<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>The Blographic &#187; 휴먼 테크놀로지</title>
	<atom:link href="http://blographic.net/category/story/technology/feed" rel="self" type="application/rss+xml" />
	<link>http://blographic.net</link>
	<description>블로그로 그려가는 세상, 블로그래픽</description>
	<lastBuildDate>Wed, 27 May 2009 21:07:11 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>스페이스 오딧세이, 스타트렉(Star Trek), 그리고 음성 인식 기술</title>
		<link>http://blographic.net/entry/658</link>
		<comments>http://blographic.net/entry/658#comments</comments>
		<pubDate>Thu, 07 Aug 2008 15:56:53 +0000</pubDate>
		<dc:creator>blographers</dc:creator>
				<category><![CDATA[휴먼 테크놀로지]]></category>
		<category><![CDATA[스탠리 큐브릭]]></category>
		<category><![CDATA[스페이스 오딧세이]]></category>
		<category><![CDATA[음성인식]]></category>

		<guid isPermaLink="false">http://blographic.net/entry/658</guid>
		<description><![CDATA[닐 암스트롱이 달에 착륙하기 4년 전 스탠리 큐브릭 감독은 2001 스페이스 오딧세이를 찍기 시작했다. 다른 SF영화에서 비춘 미래의 모습보다는 과학적인 현실에 훨씬 근접한 영화로 평가받는 [2001 스페이스 오딧세이]가 자극한 여러가지 과학적 공상중의 백미는 역시 인공지능 컴퓨터 할(Hal)이다. 빌 게이츠는 차세대 컴퓨터 핵심은 멀티터치라고 하지만, 진짜 차세대 컴퓨팅 환경의 핵심은 말하는 컴퓨터가 아닐까 싶다.

스페이스 오딧세이가 나온지 [...]]]></description>
			<content:encoded><![CDATA[<p>닐 암스트롱이 달에 착륙하기 4년 전 스탠리 큐브릭 감독은 2001 스페이스 오딧세이를 찍기 시작했다. 다른 SF영화에서 비춘 미래의 모습보다는 <a href="http://en.wikipedia.org/wiki/2001:_A_Space_Odyssey_(film)#Scientific_accuracy">과학적인 현실</a>에 훨씬 근접한 영화로 평가받는 [2001 스페이스 오딧세이]가 자극한 여러가지 과학적 공상중의 백미는 역시 인공지능 컴퓨터 할(Hal)이다. 빌 게이츠는 차세대 컴퓨터 핵심은 <a href="http://gatorlog.com/?p=1068">멀티터치</a>라고 하지만, 진짜 차세대 컴퓨팅 환경의 핵심은 말하는 컴퓨터가 아닐까 싶다.<br />
<a href="http://www.youtube.com/watch?v=QJo__QO0zS0&amp;feature=related"><img src="http://gatorlog.com/blog/images/2008/08/youtube-hello-dave.jpg" width="480" height="385" alt="YouTube - Hello Dave!.jpg" /></a></p>
<p>스페이스 오딧세이가 나온지 40년, 사람과 대결할 수 있을만큼 지능을 갖춘 컴퓨터 할(Hal)의 음성인식 수준까지는 아닐지라도, 스피치 인식 기술에서 얻어진 성과는 주목할만하다. 뉴요커에서 언급한 스피치 인식 기술의 현재를 그대로 옮겨본다.</p>
<blockquote><p>
  Today, you can use your voice to buy airplane tickets, transfer money, and get a prescription filled. If you don’t want to type, you can use one of the current crop of dictation programs to transcribe your speech; these have been improving steadily and now work reasonably well. If you are driving a car with an onboard navigator, you can get directions in one of dozens of different voices, according to your preference. In a car equipped with Sync—a collaboration of Ford, Microsoft, and Nuance, the largest speech-technology company in the world—you can use your voice to place a phone call or to control your iPod, both of which are useful when you are in what’s known in the speech-recognition industry as “hands-busy, eyes-busy” situations. State-of-the-art I.V.R.s, such as Google’s voice-based 411 service, offer natural-language understanding—you can speak almost as you would to a human operator, as opposed to having to choose from a set menu of options. I.V.R. designers create vocal personas like Julie, the perky voice that answers Amtrak’s 800 number; these voices can be “tuned” according to a company’s branding needs. Calling Virgin Mobile gets you a sassy-voiced young woman, who sounds as if she’s got her feet up on her desk. [<a href="http://www.newyorker.com/reporting/2008/06/23/080623fa_fact_seabrook?currentPage=all">Hello, Hal</a>]
</p></blockquote>
<p>음성 인식 기술에서 얻어진 이런 눈부신 성과에도 불구하고, 우리가 궁극적으로 얻어낼 음성 인식 기술은 영화 2001 스페이스 오딧세이에서 상상한 할(Hal)보다는 스타트렉(Star Trek)에서 보여준 인간의 말을 그대로 받아적는 휴대용 컴퓨터가 아닐까 싶다. 미국에서는 이미 1971년 국방부에서 카네기멜론, 스탠포트,  IBM등에 음성인식 컴퓨터 개발을 위한 용역을 줬을만큼 이 분야에 오랫동안 투자를 해왔다. 인지심리학, 음성학, 언어학, 발성학, 컴퓨터 사이언스, 기계공학등 수많은 분야의 학문들이 결합해야만 성과를 얻을 수 있는 음성인식 기술이라는 이 미래의 기술은 현재 우리 생활에 얼마나 가까이 다가와 있을까? 우리가 손쉽게 구해 쓸 수 있는 컴퓨터 소프트웨어의 수준을 살펴보는 것보다 현재의 기술 수준을 가늠하는데 더 좋은 척도는 없을 것 같다. </p>
<p><img src="http://gatorlog.com/blog/images/2008/08/annals-of-technology-hello-hal-reporting-essays-the-new-yorker.jpg" width="480" height="391" alt="Annals of Technology_ Hello, Hal_ Reporting &amp; Essays_ The New Yorker.jpg" /></p>
<p>데이브 포그가 <a href="http://www.nytimes.com/2008/08/07/technology/personaltech/07pogue.html?partner=rssuserland&amp;emc=rss&amp;pagewanted=all">리뷰</a>한 스피치 인식 소프트웨어 Dragon NaturallySpeaking 버전 10의 성능이 참 놀랍다. 시험삼아 Freakonomics에서 1000자를 읽어본 결과 99.3%의 정확도로 읽은 내용을 타이핑 했다는 것이다. 특히 고무적인 것은 Ku Klux Klan 같은 고유명사를 타이핑하는데 아무 문제가 없었으며 &#8216; &#8216;edition&#8217;을 &#8216;addition&#8217;이란 단어로 잘못 표기하는 경우는 있었어도 철자의 에러에 해당하는 타이포(typos)는 없었다고 한다.</p>
<blockquote>
<p>As a quick test, I read aloud the first 1,000 words of “Freakonomics” into Microsoft Word. Impressively enough, NatSpeak effortlessly transcribed words like “Ku Klux Klan” and “Punic war.” It did, however, mistype seven easier words (“addition” instead of “edition,” for example, and “per trail” instead of “portrayal”). Accuracy tally with no training: 99.3 percent. Not too shabby. [<a href="http://www.nytimes.com/2008/08/07/technology/personaltech/07pogue.html?partner=rssuserland&amp;emc=rss&amp;pagewanted=all">State of the Art Speak Up, a Computer Is Listening</a> ]</p>
</blockquote>
<p>케네디 연설에서 1000자를 골라 테스트한 결과 역시 99.5%의 정확성을 보여줬으며, [“Select gas prices.” - “Italicize that.” - "Go to end of document.”]와 같은 자연어 명령<sup>1</sup> 도 알아듣는다고 한다.</p>
<p>NaturallySpeaking 버전 10은 현재 8가지 유형의 영어 엑센트를 인식한다고 한다:</p>
<blockquote>
<p>Version 10 recognizes eight accents: general (none), Australian, British, Indian, Great Lakes (Buffalo to Chicago), Southeast Asian, Southern United States and Spanish.</p>
</blockquote>
<p>NaturallySpeaking 10이 <a href="http://gatorlog.com/?p=602">남부 엑센트</a>를 인식할 수는 있겠지만, 인식하기 매우 까다롭다는 한국인들의 영어 발음을 인식할 수 있을 지는 의문이다. 한국인이 발음하는 river라든지 wal-mart 등을 미국인들이 잘 알아듣지 못하는 일이 비일비재한 것을 생각하면 한국인이 읽는 영어 문장의 정확도는 떨어질 게 분명하다.</p>
<p>불행하게도 이 뛰어난 스피치 인식 소프트웨어는 윈도우즈용이다. 부트캠프를 통해 윈도우즈를 부팅하는 맥에서는 물론 설치할 수 있다. 매킨토시에 관해 해박한 데이브 포그는 물론 맥용 스피치 인식 소프트웨어인 MacSpeech Dictate를 언급하지만, 성능은 드래곤 네추럴리스피킹 10에 딸린다고 평한다.</p>
<p>이미 90% 이상 성공확률을 만들어내는 음성인식 기술에 우리가 도전할 구석은 전혀 없는 것일까? 과학자들이 제시하는 미래의 음성 인식 기술은 바로 인간의 &#8216;감정&#8217;을 이해하는 인식이다. 그렇다면 우리가 궁극적으로 얻을 미래의 기술은 스타트렉이 아니라, 스페이스 오딧세이의 한 장면에서 영감을 받아야 하는게 아닐까? 우주선을 통제하기 위해 우주인들과 고투를 벌이면서 할은 우주인 데이브에게 이렇게 말한다. </p>
<blockquote><p>“I can tell from your voice harmonics, Dave, that you’re badly upset. Why don’t you take a stress pill and get some rest?”</p></blockquote>
<p>스탠리 큐브릭 감독의 앞날을 내다보는 혜안에 다시 한 번 경이와 찬사를 보내는 바이다. </p>
<ol class="footnotes"><li id="footnote_0_658" class="footnote">$100달러짜리 standard edition이 아닌 $200짜리 프로페셔널 에디션에서만 가능</li></ol>]]></content:encoded>
			<wfw:commentRss>http://blographic.net/entry/658/feed</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
	</channel>
</rss>
