> iPhone-iPad, think > 애플의 siri에 대한 글 공유.

애플의 siri에 대한 글 공유.

지난 4일(미국시간)에 매우 실망스럽게도(?) iPhone 4S가 발표 되었습니다.

그러나, 실망에도 불구하고, 개인적으로 iOS5의 일부 기능과 iCloud의 편리한 사용은 기대가 됩니다. 그리고, 또 하나 siri라는 것도 포함되어 있습니다.

발표 영상을 보신 분들은 확인해 보셨겠지만, siri의 기능은 기존의 방식인 ‘음성을 텍스트화 한 후에 Open API를 이용하여 정보를 가져오는 것’과는 다른 느낌이였습니다.

그와 관련된 기사를 번역해 둔 글이 있어 소개해 보겠습니다. (번역이 매끄럽지는 않네요.)

번역글 링크 / 원문 링크

—-

Why Siri just might work

Posted by: Paul Miller on October 4, 2011 6:56 pm

[IMG]

수 개월 전, 내츄럴 사용자 인터페이스에 대해 올린 글에서 필자는 음성인식의 최신 현황에 대해 대충 얘기한 바 있다. (엉터리 곡예단 정도로 소개했었다.) 그 때도 그렇고 지금도 역시 음성인식이 별 유용성이 없다는 문제 때문이었다. 음성을 잘 못알아들었을 경우에는 대책이 없다. 하지만 사람의 경우 몇 마디 놓쳐도 무슨 말인지는 알 수 있다. 말의 절반만 알아들어도 그 맥락과 논리를 이해하기 때문이다. 만약 못 알아들었다고 하더라도 확인을 요청하면 그만이다. 포드 SYNC와 같은 음성 시스템은 되물을 경우도 있지만 10번째에 “아니오!”라 말하면 그것으로 끝이다. 다시 시작으로 되돌아간다. 백지상태로 돌아간다는 의미다. 하지만 애플의 새로운 시리(Siri) 가상 개인비서의 경우는 위에 제시한 모든 문제에 대해 해결책을 제시했다.

Context

시리는 현재의 위치와 할일 목록, 날짜를 파악한다. 맹목적으로 작동하지 않기 때문에 명령을 “컴퓨터만큼 정확하게” 내릴 필요가 없다. 애플의 아이폰 4S 시연 연상 중 시리 부분을 보면, 회의를 정오로 옮길 수 있는지 묻는 장면이 나온다. 그 때 시리는 그에게 정오에 회의가 이미 잡혀 있다고 말한다. 시리는 주소록 데이터도 접근할 수 있기 때문에 집 방향을 물어보면 시리는 이미 그 정보를 알고 있는 상태에서 답해준다.

더 중요한 사항이 있다. 시리는 전통적인 맥락을 인식한다. 가령 샌프란시스코 날씨가 춥냐고 물을 때 시리는 아니라고 답한다. (실제 온도가 표시된다.) 그렇다면 나파밸리는 어떨까? 시리는 그녀가 바로 전의 질문이 날씨에 대한 것이었음을 기억하고 있기에 나파밸리의 날씨에 대해 말해준다. 식당을 찾거나 평가기사를 읽고 마침내 예약을 하는 과정에서 맥락 알기는 더 중요해진다. 이 모두가 하나의 대화이기 때문이다.

Logic

맥락 인식은 간단한 논리이며, 듣기에 있어서 매우 중요하다. 좋은 답변을 찾으려면 전체적으로 새로운 수준의 논리가 필요하지만, 수 억 달러의 가치가 있을 시리의 인공지능에서 제일 중요한 부분이 바로 그정도의 논리성일 것이다. 즉, 울프람 알파(Wolfram Alpha)는 구글이나 빙과 같은 검색엔진보다는 시리와 같은 개인비서와 통합되는 편이 더 합리적이다. 단위 전환이나 시차, 우사인 볼트와 치타의 속도 비교(그런 비교를 할 때 필자는 울프람 알파를 주로 사용한다)를 시리에게 물어보면 유용할 뿐더러 재밌기도 할 것이다.

Clarification

애플은 시리에 대해 시리가 사전(事前)적이라 말한다. 뭔가 찾기 전에 시리가 질문을 던진다는 뜻인데, 대단히 중요한 기능이다. 다른 기능도 중요하기는 하겠지만 시리는 못 알아들었다 하더라도 올바르게 알아들을 때까지 계속 질문을 물어볼 것이다. 바꿔 말한다거나 확인하는 기능은 자연스러운 대화방법이다. SUNC-스타일의 대화방법은 따라갈 수 없다.

Background

궁극적으로 이 개념이 새롭지는 않다. 다만 그 실행이 별로 잘 이뤄지지 못 했으며, 인공지능을 제대로 돌리려면 어려운 작업이 매우 많이 필요하다. 시리는 2003년, DARPA에서 자금을 지원한 “CALO” (Cognitive Assistant that Learns and Organizes)로 시작했으며, 300명의 연구자가 동원됐다가 2007년, 시리로 독립했다. 개발에 8년여 세월과 수 백만 달러의 투자가 들어간 시리는 인공지능에 있어서 상당히 성숙한 상태이다. IBM의 왓슨(Watson)은 2005년에 시작했으며, DeepQA(다른 부문에 대해 30명 정도의 별도 연구원들이 있다) 연구 인력이 15명 뿐이다.

어제 9to5 Mac노만 위나스키(Norman Winarsky)의 인터뷰가 올라왔다. 그는 CALO 프로젝트가 끝난 후 시리로 빠져 나와 애플의 시리를 둘러싼 루머에 대해 끈질기게 해명해오고 있었다. 그는 애플의 시리 주류화가 세상을 바꿀만한 사건이라 주장한다. 좀 과장일 수도 있겠으나 과장이 아니기를 필자는 정말 바라고 있다.

Only two problems…

매우 흥분되긴 하는데, 우려 사항이 두 가지 있다. 첫 번째, 아이폰 4S에서만 돌아가는 합리적인 이유를 발견하지 못했다. 이 정도의 인공지능을 처리하려면 A5 프로세서가 아니면 안 된다고 말하겠지만, 왜 그런 결정을 급하게 내려야 했을까? 오리지날 시리가 3GS에서도 돌아간다면, 적어도 아이폰 4에서는 돌아가야 하잖을까? 애플의 결정은 대단히 냉소적이고 근시안적으로 보인다.

두 번째, 이제까지 본 시연 영상을 볼 때 시리 안으로 텍스트를 입력시킬 방법을 찾지 못했다. 음성 전용이다. 가령 시끄러운 장소에 있다면 조용한 장소를 별도로 찾아야 할 것이다. 유괴범이 입에 재갈을 물고 가듯 말이다. 좀 불편하다는 것 외에도 애플의 불신임투표같은 느낌이다. 시리의 인공지능이 진정 훌륭하다면 언제 어느 때이건 입력이 가능하도록 해야 하잖을까? 텍스트 입력이 없다 함은 애플이 시리를 운동하거나 빨래를 갤 때, 혹은 달릴 때 사용할 효율적인 방식으로만 여긴다는 의미로 보인다. 음성으로만 하면 정말 효율적일까?

흥미롭게도 시리의 오리지날 버전(원래 앱스토어에 있었지만 현재 사라졌으며 기존 사용자는 10월 16일까지만 사용할 수 있다)에는 텍스트 입력 기능이 있다. 따라서… 어떨지 생각해 보시라. 너무 입력에 대해 깊게 생각한다거나 완벽하게 논리를 놓치고 있을 수도 있겠다만, 인공지능이 장난감 수준 이상이 되려면 장난감 이상으로 다뤄야 하는 것이 기본이라고 생각한다. 전체적인 기기 경험에 있어서 인공지능을 필수적으로 만들기 전까지 인공지능은 멋진 꼼수에 불과할 것이기 때문이다.

카테고리:iPhone-iPad, think 태그:, , ,
  1. 댓글이 없습니다.
  1. No trackbacks yet.

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중

%d 블로거가 이것을 좋아합니다: