si.mpli.st think

by Minku Lee

iPhone 4S

iPhone 4S가 발표되었다. 3G > 3GS > 4 > 4S 라는 의견도 있고, 임팩트가 너무 없었다는 이야기도 나왔다. 많은 애플 팬보이들이 ‘실망이다’ 라는 이야기를 연발했으며, 타임라인은 안드로이드 제국군의 승리로 보였다.

자정에 알람을 맞춰놓았지만 전날 밤을 샌 여파가 강했던지 일어나지 못해서, 결국 2007년 이후 한번도 놓치지 않았던 키노트를 놓쳐버렸다. 팀 쿡의 첫 키노트라는 점이 의미있었지만.. 놓친 건 놓친 거니. 여튼 새로 발표된 iPhone 4S의 기능을 살펴보던 중 Siri가 보였고, 데모 영상을 본 결과 팀 쿡을 욕하게 되었다. 아니, 이런 기술을 그렇게 설명했단말야!?

Your wish is your command

Siri라는 이름의 가상 비서(어감이 이상하지만 넘어가자)는 기본적으로 음성 인식 기능이다. 기존 iPhone에 있던 Voice Control(한국어 : 음성 명령)이나 Android에 있던 Voice Action과 기본적으로는 비슷하다. 사용자가 원하는 기능을 음성으로 말하고,  그것에 대한 답변을 제공해주는 셈이다. 사실 텍스트로 된 설명만 읽었을때는 별 느낌이 들지 않았는데, 키노트의 데모들을 보고 생각이 바뀌기 시작했다.

문장 분석

Siri는 문장을 분석할 수 있다. 만약 Siri가 단순한 음성인식 기술이였다면, 기존의 iOS 음성 명령처럼 정해진 방식으로 정해진 명령을 내려야 알아들을 수 있을 것이다. 하지만 Siri는 어떤 방식으로 명령을 해도 인식한다. Apple의 서버에서 음성을 분석하기 때문일 것이다.

On May 19, remind me it’s dad’s birthday.

문맥 분석

Siri는 방금 전에 사용자가 어떤 질문을 했는지 기억한다.

Is it going to be chilly in SF this weekend?

Not too cold..maybe down to 61 in SF.

What about Napa Valley?

Doesn’t seem like it. It won’t get below 68 in Napa.

Apple의 Siri 데모에서 나왔던 대화이다. 어떤 것이 놀라운 지 모르겠다고? 자세히 보자. 첫번째 질문을 기억하고 있지 않다면, 두번째 질문에도 대답할 수 없다. 또한 두 문장이 연계되었는지의 여부도 파악해야 한다.

개인 정보 접근

기존에 앱 스토어에 올라와있던 Siri는 근처의 매장 정보를 찾아주는 정도의 단순한 기능을 가지고 있었다. 애플의 규제 때문에 개인정보에 접근하지 못했기 때문이다. 하지만 애플이 인수하여 다시 만든 Siri는 다르다. 음성으로 문자를 보내고, 일정을 만든다. 만약 만드려는 일정이 다른 일정과 겹친다면, 경고도 해준다.

WolframAlpha

울프람알파는 Wolfram Mathematica를 이용한 검색엔진(사이트의 설명을 빌리자면 Computational knowledge engine)이다. Mathematica를 이용한 수학 연산부터, 잡다한 상식까지 전부 찾아준다. Siri는 질문이 어디에도 부합하지 않을 때 WolframAlpha에 검색한다. 꽤 중요한 대목이다. WolframAlpha의 방대한 지식 데이터베이스에 음성으로, 그것도 자연어로 접근할 수 있다는 것이다. 카페 라떼가 몇 kcal인지, 12oz가 몇 ml인지 등의 질문을 해도 Siri는 답해줄 것이다.

맺으며

사실 오늘까지도 Siri의 능력을 의심했지만, CBS의 데모 비디오를 보고 의도하지 않아도 꽤 높은 인식률을 보여준다는 것을 알게 될 것이다. iPhone 4S를 손에 넣으면 제일 먼저 Siri를 테스트 해 보고 싶을 만큼 개인적으로, 아니 남에게도 추천할만큼 대단한 기능이라고 생각한다. 다만 한국어 등 다국어 지원이 어떻게 될지는 걱정스럽기도 하다. 하지만 현재까지 존재했던 음성으로 기능을 작동시키는 기술 중에서는 사용자의 행동패턴을 제일 잘 반영한 것은 분명하다.

참고 사이트