2013

01월

29

애플의 시리(Siri)를 통해 본 미래의 명령입력장치.

2011년 10월에 아이폰4s와 함께 음성인식 서비스인 siri (이하 시리)를 발표하였습니다.한국어 지원은 작년 9월 20일, iOS 6부터 지원되기 시작하였습니다. 아직 완벽하진 않지만 음성 인식률도 높고, 자주는 아니지만 가끔씩 사용하고 있습니다. 영어권 언어 설정도 미국, 영국, 호주, 캐나다 영어로 나뉠 정도로 차이가 있는데, 영어권 언어만큼 연구 결과들이 많지 않을테고, 인식 실패율이 낮아지려면 앞으로 더 많은 데이터베이스가 쌓여야겠죠.

siri_dictation_01_130129

저는 주로 맥에서 아이메시지를 보내다보니, 간혹 밖에서 아이폰으로 타이핑 하는 것이 귀찮아지고 있습니다. (아이폰을 사용하고 있다면 맥에서도 자신의 아이폰 전화번호나, 이메일 주소로 아이메시지를 아이폰 사용자에게 보낼 수 있습니다.) 게다가 좀 긴 답변을 해야 할 경우에는 타이핑보다 전화를 하고 싶은 경우가 많은데, 이럴 때 음성입력을 사용하고 잘못된 글자 몇 개만 수정하고 발송합니다. 작정하고 대충 말하지 않는 이상 인식률이 꽤 높습니다.

맥도 OS X 10.8.2 (마운틴 라이언)부터 한국어 받아쓰기가 가능해졌습니다. 말을 하면 텍스트로 변환됩니다. 갈수록 사용빈도가 높아지고 있고, 느낌표나 쉼표 물음표도 알아들을 정도로 인식이 잘됩니다.

pages에서 문서 작업도 받아쓰기로 입력 하는 경우가 가끔 있는데, 손으로 타이핑 하면 어떻게 적어야 할지 고민이 되고, 앞 뒤 문맥을 살피다 보면 적으려던 내용을 잊을 때 도 있는데(심지어 원래 하려던 말에서 멀어지는 경우도 생기고) 생각을 말로 바로 표현하고 수정하는 것이 내용 전달이 확실할 때가 있어서 가끔 사용합니다. 물론 사파리나 그외의 각종 앱에서 받아쓰기가 가능한데요, 제 생각엔 맥의 Cocoa 프레임워크로 개발된 앱은 모두 가능한 것으로 보입니다.

터치 스크린은 모바일 기기외에는 힘들 것.

아이폰의 터치 스크린을 시작으로 사용성에 중요한 변화를 가져왔다고 생각하고 있습니다. 그것은 아이패드로 이어졌고, 이제 모바일 기기는 qwerty자판에서 터치자판으로 넘어갔습니다. qwerty자판보다는 불편하지만 그것을 상쇄하고도 남을 편리함이 오히려 더 많기 때문입니다.

터치는 포인팅을 넘어, 화면에 구애를 덜 받을 수 있는 제스처를 만들어냈습니다. 좌우로 밀면 화면 뒤에 숨겨진 메뉴가 나오거나 이전, 다음 콘텐츠로 이동을 하는 등 좁고 작은 화면을 크게 사용할 수 있게 되었습니다 (하지만 불편하긴 합니다). 하지만 랩탑이나 데스크탑에는 (오랜 기간동안) 터치 스크린을 적용하지 않을 것이라고 생각합니다.

랩탑과 데스트크탑은 정확한 포인팅이 필요한 경우가 많고, 업무가 주가 되는 기기입니다. 장시간 팔을 움직여 사용하기에는 부담도 크고 피로도도 꽤 클 것입니다.

손을 바닥에 대고 마우스를 까딱 하는 것도 귀찮고, 증후군까지 생기는데, 허공에 뜨다시피 큰 화면을 터치하고 장시간 사용한다는 것은 아직 까지는 무리입니다.?그래서?매직 트랙패드(Magic Tracpad) 같은 입력도구가 오히려 현재로서는 더 유용하게 사용 될 것이구요 (매직 트랙패드를 사용하다가 마우스를 함께 사용하기 시작하면서 매우 편하다는 사람들이 많습니다. 장단점이 다 있으니까요).

아이폰과 아이패드는 모바일 기기 입니다. 언제 어디서나 적당한 크기의 화면에서 손의 부담을 적게 주면서 활용할 수 있습니다. 탭과 제스처 위주로 정확한 포인팅이 필요하지도 않고, 다양한 제스쳐를 통해 컨텐츠 소비에 부담이 없는 기기입니다.?아마도 신체적인 부담과 피로도가 해결될 수 있는 방향으로 차근차근 입력 방식들이 발전해 가지 않을까 생각합니다. 아이폰이나 아이패드도 오래 사용하면 손목이나 팔꿈치가 뻐근하고 팔이 살짝 뭉치기도 하니까요.

다양한 입력장치들.

맥 앱스토어에서?Flutter?라는 앱을 무료로 받을 수 ?있습니다. 모든 맥 제품에 포함된 내장 카메라를 이용해?정해진 손동작으로 음악이나 영상을 제어할 수 있습니다. 키보드에 음악과 동영상을 제어할 수 있는 버튼들이 있지만, 키보드를 잠시 사용할 수 없는 경우나, 그 외 여러가지 상황에서 편리하게 사용할 수 있을 것입니다.

손가락의 움직임을 3D로 분석하여 컴퓨터를 제어할 수 있도록 하는 Leap Motion 이라는 입력 장치도 (한정)예약 판매를 시작했습니다. 모든 앱에서 동작 되는 것은 아니고 Leap API를 사용하는 앱에서 동작을 한다고 합니다. (물론 기본적인 것은 동작이 되겠죠?) 손가락 안의 ‘마이너리티 리포트’의 시대가 열리고 있습니다.?많은 호응이 있고, 제품이 활성화 되면 많은 앱들이 이 입력장치를 지원 할 것이고 활용도는 무궁무진할 것입니다.

하지만 앞서 말한 것처럼 이런 장치들은 많은 움직임은 쉽게 피로감을 주고, 집중도가 떨어질 수 도 있을 것입니다. 입력 장치로서의 활용도는 매우 높지만 한계가 있지 않을까 추측해봅니다.

마이크로소프트의 키넥트도 몸을 움직여 게임을 하고, 더 즐겁고 다양한 방식의 게임을 할 수는 있지만 축구경기 한 판 하고 나서 쉬듯 체력을 비축해야 할 수도 있을 것입니다. 키넥트를 게임용으로만 활용한 것도 그런 이유가 아닐까 생각 하구요. (물론 위의 Leap Motion이 키넥트 보다 200배 세밀하게 반응을 하고 0.01mm 까지 제어가 가능하다고 하니 활용도가 다르지만요.)

또한 포토샵 같은 웹디자인이나 그래픽 작업에서 세밀하게 초점을 맞춰야 할 경우는 마우스가 더 나을 것입니다.

결국 우리가 게임을 할 때 게임패드가 편리하고 포인터를 움직일 땐 마우스가 편리하듯, 활용도가 높고 인터렉티브한 사용성을 제공하는 도구가 될 수 있을 것입니다.

결국 음성이 기본.

작업을 하거나, 앱을 사용할 때 더욱 활용도 높고 뛰어난 입력 장치가 앞으로 마우스와 키보드를 대체할 수 있을지는 몰라도 결국 이런 입력 장치들 보다 음성이 주가 될 것이라고 생각합니다.

음성은 입력 도구로서의 활용도는 떨어질 수도 있습니다. 하지만 미래에 뇌와 컴퓨터가 통신하는 시대가 되기 전 까지는?명령 장치로서 음성만한 대안은 없을 것입니다.

컴퓨터와 멀리 떨어져 입력기기가 앞에 없어도, 내장 카메라와 떨어져 있어도 음성으로 음악을 일시정지 하거나 멈출 수 도 있습니다.

요즘 많은 관심을 받고 있는 구글 글라스(Google Glass) 또한 음성으로 제어합니다.

특별한 제스처를 하지 않아도 음성은 들리는 범위 내에서는 거의 모든 것을 제어할 수 있는 뛰어난 도구입니다. 사족으로.. 동영상 맨 뒤에 애인에게 악기를 연주하면서 일몰을 보여주며 끝나는데 많은 사람들, 특히 남자들은 가까이 하기엔 너무 먼 구글 글래스가 될지도 모르겠다는 생각이 드네요. 물론 그럴때를 대비한 앱이 분명히 나와 대박이 날.. 쿨럭;

음성은 익힐 필요가 전혀 없다.

시리를 사용하면서 느끼는 점은 정해진 명령 방식에 따라 동작하는 것이 아니라는 점입니다. 아직 한국어는 말을 제대로 이해하지 못하는 경우도 많지만, 중요한 것은 사람의 말을 이해하고 거기에 능동적으로 반응을 한다는 것입니다.?사용자가 어떤 말을 해야 할 지 익힐 필요도, 고민할 필요도 없습니다.?UX와 UI가 필요 없습니다.

이것은 어떤 것도 익힐 필요가 없다는 것입니다. 이미 자라면서 우리는 말을 배웠고, 너무나 자연스럽게 사용하고 있으니까요. 그저 말만 하면 되는 이 환경은 너무나 획기적인 것입니다.

아무리 쉬운 앱도 사용법을 익혀야 하고, 게임마다 게임패드 사용하는 방법이 저마다 다르지만 말로 명령을 한다는 것은 학습의 스트레스가 전혀 필요 없음을 의미 합니다 (물론 시리처럼 사람의 말을 이해하고 대응해 줄 때 가능한 것입니다만).

사용자는 화면을 볼 필요도 없고, 집중해야 할 곳에 집중하고 명령만 내리면 됩니다. 시리는 올해부터 BMW, GM, 벤츠 등 세계 자동차에 적용되어 나오게 되었습니다.

가장 중요한 것은 내가 말을 하면 시리가 이해를 하고 필요할 경우 앱을 실행시키거나 검색을 해서 사용자에게 알려주게 됩니다. 사용자가 무언가를 하기 위해 사용할 앱이나 브라우저를 결정하고, 검색하고, 찾아내는 것이 아니라, 질문만 하고 답변만 기다리면 됩니다.

사용법을 익힐 필요가 없는 놀라운 사용성은 그래서 컴퓨팅의 방법까지 바꿔 놓을 수 있습니다.

현재 맥에서는 페이스타임으로 아이폰, 아이패드, 맥 사용자들과 화상통화가 가능합니다. 아이메시지가 맥으로 들어오고, 아이폰의 폰번호나 이메일 주소로 아이폰, 아이패드, 맥 사용자들에게 메시지를 보낼 수 있습니다.?음성으로 받아쓰기를 하고, 메시지를 작성하고, 트윗과 페이스북에 올릴 수 있습니다.

siri_dictation_02_130129

저는 조만간 시리가 맥에 들어올 것이라고 생각합니다. 그러면 지금과는 다른 맥 사용을 하게 될 것입니다. 사파리를 열고 검색할 필요가 없고, 음악을 듣기 위해 아이튠즈를 실행할 필요가 없어집니다. 그냥 말만 하면 됩니다. 필요하면 알아서 사파리를 열어 결과를 보여주고, 어떤 장르의 노래를 들을지, 어느 가수의 곡을 들을지만 고민하면 됩니다.

아직은 좀 부족한 부분이 많지만, 음성에 대한 데이터베이스가 많이 쌓이고, 그에 대한 더 좋은 결과를 ?제공하게 되는 것은 그리 멀지 않아 보입니다.

요즘 애플이 듀얼 마이크로 폰을 채택하고 있습니다. 아이폰 5의 경우에는 통화 품질이 매우 좋다는 평도 많이 받고 있다고 합니다. 새로 나오는 아이맥, 맥북 역시 듀얼 마이크로 폰을 채택하고 있습니다. 제 생각에 이것은 음성 서비스를 위한 준비도 포함되어 있을 것이라고 생각합니다. 통화 품질만을 생각했다면 아이폰 외에 듀얼 마이크로 폰을 채택할 필요는 굳이 없었을 테니까요.

 

요즘 재밌는 사용성을 가진 동영상들과 자료를 보면서 따로 포스팅을 하려고 하고 있는데, 시리의 음성 입력은 따로 떼어서 간략하게 제 생각을 정리 해보았습니다.

조만간 반복 적인 내용이 될 수 있겠지만 UX와 UI에 대한 내용을 모아서 올려볼까 합니다.

  • Leap Motion보다 더 기대하는건 MYO 입니다.
    물론 리프모션보다 조금 더 비싸긴 하지만 몸에 밴드만 감고서 컨트롤 하는게 더 재밌을듯 … ㅎ
    http://macnews.tistory.com/899

    • 페이퍼북

      이 스토커. 변태.

      Leap Motion은 데스크탑 용 입력장치는 아닐듯. 멀티미디어적 요소와 특수한, 가령 3D 같은 작업에 특화 될 것같아요. 사용해봐야 알겠지만 저건 너무 몸에 부담을 줄 것같아보이거든요.

      5월 부터인가 판매가 시작되고 예약한 사람들은 일주일 전에 배송이 된다고 하니.. 그 때 가서 고민 해볼 생각인데 딱히 사고 싶은 마음이 들지는 않아요.

      스토킹 그만해요! ㅠ_ㅠ