최근 구글 어시스턴트가 두 개 언어를 동시에 처리하는 기능을 탑재했다. 구글 어시스턴트는 구글이 개발한 인공지능 스피커이자 버추얼 어시스턴트(Virtual Assistant)로, 사용자의 말을 알아듣고 그에 따른 정보를 들려주는 기능을 갖고 있다. 아마존, 애플의 인공지능 스피커도 비슷한 기능을 선보이고 있다. 그런데 타사의 스피커들은 아직 두 개 언어를 동시에 다룰 수 없다. 즉 설정에서 선택한 1개 언어만 실시간으로 처리할 수 있다. 이번 구글의 새로운 기술은 인공지능 스피커가 두 개 언어를 동시에 인식하고 처리할 수 있다는 점에서 주목되는 소식이다. 

구글이 자사 블로그에 소개한 내용에 따르면 사람은 타인이 외국어를 하면 그 언어를 자신이 할 줄 몰라도 외국어라고 알아차릴 수 있는 능력이 있다. 그러나 컴퓨터에게는 사용자가 현재 한 종류의 언어를 말하는지, 두 종류의 언어로 말하고 있는지 인식하는 일이 그리 간단한 문제가 아니다. 구글은 2013년부터 이 문제를 해결하기 위해 딥 뉴럴 네트워크 기술을 활용한 ‘LangID’라는 이름의 구어 (spoken language) 인식 기술을 연구해 오고 있다. 이번 구글 어시스턴트에 탑재된 기술은 영어, 스페인어, 불어, 독어, 이탈리아어, 일본어 등 총 6개 언어를 인식할 수 있다. 전세계적으로 두 개 이상의 언어 즉 다중 언어를 사용하는 가족이나 개인이 늘어남에 따라 구글의 구어 인식 기술도 실생활에서 유용하게 쓰일 것으로 예상된다.  

국내에도 구글 어시스턴트와 비슷한 기능을 갖춘 스마트 스피커들이 출시되어 큰 인기를 끌고 있다. 카카오 미니, 클로바 프렌즈, SKT 누구, KT 기가지니 등이 대표적이다. 스피커를 향해 명령어를 말하면 메시지를 보내거나 음악을 듣고, 알람을 설정할 수도 있으며, 귀여운 디자인 덕분에 인테리어 기능도 톡톡히 하고 있다. 국내 사용자들이 좋아하는 콘텐츠도 많이 연결되어 있다. 그러나 사용자 후기를 보면 아직 부족한 점이 많이 보인다. 특히 자연어 인식 기능이 미흡하다는 리뷰가 많다. 가령 “오늘 날씨 어때?”는 알아 듣는데, “오늘 날씨 어떠니?”는 인식을 못하는 식이다. 다중 언어를 동시에 인식하는 구글 어시스턴트의 현재 수준과 비교할 때 다소 차이가 난다고 볼 수 있다. 

이 점에서 작년 말 국립국어원이 발표한 2차 ‘세종계획’은 인공지능 기기에서 한국어의 자연어 처리를 위해 매우 중요한 프로젝트라고 할 수 있다. 2차 세종계획은 1998년부터 2007년까지 진행된 1차 세종계획의 연장선으로 2018년부터 2022년까지 총 175억원의 예산을 들여 모두 155억 어절의 우리말 말뭉치를 구축하는 내용이 핵심이다. 

인공지능 기술, 특히 자연어 인식 기술에서 ‘말뭉치’는 컴퓨터가 어떤 언어를 이해하는데 필요한 기본적인 언어 표본이라고 할 수 있다. 즉 한국어로 된 말뭉치를 가능한 많이, 다양하게 컴퓨터에 입력해줘야 컴퓨터가 사용자의 한국어를 잘 이해하게 된다. 우리말의 다양한 용례와 의미를 고려할 때 말뭉치의 양과 질은 매우 중요하다. 사실 지난 1차 세종계획은 실패한 프로젝트라는 평가를 받는만큼 이번 2차 세종계획은 본격적인 인공지능 시대를 위해 꼭 성공해야 할 프로젝트다. 또한 구글 어시스턴트의 품질에 버금가는 국내 스마트 스피커의 경쟁력을 위해 필수 불가결한 사업이라고 할 수 있다. 

 

<필자 소개>

IT 칼럼니스트. <플랫폼이 콘텐츠다> 역자이며 <테크니들> 편집장을 맡고 있다.

저작권자 © 뉴스로드 무단전재 및 재배포 금지