구글 보안 서비스 리캡차 / 사진=구글 리캡차 웹사이트

[뉴스로드] “횡단보도가 있는 타일을 모두 선택하세요.”

네티즌들은 온라인 사이트에 가입하거나 글을 작성할 때 종종 이 같은 문구와 사진이 담긴 박스를 접한다. 횡단보도 외에 ‘신호등’ ‘자동차’ 등이 보기로 주어지는 경우도 많다.

이는 IT업체들이 제공하는 매크로 방지 서비스 ‘캡차(CAPTCHA, Completely Automated Public Turing test to tell Computers and Humans Apart)’다. 사이트에 접근한 이가 매크로로 보안을 위협하려는 의도가 있는지 판별하는 기능을 한다.

캡차는 누군가가 매크로를 악용해 무수한 아이디를 생성하거나, 게시판을 도배하는 행위를 방지하기 위해 개발됐다. 캡차에 사진 속 사물을 구분하라는 지시를 넣은 것은 이 떄문이다. 사람이라면 어려움 없이 구별할 수 있지만, 봇이나 매크로는 가려내기 힘들다는 특성을 이용한 것이다.

네이버에 적용된 캡차 서비스. 구글 리캡차와 달리 지시가 구체적이다. / 사진=네이버 웹사이트 

대표적인 캡차로는 구글이 운영하는 ‘리캡차(reCAPTCHA)’가 있다. 구글은 2009년 해당 기술에 주목해, 미국 카네기멜론대학 연구원들이 개발한 리캡차를 인수했다. 이후 발전을 거듭해 네티즌들에게 익숙한 보안 서비스가 됐다.

네티즌 입장에서 캡차가 보안 서비스라는 사실은 눈치채기 쉽다. 다만 캡차가 구글 첨단기술 개발의 토대가 된다는 것은 모르는 이들이 많다.

리캡차에서 유독 도로 위를 촬영한 사진만 보이는 까닭은 구글이 자율주행·지도 서비스 고도화에 활용하고 있어서다. 구글은 네티즌들이 여러 사진에서 횡단보도·신호등·자동차 등 사물을 인식한 결과를 과정을 AI에 학습시키고 있다.

이는 집단지성의 사업 참여를 뜻하는 ‘크라우드소싱’의 일종이다. 네티즌들은 실존하는 무수한 도로 사진을 보면서, ‘데이터댐’으로 불리는 AI 학습용 데이터 구축에 참여하고 있는 셈이다.

리캡차는 과거 ‘도서 디지털화’에 활용되기도 했다. 구글이 리캡차를 인수할 당시에는 AI가 고서, 손글씨나 흐릿한 글자를 잘 인식하지 못했기 때문이다. 현재는 해킹 수법의 발전으로 보안 서비스로서의 기능이 뒤쳐져 지원이 중단된 상태다.

구글 외 다른 업체들은 여전히 고서 복원에 활용하기도 한다. 이 밖에도 AI 학습용 데이터와 무관한 난수를 생성하거나, 영문자를 제시하는 캡차 서비스도 존재한다.

현재 구글의 리캡차는 엔터프라이즈·V2·V3 등 세 가지 버전으로 제공되고 있다. 엔터프라이즈 버전과 V3는 상호작용 없이 클릭만으로도 인간과 로봇을 판별한다.

저작권자 © 뉴스로드 무단전재 및 재배포 금지