지난해 1월 열린 디지털뉴딜 사업설명회에서 당국 관계자들이 발언하는 모습. / 사진=유튜브 한국지능정보사회진흥원 채널

[뉴스로드] 정부가 올해 새로운 분야 데이터댐을 열고 데이터산업 활성화에 나설 전망이다. 기존 분야 데이터들은 낮은 품질로 지적받고 있어, 이를 보완할 대책도 필요한 상황이다.

데이터댐이란 하천을 가두는 댐처럼 데이터를 축적하는 플랫폼들을 일컫는다. ▲중앙정부와 지방정부의 실태조사·통계 등을 제공하는 ‘공공데이터포털’ ▲사물인식·안면인식·챗봇·번역 등 AI산업 기반인 AI학습용데이터를 모은 ‘AI허브’ ▲빅데이터 거래 플랫폼 등이 해당한다.

과학기술정보통신부는 2022년 범정부 디지털뉴딜 실행계획을 지난 26일 발표했다. 데이터댐 등 D·N·A(데이터, 네트워크, AI) 사업에는 전체 예산 9조 원 중 5조9000억 원을 편성했을 정도로 무게를 두고 있다.

D·N·A 사업 예산은 해마다 크게 늘고 있다. 2020년 1조3000억 원, 지난해 5조4000억 원 등이다. 정부는 2025년까지 누적 33조5000억 원을 배정해 관련 산업을 육성할 방침이다.

◇데이터 시장 규모 ‘20조 원’, 데이터댐 가시적 성과

D에 해당하는 데이터댐은 가시적인 성과가 나타나고 있다. 지난해까지 AI학습용데이터는 191종(5억3000억 건)을 구축했고, 빅데이터 플랫폼은 16곳이 문을 열었다. 공공데이터는 14만7000개를 개방했다.

AI공급기업은 2019년 220곳에서 지난해 991곳으로 대폭 늘었다. 이 기간 데이터 공급기업도 393곳에서 1126곳으로 증가했고, 이 가운데 26곳은 증시에 상장했다.

AI와 빅데이터 이용 건수는 2019년 2만 건에서 지난해 37만 건으로 급증했다. 공공데이터 이용 건수도 1300만 건에서 3300만 건으로 많아졌다.

데이터3법(개인정보보호법·정보통신망법·신용정보법) 개정 이후 금융데이터 이용 활성화에도 속도가 붙었다. 올해 금융투자업계는 마이데이터 서비스를 본격화했다.

정부는 2020년 데이터 시장이 전년비 18.7% 성장했다고 밝혔다. 2016년 13조8000억 원 규모에서 2017년 14조4000억 원, 2018년 15조6000억 원, 2019년 16조9000억 원, 2020년 20조 원 순이다.

◇보건의료·교육 데이터댐도 올해 문 열어

정부는 올해 데이터댐 규모를 2배가량 확대할 계획이다. AI학습용데이터에는 5797억 원을 투입하고 지난해와 올해까지 구축하는 310종을 추가로 개방한다. 마이데이터 서비스 확산을 위해서는 데이터 분석 20곳, 가명정보 결합 100건을 지원한다.

새로운 데이터 플랫폼 ‘마이헬스웨이’와 ‘디지털집현전’도 올해 출범한다. 마이헬스웨이는 보건의료 분야 마이데이터 활용을 위해 개인 건강정보를 제공하는 곳이다.

디지털집현전은 공공기관들이 보유한 논문과 강좌, 기타 학습자료를 한 데 모은 플랫폼이다. 오는 12월 시범 서비스를 시작하며, 2024년 정식 서비스를 목표로 하고 있다.

한편 정부 데이터댐 사업 개선 과제로는 ‘데이터 품질’ 문제가 꼽힌다. 현장에서는 정부가 발표하는 성과와 괴리가 크다는 목소리가 나온다.

지난해 국회 국정감사에서는 AI학습용데이터를 수요와 관계 없이 늘리기에만 치중하는 전시행정이 심각하다는 지적이 있었다. 구축 비용에 비해 활용도가 낮은 데이터가 많아 예산이 낭비되고 있다는 것이다.

뉴스로드 김윤진 기자psnalism@gmail.com

저작권자 © 뉴스로드 무단전재 및 재배포 금지