신뢰할 수 있는 AI를 위한 여정
AI 영역 확대될수록 신뢰성 의문 증가…민간 주도의 신뢰성 인증 선제 출범

[아이티데일리] AI는 산업 분야를 막론하고 혁신을 가속화시키기 위한 필수요소로 자리잡았다. 그러나 한편으로 AI의 역할이 커질수록 오작동을 일으켰을 때 발생할 수 있는 사고 규모도 커지고 있다. 마치 불이 인류 문명의 발전에 크게 공헌했지만 때로는 화재를 일으켜 심각한 피해를 입히기도 하는 것처럼 말이다. 특히 딥러닝을 통해 개발된 AI는 여전히 블랙박스 문제를 안고 있어 언제 터질지 모르는 시한폭탄처럼 느껴지기도 한다.

이에 따라 최근 전 세계 정부와 IT 기업들은 신뢰할 수 있는 AI를 만들고 이를 검증할 수 있는 기술과 제도 개발에 많은 관심을 쏟고 있다.


신뢰할 수 없는 공공데이터

아직 민간기업 간의 데이터 유통 생태계가 확립되지 않은 현재, 국내 기업들이 데이터를 확보할 수 있는 가장 편리한 창구는 정부다. 각 산업 분야에서 충분히 많은 데이터를 보유하지 못한 기업들에게 있어 정부기관에서 공개하는 공공데이터들은 가장 접근성이 좋고 유용한 데이터로 평가된다.

하지만 공공데이터를 활용하는 기업들은 해당 데이터에 충분한 신뢰성이 갖춰져 있는지에 대해 의문을 제기한다. 공공데이터의 장점 중 하나는 오랜 기간 동안 축적된 방대한 양인데, 과거의 데이터들에 대해서는 신뢰성을 장담할 수 없다는 것이다. 간단한 통계정보를 확인하려고 해도 동일한 항목에 대해 부처별로 수치가 다르고, 통계연보로 모아놓은 것을 확인해도 해당 데이터의 근거가 무엇인지, 어떻게 집계된 수치인지를 확인할 수 없기 때문이다. 한 관계자는 “정부 통계 자료는 2006년도에 국가재정법이 나오면서 그나마 정리가 된 것이지, 그 이전의 데이터는 믿을 수가 없다”고 강경한 목소리를 내기도 했다.

최근 정부가 야심차게 추진한 데이터 댐에 대해서도 불만의 목소리가 높다. 데이터 댐을 조성하는 데에 수조 원의 예산을 투입됐지만 결과물은 만족스럽지 못하다는 이유다. 데이터 댐에는 정부의 지원을 받아 민간기업들이 모아온 데이터들이 대량으로 들어가 있지만, 그 과정에서 제대로 된 기준 없이 제각기 가지고 온 데이터들이 덤핑돼 있어서 활용이 어렵다.

가령 사진을 통해 특정 지역의 식생을 파악하기 위해서는 그 주변의 모든 환경들을 다양하게 촬영한 데이터가 있어야 한다. 식물은 물론이거니와 주변의 날씨 변화나 토양 조건, 수원, 동물 등 식생에 영향을 미칠 수 있는 요소들에 대한 정보들이 갖춰져야 한다. 가능하다면 다른 날씨와 토양에서 자라는 식물에 대한 정보까지 갖춰져야 비로소 원하는 지역에 대한 식생 파악과 분석이 가능하다. 하지만 데이터 댐에 있는 데이터들은 어디에서 찍었는지도 알 수 없는 식물 사진만 덩그러니 있는 셈이다. 이런 사진들은 아무리 많아도 주변 환경이 해당 식생이 만들어지는 데에 어떤 영향을 미쳤는지 알 수 없으니 유용한 인사이트를 얻을 수가 없다.

기업들은 데이터 댐의 수질 관리가 제대로 되지 않고 있다고 지적한다.

더 큰 문제는 데이터 댐에 있는 데이터들이 모두 쓸모없는 것은 아니라는 점이다. 데이터 댐에는 제대로 된 데이터도 있다. 신뢰할 수 없는 데이터 가운데에 양질의 데이터가 섞여있는 셈. 그러니 제대로 된 데이터만 보고 믿을만하다고 생각해서 대량으로 덤핑해가게 되면 더 큰 문제에 봉착할 수 있다. 데이터를 가져가려는 기업은 방대한 데이터 풀 한가운데에서 스스로 각 데이터들의 신뢰성을 검증해가며 옥석을 가려내야 한다. 그런 과정 없이 신뢰할 수 없는 데이터로 AI를 학습시켜서는 신뢰할 수 없는 AI가 만들어질 뿐이다.

심지어 정부가 아니라 민간주도로 데이터를 모으고 유통하는 체계가 만들어지기 위해서라도 정부의 가이드라인은 필수적이다. 아직 민간에서 자체적인 데이터 유통 생태계가 만들어지지 못한 상황에서, 완벽하지는 않더라도 어느 정도 수용 가능한 표준 가이드라인이 있다면 그에 맞춰서 데이터를 구축하고 가공해서 거래할 수 있었을 것이다.

데이터 댐은 무작정 비용을 지불해 데이터를 사다가 쌓아놓기 전에, 어떤 데이터를 가져다가 어떤 형태로 쌓아놓겠다는 가이드라인을 먼저 세웠어야 했다. 가이드라인 없이 데이터의 양에만 집착한 결과, 방대한 데이터를 바탕으로 국내 AI 생태계를 가속화시키려던 정부의 목표는 이룰 수 없게 됐다. AI 신뢰성 확보라는 측면에서 현재 국내 데이터 생태계의 신뢰성 수준은 기대치에 못 미치는 게 사실이다.

디지털 정책 이끌어갈 컨트롤타워부터 마련해야”
부산대학교 빅데이터정책연구센터 권영주 교수

최근 몇 년 사이 정부에서는 디지털 뉴딜이라는 목표를 세워놓고 다양한 사업을 추진했다. 코로나19로 침체된 경기를 회복시키는 한편 디지털 전환이라는 글로벌 추세에 발맞춰 선도적인 입지를 다지겠다는 목표도 있었다.

그렇지만 디지털 뉴딜 사업을 진행하면서 강하게 드라이브를 걸어줄 컨트롤타워가 없었다는 점이 아쉽다. 중앙에서 지휘를 해줄 수 있는 컨트롤타워가 없다보니 부처 간의 혼란이 가중되고, 협력을 해도 모자랄 판에 실적 경쟁구도가 만들어지기도 했다. 가령 데이터 유통에 대한 법안을 만들 때, 과기정통부와 중기부, 산자부 등이 서로 먼저 만들겠다고 나섰다. 민간기업에 대한 데이터 유통 법안이니 세 부처가 다 관련이 있고 나름대로 명분도 갖췄다. 하지만 반대로 생각하면, 세 부처 중 어느 한 군데가 만들어서는 나사빠진 법안이 되기 십상이다. 그러니 각 부처들이 협력할 수 있도록 그보다 윗선에서 지시를 내릴 수 있는 컨트롤타워가 필요하다.

산업계에서는 데이터 댐의 데이터 신뢰성에 대해 불만이 많은 것으로 알고 있다. 하지만 그러한 문제 제기가 사실이라고 해도, 정부는 이미 조 단위의 막대한 자금을 투자해 조성한 데이터 댐이 쓸모없는 데이터를 담고 있다는 것을 쉽게 인정할 수 없을 것이다. 뒤늦게라도 데이터에 대한 신뢰성 검증을 해달라는 요구도 수용하기 어렵다. 확인 결과 신뢰할 수 없는 데이터라는 결과가 나오면 책임자들이 옷을 벗어야 할 테니까. 자체적으로 데이터의 신뢰성을 검증할 수 있는 타임 리미트는 이미 지나갔다고 본다. 결국 이러한 논의는 컨트롤타워의 부재라는 문제로 돌아온다. 데이터 댐에 대한 신뢰성 검증이 필요하다면 이를 권고하거나 필요하다면 강제할 수 있는 집단이 있어야 한다.

예산에 대해서도 마찬가지다. 과거 노무현 대통령 시절에 국가균형발전특별법을 만들 때는 그에 해당되는 회계부터 만들었다. 이를 통해 예산이 지속적으로 확보됐기 때문에 동력을 잃지 않고 끝까지 갈 수 있었다. 반면 최근 몇 년 사이 정부는 디지털 산업계에 막대한 예산을 투자했는데, 이게 앞으로도 쭉 이어질 수 있을지는 미지수다. 앞으로도 디지털 산업에 대한 지원이 힘을 잃지 않으려면 특별회계가 붙을 수 있는 사업이 나와야 한다. 새로운 정부에서는 그에 대한 노력을 해줬으면 하는 바람이다.

어쩌면 디지털 산업계 입장에서는 이번 정권 교체가 중요한 분기점일 수 있다. 큰 변화의 바람이 불어닥치더라도 막을 수가 없으니까. 만약 정부가 디지털 산업에서 명확한 미래의 비전을 보고 있다면, 공공데이터의 신뢰성을 검증하고 상위의 통합법을 만들고, 4차산업혁명위원회 급의 집단을 만들어서 컨트롤타워를 새롭게 세울 수 있는 마지막 기회가 아닐까 생각한다.

AIIA, 민간 주도의 AI 신뢰성 인증 제시

한편 과기정통부가 ‘신뢰할 수 있는 AI 실현전략’을 제시한 데 이어, 최근에는 민간에서도 AI의 신뢰성 확보를 위한 체계를 마련하기 위한 노력이 이어지고 있다. 지난 3월 10일, 지능정보산업협회(AIIA)는 민간 주도의 AI 신뢰성 인증(Trustworthy AI)을 내놓았다.

이번 인증은 EU에서 제안한 ‘고위험 AI 시스템 요구사항’을 기반으로 AI 기반 제품‧서비스의 신뢰성을 평가하는 제도다. AI 기술이 적용된 디바이스나 SW, 서비스 등 AI와 관련된 모든 시스템들을 포함한다. AI의 성능과 결과물의 정확성은 물론, 해당 AI를 개발한 기업이 AI 워크플로우 전 과정에서 적절한 관리체계를 갖추고 있는지 등을 점검한다.

업계 관계자들은 민간 주도로 AI 신뢰성 인증 제도가 나왔다는 것에 대해 긍정적인 반응을 보내고 있다. 인증이라는 명칭에서 느껴지듯, 자칫하면 AI 제품 출시 전에 정부가 인증 획득을 강제함으로써 기술 개발에 제동을 걸게 될 수도 있기 때문이다. 과기정통부 역시 이러한 우려를 인식하고 있는지 ‘신뢰할 수 있는 AI 실현전략’에서 “AI 신뢰성 인증 단계에서는 민간 자율 인증과 공시를 추진한다”고 밝힌 바 있다.

다행히 AIIA를 통해 민간에서 먼저 AI 신뢰성 인증이 발표되면서 이러한 걱정은 내려놓아도 될 것 같다. 민간기업들을 주축으로 AI 산업계와 실제 현장을 고려한 AI 신뢰성의 요구 수준을 선제적으로 만들 수 있게 됐기 때문이다. 이에 더해 AIIA 정책사업부 안성일 팀장은 “사실 인증이라는 표현을 쓰면 규제처럼 느껴질 것 같아서 다른 명칭을 고려하기도 했다”면서, “AI 신뢰성 인증은 민간기업들의 AI 서비스 출시를 막거나 제한하려는 것이 아니라, 인증을 획득하는 과정에서 협회가 적절한 지원과 컨설팅을 제공해 서비스의 완성도를 높이고 부작용을 미연에 방지하기 위해 마련된 것”이라고 거듭 강조했다.

AIIA는 올해 안에 AI 신뢰성 인증 제도를 통해 4~5개 기업들의 인증 획득을 지원하면서 우수사례를 만들어보겠다는 목표다. 한 번에 거창하고 정교한 인증 체계와 표준을 만들어 탑다운(Top-down)으로 내려가기보다, 현장에서 실제 AI 제품의 신뢰성 확보 과정을 지원하면서 시행착오를 겪어가며 바텀업(Bottom-up)으로 만들어나가겠다는 취지다. 기업들이 AI 신뢰성을 확보하는 과정에서 겪는 어려움들을 듣고 함께 경험하며 AI 신뢰성 인증 체계를 완성해나갈 계획이다.

현재 AIIA는 AI 신뢰성 인증 제도를 실질적으로 이끌어갈 인증위원회를 구성하기 위해 다양한 전문가 단체들과 접촉하고 있다. 국내는 그동안 AI 신뢰성에 대한 인식이 부족했기 때문에 전문적인 역량을 갖춘 인재 자체가 부족한 상황이라, 올해에는 인증을 받을 수 있는 기업의 수를 제한하더라도 시험심사를 진행하면서 인증 프로세스를 다잡아줄 수 있는 소수의 전문가들을 섭외하겠다는 계획이다. 향후 인증 프로세스와 방법론이 표준화되면 추가적으로 인력을 충원하는 한편, 협회 차원에서 AI 신뢰성에 대해 전문성을 갖춘 인재 양성 프로젝트 추진도 검토하고 있다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지