정동원 비투엔 전략사업본부 거버넌스전략팀 팀장(이사)

[아이티데일리] 본지 컴퓨터월드/아이티데일리가 지난달 29일 ‘2021 AI&빅데이터 웨비나’를 온라인으로 개최했다. 이번 웨비나는 ‘구축사례를 통해 본 AI&빅데이터의 현주소’라는 주제로, 구체적인 사례를 통해 산업계의 디지털 혁신(Digital Transformation)을 이끌고 있는 AI와 빅데이터 기술의 트렌드를 살펴보는 자리로 마련됐다.

이미 많은 기업들이 AI‧빅데이터 활용의 필요성을 인지하고 있지만, 구체적으로 어떤 투자를 수행해야 하는지 몰라 어려움을 겪는 경우가 많다. 이번 웨비나에서는 학계‧산업계 전문가들의 발표를 통해 기업들이 고민하고 있는 AI‧빅데이터 활용 전략을 제시하고, 최선의 방법론을 마련하기 위해 어떤 요소들을 고려해야 하는지 확인할 수 있도록 했다.

‘2021 AI&빅데이터 웨비나’는 연세대학교 조성배 교수의 키노트를 시작으로 데이터솔루션, 메타빌드, 비투엔 등 국내 AI‧빅데이터 전문기업들이 참가해 관련 업계의 최신 트렌드와 기술 동향을 공유했다. 각 세션의 주요 내용을 정리했다.

① AI&빅데이터의 산업체 활용 : 최신 트렌드와 전략
② 빅데이터와 인공지능의 융합을 통한 가치창출
③ 건강 데이터 기반의 AI 서비스
④ 빅데이터 분석/활용을 위한 데이터 거버넌스 프레임워크


빅데이터 분석/활용을 위한 데이터 거버넌스 프레임워크

마지막 세션에서는 정동원 비투엔 전략사업본부 거버넌스전략팀 이사가 연사로 나섰다. 정동원 팀장은 최근 다양한 산업 분야에서 데이터 거버넌스 사업이 추진되면서 관련 기술과 트렌드가 빠르게 변화하고 있다고 강조하며 ‘빅데이터 분석/활용을 위한 데이터 거버넌스 프레임워크’라는 주제에 대해 발표했다.

먼저 정동원 이사는 데이터 거버넌스가 무엇인지를 정의해야 한다고 밝혔다. 이미 거버넌스라는 단어가 많은 영역에서 사용되고 있지만 정확히 무엇을 의미하는지에 대해서는 이견이 있다는 설명이다. 이에 대해 정동원 이사는 데이터 거버넌스를 ‘기업이 데이터를 체계적으로 생산·관리하고, 해당 데이터를 사용자가 효과적으로 사용·활용할 수 있도록 하기 위한 일련의 업무’로 정의했다. 여기에 더해 해당 업무를 수행하기 위한 원칙과 기준, 조직 및 R&R, 관련 업무 도구(시스템)까지가 모두 데이터 거버넌스의 정의에 포함될 수 있다.

최근 기업들은 AI와 빅데이터에 관련된 투자를 과감하게 진행하고 있다. 하지만 과감한 투자를 진행했음에도 불구하고 성공 사례를 찾기는 쉽지 않다. 실패 이유로는 분석 인프라의 낮은 퍼포먼스, 관련 기술의 미성숙, 데이터 사이언티스트의 역량 부족, 분석 가능한 데이터의 부족 등이 꼽힌다. 기업이 AI와 빅데이터에 대한 투자를 성공시키고 활성화하기 위해서는 먼저 이와 같은 요소들에 대해 정확한 원인 분석과 진단이 이뤄져야 한다. 이러한 원인 분석과 진단은 데이터 거버넌스 프레임워크가 갖춰야 할 필수 요소다.

이어서 정동원 이사는 AI·빅데이터 관리를 위한 데이터 거버넌스 프레임워크가 기존과 어떻게 달라져야 하는지 설명했다. 먼저 첫 번째는 데이터의 운영·관리뿐만 아니라 활용 측면을 고려해야 한다. 과거에는 데이터가 비즈니스 수행의 결과물 정도로만 관리되고 단순한 기록물로 축적됐다. 하지만 데이터에서 새로운 가치를 발견하고 기존의 문제를 개선하기 위한 도구로 사용하려면, 데이터를 수집·저장하는 단계에서부터 활용 측면을 고려해야 한다.

두 번째는 데이터의 현황(As-Is)에 대한 진단과 미래 방향성(To-Be)을 설계할 수 있어야 한다. 과거에 사용된 ISP 방법론 같은 경우, 정보화 전략의 현황을 진단하고 개선하는 일련의 행위가 담겨 있지만 향후 지속적으로 운영하는 부분은 고려하지 않았다는 한계가 있다. 하지만 데이터 거버넌스 프레임워크는 단순히 일회성 프로젝트를 위한 도구로 활용되는 것이 아니라, 향후에도 지속적으로 기업의 데이터 거버넌스를 관리하고 운영할 수 있는 구조로 개발돼야 한다.

마지막으로 데이터 거버넌스 프레임워크는 유동성을 갖춰야 한다. 데이터 거버넌스 프레임워크를 구축했다고 하더라도 기업의 목표와 주변을 둘러싼 비즈니스 환경은 빠르게 변화하고 있다는 점을 간과해서는 안된다. 따라서 데이터 거버넌스 프레임워크 역시 변화에 대응할 수 있는 형태로 구성되는 것이 바람직하다.

그렇다면 데이터 분석이 활성화되기 위해서는 데이터 거버넌스 프레임워크가 어떤 역할을 수행해야 할까? 이에 대해 정동원 이사는 데이터가 사용자에게 전달될 때 ▲활용 가능한 품질·포맷으로 ▲적절한 시점에 ▲효과적인 방식으로 전달돼야 하며, 사용자는 최적의 방법으로 데이터를 활용해 유의미한 결과를 얻을 수 있어야 한다고 강조했다.

비투엔의 데이터 거버넌스 프레임워크

이를 위해 비투엔은 전사적인 데이터 라이프 사이클을 먼저 고려한 데이터 거버넌스 프레임워크를 구축했다. 비투엔의 데이터 거버넌스 프레임워크는 데이터가 생산·저장·가공·활용되는 일련의 과정을 고려해 ▲안정적·체계적 데이터 생산 및 운영 관리 ▲데이터 관리의 지능화 ▲데이터 활용 최적화 등 3개의 레이어로 구분돼있다. 이에 대해 정동원 이사는 “일반적인 데이터 거버넌스 프레임워크를 보면 가장 먼저 기업의 최종적인 비전이 있고, 그 아래에 세부적인 목표와 정책이 정의된다. 반면 비투엔은 데이터 거버넌스 프레임워크가 다뤄야 할 주요 모듈별로 목표와 정책, 원칙·기준·절차·도구 등을 각각 정의해 차별화하고 있다. 프로젝트 현장에서도 이와 같이 개별적으로 정의된 프레임워크가 더 이상적이라고 생각한다”고 설명했다.

끝으로 정동원 이사는 비투엔의 데이터 거버넌스 프레임워크를 실제 산업 현장에 적용한 사례를 소개했다. 해당 프로젝트에서는 먼저 비즈니스 현황 분석을 통해 기업의 데이터 거버넌스 체계와 관리 형태를 점검한 결과, 데이터 분석가들이 원하는 데이터를 찾기 어려워한다는 문제점이 발견됐다. 이에 따라 비투엔은 데이터 공유 활용 지원 시스템 구축이라는 목표를 설정하고 ▲데이터셋과 메타DB 구축 ▲데이터셋에 대한 검색 및 조회 기능 구축 ▲유관 시스템과의 연계 체계 구축 등을 단계적으로 수행했다. 또한 향후 데이터 거버넌스 프레임워크가 지속적으로 관리‧운영될 수 있도록 업무 프로세스 분석을 수행해, 각 업무별로 필요한 인력과 수행에 필요한 시간 등을 산출해 제공했다.

정동원 이사는 “만약 기업에서 AI‧빅데이터 환경에 대해 많은 투자를 진행했으나 아직 충분한 결과를 얻지 못한 상황이라면, 데이터 거버넌스에 대한 수립 또는 운영에 대한 고민이 필요한 시점”이라고 강조했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지