도메인 전문성 갖춘 부처별 관리 필요…연결‧통합에는 데이터 가상화 활용해야

[아이티데일리] 정부가 디지털플랫폼정부 구현을 2023년 핵심 과제 중 하나로 삼아 집중 추진한다는 계획을 발표했다. 기획재정부의 발표에 따르면, 2023년 디지털플랫폼정부 구현사업에 투입되는 예산은 전년 대비 1,168억 원 증가한 4,050억 원이다. 주요 사업은 행정안전부와 국토교통부, 과학기술정보통신부 등의 부처에 나누어 편성됐다. 지난 9월 출범한 디지털플랫폼정부위원회가 중심을 잡고 각 부처들과 협력해 관련 사업을 계획하고 추진해나갈 예정이다.

다만 올해부터 증가된 예산을 바탕으로 디지털플랫폼정부 구현이 탄력을 받아야 하는데, 아직까지 정확하고 구체적인 로드맵이 만들어지지 않았다. 특히 예산의 대부분이 기존 서비스 운영 확대 및 신규 대국민 서비스 개발에 초점이 맞춰져 있고 데이터 관리‧활용 환경 정비나 인프라 확충 등에 대한 투자는 부족한 것으로 보이는데, 위원회 출범 당시에 디지털플랫폼정부의 데이터 아키텍처로 데이터 레이크(data lake)를 고려하고 있다는 메시지를 던져 한층 더 우려되는 부분이다.

그동안 방대한 데이터를 보유하고 있는 조직에서는 반드시 데이터 레이크를 구축해야 하는 것처럼 여겨졌다. 모든 데이터를 날것 그대로(raw data) 한 곳에 모으자는 데이터 레이크의 개념은 방대하고 다양한 데이터들을 통합할 수 있는 유일한 방법처럼 보였다. 데이터의 의미를 사용할 때 정의함으로써(schema-on-read) 실시간으로 생성되는 방대한 데이터를 빠르게 저장하고, 서로 다른 데이터들을 한 곳으로 모아서 살펴보면서 새로운 가치를 만들어낼 수 있으리라는 기대도 있었다.

하지만 시간이 흘러 데이터 레이크의 단점과 한계가 수면 위로 떠오르면서 기업들의 인식이 변화하고 있다. 데이터를 그저 한 곳에 몰아넣기만 해서는 가치있는 인사이트를 만들기 어렵고, 오히려 너무 다양한 데이터들이 뒤섞여 있으면 원하는 데이터를 찾기가 더 어렵다는 점이 부각됐다. 물리적인 통합 저장소를 만들다보니 인프라에 투자해야 하는 비용도 크게 증가했고 원천 데이터 소스와 데이터 레이크 사이에 실시간 정합성을 유지하기 위한 관리 비용도 상당한 수준이었다. 적지 않은 수의 데이터 레이크들이 ROI 측면에서 장대한 실패를 겪었다.

디지털플랫폼정부의 핵심 목표 중 하나는 ‘모든 데이터가 연결되는 디지털 플랫폼’을 구현하는 것이다. 그런데 ‘모든 데이터가 연결된다’는 목표를 단순히 데이터들을 한 곳에 몰아넣는 방법으로 해결하려고 들어서는 안된다. 연결성을 만들지 않고 그저 하나의 데이터 레이크에 쌓아놓기만 해서는 그저 제멋대로 화물을 쌓아놓은 야적장에 불과하며, 이들 사이에 유기적인 관계가 발생해 새로운 인사이트가 만들어지기를 기대할 수는 없다.

데이터 패브릭(data fabric)이나 데이터 메시(data mesh)와 같이 최근 주목받고 있는 차세대 데이터 전략에서는 데이터 레이크와 같은 단일한 데이터 저장소를 필요로 하지 않는다. 오히려 도메인 별로 각각의 데이터 소스들에 대해 관리 주체를 명확히 하고, 이들을 논리적으로 연결해 살펴볼 수 있는 데이터 가상화(data virtualization) 레이어를 만들어야 한다고 권한다. 각 도메인 전문가들이 데이터를 관리하므로 보다 양질의 데이터를 확보하기 쉬워지고, 사용자 입장에서는 가상화 레이어를 통해 원하는 데이터를 손쉽게 검색하고 활용할 수 있다.

정부가 구상하는 디지털플랫폼정부가 다가올 미래에 대비해 디지털 혁신을 추구하고자 한다면, 그 기반으로 모든 부처를 통합하는 데이터 레이크를 활용하는 것은 옳지 못하다. 개별 부처에서는 업무 효율성을 높일 수 있는 가장 최적화된 형태로 데이터를 운영 및 관리하도록 하고, 각 부처의 데이터를 손쉽게 조회하고 통합해 분석할 수 있는 가상화 레이어가 운영되는 환경, 이것이 미래를 대비하는 디지털플랫폼정부의 기반이 돼야 할 것이다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지