데이터스트림즈 ‘이루다(IRUDA)’

 

[컴퓨터월드] 데이터 거버넌스는 기업 안팎에서 수집·생성되는 모든 데이터에 대한 관리체계다. 데이터의 중요성이 부각될수록 이를 제대로 관리하고 활용하기 위한 데이터 거버넌스의 중요성이 높아지고 있다. 오늘날 기업은 다양한 채널을 통해 대량의 데이터를 수집하고 있으므로, 이를 제대로 저장 및 활용하기 위해서는 보다 강력하고 체계적인 데이터 거버넌스를 갖춰야 한다. 데이터 사용자와 분석가는 제대로 된 데이터 거버넌스 상에서 정확한 인사이트를 찾아낼 수 있다.

하지만 많은 데이터들이 애플리케이션·서비스 위주로 수집·저장·관리되다보니 이들을 통합해 관리하고 활용할 수 있는 방법이 부족했다. 깊이 있는 분석을 위해서는 보다 많고 다양한 데이터들을 복합적으로 살펴볼 필요가 있는데, 서로 다른 애플리케이션·서비스에서 데이터를 각각의 형식에 맞춰 개별적으로 관리하게 되면 이를 전사 차원에서 통합하고 활용하기 어렵다. 필요한 데이터가 있어도 해당 시스템 담당자에게 요청하고 회답을 기다리는 동안 낭비되는 시간이 발생하며, 서로 다른 형식의 데이터들을 통합·가공하기 위해 많은 노력을 들여야 한다.

따라서 기업은 전사적인 데이터 거버넌스 전략을 갖춰 데이터가 생성되는 순간부터 일정한 형식으로 만들어지도록 하고, 분산돼 있는 데이터에 손쉽게 접근하고 활용할 수 있도록 해야 한다. 이를 위해서는 데이터의 출처 및 근원 관리를 위한 버전 관리, 인증, 출처 추적, 생명주기(life cycle) 관리 등을 수행해 신뢰성을 제고하고, 애플리케이션·서비스 별로 각각 구축돼있는 메타데이터들이 상호 연동될 수 있도록 하며, 사전에 데이터 형식을 정의할 수 있어야 한다.


통합 거버넌스 관리 솔루션 ‘이루다’

‘이루다(IRUDA)’는 데이터스트림즈가 제공하는 다양한 솔루션들을 연결해 데이터 거버넌스를 실현하는 통합 거버넌스 관리 솔루션이다. 데이터스트림즈는 ‘메타스트림(MetaStream)’, ‘마스터스트림(MasterStream)’, ‘퀄리티스트림(QualityStream)’, ‘Q-트랙(Q-Track)’ 등 데이터 관리와 관련된 다양한 솔루션들을 보유하고 있다.

‘메타스트림’은 기업 내에서 사용되는 메타데이터 표준을 사전에 정의하고, 이미 보유하고 있는 데이터들과 새롭게 생성되는 데이터들이 표준에 맞게 생성되고 있는지를 점검한다. 데이터가 생성되기 전에 설계 단계서부터 데이터의 형식을 표준화함으로써 기업 내 데이터들이 일관된 형태를 갖추도록 통제할 수 있다.

‘퀄리티스트림’은 각각의 데이터들이 비즈니스 규칙에 맞게 생성되고 관리되고 있는지를 지속적으로 점검해 피드백을 제공한다. 또한 ‘Q-트랙’은 각각의 애플리케이션 및 서비스를 분석해 데이터가 생성되고 활용되며 최종적으로 폐기될 때까지 모든 흐름을 시각화해, 데이터 리니지(linage)를 확인해 데이터가 잘못된 애플리케이션 및 서비스로 이동하는 것을 막고 오류가 발생한 지점을 확인할 수 있다.

하지만 각각의 솔루션들이 제공하는 기능은 개별적으로 활용할 수 있을 뿐, 이들을 단일한 플랫폼 상에서 서로 연결해서 이용할 수는 없었다. ‘메타스트림’으로 기업의 메타데이터를 효과적으로 관리하거나 ‘Q-트랙’으로 데이터의 흐름과 연결구조를 시각적으로 확인하는 것은 가능했지만, 이러한 기능들을 활용하기 위해서는 각각의 솔루션에 따로 접근해야 한다. 따라서 이러한 솔루션들로 의미 있는 비즈니스 목적을 달성하는 것은 사용자의 역량이었다.

‘이루다’는 이렇게 흩어져있는 솔루션들을 하나로 연결한다. 메타데이터를 기반으로 각각의 솔루션들을 연결해 하나의 데이터를 확인할 때도 보다 편리하게 다양한 솔루션들을 사용할 수 있다. 이를 통해 사용자는 ‘이루다’ 플랫폼 안에서 데이터가 생성되고 폐기되는 라이프사이클 전반을 편리하게 관리할 수 있다.

▲ ‘이루다’를 통해 기존 데이터 거버넌스 솔루션들을 통합해 새로운 인사이트를 제공할 수 있다.

가령 데이터 품질 관리 솔루션 ‘퀄리티스트림’을 사용해 의심되는 테이블 및 컬럼을 식별한 다음, 메타데이터 통합 관리 솔루션 ‘메타스트림’을 링크해 해당 테이블의 정보를 확인하고 정상값 여부를 진단할 수 있다. 또한 문제가 있는 데이터가 발견될 경우 데이터 흐름관리 솔루션 ‘Q-트랙’으로 연결해 해당 데이터가 생성된 지점이나 다른 테이블과의 연관관계, 사용처 및 수정 현황 등을 추적할 수 있다. 이 과정에서 사용자는 각각의 솔루션에 별도로 접근하지 않아도, 해당 데이터를 클릭하는 등 직관적인 상호작용을 통해 서로 다른 기능을 편리하게 사용 가능하다.

이는 일관된 데이터 거버넌스 하에서 표준과 품질을, 혹은 표준과 리니지(linage)를 동시에 확인할 수 있도록 만든다. 사전에 정의된 전사 메타데이터를 기반으로 하위 솔루션들을 연동해 데이터가 있는 곳을 찾고 열람하며 흐름을 제어하는 일련의 과정이 편리하게 진행된다.


‘보이는 데이터 거버넌스’ 구현

이러한 솔루션 간의 연결을 통해 ‘이루다’는 기업 내·외부에서 수집되는 다양한 데이터들에 대해 체계적인 관리 프로세스를 구축함으로써, 누구나 쉽게 필요한 데이터에 접근해 업무에 활용할 수 있는 ‘보이는 데이터 거버넌스’를 구현한다.

‘보이는 데이터 거버넌스’란 기업이 어떤 데이터를 보유하고 있는지, 어느 스토리지에 어떤 형식으로 저장하고 있는지, 누가 생성했으며 어디에서 활용되고 있는지 등을 한 눈에 확인할 수 있는 전사적인 데이터 관리체계를 말한다. 이로써 IT 관리자는 기업 내 모든 데이터를 단일한 표준과 체계 하에서 관리할 수 있으며, 사용자들은 필요한 데이터에 정확하고 손쉽게 접근해 원하는 시점에 활용할 수 있다.

특히 최신 버전인 ‘이루다 2.0’에서는 ‘보이는 데이터 거버넌스’를 위해 서치&디스커버리(Search & Discovery) 기능을 강화했다. 해당 기능은 데이터 거버넌스를 구축하기 위한 각각의 솔루션들에서 데이터를 통합 검색하고, 검색 결과를 바탕으로 다시 각각의 솔루션 기능을 연결하는 일련의 탐색 프로세스를 의미한다. 사용자는 간단한 키워드 검색을 통해 기업 내 모든 데이터의 위치·저장소·형식 등을 확인할 수 있으며, 검색된 데이터 정보에서 흥미로운 부분을 클릭해 해당 정보를 제공한 솔루션으로 손쉽게 이동하고 보다 심도 깊은 탐색을 수행할 수 있다.

▲ 데이터스트림즈의 ‘이루다 2.0’은 다양한 솔루션들과의 연결과 서치&디스커버리를 통해 ‘보이는 데이터 거버넌스’를 구축한다.

서치&디스커버리 기능을 수행하기 위해 기업 내 모든 데이터들을 한 곳에 모을 필요는 없다. 각각의 데이터들이 가지고 있는 메타데이터 기반의 검색을 수행하기 때문에, 사용자는 보다 쉽고 적은 컴퓨팅 성능만 가지고도 기업 내 모든 데이터들을 검색하고 활용할 수 있다.

한편 데이터스트림즈는 향후 ‘2.1’, ‘2.2’ 업데이트 등에서는 시각적인 측면을 강화해 전체 데이터에 대한 직관적인 인사이트를 제공할 계획이다. 이를 위해 먼저 가까운 시일 내에 대시보드 기능이 추가된다. 대시보드는 표준·품질·흐름 등 각각의 솔루션마다 별도로 제공되거나, 검색된 데이터들에 대한 통계 등을 보여주는 식으로 작동한다.

현재는 서치&디스커버리 기능으로 키워드를 검색하면 관련 정보들이 텍스트로 제공되지만, 집계/통계 방식으로 데이터들을 모아볼 수 있는 대시보드를 제공함으로써 이해를 높일 계획이다. 대시보드 기능이 도입되면 ‘이루다’ 상에서 데이터의 품질이나 데이터 값에 대한 평균적인 평가 등도 단일한 화면 내에서 확인할 수 있다.

[인터뷰]

“통합 데이터 거버넌스 실현 위한 새로운 플랫폼”

▲ 신동선
데이터스트림즈 상무

신동선 데이터스트림즈 상무

Q. ‘이루다’의 개발 목적은?

데이터 거버넌스와 관련된 국내 제품들은 대개 표준이나 품질, 흐름 등 데이터 거버넌스를 위한 한두 개 기능만 제한적으로 가지고 있는 게 대부분이다. 하지만 고립된 데이터 거버넌스 제품만 가지고는 기업의 데이터 거버넌스 전략을 달성할 수 없다. 또한 글로벌 제품 중에는 다양한 데이터 거버넌스 기능을 지원하는 제품들이 있지만, 한글에 대한 이해도가 부족하면 데이터 품질 관리 측면에서 어려움이 있을 수 있다. 이러한 측면에서 ‘이루다’는 서치&디스커버리를 중심으로 통합 데이터 거버넌스를 실현하기 위한 새로운 플랫폼이다.

또한 그동안 고립돼 있던 데이터스트림즈의 개별 제품을 연결하는 시도이기도 하다. ‘이루다’라는 큰 지붕 아래에서 우리의 다양한 제품들을 연결하고, 단순히 데이터 그 자체가 가지고 있는 정보뿐만 아니라 두 개 이상의 솔루션이 결합됐을 때 나타나는 새로운 융합 정보들을 만들어낸다. ‘Q-트랙’이 데이터의 흐름과 이동 관계 등을 보여준다면, 원본 데이터의 작성자나 작성시점 등 메타정보들을 결합해 새로운 관점을 만들어내는 게 ‘이루다’의 역할이다.


Q. ‘이루다’의 주요 사용자층은?

‘이루다’가 제공하는 직관적이고 통합된 정보들은 IT 부서에게도 물론 중요하지만, 현업 조직처럼 다양한 솔루션들을 익히고 활용하기 어려운 경우 특히 유용하다. 직관적인 대시보드와 조작을 통해 현업 조직도 어렵지 않게 활용할 수 있다. 또한 현업 조직들이 ‘이루다’ 플랫폼 안에서만 데이터에 접근한다면 IT 조직은 보안 및 접근권한 관리 등에서 편의성을 얻을 수 있다.

지금까지 데이터 거버넌스는 IT 부서에서 운영하고 사용했지만, 데이터와 IT 기술이 사용자 중심으로 변화하면서 현업 조직에서도 이를 활용할 필요가 생기고 있다. ‘이루다’ 역시 이렇게 사용자 중심으로 변화하는 트렌드에 발맞춘 것이다.


Q. 단일한 플랫폼을 통해 데이터스트림즈에 변화가 있다면?

세일즈 전략이 크게 달라진다. 예전에는 고객사별로 각각의 솔루션을 따로 납품하는 단품 판매 전략을 추진했지만, 이제는 ‘이루다’에 나머지 솔루션들을 패킹해서 제공할 계획이다. 일종의 모듈화 전략이다. ‘이루다’를 우선적으로 도입하고 나면 플랫폼 안에서 제공하는 다양한 기능 중 필요한 것을 선택적으로 도입해 사용할 수 있다. 가령 이전에는 메타데이터 관리를 위한 ‘메타스트림’을 우선적으로 제공했는데, 지금은 ‘이루다’ 플랫폼 안에 들어오기만 하면 기업의 필요에 따라 도입 순서를 자유롭게 정할 수 있다.

심지어 한 고객사는 ‘이루다’ 내에서 경쟁사 제품을 같이 쓰고 싶다고 요구하는 경우도 있었다. 기존에 익숙하게 사용하던 제품을 포기하기도 어렵고, ‘이루다’ 플랫폼 내에서 보다 많은 기능들을 활용하려는 필요에서다. 앞으로도 고객사들에게서 이와 같은 요구가 종종 있을 것으로 보이는 만큼 ‘이루다’의 플랫폼으로서의 역량을 강화시켜나갈 것이다.

 

저작권자 © 아이티데일리 무단전재 및 재배포 금지