엔코아 오성 컨설턴트

 

▲ 오성 엔코아 컨설턴트

[아이티데일리] 데이터 시각화는 사용자에게 정보를 전달하는 것이 주목적이다. 하지만 시각화에서 만들어지는 데이터와 신호를 사용자에게 모두 전달할 수 없다. 그리고 모든 정보를 표현해도 이를 사용자가 모두 받아들이는 것은 어려운 일이다.

하나의 예를 들어보자. 우리가 기사와 뉴스를 탐색하는 방법이다. 방송에서 하는 뉴스의 경우에는 아나운서가 진행하는 순서대로 보게 된다. 일반 신문의 경우 보고 싶은 기사나 카테고리를 찾아 볼 수 있지만, 대부분은 앞에서부터 순서대로 훑어보면서 관심 있는 기사만 읽거나 여유가 있으면 전체를 읽기도 할 것이다.

그러나 포탈이나 뉴스 정보를 제공하는 사이트의 경우, 메인 페이지에 요약된 정보를 보고 찾아가는 방법과 자신이 보고 싶어 하는 카테고리 또는 검색을 할 수 있고, 자신이 원하는 주제나 단어를 선택해 정제된 뉴스를 볼 수 있다. 이유는 다양하지만, 포털 사이트의 경우 검색 기능을 제공하고, 많은 사이트에서 동시에 뉴스가 전송되기 때문에 사용자는 관심 분야를 한정 지어 보게 되는 것이다. 이처럼 예전의 미디어 방식이 아닌, 최신의 미디어 방식은 관심을 가진 분야를 선택해 보게 된다.

하물며 업무를 진행하기 위해 사용하는 비즈니스 데이터 시각화에서 어떠한 정제나 구분 없이 수많은 신호와 데이터를 전달하려고 한다면, 사용자는 이를 받아들이기 어려울 것이다. 그리고 사용자는 어떠한 의사 결정도 할 수 없고, 아무런 의미를 가지고 있지 않은 정보를 받아들일 필요도 없다. 그렇기 때문에 사용자에게 정보를 전달해주기 위한 기준과 방법이 필요한 것이다.

단순하게 데이터 값과 이에 대한 변동을 표현하는 것만으로는 비즈니스의 요구를 충족시킬 수 없다. 비즈니스 데이터 시각화가 비즈니스의 요구를 충족시키기 위해서는 데이터 값의 의미를 파악해 사용자에게 전송하고 이에 대한 정량적인 평가를 해야 한다. 이러한 데이터 값의 의미를 정의하고 평가된 것을 ‘임계값’(또는 ‘임계치’라고도 부른다)이라고 한다.

임계값이란 데이터가 가지고 있는 의미에 대해 이를 사전에 평가하고 관리하기 위해 설정된 파라미터(Parameter)다. 시각화에서 임계값을 정의하면 업무적으로 얻고자 하는 결과를 얻는데 도움이 될 것이다. 이는 ‘성과(Performance)’를 표현하는 데이터만을 의미하지 않는다. 기업 내부에는 다양한 업무 기능이 존재하고, 이 기능들은 많은 리스크에 노출돼 있다. 이러한 리스크에 대해 이를 빠르게 감지하고 반응하기 위해 ‘Alert’를 정의해 빠른 대응을 가능하게 해준다.


임계값은 어떻게 정의해야 하는가

아래 예시는 어느 조직의 월간 매출액 변화에 대한 임계값을 정의한 것이다.

 

▲ 매출액에 대한 평가 기준

 

위 그림에 표현된 ‘전년 동월 대비 매출액 변동률’은 다른 차원과 관계없이 어는 곳이든 균일하게 적용할 수 있다. 그러나 이러한 임계값 정의는 대부분 적절하지 못하다. 예를 들어 보자. 지리적 차원의 관점에서 접근해보면 어느 지역은 소비 수준이 높아지고 있거나, 새로운 인구의 유입이 많은 지역이 있을 수 있다. 이러한 지역에 속해 있는 조직은 별다른 노력이 없어도 위의 평가 기준을 달성할 수 있을 것이다.

하지만 다른 지역의 경우, 반대로 소비 수준이 점차 낮아지거나 인구가 줄어드는 지역이 있을 수 있다. 이 지역은 전년 동월 대비 동일한 성과를 유지하는 것만으로도 큰 성과다. 그러나 이러한 특성을 고려하지 않고 평가한다면 직원들은 극심한 스트레스와 이탈을 겪게 될 것이다. 그렇기 때문에 이러한 상황을 고려하지 않고 임계값을 설정할 수 없는 것이다.

또한 상품의 차원에서도 고려해야 한다. 자사가 취급하는 상품이 진입장벽이 높고 이미 성숙된 시장에서 특정 포지션에 위치했다고 가정하자. 이러한 상품은 성장이 더디지만 지속적인 매출을 올릴 수 있기 때문에 매출의 감소에 기준을 맞춰야 한다. 하지만 새롭게 발굴되고 성장 가능성이 높은 시장에 진입하는 것이라면 매출의 증가에 기준을 맞춰야 한다. 그렇기에 다양한 차원을 고려하지 않고 동일한 기준으로 임계값을 정의하는 것은 매우 위험한 일이다.

아래 예시는 한 조직의 기업 고객과 개인 고객에 대한 클레임 당일 처리 비율에 대해 임계값을 정의한 것이다.

▲ 고객 클레임 처리에 대한 평가 기준

 

위 예시에서 ‘기업 고객’과 ‘개인 고객’에 대한 클레임 당일 처리 비율이 다른 이유는 다양할 수 있다. 하나는 주 타깃 고객이 기업 고객이기 때문에 개인 고객보다 더 빠른 처리를 요할 수 있다. 아니면 두 고객군에 대해 완전히 다른 상품군을 제공하기 때문에 이를 다르게 설정했을 수 있다. 또한 지리적 요인이나 시간적인 차원에서의 요소가 다르게 작용될 수 있기 때문이다.

이처럼 임계값은 사용하고 관리하는 업무 영역이나 조직의 현재 위치, 성과에 대한 기준 등 다양한 요소에 따라 정의할 수 있다. 같은 조직 안에서도 각 상품에 대해, 각 지역에 대해, 각각의 기간에 대해 모두 서로 다를 것이다. 이것은 조직이 성과에 대한 기준을 설정할 때 자주 실수하는 것으로, 하나의 기준을 전사의 모든 기준으로 적용하는 것은 하지 말아야 할 오류다. 조직의 규모와 활동을 평가하지 않은 상태에서 무턱대고 임계값을 정의해 도달할 수 없는 임계값을 정의하는 것은 조직 구성원의 사기를 저하시킬 수도 있기 때문이다.

반드시 임계값을 설정하려고 하는 업무에 대한 정확한 이해가 필요하며, 성과에 대한 도달과 반응이 가능한 임계값을 설정해야 한다. 또한 한 사람 또는 한 조직이 무턱대고 모든 평가 기준을 만드는 것이 아니라, 해당되는 구성원의 동의를 얻은 평가 기준을 설정해야 할 것이다.

이러한 임계값은 비즈니스를 시각화하는 솔루션인 BI, 기업 성과 관리(EPM), 기업 활동 감시(BAM)등에서 모니터링하는 정보의 단위다. 이러한 다양한 시스템에서 데이터를 시각화하기 위해 다양한 그래픽 효과와 차트를 이용하게 된다. 주로 실시간 정보를 표현하는 그래픽 효과는 자동차에 표시돼 있는 속도계 형태다. 속도계 내에는 다양한 컬러를 기준으로 서로 다른 임계값 수준을 표현하고, 바늘로서 실제 데이터 값을 나타낸다. 또한 시간의 흐름이 표현이 돼야 하는 형태는 꺾은선 차트 등을 이용해 이전에 어떠한 일이 있었는지를 표현한다. 이 부분은 시각화의 방법에서 자세히 설명한다.


임계값의 정의 방법과 다양한 분류 방법

임계값을 정의하는 방법과 분류하는 방법은 다양하게 존재한다. 이는 사용하는 조직의 업무 영역과 사용 목적, 데이터 소스, 업무에서 목표 등 다양한 요소에 다라 설정을 하기 때문에 임계값을 정의하고 분류하는 방법이 다양한 것이다. 아래는 임계값을 정의하는 일부 방법이다.

• 단일 규칙에 대한 정의
• 단일 시각화 내 복합적이거나 임계값 서로에 연관된 규칙을 정의
• 서로 다른 시각화에 연관돼 규칙 정의

‘단일 규칙에 대한 정의’는 규칙 자체만으로 보면 매우 단순한 구조다. 하지만 이를 정의하기 위해서는 업무 영역에 대한 특징과 주변 요소에 대해 많은 것을 고려해야 한다는 것을 잊지 말아야 한다. ‘일일 불량품 5% 이하 시 Best’라고 정의하는 것처럼 값 자체는 단순하게 정의된다. ‘단일 규칙에 대한 정의’는 아래와 같은 방법으로 정의할 수 있다.
 1) 기 정의된 값 또는 범위를 벗어나 발생하는 포인트
 2) 연속적으로 증가하거나 감소하는 포인트
 3) 연속적으로 기 정의된 값 또는 범위를 위아래로 번갈아가며 발생하는 포인트
 4) 기준값과 동일한 위치의 연속된 포인트

‘단일 시각화 내 복합적이거나 임계값 서로에 연관된 규칙을 정의’는 표현된 데이터 시각화에서 업무적인 다른 차원이 변동함에 따라 서로 선형적인 관계를 가지는 규칙을 정의하거나, 서로 다른 다수의 차원을 논리적으로 조합해 새로운 규칙을 생성하는 것이다. 서로 선형적인 관계를 가지는 규칙은 증권 시장에서 차트를 분석하는 ‘기술적 분석’과 유사한 구조라고 보면 된다.

증권 시장에서 기술적 분석이란 과거의 가격에 대한 추세나 거래량을 보고 미래에 발생할 수 있는 추세를 예측하는 것이다. 여기서는 좀 더 포괄적인 개념으로 이를 예측하거나 현재의 상태를 복합적으로 표현해 관련된 조직이 비즈니스를 수행하는데 있어서 다양한 도움을 받을 수 있게 해주는 것이기 때문이다.

‘서로 다른 시각화에 연관되어 규칙 정의’는 데이터 시각화가 표현하고 있는 지표에 대해 연관성을 정의해 규칙간의 연계성을 갖게 하는 것이다. 예를 들어 외부의 투자 관련 지표들이 나쁜 신호를 줄 때 내부의 지표들을 긴축적으로 운영하게 되는 것과 같은 것이라고 보면 된다. 이는 단일로 표현되는 시각화에 규칙을 설정하는 것보다 더 강력한 데이터의 신호를 포착해 비즈니스 기회를 제공받을 수 있다.

위의 설명처럼 값의 형태를 기준으로 임계값을 정의하는 방법만이 아니라 ‘업무 성과(Business Performance)’, ‘리스크 관리(Risk Management)’, ‘업무 운영(Business Operation)’ 등 업무의 특성에 따라 분류하는 방법, 시각화 내에서 ‘임계값이 어느 정도의 유동성을 가질 것인가’를 정의하는 방법 등 다양한 차원에서 접근이 가능하다.

물론 임계값 정의할 때는 위에서 설명한 정의 방법을 모두 따라야 한다는 것은 아니다. 필요한 상황에 따라 자료를 참조하고 업무 도메인에 맞게 사용할 수 있으면 된다.


임계값에 대한 Alert

데이터 시각화에 임계값을 정의하고 나면 이를 시스템이나 사용자가 확인할 수 있도록 주기를 설정해야 한다. 하나의 데이터 값만을 참고하고 업무를 보는 사용자라면 문제없겠지만, 대부분 업무 상황과 조직의 규모에 따라 여러 개의 데이터 값을 하나의 화면에 시각화돼 있거나 서로 연관시켜 여러 개 화면을 구성해놓았을 것이다.

또한 사용자는 화면만을 보고 있는 것이 아니라 회의를 다닐 수도 있고, 다른 화면에서 작업을 할 수 있을 것이다. 그래서 임계값에 대해 검사하는 주기를 설정하고, 이에 대해 어떠한 방법으로 사용자에게 알려야 하는지 정의해야 한다.

Alert의 알림 주기는 두 가지로 분류되는데, 하나는 검사하는 주기를 정의하고 해당 시점의 데이터 값을 사용자에게 반복적으로 알리는 방식과, 사용자가 정의한 임계값에 도달했을 때 주기와는 관계없이 알리는 방식이 있다.

앞에 설명한 반복적인 주기를 가지고 알리는 방식의 경우 단순히 값만을 알리는 것보다는 현재 수치와 임계값 도달까지의 차이 등 다양한 정보를 복합해 리포트 형식으로 사용자에게 알리게 된다. 이는 사용자에게 즉각적인 대처를 요하기보다는 이를 주기적으로 보고받고 중요한 의사 결정을 내릴 수 있도록 하는 것에 초점이 맞춰진다.

 - 매일 지정된 특정 시간에
 - 매주 지정된 특정 요일에
 - 매월 지정된 특정 일자에
 - 반복적인 00분 간격으로
임계값에 도달했을 때 알리는 방식은 사용자에게 즉각적인 행동을 요하거나, 이를 빠른 시점에 알려줘 발생할 수 있는 피해를 최소화하는데 목적이 있다. 이 방식의 경우는 수신자에 대한 지정과 알리는 방법이 중요하고, 이에 대해 반응할 수 있는 행동에 대해 매뉴얼화 돼야 한다.

예를 들어, 한 공장의 제품을 자동으로 포장하는 라인이 있다고 하자. 이 라인에서 연속으로 5개 이상의 포장 불량이 나왔을 경우에는 해당 시간의 감독관은 무조건 생산 라인을 중단시키고 원인을 파악해야 한다는 식의 구체화된 행동 지침이 있어야 한다.

증권 시장에서의 서킷브레이커(Circuit Breakers)가 발동될 때와 같다. 종합주가지수가 전일에 대비해 10%이상 하락한 상태가 10분 이상 지속되는 경우 모든 주식 거래를 20분간 중단시키는 것이다. 시스템적인 행동을 정의했을 때는 수신자를 지정하지 않는 경우도 있지만, 사용자에게 알림으로만 되는 경우에는 수신자 지정은 매우 중요하다.

 

저작권자 © 아이티데일리 무단전재 및 재배포 금지