08.25
주요뉴스
뉴스홈 > 종합/정책
고객가치 평가의 척도 - RFM고객은 기업의 가장 큰 자산

▲ 이용구 leeyg@spss.co.kr 중앙대학교 통계학과 교수이며 SPSS코리아 고문이기도 하다. 한국분류학회장 및 한국통계학회 교육상담연구회장, 한국데이터마이닝학회 이사직을 역임했으며 다변량 통계분석, 분류분석, 데이터마이닝 등이 관심분야이다. 미국 미네소타주립대 통계학박사로 통계학의 이해(율곡출판사), 다변량분석(공저, 한국방송대 출판부), 마케팅조사 통계분석(공저, SPSS 아카데미), 데이터마이닝 모델과 사례(공저, SPSS 아카데미), 범주형자료분석(공저, 한국방송대 출판부) 외 다수의 저서가 있다.





피터 드러커(Peter Drucker)의 말처럼, '기업의 첫 번째 과업은 고객창출'이다. 그러나 오늘날 고객들은 다양한 제품, 브랜드, 가격과 공급자들에 대한 다양한 정보를 쉽게 구할 수 있기 때문에 제품에 대한 선택을 어떻게 해야 하는가의 고민에 빠져 있다고 할 수 있다.

이는 기업입장에서 보면 그만큼 시장에서의 경쟁이 치열하며, 따라서 고객확보와 유지가 매우 중요하다는 것을 의미한다. 그러나 다른 한편으로 기업입장에서 보면 모든 고객이 동일한 가치를 갖는 것이 아니다. 즉 일부 우수 고객은 기업에 크게 기여하나 또 다른 고객은 기업에 손해를 끼치는 경우도 있다.

그러므로 기업이 우선적으로 추진해야 할 과제 중 하나는 수많은 대상 고객들 중에서 어느 고객이 기업에 큰 이익을 가져다주는 우수고객이며, 누가 기업에 손해를 가져다주는 불량 고객인가를 평가할 필요가 있다. 즉 한정된 자원을 가지고 효율을 극대화하기 위하여서는 고객들의 가치를 평가하고 그 결과를 이용하여 차별화된 마케팅 전략을 수립하여야 한다.

<그림 1>은 수익의 대부분이 주요 고객으로부터 발생되고 있다는 것을 보여 준다. 흔히 마케팅에서는 "상위 20%의 고객이 전체 매출의 80% 또는 70%를 차지한다"는 파레토 법칙이 있다. 이는 고객 가치 관리의 중요성을 다시 한번 말해준다. 모든 고객이 수익성을 가져다주는 고객이 아니므로, 고객의 로열티를 향상시켜 가치 있는 고객들이 이탈하지 않고 지속적으로 유지될 수 있는 모형의 제시가 필요하게 된 것이다.

다른 예로 DM(Direct Mail)에 있어서 평균응답률은 약 2%정도로 알려져 있다. 그러나 만약에 누가 그 2%안에 들을 것인가를 사전에 알 수 있다면 응답을 하지 않을 나머지 98%의 사람들에게 우편을 보내지 않고도 같은 수준의 응답을 기대할 수 있다. 즉 많은 비용의 절감을 통하여 회사의 이익을 증대시킬 수 있다.

이와 같이 기업의 입장에서 수익을 창출하면서 기업에 충성도가 있는 고객을 확보하기 위해서는 현재 고객 중에서 고객 충성도가 높아 이탈할 가능성이 낮은 고객을 꾸준히 관리하는 것이 가장 효율적이라고 할 수 있다. 요즘 기업에서 널리 활용하고 있는 데이터 마이닝을 언급하지 않더라도 기업은 현재의 고객의 가치를 정확히 판단하고 관리하여 수익을 가져다주는 고객을 만족시켜 그들을 유지해나가고자 하는 노력을 게을리 할 수가 없게 되는 것이다. 문제는 이와 같은 목적 하에서 어떻게 고객을 평가하고 분류할 수 있는가 이다. 이러한 문제를 해결하는 방법으로 여러 가지가 있으나 가장 우수한 방법으로 알려져 있는 것이 RFM 모형이다.


▲ <그림 1> 수익과 주요고객의 관계






RFM 모형
RFM은 일정기간 동안에 발생된 고객의 구매 패턴을 이용하여 고객을 분류할 수 있는 매우 간단하면서도 유용하게 사용될 수 있는 방법으로 알려져 있다. 이 방법은 지난 40년 동안 기업의 마케팅 전략에서 고객의 평가/분류방법으로 가장 많이 사용되고 있는 분석 방법 중 하나이다. RFM은 Recency, Freq uency, Monetary의 첫 문자의 모음으로 고객의 가치를 다음의 세 가지 기준에 의해 계산하고 있다.

·Recency - 거래의 최근성 : 고객이 얼마나 최근에 구입했는가?
·Frequency - 거래 빈도 : 고객이 얼마나 빈번하게 우리 상품을 구입했나?
·Monetary - 거래 규모 : 고객이 구입했던 총 금액은 어느 정도인가?

즉, 최근에 구매한 고객일수록 회사의 마케팅 홍보에 반응을 보일 가능성이 클 것이며, 자주 구매하는 고객이 그렇지 않은 고객보다 반응할 가능성이 더 높고, 많은 금액을 소비한 고객이 다시 구매할 가능성이 더 높다고 할 수 있다. 이와 같은 논리는 거의 모든 상품과 서비스의 구매에 적용할 수 있으며, RFM은 이와 같이 고객의 기본적인 구매 패턴을 이용하여 고객가치를 평가하는 것이다. 즉, 이 세 가지 요소를 기준으로 고객들을 몇 개의 소집단으로 분류한 후에 각 소집단의 특성을 파악하여 우수고객 집단과 불량고객 집단을 구분하는 방법이다.

이와 같은 RFM 모형은 나이, 소득, 주택소유여부 등과 같은 인구 사회학적 요인을 이용한 모형결과 보다 훨씬 우수한 예측력을 갖는 것으로 알려져 있다. 그 이유는 그러한 요인을 이용한 모형에서는 "고객이 누구인가"에 의하여 결과가 도출되는데 비하여, RFM 모형에서는 "고객이 어떤 행동 패턴을 가지고 있나"에 의하여 고객가치를 평가하기 때문이다. 즉 고객의 과거 구매행태에 근거하여 미래의 구매행태를 예측하는 것에 매우 우수한 예측력을 가져다준다고 할 수 있다.

또한 RFM모형은 비용이 많이 들지도 않으며 전문적인 통계학자의 도움이 필요하지도 않다. 단지 고객들의 과거 일정기간동안의 구매행태(언제, 얼마나 자주, 그리고 구매금액)에 대한 정보를 담은 데이터베이스만 있으면 된다.

RFM 모형은 어떻게 구하나

RFM 모형구축은 아주 단순하다. 우선 고객들을 R의 크기 순에 의하여 일렬로 정리한다. 즉, 가장최근에 구매한 고객이 가장 위에 그리고 구매한 날짜가 가장 오래된 고객이 가장 아래에 가도록 정리한다. 이런 후에 고객들을 20%씩 균등하게 5개 집단으로 나누고, 각 집단에 1, 2, 3, 4, 5 등과 같은 번호를 부여한다.

이 결과 집단 1은 구매한지가 가장 오랜 20%의 고객 집단이고, 집단 5는 가장 최근에 구매한 20%의 고객들로 구성된다. 이 원리를 F 와 M에도 적용하여 각각 1이 가장 낮고 5가 가장 큰 5개의 군집으로 구분한다. 즉 모든 고객들은 R, F, M 각각에 있어서 1 에서 5 사이에 있는 하나의 코드를 부여받게 된다. 물론 각 요인에 있어서 고객을 1에서 5까지의 등급으로 구분할 때는 다른 기준을 적용하는 경우도 있다.

예를 들면 R의 경우 날짜를 기준으로 5등급을 구한다든가, 또는 M의 경우 구매금액 기준으로 1000만원 이상은 5등급 1000~500만원은 4등급 등과 같이 하는 경우도 있다. 여하튼 이 결과 고객들은 세 요인에 의하여 (1,1,1)부터 (5,5,5,)까지 5 X 5 X 5 = 125 개의 집단으로 분류된다. 문제는 위와 같은 125개의 집단을 어떻게 구분하여 각 집단별 고객의 충성도를 측정할 수 있는가 이다. 여기에서 단순하게 (1,1,1) 집단은 가장 충성도가 낮은 집단이고, (5,5,5) 집단은 충성도가 가장 높은 집단이라고 할 수 있다. 그렇다면 다른 집단들은 어떻게 순서를 부여할 수 있을까? 이는 물론 상품/서비스의 종류에 따라서 다른 결과를 가져다 줄 것이다.


▲ <표 1>






그러나 대표적으로 <표 1>처럼 네 가지 유형을 생각할 수 있다. <표 1>에 주어진 4가지 경우는 모두 2개 요인 이상에서 우수한 평가를 받는 집단이다. 즉 가장 위의 집단은 모든 요소에서 높은 점수를 받는 최우수 집단이고 다음 세 경우는 각각 두 요소에서는 최우수이나 나머지 한 요소에서는 낮은 점수를 받는 경우이다. 위의 표에서 제시한 바와 같이 각각의 경우에 있어서 구매 행동별로 고객을 묶어 각 고객집단별로 차별화된 마케팅 전략을 수립할 수 있다.


▲ <그림 2> RFM 기법에 의한 고객 세분화






4가지 집단의 고객이 모두가 우수고객이라고 할지라도, 기준기간동안 거래빈도와 총 거래금액이 모두 많았으나 최근에 어떠한 이유인지 활동이 뜸한 고객과 총 거래금액도 많고, 최근에 거래가 발생하였지만 거래빈도가 낮은 고객은 분명 다르게 접근해야 한다. 전자의 고객의 경우 주로 구매하는 제품의 수명주기가 길지는 않은지 혹은 다른 사이트로 이탈한 것은 아닌지를 파악하여 다시 한 번 더 방문하게끔 만드는 전략을 수립해야 할 것이며, 후자의 경우는 구매 제품 유형 및 연관성분석을 통화여 구매빈도를 높이기 위한 '교차판매' 전략을 수립하여 접근하는 것이 더욱 효과적이라고 할 수 있다.

RFM 모델 중에서 위와 같이 RFM의 집단화 코드를 활용하여 고객을 세분화하는 방법을 사용하는 것이 간편하다는 장점이 있는 반면 다음과 같은 문제점이 있다.
우선 RFM 모형에 의하여 각 집단의 서열화를 직접적으로 구할 수 없다. 예를 들어 R과 F 둘이 모두 높은 (5,5,1) 고객집단과 R과 F가 중간 수준인 (3,3,4)인 고객집단이 있을 때 어느 집단이 더 우수한 고객집단이라고 할 수 있는가에 대해 판단 할 수 있는 방법이 없다.
또한 R, F, M 각각의 변수에 1:1:1의 가중치를 부여하고 있으나 고객의 진정한 가치를 측정하기에는 미흡한 점이 있다. 고객의 가치를 평가함에 있어 상품/서비스의 종류에 따라 R, F, M의 중요성이 달라지기 때문이다. 종합 쇼핑몰 A사는 구매한 제품이 어떤 것이든 자사 사이트에서 자주 그리고 최근까지 꾸준히 구매를 해준 고객이 보통 그 다음 달에도 구매를 하는 것을 발견하고 이런 고객을 우수고객으로 정의하고 싶을 것이다.

반면 가전제품 전문몰인 B사는 가전제품의 수명이 타 제품보다 길기 때문에 최근에 구매한 고객보다 자사 사이트에서 두 번 이상 구매한 고객이 향후 재구매하는 경향을 발견하고 이러한 고객을 우수고객으로 정의하고 싶을 것이다. 이와 같이 각 요인의 중요도는 상품과 서비스의 종류에 따라 다르다고 할 수 있는데, RFM 모형에서는 이를 고려하지 않고 각 요소의 비중을 동일하게 취급한다. 일예로 한 기업에서 RFM에 의하여 고객을 분류한 후에 각 고객들에게 DM을 발송하고 측정한 각 집단별 이익 수준을 구한 결과가 다음 <그림 3>과 같이 나타났다.


▲ <그림 3> RFM 집단별 이익 수준 측정 결과






<그림 3>에 의할 때, (5,5,5)가 가장 이익을 많이 가져다주며, R의 크기가 가장 큰 영향을 미치고 있고, 반 정도의 집단에서는 오히려 손해(막대가 0 아래로 되어 있는 경우)를 가져다 주고 있음을 알 수 있다.
RFM 모형 분석에서는 이와 같이 제 2의 분석을 통하여 어떤 집단이 많은 이익을 가져다주며 어느 집단이 손해를 가져다주는가? 그리고 각 집단별 서열화를 어떻게 할 것인가를 구해야 한다. 이와 같은 분석을 통하여 125개 각 집단의 중요도를 측정하고 그 결과를 미래의 마케팅에 활용하는 것이 RFM 모형의 목적이기도 하다.

또한 RFM 모형은 통계적 기법 없이도 고객을 세분화할 수 있다는 장점이 있지만, 고객의 가치를 수치화 하는 데는 한계가 있다. RFM 모형에 의하여 고객 가치에 점수를 부여하고자 하는 경우, 예를 들어 R, F, M 각각에 10점, 10점, 5점을 부여한 것과 10점, 5점, 10점을 부여한 것의 합은 25점으로 같아진다. 즉 R, F, M에 대한 각각의 의미는 나타낼 수가 없는 것이다. 또한 각기 다른 측정 단위를 갖고 있으며 서로 중요도가 기업마다 다른 요소, R, F, M에 동일한 가중치를 부여한다는 것은 최상이라고 할 수 없다. 따라서 RFM 모형에 의하여 고객들에게 어떤 점수(Score)를 부여하는 것이 쉽지 않다. 그러나 많은 기업에서는 고객에게 개인적이건 집단적이건 어떤 수치를 부여하여 고객(집단)을 서열화 하고자 한다.

통계적 RFM 모형

요즘 많은 회사에서는 고객의 가치를 평가하여 고객을 몇 단계(다이아몬드, 루비, 사파이어, 일반고객 등)로 계층적 소집단으로 구분하는 경우가 있다. 그런데 위에 설명한 전통적 RFM 모형에서는 R, F, M의 중요도가 동일하게 취급되며, 고객을 일정수의 집단으로 구분할 수 있으나 고객(집단)에게 어떤 점수를 부여하여 서열화를 할 수 없는 문제점이 있다. 따라서 고객들을 계층적인 소집단으로 구분할 수 없는 문제점이 있다. 이를 해결할 수 있는 방법이 통계적인 모형을 이용한 통계적 RFM 모형이다.

이 방법은 허명회/이용구 등에 의하여 개발되었는데, 모 화장품회사의 자료에 적용한 결과 매우 우수한 고객평가 결과를 구할 수 있었다. 통계적 RFM 모형은 기본적으로 고객들에 대한 R, F, M의 자료를 이용하나 반응변수가 있는 관리모형(supervised model)을 이용하여 각 요소의 가중치를 구하고, 고객 개인에 대한 RFM 점수를 계산하여 개별고객을 서열화 할 수 있는 방법이다. 이 방법의 기본적인 알고리즘은 일정기간 고객의 구매 관련 자료를 분할하여 이용하는 것이다.

즉 과거 1년 동안 고객의 구매 관련 자료가 있을 때, 이를 앞의 8개월과 뒤의 4개월로 분할 한 후에, 앞의 8개월에서는 R,F,M 값을 관측하고 뒤의 4개월 자료에서는 이 기간동안 구매가 이루어졌으면 1, 그렇지 않으면 0으로 코딩하는 이분형 자료를 만든다. 그런 후에, 앞의 R,F,M 값을 이용하여 뒤의 구매여부(0과 1)을 예측하는 모형을 이용한다. 여기에서 이용하는 통계적 모형은 신경망모형(Nural Net. Model)과 로지스틱 회귀모형(Logistic Regression)등이 있다. 이러한 통계적 RFM모형의 장점은 결과로서 각 개인의 RFM 점수를 구할 수 있을 뿐만 아니라, 각 요소의 중요도를 측정할 수 있다.

즉 각 고객의 충성도 수준과 함께 R과 F와 M 중에서 어느 요소가 얼마나 중요한가를 평가할 수 있다. 또 다른 통계적 RFM 모형으로 요인분석방법을 이용한 모형을 생각할 수 있다. 즉 관측한 자료를 두 부분으로 나누지 않고 직접 R,F,M을 이용하여 요인분석을 실시한 후에 제1요인 또는 제1요인과 제2요인을 결합하여 각 개인의 RFM 점수를 계산하는 방법이다. 이 방법에 의하여서도 각 개인의 RFM점수와 함께, 각 요소의 중요도인 가중치를 구할 수 있다. 이러한 통계적 RFM 모형은 고객 각각에 대하여 충성도 점수를 구할 수 있고 이를 이용하여 고객을 서열화 할 수 있으며, 각 요인의 중요도를 측정할 수 있는 장점이 있다. 그러나 모형을 구하는 과정이 좀 복잡하고 어느 정도 전문적인 통계학적인 지식을 필요로 한다.

그러면 어느 모형을 이용해야 하나?

이 문제는 우선 일반적인 관점에서 접근해 보자. 우리는 불확실성하에서 살고 있으며, 끊임없이 어떠한 정보를 추구하며 살고 있다. 기업에 있어서도 고객의 가치를 평가하여 우수고객을 유지하고 그렇지 않은 고객을 우수고객으로 확보하기 위하여 끊임없는 노력을 하고 있는 것이 오늘의 현실이다. 이런 상황 하에서 기업은 고객의 자료를 수집하고 이를 이용하여 고객에 대한 유용한 정보를 구하고자 노력한다.

이 결과가 데이터베이스 마케팅, 나아가 데이터 마이닝이라고 할 수 있으며, 이는 오늘날 BI라는 포괄적 개념에 포함되어 기업 경쟁력 확보의 핵심적 과제로 자리하고 있다. 여기에서 가장 중요한 과제는 어떻게 하면 가장 정확하고 유용한 정보를 구하는가 이다. 이는 우선적으로 고객의 가치를 평가할 수 있는 정확한 자료를 확보해야 한다는 것을 전제로 한다.

자료가 정확하지 않으면 아무리 훌륭한 모형을 이용하여도 가치 있는 정보가 나오지 않는다. 오늘날 대부분의 기업에서는 고객 관련 자료의 소중함을 인지하여 매우 우수한 자료를 확보하고 있다. 기본적인 토대는 마련된 셈이다.

그러면 다음에는 어떻게 정보를 구하는가의 문제이다. 여기에서 고민은 어떤 경우에도 유일한 답은 존재하지 않는다는 것이다. 즉, 주어진 조건하에서 어느 모형이 맞고 어느 모형이 틀리다고 주장할 수 없는데 고민이 있다. 그럼 해결책은 무엇인가? 이러한 모델링에서는 항상 주어진 여건 하에서 최선을 다할 뿐이다. 즉 주어진 여건 하에서 가능한 모형들을 구한 후에 모형에 나타난 결과들을 객관적인 평가기준을 이용하여 평가하여 최선의 모형을 찾는 것이 가장 바람직한 접근방법이다. 그러나 상황에 따라 끊임없이 변하므로 늘 새로운 방법에 대한 연구를 하여야 한다. 그렇기 때문에 BI모형을 구할 때에 현장에서 일하는 사람이 반드시 동참해야만 가치 있는 모형결과를 구할 수 있다는 주장이 설득력이 있는 것이다. 이러한 원칙 하에서 위의 두 접근방법(전통적 vs 통계적 RFM모형)에 대한 선택의 문제를 풀어보자. 우선 두 방법을 이용하여 모형을 구한다. 그런 후에 고객들을 집단화 하고 각 집단의 특성을 비교 분석한다. 여기에 회사의 마케팅 담당자가 참여해야 함은 물론이다.

마케팅 담당자는 각 집단의 과거 구매패턴과 인구 사회학적 특성 등을 비교 분석하여 어떤 결과가 좀 더 현실적으로 가치가 있는가를 평가할 수 있다. 만약에 두 모형의 평가 결과에 큰 차이가 없다면 보다 단순한 전통적인 방법을 선호하게 될 것이다. 그러나 통계적 모형에서 구한 각 개인의 점수와 각 요인의 중요도가 가치가 있다면 통계적 모형을 이용하는 것이 바람직하다. 통계적 모형 결과 구한 각 개인 고객의 점수에 대한 신뢰성도 또한 통계적/경험적으로 평가할 수 있다. 이런 과정을 통하여 종합적으로 평가한 후에 최종 모형을 구하고 그 결과를 이용하여 마케팅 전략을 세워야 한다. 이것이 기업의 경쟁력 향상에 도움이 되는 BI 프로젝트의 한 과제라고 할 수 있다.

인기기사 순위
(우)08503 서울특별시 금천구 가산디지털1로 181 (가산 W CENTER) 1713~1715호
TEL : 02-2039-6160  FAX : 02-2039-6163  사업자등록번호:106-86-40304
개인정보/청소년보호책임자:김선오  등록번호:서울 아 00418  등록일자:2007.08  발행인:김용석  편집인:김선오