동형암호 서비스 속속 등장…차세대 암호 시장 문 연다

[아이티데일리] 데이터를 암호화한 상태로 분석 등에 활용할 수 있는 차세대 암호기술인 ‘동형(同型)암호’가 최근 주목받고 있다. 유럽연합 ‘개인정보보호규정(GDPR)’ 등 데이터 활용을 위한 개인정보 컴플라이언스가 등장하면서, 보호와 활용 두가지 모두 만족할 수 있는 기술에 관심이 모아지고 있는 것이다. 현재 세계적으로 IT 업계는 물론 학계에서도 동형암호 기술 상용화를 위한 연구가 활발하다.

국내에서도 동형암호에 대한 관심이 매우 높다. 서울대학교, 고려대학교 등 학계는 물론, 삼성SDS 등 산업계 또한 상용화를 위한 연구에 박차를 가하고 있다. 특히 서울대학교, 삼성SDS는 동형 암호 표준화 포럼에 참여해 글로벌 동형암호 기술 개발에 적극 나서고 있다. 최근 동형암호 기술 트렌드 및 국내외 활용사례를 살펴봤다.

① 데이터 보호와 활용 모두 만족, 문제는 처리속도
② 의료, 금융, 마케팅 등 분야에서 도입 활발…상용화 적극 추진


암호화된 데이터 활용해 유출 가능성 원천 차단

전세계적으로 개인정보를 비롯한 데이터의 활용에 대한 관심이 높아지면서, 데이터를 활용하면서도 개인정보를 보호하는 방안이 요구되고 있다. 이런 관점에서 주목받고 있는 차세대 암호기술이 ‘동형암호’다.

실제 데이터 활용을 위한 노력이 지속되면서 개인정보보호 관련 컴플라이언스에 많은 변화가 나타나고 있다. 미국의 ‘건강보험 이전과 책임에 관한 법(HIPAA)’, ‘경제적·임상적 보건에 대한 건강 정보기술법(HITECH Act)’, ‘가족의 교육적 권리 및 프라이버시 법(FERPA)’, 유럽연합(EU)의 ‘개인정보보호규정(GDPR: General Data Protection Regulation)’, 영국 정보보호 커미셔너(ICO)의 익명화 규약, 일본의 개인정보보호법 등이 마련되면서 데이터 활용을 위한 기반이 마련되고 있다.

하지만 전세계 각국의 데이터 경제 활성화를 위한 노력은 동시에 개인정보 침해 우려도 높이고 있다. 데이터 활용이 증가함에 따라 개인정보 침해사고 또한 증가할 것이라는 지적이다. 이런 상황에서 개인정보보호와 활용 두 가지를 모두 만족시킬 수 있는 대안으로 떠오르고 있는 것이 ‘동형암호’ 기술이다.

‘동형암호’는 데이터가 암호화된 상태로 연산할 수 있도록 지원하는 암호기술을 일컫는다. 암호화된 상태에서 데이터를 분석함으로써 개인정보 등 데이터 유출을 원칙적으로 차단한다는 것이다. 특히 동형암호 기술은 머신러닝 및 AI 분석 등에도 적용 가능해, 데이터 중심의 디지털 트랜스포메이션 및 개인정보보호 관련 제도 변화 등의 이슈에 적극 대응할 수 있다.

동형암호의 개념을 간단하게 표현한 예시가 <그림 1>이다. <그림1>과 같이 17과 62를 각각 동형암호화하면 특정 난수로 표현되며, 이를 더한 값 역시 난수로 표현된다. 계산 값을 복호화하면 79라는 결과 값을 얻을 수 있다.

AES(Advanced Encryption Standard) 등 일반적인 암호기술은 암호문의 연산결과를 복호화했을 때 전혀 다른 값이 나오는 것에 반해, 동형암호 기술은 암호문의 연산결과가 원본 데이터의 연산결과와 동일하게 나타난다.

▲ <그림 1> 동형암호 예시(출처: 삼성SDS)

이러한 동형암호 기술은 현재 사용되고 있는 암호기술 중에서도 특성을 찾아볼 수 있다. 공인인증서, HTTPS 등에서 다양하게 활용되고 있는 공개키 기반 암호 기술인 ‘RSA(알고리즘 발명자인 Rivest, Shamir, Adelman 세 사람 이름의 첫 글자) 알고리즘’ 또는 국제 표준으로 지정된 ‘Paillier 알고리즘’ 등에도 곱셈 또는 덧셈 중 하나의 연산만 지원하는 부분 동형암호 알고리즘들이 포함돼 있다. 다만 실제 시스템에 적용돼 사용되고 있는 알고리즘에는 동일 데이터에 대해서도 다양한 암호문을 출력하기 위한 랜덤 패딩 기술이 적용돼 있어 동형암호적인 성질을 만족하지 않는다.

▲ 기존 암호 기술에서 확인할 수 있는 부분 동형암호 알고리즘 예시(출처: 삼성SDS)

2009년 IBM에서 제안 후 연구 가속화

동형암호 기술이 주목받기 시작한 것은 2009년 IBM 연구원인 크레이그 젠트리(Craig Gentry)가 동형암호의 기본 구조를 지닌 ‘완전동형암호(FHE: Fully Homomorphic Encryption)’를 제안하면서다. 완전동형암호는 이전 암호기술에서 볼 수 있었던 부분동형암호와 달리 덧셈과 곱셈을 동시에 보존해 이론상으로 모든 연산, 데이터 분석. AI 학습 등에 적용할 수 있다. 그러나 최초의 완전동형암호는 1비트(bit) 연산처리에 30분 이상 소요될 정도로 매우 비효율적이었다.

그러나 동형암호 기술이 발전하면서 10년 사이 처리 속도가 약 10만 배 빨라졌으며, 기존 비트단위로 제한됐던 데이터 타입 처리 또한 대용량 데이터 처리를 지원하는 형태로 발전됐다. 알고리즘 병렬처리에 대한 연구도 지속되고 있어 처리속도는 더욱 빨라질 것으로 전망된다.

특히 최근에는 GPU 연계를 통한 연산 자체의 병렬화 처리, FPGA 및 전용 하드웨어 칩에 대한 연구가 진행되고 있으며, 학계 및 산업계에서는 원본 데이터 처리 속도와 비슷한 속도를 목표로 연구를 지속하고 있다.

현재 동형암호의 원천기술을 보유한 기업 및 학교는 대략 5곳이다. 마이크로소프트와 IBM, 매사추세츠공과대학교(MIT), 프랑스, 서울대학교 천정희 교수팀이 동형암호 기술을 보유하고 있다. 특히 서울대 천정희 교수팀은 기존 동형암호의 연산속도를 획기적으로 개선한 근사계산 동형암호 기술 ‘혜안(HEAAN)’을 보유하고 있으며, ‘혜안’은 국제 유전정보 분석 대회인 ‘iDASH’에서 많은 팀들이 사용하는 등 기술력 및 실용성을 인정받고 있다.


문제는 처리 속도

하지만 아직까지 동형암호 기술은 이전 시스템에 비해 경쟁력이 떨어진다. 데이터 저장, 전송, 사용 등 전 구간에서 데이터를 보호할 수 있다는 장점은 있으나, 단일 데이터 암호화 속도가 기존 RSA 알고리즘 등 암호화에 비해 느린 수준이며 암호화된 데이터를 처리하는 속도 또한 평문 데이터 분석에 비해 수백~천배 가까이 차이가 나는 상황이다.

동형암호를 연구하고 있는 학계 및 산업계에서는 기존 암호 기술에 비해 단일 데이터 암호화 속도가 느리다는 점을 극복하기 위해 1,000개 이상의 데이터를 동시에 병렬적으로 암호화할 수 있는 병렬처리 기술을 적용하고 있다. 최근 대용량의 데이터를 한 번에 암호화하는 테스트를 진행했는데 기존 암호 기술보다 성능면에서 뛰어난 결과를 보인 경우도 있었다고 한다.

업계 전문가들은 실제로 동형암호 기술이 적용되는 환경을 고려하면 암호화 성능보다는 암호화된 상태에서 연산처리 성능이 더 중요하다고 주장한다. 기존 암호 기술과 다르게 데이터 활용에 초점이 맞춰진 기술이기 때문에 암·복호화 성능보다는 연산처리 성능에 주목해야 한다는 것이다.

조지훈 삼성SDS 보안연구센터장은 “데이터 보호는 ▲저장된 데이터 보호(Data-at-rest) ▲전송시 데이터 보호(Data-in-transit) ▲사용시 데이터 보호(Data-in-use) 등 3가지 면이 고려되어야 한다. 기존 암호 기술은 저장 및 전송시 데이터 보호를 목적으로만 개발, 사용돼왔다. 반면에 동형암호 기술은 ‘사용시 데이터 보호’를 주목적으로 개발된 암호기술이라는 측면에서 기존 암호기술과 차이를 보인다. 동형암호도 기존 암호 기술과 같이 저장 및 전송시에도 데이터 보호가 가능하지만, 기존 기술에 비해 비효율적일 수 있다”고 설명했다.

전문가들은 동형암호 기술은 2009년 이후 처리 성능이 혁신적으로 개선되고 있으며, 최근 2년동안 약 1,000배에 가까운 성능 개선이 이뤄지고 있다고 설명한다. 그럼에도 여전히 평문 데이터 분석에 비해 수백~천배 가까이 느린 상황이지만, GPU 활용, 병렬처리, 하드웨어 칩 구현 등 다양한 연구가 진행되고 있어 향후 처리속도 또한 빨라질 것으로 기대된다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지