머신러닝 및 딥러닝

[컴퓨터월드] 최근 빅 데이터를 대상으로 한 딥 러닝 기술의 급속한 발전에 따라 전 세계적으로 인공지능 관련 기술에 대한 폭발적인 관심과 경쟁적인 개발이 추진되고 있다. 인공지능은 지능적인 기계를 만들기 위한 SW와 HW를 포괄하는 과학 및 공학을 지칭하며, 인공지능이 인간의 지능을 뛰어넘는 시점을 특이점(Singularity)이라고 부른다.

영국의 BBC(Tomorrow’s world: A guide to the next 150 years)와 유엔 미래포럼(유엔 미래보고서 2045) 등은 2045년에 인간의 지능보다 뛰어난 슈퍼지능머신이 출현해 특이점이 도래할 수 있다고 예측했다. 또한, 인공지능이 인류의 일자리를 빼앗고, 나아가 인류의 멸망을 초래할 수도 있다는 부정적인 전망도 했다.

본지는 ICT 역사상 가장 혁신적인 기술로 주목받고 있는 인공지능과 관련, “인공지능 기술 개발 어디까지 왔나?”라는 주제로 국내 최고의 인공지능 전문가들을 필진으로 구성해 기획연재를 한다. 인공지능 필진과 게재할 주요 내용은 다음과 같다.

■ 엑소브레인(언어지능): ETRI 김현기 실장
■ 딥뷰(시각지능): ETRI 박종열 실장
■ 머신러닝 및 딥러닝: 포항공대 최승진 교수
■ 뇌공학: 고려대 이성환 교수
■ 음성처리: ETRI 박전규 실장
 

머신러닝 및 딥러닝


▲ 최승진 포항공과대학교 컴퓨터공학과 교수

최승진 교수는 서울대학교 전기공학과에서 학사 및 석사 학위를 취득했으며 미국 인디애나 주에 있는 University of Notre Dame 전기공학과에서 ‘adaptive blind source separation based on unsupervised learning’에 대한 연구로 박사학위를 취득했다. 현재 포항공과대학교 컴퓨터공학과 정교수로 근무 중이며 미래창조과학부 기계학습 연구센터 총괄책임자를 역임 중이다.


▲ 김세훈 포항공과대학교 컴퓨터공학과 박사과정

김세훈 박사과정 학생은 포항공과대학교 컴퓨터공학과에서 학사 학위 취득 후 현재 동대학 컴퓨터공학과 기계학습 연구실에서 석박사 통합과정에 재학 중이다.


인공지능의 가장 단순한 개념이라고 할 수 있는 자동화 기계는 고대 그리스 신화부터 중국의 삼국지연의에서도 찾을 수 있다. 이처럼 인공지능에 대한 인류의 관심은 상당히 오래되었다고 볼 수 있다. 전자계산기의 초기 모델이 개발되기 시작한 1950년대부터는 인공지능에 대한 본격적인 연구가 시작되었지만 초창기 낙관적인 기대와 달리 인공지능은 다른 전산 분야에 비해 상당히 더디게 발전되었다.

2000년 이후 다양한 형태의 데이터(자연어, 이미지, 동영상 등)를 활용하여 인공지능의 세부 문제를 해결하는 머신러닝(기계학습)이 높은 정확도를 제공함에 따라 인공지능 연구의 주류로 대두되었다. 머신러닝의 성공은 크게 다음과 같이 두 가지로 요약될 수 있다.

첫째. 인터넷의 등장과 IT기기의 폭발적인 성장에 의해 다양한 형태의 데이터(자연어, 이미지, 동영상, 사회관계망 등)를 쉽게 얻을 수 있는 환경이 구축되었다. 대부분의 머신러닝 알고리즘은 경험적/이론적으로 데이터의 개수가 증가함에 따라 성능 향상이 이뤄지기 때문에 많은 데이터를 쉽게 얻을 수 있는 환경이 머신러닝 성공의 주요한 역할을 수행했다.

둘째. 컴퓨팅 파워의 증가로 인해 과거에 오랜 시간이 걸려 학습할 수 있는 알고리즘들을 빠르게 학습할 수 있게 됐다. 학습 속도의 증가는 머신러닝 연구에 대한 장벽을 크게 낮추었기 때문에 대학교 연구실뿐만 아니라 기업에서도 머신러닝을 쉽게 연구 또는 활용할 수 있게 됐다.

머신러닝의 여러 연구 분야 중 하나인 딥러닝은 2010년 이후 다양한 분야에서 우수성이 입증되어 널리 사용되고 있다. 특히 컴퓨터 비전 및 음성인식 분야에서는 딥러닝 기반 알고리즘의 높은 정확성이 다양한 관점에서 검증되었기 때문에 딥러닝이 머신러닝 연구의 주요 분야로 급부상했다.

본 칼럼에서는 머신러닝 및 딥러닝의 연구 동향을 개략적으로 살펴보고 미래창조과학부에서 주관하는 머신러닝 과제인 기계학습연구센터의 연구 내용을 소개한다.



1. 머신러닝(기계학습)이란
머신러닝은 인공지능의 한 연구분파로 데이터에 내재된 패턴, 규칙, 의미 등을 컴퓨터가 스스로 학습할 수 있는 알고리즘을 연구하는 분야이다. <그림 1>은 머신러닝에 대한 간단한 개념도로 다양한 형태의 데이터(음성, 이미지, 바이오 센서, 영상 등)를 이용해 학습된 모델을 통해 데이터의 숨겨진 패턴을 파악하는 것을 보여주고 있다.


▲ <그림 1> 머신러닝에 대한 간단한 개념도


머신러닝은 일반적으로 데이터로부터 모델을 생성하는 학습 과정과 이를 바탕으로 새로운 정보를 얻는 추론 과정으로 구분될 수 있다. <그림 2>은 머신러닝의 학습 및 추론 과정을 영화 선호도 예측 문제 관점에서 설명하고 있다.


▲ <그림 2> 사용자의 영화 선호도 예측을 통한 영화 추천: 행렬 분해(학습), 행렬 복원(추론)


따라서 머신러닝의 주요한 연구 목표는 다양한 데이터의 패턴을 파악할 수 있는 모델을 학습하는 알고리즘을 개발하는 것과 학습된 모델에 기반해 실생활에 유용한 애플리케이션을 개발하는 것으로 요약할 수 있다.
 

▲ <그림 3> 머신러닝의 주요한 연구 목표에 대한 개념도



2. 딥러닝이란

딥러닝은 인공신경망으로 표현되는 비선형 변환을 활용해 데이터의 고차원 특징을 추출하는 알고리즘을 연구하는 분야이다. 딥러닝은 데이터의 고차원 특징을 효과적으로 추출하기 때문에 기존의 도메인 전문가들이 개발한 특징 추출 알고리즘보다 다양한 애플리케이션에서 높은 정확도를 제공한다.

<그림 4>에서 확인할 수 있듯이 2010년 이후 딥러닝을 적용한 음성인식 알고리즘이 기존에 개발된 알고리즘에 비해 높은 성능을 제공하고 있다. 음성인식 분야 이외에도 2012년 이미지넷(ImageNet) 경진대회에서 딥러닝 기반의 이미지 분류 알고리즘이 가장 높은 성능을 기록1)한 이후에 컴퓨터 비전 분야에서도 딥러닝 연구가 주류를 이루고 있다.


▲ <그림 4> 음성 인식 분야에서 딥러닝 알고리즘의 성공적인 적용 예


딥러닝의 가장 주요한 성공 요인은 매우 복잡한 비선형 변환을 통해 많은 수의 데이터로부터 고차원 특징을 직접 학습하려고 시도한 점이다. 도메인 전문가들이 개발한 특징 추출 알고리즘은 데이터의 다양한 변화에 강인하지 못하기 때문에 여러 데이터 셋에서 일관되게 높은 성능을 제공하기 힘들었다. 하지만 많은 수의 데이터로부터 학습한 고차원 특징은 다양한 변화에 매우 강인하기 때문에 여러 데이터 셋에서 안정적으로 높은 성능을 제공한다.

 

3. 기술개발 동향
본 항목에서는 머신러닝 및 딥러닝 알고리즘의 개별적 동향보다는 알고리즘을 쉽게 사용할 수 있도록 개발된 SW 플랫폼 및 서비스를 중심으로 기술개발 동향을 서술한다.
 

3-1. 구글 텐서플로우(Google TensorFlow)2)
텐서플로우는 구글에서 개발한 머신러닝 플랫폼으로서 다양한 하드웨어 환경에서 인공신경망 모델을 쉽게 생성하고 학습할 수 있는 인터페이스를 제공한다. <그림 5>에서 확인할 수 있듯이 머신러닝 연구자는 텐서플로우를 통해 인공신경망 모델을 학습하는데 필요한 자세한 하드웨어 조작에 신경쓸 필요 없이 인공신경망 모델 구조에만 집중할 수 있다. 따라서 연구자는 해결하고자 하는 문제에 최적화된 모델을 생성하는데만 집중할 수 있기 때문에 생산성 향상을 도모할 수 있다.
 

▲ <그림 5> 텐서플로우를 통해 생성된 인공신경망의 예2)


텐서플로우는 오픈소스로 공개돼 무료로 사용 가능하기 때문에 다양한 기업체에서 텐서플로우 기반의 머신러닝 알고리즘을 활용한 응용SW을 쉽게 개발할 수 있다.
 

3-2. 마이크로소프트 MS애저 머신러닝3)
MS 애저(Microsoft Azure)는 포춘(Fortune)지 선정 500대 기업 중 57% 이상이 사용하고 있는 엔터프라이즈급 클라우드 컴퓨팅 플랫폼3)이다. 마이크로소프트는 애저를 사용하고 있는 고객을 대상으로 머신러닝 알고리즘을 효과적으로 활용하여 데이터를 분석할 수 있는 서비스를 제공한다.

구글의 텐서플로우와 가장 큰 차이점은 유료 서비스이지만 머신러닝을 전혀 모르는 개발자들도 쉽게 사용할 수 있도록 GUI 기반으로 머신러닝 알고리즘을 테스트할 수 있다는 점이다. 또한, 텐서플로우는 인공신경망을 중심으로 개발된 SW 플랫폼이지만 애저 머신러닝은 다양한 데이터 전처리/머신러닝 알고리즘/결과 시각화 등을 손쉽게 테스트할 수 있다.


▲ <그림 6> GUI기반의 머신러닝 알고리즘 구성 예3)


3-3. 아마존 머신러닝
4)
아마존 머신러닝은 마이크로소프트의 애저 서비스와 유사하게 모든 수준의 개발자들이 손쉽게 머신러닝 알고리즘을 활용하여 데이터를 분석할 수 있는 서비스이다. 아마존 머신러닝은 부정 탐지, 문서 분류, 콘텐츠 개인화, 기타 다양한 예측 서비스 등에 성공적으로 적용되었다.
 
 

4. 기계학습 연구센터 소개5)
기계학습 연구센터는 미래창조과학부의 SW컴퓨팅원천기술개발사업의 일환으로 2014년 4월부터 2018년 2월까지 총 4년동안 80억 원의 사업비를 지원받아 설립됐다. 기계학습 연구센터의 주요한 목표는 국내 머신러닝 연구 생태계를 만들고 일반 사용자도 쉽게 사용할 수 있는 머신러닝 공개SW를 개발하는 것이다.

기계학습 연구센터에서 공개하고자 하는 머신러닝 SW는 평생 기계학습을 해결하기 위한 다양한 알고리즘을 포함하고 있다. 평생 기계학습6)이란 차세대 기계학습 패러다임으로 온라인 다과제 학습이라 생각할 수 있다. 즉, 데이터 및 학습 과제가 끊임없이 입력되는 경우 기존에 학습된 모델을 활용하여 새로운 학습 과제의 성능을 향상 시킬 수 있으며, 새로운 학습 과제를 통해 기존 모델의 성능을 증가시킬 수 있다.

<그림 7>은 위에서 서술한 평생 기계학습을 요약한 것이다.


▲ <그림 7> 평생 기계학습에 대한 개념도


기계학습 연구센터에서 개발하고자 하는 머신러닝 SW인 SMILE(Software for Machine Intelligence with Lifelong machine lEarning)의 추상적인 개요도는 아래 그림으로 표현된다. SMILE은 끊임없이 입력되는 다양한 형태의 데이터(이미지, 텍스트, 자연어, 동영상 등)를 분석할 수 있는 머신러닝 알고리즘으로 구성되어 있으며, 대규모 데이터를 다루기 위해 분산병렬 컴퓨팅 플랫폼에 기반을 두어 개발되고 있다.

기계학습 연구센터에서는 SMILE에 탑재되는 기계학습 알고리즘 이외에도 SMILE을 활용해 fMRI 영상 기반의 알츠하이머 자동 예측 프로그램, 질의 응답 검색 시스템, 시공간 질의 기반의 화제 추천 시스템 등 다양한 스마트 예측 서비스를 개발 중이다.


▲ <그림 8> 기계학습 센터의 최종 목표를 나타낸 개요도


SMILE에 대한 구체적인 내용을 서술하면 다음과 같다. SMILE은 아래 그림에서 요약되어 있듯이 분산병렬 처리를 위해 아파치 스파크(Apache Spark)에 기반을 두었고 평생 기계학습을 위한 딥러닝 알고리즘과 베이지안 학습 알고리즘으로 구성되어 있다.

기계학습 연구센터에서는 Spark를 기반으로 딥러닝 및 베이지안 학습 알고리즘을 개발하기 위해서 해당 알고리즘들을 분석하여 분산 병렬 처리를 위해 필수적인 가속화 API를 개발 중이다.


▲ <그림 9> 기계학습 센터 최종 결과물인 평생 기계학습을 위한 공개 SW


기계학습 연구센터는 SMILE를 효과적으로 개발하기 위해 아래 그림과 같이 조직되어 있다. 주관기관인 포항공과대학교를 중심으로 KAIST, 서울대학교, 연세대학교, 고려대학교에 소속된 연구진들이 평생 기계학습을 위한 딥러닝과 베이지안 학습에 필요한 알고리즘을 개발하고 있다. 개발되는 머신러닝 알고리즘을 활용해 스윙크, 다음소프트, 다이퀘스트, 소소에서 다양한 응용 SW를 개발 중이다.


▲ <그림 10> 기계학습 센터 조직도


5. 맺음말
머신러닝 및 딥러닝의 성공에 의해 인공지능 기반의 다양한 서비스가 차세대 성장동력의 필수적인 부분으로 자리잡았다.

본 칼럼에서는 머신러닝에 대한 개략적인 역사와 성공 이유를 살펴 보았으며 세계적인 IT 기업에서 공개 또는 서비스하고 있는 기술에 대한 동향을 파악했다. 또한, 세계적인 추세에 발맞춰 미래창조과학부에서 지원하고 있는 기계학습 연구센터에 대한 소개와 최종 결과물인 평생 기계학습 공개SW(SMILE)에 대한 내용을 살펴보았다.
 

▲ <그림 11> 기계학습 연구센터의 파급 효과


마지막으로, 기계학습 연구센터에서 공개할 SMILE은 <그림 11>과 같이 다양한 분야에 폭넓은 파급 효과를 지닐 것으로 기대된다. SMILE 개발을 통해 기계학습에 정통한 고급 인력이 자연스럽게 배출될 것이고, 이는 국가 경제 발전에 크게 이바지 할 것으로 생각한다. 또한, 순수 국내 기술로 개발되는 기계학습 SW인 SMILE을 기반으로 다양한 응용 애플리케이션이 특허 분쟁에 상관없이 개발될 것으로 기대된다.

 

6. 참고문헌
1) ImageNet Classification with Deep Convolutional Neural Networks, A. Krizhevsky, I. Sutskever, and G. E. Hinton, NIPS, 2012.
2) http://tensorflow.org
3) http://studio.azureml.net
4) https://aws.amazon.com/machine learning/
5) http://mlcenter.postech.ac.kr
6) ELLA: An efficient lifelong machine learning algorithm, P. Ruvolo and E. Eaton, ICML, 2013.

저작권자 © 아이티데일리 무단전재 및 재배포 금지