머신러닝 분야 경험 없어도 다양한 업계에 적용 가능해

[아이티데일리] 아마존웹서비스(AWS)는 머신러닝 경험 없이도 사용할 수 있는 5가지 최신 인공지능(AI) 서비스를 발표했다고 6일 밝혔다.

AWS는 머신러닝으로 구현되는 최신 엔터프라이즈 검색, 코드 리뷰와 프로파일링, 이상거래 탐지, 의료 기록, AI 예측에 대한 리뷰 등 더욱 많은 개발자가 머신러닝을 이용해 향상된 엔드유저 경험을 개발할 수 있도록 지원하는 최신 AI 서비스를 공개했다.

머신러닝이 지속적으로 성장하는 가운데, AWS 고객들은 자체 머신러닝 모델을 훈련, 조율, 적용할 필요 없이, 비즈니스를 개선하고 더 나은 고객 경험을 제공하기 위해 AWS의 대규모 머신러닝 경험을 배우고자 한다. AWS는 머신러닝 경험을 바탕으로 머신러닝 분야 경험이 없는 다양한 업계와 규모의 조직들도 머신러닝을 적용할 수 있도록 지원하는 최신 AI 서비스를 발표했다.


‘아마존 켄드라’

먼저 ‘아마존 켄드라(Amazon Kendra)’는 단지 키워드가 아닌 실제 질문을 이용해 여러 데이터 사일로를 검색하고, 무작위 링크를 제공하는 대신 AI 기술을 사용해 내부 직원들이 찾는 정확한 답변을 제공해 엔터프라이즈 검색을 혁신한다. 직원들은 선호하는 자연어를 이용해 검색할 수 있다.

고객은 ‘아마존 켄드라’를 자신의 모든 애플리케이션, 포털, 위키 등에 적용할 수 있다. 특히, ‘AWS 매니지먼트 콘솔’에서 단 몇 번의 클릭만으로 다양한 문서 저장소에서 ‘아마존 켄드라’를 활용하면, 페타바이트 규모의 데이터를 종합해 중앙 인덱스를 구축할 수 있다. 문서 사용권한을 스캔해 검색 결과에 사용자 접근권한이 있는 문서만 포함해 검색 결과가 기존 문서 접근 정책을 따르도록 한다.

또한, 아마존 켄드라는 클릭 데이터, 사용자 위치, 피드백 등을 활용해 시간이 지남에 따라 답변의 정확도를 높이고, 고객의 특성에 맞게 머신러닝 모델을 적극적으로 재훈련해 전체적인 정확성을 높인다.


‘아마존 코드구루’

‘아마존 코드구루(Amazon CodeGuru)’는 코드 리뷰를 자동화하고, 애플리케이션의 고비용 코드 라인을 찾아내는 새로운 머신러닝 서비스다. 아마존 코드구루에는 코드 리뷰와 애플리케이션 프로파일링이라는 두 가지 구성요소가 있다. 코드 리뷰의 경우 개발자들은 점차 더 큰 저장소를 제공하는 깃허브(GitHub)과 코드커밋(CodeCommit)을 지원하는 기존 코드를 사용하고, 일상적인 절차를 변경하거나 소프트웨어를 설치할 필요 없이 ‘아마존 코드구루’를 코드 리뷰어 중 한 명으로 추가한다.

또한, ‘아마존 코드구루’는 풀 리퀘스트를 받아 아마존에서 수십 년간 축적된 코드 리뷰로 학습한 사전 훈련된 모델과 깃허브의 상위 1만 개 오픈소스 프로젝트를 사용해 코드 검토를 자동 진행한다. 뿐만 아니라 코드 내 변경사항을 검토해 품질을 관리하고 문제 발견 시 코드 라인, 특정 문제, 코드 예시와 관련 문서가 포함된 개선방안 추천을 식별하는 풀 리퀘스트에 사람이 읽을 수 있는 코멘트를 추가한다.

아마존 코드구루에는 고객들이 가장 많은 비용이 소요되는 코드 라인을 찾도록 도와주는 머신러닝으로 구현되는 애플리케이션 프로파일러가 포함돼 있다. 또한, 아마존 코드구루는 운영자들이 애플리케이션에서 가장 많은 비용이 소요되는 코드 라인을 찾도록 지원하고, 성능 병목 현상을 일으키는 다른 코드 라인을 시각적으로 식별하는데 돕는 플레임(flame) 그래프를 생성한다.


‘아마존 프로드 디텍터’

‘아마존 프로드 디텍터(Amazon Fraud Detector)’는 아마존 고객 사업부문에서 사용되는 동일한 기술을 바탕으로, 잠재적인 온라인 신원도용과 결제 사기를 실시간 확인하는 완전 관리형 서비스로, 머신러닝 입문자도 사용 가능하다. ‘아마존 프로드 디텍터’는 이상거래와 정상적인 거래의 데이터 기록을 이용해, 실시간, 저지연 이상거래 예측을 제공하는 머신러닝 모델을 구축, 훈련, 적용한다.

‘아마존 프로드 디텍터’를 실행하기 위해서 고객들은 ‘아마존 S3’에 거래 데이터를 업로드해 모델 학습을 자신 용도에 맞게 조절해야 한다. 고객들은 거래와 연관된 이메일 주소와 IP 주소만 제공하고, 이외에 청구서 주소, 전화번호 등과 같은 데이터도 선택적으로 제공할 수 있다.

고객들이 예측하고자 하는 신규 계정이나 온라인 결제 사기 등 금융사기 유형을 바탕으로 ‘아마존 프로드 디텍터’가 아마존에서 수십 년간 진행한 대규모 이상거래 탐지 위험 분석 경험을 바탕으로 데이터를 사전 처리하고, 알고리즘을 선택해, 모델을 학습한다. ‘아마존 프로드 디텍터’는 아마존 데이터를 학습한 머신러닝 기반 데이터 탐지기도 사용한다. 이로써 고객들은 이상거래를 더 빠르고, 쉽고, 정확하게 탐지할 수 있다.


‘아마존 트랜스크라이브 메디컬’

‘아마존 트랜스크라이브 메디컬’은 머신러닝 기술을 이용해 자연어를 자동으로 기록해 이 문제를 해결한다. ‘아마존 트랜스크라이브 메디컬’의 음성-텍스트 변환 기능을 바탕으로 개발된 임상 문서 애플리케이션은 정확한 기록을 저렴한 가격에 제공한다. 또한, 수 천 시간의 진료 음성 파일을 학습한 여러 개의 머신러닝 모델로 구성돼 있으며, 머신러닝으로 구동되는 정확한 의료 기록을 제공한다. 기존에 수 일이 걸렸던 진료기록을 실시간으로 작성할 수 있게 된 것이다.

‘아마존 트랜스크라이브 메디컬’은 의사가 환자를 진료하는 동안 자동으로 대화를 기록해 의료진이 환자 진료에 집중할 수 있도록 지원한다. 의사들이 자연스럽게 대화하면 아마존 트랜스크라이브 메디컬에 내장된 자동 구두법을 이용해 기존 녹취 SW들의 한계를 극복한다. 의료 사업자의 경우 ‘아마존 트랜스크라이브 메디컬’을 기반으로 구축된 음성 솔루션은 수천 개의 잠재적인 의료 센터에 확대 적용 가능해, 임시 기록 관리의 어려움을 해소할 수 있다.


‘아마존 A2I’

‘아마존 A2I(Amazon Augmented Artificial Intelligence)’는 사람이 제공하는 머신러닝 애플리케이션 리뷰 구축과 관리를 보다 쉽게 할 수 있도록 지원하는 새로운 서비스다. ‘아마존 A2I’은 아마존 레코그니션과 아마존 텍스트랙트의 머신러닝 예측에 대한 사람 리뷰를 보다 쉽게 할 수 있도록 지원하는 이미지 속 물체 감지, 음성-텍스트 변환, 콘텐츠 조정 등 일반적인 머신러닝 업무에 대한 사전 구축된 사람 리뷰 워크플로우를 제공한다.

개발자들은 특정 애플리케이션에 대한 신뢰도 임계값을 선택해, 이보다 낮은 신뢰도 점수를 갖고 있는 모든 예측들은 사람 리뷰어에게 전송돼 추가 검증을 받는다. 개발자들은 50만 명으로 이뤄진 아마존 텍스트랙트의 글로벌 인력, 사전 승인된 인력을 갖춘 제3자 조직, 혹은 자체 사설 리뷰어를 통해 리뷰를 진행할 수 있다. 리뷰 결과는 아마존 S3에 저장되며, 리뷰가 완료되면 개발자들에게 통지해 사람 리뷰어가 진행한 믿을 수 있는 결과를 토대로 조치를 취할 수 있다.

아마존 A2I은 맞춤형 리뷰 파이프라인을 구축하고 관리하거나, 많은 사람 리뷰어를 고용해야 하는 번거로움을 해소해, 모든 개발자들이 사람 리뷰를 활용할 수 있게 지원한다.

스와미 시바수브라마니안(Swami Sivasubramanian) 아마존 머신러닝 부문 부사장은 “내부 검색, 코드 작성 개선 지원, 이상거래 탐지, 머신러닝 시스템의 전반적인 개선 등 문제들을 성공적으로 해결하는 내부 시스템을 개발했다”며 “이와 같은 시스템의 발전을 촉진해온 아마존의 고객최우선주의를 새롭게 발현한 서비스들을 출시해 머신러닝 전문성이 없는 엔터프라이즈 사용자들에게 머신러닝의 강력한 성능을 제공하게 돼 기쁘게 생각한다”고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지