보이스 기반 새 사용자 인터페이스 구현, 중첩되는 소리도 명확한 발화 인식

▲ 셀바스AI의 음성인식·음성합성 기술이 적용된 ‘샬롯홈’

[아이티데일리] 셀바스AI(대표 곽민철)는 롯데쇼핑의 인공지능(AI) 스피커 ‘샬롯홈’에 자사의 음성인식 및 음성합성 기술을 공급했다고 9일 밝혔다.

‘샬롯홈’은 디스플레이 기능을 접목한 보이스 커머스 AI 스피커다. 롯데백화점, 롯데홈쇼핑, 롯데슈퍼, 롯데리아 등의 상품과 서비스를 음성으로 대화하며 주문할 수 있다.

셀바스AI는 자사의 음성인식 및 음성합성 기술을 ‘샬롯홈’의 모든 기능에 적용했다. ‘샬롯홈’을 실행시키기 위한 보이스 트리거(음성 명령)를 시작으로, 일정과 뉴스 확인 등 생활에 필요한 정보뿐만 아니라 쇼핑을 위한 모든 정보를 음성으로 검색할 수 있다. 특히 소리가 중첩되는 상황에서도 사용자의 발화를 명확하게 인식할 수 있도록 해 사용성을 높였다.

셀바스AI는 지난해 사람의 감정까지 표현해낼 수 있는 음성합성(TTS) 기술을 발표, 이를 자사의 ‘셀비 딥TTS(Selvy deepTTS)’ 서비스에 적용한 바 있다. ‘셀비 딥TTS’에 적용된 음성합성 기술은 감정의 종류 뿐 아니라 ‘조금 슬프게’ 혹은 ‘많이 슬프게’와 같이 감정의 강도까지 조절하는 것도 가능하다. 이를 활용하면 보다 정확하고 생생한 감정 연기가 가능해 각각의 콘텐츠와 상황에 어울리는 음성을 낼 수 있게 된다.

또한 ‘셀비 딥TTS’는 외국어 학습이 용이한 교차언어 학습 기술을 탑재하고 있다. 기존에는 다국어 구사가 필요할 경우 해당 언어를 별도로 녹음해야 했기 때문에 수 배에 달하는 시간과 비용이 들어갔다. 하지만 교차언어 학습기술을 통해 한 명의 AI 화자가 다양한 언어를 자연스럽고 유창하게 발화할 수 있게 됐다. 다국어 구사가 필요할 경우에도 별도의 외국어 녹음 과정이 필요하지 않다는 뜻이다.

한편 ‘샬롯홈’에 적용된 음성합성음은 사용자들이 친숙하게 느끼도록 롯데만의 브랜드 보이스로 새롭게 개발됐다. 다양한 기능에 맞춰 자연스러운 합성음이 출력될 수 있도록 셀바스AI의 음성합성 기술 노하우가 적용됐다.

곽민철 셀바스AI 대표는 “유저 인터페이스가 터치에서 보이스로 이동하고 있는 시점에서, 셀바스AI의 음성인식 및 음성합성 솔루션이 ‘샬롯홈’에 적용돼 새로운 쇼핑 패러다임을 선보일 수 있어 기쁘다”며, “말하는 대로 쉽게 쇼핑할 수 있는 시대가 다가온 만큼 셀바스AI의 음성기술이 커머스 경쟁력을 높일 수 있는 수단이 될 수 있도록 서비스 고도화에 힘 쏟겠다”고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지