감정 파악해 AI 보이스를 만드는 ‘감정 더빙’ 기술 적용
‘다국어 합성’으로 글로벌 콘텐츠 제작 가능

[아이티데일리] KT(대표 구현모)는 인공지능(AI) 음성합성 콘텐츠를 제작할 수 있는 ‘AI 보이스 스튜디오’ 서비스를 출시했다고 19일 밝혔다.

‘AI 보이스 스튜디오’는 △100개의 AI 목소리를 활용해 즐거움, 침착함, 중립, 슬픔, 화남의 5가지 감정으로 합성할 수 있는 ‘AI 보이스’ △영상 등 오디오 합성 콘텐츠를 제작할 수 있는 ‘스튜디오’로 구성돼 있다.

KT가 AI 음성합성 콘텐츠를 손쉽게 제작할 수 있는 ‘AI 보이스 스튜디오’ 서비스를 출시했다.
KT가 AI 음성합성 콘텐츠를 손쉽게 제작할 수 있는 ‘AI 보이스 스튜디오’ 서비스를 출시했다.

특히 KT ‘AI 보이스 스튜디오’는 ‘감정 더빙’ 기술이 탑재돼 있다. ‘감정 더빙’ 기능을 활용하면 AI 보이스를 낭독한 감정을 그대로 더빙함으로써 더 생생한 AI 음성을 만들 수 있다. 또한 KT ‘AI 보이스 스튜디오’가 제공하는 모든 AI 목소리는 한국어, 영어, 중국어, 일본어 4개국어로 ‘다국어 합성’이 가능하다.

KT는 매력적인 AI 보이스를 제공하기 위해 유명인들의 음성을 AI로 제공하는 ‘셀럽 AI 보이스’를 준비했다. 첫 번째 ‘셀럽 AI 보이스’는 가수 윤도현으로, ‘AI 보이스 스튜디오’에 담긴 AI 윤도현의 목소리는 오디오북을 제작할 수 있는 낭독체와 대화체가 담겼다. ‘셀럽 AI 보이스’는 셀럽의 권리 보호를 위해 홈페이지의 문의하기 기능을 활용해 별도 정책에 따라 이용할 수 있다.

KT 최준기 AI/빅데이터사업본부장은 “이번에 출시한 ‘AI 보이스 스튜디오’는 KT만의 차별화된 AI 기술로 인간에 가까운 감정을 표현하는 등 AI 목소리의 가치를 향상시켰다”며, “향후 KT는 그룹사를 비롯한 다양한 파트너와 협력해 더 혁신적인 ‘AI 보이스 스튜디오’ 서비스를 지속 출시하겠다”고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지