글로벌 기업 수준 상용화 성공…“음성 생성 서비스 속도 약 300배 향상”

 

[아이티데일리] 마인즈랩(대표 유태준)은 CUDA(Compute Unified Device Architecture) 기술을 활용해 자사의 인공지능 음성(AI Voice) 기술의 서비스 품질을 향상시켰다고 28일 밝혔다.

CUDA 기술은 C 언어 등 산업표준 언어를 활용해 그래픽 처리 장치(GPU)에서 수행하는 병렬처리 알고리즘을 작성할 수 있는 가속화 컴퓨팅 기술이다. 페이스북이 주도하는 ‘파이토치(PyTorch)’와 구글이 주도하는 ‘텐서플로우(Tensorflow)’ 등의 머신러닝 프레임워크에서 속도개선 및 비용절감을 위해 활용되는 핵심 기술이다.

마인즈랩 연구진들은 오픈소스 생태계에서 구글과 페이스북의 개발자들과 의견을 주고받으며, CUDA 코드의 수정 및 테스트를 통한 최적화에 기여해왔다. 이 과정에서 마인즈랩이 제안한 코드가 ‘파이토치’ 및 ‘텐서플로우’에 추가되기도 했다. 또한 마인즈랩 자체적으로도 해당 기술을 적용해 음성생성·합성 등에 사용되는 AI 음성 기술의 속도를 비약적으로 향상시켰다.

마인즈랩은 CUDA 기술의 잠재적 중요성에 대해 일찌감치 파악하고 전폭적인 투자를 진행해왔다고 설명했다. 이를 통해 확보한 글로벌 수준의 기술력을 활용해 향후 음성생성 기술 외에도 음성인식, 챗봇, 안면인식, 영상처리 등 현재 서비스되고 있는 다양한 엔진들을 강화해 나갈 계획이다.

이중건 마인즈랩 CUDA팀장은 “딥러닝 기반 음성생성 기술은 기존에 1초의 음성을 만들기 위해 1분의 시간이 소요돼 상용화하기 어려웠는데, CUDA 기술을 일찌감치 연구함으로써 음성생성 시간을 약 300배 향상시키는 데 성공했다”며, “AI 기술 연구개발이 아직 초창기에 있는 만큼, 향후 상용 서비스 적용이 본격화됨에 따라 속도 개선을 위한 CUDA 기술의 수요가 폭발적으로 늘어날 것으로 예상한다”고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지