MENU
CLOSE

홍보자료

[AI] 음성인식 AI 시장 고속 성장세…관련 서비스도 고도화 2022-03-14



[아시아경제 최동현 기자] 음성인식 인공지능(AI) 시장이 고속 성장세를 보이는 가운데 관련 서비스들이 기술 고도화를 통해 다양한 산업군에서 활약하고 있어 눈길을 끈다.



12일 업계에 따르면 AI 스타트업 리턴제로가 개발한 눈으로 보는 통화 애플리케이션 ‘비토(VITO)’는 통화 녹음을 텍스트로 변환해 메신저처럼 보여주는 서비스다. 통화 종료 후 수 초 내에 상대방과 나의 목소리를 분리해 메신저처럼 보여주는 기본 기능은 물론 원하는 내용을 쉽게 검색할 수도 있다. 통화 녹음파일을 처음부터 끝까지 듣지 않아도 원하는 부분을 클릭하면 손쉽게 부분 재생이 가능하다. 통화 내용 편집, 공유, 메모와 같은 부가 서비스도 지원해 일상 속 편리한 앱으로 주목받고 있다.



리턴제로는 지속적인 기술 고도화를 통해 지난해 9월 '통화 전 미리보기' 기능을 선보였다. 이 기능을 사용하면 연락처 저장 여부와 관계없이 전화 수신 시 상대방과의 기존 통화 내용을 미리 볼 수 있어 전화 수신 전에 통화 내용을 미리 대비할 수 있다.



리턴제로는 자체 개발한 통화 음성을 텍스트로 바꿔주는 STT(Speech To Text) 기술 기반 '소머즈 엔진'과 사용자의 목소리를 분석해 화자를 분리하는 '모세 엔진'을 통해 서비스를 제공하고 있다. 비토는 높은 정확도와 고품질 기능들을 선보이며 일반인부터 통화 업무가 필수인 영업직이나 변호사, 부동산 종사자, 보험설계사까지 다양한 직종의 이용자들에게 인기를 끌고 있다.



구글은 2016년 11월 AI기반 신경망 기계번역(GNMT)을 적용한 번역 서비스를 도입하며 글로벌 번역시장을 선도하고 있다.



구글이 적용한 신경망 기술은 기존에 문장 내에서 단어·구문 단위로 번역하던 수준에서 진화해 인간의 언어 구사 방식과 유사한 문장 단위 번역을 가능케 했다. 이 기술은 영어뿐만 아니라 프랑스어, 독일어, 스페인어, 포르투갈어, 중국어, 일본어, 터키어 등 8개 언어에 적용됐다. 구글은 현재 총 103개 언어의 번역 서비스를 지원하고 있다. 향후 머신러닝을 통해 더 많은 데이터를 학습한다면 더욱 정교한 품질의 번역이 가능해질 전망이다.



- 중략 -


기사 원문보기 >

목록

top