로봇신문사
> 기획·테크 > 미래기술
미쓰비시, '칵테일 파티 문제' 해결하는 음성분리 기술 개발일본 도쿄 '연례 R&D 오픈하우스'에서 발표
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2017.06.05  16:54:21
트위터 카카오톡 페이스북

인간은 여러 사람들이 모여 있는 행사장이나 파티에서 여러 사람이 왁자지껄 떠드는데도 불구하고 자신과 친한 사람의 목소리를 용케 알아듣는다. 조금만 주의를 기울이면 웬만한 소리는 구분해 들을 수 있다. 이런 현상을 과학자들은 '칵테일 파티 효과'라고 부른다. 하지만 로봇이나 인공지능 기술은 이런 능력이 없다. 칵테일 파티장에서 여러 사람이 한꺼번에 떠들면 하나의 소리로 받아들인다. 관심 있는 소리만 선택적으로 듣는 게 불가능하다. 이를 '칵테일 파티 문제'라고 한다.

‘IEEE 스펙트럼’에 따르면 미쓰비시전기는 지난달 24일 도쿄에서 열린 연례 R&D 오픈하우스에서 ‘칵테일 파티 문제’를 해결할 수 있는 음성 분리 기술을 선보였다. 미쓰비시는 2종류의 실연 과정을 공개했다.

▲ 미쓰비시의 기술 시연 장면(사진=IEEE 스펙트럼)
첫번째는 2명의 화자가 하나의 마이크 앞에서 각자 다른 언어로 말을 하는 시험이다. 실험 결과 실시간으로 두 사람의 목소리를 구분하고, 높은 정확도를 가지고 재연하는 데 성공했다. 하지만 이 실험은 밀폐된 공간에서 이뤄졌으며 다른 사람들은 말을 하지 못하고 지켜보기만했다. 두번째 실연은 3명의 화자가 발언을 했는데 당연히 정확도가 떨어졌다.

미쓰비시 측은 소음이 매우 적은 환경에서 각각 90%와 80% 정도의 정확도를 갖고 음성을 분리할 수 있다고 주장했다. 기존의 기술은 2명의 화자가 1대의 마이크를 사용할 경우 50%의 정확도를 갖고 있다는 것. 하지만 미쓰비시 실험 역시 소음이 많은 환경에선 힘들다.

미쓰비시는 이 기술을 구현하기 위해 전용 머신러닝 기술인 ‘딥 클러스터링(Deep Clustering)‘을 활용했다. 딥 클러스터링은 화자의 음색, 높낮이, 억양에 기초해 음성 신호를 엔코딩하고, 동일한 화자에 속하는 서로 다른 구성 요소들을 유사하게 엔코딩하도록 했다. 클러스터링 알고리즘은 엔코딩 결과물을 유사성에 따라 그룹화하는 작업을 실시했다. 미쓰비시 연구진은 "화자들간 목소리를 구분하는 일은 그들이 갖고 있는 유사성 때문에 분리하기 쉽지 않은 과제였다“고 말했다.

미쓰비시 시니어 매니저인 '오카토 요헤이'는 “이번에 확보한 기술을 음성 통신과 음성인식 시스템의 질과 정확도를 높이는 데 활용할 것”이라고 밝혔다.

한편 지난 2015년 미 듀크대 과학자인 '스티븐 커머(Steven Cummer)' 연구팀은 '칵테일 파티 문제'를 해결할 수 있는 해법을 내놓은 바 있다. 여러 사람의 목소리 가운데 특정인의 목소리를 구분할 수 있는 컴퓨터 알고리즘과 청취 장비를 개발했다.

장길수  ksjang@irobotnews.com
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
장길수의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 구글+ 밴드 뒤로가기 위로가기
인기기사
1
美 노스웨스턴대, 사람 근육 닮은 소프트 로봇 개발
2
"소셜 로봇의 사회적 감수성 높이려면..."
3
범용 로봇 개발 기업 '스킬드 AI', 3억달러 투자 유치
4
고영테크놀러지, ‘2023 지속가능경영 보고서’ 발간
5
오늘의 로봇기업 주식시세(2024-07-12)
6
두산밥캣 품은 두산로보틱스, 새로운 도약 발판 마련
7
엔젤로보틱스, 연구실증센터 '플래닛대전' 투어 행사 개최
8
中 선전시 인공지능로봇연구원, 교량 점검 케이블 로봇 개발
9
플로틱, 현대자동차그룹 제로원으로부터 투자 유치
10
일본 의료 로봇 스타트업 F.MED, 4억 3천만엔 자금 조달
로봇신문 소개기사제보광고문의불편신고개인정보취급방침이메일무단수집거부청소년보호정책    *국제표준간행물번호 ISSN 2636-0381 *본지는 인터넷신문위원회 자율심의 준수 서약사입니다
08298) 서울 구로구 공원로 41(구로동, 현대파크빌 526호)  |  대표전화 : 02)867-6200  |  팩스 : 02)867-6203
등록번호 : 서울 아 02659  |  등록일자 : 2013.5.21  |  발행인·편집인 : 조규남  |  청소년보호책임자 : 박경일
Copyright © 2013 로봇신문사. All rights reserved. mail to editor@irobotnews.com