다크 스피치의 ‘사오정’AI 스피커 … 센서 하나로 해결

KT에서 개발 한 음성 인식 (AI) 스피커입니다.  작년에 등장한이 AI 스피커는 음성 명령을 사용하여 침대와 커튼의 동작을 제어 할 수 있습니다. [사진 KT]

KT에서 개발 한 음성 인식 (AI) 스피커입니다. 작년에 등장한이 AI 스피커는 음성 명령을 사용하여 침대와 커튼의 동작을 제어 할 수 있습니다. [사진 KT]

인간의 귀 구조를 모방 한 고품질 음성 인식 센서가 개발되었습니다. 스마트 폰이나 인공 지능 (AI) 스피커에 탑재 해 조만간 상용화 할 수있는 기술이다.

KAIST 연구팀, AI 음성 인식 센서 개발
스마트 폰 및 AI 스피커의 음성 식별 개선
“곧 상용화됩니다. 파트너를 찾고”

한국 과학 기술원 (KAIST)은 음성 인식 오류를 최대 95 % 개선 한 세계 최초의 ‘공진 형 유연 압전 음성 센서’를 개발했다고 15 일 밝혔다. 공진 형 플렉서블 압전 음성 센서는 센서가 특정 주파수 범위 (공진)에서 큰 진폭으로 진동하고 압력이 가해지면 (압전) 전기 신호가 자발적으로 발생하는 현상을 적용하는 센서입니다.

스마트 폰과 인공 지능 스피커에 실제로 설치된 KAIST 연구원들의 유연한 압전 음성 센서 [사진 KAIST]

스마트 폰과 인공 지능 스피커에 실제로 탑재 된 KAIST 연구원들의 유연한 압전 음성 센서. [사진 KAIST]

지금까지 AI 스피커는 주로 소프트웨어 기술로 음성 인식 오류를 해결하려고 시도했습니다. 반면 KAIST 재료 공학과 이건재와 왕 희승 연구원은 음성을 물리적으로 인식하는 센서를 새롭게 개발했다. 귀가 어두운 사람이 보청기를 착용 할 때 더 잘들을 수 있다는 것은 동일한 개념입니다.

인간의 귀에서는 달팽이관의 사다리꼴 기저막이 가청 주파수 대역에서 공명 현상을 일으켜 소리를 증폭시킵니다. 길이가 30mm에 불과한 기저막은 마이크로 미터 (μm) 구조로 인해 공명을 유발할 수 있습니다. 연구원들은 귀의 기저막 구조를 기반으로 매우 얇고 유연한 센서를 만들었습니다. 이건재 교수는 “인간의 귀 구조를 시뮬레이션하여 공명 형 음성 센서를 만든 것은 이번이 처음이다”라고 설명했다.

연구원들은 이런 방식으로 생성 된 센서가 음성을 정확하게 식별했다고 설명했습니다. 음성 인식의 정확도가 높았으며 상황에 따라 음성 인식 확률이 60 ~ 95 % 감소했다. 이 교수는“각 음성 명령을 50 회 테스트 한 결과 시판중인 AI 스피커 나 아이폰, 갤럭시 등 스마트 폰이 음성 명령을 평균 10 회 잘못 인식하면 연구원의 센서를 사용한 제품은 1 ~ 4 회. 한 번 정도만 잘못 인식했습니다.”

연구원들은 센서를 스마트 폰과 AI 스피커에 탑재 해 상용화에 성공했다. 연구원 (Pronix)이 설립 한이 회사는 미국 실리콘 밸리에있는 정보 기술 (IT) 회사와 협력하여 상용화를 추진하고 있습니다.

이 교수는“이번에 상용화 된 음성 센서는 미래 AI 기술을 주도하는 핵심 센서이며 조만간 실생활에 적용되는 제품을 보게 될 것”이라고 말했다. 파트너로서 외국 유수의 기업을 찾는 단계입니다.”

한국 연구 재단의 지원을 받아 진행된 이번 연구는 국제 학술지 ‘사이언스 어드밴스드’12 일자에 게재됐다.

문희철 기자 [email protected]


Source