KAIST(총장 신성철) 신소재공학과 이건재 교수(사진)와 전기및전자공학부 유창동 교수 공동연구팀은 인간 달팽이관의 작동 방식을 모방한 AI 기반 화자 인식용 유연 압전 음성센서를 개발했다고 4일 밝혔다.
이 기술은 97.5%의 정확도로 말한 사람을 인식해 스마트홈 가전이나 인공지능 비서, 생체인증 분야 등에서 개인 맞춤형 서비스를 가능케 할 전망이다. 음성센서는 인간과 기계 사이의 소통을 가능케 하는 수단으로, 4차 산업혁명 핵심 기술로 주목받고 있다. 2021년 약 160억달러 규모로 시장이 커질 전망이다.
그러나 현재 실용화된 기술은 음성신호 수신 시 정전용량을 측정하는 콘덴서 방식을 적용, 민감도가 낮고 인식 거리가 짧아 화자 인식률이 낮은 한계가 있다.
KAIST 연구팀은 사람의 달팽이관을 모방해 주파수에 따라 다른 영역이 진동하는 사다리꼴의 얇은 막을 제작했다. 또 이를 이용해 음성신호에 따른 공진형 진동을 유연 압전물질을 통해 감지하는 자가발전 고민감 음성센서를 개발했다.
이 센서는 기존 기술 대비 민감도가 2배 이상 높아 미세한 음성신호를 원거리에서도 감지할 수 있다. 또 다채널로 신호를 받아들여 하나의 언어에 대해 여러 개의 데이터를 얻을 수 있다.
이 기술을 화자인식 시스템에 적용한 결과 97.5%의 화자인식 성공률을 무향실 환경에서 달성했다. 기존 기술 대비 오류는 75% 이상 줄였다. 앞으로 첨단 소프트웨어 기술을 접목하면 다양한 환경에서도 화자·음성 인식률을 높일 수 있을 것으로 기대된다.
이건재 교수는 "이 센서를 이용하면 화자를 정확하게 구별할 수 있기 때문에 개인별 음성 서비스를 스마트 가전이나 인공지능 비서에 접목할 수 있게 된다"면서 "생체인증, 핀테크 등 보안 분야에서도 활발한 활용이 기대된다"고 말했다.
이 연구는 과기정통부 지원 연구조직인 스마트IT융합시스템연구단의 지원을 받아 이뤄졌으며 연구결과를 담은 논문 두 편이 최근 국제 학술지 '나노에너지'에 동시에 게재됐다.