딥 러닝의 발전과 함께 심층신경망 기반 음향 모델은 음성 인식 분야에서 좋은 성능을 보여주고 있다. 이러한 발전에도 불구하고, 학습에 사용되는 데이터와 실제로 입력되는 데이터 사이의...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
국문 초록 (Abstract)
딥 러닝의 발전과 함께 심층신경망 기반 음향 모델은 음성 인식 분야에서 좋은 성능을 보여주고 있다. 이러한 발전에도 불구하고, 학습에 사용되는 데이터와 실제로 입력되는 데이터 사이의...
딥 러닝의 발전과 함께 심층신경망 기반 음향 모델은 음성 인식 분야에서 좋은 성능을 보여주고 있다. 이러한 발전에도 불구하고, 학습에 사용되는 데이터와 실제로 입력되는 데이터 사이의 녹음 환경 차이로 인해 생기는 인식 성능 저하 현상은 심층신경망 기반 음향 모델에서도 여전히 존재한다. 본 논문에서는 이러한 문제를 해결하기 위해 이전부터 활발하게 연구되어 온 심층신경망 기반 음향 모델에서의 화자 적응 기법을 소개하고 이를 환경 적응 문제에 적용한 실험 결과를 소개한다. 이와 더불어 선형 도메인에서 잡음 특성을 직접적으로 변환하는 방법인 선형 스펙트럼 변환 기반 환경 적응을 제안한다. 우리 연구진이 진행한 음소 인식 및 음성 인식 실험 결과 본 논문에서 제안하는 선형 스펙트럼 변환 기법이 환경 적응 문제에서 최소한의 파라미터만으로도 기존 적응 방식과 같은 성능을 보임을 증명하였다.
목차 (Table of Contents)