한국어는 교착어로 대부분의 어절들이 형태소들의 결합으로 이루어지고, 각 결합에 따른 음운변화 현상이 빈번하여 인식이 어렵다. 또한 어휘의 증가에 따른 사전크기의 증가율도 매우 크...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A82311771
1999
Korean
004
학술저널
351-353(3쪽)
0
상세조회0
다운로드국문 초록 (Abstract)
한국어는 교착어로 대부분의 어절들이 형태소들의 결합으로 이루어지고, 각 결합에 따른 음운변화 현상이 빈번하여 인식이 어렵다. 또한 어휘의 증가에 따른 사전크기의 증가율도 매우 크...
한국어는 교착어로 대부분의 어절들이 형태소들의 결합으로 이루어지고, 각 결합에 따른 음운변화 현상이 빈번하여 인식이 어렵다. 또한 어휘의 증가에 따른 사전크기의 증가율도 매우 크기 때문에 한국어의 특성을 반영한 음성이식이 이루어져야 한다. 본 논문에서는 대용량의 한국어 연속음성 인식을 위해서 음성인식과 형태소 해석 단계를 결합하여 음성인식 단계에서 형태소 정보를 이용하였다.
3000 단어급의 한국어 낭독체 연속 음성을 대상으로 하여 인식 단위로 의사형태소를 선정하고, 의사형태소에 적합한 언어모델로 Tagged word bigram을 제안하였다. 형태소와 의사형태소를 각각 인식단위로 하고, 언어모델로 Word bigram과 Tagged word bigram을 각각 적용한 비교실험을 행하였다. 표제어를 형태소로 했을 때보다 의사형태소로 했을 때 약 6%의 인식률 향상을 보였다. 의사형태소 단위에 Tagged word bigram을 적용했을 때의 word accuracy는 91.751%로 단어를 표제어로 했을 때의 word accuracy 92.839%와도 근소한 차이를 보여 대용량의 연속음성 인식에 적합함을 알 수 있다.
목차 (Table of Contents)
효과적인 내용기반 영상 검색을 위한 사용자의 각 시각 특징에 대한 민감도 분석 및 적용에 관한 연구
한국어 문서 음성 변환 시스템을 위한 신경회로망 기반의 음소 지속시간 모델링
웹 상에서 에이전트를 기반으로 한 진료 예약 시스템의 설계 및 구현