본 논문에서는 인간의 감정 변화에 강인한 음성 인식 시스템을 구현하기 위하여 감정 변화의 영향을 최소화 하는 방법에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 ...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A79574771
2009
Korean
KCI등재
학술저널
773-778(6쪽)
1
0
상세조회0
다운로드국문 초록 (Abstract)
본 논문에서는 인간의 감정 변화에 강인한 음성 인식 시스템을 구현하기 위하여 감정 변화의 영향을 최소화 하는 방법에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 ...
본 논문에서는 인간의 감정 변화에 강인한 음성 인식 시스템을 구현하기 위하여 감정 변화의 영향을 최소화 하는 방법에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정 변화에 따른 음성신호의 변화를 관찰하였다. 감정이 포함되지 않은 평상의 음성으로 학습된 음성 인식 시스템에 감정이 포함된 인식 데이터가 입력되는 경우 감정에 따른 음성의 차이가 인식 시스템의 성능을 저하시킨다. 본 연구에서는 감정의 변화에 따라 화자의 성도 길이가 변화한다는 것과 이러한 변화는 음성 인식 시스템의 성능을 저하시키는 원인 중의 하나임을 관찰하였다. 본 연구에서는 이러한 음성의 변화를 감소시키는 방법으로 성도 길이 정규화 방법을 사용한 감정 변화에 강인한 음성 인식 시스템을 개발하였다. HMM을 사용한 단독음 인식 실험에서 제안된 학습 방법을 사용하면 감정 데이터의 오차가 기존방법보다 41.9% 감소되었다.
다국어 초록 (Multilingual Abstract)
This paper studied the training methods less affected by the emotional variation for the development of the robust speech recognition system. For this purpose, the effect of emotional variations on the speech signal were studied using speech database ...
This paper studied the training methods less affected by the emotional variation for the development of the robust speech recognition system. For this purpose, the effect of emotional variations on the speech signal were studied using speech database containing various emotions. The performance of the speech recognition system trained by using the speech signal containing no emotion is deteriorated if the test speech signal contains the emotions because of the emotional difference between the test and training data. In this study, it is observed that vocal tract length of the speaker is affected by the emotional variation and this effect is one of the reasons that makes the performance of the speech recognition system worse. In this paper, vocal tract normalization method is used to develop the robust speech recognition system for emotional variations. Experimental results from the isolated word recognition using HMM showed that the vocal tract normalization method reduced the error rate of the conventional recognition system by 41.9% when emotional test data was used.
목차 (Table of Contents)
참고문헌 (Reference)
1 강봉석, "음성 신호를 이용한 문장독립 감정 인식 시스템" 연세대학교 2000
2 M. Pitz, "Vocal tract normalization equals linear transformation in cepstral space" 13 (13): 930-944, 2005
3 K. R. Scherer, "Vocal cues to speaker affect: testing two models" 76 (76): 1346-1355, 1984
4 I. R. Murray, "Toward the simulation of emotion in synthetic speech: a review of the literature on human vocal emotion" Journal of Accoustal Society of America 1097-1108, 1993
5 J. E. Cahn, "The generation of affect in synthesized speech" 80 : 1-19, 1990
6 A. Nogueiras, "Speech emotion recognition using Hidden Markov Models" 4 : 2676-2682, 2001
7 S. Wegmann, "Speaker Normalization on Conversational Telephone Speech" 339-342, 1996
8 M. G. Rahim, "Signal bias removal by maximum likelihood estimation for robust telephone speech recognition" 4 (4): 19-30, 1996
9 P. Alexandre, "Root cepstral analysis: a unified view. application to speech processing in car noise environments" 12 (12): 277-288, 1993
10 J. C. Junqua, "Robustness in Automatic Speech Recognition - Fundamental and Applications" Kluwer Academic Publishers 1996
1 강봉석, "음성 신호를 이용한 문장독립 감정 인식 시스템" 연세대학교 2000
2 M. Pitz, "Vocal tract normalization equals linear transformation in cepstral space" 13 (13): 930-944, 2005
3 K. R. Scherer, "Vocal cues to speaker affect: testing two models" 76 (76): 1346-1355, 1984
4 I. R. Murray, "Toward the simulation of emotion in synthetic speech: a review of the literature on human vocal emotion" Journal of Accoustal Society of America 1097-1108, 1993
5 J. E. Cahn, "The generation of affect in synthesized speech" 80 : 1-19, 1990
6 A. Nogueiras, "Speech emotion recognition using Hidden Markov Models" 4 : 2676-2682, 2001
7 S. Wegmann, "Speaker Normalization on Conversational Telephone Speech" 339-342, 1996
8 M. G. Rahim, "Signal bias removal by maximum likelihood estimation for robust telephone speech recognition" 4 (4): 19-30, 1996
9 P. Alexandre, "Root cepstral analysis: a unified view. application to speech processing in car noise environments" 12 (12): 277-288, 1993
10 J. C. Junqua, "Robustness in Automatic Speech Recognition - Fundamental and Applications" Kluwer Academic Publishers 1996
11 A. Acero, "Robust speech recognition by normalization of the acoustic spac" 893-896, 1991
12 F. Dellaert, "Recognizing emotion in speech" 1996
13 H. Hermansky, "Recognition of speech in additive and convolutional noise based RASTA spectral processing" 83-86, 1993
14 J. Koehler, "Integrating RASTA-PLP into Speech Recognition" 421-424, 1994
15 M. Lewis, "Handbook of Emotions" The Guilford Press 1993
16 A. Acero, "Environmental robustness in automatic speech recognition" 849-852, 1990
17 B. Heuft, "Emotions in time domain synthesis" 3 : 1974-1977, 1996
18 C. E. Williams, "Emotions and speech: some acoustical correlates" 52 (52): 1238-1250, 1972
19 J. Sato, "Emotion modeling in speech production using emotion space" 472-477, 1996
20 Sirko Molau, "Efficient Vocal Tract Normalization in Automatic Speech Recognition" 209-216, 2000
21 J. Vroomen, "Duration and intonation in emotional Speech" 1 : 577-580, 1993
22 T. S. Polzin, "Detecting emotions in speech" 1998
23 H. Hermansky, "Compensation for the effect of the communication channel in auditory-like analysis of speech (RASTA-PLP)" 3 : 1367-1370, 1991
24 N. Amir, "Classifying emotions in speech: a comparison of methods" 1 : 127-130, 2001
25 T. S. Huang, "Bimodal emotion recognition by man and machine" 1998
26 R. W. Picard, "Affective Computing" The MIT Press 1997
27 L. Welling, "A study on speaker Normalization using vocal tract normalization and speaker adaptive training" 797-800, 1998
28 E. Eide, "A parametric approach to vocal tract length normalization" 346-349, 1996
도시형 풍력발전 시스템의 효율적 에너지 관리를 위한 인공신경망 기반 최대 전력점 추종 알고리즘 개발
An H∞ Output Feedback Control for Uncertain Singularly Perturbed T-S Fuzzy Systems
내부 객체 정보를 이용한 온톨로지 기반의 객체 영상 인식
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2023 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2020-01-01 | 평가 | 등재학술지 선정 (재인증) | |
2019-12-01 | 평가 | 등재후보로 하락 (계속평가) | |
2016-01-01 | 평가 | 등재학술지 선정 (계속평가) | |
2015-12-01 | 평가 | 등재후보로 하락 (기타) | |
2011-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2009-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2008-02-20 | 학술지명변경 | 한글명 : 한국퍼지및지능시스템학회 논문지 -> 한국지능시스템학회 논문지외국어명 : 미등록 -> Journal of Korean Institute of Intelligent Systems | |
2008-02-18 | 학회명변경 | 한글명 : 한국퍼지및지능시스템학회 -> 한국지능시스템학회영문명 : Korea Fuzzy Logic And Intelligent Systems Society -> Korean Institute of Intelligent Systems | |
2007-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2005-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2002-01-01 | 평가 | 등재학술지 선정 (등재후보2차) | |
1999-07-01 | 평가 | 등재후보학술지 선정 (신규평가) |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 0.62 | 0.62 | 0.63 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
0.56 | 0.49 | 0.866 | 0.2 |