RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      성도 정규화를 이용한 감정 변화에 강인한 음성 인식

      한글로보기

      https://www.riss.kr/link?id=A79574771

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      본 논문에서는 인간의 감정 변화에 강인한 음성 인식 시스템을 구현하기 위하여 감정 변화의 영향을 최소화 하는 방법에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 ...

      본 논문에서는 인간의 감정 변화에 강인한 음성 인식 시스템을 구현하기 위하여 감정 변화의 영향을 최소화 하는 방법에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정 변화에 따른 음성신호의 변화를 관찰하였다. 감정이 포함되지 않은 평상의 음성으로 학습된 음성 인식 시스템에 감정이 포함된 인식 데이터가 입력되는 경우 감정에 따른 음성의 차이가 인식 시스템의 성능을 저하시킨다. 본 연구에서는 감정의 변화에 따라 화자의 성도 길이가 변화한다는 것과 이러한 변화는 음성 인식 시스템의 성능을 저하시키는 원인 중의 하나임을 관찰하였다. 본 연구에서는 이러한 음성의 변화를 감소시키는 방법으로 성도 길이 정규화 방법을 사용한 감정 변화에 강인한 음성 인식 시스템을 개발하였다. HMM을 사용한 단독음 인식 실험에서 제안된 학습 방법을 사용하면 감정 데이터의 오차가 기존방법보다 41.9% 감소되었다.

      더보기

      다국어 초록 (Multilingual Abstract)

      This paper studied the training methods less affected by the emotional variation for the development of the robust speech recognition system. For this purpose, the effect of emotional variations on the speech signal were studied using speech database ...

      This paper studied the training methods less affected by the emotional variation for the development of the robust speech recognition system. For this purpose, the effect of emotional variations on the speech signal were studied using speech database containing various emotions. The performance of the speech recognition system trained by using the speech signal containing no emotion is deteriorated if the test speech signal contains the emotions because of the emotional difference between the test and training data. In this study, it is observed that vocal tract length of the speaker is affected by the emotional variation and this effect is one of the reasons that makes the performance of the speech recognition system worse. In this paper, vocal tract normalization method is used to develop the robust speech recognition system for emotional variations. Experimental results from the isolated word recognition using HMM showed that the vocal tract normalization method reduced the error rate of the conventional recognition system by 41.9% when emotional test data was used.

      더보기

      목차 (Table of Contents)

      • 요약
      • Abstract
      • 1. 서론
      • 2. 성도 정규화
      • 3. 주파수 와핑(frequency warping)
      • 요약
      • Abstract
      • 1. 서론
      • 2. 성도 정규화
      • 3. 주파수 와핑(frequency warping)
      • 4. 실험 및 결과
      • 5. 결론
      • 참고문헌
      • 저자소개
      더보기

      참고문헌 (Reference)

      1 강봉석, "음성 신호를 이용한 문장독립 감정 인식 시스템" 연세대학교 2000

      2 M. Pitz, "Vocal tract normalization equals linear transformation in cepstral space" 13 (13): 930-944, 2005

      3 K. R. Scherer, "Vocal cues to speaker affect: testing two models" 76 (76): 1346-1355, 1984

      4 I. R. Murray, "Toward the simulation of emotion in synthetic speech: a review of the literature on human vocal emotion" Journal of Accoustal Society of America 1097-1108, 1993

      5 J. E. Cahn, "The generation of affect in synthesized speech" 80 : 1-19, 1990

      6 A. Nogueiras, "Speech emotion recognition using Hidden Markov Models" 4 : 2676-2682, 2001

      7 S. Wegmann, "Speaker Normalization on Conversational Telephone Speech" 339-342, 1996

      8 M. G. Rahim, "Signal bias removal by maximum likelihood estimation for robust telephone speech recognition" 4 (4): 19-30, 1996

      9 P. Alexandre, "Root cepstral analysis: a unified view. application to speech processing in car noise environments" 12 (12): 277-288, 1993

      10 J. C. Junqua, "Robustness in Automatic Speech Recognition - Fundamental and Applications" Kluwer Academic Publishers 1996

      1 강봉석, "음성 신호를 이용한 문장독립 감정 인식 시스템" 연세대학교 2000

      2 M. Pitz, "Vocal tract normalization equals linear transformation in cepstral space" 13 (13): 930-944, 2005

      3 K. R. Scherer, "Vocal cues to speaker affect: testing two models" 76 (76): 1346-1355, 1984

      4 I. R. Murray, "Toward the simulation of emotion in synthetic speech: a review of the literature on human vocal emotion" Journal of Accoustal Society of America 1097-1108, 1993

      5 J. E. Cahn, "The generation of affect in synthesized speech" 80 : 1-19, 1990

      6 A. Nogueiras, "Speech emotion recognition using Hidden Markov Models" 4 : 2676-2682, 2001

      7 S. Wegmann, "Speaker Normalization on Conversational Telephone Speech" 339-342, 1996

      8 M. G. Rahim, "Signal bias removal by maximum likelihood estimation for robust telephone speech recognition" 4 (4): 19-30, 1996

      9 P. Alexandre, "Root cepstral analysis: a unified view. application to speech processing in car noise environments" 12 (12): 277-288, 1993

      10 J. C. Junqua, "Robustness in Automatic Speech Recognition - Fundamental and Applications" Kluwer Academic Publishers 1996

      11 A. Acero, "Robust speech recognition by normalization of the acoustic spac" 893-896, 1991

      12 F. Dellaert, "Recognizing emotion in speech" 1996

      13 H. Hermansky, "Recognition of speech in additive and convolutional noise based RASTA spectral processing" 83-86, 1993

      14 J. Koehler, "Integrating RASTA-PLP into Speech Recognition" 421-424, 1994

      15 M. Lewis, "Handbook of Emotions" The Guilford Press 1993

      16 A. Acero, "Environmental robustness in automatic speech recognition" 849-852, 1990

      17 B. Heuft, "Emotions in time domain synthesis" 3 : 1974-1977, 1996

      18 C. E. Williams, "Emotions and speech: some acoustical correlates" 52 (52): 1238-1250, 1972

      19 J. Sato, "Emotion modeling in speech production using emotion space" 472-477, 1996

      20 Sirko Molau, "Efficient Vocal Tract Normalization in Automatic Speech Recognition" 209-216, 2000

      21 J. Vroomen, "Duration and intonation in emotional Speech" 1 : 577-580, 1993

      22 T. S. Polzin, "Detecting emotions in speech" 1998

      23 H. Hermansky, "Compensation for the effect of the communication channel in auditory-like analysis of speech (RASTA-PLP)" 3 : 1367-1370, 1991

      24 N. Amir, "Classifying emotions in speech: a comparison of methods" 1 : 127-130, 2001

      25 T. S. Huang, "Bimodal emotion recognition by man and machine" 1998

      26 R. W. Picard, "Affective Computing" The MIT Press 1997

      27 L. Welling, "A study on speaker Normalization using vocal tract normalization and speaker adaptive training" 797-800, 1998

      28 E. Eide, "A parametric approach to vocal tract length normalization" 346-349, 1996

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2023 평가예정 재인증평가 신청대상 (재인증)
      2020-01-01 평가 등재학술지 선정 (재인증) KCI등재
      2019-12-01 평가 등재후보로 하락 (계속평가) KCI등재후보
      2016-01-01 평가 등재학술지 선정 (계속평가) KCI등재
      2015-12-01 평가 등재후보로 하락 (기타) KCI등재후보
      2011-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2009-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-02-20 학술지명변경 한글명 : 한국퍼지및지능시스템학회 논문지 -> 한국지능시스템학회 논문지
      외국어명 : 미등록 -> Journal of Korean Institute of Intelligent Systems
      KCI등재
      2008-02-18 학회명변경 한글명 : 한국퍼지및지능시스템학회 -> 한국지능시스템학회
      영문명 : Korea Fuzzy Logic And Intelligent Systems Society -> Korean Institute of Intelligent Systems
      KCI등재
      2007-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2005-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2002-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      1999-07-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.62 0.62 0.63
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.56 0.49 0.866 0.2
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼