RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      강인한 음성인식을 위한 히스토그램 등화에 의한 특징보상 및 환경적응 = Feature Compensation and Environmental Model Adaptation Utilizing Histogram Equalization for Robust Speech Recognition

      한글로보기

      https://www.riss.kr/link?id=A103470526

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      음성인식 기술의 성공적인 상용화를 위해서는 주변잡음이나 채널왜곡에 오염된 음성신호에 대한 인식성능 저하를 효과적으로 방지할 수 있는 강인한 음성인식 기술의 개발이 필수적이다. ...

      음성인식 기술의 성공적인 상용화를 위해서는 주변잡음이나 채널왜곡에 오염된 음성신호에 대한 인식성능 저하를 효과적으로 방지할 수 있는 강인한 음성인식 기술의 개발이 필수적이다. 현재 대부분의 강인한 음성인식 기술들은 신호영역에서의 음성개선, 음성인식을 위한 특징영역에서의 특징보상, 그리고 음성인식기의 모델영역에서의 모델적응에 속한다. 본 논문에서는 가장 효율적인 특징보상 기술의 하나인 히스토그램 등화 기법의 성능개선을 위한 클래스 히스토그램 등화를 제안하고 아울러 모델영역에서 환경적응을 위한 히스토그램 등화의 적용에 대해 소개한다. Aurora2 음성 데이터베이스에 대한 성능평가에서 제안된 클래스 히스토그램 등화에 의한 특징보상은 기본 음성인식 특징인 멜 켑스트럼에 비해 약 61.17%의 오인식률 감소를 나타내었고 기존의 히스토그램 등화에 의한 특징보상과 비교할 때 약 19.61%의 의미있는 개선을 얻었다. 또한, 환경적응을 위한 히스토그램 등화는 멜 켑스트럼에 비해 약 62.84%의 오인식률 감소를 나타내었다.

      더보기

      참고문헌 (Reference)

      1 A. Agarwal, "Two-stage mel-warped Wiener filter for robust speech recognition" 1999

      2 H.-G. Hirsch, "The Aurora experimental framework for the performance evaluation of speech recognition systems under noisy conditions" 16-20, 2000

      3 N. S. Kim, "Statistical linear approximation for environment compensation" 5 (5): 8-10, 1998

      4 X. Huang, "Spoken Language Processing: A Guide to Theory, Algorithm, and System Development" Prentice Hall 2001

      5 Y. Ephraim, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator" 32 (32): 1109-1121, 1984

      6 Y. Ephraim, "Speech enhancement using a minimum mean-square error log-spectral amplitude estimator" 33 (33): 443-445, 1985

      7 M.J. Gales, "Robust continuous speech recognition using parallel model combination" 4 (4): 352-359, 1996

      8 R. Kuhn, "Rapid speaker adaptation in eigenvoice space" 8 (8): 695-707, 2000

      9 Y. Suh, "Probabilistic class histogram equalization for robust speech recognition" 14 (14): 287-290, 2007

      10 C. J. Leggetter, "Maximum likelihood linear regression for speaker adaptation of continuous density hidden Markov models" 9 : 171-185, 1995

      1 A. Agarwal, "Two-stage mel-warped Wiener filter for robust speech recognition" 1999

      2 H.-G. Hirsch, "The Aurora experimental framework for the performance evaluation of speech recognition systems under noisy conditions" 16-20, 2000

      3 N. S. Kim, "Statistical linear approximation for environment compensation" 5 (5): 8-10, 1998

      4 X. Huang, "Spoken Language Processing: A Guide to Theory, Algorithm, and System Development" Prentice Hall 2001

      5 Y. Ephraim, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator" 32 (32): 1109-1121, 1984

      6 Y. Ephraim, "Speech enhancement using a minimum mean-square error log-spectral amplitude estimator" 33 (33): 443-445, 1985

      7 M.J. Gales, "Robust continuous speech recognition using parallel model combination" 4 (4): 352-359, 1996

      8 R. Kuhn, "Rapid speaker adaptation in eigenvoice space" 8 (8): 695-707, 2000

      9 Y. Suh, "Probabilistic class histogram equalization for robust speech recognition" 14 (14): 287-290, 2007

      10 C. J. Leggetter, "Maximum likelihood linear regression for speaker adaptation of continuous density hidden Markov models" 9 : 171-185, 1995

      11 A'. de la Torre, "Histogram equalization of speech representation for robust speech recognition" 13 : 355-366, 2005

      12 J. C. Segura, "Cepstral domain segmental nonlinear feature transformations for robust speech recognition" 11 : 517-520, 2004

      13 O. Viikki, "Cepstral domain segmental feature vector normalization for noise robust speech recognition" 25 : 133-147, 1998

      14 A. E. Rosenberg, "Cepstral channel normalization techniques for HMM-based speaker verification" 1835-1838, 1994

      15 J.L. Gauvain, "Bayesian learning of Gaussian mixture densities for hidden Markov models" 101-120, 1991

      16 P. J. Moreno, "A vector Taylor series approach for environment-independent speech recognition" 733-736, 1996

      17 S. Dharanipragada, "A nonlinear unsupervised adaptation technique for speech recognition" 556-559, 2000

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2016-01-01 평가 학술지 폐간(기타)
      2015-12-01 평가 등재후보로 하락(기타) KCI등재후보
      2011-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2009-01-01 평가 등재 1차 FAIL(등재유지) KCI등재
      2007-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2005-05-30 학술지등록 한글명 : Telecommunications Review</br>외국어명 : Telecommunications Review KCI등재
      2005-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2002-07-01 평가 등재학술지 선정(등재후보2차) KCI등재
      2000-01-01 평가 등재후보학술지 선정(신규평가) KCI등재후보
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼