RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 한국어 연속음성인식 시스템 구현을 위한 형태소 단위의 발음 변화 모델링

        정민화,이경님,Chung Minhwa,Lee Kyong-Nim 대한음성학회 2004 말소리 Vol.49 No.-

        In this paper, we describe a cross-morpheme pronunciation variation model which is especially useful for constructing morpheme-based pronunciation lexicon to improve the performance of a Korean LVCSR. There are a lot of pronunciation variations occurring at morpheme boundaries in continuous speech. Since phonemic context together with morphological category and morpheme boundary information affect Korean pronunciation variations, we have distinguished phonological rules that can be applied to phonemes in within-morpheme and cross-morpheme. The results of 33K-morpheme Korean CSR experiments show that an absolute reduction of 1.45% in WER from the baseline performance of 18.42% WER was achieved by modeling proposed pronunciation variations with a possible multiple context-dependent pronunciation lexicon.

      • 대어휘 연속음성인식을 위한 서브네트워크 기반의 1-패스 세미다이나믹 네트워크 디코딩

        정민화,안동훈,Chung Minhwa,Ahn Dong-Hoon 대한음성학회 2004 말소리 Vol.50 No.-

        In this paper, we present a one-pass semi-dynamic network decoding framework that inherits both advantages of fast decoding speed from static network decoders and memory efficiency from dynamic network decoders. Our method is based on the novel language model network representation that is essentially of finite state machine (FSM). The static network derived from the language model network [1][2] is partitioned into smaller subnetworks which are static by nature or self-structured. The whole network is dynamically managed so that those subnetworks required for decoding are cached in memory. The network is near-minimized by applying the tail-sharing algorithm. Our decoder is evaluated on the 25k-word Korean broadcast news transcription task. In case of the search network itself, the network is reduced by 73.4% from the tail-sharing algorithm. Compared with the equivalent static network decoder, the semi-dynamic network decoder has increased at most 6% in decoding time while it can be flexibly adapted to the various memory configurations, giving the minimal usage of 37.6% of the complete network size.

      • 오존처리에 의한 Bromate의 생성이 고환독성에 미치는 영향

        이무강,정운용,정민화,한갑이,조희숙,최종원 慶星大學校 環境問題硏究所 2002 環境硏報 Vol.12 No.1

        Bromate is a chemical oxidizing agent that has been used in analytical chemistry, in four milling, in beer malting, in cheese making, as a component of home and salon permanent hair-wave kits. In this study the objective was to investigate the effects of testis toxicity due to bromate in rats. On the biological study, the body weight changes, bromate(0, 0.1, 0.2, 0.4g/L) treated group showed decreased in the body weight and testis compared to the normal group. But kidney weight was increased. Hepatic and spleen weight were not effected compared to the normal group. Lipid peroxide content in the testis was increased by bromate which was concentrated 0.4g/L for 24 weeks. Testis cytosolic enzyme system(xanthine oxidase, aldehyde oxidase) of bromate group were significantly increased in comparison with those of normal group and microsomal enzyme system were not effected. And blood testosterone concentration was significantly decreased in comparison with those of group given bromate.

      • 에러패턴 학습과 후처리 모듈을 이용한 연속 음성 인식의 성능향상

        김용현(YongHyon Kim),정민화(Minhwa Chung) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.1B

        연속 음성 인식을 하는 경우에 많은 에러가 발생한다. 특히 기능어의 경우나 서술어의 경우에는 동시 조음 현상에 의한 음운 변화에 의해 빈번한 에러가 발생한다. 이러한 빈번한 에러를 수정하기 위한 방법에는 언어 모델의 개선과 음향 모델의 개선등을 통한 인식을 향상과 여러 단계의 인식과정을 두어 서로 다른 언어 모델을 적용하는 등의 방법이 있지만 모두 시간과 비용이 많이 들고 각각의 상황에 의존적인 단점이 있다. 따라서 본 논문에서 제안하는 방법은 이것을 수정하기 위해 음성 인식기로부터 인식되어 나온 결과 문장을 정답과 비교, 학습함으로써 빈번하게 발생하는 에러 패턴을 통계적 방법에 의해 학습하고 후처리 모듈을 이용하여 인식시에 발생하는 에러를 적은 비용과 시간으로 수정할 수 있도록 하는 것이다. 실험은 3000 단어급의 한국어 낭독체 연속 음성을 대상으로 하여 형태소와 의사 형태소를 각각 인식단위로 하고, 언어모델로 Word bigram과 Tagged word bigram을 각각 적용 실험을 하였다. 형태소, 의사 형태소인 경우 모두 언어 모델을 tagged word bigram을 사용하였음 경우 N best 후보 문장 중 적당한 단어 후보의 분포로 각각 1 best 문장에 비해 12%, 18% 정도의 에러 수정하여 문장 인식을 향상에 상당한 기여를 하였다.

      • 대화체 연속음성인식을 위한 발음열 학습

        차선화(Sunhwa Cha),정민화(Minhwa Chung) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.1B

        본 논문에서는 자연스러운 대화체 음성 데이터의 특성을 발음사전에 반영하여 전체적인 음성 인식률을 향상 시키기 위해 학습을 기반으로 한 발음열 생성법을 제안하였다. 신경망을 이용하여 표준 발음열과 실제 발화 발음열을 학습하여 발음 사전에 반영할 최적의 발음열을 얻었다. 각 발음열 종류별로, 표준 1-best발음열 사전, 표준 발음 + 수의적 발음사전, 신경망 1-best 발음사전, 신경망 3-best 발음사전을 구성하여, 인식실험을 수행하였다. 실험 결과 신경망 1-best발음사전이 표준 1-best발음사전보다 약 45의 인식률 향상을 보였다. 신경망 3-best발음사전을 인식했을 경우에는 신경망 1-best발음사전보다 약 1%의 향상을 보여 전체적으로 가장 좋은 성능을 보였다. 본 논문에서는 대화체 음성인식을 위한 발음사전의 발음열 학습의 유용성을 확인하였다.

      • 기능어용 음소 모델을 적용한 한국어 연속음성 인식

        명주현(JooHyun Myung),정민화(Minhwa Chung) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.1B

        의사형태소를 디코딩 단위로 하는 한국어 연속 음성 인식에서는 조사, 어미, 접사 및 짧은 용언의 어간등의 단어가 상당수의 인식 오류를 발생시킨다. 이러한 단어들은 발화 지속시간이 매우 짧고 생략이 빈번하며 결합되는 다른 형태소의 형태에 따라서 매우 심한 발음상의 변이를 보인다. 본 논문에서는 이러한 단어들을 한국어 기능어라 정의하고 실제 의사 형태소 단위의 인식 실험을 통하여 기능어 집합1, 2를 규정하였다. 그리고 한국어 기능어에 기능어용 음소를 독립적으로 적용하는 방법을 제안했다. 또한 기능어용 음소가 분리되어 생기는 음향학적 변이들을 처리하기 위해 Gaussian Mixture 수를 증가시켜 보다 견고한 학습을 수행했고, 기능어들의 음향 모델 스코어가 높아짐에 따른 인식에서의 삽입 오류 증가를 낮추기 위해 언어 모델에 fixed penalty를 부여하였다. 기능어 집합1에 대한 음소 모델을 적용한 경우 전체 문장 인식률은 0.8% 향상되었고 기능어 집합2에 대한 기능어 음소 모델을 적용하였을 때 전체 문장 인식률은 1.4% 증가하였다. 위의 실험 결과를 통하여 한국어 기능어에 대해 새로운 음소를 적용하여 독립적으로 학습하여 인식을 수행하는 것이 효과적임을 확인하였다.

      • KCI등재

        조음자질을 이용한 한국인 학습자의 영어 발화 자동 발음 평가

        류혁수(Ryu, Hyuksu),정민화(Chung, Minhwa) 한국음성학회 2016 말소리와 음성과학 Vol.8 No.4

        This paper aims to propose articulatory features as novel predictors for automatic pronunciation assessment of English produced by Korean learners. Based on the distinctive feature theory, where phonemes are represented as a set of articulatory/phonetic properties, we propose articulatory Goodness-Of-Pronunciation(aGOP) features in terms of the corresponding articulatory attributes, such as nasal, sonorant, anterior, etc. An English speech corpus spoken by Korean learners is used in the assessment modeling. In our system, learners’ speech is forced aligned and recognized by using the acoustic and pronunciation models derived from the WSJ corpus (native North American speech) and the CMU pronouncing dictionary, respectively. In order to compute aGOP features, articulatory models are trained for the corresponding articulatory attributes. In addition to the proposed features, various features which are divided into four categories such as RATE, SEGMENT, SILENCE, and GOP are applied as a baseline. In order to enhance the assessment modeling performance and investigate the weights of the salient features, relevant features are extracted by using Best Subset Selection(BSS). The results show that the proposed model using aGOP features outperform the baseline. In addition, analysis of relevant features extracted by BSS reveals that the selected aGOP features represent the salient variations of Korean learners of English. The results are expected to be effective for automatic pronunciation error detection, as well.

      • KCI등재

        음성인식 기반 응급상황관제

        이규환(Lee, Kyuwhan),정지오(Chung, Jio),신대진(Shin, Daejin),정민화(Chung, Minhwa),강경희(Kang, Kyunghee),장윤희(Jang, Yunhee),장경호(Jang, Kyungho) 한국음성학회 2016 말소리와 음성과학 Vol.8 No.2

        In emergency dispatching at 119 Command & Dispatch Center, some inconsistencies between the ‘standard emergency aid system’ and ‘dispatch protocol,’ which are both mandatory to follow, cause inefficiency in the dispatcher’s performance. If an emergency dispatch system uses automatic speech recognition (ASR) to process the dispatcher’s protocol speech during the case registration, it instantly extracts and provides the required information specified in the "standard emergency aid system,’ making the rescue command more efficient. For this purpose, we have developed a Korean large vocabulary continuous speech recognition system for 400,000 words to be used for the emergency dispatch system. The 400,000 words include vocabulary from news, SNS, blogs and emergency rescue domains. Acoustic model is constructed by using 1,300 hours of telephone call (8 kHz) speech, whereas language model is constructed by using 13 GB text corpus. From the transcribed corpus of 6,600 real telephone calls, call logs with emergency rescue command class and identified major symptom are extracted in connection with the rescue activity log and National Emergency Department Information System (NEDIS). ASR is applied to emergency dispatcher’s repetition utterances about the patient information. Based on the Levenshtein distance between the ASR result and the template information, the emergency patient information is extracted. Experimental results show that 9.15% Word Error Rate of the speech recognition performance and 95.8% of emergency response detection performance are obtained for the emergency dispatch system.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼