http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
한국어 연속음성인식 시스템 구현을 위한 형태소 단위의 발음 변화 모델링
정민화,이경님,Chung Minhwa,Lee Kyong-Nim 대한음성학회 2004 말소리 Vol.49 No.-
In this paper, we describe a cross-morpheme pronunciation variation model which is especially useful for constructing morpheme-based pronunciation lexicon to improve the performance of a Korean LVCSR. There are a lot of pronunciation variations occurring at morpheme boundaries in continuous speech. Since phonemic context together with morphological category and morpheme boundary information affect Korean pronunciation variations, we have distinguished phonological rules that can be applied to phonemes in within-morpheme and cross-morpheme. The results of 33K-morpheme Korean CSR experiments show that an absolute reduction of 1.45% in WER from the baseline performance of 18.42% WER was achieved by modeling proposed pronunciation variations with a possible multiple context-dependent pronunciation lexicon.
오존처리에 의한 Bromate의 생성이 고환독성에 미치는 영향
이무강,정운용,정민화,한갑이,조희숙,최종원 慶星大學校 環境問題硏究所 2002 環境硏報 Vol.12 No.1
Bromate is a chemical oxidizing agent that has been used in analytical chemistry, in four milling, in beer malting, in cheese making, as a component of home and salon permanent hair-wave kits. In this study the objective was to investigate the effects of testis toxicity due to bromate in rats. On the biological study, the body weight changes, bromate(0, 0.1, 0.2, 0.4g/L) treated group showed decreased in the body weight and testis compared to the normal group. But kidney weight was increased. Hepatic and spleen weight were not effected compared to the normal group. Lipid peroxide content in the testis was increased by bromate which was concentrated 0.4g/L for 24 weeks. Testis cytosolic enzyme system(xanthine oxidase, aldehyde oxidase) of bromate group were significantly increased in comparison with those of normal group and microsomal enzyme system were not effected. And blood testosterone concentration was significantly decreased in comparison with those of group given bromate.
대어휘 연속음성인식을 위한 서브네트워크 기반의 1-패스 세미다이나믹 네트워크 디코딩
정민화,안동훈,Chung Minhwa,Ahn Dong-Hoon 대한음성학회 2004 말소리 Vol.50 No.-
In this paper, we present a one-pass semi-dynamic network decoding framework that inherits both advantages of fast decoding speed from static network decoders and memory efficiency from dynamic network decoders. Our method is based on the novel language model network representation that is essentially of finite state machine (FSM). The static network derived from the language model network [1][2] is partitioned into smaller subnetworks which are static by nature or self-structured. The whole network is dynamically managed so that those subnetworks required for decoding are cached in memory. The network is near-minimized by applying the tail-sharing algorithm. Our decoder is evaluated on the 25k-word Korean broadcast news transcription task. In case of the search network itself, the network is reduced by 73.4% from the tail-sharing algorithm. Compared with the equivalent static network decoder, the semi-dynamic network decoder has increased at most 6% in decoding time while it can be flexibly adapted to the various memory configurations, giving the minimal usage of 37.6% of the complete network size.
명주현(JooHyun Myung),정민화(Minhwa Chung) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.1B
의사형태소를 디코딩 단위로 하는 한국어 연속 음성 인식에서는 조사, 어미, 접사 및 짧은 용언의 어간등의 단어가 상당수의 인식 오류를 발생시킨다. 이러한 단어들은 발화 지속시간이 매우 짧고 생략이 빈번하며 결합되는 다른 형태소의 형태에 따라서 매우 심한 발음상의 변이를 보인다. 본 논문에서는 이러한 단어들을 한국어 기능어라 정의하고 실제 의사 형태소 단위의 인식 실험을 통하여 기능어 집합1, 2를 규정하였다. 그리고 한국어 기능어에 기능어용 음소를 독립적으로 적용하는 방법을 제안했다. 또한 기능어용 음소가 분리되어 생기는 음향학적 변이들을 처리하기 위해 Gaussian Mixture 수를 증가시켜 보다 견고한 학습을 수행했고, 기능어들의 음향 모델 스코어가 높아짐에 따른 인식에서의 삽입 오류 증가를 낮추기 위해 언어 모델에 fixed penalty를 부여하였다. 기능어 집합1에 대한 음소 모델을 적용한 경우 전체 문장 인식률은 0.8% 향상되었고 기능어 집합2에 대한 기능어 음소 모델을 적용하였을 때 전체 문장 인식률은 1.4% 증가하였다. 위의 실험 결과를 통하여 한국어 기능어에 대해 새로운 음소를 적용하여 독립적으로 학습하여 인식을 수행하는 것이 효과적임을 확인하였다.
Analyzing vowel variation in Korean dialects using phone recognition
Jooyoung Lee,Sunhee Kim,Minhwa Chung 한국음성학회 2023 말소리와 음성과학 Vol.15 No.4
This study aims to propose an automatic method of detecting vowel variation in the Korean dialects of Gyeong-sang and Jeol-la. The method is based on error patterns extracted using phone recognition. Canonical and recognized phone sequences are compared, and statistical analyses distinguish the vowels appearing in both dialects, the dialect-common vowels, and the vowels with high mismatch rates for each dialect. The dialect-common vowels show monophthongization of diphthongs. The vowels unique to the dialects are /we/ to [e] and /ʌ/ to [ɯ] for Gyeong-sang dialect, and /ɰi/ to [ɯ] in Jeol-la dialect. These results corroborate previous dialectology reports regarding phonetic realization of the Korean dialects. The current method provides a possibility of automatic explanation of the dialect patterns.
음운 변화 역추적 규칙을 적용한 한국어 음성 언어 형태소 분석 모델
장영성(Youngsung Jang),정민화(Minhwa Chung) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.1B
본 논문에서는 한국어 자연어 처리의 기본이 되는 형태소 분석 단계에서 한국어 음성 신호 처리와 자연어 처리를 연결시켜 주기 위해 음운 변화 역추적 규칙, 트라이 인덱스 사전, 접속 정보표, CYK알고리즘을 이용한 형태소 분석 등으로 구성되어 있는 한국어 음성 언어 형태소 분석 모델을 제안한다. 음운 변화 역추적 규칙은 음성 인식의 결과인 음소 격자를 입력으로 받아 음운 변화가 일어나기 전의 원형을 추적하여 확장된 음소 격자를 생성한다. 접속 정보표는 한 어절 내에서의 형태소들 사이의 접속 제약뿐만 아니라 어절 사이에서의 형태소들 간의 접속 제약까지 고려한다. CYK 알고리즘을 이용한 형태소 분석의 첫 단계는 트라이 인덱스로 구성되어 있는 사전으로부터 형태소를 찾아 차트에 기록하는 것이며, 이 과정에서 불규칙 처리 규칙이 적용된다. 그리고 나서, 차트에 기록된 형태소들 간의 접속 정보를 이용하여 모든 가능한 형태소 분석 결과를 생성한다. 그리고, 모든 가능한 형태소 분석 결과들에 대한 형태적 모호성을 축소하는 방안으로 사용되는 통계 모델을 음성 인식의 결과로부터 얻어진 정보까지 포함함으로써 음성 인식에서의 오인식으로 인한 오류를 완화시키도록 확장하였다.
이규환(Lee, Kyuwhan),정지오(Chung, Jio),신대진(Shin, Daejin),정민화(Chung, Minhwa),강경희(Kang, Kyunghee),장윤희(Jang, Yunhee),장경호(Jang, Kyungho) 한국음성학회 2016 말소리와 음성과학 Vol.8 No.2
In emergency dispatching at 119 Command & Dispatch Center, some inconsistencies between the ‘standard emergency aid system’ and ‘dispatch protocol,’ which are both mandatory to follow, cause inefficiency in the dispatcher’s performance. If an emergency dispatch system uses automatic speech recognition (ASR) to process the dispatcher’s protocol speech during the case registration, it instantly extracts and provides the required information specified in the "standard emergency aid system,’ making the rescue command more efficient. For this purpose, we have developed a Korean large vocabulary continuous speech recognition system for 400,000 words to be used for the emergency dispatch system. The 400,000 words include vocabulary from news, SNS, blogs and emergency rescue domains. Acoustic model is constructed by using 1,300 hours of telephone call (8 kHz) speech, whereas language model is constructed by using 13 GB text corpus. From the transcribed corpus of 6,600 real telephone calls, call logs with emergency rescue command class and identified major symptom are extracted in connection with the rescue activity log and National Emergency Department Information System (NEDIS). ASR is applied to emergency dispatcher’s repetition utterances about the patient information. Based on the Levenshtein distance between the ASR result and the template information, the emergency patient information is extracted. Experimental results show that 9.15% Word Error Rate of the speech recognition performance and 95.8% of emergency response detection performance are obtained for the emergency dispatch system.
조음자질을 이용한 한국인 학습자의 영어 발화 자동 발음 평가
류혁수(Ryu, Hyuksu),정민화(Chung, Minhwa) 한국음성학회 2016 말소리와 음성과학 Vol.8 No.4
This paper aims to propose articulatory features as novel predictors for automatic pronunciation assessment of English produced by Korean learners. Based on the distinctive feature theory, where phonemes are represented as a set of articulatory/phonetic properties, we propose articulatory Goodness-Of-Pronunciation(aGOP) features in terms of the corresponding articulatory attributes, such as nasal, sonorant, anterior, etc. An English speech corpus spoken by Korean learners is used in the assessment modeling. In our system, learners’ speech is forced aligned and recognized by using the acoustic and pronunciation models derived from the WSJ corpus (native North American speech) and the CMU pronouncing dictionary, respectively. In order to compute aGOP features, articulatory models are trained for the corresponding articulatory attributes. In addition to the proposed features, various features which are divided into four categories such as RATE, SEGMENT, SILENCE, and GOP are applied as a baseline. In order to enhance the assessment modeling performance and investigate the weights of the salient features, relevant features are extracted by using Best Subset Selection(BSS). The results show that the proposed model using aGOP features outperform the baseline. In addition, analysis of relevant features extracted by BSS reveals that the selected aGOP features represent the salient variations of Korean learners of English. The results are expected to be effective for automatic pronunciation error detection, as well.
에러패턴 학습과 후처리 모듈을 이용한 연속 음성 인식의 성능향상
김용현(YongHyon Kim),정민화(Minhwa Chung) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.1B
연속 음성 인식을 하는 경우에 많은 에러가 발생한다. 특히 기능어의 경우나 서술어의 경우에는 동시 조음 현상에 의한 음운 변화에 의해 빈번한 에러가 발생한다. 이러한 빈번한 에러를 수정하기 위한 방법에는 언어 모델의 개선과 음향 모델의 개선등을 통한 인식을 향상과 여러 단계의 인식과정을 두어 서로 다른 언어 모델을 적용하는 등의 방법이 있지만 모두 시간과 비용이 많이 들고 각각의 상황에 의존적인 단점이 있다. 따라서 본 논문에서 제안하는 방법은 이것을 수정하기 위해 음성 인식기로부터 인식되어 나온 결과 문장을 정답과 비교, 학습함으로써 빈번하게 발생하는 에러 패턴을 통계적 방법에 의해 학습하고 후처리 모듈을 이용하여 인식시에 발생하는 에러를 적은 비용과 시간으로 수정할 수 있도록 하는 것이다. 실험은 3000 단어급의 한국어 낭독체 연속 음성을 대상으로 하여 형태소와 의사 형태소를 각각 인식단위로 하고, 언어모델로 Word bigram과 Tagged word bigram을 각각 적용 실험을 하였다. 형태소, 의사 형태소인 경우 모두 언어 모델을 tagged word bigram을 사용하였음 경우 N best 후보 문장 중 적당한 단어 후보의 분포로 각각 1 best 문장에 비해 12%, 18% 정도의 에러 수정하여 문장 인식을 향상에 상당한 기여를 하였다.