http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
다차 마코프 한글 정보원을 이용한 오류 문자의 정정 방안
김인대(Indae Kim),이균하(Kyoonha Lee) 한국정보과학회 1993 한국정보과학회 학술발표논문집 Vol.20 No.1
문서 인식기는 궁극적으로 필기체나 인쇄체에 상관없이 모든 문서를 인식할 수 있어야 한다. 그러나 기계에 의한 문서 인식에는 한계가 있으며, 실제로 현재까지 연구되고 있는 문서 인식기들도 정도의 차이는 있지만 오인식 글자의 발생을 피하지는 못한다. 본 논문에서는 한글 문서 인식기에서 발생되는 이런 오인식 글자들을 정정하는 후처리 방법으로서 다차 마코프 한글 정보원을 활용하는 방법을 제안한다. 문서 인식기의 오인식률, 대상 문서의 정보량, 문서의 분야별 종류 등에 따라 오인식 글자의 정정률이 가변할 수 있지만, 임의의 오인식 패턴에 대해 전반적으로 60%~85% 정도의 성장률을 보였다.