http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
도메인 특화 방법에 의한 영한 특허 자동 번역 시스템의 구축
최승권(Sung-Kwon Choi),권오욱(Oh-Woog Kwon),이기영(Ki-Young Lee),노윤형(Yoon-Hyung Roh),박상규(Sang-Kyu Park) 한국정보과학회 2007 정보과학회논문지 : 소프트웨어 및 응용 Vol.34 No.2
This paper describes an English-to-Korean automatic translation system for patent documents which is constructed by a method customizing from a general domain to a specific domain. The customizing method consists of following steps: 1) linguistically studying about characteristics of patent documents, 2) extracting unknown words from large patent documents and terminologically constructing, 3) customizing the target language words of existing terms, 4) extracting and constructing patent translation patterns peculiar to patent documents, 5) customizing existingtranslation engine modules according to linguistic study about characteristics of patent documents, 6) evaluation of automatic translation results. The English-to-Korean patent machine translation system implemented by these customization steps shows a translation accuracy of 81.03% and is improving. 본 논문은 웹과 같은 일반적인 도메인의 영한 자동 번역기를 특정 도메인으로 특화하는 방법에 의해 구축된 영한 특허 자동번역 시스템을 기술하는 것을 목표로 한다. 특정 도메인으로서의 특허 자동번역기를 위한 특화 방법은 다음과 같은 단계로 이루어진다: 1) 대용량 특허 문서의 수집 및 언어학적 특성 분석, 2) 전문용어 추출 및 대역어 구축, 3) 기보유한 용어의 대역어 특화, 4) 특허 고유의 번역 패턴추출 및 구축, 5) 언어학적 특성 분석에 따른 기보유 번역 엔진 모듈의 특화 및 개선, 6) 특화된 번역 지식 및 번역 엔진 모듈에 따른 번역률 평가. 이와 같은 특화 절차에 따른 특허 영한 자동 번역기는 특허 전문번역가의 평가에 의해 전분야 평균 81.03%의 번역률을 내었으며, 분야별로는 기계(80.54%), 전기전자(81.58%), 화학일반(79.92%), 의료위생(80.79%), 컴퓨터(82.29%)의 성능을 보였으며 계속 개선 중에 있다.
패턴기반 영한 자동번역 시스템의 상용화를 위한 도메인 특화 방법
최승권(Sung-Kwon Choi),이기영(Ki-Young Lee),노윤형(Yoon-Hyung Roh),권오욱(Oh-Woog Kwon),김영길(Young-Gil Kim) 한국정보과학회 2012 정보과학회논문지 : 소프트웨어 및 응용 Vol.39 No.4
본 논문은 한국전자통신연구원 언어처리연구팀에서 2004년까지 개발하였던 웹문서 자동번역시스템을 2006년부터 매년 도메인별로 상용화에 성공한 사례를 기술한 것이다. 상용화가 가능하였던 주요 요인 중 하나인 도메인 특화 방법을 소개하며 이 도메인 특화 방법이 시기별로 개선되어 진화되는 모습을 기술한다. 즉 2004년의 웹문서 영한 자동번역기를 2006년에 특허문서 영한 자동번역기로 특화할 때 사용한 도메인 특화 방법이 '초기 도메인 특화 방법'이라 할 수 있는데, 이 초기의 도메인 특화 방법에 번역지식 및 번역엔진 모듈의 반자동 튜닝 방법과 자동화된 평가 방법을 추가하여 2007년에 '개선된 도메인 특화 방법'을 개발하였다. 이 '개선된 도메인 특화 방법'은 2007년에 특허문서 영한 자동번역기를 기술논문 영한 자동번역기로, 2008년에 기술논문 영한 자동번역기를 IT웹신문 영한 자동번역기로, 2009년에 IT 웹신문 영한 자동번역기를 전자우편 및 기업문서 영한 자동번역기로, 그리고 2010년에 전자우편 영한 자동번역기를 메신저 영한 자동번역기로 구현할 때 사용하였으며 그 효과는 신규 도메인용 영한 번역기를 개발하는 기간을 점차적으로 줄이게 하였으며 구현 프로세스에 일관성을 제공하였다. This paper is to describe the success case that NLP Research Team, ETRI could commercialize the domain-specific machine translation systems every year since 2006. One of the main factors to enable the commercialization was the customization method which adapts an existing system to new domain. The goal of this paper is to introduce the customization method in detail and show how the customization method has evolved according to domains. For this, we will first describe the pure customization method used to adapt an English-Korean Web MT system in 2004 to an English-Korean patent MT system in 2006. Then we will discuss the upgraded customization method that semi-automatic construction of translation knowledge, semi-automatic tuning of translation engine modules, and automatic evaluation were added to the pure customization method. This upgraded customization method could make the following commercialization possible: machine translation system for scientific paper translation in 2007, machine translation system for IT web news translation in 2008, machine translation system for business documents translation in 2009, and machine translation system for messenger translation in 2010.
최승권 ( Sung-kwon Choi ),권오욱 ( Oh-woog Kwon ),노윤형 ( Yoon-hyung Roh ),이기영 ( Ki-young Lee ),김영길 ( Young-gil Kim ) 한국정보처리학회 2012 한국정보처리학회 학술대회논문집 Vol.19 No.2
본 논문은 한국전자통신연구원(ETRI)에서 2010 년부터 2015 년까지 5 년간에 걸쳐 개발 예정인 영어 교육용 대화 시스템 중 2011 년에 개발된 관광용 영어 교육용 대화 시스템 중 도시 관광 도메인을 대상으로 한 도시 관광용 영어 대화 시스템을 소개하는 것을 목표로 한다. 도시 관광용 영어대화 시스템은 크게 대화 이해 모듈, 대화 관리 모듈, 대화 생성 모듈, 대화 모델링 구축/관리 모듈, 대화 지식 구축 도구로 구성된다. 도시 관광용 영어 대화 시스템 평가를 위해 평가자를 초급, 중급, 고급의 3 개 그룹으로 나누어 평가를 실시하였다. 평가자는 원격 웹 평가 도구에 접속하여 4 개의 대화 미션에 대해 영어로 대화 시스템과 대화를 실시하였으며 평가는 태스크 성공률로 측정되었다. 태스크 성공률은 82.5%로 측정되었다.
최승권(Sung-Kwon Choi),권오욱(Oh-Woog Kwon),이기영(Ki-Young Lee),노윤형(Yoon-Hyung Roh),박상규(Sang-Kyu Park) 한국정보과학회 언어공학연구회 2006 한국정보과학회 언어공학연구회 학술발표 논문집 Vol.2006 No.10
본 논문에서는 웹과 같은 일반적인 도메인의 영한 자동번역기를 특허용 영한 자동번역기로 특화하는 방법에 대해 기술한다. 특허용 영한 자동번역기로의 특화는 다음과 같은 절차에 의해 이루어진다: 1) 대용량 특허 문서에 대한 언어학적 특성 분석, 2) 대용량 특허문서 대상 전문용어 추출 및 대역어 구축, 3) 기존 번역사전 대역어의 특화, 4) 특허문서 고유의 번역 패턴 추출 및 구축, 5) 언어학적 특성 분석에 따른 번역 엔진 모듈의 특화 및 개선, 6) 특화된 번역 지식 및 번역 엔진 모듈에 따른 번역률 평가. 이와 같은 절차에 의해 만들어진 특허 영한 자동번역기는 특허 전문번역가의 평가에 의해 전분야 평균 81.03%의 번역률을 내었으며, 분야별로는 기계분야(80.54%). 전기전자분야(81.58%), 화학일반분야(79.92%), 의료위생분야(80.79%), 컴퓨터분야(82.29%)의 성능을 보였으며 계속 개선 중에 있다. 현재 본 논문에서 기술된 영한 특허 자동번역 시스템은 산업자원부의 특허지원센터에서 변리사 및 특허 심사관이 영어 전기전자분야 특허 문서를 검색할 때 한국어 번역 서비스를 제공받도록 이용되고 있으며( http://www.ipac.co.kr), 2007년에는 전분야 특허문서에 대한 영한 자동번역 서비스를 제공할 예정이다.
최승권 ( Sung-kwon Choi ),권오욱 ( Oh-woog Kwon ),황금하 ( Jin-xia Huang ),노윤형 ( Yoon-hyung Roh ),이기영 ( Ki-young Lee ),김영길 ( Young-gil Kim ) 한국정보처리학회 2013 한국정보처리학회 학술대회논문집 Vol.20 No.1
한국전자통신연구원(ETRI)에서는 2010 년부터 2015 년까지 5 년간에 걸쳐 모바일 플랫폼 기반 대화모델이 적용된 자연어 음성인터페이스 기술을 개발하고 있다. 2010 년에는 대화 시스템의 전반적인 모습을 설계하였고, 2011 년에는 대상 도메인으로 도시 관광용 영어 대화 시스템을, 2012 년에는 대상 도메인으로 차량공조, 응급조치 등과 같은 차량 정보 서비스용 한국어 대화 시스템을 개발하였다. 본 논문에서는 2012 년에 개발한 차량 정보 서비스용 한국어 대화 시스템을 기술하는 것을 목표로 한다. 차량 정보 서비스용 한국어 대화 시스템의 성능 평가는 운전 경험이 있는 평가자 20 명에 의해 이루어졌다. 평가자는 웹 평가 도구에 원격으로 접속하여 주어진 40 개의 차량 정보 관련대화 미션을 태스크로 하여 차량 정보 서비스용 대화 시스템과 대화를 하였다. 평가는 태스크 성공률과 대화턴 성공률로 나누어 측정되었으며 태스크 성공률은 87.8%, 대화턴 성공률은 86.7%였다.
최승권 ( Sung-kwon Choi ),권오욱 ( Oh-woog Kwon ),이기영 ( Kiyoung Lee ),노윤형 ( Yoon-hyung Roh ),황금하 ( Jin-xia Huang ),김영길 ( Young-gil Kim ) 한국정보처리학회 2017 한국정보처리학회 학술대회논문집 Vol.24 No.1
본 논문은 챗봇과 대화시스템을 이용한 영어 교육 시스템을 기술하는 것을 목표로 한다. 본 논문의 시스템은 학습자의 대화 흐름을 제한하지 않고 주제를 벗어난 자유대화를 허용하며 문법오류에 대한 피드백을 한다. 챗봇과 대화시스템을 이용한 영어 교육 시스템은 대화턴 성공률로 평가되었는데, 평균 대화턴 성공률은 80.86%였으며, 주제별로는 1) 뉴욕시티투어 티켓 구매 71.86%, 2) 음식주문 71.06%, 3) 건강습관 대화 85.41%, 4) 미래화폐에 대한 생각 조사 95.09%였다. 또한 영어 문법 오류 교정도 측정되었는데 문법 오류 정확률은 66.7%, 재현율은 31.9%였다.