http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
황명권(Myunggwon Hwang),최동진(Dongjin Choi),이효갑(Hyogap Lee),최창(Chang Choi),고병규(Byeongkyu Ko),김판구(Pankoo Kim) 한국정보과학회 2010 한국정보과학회 학술발표논문집 Vol.37 No.2C
본 연구는 구글에서 제공하는 n-gram 정보들의 규모가 너무 방대하여 어플리케이션에서 사용하기 어려운 점을 극복하기 위한 방법을 제공하고 있다. 이를 위해 사용자가 관심을 갖는 특정 도메인에 해당하는 n-gram을 형성하는 방법을 제안하고 있으며, 형성된 데이터의 실효성을 평가하기 위해 텍스트 에디터에 반영하였다. 또한 사람의 타이핑 속도에 따라 얻을 수 있는 효과를 다양하게 평가하고 있으며, 이를 기존에 수행된 연구와 비교함으로써 그 성능을 분석하고 있다. 본 논문에서는 단순히 타이핑에 적용한 결과만을 포함하지만, n-gram 데이터의 활용범위가 넓은 점을 고려할 때, 본 연구는 n-gram 데이터의 실효성을 미리 예측해 볼 수 있다는 점에서 큰 의미를 갖는다.
황명권 ( Myunggwon Hwang ),정도헌,성원경 ( Do-heon Jeong ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.2
자연어 처리에서 큰 걸림돌 중의 하나는 용어의 표현 다양성이라 할 수 있다. 용어들은 시제, 단수/복수 형태, 경우에 따라서는 동일한 의미의 다른 용어로 대체되어 사용될 수 있으며, 이러한 용어의 사용은 동일한 의미를 다르게 해석하는 원인이 되기도 한다. 이에 본 연구에서는 다양한 형태의 용어들을 하나의 표준화된 형태로 정규화 하는 방법을 제안한다.
위키피디아 카테고리 유사도와 부트스트래핑 기법을 이용한 전문용어 정제
황명권(Myunggwon Hwang),정도헌(Do-Heon Jeong),이승우(Seungwoo Lee),정한민(Hanmin Jung),성원경(Won-Kyung Sung) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.2C
본 연구는 대용량의 문서집합에서 추출한 전문용어 후보군들의 정제 방법을 다룬다. 유용한 정보를 효과적으로 추출하기 위한 텍스트 마이닝의 목표가 이제는 전문가 또는 일반인들의 삶에 직접적으로 영향을 줄 수 있는 방향으로 흐름이 바뀌어 가고 있다. 기술 기회 발굴(Technology Opportunity Discovery) 연구 또한 이를 위한 것으로 시대의 흐름에 따른 전문용어의 생명주기 파악 그리고 그들 사이의 관계를 추출하기 위한 것에 집중하고 있다. 이러한 목표들을 성공적으로 달성하기 위해 잘 정제된 전문용어의 추출이 가장 우선시 되어야 하며 본 연구에서는 이를 위해 위키피디아의 카테고리 유사도 측정 방법에 기반한 부트스트래핑 방법을 제안한다. 측정된 카테고리 유사도를 전문용어의 정제에 적용함으로써 본 연구의 가능성을 도출한다.
황명권(Myunggwon Hwang),정유나(Yuna Jeong),성원경(Wonkyung Sung) Korean Institute of Information Scientists and Eng 2020 정보과학회논문지 Vol.47 No.12
This paper presents a data selection method that has a positive effect on learning for an efficient human-in-the-loop (HITL) process required for automated and intelligent artificial intelligence (AI) development. Our method first maps the training data onto a 2D distribution based on similarity, and then grids are laid out with a fixed ratio. By applying Least Slack Time Rate first (LSTRf) techniques, the data are selected based on the distribution consistency of the same class data within each grid. The finally selected data are used as convolutional neural network (CNN)-based classifiers to evaluate the performance. We carried out experiments on the CIFAR-10 dataset, and evaluated the effect of grid size and the number of data selected in one operation. The selected training data were compared to randomly selected data of the same size. The results verified that the smaller the grid size (0.008 and 0.005) and the greater the number selected in the single operation, the better the learning performance.
도메인 용어의 시맨틱 네트워크 자동구축을 위한 WSD 방법
황명권(Myunggwon Hwang),윤병수(Byungsu Youn),김판구(Pankoo Kim) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.1
의미적 정보처리를 위해 지식베이스가 다양하게 활용되고 있다. 그중 가장 활용도가 높은 지식베이스는 워드넷이라 할 수 있다. 하지만, 기존 연구에서 워드넷이 실세계에서 활용되고 있는 많은 개념 또는 개념관계쌍을 정의하지 않음을 확인하였다. 이에, 본 논문은 도메인 문서집합에서 워드넷에 정의되지 않은 도메인 용어들을 추출하고 그들의 시맨틱 네트워크를 자동구축하는 방법을 기술한다. 시맨틱 네트워크의 자동구성은 여러 가지 방법들로 구성되는데, 그중 도메인 용어와 관계가 깊은 단어들을 추출 및 그 단어들의 정확한 의미파악이 선행되어야 한다. 이에, 본 논문에서는 도메인 용어의 시맨틱 네트워크를 자동구축 하기 위해 WSD 방법을 제안한다.
황명권(Myunggwon Hwang),공현장(Hyunjang Kong),정관호(Kwanho Jung),김판구(Pankoo Kim) 한국정보과학회 2005 한국정보과학회 학술발표논문집 Vol.32 No.2
본 논문은 웹에 산재되어 있는 OWL/RDF(S) 도메인 온톨로지에 대한 검색 시스템을 설계하여, 온톨로지의 재사용성을 극대화 하는데 그 목적이 있다. 컴퓨터와 인간이 정보를 공유하고, 의미적인 상호작용을 위한 시맨틱 웹에 대한 연구가 활발이 진행되고 있다. 시맨틱 웹을 실현하기 위해 개념들의 정의와 개념들간의 관계를 형성하는 온톨로지의 구축이 필수요소가 됨에 따라 온톨로지를 구축하기 위해 OWL, RDF(S) 그리고 DAML+OIL 등의 많은 온톨로지 언어가 개발되었고, 이들 언어를 기반으로 하는 Protege, OILEd와 KAON 등의 사용자들에게 온톨로지 구축의 편리성을 제공하는 온톨로지 구축 도구들도 50여가지 이상 개발되었다. 이러한 이유로 많은 온톨로지들이 개발되고 있다. 그렇지만 온톨로지의 가장 큰 특징은 동일 도메인의 온톨로지의 재사용인데, 산재되어 있는 온톨로지들을 검색하기 어렵고, 이들을 한데 모아놓은 저장소 또한 갖추어지지 않아 동일한 도메인 온톨로지가 존재할지라도 새롭게 온톨로지를 구축해야한다. 이에 본 논문에서는 웹상에 존재하는 온톨로지들의 검색을 용이하게 하여 지식 정보의 재사용을 최대화하기 위하여 본 연구를 진행하고 시스템을 설계하였다.
황명권(Myunggwon Hwang),김판구(Pankoo Kim) 한국정보기술학회 2009 한국정보기술학회논문지 Vol.7 No.5
This paper contains the enrichment method on semantic relation network of WordNet which is a fundamental for semantic information processing. The WordNet constructively defines the relations among the concepts so that it is utilized in various fields. However, it is grasped that several real-world relations are omitted. In order to minimize this semantic gap, we propose the enrichment method which extracts noun types from the glossaries in the WordNet, assigns the exact sense to glossary noun, and constructs relation between the glossary noun and its owner concept. For the performance evaluation, we apply the enriched WordNet to WSD-SemNet algorithm, try to disambiguate Senseval-3 Gloss, and compare the result with other enrichment methods.