http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
황명권(Myunggwon Hwang),최동진(Dongjin Choi),김판구(Pankoo Kim) 한국정보과학회 2010 한국정보과학회 학술발표논문집 Vol.37 No.1C
다양한 분야에 소속된 사람들이 사용하고 있는 개념들을 기존의 워드넷과 같은 지식베이스가 모두 포함하지 못한다는 한계점이 지적되었다. 본 연구에서는 이를 해결하기 위해 위키피디아 문서집합의 분석을 통하여 해결하고자 한다. 위키피디아는 현재 320만개 이상의 유/무형의 개체에 대한 상세한 설명을 포함하고 있으며, 현재도 해당 분야의 전문가들에 의해 지속적으로 제목(주제) 생성 및 내용 작성이 수행되고 있다. 이에, 위키피디아 문서는 지식베이스의 개념 확장을 위해 아주 유용한 자원이 될 수 있으며, 본 논문에서는 이러한 위키피디아 문서 제목의 개념화를 통해 기존의 지식베이스와 연결하는 의미적인 방법을 기술한다. 이를 이용한 간단한 실험을 통하여 본 연구가 우월한 가능성이 있음을 파악하였다.
황명권 ( Myunggwon Hwang ),정도헌,성원경 ( Do-heon Jeong ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.2
자연어 처리에서 큰 걸림돌 중의 하나는 용어의 표현 다양성이라 할 수 있다. 용어들은 시제, 단수/복수 형태, 경우에 따라서는 동일한 의미의 다른 용어로 대체되어 사용될 수 있으며, 이러한 용어의 사용은 동일한 의미를 다르게 해석하는 원인이 되기도 한다. 이에 본 연구에서는 다양한 형태의 용어들을 하나의 표준화된 형태로 정규화 하는 방법을 제안한다.
황명권(Myunggwon Hwang),최동진(Dongjin Choi),이효갑(Hyogap Lee),최창(Chang Choi),고병규(Byeongkyu Ko),김판구(Pankoo Kim) 한국정보과학회 2010 한국정보과학회 학술발표논문집 Vol.37 No.2C
본 연구는 구글에서 제공하는 n-gram 정보들의 규모가 너무 방대하여 어플리케이션에서 사용하기 어려운 점을 극복하기 위한 방법을 제공하고 있다. 이를 위해 사용자가 관심을 갖는 특정 도메인에 해당하는 n-gram을 형성하는 방법을 제안하고 있으며, 형성된 데이터의 실효성을 평가하기 위해 텍스트 에디터에 반영하였다. 또한 사람의 타이핑 속도에 따라 얻을 수 있는 효과를 다양하게 평가하고 있으며, 이를 기존에 수행된 연구와 비교함으로써 그 성능을 분석하고 있다. 본 논문에서는 단순히 타이핑에 적용한 결과만을 포함하지만, n-gram 데이터의 활용범위가 넓은 점을 고려할 때, 본 연구는 n-gram 데이터의 실효성을 미리 예측해 볼 수 있다는 점에서 큰 의미를 갖는다.
위키피디아 카테고리 유사도와 부트스트래핑 기법을 이용한 전문용어 정제
황명권(Myunggwon Hwang),정도헌(Do-Heon Jeong),이승우(Seungwoo Lee),정한민(Hanmin Jung),성원경(Won-Kyung Sung) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.2C
본 연구는 대용량의 문서집합에서 추출한 전문용어 후보군들의 정제 방법을 다룬다. 유용한 정보를 효과적으로 추출하기 위한 텍스트 마이닝의 목표가 이제는 전문가 또는 일반인들의 삶에 직접적으로 영향을 줄 수 있는 방향으로 흐름이 바뀌어 가고 있다. 기술 기회 발굴(Technology Opportunity Discovery) 연구 또한 이를 위한 것으로 시대의 흐름에 따른 전문용어의 생명주기 파악 그리고 그들 사이의 관계를 추출하기 위한 것에 집중하고 있다. 이러한 목표들을 성공적으로 달성하기 위해 잘 정제된 전문용어의 추출이 가장 우선시 되어야 하며 본 연구에서는 이를 위해 위키피디아의 카테고리 유사도 측정 방법에 기반한 부트스트래핑 방법을 제안한다. 측정된 카테고리 유사도를 전문용어의 정제에 적용함으로써 본 연구의 가능성을 도출한다.
황명권(Myunggwon Hwang),공현장(Hyunjang Kong),정관호(Kwanho Jung),김판구(Pankoo Kim) 한국정보과학회 2005 한국정보과학회 학술발표논문집 Vol.32 No.2
본 논문은 웹에 산재되어 있는 OWL/RDF(S) 도메인 온톨로지에 대한 검색 시스템을 설계하여, 온톨로지의 재사용성을 극대화 하는데 그 목적이 있다. 컴퓨터와 인간이 정보를 공유하고, 의미적인 상호작용을 위한 시맨틱 웹에 대한 연구가 활발이 진행되고 있다. 시맨틱 웹을 실현하기 위해 개념들의 정의와 개념들간의 관계를 형성하는 온톨로지의 구축이 필수요소가 됨에 따라 온톨로지를 구축하기 위해 OWL, RDF(S) 그리고 DAML+OIL 등의 많은 온톨로지 언어가 개발되었고, 이들 언어를 기반으로 하는 Protege, OILEd와 KAON 등의 사용자들에게 온톨로지 구축의 편리성을 제공하는 온톨로지 구축 도구들도 50여가지 이상 개발되었다. 이러한 이유로 많은 온톨로지들이 개발되고 있다. 그렇지만 온톨로지의 가장 큰 특징은 동일 도메인의 온톨로지의 재사용인데, 산재되어 있는 온톨로지들을 검색하기 어렵고, 이들을 한데 모아놓은 저장소 또한 갖추어지지 않아 동일한 도메인 온톨로지가 존재할지라도 새롭게 온톨로지를 구축해야한다. 이에 본 논문에서는 웹상에 존재하는 온톨로지들의 검색을 용이하게 하여 지식 정보의 재사용을 최대화하기 위하여 본 연구를 진행하고 시스템을 설계하였다.