위키피디아는 개방형 백과사전으로서 수많은 편집자들에 의해 작성되기 때문에 빠른 시간에 방대한 양의 정보가 축적되고 있으며, 축적되는 정보의 신뢰성 또한 매우 높다. 본 논문에서는 ...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A82320572
2010
Korean
위키피디아 ; 분류체계 ; 개체명 사전 ; 텍스트 마이닝 ; Wikipedia ; Class hierarchy ; Named entity dictionary ; Text mining
004
KCI등재
학술저널
492-496(5쪽)
4
0
상세조회0
다운로드국문 초록 (Abstract)
위키피디아는 개방형 백과사전으로서 수많은 편집자들에 의해 작성되기 때문에 빠른 시간에 방대한 양의 정보가 축적되고 있으며, 축적되는 정보의 신뢰성 또한 매우 높다. 본 논문에서는 ...
위키피디아는 개방형 백과사전으로서 수많은 편집자들에 의해 작성되기 때문에 빠른 시간에 방대한 양의 정보가 축적되고 있으며, 축적되는 정보의 신뢰성 또한 매우 높다. 본 논문에서는 이러한 장점을 가진 위키피디아의 여러 가지 세부정보를 이용하여 한국어 개체명 사전을 자동으로 구축하는 방법을 제안한다. 먼저 위키피디아의 각 엔트리(entry)의 분류정보를 사용하여 분류체계(class hierarchy)를 생성한다. 생성된 분류체계에 위키피디아 엔트리를 자동으로 매핑(mapping)시킨 다음, 분류체계에서 최상위 계층의 불확실성(entropy)을 계산한다. 마지막으로, 임계값 이상의 불확실성을 가지는 분류체계를 제거함으로써 정확률이 높은 개체명 사전을 구축한다. 본 논문에서 제안하는 방법으로 실험을 한 결과 최고 81.12%(83.94%:정확률, 78.48%:재현율)의 F1-measure의 성능을 보였다.
다국어 초록 (Multilingual Abstract)
Wikipedia as an open encyclopedia contains immense human knowledge written by thousands of volunteer editors and its reliability is also high. In this paper, we propose to automatically construct a Korean named entity dictionary using the several feat...
Wikipedia as an open encyclopedia contains immense human knowledge written by thousands of volunteer editors and its reliability is also high. In this paper, we propose to automatically construct a Korean named entity dictionary using the several features of the Wikipedia. Firstly, we generate class hierarchies using the class information from each article of Wikipedia. Secondly, the titles of each article are mapped to our class hierarchies, and then we calculate the entropy value of the root node in each class hierarchy. Finally, we construct named entity dictionary with high performance by removing the class hierarchies which have a higher entropy value than threshold. Our experiment results achieved overall F1-measure of 81.12% (precision : 83.94%, recall : 78.48%).
목차 (Table of Contents)
참고문헌 (Reference)
1 S. Ye, "Summarizing Definition from Wikipedia" 199-207, 2009
2 K. Lee, "Study on Named Entity Recognition in Korean Text" 21 (21): 292-299, 2000
3 E. Agichtein, "Snowball: extracting relations from large plain-text collections" 85-94, 2000
4 A. Richman, "Mining Wiki Resources for Multilingual Named Entity Recognition" 1-9, 2008
5 E. Riloff, "Learning Dictionaries for Information Extraction by Multi-Level Bootstrapping" 474-479, 1999
6 M. Thelen, "Bootstrapping Method for Learning Semantic Lexicons using Extraction Pattern Contexts" 214-221, 2002
7 W. Dakka, "Augmenting Wikipedia with Named Entity Tags" 545-552, 2008
8 A. L. Berger, "A Maximum Entropy Approach to Natural Language Processing" 39-71, 1996
1 S. Ye, "Summarizing Definition from Wikipedia" 199-207, 2009
2 K. Lee, "Study on Named Entity Recognition in Korean Text" 21 (21): 292-299, 2000
3 E. Agichtein, "Snowball: extracting relations from large plain-text collections" 85-94, 2000
4 A. Richman, "Mining Wiki Resources for Multilingual Named Entity Recognition" 1-9, 2008
5 E. Riloff, "Learning Dictionaries for Information Extraction by Multi-Level Bootstrapping" 474-479, 1999
6 M. Thelen, "Bootstrapping Method for Learning Semantic Lexicons using Extraction Pattern Contexts" 214-221, 2002
7 W. Dakka, "Augmenting Wikipedia with Named Entity Tags" 545-552, 2008
8 A. L. Berger, "A Maximum Entropy Approach to Natural Language Processing" 39-71, 1996
블로그 연결망에서 파급력을 가진 파워 유저의 파악 기법
라이프로그 관리 시스템에서 블루투스 장치를 이용한 효과적인 사진 검색 방법
복잡한 엔터프라이즈 응용 개발을 위한 ISIS 아키텍처
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2022 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2019-01-01 | 평가 | 등재학술지 유지 (계속평가) | |
2016-01-01 | 평가 | 등재학술지 유지 (계속평가) | |
2015-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2014-09-16 | 학술지명변경 | 한글명 : 정보과학회논문지 : 컴퓨팅의 실제 및 레터 -> 정보과학회 컴퓨팅의 실제 논문지외국어명 : Journal of KIISE : Computing Practices and Letters -> KIISE Transactions on Computing Practices | |
2013-04-26 | 학술지명변경 | 외국어명 : Journal of KISS : Computing Practices and Letters -> Journal of KIISE : Computing Practices and Letters | |
2011-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2009-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2008-10-02 | 학술지명변경 | 한글명 : 정보과학회논문지 : 컴퓨팅의 실제 -> 정보과학회논문지 : 컴퓨팅의 실제 및 레터외국어명 : Journal of KISS : Computing Practices -> Journal of KISS : Computing Practices and Letters | |
2007-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2005-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2002-01-01 | 평가 | 등재학술지 선정 (등재후보2차) |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 0.29 | 0.29 | 0.27 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
0.24 | 0.21 | 0.503 | 0.04 |