http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
U-WIN(사용자어휘지능망) 기반의 의미적 정보검색과 KISTI-STA
최호섭,윤화묵,옥철영,Choe, Ho-Seop,Yun, Hwa-Muk,Ok, Cheol-Yeong 한국전문도서관협의회 2007 STIMA bulletin Vol.6 No.-
정보검색서비스는 '사용자가 얼마나 편리하게 검색할 수 있는가'와 '검색 결과에 얼마나 만족하는가'가 중요한데, 이는 정보검색 기술 개발에서 가장 중요하게 고려해야 할 사항이다. 본고는 과학기술 지식정보를 대상으로, 어휘망과 온톨로지적 성격을 가지고 있는 U-WIN을 기반으로 의미적인 정보검색 서비스가 가능하도록 하기 위하여, 한국과학기술정보연구원(KISTI)에서 개발 중인 U-WIN을 이용한 의미적 정보검색 기술과 시범서비스인 KISTI-STA를 소개한다.
최호섭(Ho-Seop Choe),옥철영(Cheol-Young Ock),장문수(Moon-Soo Chang),장명길(Myung-Gil Jang) 한국정보과학회 2002 한국정보과학회 학술발표논문집 Vol.29 No.1B
시소러스, 의미망, 온톨로지 등과 같은 지식베이스는 자연언어처리와 관련된 여러 분야에서 중요한 언어자원의 역할을 담당하고 있다. 하지만 정보검색, 기계번역과 같은 특정 분야마다 다르게 구축되어 이러한 지식베이스는 실질적인 한국어 처리에는 크게 효과를 보지 못하고 있는 실정이다. 본 논문은 한국어를 대상으로 한 시소러스, 의미망 등의 구축 방법론적 문제를 지적하고, 말뭉치를 중심으로 한 텍스트 언어처리에 필요한 의미망의 구축 방법과 포괄적인 활용 방안을 모색한다. 의미망 구축의 기반이 되는 지식은 각종 사전(dictionary)를 이용했으며, 구축하고 있는 의미망의 활용 가능성을 평가하기 위하여 ETRI의 ‘의미기반 정보검색’과 언어처리의 큰 문제 중 하나인 단어 중의성 해소(WSD)에서 어떻게 활용되는지를 살핀다. 그리하여 언어자원의 처리 방안 중의 하나인 의미망을 구축함으로써 언어를 효과적으로 처리하기 위한 기본적이면서 중요한 어휘 데이터베이스 마련과 동시에 언어자원 구축의 한 방향을 제시하고자 한다.
최호섭(Choe Ho Seop),옥철영(Ock Cheol Young) 한국어학회 2002 한국어학 Vol.17 No.-
It is important to construct Knowledge Base(like Thesaurus, Ontology, Semantic Network, etc) which can be applied to the whole field of natural language processing. For example, WordNet, Kadokawa Thesaurus, and Lexical FreeNet represent the most typical Knowledge Base in natural language processing. Many Knowledge Bases constructed in many fields does not come up to our expectations in Korean language processing. In order to construct an effective Knowledge Base, various language resources such as corpus, dictionary, synonym dictionary and WordNet have to be integrated one another, and the knowledge base has to consist of chain of morpheme-word-phrase-collocation-idiom-corpus. This paper presents a construction method and application of Korean Semantic Network (KSN). The KSN is based on Korean dictionary and Sejong corpus, and is applied to text processing, word sense disambiguation (WSD). semantic analysis, query pattern analysis in information retrieval, and so on. This paper deals with the following contents: (1) We point out problems of thesaurus and semantic network that look like a hierarchical structure of words, and compare KSN with them. The KSN has 1:1 relationship between word and sense, not 1:n relationship that an existing thesaurus and semantic network has (2) We present KSN component parts and a construction method. The KSN has noun semantic hierarchy structure linked to predicates, semantic class, proper noun, semantic information, and so on. The links are resulted from consideration of a paradigmatic relation and a syntagmatic relation within sentence. For reference, the KSN consists of dictionary, morpheme information, parts of speech information, construction information, proper noun information (name entity), noun semantic hierarchical structure, predicates classification structure, semantic class relation, idiom, semantic information, and so on. (3) We Present that WSD using the KSN is more effective than one using an existing thesaurus and semantic network.
임지희(Im Ji-Hui),최호섭(Choe Ho-Seop),옥철영(Ock Cheol-Young) 한국콘텐츠학회 2006 한국콘텐츠학회 종합학술대회 논문집 Vol.4 No.2
사용자가 원하는 정보를 얼마나 정확하게 제시하느냐가 정보검색시스템 성능을 판단하는 기준이 된다. 그러나 동형이의어만을 질의어로 이용한 검색 결과는 동형이의어 각 의미에 관련된 문서가 혼재되어 있거나, 특정 의미에 관련된 문서만 집중적으로 나타나는 현상을 볼 수 있다. 그래서 본 논문에서는 한국어 사용자 어휘지능망(U-WIN)의 관계정보를 이용하여, 질의어의 모호성을 해결하는 의미적 정보검색의 기반이 되는 기술을 제안한다. 실험에서 질의어는 전문분야에 주로 사용되는 동형이의어와 보편적으로 사용하는 동형이의로 구분하고, ‘질의어+상위어’ 형태의 확장 질의어를 설정한다. 그래서 포탈사이트의 웹 문서만을 대상으로 한 정확률은 73.5%, 통합검색의 정확률은 68.7%로 나타났다. 이것은 U-WIN 기반의 의미적 정보검색 기술이 정보검색 시스템에서 효율적임을 알 수 있다. The criterion which judges an information retrieval system performance is to how many accurately retrieve an information that the user wants. The search result which uses only homograph has been appears the various documents that relates to each meaning of the word or intensively appears the documents that relates to specific meaning of it. So in this paper, we suggest semantic information retrieval technique using relation within User-Word Intelligent Network(U-WIN) to solve a disambiguation of query. In our experiment, queries divide into two classes, the homograph used in terminology and the general homograph, and it sets the expansion query forms at "query + hypernym". Thus we found that only web document search's precision is average 73.5% and integrated search's precision is average 70% in two portal site. It means that U-WIN-Based semantic information retrieval technique can be used efficiently for a IR system.
과학기술 지식베이스를 이용한 학술정보 지식발견 서비스의 방향
이석형(Seok-Hyoung Lee),최호섭(Ho-Seop Choe),김진숙(Jin-Suk Kim),송유화(Yu-Hwa Song),류범종(Beom-Jong You) 한국IT서비스학회 2011 한국IT서비스학회 학술대회 논문집 Vol.2011 No.5
수많은 정보를 체계적으로 저장·관리하여 정확하고 의미있는 정보를 이용자에게 제공하기 위해 지식정보처리 차원에서는 정보의 체계화, 정보의 지식화, 지식 제공의 자동화의 측면에서 다양한 방법들이 논의되고 있다. 이 중에서 다양한 분야의 지식이 담겨 있는 문서에서 정보를 자동으로 추출하고, 개체명을 인식하고, 핵심주제를 발견하고, 추출된 정보와 주제들의 연관 관계를 분석하고 새로운 지식을 자동으로 추론하는 일련의 정밀한 텍스트처리 과정을 통해 해당 분야의 가장 효율적인 지식베이스를 생성하여 이를 지식정보 관리 및 서비스에 적용하는 방안이 정보의 지식화를 위해 필요한 핵심 요소라 할 수 있다. 이에 본 논문에서는 한국과학기술정보연구원(KISTI)에서 과학기술정보의 지식화를 위하여 필요한 핵심 자원이자 포괄적인 기술인 지식베이스에 대해 설명하고, 이를 활용한 과학기술 학술정보의 지능형 정보 관리 및 서비스 방향을 모색해 보고자 한다. KISTI의 과학기술 지식베이스는 과학기술분야 전문용어, 어휘지능망, 연구주제망, 분류체계, 전거데이터 등을 통합하여 용어에서부터 문서까지 의미있는 연계체제로 구성된 정보표현 집합이자 지식저장소이며 이용자 뿐만 아니라 관리자 측면에서 정확하고 의미있는 정보를 관리·서비스 할 수 있도록 구성되어 있다.