http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
배우정(Woo-Jeong Bae),박인철(In-Cheol Park),이용석(Yong-Seok Lee) 한국정보과학회 1999 정보과학회논문지(B) Vol.26 No.6
개념 그래프는 개념 구조(conceptual structures)를 그래프로 표현한 논리 시스템으로 자연어 처리에 적합한 여러 특성을 지니고 있다. 그러나, 개념 구조의 그래프 표현은 개념 그래프에 대한 연산의 복잡도를 증가시키고 의미 표현의 일관성(consistency)과 유일성(uniqueness)을 잃게 한다. 본 논문에서는 개념 그래프의 이러한 문제점에 대해 자세히 살펴보고 이를 해결한 개념 트리의 표현 방법을 보인다. 표현의 유일성을 위해, 개념 트리는 중심어 선행 표현(preorder expression)에 의해 제약된다. 또한, 표현의 일관성을 위해 집합 참조대상(set referents)을 확장하고 이를 다루기 위한 set join 연산을 재정의한다. 우리는 개념 트리가 자연어 문장에 대한 표현력을 유지하면서 효율적임을 보인다. Conceptual graphs, which are a logic system and represent conceptual structures with graphs, have properties suitable for natural language processing. The graph representation of conceptual structures, however, increases the complexity of operations with conceptual graphs and loses the consistency and uniqueness of meaning representation. In this paper, we present these problems in detail and then we give representations in conceptual trees for resolving the problems. For the uniqueness, conceptual trees are restricted by preorder expression. For the consistency, we extend set referents and redefine the operation set join for manipulating them. We show that conceptual trees are efficient, keeping expressive power for natural language sentences.
이중 배열 트라이 구조를 이용한 한국어 전자 사전의 구축
김철수(Cheol-Su Kim),배우정(Woo-jeong Bae),이용석(Yong-seok Lee),靑江純一(Jun-ichi Aoe) 한국정보과학회 1996 정보과학회논문지(B) Vol.23 No.1
한국어 분석 시스템들은 대용량의 전자 사전을 요구하며 구축된 전자 사전은 형태소 분석 동안에 매우 빈번하게 검색된다. 효율적인 시스템을 위해서는 사전 크기에 독립적이면서 빠른 검색 시간을 가지고 트라이의 기본 특징을 유지하면서 기억 장소를 효율적으로 사용하는 사전을 구축해야 한다. 본 논문에서는 검색 속도와 기억 공간을 모두 고려해 볼 때 이중 배열을 사용한 트라이 구조가 한국어 전자 사전 구축에 적합함을 보인다. 이를 위해 우리는 음절 단위, 반음절 단위, 자소단위 방법으로 각각 트라이 사전을 구축하고 비교한다. 또한, 자소단위의 트라이 사전을 여러 개의 트라이로 분할함으로써 검색 속도는 그대로 유지하면서 기억 공간을 거의 절반으로 줄일 수 있음을 보인다. Korean analysis systems require a large-scale electronic dictionary and the built dictionary is very frequently searched during the morphological analysis. For the more efficient system, we must construct the dictionary that has fast size-independent search time and makes efficient use of storage which preserves the basic characteristics of the Trie. With respect to storage and search time, we show, in this paper, that the Trie using double array is suitable for Korean electronic dictionary. For this purpose, we built Trie-dictionaries in syllable-unit, semisyllable-unit, and phoneme-unit methods and compared them with each other In addition, we show that the size of storage of the phoneme-unit Trie-dictionary can be reduced by approximately half by dividing the dictionary into multiple Tries with the same search time.
문형을 제약 조건으로 하는 CFG기반의 한국어 구문분석
이현영(Hyeon-Yeong Lee),황이규(Yi-Gyu Hwang),배우정(Woo-Jeong Bae),이용석(Yong-Seok Lee) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.2Ⅱ
한국어는 용언이 의미적 제약을 통해 문장을 지배하는 SOV 구조의 언어이다. 또한, 조사나 어미와 같은 기능어의 발달은 물론 관형절을 내포하는 문장이 주류를 이룬다. 따라서 한국어의 구문분석은 부착에 따른 많은 구문 모호성이 발생하게 된다. 본 논문에서는 조건단일화 기반의 CFG 문법을 기술하고 문형을 구문 제약으로 하여 구문모호성을 해결하는 방안을 제시한다. 문형은 한국어의 특성을 용언의 하위범주화에 맞게 재분류한 문장의 구조적 유형을 말한다. 본 논문에서 제안하는 문형은 동사와 형용사를 구분하여 39가지로 설정하였다. 이런 문형 정보를 이용하여 관형형 어미를 갖는 용언이 최대의 정보를 가지도록 함으로써 관형절에서 발생하는 부사 및 체언구 부착의 문제가 해결된다. 또한 문형은 이중주어나 이중 목적어 문장을 처리할 수가 있어 한국어에서 발생하는 많은 구문모호성을 해결할 수 있다.
朴仁喆,裵雨正,李鏞碩 全北大學校 1996 論文集 Vol.42 No.-
To generate conceptual graphs for Korean sentences, in this paper, we design the conceptual mapping rules which map each word into concepts and the semantic interpretation rules which are based in Korean sentence patterns to decide conceptual relations. However, the conceptual graphs generated by the semantic interpretation rules semantically are ambiguous because they represent the general conceptual relations between concepts. So, we incrementally build the conceptual patterns which represent semantic restrictions for each word. We, also, design the generator which generates conceptual graphs from the result of syntactic analysis based on the conditional unification.