자연어 문서를 미리 정의된 범주로 분류하는 작업은 정보 검색과 자연어 처리시스템에 있어서 상당한 중요성을 가지고 있다. 이러한 자동 문서 분류에 관한 기존의 연구들이 기계 학습 내지...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A82306569
1992
Korean
004
학술저널
1057-1060(4쪽)
0
상세조회0
다운로드국문 초록 (Abstract)
자연어 문서를 미리 정의된 범주로 분류하는 작업은 정보 검색과 자연어 처리시스템에 있어서 상당한 중요성을 가지고 있다. 이러한 자동 문서 분류에 관한 기존의 연구들이 기계 학습 내지...
자연어 문서를 미리 정의된 범주로 분류하는 작업은 정보 검색과 자연어 처리시스템에 있어서 상당한 중요성을 가지고 있다. 이러한 자동 문서 분류에 관한 기존의 연구들이 기계 학습 내지는 지식 공학적인 방법(knowledge engineering method) 으로 수행되어 왔다.
본 연구는 기계 학습에 의한 문서 분류 시스템을 설계, 구현하기 위한 첫단계로 현재 가장 활발히 연구되고 있는 두가지 귀납적 학습 알고리즘(Inductive learning algorithm)즉, ID3 와 에러 역전파(Backpropagation) 알고리즘의 자동 문서 분류에 있어서 성능을 측정하고 그들의 결과를 비교, 분석한다. 또한 학습 자료(training data) 크기와 특성 집합(feature set) 크기의 변화에 따른 두 알고리즘의 성능 변화를 관찰함으로써 최적의 효율성을 기대할 수 있는 변수를 제시한다.
목차 (Table of Contents)