http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
데이터 마이닝을 위한 이산화 알고리즘에 대한 비교 연구
최병수,김현지,차운옥,Choi, Byong-Su,Kim, Hyun-Ji,Cha, Woon-Ock 한국통계학회 2011 Communications for statistical applications and me Vol.18 No.1
이산화는 데이터 마이닝을 위한 전처리 과정으로서 연속형 변수를 이산형 변수로 바꾸는 과정이고, 이산화 시킨 데이터가 원래 가지고 있던 정보손실을 최소로 하면서 높은 분류정확도를 가지는 것을 목적으로 한다. 지금까지 많은 이산화 알고리즘이 제안되었는데, 본 논문에서는 분할 이산화와 병합 이산화의 관점에서 최근까지 제안된 대표적인 이산화 알고리즘들을 비교하고, 이산화 알고리즘이 가지고 있는 특성을 연구하였다. 또한 비교 연구한 이산화 알고리즘을 R코드로 작성하여 다른 연구에 사용할 수 있도록 하였다. The discretization process that converts continuous attributes into discrete ones is a preprocessing step in data mining such as classification. Some classification algorithms can handle only discrete attributes. The purpose of discretization is to obtain discretized data without losing the information for the original data and to obtain a high predictive accuracy when discretized data are used in classification. Many discretization algorithms have been developed. This paper presents the results of our comparative study on recently proposed representative discretization algorithms from the view point of splitting versus merging and supervised versus unsupervised. We implemented R codes for discretization algorithms and made them available for public users.