http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
김진우(Jin Woo Kim),지원철(Won Chul Jhee) 한국IT서비스학회 2012 한국IT서비스학회지 Vol.11 No.4
In this paper, credit card delinquency means the possibility of occurring bad debt within the certain near future from the normal accounts that have no debt and the problem is to predict, on the monthly basis, the occurrence of delinquency 3 months in advance. This prediction is typical binary classification problem but suffers from the issue of data imbalance that means the instances of target class is very few. For the effective prediction of bad debt occurrence, Support Vector Machine (SVM) with kernel trick is adopted using credit card usage and payment patterns as its inputs. SVM is widely accepted in the data mining society because of its prediction accuracy and no fear of overfitting. However, it is known that SVM has the limitation in its ability to processing the large-scale data. To resolve the difficulties in applying SVM to bad debt occurrence prediction, two stage clustering is suggested as an effective data reduction method and ensembles of SVM models are also adopted to mitigate the difficulty due to data imbalance intrinsic to the target problem of this paper. In the experiments with the real world data from one of the major domestic credit card companies, the suggested approach reveals the superior prediction accuracy to the traditional data mining approaches that use neural networks, decision trees or logistics regressions. SVM ensemble model learned from T2 training set shows the best prediction results among the alternatives considered and it is noteworthy that the performance of neural networks with T2 is better than that of SVM with T1. These results prove that the suggested approach is very effective for both SVM training and the classification problem of data imbalance.
김진우(Jin Woo Kim),지원철(Won Chul Jhee) 한국지능정보시스템학회 2011 한국지능정보시스템학회 학술대회논문집 Vol.2011 No.5
본 논문에서는 신용카드 회원의 연체가능성을 사전 예측하는 모형을 회원의 카드 사용행태 및 입금 실적을 사용하여 개발하였다. 모형 개발에 사용된 데이터 마이닝 기법은 SVM (Support Vector Machine)으로 예측의 정확성에도 불구하고 대용량 데이터에의 적용에 한계가 있음이 알려져 있다. 본 논문에서는 연체 예측 문제가 일반적으로 갖고 있는 가지고 있는 Data Imbalance 문제, 신용카드 거래 데이터의 방대함을 고려한 Data Reduction 문제에 대한 해결책의 제시와 함께 SVM Ensemble 모형의 성능을 측정하였다.
김성규(Seonggyu Kim),김경창(Kyung Chang Kim),지원철(Won Chul Jhee) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.1B
본 논문에서는 설계 사양과 그에 따른 데이터 모델로 구성된 과거의 사례를 이용하여 새로운 설계 사양에 맞는 데이터 모델을 만들어내는 사례 기반 데이터 웨어하우스 설계 방법에 대해 알아본다. 효율적인 데이터 웨어하우스 구축을 위해 사례 기반 추론을 이용하여 사용자 요구에 맞는 전역적인 개념 스키마로 통합하기 위한 데이터 웨어하우스 설계 사례 표현 방법과 사례 베이스의 구조에 대해 알아보고, 과거의 설계 사례 중 적절한 사례를 추출 하는 방법과 추출한 과거 사례의 해결책을 현재 사례의 사양에 맞게 적응하는 기법을 제시한다.
시각화된 스키마 생성기를 이용한 데이터 웨어하우스의 실체 뷰 생성
정병화(Byung-Hwa Jung),이현창(Hyun-Chang Lee),김경창(Kyung-Chang Kim),지원철(Won-Chul Jhee) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.2Ⅰ
데이터 웨어하우스 시스템은 의사 결정의 지원에 필요한 요약, 분석 작업을 수행하여 다양한 고품질의 정보 서비스를 사용자에게 제공한다.[1] 이러한 데이터 웨어하우스에 사용자가 질의를 요철할 경우 다차원 모델을 고려해 보면 여러 테이블을 조인해야 할 경우가 발생하고 이때 방대한 양의 사실 테이블을 가지고 있는 데이터 웨어하우스는 질의 처리시 성능 저하를 초래 할 수 있다. 그러므로 본 연구에서는 사용자의 질의에서 자주 요구되는 집계사실을 미리 저장하여 데이터 웨어하우스에 대한 질의 처리 성능 향상을 기대할 수 있도록 집계사실이 저장될 효율적인 집계 테이블 생성에 따른 설계와 구현을 한다. 이를 수행하기 위해 본 논문에는 집계 사실의 저장방법에 대해 살펴보고, 집계 계획에 근거한 집계 테이블 생성 인터페이스의 프로토타입 설계 및 구현을 살펴본다. 이렇게 함으로서 사용자의 의사 결정에 필요한 정보를 데이터 웨어하우스에서 더욱 신속하게 얻을 수 있다.
이화경(Hwa Kyung Lee),한상범(Sang Bum Han),지원철(Won Chul Jhee) 한국지능정보시스템학회 2010 지능정보연구 Vol.16 No.1
Ensemble approach is applied to the detection modeling of illegal cash accommodation (ICA) that is the well-known type of fraudulent usages of credit cards in far east nations and has not been addressed in the academic literatures. The performance of fraud detection model (FDM) suffers from the imbalanced data problem, which can be remedied to some extent using an ensemble of many classifiers. It is generally accepted that ensembles of classifiers produce better accuracy than a single classifier provided there is diversity in the ensemble. Furthermore, recent researches reveal that it may be better to ensemble some selected classifiers instead of all of the classifiers at hand. For the effective detection of ICA, we adopt ensemble size reduction technique that prunes the ensemble of all classifiers using accuracy and diversity measures. The diversity in ensemble manifests itself as disagreement or ambiguity among members. Data imbalance intrinsic to FDM affects our approach for ICA detection in two ways. First, we suggest the training procedure with over-sampling methods to obtain diverse training data sets. Second, we use some variants of accuracy and diversity measures that focus on fraud class. We also dynamically calculate the diversity measure-Forward Addition and Backward Elimination. In our experiments, Neural Networks, Decision Trees and Logit Regressions are the base models as the ensemble members and the performance of homogeneous ensembles are compared with that of heterogeneous ensembles. The experimental results show that the reduced size ensemble is as accurate on average over the data-sets tested as the non-pruned version, which provides benefits in terms of its application efficiency and reduced complexity of the ensemble.