로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A105210269
김부용 (숙명여자대학교) ; 강명욱 (숙명여자대학교) ; 장혜원 ((주)피스트글로벌) ; Kim, Bu-Yong ; Kahng, Myung-Wook ; Jang, Hea-Won
2009
Korean
KCI등재,ESCI
학술저널
531-539(9쪽)
1
0
상세조회0
다운로드국문 초록 (Abstract)
로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공...
로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공선성의 문제를 유발하며, 더욱이 회귀자료에 이상점들이 포함되면 최우추정량은 심각한 결함을 갖게 된다. 두 가지 문제점을 동시에 해결하기 위하여 로버스트주성분로지스틱회귀를 적용할 수 있는데, 본 논문에서는 주성분의 선정기준을 결정하는 모형을 개발하고, 주성분모형에서의 추정치에 미치는 이상점의 영향을 축소하기 위한 로버스트추정법을 제안하였다. 제안된 추정법은 다중공선성과 이상점이 유발하는 문제들을 적절히 해결해 준다는 사실이 모의실험을 통하여 확인되었다.
다국어 초록 (Multilingual Abstract)
Logistic regression is widely used as a datamining technique for the customer relationship management. The maximum likelihood estimator has highly inflated variance when multicollinearity exists among the regressors, and it is not robust against outli...
Logistic regression is widely used as a datamining technique for the customer relationship management. The maximum likelihood estimator has highly inflated variance when multicollinearity exists among the regressors, and it is not robust against outliers. Thus we propose the robust principal components logistic regression to deal with both multicollinearity and outlier problem. A procedure is suggested for the selection of principal components, which is based on the condition index. When a condition index is larger than the cutoff value obtained from the model constructed on the basis of the conjoint analysis, the corresponding principal component is removed from the logistic model. In addition, we employ an algorithm for the robust estimation, which strives to dampen the effect of outliers by applying the appropriate weights and factors to the leverage points and vertical outliers identified by the V-mask type criterion. The Monte Carlo simulation results indicate that the proposed procedure yields higher rate of correct classification than the existing method.
참고문헌 (Reference)
1 김부용, "로지스틱회귀모형의 로버스트 추정을 위한 알고리즘" 한국통계학회 20 (20): 551-559, 2007
2 김부용, "로지스틱모형에서의 주성분회귀" 한국통계학회 21 (21): 571-580, 2008
3 김부용, "V-mask Type Criterion for Identification of Outliers in Logistic Regression" 한국통계학회 12 (12): 625-634, 2005
4 Aguilera, A. M, "Using principal components for estimating logistic regression with high-dimensional multicollinear data" 50 : 1905-1924, 2006
5 Mason, R. L, "Selecting principal components in regression" 3 : 299-301, 1985
6 Kordzakhia, N, "Robust estimation in the logistic regression model" 98 : 211-223, 2001
7 Rousseeuw, P. J, "Robust Regression and Outlier Detection" John Wiley & Sons 2003
8 Hardin, J, "Outlier detection in the multiple cluster setting using the minimum covariance determinant estimator" 44 : 625-638, 2004
9 Carroll, R. J, "On robustness in the logistic regression model" 55 : 693-706, 1993
10 Croux, C, "Implementing the Bianco and Yohai estimator for logistic regression" 44 : 273-295, 2003
1 김부용, "로지스틱회귀모형의 로버스트 추정을 위한 알고리즘" 한국통계학회 20 (20): 551-559, 2007
2 김부용, "로지스틱모형에서의 주성분회귀" 한국통계학회 21 (21): 571-580, 2008
3 김부용, "V-mask Type Criterion for Identification of Outliers in Logistic Regression" 한국통계학회 12 (12): 625-634, 2005
4 Aguilera, A. M, "Using principal components for estimating logistic regression with high-dimensional multicollinear data" 50 : 1905-1924, 2006
5 Mason, R. L, "Selecting principal components in regression" 3 : 299-301, 1985
6 Kordzakhia, N, "Robust estimation in the logistic regression model" 98 : 211-223, 2001
7 Rousseeuw, P. J, "Robust Regression and Outlier Detection" John Wiley & Sons 2003
8 Hardin, J, "Outlier detection in the multiple cluster setting using the minimum covariance determinant estimator" 44 : 625-638, 2004
9 Carroll, R. J, "On robustness in the logistic regression model" 55 : 693-706, 1993
10 Croux, C, "Implementing the Bianco and Yohai estimator for logistic regression" 44 : 273-295, 2003
11 Woodru®, D. L, "Computable robust estimation of multivariate location and shape in high dimension using compound estimators" 89 : 888-896, 1994
12 Copas, J. B, "Binary regression models for contaminated data" 50 : 225-265, 1988
13 Schaefer, R. L, "Alternative estimators in logistic regression when the data are collinear" 25 : 75-91, 1986
14 Hadi, A. S, "A modi¯cation of a method for the detection of outliers in multivariate samples" 56 : 393-396, 1994
15 Rousseeuw, P. J, "A fast algorithm for the minimum covariance determinant esti- mator" 41 : 212-223, 1999
Real Protein Prediction in an Off-Lattice BLN Model via Annealing Contour Monte Carlo
Comparing Imputation Methods for Doubly Censored Data
Stochastic Upper Bound for the Stationary Queue Lengths of GPS Servers
A Statistical Approach to Examine the Impact of Various Meteorological Parameters on Pan Evaporation
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2027 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2021-01-01 | 평가 | 등재학술지 유지 (재인증) | |
2018-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2015-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2011-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2009-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2007-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2005-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2002-07-01 | 평가 | 등재학술지 선정 (등재후보2차) | |
2000-01-01 | 평가 | 등재후보학술지 선정 (신규평가) |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 0.38 | 0.38 | 0.38 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
0.35 | 0.34 | 0.565 | 0.17 |