머신러닝 기법을 활용한 분석에서 훈련 데이터의 샘플링 전략은 예측 정확도 뿐 만 아니라 일반화 능력에도 많은영향을 미친다. 특히, 산사태 취약성 분석의 경우, 산사태 발생부에 대한 정...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A106174581
2019
Korean
KCI등재,SCOPUS,ESCI
학술저널
199-212(14쪽)
0
0
상세조회0
다운로드국문 초록 (Abstract)
머신러닝 기법을 활용한 분석에서 훈련 데이터의 샘플링 전략은 예측 정확도 뿐 만 아니라 일반화 능력에도 많은영향을 미친다. 특히, 산사태 취약성 분석의 경우, 산사태 발생부에 대한 정...
머신러닝 기법을 활용한 분석에서 훈련 데이터의 샘플링 전략은 예측 정확도 뿐 만 아니라 일반화 능력에도 많은영향을 미친다. 특히, 산사태 취약성 분석의 경우, 산사태 발생부에 대한 정보에 비해 산사태 미발생부에 대한 정보가과도하게 많은 데이터 불균형 현상이 발생하며, 이에 따라 분석 모델의 훈련 데이터 설계 시 데이터 샘플링 과정이필수적이다. 그러나 기존의 연구들은 대부분 산사태 미발생부 선택 시 발생부 데이터와 1:1의 비율을 갖도록 무작위로 선택하는 방법을 적용하였을 뿐, 특정한 선택 기준에 따라 분석을 수행하지 않았다. 따라서 본 연구에서는 훈련 데이터의 샘플링 전략이 모델의 예측 성능에 미치는 결과를 확인하기 위하여 산사태 발생부와 미발생부의 샘플링 전략기준에 따라 서로 다른 6개의 시나리오를 만들어 Random Forest 모델의 훈련에 사용하였다. 또한 Random Forest의결과 중 하나인 변수 중요도를 각 산사태 유발인자들에 가중치로 곱하여 줌으로써 산사태 취약지수 값을 산정하였으며, 취약지수 값을 이용해 산사태 취약성도를 제작하고 각 결과 지도의 정확도를 비교 분석하였다. 분석 결과, 훈련데이터의 샘플링 방법에 상관없이 두 지역의 산사태 취약성 분석 결과는 모두 70~80%의 정확도를 보였다. 이를 통해 Random Forest 기법의 산사태 취약성 분석기법으로서의 적용 가능성을 확인하였으며, Random Forest 모델이 제공하는 입력변수의 중요도를 산사태 유발인자 가중치로 활용할 수 있음을 확인하였다. 또한 훈련 시나리오 간의 정확도를 비교한 결과, 특정한 기준에 의해 훈련 데이터를 설계하는 것이 기존의 랜덤 선택 방법보다 높은 예측 정확도를기대할 수 있음을 확인하였다.
참고문헌 (Reference)
1 이사로, "인공신경망을 이용한 강릉지역 산사태 취약성 분석 및 검증" 대한자원환경지질학회 38 (38): 33-43, 2005
2 이정현, "무한사면모델과 수리학적 모델의 결합을 통한 강원도 진부지역의 산사태 취약성 분석" 대한자원환경지질학회 45 (45): 697-707, 2012
3 박철용, "랜덤포레스트의 크기 결정을 위한 간편 진단통계량" 한국데이터정보과학회 27 (27): 855-863, 2016
4 박철용, "랜덤포레스트의 크기 결정에 유용한 승리표차에 기반한 불일치 측도" 한국데이터정보과학회 28 (28): 515-524, 2017
5 Chung, C.J.F., "Validation of spatial prediction models for landslide hazard mapping" 30 : 451-472, 2003
6 Wu, X., "Top 10 algorithms in data mining" 14 : 1-37, 2008
7 Yilmaz, I., "The effect of the sampling strategies on the landslide susceptibility mapping by conditional probability and artificial neural networks" 60 : 505-519, 2010
8 Dittman, D. J., "The effect of data sampling when using random forest on imbalanced bioinformatics data" 457-463, 2015
9 Zhang, K., "The assessment of landslide susceptibility mapping using random forest and decision tree methods in the Three Gorges Reservoir area, China" 76 : 405-, 2017
10 Kim, W. Y., "Study on landslide hazard prediction" Ministry of Science and Technology 339-, 2003
1 이사로, "인공신경망을 이용한 강릉지역 산사태 취약성 분석 및 검증" 대한자원환경지질학회 38 (38): 33-43, 2005
2 이정현, "무한사면모델과 수리학적 모델의 결합을 통한 강원도 진부지역의 산사태 취약성 분석" 대한자원환경지질학회 45 (45): 697-707, 2012
3 박철용, "랜덤포레스트의 크기 결정을 위한 간편 진단통계량" 한국데이터정보과학회 27 (27): 855-863, 2016
4 박철용, "랜덤포레스트의 크기 결정에 유용한 승리표차에 기반한 불일치 측도" 한국데이터정보과학회 28 (28): 515-524, 2017
5 Chung, C.J.F., "Validation of spatial prediction models for landslide hazard mapping" 30 : 451-472, 2003
6 Wu, X., "Top 10 algorithms in data mining" 14 : 1-37, 2008
7 Yilmaz, I., "The effect of the sampling strategies on the landslide susceptibility mapping by conditional probability and artificial neural networks" 60 : 505-519, 2010
8 Dittman, D. J., "The effect of data sampling when using random forest on imbalanced bioinformatics data" 457-463, 2015
9 Zhang, K., "The assessment of landslide susceptibility mapping using random forest and decision tree methods in the Three Gorges Reservoir area, China" 76 : 405-, 2017
10 Kim, W. Y., "Study on landslide hazard prediction" Ministry of Science and Technology 339-, 2003
11 Hong, H., "Spatial prediction of landslide hazard at the Yihuang area (China) using two-class kernel logistic regression, alternating decision tree and support vector machines" 133 : 266-281, 2015
12 Tien Bui, D., "Spatial prediction models for shallow landslide hazards: a comparative assessment of the efficacy of support vector machines, artificial neural networks, kernel logistic regression, and logistic model tree" 13 : 361-378, 2016
13 Brenning, A., "Spatial prediction models for landslide hazards: review, comparison and evaluation" 5 : 853-862, 2005
14 Tien Bui, D., "Regional prediction of landslide hazard using probability analysis of intense rainfall in the Hoa Binh province, Vietnam" 66 : 707-730, 2013
15 Breiman, L., "Random forest" 45 : 5-32, 2001
16 Chen, W., "Performance evaluation of the GIS-based data mining techniques of best-first decision tree, random forest, and naïve Bayes tree for landslide susceptibility modeling" 644 : 1006-1018, 2018
17 Stumpf, A., "Object-oriented mapping of landslides using Random Forests" 115 : 2564-2577, 2011
18 Duro, D. C., "Multiscale object-based image analysis and feature selection of multi-sensor earth observation imagery using random forests" 33 : 4502-4526, 2012
19 Watts, J. D., "Monitoring of cropland practices for carbon sequestration purposes in north central Montana by Landsat remote sensing" 113 : 1843-1852, 2009
20 Kim, J. C., "Landslide susceptibility mapping using random forest and boosted tree models in Pyeong-Chang, Korea" 33 : 1000-1015, 2018
21 Catani, F., "Landslide susceptibility estimation by random forests technique: sensitivity and scaling issues" 13 : 2815-2831, 2013
22 Hong, H., "Landslide susceptibility assessment in Lianhua County (China): a comparison between a random forest data mining technique and bivariate and multivariate statistical models" 259 : 105-118, 2016
23 Pradhan, B., "Landslide susceptibility assessment and factor effect analysis: backpropagation artificial neural networks and their comparison with frequency ratio and bivariate logistic regression modelling" 25 : 747-759, 2010
24 Guzzetti, F., "Landslide hazard evaluation: a review of current techniques and their application in a multiscale study, Central Italy" 31 : 181-216, 1999
25 Müller, A.C., "Introduction to machine learning with Python: a guide for data scientists" O'Reilly Media, Inc. 386-, 2016
26 Baeza, C., "Influence of sample and terrain unit on landslide susceptibility assessment at La Pobla de Lillet, Eastern Pyrenees, Spain" 60 : 155-167, 2010
27 Na, X., "Improved land cover mapping using random forests combined with landsat thematic mapper imagery and ancillary geographic data" 76 : 833-840, 2010
28 Pham, B. T., "Hybrid integration of Multilayer Perceptron Neural Networks and machine learning ensembles for landslide susceptibility assessment at Himalayan area (India) using GIS" 149 : 52-63, 2017
29 Goetz, J. N., "Evaluating machine learning and statistical prediction techniques for landslide susceptibility modeling" 81 : 1-11, 2015
30 Cho, J.H., "Decision tree approach for classification and dimensionality reduction of electronic nose data" 160 : 542-548, 2011
31 Dudoit, S., "Comparison of discrimination methods for the classification of tumors using gene expression data" 97 : 77-87, 2002
32 Tsangaratos, P., "Comparison of a logistic regression and Naïve Bayes classifier in landslide susceptibility assessments: The influence of models complexity and training dataset size" 145 : 164-179, 2016
33 Liaw, A., "Classification and regression by randomForest" 2 : 18-22, 2002
34 Kalantar, B., "Assessment of the effects of training data selection on the landslide susceptibility mapping: a comparison between support vector machine (SVM), logistic regression (LR) and artificial neural networks (ANN)" 9 : 49-69, 2018
35 Tien Bui, D., "Application of support vector machines in landslide susceptibility assessment for the Hoa Binh province (Vietnam) with kernel functions analysis" International Environmental Modelling and Software Society 2012
36 Myles, A. J., "An introduction to decision tree modeling" 18 : 275-285, 2004
37 Hamza, M., "An empirical comparison of ensemble methods based on classification trees" 75 : 629-643, 2005
38 Paola, J. D., "A review and analysis of backpropagation neural networks for classification of remotely-sensed multi-spectral imagery" 16 : 3033-3058, 1995
39 Pradhan, B., "A comparative study on the predictive ability of the decision tree, support vector machine and neuro-fuzzy models in landslide susceptibility mapping using GIS" 51 : 350-365, 2013
40 Chen, W., "A comparative study of logistic model tree, random forest, and classification and regression tree models for spatial prediction of landslide susceptibility" 151 : 147-160, 2017
41 Pham, B. T., "A comparative study of different machine learning methods for landslide susceptibility assessment: a case study of Uttarakhand area (India)" 84 : 240-250, 2016
심도에 따른 대전지역 화강암과 안동지역 편마암의 절리특성 비교분석
모사 Spray Type 배연탈황설비를 이용한 소성패각 슬러리의 SO2 흡수능 평가: 석회석과의 비교연구
아연섭취에 따른 적상추의 분광학적 반응: 중금속 오염토양에서의 반응실험
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2023 | 평가예정 | 해외DB학술지평가 신청대상 (해외등재 학술지 평가) | |
2020-01-01 | 평가 | 등재학술지 유지 (해외등재 학술지 평가) | |
2013-01-01 | 평가 | 등재 1차 FAIL (등재유지) | |
2010-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2008-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2006-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2004-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2001-07-01 | 평가 | 등재학술지 선정 (등재후보2차) | |
1999-01-01 | 평가 | 등재후보학술지 선정 (신규평가) |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 0.35 | 0.35 | 0.34 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
0.29 | 0.27 | 0.625 | 0.19 |