RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재 SCOPUS

      Random Forest 기법을 이용한 산사태 취약성 평가 시 훈련 데이터 선택이 결과 정확도에 미치는 영향 = Study on the Effect of Training Data Sampling Strategy on the Accuracy of the Landslide Susceptibility Analysis Using Random Forest Method

      한글로보기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      머신러닝 기법을 활용한 분석에서 훈련 데이터의 샘플링 전략은 예측 정확도 뿐 만 아니라 일반화 능력에도 많은영향을 미친다. 특히, 산사태 취약성 분석의 경우, 산사태 발생부에 대한 정...

      머신러닝 기법을 활용한 분석에서 훈련 데이터의 샘플링 전략은 예측 정확도 뿐 만 아니라 일반화 능력에도 많은영향을 미친다. 특히, 산사태 취약성 분석의 경우, 산사태 발생부에 대한 정보에 비해 산사태 미발생부에 대한 정보가과도하게 많은 데이터 불균형 현상이 발생하며, 이에 따라 분석 모델의 훈련 데이터 설계 시 데이터 샘플링 과정이필수적이다. 그러나 기존의 연구들은 대부분 산사태 미발생부 선택 시 발생부 데이터와 1:1의 비율을 갖도록 무작위로 선택하는 방법을 적용하였을 뿐, 특정한 선택 기준에 따라 분석을 수행하지 않았다. 따라서 본 연구에서는 훈련 데이터의 샘플링 전략이 모델의 예측 성능에 미치는 결과를 확인하기 위하여 산사태 발생부와 미발생부의 샘플링 전략기준에 따라 서로 다른 6개의 시나리오를 만들어 Random Forest 모델의 훈련에 사용하였다. 또한 Random Forest의결과 중 하나인 변수 중요도를 각 산사태 유발인자들에 가중치로 곱하여 줌으로써 산사태 취약지수 값을 산정하였으며, 취약지수 값을 이용해 산사태 취약성도를 제작하고 각 결과 지도의 정확도를 비교 분석하였다. 분석 결과, 훈련데이터의 샘플링 방법에 상관없이 두 지역의 산사태 취약성 분석 결과는 모두 70~80%의 정확도를 보였다. 이를 통해 Random Forest 기법의 산사태 취약성 분석기법으로서의 적용 가능성을 확인하였으며, Random Forest 모델이 제공하는 입력변수의 중요도를 산사태 유발인자 가중치로 활용할 수 있음을 확인하였다. 또한 훈련 시나리오 간의 정확도를 비교한 결과, 특정한 기준에 의해 훈련 데이터를 설계하는 것이 기존의 랜덤 선택 방법보다 높은 예측 정확도를기대할 수 있음을 확인하였다.

      더보기

      참고문헌 (Reference)

      1 이사로, "인공신경망을 이용한 강릉지역 산사태 취약성 분석 및 검증" 대한자원환경지질학회 38 (38): 33-43, 2005

      2 이정현, "무한사면모델과 수리학적 모델의 결합을 통한 강원도 진부지역의 산사태 취약성 분석" 대한자원환경지질학회 45 (45): 697-707, 2012

      3 박철용, "랜덤포레스트의 크기 결정을 위한 간편 진단통계량" 한국데이터정보과학회 27 (27): 855-863, 2016

      4 박철용, "랜덤포레스트의 크기 결정에 유용한 승리표차에 기반한 불일치 측도" 한국데이터정보과학회 28 (28): 515-524, 2017

      5 Chung, C.J.F., "Validation of spatial prediction models for landslide hazard mapping" 30 : 451-472, 2003

      6 Wu, X., "Top 10 algorithms in data mining" 14 : 1-37, 2008

      7 Yilmaz, I., "The effect of the sampling strategies on the landslide susceptibility mapping by conditional probability and artificial neural networks" 60 : 505-519, 2010

      8 Dittman, D. J., "The effect of data sampling when using random forest on imbalanced bioinformatics data" 457-463, 2015

      9 Zhang, K., "The assessment of landslide susceptibility mapping using random forest and decision tree methods in the Three Gorges Reservoir area, China" 76 : 405-, 2017

      10 Kim, W. Y., "Study on landslide hazard prediction" Ministry of Science and Technology 339-, 2003

      1 이사로, "인공신경망을 이용한 강릉지역 산사태 취약성 분석 및 검증" 대한자원환경지질학회 38 (38): 33-43, 2005

      2 이정현, "무한사면모델과 수리학적 모델의 결합을 통한 강원도 진부지역의 산사태 취약성 분석" 대한자원환경지질학회 45 (45): 697-707, 2012

      3 박철용, "랜덤포레스트의 크기 결정을 위한 간편 진단통계량" 한국데이터정보과학회 27 (27): 855-863, 2016

      4 박철용, "랜덤포레스트의 크기 결정에 유용한 승리표차에 기반한 불일치 측도" 한국데이터정보과학회 28 (28): 515-524, 2017

      5 Chung, C.J.F., "Validation of spatial prediction models for landslide hazard mapping" 30 : 451-472, 2003

      6 Wu, X., "Top 10 algorithms in data mining" 14 : 1-37, 2008

      7 Yilmaz, I., "The effect of the sampling strategies on the landslide susceptibility mapping by conditional probability and artificial neural networks" 60 : 505-519, 2010

      8 Dittman, D. J., "The effect of data sampling when using random forest on imbalanced bioinformatics data" 457-463, 2015

      9 Zhang, K., "The assessment of landslide susceptibility mapping using random forest and decision tree methods in the Three Gorges Reservoir area, China" 76 : 405-, 2017

      10 Kim, W. Y., "Study on landslide hazard prediction" Ministry of Science and Technology 339-, 2003

      11 Hong, H., "Spatial prediction of landslide hazard at the Yihuang area (China) using two-class kernel logistic regression, alternating decision tree and support vector machines" 133 : 266-281, 2015

      12 Tien Bui, D., "Spatial prediction models for shallow landslide hazards: a comparative assessment of the efficacy of support vector machines, artificial neural networks, kernel logistic regression, and logistic model tree" 13 : 361-378, 2016

      13 Brenning, A., "Spatial prediction models for landslide hazards: review, comparison and evaluation" 5 : 853-862, 2005

      14 Tien Bui, D., "Regional prediction of landslide hazard using probability analysis of intense rainfall in the Hoa Binh province, Vietnam" 66 : 707-730, 2013

      15 Breiman, L., "Random forest" 45 : 5-32, 2001

      16 Chen, W., "Performance evaluation of the GIS-based data mining techniques of best-first decision tree, random forest, and naïve Bayes tree for landslide susceptibility modeling" 644 : 1006-1018, 2018

      17 Stumpf, A., "Object-oriented mapping of landslides using Random Forests" 115 : 2564-2577, 2011

      18 Duro, D. C., "Multiscale object-based image analysis and feature selection of multi-sensor earth observation imagery using random forests" 33 : 4502-4526, 2012

      19 Watts, J. D., "Monitoring of cropland practices for carbon sequestration purposes in north central Montana by Landsat remote sensing" 113 : 1843-1852, 2009

      20 Kim, J. C., "Landslide susceptibility mapping using random forest and boosted tree models in Pyeong-Chang, Korea" 33 : 1000-1015, 2018

      21 Catani, F., "Landslide susceptibility estimation by random forests technique: sensitivity and scaling issues" 13 : 2815-2831, 2013

      22 Hong, H., "Landslide susceptibility assessment in Lianhua County (China): a comparison between a random forest data mining technique and bivariate and multivariate statistical models" 259 : 105-118, 2016

      23 Pradhan, B., "Landslide susceptibility assessment and factor effect analysis: backpropagation artificial neural networks and their comparison with frequency ratio and bivariate logistic regression modelling" 25 : 747-759, 2010

      24 Guzzetti, F., "Landslide hazard evaluation: a review of current techniques and their application in a multiscale study, Central Italy" 31 : 181-216, 1999

      25 Müller, A.C., "Introduction to machine learning with Python: a guide for data scientists" O'Reilly Media, Inc. 386-, 2016

      26 Baeza, C., "Influence of sample and terrain unit on landslide susceptibility assessment at La Pobla de Lillet, Eastern Pyrenees, Spain" 60 : 155-167, 2010

      27 Na, X., "Improved land cover mapping using random forests combined with landsat thematic mapper imagery and ancillary geographic data" 76 : 833-840, 2010

      28 Pham, B. T., "Hybrid integration of Multilayer Perceptron Neural Networks and machine learning ensembles for landslide susceptibility assessment at Himalayan area (India) using GIS" 149 : 52-63, 2017

      29 Goetz, J. N., "Evaluating machine learning and statistical prediction techniques for landslide susceptibility modeling" 81 : 1-11, 2015

      30 Cho, J.H., "Decision tree approach for classification and dimensionality reduction of electronic nose data" 160 : 542-548, 2011

      31 Dudoit, S., "Comparison of discrimination methods for the classification of tumors using gene expression data" 97 : 77-87, 2002

      32 Tsangaratos, P., "Comparison of a logistic regression and Naïve Bayes classifier in landslide susceptibility assessments: The influence of models complexity and training dataset size" 145 : 164-179, 2016

      33 Liaw, A., "Classification and regression by randomForest" 2 : 18-22, 2002

      34 Kalantar, B., "Assessment of the effects of training data selection on the landslide susceptibility mapping: a comparison between support vector machine (SVM), logistic regression (LR) and artificial neural networks (ANN)" 9 : 49-69, 2018

      35 Tien Bui, D., "Application of support vector machines in landslide susceptibility assessment for the Hoa Binh province (Vietnam) with kernel functions analysis" International Environmental Modelling and Software Society 2012

      36 Myles, A. J., "An introduction to decision tree modeling" 18 : 275-285, 2004

      37 Hamza, M., "An empirical comparison of ensemble methods based on classification trees" 75 : 629-643, 2005

      38 Paola, J. D., "A review and analysis of backpropagation neural networks for classification of remotely-sensed multi-spectral imagery" 16 : 3033-3058, 1995

      39 Pradhan, B., "A comparative study on the predictive ability of the decision tree, support vector machine and neuro-fuzzy models in landslide susceptibility mapping using GIS" 51 : 350-365, 2013

      40 Chen, W., "A comparative study of logistic model tree, random forest, and classification and regression tree models for spatial prediction of landslide susceptibility" 151 : 147-160, 2017

      41 Pham, B. T., "A comparative study of different machine learning methods for landslide susceptibility assessment: a case study of Uttarakhand area (India)" 84 : 240-250, 2016

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2023 평가예정 해외DB학술지평가 신청대상 (해외등재 학술지 평가)
      2020-01-01 평가 등재학술지 유지 (해외등재 학술지 평가) KCI등재
      2013-01-01 평가 등재 1차 FAIL (등재유지) KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2006-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2004-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2001-07-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      1999-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.35 0.35 0.34
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.29 0.27 0.625 0.19
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼