http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
기계학습 기반 대학원생 학업중단 예측 연구: K 대학을 중심으로
김태윤 ( Taeyoon Kim ),윤병연 ( Byungyeon Yun ) 한국교육정보미디어학회 2024 교육정보미디어연구 Vol.30 No.2
본 연구는 대학원생의 학업중단을 예측하고 학업중단에 영향을 미치는 요인에 대한 탐구를 목적으로 한다. 이를 위해 기계학습 방법을 이용하였으며, 구체적으로는 부스팅 계열의 XGBoost 알고리즘을 활용하였다. K대학의 2020년~2022년 입학생 데이터를 활용하였으며, 이들의 학적, 장학, 연구 등의 교내 데이터를 분석하였다. 모델의 성능을 측정한 결과, F1-score는 0.7417, AUC는 0.9515가 나왔다. 성능 평가 후, SHAP 라이브러리를 통해 학업중단에 영향을 끼치는 피처를 확인하였다. 상위 10개의 피처로 분석 시점까지의 월수, 학점, LMS 접속 횟수, 학적 변동 수, 휴학(일반 휴학) 횟수, 연구비 합, 포털 접속 횟수, 입학 학기, 장학금액, 나이 피처를 확인할 수 있었다. 이러한 연구 결과를 통해 다음과 같은 교육적 시사점을 도출하였다. 첫째, 대학원생들은 학교 생활을 어느 정도 한 시점에서 학업을 중단하므로, 학교 차원에서 대학원생들의 생활에 관심을 갖고 이들의 어려움을 들으려 하는 노력이 필요하다. 둘째, 학업중단의 위험신호를 포착할 수 있는 교육행정적 장치가 필요하다. 데이터베이스에 별도의 테이블을 만들거나, 학적 데이터에 추가로 기록하는 등의 방식을 통해 학업중단의 신호를 포착할 수 있다. 셋째, 학교 차원에서 대학원생들이 연구 과제를 보다 많이 수행할 수 있게 하고, 학생들이 장학금 정보에 쉽게 접근할 수 있게 하는 등의 노력이 필요하다. 본 연구의 한계점으로는 재현율의 아쉬움, 임계값에 대한 수정 필요성, 구체적인 시스템의 미비를 들 수 있다. 이같은 시사점과 한계점을 바탕으로 본 연구는 대학원생 학업중단을 예측할 수 있는 시스템 구축의 필요성과 방법을 역설하였고, 추가적인 연구를 위한 데이터 확보와 데이터 활용 방안 마련을 촉구하였다. This study aims to predict graduate student dropout rates and explore the factors influencing academic discontinuation. Machine learning methods were utilized, specifically the XGBoost algorithm within the boosting family. Data from students admitted to K University from 2020 to 2022 were analyzed, including their academic records, scholarships, and research activities. After evaluating the performance, the SHAP library was used to identify features that impact dropout. The top 10 influential features were enrolled months, grades, LMS login counts, changes in academic status, number of semesters off, total research funding, portal login counts, admission semester, scholarship amounts, and age. Educational implications derived from the results include the following: First, institutions need to address and listen to difficulties graduate students face to prevent dropout. Second, a model should be implemented to detect early signs of dropout risk, possibly by enhancing database. Third, attempts should be taken to increase graduate student participation in research and improve access to scholarship information. The limitations of this study include a disappointing recall rate, the need to adjust the threshold, and the lack of a specific system. Based on these implications and limitations, this study underscores the necessity and method for developing a system to predict graduate student dropout, advocating for the acquisition and utilization of additional data for further research.