RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        출산율 예측모형을 이용한 한국의 출산력 시나리오 분석

        김기환,전새봄,Kim, Keewhan,Jeon, Saebom 한국통계학회 2015 응용통계연구 Vol.28 No.4

        한국의 지속적인 저출산은 세계적으로 유례가 없을 정도의 급격한 고령화 속도와 맞물려 국가경쟁력 및 사회보장 시스템을 약화시키는 요인이 되었다. 저출산 문제를 해결하기 위하여 정부에서는 각종 출산장려정책을 실시하고 있으나, 현재까지 저출산에서 벗어나지 못하고 있어 정책이 효과적이지 못하였던 것으로 평가된다. 그러므로 본 연구에서는 보다 효과적인 정책개발의 근간을 마련하기 위하여 조건부 순위별 출산율을 제안하고, 이를 이용하여 한국의 출산정책 효과를 파악하였다. 조건부 순위별 출산율을 사용하면 순위별 출산율을 사용하는 것보다 합계출산율의 변화와 효과를 명확히 산출할 수 있으므로, 다양한 순위별 출산율의 시나리오에 따라 합계출산율의 변화를 비교하였다. 이를 통하여 현재 정부의 셋째 아 출산지원 정책으로 도달할 수 있는 합계출산율 및 둘째 아 또는 첫째 아의 출산지원을 하였을 때 도달할 수 있는 합계출산율을 산출할 수 있었다. 또한 지속적인 저출산으로 빠르게 감소하고 있는 가임여성(15-49세)을 고려하여 합계출산율에 따른 출생아수를 함께 제시하여 실질적인 출생아수의 증가를 유도하는 정책개발에 도움이 될 수 있도록 연구결과를 정리하였다. The low fertility rate and the unprecedented rapid pace of population aging is a significant factor degrading the national competitiveness and the social security system of Korea. The government has implemented various maternity incentives to alleviate the low birth problem; however, the policy seems in effective to solve the problem of low fertility. This study proposes a conditional birth-order specific fertility rate and investigates the policy effects of fertility transition in Korea to provide a basis for more effective policy development. The use of a conditional birth-order specific fertility rate allows for an effective calculation of the change and the effect in total fertility rate than a birth-order specific fertility rate. We compare the effects of the total fertility rate according to various scenarios that enables us to calculate how the total fertility rate can achieve the current multi-child childbirth support policy of the government and estimate how the total fertility rate can be achieved when focusing on the first or second childbirth support policy. We also summarize the research results on policy development for a practical increase in the childbirth that considers the rapid decrease in women of childbearing age (15-49 years) due to continued low fertility and present the number of childbirths in accordance with the total fertility rate.

      • KCI등재

        XAI SHAP 기반 토지 피복 구성에 따른 지표면 온도의 영향 분석

        이동찬(Dongchan Lee),김기환(Keewhan Kim) 한국자료분석학회 2023 Journal of the Korean Data Analysis Society Vol.25 No.5

        최근 인공지능 아키텍처의 발전과 하드웨어의 성능이 급속도로 개선되면서 다양한 인공지능모델들의 유용성이 증가하고 있다. 갈수록 복잡해지고 있는 인공지능 모델의 의사결정 분기점은 기하급수적으로 늘어나고 있으며, 이는 연구자의 모델 해석 용이성을 저해시키는 원인이 된다. 이에 따라 블랙박스 모형으로 알려진 인공지능 모형을 설명하기 위한 연구도 빠르게 발전하고 있다. 설명 가능한 인공지능(eXplainable Artificial Intelligence, XAI)은 위와 같은 복잡성을 해소하기 위해 등장하였으며, 모델의 블랙박스를 연구자가 이해 가능한 수준으로 분해하여 해석 가능성 및 신뢰도 제고에 도움을 준다. 본 연구는 서울특별시 셀(cell) 단위의 토지 피복 데이터를 이용하여 특정 공간 단위의 지표면 온도를 추정한다. 고차원 데이터에 대한 기존 통계모형의 한계를 살펴보았으며, 머신러닝 모델을 이용하여 추정 결과를 비교하였다. 사용한 모형으로는 Lasso(Least absolute shrinkage and selection operator) 회귀, 랜덤포레스트 회귀(random forest regression), XGBoost(eXtreme Gradient Boosting)가 있으며, XGBoost 모델의 적합 결과를 바탕으로 SHAP(SHapley Additive exPlanation)을 통한 XAI 점검을 시행하였다. Recently, with the development of artificial intelligence architecture and the rapid improvement of hardware performance, various artificial intelligence models are attracting attention and their usefulness are increasing. However, unlike the rate of development of performance, the development of model's explanatory ability is slow to progress. The increasingly complex decision branching points of AI models are increasing exponentially, which hinders researchers' ease of model interpretation. Explainable Artificial Intelligence, XAI has emerged to solve the above complexity, and helps to improve interpretability and reliability by decomposing the black box of the model to a level that researchers can understand. This study estimates the surface temperature of a specific spatial unit using land cover data of a cell unit in Korea, Seoul. The limitations of the existing statistical model for high-dimensional data were examined, and the estimation results were compared using a machine learning model. Models used include Lasso regression(Least absolute linkage and selection operator), random forest regression, and XGBoost (eXtreme Gradient Boosting) regression. Finally, based on the fitted result of the XGBoost regression model, XAI SHAP was carried out.

      • KCI등재

        오픈 데이터와 격자 시스템을 이용한 세종시 실제 인구 추정

        변상영(Sangyoung Byeon),김기환(Keewhan Kim) 한국자료분석학회 2020 Journal of the Korean Data Analysis Society Vol.22 No.5

        최근 인구자료는 용도의 다양화로 높은 공간 해상도에서도 활용할 수 있는 자료의 필요성이 높아지고 있다. 우리나라는 인구총조사를 2015년 서베이 방식에서 등록센서스 방식으로 전환한 후 매년 발표되는 공식인구는 작성과정에서 여러 행정자료가 사용되지만, 주민등록인구가 기반이 되고 있다. 매월 행정안전부에서 읍·면·동 수준까지 발표하는 주민등록인구는 17개 시도 인구보다 소규모 지역에 관한 자료이지만 적지 않게 발생하는 행정구역의 변화는 다양한 분야에서 인구자료의 활용에 걸림돌이 되고 있다. 이의 극복을 위해 필요한 것이 격자(grid) 기반의 인구이다. 이에 부응하여 통계청의 SGIS plus에서는 격자 기반의 인구를 제공하고 있지만 SGIS plus에서 제공하는 격자 인구는 실제로 활용하기에 문제점과 오류를 포함하고 있다. 따라서 본 연구에서는 세종특별자치시를 대상으로 SGIS plus에서 제공하는 격자 인구(gridded population)의 문제점과 오류를 해결하고, 월별 주민등록인구를 이용한 새로운 성·연령·월별 격자 인구를 추정하였다. 세종시를 대상으로 새로 추정된 격자 인구는 발표된 주민등록인구로 실거주 인구를 추정하는데 긍정적인 효과가 있음을 확인하였다. Recently, the demand for demographic data at a spatially downscaling level is increasing due to various uses. The official population, which is announced every year after the conversion of the register-based census from survey-based census in 2015, uses several administrative data during the preparation process, but the resident population is the basis. While the resident populations released by the Ministry of the Interior and Safety every month to the level of Eup, Myeon, and Dong are data on small areas compared to the population of 17 Sido, but the need for a grid-based population is increasing to utilize demographic data in various fields. In response, the National Statistical Office s SGIS plus provides a gridded population. However, the gridded population provided by SGIS plus contains problems and errors in its practical use. Therefore, this study solved the problems and errors of the gridded population provided by SGIS plus for Sejong-si and estimated the new gender, age, and monthly specific gridded population using the monthly resident population. It was confirmed that the newly estimated gridded population at Sejong city has a positive effect in estimating actual residence population using the resident population announced.

      • KCI등재

        모바일 기지국 데이터를 이용한 격자인구 추정

        이동찬(Dongchan Lee),김기환(Keewhan Kim) 한국자료분석학회 2021 Journal of the Korean Data Analysis Society Vol.23 No.4

        최근 통신기술의 발달과 스마트폰 보급의 증가에 따라 모바일 데이터 활용에 대한 필요성이 대두되고 있다. 모바일폰 사용자의 위치 정보를 저장하는 모바일 기지국(mobile station) 데이터는 실시간으로 변하는 지역 인구분포와 유동성을 보여주는 유일한 데이터이며, 높은 시·공간적 해상도를 갖는 모바일 기지국 데이터는 소지역추정(small area estimation) 연구에 있어서 양질의 데이터 자원이 된다. 소지역추정이란 공간적으로 더욱 상세하고 정확한 추정을 뜻하는데, 그 예로 모바일 데이터를 이용한 격자인구(gridded population) 추정을 들 수 있다. 본 연구는 특정 지역의 가상 기지국 데이터를 이용하여 100m 격자단위의 연령별, 시간대별 인구를 추정한다. 분석의 공간적 범위는 서울특별시 종로구로 설정하였다. 모바일 데이터를 이용한 인구추정에는 기존 연구에 제시된 방법인 최소제곱법(ordinary least square), 영역내삽(areal interpolation), 공간자기회귀모형(spatial autoregressive regression)을 정리하였다. 또한, 본 연구에서는 새로운 추정 방법으로 랜덤포레스트 회귀모형을 제안하였고, 추정값의 정수화를 위한 방안도 제시하였다. With the development of telecommunication technologies and the increase in smartphone penetration, the need for mobile data utilization is growing. Mobile station data that stores mobile phone users location information is the only data that shows local population distribution and liquidity changing in real time, and mobile data with high time and space resolution is a good data resource for small area estimation research. Small area estimation refers to a more detailed and accurate spatial estimation, for example, a lattice population estimation using mobile data. This study estimates populations by age and time zone in 100m grid using data from synthetic mobile stations in specific regions. The spatial scope of the analysis was set to Jongro-gu, Seoul. The population estimation using mobile data summarizes the methods presented in existing studies such as ordinal last square, areal interpolation, and spatial auto-regressive regression model. In addition, the newly proposed population estimation methods in this study include random forest regression. Measures for purification of estimated values are also proposed.

      • KCI등재

        혼인율 장기예측을 위한 Heuristic Lee-Carter 모형

        조윤랑(Yoonrang Cho),김기환(Keewhan Kim),김성용(Seonyong Kim),전새봄(Saebom Jeon) 한국자료분석학회 2018 Journal of the Korean Data Analysis Society Vol.20 No.1

        일반적으로 인구추계 및 가구추계에서는 추계(projection)를 위해 인구구성요인의 예측(forecast)기법을 적용하고 있다. 주관적인 요소나 전망을 최소화한다는 점에서 추계방법은 상대적으로 개선되어왔으나, 인구추계에 사용되는 기존의 Lee-Carter 모형에 기반한 예측방법은 급격한 변동을 보이는 인구동태의 경우에는 장기예측시 비현실적으로 과대 혹은 과소추정되는 추계결과를 초래할 수 있다. 일반적으로 우리나라와 같은 급격한 저출산·고령화와 같은 인구구조 변화에는 적정인구수준을 유지하기 위한 국가의 정책적 대응이 따르게 되고, 그로 인한 정책의 효과에 따라 장기적으로 혼인 및 출산 등 인구동태 역시 변화가 예상된다. 기존의 예측모형은 인구변동 추세에 변화가 예상되지만 이를 예측기법내에 반영할 수 없으므로 비현실적 추계결과를 야기한다. 이에 본 논문에서는 이러한 한계를 극복할 수 있는 새로운 예측모형을 제안한다. 본 논문에서는 인구추계에 사용되는 Lee-Carter 모형에 변화속도를 조절하는 계수를 추가한 Heuristic Lee-Carter 모형을 개발하였으며, 우리나라의 초혼율과 이혼율에 적용하여 예측성능을 평가한 결과 본 연구모형이 혼인율 장기예측에 적절함을 알 수 있었다. Generally, population projection and household projection use the forecasting method for population composition projection. The projection method has been relatively improved in terms of minimizing subjective prospect, but it can sometimes lead to unrealistic projection results in long-term forecasting when a rapid change in population dynamics. Demographic structure changes of Korea, such as rapid low birth rate and aging, are accompanied by policy responses, and in future population dynamics such as marriage and childbirth are expected to change according to the effect of policies. This paper proposes a prediction model that can be used in case where changes in the trends due to external intervention are expected but can not be reflected in the forecasting technique. In this paper, we developed a heuristic Lee-Carter model that adds a coefficient controlling the rate of change to the Lee-Carter model used in population projection, predictive performance of the first marriage rate and the divorce rate in Korea resulted that this proposed model is suitable for long-term marital rate prediction.

      • KCI등재

        XAI Grad-CAM 기반 궤양병 감귤 이미지 분류 CNN 모델의 점검

        이동찬(Dongchan Lee),변상영(Sangyoung Byeon),김기환(Keewhan Kim) 한국자료분석학회 2022 Journal of the Korean Data Analysis Society Vol.24 No.6

        하드웨어의 성능 및 정보처리 기술이 급격히 발전하면서 비정형 데이터의 처리 및 가치 창출에 관한 관심이 증가하고 있다. 이를 위한 다양한 인공지능 아키텍처들이 개발되고 있으며, 모델의 의사결정 분기점이 기하급수적으로 늘어나면서 큰 성능의 개선이 이루어지고 있다. 그러나복잡한 모델 구조는 연구자의 결과 해석 용이성을 저해하는 주요한 원인이 되며, 모델 성능의발전 속도와는 달리 설명 능력에 대해서는 진척이 더딘 실정이다. 설명 가능한 인공지능, 이하XAI(eXplainable Artificial Intelligence)는 위와 같은 문제를 해결하기 위해 등장하였으며, 모델의블랙박스를 이해 가능한 수준으로 분해하여 해석 가능성 및 신뢰도 제고에 도움을 준다. 본 연구에서는 CNN(Convolutional Neural Network) 모델을 사용하여 궤양병 감귤 이미지 분류 문제에접근하였으며, 최종적으로 설계한 모델은 약 97% 수준의 정확도를 보였다. 이후 모델의 신뢰성제고 및 개선 방향 판단을 위해 XAI 기법 중 하나인 Grad-CAM(Gradient-weighted Class Activation Mapping)을 적용하였으며, 이를 통해 구축한 모델이 최종적인 판단을 내리는데 중요한 역할을한 이미지의 특정 영역을 파악하는 과정을 진행하였다. 점검 결과 이미지 외곽의 형태가 객체와구분이 되지 않아 영향을 크게 받는 경우 및 특정 객체의 고유한 형태가 오분류 원인으로 감지되었다. By the rapid development of hardware performance and information processing technology, interest in processing unstructured data and creating value is increasing. Various types of AI architectures are being developed and as the decision-making junction of the model increased exponentially, the performance is being improved. However, complex model structure is a major cause of hindering researchers' ease of interpret results and unlike the speed of development of model performance, the progress is slow on explanatory ability. Explainable artificial intelligence (XAI) has emerged to solve this problem and decomposes the model's black box to an understandable level to help improve interpretability and reliability. In this research, we approach the ucler disease citrus image classification problem by using CNN model, and the final model showed approximately 97% accuracy. After that, to improve the reliability of the model and to determine the specific area of the image that played a major role in making the final judgment, Gradient-weighted Class Activation Mapping (Grad-CAM), one of the XAI techniques was applied. As a result of the inspection, it was detected that the shape outside the image wasn't distinguished from the object which was greatly affected. So, the unique shape of a specific object was the main cause of misclassification.

      • KCI등재

        CNN 기반 주간 위성 이미지를 활용한 격자 단위 인구추정

        변상영(Sangyoung Byeon),이동찬(Dongchan Lee),김기환(Keewhan Kim) 한국자료분석학회 2023 Journal of the Korean Data Analysis Society Vol.25 No.2

        인구 자료를 수집하는 전통적인 방법은 인구센서스와 인구동태조사이다. 대부분의 국가에서 이와 같은 방법을 현재까지도 사용하고 있지만 ICT 환경과 공공데이터 개방 추세에 따라 인구자료의 수집과 활용에 변화가 일어나고 있다. 우리나라가 2015년 도입한 행정자료 활용 등록센서스와 행정구역보다 상세한 소지역에 대한 인구추정이 예가 될 수 있다. 특히 소지역 인구추정에 위성이미지를 사용하는 연구들이 소개되고 있다. 초기에는 주로 야간 위성 이미지를 활용하였으나 딥러닝의 CNN 알고리즘이 소개된 이후 주간 위성 이미지를 활용하는 연구들이 소개되고 있다. 본 연구에서는 우리나라의 주간 위성 이미지와 CNN 이전학습을 이용하여 1km 격자인구 추정을 시도하였다. 추정 결과 추정 가능성은 확인하였으나, 기존 연구들처럼 만족스러운 결과는 얻지 못하였다. 개선된 격자 인구 추정값을 얻기 위해서는 국가 전체와 같은 큰 지역이 아닌 도시 단위와 같이 상대적으로 작은 지역에서 1km 보다 작은 격자를 대상으로 CNN 알고리즘을 적용하는 것이 유리할 수 있음을 확인하였다. The traditional methods of collecting population data are population census and vital data surveys. Although most countries still use this method, changes are taking place in the collection and utilization of population data according to the ICT environment and the trend of opening public data. An example is the register-based census using administrative data introduced by Korea in 2015 and population estimation for subregions that are more detailed than administrative districts. In particular, studies using satellite images for population estimation of subregions are being introduced. In the early days, night-time satellite images were mainly used, but after the deep learning CNN algorithm was introduced, studies using day-time satellite images have been introduced. In this study, we tried to estimate the 1km gridded population using day-time satellite images and CNN transfer learning in Korea. As a result of the study, the possibility of estimation was confirmed, but satisfactory results were not obtained like previous studies. In order to obtain improved gridded population estimates, it was confirmed that it may be advantageous to apply the CNN algorithm to a grid smaller than 1 km in a relatively small area such as a city rather than a large area such as the entire country.

      • KCI등재

        야간위성 이미지를 이용한 격자 단위 인구 추정모형 개발

        변상영(Sangyoung Byeon),이동찬(Dongchan Lee),김기환(Keewhan Kim) 한국자료분석학회 2022 Journal of the Korean Data Analysis Society Vol.24 No.1

        인구는 여러 가지 국가정책의 근간이 되는 자료이므로 이를 파악하는 것은 매우 중요한 일이나 모든 나라가 자국의 인구를 측정하는 제도를 잘 갖추고 있는 것은 아니다. 이런 경우는 실제인구가 아닌 추정인구로 국가의 인구를 대신한다. 주로 저개발국으로 분류되는 국가들의 인구를 추정하는 방법은 여러 가지가 있을 수 있으나 본 연구에서는 야간위성 이미지를 이용한 간접적 인구추정 방법을 제안하였다. 기존의 방법들이 야간위성 이미지를 인구추정을 위한 보조 정보로 사용하였다면, 본 연구에서 제안한 방법은 야간위성 이미지만으로 인구를 추정하는 모형을 제안하였다. 미국 해양대기청(National Oceanic and Atmospheric Administration, NOAA)에서 제공하는 Defense Meteorological Satellite Program(DMSP-OLS) 야간위성 이미지를 사용하여 격자 인구를 추정할 수 있도록 모형을 제안하였다. 모형개발을 위해 서울·수도권을 제외한 우리나라 야간위성 이미지와 격자 인구를 사용하였으며, 제안된 모형에서 최적의 결과를 얻기 위해 통계적 모형과 기계학습의 앙상블 모형을 비교하였다. 비교 결과 일반화 성능 관점에서 기계학습의 앙상블 모형이 우수한 것으로 나타났다. 본 연구에서 제안된 모형은 우리나라를 기반으로 작성되어 아직은 일반적으로 적용할 수 없으나 추후 연구에서 사례를 보강하여 이를 개선해나갈 것이다. Population data is the basis for many national policies. Therefore, it is very important to understand the population data. However, not all countries are well equipped with a system to measure their own population, so in this case, the estimated population rather than the actual population is substituted for the national population data. There may be several methods of estimating the population of countries classified as underdeveloped, but in this study, an indirect population estimation method using night satellite image was proposed. While known methods use night satellite images as auxiliary information for population estimation, the method proposed in this study proposes a model that estimates the population only with night satellite image. A model was proposed to estimate the grid population using the DMSP-OLS (Defense Meteorological Satellite Program) nighttime satellite image provided by the US NOAA (National Oceanic and Atmospheric Administration). For model development, South Korea s night satellite image and grid population were used excluding Seoul and the metropolitan area, and statistical models and ensemble models of machine learning were compared to obtain optimal results from the proposed model. As a result of comparison, it was found that the ensemble model was superior in terms of generalization performance. The model proposed in this study is based only on South Korea and cannot be generally applied yet, but it will be improved by reinforcing cases in future studies

      • KCI등재

        CNN 기반 위성 이미지를 활용한 북한의 도시 인구추정

        변상영(Sangyoung Byeon),이충열(Choong Lyol Lee),김기환(Keewhan Kim) 한국자료분석학회 2024 Journal of the Korean Data Analysis Society Vol.26 No.2

        북한은 공식적인 절차를 통해 인구데이터를 공개하지 않지만, 통계청, 인터넷 검색을 통해 북한의 인구와 관련된 자료를 확인할 수 있다. 그러나 이 데이터들은 1993년, 2008년에 유엔인구기금(UNFPA)의 지원을 받아 실시한 인구총조사를 기반으로 추정된 자료이고 신뢰성도 떨어지는 것으로 알려져 있다. 이에 본 연구에서는 북한의 현재 인구를 가늠하기 위한 첫 시도로 2023년 북한의 주간 위성 이미지를 이용하여 평양과 개성의 인구를 격자 단위로 추정하였다. 연구 결과로 CNN 기반 격자 단위 인구추정 모델을 개발하였다. 이 모형은 우리나라를 대상으로 CNN 모델을 훈련하고, 북한에 적용하는 것을 목표로 한다. 모형은 CNN의 대표적인 알고리즘인 VGG16 모델을 기반으로 전이학습을 하였으며, 주간 위성 이미지에서 나타나는 남북한의 계절 차이를 조정하기 위해 U-net을 활용하여 조정된 이미지를 사용하였다. 또한, 이웃효과(neighboring effects)를 추가하여 모델의 성능을 개선하였다. 모델 적합 결과 우리나라의 4대 광역시의 인구는 실제 인구와 큰 차이 없이 추정되었으며, 북한의 평양과 개성의 인구는 2008년 센서스인구와 유사하게 추정되어 만족스러운 결과를 보여주었다. North Korea does not officially disclose population data through formal procedures. However, information related to North Korea's population can be verified through KOSTAT or internet searches. Nevertheless, these data are based on population surveys conducted with the support of the United Nations Population Fund (UNFPA) in 1993 and 2008, and are known to be of questionable reliability. In this study, as an initial attempt to estimate the current population of North Korea, we utilized daytime satellite images from 2023 to estimate the populations of Pyongyang and Kaesong at the grid level. The research resulted in the development of a gridded population estimation model based on a Convolutional Neural Network (CNN). The model was trained on CNN using data from South Korea and aimed to be applied to North Korea. It employed the VGG16 model, a representative algorithm of CNN, for transfer learning. To account for seasonal differences in the images from daytime satellite data, a U-net was used for image adjustment. Furthermore, neighboring effects were incorporated to enhance the model's performance. The model fitting results indicated that the populations of the four major metropolitan cities in South Korea were estimated without significant differences from actual populations. The populations of Pyongyang and Kaesong in North Korea were also estimated to be similar to the 2008 census data, demonstrating satisfactory results.

      • KCI등재

        텍스트 데이터와 재정데이터를 이용한 사회정책분야 예산 분석

        이충열(Choong Lyol Lee),황명진(Myung Jin Hwang),김정학(Junghack Kim),이지나(Ji Na Lee),이동찬(Dongchan Lee),김기환(Keewhan Kim) 한국자료분석학회 2024 Journal of the Korean Data Analysis Society Vol.26 No.1

        본 연구는 AI, 빅데이터, 전문가 판단을 결합하여 정부의 세부 사업 예산을 분석한 것이다. 정부의 세부 사업을 기존 분류가 아닌 최근 발표된 ‘2023년 핵심 사회정책 추진계획’의 27개 사회정책 의제 분류를 사용했으며, 아울러 생애주기도 분류 기준으로 사용하였다. 세부 사업을 설명하는 텍스트 데이터의 의미를 파악하고 분류하기 위해 자연어 처리기술을 사용하였으며 2020~2023년 정부의 세부 사업과 예산을 27개 의제에 따라 성공적으로 분류하였다. 분류과정에서 ‘NKIS’, ‘열린재정’의 공공데이터를 활용하였으며 자연어처리 기술로는 KeyBERT를 사용하였다. 분류 결과 27개 의제에 따른 정부 세부 사업 건수 및 예산의 연도별 변화, 27개 의제별 세부사업의 불균형 정도를 확인할 수 있었다. 아울러 생애주기별 분류 결과 세부 사업과 예산이 누구를 위해 사용되고 있는지도 확인할 수 있었다. 최종 결과작성에서 자연어처리 기술이 많은 부분을 해결해 주었지만, 전문가의 지식과 판단이 중요한 역할을 하였다. 연구 결과에 따르면 효율적인 예산 집행, 행정기관 간 협력을 어떻게 해야 하는지에 관한 판단 근거를 찾을 수 있다. 또한 27개 사회정책 이슈, 생애주기 별로 좀 더 깊이 있는 분야별 연구가 가능할 것으로 기대된다. This study analyzed government detailed project budgets by combining AI, big data, and expert judgments. Instead of traditional classifications, the study used the 27 social policy agendas from the announced '2023 Core Social Policy Implementation Plan' to categorize government projects. Additionally, the life cycle was used as a classification criterion. Natural language processing(NLP) technology was employed to understand and classify textual data describing detailed projects, successfully classifying government projects and budgets from 2020 to 2023 according to the 27 agendas. Public data from 'NKIS' and 'Open Finance' were utilized in the classification, and KeyBERT was used for NLP. The classification results allowed the identification of annual changes in the number and budget of government projects according to the 27 agendas, as well as the degree of imbalance in detailed projects for each agenda. Furthermore, the classification results by life cycle provided insights into who the detailed projects and budgets are intended for. While NLP played a key role in the results, expert knowledge and judgment were crucial. The research findings suggest evidence for making judgments on efficient budget execution and interagency cooperation. The study also hints at the potential for more in-depth, field-specific research on the 27 social policy issues and life cycle.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼