RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        SOLAR SEG 데이터세트 : 태양광 패널 표면 위 오염 세그멘테이션 데이터세트 구축

        가을,최상현,나스리디노프 아지즈 한국콘텐츠학회 2024 한국콘텐츠학회논문지 Vol.24 No.7

        최근 지구 온난화가 심화되면서 태양광 에너지의 수요가 급증하고 있다. 다만, 태양광 발전의 중요 부품인 패널은 실외에 설치되어 다양한 오염에 쉽게 노출된다. 이러한 오염은 발전량을 감소시키는 주된 원인이기 때문에 태양광 패널의 오염 여부를 조기에 감지할 필요가 있다. 오염을 정확하게 감지하기 위해서는 오염의 종류와 형태를 고려해야 한다. 하지만 이를 모두 고려한 데이터세트는 부족한 실정이다. 본 연구는 태양광 패널 위 오염의 종류 및 형태를 모두 고려한 SOLAR SEG 데이터세트(Soiling On soLar pAnel suRface for SEGmentation dataset)를 소개한다. 데이터 수집은 2023년 3월부터 5월까지 아침·점심·저녁 시간대에 진행됐다. 또한 효율적인 오염 생성을 위해 오염생성 사이클을 정의했다. 이 데이터세트는 오염된 태양광 패널 이미지와 그에 대한 세그멘테이션 라벨링 데이터를 포함한다. 또한 데이터세트의 유용성을 검증하기 위해서 이미지 세그멘테이션 모델인 FCN(Fully Convolutional Networks)를 이용한다. 해당 데이터세트로 훈련한 FCN은 정확도는 95.60%, 클래스 정확도는 90.78%, mIoU는 82.17%으로 높은 성능을 보였다. 이러한 실험 결과를 바탕으로 본 논문은 SOLAR SEG 데이터세트 구축과정을 구체적으로 기술함으로써 태양광 패널 표면 위 오염과 관련된 후속 연구에 기여한다. Due to the worsening global warming, the demand for solar energy is rapidly increasing. However, solar power generation has the problem of various soiling accumulations as the panels are exposed to the natural environment. To analyze such soiling, both the type and the shape of soiling must be considered. However, existing datasets often do not consider these factors. This study introduces the SOLAR SEG dataset (Soiling On soLar pAnel suRface for SEGmentation dataset), which considers both the type and shape of soiling on solar panels. Data collection was conducted during morning, afternoon, and dinner hours from March to May 2023. Additionally, a 'soiling generation cycle' was defined for efficient soiling generations. This dataset contains images of dirty panels and their segmentation labeling data. Additionally, Fully Convolutional Networks (FCN), an image segmentation model, is used to verify the usefulness of this dataset. The FCN trained with the dataset showed high performance with an accuracy of 95.60%, class accuracy of 90.78%, and mIoU of 82.17%. By describing the process of constructing this SOLAR SEG dataset, we contribute to subsequent research on soiling on solar panel surfaces.

      • KCI등재

        데이터 무제한 요금제가 모바일 서비스 이용 행태에 미치는 영향

        이광훈(Gwanghoon Lee) 한국자료분석학회 2020 Journal of the Korean Data Analysis Society Vol.22 No.1

        본 논문은 무선 인터넷의 광대역화 속에 그 중요성이 커지고 있는 데이터 요금제가 다양한 모바일 서비스들의 이용에 있어서 어떠한 영향을 미치는지에 대한 함의를 얻기 위해, 한국 미디어 패널의 원시 자료를 바탕으로 2012년-2017년간의 패널 자료를 구축하여 분석하였다. 고정효과와 시간효과를 포함한 패널 모형의 추정 결과, 데이터 무제한 요금제의 가입은 모바일 실시간 방송의 시청을 증가시키고, 방송 이외의 모바일 동영상 서비스의 이용도 함께 증가시키는 것으로 나타났다. 또한, 데이터 무제한 요금제 가입은 전통적 커뮤니케이션 서비스인 음성통화와 문자 서비스의 이용은 감소시키는 반면에, 채팅 서비스의 이용은 증가시켰다. 한편 데이터 무제한 요금제의 가입이 모바일 영상 서비스의 이용을 증가시킴에도 불구하고, 가정용 TV를 통한 방송 시청 역시 같이 증가시키는 것으로 나타나고 있으며, 무선 인터넷의 광역화와 데이터 이용비용의 감소가 스마트폰과 가정용 TV 간의 대체를 결과하기보다는 보완적인 역할을 하게 하는 것으로 나타났다. 이러한 결과들은 현재 진행 중인 4G에서 5G 서비스로의 전환과 관련하여, 더욱 넓어지게 되는 대역의 무선 인터넷 서비스와 데이터 무제한 요금제의 확산이 결합하여, 향후 모바일 서비스 이용을 어떤 방향으로 변화시킬지에 대한 일정한 시사점을 제공해 준다. This paper analyzes the panel data constructed from Korean media panel survey to gain implications as to how the unlimited data plan affects the usage of various mobile services. The estimation of panel model with fixed effects and time effects provides the results that subscription of unlimited data plan increases the viewing of mobile real-time broadcasting and increases usage of non-broadcasting mobile video service. In addition, subscriptions to unlimited data plans have reduced the use of traditional communications services such as voice and text services, while increasing the use of chat services. On the other hand, even though subscription of unlimited data plan increases the viewing of mobile broadcasting, it also increases TV viewing. This implies that the broadband wireless internet and reduction of data usage cost result in complementarity rather than substitution between smartphone and home TV in viewing broadcasting. These findings will have implications for the direction of future mobile services during the transition from 4G to 5G services.

      • KCI등재

        데이터 마이닝 기법을 통한 교육 패널데이터 분석

        유진은(兪鎭銀) 서울대학교 교육연구소 2016 아시아교육연구 Vol.17 No.3

        명확한 기존 이론이 없어도 축적된 데이터 분석을 통하여 결과를 도출할 수 있는 데이터 마이닝 기법이 빅데이터 시대에 각광을 받고 있다. 수렴 또는 과적합 등의 문제로 인해 소수의 변수만을 모형화해 온 기존 연구방법과 달리, 데이터 마이닝 기법으로는 수백 개의 변수를 한 모형에 투입할 수 있으며, 따라서 연구방법적 측면에서 여러 장점을 가진다. 국가기관에서 십수년 간 수집해 온 교육 패널자료는 양적 · 질적인 측면에서 데이터 마이닝기법 적용에 적절하다. 본 연구는 빅데이터 분석에서 자주 이용되는 벌점회귀모형인 LASSO를 KYPS 5차 자료분석에 이용함으로써 데이터 마이닝 기법의 교육 패널자료 적용 사례를 제시하였다. 수십 개의 변수만을 이용하였던 기존 연구와 달리, 본 연구는 총 315개의 설명변수를 한 모형에 투입하여 15개의 변수를 선택하였다. 기존 연구에서 모형화된 변수뿐만 아니라 새로운 변수를 발굴할 수 있었다. 본 연구의 함의 및 후속 연구 주제 또한 논의되었다. With the advent of so-called big data era, data mining techniques have come to the fore as big data analysis tools. Unlike conventional statistical methods, data mining techniques can handle hundreds of variables in one model without convergence or overfitting problems. However, studies in the field of education have not yet paid enough attention to recent data mining techniques. Particularly, panel data with its hundreds of variables and thousands of participants can fit data mining techniques. This study aimed to illustrate a popular data mining technique, LASSO, by applying it to the 5th wave of KYPS (Korea Youth Panel Study). A penalized LASSO regression was executed with 10-fold cross-validation via deviance, and was successfully applied to the social sciences panel data. Implications of the study are discussed as well as further research topics.

      • 사학연금 패널조사의 도입방안에 관한 연구

        김영식 사립학교교직원연금공단 2021 사학연금연구 Vol.6 No.-

        데이터를 이용한 정책결정과 집행, 그리고 세부적인 사업추진에 있어 객관적이고 과학적인 조사에 근거한 자료 및 데이터의 활용은 최근 4차 산업혁명 시대에 중요한 요소로 자리잡고 있다. 본 연구의 목적은 공단의 고객이라고 볼 수 있는 사립학교교직원들에 대한 조사를 통해 데이터를 생성하여 통계를 작성하기 위한 사학연금 패널조사에 대한 도입방안을 마련하는 것이다. 본 연구가 도입하려는 방식은 기존 패널조사에서 탈피하여, 4000명을 표본으로 하며, 다단계층화추출법을 이용한다. 초기에 온라인 조사후 장기적으로 연금패널의 통합을 제안한다. 공단의 고객에 대한 정보 확보는 향후 지표를 개발하고, 동시에 해당지표를 통해 경영전략을 더욱 체계화할 수 있다. 더불어, 해당사업의 조사를 통해 고객에 대한 통계작성 및 분석을 통해 사학연금제도의 지속가능성을 확보할 수 있을 것으로 기대된다. 실제 패널조사가 도입되기 위해서는 예산 및 인력이 뒷받침되어야 하기 때문에 후속조치가 이루어져야 할 것이다.

      • KCI등재

        대학교육 질 관리를 위한 학습자 패널 데이터 타당화 연구

        이훈병 ( Lee Hunbyoung ) 아시아문화학술원 2017 인문사회 21 Vol.8 No.6

        본 연구는 대학교육의 질 제고를 위한 패널조사의 주요영역 및 요소들을 선정하고 타당성을 제시하는데 목적을 둔다. 본 연구는 교수와 직원을 대상으로 내용타당도 비율검사, 요인분석, 신뢰도 분석을 실시하였다. 연구결과를 살펴보면 다음과 같다. 첫째, 대학교육 질 관리를 위한 학생 패널데이터는 입학, 학교생활, 졸업 및 취업 3영역에 총 34개(입학 9개, 학교생활 17개, 그리고 졸업 및 취업 8개) 항목이 패널데이터로서 타당성을 확보하였다. 둘째, 대학교육 질 관리를 위한 요인은 3영역 6개 요인으로 나타났다. 요인분석 결과 입학영역은 입학점수, 학과, 가족관계 요인으로, 학교생활 영역은 상담 및 진단검사, 학습활동성과와 기대, 전공, 진로 전망 요인으로, 그리고 졸업 및 취업 영역은 취업내용, 취업노력, 전공일치도 요인으로 분류되었다. 효과적인 패널 운영 및 패널데이터 수집 및 분석을 위해서는 첫째, 개인정보보호를 위한 대책이 요구된다. 둘째, 전담관리 조직 및 관련부서들의 협조가 필요하다. 셋째, 무응답 또는 표본이탈 방지 노력에 요구된다. 넷째, 패널자료의 적극적 이용 및 이용 활성화 방안이 모색되어야 한다. 추후 본 연구결과를 바탕으로 패널데이터를 이용한 다양한 교육성과 분석 연구를 모색하고자 한다. The purpose of this study is to select and validate the areas and items of the panel survey. The analytical methods used are the content validity ratio test, factor analysis, and reliability analysis. The results are as follows. Firstly, the panel data area for the quality management was selected as admission, school life, graduation&employment. A total of 34 items (9 for “entrance”, 17 for “school life”, and 8 for “graduation&employment”) were selected as the panel data. Secondly, the areas for panel data consist of three domains and six factors. In the factor analysis, the “entrance” consisted of entrance score, department, and family. The “school life” consisted of counseling&diagnostic tests, learning outcomes&expectations, major and career prospects. The “graduation&employment” consisted of the employment, efforts for employment, major adjustment. The suggestions are as follows. ① A plan for protecting personal information is required. ② It is necessary to create a management organization and cooperate with related departments. ③ It is required for the efforts to prevent non-response&sample deviation. ④ Utilization of panel data should be considered. Based on the results of this study, we will conduct various performance analysis studies using panel data.

      • KCI우수등재

        맞춤형 커튼월 패널의 꼭짓점 좌표데이터 전이를 통한 BIM 형태 구축 프로세스 모델 연구

        고성학 대한건축학회 2019 대한건축학회논문집 Vol.35 No.11

        The purpose of this study is to propose a modeling methodology through the exchange of coordinate data of a three-dimensional customcurtain wall panel between Rhino and Revit, and to examine the validity of the model implemented in the drawing. Although the modelingmeans and method are different, a fundamental principle is that all three-dimensional modeling begins by defining the position of the points,the most primitive element of geometry, in the XYZ coordinate space. For the BIM modeling methodology proposal based on this geometrybasic concept, the functions and characteristics associated with the points of Rhino and Revit programs are identified, and then BIMimplementation process model is organized and systemized through the setting of the interoperability process algorithm. The BIMimplementation process model proposed in this study is (1) Modeling and panelizing surface into individual panels using Rhino andGrasshopper; (2) Extraction of vertex coordinate data from individual panels and create CSV file; (3) Curtain wall modeling through AdaptiveComponent Family in Revit and (4) Automatic creation of Revit curtain wall panels through API. The proposed process model is expected tohelp reduce design errors and improve component and construction quality by automatically converting general elements into architecturalmeaningful information, automating a set of processes that build them into BIM data, and enabling consistent and integrated designmanagement. 비정형 건축물의 BIM 구현에 관한 연구는 계속 진행되고 있으나, 비정형 건축물의 형태와 외관을 구성하는 다양한 형상의 패널을 구현하는 구체적인 프로세스에 관한 연구는 미비한 상태이다. 이에 본 연구에서는 라이노와 레빗간의 3차원 맞춤형 커튼월 패널의 꼭짓점 좌표데이터 교환을 통한 비정형 건축물의 형태 구축의 모델링 방법론 제시와 더불어 도면생성에 있어 구현된 모델의 유효성 검토를 본 연구의 목적으로 한다. 모델링 기반이 다르다 하더라고 공통된 원칙은 모든 3차원 모델링은 XYZ 좌표 공간에 기하학의 가장 기본이 되는 요소인 점의 위치를 규정하는 것에서부터 시작한다는 것이다. 이러한 기하학의 가장 기본이 되는 점에서 출발하며, 라이노와 레빗 프로그램의 점과 연관된 특성 파악을 통해 비정형 BIM 구축 프로세스 모델을 체계화한다. 본 연구에서 제시하고 있는 BIM 구축 프로세스 모델은 1. 라이노와 그래스호퍼를 이용한 모델링 및 개별 패널화, 2. 개별 패널의 꼭짓점 좌표데이터 추출, 3. Adaptive 컴포넌트 Family를 통한 커튼월 모델링, 4. 데이터 매칭을 통한 레빗 커튼월 패널 자동 생성의 4단계로 구성된다. 제안된 프로세스 모델은 비정형 건축 설계단계에서 생성된 비정형 객체들을 건축적으로 의미 있는 건축 정보로 자동변환하고, 이를 BIM 데이터로 구축하는 일련의 과정들을 자동화함으로써 비정형 건축 설계 데이터 구축에 대한 설계 시간을 감소할 수 있으며, 설계 데이터에 대한 일관성 있는 통합적인 관리가 가능하게 하여, 설계 오류를 감소시키고, 부재제작 및 시공의 품질을 높이는 데 이바지할 수 있을 것으로 기대된다. 아울러 본 연구의 비정형 형태 매스에 외피 패널을 생성하는 프로세스 모델 연구로 기하학의 가장 기본이 되는 점, 선, 면이라는 기본 개념에서 출발하여, 각각의 프로그램의 특성을 파악하고 이를 통해 BIM 데이터 구축의 의의가 있다고 할 수 있다.

      • KCI등재

        R&D 툭자 촉진을 위한 재정지원정책의 효과분석

        송종국 ( Jong Guk Song ),김혁준 ( Hyuk Joon Kim ) 기술경영경제학회 2009 Journal of Technology Innovation Vol.17 No.1

        최근 외환위기 이후 기업 R&D 투자의 실질증가율이 외환위기 이전의 절반에 가까운 평균 약 7.1%로 떨어지고 있으며, 대기업에 비해 중소기업에 대한 정부의 R&D 투자지원이 상대적으로 유리한 데도 중소기업의 R&D 투자 비중은 줄어들고 있다. 또한 1990년대 중반부터 상위 3개 기업을 제외한 대기업 R&D 투자는 증가하지 않고 있어 대기업 간의 R&D 투자 양극화 현상이 나타나고 있다. 이러한 기업의 R&D 투자 현상의 원인이 무엇인지 분석해 볼 필요가 있다. 또한 정부의 R&D 직접 보조금 정책이나 조세지원 정책의 당위성에 대해서 이론적으로나 현실적으로 그 필요성이 인정되더라도 정책의 효율성에 대해서는 검증해 보아야 할 것이다. 본 연구에서는 우리 정부가 가장 보편적으로 활용하고 있는 R&D 보조금 지원제도와 조세 지원제도가 과연 효과가 있는지를 실증 분석을 통해 검증해 보려고 한다. 특히 우리나라의 재정지원제도는 대기업과 중소기업 간에 차별적으로 적용되고 있기 때문에 기업 규모에 따른 정책 효과를 구분하여 분석한다. 본 연구의 실종 분석에 이용한 개별 기업의 R&D 데이터는 2002년에서 2005년까지 기업의 연구개발 활동에 대해 서베이 한「과학기술연구개발활동 조사보고」의 기업별 원시 패널 데이터 중에서 활용한 불균형(unbalanced) 패널 데이터이다. 각 기업의 보조금과 관련한 데이터는 「과학기술연구개발활동조사보고」의 서베이 데이터를 사용했으며, 조세지원을 나타내는 사용자 비용에 관한 데이터는 이론적 모형에서 도출하였다. 본 연구의 패널 데이터 분석은 고정효과 모형을 대기업, 중소기업 및 모든 기업에 각각 적용했다. 본 연구의 실증 분석 결과는 다음과 같다. 정부의 직접 보조금 지원은 대기업의 경우 R&D 투자를 늘리는 유인효과(crowding-in effect)를 보인데 반해, 중소기업은 R&D 투자를 줄이는 구축효과(crowding-out effect)가 나타났다. 그러나 대기업이나 중소기업 모두 정부의 보조금 지원정책에 대한 반응이 매우 비탄력적으로 추정되었기 때문에 R&D 보조금 지원정책이 기업의 R&D 투자에 미치는 영향은 매우 낮은 것으로 판단된다. 정부의 R&D 조세지원은 대기업과 중소기업의 R&D 투자를 유인하는 것으로 분석되었으며, 특히 중소기업보다 대기업의 R&D 촉진에 더 효과적인 것으로 나타났다. 조세지원으로 사용자 비용이 1% 감소하면 대기업은 R&D 투자를 0.99% 증가시키고, 중소기업은 0.054% 증가시키는 것으로 추정되었다. 본 연구의 분석 결과에서 시사하는 정부의 R&D 재정지원제도의 개선 방향은 다음과 같이 요약할 수 있다. 정부의 R&D 보조금은 기업의 R&D 투자를 구축하지 않도록 기업과 중복되지 않는 기초연구와 공공기술 지원에 국한해야 하며, 중소기업에 대해서는 R&D 인프라 구축과 기술정보지원 등 R&D 서비스(extension service) 지원에 초점을 두어야 할 것이다. 대기업에 대한 R&D 조세지원은 한시적으로 강화할 필요가 있다. 본 연구는 4개 연도의 기업 패널 데이터를 활용하였는데, 앞으로 정책의 효과를 장기간에 걸쳐 분석할 수 있는 거시 시계열 데이터를 활용한 분석의 보완이 필요하디; 또한 기업의 R&D 투자 촉진 외에도 일반 투자나 기타 목적을 위해 시행되고 있는 정부의 재정 정책들과의 대제 혹은 보완 관계의 여부를 검증해 볼 필요가 있다. 특히 중소기업의 시설투자 세액 공 제와 R&D 투자 세액공제 제도의 혜택은 단기투자와 장기투자를 선택해야 하는 기엽의 의사 결정에 영향을 줄 수 있다. Recently we have found some symptoms that R&D fiscal incentives might not work well what it has intended through the analysis of current statistics of firm`s R&D data. Firstly, we found that the growth rate of R&D investment in private sector during the recent decade has been slowdown. The average of growth rate (real value) of R&D investment is 7.1% from 1998 to 2005, while it was 13.9% from 1980 to 1997. Secondly, the relative share of R&D investment of SME has been decreased to 21%(`05) from 29%(`01), even though the tax credit for SME has been more beneficial than large size firm. Thirdly, The R&D expenditure of large size firms (besides 3 leading firms) has not been increased since late of 1990s. We need to find some evidence whether fiscal incentives are effective in increasing firm`s R&D investment. To analyse econometric model we use firm level unbalanced panel data for 4 years (from 2002 to 2005) derived from MOST database compiled from the annual survey, 「Report on the Survey of Research and Development in Science and Technology」, Also we use fixed effect model (Hausman test results accept fixed effect model with 1% of significant level) and estimate the model for all firms, large firms and SME respectively. We have following results from the analysis of econometric model. For large firm: i) R&D investment responds elastically 0.20) to sales volume. ii) government R&D subsidy induces R&D investment (0.03) not so effectively. iii) Tax price elasticity is almost unity (-0.99). iv) For large firm tax incentive is more effective than R&D subsidy For SME: i) Sales volume increase R&D investment of SME (0.043) not so effectively. ii) government R&D subsidy is crowding out R&D investment of SME not seriously (-0.0079) iii) Tax price elasticity is very inelastic (-0.054) To compare with other studies, Koga(2003) has a similar result of tax price elasticity for Japanese firm (-1.0036), Hall((1992) has a unit tax price elasticity, Bloom et al. (2002) has -0.354~-0.124 in the short run. From the results of our analysis we recommend that government R&D subsidy has to focus on such an areas like basic research and public sector (defense, energy, health etc.) not overlapped private R&D sector. For SME government has to focus on establishing R&D infrastructure. To promote tax incentive policy, we need to strengthen the tax incentive scheme for large size firm`s R&D investment. We recommend tax credit for large size film be extended to total volume of R&D investment.

      • KCI등재

        패널모형을 이용한 도시특성요소가 범죄 발생에 미치는 영향 분석

        이효진,이재송,최열,Lee, Hyo Jin,Lee, Jae Song,Choi, Yeol 대한토목학회 2015 대한토목학회논문집 Vol.35 No.6

        본 연구는 사회학적 범죄이론에 근거하여 도시 지역의 특징과 범죄 발생 간의 관련성을 규명함으로써 효과적인 범죄예방 대책을 수립하는데 도움이 되고자 하였다. 연구를 위하여 지난 8년간(2005~2012) 대검찰청의 범죄데이터와 지역별 통계연보 등을 통한 인구사회학적 데이터를 이용하여 패널데이터를 구축하였고, 부산시의 16개의 구 군을 대상으로 패널모형으로 분석하였다. 분석결과를 바탕으로 범죄 발생을 줄이고, 범죄예방을 위해서는 첫째, 일반적인 범죄 예방책보다는 지역의 특성에 적합한 정책이 필요하다. 둘째, 범죄연구에 필요한 구체적이고, 정확한 범죄데이터를 활용할 수 있는 제도적 시스템이나 정책이 필요하다. 셋째, 앞으로도 사회과학분야의 제도와 함께 도시공학 및 여러 학문들이 연계된 연구의 수행이 이루어져야 할 것이다. This study, based on the sociological crime theory, is to examine the relation between urban characteristics and the incidence of crime, helping establish effective crime prevention measures. For doing so, the study employs crime data from the Supreme Prosecutors' Office and socio-demographic data including the regional Statistical Yearbooks -both from 2005 to 2012- to build the study's panel data, and analyzes the panel model on the 16 subordinate districts in the city of Busan. To reduce the incidence of crime and prevent crimes from occurring based on the analysis results, first, prevention measures specific to each region by its attributes are needed rather than general ones; second, new institutional frameworks or policies are required for utilizing accurate crime data; third, interdisciplinary research in which various fields including urban engineering are associated to that of social science is necessary to further the study.

      • KCI등재
      • KCI등재

        회귀나무 모형을 이용한 패널데이터 분석

        장영재,Chang, Youngjae 한국데이터정보과학회 2014 한국데이터정보과학회지 Vol.25 No.6

        회귀나무 (regression tree)는 독립변수로 이루어진 공간을 재귀적으로 분할하고 해당 영역에서 종속변수의 최선의 예측값을 찾고자 하는 비모수적 방법론이다. 회귀나무 모형이 제안된 이래 로지스틱 회귀나무모형이나 분위수 회귀나무모형과 같이 유연하고 다양한 모형적합을 위한 연구가 진행되어 왔다. 최근에 들어서는 Sela와 Simonoff (2012)의 RE-EM 알고리즘, Loh와 Zheng (2013)의 GUIDE 등 패널데이터와 관련하여 진일보한 나무모형 알고리즘도 제안되었다. 본 논문에서는 각 알고리즘을 소개하고 특징을 살펴보는 한편, 실험 데이터를 생성하여 평균제곱오차 (mean squared error)를 바탕으로 예측력을 비교하였다. 분석결과, RE-EM 알고리즘의 예측력이 상대적으로 우수하게 나타났다. 이 알고리즘을 통해 기업경기실사지수 업종별 패널자료를 분석한 결과 최근의 업황에 가장 큰 영향을 미치는 요소는 매출 실적으로 나타났으며 매출 상위 그룹의 경우 비제조업이 제조업에 비해 업황에 대한 판단이 긍정적인 것으로 나타났다. Regression tree is a tree-structured solution in which a simple regression model is fitted to the data in each node made by recursive partitioning of predictor space. There have been many efforts to apply tree algorithms to various regression problems like logistic regression and quantile regression. Recently, algorithms have been expanded to the panel data analysis such as RE-EM algorithm by Sela and Simonoff (2012), and extension of GUIDE by Loh and Zheng (2013). The algorithms are briefly introduced and prediction accuracy of three methods are compared in this paper. In general, RE-EM shows good prediction accuracy with least MSE's in the simulation study. A RE-EM tree fitted to business survey index (BSI) panel data shows that sales BSI is the main factor which affects business entrepreneurs' economic sentiment. The economic sentiment BSI of non-manufacturing industries is higher than that of manufacturing ones among the relatively high sales group.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼