RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      빅데이터를 이용한 딥러닝 기반의 기업 부도예측 연구

      한글로보기

      https://www.riss.kr/link?id=A105508499

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      Ⅰ. 연구배경 및 목적 ▣ 부도예측 모형은 금융 산업에서 항상 중요한 과제로 인식되어 지속적으로 발전하여 왔으나 여전히 중요한 연구 과제로 인식되고 있음. · 부도예측 모형은 그간의 ...

      Ⅰ. 연구배경 및 목적
      ▣ 부도예측 모형은 금융 산업에서 항상 중요한 과제로 인식되어 지속적으로 발전하여 왔으나 여전히 중요한 연구 과제로 인식되고 있음.
      · 부도예측 모형은 그간의 많은 연구로 정확도가 많이 향상되었으나. 거시경제 여건, 기업 경영환경 등이 급속하게 변화하여 부도 기업에 대한 정확한 예측은 여전히 어려운 과제임.
      ▣ 과거의 많은 연구는 기업에 대한 재무 정보와 시장 정보를 기반으로 부도예측을 수행
      · 재무 정보는 가장 객관적이고 세부적인 기업에 대한 정보임. 하지만 데이터 생성 주기가 상대적으로 길어(연도, 분기) 부도 예측의 적시성이 떨어지는 근원적인 한계가 있음.
      · 시장 정보는 유가증권 시장 참여자에 의하여 기업에 대한 정보가 가장 빠르게 반영된다는 장점이 있음. 하지만 유가증권시장 상장 기업만 활용이 가능하고, 주가에 영향을 주는 다른 요인에 대하여 영향을 통제하지 못하는 단점이 있음.
      ▣ IT 기술 및 데이터 분석 기법, 인공지능 기법의 발달로 인하여 새로운 데이터 원천인 뉴스 정보를 부도 예측 과정에 활용할 수 있음.
      · 빅데이터 연구 분야에 활용되는 텍스트마이닝과 인공지능기법을 활용하여 텍스트 정보를 측정 가능한 변수로 계량화하는 방법 적용
      · 뉴스 정보는 기업에 대한 가장 빠른 정보 원천 중 하나로 기업 부실의 징후를 사전적으로 알 수 있는 정보로서 충분한 가치가 있음.
      ▣ 본 연구는 기존의 연구를 기반으로 부도 예측 과정에서 1) 뉴스텍스트와 같은 새로운 정보 원천이 적용에 따라 부도 예측력을 높일 수 있는지, 2) 인공지능(딥러닝) 기법과 같은 새로운 방법론이 기존의 방법론에 비하여 예측 성능이 향상되는지 두가지 측면을 중점적으로 연구
      Ⅱ. 빅데이터 및 인공지능의 금융 관련 분야 활용 현황
      ▣ 빅데이터 및 인공지능 분야는 활용 가능한 데이터의 확대와 IT 기술 혁신을 기반으로 발전
      · 1) 분석가능한 데이터 양의 급격한 증가, 2) 복잡하고 방대한 데이터 분석을 위한 방법론의 발전, 3) 컴퓨터 과학의 진화
      · 빅데이터는 데이터의 크기(Volume)가 크고, 분석 과정에서 실시간에 준하는 빠른 속도(Velocity) 및 데이터의 원천이 매우 다양(Variety)한 특성을 가지고 있음
      · 빅데이터는 정보 원천에 따라 개인정보, 비즈니스 정보, 센서에 의한 정보로 구분
      ▣ 금융 산업 또한 빅데이터가 여러 경로를 통하여 수집 및 관리되고 있음.
      · 금융 산업의 주요 데이터 원천은 증권거래소 등의 자본 시장과 금융 감독 기관과 같은 공공기관의 공시 데이터임.
      · 금융 관련 데이터는 대부분 시간의 흐름에 따라 입력되어 관리되는 시계열(Time-Series) 데이터의 형태가 많음. 최근에는 데이터 수집 주기를 매우 짧은 기간으로 설정하여 시계열데이터 발생 빈도를 크게 늘린 고빈도(high-frequency) 데이터도 많이 활용됨.
      · 금융 데이터 수집 과정에서 금융 위기 기간은 반드시 별도로 고려되어야 함. 금융 위기 기간의 데이터가 정상적 기간의 데이터와 구분되지 않는 경우 경우 완전히 다른 분석 결과를 얻을 수 있음.
      · 기존의 활용되지 못하던 신규 생성 데이터의 확보로 데이터 확장도 가능하지만, 이미 존재하고 있는 이종 데이터 간의 결합을 통해서도 데이터가 확대되는 효과를 얻을 수도 있음.
      · 수집된 데이터는 분석 방법에 따라 필요한 정제 작업을 거쳐 데이터 분석 과정에 활용됨.
      ▣ 인공지능은 새로운 개념은 아니지만, 최근 매우 큰 관심을 받고 있고 매우 급속하게 발전하는 분야임.
      · 인공지능은 인간이 지정한 방법에 따라 학습하여 의사결정을 수행하는 ‘지도학습’과 컴퓨터가 스스로 경험한 내용에 대하여 학습을 할 수 있도록 설계하는 ‘비지도 학습’으로 구분
      · 인공신경망 이론을 기반으로 복잡한 비선형 문제를 ‘비지도 학습’ 방식으로 해결하는 방법을 ‘딥러닝’으로 기존의 ‘머신러닝’ 분야와 구별하고 있음. 하지만 이러한 구분은 절대적인 기준은 아님.
      · 인공지능 관련 시장 규모는 연평균 44%의 성장 중에 있으며, 2020년에는 전 세계적으로 약 240조원의 시장 규모를 형성할 것으로 예측(일본 EY 연구소)
      · 국내 또한 인공지능 시장은 2020년에 2.2조원, 2030년 27.5조원 시장으로 급격한 성장이 예상되고 있음(KT 경영연구소).
      ▣ 빅데이터는 복잡하고 방대한 양의 데이터를 기반으로 발전된 기법이므로 소매 금융 데이터 분석에 활용 효과가 높음.
      · 소매 금융은 개인 및 소규모 기업 고객을 대상으로 하는 금융 서비스로서, 기업 고객에 비하여 상대적으로 데이터의 양이 많으며 다양한 속성이 복잡하게 나타나는 특성이 있음.
      · 기존의 고객이 제공하던 데이터의 수집을 넘어서, 고객에 대한 정보를 직/간접적으로 확보하는 방향으로 정보 원천을 확대함.
      · 소매 금융 부문 중 본 연구와 관련된 ‘신용 평가’ 부분은 가장 빅데이터가 활발하게 활용되는 분야 중 하나임.
      ▣ 인공지능 알고리즘은 신용 평가모형의 예측 성능을 개선하기 위한 목적으로 활용도가 증가하고 있음.
      · 미국의 ‘제스트 파이낸스’ 는 1만개 이상의 대용량 변수를 신용 평가모형에 활용
      · 독일의 ‘크레디테크’, 홍콩의 ‘렌도’, 일본의 ‘소프트뱅크’, ‘미즈호뱅크’ 등도 비슷한 수준
      · 미국 ‘FICO’는 인공지능의 도입으로 신용 평가모형에 비선형변수의 반영, 다양한 변수 결합에 의한 고객 특성 반영 등으로 10~25%의 모형 개선 효과가 있다고 보고
      · 미국 및 글로벌 핀테크 업체를 중심으로 신용 평가 및 금융기관 운영 과정에서 인공지능을 다양하게 활용하고 있음.
      · 국내의 경우 여러 기관이 현재의 신용평가 모형을 인공지능을 활용하여 개선하고 있으나 아직은 선도적인 결과를 보고하는 기관을 찾기 어려움.
      ▣ 빅데이터 및 인공지능 도입은 비용 증가, 예측결과 해석의 어려움, 평가 모형의 신뢰성 부족 및 관련 규제 미비 등의 한계요인도 가지고 있음.
      · 데이터의 확보, 처리, 분석 등에 시간, 인원, 컴퓨터 하드웨어 등의 추가 비용 요인 발생
      · 전통적인 통계 분석 기법과 달리 예측 결과에 대한 원인 분석이 쉽지 않음.
      · 과거 모형에 비하여 구축 및 적용된 기간이 길지 않아, 아직은 신뢰성에 대한 의문 존재
      · 관련 산업에 대한 규제가 많아 관련 산업 발전의 장애 요인으로 작용 중
      Ⅲ. 부도 예측 연구 방법론
      1. 선행연구
      ▣ Altman(1968)의 다변량 판별분석과 Ohlson(1980)의 로짓 모형으로 대표되는 전통적인 기업부도예측 연구는 다양한 방법론을 적용하여 예측 성과를 높이는 방향으로 발전하여 왔음.
      · McQuown(1993)은 자본시장의 시장 가격을 바탕으로 옵션가격 평가모형을 적용하여 기업의 부도 위험 수준인 EDF(Expected default frequency)를 측정하는 모형(KMV 모형)을 제시
      · 오세경(2001)은 국내 기업을 대상으로 로짓(Logit) 모형을 이용한 다변량 판별분석과 함께 옵션가격 평가모형을 이용하여 EDF의 시간별 변화 추이를 분석
      ▣ 각각 부도예측 과정에 활용되던 재무 정보와 시장 정보는 두 원천을 통합하여 부도예측력을 높일 수 있는 방법에 대한 연구로 발전
      · Shumway(2001)가 회계 정보와 시장 정보를 헤저드 모형으로 통합하여 부도예측력을 높일 수 있는 방법을 처음 제안
      · Campbell et al(2008) 또한 회계모형과 시장 정보를 결합한 헤저드 모형이 기존의 각각의 모형보다 부도예측력이 우수하다는 것을 실증
      · 이인로·김동철(2015), 최정원·오세경(2016)은 국내 기업을 대상으로 재무정보와 시장정보를 통합하면 기존의 모형보다 예측력이 우수한 것을 실증
      · Nam et al(2008)은 시간 가변적인(Time-varying) 헤저드 모형을 사용하여 재무정보와 시장정보 및 거시경제 정보가 기업의 부도 예측 가능성을 높일 수 있음을 실증
      ▣ 빅데이터를 활용한 예측 모형 연구는 최근 관련 분야의 대내외적인 관심 증가로 인하여 폭발적으로 증가하고 있음.
      · 배상진·박철균(2003), 김근형·오성렬(2009) 등은 텍스트 마이닝 및 텍스트 데이터 전처리 과정 등을 세부적인 절차로 제시
      · 김유신·김남규·정승렬(2012), Martinez et al(2012)은 텍스트 정보를 이용한 분석 과정에서 텍스트가 담고 있는 감성(Opinion)을 분석하고 이를 연구 과정에 활용함.
      · 이광석(2014), 최정원·한호선·이미영·안준모(2015), 조남옥·신경식(2016)은 텍스트 정보를 활용한 기업 부도예측모형의 유용성을 실증함.
      · Chen et al(2014), 김민수·구평회(2013), 안성원·조성배(2010)는 뉴스 텍스트마이닝 기법을 주가예측 모형에 활용
      ▣ 인공지능(딥러닝) 기법은 비교적 최신의 방법론으로서 금융 및 재무 분야에서는 전통적인 방법론에 의한 예측 방법론에 비하여 연구의 양과 질 모두 부족하지만 최근 기술의 발전 및 전 세계적인 관심 증가와 함께 관련 연구가 매우 급격하게 증가하고 있음.
      · 이재식·한재홍(1995)은 기존의 재무정보만 활용한 부도예측의 한계가 있음을 지적하고 이를 보완하기 위하여 비재무정보를 활용한 인공신경망 기반의 부도예측 모형을 제시
      · Kim and So(2010)는 SVM 기법으로 부도예측을 수행하고, 정보가 상대적으로 부족한 중소기업의 경우 기존의 방법론보다 인공지능 기법의 예측 성능이 더욱 우수함을 실증
      · 김성진·안현철(2016)은 금융기관의 신용위험관리의 중요한 도구인 기업신용등급 예측 과정에 인공지능 기법 중 랜덤 포레스트(Random Forests) 방법을 적용
      · Yeh et al.(2015)은 딥러닝 개념의 인공신경망 기법 중 하나인 Deep Belief Networks (DBN)이 기존의 머신러닝 중 대표적 기법인 SVM보다 기업 부도예측 성능이 더 우수함을 실증
      · Addal(2016)은 인공신경망, K 근접 군집분석 등의 방법론을 이용하여 기업부도예측 모형이 우수한 예측력을 보이는 것을 실증
      2. 연구방법론
      ▣ 선행연구를 참고하여 확보 가능한 다양한 정보 원천을 모두 포괄하여 예측 모형에 활용
      · 재무 정보의 경우 기업에 대한 가장 기본적이고 객관적인 실적 지표로서 기업 부도예측에 반드시 활용되는 정보
      · 시장 정보는 분석 시점의 기업에 대한 최신 정보를 반영하고 있다는 특성이 있으므로 재무 정보의 적시성 부족 문제를 보완하나 유가증권 시장에 상장되어 주식이 거래되고 있는 기업들만의 정보를 이용한다는 한계
      · 재무 정보와 시장 정보는 두 정보를 결합하여 모형에 반영이 가능함. Nam et al.(2008)의 연구는 Hazard 모형을 활용하여 재무정보와 시장정보를 결합한 부도 예측 모형 제시
      · 거시경제 지표의 경우 과거 일부 부도 예측 연구에서 설명변수로 활용은 되고 있으나, 그 빈도가 재무지표나 시장지표에 비하여 많이 떨어짐.
      · 여러 선행연구에서 적용하는 비정형 정보는 그간에 연구들이 주로 사용하지 못하였던 뉴스 및 인터넷 등의 텍스트 정보를 원천으로 활용하는 경우가 많음.
      ▣ 본 연구 분석 과정에서 활용한 예측 방법론의 종류와 각 방법론의 특징
      ▣ 텍스트 데이터를 예측 모형 등에 활용하기 위해서는 계량화된 변수로 측정하는 과정이 필요
      · ‘Word2vec’은 단어들 간의 연관된 규칙을 찾아서 각 단어의 관계를 계량적으로 산출하는 방법론으로서, 각 단어 간의 앞뒤 관계를 보고 근접도를 벡터의 형태로 계산하는 알고리즘 · ‘Word2vec’을 활용하여 뉴스 기사 내에 언급된 단어 간의 관계를 계량적으로 분석할 수 있음.
      · 본 연구에서는 부도와 연관된 기사에서 나타나는 ‘부도’의 의미를 가지는 다른 단어들을 객관적으로 판단(‘부도 연관어휘’)하는 근거를 마련하여 위하여 ‘Word2vec’ 활용
      · 산출된 ‘부도 관련 기사 비율’과 ‘부도 유사도’ 지표는 수준이 높게 나타날 경우 이를 사전적인 ‘부도’의 징후로 판단할 수 있음.
      ▣ 여러 가지 방법론을 적용하여 기업 부도예측을 수행할 경우 모형의 성능을 비교하기 위해서는 동일한 개념으로 적용이 가능한 객관적인 모형 평가 방법 필요
      · 본 연구의 기업 부도예측과 같은 이진 분류 예측의 상황은 두 범주(부도, 정상)간의 정확한 분류가 가능한지를 여러 모형 간에 비교하여 봄으로써 모형 평가를 수행
      · 기업예측 모형과 같은 이진 판별 예측은 할 때, 예측 모형의 추정 값들은 0에서 1 사이에서 판별 값(Threshold)이 변함에 따라 정확도가 변동함. 따라서 최적의 판별 값 수준 결정필요
      ▣ 예측 모형을 도출하여 모형의 예측력을 평가하는 과정에서 Sample data를 학습 세트(training set)와 평가 세트(test set)으로 나누어 예측 정확도(Accuracy)를 산출하고 이를 근거로 모형의 성능을 평가하여야 함(out of sample test).
      · 본 연구도 학습 세트와 평가 세트를 전체 표본 중 중복되지 않도록 70% 대 30%의 비중으로 배분하여 모형 추정과 예측력 평가 과정에 각각 사용
      · 과거 부도예측 연구에서는 부도 기업의 표본(sample) 수가 너무 적어 표본의 불균형에 의한 모형 예측력 평가의 어려움이 있음을 한계로 지적하였음.
      · 본 연구는 부도 기업의 표본을 고정하고, 정상 기업의 표본을 부도 기업 수만큼만 Random 형태로 Sampling하여 균형(equal-weighted. 50% 대50%) 표본을 구성하여 모형의 추정과 평가에 활용하는 방안을 적용.
      · 다만 이러한 Sampling 방식을 사용할 경우 정상 기업 표본에서 표본 선택에 따른 편의(bias)가 발생할 수 있으므로, 평가 과정의 강건성을 얻기 위하여 정상 기업 표본을 반복적으로 총 100 세트(set)를 임의 확률(random)로 구성하여 모형평가 과정에 활용
      · 각 방법론의 예측 수준 평가를 위한 정확도 값은 모든 평가세트(100 set)에서 산출된 정확도의 평균 수준으로 산출
      Ⅳ. 실증분석
      1. 부도 사건의 정의
      ▣ 기업 부도예측 연구 과정에서 보다 유용한 결과를 얻기 위해서는 기업의 부도(부실)에 대한 명확한 정의를 하는 것이 매우 중요
      ▣ 유가증권시장에서 ‘상장폐지’가 결정된 기업들 중 부도에 관련된 공시가 발생한 기업들을 부도 발생기업으로 인식하고 분석을 진행
      · 이인로·김동철(2015), 최정원·오세경(2016) 등의 선행연구와 동일한 가정
      · 상장폐지 사건은 부도와 반드시 연결된다고 볼 수는 없으나, 부도와 관련된 이유로 상장폐지가 발생한 대부분의 기업은 특수한 상황을 제외하고 부도가 발생하거나 부도에 준하는 재무상황이 발생함.
      2. 데이터 수집 및 정제
      ▣ 2001년부터 2015년 까지 부도 정의에 따라 유가증권 시장에 상장된 기업을 대상으로 분석
      ▣ 비정형 정보인 뉴스 텍스트 데이터 수집을 위하여, 네이버 뉴스 검색 홈페이지를 활용하여, 분석 대상 기업들에 대한 2010년 1월부터 2016년 12월까지의 84기간의 뉴스 컨텐츠를 수집
      · 인터넷 뉴스 서버에 DB가 구축되지 않아 기사를 확보할 수 없거나, 총 집계기간 동안 기사 수가 부족한 기업, 검색이 불가능한 이름의 기업, 명확한 구별이 어려운 기업 등의 기사는 수집 과정에서 제외
      · 제외 후 텍스트 정보 수집 대상 기업은 총 1,788개의 기업으로 총 2,506,080건의 기사를 텍스트 DB로 확보함. 기업당 평균적으로 약 1,401건, 1개월 당 평균적으로 약 16.6건
      · 텍스트 DB는 집계 이후 자연어 처리, 분석 Sample 수 미달제외, 특정 의미 단어 제외 등의 정제 과정을 거쳐 최종 텍스트 분석 DB로 산출됨.
      ▣ 텍스트 분석 DB를 기반으로 ‘부도’ 및 ‘상장폐지’와 기사 내에 언급된 단어 간의 유사도를 ‘Word2vec’을 이용하여 산출
      · ‘부도’ 혹은 ‘부도’ 및 ‘상장폐지’로 ‘Word2vec’ 유사도 기준상위 20개 단어 선별
      · 선정된 부도 유사 단어가 포함된 경우 해당 기사를 부도 연관 기사로 간주하고, 전체 기사 대비 부도 연관 기사 비율을 산출하여 ‘부도 기사 비율’을 산출함.
      · 기사를 구성하고 있는 개별 단어별로 ‘부도’ 및 ‘상장폐지’ 유사도를 부여하고, 각 기사별 ‘부도 유사도(평균수준)’을 산출함.
      · ‘부도 기사 비율’ 과 ‘부도 유사도’ 는 부도 기사에 대한 계량화된 텍스트 분석 결과로서 향후 부도 예측 모형 추정 과정에서 설명 변수로 활용
      ▣ 정보 원천별로 모형 예측의 영향을 평가하기 위하여 취합된 분석 DB를 4가지의 데이터 세트로 분류하여 각각의 모형에 적용하고 가용한 데이터 수준에 따라 기간을 나누어 분석함.
      · 총 7개의 분석 Set가 구성되어 각각의 예측 방법론에 적용됨
      1) Set A(2001~2016년) : 재무, 시장, 거시경제 정보. 총 2291개 (부도 502개) 기업 대상
      2) Set B(2010~2016년) : 재무, 시장, 거시경제 정보. 총 1586개 (부도 258개) 기업 대상
      3. 연간 예측 모형
      ▣ 각 분석 DB Set를 예측 방법론별 모형에 적합(Fitting) 하고 최적 모형을 도출함.
      ▣ SET A 결과(분석기간 2001년~2016년 적용)
      · 가장 높은 정확도를 나타낸 방법론은 Random Forests 방법론 · 로지스틱 모형과 SVM 또한 0.9에 상회하는 높은 정확도가 산출
      · 의사결정나무(Dtree)와 인공신경망(DNN, RNN) 등은 0.9에 다소 못 미치는 정확도
      · 기업의 재무정보, 거시 경제정보, 시장정보를 포괄하여 가장 정보가 많이 활용된 < SET3 >의 정확도는 타 데이터 세트에 비하여 다소 높게 산출. 하지만 유의미한 수준은 아님.
      ▣ SET B 결과(분석기간 2010년~2016년 적용)
      · Random Forests 방법론이 가장 우수한 예측력. SVM, 인공신경망(DNN) 순
      · 로지스틱 모형은 상대적으로 모형 예측력이 하락. 인공지능 기법들의 예측력은 유지되거나 오히려 다소 상승
      · 기존 전통적 정보 원천이 반영된 < SET B_3 >에 뉴스 텍스트 정보까지 추가로 반영된 < SET B_4 >가 타 모형에 비하여 모형 예측력이 높게 산출. 비정형 정보도 부도예측 성능 향상에 영향을 줄 수 있음을 실증하는 결과임. 유의성은 떨어짐.
      ▣ 연관 예측 모형 추정 결과 인공지능 중 Random Forests 방법론이 두 데이터 SET 모두 가장 높은 수준의 예측력 나타남.
      · 데이터 수가 상대적으로 적은 < SET B >에서도 우수한 예측력을 유지함으로써 인공지능 기법이 강건하게 기업의 부도에 대한 예측을 잘 수행할 수 있음을 실증
      · 인공지능_DNN의 예측 성능이 기대 수준에 미치지 못함. 컴퓨터 하드웨어를 보강하고 추가적인 효율화 방안을 도입하여 이러한 구조를 개선하면 현재보다 더 높은 예측 정확도를 얻을 가능성이 있음.
      ▣ 텍스트 데이터를 추가로 반영한 < SET B_4 >의 예측 정확도는 방법론에 따라 약간의 차이는 있지만 전반적으로 텍스트 데이터를 반영하지 않은 SET에 비하여 유의한 수준의 정확도 차이가 나타나지 않음.
      · 재무정보만 활용한 < SET A_1 >, < SET B_1 >의 예측력도 타SET에 비하여 큰 차이가 없음.
      · 이는 상장 기업의 경우 다양한 공시 요구 및 규제에 의하여 기업의 정보가 재무정보에 이미 충분히 반영되어 나타나는 결과라 판단됨.
      4. 월간 예측 모형
      ▣ 미디어의 뉴스 기사는 시장 정보(주가)와 마찬가지로 실시간으로 공개되는 정보임. 따라서 시장정보를 활용한 예측 모형인 KMV 모형과 유사한 형태의 부도예측 모형 구축 가능
      · 기업의 부도 관련 뉴스가 실제 부도가 발생하는 시점 이전에 부도 가능성을 선제적으로 알려줄 수 있는지, 조기 경보 지표(early warning index)로서 활용 가치가 있는지 연구
      · 분석 가능 대상 Sample : 부도 기업 52개, 정상기업 855개 확보
      · KMV모형 및 텍스트 기반 모형의 부도예측 단위는 월간이며, 부도 기준 직전 12개월의 추이를 분석함.
      · 부도 기업의 경우 부도 발생 1년전부터 점진적으로 평균 수준에 비하여 다소 낮은 수준으로 D.D. 가 하락하다가, 부도발생 3개월 전부터 급격하게 하락함.
      ▣ 텍스트 정보기반 예측 모형 산출 결과(부도 기사 비율 추이)
      · 동일한 기간과 동일한 기업에 대하여 기사 텍스트 DB를 기반으로 산출한 부도 기사 비율
      · KMV 모형과 마찬가지로 부도기사 비율은 부도 발생 12개월 이전부터 점진적으로 상승하여 지속적으로 정상기업에 비하여 높은 수준으로 산출
      ▣ 텍스트 정보기반 예측 모형 산출 결과(부도 유사도 추이)
      · 동일한 기간과 동일한 기업에 대하여 기사 텍스트 DB를 기반으로 산출한 부도 유사도
      · 부도 유사도 역시 부도기사비율과 마찬가지로 부도발생 이전부터 정상기업과 차이가 나타남.
      · 단, KMV 와 부도기사비율과는 달리 점진적 상승 추세가 다소 약하고, 부도 시점에 가까워지면서 오히려 정상기업보다 떨어지는 수준도 나타나는 것을 확인할 수 있음.
      ▣ KMV 모형과 텍스트 정보기반의 예측 모형은 각각 부도 발생 이전 시점부터 부도 가능성이 상승함을 보여주는 것을 확인할 수 있음.
      · 선제적 예측 성능을 비교하기 위하여 두 모형을 함께 그래프로 도식화
      · 부도 기사 비율은 KMV 모형의 결과인 D.D. 와 비슷한 형태로 부도 가능성에 대한 신호가 나타남.
      · 특히 부도 발생 6개월 이전 시점부터는 지속적으로 KMV모형보다 다소 높은 수준으로 부도 기사 비율이 나타남.
      ▣ ‘부도 기사비율’과 ‘부도 유사도’를 활용할 경우 KMV 모형과 유사한 형태로 부도 예측이 가능하며 추가적인 확장도 가능함.
      · 부도 발생 시점을 기준으로 KMV 모형 보다 이전 기간에 부도 유사도가 상승하여 기업 부도에 대한 조기경보 지표로서 충분히 활용 가능성이 있음.
      · 텍스트 정보 기반의 부도예측은 주가 정보가 없는 비상장기업에도 활용이 가능하다는 점에서 KMV 의 단점을 보완하는 방법론으로 더욱 의미가 있음.
      ▣ 텍스트 기반의 부도 예측 방법 또한 기업관련 뉴스의 편중 문제가 나타나는 단점이 있음.
      · 대부분의 기업 뉴스는 일부 매우 우량하고 유명한 대기업에 대한 기사가 많이 생성되고, 정작 부도가 많이 발생하는 규모가 작은 기업에 대한 뉴스는 상대적으로 매우 적음.
      · 향후 이를 보완하기 위해서는 텍스트 데이터 확보 정보 원천을 미디어 뉴스뿐만 아니라 기업 공시자료, 증권/투자 관련게시판, 해당기업 홈페이지 등으로 확대하여 보다 광범위한 텍스트 데이터의 확보가 필요함.
      Ⅴ. 결론 및 시사점
      ▣ 기업 부도 예측 과정에서 우선 비정형 데이터인 뉴스 텍스트 데이터를 계량화하여 새로운 정보 원천으로 활용할 수 있는 방법을 제시
      ▣ 기존 정보 원천과 함께 텍스트 정보를 포함한 인공지능 기반의 예측 방법론을 제시하고 기존의 방법론과 예측력을 비교분석
      ▣ 연구 결과, 연간 모형에서는 인공지능 기법인 Random forests 기법이 가장 우수한 예측력이 나타나는 것으로 분석
      · 인공지능을 이용한 다른 방법론들도 전반적으로 기존의 전통적인 예측 방법보다 예측력이 우수함.
      ▣ 또한 뉴스 텍스트를 추가적인 정보 원천으로 추정한 월간 예측 모형의 경우 시장 정보 기반의 예측 모형인 KMV 모형과 유사한 결론을 도출할 수 있는 것으로 나타남.
      · 기업 부도 예측 과정에서 텍스트 정보 기반의 부도 예측 모형은 조기 경보 모형으로 충분히 활용이 가능함.
      ▣ 중소기업(SME)과 개인에 대한 부도 예측 모형으로 연구의 확장이 필요
      · 현재 분석 대상인 상장기업의 경우 재무 정보가 기업 현황을 비교적 잘 반영하고 있고, 기업에 대하여 발생하는 정보 또한 주가에 즉각 반영되고 있는 편이기 때문에 텍스트 정보 및 인공지능 도입에 대한 예측 증가 수준이 미미할 수 있음.
      · 재무정보의 신뢰도가 떨어지고 시장 정보의 확보가 어려운 중소기업이나 개인에 대하여 본 연구의 부도 예측 방법을 적용한다면 기존의 방법에 대하여 추가적인 예측 수준 증대를 얻을 수 있을 것으로 기대됨.
      · 기업을 대상으로 하는 연구의 경우, 뉴스 텍스트 정보와 함께 웹 페이지, 공시자료 등 추가적인 정보 원천을 포괄하여 적용하면 추가적인 예측 수준 개선이 기대됨.
      ▣ 빅데이터 및 딥-러닝 분야는 아직까지 국내 금융, 재무 분야에서 관련 연구가 부족함.
      · 본 연구에서 활용한 방법론은 타 연구에서도 충분히 응용하여 활용이 가능하므로 향후 관련 된 연구가 많이 발전할 것이라 기대할 수 있음.

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼