RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      휴리스틱 클러스터링을 활용한 다중 문서 요약 시스템 : 반도체 산업 사례 = A Multi-Document Summarization System using Heuristic Clustering: The Case of Semiconductor Industry

      한글로보기

      https://www.riss.kr/link?id=A108249118

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      In modern society, the plethora of digitalization has encouraged to produce and collect vast amounts of textual data. As such, there has been a keen interest in document summarization, which efficiently extracts and provides information in a couple of...

      In modern society, the plethora of digitalization has encouraged to produce and collect vast amounts of textual data. As such, there has been a keen interest in document summarization, which efficiently extracts and provides information in a couple of sentences. To this end, there have been numerous approaches to single-document summarization in the leading research stream, while relatively few studies on a multi-document summarization. In this paper, we propose a multi-document summarization method with heuristic clustering. More in specific, this paper suggests a method of deriving optimal clusters with similar topics among heterogeneous documents, finding a representative document for each cluster, and then summarizing the selected representative. This paper introduces a data analysis result using the collected news articles in the semiconductor industry and the multi-document summarization system. This research has a contribution both from academia and industry in suggesting a new approach for multi-document summarization and being used for numerous domains requiring document summarization.

      더보기

      국문 초록 (Abstract)

      방대한 양의 텍스트 데이터가 축적되고 있는 현대 사회에서 정보를 효율적으로 추출 및 제공하기 위한 문서 요약 연구가 활발히 이루어지고 있다. 하지만 이는 주로 단일 문서 요약에 관한 ...

      방대한 양의 텍스트 데이터가 축적되고 있는 현대 사회에서 정보를 효율적으로 추출 및 제공하기 위한 문서 요약 연구가 활발히 이루어지고 있다. 하지만 이는 주로 단일 문서 요약에 관한 연구로 다중 문서 요약에 관한 연구는 비교적 적다. 본 논문에서는 휴리스틱 군집화를 통해 다중 문서 요약을 수행하는 방법을 제시한다. 구체적으로, 본 논문은 다양한 주제의 문서 중 유사한 주제를 갖는 최적의 클러스터들을 도출하고 해당 클러스터 내의 대표 문서를 찾고, 그 후 선택된 대표 문서를 요약하는 방법을 제시한다. 본 논문에서는 반도체 산업 관련 기사 데이터를 통한 데이터 분석 결과 및 반도체 산업 다중 문서 요약 시스템을 소개한다. 본 연구는 다중 문서 요약에 관한 새로운 접근 방법을 제시하였다는 것 뿐만 아니라 문서 요약이 필요한 다양한 서비스에 이용 가능하다는 측면에서, 학계와 산업계 모두 기여점을 갖는다.

      더보기

      참고문헌 (Reference)

      1 Yonhap News, "Yonhap News launches artificial intelligence article summary service"

      2 Dávid Bajusz, "Why is Tanimoto index an appropriate choice for fingerprint-based similarity calculations?" 2015

      3 Naver, "What is a summary bot service?"

      4 S. K. Kwon, "The Study on Korean Single Document Summarization Using Pre-trained Language Models" Jeju International Convention Center 1-3, 2021

      5 손지영 ; 신용태, "TextRank 알고리즘을 이용한 음악 가사 요약 기법" 한국멀티미디어학회 21 (21): 45-50, 2018

      6 T. H. F. Khan, "Text Document Clustering using K-Means and Dbscan by using Machine Learning" 9 (9): 6327-6330, 2019

      7 P. Y. D. Silva, "Recursive Hierarchical Clustering Algorithm" 8 (8): 1-7, 2018

      8 H. N. Cho, "Multi-Document Summarization Based on Graph Clustering" 912-914, 2014

      9 SKT, "Korean BART"

      10 Children’s Chosun Ilbo, "Isn't reading web novels and webtoons also reading? Student reading amount 'tuck'... The use of e-books is increasing"

      1 Yonhap News, "Yonhap News launches artificial intelligence article summary service"

      2 Dávid Bajusz, "Why is Tanimoto index an appropriate choice for fingerprint-based similarity calculations?" 2015

      3 Naver, "What is a summary bot service?"

      4 S. K. Kwon, "The Study on Korean Single Document Summarization Using Pre-trained Language Models" Jeju International Convention Center 1-3, 2021

      5 손지영 ; 신용태, "TextRank 알고리즘을 이용한 음악 가사 요약 기법" 한국멀티미디어학회 21 (21): 45-50, 2018

      6 T. H. F. Khan, "Text Document Clustering using K-Means and Dbscan by using Machine Learning" 9 (9): 6327-6330, 2019

      7 P. Y. D. Silva, "Recursive Hierarchical Clustering Algorithm" 8 (8): 1-7, 2018

      8 H. N. Cho, "Multi-Document Summarization Based on Graph Clustering" 912-914, 2014

      9 SKT, "Korean BART"

      10 Children’s Chosun Ilbo, "Isn't reading web novels and webtoons also reading? Student reading amount 'tuck'... The use of e-books is increasing"

      11 R. Khan, "Extractive based Text Summarization Using KMeans and TF-IDF" 11 (11): 33-44, 2019

      12 Y. Y. Yoon, "Document embedding and classification using BERT" Pusan National University 2022

      13 W. M. Song, "Document Summarization System Using Dynamic Connection Graph" 112-113, 2008

      14 김동성, "Doc2Vec 단어 임베딩 언어 모델을 활용한 텍스트 장르 구분" 한국언어정보학회 23 (23): 23-43, 2019

      15 Swamy L N, "Concept of TF-IDF, Common Bag of Word and Word Embedding for Effective Sentiment Classification" 9 (9): 2198-2201, 2020

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2022 평가예정 재인증평가 신청대상 (재인증)
      2019-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2016-01-01 평가 등재학술지 선정 (계속평가) KCI등재
      2015-12-01 평가 등재후보로 하락 (기타) KCI등재후보
      2011-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2010-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2009-01-01 평가 등재후보 1차 FAIL (등재후보2차) KCI등재후보
      2008-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2006-02-17 학회명변경 한글명 : 한국디지털컨텐츠학회 -> 한국디지털콘텐츠학회 KCI등재후보
      2006-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      2005-09-21 학술지명변경 한글명 : 디지털컨텐츠학회논문지 -> 디지털콘텐츠학회논문지
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.35 0.35 0.38
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.39 0.37 0.636 0.12
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼