RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      환경빅데이터를 활용한 환경 유형별 주요 키워드 분석에 관한 연구 = A Study on the Major Keywords Analysis for Environmental Categories using Environmental Big Data

      한글로보기

      https://www.riss.kr/link?id=A108502059

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      Big data analysis of unstructured resources is necessary to determine the decision-making for environmental management based on reliable information. Text mining with a term weighing scheme is an essential process to extract useful information from textual data. Therefore, in this study, we analyzed top keywords and trends for each environmental category (Air, Climate, Water, Waste/garbage) using environmental news data and estimate similar keywords for the top 2 keywords using the Word2Vec model. Environmental news for 11 years (2010 – 2020) related to Seoul was downloaded from the Naver platform. The results of top keywords and trend analyses were visualized in each environmental category. Our study results will provide useful information for each environmental category from the digital news and be utilized as basic resources for the environmental text mining process.
      번역하기

      Big data analysis of unstructured resources is necessary to determine the decision-making for environmental management based on reliable information. Text mining with a term weighing scheme is an essential process to extract useful information from te...

      Big data analysis of unstructured resources is necessary to determine the decision-making for environmental management based on reliable information. Text mining with a term weighing scheme is an essential process to extract useful information from textual data. Therefore, in this study, we analyzed top keywords and trends for each environmental category (Air, Climate, Water, Waste/garbage) using environmental news data and estimate similar keywords for the top 2 keywords using the Word2Vec model. Environmental news for 11 years (2010 – 2020) related to Seoul was downloaded from the Naver platform. The results of top keywords and trend analyses were visualized in each environmental category. Our study results will provide useful information for each environmental category from the digital news and be utilized as basic resources for the environmental text mining process.

      더보기

      국문 초록 (Abstract)

      빅데이터 시대에서 환경경영과 정책 결정을 위해 정보에 입각한 의사결정을 하기 위해서는 비정형데이트를 이용한 환 경 빅데이터 분석이 필요하다 . 용어 가중치 기법을 적용한 텍스트 마이닝 분석은 대용량 텍스트에서 유용한 정보를 추출 하고 우선순위를 지정할 수 있는 필수 프로세스이다 . 따라서 , 본 연구에서는 환경 뉴스 데이터에 용어 가중치를 적용하여 환경 유형별 핵심 키워드와 트랜드 분석을 실행하였고 , 기계학습을 이용한 Word2vec모형을 구축하여 핵심 키워드에 대 한 유사어를 분석하였다 . 이를 위해 2010년에서 2020년 동안의 서울 지역과 관련된 네이버 환경 뉴스를 수집하였다 . 이 후, 데이터 전처리 , 형태소 분석 , TD-IDF 용어 가중치를 적용하여 환경 분야별 핵심 키워드와 트랜드 결과를 분석하고 시각화하였다 . 본 연구의 분석 결과들은 환경 유형별 대중들의 관심 키워드와 트랜드 변화에 대한 정보를 제공해 주고 관 심 핵심어의 연관어 정보를 제공해 줌으로써 환경 텍스트 마이밍 적용에 필요한 기초 자료로 이용될 수 있을 것이다 .
      번역하기

      빅데이터 시대에서 환경경영과 정책 결정을 위해 정보에 입각한 의사결정을 하기 위해서는 비정형데이트를 이용한 환 경 빅데이터 분석이 필요하다 . 용어 가중치 기법을 적용한 텍스트 마...

      빅데이터 시대에서 환경경영과 정책 결정을 위해 정보에 입각한 의사결정을 하기 위해서는 비정형데이트를 이용한 환 경 빅데이터 분석이 필요하다 . 용어 가중치 기법을 적용한 텍스트 마이닝 분석은 대용량 텍스트에서 유용한 정보를 추출 하고 우선순위를 지정할 수 있는 필수 프로세스이다 . 따라서 , 본 연구에서는 환경 뉴스 데이터에 용어 가중치를 적용하여 환경 유형별 핵심 키워드와 트랜드 분석을 실행하였고 , 기계학습을 이용한 Word2vec모형을 구축하여 핵심 키워드에 대 한 유사어를 분석하였다 . 이를 위해 2010년에서 2020년 동안의 서울 지역과 관련된 네이버 환경 뉴스를 수집하였다 . 이 후, 데이터 전처리 , 형태소 분석 , TD-IDF 용어 가중치를 적용하여 환경 분야별 핵심 키워드와 트랜드 결과를 분석하고 시각화하였다 . 본 연구의 분석 결과들은 환경 유형별 대중들의 관심 키워드와 트랜드 변화에 대한 정보를 제공해 주고 관 심 핵심어의 연관어 정보를 제공해 줌으로써 환경 텍스트 마이밍 적용에 필요한 기초 자료로 이용될 수 있을 것이다 .

      더보기

      참고문헌 (Reference) 논문관계도

      1 이동준 ; 원종운 ; 권용장 ; 김미례, "소셜 네트워크 빅데이터 기반 택배업체 고객만족도에 관한 연구" 한국전자거래학회 21 (21): 55-67, 2016

      2 Kausar, M. A., "Web crawler: a review" 63 (63): 2013

      3 Chen, K., "Turning from TF-IDF to TF-IGM for term weighting in text classification" 66 : 245-260, 2016

      4 Beel, J., "TF-IDuF: A novel term-weighting scheme for user modeling based on users’ personal document collections" Bibliothek der Universität Konstanz 2017

      5 Chum, O., "Near duplicate image detection: Min-hash and TF-IDF weighting" Bmvc 812-815, 2008

      6 Deshmukh, P. R., "Identifying contextual information in document classification using term weighting" 72-78, 2018

      7 Morss, R. E., "Hazardous Weather Prediction and Communication in the Modern Information Environment" 98 (98): 2,653-2,674, 2017

      8 Chen, X., "From channelization to restoration : Sociohydrologic modeling with changing community preferences in the Kissimmee River Basin, Florida" 52 (52): 1,227-1,244, 2016

      9 El-Khair, I. A., "Encyclopedia of Database Systems" Springer 2009

      10 Mikolov, T., "Districuted Representations of Words and Phrases and their Compositionality" 2 : 3111-3119, 2013

      1 이동준 ; 원종운 ; 권용장 ; 김미례, "소셜 네트워크 빅데이터 기반 택배업체 고객만족도에 관한 연구" 한국전자거래학회 21 (21): 55-67, 2016

      2 Kausar, M. A., "Web crawler: a review" 63 (63): 2013

      3 Chen, K., "Turning from TF-IDF to TF-IGM for term weighting in text classification" 66 : 245-260, 2016

      4 Beel, J., "TF-IDuF: A novel term-weighting scheme for user modeling based on users’ personal document collections" Bibliothek der Universität Konstanz 2017

      5 Chum, O., "Near duplicate image detection: Min-hash and TF-IDF weighting" Bmvc 812-815, 2008

      6 Deshmukh, P. R., "Identifying contextual information in document classification using term weighting" 72-78, 2018

      7 Morss, R. E., "Hazardous Weather Prediction and Communication in the Modern Information Environment" 98 (98): 2,653-2,674, 2017

      8 Chen, X., "From channelization to restoration : Sociohydrologic modeling with changing community preferences in the Kissimmee River Basin, Florida" 52 (52): 1,227-1,244, 2016

      9 El-Khair, I. A., "Encyclopedia of Database Systems" Springer 2009

      10 Mikolov, T., "Districuted Representations of Words and Phrases and their Compositionality" 2 : 3111-3119, 2013

      11 Domeniconi, G., "Cross-domain Text Classification through Iterative Refining of Target Categories Representations" 31-42, 2014

      12 Mendez, J. R., "A new semantic-based feature selection method for spam filtering" 76 : 89-104, 2019

      13 Li, C., "A comparative study of the class imbalance problem in Twitter spam detection" 30 : 2018

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼