RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 텍스트마이닝을 활용한 수목원에 대한 소비자 인식 분석

        백지희(Ji-hee Baik),손지연(Ji-yeon Son) 전남대학교 생활과학연구소 2022 生活科學硏究 Vol.32 No.-

        The purpose of this study is to draw implications for the operation and promotion of arboretums by analyzing social big-data. Blog posts written on the portal site Naver were crawled using the Naver API with Python 3.8.8, and frequency analysis(e.g., TF analysis and TF-IDF analysis), social network analysis(e.g., semantic network analysis), topic modeling(LDA), and visualization using word cloud were performed. Three arboretums, including the Korea National Arboretum, the Baekdudaegan National Arboretum, and the Sejong National Arboretum were selected for analysis, and the main analysis results for each arboretum are as follows. First, the word with high TF and TF-IDF values for the Korea National Arboretum was 'reservation' (TF: 1st, TF-IDF: 3rd). As a result of social network analysis, words with high connection centrality were 'reservation' and 'Gwangneung Forest Road', and as a result of topic modeling, 4 topics including 'fall in the Korea National Arboretum', 'suburb trip', 'visit to the Korea National Arboretum', and 'visit to the Korea National Arboretum' were formulated. Second, the word with high TF and TF-IDF values for the Baekdudaegan National Arboretum was 'Baekdu Mountain Tiger' (TF: 1st, TF-IDF: 2nd). Results of social network analysis showed that 'Asia', 'conservation', and 'Baekdu Mountain Tiger' had the high level of connection centrality. Topic modeling derived 4 topics including 'Baekdudaegan Arboretum Symbol', 'Baekdudaegan Arboretum Tour', 'Baekdudaegan Arboretum Trip' and 'Baekdudaegan Arboretum PR.' Third, the word with high TF and TF-IDF values for the Sejong National Arboretum was 'four seasons exhibition greenhouse' (TF: 1st place, TF-IDF: 1st place). As a result of social network analysis, 'Four Seasons Exhibition Greenhouse', 'Places to visit', and 'Korea Arboretum Garden Management Service' showed the high level of high centrality, and as a result of topic modeling, 4 topics, including 'arboretum outing', 'Sejong Arboretum Greenhouse', 'Sejong Arboretum PR' and 'Sejong Arboretum outdoor,' were derived. The main purpose of consumers visiting an arboretum can be divided into two types: an outing type for recreation and an exploration type in which they look around every nook and cranny of the arboretum and participate in activities. The analysis results of this study suggest that the majority of consumers pursue outings rather than exploration types when visiting arboretums. Contrary to the traditional idea of experts that an arboretum is a facility for collection, propagation, preservation, management, exhibition, and research, consumers perceive it as a place for outings and recreational spaces to feel nature. In addition, the results of the text mining analysis show that consumers' interest in individual species of animals and plants or specialized exhibition gardens is not noticeable. It is in line with the fact that consumers regard the arboretum as an outing place for the purpose of resting in nature.

      • KCI등재

        텍스트마이닝을 활용한 러닝 어플리케이션 사용자 리뷰 분석: Nike Run Club과 Runkeeper를 중심으로

        류기문,김일광 대한산업경영학회 2024 산업융합연구 Vol.22 No.4

        본 연구의 목적은 텍스트마이닝을 활용하여 러닝 어플리케이션 사용자의 리뷰를 분석하였다. 본 연구는 python3의selenium 패키지를 이용하여 google playstore의 Nike Run Club, Runkeeper의 사용자 리뷰들을 분석자료로 이용하였으며, okt 분석기를 통해 한글 명사만을 남겨 형태소를 분리하였다. 형태소 분리 후 rankNL 사전을 만들어 불용어(stopword) 를 제거하였다. 자료 분석을 위해 텍스트마이닝의 TF(빈도분석), TF-IDF(키워드 빈도-문서 역빈도), LDA 토픽모델링을 통해분석하였다. 본 연구의 결과는 다음과 같다. 첫째, Nike Run Club, Runkeeper 어플리케이션 사용자 리뷰에서 공통적으로상위 키워드로 ‘기록’, ‘앱’, ‘운동’의 키워드가 도출되었으며 TF, TF-IDF의 순위에는 차이가 나타났다. 둘째, Nike Run Club의 LDA 토픽모델링으로 ‘기본 항목’, ‘추가 기능’, ‘오류 사항’, ‘위치기반데이터’의 토픽이 도출되었고 Runkeeper는‘오류 사항’, ‘음성 기능’, ‘러닝 데이터’, ‘사용 혜택’, ‘사용 동기’의 토픽이 도출되었다. 결과를 통해 제언하면 어플리케이션의경쟁력 향상을 기여하기 위해 오류 및 개선사항을 보완해야 한다. The purpose of this study was to analyze user reviews of running applications using text mining. This study used user reviews of Nike Run Club and Runkeeper in the Google Play Store using the selenium package of python3 as the analysis data, and separated the morphemes by leaving only Korean nouns through the OKT analyzer. After morpheme separation, we created a rankNL dictionary to remove stopwords. To analyze the data, we used TF, TF-IDF and LDA topic modeling in text mining. The results of this study are as follows. First, the keywords ‘record’, ‘app’, and ‘workout’ were identified as the top keywords in the user reviews of Nike Run Club and Runkeeper applications, and there were differences in the rankings of TF and TF-IDF. Second, the LDA topic modeling of Nike Run Club identified the topics of ‘basic items’, ‘additional features’, ‘errors’, and ‘location-based data’, and the topics of Runkeeper identified the topics of ‘errors’, ‘voice function’, ‘running data’, ‘benefits’, and ‘motivation’. Based on the results, it is recommended that errors and improvements should be made to contribute to the competitiveness of the application.

      • KCI등재

        마리나에 대한 사회적 이슈 분석: 토픽모델링을 활용한 국내 언론 보도기사 분석을 중심으로

        김남규,장승현,이근모 한국스포츠사회학회 2022 한국스포츠사회학회지 Vol.35 No.3

        The purpose of this study was to examine the past and present of the marina industry to suggest a development plan using text mining. Press articles were extracted with the keyword 'marina', and TF analysis, word cloud analysis, TF-IDF analysis, and topic modeling analysis were performed using text mining techniques. The results of this study are as follows. First, the top 60 keywords such as 'business', 'marina', and 'marine' were presented through TF analysis and it was visualized through word cloud analysis based on the top 500 keywords. Second, TF-IDF analysis confirmed the social trend of marina by period. Third, by topic modeling analysis, 8 topics were derived, 'marina policy', 'tourism', 'real estate development', 'marina investment attraction', 'marine leisure industry', 'complex marina development', 'hotels and entertainment facilities', 'domestic investment by foreign companies'. Fourth, the past and present of the marina industry were examined by analyzing the social issues and changes of topics through topic modeling analysis by period. Based on the results, it was possible to make suggestions for the development of the marina industry in the future. 본 연구에서는 마리나 산업의 과거와 현재를 조망하고 이에 따른 마리나 산업의 발전방안을 제시하기 위해 텍스트 마이닝을 활용하였다. '마리나'를 키워드로 언론 보도기사를 추출했으며, 이를 대상으로 텍스트 마이닝 기법을 활용해TF분석, 워드 클라우드 분석, TF-IDF 분석, 토픽 모델링 분석을 실시하였다. 이를 통해 도출된 연구결과는 다음과같다. 첫째, TF 분석을 통해 ‘사업’, ‘마리나’, ‘해양’ 등 상위 60개의 키워드를 제시하였고, 상위 키워드 500개를 기준으로 워드 클라우드 분석을 통해 시각화하였다. 둘째, TF-IDF 분석을 통해 시기별 마리나의 사회적인 트렌드를 알아보았다. 셋째, 토픽모델링 분석을 통해 ‘마리나 정책’, ‘관광’, ‘부동산 개발’, ‘마리나 투자유치’, ‘해양레저산업’, ‘복합 마리나 개발’, ‘호텔 및 위락시설’, ‘해외기업의 국내투자’로 명명한 8개의 토픽을 도출하였다. 넷째, 시기별 토픽모델링 분석을 통해 토픽들의 사회적 이슈와 변화를 분석하여 마리나 산업의 과거와 현재를 조망하였다. 이상의 결과를 기반으로 향후 마리나 산업의 발전을 위한 제언을 할 수 있었다.

      • KCI등재

        TF-IDF 알고리즘의 분석법을 활용한 브랜드 디자인 프로세스 개발 연구

        송지성(Song, Ji Sung),안병진(Ahn, Byeong Jin) 한국디자인문화학회 2020 한국디자인문화학회지 Vol.26 No.1

        본 연구는 새로운 산업혁명의 구조적 변화에 맞춰 다양한 산업 속에서 빅 데이터를 다루기 위한 기술개발이 활발하게 이루어지고 있는 시대적 배경을 가지고 있다. 하지만 전통적인 산업을 가지고 있는 디자인구조 또한 신속하게 성장하는 다양한 산업과 경제구조의 변화에 맞춰 대대적인 변화가 필요하다고 생각한다. 이 전통적인 디자인 산업의 변화를 위해서는 감성적인 텍스트를 통계적 키워드로 변화시켜줄 수리적 알고리즘과 데이터 분석에 대한 비교·탐색이 매우 필요하다. 본 연구는 전통적 디자인 프로세스의 문제 인식을 기반으로 다른 산업분야에서 사용되는 트렌드 빈도분석을 도출하는 알고리즘과는 다르게 사용자 심리, 색채, 조형 등 다양한 문서 내에서 유의미한 디자인 키워드를 도출하여 소비자들에게 가장 많은 빈도로 이용되는 대중화를 기반으로 한 텍스트 추출 모델인 TF-IDF의 자연어 처리 분석 알고리즘을 연구·조사하여 선정하였다. 이러한 자연어 분석 알고리즘의 개발 목적은 경영, 마케팅, 기획 산업에 활용되는 트렌드 분석 모델과 자연어 분석 모델을 결합하면 디자인 산업에 더 큰 기대효과를 낼 것이라고 생각하여 위와 같이 선정하였다. 그 결과, TF-IDF의 분석법을 활용하면 디자인 산업에서의 디자이너가 의미 있는 정확한 키워드를 신속하게 찾아내어 도움을 줄 수 있을 것이라는 결과를 발견할 수 있었다. 새로운 산업구조가 변화하고 증가하는 반면 감성을 중요시 생각하는 디자인 구조에도 객관적인 변화가 가능하다는 결과를 얻을 수 있었다. 본 연구에서 디자이너들이 자연어 처리 프로세스를 활용하면 입력된 기존 문서 데이터 속 문장 단어를 유사도로 활용하여 의미 벡터를 결합하고 다시 디자인 문서를 벡터화하여 디자이너가 원하는 감성 데이터의 주요 문장을 키워드로 도출하는 방법을 평가하는 방식으로 본 연구의 성과와 결과를 얻을 수 있었다. 본 연구의 실험 결과로 기존 디자이너의 시간적 효율을 향상시키는 디자인산업의 새로운 발전과 방향성을 제언하고자 한다. This study has an age background in which technology development is actively being carried out to deal with big data in various industries in line with the structural changes of the new industrial revolution. However, I think that design with traditional industries also needs to make sweeping changes to accommodate the fast-growing variety of industrial and economic structures. This traditional design industry change requires a great deal of comparison and exploration of mathematical algorithms and data analysis that will transform emotional text into statistical keywords. Unlike algorithms that derive trend frequency analysis used in other industries based on the recognition of problems in traditional design processes, this study seeks to derive and use meaningful design keywords within various documents, such as user psychology, coloring and molding. The mathematical model was chosen by studying and examining the natural language processing analysis method of TF-IDF, a text extraction algorithm based on the most commonly used popularized data. The purpose of the development of these natural language analysis algorithms was chosen as above, thinking that combining trend analysis models and natural language analysis models used in the management, marketing and planning industries would have greater expected effects on the design industry. As a result, using TF-IDF’s analysis methods, designers in the design industry could quickly find and help out meaningful and accurate keywords. While new industrial structures have changed and increased, objective changes have been possible in design structures that value sensibility. The results and results of this study were obtained by designers using natural language processing processes to evaluate how to combine semantic vectors and vectorize design documents to derive key sentences of desired emotional data into keywords by using sentence words in data in existing documents entered in a similar way. As a result of the experiment of this study, I would like to suggest the new development and direction of the design industry that improves the time efficiency of existing designers.

      • KCI등재

        문서 분류를 위한 용어 가중치 기법 비교

        정호영,신상민,최용석 한국통계학회 2019 응용통계연구 Vol.32 No.2

        문서-용어 빈도행렬은 텍스트 마이닝에서 분석하고자 하는 개체 정보를 가지고 있는 일반적인 자료 형태이다. 본 연구에서 문서 분류를 위해 문서-용어 빈도행렬에 적용되는 기존의 용어 가중치인 TF-IDF를 소개한다. 추가하여 최근에 알려진 용어 가중치인 TF-IDF-ICSDF와 TF-IGM의 정의와 장단점을 소개하고 비교한다. 또한 문서 분류 분석의 질을 높이기 위해 핵심어를 추출하는 방법을 제시하고자 한다. 추출된 핵심어를 바탕으로 문서 분류에 있어서 가장 많이 활용된 기계학습 알고리즘 중에서 서포트 벡터 머신을 이용하였다. 본 연구에서 소개한 용어 가중치들의 성능을 비교하기 위하여 정확률, 재현율, F1-점수와 같은 성능 지표들을 이용하였다. 그 결과 TF-IGM 방법이 모두 높은 성능 지표를 보였고, 텍스트를 분류하는데 있어 최적화 된 방법으로 나타났다. The document-term frequency matrix is a general data of objects in text mining. In this study, we introduce a traditional term weighting scheme of term frequency-inverse document frequency (TF-IDF) which is applied in the document-term frequency matrix and used for text classifications. In addition, we also introduce and compare TF-IDF-ICSDF and TF-IGM schemes. This study also provides a method to extract keywords that enhance the quality of text classifications. We applied support vector machine for the text classification based on extracted keywords. In this study, we also used some performance metrics such as precision, recall, and F1-score to compare the performance term weighting schemes. Therefore, the TF-IGM scheme is known to provide high performance metrics that are optimal for text classification.

      • KCI등재

        소셜 네트워크 환경에서 변형된 TF-IDF를 이용한 핫 토픽 예측 기법

        노연우(Yeonwoo Noh),임종태(Jongtae Lim),복경수(Kyoungsoo Bok),유재수(Jaesoo Yoo) 한국정보과학회 2017 정보과학회 컴퓨팅의 실제 논문지 Vol.23 No.4

        최근 실시간으로 생성되는 대용량의 SNS 데이터로부터 유의미한 정보를 찾아내고 분석하는 것이 중요해지면서 핫 토픽 예측에 대한 관심도 크게 증가하고 있다. 기존 핫 토픽 검출 기법은 시간적 속성을 고려하지 않기 때문에 빠르게 변화하는 사회에서 이슈화되는 핫 토픽을 예측하기에는 부적합하다. 본 논문에서는 소셜 네트워크 환경에서 변형된 TF-IDF를 통한 핫 토픽 예측 기법을 제안한다. 변형된 TF-IDF을 이용하여 과거의 IDF 값에 대한 현재의 IDF값의 비율로 순간적으로 이슈화되는 후보 키워드 집합을 추출한다. 추출된 후보 키워드에 사용자의 영향력과 전문성을 고려한 가중치를 부여하여 핫 토픽 예측 지수를 계산한다. 제안하는 기법의 우수성을 보이기 위해 기존의 핫 토픽 검출 기법과의 성능평가를 수행한다. 또한 제안하는 기법이 핫 토픽을 정확히 예측하는지를 보이기 위해 네이버 한글 뉴스 기사를 통한 핫 토픽 예측 기법의 질을 평가한다. Recently, the interest in predicting hot topics has grown significantly as it has become more important to find and analyze meaningful information from a large amount of data flowing in social networking services. Existing hot topic detection schemes do not consider a temporal property, so they are not suitable to predict hot topics that are rapidly issued in a changing society. This paper proposes a hot topic prediction scheme that uses a modified TF-IDF in social networking environments. The modified TF-IDF extracts a candidate set of keywords that are momentarily issued. The proposed scheme then calculates the hot topic prediction scores by assigning weights considering user influence and professionality to extract the candidate keywords. The superiority of the proposed scheme is shown by comparing it to an existing detection scheme. In addition, to show whether or not it predicts hot topics correctly, we evaluate its quality with Korean news articles from Naver.

      • KCI등재

        텍스트 마이닝을 활용한 국내 개별화 학습 연구동향 분석: TF-IDF, LDA 기반 텍스트 마이닝을 중심으로

        박지우,박하나,정성희,임규연 한국교육방법학회 2022 교육방법연구 Vol.34 No.4

        최근 급격한 변화를 겪은 교육 환경에서 개별화 학습의 필요성이 더욱 강조되고 있다. 이에 본 연구에서는 텍스트 마이닝을 활용하여 국내 개별화 학습 연구동향을 확인하고, 앞으로의 개별화 지원에 시사점을 주기 위해 TF-IDF, LDA 기반 텍스트마이닝 기법을 활용하여 2012년부터 2021년까지 10년간의 개별화 학습 연구에서 주요 주제어와 토픽을 확인하였다. 연구 결과 첫째, 개별화 학습 연구는 특히 2019년 이후 발행 수가 급증하는 양상을 보였으며, 학술지별로는 일반 교육학 분야와 학제간 연구 분야의 학술지에서의 발행 수가 가장 많았다. 둘째, TF-IDF 기반 빈도 분석 결과, ‘모형’, ‘시스템’, ‘콘텐츠’, ‘프로그램’, ‘장애’, ‘인공지능’, ‘개별화교육계획’ 등의 주제어가 도출되었다. 특히 ‘모형’, ‘시스템’, ‘프로그램’ 등의 주제어는 TF와 TF-IDF 모두 상위 5위 이내에 위치하여 빈도 및 중요도 면에서 연구동향을 나타내는 주제어로 볼 수 있다. 셋째, LDA 기반 토픽모델링 결과, 도출된 토픽 6개는 ‘토픽 1: 특수교육에서의 개별화 학습’, ‘토픽 2: 개별화 학습 프로그램의 효과’, ‘토픽 3: 온라인 기반 개별화 학습 시스템’, ‘토픽 4: 교과교육에서의 개별화 학습’, ‘토픽 5: 대학에서의 인공지능·데이터 기반 개별화 학습’, ‘토픽 6: 개별화 학습 교육과정 개발 및 교원 양성’이었다. 6개 토픽 모두 10년간 전반적으로 증가하는 양상을 보였으나, 특히 토픽 3과 5의 경우 2019년 이후 급증하여 코로나19 발생 이후 비대면 학습 환경에서 개별화 학습을 지원하는 시스템과 데이터를 통한 학습 환경 설계에 대한 관심이 증가하였음을 확인할 수 있었다. 마지막으로 본 연구에서는 이와 같은 연구 결과를 종합하여 현 시점에 필요한 개별화 학습에 대한 후속연구와 개별화 학습 환경 구축 측면에서 통합적 관점으로 접근할 필요가 있음을 제언하였다.

      • KCI등재

        중국 고대의 ‘사랑’ 개념과 사랑시의 주제 ― 先秦에서 唐代까지의 사랑시를 중심으로

        金俊淵 ( Kim Joonyoun ) 중국어문연구회 2022 中國語文論叢 Vol.- No.111

        This paper attempted to analyze love poetry in China and investigate the concept of love in ancient China, the main themes of love poetry, and the typicality and emotions of love poetry by period. For this, a representative poems were selected and a topic modeling study was conducted by analyzing the TF-IDF index. Topic modeling is a statistical model for identifying the subject of a particular text. TF-IDF is a method of approaching the subject of poetry by analyzing the frequency of poetic words. Since there are no separate documents collected only from ancient Chinese love poems, this paper selected 164 love poems several documents by period and made separate documents for TF index analysis. The documents for IDF index analysis were made into 942 poems contained in three documents containing about 300 poems by period. For these poems, I secured a list of the top 50 TF-IDF indices for topic modeling. In ancient China, love is a concept closely related to the social system of marriage. Therefore, it is difficult to explain with modern love theory that values only the emotional aspect. As the theme of ancient Chinese love poems shifted from Pre-Chin(先秦) to Tang(唐) Dynasty, the theme of ‘breakup’ was strengthened rather than ‘passionate love’. Overall, ‘思’ which means ‘missing’, was found to represent the characteristic aspect of ancient Chinese love poetry. Sub-topics of love poetry include ‘Breakup’ and ‘Worry’. This is not because the concept of love has changed, but rather because the perception that love poetry should also be the result of intellectual actions has become stronger. The typicality of love poetry of each period was explored by dividing 164 love poems by period and examining the TF-IDF index. Pre-Chin’s love poems are characterized by many works that sing pure love, and female speakers are the mainstream. Although women appear as the main characters in the love poems of Han-Wei and Six Dynasties, it is evaluated that indirectness or figurativeity has increased in that most of the poets were men. The breakup quickly emerged as a major theme and the description became more delicate. In love poetry of the time, the ingredient of resentment was strengthened, and the theme of betrayal was often mentioned. It is also noteworthy that ‘tears’ was frequently used. Among the top 50 words in the TF-IDF index, those that do not overlap with each period were analyzed to see how the expression representing the emotions of love poetry changed. As a result, the role of ‘heartache(傷)’ in the Pre-Chin, ‘worry(憂)’ in the Han-Wei and Six Dynasties, and ‘resentment(恨)’ in Tang dynasty stood out. Pre-Chin’s love poems often expressed heartbreaking emotions that he/she could not be with his/her beloved. The love poems of Han-Wei and Six Dynasties dealt with the worries of the wife or husband who were engaged in staying alone due to separation or bereavement. The love poems of the Tang dynasty have been embodied several times in which they resent and lament the situation in which love is difficult to achieve amicably.

      • KCI우수등재

        국내 주요 걷기여행길의 이용행태에 대한 시멘틱 네트워크(Semantic Network) 분석

        이태숙,전채남,이태환 한국관광학회 2020 관광학연구 Vol.44 No.4

        본 연구는 국내 주요 걷기여행길에 대한 인식 및 이용행태를 파악하고자 제주올레길, 지리산둘레길, 해파랑길에 대한 최근 10년(2009.07- 2019.06)간의 온라인 포털(네이버/다음 블로그, 네이버/다음 카페)과 소셜미디어 서비스(트위터, 인스타그램) 데이터를 분석하였다. 수집된 데이터는 텍스톰(TEXTOM)과 UCINet, NodeXL을 활용하여 분석하였으며, 이를 통해 걷기여행길에 대한 특성을 파악하였다. 세부적으로는 3개의 걷기여행길별 방문 목적, 동반자 유형, 감성 이미지, 숙박 장소, 해당 길의 특성, 해당 길의 명소 등을 TF 및 TF-IDF 값을 통해 산출하였고, 걷기여행길별 관심도 추이와 월별 관심시기, 주요 키워드도 규명하였다. 연도별 분석에서 해파랑길은 시간이 지남에 따라 자료량이 증가하였고, 제주올레길은 큰 변화가 없는 것으로 나타났으며, 지리산둘레길은 관심도가 하락하는 것으로 나타났다. TF 및 TF-IDF값 산출 결과에서는 제주올레길은 ‘맛집’과 ‘카페’가, 지리산둘레길은 ‘펜션’과 ‘민박’이, 해파랑길은 ‘맛집’과 ‘펜션’이 높게 나타났다. 또한 감정어휘 분석에서는 3개의 걷기여행길 모두에서 ‘힐링’, ‘행복’의 표현들이 나타나 걷기여행의 정서적 의미를 확인하였다. 이러한 결과를 통해 본 연구는 걷기여행객 니즈에 부합하는 콘텐츠 개발의 기초자료가 될 수 있을 것으로 기대한다. This study includes analysis of text data over the last 10 years (2009. 7- 2019. 6) from online portals and social media services targeting the JejuOlle, the JirisanDulle, and the Haeparang trails to identify the perception and use of walking trails. A network analysis was conducted on the collected data using Textom program, Ucinet and NodeXL. Characteristics of each of the three walking trails were identified. Specifically, the purpose of visit, types of companion, emotional image, accommodation, characteristics of the trail, famous sites of the trail, and other informative characteristics were derived using TF and TF-IDF values for each walking trail. As a result, interest trends and major keywords for each walking trail were determined. According to the findings of time series analysis by year, the data volume of Haeparang-gil has increased over time while there was no significant change in JejuOlle-gil, and interest in JirisanDulle-gil has decreased. Calculation of TF and TF-IDF values for keywords have indicated that the two significant words for JejuOlle-gil were ‘restaurant’ and ‘cafe’ while JirisanDulle-gil showed ‘pension’ and ‘B&B’, and ‘restaurant’ and ‘pension’ for Haeparang-gil. Moreover, findings upon sentiment analysis based on emotional vocabulary showed that all three walking trails had expressions such as ‘healing' and ‘happiness.’ It is expected that this study will be used as a fundamental reference to develop and improve contents that would fulfill walking travelers' needs.

      • KCI등재

        군집분석을 이용한 양파 감성사전 구축

        오승원,김민수 한국자료분석학회 2018 Journal of the Korean Data Analysis Society Vol.20 No.6

        Many researches are accomplished as a result of the efforts of developing the production predicting model to solve the supply imbalance of onions which are vegetables very closely related to Korean food. But considering the possibility of storing onions, it is very difficult to solve the supply imbalance of onions only with predicting the production. So, this paper's purpose is trying to build a sentiment dictionary to predict the price of onions by using the internet articles which include the informations about the production of onions and various factors of the price, and these articles are very easy to access on our daily lives. Articles about onions are from 2012 to 2016, using TF-IDF for comparing with four kinds of TF-IDFs through the documents classification of wholesale prices of onions. As a result of classifying the positive/negative words for price by k-means clustering, DBSCAN (density based spatial cluster application with noise) clustering, GMM (Gaussian mixture model) clustering which are partitional clustering, GMM clustering is composed with three meaningful dictionaries. To compare the reasonability of these built dictionary, applying classified articles about the rise and drop of the price on logistic regression, and it shows 85.7% accuracy. 우리나라 식생활에 밀접한 관련을 가지고 있는 채소인 양파의 수급불균형 해결을 위한 생산량 예측 모형 개발의 노력이 많은 연구를 통해 이뤄지고 있다. 하지만 양파의 수확기와 저장 가능성을 고려해 봤을 때 생산량 예측만으로는 수급불균형 해결이 어렵다. 따라서 본 논문에서는 양파의 생산량 정보와 가격의 다양한 요인이 포함되어 있으며 일상에서 쉽게 접할 수 있는 인터넷 기사를 이용하여 가격 예측을 위한 감성사전을 구축하고자 한다. 양파 기사는 2012년부터 2016년까지의 데이터를 사용하였고 도매시장 가격을 통한 문서구분을 통해 4가지 TF-IDF를 비교하여 적합한 TF-IDF를 사용하였다. 분석을 위하여 분할적 군집분석 중 k-means 군집, 밀도기반군집(DBSCAN; density based spatial cluster applications with noise), 가우시안혼합분포군집(GMM; Gaussian mixture model) 군집을 통하여 가격에 대한 긍정/부정 단어를 구분한 결과 GMM 군집이 의미 있는 긍정, 부정, 무정의 3개의 사전으로 구성되었다. 구축된 사전의 합리성을 비교하기 위하여 가격 상승 기사와 가격 하락 기사의 분류에 로지스틱 회귀분석을 적용한 결과 85.7%의 정확도로 구축된 사전의 합리성을 확인할 수 있었다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼