RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        경험적 모델과 머신러닝 기법을 활용한 SNS 사용자 분류방법 비교: 플리커 데이터의 관광객 분류방법

        강영옥,조나혜,이주윤,윤지영,이혜진 대한공간정보학회 2019 대한공간정보학회지 Vol.27 No.4

        플리커는 위치, 시간, 사진 등의 정보를 포함하고 있어 관광 분야에서 활용이 높은 SNS 가운데 하나이다. 플리커 데이터를 활용하여 관광객의 특성을 분석하기 위해서는 플리커에 사진을 업로드한 사용자 가운데 관광객을 구분하는 것이 필수적이다. 실제 플리커의 메타데이타에는 사용자의 거주지 정보를 기재하게 되어 있지만 정확하게 기재한 사용자의 비율은 40% 미만이다. 본 연구는 플리커 사용자 가운데 관광객과 거주자를 구분하기 위해 경험적 모델과 기계학습 방법을 적용하고, 정확도를 평가하여 어떠한 방법을 사용할지 제안하고자 하였다. 경험적 방법에는 시간적 임계치, 최다 사진 촬영 국가, 최장 체류 국가, 최다 방문 국가를 기준으로 거주국을 추정하는 4가지 방법을, 기계학습 방법에는 로지스틱 회귀, 서포트벡터머신, 의사결정나무, 랜덤포레스트, 인공신경망 모델의 5가지 방법을 적용하였다. 적용 결과 경험적 방법에서는 최장 체류 국가를 기준으로 거주국을 추정하는 방법이, 기계학습 방법에서는 랜덤포레스트 방법이 가장 정확도가 높게 도출되었다. 그러나 관광객 구분에 있어서 정확도뿐 아니라 특이도도 주의 깊게 고려해야 할 항목임을 알 수 있었으며, 연구 목적에 따라 다른 방법이 선택될 수 있음을 제안하였다. Flickr is one of the most utilized SNS in the field of tourism because it contains information such as location, time, and photos. In order to analyze the characteristics of tourists using Flickr data, it is essential to identify the tourists among the users who uploaded the photos to Flickr. Flicker's metadata is supposed to contain the owner’s location information, but the percentage of users accurately stated is less than 40%. The purpose of this study is to suggest a model which accurately distinguish between tourists and residents after experimenting various models. For empirical models, four methods were used to estimate the country of residence based on the time threshold, the highest photo-taking country, the longest-stay country, and the most visited country. Five machine learning methods are applied: logistic regression, support vector machine, decision tree, random forest, and artificial neural network model. As a result, the method of estimating the country of residence based on the longest stay nation in the empirical method and the random forest method in the machine learning method were found to be the most accurate. However, it was found that not only the accuracy but also the specificity should be considered carefully in the tourist category, and suggested that different methods could be selected according to the research purpose.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼