RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI우수등재

        참고문헌의 유무가 LDA를 사용한 토픽 모델링 결과에 미치는 영향

        백주해 ( Juhae Baeck ),권형일 ( Hyungil Kwon ),최미화 ( Mihwa Choi ),( Yi-hsiu Lin ) 한국체육학회 2019 한국체육학회지 Vol.58 No.6

        본 연구는 논문을 사용한 토픽 모델링에서 연구자가 고려해야 할 요소 중 하나인 참고문헌 제거 여부에 대한 필요성을 탐색하고자 하였다. 참고문헌 내용만을 텍스트에서 정확하게 제거하는 명령어나 기술이 제공되고 있지 않아, 참고문헌을 제외한 텍스트로 토픽 모델링을 수행하고자 하였을 때에는 연구자가 모든 텍스트에서 일일이 참고문헌을 제거하는 과정을 거쳐야만 한다. 이렇게 많은 노동력과 시간이 소요되는 참고문헌 제거 과정이 연구자에게 부담으로 작용할 수 있으므로, 참고문헌의 존재가 토픽 모델링 결과에 어떠한 영향을 미치는지를 알아보고 토픽 모델링에 더욱 적합한 텍스트 형태를 제시하고자 하였다. 스포츠산업경영 분야의 국제 저널 SMQ, ESMQ와 JSM에서 최근 10년간 출간된 논문을 대상으로 토픽 모델링을 수행하고, 참고문헌이 포함된 텍스트와 참고문헌이 제거된 텍스트의 토픽 모델링 결과를 비교하였다. 스포츠산업경영 및 마케팅에 대한 전반적인 지식을 가지고 세 가지 저널의 특성에 대해 충분히 이해하고 있는 전문가 5인의 평가로 결과 비교가 이루어졌다. 비교 결과, 참고문헌을 포함한 전문을 사용하였을 때 더욱 해석이 용이한 토픽 모델링 결과가 도출되는 것으로 나타났다. 텍스트에 참고문헌이 포함되었을 때에 토픽을 산출하는 데 할당되는 논문 간의 연관성이 높았으며, 연관성이 높은 논문들로부터 산출된 토픽의 해석가능성 또한 높아지는 것으로 판단할 수 있다. 이처럼 참고문헌의 존재가 토픽 모델링 결과에 부정적인 영향을 미치지 않는다는 본 연구결과에 따르면, 논문을 사용한 토픽 모델링에서 참고문헌을 제거하는 추가적인 절차를 거치지 않아도 됨을 뜻한다. 이에 따라, 논문을 사용한 토픽 모델링을 수행하고자 하는 추후 연구에서는 참고문헌의 존재가 미칠 수 있는 토픽 모델링 결과에 대한 부정적인 영향력에 대한 고민을 덜 수 있을 것으로 판단된다. This study tried to investigate the necessity of the reference removal procedure during the text pre-processing in topic modeling by comparing the topic modeling results using the text with reference and the text without reference. The use of full-text article for the topic modeling may cause extra work on removing the subsidiary part that is not directly related to the content of the article, because it is not able to selectively extract the certain part of the text that researcher wants to include in the analysis has not yet been developed. Therefore, manual work by the researcher is required to remove the subsidiary information and it takes a great amount of labor and time to perform the text pre-processing rather than the actual topic modeling analysis process. Thus, this study compared the topic modeling result of the text containing reference and of the text without reference. The research articles has been published from three major sports management and marketing journals from 2009 to 2018 were collected. JSM, ESMQ, and SMQ have been selected based on their reputation and status in the academic field. Five sport management/marketing experts were hired to evaluate the quality of the topic modeling result. The result indicated that the text containing reference produced a better topic modeling result than the text without reference. The relevance between the articles which were used to generate certain topic was higher when the text containing reference. It can be concluded that the quality of the topics is also high when the relevance of the articles is high. Based on this result, reference removal procedure is not necessary for the topic modeling using research articles. It can reduce a considerable amount of time and labor that the researcher needs to spend on pre-processing.

      • KCI등재

        토픽모델링을 활용한 상담과정에서 상담자와 내담자 간 언어변화

        김하선(Ha-Seon Kim),조남옥(Nam-Ok Cho),이윤주(Yoon-Joo Lee) 학습자중심교과교육학회 2023 학습자중심교과교육연구 Vol.23 No.20

        목적 본 연구의 목적은 상담과정에서 이루어진 상담자와 내담자 간의 상담 내용을 토픽모델링을 활용하여 주요 주제를 추출하며 시간의 흐름에 따른 언어변화를 탐색하는 데 있다. 방법 한 상담사가 주 1회 50분 동안 총 5회에 걸쳐 내담자 A와 내담자 B에게 개별상담을 진행한 내용과 추수상담 1회를 포함한 상담 축어록을 전사한 후, 정제과정을 거친 뒤 빈도분석과 토픽모델링을 실시하였다. 결과 빈도 분석 결과, 내담자 A의 상담에서 주요 핵심어는 ‘생각’, ‘사람’, ‘마음’ 등이 나타났으며, 내담자 B의 상담에서는 ‘엄마’, ‘아이’, ‘이야기’ 등이 주로 등장하였다. LDA토픽모델링 결과, 내담자 A의 주요 토픽은 ‘생각과 기분’, ‘자신의 생활’ 등으로, 상담자의 토픽은 ‘남편과 마음’, ‘사람의 마음’ 등 5개씩 추출되었다. 내담자 B의 주요 토픽은 ‘교수 생각’, ‘칭찬 이야기’ 등으로, 상담자의 토픽은 ‘걱정된 이야기’, ‘엄마 공부’ 등 8개씩 추출되었다. 또한, DTM토픽모델링 결과, 내담자 A와 B 모두 상담 초기와 종결 회기에서의 토픽 출현이 높았으며, 상담과정 중에는 낮았다. 반면, 상담자는 상담 초기부터 종결 회기까지 토픽의 출현이 높았으며, 추수상담에서는 내담자와 상담자 모두 토픽 출현이 낮게 나타났다. 결론 본 연구를 통해, 상담과정 중 핵심 주제어와 토픽을 추출하여 내담자의 관심사와 주제를 파악하고 토픽 변화를 분석함으로써, 상담자와 내담자 간 상호작용에서 특정 주제와 언어가 어떻게 변화되는지 탐색하는 데 도움이 되었다. 이러한 연구 결과는 상담자가 내담자의 주요 관심사에 초점을 맞춘 개인상담을 진행하고 있는지 확인하여 상담과정의 질을 개선하는 데 중요한 정보를 제공함을 시사한다. 뿐만 아니라, 개인상담의 내용을 분석하는 데 토픽모델링이라는 인공지능 분석기법을 활용하여, 상담과정에서 상담자와 내담자 간 언어변화를 제시하는 데 의의를 두고 있다. Objectives The aim of this study is to utilize counseling content between counselors and clients during the coun-seling process using topic modeling, extract key themes, and investigate language changes over time. Methods A single counselor conducted individual counseling sessions with Client A and Client B, each lasting 50 minutes, once a week for a total of 5 sessions. The transcripts of these counseling sessions, including a follow-up session, underwent refinement before undergoing frequency analysis and topic modeling. Results In the frequency analysis, key keywords in Client A's counseling sessions included ‘thoughts,’ ‘people,’ and ‘emotions,’ while in Client B's counseling sessions, ‘mother,’ ‘child,’ and ‘stories’ predominated. LDA topic modeling revealed that Client A's major topics were ‘thoughts and emotions’ and ‘personal life,’ while topics such as ‘husband and emotions’ and ‘people's emotions’ were extracted for the counselor, each occurring 5 times. For Client B, primary topics included ‘professor's thoughts’ and ‘complimentary stories,’ while for the counselor, top-ics like ‘worrisome stories’ and ‘mother's studies’ were extracted, each occurring 8 times. Additionally, DTM topic modeling results showed that both Client A and B had higher topic appearances at the beginning and end stages of counseling, with lower appearances during the counseling process. In contrast, the counselor had a high topic appearance from the beginning to the end, while in the follow-up session, both the client and the counselor showed lower topic appearances. Conclusions Through this study, extracting core keywords and topics during the counseling process allowed for the identification of client interests and themes, as well as the analysis of topic changes over time. This in-formation can assist counselors in focusing on the client's primary concerns, thus improving the quality of the counseling process. Furthermore, the use of artificial intelligence analysis techniques such as topic modeling in analyzing the content of individual counseling sessions is significant in presenting language changes between counselors and clients during the counseling process.

      • KCI등재

        비정형 텍스트 자료에서 잠재정보 추출을 위한 토픽모델링 소개: 치매관련 신체활동 뉴스 기사의 이슈 분석

        윤효준,박재현,윤지운 국민체육진흥공단 한국스포츠정책과학원 2019 체육과학연구 Vol.30 No.3

        [Purpose] The purpose of this study is to introduce the basic concepts and procedures for topic modeling and to explain topic modeling to news articles about dementia-related physical activities. And it is also to discuss the possibility of using topic Modeling in the field of physical education. [Methods] In this study, the LDA algorithm of topic modeling is explained and the analysis procedure is summarized step by step by text preprocessing, text formatting, and topic number determination. The application cases were selected from 274 news articles about dementia-related physical activities reported in 13 major daily newspapers from 2000 to 2018. [Results] When the number of topics is 3, the Coherence Score figure is the highest. Topic 1 is about welfare services for dementia patients, Topic 2 is about prevention of dementia, and Topic 3 is about dementia research. The ratio by each subject is Topic 2 (46.0%), Topic 3 (33.2%) and Topic 1 (20.8%) in order of high ratio. [Conclusion] Topic modeling is an effective methodology to extract potential information excluding subjectivity of researchers. It is expected to be used when searching for information in massive texts in the field of physical education. [목적] 이 연구는 토픽모델링에 대한 기본개념 및 절차에 대해 소개하고 치매관련 신체활동에 대한 뉴스기사에 토픽모델링을 적용사례로 설명하는 것이 목적이다. 아울러 체육학 분야에서 토픽모델링의 활용가능성을 논의하고자 하였다. [방법] 이 연구에서는 토픽모델링의 LDA 알고리즘을 설명하고 분석절차를 텍스트전처리, 텍스트정형화, 토픽수결정으로 단계별로 요약하였다. 적용사례는 치매관련 신체활동에 대한 뉴스기사로 2000년부터 2018년까지 13개 주요일간지에 보도된 274건의 뉴스본문을 대상으로 선정하였다. [결과] 토픽의 수는 3개 일 때 Coherence Score값이 가장 높게 나타났다. 토픽1은 치매환자를 위한 복지서비스 주제, 토픽2는 치매예방 주제, 토픽3은 치매연구 주제이다. 주제별 비율은 토픽2(46.0%), 토픽3(33.2%), 토픽1(20.8%)순으로 높게 나타났다. [결론] 토픽모델링은 연구자의 주관성을 배제하여 잠재적 정보를 추출해낼 수 있는 효과적인 방법론으로 체육학분야에서도 방대한 텍스트자료에서 정보를 탐색하고자 할 때 활용되길 기대한다.

      • KCI우수등재

        온라인 댓글의 주제 분석을 위한 토픽 모델링 : 이슈 포착과 분류에 활용 가능한 LDA와 BTM의 비교와 검증

        이신행 한국언론학회 2023 한국언론학보 Vol.67 No.4

        Using computers to rapidly and efficiently build a model to organize massive volumes of textual data, topic modeling is an unsupervised machine learning technique that can be used to classify texts into related themes or to analyze the nature and distribution of topics. However, topic modeling's usage in media research has recently come under fire for failing to take into account reliable and valid measures of theoretically defined concepts. This means that topic modeling needs methodological validation and reliability in order to be employed in media research as a tool for investigating and summarizing massive volumes of textual material. Additionally, it is helpful to be able to group online comments into "issues" and list their important points in order to quickly identify social issues and monitor discourse patterns in real-time on digital platforms. For this reason, attempts to diagnose the methodological validity of topic modeling for analyzing the topics of comments are of great significance. Therefore, this study validates topic modeling for analyzing online comments by verifying its performance as follows. First, we discussed why topic analysis of comments is necessary and what the implications are through the conceptualization of "issues" in the context of online comments. Then, with an emphasis on the Latent Dirichlet Allocation (LDA) model, we reviewed the principle of topic modeling to estimate the topic of text and the assumptions of statistical models that affect topic estimation. Additionally, we contrasted the merits and drawbacks of LDA and the Biterm Topic Model (BTM) to suggest topic modeling as a means of identifying the subject of comments and categorizing them as "issues." Based on the above theoretical discussion, we applied topic modeling to analyze 9,000 online news comments on articles covering nine social issues and validate whether the topics are useful to classify comments according to the "issues" of the news. The results are as follows. First, compared to BTM, LDA is highly dependent on the hyperparameter, , with lower values leading to better model performance. Second, both BTM and LDA were able to estimate the optimal number of topics (K ), but BTM showed less variation in performance with value selection than LDA, and performance degradation was worse when the value was lower than the optimal K than when it was higher. Third, both BTM and LDA performed better when adding bigrams along with unigrams to the vocabulary, but the difference was more pronounced for LDA. Based on these validation results, we assessed the validity of topic modeling for analysis of comments and discussed its implications. 토픽 모델링은 컴퓨터를 이용해 빠르고 쉽게 방대한 양의 정보를 구성하거나 파악하는 모델을 추정하는 비지도 기계학습 방법으로 문서를 비슷한 토픽별로 묶어내거나 토픽의 내용과 분포를 파악하고자 할 때 활용된다. 그런데 토픽 모델링을 미디어 연구에 활용함에 있어 이론적으로 정의된 개념을 타당하고 신뢰할 수 있는 측정하는 방법으로써의 고민이 부족했다는 지적이 최근 제기되고 있다. 대단위 텍스트 자료를 탐색하고 요약하는 도구인 토픽 모델링을 미디어 연구에 활용하기 위해서 방법적 타당성 검증과 신뢰성 확보가 필요하다는 것이다. 더욱이, 온라인 플랫폼을 통해 거대한 규모로 빠르게 발생하고 있는 댓글을 ‘이슈’에 따라 분류하고 그 주요 주제를 요약하는 방법은 사회적 쟁점을 즉각적으로 파악하고 담론 양상을 통시적으로 추적하는데 유용하다. 이러한 이유에서 댓글의 주제를 분석하기 위한 토픽 모델링의 방법적 타당성을 진단하는 시도는 그 의의가 크다고 할 수 있다. 이에 본 연구는 온라인 댓글의 주제 분석을 위한 토픽 모델링 방법을 제시하고 그 성능과 타당성을 다음과 같이 검증했다. 우선, 온라인 댓글의 맥락에서 다뤄지는 ‘이슈’에 대한 개념화를 통해 댓글의 주제 분석이 왜 필요하고 어떠한 함의가 있는 것인지에 대해 논의했다. 그리고 토픽 모델링이 텍스트의 주제를 추정하는 원리와 주제 추정에 영향을 미치는 통계 모델로써의 가정들에 대해 Latent Dirichlet Allocation(LDA) 모델을 중심으로 살펴봤다. 또한 댓글의 주제를 포착하고 ‘이슈’별로 분류하기 위한 토픽 모델링을 제안하고자 LDA와 Biterm Topic Model(BTM)의 성능과 한계를 비교했다. 이상의 이론적 논의를 토대로 9개의 사회적 이슈를 다루고 있는 기사에 달린 9,000건의 온라인 뉴스 댓글을 토픽 모델링으로 분석해 주제를 추정하고 이에 따라 댓글이 뉴스의 ‘이슈’에 따라 분류되는지를 모델별로 비교 검증했다. 그 결과는 다음과 같다. 첫째, BTM에 비해 LDA는 초모수 에 많은 영향을 받았는데 값이 낮아질수록 모델의 성능이 좋아졌다. 둘째, BTM과 LDA 모두 최적의 주제의 개수(K)를 추정할 수 있었으나, BTM이 K값 선정에 따른 성능 변화가 LDA보다 적었고 K값이 최적의 값보다 클 때보다 낮을 때 성능 저하가 심해졌다. 셋째, BTM과 LDA 모두 분석 단어 목록에 단일 형태소와 함께 바이그램(bigram)을 추가할 때 성능이 좋아졌으나 그 차이는 LDA에서 더욱 뚜렸했다. 이러한 검증 결과를 토대로 댓글의 주제 분석을 위한 토픽 모델링의 활용 가능성을 진단하고 그 함의를 논의했다.

      • KCI등재

        국내 기록관리학 연구동향 분석을 위한 토픽모델링 기법 비교 - LDA와 HDP를 중심으로 -

        박준형,오효정 한국도서관·정보학회 2017 한국도서관정보학회지 Vol.48 No.4

        The purpose of this study is to analyze research trends of archives management in Korea by comparing LDA (Latent Semantic Allocation) topic modeling, which is the most famous method in text mining, and HDP (Hierarchical Dirichlet Process) topic modeling, which is developed LDA topic modeling. Firstly we collected 1,027 articles related to archives management from 1997 to 2016 in two journals related with archives management and four journals related with library and information science in Korea and performed several preprocessing steps. And then we conducted LDA and HDP topic modelings. For a more in-depth comparison analysis, we utilized LDAvis as a topic modeling visualization tool. At the results, LDA topic modeling was influenced by frequently keywords in all topics, whereas, HDP topic modeling showed specific keywords to easily identify the characteristics of each topic. 본 연구에서는 최근 각광을 받고 있는 텍스트마이닝 기법인 LDA 토픽모델링과 이를 변형한 HDP 토픽모델링을 적용하여 국내 기록관리학의 연구동향을 분석하고자 한다. 이를 위해 국내 기록관리학 관련 학술지 2종과 문헌정보학 관련 학술지 4종에서 1997년부터 2016년까지 발표된 기록관리학 관련 논문 1,027건을 수집하고 적절한 전처리과정을 거친 후 LDA 토픽모델링과 HDP 토픽모델링을 각각 수행하였다. 또한 토픽모델링 시각화 도구인 LDAvis를 활용하여 토픽별 거리를 가시적으로 표현하고 세부 대표 키워드를 분석하였다. 두 토픽모델링을 비교한 결과, LDA 토픽모델링은 전반적으로 해당 도메인을 대표하는 주요 키워드로 빈도수에 영향을 많이 받았으며, HDP 토픽모델링은 각 토픽별 특징을 파악할 수 있는 특수한 키워드가 많이 도출되었다. 이를 통해 LDA는 국내 기록관리학 내에 거시적으로 대표되는 주제들을, HDP는 세부 주제별 미시적인 핵심 키워드를 도출하는데 효과적임을 알 수 있었다.

      • KCI등재

        토픽모델링을 활용한 쟁점 분석

        임연수(Yon Soo Lim) 한국자료분석학회 2023 Journal of the Korean Data Analysis Society Vol.25 No.1

        이 연구는 사회적 쟁점을 추적하고 탐색하는 쟁점 분석 측면에서 토픽모델링의 활용 가능성을 탐지하는 데 목적이 있다. 토픽모델링 방식 중 잠재 디리클레 할당(Latent Dirichlet Allocation: LDA) 알고리즘에 기반한 토픽 분석과 구조적 토픽모델링(Structural Topic Modeling: STM) 방법은 연구 접근 방식에 따라 구분해서 사용할 필요가 있다. 가설 검증을 위한 확인적 자료 분석(Confirmatory Data Analysis) 방식에는 STM이 적합하고, 언론 보도에 대한 쟁점 분석과 같이 자료에 대한 탐색적 자료 분석(Exploratory Data Analysis)에는 LDA가 적합하다. LDA 기반 토픽 분석에서 문서 내 메타 정보를 활용해 문서 범주를 분류한다면 동태적 자료 분석도 가능할 수 있다. 이를 실증적으로 살피기 위해서 10개의 국내 주요 전국일간지에서 보도한 증오 관련 기사를 대상으로 LDA 기반 토픽 분석을 수행했다. 분석 결과, 모든 언론사에서 여성 증오 범죄를 2021년에 주요하게 다루고 있었고, 증오와 혐오 정치 토픽이 2022년에 상승하는 추세를 보였다. 증오문제에 대한 보도 방향이 언론사 간 큰 차이를 나타내지 않고 있으며, 정치적 편향에 따른 보도특성도 크지 않았다. 이는 증오 문제가 언론 보도에서는 중요한 쟁점으로 아직은 부상하지 않음을 나타낸다. 결론적으로, 이 연구는 쟁점을 추적하고 탐지하는 활동에 LDA 기반 토픽모델링 방법이 충분히 활용될 수 있다는 점을 실증 분석을 통해 보여준다. This study aims to explore the possibility of using topic modeling in terms of issue analysis in tracking and detecting social issues. Among the topic modeling methods, LDA(Latent Dirichlet Allocation) based topic analysis and STM(Structural Topic Modeling) need to be used separately according to the research approach. STM is suitable for Confirmatory Data Analysis for hypothesis test, and LDA is suitable for Exploratory Data Analysis, such as issue analysis on news media. Dynamic data analysis may be possible if document categories are classified using meta-information in documents in LDA based topic modeling. In order to empirically examine, an LDA based topic analysis was conducted on hatred articles reported by 10 major national daily newspapers in Korea. From the results, all newspapers mainly dealt with hatred crimes against women in 2021, and hatred politics of politicians showed an upward trend in 2022. The direction of news reporting on the hatred issue did not show much difference among newspapers, and the characteristics of news reporting due to political bias were not large. This indicates that the issue of hatred has not yet emerged as an important issue in news coverage. In conclusion, this study demonstrates through empirical analysis that LDA based topic modeling can be fully utilized for research activities that track and detect issues.

      • KCI등재후보

        지역신문기사 자료와 토픽모델링을 이용한 해변 관련 계절별 현안분석

        유무상,정수연,김건후,손철 한국지역학회 2018 지역연구 Vol.34 No.4

        The purpose of this study is to analyze the seasonal issues using the local newspaper articles with the keyword beach from 2004 to 2017. Topic modeling and Time series regression analysis based on open source programs were performed for analysis. Topic modeling results showed 35 topics in spring, 47 topics in summer, 36 topics in autumn and 35 topics in winter. The common themes were ‘beaches’, ‘festivals and events’, ‘accident and environmental issues’, ‘tourism’, ‘development and sale’, ‘administration and policy’ and ‘weather’. Time series regression analysis showed in the spring, 5 Hot-Topics and 2 Cold-Topic were found out of the 35 topics. In the summer, 6 Hot-Topics and 3 Cold-Topic were found out of the 47 topics. In the autumn, 4 Hot-Topics and 3 Cold-Topic were found out of the 36 topics. In the winter, 3 Hot-Topics and 3 Cold-Topic were found out of the 35 topics. And for each season, topics that do not fall into the Hot-Topic and Cold-Topic are classified as Neutral-Topic. In this study if seasonal uses are different such as beaches are deemed that seasonal topic modeling for analysis of regional issues will yield more useful results and enable detailed diagnosis. 본 연구의 목적은 2004년부터 2017년까지의 해변과 해수욕장을 키워드로 하는 지역신문기사를 이용하 여 계절별 현안을 분석하는 것이다. 분석을 위해 오픈소스 프로그램을 기반으로 한 토픽모델링과 시계열회귀분석 을 수행하였다. 토픽모델링 분석 결과 계절별 토픽은 봄 35개, 여름 47개, 가을 36개, 겨울 35개가 도출되었다. 모 든 계절에서 공통적으로 도출된 주제는 해수욕장, 축제·행사, 사건사고 및 환경문제, 관광지, 개발·분양, 행정· 정책, 날씨로 나타났다. 시계열회귀분석 결과 봄에는 35개의 토픽 중 5개의 상승 토픽과 2개의 하락 토픽이 도출 되었다. 여름에는 47개의 토픽 중 6개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 가을에는 36개의 토픽 중 4 개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 겨울에는 35개의 토픽 중 3개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 그리고 각 계절별로 상승 토픽과 하락 토픽에 해당하지 않는 토픽은 중립 토픽으로 구분하였다. 본 연구를 통해 해변과 같이 계절별로 용도가 다른 경우에 지역현안에 대한 분석을 위해 계절별 토픽모델링을 진행 한다면 더욱 유용한 결과를 도출하고 이에 따른 세부적인 진단이 가능하다고 판단된다.

      • KCI등재
      • KCI등재

        토픽모델링 연구동향 분석 : 공학과 사회과학 분야 KCI 등재지를 중심으로

        최성철(Sung Cheol Choi),박한우(Han Woo Park) 한국자료분석학회 2020 Journal of the Korean Data Analysis Society Vol.22 No.2

        해외에서 토픽모델링 관련 연구가 이루어짐에 따라, 국내에서도 토픽모델링에 대한 관심이 증가하고 있다. 따라서 국내 토픽모델링 연구에 대한 트렌드와 계열간 연구주제 차이를 파악하고 한국어에 대한 토픽모델링 기법 적용 가능성을 확인하고자 하였다. 한국학술지인용색인(KCI) 홈페이지에서 제공되는 데이터를 수집한 후 저자와 기관을 중심으로 네트워크 분석을 수행하였다. 세부적인 연구주제와 동향을 파악하기 위하여, 연구진이 수집한 논문들을 읽고 내용분석을 진행하였으며 동시에 LDA와 DTM 기반 토픽모델링 분석을 수행하였다. 결과의 시사점은 다음과 같다. 첫째, 토픽모델링 관련 연구는 2015년부터 급증하는 것으로 나타났으며 공학 계열보다 사회과학 논문 수가 더 많았다. 둘째, 공저자 네트워크 분석결과는 공학과 사회과학 계열 모두 소그룹 형태로 다수 구성되어 학술연구 네트워크의 초기형태를 보였다. 마지막으로 토픽모델링을 통해 나타난 세부 주제의 구성이 계열별 차이를 보였다. 공학 계열은 타 시스템과의 적용가능성과 신규 알고리즘 개발에 중점을 둔 주제로 구성된 반면, 사회과학 계열은 주제 및 여론 발굴, 그리고 여론 동향분석과 관련된 것으로 구성되었다. 본 연구 결과는 KCI 등재지의 논문 서지정보를 이용하여 새로운 연구방법인 토픽모델링의 트렌드를 파악하고, 공학과 사회과학 그룹간 세부 주제의 차이를 검토하였다는 점에서 학술적 의의를 지닌다. Current study collected a total of 166 publications indexed in the KCI (Korea citation index) that used a topic modeling analysis since 2000. Through co-authorship data, social network analysis for researchers and institutions was performed for social sciences versus engineering discipline. A LDA (latent Dirichlet allocation) analysis was also performed to identify detailed research topics and trends. The findings are as follows. First, studies related to topic modeling in Korea showed that the number of papers in the social sciences was increasing rapidly from 2015 and confirmed that the number of papers in the social sciences was higher than those in engineering. Second, the co-authorship networks consisted of a number of small groups, both in engineering and social science. This is an early form of academic research networks. Finally, engineering papers focused on applicability with other systems and development of new algorithms. The social science sector, on the other hand, showed a difference, consisting of an analysis of issues, public opinion, and trends.

      • KCI등재

        토픽 모델링을 통한 컴퓨터 보조 언어학습의 연구 동향

        김지영 인문사회 21 2022 인문사회 21 Vol.13 No.6

        A Topic Modeling Analysis of Research Trendsin Computer-assisted Language LearningJieyoung Kim Abstract: This study is to identify research trends by extracting keywords from papers on computer-assisted language learning listed in Korean journals from 1990 to 2022 through topic modeling, deriving topics, and studying changes over time. A total of 344 papers were selected as research subjects. Salient terms and topics were analyzed, and regression analysis was performed to analyze upward and downward topics. Among the 30 salient terms, ai, reading, online, translation, feedback, and apps were the top. The ten topics extracted through the topic modeling as follows: ① AI and language education, ② multimedia classroom education, ③ AI, multimedia, & grammar instruction, ④ Internet, pronunciation & software, ⑤ vocabulary, ⑥ online collaborative, ⑦ speaking apps, ⑧ cyber translation, ⑨ reading, & extensive, and ⑩ digital communication. The topic ⑦ is an upward topic but ② ③ ④ ⑤ topics are downward. Key Words: Topic Modeling, Computer-assisted, Language Learning, Research Trends, Regression Analysis 토픽 모델링을 통한 컴퓨터 보조 언어학습의 연구 동향김 지 영* 연구 목적: 본 연구는 토픽 모델링은 통해 1990년부터 2022년까지 국내 학술지에 등재된 컴퓨터 언어 보조 학습에 관련된 논문의 핵심어를 추출하고 토픽을 도출한 후 시간에 따른 변화를 연구하여 연구 동향을 알아보는 것이다. 연구 방법: 344편의 논문을 대상으로 핵심어와 토픽을 분석하고 회귀 분석을 시행하여 상승토픽과 하향 토픽을 분석하였다. 연구 내용: 30개 핵심어 중 ai, reading, online, translation, feedback, apps가 상위였으며, 토픽 모델링을 통해 추출된 10개의 토픽은 다음과 같다: ① 인공지능과 언어교육 ② 멀티미디어 교실 교육, ③ 인공지능, 멀티미디어, 문법 지도, ④ 인터넷, 발음, 소프트웨어 ⑤ 어휘 ⑥ 온라인 협동학습 ⑦ 말하기 apps ⑧ 사이버 번역 ⑨ 읽기와 다독 ⑩ 디지털 커뮤니케이션. 10개 토픽 중 ⑦은 상승토픽이며, ② ③ ④ ⑤ 하향 토픽이었다. 결론 및 제언: 연구 결과는 향후 연구의 방향 제시에 도움이 될 것이다. 핵심어: 토픽 모델링, 컴퓨터 보조, 언어학습, 연구 동향, 회귀 분석 □ 접수일: 2022년 11월 11일, 수정일: 2022년 12월 2일, 게재확정일: 2022년 12월 20일* 중앙대학교 영어교육과 교수(Professor, Chung-Ang Univ., Email: jk221@cau.ac.kr)

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼