최근 들어 각종 문헌자료들의 디지털화가 급속히 진행되고 있으며 일상 생활사 자료로서의 의의가 새롭게 부각되어온 일기자료 역시 예외는 아니다. 그러나 디지털화된 텍스트자료들은 그 ...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A101793377
2016
Korean
일기 ; 디지털텍스트 ; 토픽모델링 ; 타당도 ; 사전적 지식 ; 어휘 자루 ; 멀리서 읽기 ; diary ; digitized text ; topic modeling ; validity ; prior domain expertise ; bag of words ; distant reading
KCI등재
학술저널
89-135(47쪽)
42
0
상세조회0
다운로드국문 초록 (Abstract)
최근 들어 각종 문헌자료들의 디지털화가 급속히 진행되고 있으며 일상 생활사 자료로서의 의의가 새롭게 부각되어온 일기자료 역시 예외는 아니다. 그러나 디지털화된 텍스트자료들은 그 ...
최근 들어 각종 문헌자료들의 디지털화가 급속히 진행되고 있으며 일상 생활사 자료로서의 의의가 새롭게 부각되어온 일기자료 역시 예외는 아니다. 그러나 디지털화된 텍스트자료들은 그 방대한 규모로 인하여 전통적인 텍스트분석방법으로는 소화해내기에 한계가 있다. 본 연구에서는 해당 분야에 대한 별다른 사전적 전문지식이 없이도 방대한 디지털 텍스트자료로부터 소수의 의미 있는 토픽을 추출해주는 알고리즘으로 알려진 토픽모델링 기법의 특징과 이론적 전제에 대해 살펴보고, 이를 농민일기 분석에 예시적으로 적용해보았다. 토픽모델링 기법을 적용하여 아포일기에서 추출된 토픽들은 해석가능성이나 외적 타당도 측면에서 유의미한 것으로 드러났다. 전통적 텍스트분석방법에 의한 연구결과와의 비교에서도 대체로 일맥상통하는 것으로 나타났으며, 더 나아가 기존연구에서는 간과하였던 새로운 토픽을 발견해낼 수도 있음을 보여주었다. 이런 연구결과에 기반하여 향후 일기자료 연구에 토픽모델링 기법이 본격적으로 활용되기 위해서는 검토해야 할 부분이 무엇인지 토픽모델링의 주요 특징으로 알려진 1) 연구분야에 대한 사전적 지식을 요구하지 않는 점, 2) 멀리서 읽기, 3) ‘어휘자루’ 가정과 관계적 의미 전제를 중심으로 논의해 보았다.
다국어 초록 (Multilingual Abstract)
Rapid digitization of text documents, including personal diaries, raised a new puzzle: how can researchers analyze ‘large quantities’ of textual data efficiently and effectively? The author presents topic modeling as a promising solution to these ...
Rapid digitization of text documents, including personal diaries, raised a new puzzle: how can researchers analyze ‘large quantities’ of textual data efficiently and effectively? The author presents topic modeling as a promising solution to these challenges. The most distinctive feature of topic models is that they provide an automated procedure for coding the content of a corpus of texts into a set of substantively meaningful categories called ‘topics’. The author discussed the theoretical presumptions of the topic modeling technique. The author illustrated the strength of topic modeling methods as a means of analyzing large text corpora by applying them to a farmer’s diary (Appo diary). Topics extracted by topic modeling method are significant in terms of interpretability and external validity. Most of the results of topic modeling coincide with the results of traditional content analysis. In addition, topic modeling extracted a new topic, which the traditional content analysis had overlooked. Based on this findings, the author discussed the demands and limitations of the methods focusing on three major characteristics of topic modeling methods: Bag of words assumption, no need of a priori coding list (prior domain expertise), and distant reading.
목차 (Table of Contents)
참고문헌 (Reference)
1 박자현, "토픽모델링을 활용한 국내 문헌정보학 연구동향 분석" 한국정보관리학회 30 (30): 7-32, 2013
2 김하진, "토픽모델링을 통한 저자명 식별 성능 비교" 한국정보관리학회 149-152, 2014
3 강범일, "토픽 모델링을 이용한 신문 자료의 오피니언 마이닝에 대한 연구" 한국문헌정보학회 47 (47): 315-334, 2013
4 정병욱, "일기를 통해 본 전통과 근대, 식민지와 국가" 소명출판 2013
5 정병욱, "일기를 통해 본 전통과 근대, 식민지와 국가" 소명출판 263-312, 2013
6 니시카와 유코, "일기를 쓴다는 것 (번역)" 신아출판사 2014
7 이정덕, "아포일기 1: 농민 권순덕의 삶의 기록" 전북대학교 출판문화원 2014
8 한신갑, "빅데이터와 사회과학하기: 자료기반의 변화와 분석전략의 재구상" 한국사회학회 49 (49): 161-192, 2015
9 이케다 유타, "동아시아 일기 연구와 근대의 재구성" 논형 25-33, 2014
10 진양명숙, "남성 농민일기에 나타난 가부장적 젠더 인식, in 압축근대를 경험하는 동아시아" 47-66, 2015
1 박자현, "토픽모델링을 활용한 국내 문헌정보학 연구동향 분석" 한국정보관리학회 30 (30): 7-32, 2013
2 김하진, "토픽모델링을 통한 저자명 식별 성능 비교" 한국정보관리학회 149-152, 2014
3 강범일, "토픽 모델링을 이용한 신문 자료의 오피니언 마이닝에 대한 연구" 한국문헌정보학회 47 (47): 315-334, 2013
4 정병욱, "일기를 통해 본 전통과 근대, 식민지와 국가" 소명출판 2013
5 정병욱, "일기를 통해 본 전통과 근대, 식민지와 국가" 소명출판 263-312, 2013
6 니시카와 유코, "일기를 쓴다는 것 (번역)" 신아출판사 2014
7 이정덕, "아포일기 1: 농민 권순덕의 삶의 기록" 전북대학교 출판문화원 2014
8 한신갑, "빅데이터와 사회과학하기: 자료기반의 변화와 분석전략의 재구상" 한국사회학회 49 (49): 161-192, 2015
9 이케다 유타, "동아시아 일기 연구와 근대의 재구성" 논형 25-33, 2014
10 진양명숙, "남성 농민일기에 나타난 가부장적 젠더 인식, in 압축근대를 경험하는 동아시아" 47-66, 2015
11 김윤석, "기계 학습을 이용한 한글 텍스트 감정 분류" 한국엔터테인먼트산업학회 206-210, 2013
12 손현주, "근대적 경험과 양가성, in 압축근대를 경험하는 동아시아" 93-121, 2015
13 Tangherlini, T.R., "Trawling in the Sea of the Great Unread: Sub-corpus Topic Modeling and Humanities Research" 41 : 725-749, 2013
14 Wang, Xuerui, "Topics over Time: A Non-Markov Continuous-time Model of Topical Trends" ACM 2006
15 Grun, Bettina, "Topicmodels: An R Package for Fitting Topic Models" 40 (40): 1-30, 2011
16 Yang, Tze-I, "Topic Modeling on Historical Newspapers" Association for Computational Linguistics 2011
17 Weingart, Scott, "Topic Modeling for Humanists: A Guided Tour"
18 Rhody, Lisa M., "Topic Modeling and Figurative Language" 2 (2): 2012
19 Blevins, Cameron, "Topic Modeling Martha Ballard’s Diary"
20 Jockers, M. L., "Text Analysis with R for Students of Literature" Springer 2014
21 Broniantowski, D.A., "Social Computing, Behavioral-Cultural Modeling and Prediction" Springer Berlin Heidelberg 212-218, 2011
22 Jockers, Matthew L., "Significant Themes in 19th-century Literature" 41 (41): 750-769, 2013
23 Miller, Ian Matthew, "Rebellion, Crime and Violence in Qing China, 1722-1911: A Topic Modeling Approach" 41 (41): 626-649, 2013
24 Blei, David M., "Probabilistic Topic Models" 55 (55): 77-84, 2012
25 Newman, D., "Probabilistic Topic Decomposition of An Eighteenth-century American Newspaper" 57 (57): 753-767, 2006
26 Miner, Gary, "Practical Text Mining and Statistical Analysis for Nonstructured Text Data Applications" Elsevier Inc 2012
27 Templeton, Clay, "Mining the Dispatch under Super-vision: Using Casualty Counts to Guide Topics from the Richmond Daily Dispatch Corpus" 2011
28 Nelson, Robert K, "Mining the Dispatch"
29 Blei, David M., "Latent Dirichlet Allocation" 3 : 993-1022, 2003
30 Jeon, Heewon, "KoNLP: Korean NLP Package"
31 Mohr, J. W., "Introduction - Topic Models: What They Are and Why They Matter" 41 (41): 545-569, 2013
32 Griffiths, T., "Finding Scientific Topics" 101 (101): 5228-5235, 2004
33 DiMaggio, P., "Exploiting Affinities between Topic Modeling and the Sociological Perspective on Culture" 41 (41): 570-606, 2013
34 Bonilla, T., "Elevated Threat and Decreased Expectations: How Democracy Handles Terrorist Threats" 41 (41): 650-669, 2013
35 Baird, Bridget, "Digital Diaries, Digital Tools: A Comparative Approach to Eighteenth-Century Women’s History" 2013
36 Urlich, L., "A Midwife's Tale: The Life of Martha Ballard, Based on Her Diary, 1785-1812" Vintage Books 1991
37 Gerrish, S. M., "A Language-based Approach to Measuring Scholarly Impact" 375-382, 2010
우즈베키스탄 고려인 이주자의 노부모에 대한 ‘초국적 돌봄’
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2026 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2020-01-01 | 평가 | 등재학술지 유지 (재인증) | |
2018-02-27 | 학술지명변경 | 외국어명 : 미등록 -> Cross-Cultural Studies | |
2017-01-01 | 평가 | 등재학술지 유지 (계속평가) | |
2013-01-01 | 평가 | 등재 1차 FAIL (등재유지) | |
2010-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2008-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2005-05-17 | 학술지명변경 | 한글명 : 비교문화연구 제9집 1호 -> 비교문화연구 | |
2005-01-01 | 평가 | 등재학술지 선정 (등재후보2차) | |
2004-01-01 | 평가 | 등재후보 1차 PASS (등재후보1차) | |
2002-07-01 | 평가 | 등재후보학술지 선정 (신규평가) |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 0.78 | 0.78 | 0.78 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
0.79 | 0.76 | 1.231 | 0.68 |