RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        케이팝 감성 표현의 사용 양상에 대한 말뭉치언어학적 연구 - 전문가 리뷰와 사용자 리뷰의 차이를 중심으로 -

        안진산,고예린 한국사전학회 2024 한국사전학 Vol.0 No.43

        이 연구의 목적은 케이팝에 대한 전문가 및 사용자 리뷰에 나타난 감성 표현을 추출하고, 의견 보유자의 전문성에 따른 사용 양상 차이를 분석하는 데 있다. 이를 통해 동일한 주제(domain) 내에서도 언어 사용역에 따라 감성사전을 보다 세분화하여 구축할 필요가 있음을 논의한다. 연구 수행을 위해 대중음악 평론 매거진과 유튜브 댓글을 수집하여 연구 대상 말뭉치를 구축한 후, PoS-gram을 활용하여 총 1206개 감성 표현을 추출·판별하였다. 두 말뭉치에서 나타난 감성 표현의 빈도를 분석하여 그 빈도 차이가 통계적으로 유의함을 확인하였고(Mann-Whitney U test, p < .001, effect size 0.475), 상대 빈도의 차이가 2배 초과인 것을 각각 ‘전문가 감성 표현’과 ‘사용자 감성 표현’으로, 2배 이하인 것을 ‘공통 감성 표현’으로 분류하였다. 이어 전문가와 사용자의 감성 표현의 1) 어휘 다양도, 2) 의미 특성, 3) 극성을 비교·분석하였다. 그 결과 어휘 다양도는 전문가 감성 표현이 사용자 감성 표현에 비해 4배 이상 높게 나타났으며, 전문가는 [+주관성]과 [+대상성]을 가지는 감성 표현들을 ‘사전 극성(prior polarity)’을 기반으로 사용하는 반면, 사용자는 [+주관성]과 [+주체성]을 가지는 감성 표현들을 ‘문맥 극성(contextual polarity)’에 기반하여 창조적으로 사용하는 경향이 있음을 밝혔다. 또한 케이팝에 대한 전문가와 사용자의 감성 표현은 모두 [+긍정]이 지배적으로 드러나지만, 극성을 드러내는 어휘 선택에는 큰 차이가 있음을 확인하였다. This study extracts and analyzes Korean sentiment expressions in expert reviews and non-expert(user) reviews of K-pop. With this, we discuss the necessity of developing a more detailed sentiment lexicon within the same domain, considering the variation in registers. To conduct the study, a total of 1,206 sentiment expressions were extracted and analyzed using PoS-gram by collecting popular music critique magazines and YouTube comments to build an ‘expert critiques corpus’ and a ‘user’s comments corpus’. We analyzed the frequency of sentiment expressions in the two corpora to confirm that the difference in frequency is statistically significant (Mann-Whitney U test, p < .001, effect size 0.475) and classified those with a difference in relative frequency of more than 2 times as ‘expert sentiment expressions’ and ‘user sentiment expressions’ respectively and those with a difference of less than 2 times as ‘common sentiment expressions’. Then, we compared and analyzed 1) lexical diversity (Standardized Type-Token Ratio, STTR), 2) semantic properties, and 3) polarity between ‘expert sentiment’ and ‘user sentiment expressions’. The results showed that the lexical diversity of ‘expert sentiment expressions’ was more than four times higher than that of ‘user sentiment expressions’, and that experts tend to use sentiment expressions with [+subjectivity] and [+objectivity] based on their ‘prior polarity’, while users tend to use sentiment expressions with [+subjectivity] and [+objectivity] more creatively through their ‘contextual polarity’. In addition, we found that both expert’s and user's sentiment expressions toward K-pop are dominated by [+positive], but there are significant differences in the lexical choices that reveal polarity.

      • KCI등재

        『우리말샘』 최근 등재어의 형태·의미적 특성과 텍스트 장르별 출현 빈도 분석

        안진산 ( An Jinsan ),성민규 ( Sung Minkyu ),이수진 ( Lee Soojin ) 연세대학교 언어정보연구원 2023 언어사실과 관점 Vol.59 No.-

        This paper looks into the lexical items that have recently been added to Urimalsaem and evaluates the dictionary’s recent inclusion trends. To this end, we analysed the morphological and semantic characteristics of the lexical items that were included in Urimalsaem from 1 July 2020 to 30 June 2021 and examined their use in a large-scale corpus compiled between 2019 and 2021. The analysis showed that phrase units, proper noun classes, and specialised terms tended to be included in the dictionary at a higher rate than word units, common nouns, and common words. Regarding usage, it appeared that some of the included items from the proper noun and terminology categories were not in use in news articles (whether main text or comments), YouTube comments, and instant messaging chats. In addition, lexical items exclusively used in news articles were far more frequently included in the dictionary compared to other text genres. This shows that the recent inclusion of headwords in Urimalsaem has not been carried out in a balanced and systematic way; instead, there is a tendency to focus on vocabulary of specific semantic categories and specific use contexts, which is indicative of the limitations of Urimalsaem as a ‘user-generated content dictionary’. Ultimately, the results of this study point to the improvements that are yet to be made in the dictionary Urimalsaem.

      • KCI등재

        한국어 축약어는 그 원형식과 의미가 얼마나 유사한가?

        정예은,안진산 한국어학회 2024 한국어학 Vol.105 No.-

        본 연구는 한국어 축약어와 그 원형식 간의 의미적 유사성에 대한 실증적 분석을 수행한다. 약 18억 어절 규모의 시계열 말뭉치(2009~2022년)를 활용해 축약형과 원형식의 사용 빈도와 추이, 공기어 분석을 통한 사용 맥락을 계량화하여 비교한 결과, 축약어는 ‘원형식의 의미를 유지한 채 그 형태만 줄어든 단위’로 알려져 왔으나 그 실제 유형은 크게 세 분류로 구분되는 것으로 보인다. 첫째, 원형식과 유사한 맥락에서 사용되나 빈도가 더 낮은 전형적 축약어, 둘째, 해당 전형적 축약어 가운데 원형식과 사용 맥락이 다르지만 유사한 빈도를 보이는 정착된 축약어, 셋째, 원형식과 전혀 다른 맥락에서 사용되며 빈도가 더 높은 비전형적 축약어가 포착된다. 본 연구는 기존 축약어의 의미에 대한 해석적 논의를 넘어, 축약어와 원형식 간 의미적 유사성을 계량적으로 분석했다는 점에서 의의를 갖는다. 특히 전형적 축약어가 주로 전문용어에서, 비전형적 축약어가 자연어에서 나타나는 경향은 한국어 축약어의 본질적 특성에 대한 새로운 시각을 제시할 수 있다. This study provides an empirical analysis of the semantic similarity between Korean abbreviations and their full forms. Using a time-series corpus of approximately 1.8 billion words (2009–2022), it compares the usage frequency, trends, and contexts of abbreviations and full forms through collocation analysis. While abbreviations are traditionally understood as shortened forms retaining the meaning of their originals, the results identify three types: (1) prototypical abbreviations, used less frequently than the full forms but in similar contexts; (2) stabilized abbreviations, a subtype of prototypical abbreviations, used similarly but in different contexts; and (3) atypical abbreviations, used more frequently in completely different contexts. This study moves beyond interpretative discussions by quantitatively analyzing the semantic similarity between abbreviations and their full forms. Prototypical abbreviations often appear in technical terms, whereas atypical abbreviations are more common in natural language, offering new insights into the nature of Korean abbreviations.

      • KCI등재

        UGC 표준형 말뭉치 구축을 위한 말뭉치언어학적 연구 - 유튜브 댓글을 중심으로 -

        남길임,안진산,황은하 한말연구학회 2020 한말연구 Vol.- No.57

        The hasty growth of CMC(Computer-Mediated Communication) are nowadays used by many Korean users to express their perspectives on various topics. However most of the data is difficult to process automatically due to the non-standard expressions, neologism including OOV(out-of-vocabulary) and web specific orthographic conventions. This study amis to propose the standardization procedure of Korean UGC corpus by constructing and analyzing Korean Youtube review corpus. For the purpose of this study, 250K word Youtube review corous was built: this was composed of all reviews on the K Drama channeds provided by three main Korean broadcasting companies. Chapter 2 presents the corpus analysis methodology for the research process including Youtube Comment Scraper tool and preprocessing. Chapter 3 addresses the classification of no standard forms, which focus on highly frequent forms in Korean UGC data. Chapter 4 deals with issues and considerations in constructing the parallel corpus between non-standard and standard forms for Korean linguistic analysis and NLP.

      • KCI등재

        의미적 신어의 출현 및 정착 양상 연구

        남길임,안진산 한글학회 2022 한글 Vol.- No.336

        This study investigated the aspects of semantic changes and semantic neologisms from a short-term diachronic approach. This paper is written as follows. Section 2 introduces the distributional methodology, related research trends, and the time-sliced 1990–2018 online news article corpus analyzed in this study. Section 3 discusses how collocation and lexical similarity analyses were conducted to detect semantic neologisms. Previous studies in this area have had a limited ability to detect semantic changes because frequency-based analysis is too sensitive to corpus size to be reliable. Accordingly, Section 4 suggests that type frequency-based method is more effective than the token frequency method. Collocation type trend analysis should be to detect semantic changes. 이 연구는 단기통시적 관점에서 의미의 변화가 있다고 판단되는 형태를 ‘의미적 신어’로 지칭하고, 형태적 신어와 동일한 관점에서 의미적 신어의 출현과 정착 양상을 살피는 것을 목적으로 한다. 이를 위해 분포적 가설을 따르는 기존의 접근법의 분석 원리와 의의, 한계를 살펴보고, 이에 대한 대안으로 ‘공기어 유형 추이 분석’을 제안한다. 의미 변화의 양적 분석에서 주로 논의되어 온 ‘공기어 분석’과 ‘유사어 분석’은 새로운 의미와 관련된 공기어만을 고려하고 그 빈도가 일정 수준 이상으로 나타나야 한다는 전제에서 수행된다. 그러나 분포 범위 내 대부분의 공기어는 의미 변화와 직접적 관련이 없다는 점, 새로운 형태나 의미는 그 ‘새로움’ 때문에 본질적으로 저빈도로 나타난다는 특성으로 인해서 빈도에 기반한 공기어와 유사어의 자동 분석은 의미 변화의 양상을 충분히 살펴볼 수 없다는 한계를 가진다. 이에 대한 대안으로, 본고에서는 공기어 유형의 출현과 확산 추이를 연구자의 직관으로 분석함으로써, 의미적 신어의 최초 출현과 정착을 식별하는 원리를 제안한다. ‘공기어 유형 추이 분석’은 연도별 공기어의 유형과 토큰 수의 분포를 분석하는 방법으로, 의미적 신어의 최초 출현, 확산, 정착 시기를 식별하고, 의미적 신어의 확산 원리를 살펴볼 수 있다는 의의가 있다.

      • KCI등재

        구 단위 계열형 신어 [N + 세대] 연구 - ‘컴퓨터 세대’에서 ‘코로나 세대’, ‘MZ 세대’까지 -

        남길임,안진산 한국사전학회 2023 한국사전학 Vol.- No.42

        본 연구는 1990년부터 2021년까지 생산된 신문 기사 말뭉치를 대상으로 한국인들이 창조적으로 생산하고 사용해 온 [N + 세대]를 수집하고, 이의 사용 양상과 사전학적 기술 방안을 논의한 연구이다. [N + 세대]는 물리적이고 객관적인 연령층을 범주화하기보다는 명명자의 의도에 따라 사회·문화적, 정치적, 역사적 사건을 공유하는 경험의 공동체를 범주화하는 경향이 많은 것으로 드러났다. 본 연구에서는 이들을 명명 의도에 따라 여섯 가지 명명 유형으로 구분하고 10년을 단위로 한 이들의 고빈도 타입과 빈도를 분석하였다. 본 연구의 말뭉치 분석을 통해, 지난 30여 년간 사용된 [N + 세대]의 타입은 총 579개로 나타났으며, 이 중 45%에 해당하는 263개의 타입만이 일정한 빈도와 분포의 기준을 만족하는 것으로 드러났는데, 본 연구에서는 이들을 사전 등재 후보 목록으로 분류하고 이들의 등재 현황을『우리말샘』을 기준으로 분석하였다.『우리말샘』에 등재된 [N + 세대]는 총 164개 타입으로, 본 연구에서 생존 신어로 분석된 263개의 타입 중 84개의 타입만이『우리말샘』에 등재된 것으로 분석되었다. 본 연구에서는 구 단위 계열형 신어로서 [N + 세대]의 추출과 사전 등재 및 기술에 대한 합리적인 기준이 필요함을 논의하였다. This study collects the types of [N + seday ‘generation’] creatively produced and used by Koreans from 1990 to 2021 through a corpus of web-crawled articles and discusses their usage and lexicographic descriptions. It was found that [N + seday ‘generation’] tends to categorize a community of shared experiences of sociocultural, political, and historical events according to the intention of the individual naming it, rather than categorizing a certain physical and objective age group. In this study, we classified them into six types and analyzed their frequency by decade. We also found that a total of 579 types of [N + seday ‘generation’] were collected over the past 30 years, of which only 263 types, or 45%, met the criteria of a minimum frequency and distribution we applied. We classified them as headword candidates for listing to dictionaries and analyzed their status based on <Urimalsaem ‘our language pond’>. There are a total of 164 types of [N + seday ‘generation’] listed in <Urimalsaem>, which is only a fraction of the 263 types analysed as surviving neologisms in this study. This study discussed the need for reasonable criteria for the extraction, listing as a headwords and description of [N + seday ‘generation’] as a phrase-unit serialised neologisms.

      • KCI우수등재

        한국어 미등재어의 사용 양상에 대한 말뭉치언어학적 분석 -사전학적 DB 구조를 중심으로-

        남길임,안진산,최준 국어학회 2024 국어학 Vol.- No.111

        This research explores the significance of high-frequency unregistered words as units in synchronic linguistics through their extraction and analysis. Chapter 2 introduces the structure of the messenger corpus used for this study and outlines the sub-corpora developed for quantitative and qualitative research, while also addressing issues concerning the definition of unregistered words. In Chapter 3, the distributional characteristics of high-frequency unregistered words identified within the messenger corpus are analyzed to discuss their lexical reality. In Chapter 4, the lexical reality of high-frequency unregistered words and their usefulness as dictionary data were discussed, and their dictionary DB structure was proposed. This study highlights the lexicographical importance of research on high-frequency unregistered words across various media, including messenger platforms, and demonstrates how such research can elucidate the communication strategies of contemporary native speakers across different media.

      • KCI등재

        신어는 어디에서 탄생하고 확산하는가? - 뉴스 중심 신어 추출에 대한 비판적 검토 -

        남길임,송현주,안진산,강범일 연세대학교 언어정보연구원 2024 언어사실과 관점 Vol.63 No.-

        The purpose of this study is to ensure the representativeness and balance of the data used for the investigation of neologisms and to provide empirical evidence for the necessity of collecting neologisms beyond online news corpora. For this purpose, we analyzed the occurrence patterns of 250 neologisms selected from online news articles from July 2022 to June 2023, focusing on both online news (from the five major daily newspapers) and Naver blogs. The findings of this study are as follows: First, in terms of the initial appearance of neologisms by media type, the majority, 192 neologisms (76.80%), first appeared on blogs, while 38 neologisms (15.20%) appeared simultaneously in both blogs and news, and only 20 neologisms (8%) appeared first in news outlets. Furthermore, despite the larger size of the news corpus compared to the blog corpus, the likelihood of observing neologisms was found to be significantly higher in blogs. Second, the study examined the lexical-semantic tendencies of high-frequency neologisms by media type, both in news and blogs. Through an analysis of the initial appearance dates and frequency of neologisms by media type, the study revealed the limitations of extracting neologisms primarily from news sources, and highlighted the role of blogs, which cover both public and private domains, in the dissemination of language. Moreover, blog examples were found to present living usage beyond mere quotations and definitions, adding further significance. This study is meaningful in that it is the first to explore the significance and potential of neologism extraction considering media diversity, an issue that has long been raised by many researchers of neologisms.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼