RISS 학술연구정보서비스

다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        러시아어학습자코퍼스(Russian Learner Corpus)

        이수현(Lee, Su Hyoun) 한국노어노문학회 2015 노어노문학 Vol.27 No.4

        본 논문은 학습자 오류연구를 위한 세 갈래의 장기 연구활동 계획, 즉 러시아어 학습자의 문어 자료를 수집하는 활동, 제 2언어로서의 외국어 학습자와 계승어 학습자의 문어 오류분석 및 두 학습자의 오류간 비교를 통하여 언어학적으로 의미 있는 지표를 찾아내는 활동, 마지막으로 우리나라와 다른 나라의 계승어 학습자의 오류 유형을 비교·분석하는 언어 이론적 연구활동을 위해 전제가 되는 러시아어학습자코퍼스 구축의 필요성에서 시작되었다. 이에 따라 논문에서는 연구방법론으로서의 코퍼스 연구에 대하여 소개하고, 코퍼스 연구의 당위성과 향후 러시아어 연구는 물론 보편 언어학 연구를 위한 토대로서의 러시아어학습자코퍼스 구축 문제를 다루고 있다. 세부적으로 코퍼스를 활용한 사례연구를 통해 코퍼스 연구가 공시적 관점에서뿐만 아니라 통시적 관점에서 언어 현상에 대한 적절한 연구방법론이 되고 있음을 주장한다. 특히, 논문에서는 2015년 현재 러시아를 비롯한 해외 여러 나라의 코퍼스 연구팀과 공조연구로 진행되고 있는 러시아어학습자코퍼스 구축 과정을 기술하고 러시아어국가코퍼스와의 연계 하에 러시아어학습자코퍼스가 언어 습득연구 및 유형연구의 연구 기반으로 활용되기 위하여 어떠한 내용적 측면이 고려되어야 하는지를 고찰하고 있다.

      • KCI등재

        19세기말 한일어의 접촉과 교류 연구

        이한섭(李漢燮) 한국일본어학회 2012 日本語學硏究 Vol.0 No.34

        이 논문은 필자가 최근 구축 완료한 ‘근대한국어코퍼스’를 사용하여 개화기 한일어의 접촉 및 교류, 수용 관계를 연구하는 방법에 대하여 언급한 것이다. 개화기 한일어의 접촉 및 교류 연구는 조사 자료가 방대하고 다양한 장르의 자료를 다루어야 하기 때문에 전통적인 연구 방법으로는 조사 연구가 어렵다. 이에 필자는 1998년경부터 개화기 자료의 코퍼스 구축을 시작하였고 2011년11월 제1단계 작업을 끝냈다. 이 논문에서는 먼저 ‘근대한국어코퍼스’의 개요에 대하여 설명하고 ‘전화’와 ‘민주’ ‘공화’를 예로 ‘근대한국어코퍼스’에서 이들 단어가 언제 어떤 형태로 출현하는 가를 조사하여 개화기 한일어 어휘의 접촉 및 교류, 수용 문제를 살펴보았다.

      • KCI등재

        전통 코퍼스와 웹 코퍼스 비교 연구 - Frantext, Sketch Engine, DIY-코퍼스를 중심으로

        조준형 ( Cho Joon-hyung ) 한국프랑스어문교육학회 2021 프랑스어문교육 Vol.75 No.-

        코퍼스는 언어의 실질적인 연구 및 교육을 위한 중요한 도구이다. 현재 프랑스어 코퍼스로는 프랑텍스트(Frantext)가 가장 대표적이다. 그런데 프랑텍스트는 문학 텍스트로 구성되어서 프랑스어의 변화를 제대로 반영하지 못한다는 단점이 있다. 이러한 측면에서, 인터넷 웹 페이지를 바탕으로 한 웹 코퍼스(Web comme corpus)가 하나의 대안이 될 수 있다. 웹 코퍼스를 바탕으로 한 가장 대표적인 프랑스어 코퍼스는 스케치엔진(Sketch Engine)에서 구축한 코퍼스들이다. 이와 함께, 부트켓(BootCat)과 같은 웹 크롤링(Web crawling) 도구를 사용해서 개인이 직접 코퍼스를 구축하는 방법도 있다. 본 논문은 프랑텍스트, 스케치엔진 코퍼스 그리고 개인이 구축한 코퍼스에서 특정 키워드를 중심으로 공기어를 추출하고, 각 코퍼스에서 어떤 차이가 있는지 비교 분석하였다. 구축 시기 및 구성 텍스트에 차이가 있어서, 코퍼스에 따른 특징적인 공기어 분포가 나타났지만, 가장 일반적인 단어는 서로 유사하다는 것도 확인할 수 있었다. 코퍼스 기반 프랑스어 연구 및 교육이 여전히 미진한 현실에서 그리고 활용할 수 있는 프랑스어 코퍼스가 많지 않다는 측면에서, 본 논문에서 살펴본 코퍼스들을 연구 및 교육 목적에 따라서 적절히 선택해서 활용한다면, 매우 유용한 도구가 될 수 있음을 확인하였다. Aujourd'hui, le corpus est une ressource essentielle pour l'étude et l'enseignement pratique des langues. Le Frantext est actuellement un des corpus les plus représentatifs du français. Pourtant, il aurait des limites pour refléter des changements du français, car les textes français sont des textes littéraires. Le Web comme corpus construit à partir des pages Web d'Internet pourrait être utilisable, puisque les pages Web sont écrites de différentes manières et en différentes langues. Dans cet article, nous avons tenté d'extraire les cooccurrences autour de trois mots-clés (année, président, homme) dans le Frantext, Sketch Engine et les corpus personnels et d'en comparer des caractéristiques lexicales. À cause de l'hétérogénéité des genres, chaque corpus a présenté une différence lexicale de cooccurrences. Pourtant, nous avons aussi vu que des cooccurrents primordiaux sont similaires. Si nous utilisons un corpus approprié dans le but d'étudier et d'apprendre le français, les corpus examinés dans notre article seront utiles comme mégadonnées de nombreux exemples français.

      • KCI등재

        코퍼스 기반 특수 목적 러시아어 연구: 의료 러시아어의 어휘·문체적 특성

        이성민 한국슬라브․유라시아학회 2019 슬라브학보 Vol.34 No.1

        Recently, language researches using the corpus has become active, but most of them are limited to English education. In the case of the Russian corpus, it is mainly used to provide examples that serve as primary data for researchers. However, the type of corpus, which computerized a large amount of actual data, can be evaluated not only as a source of data complementing the abstraction of language theory, but also as an efficient research and teaching methodology. This study examined the Russian vocabulary and stylistic characteristics in the subcorpus of health and medicine. The lexical characteristics of medical Russian identified through corpus are as follows. In medical subcorpus, the incidence of nouns and adjectives appeared relatively high, and the frequencies of verbs and personal pronouns were relatively low. In addition, for English medical text, the high incidence of prepositions was characterized, but the rate of prepositions of medical subcorpus and basic corpus in Russian was similar in percentage. However, some prepositions indicating cause or purpose showed a higher incidence rate in medical subcorpus than in basic corpus. Stylistically, the use of passive sentences and participles was high, but the appearance of complex sentences using gerund or conjunction was relatively low in the written medical subcorpus. Except for the low frequency of use of exclamations, the characteristics of spoken medical subcorpus and ordinary spoken corpus were the same. The languages used in a particular field are largely distinguished from those used in everyday life. Therefore, specialized methodology distinguished from general language education is needed for language education and use as well as specialized language research in the field, and corpus linguistics can be an alternative. 최근 코퍼스를 사용한 언어 연구는 활성화되어가고 있지만, 대부분 영어 교육 등에 한정되어 있을 뿐 러시아어 코퍼스의 경우는 주로 연구자들에게 1차 자료가 되는 예문을 제공해 주는 데 그치고 있다. 그러나 다량의 실제 자료를 전산화한 형태의 코퍼스는 언어 이론의 추상성을 보완해 주는 자료 공급원으로서뿐만 아니라 효율적인 연구 및 교육 방법론으로 평가받을 수 있다. 본 연구는 러시아 국립 코퍼스에서 건강 및 의료 분야의 하위 코퍼스를 설정하여 해당 영역에서 사용되는 러시아어의 어휘, 문체적 특징을 살펴보았다. 코퍼스를 통해 확인된 의료 러시아어의 어휘적 특징은 다음과 같다. 의료코퍼스에서는 명사와 형용사의 출현 비율이 상대적으로 높게 나타났고 동사와 인칭대명사의 빈도는 상대적으로 낮았다. 또한 영어 의료 텍스트의 경우 전치사의 높은 출현 비율을 특징으로 하지만 러시아어는 의료코퍼스와 기본 코퍼스에서의 전치사 출현 비율은 유사했다. 다만, 원인이나 목적 등을 나타내는 일부 전치사의 경우는 기본 코퍼스보다 의료코퍼스에서 높은 출현 비율을 보여주었다. 문체적으로 문어 의료코퍼스에서는 피동 구문과 형동사의 사용이 높게 나타났으며, 부동사나 접속사를 사용한 복문의 출현은 상대적으로 낮았고, 구어 의료 코퍼스에서는 감탄문의 낮은 사용 빈도를 제외하고는 일반적인 구어체의 양상이 나타났다. 특정 분야에서 사용되는 언어는 일상생활에서 사용되는 언어와 크게 구분된다. 따라서 해당 분야의 전문적인 언어 연구뿐만 아니라 언어 교육 및 사용을 위해서는 일반적 언어 교육과 구분되는 특화된 방법론이 필요하며, 코퍼스 언어학이 그 대안이 될 수 있다. 물론 이러한 연구를 위해서는 목적에 맞는 코퍼스 구축이 반드시 필요하며, 러시아국립 코퍼스에 대한 형식적 해석 작업 역시 필수적이다. 러시아국립코퍼스에 제시되어 있는 정보는 대부분 품사와 어휘 의미에 한정되어 있으며, 구조나 기능에 대한 분류는 이루어지고 있지 않다. 영어를 포함한 다른 언어의 방법론을 그대로 적용하기에는 러시아어의 본질을 나타내는 데 한계가 있다. 구조 및 기능적 관점에서의 러시아어 분석과 함께 특정 언어 사용역에 대한 연구가 이루어진다면, 더욱 설득력있는 결과를 도출할 수 있을 것이다.

      • KCI등재

        백석시의 코퍼스 구축과 통계 분석 연구 - 현대시 코퍼스 연구 방법론 1 -

        이상숙(Lee, Sang-Sook),김일환(Kim, Il-Hwan) 우리문학회 2022 우리文學硏究 Vol.- No.74

        이 논문은 백석시를 대상으로 현대시의 코퍼스 분석 방법론에 대한 고찰을 목적으로 한다. 문학 코퍼스 기반 연구는 문학 텍스트를 전처리 가공하여 코퍼스로 만들어 통계 프로그램을 통해 빈도, 키워드, 공기어 네트워크의 결과를 얻는 것으로 연구자의 직관을 뒷받침하고 증명하는 것은 물론 새로운 연구 설계와 방향을 제시해 준다. 문학분야에 적용된 코퍼스 연구 방법론은 소설, 수필 등 산문 텍스트를 대상으로 한 경우가 많은데 행과 연이 구분되고 단절된 형태의 시 텍스트는 일반적 텍스트 전처리, 가공과 다른 과정으로 진행되어야 한다. 이 논문에서는 1930년대 시인 백석의 시 텍스트 전편을 입력하여 코퍼스로 만들어 현대시 코퍼스 구축과 분석 과정의 예로 삼았다. 백석의 시는 문학적 성취가 뛰어난 데다 현대시의 코퍼스 분석 과정에서 해결해야 할 유형적 사례를 보여주기에 적합하기 때문이다. 백석은 행갈이, 연 구분 등의 전형적 시형식과 문장형의 산문시 모두 창작했고 토속어, 한자어, 이형(異形) 표기가 많아 전처리 과정에서 해결할 사항이 많다. 분단을 기점으로 백석시를 나누어 비교 대조하면 시대에 따른 공통점과 차이점이 드러나는데 이것을 남북의 시적 특징으로 확장하여 설명할 수 있다는 것도 백석을 선택한 중요한 이유이다. 백석시를 대상으로 코퍼스 구축, 전(前)처리할 때 필수적인 고려 사항, 형태소 분석기, 통계식, 통계 결과의 활용 등 현대시 코퍼스 연구 방법론의 참조점이 되기를 기대한다. This study examines the corpus analysis of modern poetry. The preprocessing of literary texts into a corpus to statistically identify the frequency of linguistic usages, keywords, and co-occurrence of words in networks in a body of texts not only supports and proves the researcher’s hypothesis, but also allows a new perspective on research direction and design. Corpus analysis has often been applied to prose texts, such as novels and essays, in the field of literature. This is because poetry, in which lines and verses are separated and disconnected, require different analytical processes. This study, therefore, focuses on the process and methodology necessary for corpus analysis of modern poetry. The findings of this study will contribute to a reduction in the trial and error involved in corpus analysis of literary works generally and poetry specifically, which can be infinitely expanded in the future. This study examines the essential considerations involved in this endeavor, such as the use of a part of speech tagger, and the corpus analysis tool required for the process of integrating (preprocessing) modern poetry texts into a corpus. Before the analysis, the entire poetic oeuvre of Baek Seok, (a poet of the 1930s), are experimentally formed into a corpus. Baek Seok’s poems were selected because not only are they outstanding in terms of literary achievement, but they are also suitable for showing problems entailed by modern poetry’s corpus analysis. Baek Seok wrote both formally conventional poems with separated lines and verses and prose poems, which allows analyses of various forms of poetry. He also used numerous dialects, Chinese characters, and heteromorphic notations (words with the same meaning which are written in different ways), all of which make preprocessing complicated. Although this increases the difficulty of the task, it also affords an opportunity for the researcher to experience various problems that must be resolved in the corpus analysis process.

      • KCI등재

        한국 한시 코퍼스 구축과 활용 방안 연구

        이병찬 근역한문학회 2019 한문학논집(漢文學論集) Vol.53 No.-

        In this paper, I have studied how to construct Chinese poetry corpus. The construction of Chinese poetry corpus is essential for the analysis of Chinese poetry. At present, the study of Chinese poetry can not escape from the center of individual artists. There is no comprehensive study that reveals the tendency of age or the poetical circles. The construction of Korean Chinese poetry corpus is a very useful tool for understanding the specificity and universality of works. To prove creativity, you have to show that your theme or expression is different from others. The poet speaks in poetic diction. poetic diction are the essence of artistry. Therefore, analysis of poetry is inevitable. However, current research has paid more attention to the meaning of poetry than poetry. And the analysis of the poetry focused on the understanding of the text and the contents. So the interest in poetry was less. This method has defects. It is difficult to grasp the influence relations of the poets by solving the poetry alone. The influence relationship of poets can be found in poetry. If you share poetry that others do not use, this is an influence. In this paper, we have studied how to construct a Chinese poetry corpus that can grasp the influence of poetry. The Chinese corpus is an example of how we can set an example. China has built CNCORPUS, and has built a total analysis system of Chinese poetry, which is a Chinese poetry specialist corpus. It is urgent to construct a corpus in Korea as in China. However, we can not use the Chinese way. We can not build a corpus with only Korean poems. It is because of the influence of China in Korea. Therefore, we should construct corpus by using Chinese data together. Considering these points, I studied how to construct Korean poetry corpus. The construction of a corpus is very useful to use an n-gram. This paper presents an actual case using an n-gram. The sample subjects of the corpus construction are 『Cheong-eum-jib(淸陰集)』, and 『nong-am-jib(農巖集)』. In this paper, we propose a method for constructing and utilizing a corpus by examining various problems derived from this. 본고는 한시 코퍼스 구축과 그 활용 방안을 연구하였다. 한시 코퍼스 구축은 연구를 위한 필수적 과제이다. 현재 한시 연구는 시대적 경향이나 유파의 특성을 밝히는 종합적 접근이 없지 않지만, 개별 시인의 작품 중심에서 벗어나지 못하고 있다. 수많은 시를 분석하여 온당한 평가를 하는 일이 매우 어렵기 때문이다. 한시 코퍼스를 구축하면 작품들이 가진 특수성과 보편성을 파악에 유용한 보조도구로 활용할 수 있다. 작품의 특성을 입증하기 위해서는 그만이 가진 주제나 표현이 남과 다름을 보여주어야 한다. 詩의 특성은 詩語에 농축된다. 따라서 詩語의 분석은 필수적이다. 그렇지만 현재의 연구는 詩語보다 詩의 의미에 더 관심을 기울였다. 그리고 詩의 分析은 飜譯과 意味의 이해에 집중하였다. 그러다 보니 자연스럽게 詩語에 관심도 적어졌다. 이러한 분석 방식은 缺陷을 가지고 있다. 시의 해석만으로 특성이나 詩人들의 영향 관계를 구체적으로 파악하기 어렵기 때문이다. 시의 특성이나 詩人들의 영향 관계의 실마리는 詩語에서 찾을 수 있다. 다른 사람들이 사용하지 않는 詩語를 쓰거나 특정인과 공유한다면 이것은 시 연구에 중요한 단서가 된다. 그러나 수많은 詩句에서 이를 발견하기는 매우 어려운 일이다. 본고는 이러한 詩語의 특성이나 영향 관계를 파악할 수 있는 한시 코퍼스를 구축하는 방법과 활용방법을 연구하고자 한다. 중국의 코퍼스는 이 연구를 위하여 우리가 참고할 수 있는 중요한 사례이다. 중국은 CNCORPUS를 비롯한 여러 코퍼스를 구축하였으며, 특히 한시 전문 코퍼스인 全唐詩分析系統과 全宋詩分析系統도 운영하고 있다. 우리나라도 중국처럼 한시 전문 코퍼스의 구축이 절실하다. 다만 우리의 한시 자료만 가지고 코퍼스를 구축할 수 없다. 우리의 한시가 중국의 영향을 받았기 때문에 우리는 중국의 자료도 함께 사용하여 코퍼스를 구축하여야 한다. 이러한 점을 고려하면서 한시 코퍼스 구축과 활용 방안을 연구하였다. 코퍼스의 구축은 엔그램(n-gram)의 분석이 매우 유용하다. 본 논문은 엔그램(n-gram)을 사용한 실제 사례를 제시하였다. 코퍼스 구축의 샘플 대상은 『淸陰集』·『農巖集』이다. 여기서 파생하는 다양한 문제점을 검토하여 한시 코퍼스의 구축과 활용에 관한 여러 방안을 제시하였다.

      • KCI등재

        언어 교육에서 코퍼스 활용의 쟁점들

        조준형 한국프랑스어문교육학회 2013 프랑스어문교육 Vol.44 No.-

        Dans cet article, nous avons examiné les enjeux liés à la didactique des langues étrangères basée sur le corpus. Représentant des images vives d’une langue, le corpus deviendrait une ressource utile dans la didactique des langues étrangères, y compris le français. Au sens large du terme, un corpus peut correspondre aux documents Web, aux les textes électroniques produits à partir de diverses sources et même aux textes en papier. Les caractéristiques compositionnels d’un corpus permettent aux enseignants/apprenants d’explorer à la fois des expressions normales et des comportements langagiers anormaux qui apparaîtraient fréquemment dans la situation quotidienne. Pourtant, quelques chercheurs ne s’intéressent qu’à l’utilisation d’un corpus dans le cadre de l’enseignement du français langue étrangère à la différence de celui de l’anglais. L’étude basée sur le corpus exige non seulement les techniques concernant la construction d’un corpus et la manipulation des logiciels d’analyse, mais aussi des connaissances spécialisées à une série d’analyses statistiques portant sur les données extraites à partir d’un corpus. N’ayant pas de profondes connaissances de la notion de « corpus », les enseignants/apprenants n’éprouvent des difficultés qu’à l’appliquer à l’enseignement/ apprentissage du français. Mais, comme nous l’avons dit en proposant quelques méthodes visant au dépouillement d’un corpus, il est aussi évident qu’il ne faut pas recourir aux techniques d’expert au moins dans le cadre de l’enseignement des langues. En profitant d’un corpus brut et d’une méthode élémentaire comme la concordance, on peut exhaustivement extraire des données utiles à l’apprentissage du français. Ces jours-ci, la didactique des langues étrangères porte aussi sur l’enseignement de la traduction que sur celui d’une langue. On peut donc envisager un corpus destiné à une ressource multi-dimensionnelle et universelle pour plusieurs types d’enseignement d’une langue. De ce point de vue, les enseignants et les apprenants deviendraient d’une manière active s’engager à l’utilisation de cet outils puissant bien que celle-ci demeure au niveau élémentaire. 본 논문에서 우리는 코퍼스를 기반으로 한 언어교육의 방법과 그 문제점을 고찰해 보았다. 코퍼스는 한 언어 사용자가 실제 생산한 언어 텍스트를 기반으로 하기 때문에 언어 교육의 관점에서 매우 실용적인 자료가 된다. 더욱이 코퍼스는 넓은 개념에서 기존의 종이 텍스트를 비롯해서, 인터넷 상의 웹문서 등 다양한 원천으로부터 수집된 텍스트로 구성될 수 있다. 프랑스어를 비롯한 언어 교육에서 기존의 표준화된 교재에서 벗어나 코퍼스를 이용해서 교수자가 학습자와 함께 언어 용례들을 관찰한다면, 규범적 언어뿐만 아니라 비규범적이지만 일상생활에서 실제로 사용되는 실용적인 표현들을 학습할 수 있는 장점이 있다. 코퍼스의 이러한 장점 때문에 영미권에서는 언어 교육에서의 코퍼스 활용에 대한 연구가 일찍부터 시작되었고, 관련 결과물도 지속적으로 나오고 있다. 국내에서도 이러한 연구가 많이 진행되었는데, 그럼에도 불구하고 대부분의 연구는 영어에 편중되어 있으며, 프랑스어 교육에서 코퍼스 활용의 문제는 일부 특정 연구자들을 제외하고는 거의 이루어져 있지 않다고 할 수 있다. 이것은 영어 관련 학제와 달리 프랑스어 관련 코퍼스 기반 인프라의 열악한 환경과도 관련이 된다. 프랑스어와 관련된 대규모 코퍼스의 부재, 그리고 프랑스어학 내에서 코퍼스 관련 교육의 부족함은 이와 관련된 지식을 갖춘 연구자 및 교육자의 부재로 이어진다. 코퍼스 기반 연구는 교수자에게 많은 전문적인 지식을 요구한다. 코퍼스 구축, 코퍼스 처리, 분석도구의 활용, 심지어 구글과 같은 인터넷 검색엔진을 이용하여 웹문서들 코퍼스로 이용한다고 하더라도, 그 결과의 분석과 정리, 분류 등은 관련 지식을 가지지 못한 교수자에게는 매우 어려운 작업이라고 할 수 있다. 국내 프랑스어 관련 코퍼스 연구의 이러한 현실은 프랑스어 교육에서 매우 소수의 연구자들만이 이 주제에 대해 관심을 가지고 연구를 진행할 수밖에 없는 상황을 만들었다. 한정된 연구 저변은 궁극적으로 연구의 폭이 넓어질 수 있는 기회를 없애고, 후속의 연구의 단절을 야기할 수 있다. 현대 외국어 교육에서 문어보다는 상대적으로 구어에 초점이 맞춰진 학습 방법이 주목을 받고 있지만, 의사소통이라는 거시적 관점에서는 구어뿐만 아니라 문법과 글쓰기도 결코 배제되어서는 안 될 학습 목표이다. 더욱이 외국어 교육에서 번역 교육과의 연계성도 점차 높아지고 있는 현재의 학교 상황에서 코퍼스의 역할은 매우 중요하다고 할 수 있다. 언어의 현실에 대한 투영이라는 코퍼스의 특징은 교수자와 학습자의 관심을 이끌어낼 수 있는 가장 핵심적인 요소라고 할 수 있다. 그렇지만 이러한 특성만이 코퍼스 기반 언어 교육의 전부는 아니다. 그동안의 외국어 교육이 올바른 표현과 잘못된 표현의 구분에 일차적인 학습 목표를 두었다고 한다면, 코퍼스 기반 교육에서는 이를 넘어서 표준과 비표준의 차이, 일반과 특수, 표현의 다양성과 등급 학습이라는 보다 확대된 시각에서 외국어 교육 목표를 설정할 수 있다. 학교 현장에서 인터넷 웹문서와 같은 다양한 저작물을 검색하는 것은 찾고자하는 어휘 혹은 표현의 활용 가능성과 사용 빈도 그리고 그것의 문채(文彩)를 보고자 하는 것이지, 문법적 오류 검증이 일차적인 목적이 아니다. 기술적인 어려움으로 코퍼스 기반 학습이 제공할 수 있는 다양한 이점을 포기할 ...

      • KCI등재

        BCC코퍼스에 의거한 중국어 동의어 분석 방법론

        최향란,박흥수 한국중국언어학회 2019 중국언어연구 Vol.0 No.84

        This article tried to grasp By using the statistical functions and various retrieval methods provided by BCC corpus, this paper explores specific methods to distinguish and analyze the differences in word frequency distribution, word collocation and semantic prosody of synonyms, so as to help the proper use of synonyms and better play the communicative function of Chinese. Chinese is the most widely used language in the world and has a long cultural history. Therefore, there are a large number of synonyms with similar semantics in Chinese. How to accurately understand the subtle differences between them and use them appropriately has always been a big problem for non-native Chinese learners. Generally speaking, synonym discrimination relies on intuitive experience and introspection through dictionaries and other tools. Dictionary analysis, though authoritative, is often not able to achieve the purpose of accurate analysis due to the limitations of its compiling methods; in the past, it relied on intuitive experience and introspective ways, and because of the image of dialects and language habits in the region where the researchers live, the results of the research are often not objective enough. Large corpus is an extremely advanced retrieval tool, which provides a new method for synonym discrimination with its unique advantages. Corpus linguistics is a branch of general linguistics. It uses special text analysis software tools to analyze large machine-readable text databases. The analysis of synonyms in corpus linguistics mainly focuses on the differences in frequency distribution of synonyms in different register. The significant degree of co-occurrence of collocations and keywords was counted. The collocation characteristics of synonyms in search lines were observed, and their different linguistic features, such as class association, collocation relationship and semantic prosody, were revealed. Thanks to the abundant evidence provided by the huge corpus, the corpus index can provide abundant usage and context for synonyms, enabling researchers to compare and grasp the subtle semantic and pragmatic differences between synonyms, and to achieve an objective and comprehensive description of the subtle differences of synonyms. 본 연구는 BCC 코퍼스에서 제공하는 통계프로그램과 검색식을 활용하여 현대 중국어 동의어 분석 방법론에 대해 고찰하였다. 구체적인 연구 결과는 다음과 같다. 먼저 중국어 어휘교육에서 코퍼스 언어학적 분석 방법의 중요성을 고찰했다. 코퍼스에서 제시한 대규모 전산 자료는 다양한 문체의 언어영역을 포함하고 해당 언어의 포괄적인 모습을 반영하며 코퍼스를 활용한 통계와 분석법은 과거의 직감과 경험을 의지하는 분석법의 문제점을 보완하고 보다 객관적인 연구를 진행할 수 있게 했다. 다음은 중국어 동의어 분석에 적합한 코퍼스로 BCC 코퍼스를 소개했다. BCC 코퍼스 자체통계 프로그램과 다양한 검색식은 간편한 조작과 신속한 결과 도출기능으로 다른 코퍼스는 별도 분석도구를 사용해야 되는 번거로움을 해소할 수 있기에 동의어 분석에는 가장 적합하다는 결론을 도출했다. 이를 토대로 코퍼스언어학에서 동의어 판별하는 방법인 출현빈도(词频)분석, 단어호응(词语搭配)분석과 연어관계(类连接)분석, 의미운율(语义韵)분석 등의 구체적인 조작 방법을 제시했다. 코퍼스에 의거한 중국어 동의어 분석은 그 세밀한 차이를 분별하는 방법론을 세우는 것이 매우 중요하다. 기존에 제기된 방법들은 여러 가지 코퍼스 분석 툴과 도구를 먼저 익혀야 분석을 시작 할 수 있는 어려움 때문에 연구를 쉽게 시도를 하지 못하는 경향이있었다. 따라서 본 연구에서 제시한 BCC 코퍼스 자체통계 프로그램을 활용하는 방법이 새로운 접근이 되기바란다.

      • KCI등재

        일본의 한적 정보화와 코퍼스 구축 현황

        박영미,하지영 근역한문학회 2019 한문학논집(漢文學論集) Vol.53 No.-

        In the case of Korean domestic resources for classic literature written in Chinese characters, the government-driven project for digitization of classical texts has secured the raw corpus, but the development of tagged corpus and parallel corpus has not received as much attention.The development of corpus and the machine translation of Korean domestic Chinese character text resources were not a phased development over time, but rather a short-term advancement helped by recent developments in artificial intelligence translation. Artificial intelligence translation at the current stage is processed by machines automatically learning the relationship between sentences based on the data of original and translated texts, and therefore developing a tagged corpus, which is adding annotations according to certain criteria such as grammar, word class, and punctuation, is deemed an unnecessary task. In comparison, the situation is very different in China and Japan, which are also within the Chinese character cultural sphere. China and Japan have been phasing in with projects in digitalization of texts in Chinese characters and development of corpora in preparation for machine translations. The goals of developing corpora in China and Japan is not only to improve the efficiency of machine translations, but also to positively contribute to the national studies of each country. This situation prompts us to reconsider whether it is truly unnecessary to develop corpora for Korean texts in Chinese characters. In Japan, Kyoto University Institute for Research in Humanities Library, and the National Institute for Japanese Language and Linguistics have led the corpus development work from original texts in Chinese characters. The Institute for Research in Humanities have developed a tagged corpus utilizing the Mecab Morphological Analyzer and attempted dependency parsing based on Universal Dependencies with application of the traditional Japanese reading method(Kundoku) of Chinese characters. The studies of the National Institute for Japanese Language and Linguistics not only created translation results by developing corpora, but also extracted scholarly, literary styles depending on the era, the schools of theory, the literary circles in Japan from this foundation. Considering such examples, the development of tagged, parallel corpora from Korean original text resources in Chinese characters is still a meaningful task. 국내 한문 자료의 경우 국가 주도의 한문고전 전산화 사업을 통해 원시 코퍼스는 확보되었으나 주석, 병렬 코퍼스 구축 작업은 크게 관심을 받지 못하였다. 국내 한문 자료의 코퍼스 구축 및 기계번역은 단계적으로 진행된 것이 아니라 최근 인공지능 번역의 개발에 힘입어 단기간에 발전되어 온 것이라고 할 수 있다. 현 단계의 인공지능 번역은 기계가 원문 번역문 데이터를 기반으로 문장 간의 연관성을 자동적으로 학습하는 단계이기 때문에 문법, 품사, 표점 등 일정한 기준에 의해 주석을 가하는 주석 코퍼스를 구축하는 작업은 불필요하게 여겨진다. 이러한 상황은 같은 한자문화권인 중국과 일본의 상황과 견주어 보았을 때 무척 상이하다. 중국과 일본은 기계번역을 대비하여 한적 정보화와 코퍼스 구축 사업이 단계적으로 진행되고 왔다. 이들의 코퍼스 구축 작업은 기계 번역의 효율성을 제고하는 것뿐 아니라 국학 연구의 긍정적 기여를 하는 것을 목표로 하고 있다. 이를 볼 때 국내 한적 자료의 코퍼스 구축 작업이 과연 불필요한 것인지에 대한 재고가 필요하다. 일본에서는 교토대학교 인문과학연구소와 국립국어 연구소의 주도로 한문 원전 코퍼스 구축 작업이 진행되어왔다. 인문과학연구소는 Mecab 형태소 분석기를 활용하여 주석 코퍼스를 구축하였으며, 전통적인 훈독 방식을 응용하여 Universal Dependencies에 의한 依存文法解析을 시도하였다. 일본 국립국어 연구소의 연구는 코퍼스 구축을 통해 번역 결과물을 생성해내는 작업뿐 아니라, 이를 바탕으로 시대와 학파, 문단에 따른 학문적, 문예적 경향을 추출해 내었다. 이러한 성과를 볼 때 한국의 원전 자료에서도 주석, 병렬 코퍼스를 구축하는 작업에 관심이 필요하다.

      • KCI등재

        코퍼스와 한국어 문법 교육

        강현화 서울대학교 국어교육연구소 2012 국어교육연구 Vol.30 No.-

        The purpose of this paper is to analyze the corpus studies in Korean grammar teaching and suggest its applications. Based on the applicability in language education, this study divide grammar into three areas: lexico grammar, discourse grammar and sentence grammar and intends to analyze the research results in these areas. First, this paper finds that the domestic studies lacks in corpus application research compared to the foreign studies, especially in the field application of corpus in teaching. This paper suggests that this problem can be resolved through instructor's easy access to the corpus. Second, this paper analyzes the previous studies and detects the problems regarding corpus building in Korean education. This paper proposes the need for building large corpus led by Korean government. Third, this paper emphasizes the necessity of teacher training using the corpus and building various types of voice and video corpus for grammar education that goes beyond current sentence oriented grammar to lexical approached grammar, discourse grammar and context grammar. 본고는 한국어 문법 교육에 있어서의 코퍼스 활용 연구를 분석하고 문법 교수에의 활용을 제안하는 것을 목적으로 하였다. 이를 위해, 국내외 언어교육 연구에서의 코퍼스를 활용한 문법 교육 자료 연구와 문법 교수 방안 연구를 분석해 보았다. 언어교육에서의 활용성을 전제로 하여 문법을 어휘 문법, 문장 문법, 담화 문법의 세 영역으로 구분하고 이들 영역에서의 연구 결과를 분석하고자 했다. 첫째, 국내외 연구를 비교해 보면 국외의 연구에 비해 국내 연구는 코퍼스 활용 연구가 부족하며, 특히 교수 현장에의 적용 부분이 부족함을 확인할 수 있었다. 이는 교수자의 코퍼스 접근의 용이성 확보를 통해 해결해야 함을 제안하였다. 둘째, 선행 연구의 분석 결과 한국어교육에서의 코퍼스 구축의 문제점을 발견할 수 있었다. 한국어교육에서의 코퍼스의 사용은 코퍼스 규모나 균형성이 확보되지 못해, 적은 자료의 분석으로 결과를 도출하거나 문어에 치중되어 언어교육에의 효용이 적음을 확인할 수 있었다. 이는 국가 주도의 대규모 한국어 교육용 코퍼스 구축이 필요함을 의미한다고 보았다. 셋째, 코퍼스 활용을 위한 교사 교육의 필요성이나 음성, 동영상 코퍼스로 이어지는 다양한 유형의 코퍼스가 구축되어야만 문장 문법에 머물고 있는 문법 교육이 어휘 접근적 문법, 담화 차원의 문법, 맥락 차원의 문법 교수로 나아갈 수 있음을 확인할 수 있었다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료
