RISS 학술연구정보서비스

다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        남북한 말뭉치 통합 방안에 대한 연구

        소강춘(So Kang-chun) 국어문학회 2016 국어문학 Vol.63 No.-

        이 연구는 한국어 정보화의 초석이 되는 통합된 한국어 말뭉치 구축 방안을 모색하기 위한 것이다. 우리나라는 남북으로 분단되어 서로 다른 언어 규범을 사용하고 있을 뿐만 아니라, 중국의 조선족 동포들이 사용하고 있는 중국 조선어도 별도의 규범을 가지고 있다. 따라서 완전한 한국어 말뭉치를 구축하기 위해서는 이 세 지역의 언어규범을 포괄할 수 있는 방안이 마련되어야 한다. 그러나 이러한 외적 환경 조성은 용이한 일이 아니다. 그래서 이 연구에서는 그동안에 구축되었던 말뭉치 현황을 파악하고, 남북에서 구축된 말뭉치의 실례를 통해 문제점과 통합 가능성을 파악하여, 보다 효과적인 남북한 한국어 자료의 말뭉치 구축 방안을 제시하려 한다. In this study, I have a clear grasp of the present state of the electronic Korean corpus that was built by North and South Korea. Through that corpus, I am able to clarify the distinction between the North Korea corpus and its counterpart in the South. I am also able to find a way to close the gaps. Subsequently, I will search for a method to integrate corpus in North and South Korea.

      • KCI등재

        강제음성정렬장치를 이용한 대용량음성자료연구

        윤태진(Tae-Jin Yoon) 한국중원언어학회 2013 언어학연구 Vol.0 No.29

        In order to study linguistic patterns from large-scale spoken data, researchers need tools such as automatic forced-alignment tools. Automatic forced-alignment tools map wave forms in sound files to orthographic word or phone sequences. It is often problematic, however, that researchers to spoken language have limited access to such tools. The paper presents how Korean automatic alignment system can used in the study of large-scale spoken language. Korean simple vowels are acoustically analyzed as a case study. The acoustic analysis of the Korean monophthong illustrates that the forced-alignment system can be used in a reliable and reproducible way.

      • KCI등재
      • KCI등재

        구어 어휘의 의미 연구 방법론-말뭉치 기반 사용역 변이 연구를 중심으로-

        안의정 한국어의미학회 2014 한국어 의미학 Vol.43 No.-

        This study aims at finding the methodology for the meaning of colloquial vocabulary by arranging the history of research of corpus-based register variation. Many studies using corpora have focused on variation by comparing two or more dialects, channels, genres, sublanguages or varieties of language in order to uncover the main differences and similarities between them. In one language, there are many types of sublanguage existed and this sublanguage can be divided and understood in the aspects of genre, language register, and style. In this study, I’d like to determine how to suggest the methodology for the study of meaning by studying the variation of corpus linguistics. To understand the language register is to understand various usages of language forms in the discourse level out of sentence level. Therefore, we can understand the meaning of spoken language vocabulary in the discourse level by focusing on the study of language register variation including spoken language. In Chapter 2, I organized the relationship between corpus linguistics and semantic study as a basic theoretical discussion. In Chapter 3, thereafter, I organized what type of variation study was processed following the corpus annotation. I organized the study of various registers by dividing into raw corpus, POS tagged corpus, and speech corpora. Finally, in the Chapter 4, I introduced a methodology for the study of meaning targeting sense tagged corpus.

      • KCI등재

        한국어 억양 말뭉치 KICo의 감탄사 ‘그래’ 억양 연구 -H%와 L%의 기울기를 고려하여-

        김지은 ( Kim Ji-eun ) 국어학회 2023 국어학 Vol.- No.108

        본고는 한국어 억양 말뭉치 KICo(Korean Intonation Corpus)를 처음으로 활용하는 연구이다. 본 연구의 일차적 목적은 ‘그래’의 의미별 억양을 고찰하는 데에 있으나, 이 과정에서 한국어 억양 전사법의 재고를 통한 H%와 L%의 기울기 전사의 방법과 필요성도 생각해 보고자 하였다. 이러한 목적을 달성하기 위해 본고에서는 KICo에 포함되어 있는 총 1,320개의 한국어 모어 화자의 ‘그래’ 발화를 사전적 의미에 따라 분류하고 음성학·음운론적으로 분석하였다. 그 결과 ‘그래’ 「1」은 H%(75%)를, ‘그래’ 「2」는 H%(66%)를, 그래 「3」은 L%(79%)를 최빈(最頻) 억양으로 하여 의미별 억양이 서로 겹치는 것처럼 보이지만, 이들은 다시 L%와 H%의 기울기 모양을 전사해 보고 음성학적 척도에 따라 분석하면 대개 변별적인 억양 실현이 이루어짐을 확인할 수 있었다. 본고의 결과는 ‘그래’의 의미별 억양 외에도 기존의 음운론적인 억양 전사 규약이 의미와 억양의 ‘다대다’ 관계 확장에 기여했을 가능성을 보여 주어 음성적 억양 전사 규약의 추가가 필요할 수 있음을 시사한다. This paper is the first study using the Korean Intonation Corpus (KICo). We primarily aimed to examine the intonation of “geurae” across meanings, while looking to introduce KICo to the Korean linguistics community for the first time and reconsider the transcription method and necessity of taking the slope of H% and L% into consideration. To achieve these goals, a total of 1,320 utterances of “geurae” by native Korean speakers included in KICo were classified according to their lexical meanings and were phonetically and phonologically analyzed. As a result, “geurae” 「1」 showed H% (75%) as the most frequent intonation, “geurae” 「2」 showed H% (66%), and “geurae” 「3」 showed L% (79%) as their most frequent intonations. While the intonations for each meaning seemed to overlap, when transcribed with the slopes of L% and H% and analyzed based on phonetic measurements, they typically exhibited distinct intonation realizations. The results of this paper suggest that, beyond the intonation of “geurae” by meaning, the existing intonation transcription systems might have expanded the “many-to-many” relationship between meaning and intonation, implying that additional transcription guidelines may be necessary.

      • KCI등재
      • KCI등재

        학습자 말뭉치 구축을 위한 구어 전사지원 도구의 개발 방향

        이화진,이지연 한국언어문화교육학회 2016 언어와 문화 Vol.12 No.3

        The main purpose of this study is to suggest the way that develops the automatic transcription tool for foreign learner’s spoken corpus construction. The automatic transcription tool is primarily applied for efficiency. However, In terms of transcribing foreign learner’s speech is treated as the spoken corpus, transcription tools incorporate speech recognition process should be focused on the accuracy of recognition. In numerous cases, transcribing speech through the automatic tool is operated by the native speaker’s parameters. In those cases, corpus data can be established as an inappropriate form that is caused by inaccurate speech recognition based on the native speaker’s data. Therefore, the process of perceiving foreign learner’s speech should be programmed through the foreign learner’s parameters can raise the recognition rate. The foreign learner’s parameters can be composed of their own phonetic properties and frequent patterns of error.

      • KCI등재

        Back TranScription(BTS)기반 데이터 구축 검증 연구

        박찬준,서재형,이설화,문현석,어수경,임희석 한국융합학회 2021 한국융합학회논문지 Vol.12 No.11

        최근 인간과 컴퓨터의 상호작용(HCI)을 위한 수단으로 음성기반 인터페이스의 사용률이 높아지고 있다. 이에 음성인식 결과에 오류를 교정하기 위한 후처리기에 대한 관심 또한 높아지고 있다. 그러나 sequence to sequence(S2S)기반의 음성인식 후처리기를 제작하기 위해서는 데이터 구축을 위해 human-labor가 많이 소요된다. 최근 기존의 구축 방법론의 한계를 완화하기 위하여 음성인식 후처리기를 위한 새로운 데이터 구축 방법론인 Back TranScription(BTS)이 제안되었다. BTS란 TTS와 STT 기술을 결합하여 pseudo parallel corpus를 생성하는 기술을 의미한다. 해당 방법론은 전사자(phonetic transcriptor)의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성 할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축할 수 있다. 본 논문은 기존의 BTS 연구를 확장하여 어떠한 기준 없이 데이터를 구축하는 것보다 어투와 도메인을 고려하여 데이터 구축을 해야함을 실험을 통해 검증을 진행하였다. Recently, the use of speech-based interfaces is increasing as a means for human-computer interaction (HCI). Accordingly, interest in post-processors for correcting errors in speech recognition results is also increasing. However, a lot of human-labor is required for data construction. in order to manufacture a sequence to sequence (S2S) based speech recognition post-processor. To this end, to alleviate the limitations of the existing construction methodology, a new data construction method called Back TranScription (BTS) was proposed. BTS refers to a technology that combines TTS and STT technology to create a pseudo parallel corpus. This methodology eliminates the role of a phonetic transcriptor and can automatically generate vast amounts of training data, saving the cost. This paper verified through experiments that data should be constructed in consideration of text style and domain rather than constructing data without any criteria by extending the existing BTS research.

      • KCI등재

        한국어 준구어 어절 구조 연구

        노성화(Xing-Hua Lu) 순천향대학교 인문학연구소 2012 순천향 인문과학논총 Vol.31 No.1

        본 연구는 어절이 통사적인 짜임새의 기본적인 단위이면서 또한 형태론적인 짜임새의 최대 단위라는 점을 중시하여, 총 10편의 한국 영화와 4편(5회/편)의 한국 드라마로 구성된 준구어 음성 전사 말뭉치를 기초 분석 자료로, 이들 준구어에서 나타나는 어절 구조의 사용 실태와 그 특징을 어절들의 음절수, 형태수, 형태 결합 양상 등 3가지 측면으로 나누어 계량언어학적 분석을 진행하였다. 또한 이 연구 결과를 각각 영화와 드라마, 남자와 여자로 세분하여 비교 분석을 진행하였다. 먼저 어절들의 음절수를 보면, 음절수가 1~4개인 어절이 전체 어절의 95%를 차지하였으며 그중 1~3개인 어절이 전체 어절의 85%를 차지하였다. 또한 형태수 측면에서, 1~3개 형태로 된 어절이 98%를 차지해 대부분의 대화들이 이들 위주로 진행됨이 발견되었다. 준구어 어절의 형태 결합 양상을 보면, 명사류, 동사류, 감탄사류, 부사류, 대명사류 어절 구조는 전체 준구어 어절의 86.326%를 차지해 높은 사용률을 보였으며, 부류별 개별 구조들도 전부 상용 구조가 있어 절대 대부분의 대화가 이들을 둘러싸고 진행됨이 발견되었다. 또한 위의 분석 결과를 드라마와 영화, 남자와 여자로 나누어 비교 분석을 진행한 결과 각 비교 항목별로 일부 차이를 보였지만 큰 차이를 보이지 않아 준구어에서 사용률이 높은 개별 구조들이 각 비교 항목별로도 사용률이 높고 준구어에서 사용률이 낮은 개별 구조들이 각 비교 항목별로도 사용률이 낮음을 알 수 있었다. This study examines the usage condition of phrase structures and its characteristics in the spoken Korean language. The quantitative linguistic analysis on the voice transcription corpus consisting of 10 films and 4 dramas deals with the numbers of syllables, morphemes and aspects of combined morphemes. In terms of syllable numbers, the phrases with less than four syllables account for 95% of total phrases. In the numbers of morphemes, the phrases less than 3 account for 98%. This result shows that most of our dialogues are accomplished in such circumferences. In the aspects of combined morphemes, the phrase structures of noun, pronoun, verb, adverb, interjection take as high as 86.326% of the spoken language. The comparative analysis on film, drama, men and women respectively does not show any significant differences among them.

      • KCI등재

        구어 자료에 나타난 감탄사 ‘어’의 담화 기능과 운율

        송인성 민족어문학회 2022 어문논집 Vol.- No.94

        이 연구는 구어 자료를 이용하여 감탄사 ‘어’의 담화 기능과 사용 맥락을 조사하고, 이에 따른 ‘어’의 운율 특성을 밝히는 데 목적이 있다. ‘어’에 관한 기존 연구는 ‘어’의 의미와 기능을 파악하는 데 중점을 두었다. 그러나 이 연구에서는 앞선 연구와 달리 ‘어’의 운율 특성을 분석하는 데 중점을 두고 논의를 진행하였다. ‘어’의 담화 기능은 반응 표현, 태도 표현, 발화 진행 표현으로 구분된다. 반응 표현에는 긍정, 응답, 재발화 및 설명 요구 기능, 태도 표현에는 강조, 놀람·감탄, 주저함 기능, 발화 진행 표현에는 관심 유도, 발언권 유지(시간 벌기, 디딤말), 수정하기의 기능이 실현되었다. 이와 같은 ‘어’의 담화 기능은 다양한 사용 맥락에서 실현되는 특징을 보였다. ‘어’의 운율 특성은 ‘어’의 각 담화 기능에 따라 초, 중, 말, 단독의 발화 내 위치와 고, 저, 고저 등의 음높이 유형과 상대적으로 길고 짧음의 길이에 관한 주된 운율 특징을 파악할 수 있었다. 이 연구는 기존 연구에서 관심이 부족하였던 ‘어’의 운율 특성을 분석하는 데 중점을 두고, 음성 자료와 음성 분석 프로그램을 이용하여 ‘어’의 각 담화 기능에 따른 주된 운율의 특성을 파악하였다. 이 연구를 통해서 앞으로 감탄사 ‘어’의 연구 범위가 확대될 것으로 전망한다. The aim of this paper is to investigate the discourse functions and prosodic features of ‘eo’ realized in different types of spoken language corpus. The discourse functions of ‘eo’ are divided into three main ctergories: the expression of reaction to other people’s utterances and the expression of one’s own attitude, one’s progression strategy of utterance. Discourse functions that respond to other people’s speech are ‘positive’, ‘response to a call’, ‘request to say again’, The discourse functions that expression of one’s own attitude are ‘emphasis’, ‘hesitation’. ‘surprise or admiration’. The discourse functions that progression strategy of utterance are ‘attention’, ‘maintenance of utterance’, ‘correct utterances’. According to each discourse functions, ‘eo’ showed differences in prosody such as position in utterance, tonal type, and duration. This study is meaningful in that it focuses on analyzing the prosody features of ‘eo’ which was lacking interest in previous studies, and precisely analyzes the prosody features of ‘eo’ using speech corpus and a speech analysis program.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료
