RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      북한어 말뭉치의 형태 분석에 관한 몇 가지 문제

      한글로보기

      https://www.riss.kr/link?id=A107987683

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      이 논문에서는 현재까지 갖추어져 있는 북한어 말뭉치 형태 분석 지침과 북한어 형태 주석 말뭉치 구축 과정을 검토하고, 이들의 처리 방법에 대하여 논의하였다. 특히 대규모 말뭉치 분석자와 사용자의 입장에서 북한어 형태 분석 과정에서 발생하는 실제적인 문제들을 논의하였다.
      2장에서는 문어 말뭉치 형태 분석 작업에서 발생하는 문제를 다루었다. 먼저, 남북한 사전에 등재되지 않은 단어를 분석할 때의 문제를 합성어를 중심으로 살폈다. 다음으로, 한글과 한글 외의 문자가 혼용되어 있는 어절을 처리하는 방식을 두 가지로 검토하였다. 3장에서는 구어 말뭉치 형태 분석 작업에서 발생하는 문제를 다루었다. 먼저, 재구조화에 의해 조사와 어미를 분리하기 어려운 경우 재구조화된 형태를 인정하되 조사나 어미가 분리되지 않으며 다른 통사 성분과 통사적 관계를 형성하지도 않는다면 분석하지 않을 것을 주장하였다. 다음으로, 담화 표지로 기능하는 형태들의 처리 방식에 대하여 논의하였다. 특히 활용형이 담화 표지로 기능할 때 어간과 어미를 분리하지 말아야 함을 주장하였다.
      번역하기

      이 논문에서는 현재까지 갖추어져 있는 북한어 말뭉치 형태 분석 지침과 북한어 형태 주석 말뭉치 구축 과정을 검토하고, 이들의 처리 방법에 대하여 논의하였다. 특히 대규모 말뭉치 분석...

      이 논문에서는 현재까지 갖추어져 있는 북한어 말뭉치 형태 분석 지침과 북한어 형태 주석 말뭉치 구축 과정을 검토하고, 이들의 처리 방법에 대하여 논의하였다. 특히 대규모 말뭉치 분석자와 사용자의 입장에서 북한어 형태 분석 과정에서 발생하는 실제적인 문제들을 논의하였다.
      2장에서는 문어 말뭉치 형태 분석 작업에서 발생하는 문제를 다루었다. 먼저, 남북한 사전에 등재되지 않은 단어를 분석할 때의 문제를 합성어를 중심으로 살폈다. 다음으로, 한글과 한글 외의 문자가 혼용되어 있는 어절을 처리하는 방식을 두 가지로 검토하였다. 3장에서는 구어 말뭉치 형태 분석 작업에서 발생하는 문제를 다루었다. 먼저, 재구조화에 의해 조사와 어미를 분리하기 어려운 경우 재구조화된 형태를 인정하되 조사나 어미가 분리되지 않으며 다른 통사 성분과 통사적 관계를 형성하지도 않는다면 분석하지 않을 것을 주장하였다. 다음으로, 담화 표지로 기능하는 형태들의 처리 방식에 대하여 논의하였다. 특히 활용형이 담화 표지로 기능할 때 어간과 어미를 분리하지 말아야 함을 주장하였다.

      더보기

      다국어 초록 (Multilingual Abstract)

      This paper has examined guidelines for morphological analysis on North Korean corpus which have been established and the process of construction a corpus of North Korean morphological annotation and then discussed how to deal with them. Particularly, from the standpoint of users and analyzers of large-scale corpus, this author has investigated practical problems occurring in the process of North Korean morphological analysis.
      Chapter 2 deals with the problems found in the work of morphological analysis on a corpus of written language. First of all, this author examines problems found in the process of analyzing words not registered in South and North Korean dictionaries mainly with compounds. Next, this study investigates how to treat word segments in which Hangeul and non-Hangeul letters are mixed in two ways. Chapter 3 handles the problems occurring in the work of morphological analysis on a corpus of spoken language. First, this author insists that when it is hard to separate the postposition and word ending through restructuralization, the form restructuralized should be acknowledged and if either the postposition or word ending is not separated and does not form any syntactic relation with another syntactic component, it should not be analyzed. Next, how to deal with the forms functioning as a discourse marker is discussed. In particular, this author asserts that when the inflectional form functions as a discourse marker, the stem and word ending should not be separated.
      번역하기

      This paper has examined guidelines for morphological analysis on North Korean corpus which have been established and the process of construction a corpus of North Korean morphological annotation and then discussed how to deal with them. Particularly, ...

      This paper has examined guidelines for morphological analysis on North Korean corpus which have been established and the process of construction a corpus of North Korean morphological annotation and then discussed how to deal with them. Particularly, from the standpoint of users and analyzers of large-scale corpus, this author has investigated practical problems occurring in the process of North Korean morphological analysis.
      Chapter 2 deals with the problems found in the work of morphological analysis on a corpus of written language. First of all, this author examines problems found in the process of analyzing words not registered in South and North Korean dictionaries mainly with compounds. Next, this study investigates how to treat word segments in which Hangeul and non-Hangeul letters are mixed in two ways. Chapter 3 handles the problems occurring in the work of morphological analysis on a corpus of spoken language. First, this author insists that when it is hard to separate the postposition and word ending through restructuralization, the form restructuralized should be acknowledged and if either the postposition or word ending is not separated and does not form any syntactic relation with another syntactic component, it should not be analyzed. Next, how to deal with the forms functioning as a discourse marker is discussed. In particular, this author asserts that when the inflectional form functions as a discourse marker, the stem and word ending should not be separated.

      더보기

      목차 (Table of Contents)

      • 국문초록
      • 1. 서론
      • 2. 언어학적 관습 차이에 대한 처리-문어 말뭉치를 중심으로
      • 3. 비표준 특수형의 처리- 구어 말뭉치를 중심으로
      • 4. 결론
      • 국문초록
      • 1. 서론
      • 2. 언어학적 관습 차이에 대한 처리-문어 말뭉치를 중심으로
      • 3. 비표준 특수형의 처리- 구어 말뭉치를 중심으로
      • 4. 결론
      • 참고문헌
      • Abstract
      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼