RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      코퍼스의 대표성 측정 방안 연구 : 텍스트 장르별 언어학적 자질의 분포를 중심으로

      한글로보기

      https://www.riss.kr/link?id=T12756226

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      코퍼스는 언어의 본질적인 모습을 총체적으로 드러내 보여 주는 자료의 집합이다. 따라서 코퍼스를 구축할 때 가장 중요하게 고려해야 할 것은 코퍼스를 구성하는 텍스트들이 언어의 현실을 충분히 반영하고 있는가에 대한 대표성의 문제일 것이다. 대표성에 관한 기존의 연구들은 주로 코퍼스의 설계 단계에서 고려되어야 할 기준을 제시하려는 것들이었으나 본 연구에서는 이미 구축된 코퍼스를 대상으로 그것의 대표성을 측정하는 방안을 제시해 보고자 하였다.
      먼저 국립국어원에서 구축한 300만 어절의 균형 코퍼스를 대표성을 갖춘 기준코퍼스로 설정하고 이와 동일한 규모와 구성을 가지는 다섯 개의 실험코퍼스를 구축하였다. 대표성 측정의 도구로 사용될 언어학적 자질의 집합을 구성하고 그 중에서 텍스트의 장르 변별에 있어 유의미한 자질들을 선별하기 위해 신뢰성과 타당성 검증을 실시하였다. 코퍼스를 대상으로 자질의 빈도를 산출하는 프로그램을 작성하여 기준코퍼스와 실험코퍼스로부터 검증된 자질들의 출현 빈도를 산출하였다. 기준코퍼스의 빈도 정보를 토대로 요인 분석을 실시하여 언어학적 자질들의 공기 패턴을 기반으로 다섯 개의 요인을 밝혀내고 각 요인들에 대하여 기준코퍼스와 실험코퍼스의 장르별 요인 점수를 산출하였다. 이 점수들을 그래프로 시각화하고 ‘피어슨 상관계수’ 및 ‘대응표본T검정’을 이용하여 기준코퍼스와 실험코퍼스의 요인 점수를 상호 비교한 결과, ‘실험코퍼스4’가 대표성을 가장 잘 갖춘 코퍼스인 것으로 드러났다. 또한 대부분의 실험코퍼스들이 보다 더 대표성을 띨 수 있도록 하기 위해서는 ‘서술성’과 ‘대화성’의 측면에서 코퍼스를 구성하는 텍스트들이 기준치에 맞게 조정될 필요가 있음을 확인할 수 있었다.
      번역하기

      코퍼스는 언어의 본질적인 모습을 총체적으로 드러내 보여 주는 자료의 집합이다. 따라서 코퍼스를 구축할 때 가장 중요하게 고려해야 할 것은 코퍼스를 구성하는 텍스트들이 언어의 현실...

      코퍼스는 언어의 본질적인 모습을 총체적으로 드러내 보여 주는 자료의 집합이다. 따라서 코퍼스를 구축할 때 가장 중요하게 고려해야 할 것은 코퍼스를 구성하는 텍스트들이 언어의 현실을 충분히 반영하고 있는가에 대한 대표성의 문제일 것이다. 대표성에 관한 기존의 연구들은 주로 코퍼스의 설계 단계에서 고려되어야 할 기준을 제시하려는 것들이었으나 본 연구에서는 이미 구축된 코퍼스를 대상으로 그것의 대표성을 측정하는 방안을 제시해 보고자 하였다.
      먼저 국립국어원에서 구축한 300만 어절의 균형 코퍼스를 대표성을 갖춘 기준코퍼스로 설정하고 이와 동일한 규모와 구성을 가지는 다섯 개의 실험코퍼스를 구축하였다. 대표성 측정의 도구로 사용될 언어학적 자질의 집합을 구성하고 그 중에서 텍스트의 장르 변별에 있어 유의미한 자질들을 선별하기 위해 신뢰성과 타당성 검증을 실시하였다. 코퍼스를 대상으로 자질의 빈도를 산출하는 프로그램을 작성하여 기준코퍼스와 실험코퍼스로부터 검증된 자질들의 출현 빈도를 산출하였다. 기준코퍼스의 빈도 정보를 토대로 요인 분석을 실시하여 언어학적 자질들의 공기 패턴을 기반으로 다섯 개의 요인을 밝혀내고 각 요인들에 대하여 기준코퍼스와 실험코퍼스의 장르별 요인 점수를 산출하였다. 이 점수들을 그래프로 시각화하고 ‘피어슨 상관계수’ 및 ‘대응표본T검정’을 이용하여 기준코퍼스와 실험코퍼스의 요인 점수를 상호 비교한 결과, ‘실험코퍼스4’가 대표성을 가장 잘 갖춘 코퍼스인 것으로 드러났다. 또한 대부분의 실험코퍼스들이 보다 더 대표성을 띨 수 있도록 하기 위해서는 ‘서술성’과 ‘대화성’의 측면에서 코퍼스를 구성하는 텍스트들이 기준치에 맞게 조정될 필요가 있음을 확인할 수 있었다.

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼