RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      역사 말뭉치 분석을 통한 감정 어휘의 의미 영역 변화 양상 연구

      한글로보기

      https://www.riss.kr/link?id=G3750461

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      감정어에 대한 정의와 감정어 추출은 다음과 같은 방식을 따르고자 한다. 우선 감정에 대한 선행 연구를 비판적으로 검토하여 감정 어휘를 한정한다. 이후 이를 기준으로 감정을 나타내거나...

      감정어에 대한 정의와 감정어 추출은 다음과 같은 방식을 따르고자 한다. 우선 감정에 대한 선행 연구를 비판적으로 검토하여 감정 어휘를 한정한다. 이후 이를 기준으로 감정을 나타내거나 감정과 관련되는 모든 어휘를 사전에서 추출한다. 추출한 감정어를 분류하여 목록화한 후 말뭉치 속 빈도를 중심으로 연구 대상 어휘를 선정 정리한다.
      이 연구에서 이용하는 말뭉치는 다음과 같다. 우선 19C말~20C초 자료로는 경희대학교 김진해 교수 연구팀이 구축한 290만 어절 규모의 20C초 형태소 분석 말뭉치 자료(이하 20C초 말뭉치)를 재가공하여 사용할 것이다. 이와 비교할 현대 국어 자료는 21C세종계획의 일환으로 구축된 550만 어절 규모의 형태소 분석 말뭉치 자료(이하 20C말 말뭉치)를 재가공하여 사용하고자 한다. 이와 함께 경우에 따라 21C세종계획으로 구축한 말뭉치, 고려대학교 물결21 코퍼스 등을 참고로 이용할 것이다.
      이 연구에서 파악하고자 하는 변화 유형과 연구 방법은 다음과 같다. 먼저 시대에 따른 사용량 변화 양상을 추적한다. 이를 위해 크기와 방향을 가지고 있는 정보를 벡터 모델(vector space models)로 표현해 내며, 이를 통해 시기별 변화 양상을 확인할 수 있다. 다만 단순히 한 단어의 사용 빈도가 변화하는 것을 살피는 것이 아니라 이들의 연관된 사용 의미 변화를 함께 살펴봄으로써 의미 변화 양상을 직접 확인할 수 있다. 사용 의미 변화의 파악은 공기관계의 변화를 추가함으로써 가능하다. 공기관계의 변화는 새로운 사용 유형의 등장과 확장, 또는 소멸 등을 통해 파악이 가능하다.
      벡터 모델(schütze, 1993)은 다차원 공간의 문맥 벡터를 이용해 단어, 문서, 또는 기타 항목을 나타내는 수학적 모델이다. 이를 이용하면 공기관계 패턴을 통해 파악한 단어의 언어적 맥락을 분포를 통해 확인할 수 있게 된다. 더욱이 문맥 벡터들 사이의 의미적 유사성 측정치들은 유사한 의미를 갖는 단어들을 검출하는 데 사용할 수 있다. 의미적 유사성의 측정은 생성된 공간에서 항목 간의 거리를 기반으로 한다. 의미적으로 긴밀하게 관련된 단어는 공간에서 그룹화되는 경향이 있으며 다른 단어보다 더 짧은 거리에 있을 것이므로 공백에서 이 거리는 두 단어 또는 그룹 사이에서 계산될 수 있다.
      이와 같은 벡터 공간을 만들기 위해서는 형태소 분석 태그가 달린 말뭉치에서 행렬을 작성해야 한다. 이를 이용해 문서-단어 행렬, 단어 문맥 및 동시 발생 행렬, 단어 패턴 행렬 등의 벡터 공간 모델을 구성할 수 있으며 다양한 분석을 시행할 수 있다. 예를 들어 유사한 단어 쌍과 함께 발생하는 패턴은 유사한 의미관계를 나타내는 것이라고 말할 수 있다. 마찬가지로 유사한 패턴에서 동시에 발생하는 단어 쌍은 유사한 의미 관계를 나타낸다고 볼 수 있다.
      단어의 유사성 또한 단어-문서 행렬을 통해 측정할 수 있다. 의미론적 유사성은 생성된 공간에서 항목 간의 거리를 기반으로 하는데, 의미론적으로 긴밀하게 관련된 단어는 이 공간에서 그룹화되는 경향이 있으며 다른 단어보다 더 짧은 거리에 있을 것이므로, 이 거리는 쌍(두 단어) 또는 그룹(좌표) 사이에서 계산될 수 있다.
      의미 네트워크라는 이름으로 수행된 방식 또한 유용하다. 이는 단어들의 개념뿐 아니라 이들의 관계, 양상, 현상, 등을 시각화하는 효과를 가질 수 있기 때문이다. 따라서 단어 네트워크는 단어들이 어떤 의미 관계로 연결되어 군집화되는지 관찰하게 해 준다.(김혜영 외 2011 82)
      이와 같이 두 시기 말뭉치를 통해 감정어들의 사용량 변화를 파악하여 이를 벡터 모델을 통해 시기별로 중첩시킴으로써 의미 변화의 양상을 포착할 수 있을 것이다. 여기에 더 나아가 네트워크 분석을 같은 방식으로 중첩시키는 것을 통해 네트워크 변화 양상을 동일한 방식으로 파악할 수 있게 된다. 이를 이용하여 중심성의 변화와 공기관계의 변화 등을 시각적으로 확인할 수 있다.
      사용 빈도와 공기관계를 이용한 추세선 변화는 해당 용어들의 주제 범위를 보여주며 이들의 변화를 평가함으로써 의미 변화의 변동성을 계산할 수 있다. 이는 기본적으로 주요 단어에 대한 시간 범위 내의 전체 단어 수와의 비교를 통해 이루어지며 이들의 변화가 의미에 영향을 주는지 확인할 수 있다. 이 연구는 그림을 이용한 시각적 분석을 제시함으로써 보다 효과적인 탐색을 가능하도록 할 것이다.

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼