RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      효과적인 자질 선택과 부트스트래핑을 이용한 단어 중의성 해소 = Word Sense Disambiguation using Effective Feature Selection and Bootstrapping

      한글로보기

      https://www.riss.kr/link?id=T11922040

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      In this thesis we propose a method that creates sense tagged data using machine readable dictionaries for ambiguous word sense tagging. Our method introduces a bootstrapping method to create training data additively and learn gradually. In this bootstrapping routine, this method applies penalty to a word that leads to wrong sense tagging. So it makes the right sense tagging in the next bootstrapping turn. The proposed method creates the meaning group that consists of distinguishing surrounding words near target words. This method introduces concentration concept into word weight formula for selecting important word and enhances the tagging accuracy. The tagging result on the SENSEVAL-2 data shows that the proposed method improves about 7% of accuracy over the base tagging system.
      번역하기

      In this thesis we propose a method that creates sense tagged data using machine readable dictionaries for ambiguous word sense tagging. Our method introduces a bootstrapping method to create training data additively and learn gradually. In this bootst...

      In this thesis we propose a method that creates sense tagged data using machine readable dictionaries for ambiguous word sense tagging. Our method introduces a bootstrapping method to create training data additively and learn gradually. In this bootstrapping routine, this method applies penalty to a word that leads to wrong sense tagging. So it makes the right sense tagging in the next bootstrapping turn. The proposed method creates the meaning group that consists of distinguishing surrounding words near target words. This method introduces concentration concept into word weight formula for selecting important word and enhances the tagging accuracy. The tagging result on the SENSEVAL-2 data shows that the proposed method improves about 7% of accuracy over the base tagging system.

      더보기

      국문 초록 (Abstract)

      본 연구에서는 기계 가독형 사전 정보를 이용하여 중의어 의미 태깅을 위한 학습에 사용될 의미부착 데이터를 자동으로 생성하는 방법을 제안한다. 또한 부트스트래핑 기법을 도입하여 학습 데이터를 추가적으로 생성하고 점진적으로 학습한다. 이 과정에서 잘못된 의미부착으로 유도하는 단어에 대한 패널티를 적용하여 다음 부트스트래핑 단계에서 의미 부착 정확도를 높인다. 그리고 중의어의 의미별로 특징있는 주변 단어를 원소로 갖는 의미그룹을 생성하며 의미그룹 내 중요 단어 선정을 위해 집중도 개념을 도입한다. SENSEVAL-2 데이터를 사용하여 태깅 정확도를 평가한 결과 본 연구에서 제안한 방법이 기본 태깅 방법보다 정확도를 7% 가량 향상시킨 것으로 나타났다.
      번역하기

      본 연구에서는 기계 가독형 사전 정보를 이용하여 중의어 의미 태깅을 위한 학습에 사용될 의미부착 데이터를 자동으로 생성하는 방법을 제안한다. 또한 부트스트래핑 기법을 도입하여 학...

      본 연구에서는 기계 가독형 사전 정보를 이용하여 중의어 의미 태깅을 위한 학습에 사용될 의미부착 데이터를 자동으로 생성하는 방법을 제안한다. 또한 부트스트래핑 기법을 도입하여 학습 데이터를 추가적으로 생성하고 점진적으로 학습한다. 이 과정에서 잘못된 의미부착으로 유도하는 단어에 대한 패널티를 적용하여 다음 부트스트래핑 단계에서 의미 부착 정확도를 높인다. 그리고 중의어의 의미별로 특징있는 주변 단어를 원소로 갖는 의미그룹을 생성하며 의미그룹 내 중요 단어 선정을 위해 집중도 개념을 도입한다. SENSEVAL-2 데이터를 사용하여 태깅 정확도를 평가한 결과 본 연구에서 제안한 방법이 기본 태깅 방법보다 정확도를 7% 가량 향상시킨 것으로 나타났다.

      더보기

      목차 (Table of Contents)

      • 1. 서 론 1
      • 2. 관련 연구 4
      • 2.1 학습 방법에 따른 연구 분류 4
      • 2.1.1 지도식 학습 방법 4
      • 2.1.2 비지도식 학습 방법 6
      • 1. 서 론 1
      • 2. 관련 연구 4
      • 2.1 학습 방법에 따른 연구 분류 4
      • 2.1.1 지도식 학습 방법 4
      • 2.1.2 비지도식 학습 방법 6
      • 2.1.3 준지도식 학습 방법 7
      • 2.2 SENSEVAL대회 관련 연구 9
      • 2.2.1 SENSEVAL대회의 성능 평가 결과 10
      • 2.2.2 JHU system 11
      • 2.3 관련 수식 13
      • 2.3.1 집중도 13
      • 3. 의미그룹을 이용한 단어 중의성 해소 15
      • 3.1 기초 의미그룹 생성 17
      • 3.2 웹 문서 문맥의 의미 부착 19
      • 3.3 의미그룹 생성 21
      • 3.4 의미부착 피드백 28
      • 3.5 중의어 의미 태깅 34
      • 3.5.1 복합명사 규칙 적용 34
      • 3.5.2 의미그룹 가중치 적용 36
      • 3.5.3 중의어 의미 태깅 알고리즘 38
      • 4. 실험 및 평가 39
      • 4.1 자료 수집 39
      • 4.2 평가 데이터 39
      • 4.3 파라미터 및 알고리즘 설정 실험 40
      • 4.3.1 패널티 결정 수식 관련 설정 실험 40
      • 4.3.2 부트스트래핑 반복 회수 고정 및 자율 조절 비교 실험 43
      • 4.3.3 부트스트래핑 반복 회수 조절 임계치 설정 실험 46
      • 4.3.4 최적 자질 개수 설정 실험 49
      • 4.4 성능 비교 평가 51
      • 4.4.1 사람이 직접 초기 seed를 선정하는 경우와 비교 실험 52
      • 4.4.2 특정 알고리즘 첨가 비교 실험 55
      • 4.4.3 학습 데이터 종류에 따른 비교 실험 57
      • 4.4.4 나이브 베이지안 수식과 비교 실험 58
      • 4.4.5 최종 실험 결과 61
      • 4.5 실험 결과 63
      • 4.5.1 의미 태깅 결과 63
      • 4.5.2 부트스트래핑 결과(학습 데이터 양 증가) 65
      • 4.5.3 부트스트래핑 결과(양질의 의미별 연관단어 집합 생성) 66
      • 5. 결론 및 향후 연구 69
      • 參考文獻 70
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼