RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      한국어-영어/일본어-영어 교차언어정보검색에서 클러스터 분석을 통한 성능 향상 = Performance Improvement by Cluster Analysis in Korean-English and Japanese-English Cross-Language Information Retrieval

      한글로보기

      https://www.riss.kr/link?id=A103971883

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      This paper presents a method to implicitly resolve ambiguities using dynamic incremental clustering in Korean-to-English and Japanese-to-English cross-language information retrieval (CLIR). The main objective of this paper shows that document clusters can effectively resolve the ambiguities tremendously increased in translated queries as well as take into account the context of all the terms in a document. In the framework we propose, a query in Korean/Japanese is first translated into English by looking up bilingual dictionaries, then documents are retrieved for the translated query terms based on the vector space retrieval model or the probabilistic retrieval model. For the top-ranked retrieved documents, query-oriented document clusters are incrementally created and the weight of each retrieved document is re-calculated by using the clusters. In the experiment based on TREC test collection, our method achieved 39.41% and 36.79% improvement for translated queries without ambiguity resolution in Korean-to-English CLIR, and 17.89% and 30.46% improvements in Japanese-to-English CLIR, on the vector space retrieval and on the probabilistic retrieval, respectively. Our method achieved 12.30% improvements for all translation queries, compared with blind feedback in Korean-to-English CLIR. These results indicate that cluster analysis help to resolve ambiguity.
      번역하기

      This paper presents a method to implicitly resolve ambiguities using dynamic incremental clustering in Korean-to-English and Japanese-to-English cross-language information retrieval (CLIR). The main objective of this paper shows that document clusters...

      This paper presents a method to implicitly resolve ambiguities using dynamic incremental clustering in Korean-to-English and Japanese-to-English cross-language information retrieval (CLIR). The main objective of this paper shows that document clusters can effectively resolve the ambiguities tremendously increased in translated queries as well as take into account the context of all the terms in a document. In the framework we propose, a query in Korean/Japanese is first translated into English by looking up bilingual dictionaries, then documents are retrieved for the translated query terms based on the vector space retrieval model or the probabilistic retrieval model. For the top-ranked retrieved documents, query-oriented document clusters are incrementally created and the weight of each retrieved document is re-calculated by using the clusters. In the experiment based on TREC test collection, our method achieved 39.41% and 36.79% improvement for translated queries without ambiguity resolution in Korean-to-English CLIR, and 17.89% and 30.46% improvements in Japanese-to-English CLIR, on the vector space retrieval and on the probabilistic retrieval, respectively. Our method achieved 12.30% improvements for all translation queries, compared with blind feedback in Korean-to-English CLIR. These results indicate that cluster analysis help to resolve ambiguity.

      더보기

      국문 초록 (Abstract)

      본 논문에서는 교차언어정보검색에서 점진적 클러스터링을 통해서 모호성을 묵시적으로 해소하는 방법을 제안한다. 연구 목적은 질의 번역에서 모호성이 크게 증가된 상태에서 문서 클러스터가 문서 문맥 역할과 모호성 해소 역할을 하는지를 보고자 하는 것이다. 제안하는 방법은 한국어/일본어 질의를 사전을 이용하여 영어로 번역을 하고, 번역된 영어 질의에 대해서 벡터공간검색모델이나 확률검색모델에 의해서 문서를 검색한다. 검색된 문서의 순위대로 점진적 클러스터를 동적으로 생성하고, 이 클러스터 정보를 질의에 반영해서 문서의 순위를 다시 결정하는 것이다. TREC 테스트컬렉션을 이용한 실험에서 모호성 해소를 하지 않은 질의에 대해서, 제안한 방법은 한국어-영어 교차언어정보검색에서는 벡터공간검색모델에서 39.41%의 성능향상, 확률검색모델에서 36.79%의 성능향상을 보였다. 일-영 교차언어정보검색에서는 각각 17.89%와 30.46%의 성능향상을 보였다. 적합성 피드백 방법과의 비교에서는 모호성 해소를 하지 않은 경우 확률검색모델에서 12.30%의 성능향상을 보였다. 이를 통해, 클러스터 분석은 질의 모호성 해소에 도움을 주어서 검색성능 향상에 기여하였음을 알 수 있다.
      번역하기

      본 논문에서는 교차언어정보검색에서 점진적 클러스터링을 통해서 모호성을 묵시적으로 해소하는 방법을 제안한다. 연구 목적은 질의 번역에서 모호성이 크게 증가된 상태에서 문서 클러...

      본 논문에서는 교차언어정보검색에서 점진적 클러스터링을 통해서 모호성을 묵시적으로 해소하는 방법을 제안한다. 연구 목적은 질의 번역에서 모호성이 크게 증가된 상태에서 문서 클러스터가 문서 문맥 역할과 모호성 해소 역할을 하는지를 보고자 하는 것이다. 제안하는 방법은 한국어/일본어 질의를 사전을 이용하여 영어로 번역을 하고, 번역된 영어 질의에 대해서 벡터공간검색모델이나 확률검색모델에 의해서 문서를 검색한다. 검색된 문서의 순위대로 점진적 클러스터를 동적으로 생성하고, 이 클러스터 정보를 질의에 반영해서 문서의 순위를 다시 결정하는 것이다. TREC 테스트컬렉션을 이용한 실험에서 모호성 해소를 하지 않은 질의에 대해서, 제안한 방법은 한국어-영어 교차언어정보검색에서는 벡터공간검색모델에서 39.41%의 성능향상, 확률검색모델에서 36.79%의 성능향상을 보였다. 일-영 교차언어정보검색에서는 각각 17.89%와 30.46%의 성능향상을 보였다. 적합성 피드백 방법과의 비교에서는 모호성 해소를 하지 않은 경우 확률검색모델에서 12.30%의 성능향상을 보였다. 이를 통해, 클러스터 분석은 질의 모호성 해소에 도움을 주어서 검색성능 향상에 기여하였음을 알 수 있다.

      더보기

      참고문헌 (Reference)

      1 "한영 교차언어 정보검색 시스템에서 질의어의 모호성 해소와 병렬 코퍼스를 이용한 질의어 보완" 2000.

      2 "V. Translating collocations for bilingual lexicons" 22 (22): 1-38, 1996.

      3 "The Transformation, Analysis, and Retrieval of Information by Computer" Addison-Wesley 1989.

      4 "S. Okapi/Keenbow at TREC-8" In Proc. of the Eighth Text REtrieval Conference -8, 1999.

      5 "S. H. Using Mutual Information to Resolve Query Translation Ambiguities and Query Term Weighting" In Proc. of the 37th Annual Meeting of the Association for Computational Linguistics 1999.

      6 "S. Exploiting Clustering and Phrases for Context-Based Information Retrieval" In Proc. of 20th ACM SIGIR Conference 1997.

      7 "Resolving Ambiguity for Cross-language Retrieval" In proc. of 21rd ACM SIGIR Conference 1998.

      8 "Query Expansion Using Local^Global Document Analysis" In Proc. of the 19th ACM SIGIR Conference 1996.

      9 "P. Document Translation for the Cross-Language Text Retrieval at the University of Maryland" In Proc. of the Sixth Text Retrieval ConferenceIn Proc. of the Sixth Text Retrieval Conference 1997.

      10 "P. Cross- Language Information Retrieval with the UMLS Metathesaurus" In Proc. of the 21th ACM SIGIR Conference 1998.

      1 "한영 교차언어 정보검색 시스템에서 질의어의 모호성 해소와 병렬 코퍼스를 이용한 질의어 보완" 2000.

      2 "V. Translating collocations for bilingual lexicons" 22 (22): 1-38, 1996.

      3 "The Transformation, Analysis, and Retrieval of Information by Computer" Addison-Wesley 1989.

      4 "S. Okapi/Keenbow at TREC-8" In Proc. of the Eighth Text REtrieval Conference -8, 1999.

      5 "S. H. Using Mutual Information to Resolve Query Translation Ambiguities and Query Term Weighting" In Proc. of the 37th Annual Meeting of the Association for Computational Linguistics 1999.

      6 "S. Exploiting Clustering and Phrases for Context-Based Information Retrieval" In Proc. of 20th ACM SIGIR Conference 1997.

      7 "Resolving Ambiguity for Cross-language Retrieval" In proc. of 21rd ACM SIGIR Conference 1998.

      8 "Query Expansion Using Local^Global Document Analysis" In Proc. of the 19th ACM SIGIR Conference 1996.

      9 "P. Document Translation for the Cross-Language Text Retrieval at the University of Maryland" In Proc. of the Sixth Text Retrieval ConferenceIn Proc. of the Sixth Text Retrieval Conference 1997.

      10 "P. Cross- Language Information Retrieval with the UMLS Metathesaurus" In Proc. of the 21th ACM SIGIR Conference 1998.

      11 "K. S. Re-ranking model based on document clusters" 37 (37): 1-14, 2001.

      12 "J. O. Reexamining the Cluster Hypothesis" In Proc. of 19th ACM SIGIR Conference 1996.

      13 "J. Experiments Using the Lemur Toolkit" InProc. of the Tenth Text REtrieval Conference -10, 2001.

      14 "J. EDICT Japanese/English Dictionary File" The Electronic Dictionary Research and Development Group, Monash University 2003.

      15 "Information Retrieval" Butterworths 1979.

      16 "G. Querying across languages" In Proc. of the 19th ACM SIGIR Conference 1996.

      17 "G. B. Cross-Language Text Retrieval Based on Document Translation Using Japanese-to-Korean MT system" 1997.

      18 "F. An Approach to Conceptual Text Retrieval Using the EuroWordNet Multilingual Semantic Database" In Proc. of AAAI Spring Symposium on Cross-Language Text and Speech Retrieval 1997.

      19 "Automatic cross-language retrieval using latent semantic indexing" In Proc. of AAAI Symposium on Cross-Language Text and Speech Retrieval 1997.

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2027 평가예정 재인증평가 신청대상 (재인증)
      2021-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2018-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2015-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2012-10-31 학술지명변경 한글명 : 소프트웨어 및 데이터 공학 -> 정보처리학회논문지. 소프트웨어 및 데이터 공학 KCI등재
      2012-10-10 학술지명변경 한글명 : 정보처리학회논문지B -> 소프트웨어 및 데이터 공학
      외국어명 : The KIPS Transactions : Part B -> KIPS Transactions on Software and Data Engineering
      KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2006-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2003-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2002-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2000-07-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.35 0.35 0.28
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.23 0.19 0.511 0.06
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼