RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      기계번역을 이용한 교차언어 문서 범주화의 분류 성능 분석 = Classification Performance Analysis of Cross-Language Text Categorization using Machine Translation

      한글로보기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      Cross-language text categorization(CLTC) can classify documents automatically using training set from other language. In this study, collections appropriated for CLTC were extracted from KTSET. Classification performance of various CLTC methods were compared by SVM classifier using machine translation. Results showed that the classification performance in the order of poly-lingual training method, training-set translation and test-set translation. However, training-set translation could be regarded as the most useful method among CLTC, because it was efficient for machine translation and easily adapted to general environment. On the other hand, low performance was shown to be due to the feature reduction or features with no subject characteristics, which occurred in the process of machine translation of CLTC.
      번역하기

      Cross-language text categorization(CLTC) can classify documents automatically using training set from other language. In this study, collections appropriated for CLTC were extracted from KTSET. Classification performance of various CLTC methods were c...

      Cross-language text categorization(CLTC) can classify documents automatically using training set from other language. In this study, collections appropriated for CLTC were extracted from KTSET. Classification performance of various CLTC methods were compared by SVM classifier using machine translation. Results showed that the classification performance in the order of poly-lingual training method, training-set translation and test-set translation. However, training-set translation could be regarded as the most useful method among CLTC, because it was efficient for machine translation and easily adapted to general environment. On the other hand, low performance was shown to be due to the feature reduction or features with no subject characteristics, which occurred in the process of machine translation of CLTC.

      더보기

      국문 초록 (Abstract)

      교차언어 문서 범주화(CLTC)는 다른 언어로 된 학습집단을 이용하여 문헌을 자동 분류할 수 있다. 이 연구는 KTSET으로부터 CLTC에 적합한 실험문헌집단을 추출하고, 기계 번역기를 이용하여 가능한 여러 CLTC 방법의 분류 성능을 비교하였다. 분류기는 SVM 분류기를 이용하였다. 실험 결과, CLTC 중에 다국어 학습방법이 가장 좋은 분류 성능을 보였으며, 학습집단 번역방법, 검증집단 번역방법 순으로 분류 성능이 낮아졌다. 하지만 학습집단 번역방법이 기계번역 측면에서 효율적이며, 일반적인 환경에 쉽게 적용할 수 있고, 비교적 분류 성능이 좋아 CLTC 방법 중에서 가장 높은 이용 가능성을 보였다. 한편 CLTC에서 기계번역을 이용하였을 때 번역과정에서 발생하는 자질축소나 주제적 특성이 없는 자질로의 번역으로 인해 성능 저하를 가져왔다.
      번역하기

      교차언어 문서 범주화(CLTC)는 다른 언어로 된 학습집단을 이용하여 문헌을 자동 분류할 수 있다. 이 연구는 KTSET으로부터 CLTC에 적합한 실험문헌집단을 추출하고, 기계 번역기를 이용하여 가...

      교차언어 문서 범주화(CLTC)는 다른 언어로 된 학습집단을 이용하여 문헌을 자동 분류할 수 있다. 이 연구는 KTSET으로부터 CLTC에 적합한 실험문헌집단을 추출하고, 기계 번역기를 이용하여 가능한 여러 CLTC 방법의 분류 성능을 비교하였다. 분류기는 SVM 분류기를 이용하였다. 실험 결과, CLTC 중에 다국어 학습방법이 가장 좋은 분류 성능을 보였으며, 학습집단 번역방법, 검증집단 번역방법 순으로 분류 성능이 낮아졌다. 하지만 학습집단 번역방법이 기계번역 측면에서 효율적이며, 일반적인 환경에 쉽게 적용할 수 있고, 비교적 분류 성능이 좋아 CLTC 방법 중에서 가장 높은 이용 가능성을 보였다. 한편 CLTC에서 기계번역을 이용하였을 때 번역과정에서 발생하는 자질축소나 주제적 특성이 없는 자질로의 번역으로 인해 성능 저하를 가져왔다.

      더보기

      참고문헌 (Reference)

      1 김성혁, "자동색인기 성능시험을 위한 Test Set 개발" 11 (11): 81-102, 1994

      2 Amine, B. M, "Word-Net based Cross-Language Text Categorization" 848-855, 2007

      3 Vapnik, V. N, "The nature of statistical learning theory. 2nd ed" Springer 2000

      4 Vapnik, V. N, "The Nature of Statistical Learning Theory" Springer 1995

      5 Joachims, T, "Text categorization with Support Vector Machines: Learning with many relevant features" 137-142, 1998

      6 Kishida, K, "Technical issues of crosslanguage information retrieval: a review" 41 : 433-455, 2005

      7 Melo, G, "Multilingual text classification using ontologies" 541-548, 2007

      8 Peters, C, "Multilingual information access"

      9 Adeva, J, "Multilingual Approaches to Text Categorisation" 6 (6): 43-51, 2005

      10 Chang, C, "LIBSVM : a library for support vector machines"

      1 김성혁, "자동색인기 성능시험을 위한 Test Set 개발" 11 (11): 81-102, 1994

      2 Amine, B. M, "Word-Net based Cross-Language Text Categorization" 848-855, 2007

      3 Vapnik, V. N, "The nature of statistical learning theory. 2nd ed" Springer 2000

      4 Vapnik, V. N, "The Nature of Statistical Learning Theory" Springer 1995

      5 Joachims, T, "Text categorization with Support Vector Machines: Learning with many relevant features" 137-142, 1998

      6 Kishida, K, "Technical issues of crosslanguage information retrieval: a review" 41 : 433-455, 2005

      7 Melo, G, "Multilingual text classification using ontologies" 541-548, 2007

      8 Peters, C, "Multilingual information access"

      9 Adeva, J, "Multilingual Approaches to Text Categorisation" 6 (6): 43-51, 2005

      10 Chang, C, "LIBSVM : a library for support vector machines"

      11 Taira, H, "Feature selection in SVM text categorization" 480-486, 1999

      12 Oard, D. W, "Crosslanguage information retrieval" 33 : 223-256, 1998

      13 Bel, N, "Cross-Lingual Text Categorization" 126-139, 2003

      14 Gliozzo, A. M, "Cross language text categorization by acquiring multilingual domain models from comparable corpora" 9-16, 2005

      15 Cristianini, N, "An Introduction to Support Vector Machines and Other Kernel-based Learning Methods" Cambridge University Press 2000

      16 Rigutini, L, "An EM based training algorithm for Cross- Language Text Categorization" 529-535, 2005

      17 Yang, Y, "A re-examination of text categorization methods" 42-49, 1999

      18 Wu, K, "A Refinement Framework for Cross Language Text Categorization" 15-18, 2008

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2023 평가예정 계속평가 신청대상 (등재유지)
      2018-01-01 평가 우수등재학술지 선정 (계속평가)
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2013-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2006-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2004-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2001-07-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      1999-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.59 0.59 0.68
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.69 0.67 0.952 0.33
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼