RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      자율 학습을 이용한 선형 정렬 말뭉치 구축 = Construction of Linearly Aliened Corpus Using Unsupervised Learning

      한글로보기

      https://www.riss.kr/link?id=A103972547

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      본 논문에서는 자율 선형 정렬 알고리즘을 이용하여 선형 정렬 말뭉치를 구축하는 방법을 제안한다. 기존의 자율 선형 정렬 알고리즘을 이용하여 선형 정렬 말뭉치를 구축할 경우, 두 문자...

      본 논문에서는 자율 선형 정렬 알고리즘을 이용하여 선형 정렬 말뭉치를 구축하는 방법을 제안한다. 기존의 자율 선형 정렬 알고리즘을 이용하여 선형 정렬 말뭉치를 구축할 경우, 두 문자열의 길이가 서로 다르면 정렬된 두 문자열(입력열과 출력열)에 모두 공백문자가 나타난다. 이 방법을 그대로 사용하면 정렬 말뭉치의 구축은 용이하나 정렬된 말뭉치를 이용하는 응용 시스템에서는 탐색 공간이 기하급수적으로 늘어날 뿐 아니라 구축된 정렬 말뭉치는 다양한 기계학습 방법에 두루 사용될 수 없다는 문제가 있다. 본 논문에서는 이들 문제를 최소화하기 위해서 입력열에는 공백문자가 나타나지 않도록 기존의 자율 선형 정렬 알고리즘을 수정하였다. 이 알고리즘을 이용해서 한영 음차 표기 및 복원, 영어 단어의 발음 생성, 영어 발음의 단어 생성, 한국어 형태소 분리 및 복원을 위한 정렬 말뭉치를 구축하였으며, 간단한 실험을 통해, 그들의 실용성을 입증해 보였다.

      더보기

      다국어 초록 (Multilingual Abstract)

      In this paper, we propose a modified unsupervised linear alignment algorithm for building an aligned corpus. The original algorithm inserts null characters into both of two aligned strings (source string and target string), because the two strings are...

      In this paper, we propose a modified unsupervised linear alignment algorithm for building an aligned corpus. The original algorithm inserts null characters into both of two aligned strings (source string and target string), because the two strings are different from each other in length. This can cause some difficulties like the search space explosion for applications using the aligned corpus with null characters and no possibility of applying to several machine learning algorithms. To alleviate these difficulties, we modify the algorithm not to contain null characters in the aligned source strings. We have shown the usability of our approach by applying it to different areas such as Korean-English back-transliteration, English grapheme-phoneme conversion, and Korean morphological analysis.

      더보기

      참고문헌 (Reference)

      1 "한국어에서의 품사 부착 말뭉치의 작성 요령" 1995.

      2 "표준대국어사전" (주)두산동아 2000

      3 "다국어 정보검색을 위한 영-한 음차 표기 및 복원 모델" 1999.

      4 "Two-Level 한국어 형태소 해석" 1992.

      5 "The use of tree-trellis search for large-vocabulary mandarin polysyllabic word speech recognition" 39-50, 1994.

      6 "T. M. Machine Learning" McGraw-Hill 1997.

      7 "PC-KIMMO:A Two-level Processor for Morphological Analysis Summer Institute of Linguistics" 1990.

      8 "Learning String Edit Distance" 20 (20): 522-532, 1998.

      9 "Hidden Markov models in computational biology" 235 : 1501-1531, 1994.

      10 "H. Foundations of Statistical Natural Language Processing" The MIT Press 1999.

      1 "한국어에서의 품사 부착 말뭉치의 작성 요령" 1995.

      2 "표준대국어사전" (주)두산동아 2000

      3 "다국어 정보검색을 위한 영-한 음차 표기 및 복원 모델" 1999.

      4 "Two-Level 한국어 형태소 해석" 1992.

      5 "The use of tree-trellis search for large-vocabulary mandarin polysyllabic word speech recognition" 39-50, 1994.

      6 "T. M. Machine Learning" McGraw-Hill 1997.

      7 "PC-KIMMO:A Two-level Processor for Morphological Analysis Summer Institute of Linguistics" 1990.

      8 "Learning String Edit Distance" 20 (20): 522-532, 1998.

      9 "Hidden Markov models in computational biology" 235 : 1501-1531, 1994.

      10 "H. Foundations of Statistical Natural Language Processing" The MIT Press 1999.

      11 "E. A. A Learning Approach for Designing Dynamic Programming Algorithms" 2000.

      12 "Comptession and Approximate Matching" 42 (42): 1-10, 1999.

      13 "Building a large annotated corpus of English" 19 (19): 313-330, 1993.

      14 "An Introduction to Natural Language Processing Computational Linguistics, and Speech Recognition" Prentice-Hall 2000.

      15 "A tutorial on support vector machines for pattern recognition" 2 (2): 1998.

      16 "A tutorial on hidden Markov models and selected application in speech recognition Proceedings of the IEEE" 257-286, 1989

      17 "21세기 세종계획 성과발표 및 토론회 자료집" 2004.

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2027 평가예정 재인증평가 신청대상 (재인증)
      2021-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2018-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2015-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2012-10-31 학술지명변경 한글명 : 소프트웨어 및 데이터 공학 -> 정보처리학회논문지. 소프트웨어 및 데이터 공학 KCI등재
      2012-10-10 학술지명변경 한글명 : 정보처리학회논문지B -> 소프트웨어 및 데이터 공학
      외국어명 : The KIPS Transactions : Part B -> KIPS Transactions on Software and Data Engineering
      KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2006-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2003-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2002-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2000-07-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.35 0.35 0.28
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.23 0.19 0.511 0.06
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼