RISS 학술연구정보서비스

다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기


      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      • 무료
      • 기관 내 무료
      • 유료
      • In search of non-quantitative semiautomatic methods of collocations retrieval

        Piotr Wierzchon 아시아중동부유럽학회 2005 동유럽발칸학 Vol.7 No.1

        The article presents the semiautomatic method for excerption of collocations which cause most difficulties in translation practices. Due to the flectional features of the Polish language and the lack of homography of particular flection forms (biała niedziela, białej niedzieli, białe niedziele etc.), the quantitative methods such as T-score, Gravity Counts, Dice, Mutual Information etc. (cf. Daudaraviius, Marcinkeviien 2004) lose their value since their use depends on the use of a competent morphological analyzer lemmatizing all flection forms to dictionary entry forms (lemmas). In the case of an analysis of contemporary vocabulary, noting phenomena of real life, such a morphological pre-analysis will be significantly slowed down. Thus, it seems impossible to propose an optimal quantitative method, e.g. bigram (i.e. in which an observation of frequency of given lexical connections is used; cf. Stubbs 2002, Yamamoto, Church 2001) for an automatic excerption of lexical connections in highly flectional languages. The proposition presented in this text has a mainly lexicographical value and involves the use of a simplified filter applied on a corpus. This is an observation of two-, three- and four-word collocations preceded by the abbreviation tzw. (so-called) and limited on the right side by a punctuation mark (e.g. full stop, comma, semicolon etc.). The size of the corpus does not matter in our research. 본 논문은 번역에 있어서 어려움을 야기 시키는 collocation(복합 구문)의 반(半)자동적인 도출(導出) 방법에 대해 연구한 것이다. 폴란드어의 어형 변화와 biała niedziela, białej niedzieli, białe niedziele 같은 굴절형의 기본 동형(同形) 형태 부재로 T-score, Gravity Counts, Dice, Mutual Information등의 음량(音量) 방법은 사전에서 표제어가 되는 낱말의 이형, 변화형을 하나로 묶기 위해 분류를 하는 형태소 분석기에 의존하게 되면서 이용 가치가 없어졌다. 현대 어휘의 분석에 있어서, 선 형태소 분석이 세부적이지 못하듯이 실제로도 이것은 큰 영향을 주지 않는다. 이와 같이 심한 어형 변화를 하는 언어에 있어서 연결 어휘의 자동적인 도출을 위해 주어진 어휘 결합의 빈도수를 조사하는 bigram과 같은 최적 음량 방법의 제안은 불가능한 것처럼 보일 수 있다. 이 제안은 주로 텍스트에 적용되는 기본 필터를 사용해서 분석할 수 있는 방법을 사용했으며, 문장에서 주로 어휘적인 가치가 있다. 이것은 두 개, 세 개, 네 개의 복합 구문이 tzw.와 같이 약자로 표시되고, 약자의 오른쪽은 마침표, 쉼표, 세미콜론에 의해 한정되는 방법에 대한 연구이다. 텍스트의 크기는 본 연구에서 중요하지 않다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료
