RISS 학술연구정보서비스

다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      • 무료
      • 기관 내 무료
      • 유료
      • 통계 정보와 언어 지식의 보완적 특성을 고려한 혼합형 품사 태깅

        임희석(Heui Seok Lim),김진동(Jin Dong Kim),임해창(Hae Chang Rim) 한국정보과학회 1998 정보과학회논문지(B) Vol.25 No.11

        기존의 규칙 기반 품사 태깅 시스템은 규칙이 적용되는 언어 현상에 대해서 매우 높은 정확률을 보이나 처리 범위가 제한적이다. 반면 통계 기반 품사 태깅 시스템은 규칙 기반 품사 태깅 시스템보다 처리 범위가 넓고 견고하다는 장점을 갖지만, 규칙 기반 품사 태깅보다 정확률이 떨어진다는 단점이 지적되고 있다. 이에 본 논문은 통계 기반 품사 태깅과 규칙 기반 품사 태깅의 보완적 특성을 이용한 혼합형 품사 태깅 방법을 제안한다. 제안한 방법은 규칙에 의한 품사 태깅 결과를 선호함으로써 규칙이 적용되는 언어 현상에 대해서 높은 정확률을 유지하며 중의성이 해결되지 않은 어절에는 통계 정보에 의한 품사 태깅 결과를 할당함으로써 처리 범위와 견고성을 유지할 수 있다. 본 논문은 제안한 품사 태깅 방법으로 한국어 품사 태깅 시스템을 구현하였고, 이를 2만 어절 크기의 코퍼스에 대하여 실험하였다. 실험 결과, 구현된 품사 태깅 시스템은 통계 기반 품사 태깅 시스템의 처리 범위를 유지하면서 통계 기반 품사 태깅 시스템의 오류를 32.70%만큼 감소시킨 95.43%의 정확률을 보였다. The rule-based part-of-speech(POS) tagger is very accurate where rules are applied but its coverage is often limited to some core linguistic phenomena. To the contrast, while the probabilistic POS tagger is robust and extensive to various linguistic phenomena, the accuracy is lower than the rule-based POS tagger. In this paper, we propose a hybrid POS tagging method combining those complemental characteristics of the rule-based and the probabilistic POS tagger. By preferring the linguistic knowledge to stochastic information, the proposed method can keep the accuracy of the rule-based tagger. Also it has robustness and coverage of the probabilistic POS tagger by assigning a unique tag for the word whose ambiguity is not fully resolved by linguistic knowledge. A Korean POS tagger using the proposed method was implemented and experimented on the 20K Eojeol-sized open test corpus. As a result, the experiment result showed that the tagger had the accuracy of 95.43%, which reduced the error rate of the probabilistic tagger about 32.70%. Also, It is proved that the tagger is as robust and extensive as the probabilistic POS tagger.

      • KCI등재후보

        계산주의적 시각단어재인 모델에서의 시각이웃과 음운이웃 효과

        임희석(Lim, Heui-Seok),박기남(Park, Ki-Nam),남기춘(Nam, Ki-Chun) 한국산학기술학회 2007 한국산학기술학회논문지 Vol.8 No.4

        본 논문은 인간의 언어정보처리 과정 중 시각단어재인(visual word recognition) 과정에서 음운정보 (phonological information)와 철자정보(orthography information)의 역할 및 심성어휘집의 표상(representation) 형태를 알아보기 위해 신경망(neural network)을 이용한 계산주의적 모델(computational model)을 제안한다. 제안하는 모델은 한국어 2음절을 입력 값으로 사용하는 입력층(input layer), 은닉층(hidden layer) 그리고 의미를 표현하는 출력층(output layer)으로 구성된 전방향 신경회로망(feed forward network) 구조로 설계하였다. 실험결과 계산주의적 모델은 한국어에 대한 시각 단어재인 시 보이는 언어현상 중 음운, 철자 이웃 크기효과(phonological and orthographic neighborhood effect)를 나타냈으며, 이를 통해 한국어 시각난어재인 과정에서 심성어휘집이 음운정보로 표상되어 있음을 시사하는 증거를 보였다. This study suggests a computational model to inquire the roles of phonological information and orthography information in the process of visual word recognition among the courses of language information processing, and the representation typcs of the mental lexicon. The model that this study is presenting here was designed as a feed forward network structure which is comprised of input layer which uses two Korean syllables as its input value, hidden layer, and output layer which express meanings. As the result of the study, the computational model showed the phonological and orthographic neighborhood effect among language phenomena which are shown in Korean word recognition, and showed proofs which implies that the mental lexicon is represented as phonological information in the process of Korean word recognition.

      • KCI등재

        실시간 인력기반 질의응답 시스템

        임희석(Lim, Heui-Seok),류기곤(Lyu, Ki-Gon) 한국산학기술학회 2008 한국산학기술학회논문지 Vol.9 No.3

        본 논문은 기존의 정보검색 시스템의 컴색 결과에 비연관 문헌이 포함되는 단점과 질의응답 시스템이 가지는 자연어처리 기술의 한계를 극복하고, 사용자의 정보 요구에 실시간으로 정보를 제공하며 사용자의 참여를 적극 활용하여 웹2.0 환경으로의 변화에 적응할 수 있는 실시간 인력기반 질의응답 시스템을 제안한다. This research suggests real-time people-powered Q&A system that overcoming limitation of natural language handling technology that Q&A system has and demerits that unrelated documents are included in the results of searching in existing information retrieval system and can adapt to change to Web2.0 environment by actively applying users' participation and providing real-time information to users' request of information.

      • KCI등재후보

        예제기반 한국어 표준 산업/직업 코드 분류

        임희석(Lim, Heui-Seok) 한국산학기술학회 2006 한국산학기술학회논문지 Vol.7 No.4

        통계청에서 실시하는 통계 조사에는 한국 표준 산업/직업 분류 코드를 작성하는 작업이 많이 포함되는데, 현재 대부분의 코드 분류 작업은 수작업으로 이루어지고 있으며, 이로 인하여 막대한 노동력과 비용이 소모되고 작업 결과의 일관성을 유지하기 어렵다는 문제점이 있다. 본 논문은 수동 코드 분류 규칙과 예제기반의 자동 학습을 이용 하는 한국어 표준 산업/직업 코드 자동 분류 시스템을 제안한다, 제안된 시스템은 산업과 직업에 대하여 설명하는 자연어를 입력받아 해당 산업/직업 분류 코드를 생성하는 시스템으로 수작업으로 구축된 규칙을 적용한 후 규칙이 적용 되지 않는 레코드는 예제 기반의 학습을 이용한 자동 분류 시스템에 의해서 해당 코드를 할당한다. 수작업 규칙 260여개와 40만여개의 예제를 이용하여 학습한 시스템에 대하여 실험한 결과 제안한 시스템은 직업 코드 분류에서 76.69% 그리고 산업 코드 분류에서는 99.68%의 정확도를 보였다. Coding of occupational and industrial codes is a major operation in census survey of Korean statistics bureau. The coding process has been done manually. Such manual work is very labor and cost intensive and it usually causes inconsistent results. This paper proposes an automatic coding system based on example-based learning. The system converts natural language input into corresponding numeric codes using code generation system trained by example-based learning after applying manually built rules. As experimental results performed with training data consisted of 400,000 records and 260 manual rules, the proposed system showed about 76.69% and 99.68% accuracy for occupational code classification and industrial code classification, respectively.

      • 스마트 교육을 위한 세계의 ICT 활용 동향

        임희석(Heui-Seok Lim),유길상(Kil-Sang Yoo) 한국정보기술학회 2012 한국정보기술학회지 Vol.10 No.1

        기술 발달로 인하여 교육계획 수립, 학습 과정, 모니터링 등이 보다 효율적으로 이루어지고 있다. 세계의 여러 나라에서는 교육정보화의 중요성에 대하여 인식하고 첨단 ICT 활용 교육을 전략적으로 추진하기 위한 계획과 스마트 교육전략을 추진하고 있다. 차세대 스마트 교육의 일환으로 추진되어야 할 학습 시스템의 방향과 인터넷과 디지털 기술을 활용하여 학습과정의 효율성을 높이기 위하여 이에 대한 서비스계획과 국가 차원에서 이루어지는 각국의 전략과 문제점 그리고 스마트교육이 나아가야 할 방향을 살펴본다.

      • KCI등재

        언어생활을 반영한 지능적 끝말잇기 프로그램 구현

        임희석(Lim, Heui-Seok) 한국산학기술학회 2008 한국산학기술학회논문지 Vol.9 No.1

        본 논문은 한국어의 사용 패턴을 고려한 지능적 끝말잇기 프로그램을 구현하였다. 끝말잇기 프로그램은 뇌손상 등을 통한 실어증 환자나 언어 능력 발달이 상대적으로 낮은 아동들의 언어 능력을 진단하고, 재미있게 재활치료를 하는데 기여할 수 있다. 하지만 컴퓨터는 사람과 비교하여 대용량의 단어 목록을 기억하기에 유리하므로 끝말잇기 프로그램에서 컴퓨터는 훨씬 유리한 조건이다. 따라서 컴퓨터의 보유 단어 목록에서 임의의 끝말을 생성하는 끝말잇기 프로그램은 지능적인 게임의 상대자로 부적합하며 게임자의 의욕을 저하시킬 수 있다. 게임자의 단어 사용 수준에 따라 컴퓨터의 대답의 난이도를 조절하고, 실제 언어생활의 사용 패턴을 반영한 끝말잇기 프로그램은 게임자로 하여금 컴퓨터 상대방이 사람인 것처럼 느끼게 할 수 있으며, 이를 통하여 끝말잇기 프로그램을 지속시킬 수 있다. An word relay game contributes to rehabilitation and treatment of language disorders such as aphasia. As a computer is better than human in memorizing very large vocabularies, the computer has much advantage over people in word relay game. Such the game result in decrease the motivation of players and patients in treatment of language disorders. To make people to continue word relay and to be effective to remedy language disorders, the game need to be intelligent and familar with a person. This paper proposes an implementation of intelligent Korean word relay game, which considers characteristics of Korean word usage patterns. The gaem is intelligent in constructing vocabulary database and choosing an answer considering the level of player.

      • 형태소 분석 단계에서 발생하는 어절의 중의성 분석 방안

        임희석(Heui-Seok Lim),이호(Ho Lee),임혜창(Hae-Chang Rim) 한국정보과학회 1993 한국정보과학회 학술발표논문집 Vol.20 No.1

        현재까지 국내에서 개발된 한국어 형태소 분석기들은 대부분 철자 검사기나 정보검색 시스템 등의 특정 응용분야만을 위한 것들이어서 한 어절의 모든 가능한 형태소 결합중에서 하나만을 그 분석 결과로 채택한다. 그러나 자연어는 그 특성상 많은 중의성을 포함하고 있으므로 자연어의 정확한 해석을 위해서는 형태소 분석 단계에서부터 어절의 가능한 모든 중의성을 분석하여야 하며 자연어 해석에 사용 될 적당한 형태소 결합을 선택할 수 있을 때까지 또는 불필요한 형태소 결합을 제거할 수 있는 정보가 제공될 때까지 중의성이 유지되어야 한다. 따라서 본 논문에서는 한국어 형태소 분석 단계에서 어절의 모든 가능한 중의성을 분석하기 위하여 형태소 분석 단계에서 발생하는 어절의 중의성을 유형별로 나누고 그 분석 방안을 제안한다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료
