RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 패턴 정보를 이용한 효모 관련 문서에서의 이벤트 자동 추출

        전홍우(Hongwoo Chun),황영숙(Youngsook Hwang),임해창(Haechang Rim) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.1B

        생명과학 관련 문서에서 자동으로 이벤트를 추출하는 것은 관련 연구자들의 연구에 많은 도움을 줄 수 있다. 본 논문에서는 생명과학 관련 문서 중 특히 효모와 관련된 문서를 대상으로 간단한 자연언어 처리 기술을 적용하여 유의미한 정보를 추출한 결과를 제시하고자 한다. 실험은 효모 관련 문서에서 고빈도의 이벤트 표현 동사에 대한 패턴 정보를 조사한 후, 패턴 정보에 의거하여 이벤트를 추출하였다. 평가 결과, 비교적 간단한 자연언어 처리 기술만으로도 유의미한 정보들을 추출할 수 있었다.

      • 기계학습과 사전을 이용한 개체명 세분화

        이기중(Kijoong Lee),이도길(Dogil Lee),임해창(Haechang Rim),임수종(Soojong Lim) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.1B

        개체명 인식은 효과적인 정보추출 시스템을 구축하기 위해 반드시 선행되어야 하는 작업이다. 지금까지의 개체명 인식에 관한 연구는 인명이나 조직, 장소와 같은 일반적인 개체명 인식 작업이 대부분이었다. 그러나, 효과적인 정보추출을 위해서는 이런 일반적인 개체명들을 더욱 세분화할 필요가 있다. 본 논문에서는 SVM기반 기계학습법과 기구축된 사전과의 편집거리 비교법을 이용하여 개체명을 세분화하는 방법을 제시한다. 실험은 개체명과 세분화된 범주가 부착된 공연 관련 문서 100개 중 80개는 학습집합, 20개는 실험집합으로 사용하였고 성능 평가 척도는 정확도(accuracy)를 이용해 개별적으로 평가하였다. 실험 결과 기계학습법과 사전을 이용한 방법을 결합한 모델이 가장 좋은 성능(정확도 72.91%)을 보였다.

      • 주변 문장 유사도를 이용한 문서 재사용 측정 모델

        최성원(Sungwon Choi),김상범(Sangbum Kim),임해창(Haechang Rim) 한국정보과학회 언어공학연구회 2005 한국정보과학회 언어공학연구회 학술발표 논문집 Vol.2005 No.10

        기존의 문서 재사용 탐지 모델은 문서 혹은 문장 단위로 그 내부의 단어 혹은 n-gram을 비교를 통해 문장의 재사용을 판별하였다. 그렇지만 문서 단위의 재사용 검사는 다른 문서의 일부분을 재사용하는 경우에 대해서는 문서 내에 문서 재사용이 이루어지지 않은 부분에 의해서 그 재사용 측정값이 낮아지게 되어 오류가 발생할 수 있는 가능성이 높아진다. 반면에 문장 단위의 문서 재사용 검사는 비교 문서 내의 문장들에 대한 비교를 수행하게 되므로, 문서의 일부분에 대해 재사용을 수행한 경우에도 그 재사용된 부분 내의 문장들에 대한 비교를 수행하는 것이므로 문서 단위의 재사용에 비해 그런 경우에 더 견고하게 작동된다. 그렇지만, 문장 단위의 비교는 문서에 비해 짧은 문장을 단위로 하기 때문에 그 신뢰도에 문제가 발생하게 된다. 본 논문에서는 이런 문장단위 비교의 단점을 보완하기 위해 문장 단위의 문서 재사용 검사를 수행 후, 문장의 주변 문장의 재사용 검사 결과를 이용하여 문장 단위 재사용 검사에서 일어나는 오류를 감소시키고자 하였다.

      • 대화적 질의 확장을 통해 의미적 용어불일치를 완화하는 정보검색 방안

        윤보현(BoHyun Yun),백대호(DaeHo Bcak),김상범(SangBum Kim),한경수(KyoungSoo Han),임해창(HaeChang Rim) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.1B

        색인어와 질의어간에 발생하는 의미적 용어불일치에 의해 정보검색시스템의 성능은 향상되기 어렵다. 동의어는 문서검색의 유사도 계산 과정에서 유사도 측정 기준을 과소 평가하는 경향이 있다. 아울러 한 단어가 여러 개의 의미를 가지는 다의어는 용어 매칭 과정에서 유사도 측정기준을 과대평가하는 경향이 있다. 본 논문에서는 대화적 질의 확장 방법으로 검색 전에 질의를 확장하는 용어제시와 검색 후에 질의를 확장하는 용어적합성피드백을 이용하여 의미적 용어불일치를 완화하는 정보 검색방안을 제안하고자 한다. 실험결과, 용어제시와 용어적합성피드백을 함께 사용한 방법이 가장 나은 성능을 보였다.

      • 결정적 구문 분석을 위한 문맥 의존 문법 규칙 획득 도구

        곽용재(YongJae Kwak),황영숙(YoungSook Hwang),박소영(SoYoung Park),정후중(HooJung Chung),임해창(HaeChang Rim) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.1B

        문맥을 고려하지 않는 CFG 규칙은 작성이 용이하지만 언어 생성에 한계가 있다. 이에 반해 CDG 규칙은 문맥을 고려하기 때문에 언어 생성 능력이 높은 반면 작성이 용이하지 않다. 기존 연구에서는 CDG 규칙을 수작업으로 획득함으로써 많은 시간과 인력이 요구되었다. 본 논문은 CDG 규칙 획득에 필요한 수작업을 최소화할 수 있는 도구를 제안한다. 제안된 도구는 중의성이 없는 경우를 탐지하여 자동으로 규칙을 획득함으로써 수작업을 최소화한다. 규칙 획득 실험 결과, 수동 규칙 획득 작업과 비교하여 약 70%의 수작업이 감소되었다.

      • KCI등재

        지배가능 경로 문맥을 이용한 의존 구문 분석의 수식 거리 모델

        우연문(YeonMoon Woo),송영인(YoungIn Song),박소영(SoYoung Park),임해창(HaeChang Rim) 한국정보과학회 2007 정보과학회논문지 : 소프트웨어 및 응용 Vol.34 No.2

        본 논문에서는 한국어 의존 구문 분석을 위한 새로운 확률 모델을 제안한다. 한국어가 자유 어순 언어라 할지라도 지역적 어순은 존재하기 때문에 의존관계를 결정하기 위해 의존하는 두 어절인 의존소와 지배소 사이의 수식 거리가 유용하다는 것은 이미 많은 연구를 통해 밝혀졌다. 본 연구에서는 수식거리의 정확한 수식 거리의 추정을 위해 지배가능 경로 문맥을 이용한 수식 거리 확률 모델을 제안한다. 수식 거리를 위해 지배가능 경로를 고려함으로써, 긴 표층 문맥을 압축하는 효과를 가져다 준다. 이를 통해 구문 분석 정확률 향상과 원거리 의존 관계 향상을 보임을 설명한다. 실험 및 평가를 통해 제안하는 모델의 구문 분석 성능은 86.9%이며, 기존에 제안된 구문 분석 모델과 비교하여 높은 구문 분석 결과를 보이며, 특히 원거리 의존관계에 대하여 더욱 향상된 성능을 보인다. This paper presents a statistical model for Korean dependency-based parsing. Although Korean is one of free word order languages, it has the feature of which some word order is preferred to local contexts. Earlier works proposed parsing models using modification lengths due to this property. Our model uses headible path contexts for modification length probabilities. Using a headible path of a dependent it is effective for long distance relation because the large surface context for a dependent are abbreviated as its headible path. By combined with lexical bigram dependency, our probabilistic model achieves 86.9% accuracy in eojoel analysis for KAIST corpus, more improvement especially for long distance dependencies.

      • KCI등재후보

        효율적인 질의 응답시스템 개발을 위한 BM25기반의 단락 검색 시스템

        임희석,이영신,임해창 한국컴퓨터교육학회 2003 컴퓨터교육학회 논문지 Vol.6 No.4

        본 논문은 문서 단위 보다 작은 단락 단위의 검색 시스템을 사용하는 효율적인 질의 응답 시스템 개발을 위하여 문서 검색에서 성능이 검증된 Okapi 시스템의 BM25 알고리즘을 응용한 단락 검색 시스템을 제안하고, 단락 검색 시스템의 성능을 분석하고자 한다. 100만 건의 문서로 구성된 TREC Q&A track 테스트 컬렉션을 색인에 사용하고 TREC Q&A track 질의 집합 중 1~100번까지의 질의를 사용하여 실험한 결과 재현율이 100%가 되기 위해서는 문서 검색은 약 12만 문장을 검색해야 하는 반면, 단락 검색에서는 문서 검색의 약 1/17인 1700문장만으로도 100%의 재현율을 얻을 수 있음을 확인하였다. This paper proposes a passage retrieval system based on Okapi’s BM25 for developing an efficient QA system and evaluates performances of the passage retrieval system. The test collection of TREC Q&A track which is composed of about one million documents was indexed and a hundred queries of TREC Q&A track are used as testing queries. The experimental results shows that the proposed passage retrieval system can reach to 100% recall rate by searching in only 1700 sentences while the conventional document retrieval system have to search about 120 thousands sentences which are about 70 times more than the proposed passage retrieval system.

      • 단위구문 인식에 기반한 견고한 구문 분석 기법

        황영숙,곽용재,박소영,정후중,임해창 고려대학교 컴퓨터과학기술연구소 2001 JOURNAL OF COMPUTER SCIENCE & ENGINEERING TECHNOLO Vol.3 No.-

        본 논문에서는 문법적 오류가 존재한다 할지라도 견고하게 문장을 분석할 수 있는 구문분석 기법을 제안한다. 제안된 구문 분석기는 부분 구문 분석기와 완전 구문 분석기로 구성되며, 부분 구문 분석기는 완전 구문 분석의 전처리로써 주어진 문장을 단위 구문들로 분할하고(Chunking), 완전 구문 분석기는 부분 구문 분석 결과를 입력 받아 문장의 완전한 구문 구조를 밝혀낸다. 부분 구문 분석기와의 결합은 완전 구문 분석만을 했을 때에 비해 구조적 중의성을 상당히 많이 감소시켜 줌으로써 처리속도를 현격하게 향상시켜 줄 뿐만 아니라, 완전 구문 분석에 실패한다 할지라도 부분 구문 분석의 결과를 이용하여 명사구나 동사구와 같은 중요 구문들을 높은 정확률과 함께 견고하게 추출할 수 있도록 해준다는 장점이 있다. 실험결과, 부분 구문 분석기는 전체 구문에 대해 93.19%의 정확률과 93.11%의 재현률을 보여 주었고, 단위구문 인식 결과를 입력으로 하는 완전 구문 분석기는 평균 0.039sec로 문장을 분석할 수 있음을 보여주었다. 이는 주어진 문장에 대해 문장의 완전한 구문구조를 밝혀내진 못한다 할지라도 93.19%의 정확률로 명사구나 동사구와 같은 중요 단위구문들을 추출할 수 있음을 의미한다. In this paper, we propose a robust parsing technique, which ran robustly analyze a given sentence even though the sentence contains some grammatical errors. The proposed parsing technique consists of a partial parser and a full parser. A partial parser segments a sentence into chunks as a usefule precursor of a full parser, and a full parser tries to analyze the structural relations among chunks resulted from the partial parser. Combining a partial parser with a full parser enables to reduce the structural ambiguities of the sentence and to do speed up of analyzing the sentence during the full parsing. Furthermore, with a high-performanced partial parsing results, the proposed parser takes an advantage of extracting important phrases such as noun phrases and/or verb phrases in a robust way even though a full parser ends in a failure. Experimental results show that the precision and recall of the partial parser are 93.19% and 93.11% and average processing speed of the full parser is 0.039sec/sentence. As a result, the proposed parsing technique has a power of extracting important phrases with a 93.19% precision although it fails to analyse a full structure of a sentence.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼