RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 경험적 정보를 이용한 kNN 기반 한국어 문서 분류기의 개선

        임희석,남기춘 한국컴퓨터교육학회 2002 컴퓨터교육학회 논문지 Vol.5 No.3

        문서 자동 분류란 입력 문서에 이미 정해져 있는 특정 범주를 할당하는 작업을 의미하며 이는 문서의 효율적, 체계적 관리를 위하여 그 필요성이 증가하고 있는 실정이다. 현재 국내외에서 기계 학습 방법을 이용한 문서 자동 분류에 대한 연구가 활발히 진행되고 있으나 대부분의 연구는 문서 분류기의 성능 향상을 위한 새로운 학습 모델 제안과 학습 모델간의 상호 비교 연구에 치중되어 있으며 특정 학습 모델을 이용한 분류 시스템의 최적화나 개선 방안에 대한 연구는 다소 미흡한 실정이다. 이에 본 논문은 kNN 학습 방법을 이용한 문서 분류 시스템의 성능 향상에 중요한 역할을 하는 파라미터를 정의하고 실험을 통해서 얻은 경험적 정보를 이용한 한국어 문서 분류기 성능 개선 방안을 제안한다. 실험 결과, 이웃 문서들간의 유사도 가중치를 사용하는 분류 함수, 분류 정보를 이용한 자질 선택 방법, 그리고 전역적 분류 방법이 높은 성능을 보였고, 분류 영역에 따라 신중히 결정된 k값을 사용한 지역적 방법도 많은 계산량을 필요로 하는 전역적 방법과 유사한 성능을 보일 수 있음을 확인하였다. Automatic text classification is a task of assigning predefined categories to free text documents. Its importance is increased to organize and manage a huge amount of text data. There have been some researches on automatic text classification based on machine learning techniques. While most of them was focused on proposal of a new machine learning methods and cross evaluation between other systems, a through evaluation or optimization of a method has been rarely been done. In this paper, we propose an improving method of kNN-based Korean text classification system using heuristic informations about decision function, the number of nearest neighbor, and feature selection method. Experimental results showed that the system with similarity-weighted decision function, global method in considering neighbors, and DF/ICF feature selection was more accurate than simple kNN-based classifier. Also, we found out that the performance of the local method with well chosen k value was as high as that of the global method with much computational costs.

      • Fill Dam의 漏水原因과 遮水에 關한 硏究

        임희대,양재석 충남대학교 공업교육연구소 2001 論文集 Vol.24 No.1

        In general, leakage of fill dam causes not only fall in economic field in problem of storage efficiency but also collapse of embankment dams. This leakage path can be embankment dams, joining part between embankment dams and foundation ground and foundation ground. Fissure which nearly happens in embankment dams, one of leakage causes of fill dam turned out that load transfer by differential settlement between different core and rip rap with each other is chief cause offerer. This phenomenon turned out to be so dangerous in early containing water. Futhermore, it induces hydraulic fracturing and has considerable influence on stability of embankment dams. Hydraulic fracturing is that fissure happens either in rock mass or internal embankment dams by hydraulic pressure and when dam is filled with water, means that core is torn horizontally by hydraulic pressure. Initial proposed mechanisms of hydraulic fracturing are for the most part supposed things in the process for investigating either leakage or cause of failure by internal erosion and are considerably qualitative but since finite element in moving analysis is used, have begun to be analyzed quantitatively. In this paper, the cause of leakage and the process of occurrence of leakage are examined, and measures which can predict and prevent leakage in advance is presented. Also a impervious method improved is presented after investigation of the methods which have been applied to fill dam to cut off leakage. As an impervious method, grouting after grasping the cause of leakage and flow channel with geophysical investigation is better efficient than only to reinforce part in which erosion or fissure happens.

      • KCI등재후보

        예제기반 한국어 표준 산업/직업 코드 분류

        임희석(Lim, Heui-Seok) 한국산학기술학회 2006 한국산학기술학회논문지 Vol.7 No.4

        통계청에서 실시하는 통계 조사에는 한국 표준 산업/직업 분류 코드를 작성하는 작업이 많이 포함되는데, 현재 대부분의 코드 분류 작업은 수작업으로 이루어지고 있으며, 이로 인하여 막대한 노동력과 비용이 소모되고 작업 결과의 일관성을 유지하기 어렵다는 문제점이 있다. 본 논문은 수동 코드 분류 규칙과 예제기반의 자동 학습을 이용 하는 한국어 표준 산업/직업 코드 자동 분류 시스템을 제안한다, 제안된 시스템은 산업과 직업에 대하여 설명하는 자연어를 입력받아 해당 산업/직업 분류 코드를 생성하는 시스템으로 수작업으로 구축된 규칙을 적용한 후 규칙이 적용 되지 않는 레코드는 예제 기반의 학습을 이용한 자동 분류 시스템에 의해서 해당 코드를 할당한다. 수작업 규칙 260여개와 40만여개의 예제를 이용하여 학습한 시스템에 대하여 실험한 결과 제안한 시스템은 직업 코드 분류에서 76.69% 그리고 산업 코드 분류에서는 99.68%의 정확도를 보였다. Coding of occupational and industrial codes is a major operation in census survey of Korean statistics bureau. The coding process has been done manually. Such manual work is very labor and cost intensive and it usually causes inconsistent results. This paper proposes an automatic coding system based on example-based learning. The system converts natural language input into corresponding numeric codes using code generation system trained by example-based learning after applying manually built rules. As experimental results performed with training data consisted of 400,000 records and 260 manual rules, the proposed system showed about 76.69% and 99.68% accuracy for occupational code classification and industrial code classification, respectively.

      • 표준 통계 분류 코드 자동 생성

        임희석(Lim Heui-Seok) 한국산학기술학회 2006 한국산학기술학회 학술대회 Vol.- No.-

        본 논문은 수동 코드 분류 규칙과 예제기반의 자동 학습을 이용하는 한국어 표준 산업/직업 코드 자동분류 시스템을 제안한다. 제안된 시스템은 산업과 직업에 대하여 설명하는 자연어를 입력받아 해당 산업/직업 분류 코드를 생성하는 시스템으로 수작업으로 구축된 규칙을 적용한 후 규칙이 적용되지 않는 레코드는 예제 기반의 학습을 이용한 자동 분류 시스템에 의해서 해당 코드를 할당한다.

      • KCI우수등재

        배제 정보를 이용한 효율적인 한국어 형태소 분석기

        임회석(Heui-Seok Lim),윤보현(Bo-Hyun Yun),임해창(Hae-Chang Rim) 한국정보과학회 1995 정보과학회논문지 Vol.22 No.6

        The existing Korean morphological analyzers generate all the possible candidates only to accept the correct candidates, creating significant amount of implausible candidates. Hence the string processing time and the dictionary access frequency in analyzing a word are aggravated. To lower the above inefficiency, this paper proposes the efficient Korean morphological analyzer using exclusive information, which represents the exclusive relation between specific phoneme, specific syllable, specific string and each part of speech. We discuss how it can reduce the implausible candidates in analyzing a word. The result of the experiment showed that Korean morphological analyzer using exclusive information decreased the dictionary access frequency about 40.16% in comparison with others by reducing the implausible candidates. 모든 형태소 결합을 찾아내는 기존의 한국어 형태소 분석 방법은 후보 생성 과정에서 불필요한 분석 후보를 생성하여 문자열 처리 시간과 사전 탐색 횟수를 가중시키는 단점이 있다. 본 논문은 이러한 비효율성을 감소시키기 위하여 배제 정보(Exclusive Information)를 이용한 효율적인 한국어 형태소 분석 방법을 제안한다. 배제 정보는 음소, 음절, 문자열 각각과 특정 품사와의 배제 관계를 나타내는 정보이다. 배제 정보를 이용한 형태소 분석 시스템은 필요 없는 분석 후보 생성을 감소시키므로 효율적인 분석을 수행한다. 한국어 어절 약 30만개에 대해서 실험한 결과, 본 논문에서 제시한 배제 정보를 이용한 한국어 형태소 분석 시스템은 분석 후보의 생성을 줄임으로 기존의 시스템보다 사전 탐색 횟수를 약 40.16% 감소시킬 수 있었다.

      • 형태소 분석 단계에서 발생하는 어절의 중의성 분석 방안

        임희석(Heui-Seok Lim),이호(Ho Lee),임혜창(Hae-Chang Rim) 한국정보과학회 1993 한국정보과학회 학술발표논문집 Vol.20 No.1

        현재까지 국내에서 개발된 한국어 형태소 분석기들은 대부분 철자 검사기나 정보검색 시스템 등의 특정 응용분야만을 위한 것들이어서 한 어절의 모든 가능한 형태소 결합중에서 하나만을 그 분석 결과로 채택한다. 그러나 자연어는 그 특성상 많은 중의성을 포함하고 있으므로 자연어의 정확한 해석을 위해서는 형태소 분석 단계에서부터 어절의 가능한 모든 중의성을 분석하여야 하며 자연어 해석에 사용 될 적당한 형태소 결합을 선택할 수 있을 때까지 또는 불필요한 형태소 결합을 제거할 수 있는 정보가 제공될 때까지 중의성이 유지되어야 한다. 따라서 본 논문에서는 한국어 형태소 분석 단계에서 어절의 모든 가능한 중의성을 분석하기 위하여 형태소 분석 단계에서 발생하는 어절의 중의성을 유형별로 나누고 그 분석 방안을 제안한다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼