http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
효율적인 병렬정보검색을 위한 색인어 군집화 및 분산저장 기법
강재호,양재완,정성원,류광렬,권혁철,정상화 한국정보과학회 2003 정보과학회논문지 : 소프트웨어 및 응용 Vol.30 No.2
인터넷과 같은 대량의 정보에 대응할 수 있는 고성능 정보검색시스템을 구축하기 위해서는 지금까지 고가의 중대형컴퓨터를 주로 활용하여 왔으나, 최근 가격대 성능비가 높은 PC 클러스터 시스템을 활용하는 방안이 경제적인 대안으로 떠오르고 있다. PC 클러스터 상에서의 병렬정보검색시스템을 효율적으로 운영하기 위해서는 사용자가 입력한 질의를 처리하는데 요구되는 개별 PC의 디스크 I/O 및 검색관련 연산을 모든 PC에 가능한 균등하게 분배할 필요가 있다. 본 논문에서는 같은 질의에 동시에 등장할 가능성이 높은 색인어들끼리 군집화하고 생성된 군집을 활용하여 색인어들을 각 PC에 분배함으로써 보다 높은 수준의 병렬화를 달성할 수 있는 방안을 제시한다. 또한 일부 PC의 결함 또는 유지보수 등의 원인에 의한 서비스 중지상황에도 적극적으로 대처하기 위하여 색인어 역파일을 중복되게 분산저장하는 기법을 제안한다. 대용량 말뭉치를 활용한 실험결과 본 논문에서 제시하는 분산 및 중복저장기법이 충분한 효율성과 실용성이 있음을 확인하였다. The PC cluster architecture is considered as a cost-effective alternative to the existing supercomputers for realizing a high-performance information retrieval (IR) system. To implement an efficient IR system on a PC cluster, it is essential to achieve maximum parallelism by having the data appropriately distributed to the local hard disks of the PCs in such a way that the disk I/O and the subsequent computation are distributed as evenly as possible to all the PCs. If the terms in the inverted index file can be classified to closely related clusters, the parallelism can be maximized by distributing them to the PCs in an interleaved manner. One of the goals of this research is the development of methods for automatically clustering the terms based on the likelihood of the terms' co-occurrence in the same query. Also, in this paper, we propose a method for duplicate distribution of inverted index records among the PCs to achieve fault-tolerance as well as dynamic load balancing. Experiments with a large corpus revealed the efficiency and effectiveness of our method.
고온공기 공급에 따른 액체연료의 연소특성에 관한 실험적 연구
강재호,임인권 명지대학교 산업기술연구소 2001 産業技術硏究所論文集 Vol.20 No.-
An experiment on the combustion characteristics of pre-heated air combustion with oil fuel is performed. With the high-temperature air supply, although real air flow rates are less than that of stoichiometric condition, stable distribution of high-temperature combustion region is obtained with increase of flame intensity. The flame temperature with pre-heated air is much higher than reference where the air is not pre-heated. When pre-heated air is introduced in the chamber, the temperature distribution in the chamber is more uniform in a high level. CO emission is decreased, but NOx emission is increased compared to the flame in a reference, although the amount is small. It is found that with the use of pre-heated air, the flame intensity and combustion region can be extended due to increase of the combustion intensity and the air flow velocity.
[발표논문] 능동적 학습을 위한 뭉치 문서 예제의 활용
강재호,류광렬 한국지능정보시스템학회 2004 한국지능정보시스템학회 학술대회논문집 Vol.- No.-
본 논문에서는 문서 분류 (text classification) 문제에 능동적 학습(active learning) 기법을 적용하고자 할 때, 뭉치 문서 (bundled text) 를 훈련 예재 (training example)잉로 사용함으로써 효다 정확도가 높은 분류기(classifier)를 생성할 수 있는 방안을 제안한다. 뭉치 문서는 카테고리(category) 가 부여되지 않은 운서 들 중에서 능동적 학습이 사용자에게 카테고리 부여를 요청한 문의 (query) 운서와 가장 유사한 몇 개의 문서들을 종합한 가상의 문서이다. 뭉치 문서를 생성하는데 활용된 문서들은 분의 운서와 충분히 유사 하므로, 사용자에게 부여 받은 해당 푼의 문서의 카테고리를 뭉치 문서의 카테고리로 설정하여 학습을 위한 혼련 예제로 사용할 수 있다. 뭉치 문서는 동일한 카테고리에 속할 가능성이 갚은 여러 문서에 등장한 단어들을 많이 포함하므로 능동적 학습과 같이 작은 수의 판린 예제를 사용하여 학습하여야 하는 경우, 보다 정확도가 높은 분류기를 생성할 수 있게 한다. 유즈넷 뉴스 그룹 기사 분류 운재에 본 재안 방안을 적용하여 실험한 결과 능동적 학습의 성능을 일부 향상시킬 수 있음을 확인할 수 있었다.