http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
ManBIF: a Program for Mining and Managing Biobank Impact Factor Data
유기진,남정민,허윤,추민석,서형석,김준우,전재필,박혜경,박기정 한국유전체학회 2011 Genomics & informatics Vol.9 No.1
Biobank Impact Factor (BIF), which is a very effective criterion to evaluate the activity of biobanks, can be estimated by the citation information of biobanks from scientific papers. We have developed a program, ManBIF, to investigate the citation information from PDF files in the literature. The program manages a dictionary for expressions to represent biobanks and their resources, mines the citation information by converting PDF files to text files and searching with a dictionary, and produces a statistical report file. It can be used as an important tool by biobanks.
유기진,이영석,이헌규 한국디지털콘텐츠학회 2019 한국디지털콘텐츠학회논문지 Vol.20 No.12
As companion animals increase, there is a need for an institutional strategy to reduce health care costs for animals through frequent monitoring of health status and preliminary determination of disease status. In this paper, we propose an artificial intelligence (AI) system that analyzes the major diseases of dogs by breed, gender and life cycle using electronic medical record (EMR) data of animal hospitals. The system includes a frequent pattern analysis model that enables the extraction of highly correlated medical information from breed, gender, life cycle, disease and prescription information, and a Deep Belief Network (DBN) model that can automatically predict the life cycle that affects the diagnosis of a animal's disease. EMR data, a high-dimension bulk data, is managed by applying Map-Reduce technology, which performs parallel processing to improve the performance speed of AI algorithms. Using 16,139 EMR data of dogs collected from four domestic animal hospitals, the DBN model showed 88% accuracy for life cycle prediction in dogs. 반려동물 양육 가구의 급증에 따라, 반려견의 건강상태를 모니터링 하고 질환 여부를 사전 진단함으로써 반려견의 의료비 지출을 줄일 수 있는 제도적 방안이 필요하다. 본 논문에서는 동물병원의 전자의무기록 (EMR; electronic medical record) 데이터를 이용하여 반려견의 종, 성별 및 생애주기별 주요 질병을 분석하는 인공지능 시스템을 제안한다. 인공지능 분석 시스템은 반려견의 종과 성별, 나이, 질병, 처방 정보로부터 상관성이 높은 의료정보 추출이 가능한 빈발패턴 분석모델과 반려견의 질환 진단에 영향을 주는 생애주기를 자동으로 예측할 수 있는 Deep Belief Network (DBN) 모델을 포함한다. 동물병원에서 수집된 EMR 데이터는 고차원 대용량 데이터이므로, 병렬처리를 통해 인공지능 알고리즘의 수행 속도 개선이 가능한 Map-Reduce 기술을 적용하였다. 국내 4개 동물병원에서 수집된 반려견의 16,139건 EMR 데이터를 이용하여 반려견의 생애주기를 예측한 결과, DBN 모델은 약 88%의 정확도를 보였다.
잔기 위치 예측을 위한 단백질 기하학적 특징 추출 기법
유기진 ( Ki Jin Yu ),정광수 ( Kwang Su Jung ),류근호 ( Keun Ho Ryu ) 한국정보처리학회 2006 한국정보처리학회 학술대회논문집 Vol.13 No.2
생명현상을 이해하기 위해서는 단백질의 기능 규명이 이루어져야한다. 단백질 기능 규명을 위한 서열 분석 방법은 서열 상동성이 현저히 낮은 경우 단백질 기능 예측이 불가능하고, 과거의 전체적인 단백질 구조 분석을 통한 기능 예측의 문제점이 보고되고 있다. 이 논문에서는 기능상 중요한 의미를 가지고 있는 단백질의 특정하위구조의 기하학적 특징을 추출하여 이 특징과 잔기의 위치와의 관계를 규명하였다. 또한 NaiveBayes, SVM, C4.5의 분류알고리즘을 이용하여 각 알고리즘별 분류성능을 평가하였다. 기능상 중요한 의미를 가지고 있는 특정하위구조를 비교함으로써 모르는 단백질의 기능을 예측할 수 있다.
유기진(Kijin Yu),박수호(Soo Ho Park),류근호(Keun Ho Ryu) 한국디지털콘텐츠학회 2018 한국디지털콘텐츠학회논문지 Vol.19 No.9
Genome-Wide Association Study (GWAS) have been used to identify susceptibility genes for complex human diseases and many recent studies succeed to report common genetic factors for various diseases. Unfortunately, it is hard to understand all biological functions and mechanisms around the complex disease with GWAS only although the number of known associated genes with diseases is increased drastically because GWAS is a single locus based approach while not a gene but numerous factors may affect a disease associated pathways. PRaDA generates a combined report with genes, pathways and Gene Ontology (GO) using single nucleotide polymorphism (SNP) analysis output. The PRaDA reports not only directly associated pathways but also functionally related ones for identifying accumulated effects of low p-value SNPs. Through integrated information including indirect functional effects, user could have insights of overall disease mechanisms and markers.
MCL 알고리즘을 이용한 단백질 표면의 바인딩 영역 분석 기법
정광수,유기진,정용제,류근호,Jung, Kwang-Su,Yu, Ki-Jin,Chung, Yong-Je,Ryu, Keun-Ho 한국정보처리학회 2007 정보처리학회논문지D Vol.14 No.7
단백질은 다른 물질과의 결합하여 기능을 수행하기 때문에 활성 사이트가 유사한 단백질은 유사한 기능을 가진다. 따라서 단백질의 바인딩 영역을 식별함으로써 단백질의 기능을 추론할 수 있다. 이 논문은 MCL (Markov Cluster) 알고리즘을 이용하여 단백질의 바인딩 영역을 추출하는 새로운 방법을 제시한다. 이를 위하여 단백질의 표면 잔기 거리를 나타내는 distance matrix를 생성하고, 여기에 MCL 프로세스를 적용한다. 제시한 방법을 평가하기 위해 Catalytic Site Atlas (CSA) 데이터를 사용하였다. CSA 데이터 (94개의 단일 체인 단백질)를 이용한 실험 결과, 알고리즘은 91개 단백질의 활성 사이트 주변의 바인딩 영역을 검출하였다. 이 논문은 단백질 활성 사이트를 분석하기 위한 새로운 기하학적 특징을 제시하였고, 활성 사이트와 관련이 없는 잔기를 제거함으로써 단백질 표면의 분석의 시간을 줄일 수 있는 장점이 있다. Proteins combine with other materials to achieve their function and have similar function if their active sites are similar. Thus we can infer the function of protein by identifying the binding area of proteins. This paper suggests the novel method to select binding area of protein using MCL (Markov Cluster) algorithm. We construct the distance matrix from surface residues distance on protein. Then this distance matrix is transformed to connectivity matrix for applying MCL process. We adopted Catalytic Site Atlas (CSA) data to evaluate the proposed method. In the experimental result using CSA data (94 selected single chain proteins), our algorithm detects the 91 (97%) binding area near by active site of each protein. We introduced a new geometrical features and this mainly contributes to reduce the time to analyze the protein by selecting the residues near by active site.