http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
funcGNN과 Siamese Network의 코드 유사성 분석 성능비교
최동빈,조인수,박용범,Choi, Dong-Bin,Jo, In-su,Park, Young B. 한국반도체디스플레이기술학회 2021 반도체디스플레이기술학회지 Vol.20 No.3
As artificial intelligence technologies, including deep learning, develop, these technologies are being introduced to code similarity analysis. In the traditional analysis method of calculating the graph edit distance (GED) after converting the source code into a control flow graph (CFG), there are studies that calculate the GED through a trained graph neural network (GNN) with the converted CFG, Methods for analyzing code similarity through CNN by imaging CFG are also being studied. In this paper, to determine which approach will be effective and efficient in researching code similarity analysis methods using artificial intelligence in the future, code similarity is measured through funcGNN, which measures code similarity using GNN, and Siamese Network, which is an image similarity analysis model. The accuracy was compared and analyzed. As a result of the analysis, the error rate (0.0458) of the Siamese network was bigger than that of the funcGNN (0.0362).
데이터 정제의 관점에서 본 한국문집총간 XML 문서 검토
최지연 ( Choi¸ Ji Yeon ),조성덕 ( Cho¸ Sung Duk ),최동빈 ( Choi¸ Dong Bin ) 근역한문학회 2021 한문학논집(漢文學論集) Vol.60 No.-
정보화 기술이 고도화됨에 따라 단순한 데이터베이스의 서비스보다 DB의 재가공 또는 DB 융합 서비스 등 다양한 형태의 정보 서비스 방식이 요구되고 있다. 본고는 데이터 정제의 관점에서 현재 구축된 한국 고전 데이터베이스 가운데 한국고전종합 DB의 한국문집총간 XML 문서를 검토하였다. 한국문집총간은 한국고전번역원이 삼국 시대부터 대한제국 말기까지 저작된 한국의 문집 중에서 주요 문집을 선정하고, 표점·영인하여 간행한 것으로, 한국고전번역원은 지난 1999년부터 2021년까지 전체 1,259종 500책에 대한 DB 구축 사업을 진행하였다. 본 연구진은 한국문집총간 DB를 기초데이터로 사용하는 과제를 진행하면서 한국문집총간 XML 문서를 검토하였다. 데이터 정제에 영향을 주는 장애요인을 ‘페이지 번호 불일치’, ‘데이터 추가’, ‘데이터 누락’, ‘원문 이미지와 XML 한자의 불일치’의 네가지로 나누고 그 원인을 고찰해 보았다. 본고에서 살펴본 한국문집총간 XML에 대한 논의가 신뢰도 높은 데이터를 구축하는 데 도움이 되기를 기대한다. From the perspective of data reprocessing, this paper intends to review the XML document of the Korean Anthologies Collection Database among the oriental classic databases currently constructed. 'Korean Anthologies Collection' is a book published by the Institute for the Translation of Korean Classics, from the Three Kingdoms Period to the end of Joseon Dynasty by selecting and imprinting major collections of Korean literature. From 1999 to 2021, the establishment of a database (DB) for a total of 500 books of 1,259 species was completed. The researchers divided the types of errors found in the process of reprocessing and using the DB between Korean literature as basic research data into four categories: page number mismatch, data addition, data omission, and, mismatched XML Chinese characters. As information technology is advanced, various types of information service methods such as reprocessing DB or DB convergence service are required rather than simple database services. We hoped that the discussion on XML between the Korean Anthologies Collection examined in this paper will help build reliable research data.
Mask R-CNN 과 zi2zi 모델을 활용하여 탐지된 객체의 스타일을 변환시키는 신경망 모델
조인수 ( In-su Jo ),최동빈 ( Dong-bin Choi ),박용범 ( Young B. Park ) 한국정보처리학회 2021 한국정보처리학회 학술대회논문집 Vol.28 No.2
스타일 변환 모델은 이미지 전체나 이미지 내에서 사용자가 지정한 영역을 대상으로 스타일을 변환시킨다. 이런 방식은 이미지 내의 다수의 객체에 대해 스타일 변환을 시행할 때 일일이 영역을 지정해 줘야 한다는 불편함과 결과물의 전체 해상도가 떨어진다는 한계를 가지고 있다. 본 논문에서는 이런 한계들을 극복하기 위해 객체탐지 모델과 스타일변환 모델을 연동한 객체스타일변환모델을 제안하고 모델 간 연동방법에 대해 자세히 서술한다. 객체탐지모델인 Mask R-CNN 을 통해 필요한 객체를 탐지하고 탐지한 객체의 특징맵들을 스타일변환 모델인 zi2zi 의 입력 값으로 전달하여 이미지 내의 필요한 객체들만 스타일변환이 이루어지도록 모델이 동작한다. 이러한 모델은 기존에 있는 두 모델을 재사용함으로써 모델을 처음부터 새로 설계할 필요가 없다는 장점이 있으며, 공개된 다양한 모델들을 서로 융합하여 사용할 수 있는 방법을 제시하는데 도움을 줄 것이다.
스킵연결이 적용된 오토인코더 모델의 클러스터링 성능 분석
조인수 ( In-su Jo ),강윤희 ( Yunhee Kang ),최동빈 ( Dong-bin Choi ),박용범 ( Young B. Park ) 한국정보처리학회 2020 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.9 No.12
In addition to the research on noise removal and super-resolution using the data restoration (Output result) function of Autoencoder, research on the performance improvement of clustering using the dimension reduction function of autoencoder are actively being conducted. The clustering function and data restoration function using Autoencoder have common points that both improve performance through the same learning. Based on these characteristics, this study conducted an experiment to see if the autoencoder model designed to have excellent data recovery performance is superior in clustering performance. Skip connection technique was used to design autoencoder with excellent data recovery performance. The output result performance and clustering performance of both autoencoder model with Skip connection and model without Skip connection were shown as graph and visual extract. The output result performance was increased, but the clustering performance was decreased. This result indicates that the neural network models such as autoencoders are not sure that each layer has learned the characteristics of the data well if the output result is good. Lastly, the performance degradation of clustering was compensated by using both latent code and skip connection. This study is a prior study to solve the Hanja Unicode problem by clustering.