http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
영상 폐색영역 검출 및 해결을 위한 딥러닝 알고리즘 적용 가능성 연구
배경호(Kyoung-Ho Bae),박홍기(Hong-Gi Park) 한국산학기술학회 2019 한국산학기술학회논문지 Vol.20 No.11
최근 드론을 이용한 공간정보 구축이 활성화되면서 공간정보 산업발전에 많은 기여를 하고 있다. 하지만 드론 공간정보는 카메라의 중심투영에 의한 발생하는 폐색영역 뿐 아니라 가로수, 보행자, 현수막과 같은 적치물에 의한 폐색영역이 필연적으로 발생한다. 이러한 폐색영역을 효율적으로 해결하기 위한 다양한 방안이 연구되고 있다. 본 연구에서는 폐색영역 해결을 위해 원초적인 재촬영이 아닌 딥러닝 알고리즘을 적용하기 위한 다양한 알고리즘별 조사 및 비교연구를 수행하였다. 그 결과, 객체 검출 알고리즘인 HOG부터 기계학습 방법인 SVM, 딥러닝 방식인 DNN, CNN, RNN까지 다양한 모델들이 개발 및 적용되고 있으며, 이 중 영상의 분류, 검출에 가장 보편적이고 효율적인 알고리즘은 CNN기법임을 확인하였다. 향후 AI 기반의 자동 객체 탐지와 분류는 공간정보 분야에서 각광받는 최신 과학기술이다. 이를 위해 다양한 알고리즘에 대한 검토와 적용은 중요하다. 따라서, 본 연구에서 제시하는 알고리즘별 적용 가능성은 자동으로 드론 영상의 폐색영역을 탐지하고 해결할 수 있어 공간정보 구축의 시간, 비용, 인력에 대한 효율성 향상에 기여할 것으로 판단된다. Recently, spatial information is being constructed actively based on the images obtained by drones. Because occlusion areas occur due to buildings as well as many obstacles, such as trees, pedestrians, and banners in the urban areas, an efficient way to resolve the problem is necessary. Instead of the traditional way, which replaces the occlusion area with other images obtained at different positions, various models based on deep learning were examined and compared. A comparison of a type of feature descriptor, HOG, to the machine learning-based SVM, deep learning-based DNN, CNN, and RNN showed that the CNN is used broadly to detect and classify objects. Until now, many studies have focused on the development and application of models so that it is impossible to select an optimal model. On the other hand, the upgrade of a deep learning-based detection and classification technique is expected because many researchers have attempted to upgrade the accuracy of the model as well as reduce the computation time. In that case, the procedures for generating spatial information will be changed to detect the occlusion area and replace it with simulated images automatically, and the efficiency of time, cost, and workforce will also be improved.
배경호(Kyungho Bae),이효건(Hyogun Lee),최진우(Jinwoo Choi) 한국방송·미디어공학회 2022 한국방송공학회 학술발표대회 논문집 Vol.2022 No.6
기존의 video domain adaptation은 closed set 환경에서 주로 연구되었다. 하지만 이는 source와 target의 label이 같다는 비현실적인 전제를 요구한다. 따라서 본 논문에서는 target의 label space가 source보다 넓은 open set video domain adaptation 문제를 다룬다. 우린 open set image domain adaptation에서 사용되는 방법들을 video로 확장 시켜 모델을 설계하고 UCF to HMDB, HMDB to UCF 와 같은 video dataset에서 실험하였다. 그 결과 source only 대비 UCF to HMDB에서 12%, HMDB to UCF 7.1% 향상된 결과를 얻었다.
디지털트윈 구축을 위한 3차원 공간정보 폐색영역 검출 및 복원 기술개발
배경호(Kyoung-Ho Bae) 한국산학기술학회 2022 한국산학기술학회논문지 Vol.23 No.10
디지털트윈의 중요한 요소는 실제 객체에 대한 폐색영역이 없는 실감형 공간정보를 구축하고 제공하여야 한다. 하지만 3차원 공간정보 모델링에서는 촬영 각도와 촬영 시기로 인해 필연적으로 폐색영역이 발생한다. 이에 최신 기술인 인공지능 기술을 이용한 특정객체의 검출과 이를 제거하고 복원할 수 있는 기술을 구현하고자 한다. 연구에서는 인공지능 모델 중에서 ResNet 알고리즘을 사용하 폐색 유발 객체를 자동으로 검출하고, 텍스처링 영상에서 검출된 폐색영역을 삭제하여 특정 알고리즘을 적용하여 해당 건물의 텍스처링 영상에서 폐색영역을 복원하는 복원 기술을 개발하였다. 실험데이터는 건물 모델링에서 가장 많은 폐색을 유발하는 가로수를 대상으로 최신모델인 ResNet 학습모델을 사용하여 폐색영역을 유발하는 가로수 객체 데이터셋을 만들고 자동으로 검출하였으며 그 결과를 분석하였다. 연구의 결과로는 ResNet 알고리즘을 이용하여 비정형 데이터인 가로수를 검출할 수 있으며, DeepFillv2 알고리즘을 이용하여 가로수를 제거하고 인접 픽셀을 이용하여 상가와 아파트 텍스처링 영상을 복원하였다. An important element of a digital twin is to model and provide realistic spatial information without an occluded area for real objects. In 3D spatial information modeling, however, an occluded area inevitably occurs due to the shooting angle and shooting time. In this regard, this study implemented a technology that can detect a specific object using the latest technology, AI, and remove and in-paint it. In this study, the occlusion-causing object was automatically detected using the ResNet algorithm and the occlusion area in-painting in the texturing image. For the experimental data, the ResNet algorithm was applied to street trees that cause the most occlusion in building modeling to produce a street tree dataset and automatically detected and analyzed the results. Street trees, which are unstructured data, can be detected using the ResNet algorithm and removed using the DeepFillv2 algorithm, producing texturing images of shops and apartments that are restored using the adjacent pixels.