http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
김재홍(Jaehong Kim),강다빈(Dabin Kang),송민지(Minji Song),홍지수(Jisoo Hong),김동휘(Dong-hwi Kim),이동훈(Dong-hun Lee),김아로(Aro Kim),박상효(Sang-hyo Park) 한국방송·미디어공학회 2023 한국방송공학회 학술발표대회 논문집 Vol.2023 No.6
본 논문에서는 생성된 이미지에 대한 객체 인식률이 디노이징 여부에 따라 어떻게 변화하는지를 살펴본다. 최근 객체 인식의 성능을 저하하는 적대적 공격과 방어 기법이 활발히 연구되며 객체 인식의 성능이 현저히 떨어지는 상황이 발생하고 있다. 이에 선행 연구에서는 DALL-E 2를 이용해 생성한 이미지에 대한 객체 인식률을 점검하는 연구만을 진행하였으나, 본 연구에서는 stable diffusion을 이용해 생성한 이미지 데이터 세트에 디노이징 모델 NAFNet, PNGAN을 적용해 객체 인식률을 점검하였다. 그 결과 NAFNet은 93.8%, PNGAN은 92.7%로 기존 생성 이미지에 대한 객체 인식률인 96.4%보다 낮음을 확인하였다. 또한 생성 모델을 이런 딥러닝 모델로 디노이징하는 경우 심각한 화질 저하가 발생함을 보고한다.
딥 러닝 기반 이미지 생성 모델을 활용한 객체 인식 사례 연구
강다빈(Dabin Kang),홍지수(Jisoo Hong),김재홍(Jaehong Kim),송민지(Minji Song),김동휘(Dong-hwi Kim),박상효(Sang-hyo Park) 한국방송·미디어공학회 2022 한국방송공학회 학술발표대회 논문집 Vol.2022 No.11
본 논문에서는 생성된 이미지에 대한 YOLO 모델의 객체 인식의 성능을 확인하고 사례를 연구하는 것을 목적으로 한다. 최근 영상 처리 기술이 발전함에 따라 적대적 공격의 위험성이 증가하고, 이로 인해 객체 인식의 성능이 현저히 떨어질 수 있는 문제가 발생하고 있다. 본 연구에서는 앞서 언급한 문제를 해결하기 위해 text-to-image 모델을 활용하여 기존에 존재하지 않는 새로운 이미지를 생성하고, 생성된 이미지에 대한 객체 인식을 사례 별로 연구한다. 총 8가지의 동물 카테고리로 분류한 후 객체 인식 성능을 확인한 결과 86.46%의 정확도로 바운딩 박스를 생성하였고, 동물에 대한 116개의 60.41%의 정확도를 보여주었다.