스마트농업 분야에서 빅데이터 분석 기술 및 인공지능을 활용한 연구의 필요성이 지속적으로 요구되고 있다. 인공지능 연구를 위해서는 대용량의 고품질 데이터 확보 및 라벨링이 필수적이...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T16938208
서울 : 국민대학교 일반대학원, 2023
학위논문(박사) -- 국민대학교 일반대학원 , 데이터사이언스전공 , 2024. 2
2023
한국어
수경재배 ; 항암쌈채 ; 모종 불량 진단 ; 머신러닝 ; 딥러닝 ; 데이터 증강 ; Hydroponic conditions ; Anti-caner leaf lettuce ; Machine learning ; Deep learning ; Data augmentation
서울
ⅵ, 84 ; 26 cm
지도교수: 박종혁
I804:11014-200000734173
0
상세조회0
다운로드국문 초록 (Abstract)
스마트농업 분야에서 빅데이터 분석 기술 및 인공지능을 활용한 연구의 필요성이 지속적으로 요구되고 있다. 인공지능 연구를 위해서는 대용량의 고품질 데이터 확보 및 라벨링이 필수적이...
스마트농업 분야에서 빅데이터 분석 기술 및 인공지능을 활용한 연구의 필요성이 지속적으로 요구되고 있다. 인공지능 연구를 위해서는 대용량의 고품질 데이터 확보 및 라벨링이 필수적이나, 수경재배 영역에서의 데이터가 상대적으로 부족한 현황이다. 이에 따라 본 논문에서는, 수경재배 환경에서 불량 모종 진단을 위해 수집된 항암쌈채 이미지 데이터의 인공지능 모형 개발 가능성을 확인한 후 이를 생성형 인공지능으로 증강한 데이터의 활용 가능성을 확인하는 연구를 진행하였다.
먼저 수집 및 전문가 라벨링을 마친 원본 항암쌈채 생육 모종 데이터를 대표적인 분류 모델인 ResNet, DenseNet, MobileNetV1, SENet, EfficientNet의 5개 백본 분류 모형에 학습시켜 불량 모종 진단을 진행하였다. 가장 성능이 높게 측정된 모형은 DenseNet으로 92.9%의 정확도이다. 학습 데이터의 양이 적고 클래스간 불균형이 존재함에도 높은 성능을 나타내어 확보된 항암쌈채 모종의 원본 데이터가 머신러닝 학습에 적합한 품질을 가진 것을 확인하였다. 이후 DCGAN과 Stable Diffusion의 생성형 인공지능으로 원본 데이터를 증강 후 전문가 선별 작업을 통해 원본과 비슷한 양의 불량 모종 클래스별 데이터셋을 확보하였다. 확보한 증강 데이터에 대한 FID값 측정 후, 원본 데이터로 학습된 불량 모종 진단 모형을 이용하여 증강 데이터를 진단하였다. Stable Diffusion 증강 데이터는 최대 79.8%의 정확도로 분류되었고, 잎의 색상과 형태, 생육 상태 구분 등 모종 불량 유형별 특성을 반영하고 있는 데이터가 다수 존재함을 확인하였다. 이후 증강 데이터의 머신러닝 활용 가능성 확인을 위해, 백본 분류 모형을 증강 데이터만으로 학습 후 원본에 대한 분류정확도 측정 실험을 진행하고, 이후 증강 데이터의 추가 건수별 분류정확도 측정을 통해 증강 데이터가 분류 모델의 정확도에 미치는 영향을 파악하였다. 본 연구를 통해, 수집된 항암쌈채 생육 데이터를 활용한 머신러닝 분류 모델 개발 가능성뿐 아니라, 적은 양의 원본 데이터도 생성형 인공지능을 이용한 증강 데이터 활용을 통해 머신러닝 분류 모델 개발 및 성능 향상이 가능하다는 것을 확인하였다. 또한 본 연구에서 확보된 항암쌈채 모종 이미지의 증강 데이터 공개로 수경재배 식물 관련 인공지능 개발 연구에 기여할 수 있을 것으로 기대한다.
다국어 초록 (Multilingual Abstract)
The need for big data analysis and artificial intelligence for smart agriculture is continuously requested. It is essential to collect and label large amounts of quality data for artificial intelligence research, However, there is a relative scarcity ...
The need for big data analysis and artificial intelligence for smart agriculture is continuously requested. It is essential to collect and label large amounts of quality data for artificial intelligence research, However, there is a relative scarcity of data in the area of hydroponic cultivation. Consequently, this paper investigates the feasibility of developing an artificial intelligence model using collected images of anti-cancer leafy greens in a hydroponic environment for diagnosing unhealthy seedlings, followed by examining the potential of using augmented data by generative AI.
Initially, the original anti-cancer leaf lettuce data set, which has been collected and labeled by experts, was trained by 5 Backbone classification models (ResNet, DenseNet, MobileNetV1, SENet, and EfficientNet) to diagnose unhealthy seedlings. The model with the highest performance was DenseNet, achieving an accuracy of 92.9%.
Despite the small amount of original data set and imbalance between classes, it showed high performance. It means that obtained 14th day anti-cancer leaf lettuce data set has enough quality for machine learning. After DCGAN and Stable diffusion augmentation, a similar quantity of data set was secured through expert selection. After FID calculation, the augmented data were diagnosed using the model trained with the original data. The Stable Diffusion augmented data were classified with an accuracy of up to 79.8%, and it was observed that many of these data reflected the distinct characteristics of different types of unhealthy seedlings, including leaf color, shape, and growth status.
To assess the potential for developing and utilizing machine learning models with augmented data, the study initially involved training backbone classification models with augmented data only. This was followed by experiments to measure the accuracy of diagnosing defects in the original data. Subsequently, the study evaluated the accuracy of unhealthy seedling diagnosis with different quantities of augmented data to understand the impact of augmented data on the accuracy of the classification model.
Through this research, it was established that not only is the development of machine learning classification models feasible using the collected anti-cancer leaf lettuce’s growth data, but also that the use of a small amount of original data can lead to the development and enhancement of machine learning classification models with augmented data by generative AI, Additionally, the public release of the augmented image data of anti-cancer leaf lettuce from this study is expected to contribute to artificial intelligence development research in the field of hydroponically cultivated industry domain.
목차 (Table of Contents)