http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
다양한 불균형 데이터셋에서 심층 신경망의 손실 함수 성능 비교 분석
하동휘(Donghee Ha),김무섭(Mooseop Kim),정치윤(Chi Yoon Jeong) 한국통신학회 2022 한국통신학회 학술대회논문집 Vol.2022 No.2
심층 신경망 모델 학습 시, 특정 클래스의 데이터 수가 다른 클래스들보다 현저히 적었을 때 발생하는 데이터 불균형 문제는 심층 신경망 모델의 성능을 저하시키는 주요 원인으로 알려져 있다. 이러한 문제를 해결하기 위해서 데이터 불균형을 고려한 손실 함수들이 많이 제안되고 있지만, 이들에 대한 비교 분석 연구는 진행되고 있지 않다. 따라서, 본 논문에서는 기존의 손실 함수들을 불균형 비율이 서로 다른 4 개의 공개 데이터셋에 적용하여 객관적인 성능 비교를 수행하였다. 손실 함수는 Cross Entropy(CE), Focal Loss, Equalization Loss 등 총 7 가지를 사용하였다. 실험 결과, F1 스코어와 AUPRC(Area Under Precision-Recall Curve) 기준으로 데이터셋마다 가장 좋은 성능을 보인 손실 함수가 달랐으며, 일부 손실 함수는 CE 보다 낮은 성능을 보였다. 또한, Focal Loss 가 유일하게 모든 데이터셋에서 CE 대비 성능향상을 확인하였다.