http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
컨볼루션 신경망 모델에 의한 악성 댓글 모자이크처리 방안
김유민,강효빈,한수현,정희용 한국산업정보학회 2022 한국산업정보학회논문지 Vol.27 No.2
온라인 서비스의 발달로 악성 댓글의 파급력이 커져 사이버 폭력 피해가 극심해지고 있다. 이를 방지하기 위해 금칙어 기반 필터링, 신고제도 등 다양한 방법이 사용되고 있지만 악성 댓글을 완벽하게 근절하기는 어렵다. 본 연구는 딥러닝을 사용하여 악성 댓글의 분류의 정확도를 높이고 욕설에 해당하는 부분을 모자이크처리 처리하는 것을 목적으로 진행되었다. 정확도를 높이기 위해 컨볼루션의 층수, 필터 수를 다르게 설정하여 두 가지 모델링을 진행하여 비교하였고, 데이터 세트의 90%를 훈련 데이터로, 10%를 테스트 데이터로 사용한 결과 최종 88%의 정확도를 도출해 낼 수 있었다. 또한 Grad-CAM을 사용하여 모델이 댓글의 어느 부분을 결과에 반영하였는지 표시하여 욕설 위치 정보를 출력하였다. 단순 금칙어 기반으로 댓글을 분류한 정확도는 56%이지만, 컨볼루션 신경망에 의한 분류 정확도가 88%인 것과 비교하면 딥러닝 모델로 악성 댓글의 욕설을 처리하는 것이 더 효과적인 것을 확인할 수 있었다.
김유민 ( Yumin Kim ),강효빈 ( Hyobin Gang ),한수현 ( Suhyeun Han ),정희용 ( Hieyong Jeong ) 한국정보처리학회 2021 한국정보처리학회 학술대회논문집 Vol.28 No.2
개인의 소셜미디어 활동이 활발해지면서 익명성을 악용하여 타인에게 욕설을 주저없이 해버리는 사용자가 늘고 있다. 본 연구는 욕설이 난무하는 채팅창에서 욕설 데이터를 크롤링하여 데이터셋을 구축하여 컨볼루션 네트워크로 학습시켰을 때 욕설을 탐지하고, 전체 문장에서 그 탐지한 욕설의 위치를 파악하여 블러링 처리를 할 수 있는지를 확인하는 것을 목적으로 한다. 전처리 작업으로 한글과 공백을 제외하고 형태소 단위로 토큰화한 후 불용어를 제거해서 패딩처리를 하였다. 학습 모델로는 1차원 컨볼루션을 사용하여 수집한 데이터의 80%를 훈련에 사용하고 나머지 20%를 테스트에 사용하였다. 키워드를 이용한 단순 분류 모델과 비교하였을 때, 본 연구에서 이용한 모델이 약 14% 정확도가 향상된 것을 확인할 수 있었다. 테스트에서 전체 문장에서 욕설이 포함되었을 때 욕설과 그 위치 정보를 잘 획득하는 것도 확인할 수 있었다.