RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI우수등재

      욕설문장 분류의 불균형 데이터 해결을 위한 전이학습 방법 = A Transfer Learning Method for Solving Imbalance Data of Abusive Sentence Classification

      한글로보기

      https://www.riss.kr/link?id=A104305101

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      The supervised learning approach is suitable for classification of insulting sentences, but pre-decided training sentences are necessary. Since a Character-level Convolution Neural Network is robust for each character, so is appropriate for classifyin...

      The supervised learning approach is suitable for classification of insulting sentences, but pre-decided training sentences are necessary. Since a Character-level Convolution Neural Network is robust for each character, so is appropriate for classifying abusive sentences, however, has a drawback that demanding a lot of training sentences. In this paper, we propose transfer learning method that reusing the trained filters in the real classification process after the filters get the characteristics of offensive words by generated abusive/normal pair of sentences. We got higher performances of the classifier by decreasing the effects of data shortage and class imbalance. We executed experiments and evaluations for three datasets and got higher F1-score of character-level CNN classifier when applying transfer learning in all datasets.

      더보기

      국문 초록 (Abstract)

      욕설문장을 지도학습 접근법으로 분류하기 위해서 욕설인지 아닌지 판별된 학습 문장이 필요하다. 문자수준의 컨볼루션 신경망이 각 문자에 대해 강건성을 가지기 때문에 욕설분류에 적합...

      욕설문장을 지도학습 접근법으로 분류하기 위해서 욕설인지 아닌지 판별된 학습 문장이 필요하다. 문자수준의 컨볼루션 신경망이 각 문자에 대해 강건성을 가지기 때문에 욕설분류에 적합하지만, 학습에 많은 데이터가 필요하다는 단점이 있다. 본 논문에서는 이를 해결하기 위해 임의로 생성한 욕설/비욕설 문장 쌍을 컨볼루션 신경망을 기반으로 하는 분류기에 학습시켜 컨볼루션 신경망의 필터가 욕설의 특징을 분류하도록 조정한 후, 실제 훈련문장을 학습시킬 때 필터를 재사용하는 전이학습방법을 제안한다.
      이로써 데이터 부족과 클래스 불균형으로 인한 영향이 감소하여 분류 성능이 향상될 것이다. 실험 및 평가는 총 3가지 데이터에 대해 수행되었으며, 문자수준 컨볼루션 신경망을 활용한 분류기는 모든 데이터에서 전이학습을 적용했을 때 더 높은 F1 점수를 획득하였다.

      더보기

      참고문헌 (Reference)

      1 N. V. Chawia, "SMOTE : synthetic minority oversampling technique" 16 : 321-357, 2002

      2 S. Sood, "Profanity use in online communities" 1481-1490, 2012

      3 K. Dinakar, "Modeling the detection of Textual Cyberbullying" 11-17, 2011

      4 J. M. Xu, "Learning from bullying traces in social media" 656-666, 2012

      5 N. Djuric, "Hate speech detection with comment embeddings" 29-30, 2015

      6 M. Iyyer, "Generating sentences from semantic vector space representations" 2014

      7 T. Mikolov, "Distributed representations of words and phrases and their compositionality" 3111-3119, 2013

      8 Q. V. Le, "Distributed representations of sentences and documents" 1188-1196, 2014

      9 J. Wang, "Dimensional sentiment analysis using a regional CNN-LSTM model" 225-230, 2016

      10 G. Xiang, "Detecting offensive tweets via topical feature discovery over a large scale twitter corpus" 1980-1984, 2012

      1 N. V. Chawia, "SMOTE : synthetic minority oversampling technique" 16 : 321-357, 2002

      2 S. Sood, "Profanity use in online communities" 1481-1490, 2012

      3 K. Dinakar, "Modeling the detection of Textual Cyberbullying" 11-17, 2011

      4 J. M. Xu, "Learning from bullying traces in social media" 656-666, 2012

      5 N. Djuric, "Hate speech detection with comment embeddings" 29-30, 2015

      6 M. Iyyer, "Generating sentences from semantic vector space representations" 2014

      7 T. Mikolov, "Distributed representations of words and phrases and their compositionality" 3111-3119, 2013

      8 Q. V. Le, "Distributed representations of sentences and documents" 1188-1196, 2014

      9 J. Wang, "Dimensional sentiment analysis using a regional CNN-LSTM model" 225-230, 2016

      10 G. Xiang, "Detecting offensive tweets via topical feature discovery over a large scale twitter corpus" 1980-1984, 2012

      11 Y. Chen, "Detecting offensive language in social media to protect adolescent online safety" 71-80, 2012

      12 R. Lewand, "Cryptological Mathematics" The Mathematical Association of America 199-, 2000

      13 Y. Kim, "Convolutional neural networks for sentence classification" 1746-1754, 2014

      14 K. He, "Convolutional neural networks at constrained time cost" 5353-5360, 2015

      15 D. Ramage, "Characterizing microblogs with topic models" 1-1, 2010

      16 X. Zhang, "Character-level convolutional networks for text classification" 649-657, 2015

      17 Y. Kim, "Character-aware neural language models" 2741-2749, 2016

      18 S. Sood, "Automatic identification of personal insults on social news sites" 63 (63): 270-285, 2012

      19 C. Nobata, "Abusive language detection in online user content" 145-153, 2016

      20 N. D. Gitari, "A lexicon-based approach for hate speech detection" 10 (10): 215-230, 2015

      21 W. Zhang, "A comparative study of TF* IDF, LSI and multi-words for text classification" 38 (38): 2758-2765, 2011

      22 T. Chen, "A Sentence vector based over-sampling method for imbalanced emotion classification" 62-72, 2014

      23 C. Zhou, "A C-LSTM neural network for text classification"

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2021 평가예정 계속평가 신청대상 (등재유지)
      2016-01-01 평가 우수등재학술지 선정 (계속평가)
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2002-01-01 평가 학술지 통합 (등재유지) KCI등재
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.19 0.19 0.19
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.2 0.18 0.373 0.07
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼