RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      적대적 오류 주입 공격에 대응하기 위한 RawNet3 기반 딥보이스 탐지기 구현

      한글로보기

      https://www.riss.kr/link?id=A109535924

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      딥보이스 기술은 TTS(Text-to-Speech), 음성 복제, 음성 변환 등 다양한 산업에서 활용되고 있으나, 가 짜 뉴스 유포나 보이스피싱 등 악용 가능성으로 인해 심각한 사회적 문제를 야기할 수 있다. 이를 탐지하기 위해 다양한 딥보이스 탐지 기술이 연구되고 있으나, 탐지 모델은 적대적 공격(adversarial attack)에 취약하다는 한계 가 있다. 본 논문에서는 ASVspoof 2021 및 WaveFake 데이터셋을 사용하여 RawNet3 기반 딥보이스 탐지 모델 을 구현하고, FGSM, PGDL2, FAB 적대적 공격에 따른 탐지 성능을 EER(Equal Error Rate) 지표로 분석하였 다. 또한, 논문에서는 적대적 공격에 대응하기 위한 적응형 적대적 훈련 기법을 제안하였다. 제안된 기법은 적대적 샘플 탐지 성능을 향상시키는 동시에 원본 데이터 성능도 유지하였으며, 기존 적대적 훈련 방식 대비 EER을 4.90%에서 4.12%로 낮추는 등 딥보이스 탐지 성능이 우수함을 확인하였다.
      번역하기

      딥보이스 기술은 TTS(Text-to-Speech), 음성 복제, 음성 변환 등 다양한 산업에서 활용되고 있으나, 가 짜 뉴스 유포나 보이스피싱 등 악용 가능성으로 인해 심각한 사회적 문제를 야기할 수 있다. ...

      딥보이스 기술은 TTS(Text-to-Speech), 음성 복제, 음성 변환 등 다양한 산업에서 활용되고 있으나, 가 짜 뉴스 유포나 보이스피싱 등 악용 가능성으로 인해 심각한 사회적 문제를 야기할 수 있다. 이를 탐지하기 위해 다양한 딥보이스 탐지 기술이 연구되고 있으나, 탐지 모델은 적대적 공격(adversarial attack)에 취약하다는 한계 가 있다. 본 논문에서는 ASVspoof 2021 및 WaveFake 데이터셋을 사용하여 RawNet3 기반 딥보이스 탐지 모델 을 구현하고, FGSM, PGDL2, FAB 적대적 공격에 따른 탐지 성능을 EER(Equal Error Rate) 지표로 분석하였 다. 또한, 논문에서는 적대적 공격에 대응하기 위한 적응형 적대적 훈련 기법을 제안하였다. 제안된 기법은 적대적 샘플 탐지 성능을 향상시키는 동시에 원본 데이터 성능도 유지하였으며, 기존 적대적 훈련 방식 대비 EER을 4.90%에서 4.12%로 낮추는 등 딥보이스 탐지 성능이 우수함을 확인하였다.

      더보기

      다국어 초록 (Multilingual Abstract)

      Deep voice technology is being used in various industries such as TTS(Text-to-Speech), voice cloning, and voice conversion, but it can cause serious social problems due to the possibility of misuse such as fake news distribution and voice phishing. Despite ongoing research into various deep voice detection techniques, detection models are still vulnerable to adversarial attacks. In this paper, we implement a RawNet3-based deep voice detection model using ASVspoof 2021 and WaveFake datasets, and analyze the detection performance against FGSM, PGDL2, and FAB adversarial attacks using the EER (Equal Error Rate) metric. Furthermore, we propose an adaptive adversarial training technique to counter adversarial attacks. The proposed technique improves adversarial sample detection performance while maintaining the original data performance, and it is confirmed that the deep voice detection performance is excellent, such as reducing EER from 4.90% to 4.12% compared to the existing adversarial training method.
      번역하기

      Deep voice technology is being used in various industries such as TTS(Text-to-Speech), voice cloning, and voice conversion, but it can cause serious social problems due to the possibility of misuse such as fake news distribution and voice phishing. De...

      Deep voice technology is being used in various industries such as TTS(Text-to-Speech), voice cloning, and voice conversion, but it can cause serious social problems due to the possibility of misuse such as fake news distribution and voice phishing. Despite ongoing research into various deep voice detection techniques, detection models are still vulnerable to adversarial attacks. In this paper, we implement a RawNet3-based deep voice detection model using ASVspoof 2021 and WaveFake datasets, and analyze the detection performance against FGSM, PGDL2, and FAB adversarial attacks using the EER (Equal Error Rate) metric. Furthermore, we propose an adaptive adversarial training technique to counter adversarial attacks. The proposed technique improves adversarial sample detection performance while maintaining the original data performance, and it is confirmed that the deep voice detection performance is excellent, such as reducing EER from 4.90% to 4.12% compared to the existing adversarial training method.

      더보기

      목차 (Table of Contents)

      • 요약
      • Abstract
      • Ⅰ. 서론
      • Ⅱ. 딥보이스 탐지기 구현
      • 2.1 데이터셋
      • 요약
      • Abstract
      • Ⅰ. 서론
      • Ⅱ. 딥보이스 탐지기 구현
      • 2.1 데이터셋
      • 2.2 데이터셋 전처리
      • 2.3 RawNet3 기반 딥보이스 탐지기
      • Ⅲ. 딥보이스 탐지기에 대한 적대적 공격
      • 3.1 FGSM, PGD, FAB 공격 기법
      • 3.2 RawNet3 기반 탐지기에 대한 적대적공격
      • Ⅳ. 적대적 공격에 대한 대응책 제안
      • 4.1 딥보이스 탐지기 적대적 공격 대응책
      • 4.2 제안하는 적응형 적대적 훈련
      • 4.3 적대적 훈련 기법의 비교 분석
      • Ⅴ. 결론
      • REFERENCES
      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼