RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      McSimA+ 시뮬레이터를 사용한 Vision Transformer 추론 과정의 레이어 별 Memory Bottleneck 분석

      한글로보기

      https://www.riss.kr/link?id=A108782463

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      As deep learning models continue to grow in scale, the number of parameters in these models has increased, causing a significant memory bottleneck in conventional von Neumann architecture-based systems. To address this issue, a new memory technology s...

      As deep learning models continue to grow in scale, the number of parameters in these models has increased, causing a significant memory bottleneck in conventional von Neumann architecture-based systems. To address this issue, a new memory technology such as Processing-In-Memory (PIM) is being developed, and its importance is also steadily being emphasized. However, since PIM designs additional logic to the existing memory structure, an in-depth analysis of the workload suitable for PIM is required in advance to prevent unnecessary overhead in the design process. In this paper, in order to verify the suitability of the recently popular Vision in Transformer (ViT) model for PIM, we build a deep learning model analysis environment using McSimA+ simulator and analyze the memory bottleneck of the ViT inference workload by layer. The analysis results show that the ViT is a very memory-intensive workload because Last-to-First Miss Ratio (LFMR) and Last Level Cache Miss Per Kilo Instruction (LLC MPKI) of the ViT, which are composed of embedding, multi-head self attention, and multi-layer perceptron layers, are 88.64 and 45.31, respectively, on average. As a result, the ViT is an appropriate workload to achieve significant system acceleration and power savings through PIM systems, unlike computationally intensive convolution neural networks (CNNs).

      더보기

      목차 (Table of Contents)

      • Abstract
      • Ⅰ. 서론
      • Ⅱ. 연구 배경
      • Ⅲ. 연구 구현 및 분석결과
      • Ⅳ. 결론 및 향후 연구 방향
      • Abstract
      • Ⅰ. 서론
      • Ⅱ. 연구 배경
      • Ⅲ. 연구 구현 및 분석결과
      • Ⅳ. 결론 및 향후 연구 방향
      • 참고문헌
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼