RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      대용량 데이터에서 데이터 군집화 기반의 효율적인 이상치 탐지 기법 = An Efficient Outlier Detection Algorithms based on Data Clustering over Massive Data

      한글로보기

      https://www.riss.kr/link?id=A103722119

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      An outlier means that a data is distant from other data or a data has a contradictory relation with other data in a data set. As these features, since the outlier is used to an unnecessary data or a significant event, the outlier detection is very imp...

      An outlier means that a data is distant from other data or a data has a contradictory relation with other data in a data set. As these features, since the outlier is used to an unnecessary data or a significant event, the outlier detection is very important. However, since the advent of the devices that capable of communication with others and environments measurement has come an explosion of data, the existing outlier detection algorithms are not suitable to the massive data. Thus, in this paper, we propose an efficient outlier detection algorithms based on data clustering over the massive data. In proposed algorithms, we utilize the MapReduce framework which comprises a number of machines in order to construct the local clusters in parallel and merge the local clusters to the global clusters. To fully utilize every machine in MapReduce, we divide the domain of the data set into a number of grids, and then each machine collects every data in each grid and constructs the local clusters. In our experiments, we created the various size of the data sets and form the diverse experiment environments in order to evaluate proposed algorithms in various fields.

      더보기

      국문 초록 (Abstract)

      이상치란 데이터 집합에서 다른 데이터들과 분명한 차이를 보이거나 모순 관계를 갖는 데이터를 의미한다. 이러한 특징으로 이상치는 데이터 집합에서 불필요한 데이터 또는 중요한 사건을...

      이상치란 데이터 집합에서 다른 데이터들과 분명한 차이를 보이거나 모순 관계를 갖는 데이터를 의미한다. 이러한 특징으로 이상치는 데이터 집합에서 불필요한 데이터 또는 중요한 사건을 의미하는 정보로 사용되기 때문에, 이상치를 탐지하는 일은 매우 중요하다. 그러나 환경 정보 측정과 외부와의 통신이 가능한 기기들의 등장으로 데이터가 기하급수적으로 수집됨에 따라 기존 이상치 탐지 기법들은 이러한 대용량 데이터에 적합하지 않다. 따라서 본 논문에서는 대용량 데이터에서 데이터 군집화 기반의 효율적인 이상치 탐지 기법을 제안한다. 제안 기법에서는 복수 개의 기기들이 참여하는 맵리듀스를 이용하여 지역 군집들을 병렬로 생성하고, 지역 군집들을 병합하여 전역 군집들로 생성한다. 제안 기법에서는 데이터 영역을 격자들로 분할하여 각 격자에 속한 데이터들을 어떤 한 기기에서 모두 수집하여 지역 군집을 생성함에 따라 맵리듀스에 참여하는 모든 기기들을 완전히 사용한다. 실험에서는 제안 기법의 성능을 다방면에 걸쳐 평가하기 위해, 여러 크기의 실험 데이터 집합들을 생성하고 다양한 실험 환경을 구성하였다.

      더보기

      참고문헌 (Reference)

      1 윤들녁, "맵리듀스를 이용한 그리드 기반 k-NN 조인 질의처리 알고리즘" 한국정보과학회 30 (30): 103-115, 2014

      2 Kejia Zhang, "Unsupervised outlier detection in sensor networks using aggregation tree" 158-169, 2007

      3 Konstantin Shvachko, "The hadoop distributed file system" 1-10, 2010

      4 Frank E. Grubbs, "Procedures for detecting outlying observations in samples" 11 (11): 1-21, 1969

      5 Qing He, "Parallel outlier detection using kd-tree based on MapReduce" 75-80, 2011

      6 Jeffrey Dean, "MapReduce: simplified data pprocessing on large clusters" 51 (51): 107-113, 2008

      7 Weili Wu, "Localized outlying and boundary data detection in sensor networks" 19 (19): 1145-1157, 2007

      8 Anna Koufakou, "Fast paralle outlier detection for categorical datasets using MapReduce" 3298-3304, 2008

      9 Sridhar Ramaswamy, "Efficient algorithms for mining outliers from large data sets" 29 (29): 427-438, 2000

      10 Hans-Peter Kriegel, "Angle-Based outlier detection in high-dimensional data" 444-452, 2008

      1 윤들녁, "맵리듀스를 이용한 그리드 기반 k-NN 조인 질의처리 알고리즘" 한국정보과학회 30 (30): 103-115, 2014

      2 Kejia Zhang, "Unsupervised outlier detection in sensor networks using aggregation tree" 158-169, 2007

      3 Konstantin Shvachko, "The hadoop distributed file system" 1-10, 2010

      4 Frank E. Grubbs, "Procedures for detecting outlying observations in samples" 11 (11): 1-21, 1969

      5 Qing He, "Parallel outlier detection using kd-tree based on MapReduce" 75-80, 2011

      6 Jeffrey Dean, "MapReduce: simplified data pprocessing on large clusters" 51 (51): 107-113, 2008

      7 Weili Wu, "Localized outlying and boundary data detection in sensor networks" 19 (19): 1145-1157, 2007

      8 Anna Koufakou, "Fast paralle outlier detection for categorical datasets using MapReduce" 3298-3304, 2008

      9 Sridhar Ramaswamy, "Efficient algorithms for mining outliers from large data sets" 29 (29): 427-438, 2000

      10 Hans-Peter Kriegel, "Angle-Based outlier detection in high-dimensional data" 444-452, 2008

      11 Alexander Hinneburg, "An efficient approach to clustering in large multimedia databases with noise" 5 (5): 387-415, 2003

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2026 평가예정 재인증평가 신청대상 (재인증)
      2020-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2017-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2013-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2010-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2009-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2007-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.02 0.02 0.01
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.02 0.02 0.183 0.03
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼