RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      대용량 데이터 분석을 위한 맵리듀스 기반의 이상치 탐지 = Outlier Detection Based on MapReduce for Analyzing Big Data

      한글로보기

      https://www.riss.kr/link?id=A103034627

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      가까운 미래에는 빅데이터의 많은 부분을 IoT 데이터가 차지할 것이라는 전망이 나오고 있다. 그에 따라, IoT 데이터의 많은 부분을 차치하는 센서 데이터에 관한 관심과 연구 또한 활발하게 ...

      가까운 미래에는 빅데이터의 많은 부분을 IoT 데이터가 차지할 것이라는 전망이 나오고 있다. 그에 따라, IoT 데이터의 많은 부분을 차치하는 센서 데이터에 관한 관심과 연구 또한 활발하게 진행되고 있다. 여러 분야에서 활용되고 있는 센서 데이터는 분석할 때 실제와는 다른 값인 이상치를 포함하게 되면 정확한 분석이 어려우며, 왜곡된 결과가 도출되어 활용할 수 없는 경우가 생긴다. 따라서 본 논문에서는 정확한 결과를 도출하기 위해 수집된 원자료를 분석하기 전에 이상치 탐지 및 제거를 하였다. 또한, 점점 늘어나고 있는 대용량의 데이터를 빠르게 처리하기 위해 메모리 접근방식인 스파크를 사용한 분산처리환경에서 처리하였다. 맵리듀스 기반의 이상치 탐지 및 제거는 총 4단계로 나누어 구현하였으며, 각 단계를 매퍼와 리듀스로 구현하였다. 제안한 기법의 평가를 위해서 3가지 환경에서 비교하였으며, 그 결과 이상치 탐지 및 제거를 하고자 하는 데이터의 용량이 커질수록 스파크를 이용한 분산처리환경에서의 처리가 가장 빠르다는 결과를 얻었다.

      더보기

      다국어 초록 (Multilingual Abstract)

      In near future, IoT data is expected to be a major portion of Big Data. Moreover, sensor data is expected to be major portion of IoT data, and its` research is actively carried out currently. However, processed results may not be trusted and used if o...

      In near future, IoT data is expected to be a major portion of Big Data. Moreover, sensor data is expected to be major portion of IoT data, and its` research is actively carried out currently. However, processed results may not be trusted and used if outlier data is included in the processing of sensor data. Therefore, method for detection and deletion of those outlier data before processing is studied in this paper. Moreover, we used Spark which is memory based distributed processing environment for fast processing of big sensor data. The detection and deletion of outlier data consist of four stages, and each stage is implemented with Mapper and Reducer operation. The proposed method is compared in three different processing environments, and it is expected that the outlier detection and deletion performance is best in the distributed Spark environment as data volume is increasing.

      더보기

      참고문헌 (Reference)

      1 Changyong Park, "Validation of quality control algorithms for temperature data of the republic of korea" 299-307, 2012

      2 Shvachko, Konstantin, "The Hadoop distributed file system" 1-10, 2010

      3 Apache Mesos, "The Apache software foundation"

      4 Aitchison, John, "Statistical prediction analysis"

      5 Davies, Paul L, "Statistical evaluation of interlaboratory tests" 331 (331): 513-519, 1988

      6 Zaharia, Matei, "Spark cluster computing with working sets" 10 : 10-10, 2010

      7 Zaharia, Matei, "Resilient distributed data sets: A fault-tolerant abstraction for in-memory cluster computing" USENIX Association 2-,

      8 Zhang, Yang, "Outlier detection techniques for wireless sensor networks: A survey" 12 (12): 159-170, 2010

      9 Dean, Jeffrey, "MapReduce: simplified data processing on large clusters" 51 (51): 107-113, 2008

      10 Murphy, Kevin P, "Machine learning: a probabilistic perspective" MIT press 2012

      1 Changyong Park, "Validation of quality control algorithms for temperature data of the republic of korea" 299-307, 2012

      2 Shvachko, Konstantin, "The Hadoop distributed file system" 1-10, 2010

      3 Apache Mesos, "The Apache software foundation"

      4 Aitchison, John, "Statistical prediction analysis"

      5 Davies, Paul L, "Statistical evaluation of interlaboratory tests" 331 (331): 513-519, 1988

      6 Zaharia, Matei, "Spark cluster computing with working sets" 10 : 10-10, 2010

      7 Zaharia, Matei, "Resilient distributed data sets: A fault-tolerant abstraction for in-memory cluster computing" USENIX Association 2-,

      8 Zhang, Yang, "Outlier detection techniques for wireless sensor networks: A survey" 12 (12): 159-170, 2010

      9 Dean, Jeffrey, "MapReduce: simplified data processing on large clusters" 51 (51): 107-113, 2008

      10 Murphy, Kevin P, "Machine learning: a probabilistic perspective" MIT press 2012

      11 Hewlett Packard Enterprise, "Internet of things research study" 1-3, 2015

      12 Knorr, Edwin M., "Finding intensional knowledge of distance-based outliers" 99 : 211-222, 1999

      13 Zaharia, Matei, "Fast and interactive analytics over Hadoop data with Spark" 37 (37): 45-51, 2012

      14 Powers, David Martin, "Evaluation: from precision, recall and F-measure to ROC, informed, markedness and correlation" 2011

      15 Open Data Portal, "Environment& Weather"

      16 Preparata, Franco P, "Computational geometry: an introduction" Springer Science & Business Media 2012

      17 David Culler, "Amplab UC BERKELEY, BDAS, the Berkeley Data Analytics Stack"

      18 Zhuang, Yongzhen, "A weighted moving average-based approach for cleaning sensor data" 38-38, 2007

      19 Brown, Angus M., "A step-by-step guide to nonlinear regression analysis of experimental data using a Microsoft Excel spreadsheet" 65 (65): 191-200, 2001

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2027 평가예정 재인증평가 신청대상 (재인증)
      2021-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2018-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2013-11-05 학술지명변경 외국어명 : Journal of Korean Society for Internet Information -> Journal of Internet Computing and Services KCI등재
      2011-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2009-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2006-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2005-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2003-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.55 0.55 0.63
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.64 0.6 0.85 0.03
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼