RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        부산지역 교통관련 기사를 이용한 비정형 빅데이터의 정형화와 시각적 해석

        이경준,노윤환,윤상경,조영석,Lee, Kyeongjun,Noh, Yunhwan,Yoon, Sanggyeong,Cho, Youngseuk 한국데이터정보과학회 2014 한국데이터정보과학회지 Vol.25 No.6

        2013년 1월 1일부터 2013년 12월 31일까지의 부산지역지인 국제신문과 부산일보의 기사들 중 제목에 '부산'과 '교통'을 동시에 포함한 2889건의 기사 내용의 관계 또는 관련 있는 데이터에 내재되어 있는 의미 있는 패턴을 찾아내고자한다. 데이터마이닝 (datamining)의 일부인 텍스트마이닝(textmining)의 기법을 이용하여 사회네트워크분석 (SNA; social network analysis)을 실시하였다. 비정형 데이터의 정형화를 위해 빅데이터의 저장, 처리 및 분석을 위해 자바 기반의 오픈소스 프레임워크인 하둡 생태계 (Hadoop ecosystem)의 HDFS와 맵리듀스 (MapReduce)를 Linux (Ubuntu-12.04LTS) 환경에서 이용하였고, 기존의 R패키지에서 제공되는 사회 네트워크 분석보다 효율적인 시각화를 위해 각 노드 및 선에 비율에 따른 가중치를 주어 색상과 굵기로 해석할 수 있도록 새로운 알고리즘을 구현하였다. We analyzed the articles from "Kukje Shinmun" and "Busan Ilbo", which are two local newpapers of Busan Metropolitan City. The articles cover from January 1, 2013 to December 31, 2013. Meaningful pattern inherent in 2889 articles of which the title includes "Busan" and "Traffic" and related data was analyzed. Textmining method, which is a part of datamining, was used for the social network analysis (SNA). HDFS and MapReduce (from Hadoop ecosystem), which is open-source framework based on JAVA, were used with Linux environment (Uubntu-12.04LTS) for the construction of unstructured data and the storage, process and the analysis of big data. We implemented new algorithm that shows better visualization compared with the default one from R package, by providing the color and thickness based on the weight from each node and line connecting the nodes.

      • KCI등재

        도로위의 기상요인이 교통사고에 미치는 영향 - 부산지역을 중심으로 -

        이경준,정임국,노윤환,윤상경,조영석,Lee, Kyeongjun,Jung, Imgook,Noh, Yunhwan,Yoon, Sanggyeong,Cho, Youngseuk 한국데이터정보과학회 2015 한국데이터정보과학회지 Vol.26 No.3

        Them traffic accidents have been increased every year due to increasing of vehicles numbers as well as the gravitation of the population. The carelessness of drivers, many road weather factors have a great influence on the traffic accidents. Especially, the number of traffic accident is governed by precipitation, visibility, humidity, cloud amounts and temperature. The purpose of this paper is to analyse the effect of road weather factors on traffic accident. We use the data of traffic accident, AWS weather factors (precipitation, existence of rainfall, temperature, wind speed), time zone and day of the week in 2013. We did statistical analysis using logistic regression analysis and decision tree analysis. These prediction models may be used to predict the traffic accident according to the weather condition. 교통사고는 인구의 증가와 그에 따른 자동차의 증가로 인하여 매년 증가하고 있다. 그러한 교통사고의 원인은 운전자의 부주의뿐만 아니라 도로상의 기상상황에 의해 영향을 받는다. 특히, 강수량, 시계, 습도, 흐림 정도, 기온 등에 의해 많은 교통사고들이 영향을 받는다. 따라서 본 연구는 다양한 기상 요인의 영향 정도에 따른 교통사고 발생 유무의 분석을 목적으로 하였다. 부산 해운대구의 센텀남대로 및 해운대로의 2013년도 교통사고 발생 자료와 지역별 상세 기상 관측 자료인 AWS 기상자료(시간당 강수량, 강수유무, 기온, 풍속), 시간대, 요일을 활용하여 로지스틱 회귀모형 및 의사결정나무모형을 이용하여 분석하였다. 그 결과 기상 요인 중 강수유무와 기온이 교통사고 발생에 영향을 미치는 요인으로 나타났다. 이러한 결과는 도로위의 기상상태에 따른 교통사고의 발생을 예측하는데 유용하게 사용할 수 있을 것이다.

      • KCI우수등재

        불균형 두 집단의 매칭방법 제안

        정임국(Imgook Jung),노윤환(Yunhwan Noh),조영석(Youngseuk Cho) 한국데이터정보과학회 2018 한국데이터정보과학회지 Vol.29 No.3

        관찰연구 (observational study)에서 사건이 발생한 관측데이터와 사건이 발생하지 않은 관측데이터는 연구 참여 이전에 다른 성향의 데이터일 가능성이 높고, 표본선택 편의 (sample selection bias)의 발생 가능성이 높아지게 된다. 또한 관심 있는 사건이 발생한 관측데이터와 그렇지 않은 관측데이터 수의 불일치가 일어날 가능성이 매우 높다. 이러한 불균형을 해결하는 방법으로 성향점수매칭(propensity score matching: PSM)이 사용되고 있다. 본 논문은 표본선택 편의와 관측데이터 수의 불균형을 해결하기 위해 새로운 방법을 제안하고 그 결과를 비교하고자 한다. In this article, we propose a statistical method to find the equivalent group in observational data by using conversion score. In observational study, treatment group and control group are likely to be different groups before research participation. Thus the difference makes rise of selection bias occurrence possibility. In addition, selection bias makes difference between treatment group and control group. One of the methods to overcome the imbalance is propensity score matching (PSM). For case analysis, we use the 2014 traffic accident data.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼