RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 학위유형
        • 주제분류
        • 수여기관
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 지도교수
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 커널 밀도 추정치를 이용한 모형 기반 군집분석의 초기화 방법 : 기업 부도 빅데이터를 이용하여

        조현주 국민대학교 일반대학원 데이터사이언스학과데이터사이언스전공 2018 국내석사

        RANK : 248671

        Expectation-Maximization 알고리즘은 가우시안 혼합 모형(gaussian mixture models)과 같이 숨겨진 구조의 모델의 파라미터를 추정하는데 널리 쓰인다. 하지만 EM 알고리즘은 초기 값(initial value)에 따라 극댓값(local maximum)으로 수렴할 가능성이 있고 알고리즘 수렴 속도의 시간이 오래 걸릴 수 있는 결점을 가지고 있다. 본 연구에서는 이러한 EM 알고리즘의 결점을 해결하고자 Modal-EM 알고리즘으로 커널 밀도 추정치(kernel density estimation)의 local mode를 찾고 커널 밀도 추정치의 local mode를 갖는 모수를 초기 값으로 지정하여 최대우도추정량(maximum likelihood estimation)을 추정하고자 한다. 또한 모의실험을 통해 기존 연구의 무작위 초기화(random initialization) 방법인 10EM, 10CEM-EM, 10em-EM, SEMmax-EM 방법과 비교하여 본 연구에서 제안하는 초기 값 선택 방법이 우도 함수(likelihood function)의 최댓값(global maximum)을 찾는데 더 좋은 성능을 가지는 것을 확인하고 실제 기업 부도 데이터에 적용하여 기존 방법론과 커널 기반 초기 값 선택 방법을 비교하고자 한다. Expectation-Maximization algorithm is widely used to estimate the parameters of hidden structural models, such as Gaussian mixture models. However, the EM algorithm has the drawback that it may converge to the local maximum according to the initial value and the algorithm convergence speed may take a long time. In order to solve the drawbacks of this EM algorithm, this study finds the local mode of the kernel density estimation with the Modal-EM algorithm and tries to estimate the maximum likelihood estimation by specifying the parameter with the local mode of the kernel density estimate as the initial value. Also, the simulation results show that the initial value choice method proposed in this study compared to the random initialization methods such as 10EM, 10CEM-EM, 10em-EM and SEMmax-EM, has better performance in finding the global maximum. We compare the results of the existing methodology and the kernel-based initial value choice method by applying it to actual corporate default data.

      • 트랜잭션 기반 머신러닝 문제의 자동화된 특성 추출을 위한 딥러닝 활용

        우덕채 국민대학교 일반대학원 2019 국내박사

        RANK : 248671

        머신러닝은 통찰력을 도출하거나 분류 및 예측을 하기 위해, 주어진 데이터를 수학적 모델에 적합시키는 방식으로 정보 기술의 발전과 다양한 스마트 기기의 등장으로 활용 가능한 데이터의 양이 기하급수적으로 증대된 빅데이터 시대에서 편향이 개입되지 않은 패턴 발견으로 높은 예측 성능을 보이고 있다. 이러한 머신러닝 수행 과정에서 해결하고자 하는 문제를 잘 설명할 수 있는 속성을 생성하는 특성공학은 머신러닝 성능에 큰 영향을 미쳐 그 중요성이 지속적으로 강조되어 오고 있다. 하지만, 이러한 중요성에도 불구하고 반복적인 검증 절차와 원천 데이터에 대한 이해 뿐만 아니라 도메인 특성에 대한 깊은 이해를 필요로 함에 따라 여전히 어려운 과업으로 여겨지고 있다. 따라서, 본 연구에서는 이러한 특성공학 과업 중 전문 지식을 요구하며 반복적으로 수행되어야 하는 특성 추출의 복잡성 및 어려움을 해결하고 머신러닝 모델의 성능을 높이기 위한 방법으로 딥러닝 기법의 적용을 제안한다. 다른 머신러닝 기법과 달리 복잡한 비정형 데이터 처리 분야에서 딥러닝 기법이 뛰어난 성능을 보이는 가장 대표적인 이유는 원천 데이터 자체로부터 특성 추출이 가능하다는 점이다. 이러한 딥러닝 기법의 장점을 비즈니스 문제 해결에 적용하기 위하여 본 연구에서는 트랜잭션 데이터로부터 자동적으로 특성을 추출하거나 직접 예측 및 분류가 가능한 딥러닝 기반의 방법들을 제안하고 데이터 특성에 따른 차이를 실험하였다. 특히, 트랜잭션 데이터와 텍스트 데이터의 구조적 유사성에 기반하여 기존의 텍스트 처리에 높은 성능을 보이고 있는 기법을 적용하였으며 트랜잭션 데이터의 특성에 따라 각 방법들의 적합성을 검증하였다. 본 연구를 통해 자동화된 특성추출의 가능성을 탐색할 수 있을 뿐만 아니라 특성 추출 과업 수행 전에 일정 수준 이상의 성능을 보이는 준거 모델의 확보가 가능할 것으로 판단된다. 또한, 해결하고자 하는 비즈니스 문제와 보유하고 있는 데이터 특성에 따라 적합한 딥러닝 모델 선택의 가이드라인을 제시할 수 있으리라 기대된다. Machine learning (ML) is a method of fitting given data to a mathematical model to derive insights or to predict. In the age of big data, where the amount of available data increases exponentially due to the development of information technology and smart devices, ML shows high prediction performance due to pattern detection without bias. The feature engineering that generates the features that can explain the problem to be solved in the ML process has a great influence on the performance and its importance is continuously emphasized. Despite this importance, however, it is still considered a difficult task as it requires a thorough understanding of the domain characteristics as well as an understanding of source data and the iterative procedure. Therefore, we propose methods to apply deep learning for solving the complexity and difficulty of feature extraction and improving the performance of ML model. Unlike other techniques, the most common reason for the superior performance of deep learning techniques in complex unstructured data processing is that it is possible to extract features from the source data itself. In order to apply these advantages to the business problems, we propose deep learning based methods that can automatically extract features from transaction data or directly predict and classify target variables. In particular, we applied techniques that show high performance in existing text processing based on the structural similarity between transaction data and text data. And we also verified the suitability of each method according to the characteristics of transaction data. Through our study, it is possible not only to search for the possibility of automated feature extraction but also to obtain a benchmark model that shows a certain level of performance before performing the feature extraction task by a human. In addition, it is expected that it will be able to provide guidelines for choosing a suitable deep learning model based on the business problem and the data characteristics.

      • 워드 임베딩 기법을 활용한 범주형 데이터의 군집분석 : 고차원 데이터를 중심으로

        조현 국민대학교 일반대학원 2019 국내석사

        RANK : 248671

        머신 러닝 분야의 대표적인 비지도 학습 방법 중 하나인 군집분석은 데이터를 서로 유사한 집단끼리 묶어주는 분석으로, 마케팅, 공학, 의학 등 다양한 분야에서 활용되고 있다(Wilson et al, 2011). 오늘날 군집 분석과 관련된 연구는 꾸준히 진행되고 있는데, 데이터가 수치형 일 때 활용될 수 있는 연구가 주를 이루고 있으며 범주형 데이터의 군집분석과 관련된 연구는 활발하게 진행되고 있지 않다(Mingoti et al, 2012). 이에 본 연구에서는 범주형 데이터의 군집분석 시, 텍스트 분석에서 주로 사용되고 있는 워드 임베딩 기법을 활용하여 데이터를 수치형으로 변환을 한 뒤 수치형 데이터에 대한 군집분석 방법을 적용하는 방법을 제시하고자 한다. 워드 임베딩은 현재 가장 많이 사용 되고 있는 기법인 Word2vec, FastText, Glove 기법을 각각 적용하였고, 각 기법 적용시 어떠한 성능의 차이를 보이는지를 비교분석 하였다. 또한 제시하는 모형의 성능을 기존의 범주형 데이터의 군집분석 모형과 비교해 보면서 모형의 우수성을 검증하였고, 이때 가장 많이 알려진 방법인 K-mode, ROCK 등 의 방법과 비교분석 하였다. 데이터의 구조에 따른 모형의 성능의 변화를 파악하기 위해 시뮬레이션을 통해 다양한 조건의 데이터를 생성한 뒤 각 데이터 조건별 모형의 성능을 비교 하였고, 나아가 실제 데이터에서도 모형이 잘 군집하는지를 평가하기 위하여 실제 데이터를 통해 모형의 성능을 평가 하였다. Clustering algorithms is technique for grouping similar data and have been used in a variety of fileds such as engineering, medicine, marketing, etc. There are lot of study about clustering analysis but, majority of studies are about algorithms for nimerical data. In this study, we propose a method that transform categorical data to numerical data using word embedding. We used three word embedding model(Skip-gram, FastText, Glove) and compared the performance with algorithms for categorical data(K-mode, ROCK). To determine the performance of the model depending on the structure of the data, we generated data with different conditions and furthermore, evaluated performance of the model through real data. we used Silhouette score and Adjusted Rand score for performance evaluation. By the Simulation, We Compared performance of the model by the number of categories and the number of data and as a result, embedding using the glove shown the best performance except where the number of categories is high and the number of data is low. We compared performance of the model through the real hospital care data and performance was good in order of K-means using glove embedding, K-mode, K-means using word2vec, K-means using FastText.

      • 정보전달을 위한 데이터시각화의 사용자경험 연구 : 스마트홈 실내공기 서비스를 중심으로

        이현진 단국대학교 대학원 2019 국내석사

        RANK : 248671

        사물의 인터랙션이 실시간으로 이루어지는 초연결 사회가 도래함에 따라, 방대한 데이터가 거의 전 분야에서 실시간으로 수집되고 있다. 데이터는 기하급수적으로 증가하고 있으나, 그 중 가치 있는 데이터를 추출해 의미 있는 데이터를 적극적으로 활용하는 전달방법에 대한 연구는 아직은 전문가 위주로 이루어져 있다고 할 수 있어 비전문가인 일반 사용자들을 위한 연구가 필요하다. 본 연구에서는 데이터 시각화 요소를 활용할 경우와 정보 내용만 전달할 경우 정보인지도가 높은 쪽을 밝히고, 매체풍요도 이론에 따라 색상이나 이미지를 사용했을 경우와 그렇지 않을 경우의 차이를 도출하고자 실험을 진행했다. 그 결과 데이터 시각화 요소의 활용이 사용자의 태스크 실행의도에 미치는 영향은 시각화 요소를 활용해 정보 전달을 할 경우가 그렇지 않을 경우보다 더 긍정적으로 나타남을 확인하였다. 추가로 정보인지도가 높을 수록 태스크 실행의도에 긍정적인 영향을 미치는 것으로 보아 향후 보다 많은 사용자들이 불편함 없이 가치있는 데이터를 활용할 수 있도록 다방면의 연구가 필요하다고 제안하는 바이다. Among the smart home service, fine dust and indoor air quality data closely related to our daily life. I conducted a research to determine whether the presence of data visualization elements in information delivery has a noticeable effect on information awareness and execution intent for a given task. For this, according to the medium richness theory, which is the basis of the study, and through the preliminary studies, the image and color of the data visualization elements were set as independent variables and the fine dust sensitivity which can affect the results were set as the control variables. After that, subjects were divided into 4 groups according to each independent variable and examined the degree of information awareness and the intention to perform 'ventilation' task. As a result, it is confirmed that the use of data visualization elements affect user 's intention of task execution more positively than without. Fortunately, data analysts field and global corporations are leading the way by researching and presenting 'accessibility' guides on IT technologies such as web and mobile, to build an improved user experience for everyone and to change overall social awareness. As a result, the problem of visualization of data and information is expected to be solved gradually, but it is still focused on 'visualization' and this is also one of the biggest limitations of this study. However, I hope that this study will contribute to bring more interests of given subject and therefore everyone should be able to freely use data and information regardless of their environment and physical condition.

      • 불균형 정형데이터 문제 해결을 위한 SMOTE와 CycleGAN 기반 하이브리드 오버샘플링 기법 개발 및 적용 : 금융사기를 중심으로

        노정담 국민대학교 일반대학원 2020 국내석사

        RANK : 248671

        현대 사회는 사람의 행동 하나가 데이터가 되며 이는 곧 엄청난 데이터의 흐름을 만든다. 20년 전 인터넷 속 전체 데이터의 양이 현대 사회 속에서는 1초마다 저장된다. 이러한 추세는 앞으로 더욱 더 심화될 것이며 이러한 빅데이터를 활용하기에 따라서 엄청난 이점을 줄 수 있을 것으로 판단된다. 이러한 데이터의 분석을 위해서는 편향되지 않은 데이터가 필요한데 대부분의 빅데이터는 한쪽으로 편향인 불균형 상태며 이는 분석의 정확도를 떨어뜨리는 원인 중 하나이다. 또한 2종 오류의 비용이 큰 분야에서는 불균형 데이터를 사용한 분석을 믿을 수 없는 실정이기 때문에 이러한 문제점을 해결하는 것은 매우 중요하다. 정형 데이터 분야에서는 이러한 문제점을 해결하기 위해서 전통적인 방식의 오버샘플링이 발전해왔고 비정형 데이터에서는 딥러닝의 발전과 더불어 발전한 생성 모델이 불균형 문제의 해결책으로 떠올랐다. 기업에서 현재 상황을 이용하여 미래를 예측하는 일은 매우 중요하고 어려운 일이다. 이러한 문제를 해결하기 위해 대부분의 기업에서는 통계기반의 머신러닝을 이용하고 있다. 통계기반의 머신러닝을 이용한 예측에서 중요한 점은 편향되지 않은 양질의 정형데이터이다. 본 연구에서는 비정형 데이터에서 오버샘플링을 하기 위해 자주 사용하는 생성 모델인 CycleGAN을 정형 데이터에 맞게 변형시켜 TDOGAN을 만들었다. 오버샘플링과 TDOGAN을 이용해 편향되지 않은 양질의 정형 데이터를 만들어 냈다. PCA를 사용하여 개인정보를 가린 실제 금융사기 데이터에 본 논문에서 제안하는 하이브리드 오버샘플링 기법을 적용하였다. In modern society, one person's actions become data, which creates a huge flow of data. Twenty years ago, the total amount of data on the Internet is stored every second in modern society. This trend is expected to intensify in the future, and the use of such big data will bring enormous advantages. The analysis of such data requires unbiased data, and most of the big data is unbalanced, which is one of the reasons for lowering the accuracy of the analysis. It is also very important to solve this problem because the analysis using unbalanced data is unreliable in the field where the cost of type 2 error is high. In the field of structured data, traditional oversampling has evolved to address these problems, and in unstructured data, the generation model developed with the development of deep learning has emerged as the solution to the problem of imbalance. It is very important and difficult for companies to use the current situation to predict the future. To solve these problems, most companies are using statistics-based machine learning. An important aspect of forecasting using statistics-based machine learning is unbiased, quality structured data.In this study, the cycleGAN, a often used generation model for oversampling in unstructured data, was modified to fit the structured data to create TDOGAN. By using OVER-sampling and TDOGAN, it has produced high-quality structured data that is not biased. The hybrid oversampling technique proposed in this paper has been applied to actual financial fraud data covering personal information using PCA.

      • 연관 분석 알고리즘의 분석 및 개선 : Apriori 알고리즘 개선을 중심으로

        허침 건국대학교 대학원 2023 국내석사

        RANK : 248671

        사회의 진보와 생산성이 지속적으로 향상됨에 따라 컴퓨터 기술도 지속적으로 혁신되고 대중화되었으며 기업의 정보 수집 능력도 크게 향상되었으며 데이터의 규모는 전례 없는 규모에 도달했다. 이러한 방대한 데이터 정보에 대해 기업의 원래 기술과 도구는 더 이상 요구를 충족시킬 수 없으므로 이러한 데이터를 처리하기 위한 새로운 기술을 연구하고 개발해야 한다. 이제 컴퓨터 기술과 수학 이론을 바탕으로 방대한 양의 데이터를 자동으로 처리하고 가치 있는 정보와 지식을 마이닝 및 분석하여 실제 의사결정에 도움을 주는 풍부하고 강력한 데이터 마이닝 기술이 개발되었다. 이런 배경에서 탄생한 데이터 마이닝 기술은 실제 업무와 떼려야 뗄 수 없는 관계다. 현재 데이터 마이닝 기술은 기업 운영의 효율성과 수익을 향상시키기 위해 다양한 산업에서 널리 사용되었다. 또한 다양한 비즈니스 요구를 충족시키기 위해 데이터 마이닝 기술은 클러스터링, 분류, 연관 분석 및 시계열 분석과 같은 다양한 방향으로 개발되었다. 상관 규칙 분석은 데이터 마이닝 기술에서 더 중요한 연구 방향이다. 이 논문에서는 관련 규칙 알고리즘 분석에 중점을 둔 데이터 마이닝 기술을 자세히 소개하고 실험적 연구와 고전적인 Apriori 알고리즘을 개선한다. Apriori 알고리즘의 경우 가장 핵심적인 문제는 빈번한 아이템 셋을 생성하는 것이다. 이에 데이터베이스 압축, 후보 아이템 셋 축소, 규칙에 맞지 않는 아이템 셋 사전 선별 등의 방향으로 개선해 클래식한 Apriori 알고리즘을 기반으로 알고리즘의 효율성을 더욱 향상시킨다. 이론적 분석이 완료된 후 파이썬을 통해 개선된 알고리즘의 유효성을 검증하기 위한 실험을 수행할 것이다. With the progress of society and the continuous improvement of productivity, computer technology is constantly innovating and popularizing, the information collection ability of enterprises has also been greatly improved, and the scale of data has reached an unprecedented scale. For such a huge amount of data information, the original technology and tools of the enterprise can no longer meet the needs, so it is necessary to research and develop new technologies for processing these data. Now, based on computer technology and mathematical theory, rich and powerful data mining technology has been developed, which can automatically process massive data, mine and analyze valuable information and knowledge, and provide help for practical decision-making. The data mining technology born in this context is bound to be inseparable from the actual business. At present, data mining technology has been widely used in all walks of life to improve the operational efficiency and revenue of enterprises. In addition, in order to adapt to different business needs, data mining technology has developed in different directions, such as clustering, classification, association analysis and time series analysis and so on. Association rule analysis is an important research direction in data mining technology. This paper will introduce the data mining technology in detail, focus on the analysis of the association rule algorithm, and combine the experimental research and improvement of the classic Apriori algorithm. For the Apriori algorithm, the core problem is to generate frequent itemsets. In this regard, it can be improved by compressing the database, reducing the candidate item set, and pre-screening the itemsets that do not meet the rules, so as to further improve the efficiency of the algorithm on the basis of the classic Apriori algorithm. After completing the theoretical analysis, experiments will be conducted through python to verify the effectiveness of the improved algorithm.

      • 시민 참여형 공공문제해결과 데이터 퍼실리테이터의 역할 연구/ : 서울시 디자인거버넌스를 중심으로

        신동일 단국대학교 대학원 2018 국내석사

        RANK : 248671

        1948년 대한민국 정부가 수립되고 우리나라는 세계 11위의 경제 대국으로 성장하였다. 대략 70년만에 유례 없는 속도로 경제 성장을 이뤄내면서 대외적으로는 선진 국가 사례로 소개받고 있다. 그만큼 대한민국은 짧은 시간 내에 세계화, 정보화, 다원화를 급격하게 겪고 이뤄내면서 많은 변화의 소용돌이에 노출되고 겪고 있다. 하지만 언론이나 주변에서 매일 보고 소개받듯이 사회문제로 진통을 앓고 있는 것이 현실이다. 사회 문제 해결을 위해서는 정부와 시민들의 노력으로 진단하고 해결을 해야한다. 이럴 때, 문제 해결 능력이 필요한데, 세계경제포럼 평가(2016년 기준)에 따르면 한국 성인의 ‘문제해결 역량’은 OECD 평균 보다 낮은 12위를 기록했다. 문제를 해결해야할 주체인 성인들이 문제해결의 방법을 잘 모르고 있다고 평가되는 것이다. 최근 공공문제 해결을 위하여 많은 투자와 노력이 시행되고 있다. 서울시는 공공문제 해결을 위해 100억 단위에 투자를 하고 있고, 많은 공모전과 대회를 열어 공공문제 해결에 노력을 기울이고 있다. 서울시 공무원들이 직접 문제해결을 주도하는 경우도 있고, 시민들이 직접 참여하여 사회 문제 해결을 진행하는 프로젝트나 해커톤이 최근 들어 개최되고 진행되고 있다. 하지만 사회와 대학 교육에는 아직 문제해결 교육에 대한 부분이 활성화가 되어 있지 않은 부분이 많고, 시민들도 주먹구구식으로 문제 해결을 위해 참여하고 있는 경향이 있다. 이러한 배경 하에 본 연구는 공공 문제해결을 위해 시민이 직접 참여하여 공공 문제를 해결하는 사회적 흐름을 따라서 현재의 추세와 문제점을 분석하고 개선할 수 있는 프로세스를 제안하고자 한다. 먼저 공공문제해결의 개념과 시민 참여형 공공문제 해결 프로세스를 비교해 보았다. 그리고 6개월에 걸쳐서 직접 참여한 공공문제해결 프로젝트인 서울시 디자인거버넌스를 소개하고 실행 내용을 소개하겠다. 공공문제해결의 프로세스는 디자인씽킹(Design Thinking)을 적용하여 해결하였으며, 체계적인 프로세스를 통한 문제해결을 주도하여 해결하였다. 좀더 효율적인 프로세스 제안을 위해 이 프로젝트에 참가한 대상자들을 대상으로 필요한 역량을 설문 조사하였다. 프로젝트 참가 대상자가 뽑은 필요 역량은 회의 중개자 역할과 데이터 분석에 대한 역할이 였으며, 이런 역량을 가진 전문가인 퍼실리테이터와 데이터 분석가의 역량을 분석하여 공공문제해결을 위한 전문가를 새롭게 규정하여 새로운 공공문제해결 해결 프로세스를 제안하고자 한다. 새롭게 규정하는 전문가는 데이터 퍼실리테이터로서, 데이터분석가의 역량을 지닌 퍼실리테이터가 시민참여형문제 해결단에 같이 참여하여 회의 중개자와 데이터 분석을 보조하는 역할을 진행하게 된다. 결론적으로 본 연구는 최근 들어 늘어난 시민 참여형 공공문제 해결을 창의적 문제해결 방법론인 디자인씽킹(Design Thinking) 프로세스로 해결하고 매일 늘어가는 공공문제해결을 효과적으로 해결하기 위한 새로운 공공문제 해결 프로세스를 제안하는데 의의가 있다. 주제어 : 공공문제해결, 디자인씽킹, 서울시디자인거버넌스, 퍼실리테이터, 데이터분석가, 데이터 퍼실리테이터 In 1948, the Korean government was established and Korea became the 11th largest economy in the world. It has achieved economic growth at an unprecedented rate in about 70 years and has been introduced as an example of advanced countries. As a result, the Republic of Korea is suffering from a great deal of change, suffering from rapid globalization, information and diversification within a short period of time. However, as is the case in the media and in the surrounding areas, it is a reality that suffering from social problems. In order to solve social problems, it is necessary to diagnose and resolve by the efforts of the government and citizens. In this case, problem solving ability is needed. According to the evaluation of the World Economic Forum (2016), Korean adults 'problem solving ability' ranked 12th, lower than the OECD average. The adults who are the subjects to solve the problem are judged not to know how to solve the problem. Recently, a lot of investment and efforts are being made to solve public problems. The city is investing 10 billion units to solve public problems, and is making efforts to solve public problems by opening lots of contests and conventions. In some cases, Seoul government officials lead the problem solving process directly. In addition, projects and hacker tones are being held and carried out recently. However, there are many parts of society and college education that are not yet active in problem-solving education, and citizens tend to participate in problem-solving to solve problems. In this context, this study aims to propose a process to analyze and improve current trends and problems according to the social trends in which citizens participate directly to solve public problems and solve public problems. First, I compared the concept of public problem solving with the process of public participation problem solving. I will introduce the design governance of Seoul, which is a public problem solving project that I participated in for 6 months. The process of public problem solving was solved by applying design thinking, and solving the problem through systematic process. In order to propose a more efficient process, we surveyed the competencies needed for the participants in this project. The required competencies of the project participants were the role of meeting brokers and data analysis. By analyzing the competence of facilitator and data analysts who are experts in this field, Process. A newly defined specialist is a data facilitator and a facilitator with data analyst competency participates in the citizen participatory problem solving team to assist in the analysis of data with the meeting intermediaries. In conclusion, this study is meaningful to suggest a new public problem solving process to resolve the increasing public problem solving with creative thinking problem solving method (Design Thinking) have. Key words: Public Problem Solving, Design Thinking, Seoul Design Governance, Facilitator, Data Analyst, Data Facilitator

      • 관광시설의 입지가 관광객 방문에 미치는 영향 : 관광 빅데이터를 활용한 격자분석기법의 적용

        김보람 제주대학교 대학원 2022 국내석사

        RANK : 248671

        Ensuring that tourist facilities and services are efficiently supplied to satisfy the necessary demand is critical to constructing a reasonable tourist development plan that serves as a tool for regional development. In other words, both the supply side and the demand side of the tourism industry must be considered. In this regard, the types of tourism facilities required to meet the local demand must be thoroughly examined. However, tourism research has primarily focused on tourism demand in the tourism industry. Research on tourism supply is largely insufficient despite the significance of tourism facilities. Significantly, recent advances in technology have made it possible collect large amounts of data on tourists in real-time via smartphones, etc. In the tourism industry, big data can be utilized to comprehend visitor consumption patterns and service utilization characteristics. Further, in tourism research, the significance of big data analysis that incorporates spatial information is expanding, particularly because it is simple to assess the tourism phenomena’s spatial patterns utilizing big data. Therefore, this study experimentally investigated the effect of tourist facilities’ (tourist destinations, accommodation facilities, restaurants, and retail outlets) placement on tourists’ desire to visit, based on tourism big data, including spatial information and grid analysis techniques. Specifically, it performed an analysis from December 2020 to November 2021 using the Jeju Big Data Center’s floating population data and the card usage amount data. Additionally, it analyzed and visualized tourist patterns in Jeju using the GIS(Geographic Information System). Further, it attempted to empirically examine the impact of tourism consumption in relation to domestic tourist visits. The findings suggest that the number of domestic tourist visits increases in areas that have a large number of hotels, restaurants, and retail establishments. In addition, it suggests that tourism consumption increases with increasing domestic tourist visits. In conclusion, this study’s findings suggest that tourism development can contribute to balanced regional development by supplying tourism facilities that help attract tourists to relatively underdeveloped areas. Additionally, by analyzing the tourism phenomenon using big data, the study confirmed the possibility of establishing a more reasonable tourism development plan.

      • 모바일 웹 기반의 데이터 정보 시각화에 대한 연구 : 공공 데이터 기반으로

        유진아 단국대학교 대학원 2019 국내석사

        RANK : 248671

        스마트폰 기술의 발전과 보급의 대중화는 모바일을 통해 필요한 정보를 찾는 이용자들이 증가하고 있다. 과학기술정보통신부의 2018 인터넷 이용 실태조사에 따르면 인터넷 접속기기로 스마트폰이 94.3%로 비중이 매우 높다. 이용자들이 증가함에 따라 정부부처에서도 모바일 웹 환경에서 정책 또는 관련 데이터들의 정보를 시각화하여 이용자에게 전달하는 추세이다. 정부부처 업무수행 및 홍보활동 중 정책 홍보활동에 대한 조사결과에 따르면 정부의 정책 정보나 홍보물을 접하는 경로가 스마트폰이 60%로 가장 높고 TV 55%, 컴퓨터 42% 순으로 나타났다. 스마트폰으로의 정보의 집중 양상이 유지되는 등 매체의 영향력이 압도적으로 유지되고 있다. 이에 따라 모바일로 정보를 습득하는 사용자가 많음으로써 효과적인 정보의 전달은 중요해지고, 정보의 의미를 정확하고 가장 빠르게 전달하는 효과적인 방법은 무의식적으로도 즉각적인 인지가 가능한 이미지 혹은 그림으로 제공하는 방법이다. 정보를 시각화하여 전달하는 정보와 사용자 간의 상호작용이 원활한 인포그래픽이 주목받고 있다. 이에 본 연구에서 유형 별 인포그래픽 대상으로 연구를 진행하였다. 본 연구는 선행연구 조사를 통해 공공데이터의 정보 시각화 역할 및 필요성을 파악하고, 효과적인 정보의 이해와 전달을 위한 정보 시각화의 표현 요소와 정보 시각화의 인지부하 실험도구를 도출하고, 사례조사 및 분석 통해 공공데이터의 인포그래픽 유형 별 사례를 선정하고, 공공데이터의 인포그래픽 유형 별 정보 시각화의 표현 사례를 분석하였다. 공공데이터의 효과적 전달을 위한 시각화에 있어 중요하게 고려해야 할 요인을 연구하기 위해 20~30대 청년세대를 대상으로 설문조사를 실시하였고, 연구목적을 달성하기 위해 설문조사 결과를 바탕으로 IPA를 수행하였다. 또한 모바일 웹 환경에서 인포그래픽의 유형 별 정보 시각화 정도가 공공데이터의 효과적인 전달을 목적으로 하는 학습과 인지에 어떠한 영향을 미치는지 그 결과를 도출하기 위해 인지부하 설문문항을 활용하여 실험조사를 진행하여 설문조사를 바탕으로 결과를 분석하였다. 본 연구는 인지부하를 고려한 공공데이터의 효과적인 정보 전달을 위한 정보시각화에 주목하였다. 이를 위해 공공데이터 기반의 인포그래픽을 유형 별 수집 및 분석하였다. 수집된 자료는 유형에 의해 정리된 후, 정보시각화 표현 기준 바탕으로 분석 되었다. 따라서 본 연구의 결과는 다음과 같다. 첫째, 공공데이터의 효과적인 전달을 위해 정보 시각화에서 명확한 데이터를 통해 식별이 용이한 화면의 구성이 우선적으로 필요하다. 적당한 그래픽 요소는 유형에 따라 활용하면 사용자가 더욱 쉽게 정보를 습득하고 이해할 수 있다. 공공데이터의 정보시각화는 인포그래픽으로 표현함으로써 텍스트로 이미지 등 정보유형에 따라 다양하게 표시할 수 있다. 뿐만 아니라 배경 이미지를 잘 활용하면 효과적인 정보 전달과 사용자의 흥미를 유발할 수 있다. 둘째, 공공데이터의 효과적인 전달을 위해 정보 시각화에서 유용한 콘텐츠의 제공이 필요하다. 공공데이터는 정부 또는 공공기관이 보유하는 있는 데이터로서 사용자의 전반적인 생활 편의성 확보와 이를 기반으로 한 정책참여 등 다양한 기능을 제공하고 있다. 따라서 교통, 기상, 의료, 경제, 환경, 여가 등에서 사용자의 일상생활에 직접적으로 관련이 될 수 있는 콘텐츠의 시각적 위계 설정과 시간적, 공간적, 분야별 변화를 나타냄으로써 현재의 상황을 용이하게 파악할 수 있는 유용한 콘텐츠 등의 제공이 필요하다. 셋째, 공공데이터의 효과적인 전달에서 필요한 사용자의 신체적, 정신적 부담을 줄이고, 데이터의 이해도를 증가하기 위해서는 정보에 대한 흥미유발과 메타포를 형성할 수 있는 정보의 시각화가 필요하다. 즉, 정보에 대한 이해를 돕기 위해 은유 또는 비유에 대한 시각화를 통해 사용자의 흥미를 유발할 수 있어야 한다. 이를 위해 주로 활용할 수 있는 인포그래픽을 통한 정보의 시각화 방안은 캐릭터 등의 만화적 요소를 활용하거나 일상생활과 관련된 행동, 심리 등을 활용한 정보, 두 가지 이상의 정보 유형이나 개념을 비교함으로써 사용자의 이해를 돕는 것이 필요하다. 넷째, 공공데이터의 효과적인 전달을 위해 사용자의 신체적, 정신적 측면에서 인지 부하를 감소시킬 수 있는 정보의 시각화가 필요하다. 이를 위해 일상생활이나 어떠한 행동이나 직업, 심리 등과 관련된 흥미성 자료를 기반으로 한 정보를 중심으로 캐릭터 등의 만화적 요소를 활용하여 정보를 전달하여 신체적, 정신적 측면에서 피곤하지 않고 직관적으로 흥미성을 주는 시각화가 필요하다. 다섯째, 공공데이터의 효과적인 전달을 위해 사용자의 이해가 용이한 내용 및 구성을 위한 정보의 시각화가 필요하다. 이를 위해 공공데이터에 대해 시간적 전개, 경로의 전개를 통해 전반적인 사항을 포괄적으로 이해할 수 있는 스토리텔링 방식의 정보 시각화가 필요하다. 또한 제품 또는 개념을 두 가지 이상 비교하는 방식인 비교분석형의 정보 시각화가 필요하다. As the development and popularization of smartphone technology become popular, users are looking for information through mobile. According to a survey by the Ministry of Science and Technology (MIC) on Internet usage by 2018, smartphones accounted for 94.3% of the total number of Internet access devices. As the number of users increases, government ministries also tend to visualize policy and related data in the mobile web environment and deliver it to users. According to the results of public relations activities conducted by government ministries and agencies, 60% of the respondents had access to government policy information or publicity materials, followed by 55% of TVs and 42% of computers. The influence of the media on smartphones has remained intact. As a result, there are many users who acquire information through mobile, so that effective information transfer becomes important, and an effective method of conveying the meaning of information accurately and fast is a method of providing images or pictures that can be unconsciously recognized immediately. Infographics, which are easy to interact with information and information that visualize and deliver information, are attracting attention. In this study, the study was carried out as an infographic for each type. The purpose of this study is to identify the role and necessity of information visualization of public data through previous studies and to derive cognitive load experiment tools of information visualization and information visualization for effective understanding and transmission of information, The case of infographic type of public data was selected and the case of information visualization by infographic type of public data was analyzed. In order to investigate the factors that should be considered important in visualization for effective transmission of public data, a questionnaire survey was conducted for young people in their 20s and 30s, and an IPA was conducted based on the survey results to achieve the research purpose . In addition, in order to derive the effect of information visualization level of infographic in mobile web environment on learning and cognition that is aimed at effective transmission of public data, we conducted experiment survey using cognitive load questionnaire The results were analyzed based on the survey. This study focuses on information visualization for effective information transmission of public data considering cognitive load. For this purpose, we collected and analyzed infographic of public data based on type. The collected data were analyzed by type and then based on information visualization expression standard. The results of this study are as follows. First, in order to efficiently transmit public data, it is necessary to construct a screen that can be easily identified through clear data in information visualization. Proper graphical elements can be more easily learned and understood by users if they are based on type. Information visualization of public data can be displayed variously according to the type of information such as text and images by representing it in infographic form. In addition, the use of background images can lead to effective information transmission and user interest. Second, it is necessary to provide useful contents in information visualization to efficiently transmit public data. Public data is the data held by the government or public institutions and provides various functions such as ensuring the user's overall life convenience and participating in policies based on the data. Therefore, visual hierarchy of contents that can be directly related to user's daily life in transportation, weather, medical, economic, environment, leisure, etc., and time, space, It is necessary to provide contents and the like. Third, in order to reduce the physical and mental burdens of users in order to efficiently transmit public data and to increase the understanding of data, it is necessary to visualize information that can induce interest in information and form a metaphor. In other words, to help understand the information, it is necessary to visualize the metaphor or metaphor to induce the user's interest. The information visualization method that can be used mainly for this purpose is to utilize comic elements such as characters, information using behavior related to daily life, psychological information, comparing two types of information or concepts, It is necessary to help. Fourth, in order to efficiently transmit public data, it is necessary to visualize information that can reduce the cognitive load in the physical and mental aspects of users. To do this, visualization is used to convey information by using comic elements such as characters, focusing on information based on interesting data related to everyday life or any behavior, occupation, psychology, etc., so that it is not tired and intuitively interesting in physical and mental aspects. Fifth, in order to efficiently transmit public data, it is necessary to visualize information for user's easy understanding and composition. For this, information visualization of storytelling method is needed to comprehensively understand the overall contents through temporal development and development of public data. In addition, information visualization of comparative analysis type which is a method of comparing two or more products or concepts is needed. visualization for effective information transmission of public data considering cognitive load. To do this, we collected and analyzed infographic of public data base. The collected data were analyzed by type and then based on information visualization expression standard. The results of this study are as follows. First, in the first half, the result that the visualization factor of information is important about clarity, contents, screen composition, and interest inducing factor is derived, so that it is based on information that is interesting to the user, In order to be easy to understand and use, it is necessary to provide an easy-to-understand format using visualization to make it easier to communicate to general users.

      • 영상과 텍스트 정보의 결합을 통한 가짜뉴스 탐지 연구 : 유튜브를 중심으로

        장윤호 국민대학교 일반대학원 2021 국내석사

        RANK : 248671

        최근 소셜미디어(Social Media)를 활용한 뉴스 소비가 급격하게 증가하고 있다. 소셜미디어를 활용한 뉴스 소비는 개인의 기호에 보다 적합한 뉴스를 보다 쉽게 파악할 수 있을 뿐 아니라 이를 다른 사람과 쉽게 공유할 수는 장점이 있는 것도 사실이다. 그러나 소셜미디어를 통한 뉴스의 소비는 출처가 불명의 잘못된 정보에 기반한 가짜뉴스의 생산과 확산이라는 위험 또한 증대시키고 있다. 가짜뉴스로 인한 사회적 혼란과 경제적 비용으로 인해 지금까지 가짜뉴스의 탐지와 관련한 다양한 연구가 진행되어 왔다. 그러나 이러한 기존 연구는 소셜미디어의 활용이 유튜브와 같은 영상 기반으로 빠르게 전환되고 있음에도 불구하고 뉴스나 소셜미디어 상의 텍스트를 기반으로 이루어져 왔다는 점에서 한계가 있다. 이러한 기존 연구의 한계를 극복하기 위해 본 연구에서는 유튜브를 기반으로 영상 정보와 텍스트 정보를 함께 활용함으로써 가짜뉴스 탐지를 위한 성능을 개선하고자 하였다. 본 연구의 목적 달성을 위해 ‘SNU Factcheck’와 유튜브의 관련 영상으로부터 수집된 데이터를 기반으로 5가지 분류 모델을 활용하여 1) 텍스트 데이터 2) 메타 데이터 3) 표정 점수 4)텍스트 데이터 + 메타데이터 5) 텍스트 데이터 + 표정 점수 6) 메타 데이터 + 표정 점수 7) 텍스트 데이터 + 메타 데이터 + 표정 점수의 7가지 특성(feature) 조합을 비교하였다. 분석 결과 영상 데이터를 통해 확보한 표정 점수가 가짜뉴스 탐지 성능을 일정 정도 개선하고 있음을 확인할 수 있었다. 본 연구는 기존 연구와 달리 최근 뉴스 소비의 도구로 사용이 증가하고 있는 영상 데이터를 활용함으로써 텍스트 위주의 기존 가짜뉴스 탐지 연구의 폭을 넓혔다는 점에서 그 의의가 있다. Recently, news consumption using social media is rapidly increasing. It is true that news consumption using social media not only makes it easier to identify news that is more appropriate to individual tastes, but also has the advantage of sharing it with others easily. However, the consumption of news through social media also increases the risk of producing and spreading fake news based on misinformation from unknown sources. Various studies have been conducted on the detection of fake news so far due to social confusion and economic costs caused by fake news. However, these existing studies have limitations in that they have been based on text on news and SNS(Social Networking Service), even though the use of social media is rapidly shifting to video-based social media such as YouTube. To overcome the limitations of these existing studies, this work aims to improve performance for detecting fake news by using video information and text information together based on YouTube. To achieve the objectives of this study, we compare a combination of 1) text data 2) metadata 3) facial score 4) text data + facial score 6) metadata + facial score 7) text data + meta data + 7 features of facial score, using data collected from relevant images on 'SNU Factcheck' and YouTube. As a result of the analysis, it was confirmed that facial expression scores obtained through video data were improving the performance of detecting fake news by some degree. Unlike existing studies, this study is significant in that it has expanded the scope of existing text-oriented fake news detection research by utilizing video data, which has been increasing in use as a tool for news consumption recently.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼