http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
경정익 한국부동산경영학회 2014 부동산경영 Vol.10 No.-
빅데이터는 새롭게 출현한 기술이 아니라 종전의 다양한 분석기술의 연장이라 할 수 있다. 다만 종전의 분석기법과 차이점은 앞에서 살펴 본 바와 같이 빅데이터의 특성인 V3+C(규모, 다양성, 속도, 복잡성)에서 찾아 볼 수 있다. 이러한 빅데이터 분석은 부동산문제 해결을 위한 기술적·경제적·법률적 측면의 부동산 현상을 분석하기 위한 최적의 기술이다. 따라서 부동산 문제 해결을 위한 다양하고 대규모의 데이터를 수집하여 분석하여 부동산의 정책, 개발, 매매, 중개, 가격결정 등에서 효율성을 높일 수 있는 것이다. 이와 같이 빅데이터의 특성은 부동산의 특성과 깊은 연관성이 있어 빅데이터는 부동산분야의 제반 문제를 효율적으로 해결하는 최적의 기술이라는 것을 본 연구의 STEEP분석과 연관성 분석을 통해 확인하였다. 따라서 부동산 정책 추진, 부동산 시장 분석, 부동산평가, 부동산의 제반 활동의 의사결정 등 빅데이터를 부동산에 활용할 수 있는 대표적인 방안을 제시하였다. 또한 향후 빅데이터 활용을 더욱 확대하기 위한 정책적 제안을 제시하였다. Big data can be referred to the newly emerged technology as an extension of the traditional variety of analytical techniques. However, conventional analyzers laws difference V3 characteristics of Big Data + C can be found in (volume, velocity, variety and complexity). The Big Data analysis is the best technique for analyzing the technical, economic and legal aspects of real estate developer for solving real estate problems. Thus for solving various real estate issues and collect and analyze large amounts of data, which can increase the efficiency of real estate, etc. policies, development, marketing, mediation, pricing. Characteristics of big data thus there is a deep association of real estate properties and Big Data were examined by STEEP analysis and correlation analysis of this that the best technology to solve various problems in the real estate sector to efficiently research. Therefore, the real estate policy implementation, real estate market analysis, real estate appraisal, real estate decisions in various activities, such as doctors suggest the typical ways that you can take advantage of Big Data in Real Estate. Also presented a policy proposal to expand the use next big data.
옥진아,조무상 경기연구원 2016 정책연구 Vol.- No.-
경기도에서도 2015년 빅파이사업의 일환으로 10개의 빅데이터 분석과제를 추진하였고, 2016년 올해는 2개의 확산사업, 1개의 융합 확산사업과 3개의 신규사업을 추진하고 있다. 뿐만 아니라, 기초 지자체에서도 각 지자체에서 필요에 의해 빅데이터 분석을 하고 있지만, 개별로 추진하다보니, 빅데이터 분석 사업에 대한 공유체계가 마련되어 있지 않아, 비슷하거나 같은 주제임에도 표준화된 모델없이 개별 분석 틀에 따라 추진되는 경우도 많고, 분석결과에 대해 어떻게 활용(적용)되었는지 알 수 없는 문제도 있다. 실제 경기도 지자체 빅데이터 분석사업 추진 담당자와 실무부서 설문조사결과에서도 과학적인 정책지원을 위해 빅데이터 분석이 필요하다고 인지하고 있지만, 실제로 빅데이터 분석사업을 추진할 전문인력도 없고, 빅데이터 분석 사업을 어떻게 추진해야 하는지, 어떤 분석을 해야하는지 등 사업발굴과 분석에 대해 어려움을 겪고 있는 것으로 나타났다. 또한, 현재 각 시 · 군에서 같은 내용임에도 개별적으로 분석사업을 추진하다보니 비용적 측면에서 비효율적이기 때문에 경기도 차원에서 통합적으로 분석하거나 공통의 틀(플랫폼)에 대한 요구가 있었다. 경기도는 각 실국 및 지자체 분석 수요에 대한 수시대응하고 시범사업을 통해 분석된 결과를 토대로 지속가능한 정책지원을 위해 빅데이터 분석플랫폼에 대한 도입전략을 마련해야한다. 빅데이터 분석플랫폼은 데이터 통합관리 기능, 분석을 위한 표준모델, 표준단위, 분석기술, 정책지원기능이 필요하다. 빅데이터 사업을 기획하고 시범사업을 통해 분석결과를 피드백하고 업무에 내재화할 수 있는 시스템으로 구축되어야한다. 빅데이터 분석을 위해서는 데이터 통합관리 체계가 필요하고, 공공데이터와 민간데이터들을 수집, 분류, 정체, 표준화하여, 다양한 분석을 위한 데이터 마트를 구축해야한다. 데이터를 수집 · 구축할 때, 분석의 내용 및 결과를 고려하여 분석을 위한 표준 단위(블록)를 구축하는 것이 중요하다. 경기도 분석플랫폼 차원에서 지역을 세분화하여, 어떤 분석을 할 것인가에 따라 세분류, 중분류, 대분류 단위의 표준 블록을 구축을 하고, 공통된 블록에 각 데이터를 구축할 수 있는 환경을 제공해야 한다. 경기도 빅데이터 분석플랫폼을 도입하고 운영하기 위해서는 정책지원을 위한 빅데이터 분석플랫폼 운영에 있어서의 역할구분도 중요하다. 또한 경기도는 빅데이터 분석플랫폼을 통해서 데이터 통합관리 및 표준화하여, 이를 활용하여 다양한 분석업무를 수행할 수 있도록 지원해야할 것이며, 지속적인 모니터링과 피드백을 통해서 빅데이터 분석결과를 업무에 내재화될 수 있는 체계를 마련해야한다. 분석을 위한 플랫폼과 서비스는 경기도 빅파이추진단이 그 역할을 해야 할 것이고, 기초지자체에서는 필요한 분석내용과 관련된 데이터를 제공하고, 공동 분석에 대한 협업방안은 함께 고려해야한다. 경기도 빅데이터 분석플랫폼은 “데이터수집– 분석– 예측– 정책반영– 현안적용”되는 선순환체계(생태계)가 조성되어야 한다. 더 이상 분석을 위한 시스템이 아닌 실무에서 활용할 수 있는 시스템이 구축되어야 하며, 각 지자체에서는 경기도에 의견 및 요구사항을 제시하고, 경기도에서는 빅데이터에 대해 소통하고 공유할 수 있는 장을 마련해야 할 것이다.
함수형 자료를 통한 함수형 데이터 분석과 다변량 데이터 분석 비교
안경민 한국데이터정보과학회 2022 한국데이터정보과학회지 Vol.33 No.5
함수형 데이터 분석 (Functional data analysis)이란 함수들로 이루어진 자료를 분석하는 이론이다. 특히 시간에 따라 측정되고 관측된 데이터 분석에 있어서 함수형 데이터 분석은 기존의 단순히 점들로 이루어진 다변량 데이터 분석 (Multivariate data analysis)과 다른 접근을 필요로 한다. 즉, 함수형 데이터 분석은 힐베르트 (Hilbert) 공간에서 데이터를 다루기 때문에, 기존의 유클리디안 공간에서 다루어 왔던 다변량 데이터 분석과 이에 맞게 쓰이는 여러 통계 방법론들을 동일하게 적용할 수 없기에 재정의를 해야 한다. 이러한 이유로 함수형 데이터 분석의 다양한 통계 방법론들은 다변량 데이터 분석의 방법론들과 비교했을 때 서로 다른 분석 및 예측 결과를 낳았고, 특히 함수형 자료에 있어서는 월등히 좋은 결과를 도출해 냈다. 하지만 이러한 함수형 자료에 왜 함수형 데이터 분석이 적용되어야 하는지, 그리고 다변량 데이터 분석이 적용되었을 때 그 결과와 성능에 있어서 어떤 차이가 있는지는 크게 다룬 논문이 없다. 따라서 본 논문에서는 다양한 함수형 자료를 이용해서 함수형 데이터 분석과 다변량 데이터 분석을 적용했을 때의 결과와 성능을 회귀 모형을 이용하여 비교 및 분석한다.
학습분석학적 접근을 통한 방송고 학습자의 학습행태 분석 및 이수 여부에 미치는 영향요인 분석
이은주 고려대학교 교육문제연구소 2019 敎育問題硏究 Vol.32 No.4
This study intends to identify learning behaviors of Open High school learners by analyzing accumulated learning log data while operating online class contents of Open High School during the first semester of 2018, and to analyze variables affecting the completion of learners' learning behavior. For this purpose, 998,620 data of 3098 people are finally analyzed by classifying only IDs having all of learner basic data, learning activity data, and operational data among 100,900 log data on the system. As a result of the analysis, Tuesday shows the highest frequency of learning, but there is no significant difference from other days of the week. Next, as a result of analyzing gender and age completion rate, the group with the lowest completion rate is the male group in 30s, and the group with the lowest score on the formative evaluation is the male group in the 30s. As a result of examining the difference in the formative evaluation scores according to the access to March, the results of the formative evaluation are significant according to the access to March. Logistic regression analysis was conducted to find out that the number of learning cycles in March, the average number of learning per session, and the average of formative evaluation are all factors that contributed to the completion. Through this study, it is necessary to prepare a customized learning support service plan according to learner's learning behavior and suggest that additional data should be collected for more indepth analysis of learner's learning behavior. 학업과 관련된 데이터를 수집하여 학습자의 수행을 예측하고 잠재적 쟁점을 찾아내는 데 중점을 두고 있는 학습분석학은 객관적인 데이터를 근거로 수행된다는 측면에서 교육 학습 환경을 바꿀 수 있는 미래 기술로 주목받고 있다. 이에 본 연구에서는 방송고의 온라인 수업 콘텐츠를 2018년 1학기 동안 운영하면서 쌓인 학습 로그 데이터를 분석하여 방송고 학습자의 학습 행태를 규명하고 학습자의 학습 행태 중 이수에 영향을 미치는 변인을 분석하고자 하였다. 이를 위해 시스템 상 로그데이터 100,900개의 데이터 중 학습자 기본 데이터, 학습활동 데이터, 운영 데이터 모두를 갖고 있는 ID만 분류하여 3098명의 961,620개의 데이터를 최종 분석하였다. 분석 결과 요일별 학습 빈도는 화요일이 가장 높은 빈도를 보였으나 다른 요일과 큰 차이는 없었고 시간대별 학습 빈도를 살펴본 결과 주중과 주말 모두 오전보다는 오후 시간대에 학습 빈도가 높게 나타났다. 다음으로 성별, 연령별 이수율을 분석해본 결과 이수율이 가장 낮은 집단은 30대 남성 집단이었으며 형성평가 평균 점수 역시 가장 낮은 집단이 30대 남성 집단이었다. 3월 접속 여부에 따른 형성평가 점수 차이를 살펴본 결과 3월 접속 여부에 따라 형성평가의 점수 차이가 유의미한 것으로 나타났으며 마지막으로 방송고 학습자의 학습 행태 요인 중 이수에 영향을 미치는 독립 변인이 무엇인지 알아보기 위해 로지스틱 회귀분석을 실시한 결과 3월 학습 회차 수, 회차당 평균 학습 횟수, 형성평가 평균 점수 모두 이수에 영향을 미치는 요인인 것으로 분석되었다. 본 연구를 통해 학습자의 학습 행태에 따른 맞춤형 학습 지원 서비스 방안을 마련할 필요가 있으며 학습자의 학습 행태에 대한 좀 더 심도있는 분석을 위해 추가적인 데이터를 수집해야 함을 제안하였다.
세계 연구의 의미망분석을 통한 공공재로서 빅데이터 생태계 설계
박장호(JangHo Park),문혜정(HyeJung Moon) 한국경영학회 2017 한국경영학회 통합학술발표논문집 Vol.2017 No.08
빅데이터는 특정인에게 점유될 수 없는 비배제성(非排除性)과 사용으로 인해 효용가치가 낮아지지 않는 비경합성(非競合性)을 지니고 있기 때문에 수도, 태양, 공기처럼 정부가 정책적으로 개입해야 하는 대표적인 공공재(公共財)라 할 수 있다. 이 논문은 공공재의 관점에서 빅데이터 산업에 관한 정책을 설계하기 위하여 세계의 빅데이터 관련 선행 논문을 대상으로 빅데이터분석을 수행하였다. 연구대상으로 사회과학연구 데이터베이스 회사인 Web of Science에서 제공하는 `big data` 관련 선행문헌을 수집하였다. 연구절차는 네트워크분석을 통해 주요 연구분야를 탐색하고, 시맨틱분석을 통해 연구분야별 주제와 테마를 분석하였다. 분석도구는 네트워크분석을 위해 NodeXL을, 시맨틱분석 수행을 위해 KhCoder를 사용하였다. 분석 결과, 빅데이터와 관련된 주요 연구의 테마는 하둡, 분석, 클라우드, 소셜, 모바일, 개인정보보호, 건강, 정책 등 이었으며 우리는 이러한 연구들이 정책과 소셜 부문의 연구를 통하여 상호 순환되고 있음을 확인했다. 공공재의 관점에서 각 연구 주제의 특성을 분석한 결과 데이터 구조, 정책 수단 및 시장 규제의 세 가지 기준으로 구조화함으로써 빅데이터 기술을 기반으로 서비스 시장을 구성하고 콘텐츠를 활용하여 정치적으로 관리 할 수 있는 생태계를 구축하고 있다. 빅데이터 시장을 활성화시키기 위해서는 기술 및 서비스 시장뿐만 아니라 비즈니스 부문의 정책 결정자 및 데이터 관리자들이 참여하는 것이 절대적으로 필요하다. 따라서 공공 정책의 관점에서 빅데이터 산업에 대한 투자, 활용 및 관리에 노력할 필요가 있다. Big data has characteristics of a non-excludability that cannot be occupied by a specific person, and a non-rivalry that does not lower utility value due to use. It is a representative public goods (public goods) controlled by government by perspectives of public policy. In this paper, big data analysis was conducted on the big data related papers of the world in order to design public policy on the big data industry from the perspective of public goods. For collecting research data, we use the `big data` related studies provided by Web of Science, a social science research database company. The research process was conducted from network analysis for exploring study domain, semantic analysis for finding issue and theme and literature review for understanding the context. As an analysis tool we used NodeXL for network analysis and KhCoder for semantic analysis. Results of Analysis showed major research themes related to big data were hadoop, method, analysis, cloud, social, mobile, privacy, health and policy, and we confirmed that these researches are mutually circulated through policy and social. As a result of analyzing the characteristics of each research theme from the point of view of public goods, and structuring it with three criteria of data structure, policy tool and market regulation, an ecosystem that can be managed politically is being constructed by organizing service market based on big data technology and utilizing contents. In order to revitalize the big data market, it is absolutely necessary to participate not only in the technology and service market, but also in the policy makers and data curators at business sector. Therefore, it is necessary to make effort to invest, utilize and manage about big data industry with the perspective of public policy.
데이터 기반 사용자 여정 분석 도구 UX 디자인 개선 방안 제안 뷰저블 애널리틱스(Beusable Analytics)를 중심으로
정지현,김서연,박민희,이지현 인제대학교 디자인연구소 2022 Journal of Integrated Design Research (JIDR) Vol.21 No.4
Background : With the recent growth of big data and the advancement of data analytics, the importance of data-informed UX design is being highlighted. As the need for more sophisticated analyses on user needs and behavior patterns, a great variety of analysis methods were developed. But, there is a lack of study that focuses on detailed data exploration and analysis based on interaction designs that implement such concepts for the moment. Methods : Beusable Analytics, data-informed user journey analysis tool in South Korea, as a research subject to improve user experience based on data analysis. First, this study conducted literature review to understand about the User Journey Map, Funnel Analysis, Data Visualization types and Flow factors for Data Analytics. data visualization types and interaction methods of data informed user journey analysis tools were analyzed. Afterwards, expert evaluation was conducted, and major problems and design improvements were proposed by analyzing the evaluation contents and measuring priorities. Results : Finally, four improvements were proposed as wireframe and key path scenario to improve the ‘limitation of the overall view of the entire journey', ‘lack of storytelling of the journey’, ‘Difficulty in recording and interpreting data‘ and ‘difficulty in identifying variability'. Conclusion : This study proposes ways to improve user experience by considering User Experience such as UI (User Interface) and Interaction for UX designers who want to derive insights by analyzing user journey data. Analysis results of user journey analysis tools and expert evaluations are meaningful in that they confirmed the behavioral patterns and functional requirements of practical UX designers during data analysis. It is expected to be used as a useful resource for the usefulness of the existing user journey analysis tool has been improved through the design improvement plan, and it is expected to be applied and used as an additional function of the user journey analysis tool that provides not only viewable analytics but also funnel analysis. 연구배경 : 최근 빅데이터 관련 기술의 성장과 데이터 분석 솔루션의 고도화로 인해 데이터 기반 UX 디자인의 중요성이 더욱 크게 부각되고 있다. 고객의 니즈와 행동 패턴의 정교한 분석이 점점 더 중요해지며, 다양한 분석 방식이 개발되었지만 국내에서는 아직까지 이를 구체화한 분석 도구의 개발과 인터랙션 디자인 기반 데이터 탐색 및 분석에 초점을 맞춘 연구는 미비한 실정이다. 연구방법 : 본 연구는 데이터 기반 사용자 여정 분석 도구의 사용자 경험 향상을 위한 디자인 개선 방안을 제안하고자 상용화되어 있는 사용자 여정 분석 도구 중 국내 서비스인 뷰저블 애널리틱스(Beusable Analytics)를 연구 대상으로 선정하였다. 우선 문헌 연구를 통해 사용자 여정 지도와 퍼널 분석에 대해 파악하고, 국내외 사용자 여정 분석 도구의 데이터 시각화 유형 및 데이터 분석을 위한 인터랙션 방식에 대해 분석하였다. 전문가 평가를 진행하여 뷰저블 애널리틱스의 사용성을 진단하고, 평가 내용 분석과 우선순위를 측정하여 주요 문제점과 디자인 개선 사항을 제안하였다. 연구결과 : 결과적으로 ‘여정 전체 조망의 한계’, ‘여정의 스토리텔링 전달 부족’, ‘데이터 기록 및 해석의 어려움’, ‘변동성 파악에 대한 어려움’ 총 4가지 주요 문제점과 디자인 개선 사항의 와이어프레임(Wireframe)과 핵심 경로 시나리오(Key path scenario)를 제안하였다. 결론 : 본 연구는 웹 페이지 내 사용자 여정 데이터를 분석하여 인사이트를 도출하고자 하는 IT 실무자가 효율적으로 데이터를 탐색하기 위한 UI(User Interface) 및 인터랙션(Interaction) 등의 사용자 경험적 측면을 고려하여 경험 향상 방안 제안을 목적으로 진행되었다. 전문가 평가 분석 자료와 상용화 되어 있는 사용자 여정 분석 도구의 시각화 방식 및 인터랙션 측면의 분석 결과는 데이터 분석 시의 실무 UX 디자이너와 기획자의 행동 패턴과 기능 요구사항을 확인하였다는 것에 의의가 있으며, 동료 연구자들에게 유용한 자료로 활용될 것으로 기대된다. 또한, 디자인 개선안을 통해 기존 사용자 여정 분석 도구의 유용성을 높였으며, 이는 뷰저블 애널리틱스뿐만 아니라 퍼널 분석 등을 제공하는 사용자 여정 분석 도구의 발전방향 수립 시 참고할 수 있을 것으로 기대한다.
이경서,문혜정 한국정책분석평가학회 2018 한국정책분석평가학회 학술대회발표논문집 Vol.2018 No.4
공공데이터는 정부 3.0을 기점으로 공급자 위주의 정보 개방에서 국민 개개인 중심의 맞춤형 정보 공유의 형태로 변모했다. 정부는 공공데이터의 가치를 극대화하고 재사용을 높이고자 노력하고 있으나 민간 부문의 공공데이터 활용은 아직 미비한 실정이다. 따라서 이 연구는 연도별로 주목받는 공공데이터의 가치 변화를 분석하여 이를 공공데이터 활성화 방안에 적용하고자 했다. ‘공공데이터’를 포함하는 국내 온라인 뉴스와 공공기관 입찰정보를 대상으로 의미망 분석을 실시했으며 도출된 주요 주제어를 공공데이터에 내재된 사회적, 경제적 가치와 연결시키는 작업을 수행했다. 분석 결과 공공데이터 관련 주요 이슈는 ‘양적 개방, 질적 개방, 공공 부문의 활용, 민간 부문의 활용’으로 나뉘었으며, 이는 각각 투명성, 효율성, 참여성, 혁신 가치와 밀접하게 연관성을 보였다. 온라인 뉴스를 시계열 분석한 결과 데이터 양적 수집과 개방을 의미하는 투명성이 가장 높은 수치를 기록했고 시간의 흐름에 따라 혁신이 새로운 가치로 부각되고 있었다. 다만, 민간부문의 활용 역시 정부 주도의 활동이 주를 이루었다. 공공데이터 관련 정부 수요는 효율성의 비중이 높았으며 시간의 흐름에 따라 투명성 중심에서 참여성과 혁신 중심으로 이동하고 있었다. 이 연구가 의미하는 바는 다음과 같다. 첫째, 정부는 직접적인 데이터 활용 관련 활동보다 고수요 데이터 개방을 통해 데이터 사용자들의 자발적인 참여를 유발해야 한다. 둘째, 공공 빅데이터 차원의 활용을 도모하기 위해 기관간 체계적인 데이터 관리 및 공유 방안에 대해 고민해야 한다.
빅데이터 분석 교육의 문제점과 개선 방안 -학생 과제 보고서를 중심으로
최도식 한국융합학회 2017 한국융합학회논문지 Vol.8 No.12
This paper examines the problems of big data analysis education and suggests ways to solve them. Big data is a trend that the characteristic of big data is evolving from V3 to V5. For this reason, big data analysis education must take V5 into account. Because increased uncertainty can increase the risk of data analysis, internal and external structured/semi-structured data as well as disturbance factors should be analyzed to improve the reliability of the data. And when using opinion mining, error that is easy to perceive is variability and veracity. The veracity of the data can be increased when data analysis is performed against uncertain situations created by various variables and options. It is the node analysis of the textom(텍스톰) and NodeXL that students and researchers mainly use in the analysis of the association network. Social network analysis should be able to get meaningful results and predict future by analyzing the current situation based on dark data gained. 본 논문은 빅데이터 분석 교육의 문제점을 고찰해 그 개선 방안을 제시한다. 빅데이터의 특성은 V3에서 V5로 진화하고 있다. 이에 빅데이터 분석 교육도 V5를 감안한 데이터 분석 교육이 되어야 한다. 작금 불확실성의 증대는 데이터 분석의 리스크를 증가시키기에 내적․외적 구조화/비구조화 데이터를 비롯해 교란 요인마저 분석할 때 데이터의 신뢰성은 증가될 수 있다. 그리고 평판분석을 활용할 때 범하기 쉬운 오류가 가변성과 불확실성에 대한 상황 인식이다. 가변성의 측면을 고려해, 다양한 변수와 옵션에 의한 불확실성의 상황을 인식하고 대비한 데이터 분석이 이뤄질 때 데이터에 대한 신뢰성과 정확성은 증가할 수 있다. 사회관계망 분석에서 학생들과 일반 연구자들이 주로 활용하는 것이 텍스톰과 노드엑셀의 노드 분석이다. 사화관계망 분석은 매개중심성에 의한 상황 분석을 통해 다크 데이터를 찾아 이상 현상을 감지하고 현 상황을 분석하여 유용한 의미를 얻고 미래를 예측할 수 있어야 한다.
빅데이터 분석 방법을 활용한 한시 영향관계 분석을 위한 시론
이병찬(Lee Byong-chan) 어문연구학회 2017 어문연구 Vol.94 No.-
현재 한시연구는 작품의 자구 하나는 물론 그 사이 행간의 의미까지 세밀하게 해석하는 방식으로 이루어지고 있다. 이는 많은 시간을 요하며 따라서 한정된 작품에 국한하여 연구를 진행할 수밖에 없다. 작가 개인에 대한 연구는 동시대 혹은 전후시대의 문학들과 연관성이 함께 언급될 때 더욱 의미와 가치를 지닌다. 즉 타자와의 영향이나 차별성이 문학사적 의의를 고구하는 중요한 가치척도이다. 그러므로 연구범주를 설정함에, 특정 몇몇을 대상으로 하는 것보다 비교군이 많을수록 그 성과가 의미를 가진다. 이 때문에 연구는 방대한 자료 분석을 기반으로 이루어져야 한다. 그러나 이는 한 개인의 역량으로 불가능한 일이다. 방대한 자료를 분석하는 연구방법의 미비로 인하여, 연구가 다수의 인물이나 작품을 함께 포괄하는 전반적이고 체계적인 분석에 이르지 못하고 있다. 따라서 연구가 결국 연구자 의 연구목적에 의해 미리 한정한 문헌들만을 대상으로 이루어질 수밖에 없는 실정이다. 이러한 문제를 해결하기 위한 방법이 바로 빅데이터 분석이다. 많은 문헌의 처리와 분석이 가능한 빅데이터 분석 방법을 도입한다면 이전에는 시도하지 못했던 개인들의 어휘사용 특성이나 패턴은 물론, 문집들의 상관성과 상호간의 거리, 혹은 고문진보(古文眞 寶)나 두시(杜詩)와의 비교 분석을 통하여 중국 시인들이 우리나라 문인들에게 준 영향의 심도에 대한 수치적 계량화나 구체적 실상에 대한 분석도 가능하다. 그러나 현시점에서 우리가 한문학 자료의 빅데이터 분석을 통하여 얻을 수 있는 결과는 제한적일 수밖에 없다. 한국고전종합DB라는 자료가 확보되어 있으며, 빅데이터 분석 기술 이 발전하고 여러 방면에 응용되고 있지만 실제로 분석 기술을 사용하는데 많은 어려움이 있다. 왜냐하면 빅데이터 분석은 대상 데이터의 가공 여부, 분석의 도구로 사용되는 기초 자료의 확충과 정리, 분석 전문가인 프로그래머와 결과를 활용하고자 하는 한문학 전공자의 정확한 소통과 같은 전제 조건이 충족되지 않는다면 원하는 결과를 얻을 수 없기 때문이다. 본 연구는 이와 같이 제한된 조건임에도 조선 중기의 한시 중 일부를 대상으로 텍스트와 주제어 유사성 분석을 시도하였다. 그리고 수치화하여 도출한 결과가 기존 방식으로 나온 연구 결과, 혹은 일반적인 추론과 어긋나지 않음을 확인하여 빅데이터 분석의 유효 성을 입증하였다. 앞으로 본 연구에서 제시한 그 한계와 문제점을 개선하여 빅데이터 분석을 기반으로 한 연구가 활성화되기를 기대한다. A study on artist individual has more meaning and value when mentioned with the relations with literatures of same period or the post-war period. In other words, differentiation from others is an important measure of value investigating the meaning of literature history. Therefore, the range of research is not a few particular objects and as comparison is more, the outcomes are significant. Therefore, the study must be conducted based on the analysis on massive materials. But, it s impossible with individual capabilities. Because of the insufficient research method to analyze massive materials, the study cannot approach general and systematic analysis including many persons or works together. Therefore, the study cannot help being organized by research purpose of researcher and conducted for only limited literatures. The method to solve the problem is rightly big data analysis. If introducing big data analysis that can treat and analyze lots of literatures, it s possible to measure influence of Chinese poets on our scholars numerically and analyze concrete realities through characteristics or patterns of individual vocabularies that were not tried before, correlations and mutual distance of literature collections, and comparative analysis of gomunjinbo (古文眞寶) or two poems. However, the results of big data analysis of Chinese literature data are restricted at present. Data of Korean classics DB is secured and mention about the possibility of big data analyzing technology is increased. It is tried from several angles, but there are difficulties in using analyzing technology actually. Big data analysis cannot provide desired results if preconditions such as process of objective data, securing and arrangement of basic data used as a tool of analysis, persons majoring in Chinese literature who intend to utilize the results with analytic specialist, programmer, and accurate communication and so on are not satisfied. This research digitized and drew the results through analysis on texts, topic words and similarities for Chinese poems of the middle stage of Joseon in spite of restricted conditions. Therefore, it was confirmed to be same as research results or general inference brought by existing methods. It means that methodological validity utilizing big data analysis to following researches was secured. In the future, the restrictions and problems of this research should be improved and researches based on big data analysis should be vitalized.
텍스트 마이닝 기법을 활용한 지방자치단체 데이터기반행정 활성화 동향 분석
왕문혜,오혜근,나민주 한국지방자치학회 2023 한국지방자치학회보 Vol.35 No.2
The objective of this study is to analyse local governments’ data-based administration revitalization trends. In order to achieve this, the ‘Data-based Administration Revitalization Implementation Plans(DARIP)’ from 17 metropolitan local governments were analysed using text mining method. This study determined what each metropolitan government's data-based administration is promoting, whether it is carried out in accordance with the intent and guidelines of the pertinent laws, and explored implications for data-based administration activation. Below are the key findings of the analysis. Firstly, text analysis revealed that ‘data, big data, analysis, utilization, construction, joint, and public’ appeared frequently. Secondly, as a result of network text analysis, connection centrality was high in the order of ‘data, analysis, big data, utilization, discovery, joint, and system’. Third, network cluster analysis identified five clusters: ‘Building and operating a data collection, analysis, and utilization system’, ‘Enabling joint data registration of public institutions’, ‘Improving local public services through data analysis and utilization’, and ‘Expanding data-based administrative capabilities’. Conclusions were drawn in the final section by comparing these findings to those of earlier research. This study is significant because it used the first DARIP created after the Act on Data-based Administration was passed to scientifically examine the trend of local governments’ data-based administration revitalization. 본 연구의 목적은 지방자치단체의 데이터기반행정 활성화 동향을 분석하는 데 있다. 이를 위해 광역 지방자치단체의 데이터기반행정 활성화 시행계획을 전수 분석하여 데이터기반행정의 추진내용이 무엇인지, 그 내용이 관련 법령의 추진 목적과 방향에 맞게 추진되고 있는지, 그리고 데이터기반행정 활성화를 위한 시사점은 무엇인지를 탐색하였다. 2021년도 17개 광역 지방자치단체의 ‘데이터기반행정 활성화 시행계획’을 수집하였고, 텍스트 마이닝 기법을 활용하여 분석하였다. 주요 분석 결과는 다음과 같다. 첫째, 텍스트 분석 결과 ‘데이터, 빅데이터, 분석, 활용, 구축, 공동, 공공’ 등의 순으로 출현 빈도가 높게 나타났다. 둘째, 텍스트 네트워크 분석 결과 ‘데이터, 분석, 빅데이터, 활용, 발굴, 공동, 시스템’ 등의 순으로 연결중심성이 높게 나타났다. 셋째, 네트워크 클러스터 분석 결과 ‘데이터 수집・분석・활용 시스템 구축・운영’, ‘공공기관의 공동활용 데이터 등록 활성화’, ‘데이터 분석・활용으로 지역공공서비스 개선’, ‘데이터기반행정 추진기반 확충’, ‘데이터기반행정 역량 확충’의 5개 클러스터가 도출되었다. 마지막에서는 이러한 분석 결과를 선행연구와 비교하면서 시사점을 도출하였다. 본 연구는 「데이터기반행정 활성화에 관한 법률」이 제정된 이후 작성된 첫 번째 시행계획을 통해 지방자치단체의 데이터기반행정 활성화 동향을 실증 분석했다는 점에서 의의가 있다.