        연관성규칙에서의 다중매개관계에 관한 연구

        조광현,박희창 한국자료분석학회 2011 Journal of the Korean Data Analysis Society Vol.13 No.1

        Association rule mining searches for interesting relationships among items in a given database. There are three primary quality measures for association rule, support and confidence and lift. In order to improve the efficiency of existing mining algorithms, constraints were applied during the mining process to generate only those association rules that are interesting to users instead of all the association rules. When create relation rule, can often find a lot of rules. This can find rule that direct relativity by intervening variable does not exist. In this study we try to present the method of multi intervening association rules. Multi intervening association rules can disambiguate analysis of result more. 연관성규칙은 대용량 데이터베이스에서 각 항목들 간의 관련성을 찾아내는 기법으로 둘 또는 그 이상의 품목들 사이의 지지도, 신뢰도, 향상도를 바탕으로 관련성 여부를 측정한다. 연관성규칙에서는 일반적으로 사용하는 연관성규칙 이외에 연관성규칙의 효율성을 개선하기 위하여 여러 가지 제약 기반 연관성규칙의 연구가 활발하게 진행되고 있다. 연관성규칙 생성 시, 종종 많은 규칙들을 발견할 수 있다. 이는 변수들 간에 우연히 관련성이 높게 나타나는 경우가 존재할 수 있고 매개 변수에 의하여 직접적인 관련성이 없는 규칙을 발견할 수도 있다. 이에 본 논문에서는 연관성 규칙에서 변수들 간의 다중매개관계를 규명할 수 있는 다중매개연관성규칙을 정의하고 실제 자료에 적용하고자 한다. 다중매개연관성규칙에서 매개관계가 성립되는 경우 매개 변수에 의하여 그 연관성 규칙은 간적접 해석만 가능하므로 의미가 없는 것으로 판단되며 실제 자료에 적용한 결과, 총 23개의 규칙들 중 의미 없는 규칙 3개를 발견할 수 있었다. 본 논문에서 제시하는 다중매개연관성규칙은 생성된 규칙에 대한 관련성을 보다 정확하게 이해할 수 있으므로 연관성 규칙의 결과 해석을 보다 명확하게 할 수 있다.

      • KCI등재

        연관성시각에서 본 국내 광고Creative의 커뮤니케이션오류에 관한 연구 -2011년 신문광고 중심으로-

        박문수 한국일러스아트학회 2012 조형미디어학 Vol.15 No.2

        This study has analyzed recent relevance of one hundred advertisements on domestic daily newspaper in 2011 for the purpose of understanding communication error in Korean advertising creative. For that, individual in-depth interviews of five advertising creators(CD) have been conducted to produce a checklist of relevance of advertising creative and to analyze advertisements. Consequently, the checklist of relevance for advertising creative includes three categories: product relevance, target relevance, and brand image relevance. Moreover, each category has three items, which are respectively ① concept, ② product meaning, and ③ credibility; ① target profile, ② sensibility, and ③ interest; and ① brand image, ② B. I. manual, and ③ identity. As a result of analysis of 5-point scale, the positive aspect(5 points + 4 points) in the check of product relevance was 54% while the negative aspect(3 points + 2 points + 1 point) was 46%. In the check of target relevance, the positive aspect(5 points + 4 points) was 32% and the negative aspect(3 points + 2 points + 1 point) was 68%. Lastly, in the check of B.I. relevance, the positive aspect(5 points + 4 points) was 25% while the negative aspect(3 points + 2 points + 1 point) was 75%. Since target and brand image relevance have appeared lower compared with product relevance among the three categories, more attention and effort are required of advertising creators. In conclusion, there are still many advertisements in Korea which are insufficient in a sense of presence and belonging, namely communication error, due to the marginal relevance to the product, the target, and the brand applied to advertising communication. If advertising exists for a brand, more effort to produce ideas relevant to product, target, and brand should be made in advertising creative. It is hoped that this study will be able to contribute to development of Korean advertising creative by helping to interact with consumers and create advertising effect. 본 연구는 한국의 광고 Creative의 커뮤니케이션 오류에 대한 이해를 위해, 2011년도 국내일간지에 게재된 100개의 광고를 대상으로 연관성 현황을 분석하였다. 이를 위해 광고 Creative의 연관성 체크리스트 선정과 광고물분석을 위하여 5인의 광고 크리에이터(CD)를 대상으로 개별 심층인터뷰를 전개하였다. 광고 Creative를 위한 연관성 체크리스트는 1.제품연관성에는 ① concept ② product meaning ③ credibility를, 2.타깃연관성에는 ① target profile ② sensibility ③ interest를, 3.브랜드이미지 연관성에는 ① brand image ② B.I manual ③ identity등 3개 항목에 따른 9개 체크리스트를 선정하였다. 5점 척도분석결과, 제품연관성 체크결과에서는 긍정적 측면(5점+4점)이 54%로 나타났고, 부정적 측면(3점+2점+1점)은46%로 나타났다. 타깃연관성 체크에서는 긍정적 측면(5점+4점)이 32%로 나타났고, 부정적 측면(3점+2점+1점)은 68%로 나타났다. B. I.연관성 체크에서는 긍정적 측면(5점+4점)이 25%로 나타났고, 부정적 측면(3점+2점+1점)은75%로 나타났다. 그리고 3항목 중 제품연관성에 비해 타깃과 브랜드이미지의 연관성은 더욱 낮게 나타나 광고인의 관심과 노력이 더욱 요구된다. 결론적으로 광고커뮤니케이션에 적용한 제품, 타깃, 브랜드 등의 연관성이 약하여 존재감과 소속감이 부족한(커뮤니케이션 오류)광고가 국내에는 아직 많다. 광고가 브랜드를 위해 존재한다면, 광고 Creative에 제품과 타깃, 브랜드의 연관성이 있는 아이디어노력이 이루어져야만 한다. 본 연구가 소비자와 호흡할 수 있고, 광고효과를 창출하는데 도움이 되어 국내광고Creative 발전에 기여하기를 기대한다.

      • KCI등재

        NCS 기반 상업계 고등학교 교육과정과 상업교사 양성대학 교육과정의 연관성 분석에 기초한 상업교사 양성대학 교육과정의 개선 방향

        이광호 한국상업교육학회 2017 상업교육연구 Vol.31 No.1

        이 연구의 목적은 NCS 기반으로 개정된 2015 개정 교육과정 중에서 경영․금융 교과 교육과정과 상업교사 양성대학 교육과정의 연관성을 분석한 후에 상업교사 양성대학 교육과정의 개선 방향을 도출하는 것이다. 연구목적을 달성하기 위해 상업계 고등학교 교육과정과 상업교사 양성대학 교육과정의 연관성을 분석하였다. 연관성은 교과내용 측면에서의 일치 정도를 질적인 측면에서 분석하였고 그 결과를 계량화하였다. 연관성은 다음과 같은 식을 이용하여 산출하였다. 연관성 = 여기에서 SUBk: 2015 개정 경영․금융 교과 교육과정의 과목과 상업교사 양성대학 교육과정상 과목과의 일치도N: 2015 개정 경영․금융 교과 교육과정의 과목수 연구결과를 요약하면 다음과 같다. 첫째, 상업계 고등학교 교육과정과 상업교사 양성대학 교육과정의 연관성은 다음과 같다. ∙ 2009 개정 상업계 고등학교 교육과정의 전체 전문과목과 상업교사 양성대학 교육과정의 연관성: 0.83 ∙ 2015 개정 상업계 고등학교 교육과정의 전체 전문과목과 상업교사 양성대학 교육과정의 연관성: 0.49 ∙ 2015 개정 상업계 고등학교 교육과정의 이론 과목과 상업교사 양성대학 교육과정의 연관성: 0.78 ∙ 2015 개정 상업계 고등학교 교육과정의 실무 과목과 상업교사 양성대학 교육과정의 연관성: 0.30 둘째, 상업교사 양성대학 교육과정의 개선 방향은 다음과 같다. ∙ 상업교사 양성대학 교육과정을 개편할 때, 상업계 고등학교 교육과정과의 연관성을 높여야하며, 이를 위해 학과별로 교육과정위원회를 구성하고 이 위원회에 상업계 고등학교 교사와 산업체 인사가 반드시 포함되도록 한다. ∙ 실무 관련 교재를 다양하게 개발하여 교수․학습과정에 활용한다. 특히 NCS 기반으로 만들어진 학습모듈을 주교재와 함께 활용하여 이론과 실무 내용을 고르게 학습할 수 있도록 한다. ∙ 교수․학습방법을 능력중심 교육으로 개선한다. 실무 능력을 높이기 위해 프로젝트학습, 모듈식 교수-학습, 문제중심학습 방법에 의한 수업의 비중을 높여야 한다. ∙ 산업체 현장실습을 의무화한다. 일정 기간의 산업체 현장실습을 통해 산업체에서의 경험을 의무화하여 학교에서 배운 내용을 실제 산업현장에서 적용하거나 체험해 보는 경험을 갖게 한다. ∙ 교육과정에 대한 주기적 평가 및 피드백을 실시해야 한다. 교육부와 한국교육개발원에서 실시하는 교원양성기관 평가요소에 상업교사 양성대학 교육과정과 상업계 고등학교 교육과정과의 연관성 정도를 포함한다. The purpose of this study is to suggest improvement direction of the business teacher training college curriculum. In order to achieve these research objectives, we analyzed the relevance between the curriculum of business and financial subject in commercial high school and the curriculum of business teacher training in college. The relevance was first analyzed to achieve the research objective. The relevance was analyzed qualitatively and the results were quantified. The relevance was calculated using the following equation.Relevance = SUBk: Match between the 2015 revised curriculum in commercial high school and the curriculum of business teacher training in college. N: The number of subjects in the 2015 revised commercial high school curriculum The results of the relevance analysis are as follows. ∙ The relevance of the 2009 revised commercial high school curriculum and the business teacher training college curriculum: 0.83 ∙ The relevance of the 2015 revised commercial high school curriculum and business teacher training college curriculum: 0.49 ∙ The relevance of the 2015 revised commercial high school curriculum and the business teacher training college curriculum in theoretical subjects: 0.78 ∙ The relevance of the 2015 revision of commercial high school curriculum and business teacher training college curriculum in practical subjects: 0.30 The directions of improvement of the curriculum of the business teacher training college are as follows. ∙ When reorganizing the business teacher training college curriculum, it is necessary to improve the connection with the commercial high school curriculum. To do this, the curriculum committee should be formed for each department, and the committee should include commercial high school teachers and industrial personnel. ∙ Develop a variety of practical teaching materials and use them in the teaching and learning process. Especially, the learning module based on NCS is used together with the main texts so that students can learn the theory and practical contents evenly. ∙ Improve teaching and learning methods with ability-based education. To increase practical skills, it is necessary to increase the proportion of teaching by project, modular teaching, and problem based learning. ∙ Industrial field practice should be mandatory in business teacher training curriculum. Students are required to have industry experience through a field workshop for a certain period of time, so that they have experience of applying what they have learned to the actual industrial field. ∙ Periodic evaluation and feedback on the business teacher training curriculum should be conducted. It is necessary to include the degree of relevance of the business teacher training college curriculum and the commercial high school curriculum to the evaluation factors of the teacher training institute conducted by the Ministry of Education and the Korea Educational Development Institute.

      • KCI등재

        고유한 항목 특성 파악을 위한 순수 연관성 규칙의 제안

        박희창 한국자료분석학회 2009 Journal of the Korean Data Analysis Society Vol.11 No.2

        Data mining is the method to find useful information for large amounts of data in database. An association rule of this techniques, finds the relation among each items in massive volume database using interestingness measures such as support, confidence, and lift. There are some kinds of association rules ; boolean association rule, quantitative association rule, single-dimensional association rule, multi -dimensional association rule, single-level association rule, multi-level association rule sequences association rule, and dissociation rule etc. This paper present a new association rule to evaluate pure association(we call pure association rule) and describe some conditions and properties for a proposed association rule. A comparative study with new interestingess measures is shown by numerical example. The results showed that we were able to avoid the discovery of misleading association rules by the pure association rule thresholds and interpret whether positive association by specific items or not. 데이터 마이닝은 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 기법이다. 데이터 마이닝 기법 중에서 연관성규칙은 데이터베이스 내에 존재하는 항목들 간의 상호 관련성을 찾아내는 기법으로서 항목들 사이의 지지도, 신뢰도, 향상도 등의 흥미도 측도를 기준으로 상호 관련성 여부를 측정한다. 이러한 연관성 측정을 위한 연관성 규칙의 종류로는 불리언 연관성 규칙과 정량적 연관성 규칙, 1차원 연관성 규칙과 다중차원 연관성 규칙, 단일 수준 연관성 규칙과 다 수준 연관성 규칙, 그리고 순차 연관성 규칙과 비 연관성 규칙 등이 있다. 본 논문에서는 고유한 항목의 특성을 파악하기 위해 순수 연관성 규칙을 제안하고, 제안된 연관성 규칙의 평가기준에 대한 조건과 성질을 규명하였다. 또한 예제를 통하여 기존의 흥미도 측도와 제안한 흥미도 측도를 비교한 결과, 순수 연관성 규칙에서는 특정 요인에 의한 결과를 나타내주는 동시에 양의 관련성과 음의 관련성을 판단할 수 있다는 사실을 알게 되었다.

      • KCI등재

        엔트로피 기반 연관성 평가 기준의 제안

        박희창 한국자료분석학회 2016 Journal of the Korean Data Analysis Society Vol.18 No.4

        These days, government and companies are creating real value from big data and explore new opportunities by big data technology and diversified professional services. By Wikipedia, data mining is the computational process of discovering patterns in huge data sets involving methods at the intersection of artificial intelligence, machine learning, and statistics. Association rule is one of the well-established methods in data mining, and can be divided into positive, negative, and inverse rules. It discovers associations among items in a big data on the basis of several association thresholds (support, confidence, and lift). If we use these thresholds for association rule generation, we cannot know whether the association is positive or negative by their values, and so we may reach the wrong conclusion. In this paper, we proposed three kinds of entropy-based modified measures to compensate for this disadvantage, and compared some various aspects through a few experiments. The results showed that they had the direction of association. 오늘날 빅 데이터 기술이 발전하고 전문적인 서비스가 다양화됨에 따라 정부뿐만 아니라 기업에서는 빅 데이터로부터 실질적인 가치를 창출하고 새로운 기회를 탐색하고 있다. 데이터 마이닝은 빅 데이터 내에 있는 유용한 정보를 발견하고 이를 바탕으로 의사결정 등을 위한 정보로 활용하고자 하는 것이다. 데이터 마이닝 분야에서 널리 이용되고 있는 연관성 규칙은 흥미도 측도를 근거로 항목들 간의 관련성 여부를 측정하며, 연관성의 방향에 따라 정의 연관성 규칙, 역의 연관성 규칙, 그리고 부의 연관성 규칙으로 나누어진다. 기본적인 연관성 평가 기준인 지지도, 신뢰도, 그리고 향상도는 정의 연관성 규칙만을 생성하기 위한 것으로 역 또는 부의 연관성 규칙을 고려하지 않음으로 인하여 의미 없는 규칙이 생성될 수도 있고 의미 있는 규칙이 생성되지 않을 수도 있다. 본 논문에서는 의사결정나무에서 활용되고 있는 엔트로피 기반의 측도들 중에서 결합 엔트로피, 조건부 엔트로피, 그리고 상호 정보량 등을 변형하여 기본적인 연관성 평가 기준을 대체할 수 있는 측도를 제안하였다. 그 결과, 기본적인 연관성 측도는 모두 양의 값만을 취하는 반면에 엔트로피 기반 측도들은 모두 양의 값뿐만 아니라 음의 값을 동시에 취하는 것으로 나타났다. 따라서 엔트로피 기반 측도들을 연관성 평가 기준으로 활용하게 되면 연관성의 방향을 파악할 수 있다는 사실을 확인하였다.

      • KCI등재

        발생빈도를 고려한 연관성분석 연구

        임제순,이경준,조영석,Lim, Je-Soon,Lee, Kyeong-Jun,Cho, Young-Seuk 한국데이터정보과학회 2010 한국데이터정보과학회지 Vol.21 No.6

        데이터마이닝 분야에서 연관성분석은 가장 많이 사용되고 있는 기법으로 데이터 내에 포함되어 있는 특정 항목들의 연관성을 수치화시켜 나타내는 방법이다. 기본적으로 연관성규칙은 지지도, 신뢰도, 향상도를 계산하여 연관성의 유무를 판단한다. 기존에 제시된 관련 논문에서는 관심변수의 발생유무만을 바탕으로 연관성규칙을 이용하였고, 빈번하지 않은 데이터에 대한 문제점과 순위결정함수를 통한 해결방안을 제시하였다. 하지만 실제 데이터에서는 발생이 빈번하지 않은 데이터 뿐 아니라, 발생이 많이 일어나는 데이터도 존재한다. 따라서 발생빈도를 고려한 연관성규칙이 필요하다고 생각한다. 본 논문에서는 각 케이스 내의 발생빈도를 고려한 새로운 연관성 측정 도구를 제시하였다. 또한 실제 예제를 통하여 기존의 연관성규칙과 새로운 연관성규칙의 결과를 비교해 보았다. 그 결과, 새로 제시한 연관성규칙이 기존의 연관성규칙보다 더 세밀하게 구분하는 것을 확인할 수 있었다. In data mining, association rule is a popular and well researched method for discovering interesting relations between variables. There are three measures for association rule, support, confidence and lift. But there are some problem in them. They don't consider the frequency of variable in case. So, we need the new association rule which consider the frequency.In this paper, we proposed the new association rule. We compared the proposed association rule with the original association rule from example data. As a result, we knew our function was better than the original function in terms of sensitivity.

      • KCI등재

        2·28민주운동, 3·15 1차 마산의거와 4·11-13 2차 마산의거, 4·19혁명

        유명철(Yu, Myung Cheol) 한국사회과교육연구학회 2018 사회과교육 Vol.57 No.1

        1960년 4월 혁명에 대한 내용을 지도할 때 2·28민주운동, 3·15 1차 마산의거와 4·11-13 2차 마산의거, 4·19혁명의 연속적인 흐름 속에서 시간적, 공간적, 주체적인 측면에서의 연관성을 파악하도록 학습지도할 필요가 있다. 그런데, 현행 일반사회 영역 교과서에는 4·19혁명만을 부각시켜 다루고 있다. 그리고 4·19혁명이라고 하면 일반적으로‘4월 19일’,‘서울’‘, 대학생’의 의미만 부각시키고 있다. 이러한 문제의식에 입각하여, 1) 시간적인 측면에서‘2·28’민주운동을 출발로‘3·15’1차 마산의거와‘4·11-13’2차 마산의거를 거쳐‘4·19’혁명으로 이어진 연관성, 2) 공간적인 측면에서‘대구’에서 2·28민주운동이 시작되어‘마산’의 3·15 1차 의거와 4·11-13 2차 의거를 거쳐‘서울’의 4·19혁명으로 이어진 연관성, 3) 주체적인 측면에서‘고등학생’이 주체인 2·28민주운동과 3·15 1차 마산의거와 4·11-13 2차 마산의거가‘대학생’이 주체인 4·19혁명으로 이어진 연관성에 대한 내용을 분석해 보고자 하였다. 이를 통하여, 4월 혁명을 지도할 때 2·28민주운동, 3·15 1차 마산의거와 4·11-13 2차 마산의거, 4·19혁명의 연속적인 흐름 속에서 시간적, 공간적, 주체적인 측면에서의 연관성을 학습지도할 필요성이 있음을 밝혔다. Current General Social Studies textbooks usually overemphasize the “April Student Revolution” that erupted in April 1960 and excessively stress “April 19th,” “Seoul,” and “university students.” When it is taught, however, there is a need to teach its relevancy with “February democratization movement” that took place on February 28, 1960, in Taegu, the “first brave deed of Masan” that occurred on March 15, 1960, in Masan, and the “second brave deed of Masan” that happened on April 11-13, 1960, in Masan. More specifically, teaching of the “April Student Revolution” needs to treat opposition to a possible fraudulent election of the Syngman Rhee regime in the “February democratization movement”. Invalidation of presidential and vice-presidential elections and their renewal need to be taught in the “first brave deed of Masan”. Syngman Rhee"s leaving from the presidency in the “second brave deed of Masan” and resignation of Syngman Rhee as president in the aftermath of the “April Student Revolution” as parts of the “April democratization revolution” also need to be taught. Second, the teaching needs to stress the relevancy of Taegu, Masan, and Seoul as strong bastions of the South Korean opposition, particularly the movement in Taegu as the starting point, brave deeds in Masan as the trigger, and the revolution in Seoul as the climax in the democratization revolution of 1960. Third, teaching needs to emphasize the relevancy of high school students and university students as prime movers of revolution. It is noteworthy that it is high school students" “February democratization movement” and two “brave deeds of Masan” that led to university students" “April Student Revolution.”

      • KCI등재

        양적 연관성 규칙에서의 객관적 평가기준

        박희창 한국자료분석학회 2009 Journal of the Korean Data Analysis Society Vol.11 No.6

        One of the well-studied problems in data mining is the search for association rules. The task of association rule mining is to find certain association relationships among a set of data items in a database. There are three primary quality measures for association rule, support and confidence and lift. Given a user defined minimum support and minimum confidence threshold, association rule mining is to find all the rules having at least minimum support and minimum confidence. Association rules are frequently used by retail stores to assist in marketing, advertising, floor placement, and inventory control. In this paper we present the relation between the measure of association and the criteria of association rule for continuous database and propose the objective criteria for association. As the result, we knew that there was a linear relationship between the same occurrence frequency and measure of association, and the thresholds was linear to measure of association. 데이터마이닝에서 가장 많은 연구가 이루어지고 있는 분야는 연관성 규칙을 찾는 것이다. 연관성 규칙은 각 항목간의 연관성을 반영하는 규칙으로서 둘 또는 그 이상의 항목들 사이의 지지도, 신뢰도, 향상도를 기반으로 하여 미리 결정된 최소지지도 및 최소신뢰도 이상의 의미 있는 규칙을 찾아내는 데이터마이닝 기법 중의 하나이다. 연관성 규칙은 교차판매, 매장 진열, 카탈로그 디자인, 장바구니 분석 등에 사용된다. 본 논문에서는 연속형 자료에서의 연관성 측도와 연관성 규칙의 평가 기준과의 관계를 제시함으로써 연관성 규칙의 객관적인 기준을 제안하였다. 그 결과, 동시발생빈도와 연관성 측도, 연관규칙의 평가기준과 연관성 측도가 선형관계를 가짐을 알 수 있었다. 이러한 결과를 통하여 연관성 규칙에 대한 관련성 정도를 객관적으로 제시할 수 있었으며, 둘 이상의 연관 규칙간의 비교 분석 또한 가능하도록 하였다.

      • KCI등재

        균형 확인적 연관성 평가 기준의 제안

        박희창 한국자료분석학회 2014 Journal of the Korean Data Analysis Society Vol.16 No.4

        Due to the wide variety of large scale data, attention for big data has been concentrated to enhance the competitiveness in various companies and organizations. The most commonly utilized technique for big data is data mining. In particular, association rule of data mining techniques finds the relation among each items in a big database using elementary interestingness measures such as support, confidence, and lift. But we can not know association direction by these measures. So, confirmed association rule thresholds were proposed to compensate for this problem, But we can not determine accurately the direction of association by them. This paper propose a balanced and confirmed association rule to solve these problems, and then check the three conditions of interestingness measures by Piatetsky-Shapiro (1991). The comparative studies with elementary, confirmed association, and balanced and confirmed association thresholds are shown by numerical example. The results show that balanced and confirmed association thresholds are better than elementary and confirmed association thresholds. 오늘날 다양한 종류의 이용 가능한 대규모 데이터의 발생으로 인하여 각종 기업 및 조직에서는 경쟁력 제고를 위해 빅 데이터에 대한 관심이 집중되고 있다. 이러한 빅 데이터에 가장 많이 활용되고 있는 기법이 데이터마이닝이다. 특히 데이터마이닝 기법들 중에서도 연관성 규칙은 항목들 간의 지지도, 신뢰도, 그리고 향상도를 기반으로 하여 빅 데이터에 포함되어 있는 항목들 간의 관련성을 탐색하는 데 활용되고 있다. 그러나 이들 기본적인 연관성 평가 기준만으로는 연관성의 방향을 알 수가 없어서 확인적 연관성 규칙에 대한 평가 측도가 제안되었으나 이들은 연관성의 방향을 제대로 나타내지 않는 경우가 종종 발생한다. 본 논문에서는 이러한 문제점을 보완한 균형 확인적 연관성 규칙의 평가 기준을 제안하였다. 또한 이들이 흥미도 측도의 조건을 충족하는지를 조사하였으며, 예제를 통하여 균형 확인적 연관성 규칙의 유용성에 대해 알아보았다. 그 결과, 기본적인 연관성 측도나 확인적 연관성 측도보다 균형 확인적 연관성 측도를 평가 기준으로 활용하는 것이 항목 간의 연관성의 정도와 방향을 더 정확하게 나타낸다는 것을 규명할 수 있었다.

      • KCI등재

        연관성의 방향을 고려한 종속 요인 기반 흥미도 측도의 고찰

        박희창 한국자료분석학회 2015 Journal of the Korean Data Analysis Society Vol.17 No.3

        Today, data is growing exponentially. Association rule mining is a data mining task that discovers associations among items in a big transactional database on the basis of several interestingness measures. There are three kinds in association rules; positive, negative, and inverse association rule. A positive association rule is a pattern that states when an item X occurs, an item Y occurs with certain probability. A negative association rule is a pattern that states when an item X occurs, an item Y does not occur, or when X does not occur, Y occurs with certain probability. Inverse association rule is a pattern that states when X does not occur, Y does not occur. If we consider these techniques at the same time to explore association rules, we can obtain some kinds of meaningful rules that can not be generated by positive association rule mining alone. In this paper, we study some dependency factors considering the direction of association. In addition, we investigated some useful properties of dependency factors and the conditions of interestingness measure, and compared these measures through a few experiments. 오늘날 데이터의 폭발적인 증가로 인해 빅 데이터를 활용하기 위한 데이터 마이닝 기법이 대두되고 있다. 이들 중에서는 연관성 규칙이 많이 이용되고 있는데, 이는 여러 가지 흥미도 측도를 근거로 하여 관련성 여부를 측정한다. 연관성 규칙은 크게 정, 역, 그리고 부의 연관성 규칙으로 나누어지는데, 정의 연관성 규칙은 어느 항목이 발생하면 다른 항목도 발생한다는 규칙을 찾아내는 것이고, 역의 연관성 규칙은 어느 항목이 발생하지 않으면 다른 항목도 발생하지 않는다는 규칙을 찾아내는 것이다. 반면에 부의 연관성 규칙은 어느 항목이 발생하면 다른 항목은 발생하지 않거나 어느 항목이 발생하지 않으면 다른 항목은 발생한다는 규칙을 찾아내는 것이다. 항목들 간의 연관성 규칙을 탐색하기 위해 이들을 동시에 고려하게 되면 정의 연관성 규칙만으로는 구할 수 없는 또 다른 규칙을 생성할 수 있게 된다. 이를 위해 본 논문에서는 연관성 방향을 고려한 여러 가지 종속 요인을 제안하는 동시에 이들의 성질을 규명하였다. 또한 예제를 통하여 이들 측도의 유용성을 파악해본 결과, 이들 모두가 대칭형 측도이며, 연관성의 방향을 잘 나타내는 것을 확인하였다.

