
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
이광진 한국자료분석학회 2008 Journal of the Korean Data Analysis Society Vol.10 No.1
A so-called 'functional data correspondence analysis' is not yet introduced in and is not yet commented about, which is combined with methodologies of recently-developed functional data analysis and a fundamental concept of classical correspondence analysis. So this paper makes an attempt to standardize it with an artificial problem of data analysis. Its main steps are followings: ①to estimate probability density functions by group, ②to make an optimal contingency table of which each row represents a group, each column a sub-interval, each cell-value an estimated frequency from the estimated pdf, ③to get row coordinates and column coordinates from a simple correspondence analysis of the last optimal contingency table, and finally ④to get a curve of correspondence function by smoothing the column coordinates. The decision on the proper number of sub-intervals depends maybe on the pattern of the values of chi-square statistic. 비교적 최근에 개발된 자료분석기법인 함수자료분석(functional data analysis)의 방법론과 전통적인 자료분석기법인 대응분석(correspondence analysis)의 기본개념이 결합된 소위 '함수자료대응분석(functional data correspondence analysis)'이란 기법은 아직까지 소개되거나 언급조차 된 적이 없다. 이에 본 연구에서는 가상의 한 자료분석 문제를 제기하고 이를 통해 '함수자료대응분석'이란 이름의 자료분석기법에 대해 그의 정형화를 시도한다. 기본 흐름은 다음과 같다. ①집단별 자료로부터 각 집단의 확률밀도함수를 추정하고, ②집단을 행, 부분구간을 열, 추정된 확률밀도함수에 근거하여 계산된 추정 자료수를 셀의 값으로 갖는 이원분할표들 중 카이제곱 통계량 값을 최대로 하는 이원분할표를 얻고, ③이에 대해 단순대응분석을 실시하여 행범주 및 열범주 좌표점들을 구한다. ④마지막으로 열범주 좌표점들에 대한 평활화를 통해 '대응함수곡선'을 구한다. 물론 부분구간의 적절한 개수 결정은 카이제곱통계량 값들이 변화하는 패턴을 참조하여 이루어진다.
강창완,김규곤,김태완 한국자료분석학회 2009 Journal of the Korean Data Analysis Society Vol.11 No.1
Recently, the field of scientific research has been moved from off-line spaces to on-line spaces of the computer via World Wide Web, due to the development in computer technology. Websites of academic societies provides lots of academical information to the researchers and play important role as a indicator in evaluating academic societies. Specially, the contents, structures and management system of academic societies' websites make it possible for the exchange and search of research information, and improve the satisfaction and also increase the participation of the members in academic societies. Therefore we can justify that the evaluation for the activities of academic societies could be done effectively by website log analysis. In this paper, we analyze weblog data of the Korean Data Analysis Society's website using Google Analytics, derive the current states of it and finally suggest some plans for the efficient managements of this website. The results showed that total number of visits is 411, the number of the pages per visit is 1.65 and the average time on the site is 1 minute. 최근 급속한 컴퓨터 기술의 발전으로 인하여 과학 기술 분야의 연구 정보의 장이 인터넷 공간으로 옮겨오고 있는 실정이다. 이러한 인터넷 시대에서 대부분 학술단체의 활동 중 학회 웹사이트를 이용한 정보 제공은 학회 활동의 평가지표로 매우 중요한 역할을 담당하고 있다. 특히, 학회 웹사이트의 구성 내용과 운영방식은 학회 정보를 이용하거나 연구 정보의 교환 및 탐색하는데 효율적인 밑바탕이 되고 이는 학회 구성원의 학회 참가도 및 만족도에 지대한 영향을 끼친다고 할 수 있다. 본 연구에서는 한국자료분석학회의 웹로그 분석을 하고 이를 통해 학회 웹사이트의 현황을 분석하고 학회 웹사이트의 효율적 운영을 위한 몇 가지 개선 방안을 제시한다. 웹로그 분석 결과 1달 동안에 본 학회를 방문한 방문자 수는 총 411번으로 나타났으며, 방문 당 페이지뷰 수는 1.65, 그리고 평균 머문 시간은 1분으로 나타났다.
강창완,김규곤,최승배 한국자료분석학회 2018 Journal of the Korean Data Analysis Society Vol.20 No.6
Journal of the Korean Data Analysis Society founded in 1998 has played the role of a major application journal. In this study, we checked the objective of this journal by checking the abstracts for 10 years. Abstract data was crawled from the online journal site (kdas.jems.or.kr) and analyzed by topic model. As a result, we found 18 topics from 2680 abstracts that had several contents, for example, nursing, marketing, economics, regression, factor analysis, data mining and statistical inferences. Topic1 (regression) is most frequent with 460 documents and we found the usefulness of regression in the applied science area. We confirmed the significant 10 association rules using by Fisher’s exact test. Also, for exploring the trend of topics, we conducted the topic analysis for two periods which are 2006-2011 period and 2012-2016 period. We found that the control study was more frequent than survey study over time and regression and factor analysis were frequent regardless of time. 1998년에 창립한 한국자료분석 학회지는 자료분석에 기반한 다양한 전공분야를 위해 현재까지 응용학회지로서 역할을 해오고 있다. 본 연구에서는 이러한 한국자료분석 학회지의 본연의 목적을 잘 수행해오고 있는지 최근 10년간 학회지 요약문을 통해 분석하였다. 분석은 한국연구재단에서 제공한 온라인 저널 홈페이지를 통해 2006년부터 2016년까지의 영문 요약문 2680개를 웹크롤링하여 토픽모델을 적용하였다. 분석결과로 18개의 토픽이 선정되었으며 이에 대한 토픽을 해석한 결과 자료분석학회지는 간호학, 경영학(마케팅), 경제학 등 여러 분야를 다루고 있으며 분석방법으로 회귀분석, 가설검정, 데이터마이닝(연관성분석), 요인분석 등이 많이 이용되고 있음을 볼 수 있었다. 그리고 단어들의 연관성(association rule)분석을 통하여 통계적으로 유의한 연관성 규칙 10개를 제시하였다. 여기서 연관성규칙의 통계적 유의성검정은 피셔의 정확검정(Fisher’s exact test)을 사용하였다. 또한 연구주제(토픽)의 변화를 살펴본 결과 전반기에는 조사연구가, 후반기에는 대조 연구가 많아졌음을 볼 수 있고 또한 회귀분석과 요인분석은 전, 후반기 구분 없이 자료분석에서 공통적으로 많이 사용하는 통계적 방법임을 알 수 있었다.
한국 산업단지들의 경쟁력 우위 산업 분석에 관한 연구: 고용, 생산, 수출 데이터를 이용한 LQ 분석을 중심으로
김연준 한국자료분석학회 2019 Journal of the Korean Data Analysis Society Vol.21 No.2
This study analyzes the regional competitiveness of Korean industrial parks from 2014 to 2018 in terms of employment, production, and exports using the LQ analysis by industry. It analyzes whether the competitiveness of industrial parks based on 2014 changes by 2018. Unlike the existing methodology in calculating the specific weights of industries, this paper has contributed academically to applying the LQ methodology and extending the period to recent period, and conducting an empirical analysis with employment, production, and export data. Through the LQ analysis, we derive competitive industry by industrial park in Korea, and the result of analysis shows the process of changing the competitive industry by industrial park from 2014 to 2018. Results of analysis show that competitive industries exist by industrial park in terms of employment, production, and export, and that changes in structure between industries have occurred except for recently constructed industrial parks. And some industrial parks show improvement in industrial structure. The results of the analysis in terms of employment, production, and export show that production of transportation equipment is competitive in many industrial complexes across the country. 한국의 산업단지들은 제조업을 중심으로 정부의 산업단지 육성 정책과 함께 한국 산업 발전에 커다란 역할을 해왔다. 기존의 한국산업단지공단(2015)의 연구는 2014년을 기준으로 한국의 여섯 개 국가산업단지에 대해 산업별 비중을 계산하는 방법을 이용해 산업단지별 경쟁력 분석을 하였다. 본고는 기존의 산업별 비중을 계산하는 방법과 달리 LQ 방법을 응용하여 분석하고 기간을 최근 기간까지로 확장하고 고용, 생산, 수출 데이터를 가지고 실증분석을 하였다는 측면에서 학문적인 기여가 있다. 본고는 LQ 분석을 통해 한국의 산업단지별 경쟁력 우위 산업을 도출하였고 2014년부터 2018년까지 산업단지별 경쟁력 우위 산업의 변화 과정이 존재하였다는 사실을 발견하였다. 그리고 고용, 생산, 수출 측면에서 산업단지별 경쟁력 우위 산업이 존재함을 확인할 수 있었고 최근에 조성된 산업단지를 제외하고는 산업간 구조 변화가 발생한 경우를 확인할 수 있었으며 일부 산업단지에서는 산업구조 고도화 현상을 보이고 있음을 분석 결과는 보여주고 있다. 경쟁력 우위 산업이 고용, 생산, 수출에 있어서 각각 일치하는지에 대해 분석한 결과, 일치하는 경우가 그렇지 않은 경우 보다 큰 것으로 나타났다. 한편 운송장비의 경우, 전국의 다수 산업단지에서 경쟁력이 있는 것으로 나타났다.
기상관측이 시작된 이래 장기간 기상자료를 활용한 태풍에 동반된 기상 극값변화
나하나,정우식 한국자료분석학회 2022 한국자료분석학회 학술대회자료집 Vol.2021 No.2
우리나라의 여러 자연재해 가운데 태풍으로 인한 피해는 꾸준히 증가하고 있다. 특히, 2000년 대에 영향을 준 태풍 루사와 매미 시기에는 각각 일 강수량 극값 1위와 최대순간풍속 극값 1위 를 기록하면서 우리나라 역사상 최악의 재산피해를 발생시켰다. 피해의 증가와 태풍의 강도가 강해짐에 대한 태풍의 이론적인 연구는 다수 선행되었으나, 신뢰성 있는 장기간의 기상관측자료를 활용한 실제 태풍 강도의 증가를 분석한 연구는 매우 부족하다. 본 연구에서는 한반도에서 기상관측이 시작된 1904년부터 2020년까지의 한반도 영향태풍에 대한 극값, 즉 최대풍속, 최대순간풍속, 누적강수량, 최저기압 등에 대한 분석을 수행하였다. 본 연구의 결과는 기상청에서 공식적으로 관측이 수행된 1904년부터 2020년까지의 전 기간에 대한 한반도 영향태풍의 관측자료를 분석한 결과로써, 방재적인 측면에서 태풍에 대한 정책 결정의 기준으로써, 중요한 기초자료가 될 수 있을 것으로 사료된다.
한국인의 주관적 건강상태와 우울이 건강관련 삶의 질에 미치는 매개효과: 제7기 2016년도 국민건강영양조사를 활용한 이차자료 분석
유혜연 한국자료분석학회 2019 Journal of the Korean Data Analysis Society Vol.21 No.2
This study is a secondary data analysis study to investigate mediating effects of subjective health status and depression and impact factors on health related quality of life (HRQoL) using data of the first year (2016) of the 7th national health and nutrition examination survey. The subjects were sampled nationwide using the stratified cluster sampling method. The extracted data were analyzed by composite sample general linear model t-test, and composite sample logistic regression model. A hierarchical regression analysis proposed by Kenny (2008) and Mackinnon, Dwyer (1993) was conducted. Then the mediating effects of subjective health status and depression was validated using the formula of Sobel (1982). In results, the number of comorbidities, HbA1c and hs-CRP mediated through subjective health status indirectly influence on HRQoL. And the number of comorbidities mediated by depression and indirectly affect HRQoL, respectively. Therefore, further study is needed comprehensive approach for program considering subjective health status and depression to improve HRQoL of Korean adults. 본 연구는 국민건강영양조사 제7기의 1차(2016년)자료를 이용하여 한국인의 주관적 건강상태와 우울이 건강관련 삶의 질에 미치는 매개효과를 확인하기 위한 이차자료 분석연구이다. 추출된 자료는 복합표본 일반선형모형 t-검정, 복합표본 로지스틱 회귀모형, 다중회귀분석 등을 이용하여 분석하였다. 범주형 변수인 주관적 건강상태와 우울의 매개효과를 분석하기 위해 MacKinnon, Dwyer(1993)가 제안한 내용을 바탕으로 Kenny(2008)의 공식을 적용하여 회귀분석을 실시하였고, Sobel(1982)의 공식을 활용한 매개효과 검증을 실시하였다. 일반적인 특성을 통제한 후 한국인의 건강관련 삶의 질에 영향을 미치는 요인을 분석한 결과, 동반질환 개수, 주관적 건강상태, 우울이 건강관련 삶의 질의 유의한 영향요인으로 나타났다. 동반질환 개수, HbA1c, hs-CRP는 주관적 건강상태를 매개하여 건강관련 삶의 질에 영향을 미치는 것으로 검증되었고, 동반 질환 개수는 우울을 매개하여 건강관련 삶의 질에 영향을 미치는 것으로 검증되었다. 따라서 한국인의 건강관련 삶의 질을 개선하기 위해서는 평소 건강상태에 대한 관리 수준을 높이고 신체적 영역의 주관적 건강상태와 심리적 영역의 우울을 통합적으로 스크리닝할 필요가 있으며 건강문제 대처 능력과 자가 간호를 증진할 수 있는 통합적으로 접근할 수 있는 체계적인 간호 중재 프로그램 개발이 필요하다.
결측을 포함한 반복측정자료 모형에서 결측자료 메커니즘의 영향
송주원 한국자료분석학회 2010 Journal of the Korean Data Analysis Society Vol.12 No.3
Missing values often occur in repeatedly measured data due to dropouts and other reasons. To conduct an analysis of repeatedly measured data, models include correlations among different time points for the same subject. It is known that this model does not delete any observed values due to missingness of other time points and provides unbiased estimates of the parameters if missing data mechanism is MAR(Litte and Rubin, 2002). The analysis of repeatedly measured data often follows a restrictive approach that includes only variables of interests and covariates, since this parsimonious model is simple and easy to explain. On the other hand, a simulation study by Collins, Schafer, and Kam(2001) shows that a restrictive model could provide biased parameter estimates if it does not include an explanatory variable which is related to both a response variable and missingness. Here, we conducted a simulation study to compare this restrictive model without the explanatory variable and the model with the explanatory variable for repeatedly measured missing data. Since the restrictive model may provide biased parameter estimates, it is more appropriate to select explanatory variables by considering the missing data mechanism as well. It is also indicated that the size of biases depends on the correlation among repeated measured variables. 반복측정자료에서는 관측개체의 중도탈락 등의 원인으로 인하여 결측이 흔히 발생한다. 반복측정자료를 분석하기 위하여 동일한 개체에 대한 반복측정된 다른 시점의 값들 사이의 연관성을 포함하는 모형이 적합되는데 이 모형은 결측자료 하에서 정보의 손실이 없고 결측자료 메커니즘이 MAR(Little and Rubin, 2002)을 따른다면 모수의 추정에 편향(bias)이 발생하지 않는다고 알려져 있다. 반복측정자료의 분석에는 주요 관심 대상이 되는 변수 및 공변량 만을 모형에 포함시켜 분석하는 제한적 모형(restrictive model)이 흔히 사용되는데 이는 절약모형(parsimonious model)이 해석 및 설명하기 쉽기 때문이다. 반면, Collins, Schafer, and Kam(2001)은 횡단면 분석을 위한 모형에서 반응변수 및 결측 발생과 연관된 설명변수가 포함되지 않은 제한적 모형이 결측자료에 적용된다면 모수에 편향이 발생할 수 있다는 점을 모의실험을 통해 보였다. 본 연구에서는 결측을 포함한 반복측정자료에서 반응변수 및 결측 발생과 모두 연관되어 있지만 주요 관심 대상이 되는 설명 변수와 연관되지 않아 공변량이 아닌 변수가 모형에 포함되지 않는 제한적 모형과 이 변수를 모형에 포함하는 모형에서 모수 추정에 편이가 발생하는 지를 모의실험을 통해 비교하였다. 제한적 모형의 경우 모수 추정에 편향이 발생하는 것으로 나타나 결측자료 분석에서는 결측자료 메커니즘을 고려하여 연관된 변수를 포함하는 모형이 적절하게 나타났다. 하지만 모수 추정의 편이는 동일한 개체에 대하여 반복측정된 값들 사이의 연관성이 높아짐에 따라 작아지는 것으로 나타났다.
윤영주,김은주,김정일 한국자료분석학회 2019 Journal of the Korean Data Analysis Society Vol.21 No.3
The objective of this research was to investigate determinants affecting the real estate holding ratio of firms through linear and non-linear panel analysis. For the empirical analysis, a sample of 272 firms were selected based on a suitable balanced panel data analysis for eight years from 2010 to 2017 using a financial statement database provided by Fn-Guide. Linear and non-linear panel analysis were performed using the sample to examine descriptive analysis, correlation analysis for each variable, and association between corporate governance and the real estate holding ratio. The real estate holding ratio was statistically significant only for institutional investor share ratio, size, return on assets, and growth ratio by linear panel analysis. In addition, major stockholder share ratio, foreign investor share ratio, return on assets, research & development ratio, and free cash flow were presented as a reverse U shape, and leverage rate was displayed as a U shape in the non-linear panel analysis. And the relationship between the real estate holding ratio compared to the results using the linear panel analysis could be interpreted differently, since there were significant results for all variables except outside directors ratio and advertisement ratio in the non-linear panel analysis. 본 연구는 기업의 부동산 보유비율에 미치는 결정요인을 선형패널분석과 비선형패널분석을 통하여 규명하는 것을 목적으로 하고 있다. 실증적 분석에서, 표본은 Fn-Guide에서 제공하는 재무제표 데이터베이스를 이용하여 2010년부터 균형패널자료분석에 적합한 272개 기업의 8년간 패널자료를 대상으로 분석하였다. 이들 표본을 대상으로 표본의 기술적 분석, 각 변수의 상관분석, 그리고 기업지배구조와 부동산 보유비율의 상호관련성을 검증하기 위하여 선형패널분석과 비선형패널분석을 실시하였다. 선형패널분석에서는 기관투자자 지분율, 기업규모, 총자산순이익률, 그리고 매출액증가율만이 부동산 보유비율에 유의한 영향을 미치고 있다. 비선형패널분석에서는 대주주 지분율, 외국인투자자 지분율, 총자산순이익률, 연구개발비비율, 그리고 잉여현금흐름비율이 역 U자 형태를 취하고 있으며, 부채비율은 U자 형태를 취하고 있다. 제곱항이 제거된 변수에서는 선형패널분석 결과와 비슷하였으며, 제곱항이 유의한 변수는 더 많은 정보를 제공하여 유의한 해석이 가능하였다. 결과적으로 비선형에서는 사외이사비율과 광고선전비 비율을 제외한 모든 변수들에 대하여 유의한 해석이 가능하여 부동산 보유비율과 관계를 선형패널분석에서의 결과와 다른 해석을 할 수 있다.
기초자료 최적화 기반 한반도 태풍동반 강풍피해액 추정 : 2002-2019년 영향태풍을 대상으로
윤희성,정우식 한국자료분석학회 2022 한국자료분석학회 학술대회자료집 Vol.2021 No.2
본 연구에서는 태풍사전방재모델의 기상 입력자료로 사용되는 WRF(Weather Research and Forecasting) 모델 결과와 함께, 보다 정확도 높은 최대피해액 산정을 위해 활용 가능한 입력자료를 최대한 적용하여, 태풍시기 강풍으로부터 유발되는 단독주택 가구당 최대피해액을 산정하였 다. 2002-2019년 60개 영향태풍을 대상으로 유형별 분석을 진행하였고, 그중에서 권역 구분에 따 른 피해액은 태풍특성과 더불어 평균 매매가격이 고려되어 서울에서 가장 높은 가구당 최대피해액이 나타났다. 연도별 피해액 결과에서는 2011-2012년은 대체로 서해안 지역에 피해가 강했고 그중 2012년은 권역 구분에 따른 피해 구분이 명확히 잘 나타났음을 확인할 수 있고, 2016년은 3초 gust에 비례하여 남동해안 지역에 피해가 강하게 나타났다. 또한, 월별 분석에서는 8월이 10월보다 비교적 태풍 빈도나 피해가 강했지만, 10월에는 남동해안에서 점차 내륙으로 피해가 확 대되면서 향후 피해가 점진적으로 강해질 것으로 고려된다. 본 연구는 태풍에 동반된 강풍으로 유발되는 최대피해액을 산정하기 위해 최적화된 입력자료를 활용하여 수행한 기초자료로써, 사전방재 차원에서의 높은 효율성을 보일 것으로 사료된다.
외국인 유학생의 한국어 발음 분석 : 한국어 발음지도를 위한 예비연구
허명진,강소영 한국자료분석학회 2019 Journal of the Korean Data Analysis Society Vol.21 No.3
The purpose of this study was to investigate the error patterns of Korean pronunciation according to the duration of Korean residents, Korean language level, and placement and method of articulation. In this study there were 30 people involved foreign students, the Korean articulation phonological test (U-TAP) was conducted to evaluate their pronunciation. All pronunciation of foreign students was recorded and analyzed by two language therapists. Data were analyzed by two-way ANOVA, paired t-test and repeated measures ANOVA. As a result, the Korean pronunciation of foreign students was not different according to the duration of Korean residence or the level of Korean and show no different of accuracy between vowel and consonant pronunciation. In the position of consonants on the syllable, the phonemes located in the word initial-syllable initial were statistically more accurate than the phonemes located in the word middle-syllable initial. Bilabial sound in the articulation placement and nasal/liquid sound in the articulation method are pronounced more accurately than other phonemes. Therefore, vowel pronunciation should be emphasized when teaching Korean language to foreign students and consonant guide to focus on phonemes with many resonance tones and clues. 본 연구의 목적은 외국인 유학생의 한국어 발음을 향상시키기 위해 한국에 거주한 기간이나 한국어 수준, 조음위치와 방법에 따라 한국어 발음의 정확도를 살펴보고자 하였다. 외국인 유학생 30명을 대상으로 우리말 조음음운검사(U-TAP)를 실시하였고, 외국인 유학생이 산출한 모든 발음을 녹음하여 2명의 언어재활사가 분석하였다. 한국에 거주기간이나 한국어 수준에 따른 조음정확도 결과는 이변량분산분석으로 처리하였고, 조음위치와 방법에 따른 자료는 반복측정 분산분석을 실시하였다. 연구결과, 외국인 유학생의 한국어 발음은 한국에 거주하는 기간이나 한국어수준에 따라 차이가 없었으며, 자모음간 발음 정확도에서도 유의한 차이가 나타나지 않았다. 음절상에서 어두-초성에 위치한 음소는 어중-초성에 위치한 음소보다 통계적으로 유의하게 정확하였다. 조음 위치에서는 양순음이, 조음 방법에서는 비음과 유음이 다른 음소에 비해 정확하게 산출하였다. 따라서 외국인 유학생에게 한국어 발음을 지도할 때 모음의 정확도가 강조되어야 하며, 자음을 지도할 때는 공명음과 단서가 많은 음소위주로 먼저 교육하고, 가능하다면 각 국가별 음성학적 특성을 고려한 발음교육 접근이 제시되어야 할 것이다.