http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Graybill-Wang방법의 합분산에 대한 분산비의 수정 신뢰구간에 관한 연구 (2인자 지분분산성분 모형에서)
이 논문은 2인자 지분분산성분 모형에서 Graybill-Wang방법의 신뢰구간과 Kang의 수정 신뢰구간에 대한 시뮬레이션 결과를 비교하여 요약정리 하였다. Graybill-Wang방법의 신뢰구간의 시뮬레이션 결과에 의하면 I=J:3~5, K:3~10(정의역)에서는 100(1-a)%에 꼭 맞지 않거나 그 신뢰구간 범위의 폭이 넓다. 그러나 그 값은 100(1-a)%에 근사하는 경우는 J가 10~100이거나 실험횟수 K가 10000인 큰 수 일 때 이지만, 그 때 J나 K가 너무 커서 실제 실험과 검정에 사용 할 수가 없다. 그런데 수정신뢰구간은 J가 3~5실험횟수 K가(정의된) 3~10에서 사용이 가능하도록 수정하여 수정 신뢰구간이 더 좋다. 두 신뢰구간과 비교 결과는 다음과 같다. 1. I=J:3~5, K:3~10일 때 σ_A^2(σ_A^2+σ_B^2+σ_C^2)에 대한 상위 신뢰구간은 수정 신뢰구간의 범위가 더 좁아 Graybill-Wang방법의 신뢰구간보다 더 좋은 신 뢰구간 이였다. 그러나 그 하위 신뢰구간에서는 수정 신뢰구간과 Graybill– Wang방법의 신뢰구간의 값이 비슷하지만 Graybill–Wang방법의 신뢰구간이 100(1-a)%에 근사 하는 경우는 J가 100이거나 K가 10000일 때 이지만 그 때 J나 K가 너무 커서 실제 실험이나 검정에 사용 할 수가 없다. 그러나 수정 신뢰구간은 항상 정의된 J:3~5나 K가 3~10에서도 잘 근사 하므로 실제 실험과 검정에 사용할 수 있다. 그러므로 수정신뢰구간이 Graybill–Wang방법의 신뢰구간보다 더 좋다. 2. σ_B^2(σ_A^2+σ_B^2+σ_C^2)에서는 상위와 하위의 두 수정신뢰구간의 값이 Graybill- Wang방법의 신뢰구간과 비슷하다. 그런데 Graybill-Wang방법의 신뢰구간은 100(1-a)%에 근사 하는 경우는 I=5나 J=10인 경우인데 이 때 J가 너무 커서 실제 실험이나 검정에 사용 할 수 없다. 그러나 수정 신뢰구간은 I=J:3~5, K:3~10에서도 항상 잘 근 사하므로 실제 실험이나 검정에 사용할 수 있다. 그러므로 수정 신뢰구간이 Graybill-Wang방법의 신뢰구간 보다 더 좋다. 3. σ_C^2(σ_A^2+σ_B^2+σ_C^2)에서는 상위 신뢰구간은 수정 신뢰구간의 값이 Graybill- Wang방법의 신뢰구간과 비슷하다. 그러나 Graybill-Wang방법의 신뢰구간이 100(1-a)%에 근사 하는 경우는 I=5나 J=10인 경우인데 이 때 J가 너무 커서 실제 실험이나 검정에 사용 할 수 없다. 그러나 수정 신뢰구간은 I=J:3~5, K:3~10에서 잘 근사하므로 실제 실험에 사용할 수 있다. 그러므로 수정 신뢰구간이 Graybill-Wang방법의 신뢰구간보다 더 좋다. 그리고 하위 신뢰구간 은 I=J:3~5, K:3~10에서 수정 신뢰구간이 Graybill-Wang방법의 신뢰구간 보다 그 범위가 더 좁아 더 좋다. 그러므로 수정 신뢰구간이 Graybill-Wang 방법의 신뢰구간보다 더 좋은 신뢰구간 이다.
구선경 동아대학교 교육대학원 2006 국내석사
이 논문은 1인자 분산구성모형에서 Tukey([41])-Williams([45])의 근사방법을 사용한 Graybill과 Wang([15])의 에 대한 근사신뢰구간을 수정하여 보다 더 좋은 신뢰구간을 구하는 방법을 제시하고 그 시뮬레이션 결과를 통하여 에 대한 수정신뢰구간이 주어진 근사신뢰구간보다 더 좋은 신뢰구간인지를 보이고 실제로 그것을 활용할 수 있는 방법을 제시한 논문이다. 변량모형 에서 이고 이며, 를 인 분포라 하고 를 인 분포를 갖는다고 가정하면 합분산 꼴들이 생긴다. 여기서 은 급내 평균제곱이고 은 급간 평균제곱이다. 확률변수 는 관측 가능한 확률변수이고, 와 는 독립 관측 불가능한 결합정규분포이다. 와 , 는 관측 불가능한 변수이다. 또, 모수 공간 는 이고 에 의해 정의되고 , , 이다. 이 모형에 대한 선행연구자들의 신뢰구간들이 대부분 근사신뢰구간이기 때문에 이 신뢰계수가 에 꼭 맞는지 또는 아닌지를 정확하게 알 수 없다. 또, 밝혀지지 않은 많은 신뢰구간들은 그 신뢰계수를 찾아야 하고, 밝혀진 근사신뢰구간들은 그 신뢰계수가 에 보다 더 가까운 신뢰구간을 찾아야 하기 때문에 이 문제들은 지금도 계속 연구되고 있고 또, 앞으로도 계속 연구되어야 한다. 1인자 분산구성모형의 신뢰구간 중 Tukey([41])-Williams([45])의 방법을 사용한 Graybill과 Wang([15])의 근사신뢰구간을 보조정리 3.2.1에서 소개한다. 그런데 이 신뢰구간의 신뢰계수가 에 근사하는 경우 가 너무 커서 실제 실험에 사용하기가 곤란하기 때문에 이 을 수정하고 또, 이 신뢰구간의 폭을 좁게 하는 조건을 추가하여 다음과 같이 수정하였다. 임의의 자연수 와 가 존재하여 (1) , 단 은 (2) , 단 은 (3) , 단 과 은 (4)와 (5)의 , 이다. 이 결과는 본 논문에서 시뮬레이션으로 보여주고 비교하였다.
2인자 지분 분산성분 모형에서 신뢰구간의 범위에 관한 연구
유호재 동아대학교 교육대학원 1998 국내석사
2인자 지분(nested) 분산성분 모형 y_(ijk)=μ+A_(i)+B_(ij)+C_(ijk)에서 σ^(2)_(A)/σ^(2)_(C)에 대한 분산성분 모형의 신뢰 구간을 구하는 문제는 몇몇 학자들에 의하여 많이 연구되어 여러 결과를 얻었는데 그 결과를 요약하면, Graybill[12]은 2인자 지분 분산성분 모형에 대한 신뢰구간을 분산분석법으로 구하는 방법을 발표하였고, Broemeling[2]은 σ^(2)_(A)/σ^(2)_(C)과 σ^(2)_(B)/σ^(2)_(C)에 대한 신뢰구간을 발표하였다. 또, Wang[28]은, σ^(2)_(A)/σ^(2)_(C)과 σ^(2)_(A)/σ^(2)_(B)에 대한 신뢰구간을 발표하였는데, 그 결과는 Bromeling[2]의 σ^(2)_(A)/σ^(2)_(C)과 σ^(2)_(B)/σ^(2)_(C)에 대한 신뢰구간의 범위보다 더 좋게 나왔음이 밝혀졌다. Graybill과 Wang[13]은 σ^(2)_(A)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C))의 신뢰구간과 σ^(2)_(B)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C))의 신뢰구간 및 σ^(2)_(C)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C))에 대한 신뢰구간, 즉 전분산에 대한 각각의 비의 신뢰구간을 발표하였다. 여기서 Graybill과 Wang[13]의 σ^(2)_(B)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C))과 σ^(2)_(C)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C))의 전분산에 대한 각각의 비에 대한 신뢰구간은 Satterthwaite[23]의 신뢰구간보다 더 좋은 결과를 보여 주었음이 밝혀졌다. Burdick[5]과 Graybill[12]은 σ^(2)_(A)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C))에 대한 신뢰구간의 범위를 구하였다. 최근 Burch[4]는 2인자 분산을 갖는 혼합모형에서의 분산성분의 비에 대한 가장 좋은 "Lamotte-Mcwhorter type" 신뢰구간을 찾는 절차를 개발하였다. 그리고 Ofversten[20]은 반복추출법에 의하여 불균형 혼합모형에서의 분산성분을 검정하기 위한 정확한 절차를 유도하는 방법을 제시하였다. Fayyad 등[10]은 반복추출 검정의 멱에 대한 한계를 정하기 위한 등식을 유도하였고, Christensen[7]은 Wald의 검정과 함께 Ofversten [20] 방법의 통일된 처리 방법을 제시하였다. 그리고 Ueng과 Iyer[27]는 이 문제를 더 개선하고 확장시켜 좋은 결과를 얻었다. 위와 같은 신뢰 구간을 참는 문제들은 지금도 연구가 계속되어지고 있고, 또 앞으로도 연구가 되어져야 할 것이다. 왜냐하면 이 신뢰구간들이 100(1-α)%에 꼭 맞는 지 또는 꼭 맞지 않다던 그 신뢰구간이 어느 정도 근사한지가 밝혀져서 앞으로 더 좋은 신뢰구간이 필요한지에 대한 의문이 해결되기 때문이다. 따라서 이 논문의 목적은 그 신뢰구간 중에서 σ^(2)_(A)/σ^(2)_(C)에 대한 신뢰구간의 확률범위가 100(1-α)%보다 큰 지, 또는 작은 지 아니면 같은 지를 수학적인 증명에 의하여 그 범위를 보여주고자 한다. In the two-factor nested variance component model with equal numbers in the cells given by y_(ijk)=μ+A_(i)+B_(ij)+C_(ijk), the confidence intervals of the variance component models on σ^(2)_(A)/σ^(2)_(C) were obtained in various forms by many authors. An analysis of variance for the model is displaced in Graybill[12]. Bromeling[2] found out the confidence intervals on σ^(2)_(A)/σ^(2)_(C) and σ^(2)_(B)/σ^(2)_(C). Wang[28] found out the confidence intervals on σ^(2)_(A)/σ^(2)_(C) and σ^(2)_(A)/σ^(2)_(B). Then, the ranger of confidence intervals on σ^(2)_(A)/σ^(2)_(C) and σ^(2)_(A)/σ^(2)_(B) of Wang's ate better than Broemeling's σ^(2)_(A)/σ^(2)_(C) andσ^(2)_(B)/σ^(2)_(C). As well as, Graybill and Wang[13] found out the ratio of total variances of confidence intervals on σ^(2)_(A)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C)), σ^(2)_(B)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C)) and σ^(2)_(C)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C)). Burdick[5] and Graybill[12] showed the range of confidence intervals σ^(2)_(A)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C)), σ^(2)_(B)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C)) and σ^(2)_(C)/(σ^(2)_(A)+σ^(2)_(B)+σ^(2)_(C)) of Graybill and Wang[13] were better than those of Satterthwate's. Lately, Burch[4] developed procedures for selecting the best "LaMotte-McWhorter type" confidence interval for a ratio of variance components in a mixed linear model with two sources of variation based on the unbiasedness and expected length of the intervals. fversten[20] presented a method for deriving exact procedures for testing variance components in unbalanced mixed lineat models by the so-called resampling method. Fayyad et al.[10] derived an equality to place a bound on the power of the resampling test. Christensen[7] proposed an unified treatment of fversten's method with Wald's test. And Ueng and Iyer[27] were more improved and extended in this problems. By the way, in the asymptotic confidence intervals of Wang's and Broemeling's on σ^(2)_(B)/(σ^(2)_(A), the simulation results were given in these paper. Then, this problems are still being studied and must continuous to be studied, they fit exactly the given confidence coefficient 1-α and to determine confidence intervals closer to the 100α percentile confidence coefficient. In this cases where the acquired confidence intervals do not exactly fit 1-α, they are asymptotically close to 1-α. So, the aims of in this paper, we would like to show by the mathematical computation that the probability range of these confidence intervals on σ^(2)_(A)/(σ^(2)_(C) are equals and whether greater than 1-α or not.
Broemeling방법의 합분산에 대한 분산비의 수정신뢰구간에 관한 연구 : 2인자 지분분산성분 모형에서
이 논문은 2인자 지분분산성분 모형에서 Broemeling방법의 신뢰구간과 Kang의 그 수정신뢰구간에 대한 시뮬레이션 결과를 비교하여 요약정리 하였다. Broemeling방법의 신뢰구간의 시뮬레이션 결과에 의하면, I=J:3~5, K:3~10 (정의역)에서는 100(1-α)%에 꼭 맞지 않거나 그 신뢰구간 범위의 폭이 다소 넓다. 그러나 그 값은 100(1-α)%에 근사하는 경우는 실험횟수 K가 10000인 큰 수 일 때 이지만, 그 때 K가 너무 커서 실제 실험과 검정에 사용 할 수가 없다. 그런데 수정신뢰구간은 I=J:3~5, 실험횟수 K가(정의된) 3~10에서 사용이 가능하도록 수정하여 수정신뢰구간이 더 좋다. 두 신뢰구간의 비교 결과는 다음과 같다. (1) I=J:3~5, K:3~10일 때 {σ_A}^2/{{σ_A}^2+ {σ_B}^2+ {σ_C}^2}에 대한 상위 신뢰구간의 값은 수정신뢰구간의 범위가 더 좁아 Broemeling방법의 신뢰구간보다 더 좋은 신뢰구간 이였다. 그러나 하위 신뢰구간에서는 수정신뢰구간 값이 더 좋거나 Broemeling방법의 신뢰구간의 값과 비슷하다. 그러나 Broemeling방법의 신뢰구간이 100(1-α)%에 근사 하는 경우는 K가 10000일 때 인데 그 때 K가 너무 커서 실제 실험이나 검정에 사용 할 수가 없다. 그러나 수정신뢰구간은 항상 정의된 J:3~5나 K가 3~10에서도 잘 근사 하므로 실제 실험과 검정에 사용할 수 있다. 그러므로 수정신뢰구간이 Broemeling방법의 신뢰구간보다 더 좋다. (2) I=J:3~5, K:3~10일 때 {σ_B}^2/{{σ_A}^2+ {σ_B}^2+ {σ_C}^2}에 대한 상위, 하위 신뢰구간은 수정신뢰구간의 값의 범위가 더 좁아 Broemeling방법의 신뢰구간보다 더 좋은 신뢰구간 이였다. 그러므로 수정신뢰구간이 Broemeling방법의 신뢰구간보다 더 좋다. (3) I=J:3~5, K:3~10일 때 {σ_C}^2/{{σ_A}^2+ {σ_B}^2+ {σ_C}^2}에 대한 상위, 하위 신뢰구간은 수정신뢰구간의 값의 범위가 더 좁아 Broemeling방법의 신뢰구간보다 더 좋은 신뢰구간 이였다. 그러므로 수정신뢰구간이 Broemeling방법의 신뢰구간보다 더 좋다.
분산 A에 대한 수정 Howe 신뢰구간의 근사도에 대한 연구 (1인자 분산구성모형에서)
분산 A에 대한 수정 Howe 신뢰구간의 근사도에 대한 비교연구 (1인자 분산구성모형에서) A Study on the Approximate Precision of Modified Howe's Confidence Intervals for Variance A (in One-Factor Components Variance Model) 수학교육전공 이 재 용 지 도 교 수 강 관 중 이 논문에서는 1인자 분산구성모형에서 Howe 근사방법을 사용한 선행연구자의 에 대한 신뢰구간의 연구결과를 조사비교하여 그 신뢰구간을 수정하여 보다 더 좋은 신뢰구간을 구하는 방법을 제시하고, 그 시뮬레이션 결과를 통하여 에 대한 수정 Howe 신뢰구간이 Howe 신뢰구간 보다 더 좋은 신뢰구간임을 보이고 그것을 활용할 수 있는 방법을 제시한 논문이다. 변량모형 에서 이고 이며, 를 인 분포라 하고 를 인 분포를 갖는다고 가정하면 합분산 꼴들이 생긴다. 여기서 은 급내 평균제곱이고 은 급간 평균제곱이다. 확률변수 는 관측 가능한 확률변수이고 와 는 독립 관측 불가능한 결합정규분포이다. 와 , 는 관측 불가능한 변수이다. 또, 모수 공간 는 와 에 의해 정의하면 이다. 이 모형에 대한 선행연구자들의 신뢰구간들이 대부분 근사 신뢰구간이기 때문에 이 신뢰계수가 에 꼭 맞는지 아닌지를 정확하게 알 수 없다. 그 중에서 Howe의 신뢰구간의 신뢰계수를 시뮬레이션 한 결과 하위 신뢰구간의 폭이 너무 넓고, 실험횟수가 너무 커서 신뢰구간으로 사용 할 수 없었다. 그래서 이 신뢰구간을 수정하여 새로운 신뢰구간을 제안 하였다. 본 논문에서는 Howe 방법에 사용한 신뢰구간에서 1) 변수 대신에 로 변환하고 2) 신뢰구간의 폭이 넓은 하위 신뢰구간은 다시 수정한 수정 Howe 신뢰구간을 Howe 신뢰구간과 비교한 결과 다음과 같은 결론을 얻었다. 1. 수정 Howe 신뢰구간의 신뢰계수가 Howe 신뢰구간의 신뢰계수보다 더 좋아져서 수정 신뢰구간의 신뢰도가 더 좋아졌음을 알 수 있었고, 또한 신뢰구간도 크게 개선되었다. 2. 변수 를 로 바꾼 수정 Howe 신뢰구간은 실험횟수 를 보다 더 줄일 수 있었고 이때 어떤 적당한 상수 를 잡으면 실험횟수가 으로 실제 실험에서도 사용이 가능해지고 그 때 원하는 신뢰계수를 찾을 수 있다. 3. 하위 신뢰구간은 신뢰구간의 폭이 너무 넓어 재수정하여 더 좋은 신뢰구간을 얻었다. 4. 이 실험은 통계패키지 SAS 9.1를 사용하였다. 또, 실험의 난해성 때문에 에서만 실험하였는데 0~10에서도 비슷한 결과를 얻을 것이라 생각되고, 다른 프로그램을 사용할 때에도 비슷한 결과를 얻을 것으로 생각된다. 주요어 : 신뢰계수, 수정 신뢰구간, 1인자 분산구성모형.
Confidence intervals for survival function : a comparison study
생존함수의 신뢰구간 추정에는 Greenwood 공식을 이용하여 정규근사 신뢰구간은 계산하는 Greenwood 신뢰구간 방법이 널리 사용되고 있다. 생존자료는 중도절단이 존재하고, 표본크기도 크지 않아 이러한 Greenwood 신뢰구간을 적용하는 데 많은 어려움이 있다. 이에 대한 대안으로 Peto 신뢰구간, Wilson 신뢰구간, Agresti-Coull 신뢰구간, Higher-order asymptotic likelihood 신뢰구간, Constrained-beta 신뢰구간, Beta product confidence procedure(BPCP) 신뢰구간 등의 많은 신뢰구간들이 제안되었다. 본 논문에서는 생존시간의 분포, 중도절단의 정도, 표본의 크기 등의 다양한 조건 하에서 위에 제시된 신뢰구간을 비교하는 모의실험을 실행함으로써 생존함수의 신뢰구간 선택에 도움이 되고자 한다. A most common approach for constructing a confidence interval for survival function is to build a Greenwood confidence interval, which is a Wald type confidence interval with the variance estimated by Greenwood formula. Unique difficulties arise in survival analysis due to censoring and small sample size and these problems are hard to be dealt with by the usual statistical methods. Many attempts have been made to propose the alternative confidence interval for survival function, such as the Peto confidence interval, the Wilson confidence interval, the Agresti-Coull confidence interval, the higher-order asymptotic likelihood confidence interval, the constrained-beta confidence interval and the beta product confidence procedure(BPCP). In the study, simulations are conducted to compare these multiple confidence intervals for survival function under the various distributions of death time, censoring rates and sample sizes.
Broemeling 방법의 합 분산에 대한 분산 비 B에 대한 신뢰구간 : 2인자 지분 분산성분 모형에서
Broemeling 방법의 합 분산에 대한 분산 비 B에 대한 신뢰구간 (2인자 지분 분산성분 모형에서) Broemeling's Method Confidence Intervals for the Ratio B of Total Variance (in Two-Factor Nested Variance Components Model) 수 학 과 이 승 열 지도교수 강 관 중 본 논문은 2인자 지분 분산성분 모형 를 공부하고 그 성질과 신뢰구간의 근사방법을 공부하여 정리하였으며 분산 비 과 에 대한 Broemeling(1969) 방법의 신뢰구간을 이용하여 에 대한 신뢰구간을 찾는 방법을 공부하였다. 또 수정 Broemeling(1969) 방법의 신뢰구간의 시뮬레이션 결과를 비교하여 그 신뢰구간의 정도를 밝히고 그들의 추정과 검정에 사용하는 방법을 공부하여 정리하였다. 이 결과로부터 다음과 같은 결론을 얻었다. 1. Broemeling(1969) 신뢰구간에서 변수 가 클수록 근사도가 좋아지지만 그 값이 너무 커서 실제 실험에 사용할 수가 없어서 /를 로 수정하여 실험횟수를 줄일 수 있었고 이 때 어떤 적당한 상수 를 잡으면 실험 횟수 으로 실제 실험에서도 사용이 가능해지고 그 때 원하는 신뢰구간을 찾을 수 있음을 알 수 있었다. 2. Broemeling(1969) 신뢰구간의 범위가 너무 넓어 수정 신뢰구간을 사용해야 하고 그 수정 신뢰구간의 신뢰도가 더 높은 것을 알 수 있었다. 또한 수정 신뢰구간이 크게 개선되었음을 알 수 있었다. 3. 하위 신뢰구간은 최솟값은 음수이고 최댓값은 보다 커서 신뢰구간의 폭이 너무 넓어 , , , 에서 을 로 바꾸고, 에서 와 의 분모에서 을 로 바꾸는 재수정을 하여 더 좋은 신뢰구간을 얻었다. 이 실험은 통계패키지 SAS 9.1를 사용하였고 실험의 난해성 때문에 : 로 제한하여 실험한 결과이다. 만약 의 값의 범위를 더 넓게 하였을 경우에 이 결과가 어떻게 될지 실험해 볼 필요가 있다. 주요단어: 신뢰구간, 2인자 지분 분산성분 모형, 분산성분.
현재 통계적 소양은 우리나라를 포함한 여러 국가에서 통계교육의 목적으로 강조되고 있다. 통계교육을 통해 학생들이 통계적 소양을 갖추기 위해서는 교사가 먼저 통계적 소양을 갖추고 있어야 한다. 통계적 추정과 가설검정은 통계적 소양을 기르기 위해 필수적인 통계적 지식이고, 우리나라 중등 교육과정에서는 그중에서 통계적 추정만을 가르친다. 통계적 추정 단원의 핵심은 신뢰구간을 구해 모수에 대해 구간 추정을 하는 것이므로, 통계적 소양을 길러주기 위해서 교사는 신뢰구간을 중심으로 통계적 소양을 갖추고 있어야 한다. 한편 통계적 소양은 실세계 자료를 대할 때 필요한 능력이고 통계적 사고의 핵심은 통계적 영역과 맥락적 영역을 결합하는 것이다. 따라서 이 연구에서는 우선 실생활 자료에서 나타나는 신뢰구간의 양상을 파악하여 이를 위한 통계적 소양을 탐구하고, 설문 조사를 통해 예비교사들이 이러한 통계적 소양을 갖추었는지 교수 지식의 관점에서 분석한다. 실생활 자료 조사에서는 크게 대중매체 자료와 관공서 자료를 그 대상으로 선정하여 자료에서 나타나는 신뢰구간 관련 양상(추정 모수의 유형, 관련 용어, 신뢰구간 표현 방식 등)을 조사한다. 예비교사 대상 설문조사에서는 실생활 자료 분석 결과와 선행연구에서 마련한 통계적 소양을 측정할 수 있는 행동 목표를 바탕으로 하여 실생활 자료를 제공하면서 이와 관련한 신뢰구간 지식, 통계적 추론 등을 묻는다. 연구 결과, 중앙행정기관의 자료와 언론 자료에서 모비율 추정의 빈도가 모평균 추정의 빈도보다 높게 나타났고, ‘신뢰도’라는 용어보다 ‘신뢰수준’이라는 용어가 더 자주 등장했으며, 교과서에서 다루지 않는 ‘표본오차’와 그 유사어, 그리고 ‘표준오차’가 자주 등장하였다. 이를 바탕으로 정리한 예비교사들이 갖춰야 할 신뢰구간 관련 통계적 소양은 ‘다양한 맥락에서 접하는 통계 자료에서 모평균 및 모비율에 대한 신뢰구간의 의미를 이해하고 자료를 해석할 수 있다.’, ‘다양한 맥락에서 신뢰구간과 관련된 여러 용어의 뜻을 정확하게 알고 적절하게 활용한다.’, ‘다양한 맥락에서 접하는 통계 자료에서 표본오차를 포함한 신뢰구간의 구성 요소 사이의 상호 관계를 이해한다.’이다. 실생활의 통계 자료에서 나타나는 통계 양상과 위의 소양을 반영하여 예비교사들에게 관련 통계적 소양을 갖추고 있는지 물었다. 그 결과 모비율의 추정에서 요소들의 관계를 제대로 파악하지 못하는 예비교사가 많았고, 모평균의 추정과 모비율의 추정에 관계없이 교육과정에서 다루지 않는 신뢰구간 관련 용어에 대한 이해가 낮았으며, 이로 인해 신뢰구간을 바탕으로 두 모수가 유의미하게 차이가 있는지 판단하는 통계적 추론 능력이 높지 않았다. 그뿐만 아니라 대부분 예비교사가 모비율의 추정을 교육과정에서 다시 다루는 것과 실생활 자료에서 나타나는 신뢰구간 관련 용어를 함께 다루는 것을 제안하였다. Currently, statistical literacy is emphasized for the purpose of statistics education in several countries, including South Korea. In order for students to have statistical literacy through statistics education, teachers must first have statistical literacy. Statistical estimation and hypothesis test are statistical knowledge which are essential to develop statistical literacy, and only statistical estimation is taught in the secondary curriculum of South Korea. The core of statistical estimation in the secondary curriculum of South Korea is to estimate the interval for the parameter by obtaining the confidence interval. Consequently, the teacher must have statistical knowledge on the confidence interval for students to develop the same statistical knowledge. On the other hand, statistical literacy is necessary to deal with real-world data, and the core of statistical thinking is to combine statistical areas and contextual ones. Therefore, this study first identifies the aspects of the confidence interval in real life data, explores the statistical literacy which is necessary to understand and make use of them, and analyzes whether prelimanary teachers have such statistical literacy from the perspective of knowledge of teaching. In the survey of real-life data, mass media data and government office data are selected to investigate aspects related to the confidence interval(e.g. type of estimated parameters, related terms, expression method of confidence interval). The survey of preliminary teachers is conducted making use of real-life data based on the analysis results of real-life data and behavioral objectives that can measure statistical literacy prepared in previous studies, and asks about knowledge and statistical reasoning on confidence interval. As a result of the study, data from central administrative agencies and media data showed that the frequency of population ratio estimation is higher than that of population mean estimation, the term "reliability level" appeared more often than the term "reliability", and the term “sample error” and its similar ones as well as the term “standard error” appeared frequently. Based on this, the statistical literacy on confidence interval which prelimanary teachers must have is to understand the meaning of confidence intervals on both population mean and population raio and interpret data in various contexts, to exactly understand the meaning of terms related to the confidence interval and utilize them in a proper manner, and to understand the correlationship between components of the confidence interval including sample error in various contexts. Reflecting the statistical aspects of real-life statistical data and the above literacy, preliminary teachers were asked if they had relevant statistical literacy. As a result, many preliminary teachers did not properly grasp the relationship between factors in the estimation of the population ratio, and their understanding of the terms related to the confidence interval not covered in the curriculum was low regardless of the type of the estimated parameters. In addition, most preliminary teachers suggested that the estimation of the population ratio be dealt with again in the curriculum as well as the terms related to the confidence interval that appear in real life data.
붓스트랩 技法을 이용한 工程能力指數의 信賴區間 設定에 관한 硏究
공정능력지수는 생산공정에서 나타난 공정변동과 규격요건간의 관계를 통계적 척도로 나타낸 것으로, 공정의 잠재력과 성능에 관한 단위 없는 척도로 사용되어 왔다. 공정능력지수는 공정의 성능개선에 필요한 정보들을 수용하고 있을 뿐만 아니라 품질목표의 설정과 정보소통을 훨씬 단순화시킬 순 있기 때문에 산업계에서 널리 사용되고 있다. 공정능력지수를 연구함에 있어서 신뢰구간의 설정은 매우 중요하다. 산업현장에서 공정능력을 추정할 때, 공정에서 취한 샘플들을 사용하여 지수를 추정하기 때문에 이 추정치가 얼마나 정확하게 공정전체를 대표하고 있는지를 판단하기는 어렵다. 그러나 참값에 대한 신뢰구간을 추정함으로써 이러한 불확실성을 감소시킬 수는 있다. 따라서 공정능력을 연구할 때에는 공정능력지수의 추정과 함께 신뢰구간 설정에 관한 연구도 병행되어야 한다. 최근에 공정능력지수의 연구에 도입된 붓스트랩(bootstrap)기법은 각 지수들이 가지는 매우 복잡한 통계적 특성이나 분포에 제한을 받지 않게 함으로써 실무자들이 보다 쉽게 신뢰구간을 구할 수 있도록 하고 있다 붓스트랩기법은 소 표본에서도 비교적 정확하게 관심 통계량을 추정할 수 있도록 한다는 장점을 가지고 있으며, 모집단의 분포를 알 수 없을 때에도 정규성의 가정이 필요 없는 비모수적 기법이다. 일반적으로는 모집단에 대한 사전정보가 없을 때에는 정규성의 가정을 하고 통계량을 계산하게 되는데 이러한 가정을 만족하는 경우는 현실적으로 매우 드물다. 따라서 정규성가정을 필요로 하지 않는 붓스트랩 기법은 산업현장에서 폭넓게 사용할 수 있을 것이다. 본 연구에서는 붓스트랩 기법이 비모수적 기법으로서 공정능력지수들을 얼마나 정확하게 추정해 주는가에 초점이 맞추어져 있다. 따라서 대상 공정을 정규공정과 비정규 공정으로 나누고, 정규공정에 대해서는 공정이 정규분포를 따른다고 가정하고, 비정규공정에 대해서는 대수정규 분포 경우를 예로 들어서 각각 붓스트랩 기법을 적용하였다. 신뢰구간의 정확도에 대하여는 모수가 신뢰구간 안에 포함되어 있는지를 판단하는 포함확률을 추정해서 그 민감도를 비교하였다. 정규공정에서는 일반적으로 알려져 있는 공정능력지수를 추정하는 식을 사용하였으며, 비정규공정에서는 Pearson system과 Johnson system을 사용한 추정식에 붓스트랩 기법을 적용하여 C_(pm) , C_(pmk), C_(psk)에 대한 신뢰구간을 추정하고 있다. 본 연구에서 사용되는 붓스트랩 신뢰구간 춘정기법은 표준 붓스트랩 기법(standard bootstrap method), 백분위수 붓스트랩 기법(percentile bootstrap method), 그리고 치우침이 수정된 백분위수 기법(bias-corrected bootstrap method)이 사용되었다. 본 연구 결과를 요약하면 다음과 같다. 첫째, 공정능력지수들의 신뢰구간을 추정함에 있어서 복잡한 통계량 대신에 붓스트랩 재샘플링을 사용하여 공정능력지수들의 신뢰구간과 포함확률을 추정하였으며, 신뢰구간이 얼마나 정확하게 추정되었는가를 판단하는 포함확률이 신뢰수준과 크게 차이가 나지 않는 범위에서 비교적 정확하게 추정이 되었다. 둘째, 비정규공정에 대해 민감하게 공정능력을 측정하는 방법으로 알려진 있는 Pearson system곽 Johnson system을 적용해서 각각 공정능력지수와 신뢰구간, 그리고 포함확률을 추정한 결과, 이 방법을 적용하지 않았을 때 보다 좋은 신뢰구간과 포함확률을 얻을 수 있었다. 셋째, 정규공정에서의 신뢰구간이나 포함확률이 비정규공정에서의 신뢰구간이나 포함확률과 크게 차이가 나지 않는 범위에서 추정됨으로써 비모수적 붓스트랩 기법이 공정능력지수 연구의 대안으로 활용될 수 있음을 입증하였다. Process Capability Indices are widely used to provide a unitless measure of process potential and performance and in evaluation of purchasing decisions. These indices are a function of the process mean and standard deviation, the process specification limits and target value T for the process mean, USL, T, and LSL and assigned externally by engineers. A primary objective of process capability is to determine how well the output from the process meets the preassigned engineering specification. It is very important to estimate confidence intervals when we estimate process capability indices. If we estimate process capability indices, we draw some samples from process. Therefore it's difficult to find such a statistics are how well represent the population, so it is necessary to find confidence intervals However, it needs very complicated theories to estimate confidence intervals, but there is one solution to solve this problem, it is bootstrap method. The bootstrap method, as initiated by Efron(1979), avoids having to derive formulas via difficult analytical arguments by taking advantage of fast computers. It makes valid statistical inferences about the world without the need for using unrealistic or unverifiable assumptions. Recently, bootstrap method is used to estimate confidence intervals for process capability index. This method has advantage in the case that companies have a problem when they draw samples because of a large cost or special characteristic of some products that they should gain statistics through a few samples which is to estimate a interest statistics with a few samples correctly. In this papers, three bootstrap methods to estimate confidence intervals of process capability indices-standard method, percentile method, and bias corrected percentile method. Also It's estimated that process capability indices for a normal distribution and abnormal distribution-A normal distribution with μ = 50, σ = 2 is used for normal distribution, and a lognormal distribution abnormal distribution And it is estimated and compared that bootstrap methods are how well estimate confidence intervals for a normal and abnormal distribution. Especially, for abnormal distribution, the Pearson System and a Johnson system is used to estimate process capability indices. These are the summary of this study. First, confidence intervals and coverage probability is estimated using bootstrap resampling instead of complicated statistics, when we estimate confidence Intervals of process capability indices. A coverage probability which is used to decide that how well confidence intervals is estimated is not significantly difference with confidence level. Second, when we use Pearson system and Johnson system which are known that it estimate process capability indices sensitively, we gain better confidence intervals and coverage probability than other methods are used. Finally, it is proved that bootstrap method has advantage that both in normal process and abnormal process we gain better confidence intervals and coverage probability