RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재후보

        제한조건이 있는 선형회귀 모형에서의 베이지안 변수선택

        오만숙 한국통계학회 2002 응용통계연구 Vol.15 No.1

        Linear regression models with inequality constraints on the coefficients are frequently used in economic models due to sign or order constraints on the coefficients. In this paper, we propose a Bayesian approach to selecting significant explanatory variables in linear regression models with inequality constraints on the coefficients. Bayesian variable selection requires computation of posterior probability of each candidate model. We propose a method which computes all the necessary posterior model probabilities simultaneously. In specific, we obtain posterior samples form the most general model via Gibbs sampling algorithm (Gelfand and Smith, 1990) and compute the posterior probabilities by using the samples. A real example is given to illustrate the method. 계수에 대한 부등 제한조건이 있는 선형 회귀모형은 경제모형에서 가장 흔하게 다루어지는 것 중의 하나이다. 이는 특정 설명변수에 대한 계수의 부호를 음양 중 하나로 제한하거나 계수들에 대하여 순서적 관계를 주기 때문이다. 본 논문에서는 이러한 부등 제한이 있는 선형회귀 모형에서 유의한 설명변수의 선택을 해결하는 베이지안 기법을 고려한다. 베이지안 변수선택은 가능한 모든 모형의 사후확률 계산이 요구되는데 본 논문에서는 이러한 사후확률들을 동시에 계산하는 방법을 제시한다. 구체적으로 가장 일반적인 모형의 모수에 대한 사후표본을 깁스 표본기법을 적용시켜 얻은 후 이를 이용하여 모든 가능한 모형의 사후확률을 계산하고 실제적인 자료에 본 논문에서 제안된 방법을 적용시켜 본다.

      • KCI등재

        영 과잉 순서적 프로빗 모형을 이용한 한국인의 음주자료에 대한 베이지안 분석

        오만숙,오현탁,박세미,Oh, Man-Suk,Oh, Hyun-Tak,Park, Se-Mi 한국통계학회 2012 응용통계연구 Vol.25 No.2

        순서적 다항 반응변수의 경우 종종 과도하게 많은 수의 관측치가 0 범주에서 발생하는 영 과잉 특성을 지닌다. 이러한 영 과잉 자료에서 0범주를 발생시키는 요인이 여러 개 존재할 때 일반적인 순서적 프로빗 모형은 자료를 설명함에 있어서 한계를 지닌다. 본 논문에서는 영 과잉 특성을 반영한 이 단계 영 과잉 순서적 프로빗 모형의 베이지안 분석기법을 제시하고 이를 2008년도 통계청에서 조사한 한국인의 음주소비 자료에 적용시킨다. 첫 번째 단계에서는 음주소비가 하나도 없다고 답한 0 범주에 속하는 비음주자들을 신념 또는 영구적 건강상의 문제 등으로 상황에 관계없이 음주를 하지 않는 절대적 비음주자(genuine non-drinker, non-participant)와 현재 소비가 없지만 상황에 따라 음주자가 될 가능성이 있는 잠재적 음주자(zero consumption potential drinker)로 구분하는 프로빗 모형을 적용시켜 분석한다. 두 번째 단계에서는 잠재적 음주자와 1 이상의 범주에 속하는 실제적 음주자를 합하여 음주자 집단으로 보고 이에 대하여 순서적 프로빗 모형을 적용하여 분석한다. 분석결과, 비음주자 중 약 30%가 절대적 비음주자로 음주자료가 일반적 순서적 자료에 비하여 뚜렷한 영 과잉 특성을 가짐을 알 수 있었다. 각 변수의 한계효과를 분석함으로써 같은 설명변수가 절대적 비음주자와 잠재적 음주자에 미치는 영향이 서로 반대로 나타날 수 있음을 발견하였고, 따라서 한국인의 음주자료에 대하여 제안된 영 과잉 순서적 프로빗 모형이 유용함을 보여주었다. Excessive zeroes are often observed in ordinal categorical response variables. An ordinary ordered Probit model is not appropriate for zero-inflated data especially when there are many different sources of generating 0 observations. In this paper, we apply a two-stage zero-inflated ordered Probit (ZIOP) model which incorporate the zero-flated nature of data, propose a Bayesian analysis of a ZIOP model, and apply the method to alcohol consumption data collected by the National Bureau of Statistics, Korea. In the first stage of a ZIOP model, a Probit model is introduced to divide the non-drinkers into genuine non-drinkers who do not participate in drinking due to personal beliefs or permanent health problems and potential drinkers who did not drink at the time of the survey but have the potential to become drinkers. In the second stage, an ordered probit model is applied to drinkers that consists of zero-consumption potential drinkers and positive consumption drinkers. The analysis results show that about 30% of non-drinkers are genuine non-drinkers and hence the Korean alcohol consumption data has the feature of zero-inflated data. A study on the marginal effect of each explanatory variable shows that certain explanatory variables have effects on the genuine non-drinkers and potential drinkers in opposite directions, which may not be detected by an ordered Probit model.

      • KCI등재

        잠재그룹 포아송 모형을 이용한 전립선암 환자의 베이지안 그룹화

        오만숙,Oh Man-Suk 한국통계학회 2005 응용통계연구 Vol.18 No.1

        최근 많은 연구자와 실무자들이 모집단에 내재해 있는 여러 다른 그룹(class, segment)간의 이질성을 밝혀내고 객체들을 그룹별로 세분화하는 방법 중 하나로 잠재그룹 모델(Latent class model)을 고려하고 있다. 이 논문에서는 2000년도에 국립 암 센터에 접수된 한국 내 연령별 전립선암 사망자수 자료를 기반으로, 잠재그룹 포아송 모형을 이용하여 전립선암 환자의 연령에 따른 그룹화를 시도한다. 최우추정법 등 고전적 추론방법의 한계를 극복하기 위하여 Markov Chain Monte Carlo (MCMC) 방법을 도구로 한 베이지안 추정 방법을 제안한다. 제안된 베이지안 방법의 장점은 용이한 모수추정과 추정오차의 제공, 그리고 각 객체의 소속그룹의 판정과 이에 따르는 오차, 즉, 객체의 각 군집에 속할 확률, 도 구할 수 있다는 것이다. 또한 주어진 자료들에 대해 가장 적합한 그룹의 수를 결정하는 방법을 제시하여 그룹의 수나 세분화의 근거를 사전에 제공하지 않아도 자료가 주는 정보로부터 이들을 자동으로 결정하는 방법을 제시한다. Latent Class model has been considered recently by many researchers and practitioners as a tool for identifying heterogeneous segments or groups in a population, and grouping objects into the segments. In this paper we consider data on prostate cancer patients from Korean National Cancer Institute and propose a method for grouping prostate cancer patients by using latent class Poisson model. A Bayesian approach equipped with a Markov chain Monte Carlo method is used to overcome the limit of classical likelihood approaches. Advantages of the proposed Bayesian method are easy estimation of parameters with their standard errors, segmentation of objects into groups, and provision of uncertainty measures for the segmentation. In addition, we provide a method to determine an appropriate number of segments for the given data so that the method automatically chooses the number of segments and partitions objects into heterogeneous segments.

      • KCI등재

        한국국민의 가계 금융부채에 대한 체감도 분석

        오만숙,현승미,Oh, Man-Suk,Hyun, Seung-Me 한국통계학회 2009 응용통계연구 Vol.22 No.2

        Korean household debt is one of the main sources of the current financial crisis. This paper studies the impact of household members' attributes such as a type of housing(self-own or rent), education, age, average monthly income of the head of household, and the area of residence, on the stress level of the household members due to household debt. We analyze a real data set collected by KB Kookmin Bank in 2004. We consider low and high stress level as a binary response variable and use a logistic regression model with the attributes of household members as explanatory variables. A simple but well-fitting model is selected by backward elimination method based on the likelihood statistic for goodness-of-fit test, and the impact of the attributes on the stress level is studied from parameter estimates of the selected model. We also perform the similar analysis on a binary response variable which distinguishes households with no debt from the rest. From the analysis, the stress level tends to be low for households with self-own houses, high average monthly income, low education level, and young members. 최근 금융위기의 요인이 되고 있는 가계부채에 대하여 가계구성원이 느끼는 부담감, 즉, 가계부채에 대한 체감도에 가계구성원의 속성들(주택점유형태, 가구주 학력, 가구주 연령, 월소득, 거주지역)이 미치는 영향을 2004년도 국민은행이 조사한 실제자료를 가지고 분석하였다. 체감도를 부채에 대한 부담감이 낮음과 높음의 이항자료로 구분하여 가계구성원의 속성들을 설명변수로 갖는 로지스틱 회귀분석을 수행하였다. 적합도에 대한 우도비 통계량을 이용한 후진제거법을 사용하여 간단하면서도 자료를 잘 적합시키는 모형을 선택한 결과 2개의 2차 교호작용을 갖는 모형이 선택되었다. 선택된 모형에 대한 계수 추정치를 통하여 각 속성이 부채 체감도에 대하여 미치는 영향을 분석하였다. 또한 가계부채의 유무에 대하여 가계구성원의 속성들이 미치는 영향을 로지스틱 회귀모형을 통하여 유사한 방법으로 분석하였다 자가주택일수록, 월소득이 증가할수록, 가구주 학력이 낮을수록 그리고 가구주 연령이 낮아질수록 부채에 대한 체감도가 낮아짐을 알 수 있었다.

      • KCI등재

        몬테칼로깁스표본기법을 이용한 누적로짓 모형의 베이지안 분석

        오만숙 한국통계학회 1997 응용통계연구 Vol.10 No.1

        순서적 다항자료의 누적로짓 모형에 대한 베이지안 사후추론을 위하여 몬테칼로 깁스표본기법을 제안하였다. 원래의 모형에서는 깁스표본기법 적용에 필수적으로 요구되는 각 원소모수의 조건부 확률분포가 난수생성에 편리한 형태로 주어지지 않으므로 Albert and Chib(1993)과 Oh(1997)에서 이항 로짓모형에 사용한 바와 같이 적절한 잠재변수를 도입하여 깁스표본기법 적용에 매우 편리한 형태를 갖도록 한다. An easy Monte Carlo Gibbs sampling approach is suggested for Bayesian analysis of cumulative logit models for ordinal polytomous data. Because in the cumulative logit model the posterior conditional distributions of parameters are not given in convenient forms for random sample generation, appropriate latent variables are introduced into the model so that in the new model all the conditional distributions are given in very convenient forms for implementation of the Gibbs sampler.

      • KCI등재

        t 분포의 극단 꼬리부분으로부터의 효율적인 난수생성

        오만숙,김나영 한국통계학회 1996 응용통계연구 Vol.9 No.1

        제한된 t 분포로부터의 난수 생성은 특히 베이지안 분석에서 제한이 있는 모수의 사후밀도함수를 추정하기 위하여 몬테카를로 적분을 하는 경우 등에 필요하다. 그런데 제한영역이 t분포의 극단 꼬리부분으로 주어졌을 때 기존의 난수생성기법의 적용은 매우 비효율적이 될 수 있다. 본 논문에서는 난수생성 알고리즘을 제시하과 기존의 기법들과 시뮬레이션을 통하여 효율을 비교하였다. It is often needed to generate random numbers from truncated t-distributions to carry out Bayesian inferences, especially in Monte Carlo integration for estimation of posterior densities of constrained parameters. However, when the restricted area is an extreme tail area with a small probability most existing random generation methods are not efficient. In this paper, we propose an efficient acceptance-rejection method to generate random numbers from extreme tail areas of a t-distribution. Using some simulation results, we compare the proposed algorithm with other popular methods.

      • KCI등재

        부등 제한 조건하에서의 베이지안 추론

        오만숙,Oh, Man-Suk 한국통계학회 2014 응용통계연구 Vol.27 No.6

        부등제한 조건 (>,<,=)과 관련된 베이지안 추론에서 다음의 세 가지 주제에 대하여 기존의 연구와 최근의 연구동향 그리고 추후 연구주제에 대하여 살펴보았다 : ⅰ) 모수에 대한 여러 부등제한 조건들의 비교, ⅱ) 모수에 부등제한 조건을 부여하는 것이 타당하다고 할 때 모수의 동등성에 관한 동시 다중 검정, ⅲ) 순서적 범주형 변수에 대한 분할표에서 스코어 모수에 순서적 부등제한 조건을 가정 할 때 스코어 모수의 동등성에 대한 다중 검정. This paper reviews Bayesian inference with inequality constraints. It focuses on ⅰ) comparison of models with various inequality/equality constraints on parameters, ⅱ) multiple tests on equalities of parameters when parameters are under inequality constraints, ⅲ) multiple test on equalities of score parameters in models for contingency tables with ordinal categorical variables.

      • 한국인의 사망원인 질병에 대한 통계적 분석

        오만숙,신우영 전북대학교 산업경제연구소 2010 아태경상저널 Vol.2 No.3

        Bureau of Statistics, Korea, has been collecting data from deaths each year about the cause of death and other demographic variables. Statistical analysis of such data would give not only useful guidelines for individual health care but also establishing governmental policies for health care system. However, only univariate analyses have been done and there is a need for multivariate analysis of the data to control confounding factors. In this paper, we analyze the Cause of Death Statistics, Korea, 2008. We especially focus on two diseases, 'Neoplasm, blood and blood diseases and certain disorders involving the immune mechanism' which is the most frequent cause of deaths and 'Endocrine, nutritional and metabolic diseases' which is rapidly increasing among Koreans. We use a logistic model for each of the two response variables. We first search for an appropriate model for the data, perform test of significance for each explanatory variable, and then interpret the effect of each explanatory variable to the response variables. The analysis results show that for 'Neoplasm, blood and blood diseases and certain disorders involving the immune mechanism', there is a higher chance that this disease would be a cause of death for residents in large cities, for city laborers, and people with a low education level. For 'Endocrine, nutritional and metabolic diseases', there is a higher chance that this disease would be a cause of death for men, for people with more stressful jobs. Especially, the effect of job on this disease is very strong. For instance, the odds of technicians would die of 'Endocrine, nutritional and metabolic diseases' is 2.64 times larger than that of students·houseworkers·unemployeds. 통계청에서는 매년 전년도 사망한 모든 사망자들을 대상으로 사망원인이 되는 사고 및 질병 등의 요인, 사망자의 주소지, 연령, 교육수준 등의 자료를 조사하여 발표하고 있다. 이는 사망원인이 되는 요인에 대한 분석이 한국인의 무병장수와 정부적 보건의료정책의 수립에 도움이 될 것으로 판단하기 때문이다. 그러나 그동안 사망통계자료에 대한 다변적인 분석이 미흡하여 귀중한 자료를 적극적으로 활용하지 못하였다. 본 논문에서는 2008년 사망원인 통계자료를 대상으로, 한국인의 사망원인 중 1순위인 ‘신생물, 혈액 및 조혈기관의 질환과 면역기전을 침범하는 특정장애’와 앞으로 한국인에게 확산될 것으로 우려되는 ‘내분비, 영양 및 대사 질환’의 두 질병에 대하여 적합한 모형을 찾고, 유의한 영향을 미치는 설명변수 들을 판별한 뒤 구체적인 영향의 분석을 수행한다. 분석결과 ‘신생물, 혈액 및 조혈기관의 질환과 면역기전을 침범하는 특정장애’는 대도시 보다는 지 방주민에게, 1차 산업 종사자나 전문가 보다는 도시 노동자에게, 그리고 교육 수준이 낮은 사람에게 더 많이 사망원인이 됨을 보여 주었다. ‘내분비, 영양 및 대사 질환’의 경우는 여자 보다는 남자에게, 평균적으로 스트레스를 많이 직업군에서 더 많이 사망원인이 됨을 보여 주었다. 이 질병은 특히 직업 의 영향을 매우 크게 받는 것으로 나타났는데, 기술공의 경우 학생·가사·무직에 비하여 오즈가 164% 증가함을 보여 주었다.

      • KCI등재

        Bayesian variable selection in quantile regression using the Savage–Dickey density ratio

        오만숙,최정순,Eun Sug Park 한국통계학회 2016 Journal of the Korean Statistical Society Vol.45 No.3

        In this paper we propose a Bayesian variable selection method in quantile regression based on the Savage–Dickey density ratio of Dickey (1976). The Bayes factor of a model containing a subset of variables against an encompassing model is given as the ratio of the marginal posterior and the marginal prior density of the corresponding subset of regression coefficients under the encompassing model. Posterior samples are generated from the encompassing model via a Gibbs sampling algorithm and the Bayes factors of all candidate models are computed simultaneously using one set of posterior samples from the encompassing model. The performance of the proposed method is investigated via simulation examples and real data sets.

      • KCI등재

        Performance Evaluation via Monte Carlo Importance Sampling in Single User Digital Communication Systems

        오만숙 한국통계학회 2006 Journal of the Korean Statistical Society Vol.35 No.2

        This research proposes an ecient Monte Carlo algorithm for computingerror probability in high performance digital communication systems. Itcharacterizes special features of the problem and suggests an importancesampling algorithm specially designed to handle the problem. It uses ashifted exponential density as the importance sampling density, and showsan adaptive way of choosing the rate and the origin of the shifted exponentialdensity. Instead of equal allocation, an intelligent allocation of the samplesis proposed so that more samples are allocated to more important part ofthe error probability. The algorithm uses the nested feature of the errorspace and avoids redundancy in estimating the probability. The algorithmis applied to an example data set and shows a great improvement in accuracyof the error probability estimation.AMS 2000 subject classications.Primary 65C05; Secondary 65D30.Keywords.Monte Carlo, adaptive importance sampling, stratication.1. IntroductionPerformance evaluation in high performance digital communication system isclosely related to estimation of the probability of bit error which can be convertedinto estimation of the integralI =ZEf(x)dx;Received February 2006; accepted March 2006.yThis work was supported by the Korea Research Foundation Grant KRF-2004-015-C00079.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼