RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      다중대체와 재현자료 작성 = Multiple imputation and synthetic data

      한글로보기

      https://www.riss.kr/link?id=A106066139

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      As society develops, the dissemination of microdata has increased to respond to diverse analytical needs of users. Analysis of microdata for policy making, academic purposes, etc. is highly desirable in terms of value creation. However, the provision ...

      As society develops, the dissemination of microdata has increased to respond to diverse analytical needs of users.
      Analysis of microdata for policy making, academic purposes, etc. is highly desirable in terms of value creation.
      However, the provision of microdata, whose usefulness is guaranteed, has a risk of exposure of personal information.
      Several methods have been considered to ensure the protection of personal information while ensuring the usefulness of the data.
      One of these methods has been studied to generate and utilize synthetic data.
      This paper aims to understand the synthetic data by exploring methodologies and precautions related to synthetic data.
      To this end, we first explain muptiple imputation, Bayesian predictive model, and Bayesian bootstrap, which are basic foundations for synthetic data.
      And then, we link these concepts to the construction of fully/partially synthetic data.
      To understand the creation of synthetic data, we review a real longitudinal synthetic data example which is based on sequential regression multivariate imputation.

      더보기

      국문 초록 (Abstract)

      사회가 발전함에 따라 이용자의 다양한 분석 요구에 대응하기 위해 개인 단위로 구성된 마이크로데이터 제공이 증가했다. 나아가 센서스, 행정자료와 같은 전수자료를 마이크로데이터 형태...

      사회가 발전함에 따라 이용자의 다양한 분석 요구에 대응하기 위해 개인 단위로 구성된 마이크로데이터 제공이 증가했다. 나아가 센서스, 행정자료와 같은 전수자료를 마이크로데이터 형태로 제공받아 연구하고자 하는 요구 역시 커지고 있다. 정책결정, 학술목적 등을 위한 마이크로데이터 분석은 가치 창출 측면에서 대단히 바람직하다. 하지만 자료 유용성이 확보된 마이크로데이터 제공은 개인정보가 노출될 가능성이라는 위험을 가질 수 밖에 없다. 이에, 자료의 유용성을 확보하면서 개인정보보호를 보장할 수 있는 여러 방법들이 고려되어 왔다. 이러한 방법 중 하나로 재현자료(synthetic data)를 생성해서 활용하는 방법이 연구되어 왔다. 본 논문은 재현자료 생성과 관련된 방법론 및 주의사항을 소개하여, 재현자료의 이해를 도모하고자 한다. 이를 위해 재현자료 작성에 필수적인 다중대체, 베이지안 예측 모형 및 베이지안 붓스트랩 등의 개념들을 먼저 설명하고, 완전 재현자료 및 부분 재현자료에 대해 살펴본다. 특히, 재현자료 작성을 심도 깊이 이해하기 위해 순차회귀 다중대체(sequential regression multivariate imputation)를 이용해 경시적(longitudinal) 자료를 재현자료로 작성하는 구체적 사례를 살펴본다.

      더보기

      참고문헌 (Reference)

      1 박민정, "마이크로데이터 공표를 위한 통계적 노출제어 방법론 고찰" 한국통계학회 29 (29): 1041-1059, 2016

      2 Rubin, D. B., "The Bayesian bootstrap" 9 : 130-134, 1981

      3 Little, R. J. A., "Statistical analysis of masked data" 9 : 407-426, 1993

      4 Drechsler, J., "Some clarifications regrading fully synthetic data" Springer 109-121, 2018

      5 Reiter, J. P., "Significance tests for multi-component estimands from multiply imputed, synthetic microdata" 131 : 365-377, 2004

      6 Reiter, J. P., "Satisfying disclosure restrictions with synthetic data sets" 18 : 531-543, 2002

      7 Park, M. J., "Reveiw on the synthetic data generation methodologies" Statistical Research Institute 2017

      8 Machanavajjhala, A., "Privacy : theory meets practice on the map" 277-286, 2008

      9 Raab, G. M., "Practical data synthesis for large samples" 7 : 67-97, 2017

      10 Rubin, D. B., "Multiple imputations in sample surveys - a phenomenological Bayesian approach to nonresponse" American Statistical Association 20-34, 1978

      1 박민정, "마이크로데이터 공표를 위한 통계적 노출제어 방법론 고찰" 한국통계학회 29 (29): 1041-1059, 2016

      2 Rubin, D. B., "The Bayesian bootstrap" 9 : 130-134, 1981

      3 Little, R. J. A., "Statistical analysis of masked data" 9 : 407-426, 1993

      4 Drechsler, J., "Some clarifications regrading fully synthetic data" Springer 109-121, 2018

      5 Reiter, J. P., "Significance tests for multi-component estimands from multiply imputed, synthetic microdata" 131 : 365-377, 2004

      6 Reiter, J. P., "Satisfying disclosure restrictions with synthetic data sets" 18 : 531-543, 2002

      7 Park, M. J., "Reveiw on the synthetic data generation methodologies" Statistical Research Institute 2017

      8 Machanavajjhala, A., "Privacy : theory meets practice on the map" 277-286, 2008

      9 Raab, G. M., "Practical data synthesis for large samples" 7 : 67-97, 2017

      10 Rubin, D. B., "Multiple imputations in sample surveys - a phenomenological Bayesian approach to nonresponse" American Statistical Association 20-34, 1978

      11 Raghunathan, T. E., "Multiple imputation for statistical disclosure limitation" 19 : 1-16, 2003

      12 Rubin, D. B., "Multiple Imputation for Nonresponse in Surveys" John Wiley & Sons 1987

      13 Reiter, J. P., "Inference for partially synthetic, public use microdata sets" 29 : 181-188, 2003

      14 Abowd, J. M., "High wage workers and high wage firms" 67 : 251-333, 1999

      15 Rubin, D. B., "Discussion statistical disclosure limitation" 9 : 461-468, 1993

      16 Abowd, J. M., "Confidentiality, Disclosure, and Data Access: Theory and Practical Applications for Statistical Agencies" North Holland 215-277, 2001

      17 Park, M. J., "Comparative study on the recent SDC methods" Statistical Research Institute 2016

      18 Efron, B., "Bootstrap methods : another look at the jackknife" 7 : 1-26, 1979

      19 Clyde, M. A., "Artificial Intelligence and Statistics" Morgan Kaufmann 169-174, 2001

      20 Rubin, D. B., "An overview of multiple imputation" American Statistical Association 79-84, 1988

      21 Raghunathan, T. E., "A multivariate technique for multiply imputing missing values using a sequence of regression models" 27 : 85-95, 2001

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2027 평가예정 재인증평가 신청대상 (재인증)
      2021-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2018-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2011-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2009-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2007-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2005-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2002-07-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2000-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.38 0.38 0.38
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.35 0.34 0.565 0.17
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼