다양한 형태의 데이터들이 대량으로 생성되는 시대에 직면한 현재, 시시각각 발생하는 변화에 대처하는 자세가 필요하다. 새로운 조사를 통해 정보를 얻는 방법이 어려워지는 상황에서 데...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
국문 초록 (Abstract)
다양한 형태의 데이터들이 대량으로 생성되는 시대에 직면한 현재, 시시각각 발생하는 변화에 대처하는 자세가 필요하다. 새로운 조사를 통해 정보를 얻는 방법이 어려워지는 상황에서 데...
다양한 형태의 데이터들이 대량으로 생성되는 시대에 직면한 현재, 시시각각 발생하는 변화에 대처하는 자세가 필요하다. 새로운 조사를 통해 정보를 얻는 방법이 어려워지는 상황에서 데이터 통합과 데이터 매칭의 방법을 통해서 조사목적에 맞는 데이터를 얻는 방법이 해외사례를 비롯하여 국내에서도 활용하려는 움직임이 많아지고 있다. 본 연구에서는 행정자료인 어업총조사 자료와 조사자료인 어업경영체 자료의 매칭을 활용하여 단일 데이터로서의 활용성을 제고해 보자는 목적으로 연구를 시작하였다. 매칭의 방법으로는 고유 ID로 매칭하여 정확도가 높은 정확매칭 방법과 로지스틱회귀분석을 통해 계산된 사후 확률을 사용하여 매칭하는 성향점수 매칭방법(PSM)을 사용하였다. 정확매칭으로 두 데이터를 연계한 결과 고유ID의 부재로 두 데이터간의 공통변수들 중에서 활용도가 높은 변수들을 더하여 새로운 ID를 만들어서 매칭을 친행하였다. 그 결과 매우 낮은 매칭률을 보였고 이를 보완하기 위해 성향점수 매칭방법에 초점을 맞추어 분석을 진행하였다. 성향점수 매칭방법은 총 3단계로 나누는데 1단계(1차매칭), 2단계(성향점수 매칭), 3단계(완전매칭)의 과정을 동해서 매칭률을 결정하였다. 본 연구에는 단계별로 각각의 어업에 종사하는 분야별로 경우를 나누어 분석을 하였고 해당 경우는 동력어선을 보유한 사람의 경우를 분석해 보았다. 또한 특정지역을 선택하여 분석하였는데 해당 지역은 경상남도 하동군이다. 결과적으로 매칭에 활용할 변수들이 부족하고 두 데이터에서 사용할 수 있는 키 변수의 정의가 달라서 낮은 매칭률을 보임을 확인할 수 있었다.
목차 (Table of Contents)