RISS 학술연구정보서비스

다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        Bifactor 다차원 문항반응이론을 적용한 단위검사 구성 검사점수의 신뢰도 추정 방법

        김나나(Nana Kim):이규민(Guemin Lee):강상진(Sang-Jin Kang) 한국교육평가학회 2017 교육평가연구 Vol.30 No.1

        이 연구에서는 bifactor 다차원 문항반응이론을 적용하여 단위검사 구성 검사점수의 신뢰도를 추정하였고, 이를 기존 연구에서 사용되어온 다른 신뢰도 추정 방법들과 비교하였다. 구체적으로 bifactor 모형, 일차원 이분문항반응이론 모형, 일차원 다분문항반응이론 모형을 적용하여 추정한 신뢰도를 비교하였으며, 단위검사 효과의 크기와 단위검사의 불균형 수준이 이러한 단위검사 구성 검사점수의 신뢰도 추정에 미치는 영향을 분석하였다. 연구 결과, bifactor 모형이 단위검사 구성 검사점수의 신뢰도를 가장 정확하게 추정하였고, 이분문항반응이론 모형과 다분문항반응이론 모형은 신뢰도를 각각 과대 추정하거나 과소 추정하였다. 하지만 다분문항반응이론 모형의 경우에는 신뢰도 과소 추정의 정도가 미미하여, 단위검사 구성 검사점수의 신뢰도를 추정하는 방법으로 사용할 수 있을 것으로 보인다. 또한 단위검사의 효과가 커질수록 이분문항반응이론 모형의 신뢰도 과대 추정 정도가 커지는 것으로 나타난 반면, 단위검사의 불균형 수준은 신뢰도 추정에 큰 영향을 미치지 않았다. This study aimed to investigate a bifactor MIRT approach to estimating the reliability of testlet-composed test scores. Using simulated data, the reliability estimates derived from a bifactor model were compared to those estimated via traditional IRT models: a two parameter logistic (2PL) model and a graded response model (GRM). Moreover, the effects of testlet effect size and the degree of imbalance in testlet lengths on estimating the reliability were examined. The bifactor model produced the most accurate reliability estimates of testlet-composed test scores while the 2PL model and GRM over- and under-estimated the reliability, respectively. The magnitudes of underestimation in the GRM, however, were very small; therefore, using the GRM also seemed to be quite appropriate when estimating the reliability of testlet-composed test scores. The errors of reliability estimates obtained from the 2PL model increased as the testlet effect grew larger. The degree of imbalance in testlet lengths also influenced the errors of reliability estimated from the 2PL model, but the effect was marginal

      • KCI등재

        공통문항 비동등집단 설계에서 다차원 문항반응모형의 연계화와 동등화 결과 비교

        정지영(Ji young Jung),이규민(Gue min Lee),강상진(Sang Jin Kang),민경석(Kyung Seok Min) 한국교육평가학회 2016 교육평가연구 Vol.29 No.4

        본 연구는 공통문항 비동등집단 설계에서 이차원성을 갖는 검사자료에 다차원 문항반응모형을 적용한 연계화와 동등화 결과를 집단 간 비동등성, 차원 간 상관정도, 검사구조에 따라 모의실험을 통해 비교하였다. 각 연구조건에 따라 모의자료를 생성한 후 Oshima, Davey와 Lee(2000), Li와 Lissitz(2000), Min(2003)이 제안한 MIRT 연계화 방법을 적용하여 연계화를 시행하고 그 결과를 비교하였다. 이후 각 연계화 방법에 따라 공통 척도로 전환 된 모수를 사용하여 Brossman(2010)의 연구에서 제시한 복합 다차원 문항반응이론 관찰점수 동등화, 다차원 문항반응이론의 일차원적 접근 진점수와 관찰점수 동등화방법을 적용하여 동등화 결과를 비교하였다. MIRT 연계화 결과를 보면, Oshima, Davey와 Lee 방법이 Li와 Lissitz, Min 방법에 비해 집단 간 비동등성과 차원 간 상관정도에 따라 연계화 결과가 상대적으로 안정적으로 산출되었고, 검사구조에 따라서는 세 가지 연계화 방법의 결과가 유사하였다. MIRT 등동화 결과를 보면, Oshima, Davey와 Lee 연계화 방법이 적용된 경우에 모든 연구조건에서 세 가지 MIRT 동등화 방법의 결과가 유사하게 산출되었다. 한편 Li와 Lissitz, Min 연계화 방법이 적용된 경우에는 다차원 문항반응이론의 일차원적 접근 관찰점수와 진점수 동등화 방법 간 동등화 결과가 유사하였고, 복합다차원 문항반응이론 관찰점수 동등화 방법은 다른 패턴으로 동등화 결과를 산출하였다. The purpose of this study is to compare the results of MIRT linking and equating according to group nonequivalency, dimensional correlation, and test structures under the common item nonequivalent groups design with two dimensional simulation data. After separate calibration of generated simulation data, estimated parameters were linked by three MIRT linking methods: Oshima, Davey and Lee(2000), Li and Lissitz(2000), and Min(2003). Commonly scaled parameters by each linking method were equated by three MIRT equating methods: full MIRT observed score equating, approximate unidimensionalized MIRT true score, and approximate unidimensionalized MIRT observed score equating developed by Brossman(2010). A summary of the results of this study is divided into two parts because MIRT equating processes include MIRT linking procedures.

      • KCI등재

        단위검사로 구성된 검사에서 다양한 다차원 문항반응이론 모형에 따른 동등화 결과 비교

        이규민,강혜진 한국교육평가학회 2019 교육평가연구 Vol.32 No.4

        This study was designed to evaluate relative performance of four multidimensional item response theory (MIRT) models (Bi-factor, Testlet-response, Simple-structure, Second-order MIRT models) which could reflect the structure of testlet-based tests, and traditional unidimensional item response theory (UIRT) models in equating with real and simulated data sets. Based upon the results of this study, the following conclusions can be made. First, four MIRT models produced very similar IRT observed-score equating relationships for the tests composed of testlets. Second, the equating results from the UIRT and MIRT models were not easily differentiated from the practical point of view for real data analyses. Third, based upon the results from simulated data analyses, the UIRT model produced significantly different equating relationships compared to those from the MIRT models and showed bigger biases when data were significantly departed from the unidimensionality assumption. In the case of significant departure from the unidimensionality assumption, it would be recommended to use the MIRT models rather than the UIRT models in equating scores from tests composed of testlets. 이 연구는 단위검사로 구성된 검사의 구조를 모형에 반영할 수 있는 4가지 다차원 문항반응이론 모형(Bi-factor, Testlet Response, Simple-structure, Second-order MIRT 모형)과 전통적으로 사용되어 온 일차원 문항반응이론 모형을 실제 자료와 모의실험 자료에 적용하여 동등화 결과를 비교하여 각 모형의 상대적인 동등화 수행능력을 평가하고자 하였다. 결론은 다음과 같이 요약될 수 있다. 첫째, 이 연구에서 검토된 4가지 MIRT 모형 관찰점수 동등화 결과는 단위검사로 구성된 검사의 동등화에서 유사한 결과를 산출하였다. 둘째, 실제 자료를 활용한 분석에서 일차원 문항반응이론 모형은 다차원 문항반응이론 모형과 거의 차이를 확인할 수 없을 정도의 유사한 동등화 결과를 산출하였다. 셋째, 가상자료를 바탕으로 한 분석에서, 일차원성 가정 이탈 수준이 높은 경우, 일차원 문항반응이론 모형에 기반한 동등화 방법은 다차원 문항반응이론 모형에 기반한 동등화 방법과 다른 동등화 결과를 산출하였고, 동등화 편의가 큰 것으로 나타났다. 문항반응이론의 일차원성 가정의 위배가 큰 경우, 단위검사로 구성된 검사의 동등화에 다차원 문항반응이론 모형을 적용한 동등화 방법을 사용하는 것이 타당할 것이다.

      • KCI등재

        다차원 문항반응모형의 척도연계방법

        민경석(Min Kyung-Seok),김종필(Kim Jong-Pil) 한국교육평가학회 2006 교육평가연구 Vol.19 No.1

        문항반응이론에서는 전통적으로 일차원성 가정을 중요시한다. 그러나 많은 연구자들은 교육/심리 검사가 다양한 차원에 반응하고 있음을 주장하며, 이에 따른 다차원 문항반응모형의 필요성을 제안하였다. 하지만 다차원 문항반응이론이 널리 쓰이지 못하고 있는 이유 가운데 하나로 여러 능력차원을 고려한 동등화 척도의 개발에 대한 어려움을 들 수 있다. 근래 이에 대한 해결 방안으로 Oshima, Davey, & Lee(2000)와 Li & Lissitz(2000)이 각각 다차원척도연계방법을 개발하였다. 이 두 방법은 각기 독자적인 이론적 근거와 수리적 방법에 따라 개발될 것으로 이 논문에서는 다차원 척도연계방법의 현실적 적용을 위하여 위 두 방법을 척도연계의 정확성과 안정성이라는 측면에서 비교/분석하였다. 가상자료를 이용한 분석 결과는 Oshima, Davey, & Lee의 방법이 변별도의 연계에 비교적 안정적이며, Li & Lissitz의 방법은 직교회전을 통한 차원성 유지와 난이도 연계에 보다 강점을 갖는 것으로 나타났다. 덧붙여 다차원 문항반응모형 척도연계에 대한 제한점과 주의점이 논의되었다. Unidimensionality in the traditional IRT model has been regarded as a strong assumption. Many researchers agree that psychological/educational tests are sensitive to multiple traits, implying the need for multidimensional item response theory (MIRT). One fact that limits the application of MIRT in practice is difficulty in establishing equivalent scales based on multiple traits. Several solutions for this problem have been proposed. In this study, two MIRT linking methods, recently developed by Oshima, Davey and Lee (2000) and Li and Lissitz (2000), respectively, are investigated based on the accuracy and stability of multidimensional scale transformations under several testing conditions. Simulated data under considering several testing conditions, are analyzed for the comparison of the two linking methods. The results show that Oshima et al."s method performs well in transforming item discriminations, and that Li and Lissitz"method has an advantage of maintaining test dimensional structures through orthogonal rotation and of transforming item difficulties. The limitations and cautions in using multidimensional scaling techniques are discussed.

      • KCI등재

        혼합형 검사에서 공통문항의 비율과 구성 방식이 Bi-Factor MIRT 관찰점수 동등화에 미치는 영향

        안성현(Seonghyun An),강혜진(Hyejin Kang),이규민(Guemin Lee) 한국교육평가학회 2021 교육평가연구 Vol.34 No.3

        이 연구에서는 Bi-Factor 다차원 문항반응모형을 공통문항 비동등집단 설계에서 수집되었다고 가정한 혼합형 검사 자료에 적용하여 관찰점수 동등화를 진행하고, 그 결과가 공통문항의 구성 조건 및 문항 유형 요인의 상관 정도에 따라 어떠한 차이를 보이는지 살펴보았다. 이를 평가하기 위하여 선행연구에서 많이 사용되었던 2모수 일차원 문항반응모형을 비교 모형으로 설정하였다. 연구 결과, 문항 유형 간 상관이 제일 낮은 조건인 0.5와 중간 조건인 0.7인 경우에서는 공통문항의 비율 및 구성 방식에 상관없이 모든 조건에서 Bi-Factor MIRT 모형의 동등화 오차가 일차원 모형보다 더 양호한 것으로 나타났다. 이에 반해 문항 유형 간 상관이 0.9인 경우에서는 2모수 일차원 문항반응모형의 동등화 오차가 더 낮은 것으로 나타났다. 공통문항의 구성에 따라서는 전체 검사의 선택형 문항과 서답형 문항의 비율과 유사하게 공통문항이 구성되었을 때 동등화 오차가 가장 낮은 것으로 나타났고, 전체 검사 문항에 대한 공통문항의 비율이 증가함에 따라 동등화 오차는 감소하는 것으로 나타났다. This study applied the Bi-Factor MIRT model to hypothetical simulated mixed-format test data in the context of observed-score equating with a common-item nonequivalent groups (CINEG) design. The equating results were compared with those derived from applying the two-parameter logistic (2PL) UIRT model across several conditions of combining proportions and compositions of common items, and correlations between two dimensions of item types. The Bi-Factor MIRT model produced lower root mean squared errors (RMSEs) than did the 2PL UIRT model for every conditions in 0.5 and 0.7 correlations between dimensions of item types. However, in 0.9 correlation, the RMSEs for 2PL UIRT model were lower than those for the Bi-Factor MIRT model. The RMSEs were the lowest when the compositions of common items reflected similarly the proportions of multiple-choice (MC) and free-response (FR) items in the total test. As the proportion of numbers of common items relative to the numbers of items in the total test increased, the RMSEs for both UIRT and MIRT equatings decreased as expected.

      • KCI등재

        Fixed Parameter Calibration for Linking Multidimensional IRT Scales

        박찬호(Chan ho Park),김성훈(Seong hoon Kim) 한국교육평가학회 2016 교육평가연구 Vol.29 No.4

        문항반응이론(item response theory: IRT)을 사용하는 검사 프로그램에서, 서로 다른 동형검사에 응시한 피험자의 능력 점수를 상호 비교하기 위해서는 하나의 능력척도가 개발되고 유지될 필요가 있다. 척도연계 방법과 더불어 가교-고정 모수 추정(fixed parameter calibration: FPC) 방법은 문항모수와 능력분포를 기 개발된 능력척도 상에서 추정함으로써 그 능력척도를 유지하는 데 활용된다. 지금까지 FPC 방법은 주로 일차원 IRT 모형을 사용하는 검사에 적용되어 왔다. 그러나 검사 문항에 답하는 데 다수의 기능이나 능력이 필요하다면, 다차원 문항반응이론(MIRT) 모형이 문항 분석에 보다 적합하다. 본 연구는 MIRT 척도연계의 한 방법으로 FPC의 활용 가능성을 탐색하고자 하였다. 분석에 사용된 모형은 다차원 2모수 로지스틱(M2PL) 모형이었다. MIRT 척도연계(즉, 척도 유지)를 위해 FPC이 어떻게 기능하는지를 검토하기 위해서, 50-문항 검사에 1,000명의 피험자가 응시하는 상황을 가정하고 모의실험을 수행하였다. 모의실험 요인으로 공통 문항의 수, 능력차원의 평균, 능력차원의 공분산 등을 고려하였다. 모수 추정을 위해 MCMC (Markov chain Monte Carlo) 알고리즘을 사용하였다. 주요 결과로서, 문항모수의 복원은 전반적으로 양호하였으며, 특히 곤란도 모수가 가장 정확하게 추정되었고 다음으로 변별도 모수, 피험자의 능력 평균, 분산과 공분산 순이었다. 편파(bias)는 일부 조건에서 비교적 큰 값을 보이는 경우가 있었으나 모의실험 조건에 따라 체계적인 변화를 보이지는 않았다. 전반적으로, 공통 문항의 수가 추정의 정확성에 가장 큰 영향을 미쳤으며 다른 조건에 의한 차이는 대체로 미미하였다. 제안된 FPC 방법의 실제 활용과 후속 연구 방향에 대해서도 논의하였다. When multiple forms exist for a standardized educational test, a single scale should be maintained over administrations of the forms for test scores from each form to be interchangeably used, and fixed parameter calibration (FPC) has been a useful linking method when item response theory is used. If multiple skills or traits are necessary when solving a certain types of test items, multidimensional item response theory (MIRT) models are useful. This study proposed FPC as a linking method for MIRT. The model considered in this study is a two-parameter logistic MIRT model as a compensatory MIRT model. To examine how FPC functions for MIRT linking, a simulation analysis was conducted for a 50-item test with 1,000 examinees. The simulation factors were the number of common items, increased levels of ability means, and varying degrees of latent trait covariances. A Markov chain Monte Carlo estimation algorithm was employed for parameter estimation. As a result, item parameter recovery was acceptable overall. Item difficulty parameters were most accurately estimated, followed by item discrimination parameters, latent trait means, and latent trait variances-covariances. No systematic biases were observed although there was some variability across simulation conditions. Generally, the number of common items was the most influential factor for accurate estimation of item and person parameters, and the influences of the other conditions were minimal. The utility of the proposed method and directions for future research were also discussed.

      • KCI등재

        다차원 명명반응 모형을 위한 척도연계 방법

        김성훈(Seonghoon Kim) 한국교육평가학회 2020 교육평가연구 Vol.33 No.3

        본 연구의 목적은 탐색적 다차원 문항반응이론(item response theory: IRT) 모형 중 가장 일반적인 형태인 다차원 명명반응(nominal response: NR) 모형을 위한 공통-문항 척도연계 방법을 제시하고 이 방법의 적절성을 탐구하는 데 있다. 이를 위해 최소제곱(LSQ) 방법과 문항유목반응함수(IRF) 방법의 두 가지 방법을 제시하고 두 방법의 기능을 모의실험을 통해 검토하였다. 모의실험 요인으로 기저 능력분포의 유형, 표본의 크기, 가교 문항의 수 등을 포함하였다. 대부분의 모의실험 조건에서 LSQ 방법은 임의의 다차원 능력척도를 기준 능력척도로 변환하는 데 사용되는 척도연계 계수(회전행렬과 이동벡터)를 추정함에 있어 IRF 방법보다 열등한 기능을 보였다. 특히 LSQ 방법은 척도연계를 통해 기저 능력분포를 추정할 때 능력 변수의 분산을 상당한 정도로 과소 혹은 과대 추정하는 경향을 보였다. 이에 비해 IRF 방법은, 가교 문항의 수가 5인 조건을 제외하고, 척도연계를 통해 기저 능력분포의 모수뿐만 아니라 문항 모수 또한 적절히 추정하였다. 논문의 말미에 다차원 NR 모형을 적용한 검사 자료의 분석 과정에서 IRF 척도연계 방법이 어떻게 실시되어야 하는지에 대해 논의하였다. In item response theory (IRT), the exploratory multidimensional nominal response (NR) model is one of the most general models, from which several dichotomous and polytomous models can be derived. The purpose of this paper is to present common-item scale-linking methods for the multidimensional NR model and investigate their characteristics and performances. For this, the least squares (LSQ) method and the item-category response function (IRF) method were presented and their functions were examined through computer simulations. The simulation study included three factors of (a) type of population ability distribution, (b) sample size, and (c) number of anchor items. Simulation results showed that overall, the LSQ method was inferior to the IRF method in estimating the linking coefficients (rotation matrix and translation vector) used to transform an arbitrary multidimensional ability scale to the base scale. In particular, the LSQ method tended to considerably under-estimate or over-estimate the variances of ability variables when recovering the underlying ability distribution through scale linking. On the other hand, the IRF method recovered well the parameters of the underlying ability distribution as well as the item parameters through scale linking. At the end of the paper, a discussion is provided as to how the IRF linking method should be implemented in association with the process of test data analysis based on the multidimensional NR model.

      • KCI등재

        다차원 문항반응모형의 총점 산출을 위한 기준선 합성방법과 최대 검사정보함수 방법의 비교

        민경석 한국교육과정평가원 2012 교육과정평가연구 Vol.15 No.3

        Multidimensional IRT models have been popular as the tests tend to measure multiple constructs rather than one latent variable. While there were various studies to produce more reliable sub-scores in multidimensional IRT models, the research on overall scores was somewhat limited. The purpose of this paper was to compare two MIRT calibration methods of overall score such as reference composites and maximizing test information function method. For the comparison of two methods, simulated data with approximate simple structure and complex structure, and real data were analyzed. As a result, a simple linear relationship between sub-scores and overall scores could not be assumed expecially in the simple structure. Also, the test information function method provided more detailed examinees' ability information in the complex structure compared with the reference composit method. In addition, limitations of the study and directions for further research were discussed. 교육/심리 검사가 서로 관련성을 갖는 다양한 능력을 측정함에 따라 측정모형은 전통적인 일차원 문항반응모형에서 다차원 문항반응모형으로 확장되어왔다. 다차원 문항반응모형을 이용한 신뢰로운 하위점수(sub-scores)의 산출방법에 대한 다양한 논의가 이루어져온 반면, 하위점수를 종합한 총점(overall scores)의 의미와 특성에 대한 연구는 상대적으로 제한적이라 할 수 있다. 이 연구의 목적은 피험자와 문항간의 상호작용에서 복수의 잠재적 능력을 가정하는 두 가지 총점 산출방법(기준선 합성방법과 검사정보함수 방법)의 특성을 비교하는 데 있다. 구체적으로 모의 자료(차원구조를 가정한 문항모수)와 실제 대규모 검사자료의 분석을 통하여 총점 산출방법에 따른 하위점수와 총점과의 관계를 논의하였다. 연구결과로써, 모의 자료 분석에서 검사의 차원구조가 단순구조에 가까울수록 기준선 합성방법과 최대 검사정보 방법의 총점 간 차이가 크게 나타났다. 이는 단순구조에서 총점-하위점수 사이에 단일한 선형관계를 가정할 수 없음을 의미한다. 두 번째, 복합구조를 갖는 실제 검사 자료 분석에서 두 가지 총점 산출방법이 유사한 결과를 제공함에도 불구하고, 검사정보함수 방법의 총점은 피험자 수준에 따라 상대적으로 중요한 능력수준에 대한 보다 세밀한 정보를 제공하는 특성을 보였다.

      • KCI등재

        다차원 일반화부분점수 모형을 위한 척도연계 방법의 특성 및 상대적 기능 분석

        김성훈(Kim, Seonghoon) 한국교육평가학회 2019 교육평가연구 Vol.32 No.2

        문항반응이론(IRT)에서 다차원 일반화부분점수(multidimensional generalized partial credit: MGPC) 모형은 다차원 능력변수를 측정하는 검사 문항에 대한 피험자들의 다분 반응을 분석하기 위해서 사용되고 있다. 본 연구는 MGPC 모형을 위한 다차원 척도연계(scale linking) 방법으로 최소제곱(LSQ), 문항반응함수(IRF) 및 검사반응함수(TRF)의 세 가지 방법을 공통-문항 설계하에서 제시하고 모의실험을 통해 이 방법들의 특성과 상대적 기능을 분석하고자 하였다. 이를 위해 검사의 유형, 모집단 능력분포의 유형, 표본의 크기, 그리고 공통 문항의 수 등의 네 가지 요인을 결합하여 생성한 모의실험 조건들에서 각 척도연계 방법이 척도연계를 통해 모집단 능력분포의 모수와 문항모수를 얼마나 잘 복원하는지를 검토하였다. 주요 결과로, 각 척도연계 방법은 모든 모의실험 조건에서 척도연계의 회전행렬과 이동벡터를 적절히 추정하였다. 그러나 세 척도연계 방법 간 기능의 상대적 우수성은 검사 유형에 따라 차이를 보였다. 단순 구조의 문항들과 복합 구조의 문항들이 혼재된 검사에 대해서, 척도연계를 통한 능력분포 모수 및 문항모수 추정의 정확성에 있어서 전반적으로 IRF 방법이 가장 우수하였고, LSQ 방법이 그 뒤를 따랐으며, TRF 방법이 가장 열등하였다. 복합 구조의 문항들만으로 구성된 검사에 대해서는, 전반적으로 IRF 방법이 가장 우수하였고, TRF 방법이 그 다음이었으며, LSQ 방법이 가장 열등하였다. In item response theory (IRT), the multidimensional generalized partial credit (MGPC) model can be used for analyzing data from the partially-scored items with two or more response categories that are intended to measure multiple latent traits. The present study was purposed to present three scale-linking methods for the MGPC model under the context of common-item linking designs and investigate their characteristics and performances through computer simulations. The common-item linking methods presented are the least squares (LSQ), item-category response function (IRF), and test response function (TRF) methods. Computer simulations, including four factors of test type, multivariate ability distribution for the examinee population, sample size, and number of the common items used for linking, were conducted to examinee how well the three linking methods would recover the distribution parameters and the MGPC item parameters through scale linking. The simulation results suggested that in various linking conditions, the three methods should properly work for estimating the rotation matrix and translation vector of linear linking functions. However, overall, the relative performance of the three linking methods differed by the test type. For the test consisting of items of simple structure and items of complex structure, the IRF, LSQ, and TRF methods performed best, second best, and worst, respectively, in recovering the distribution and item parameters through scale linking. For the test consisting of items of complex structure only, the IRF method again performed best but the LSQ method performed worst.

      • KCI등재

        다차원 IRT 모형 적합 혼합형 검사를 위한 공통문항 척도 연계 방법

        김성훈(Seonghoon Kim) 한국교육평가학회 2024 교육평가연구 Vol.37 No.1

        공통문항 비동등집단 설계하에서, 다차원 3모수 로지스틱(M3PL) 모형, 다차원 등급반응 (MGR) 모형, 다차원 일반화부분점수(MGPC) 모형, 다차원 명명반응(MNR) 모형 각각을 위 해 사용할 수 있는 문항반응이론(IRT) 척도 연계 방법이 제시되어 왔다. 여러 방법 중 세 가지 방법, 즉 직접 최소제곱(direct least squares: DLS) 방법, 문항유목반응함수(item category response function: ICRF) 방법, 검사반응함수(test response function: TRF) 방법이 단일 문항유 형 검사에 잘 기능하는 것으로 알려져 왔다. 본 연구의 주목적은 이 세 가지 척도 연계 방법을 M3PL, MGR, MGPC, 혹은 MNR 모형의 어떤 조합을 사용하는 혼합형 검사에 사용 할 수 있도록 확장하는 데 있다. 각 척도 연계 방법은, 개별 추정(separate calibrations)으로 부터 산출된 공통 문항들에 대한 두 세트의 다차원 문항 모수 추정치가 주어졌을 때, 두 다차원 능력 척도 간 선형 변환 함수의 척도 연계 계수(즉, 회전 행렬과 이동 벡터)를 추 정한다. 확장된 세 가지 다차원 척도 연계 방법의 기능을 검토하기 위해 다양한 연계 조 건하에서 모의실험을 수행하였다. 전반적으로, ICRF 방법이 회전 행렬과 이동 벡터를 가 장 잘 추정하였다. 대부분의 조건에서 DLS 방법은 차선의 척도 연계 계수를 산출하였다. TRF 방법은 회전 행렬은 잘 추정하였으나 이동 벡터는 열등하게 추정하였다. 결과적으로, TRF 방법은 여러 조건에서 가장 저조한 수행을 보였다. Under the context of the common-item nonequivalent groups design, item response theory (IRT) scale linking methods have been presented for each of the multidimensional extensions of the three-parameter logistic (M3PL), graded response (MGR), generalized partial credit (MGPC), and nominal response (MNR) models. The common-item multidimensional IRT (MIRT) linking methods that have been proved effective for single-format tests include the direct least squares (DLS), item category response function (ICRF), and test response function (TRF) methods. This paper extends the three MIRT linking methods to any mixture of the exploratory M3PL, MGR, MGPC, and MNR models for mixed-format tests. Each linking method extended attempts to find the linking coefficients in the rotation matrix and translation vector that constitute a linear transformation between two multidimensional ability scales. Simulations are conducted to investigate the performance of the three linking methods under various linking conditions. The results indicated that overall, the ICRF method performed best in estimating the rotation matrix and translation vector of the linear transformation between the new and true simulation scales. In not a few conditions, the DLS method resulted in the second best linking solutions. The TRF method tended to estimate the rotation matrix well but the translation vector poorly and thus showed the worst performance among the linking methods in some conditions.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료
