http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
A Comparative Study on Similarity Measure Techniques for Cross-Project Defect Prediction
류덕산,백종문,Ryu, Duksan,Baik, Jongmoon Korea Information Processing Society 2018 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.7 No.6
소프트웨어 결함 예측은 결함이 자주 발생하는 모듈에 집중함으로써 소프트웨어 품질 보증 활동에 귀중한 프로젝트 리소스를 효과적으로 할당하는 데 도움이 될 수 있다. 회사 내에서 수집 된 충분한 기록 데이터를 사용하여 정확한 결함 발생 가능성이 높은 모듈 예측에 대해 WPDP (프로젝트 내 결함 예측)를 사용할 수 있다. 회사가 과거 데이터를 유지하지 못한 경우 CPDP (Cross-Project Defect Prediction) 메커니즘을 기반으로 오류를 예측하는 분류기를 만드는 것이 도움이 될 수 있다. CPDP는 다른 조직에서 수집 한 다른 프로젝트 데이터를 사용하여 분류기를 작성하기 때문에 정확한 분류기를 만드는데 가장 큰 장애물은 소스와 대상 프로젝트 간의 서로 다른 분포이다. 이 문제의 해결을 위해 효과적인 유사도 측정 기술을 식별하는 것이 중요하므로, 본 논문에서는 다양한 유사도 측정 기술을 CPDP 모델에 적용하여 성능을 비교한다. 유사도 가중치의 유효성을 평가하고, 통계적 유의성 검정 및 효과 크기 검정을 통해 결과를 검증한다. 실험 결과, k-Nearest Neighbor (k-NN), LOcal Correlation Integral (LOCI) 및 Range 방법이 유사도 측정 기술 중 상위 3 개에 속했고, 이들을 사용하는 CPDP 예측 성능이 WPDP의 성능과 유사하였다. Software defect prediction is helpful for allocating valuable project resources effectively for software quality assurance activities thanks to focusing on the identified fault-prone modules. If historical data collected within a company is sufficient, a Within-Project Defect Prediction (WPDP) can be utilized for accurate fault-prone module prediction. In case a company does not maintain historical data, it may be helpful to build a classifier towards predicting comprehensible fault prediction based on Cross-Project Defect Prediction (CPDP). Since CPDP employs different project data collected from other organization to build a classifier, the main obstacle to build an accurate classifier is that distributions between source and target projects are not similar. To address the problem, because it is crucial to identify effective similarity measure techniques to obtain high performance for CPDP, In this paper, we aim to identify them. We compare various similarity measure techniques. The effectiveness of similarity weights calculated by those similarity measure techniques are evaluated. The results are verified using the statistical significance test and the effect size test. The results show k-Nearest Neighbor (k-NN), LOcal Correlation Integral (LOCI), and Range methods are the top three performers. The experimental results show that predictive performances using the three methods are comparable to those of WPDP.
식스 시그마 도구를 활용한 DMAIC 기반 소프트웨어 프로젝트 관리 및 프로세스 개선
김세준(Sejun Kim),백종문(Jongmoon Baik) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.2A
식스 시그마 방법론은 소프트웨어 제품 및 개발 프로세스 상의 문제점을 식별하고 개발 프로세스의 정량적 개선을 통해 조직의 비즈니스 목적을 달성하는 것을 목적으로 한다. 이러한 식스 시그마 프로젝트의 지원을 위한 많은 상용화 혹은 오픈소스 형태의 식스 시그마 프로젝트 지원 도구가 존재하기는 하지만 대부분 개발 시 다른 목적으로 활용되는 개발 및 프로세스 개선 관련 도구와의 맵핑이 어려우며 데이터 공유 및 컴포넌트간 상호작용이 힘들다는 단점을 가지고 있다. 따라서 본 연구에서는 기존 연구에서 제시하는 프로세스 개선을 위한 식스 시그마 프레임워크를 기반으로 개발 및 프로세스 개선 관련 도구와의 상호운영성을 가지고 컴포넌트 간 데이터 공유를 지원할 수 있는 웹 기반 식스 시그마 프로젝트 관리 지원 도구를 개발하였다. 이 도구를 통하여 현재 조직 내에서 활용하고 있는 개발 프로세스 및 프로세스 개선 도구와 병렬적으로 활용함으로써 조직의 프로세스 및 제품에 대한 문제점을 파악하고 이를 개선함으로써 조직의 비즈니스 목적 달성에 도움을 줄 수 있을 것으로 기대된다.
김국현 ( Gookhyun Kim ),백종문 ( Jongmoon Baik ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.2
소프트웨어가 점점 복잡해지면서 신뢰할 수 있는 소프트웨어의 개발에 대한 필요성이 제기되고 있다. 이에 따라 소프트웨어 개발 업체는 소프트웨어 신뢰성 보장을 위한 많은 활동들을 수행하고 있다. 이 과정에서 소프트웨어 신뢰성 평가는 핵심이 되는 작업 중 하나이며, 다양한 소프트웨어 신뢰성 평가 도구가 개발되어 정확하고 효율적인 신뢰성 평가를 돕고 있다. 소프트웨어 신뢰성 평가 도구는 적용할 수 있는 소프트웨어 개발 단계와 적용 방법에 차이가 있기 때문에 도구들은 적시적소에 적용되어야 한다. 본 논문에서는 CASRE, SMERFS, SREPT, GERT, SRTPRO 와 같은 소프트웨어 신뢰성 평가 도구의 분석을 통해 각 도구들의 특징, 목적, 적용단계 등을 고려하여 사용자가 다양한 도구 중 어떤 도구를 선택해야 하는지 판단하는데 도움을 주고자 한다.
Duksan Ryu(류덕산),Jongmoon Baik(백종문) Korean Institute of Information Scientists and Eng 2018 정보과학회논문지 Vol.45 No.7
Software defect prediction (SDP) can help optimally allocate software testing resources on fault-prone modules. Typically, local data within a company are used to build classifiers. Unlike such Within-Project Defect Prediction (WPDP), there may exist some cases, e.g., pilot projects, without any collected data from historical projects. Cross-project defect prediction (CPDP) using data from other projects can be employed in such cases. The defect prediction performance may be degraded in the presence of irrelevant or redundant information. To address this issue, various feature selection techniques have been suggested. Until now, there has been no research on identifying effective feature selection techniques for CPDP. We present a comparative framework using feature selection to produce a high performance for CPDP. We compare eight existing feature selection techniques, for three CPDP and one WPDP model, based on feature subset evaluators and feature ranking methods. After the features are chosen that perform the best, classifiers are built, tested, and evaluated using the statistical significance and effect size tests. Hybrid Instance Selection using Nearest-Neighbor (HISNN) is better than the other CPDP models and comparable to the WPDP model. Results from the comparison show that a different distribution, class imbalance and feature selection should be considered to obtain a high performance CPDP model.
하모니 탐색 알고리즘을 이용한 소프트웨어 신뢰성 성장 모델의 매개변수 추정 기법
김태현(Taehyoun Kim),백종문(Jongmoon Baik) 한국정보과학회 2014 정보과학회논문지 : 소프트웨어 및 응용 Vol.41 No.3
소프트웨어 신뢰성 성장 모델은 테스트 단계에서 발견되는 결함 현상을 기반으로 소프트웨어 신뢰성을 추정하는 대표적인 모델 중 하나이다. 소프트웨어 신뢰성 성장 모델은 각 모델의 특성을 나타내는 매개변수들을 포함하고 있으며 이에 대한 추정은 모델의 정확성을 결정짓는 중요한 요소이다. 일반적으로 최대 우도 추정 혹은 최소 제곱 추정과 같은 수치적 기법들이 소프트웨어 신뢰성 성장 모델의 매개변수를 추정하는 데 이용되고 있지만, 이러한 기법들은 소프트웨어 신뢰성 성장 곡선과 같은 비선형 함수의 매개변수 추정에는 적합하지 않다는 문제점이 존재한다. 따라서 본 논문에서는 기존의 수치적 기법들의 문제를 해결하기 위해 하모니 탐색 알고리즘을 이용한 소프트웨어 신뢰성 성장 모델의 매개변수 추정 기법을 제안하도록 한다. 또한, 해당 기법의 정확성과 안정성을 평가하기 위해 8개의 데이터에 대해 기존의 수치적 기법 및 유전자 알고리즘을 이용한 매개변수 추정 기법과의 비교를 수행하였다. Software Reliability Growth Model (SRGM) is one of the famous models to estimate software reliability based on a failure detection phenomenon during a testing phase. SRGM has some parameters which represent characteristics of each model and the estimation of these parameters is an important factor determining the accuracy of SRGM. In general, numerical methods, such as Maximum Likelihood Estimation (MLE) or Least Square Estimation (LSE), are used to estimate the parameters of SRGM. However, such methods are not suitable for SRGM of which the cumulative density function is a non-linear function. In this paper, we propose a parameter estimation method of SRGM using Harmony Search algorithm (HS). We conducted experiments on eight datasets to compare the accuracy and stability of the proposed method with the existing numerical method and Genetic Algorithm (GA).