http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
데이터셋 유형 분류를 통한 클래스 불균형 해소 방법 및 분류 알고리즘 추천
김정훈,곽기영,Kim, Jeonghun,Kwahk, Kee-Young 한국지능정보시스템학회 2022 지능정보연구 Vol.28 No.3
AI(Artificial Intelligence)를 다양한 산업에서 접목하기 위해 알고리즘 선택에 대한 관심이 증가하고 있다. 알고리즘 선택은 대부분 데이터 과학자의 경험에 의해 결정되는 경우가 많다. 하지만 경험이 부족한 데이터 과학자의 경우 데이터셋 특성 기반의 메타학습(meta learning) 을 통해 알고리즘을 선택한다. 기존의 알고리즘 추천은 선정 과정이 블랙박스이기 때문에 어떠한 근거에 의해 도출되는지 알 수 없었다. 이에 따라 본 연구에서는 k-평균 군집분석을 활용하여 데이터셋 특성에 따라 유형을 나누고 적합한 분류 알고리즘과 클래스 불균형 해소 방법을 탐색한다. 본 연구 결과 네 가지 유형을 도출하였으며 데이터셋 유형에 따라 적합한 클래스 불균형 해소 방법과 분류 알고리즘을 추천하였다.
일제강점기 재만 조선인 이주문학 연구 - 이주·정착과정의 시적 형상화를 중심으로 -
김정훈(Kim Jeonghun),정덕준(Chung Dukjoon) 한국언어문학회 2006 한국언어문학 Vol.56 No.-
Until now research mostly treated Chinese-Korean Literature on Manchuria as a literature in exile. This way don’t reflect actuality of Manchuria under the Japanese Colonial Period. Because, in this paper I divided the Chinese-Korean Poetry under the Japanese Colonial Period into several classes with the viewpoint which is a encapsulated the history of their emigration and domiciliation. First of all, it starts with a literature in exile before 1920s. The most works are foregrounding an anti-Japanese combative consciousness and the hope to a national right recovery. Kim Tack-young and Shin Jung and Shin Chae-ho are typical writer of this age. Even in after, literature that reject the foreign power like this placed a important quality of it. The Chinese-Korean poetry until 1920s is not an particular different point from with interior poems as such poets in charge or to selected form. Only, in contents, it frequently appears strongly foregrounds anti-Japanese combative consciousness of interior literature. The poems after 1930s is individually show racial consciousness of different kind from poems of KAPF or nationalism at home. This is natural that the Manchuria when is because is a base of anti-Japanese independence movement. It was started from 1930s that makes exile’s life as emigrant to Manchuria with subject matter of the Chinese-Korean Poetry. This time when that it is a widely and systematic range executed plan as emigration a national policy. It becomes literary encapsulated with the features which is various aspect with vague expectation and hope about Manchuria, homesick, maladjustment in alien and deploring actuality trouble. An aspect of emigrated Korean to endured any kind of trials appears in diverse works on Manchuria. The Chinese-Korean literature in domiciliate step on Manchuria described settlement' conflict with Chinese landowner and their poverty and suffering because of the Japanese colony rule in China likewise in their homeland. The representative writers are Kim Jo-kyu, Lee Uk, etc. The poems from 1930 to 1940’s described various lives of settlers : an anti-Japanese struggle, a will of settle, and escapism. The representative writers are Song Chul-ly, Chun Chun-song, Shim Yeon-su and so on. It grasps the Chinese-Korean poetry under the Japanese Colonial Period when point of view with not a literature in exile but literature of the emigration and domiciliation. Many poets who had various works in this time was not referred almost from the history of literature on and after the middle of 1930s. Reasonable research of its works is urgent for just corroboration of Korean Poetry. Their works are plentifully putting in the features of immigration and fixation. There is a necessity which will judge their poetry straightly. The poetry of the glorious restoration is most rapture of regain of country and ovation of land reform. This works becomes the strong and steady base of the Chinese-Korean Poetry.
VOC 데이터 내의 정형 속성과 텍스트마이닝으로 도출된 비정형 속성을 결합한 고객만족도 예측모형 개발
김정훈(Jeonghun Kim),권오병(Ohbyung Kwon) 한국경영학회 2015 한국경영학회 통합학술발표논문집 Vol.2015 No.08
VOC(Voice of Customer)는 특정 제품이나 서비스에 대한 조사가 아니라 고객의 의견 및 요구를 직접 알 수 있는 중요한 자원이다. 즉, VOC 정보를 활용하면 고객 대응 속도 향상 등 고객 만족도와 경영 성과를 제고할 수 있다. 하지만 VOC 내에 고객 불만 진술 등 다양한 비정형 데이터가 존재함에도 불구하고 분쟁 시 참고자료로만 활용하는 등 분석에 직접적으로 활용하지 않았다. 따라서 본 연구의 목적은 VOC 비정형 자료에 대한 텍스트마이닝을 통해서 획득되는 속성과 VOC 정형 자료를 결합하면 업무처리의 소요시간 등 고객 만족도를 예측하는 정확도가 개선되는지를 검증하는 것이다. 더 나아가 고객의 만족도를 예측하는 모형을 개발하고자 한다. 이를 위해 실제 기업 VOC 자료를 활용하고 C4.5 등 판별 알고리즘을 통해 그 성능을 실증 분석하였다. 또한 실제 VOC 자료의 활용에서 발생하는 공백 자료의 처리 등 분석 상의 이슈들을 제안하고자 한다. VOC(Voice of Custome r) is an important res ource in management that can directly know not only customer feedback but also specific product or service. In other words, if you use VOC information you can be improve customer responsiveness, customer satisfaction and business results. VOC has unstructured data such as customer complaints that is utilizing resources but it used when disputes. So purpose of this study is improve customer satisfaction by combined unstructured attribute from textmining with structure attribute in VOC. For this study, We use real data in company and C4.5 classification algorithm. Also suggest blank data preprocessing issue.