http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
조우진,오정석,이재영,김유섭,Cho Woojin,Oh Jungseok,Lee Jaeyoung,Kim Yu-Seop 한국정보처리학회 2005 정보처리학회논문지 A Vol.12 No.6
Recently, as the number of Internet users are growing explosively, e-learning has been applied spread, as well as remote evaluation of intellectual capacity However, only the multiple choice and/or the objective tests have been applied to the e-learning, because of difficulty of natural language processing. For the intelligent marking of short-essay typed answer papers with rapidness and fairness, this work utilize heterogenous linguistic knowledges. Firstly, we construct the semantic kernel from un tagged corpus. Then the answer papers of students and instructors are transformed into the vector form. Finally, we evaluate the similarity between the papers by using the semantic kernel and decide whether the answer paper is correct or not, based on the similarity values. For the construction of the semantic kernel, we used latent semantic analysis based on the vector space model. Further we try to reduce the problem of information shortage, by integrating Korean Word Net. For the construction of the semantic kernel we collected 38,727 newspaper articles and extracted 75,175 indexed terms. In the experiment, about 0.894 correlation coefficient value, between the marking results from this system and the human instructors, was acquired. 최근 인터넷 사용자가 급증하면서 원격교육의 발전과 함께 평가에서도 원격을 이용한 방법이 많이 사용되고 있다. 하지만 현재까지는 자연언어처리의 어려움으로 객관식이나 단답식 평가가 주류를 이루고 있다. 본 논문에서는 서술형 주관식 문제의 빠르고 공정한 지능형 채점을 위하여, 다양한 언어 지식을 활용하였다. 이를 위하여, 가공되지 않은 말뭉치에서 의미커널을 구축하고, 수험자가 작성한 답안과 이미 구축된 정답을 벡터로 구성하여 이 답안간의 유사도를 의미커널을 통해 계산하여 정답여부를 자동으로 판단하도록 하였다. 의미커널을 구축하기 위하여 벡터 공간 모델에 기반한 은닉 의미 분석을 이용하였으며, 또한 한글 워드넷을 이용하여 답안의 정보부족 문제를 줄여보고자 하였다. 실험을 위하여 3000 문항의 주관식 문제를 구축하였으며, 의미커널의 구축을 위하여 38,727개의 신문기사를 모아 말뭉치로 구성하고 75,175개의 색인어를 추출하였다. 의미커널에 기반한 자동 채점 시스템으로 실제 수험자에 의하여 작성된 답안을 채점한 결과, 출제자가 실제로 채점한 결과를 기준으로 하여 최고 0.894의 상관관계를 얻을 수 있었다
조우진,Cho, Woojin 대한후두음성언어의학회 2018 대한후두음성언어의학회지 Vol.29 No.1
Ultrasonography has increasingly moved from being a modality confined to the radiology department to an active diagnostic and therapeutic aid available to the head and neck at the point of patient care. However, the application of ultrasonography to the laryngeal disorder is very rare due to progressive age-related ossification of laryngeal cartilage and the presence of air in the lumen, which contribute to difficult conditions for transmission of the ultrasonic waves. The observation about the movements of larynx or surrounding structures is important to understand the physiology of phonation or swallowing and to diagnose the disease. Ultrasonography is a noninvasive and safe imaging technique that can be used to investigate the anatomic structures of the head and neck. Recently, the development of high-frequency ultrasonography makes it possible to apply the ultrasound in the evaluation of larynx.
사전학습 언어모델 기반의 한국어 질문-답변 데이터 증강 방법
조우진(Woojin Cho),이혁준(Hyukjoon Lee) 한국정보과학회 2021 정보과학회 컴퓨팅의 실제 논문지 Vol.27 No.12
자연어처리는 최근 인공지능이 각광을 받으며 비약적인 발전을 이루고 있다. 자연어처리의 여러 문제 중 질문-답변은 인공지능이 문단 내에서 질문에 맞는 답을 찾아주는 문제다. 인공지능 문제에서 우수한 성능을 달성하기 위해서는 인공지능 모델과 학습 데이터셋의 확보가 매우 중요하다. 특히 질문-답변 데이터셋은 질문-답변의 문법, 관계 등 인간의 직접적 개입이 많이 요구되어 데이터 구축이 쉽지 않다. 이런 문제점을 해결하기 위해 본 논문에서는 답변 생성, 질문 생성, 필터링의 3 단계로 구성된 질문-답변 데이터 증강 방법을 제안한다. 증강된 데이터를 이용하여 학습시킨 모델의 질의응답 성능이 KorQuAD 데이터만으로 학습시킨 모델에 비해 F1-score 기준 최대 1.13 증가한 결과를 얻을 수 있음을 실험을 통해 보인다. Natural language processing (NLP) has recently made rapid progress with artificial intelligence (AI) in the spotlight. Among the many problems of NLP, question-answer (QA) is a problem in which an AI algorithm finds the right answer to the question within a paragraph. Securing artificial intelligence models and training data are utmost important to achieve good performance of AI. In particular, QA data requires a lot of direct human intervention due to grammars and relationships between questions and answers, making it difficult to obtain a data set. To solve this problem, this paper proposes a QA data augmentation method consisting of four steps: answer generation, question generation, round-trip filter technique, and verification. Experiment results shows that the QA performance of the model trained using the augmented data could achieve up to 1.13-fold increase in terms of F1-score compared to the model learned by using KorQuAD data only.
의미 커널과 워드넷을 이용한 주관식 문제 채점 시스템의 설계 및 구현
조우진 ( Woojin Cho ),추승우 ( Seungwoo Chu ),오정석 ( Hansaem Kim ),김한샘 ( Yuseop Kim ),김유섭 ( Jaeyoung Lee ),이재영 한국정보처리학회 2005 한국정보처리학회 학술대회논문집 Vol.12 No.1
기존 의미커널을 적용한 주관식 채점 시스템은 여러 답안과 말뭉치에서 추출한 색인어들과의 상관관계를 벡터방식으로 표현하여 자연어 처리에 대한 문제를 해결하려 하였다. 본 논문에서는 기존 시스템의 답안 및 색인어의 표현 한계로 인한 유사도 계산오차 가능성에 대한 문제를 해결하고자 시소러스를 이용한 임의 추출 방식의 답안 확장을 적용하였다. 서술형 주관식 평가에서는 문장의 문맥보다는 사용된 어휘에 채점가중치가 높다는 점을 착안, 출제자와 수험자 모두의 답안을 동의어, 유의어 그룹으로 확장하여 채점 성능을 향상시키려 하였다. 우선 두 답안을 형태소 분석기를 이용해 색인어를 추출한 후 워드넷을 이용하여 동의어, 유의어 그룹으로 확장한다. 이들을 말뭉치 색인을 이용하여 단어들 간 상관관계를 측정하기 위한 벡터로 구성하고 의미 커널을 적용하여 정답 유사도를 계산하였다. 출제자의 채점결과와 각 모델의 채점 점수의 상관계수 계산 결과 ELSA 모델이 가장 높은 유사도를 나타내었다..
공장 에너지 관리 시스템 운용을 위한 데이터 수집 시스템 백업 스토리지 엔진 평가
조우진(Woojin Cho),임채영(Chae-young Lim),김동주(Dongju Kim),여채은(Chae-eun Yeo),이형아(Hyungah Lee),구재희(Jae-hoi Gu) 한국환경에너지공학회 2023 한국열환경공학회 학술대회지 Vol.2023 No.1
지구 온난화와 지속적 난개발로 인한 이상 기후 현상은 심각한 미래 위기로 다가오고 있다. 또한 에너지 비용의 지속적 상승으로 인해 에너지 절감과 에너지 효율 향상에 대한 관심이 증대되고 있다. 이러한 추세에 의해 에너지 절감을 위한 에너지 관리 시스템의 관심 또한 증대되고 있다. 적용되는 곳에 따라 빌딩에너지 관리 시스템 (BEMS), 주택 에너지 관리 시스템 (HEMS), 공장 에너지 관리 시스템 (FEMS) 등으로 분류한다. 이 중, 가장 큰 비중을 차지하는 공장에너지 관리 시스템의 경우 제 3 차 에너지 기본 계획을 통해 2025 년부터 10 만 TOE 이상의 에너지 다소비 사업장을 대상으로 의무화가 된다. 에너지 관리 시스템의 경우 데이터 기반으로 동작하므로 에너지 효율 향상 및 절감을 위해서 데이터 수집이 무엇보다 중요하다. 에너지 관리 시스템의 데이터 수집 시스템에서 수집되는 데이터의 대부분인 시계열 데이터의 특성상 일정 기간 이전의 데이터의 접근 확률이 떨어진다. 따라서 이러한 데이터들을 주기적으로 백업하는 백업 스토리지가 존재하여 주 데이터베이스의 용량 및 성능, 사용성 등을 개선하여야 한다. 본 연구에서는 시계열 데이터를 저장하는 공장 에너지 관리 시스템의 데이터베이스를 이원화 하여 주 스토리지 엔진이 아닌 백업 스토리지 엔진을 사용할 때 보다 효율이 높은 스토리지 엔진에 대해 연구하여 공장 에너지 관리 시스템의 데이터 수집 시스템의 발전에 기여할 것으로 기대한다.