        초등영어 학습자 코퍼스 기반 어휘 사용 양상 분석

        주성재,홍선호 이화여자대학교 교과교육연구소 2018 교과교육학연구 Vol.22 No.5

        본 연구는 우리나라 초등영어 학습자들의 영어 글쓰기에 기반한 학습자 코퍼스를 구축하고 학습자들의 어휘 사용 양상을 분석함으로써 초등영어 어휘 교육에의 활용 방안에 대한 시사점을 제시하고자 하였다. 본 연구의 학습자 코퍼스는 전국 단위의 영어 글쓰기 대회에 참가한 271명의 초등 3, 4학년 학생들이 작성한 영어 글쓰기 답안을 기반으로 한국 초등영어 학 습자 코퍼스(SEEC(SNUE(Seoul National University of Education) English Essay Contest) Elementary English Learner Corpus, SEELC)를 구축하였으며, 코퍼스의 특성을 비교·분석하기 위하여 동일 문제에 대한 서울 지역 초등학교 4학년 학생들의 글쓰기 답안을 비교 대상 코퍼스로 구축하였다. 코퍼스 분석 도구를 활용하여 학습자 코퍼스의 통계적 분석 및 코퍼스 간 상호 비교·분석을 실시하였다. 본 연구의 결과는 다음과 같다. 첫째, 본 연구를 통해 구축한 학습자 코퍼스는 초등영어 학습자들의 영어 사용 양상 분석을 위한 기반 자료로서 가치를 지닌다. 둘째, 글쓰기 대회 참가 학생들은 공립 초등학교 4학년 학생들에 비하여 영어 글쓰기 능력이 우수하였으며, 4학년 학생들 또한 교육과정에서 요구하는 기준에 부합하는 영어 글쓰기 능력을 지니고 있었다. 셋째, 글쓰기 대회 참가 학생들은 영어 글쓰기에서 내용어보다 기능어의 사용 비율이 높은 것으로 나타났다. 넷째, 우리나라 초등 영어 학습자들은 영어 수업을 통해 학습한 어휘를 실제 글쓰기에 활용하고 있었으며, 상대적으로 낮은 수준의 영어 학습자일수록 사용 비율이 높았다. 본 연구를 통하여 학습자의 영어 글쓰기 능력과 어휘 사용의 양상에 상관관계가 있음을 확인할 수 있었으며, 높은 영어 글쓰기 수준을 가진 학습자들일수록 다양한 어휘를 사용하여 더 정확하고 자연스러운 글쓰기를 하는 것을 알 수 있었다. 학습자들의 수준 및 영어 사용 양상 파악을 통한 올바른 초등영어교육의 방향 설정 및 효과적인 초등영어 교수·학습방법 개발을 위하여 향후 초등영어 학습자 코퍼스의 지속적이고 광범위한 구축이 필요할 것이다. The present study aimed to suggest the implications for the elementary English vocabulary teaching by constructing and analyzing the SEELC (SEEC Elementary English Learner Corpus). The SEELC contained around 58,000 words of texts written by 271 elementary school English learners who participated in the nationwide English writing contest, SEEC (Seoul National University of Education English Essay Contest). The corpus was analyzed on its characteristics including scale, words variety, a number of words in a sentence, etc. In addition, it was compared to the Korean university students’ English learner corpus (YELC) and English writing corpus written by the grade 4 students of a Korean public elementary school. The statistical analysis of the learner corpus and comparison and analysis between the corpus were conducted using the corpus analysis tools. The results indicated that the SEELC contains a variety of level of words compared to the Korean university students’ English learner corpus. Furthermore, When compared with the corpus of grade 4 students, the SEELC had a higher proportion of using function words than content words. The English ability of SEEC participants were higher than those of grade 4 students who had the English writing ability required in the curriculum. Participants of SEEC also used vocabulary learned in class in their actual English writing, where lower level English learners showed higher utilization. Lastly, the SEELC consisted of higher level words of basic word list in 2009 revised national English curriculum than the writing of ordinary students. Based on the results of this study, it was observed that learner’s English writing ability correlated with the use of vocabulary, and that learners with higher level of English writing produced more accurate and natural writing with various vocabulary. The necessity for consistent construction of English learner corpus as a valuable source of elementary school English education was discussed for more effective and learner-customized English teaching method.

      • KCI등재

        코퍼스에 기반을 둔 일본어 언어행동 연구방법론 비교 고찰

        손영석(Son, Young-Suk) 대한일어일문학회 2018 일어일문학 Vol.79 No.-

        In situations that include face-to-face utterances, the overall action of delivering information through verbal and non-verbal language (i.e., gaze, gesture, facial expression, and tone) is called “expressive behavior.” I compared the characteristics of that are commonly employed in expressive behavior research. Both types of corpus allow an examination of the images and voices of an utterance and include non-verbal language that is obtained from them as well as verbal language. However, the comparison revealed the following results. From the non-verbal language perspective, research that adopts multimodal corpora focuses on proving that various modes, including verbal language, gesture, and gaze, function dynamically in interactions between the speaker and listener as, for example, with turn-taking. In comparison, from the verbal language perspective, research that adopts multimedia corpora focuses on extracting patterned inclinations regarding the influences caused by the speaker’s verbal language in reciprocity to various elements (e.g., non-verbal language, the speaker’s generic characteristics, and information delivered by the utterance) that are related to expressive behavior. The difference in the focuses of the two types of corpus is distinctly reflected in the methods employed to collect the corpus data, and construct and utilize the corpus.

      • KCI등재

        온라인 멀티미디어 코퍼스의 교육적 활용과 차세대 코퍼스 구축 방안

        손영석 명지대학교(서울캠퍼스) 인문과학연구소 2020 인문과학연구논총 Vol.41 No.4

        A class on Japanese modal adverbs was conducted using an online multimedia corpus which is designed to search for examination of the images and voices of an utterance. Based on the results of demand analysis of the feedback received from learners who participated in the class, improvement plans for the future corpus were thoroughly explored. On considering the results of four aspects such as the collection of corpus data, search and search results suggestions, language data records, and non-verbal data records, it was concluded that the introduction of various technologies including voice recognition and face recognition was inevitable for the comprehensive construction of the online multimedia corpus for the purpose of foreign language education. In addition, the direction for the overall corpus construction based on each technology was presented. 인터넷 상에서 단어 등을 검색하면 해당 단어 발화시의 영상·음성을 참조할수 있도록 설계된 온라인 멀티미디어 코퍼스를 활용하여 일본어 진술부사에 관한 수업을 진행하였다. 그리고 수업에 참여한 학습자들로부터 피드백 받은 요구분석 결과를 바탕으로 향후 코퍼스 개선방안에 대해 고찰하였다. 코퍼스 자료수집, 언어정보 기록, 비언어정보 기록, 검색 및 검색결과 제시의 4가지 측면에서 고찰한 결과, 외국어 교육을 목적으로 한 본격적인 온라인 멀티미디어 코퍼스 구축에는 음성인식 및 얼굴인식을 비롯하여 다방면의 기술 도입이 불가피하다는 결론을 도출하였으며, 각각의 기술들을 기반으로 차세대 코퍼스 구축 방향성에 대해서도 제시하였다.

      • KCI등재

        한국인 영어 학습자 구어 코퍼스: 설계와 구축

        정채관 ( Jung¸ Chae Kwan ) 한국외국어대학교 외국어교육연구소 2021 외국어교육연구 Vol.35 No.3

        본 연구는 한국인 영어 학습자의 영어 말하기 사용 양상을 이해하기 위해 국내 최초로 설계하고 구축한 대규모 공개형 영어 학습자 구어 코퍼스에 관한 소개이다. 본 연구에서는 국내 10개 대학의 대학생과 만 20세 이상 한국인 성인 영어 학습자 300명 이상을 대상으로 실시간 온라인 화상회의 시스템을 사용하여 듣고 요약하여 말하기와 읽고 요약하여 평가를 각각 실시한 후, 유럽 공통 언어 기준(Common European Framework of Reference for Languages, CEFR)을 바탕으로 연구 참여자의 영어 말하기 등급을 A1, A2, B1, B2, C1, C2 6등급으로 구분하였다. 평가는 교육경력 5년 이상의 영어 원어민 3인이 교차 검토를 통해 결과를 검증하였고, 이후 연구 참여자의 음성 파일을 전사하여 텍스트화 하였다. 이상과 같은 과정을 거쳐 참여 인원 237명, 총 474개의 텍스트, 36,588 토큰, 1,799개 타입을 포함하는 의 한국인 영어 학습자 구어 코퍼스(Korean English Learners’ Spoken Corpus, KELSC)가 완성되었다. KELSC에는 특정 대학이 아닌 국내 10개 대학의 재학생과 성인이 참여하였고, 시험 상황에서 인터넷이나 영어 사전 등 보조 수단이나 도구의 도움 없이 한국인 영어 학습자가 실시간으로 발화하는 것을 채집한 국내 최초의 공개형 한국인 영어 학습자 구어 코퍼스이다. KELSC가 우리나라 영어 학습자의 영어 말하기 상황을 이해하는 데 도움이 되길 희망하며, 이를 위해 KELSC를 국립인천대학교 코퍼스연구소 홈페이지를 통해 무료로 다운로드 받을 수 있게 할 예정이다. This study is an introduction to the first large-scale public English learners’ spoken corpus designed and built in Korea to understand aspects of Korean learners’ use of English-speaking patterns. Over 300 ordinary Korean adults and students from 10 universities participated in this study; their English-speaking performances were recorded using a real-time online video conferencing system. The results were evaluated based on the Common European Framework of Reference for Languages (CEFR) and their English-speaking was assessed on a scale with six grades: A1, A2, B1, B2, C1, and C2. For evaluation, the results were verified through cross-examination by three native English speakers with over five years teaching experience at university level. The participants’ voice files were transcribed using MS Word 2019 and converted into plain text using Notepad++ v8.1.1. Through this process, the Korean English Learners’ Spoken Corpus (KELSC, 켈스크), which involves 237 participants, 474 texts, 36,588 tokens, and 1,799 types, was completed. KELSC is the first Korean English learners’ spoken corpus in Korea to collect the real-time utterances of Korean English learners without the help of an English dictionary or the Internet, allowing it to be used in many ways for research purposes. KELSC will be available for free download if a user agrees to the terms of use through the website of the Institute for Corpus Research, Incheon National University.

      • KCI등재

        한국 예비 대학생의 영어 사용 특성 파악을 위한 구어 영어 학습자 코퍼스 구축에 관한 소고: 연구 방법을 중심으로

        정채관 한국외국어대학교 외국어교육연구소 2020 외국어교육연구 Vol.34 No.2

        There is a growing body of literature that recognizes the importance of spoken English learner corpus research, especially in terms of identifying the patterns of errors made by learners of English in different L1s. However, there has yet to be much discussion about errors made by Korean high school graduates of English while speaking. The two main reasons for this scarcity are that the job of compiling and transcribing a large scale of spoken corpus from audio files has proven to be time-consuming, labour intensive, and costly. Training error coders to code errors accurately as compared to a written corpus is also expensive. This study aims to discuss challenges and opportunities of compiling a large scale spoken English learners corpus and to identify and describe the errors of Korean high school graduates of English in their spoken English at different proficiency levels. This study used non-native speakers of English to transcribe 400 audio files and native speakers of English to error-tag the transcripts manually. The findings suggest that it is crucial to go through a series of workshops and a number of review processes in order to improve accuracy and consistency of transcripts and error coding for transcribers and error coders. Some errors can be used to distinguish the typical features of errors by the students and their proficiency levels. The findings also indicate that it will be useful to investigate the written productions from the same students who participated in this study in order to get a full picture of the error features of Korean high school students at different proficiency levels. 영어 말하기는 2015 개정 영어과 교육과정에서 글로벌 창의인재에게 필요한 핵심역량 중 하나이며, 초연결을 통해 전 세계가 실시간으로 연결되는 4차 산업혁명 시대에 중요한 능력이다. 한국인의 영어 말하기 상태의 현주소를 진단하는 데 필요한 한국인 구어 영어 학습자 코퍼스의 부재는 이러한 실증적이고 실제적인 연구의 어려움이 되고 있다. 특히 구어 영어 학습자 코퍼스는 상당한 비용과 시간, 전문성이 요구되며 문어 영어 학습자와 달리 전사하는 과정에서도 영어 학습자의 발음, 속도, 음량 등 고려해야 하는 부분이 많아 섣불리 시도하기 어려운 도전이다. 본 연구를 통해 우리나라 영어 학습자의 영어 말하기 실태를 파악하고, 이를 바탕으로 우리나라 영어 학습자에게 적합한 교육과정과 교재개발의 초석이 되는 한국인 구어 영어 학습자 코퍼스 구축 및 영어 사용 양태 분석 연구를 연구 방법 측면에서 최대한 상세히 기술하여 구어 영어 학습자 코퍼스 연구에 관심 있는 연구자를 돕고, 관련 연구의 활성화를 촉진하고자 한다.

      • 뉴스 사설에 대한 문장 단위의 다차원 신뢰도 주석을 통한 신뢰도 코퍼스 구축

        양원석(Wonsuk Yang),김정호(Jung-Ho Kim),정진우(Jin-Woo Chung),박종철(Jong C. Park) 한국HCI학회 2019 한국HCI학회 학술대회 Vol.2019 No.2

        문서의 신뢰도 및 설득력에 대한 언어학적 분석을 위한 다양한 종류의 코퍼스 구축이 있어왔지만, 아직 문서 형태의 텍스트에 대한 문장 단위의 신뢰도 주석이 진행된 적은 없다. 본 연구는 문장 단위의 신뢰도 주석을 위해 인지성(Awareness), 검증성(Verifiability), 논란성(Disputability), 수용성(Acceptance), 신뢰성(Credibility)에 해당하는 5 개의 신뢰도 관련 지표를 제안하였고, 이에 따라 3,431 개의 문장 단위 주석을 수행하였다. 본 연구를 통해 구축한 코퍼스는 인지성을 제외한 4 개의 지표간 상관관계가 언어학적 직관에 일치하는 특징을 보였으며 다차원적인 신뢰도 주석을 통해 독자의 신뢰라는 개념에 대하여 보다 심층적인 이해를 가져올 것으로 기대한다. 또한 상품 신뢰 가능성의 자동 판단, 소비 의사 확인 및 증진, 문서 신뢰도 증강을 위한 자동 첨삭 등을 목적으로 독해과정에서의 신뢰 양태 변화에 대한 예측 모델을 구축하는 과정에 높은 활용성을 보일 것으로 기대한다.

      • KCI등재

        북한 영어 교과서 특성 파악을 위한 코퍼스 구축

        김정렬(Kim, Jeong-ryeol),김지영(Kim, Jiyoung) 미래영어영문학회 2017 영어영문학 Vol.22 No.2

        Understanding the North Korean (NK) educational system can advance our efforts toward the reunification. This paper constructs a corpus digitizing obtainable English textbooks used in the NK for a further analysis. The corpus includes six English textbooks from the first grade to the sixth grade of middle school for a synchronic analysis which were published in 1995 and three more textbooks of 2008 for diachronic analysis. Construction of the corpus applied three principles: All English letters are digitized, different components of textbooks are digitized into different files to maintain the forms and contents, and finally consistent names and conventions are tagged to files. The corpus construction resulted in a tag set for the NK English textbooks, markup conventions, abbreviation conventions and dialogue interactive markups applied in the NK English textbook corpus. The paper discovered important differences of the NK English textbooks in its use of compound nouns and forms-focused as opposed to meaning-focused. The corpus will provide a basic data for further exploration of vocabulary, grammar and text.

      • KCI등재

        대조 언어행동연구를 위한 코퍼스 구축과 활용-「일인칭단수대명사(一人稱單數代名詞)+たち·ら」와 ‘우리’를 예로-

        손영석 한국일본어문학회 2015 日本語文學 Vol.65 No.-


      • KCI등재

        부산외국어대학교 학습자 구어 코퍼스(BUFS Learner Corpus of Spoken English) 구축 및 활용

        홍신철 한국언어과학회 2022 언어과학 Vol.29 No.4

        The purpose of the study is to introduce the compilation of the Korean learner corpus of spoken English, BUFS (Busan University of Foreign Studies) Spoken Learner Corpus of English (BUFS-LCSE) and its possible applications in the study of Korean learner’s use of spoken English. Since few spoken learner corpora of English have been compiled in Korea, there is a limit to describe actual language use of Korean EFL learners. For this, the BUFS-LCSE was constructed under the Language Pathfinder (LP) program supported by the project of the Korean University Innovation (2nd) in 2021. From the perspective of compilation, it focuses on the following three: 1) speaker-related characteristics, 2) corpus specification, 3) translation procedure. From the perspective of application, the corpus is able to provide patterns of Korean learner’s language use focusing on centrality and typicality. This study can contribute to providing a comprehensive description of Korean EFL learners’ interlanguage and offering insights into second language acquisition.

