RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재
      • KCI등재

        한국어 정보화의 현황과 과제

        소강춘 ( So Kang-chun ) 연세대학교 언어정보연구원(구 연세대학교 언어정보개발원) 2016 언어사실과 관점 Vol.39 No.-

        This thesis investigated the results that gained by the process of the mechanization of Hangeul and the computerization of korean. And this thesis searched on the tools for the computational processing that builded korean corpus and handled korean data. And I suggested the need to establish the institution for build a korean big corpus.

      • KCI우수등재

        4차 산업혁명 시대와 우리말 연구의 미래

        소강춘(So, Kang-chun) 국어국문학회 2019 국어국문학 Vol.0 No.189

        이 글은 4차 산업혁명 시대의 한국어 인공지능 능력 향상을 위해 국립국어원에서 추진하고 있는 한국어 빅 데이터 구축 사업을 소개하는 데 목적이 있다. 21세기 세종계획이 종료된 이후 10여 년간 중지되었던 한국어 정보화 사업의 재개라는 의미도 있지만, 그 동안 변화된 언어 정보화 환경에 맞는 대용량의 말뭉치를 개발하고, 체계적인 유통 과정을 통해 보급하려 한다. 그리고 지속적인 말뭉치 구축 사업을 통해서 말뭉치 연구의 활성화에 기여하려 한다. The purpose of this article is to introduce Korean big data construction project promoted by the National Institute of Korean Language in order to improve Korean AI in the fourth industrial revolution. Although it means the resumption of Korean informatization business, which has been suspended for 10 years since the end of the 21st century Sejong plan, it is intended to develop large-scale corpus for the changed language informatization environment and distribute it through systematic distribution process. In addition, we will contribute to the activation of corpus research through continuous corpus construction projects.

      • KCI등재

        남북한 말뭉치 통합 방안에 대한 연구

        소강춘(So Kang-chun) 국어문학회 2016 국어문학 Vol.63 No.-

        이 연구는 한국어 정보화의 초석이 되는 통합된 한국어 말뭉치 구축 방안을 모색하기 위한 것이다. 우리나라는 남북으로 분단되어 서로 다른 언어 규범을 사용하고 있을 뿐만 아니라, 중국의 조선족 동포들이 사용하고 있는 중국 조선어도 별도의 규범을 가지고 있다. 따라서 완전한 한국어 말뭉치를 구축하기 위해서는 이 세 지역의 언어규범을 포괄할 수 있는 방안이 마련되어야 한다. 그러나 이러한 외적 환경 조성은 용이한 일이 아니다. 그래서 이 연구에서는 그동안에 구축되었던 말뭉치 현황을 파악하고, 남북에서 구축된 말뭉치의 실례를 통해 문제점과 통합 가능성을 파악하여, 보다 효과적인 남북한 한국어 자료의 말뭉치 구축 방안을 제시하려 한다. In this study, I have a clear grasp of the present state of the electronic Korean corpus that was built by North and South Korea. Through that corpus, I am able to clarify the distinction between the North Korea corpus and its counterpart in the South. I am also able to find a way to close the gaps. Subsequently, I will search for a method to integrate corpus in North and South Korea.

      • KCI등재

        방언 음성 자료의 전산처리 방안에 대한 연구

        소강춘(So Kang-Chun) 국어국문학회 2006 국어국문학 Vol.- No.142

        The purpose of this study is to introduce the function of Meari ver. 1.0 which is a tool of phonetic transcription. We can transcribe the dialectal sound data with phonetic alphabet, can segment the sound data, and can manage the segmented sound files conveniently with Meari ver. 1.0. We can get sound files and text files by using Meari 1.0. The sound files can be segmented according to text files. So we can service sound files and text files simultaneously. In this method, we can extend the field of Korean dialectology to storytelling which is a new field of Korean literature. In this study, I suggest a method to build up multi-tiers database for storytelling.

      • KCI등재

        한국, 조선, 중국 국어 교과서에 나타난 어휘 특징에 대한 국어정보학적 연구 - 일반명사와 고유명사를 중심으로 -

        소강춘(So Kang-chun) 한국언어문학회 2004 한국언어문학 Vol.53 No.-

        The purpose of this paper si to study lexical characters of Korean textbook in south and north Korea and China focus on computational process. For the lexical items and the sentences of elementary school textbooks were selected according to development steps of ability of language using, the lexical items and the sentences re the fundamental language data of individual nation. So I picked up the subject of this study. I introduced various methods of computational data processing for the beginner of computational linguistics.

      • KCI등재

        훈민정음의 안정적 음소 분할 원리의 과학적 탐색

        소강춘(So, Kang-chun),박상업(S. U. Park) 한국언어문학회 2015 한국언어문학 Vol.94 No.-

        We will build series of papers the science of Hunminjeongeum on the physics. This first paper will focus on the science of using the prime number. We will start from modelling the mutual communication in a formal form and build the artificial language well known in the computer science. The artificial language permit the product operation on the space of the core concepts. The prime number of core concepts is undividable concepts under the product operation, so we can estimate separation into the prime number of sub-concepts of the core concept is unbreakable under the mutual communication. Also we can expect Since Hunminjeongeum to the toy example for analysing the natural language using the artificial language for future.

      • KCI등재
      • KCI등재

        『개방형 한국어 지식 대사전』 신어 분과의 표제어 선정과 그 실제

        소강춘(So, Kangchun),이래호(Lee, Raeho),주경미(Ju, Kyoungmi) 한국사전학회 2012 한국사전학 Vol.- No.20

        The aim of this thesis is to introduce the principles of the entries selection and its procedure of new word department into the Gaebanghyeong-Hangugeo-Jisik-Daesajeon and the problems that arise during their entry selection process. Up to the present, new words have been variously defined. But, in our department, to work correspondingly on the purpose of the Gaebanghyeong-Hangugeo-Jisik-Daesajeon wherein the lexicons which include practical life vocabularies are registered, the new words will soon be defined as unregistered words which are frequently used in daily but are not recorded in the Pyojun Korean Unabridged Dictionary. The new words department entry selection principles are based on the following five presentations: (1) Selection of actively used words in reality, (2) Selection of established words in the official language, (3) Selection of non-standard words that are frequently used in daily life can also be an entry, (4) Selection of purified words that are actively used, (5) Selection of vocabularies among entries that seem to lack lexical paradigm. The selection of new words were based on data from the year 1994 until 2010 Neologism Source Book, results from frequent present word research data, Naver open dictionary, candidates for new words from the year 2008 until 2010 and finally, the Naver news corpus. With this selection principle, the classifications of the selection of new word entries from the data are composed of neologism, everyday words, phrases, technical terms, loanwords, non-standard words, etc.

      • KCI등재

        북한 구어 말뭉치의 전사와 주석

        이진병 ( Jinbyeong Yi ),소강춘 ( Kangchun So ) 연세대학교 언어정보연구원(구 연세대학교 언어정보개발원) 2016 언어사실과 관점 Vol.38 No.-

        This thesis discusses present condition, direction, problems, and guidelines of establishment related to a corpus of spoken language in North Korea. Comparing with South Korean corpus, North Korean corpus of spoken language stays around 1 percent, so it should focus on quantitative securing for now. It is difficult to secure qualitative balance because of several practical challenges. It is necessary to design corpus guidance itself generally by differing with a corpus of written language. Guidelines should be designed by considering brevity, North Korean as a dialect, connectivity with successive work, ease of users, and excellence of established process. Especially, a double transcription should be considered in a transcription process of a raw corpus, and both unity and discrimination with the guidelines of written language should be considered in a process for morphological annotation.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼