RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      한국어 빈도 조사와 말뭉치의 주석

      한글로보기

      https://www.riss.kr/link?id=A103211740

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      이 연구에서는, 이제까지 말뭉치를 바탕으로 이루어져 온 한국어 빈도 조사의 성과를 분석함으로써, 언어 연구와 빈도 조사에 말뭉치를 효율적으로 활용하기 위해서 필요한 여러 요건과 문...

      이 연구에서는, 이제까지 말뭉치를 바탕으로 이루어져 온 한국어 빈도 조사의 성과를 분석함으로써, 언어 연구와 빈도 조사에 말뭉치를 효율적으로 활용하기 위해서 필요한 여러 요건과 문제점을 구체적으로 밝히고자 했다. 또한, 빈도 조사의 정밀성과 신뢰도를 좌우하는 큰 요인은 다름 아닌 말뭉치의 분석과 주석의 방법과 태도임을 밝히고, “정확하고 신뢰할 수 있는 언어 정보”를 얻기 위한 밑바탕으로서의 주석 말뭉치를 어떻게 가공해 나가야 할 것인가 하는 새로운 방향성을 모색하고자 하였다.
      한국어 빈도 조사의 역사는 1930년으로 거슬러 올라갈 수 있으며, 낱말 빈도 조사는 최현배, 이승화(1955, 1956)에서 처음 이루어졌다. 이후 1990년대 후반 컴퓨터와 대규모의 말뭉치를 활용한 빈도 조사가 여러 차례 이루어졌으나, 1950년대에 이루어진 성과를 넘어서지 못하고 있었다. 다행히 21세기에 들어서 그 규모와 방법론을 달리하면서 다양한 빈도 조사의 시도가 이루어지고 있으며 구어와 의미 빈도의 조사에까지 이르렀으나, 앞으로 해결해야 할 문제가 적지 않게 남아 있다.

      더보기

      다국어 초록 (Multilingual Abstract)

      This meta-study examines the historical development of Korean language word frequency research in linguistics, which has been based on text corpora. We aim to clarify the various requirements in and problems of effectively using corpora for language s...

      This meta-study examines the historical development of Korean language word frequency research in linguistics, which has been based on text corpora. We aim to clarify the various requirements in and problems of effectively using corpora for language studies and frequency research. We find that the methods and attitudes of scholars analyzing and annotating corpora create problems in terms of accuracy and reliability. Therefore, we try to find a new direction on how to process annotated corpora as “high quality linguistic information”, which obviously is essential to study in this field and future research.
      The history of frequency research in Korean can be traced back to the 1930s, with full-scale and detailed studies conducted for the first time two decades later by Choi Hyun-bae and Lee Seung-hwa (1955, 1956). Then, in the late 1990s, frequency studies using computers and large corpora became common, but failed to improve upon the achievements of the 1950s. Fortunately, in the 21st century, attempts have been made to innovate by varying the scale and methodology. Still, some important problems remain.
      First, when constructing a large and small balanced corpus to be investigated as one, there is no consensus on the scale of the balanced corpus, the size of the sample, or the method of constructing it. And it is also difficult to directly compare the results with each other. In order to understand the reality of the Korean language by comparing word frequency research results, it needs to be clear that each corpus represents a different, specific register.
      Second, since frequency research is based on a linguistic analysis of a corpus, a detailed annotation of the corpus is essential. As the size of the corpus grows, the accuracy of the annotation deteriorates, causing a problem in the reliability of the overall frequency result. In many cases, the unit setting and the linguistic interpretation for the frequency research are not sufficiently thorough in the corpus annotation stage. Particularly, there are problems such as the processing of morphemes and words, numbers and numerals, and compound words. Whether symbols or punctuations should be included in frequency also remains unclear. Researchers are also passive about making public their annotated corpora.
      Third, there are few attempts to normalize the presentation of frequency results. In many cases, only the absolute frequency is presented. Especially, when a comparison between the registers is required, it is necessary to present the normalized results side by side.
      Fourth, as shown newly in Seo Sangkyu (2015), the ideal presentation method must enable other researchers to see the variation forms of the particles and endings, the spoken form, the dialectal form, and the abbreviation form of all vocabulary in one place. It is desirable to further develop the system so that readers can understand the vocabulary at a glance.

      더보기

      목차 (Table of Contents)

      • 〈벼리〉
      • 1. 머리말
      • 2. 선행 연구와 문제점
      • 3. 한국어 빈도 조사의 흐름
      • 4. 낱말의 용법과 빈도 조사의 정밀도
      • 〈벼리〉
      • 1. 머리말
      • 2. 선행 연구와 문제점
      • 3. 한국어 빈도 조사의 흐름
      • 4. 낱말의 용법과 빈도 조사의 정밀도
      • 5. 맺음말
      • 〈참고 문헌〉
      • 〈abstract〉
      더보기

      참고문헌 (Reference)

      1 김한샘, "현대 국어 사용 빈도 조사 2" 국립국어원 2005

      2 조남호, "현대 국어 사용 빈도 조사" 국립국어연구원 2002

      3 서상규, "한글의 번수 조사와 외솔 최 현배" 한글학회 (281) : 35-72, 2008

      4 최현배, "한글의 낱낱의 글자의 쓰히는 번수로써의 차례잡기" 연희전문학교 출판부 1 : 100-109, 1930

      5 김흥규, "한글 사용빈도의 분석" 고려대 민족문화연구원 1997

      6 강범모, "한국어의 텍스트 장르, 문체, 유형―컴퓨터와 통계적 기법의 이용" 태학사 2000

      7 강범모, "한국어 형태소 및 어휘 사용 빈도의 분석(2)" 고려대 민족문화연구원 2004

      8 김흥규, "한국어 형태소 및 어휘 사용 빈도의 분석 (1)" 고려대 민족문화연구원 2000

      9 김한샘, "한국어 어휘 계량 연구의 성과" 한민족문화학회 (41) : 39-74, 2012

      10 강범모, "한국어 사용 빈도" 한국문화사 2009

      1 김한샘, "현대 국어 사용 빈도 조사 2" 국립국어원 2005

      2 조남호, "현대 국어 사용 빈도 조사" 국립국어연구원 2002

      3 서상규, "한글의 번수 조사와 외솔 최 현배" 한글학회 (281) : 35-72, 2008

      4 최현배, "한글의 낱낱의 글자의 쓰히는 번수로써의 차례잡기" 연희전문학교 출판부 1 : 100-109, 1930

      5 김흥규, "한글 사용빈도의 분석" 고려대 민족문화연구원 1997

      6 강범모, "한국어의 텍스트 장르, 문체, 유형―컴퓨터와 통계적 기법의 이용" 태학사 2000

      7 강범모, "한국어 형태소 및 어휘 사용 빈도의 분석(2)" 고려대 민족문화연구원 2004

      8 김흥규, "한국어 형태소 및 어휘 사용 빈도의 분석 (1)" 고려대 민족문화연구원 2000

      9 김한샘, "한국어 어휘 계량 연구의 성과" 한민족문화학회 (41) : 39-74, 2012

      10 강범모, "한국어 사용 빈도" 한국문화사 2009

      11 안의정, "한국어 빈도 사전 편찬을 위한 기초 연구" 한국사전학회 (20) : 235-259, 2012

      12 서상규, "한국어 기본어휘 의미 빈도 사전" 한국문화사 2014

      13 서상규, "한국어 구어 빈도 사전 2―가나다순" 한국문화사 2015

      14 서상규, "한국어 구어 빈도 사전 1―잦기순" 한국문화사 2015

      15 김한샘, "한국 현대 소설의 어휘 조사 연구" 국립국어연구원 2003

      16 서상규, "최현배의 『우리말 말수 사용의 잦기 조사』" 국립국어원 24 (24): 38-60, 2014

      17 장경희, "초·중·고등학생의 구어 어휘 조사" 지식과교양 2012

      18 문영호, "조선어 빈도수 사전" 과학백과사전종합출판사 1993

      19 최현배, "우리말에 쓰인 글자의 잦기 조사―문자 빈도 조사―" 문교부 1955

      20 최현배, "우리말 말수 사용의 잦기 조사―어휘 사용 빈도 조사―" 문교부 1956

      21 연세대학교 언어정보개발연구원, "연세 한국어 사전" 두산동아 1998

      22 이상섭, "뭉치 언어학적으로 본 사전 편찬의 실제 문제" 연세대 한국어사전편찬실 2 : 162-193, 1989

      23 이상섭, "뭉치 언어학의 기본 전제" 연세대 한국어사전편찬실 5 (5): 29-60, 1995

      24 서상규, "말뭉치 분석에 기반을 둔 낱말 빈도 조사와 그 응용" 한글학회 242 : 225-270, 1998

      25 김흥규, "고려대학교 한국어 말모둠 1(KOREA-1 CORPUS) 설계 및 구성" 한국어학회 3 : 233-258, 1996

      26 서상규, "『현대 한국어의 어휘 빈도』(상·하)" 연세대 언어정보개발연구원 1998

      27 Leech, G., "Word Frequencies in Written and Spoken English" Longman 2001

      28 Sun-Hee Lee, "A Frequency dictionary of Korean" Routledge 2016

      29 김흥규, "21세기 세종계획 국어 기초자료 구축" 문화관광부 1998

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2027 평가예정 재인증평가 신청대상 (재인증)
      2021-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2018-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2011-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2009-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2007-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2004-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2003-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2002-01-01 평가 등재후보 1차 FAIL (등재후보1차) KCI등재후보
      1998-07-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.84 0.84 0.77
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.87 0.83 1.332 0.3
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼