RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        개별 어휘의 관련어 목록 구축 방법 탐색

        길호현 한국작문학회 2020 작문연구 Vol.0 No.45

        The purpose of this study is to present how to utilize the correlation numbers between words to build a list of related words for individual vocabulary. In order to calculate the correlation number of related words, Pearson correlation number of words with 'school' was obtained from Sejong corpus, a large corpus, and based on this, sub-network of related words was formed. It has the advantage of quantifying the degree of relevance by using correlation numbers to produce a list of related words for a particular vocabulary. Sub-network information can also be used to distinguish the semantics of a particular vocabulary. 이 연구는 개별 어휘의 관련어 목록을 구축하기 위해 단어 사이의 상관계수를 활용하는 방법을 제시하는 것을 목적으로 한다. 관련어의 상관계수를 산출하기 위해 대규모 말뭉치인 세종 말뭉치에서 ‘학교’라는 단어와 동시출현확률이 높은 단어들의 피어슨 상관계수를 구하였으며, 이를 바탕으로 관련어들의 하위 네트워크를 구성하였다. 상관계수를 활용하여 특정 어휘의 관련어 목록을 산출하면 관련의 정도를 계량화할 수 있다는 장점이 있다. 또한 하위 네트워크 정보를 활용하면 특정 어휘의 의미역을 구분할 수 있다.

      • KCI등재

        상관계수를 활용한 텍스트 응집성 산출 방안 연구

        길호현 한국작문학회 2020 작문연구 Vol.0 No.46

        In this study, to quantify the coherence of text, the correlation between the nouns used in the text was obtained and utilized in large corpus. To this end, a large-scale noun DTM was established by conducting a morpheme analysis on the entire Sejong corpus and extracting nouns. These data were used as a database to calculate the number of correlations between each word. To indicate the coherence of a single text, the correlation coefficient between the individual nouns used in each text was obtained from the large noun DTM and the mean value was calculated. In order to determine whether the average correlation number obtained reveals the coherence of the text, the seven texts presented in the middle and high school textbooks were selected to measure the change in the correlation between nouns before and after the revision. The correlation mean values of the text which were modified to improve coherence were statistically significantly increased. Thus, it was possible to use the correlation between the words used in the text to identify the possibility of indicating the semantic coherence of the individual text. 이 연구에서는 텍스트의 응집성을 수량화하기 위해 텍스트에 사용된 명사들 사이의 상관관계를 대규모 말뭉치에서 구하여 활용하는 방안을 검토하였다. 이를 위해 세종 말뭉치 전체를 대상으로 형태소 분석을 실시하고 명사를 추출하여 대규모 명사 DTM을 구축하였다. 이렇게 구축된 자료는 각 단어 사이의 상관계수를 산출하는 데이터베이스로 활용되었다. 단일 텍스트의 응집성을 지표화하기 위해 각 텍스트에 사용된 개별 명사들 사이의 상관계수를 대규모 명사 DTM에서 구한 후 평균값을 산출하였다. 이렇게 구한 평균 상관계수가 텍스트의 응집성을 드러내는지 판단하기 위해 중‧고등학교 교과서에 응집성 관련 수정 사항이 제시된 텍스트 7개를 선정하여 수정 전과 수정 후의 명사 간 상관계수 변화를 측정하였다. 측정 결과 응집성을 개선하기 위해 수정을 한 텍스트의 상관관계 평균값이 통계적으로 유의하게 상승하였다. 따라서 텍스트에 사용된 단어들 사이의 상관계수를 활용하여 개별 텍스트의 의미적 응집성을 나타낼 가능성이 있음을 확인할 수 있었다.

      • KCI등재

        텍스트 마이닝을 활용한 단일 텍스트의 내용 구조분석 방안 탐색

        길호현 한국독서학회 2019 독서연구 Vol.0 No.52

        The study examined the possibility of using the keyword network method among text mining analysis techniques to visualize the content structure of a single text. The method of splitting a single text into paragraphs and sentences was checked. While the organic meaning of text is more evident in paragraph unit splitting, the more clearly the distinction of meaning in sentence unit splitting. The TF*IDF weights were useful in selecting the keywords in the splitting of paragraphs, but were not helpful in calculating the content network structure of text. 본 연구는 단일 텍스트의 내용 구조를 시각적으로 표시하기 위해 텍스트 마이닝의 네트워크 분석 방법을 사용할 수 있는 가능성을 점검하였다. 이를 위해 한 편의 텍스트를 문단 단위로 분할하는 방법과 문장 단위로 분할하는 방법을 각각 시도하여 그 결과를 비교하였다. 또한 TF*IDF 값을 가중치로 반영하는 경우와 그렇지 않은 경우도 비교하였다. 분석 결과 문단 단위로 분할할 때 의미의 연결성을 파악하기가 수월했고, 문장 단위로 분할할 때 의미의 구분을 파악하기가 수월했다. TF*IDF 값은 핵심어 선정에서는 유용했고 네트워크 관계도 생성에서는 유용하지 않았다.

      • KCI등재

        읽기 선다형 문항의 변별도 결정 요인에 관한 연구

        길호현(Kil, Ho-hyun) 국어교육학회 2015 국어교육연구 Vol.59 No.-

        This study aims to identify factors th at affect the discrimination of reading assessment questions. Item difficulty determinants were used an analytical framework to achieve this. The analysis resulted in the following: when a text was composed of two opposing concepts, a discrimination point between a normal academic achievement group and a basic academic achievement group was formed. Also, because it is difficult to understand a classic essay text, discrimination points were formed in the sections of outstanding-normal and normal-basic. On the contrary, when the content and construction of a text were very plain, the gap between basic-level students and below -basic level students widened. In the case of the questions, when the thinking required by them expanded outside of the text, the gap between outstanding students and normal students in creased. Also, when the thinking process of deciding on answers became complex, the gap between the students with different academic levels widened. In particular, when the students completed the answers, the statement themselves were not wrong, but when they did not coincide with text or data interpretation required by the questions, the gap in the outstanding-normal-basic level sections increased. This study is meaningful as it focused on the item discrimination and closely analyzed rates of correct answers, which differed by the students’ levels of academic achievement.

      • KCI등재

        텍스트마이닝을 위한 한국어 불용어 목록 연구

        길호현(Kil, Ho-hyun) 우리말글학회 2018 우리말 글 Vol.78 No.-

        본 연구의 목적은 텍스트마이닝 방법을 활용하여 한국어 텍스트를 분석할 때 필요한 불용어 목록을 제시하는 것이다. 텍스트마이닝의 전처리 과정에서 불용어를 제거하는 작업이 수행되는데 이를 위한 불용어 목록이 필요하기 때문이다. 이를 위해 국립국어원에서 제시하는 대규모 말뭉치에서 최다 빈도로 출현하는 형태소를 추출하였다. 그리고 이 중에서 중요한 의미를 가지는 형태소와 의미가 없는 형식 형태소를 제외하였다. 결과적으로 실질 형태소이자 자립 형태소이면서 의미적으로는 유용하지 않은 293개의 단어가 불용어 목록으로 선정되었다. 이와 같은 불용어 목록은 다양한 분야에서 한국어 텍스트를 분석할 때 유용하게 활용될 수 있을 것으로 예상된다. The purpose of this study is to present a Korean stopwords list needed to analyze Korean text using text mining method. In the preprocessing process of text mining, a task of eliminating stopwords is performed. For this purpose, we extract morphemes with the highest frequency in the large corpus suggested by the National Institute of Korean Language. The morphemes that have important meaning and the morphemes without meaning are excluded. As a result, 293 words, which are substantial morpheme, independent morpheme, and not semantically useful, were selected as an Korean stopwords list. This list is expected to be useful for analyzing Korean texts in various fields.

      • KCI등재

        빅데이터 기사문에 나타난 리터러시 개념 사용 양상

        길호현 ( Kil Hohyun ),이지선 ( Lee Jeesun ) 한국독서학회 2022 독서연구 Vol.- No.65

        이 연구는 일반인의 리터러시 개념 사용 양상을 분석하는 것을 목표로 한다. 이를 위해 1990년부터 2020년까지 리터러시와 관계된 키워드를 포함하는 기사 2,319편을 추출하여 분석 대상으로 선정하였다. 분석 방법으로 구조적 토픽 모델링을 사용하여 기사를 25개 토픽으로 분석하였다. 또한 기사에서 각 키워드가 포함된 네트워크 구조를 산출하였다. 또한 각 키워드에 대한 2,3,4-gram 어구를 추출하여 각 키워드의 사용 양상을 분석하였다. 분석 결과 ‘리터러시’는 다양한 대상에 대한 능력을 의미하는 개념으로 사용되었다. ‘literacy’는 특정 영역에 대한 소양의 의미로 사용되는 경우가 많았다. ‘문해’는 기초 문식성의 의미로 사용되었다. ‘문해력’은 능력을 중심으로 사용되었다. ‘문식’과 ‘문식성’은 기사문에서는 잘 사용되지 않았다. 이 연구는 리터러시를 나타내는 다양한 개념어가 사용되는 양상을 기사문의 빅데이터를 활용하여 실증적으로 분석했다는 점에서 의의가 있다. This study aimed to analyze the general public’s use of the literacy concept. To this end, 2,319 articles, including literacy-related keywords from 1990 to 2020, were extracted and selected as analysis targets. The articles were analyzed into 25 topics using STM topic modeling. In addition, the network structures containing each keyword in the article were created. Furthermore, 2-, 3-, and 4-gram phrases for each keyword were extracted to analyze their usage patterns. As a result of the analysis, “liteoreosi” was used centering of the ability to various objects. “Literacy” was often used as the knowledge of a specific area. “Munhae” was used in the sense of basic literacy. “Munhaeryeok” was used for ability. “Munsik” and “Munsikseong” were not used too well. This study is meaningful as it empirically analyzed the use of various conceptual words representing literacy using big data in the article.

      • KCI등재

        교육용 텍스트의 이독성 평가를 위한 양적 준거 연구 : 정보 텍스트를 중심으로

        길호현 ( Kil Hohyun ),류수경 ( Ryu Sukyeong ),박태준 ( Park Taejoon ),최소영 ( Choi Soyoung ) 한국독서학회 2022 독서연구 Vol.- No.63

        이 연구는 교육용 텍스트의 이독성을 판단하기 위한 양적인 준거를 검토하고 텍스트의 양적 정보를 실증적으로 제시하는 것을 목적으로 한다. 이를 위해 텍스트의 양적 평가를 위한 10개의 준거를 선정하였다. 또한 현직 교사의 평가를 바탕으로 준거가 될 수 있는 교육용 정보 텍스트를 선정하였다. 그리고 이렇게 선정된 준거 텍스트의 기술 통계량을 분석하였다. 분석 결과 분량 요인에 해당하는 글자 수, 문단 수, 문장 수는 학년이 높아짐에 따라 지속적으로 증가하였다. 또한 문장의 길이나 명사비, 어려운 단어에 해당하는 4등급 단어비 역시 학년과 비례하여 상승하였다. 이 연구는 텍스트의 이독성에 영향을 미치는 양적인 준거들을 추출하여 실증적으로 검토했다는 점에서 의의가 있다. 또한 신뢰할 수 있는 수준별 텍스트 목록을 제시했다는 점에서도 의의가 있다. 이 연구는 학년의 변화에 따른 텍스트 양적 준거값의 변화를 구체적으로 제시했다는 점에서도 의의가 크다고 할 수 있다. The purpose of this study is to review the quantitative criteria for judging the readability of educational texts and their empirically present quantitative information. To this end, 10 criteria for quantitative evaluation of text were selected. In addition, educational information texts that can be the basis were selected, based on the evaluation of teachers. As a result of the analysis, the number of characters, paragraphs, and sentences corresponding to the volume factor continued to increase as the grade increased. In addition, the length of the sentence, the noun ratio, and the fourth-grade word ratio corresponding to difficult words also increased in proportion to the grade. This study is significant because it extracted and empirically reviewed quantitative criteria that affect the heterogeneity of text, it also presents a reliable list of text by level. This study’s significance also lies in the fact that it specifically presented changes in text quantitative reference values according to changes in grade level.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼