http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
풍수해 대응을 위한 Bootstrap방법과 SIR알고리즘 빈도해석 적용
김연수,김태균,김형수,노희성,장대원 한국습지학회 2018 한국습지학회지 Vol.20 No.2
수문기상자료의 빈도해석은 풍수해에 따른 대응 및 시설물의 설계기준에 있어 중요한 요소 중 하나이다. 일반적으로 수문기상자료에 대한 빈도해석의 경우 관측자료는 통계적으로 정상성을 가진다고 가정하고, 확률분포의 매개변수를 고려하는 매개변수적방법을 적용하고 있다. 이러한, 매개변수적 빈도해석을 위해서는 신뢰성 있는 충분한 자료의 수집이 필요하지만, 강수량과다르게 적설량의 경우 계절적 특성과 함께 최근에는 기후변화로 인한 적설량 관측일수 및 평균 최심신적설량이 감소하기때문에 부족한 자료에 대한 문제점을 보완할 필요가 있다. 이에 본 연구에서는 매개변수 빈도해석 방법과 부족한 자료의문제점을 보완할 수 있는 표본 재추출 기법인 Bootstrap방법과 SIR(Sampling Importance Resampling)알고리즘을 적용하여적설량의 빈도해석을 실시하였다. 58개 기상관측소에 대해 재추출된 일 최대 최심신적설량 자료를 이용한 비매개변수적빈도해석을 통해 확률적설량을 산정하고 이를 비교 분석하였다. 빈도별 확률적설량의 증감률을 검토한 결과 매개변수적빈도해석과 비매개변수적 빈도해석에서 증감률을 나타내는 지점들이 대부분 일치하는 것으로 나타났다. 확률적설량은 관측자료와 Bootstrap방법에서 –19.2%∼3.9%, Bootstrap방법과 SIR알고리즘에서 –7.7%∼137.8% 정도의 차이를 보였다. 표본재추출 기법은 관측표본이 적은 적설량의 빈도해석 및 불확실성 범위의 제시가 가능함을 확인할 수 있었고, 이는 여름철태풍과 같이 계절적 특성을 지닌 다른 자연재난의 해석에도 적용될 수 있을 것으로 판단된다. The frequency analysis of hydrometeorological data is one of the most important factors in response to natural disaster damage, and design standards for a disaster prevention facilities. In case of frequency analysis of hydrometeorological data, it assumes that observation data have statistical stationarity, and a parametric method considering the parameter of probability distribution is applied. For a parametric method, it is necessary to sufficiently collect reliable data; however, snowfall observations are needed to compensate for insufficient data in Korea, because of reducing the number of days for snowfall observations and mean maximum daily snowfall depth due to climate change. In this study, we conducted the frequency analysis for snowfall using the Bootstrap method and SIR algorithm which are the resampling methods that can overcome the problems of insufficient data. For the 58 meteorological stations distributed evenly in Korea, the probability of snowfall depth was estimated by non-parametric frequency analysis using the maximum daily snowfall depth data. The results of frequency based snowfall depth show that most stations representing the rate of change were found to be consistent in both parametric and non-parametric frequency analysis. According to the results, observed data and Bootstrap method showed a difference of –19.2% to 3.9%, and the Bootstrap method and SIR(Sampling Importance Resampling) algorithm showed a difference of –7.7 to 137.8%. This study shows that the resampling methods can do the frequency analysis of the snowfall depth that has insufficient observed samples, which can be applied to interpretation of other natural disasters such as summer typhoons with seasonal characteristics.
한국어 학습자의 빈도부사 사용양상 연구 -한국어 학습자 말뭉치를 중심으로-
장서월 ( Zhang Shu Yue ) 숙명여자대학교 한국어문화연구소 2023 한국어와 문화 Vol.33 No.-
본 연구는 한국어 학습자의 빈도부사의 사용양상을 파악하고자 하는 데에 목적이 있다. 빈도부사란 행동을 어느 정도 자주 하였는지 나타내기 위해 사용하는 부사이다. 현재 사용되는 많은 한국어 교재에서는 빈도부사에 관한 내용이 부족하다. 이 때문에 많은 한국어 학습자들은 빈도부사를 사용하는데 있어 어려움을 느끼고 있으며, 쉽게 오류를 범하는 경우가 많다. 본 연구는 한국어 학습자들이 빈도부사를 사용하는 양상을 분석해 볼 필요가 있다고 판단하여 한국어 학습자 말뭉치를 한국어 학습자의 빈도부사 사용양상을 분석하였다. 또한, 한국어 모어 화자가 사용하는 빈도부사와 ‘2017 국제 통용 한국어 표준 교육과정 적용 연구’에서 제시된 빈도부사 리스트와 비교 분석하였다. 이를 통해 한국어 학습자가 사용하는 빈도부사가 무엇인지 초, 중, 고 등급별 한국어 학습자가 사용하는 빈도부사가 어떠한 특성이 있는지, 그리고 한국어 학습자가 사용하는 빈도부사가 ‘2017 국제 통용 한국어 표준 교육과정 적용 연구’에서 제시된 빈도부사 리스트와 비교했을 때 어떤 차이점이 있는지, 한국어 모어 화자가 사용하는 빈도부사와 비교했을 때 어떤 차이점이 있는지를 살펴보았다. 마지막으로 한국어 학습자가 사용하는 빈도부사의 사용양상을 기반으로 한국어 교육에 있어 세 가지의 제안점을 제시하였다. The purpose of this study is to understand the use of frequency adverbs of Korean language learners. Frequency adverbs are adverbs used to indicate how often an action has been performed. In Korean textbooks, there is a lack of content on frequency adverbs, and Korean learners have difficulty choosing and writing frequency adverbs, and errors often appear. In this study, it was judged that it was necessary to analyze the pattern of Korean learners using frequency adverbs, and the pattern of Korean learners' use of frequency adverbs was analyzed.In addition, it was compared and analyzed with the frequency adverbs used by native Korean speakers and the frequency adverbs list presented in the 2017 Study on the Application of the Korean Standard Curriculum for International Use. Through this, we looked at the frequency adverbs used by Korean learners, the characteristics of frequency adverbs used by elementary, middle, and high grades, the differences between frequency adverbs used by Korean learners compared to the frequency adverbs presented in the 2017 International Standard Korean Curriculum Application Study. Finally, three suggestions were presented when teaching Korean based on the usage pattern of frequency adverbs used by Korean language learners.
비현실적 낙관주의에서 지각된 통제성과 사건 빈도의 상호작용효과: 직접 대 간접 측정방법
이나경 한국심리학회 2012 한국심리학회지 일반 Vol.31 No.3
Unrealistic optimism refers to people's tendency to consistently believe that risky events are less likely to happen to themselves than to others. Two experimental studies investigated the interaction between perceived controllability and event frequency of this unrealistic optimism by measuring it directly and indirectly using questionnaires. When using the direct method, unrealistic optimism was greater when an event frequency was low rather than high, and the interaction between perceived controllability and event frequency was not significant, which is consistent with the egocentrism account. On the other hand, when using the indirect method, the event frequency interacted with the perceived controllability. For uncontrollable events, the event frequency effect disappeared as the egocentrism account predicted, but for controllable events an opposite event frequency effect was found, which was that a greater rate of unrealistic optimism occurred when an event absolute frequency was high rather than low. This opposite event frequency effect occurred because the event frequency was considered lower for the subjects’ own likelihood estimates than others. Therefore, a kind of overconfidence of the subjects’ own control over risky events seems to produce the opposite event frequency effect on the unrealistic optimism when measuring with the indirect method. The importance of the opposite event frequency effect in risk perception and research of unrealistic optimism was discussed. 위험에 대하여 다른 사람들에 비해 자신의 발생가능성을 낮게 지각하는 현상이 비현실적 낙관주의이다. 본 연구는 설문지를 사용하여 직접과 간접방법으로 측정한 비현실적 낙관주의에서 지각된 통제성과 사건 빈도 간의 상호작용효과를 검증하는 두 개의 실험을 수행하였다. 직접방법에서는 빈도가 높은 사건보다 낮은 사건에서 비현실적 낙관주의가 증가하는 빈도 효과가 발생하고, 지각된 통제성과 사건 빈도 간의 상호작용효과는 유의미하지 않아서 자기중심성 가설이 지지되었다. 간접방법의 경우, 낮은 통제성 사건에서는 자기중심성 가설의 예측대로 빈도 효과가 사라졌지만, 높은 통제성 사건에서는 낮은 빈도 사건보다 높은 빈도 사건에서 비현실적 낙관주의가 증가하는 역빈도 효과가 발견되었다. 이 역빈도 효과는 자신의 발생가능성은 사건 빈도에 상관없이 일정하게 낮게 평가하면서, 다른 사람의 발생가능성은 낮은 빈도에서는 낮게, 높은 빈도에서는 높게 평가하는 것 때문에 발생하고 있었다. 따라서 통제할 수 있다고 지각되는 사건에서 자신의 통제능력에 대한 과확신이 간접방법의 비현실적 낙관주의에서 역빈도 효과를 일으킨다고 할 수 있다. 위험 지각과 비현실적 낙관주의 연구에서 역빈도 효과의 의미에 대해 논의하였다.
성인 자유 발화 자료 분석을 바탕으로 한 한국어의 음소 전이 빈도
신지영(Jiyoung Shin) 한국언어청각임상학회 2008 Communication Sciences and Disorders Vol.13 No.3
배경 및 목적: 이 연구의 목적은 한국어를 정상적으로 구사하 는 성인 화자들의 자유 발화를 수집․전사하여 한국어의 자유 발화에서 관찰되는 음소 전이 빈도 (두음소 빈도) 정보를 살펴보고, 체계적으로 기술하여 한국어의 말소리 관련 기초 자료를 제공하려 는 것이다. 음소 전이 빈도에 대한 이러한 지식은 한국어 화자들이 가지고 있는 한국어의 기본적인 지식이기 때문에 이러한 지식을 체계화시키는 작업은 기초 연구로서 반드시 필요하다. 방법: 서울 방언을 구사하는 성인 57(남 28, 여 29)명의 자유 발화를 수집하고 이를 음성 전사한 후에 운율 단 위를 고려하여 음소 전이 빈도(두음소 빈도)를 추출하였다. 본 연구의 분석 대상 자료는 총 35,439 발화, 403,572음절, 858,479음소였다. 결과: 발화 자료를 분석한 결과, 모두 980,639개의 두음소가 관찰되었다. 논리적으로 연결 가능한 두음소 1,225종 중에서 1,009종의 두음소가 관찰되었고, 이중 5.5%에 해당하는 고빈도 두음소 55종의 출현 빈도 합이 50%를 넘는 것으로 나타났다. 가장 높은 출현 빈도를 보인 두음소는 #+ㄱ > ㅐ+# > ㅏ+# > ㄱ+ㅡ > ㄴ+# > ㅡ+ㄴ > ㄱ+ㅏ 등이었다. 고빈도 두음소들은 대체로 고빈도 문법 형태소의 음절형과 유관한 것으로 보였다. 논의 및 결론: 음소 전 이 빈도를 면밀히 살펴본 결과, 한 음소와 다음 음소의 전이 역시 고빈도 유형이 발화에서 반복적 으로 사용됨을 알 수 있다. 음소 전이 빈도에 대한 이러한 연구 결과는 국어학은 물론, 언어병리학, 한국어 교육, 음성 공학 분야에서도 요긴하게 활용될 수 있을 것으로 기대한다. Background & Objectives: The aim of the present study was to provide some information on frequencies of occurrence for units of Korean bi-phoneme based on the careful analysis of spontaneous speech spoken by adult speakers of Korean. Information on bi-phoneme frequency as well as phoneme and syllable frequencies is one of the most fundamental and basic knowledges on Korean language and is used in the segmentation of speech signal into meaningful utterance units. Methods: 57 adult (28 male and 29 female) speakers of standard Korean were employed as subjects for the present study. Spontaneous speech spoken by the subjects were recorded and phonemically transcribed. Bi-phoneme frequency was calculated from the database. The data size of the present study was as follows: 35,439 utterances, 403,572 syllables, and 858,479 phonemes. Results: 980,668 classified into 8 types (C+V, V+C, C$C, C$V, V$C, V$V, #+P, P+#) according to prosodic boundaries between phonemes, were examined. Logically possible numbers of bi-phoneme types were 1,225 types and 1,009 types of bi-phonemes were found in the data. However, only 5.5% (55 types) of bi-phoneme types covered over 50% of the speech data. Discussion & Conclusion: Information on bi-phoneme frequency of Korean is one of the most fundamental and basic data for speech pathology, Korean language teaching, and speech engineering as well as Korean linguistics.
한국인의 외식 빈도별 소비자 범주화: 고빈도 이용자부터 저빈도 이용자까지
한경수,민지은 한국관광학회 2020 관광학연구 Vol.44 No.4
This study aimed to understand the consumption behavior and demographic differences between Heavy users(HU) and Light users(LU) of eating-out by using the "2016 Consumer Behavior Survey for Food" collected by the Korea Rural Economic Institute(KREI). The results show that the average age of high-frequency users was low. The monthly-average expenditure for eating-out among HU was about two times higher than the LU’(HU=₩175,329, LU=₩81,743). Regarding the average expenditure for one time eating-out, the low-frequency users were approximately two times higher than the HU(HU=₩11,147, LU=₩19,635). For the purpose of eating-out, the HU reported ‘difficult to eat meals at home’ while the LU stated ‘eating delicious food’ and ‘celebrating special days’. To segment participants based on food-related lifestyle, we employed cluster analytic procedures. This analysis resulted in eight clusters(HU: Convenient, Proactive, Reactive, Healthy & Safe, LU: Tasty & Healthy, Proactive, Reactive, Safe). It would be necessary to perform the intensive marketing for the group that could afford to eat out(LU_Reactive) and the group with lots of interest in new food(LU-Proactive). This study suggests that implementing marketing strategy targeting both HU and LU in the saturated eating-out market. 본 연구는 한국농촌경제연구원(KREI)의 2016 식품소비행태 조사 자료를 이용하여 외식 고빈도이용자와 저빈도 이용자의 소비행태와 인구통계학적 차이를 알아보고자 평균비교분석, 카이제곱분석, 분산분석, 군집분석을 실시하였다. 분석 결과 고빈도 이용자는 평균연령이 낮으며 월평균 외식지출비용이 175,329원으로 저빈도 이용자의 81,743원 보다 약 2배 많은 것으로 나타났으며 1회 평균 외식지출 비용은 저빈도 이용자 19,635원, 고빈도 이용자 11,147원으로 2배 높게 나타났다. 고빈도 이용자의 외식의 목적은 ‘가정내 식사가 어려워서’로 나타났으며 저빈도 이용자는 ‘맛있는 음식을 먹기 위해’, ‘특별한 날을 기념하기 위해’ 라고 응답한 비율이 높게 나타났다. 고빈도 이용자는 외식이 보편화 되어있으나 저빈도 이용자에게 외식은 목적이 있어야만 방문하는 특별한 경험임을 나타냈다. 고빈도 이용자와 저빈도 이용자를 식생활 라이프스타일에 따라 군집분석 한 결과 총 8개의 군집(고빈도: 간편, 능동, 수동, 건강 & 안전, 저빈도: 맛& 건강, 능동, 수동, 안전)으로 나누어졌다. 이 중 파인다이닝레스토랑이나 전문 고깃집과 같이 객단가가 높은 레스토랑의 경우 외식을 할 수 있는 경제적 여건이 되는 집단(저빈도 수동)과 새로운 음식에 관심이 많은 집단(저빈도 능동)의 방문빈도를 높이기 위한 집중적인 마케팅전략이 필요한 것으로 나타났다. 본 연구를 통해 포화된 외식시장에서 외식을 자주하는 고빈도 이용자 뿐 아니라 저빈도 이용자를 대상으로 한 마케팅 전략을 제시할 수 있다.
첫 음절 토큰 빈도와 타입 빈도가 단어 및 유사 단어 어휘 판단 시간에 미치는 영향
권유안 한국인지및생물심리학회 2012 한국심리학회지 인지 및 생물 Vol.24 No.4
Syllable frequency effect plays an important role in finding evidence supporting the hypothesis, incorporating syllable unit between letter and whole word level. The syllable frequency effect is defined as the inhibitory effect of words starting with high syllable frequency in lexical desition tasks. According to some studies, syllable frequency can be divided into two values. First is the type frequency which indicates the number of syllabic neighbors sharing the first syllable of a target word. Second is the token frequency which means the accumulated word frequency of the syllabic neighbors. Although type and token syllable frequency can make different effect, there is no evidence in Korean. This study conducted the meta-analyses to access whether the inhibitory syllable frequency effect could be expected by syllabic type or token frequency. The results showed that the syllabic token frequency played a critical role in the inhibitory effect in Korean syllable frequency effect and we explained the role of token and type frequency in visual word recognition model. 고빈도 음절로 시작되는 단어가 저빈도 음절로 시작되는 단어에 비해 어휘판단 시간이 느려지는 효과를 음절 빈도 효과라 하고, 이 효과는 시각 단어 재인에서 음절 처리를 포함한 네 수준 모형을 지지해 주는 중요한 효과로 알려져 있다. 그러나 음절 빈도는 계산 방식에 따라 타입 빈도(동일한 첫 음절을 포함한 음절 이웃 단어의 개수)와 토큰 빈도(음절 이웃 단어들의 누적 빈도)로 다르게 구분되고 각각이 단어 재인에서 다른 효과를 보일 수 있다는 주장에도 불구하고 한국어 음절 빈도 효과에서는 그 효과를 구분하지 않았다. 본 연구는 억제적 어휘판단 시간으로 대표되는 음절 빈도 효과가 음절 타입 빈도로 설명되는지 아니면 음절 토큰 빈도로 더 잘 설명되는 지를 기존 연구의 재분석을 통해 검증하였다. 분석 결과 어휘판단 시간의 증가는 음절 토큰 빈도의 증가에 의해 설명되었고, 반대로 유사 단어 자극의 어휘판단 시간의 증가는 음절 타입 빈도 및 표기 이웃 크기의 증가에 의해 설명되는 것으로 검증되었다. 이에 본 연구 결과를 바탕으로 음절 토큰 및 타입 빈도가 시각 단어 재인에서 이론적으로 어떤 의의를 갖는지를 설명하였다.
『生生字譜』에 反映된 18世紀 後半 朝鮮時代 文獻用 漢字頻度
河永三 대한중국학회 2008 중국학 Vol.31 No.-
본 논문은 朝鮮 正祖 16年(1792)에 刊行된 『生生字譜』를 對象으로 삼아 이에 反映된 當時의 漢字 빈도 狀況과 그것이 漢字 頻度 硏究史에서 가지는 의의에 대해 논의하고자 기획되었다. 形·音·義 외에 漢字의 第4要素라 불리는 “글자의 빈도(字頻)”는 해당 글자의 실제 사용 능력을 나타내 준다는 의미에서 漢字의 字頻硏究는 漢字 그 자체는 물론 漢字의 應用硏究에도 중요한 의의를 가진다. 이를 위해 본 논문에서는 『生生字譜』에 수록된 1만4천9백82개의 字種을 대상으로 하여 (1) 한자빈도 연구사에서 가지는 『生生字譜』의 가치, (2) 『生生字譜』에 대한 간단한 소개, (3) 『生生字譜』와 18세기 후반 朝鮮時代의 文獻用 漢字頻度, (4) 고빈도 상위 50한자의 속성 분석과 빈도 비교 등에 논의했다. 특히 (3)에서는 『生生字譜』에 수록된 부수별 자종과 주조 수량, 빈도별 글자례, 收錄字의 累積 計頻度, 收錄字의 頻度 等級 分類 등에 대해 논의했고, (4)에서는 고빈도 상위 50한자를 추출하여 이들의 품사, 선진시대 각종 역대 문헌 자료, 동한시대 실물 자료, 위진남북조 석각문자 등과의 빈도 비교를 통해 『生生字譜』가 가지는 빈도의 의의에 대해 논의했다. 다만, 『生生字譜』에 기록된 주조량이 어떤 방식에 의해 조사되고 63등급에 의해 분류되었는지, 당시의 다른 “字譜”들과의 차별성은 무엇인지에 대해서는 지속적인 연구가 필요하다. 本文從朝鮮正祖十六年(1792)出版的 『生生字譜』分析入手, 考察其所反映的當時漢字頻率狀況和其在字頻硏究史上的意義. 除了漢字的形音義三個要素之外, 被稱爲漢字第四要素的“字頻”實在代表着該字的使用能力. 在這個意義上, 漢字的字頻硏究對漢字本身和漢字應用硏究都具有重要意義. 本文以『生生字譜』所錄14982個字種作分析對象, 先介紹『生生字譜』, 而後考察了(1) 其在漢字字頻硏究史上的意義, (2)『生生字譜』所反映的18世紀後半朝鮮時代的文獻用漢字頻率, (3) 高頻50漢字的屬性和頻率比較. 尤其在第3節, 提示了『生生字譜』所錄的部首別字種和鑄造量, 頻率別字例, 收錄字的累積計頻率, 收錄字的頻率等級等; 在第4節, 對於高頻50字, 分析了其詞類分布, 和先秦時代各種文獻資料, 東漢時代實物資料, 魏晉南北朝石刻文字所反映的字頻, 以作比較.
임우생(Lim Woo Saeng),이건행(Lee Keon Haeng),경민수(Kyung Min Soo),김형수(Kim Hung Soo) 대한토목학회 2007 대한토목학회논문집 B Vol.27 No.6B
기존에는 잠재위험도와 기왕최대강우량을 이용하여 계획빈도를 결정하였다. 그러나, 기왕최대강우량은 이미 발생한 최대강우량이기 때문에 안전치를 고려해 산정한 계획빈도를 따라가지 못하였고, 잠재위험도에 따른 계획빈도의 범위가 매우 작은 문제점이 있었다. 따라서, 본 연구에서는 안양천 유역의 기왕최대강우량과 잠재위험도를 이용하여 계획빈도를 산정하는데 있어 계획빈도의 가중치를 결정하였다. 그 가중치는 공시지가와 홍수량이며, 기왕최대강우량으로 계획빈도를 산정하는데 수도권지역의 기상청 강우관측소 6곳에 대하여 크리깅(kriging)기법을 이용하여 기존 산정법보다 좀 더 간편하고 필요한 유역에 대해서 언제든지 간단히 산정하게 하고자 하였다. 그 결과, 안양천 유역의 기왕최대강우량에 해당하는 빈도는 112년으로 결정되었으며, 공시지가와 홍수량의 가중치로 산정한 안양천 유역의 소유역별 계획빈도는 약 45년부터 200년까지 분포하였다. 200년의 계획빈도를 갖는 지역은 안양천 유역의 하구지점이며, 행정구역상 서울시 영등포구이다. 이 지역은 공시지가가 높고 단위면적당 홍수량이 많아 가장 높게 산정되었다. 본 연구의 결과를 이용하여 앞으로는 수도권지역의 필요한 유역에 해당하는 .shp 파일만 있으면 기왕최대강우량에 해당하는 빈도, 즉 잠재위험도 100일때의 빈도를 결정할 수 있을 것이다. 현재 국가하천, 지방1ㆍ2급 하천 등의 분류에 의해 계획빈도를 결정하는 것을 유역의 조건에 따라 보다 더 합리적으로 산정할 수 있을 것으로 판단된다. The previous study determined the design frequency by using the Potential Risk of Flood Damage(PRFD) and the recorded maximum rainfall. But, we had problems that the estimated design frequency did not catch up with it which is safely designed because a rainfall that the recorded maximum rainfall had already occurred, and it had a narrow range according to the values of PRFD. So, in this study we estimated the weighting coefficients in connecting PRFD to a design frequency by the recorded maximum rainfall in An-Yang stream basin. The coefficients are public land price and flood discharge and anyone who wants to estimate the design frequency by a recorded maximum rainfall can compute the frequency more easily than existing estimation method by using Kriging technique for 6-rainfall gage station of Korea Meteorological Administration (KMA) in the metropolitan area. As the results, the design frequency corresponding to the recorded maximum rainfall was calculated as 112 years. Also we estimated the design frequencies for small river basins in An-Yang stream and the estimated frequncies were in the range from 45 to 200 years. The region holding the frequency of 200 years is an estuary area of An-Yang stream, and this is in Yeongdeungpogu, Seoul. This area has the highest design frequency since it has high public land price and flood discharge per unit basin area as a national river area. So, we can determined the design frequency corresponding to a recorded maximum rainfall which has a PRFD value of 100 if we have the .shp file for study basins. At present, the design frequency is determined according to the class of a river such as the national river, regional rivers of the first or the second classes. However, if we use the suggested methodology in this study we can determine the design frequency more reasonably.
신지영(Jiyoung Shin) 한국언어청각임상학회 2010 Communication Sciences and Disorders Vol.15 No.1
배경 및 목적: 이 연구의 목적은 한국어 사전에 등재된 표제어의 발음형을 대상으로 말소리 관련 빈도를 알아보는 것이다. 사전 표제어의 발음형이 보여주는 말소리 관련 빈도 정보, 즉음소 및 음절 관련 빈도 정보는 한국어에 대한 가장 기본적인 정보로서, 한국어 화자들의한국어에 대한 기본적인 언어 지식이라고 할 수 있다. 방법: 표제어 선정에 사용 빈도의 개념이반영된 「연세한국어사전」의 전체 표제어 49,553개 중 잘못된 형, 방언형, 자모, 접사(접두사와접미사) 등과 「표준국어대사전」의 표제어에서 찾을 수 없는 어휘 항목을 제외한 47,401개표제어를 연구의 대상으로 삼았다. 해당 표제어들을 대상으로 필자가 정한 원칙에 따라 사전의 발음형을 일일이 확인하고 입력하는 방법으로 자료를 완성하였다. 완성된 자료에서 음소및 음절 빈도를 얻기 위해 SynKDP 1.5.2(일명 깜짝새)가 사용되었다. 결과: 분석 대상이 된47,401개 표제어에서 관찰된 음절은 총 122,761개였고, 음소는 총 290,131개였다. 음소 중에서모음은 122,761(42.3%)개, 자음은 167370(57.7%)개로, 자음의 수가 약간 많았다. 자음 중에는초성이 110,122(65,8%)개, 종성이 57,248(34.2%)개로 초성의 빈도가 높았다. 한국어에 존재하는 36개의 음소 중에서 가장 높은 빈도를 보인 음소는 /?/였고, 가장 낮은 빈도를 보인 음소는 /?i/였다. 가장 높은 빈도를 보인 자음은 /k/였고, 이어서 /n/, /ŋ/, /l/, /?/의 순서를보였다. 가장 높은 출현 빈도를 보인 모음은 /?/였고, 이어서 /i, ?, o, u, ?, ?, j?, w?, w?,jo, ju, j?, wi, w?, j?, ?i/의 순서를 보였다. 사전의 발음형 전체에서 관찰된 음절의 유형수는 총 1,283이었다. 이 가운데 가장 출현 빈도가 높았던 음절은 5,413회를 보인 /h?/였다.이어서 /li, ?i, i, ki, s?, ??k/ 등이 그 뒤를 따랐다. /h?/가 고빈도를 보인 이유는 동사 파생접사 {-하}의 생산성과 유관한 것으로 보인다. 1,283개의 유형 중에서 고빈도 82개 유형, 즉6.4%에 불과한 음절의 유형이 전체 자료의 50.25%를 차지하는 것으로 나타났다. 논의 및결론: 한국어 사전 표제어의 음소 및 음절 관련 빈도 정보는 한국어와 관련된 기초 자료로서음성학, 음운론은 물론, 언어 병리학, 한국어 교육, 음성 공학 분야에서도 꼭 필요한 기초 자료로 활용될 것이다 Background & Objectives: The aim of the present study is to provide information on the occurrence frequencies of Korean phoneme and syllable units based on the careful analysis of entries inthe Korean Dictionary. Information on phoneme and syllable frequencies of the entries is a fundamental knowledge component of the Korean language. Methods: Using 47,401 entries from the Yonsei Korean Dictionary, the occurrence frequencies for units of Korean phonemes and syllables were analyzed. Pronunciations of all the entries were manually checked, and SynKDP 1.5.2 was used to calculate thephoneme and syllable frequencies. Results: A total of 122,761 syllables and 290,131 phonemes were observed from 47,401 entries, with 65.8% of consonants occupying the onset position in the syllable structure. Among 36 phonemes, /? showed the highest frequency, and /?/ showed the lowest frequency. Among 19 consonants, /k/ occupied the highest ranking, and /n/, /ŋ, /l/, and /? were the next rankings, in that order. Syllable frequency was also investigated. A total of 1,283 syllable types were observed. However, the most frequent 82 syllable types, i.e., 6.4% of all observed syllable types, accounted for over 50% of the data. Discussion & Conclusion: Information on the phoneme and syllable frequencies of entries in the Korean dictionary is a fundamental knowledge component of the Korean language. Therefore, this type of information is useful not only for Korean linguistics, but also speech pathology, Korean language teaching, and speech engineering
외래어의 사전 등재와 빈도수의 관련성 고찰 ― 『고지엔(広辞苑)』을 중심으로 ―
이은조 한국일본학회 2025 일본학보 Vol.- No.142
본고는 외래어의 사전 등재와 빈도수의 관련성에 대해서 살펴본 것이다. 어휘의 사전 등재 조건에 대해서 논한 선행 연구를 보면 객관적 기준으로 빈도수를 언급하고 있지만, 실제로 사전에 등재된 어휘와 빈도수의 관계를 논한 선행 연구는 찾아보기 힘들다. 따라서 본고는 사전에 등재된 외래어의 출현빈도수를 살펴보고 사전 등재 전과 후의 빈도수를 비교하여 사전 등재와 빈도수의 관련성에 대해서 고찰하였다. 이를 위해 일본 국립국어연구소에서 선정한 외래어 171개를 대상으로 하여, 1955년부터 2018년까지 총 7판이 발간된 『고지엔』의 사전 등재 여부를 확인하였다. 또한, 신문 데이터를 이용하여 1952년부터 2021년까지 약 70년간의 출현빈도수를 조사하여 사전 등재시기에 따라 출현빈도수가 어떠한 양상을 보이는지 검토하였다. 그 결과, 외래어의 첫 등재가 제1판, 제2판, 제3판, 제4판, 제5판인 경우에는 사전에 등재된 이후 빈도수가 증가하는 양상을 보였다. 그러나 첫 등재가 제6판 또는 제7판인 경우 13개의 어휘가 사전 등재 전에 빈도수가 가장 높은 수치로 나타나 사전 등재에 영향을 준 것으로 보았다. 또한 25개의 어휘도 사전에 등재된 시기에 빈도수가 높은 수치를 보여 빈도수가 사전 등재에 영향을 미친 가능성이 있는 것으로 보았다. 그러나 전체적으로 봤을 때 연구 대상 어휘의 대부분이 사전에 등재된 이후에 빈도수가 증가하는 양상으로 나타났기 때문에 사전 등재가 오히려 외래어의 빈도수를 높이는 관계에 있다고 보는 것이 타당한 것으로 판단하였다. The present study examined the relationship between the inclusion of loanwords in dictionaries and their frequency. Although frequency is often cited as a key criterion for dictionary inclusion, studies directly examining its relationship with inclusion are limited. In this regard, the current study examined the frequency of dictionary-listed words, and compared the pre- and post-inclusion frequencies to explore the correlation between inclusion and frequency. A total of 171 loanwords were examined, and their inclusion in Gojien was verified. Additionally, using newspaper data, the frequency of the 171 words was investigated over a period of 70 years, from 1952 to 2021. Findings show that the frequency of loanwords registered from the 1st to 5th editions increased after being registered in the dictionary. However, for the loanwords registered from the 6th to 7th editions, 13 loanwords appeared with the highest frequency before dictionary registration, and were considered to have influenced dictionary registration. In addition, 25 loanwords also showed high frequencies at the time they were listed in the dictionary. Therefore, it was considered that the frequency may have influenced dictionary inclusion. Overall, the increase in frequency of most loanwords after dictionary inclusion suggests a correlation between inclusion and frequency growth.