RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        전자기 벡터장 시각화를 위한 Mathematica 시뮬레이션

        최용대,윤희중,Choi, Yong-Dae,Yun, Hee-Joong 한국진공학회 2012 Applied Science and Convergence Technology Vol.21 No.2

        전자기장을 포함한 대부분의 물리학적 시스템이 벡터 미분 연산자들로 기술되며 또한 벡터연산을 통하여 계산된다. 그러므로 이들 벡터장들이 유전 및 자성물질 시스템들과 상호작용할 때 물리적 체계를 기술하고 계산하려면 정확한 전자기 벡터장의 지식체계를 이해할 필요가 있다. 그런데 이들 대부분 추상적 개념들을 직관적으로 이해하기에는 쉽지 않기 때문에 이들 추상적 개념의 시각화 표현 작업은 오늘날 지식정보화 수행과정에서 매우 중요한 과제의 하나다. 우리는 전자기학 체계를 구성하는 가장 기본적인 벡터장: $\vec{E}=-\vec{\nabla}_{\varphi}$, $\vec{D}={\epsilon}\vec{E}$, $\vec{\nabla}{\times}\vec{A}$, $\vec{B}={\mu}\vec{H}$, $\vec{B}={\mu}_0(\vec{\nabla}_{\varphi}{^*}+\vec{M})$들의 가시화 시뮬레이션을 Mathematica 프로그램으로 작성하여 추상적인 전자기벡터장의 시각화 모델을 제시하였다. 이 시뮬레이션을 전자기 벡터장의 물리학적 지식체계를 탐구해 가는 기본 플랫폼으로 활용할 수 있다. Visualization of the electromagnetic vector fields are presented and examined with Mathematica. Vector fields may be used to represent a great of many physical quantities in various area of physics, including electromagnetism with vector differential operators. Because they deal with abstract, three-dimensional fields that are some times very difficult to visualize, electromagnetism can be conceptually rather difficult. Visual representation of such an abstract vector fields is invaluable to student or researchers working in this field and also helps teaching electromagnetism to physics or engineering students. Mathematica provides a wider range of graphical tools including plot of vector fields and vector analysis, which can be applied to visualization of electromagnetic system. We have visualized the most fundamental concepts of the electromagnetic vector $\vec{E}=-\vec{\nabla}_{\varphi}$, $\vec{D}={\epsilon}\vec{E}$, $\vec{\nabla}{\times}\vec{A}$, $\vec{B}={\mu}\vec{H}$, $\vec{B}={\mu}_0(\vec{H}+\vec{M})$, which are confirmed with vector calculations and valid graphically with some presentations.

      • KCI등재

        ‘기하와 벡터’ 교육과정의 벡터와 내적 개념 분석

        신보미 한국학교수학회 2013 韓國學校數學會論文集 Vol.16 No.4

        이 연구는 2007 개정 교육과정의 ‘기하와 벡터’ 교과에서 다루어지는 벡터와 내적 개념을 분석하여 그 특징을 기술함으로써 벡터와 내적 개념 지도의 교수학적 시사점을 얻는데 목적 을 두었다. 이를 위해 ‘기하와 벡터’ 교육과정에서 다루어지는 벡터와 내적 개념 분석을 위한 세부 관점을 Tall(2002a; Tall, 2004b)과 Watson et al.(2003; Watson, 2002)에 기초하여 5가 지로 추출하고, 이렇게 추출된 세부 관점을 토대로 ‘기하와 벡터’ 교육과정 및 교육과정해설 서, ‘기하와 벡터’ 교과서 10종 모두에서 다루어지는 벡터와 내적 개념의 특징을 분석하였다. 이로부터 벡터와 내적 개념 형성과 관련된 교육과정상의 이슈를 구체화하였으며 이에 비추 어 ‘기하와 벡터’ 교과서에서 벡터 단원의 내용을 전개하는 방식과 관련된 시사점을 논의하 였다. This study analyzed issues in the mathematics curriculum concerning the cognitive development of the vector and inner product concepts in the light of Tall's and Watson's research(Tall, 2004a; Tall, 2004b; Watson et al., 2003; Watson, 2002). Some suggestions in teaching the vector and inner product concepts were elaborated in the terms of these analyses. First, the position vector needs to be represented by an arrow on the coordinate system in order to introduce the component form of a vector represented by a directed line segment. Second, proofs of the vector operation law should be carried out by symbolic manipulations based on the algebraic concept of a vector in the symbolic world. Third, it is appropriate that the inner product is defined as aㆍb=a1b1+a2b2(when, a=(a1, a2), b=(b1, b2) when it comes to considering the meaning of the inner product relevant to vector space in the formal world. Cognitive growth of concepts of the vector and inner product can be properly induced through revising explanation methods about the concepts in the curriculum in the basis of the above suggestions.

      • KCI등재

        문맥 독립 화자인식을 위한 공간 분할 벡터 양자기 설계

        임동철,이행세,Lim, Dong-Chul,Lee, Hanig-Sei 한국정보처리학회 2003 정보처리학회논문지B Vol.10 No.6

        이 논문은 문맥 독립 화자인식에 사용될 벡터 양자기의 설계법 개선에 관한 연구이다. 구체적으로 벡터 양자기 코드북 생성 과정에서 특징 벡터 공간을 분할하여, 양자기 설계 시 학습에 필요한 계산 복잡도를 획기적으로 줄이는 방법을 제안한다. 제안된 공간 분할 벡터 양자기 설계법은 저자가 제안한 문맥 종속 화자인식을 위한 준비반복 벡터 양자기 설계법의 벡터 공간에 대한 일반화이다. 공간 분할 벡터 양자기 설계법은 종래의 설계법이 코드북 생성에 반복적 학습 설계를 사용한다는 것과 대조를 이룬다. 또한 공간 분할 벡터 양자기 설계법의 특징은 다음과 같다. 첫째, 이 설계법은 특징 벡터 공간을 분할한 공간 분할 군집을 이용함으로써 반복 학습을 하지 않는다. 둘째, 설계된 각 양자 영역은 공간 분할 군집의 양자 영역을 원용하며, 양자점은 각각의 통계 분포에 대해 최적점으로 설정된다. 셋째, 공간 분할 군집은 특징 벡터 집합에 대해 표본 벡터 생성법(CSVQ1, 2), 특징 벡터 공간에 대해 균일 초격자 구조 생성법(CSYQ3)으로 형성하였다. 수치 실험은 화자 10명이 발성한 50개의 문장에 대해 문맥 독립 화자인식 실험으로 수행되었다. 특징계수는 12차 멜켑스트럼 벡터를 사용하였고 각각의 공간 분할 코드북 생성법에 대해 코드북 크기를 32부터 128까지 변화시키면서 기존의 벡터 양자기 인식법과 비교하였다. 제안된 방법은 표본 벡터 생성법을 사용한 경우 인식률 100%로 기존의 방법과 같은 결과를 보였다. 따라서 제안된 공간 분할 벡터 양자기 설계법은 설계에 필요한 계산량이 획기적으로 줄면서 인식률은 보존되어 문맥 독립 화자 인식에 새로운 대안이 되며 또한 특징 벡터 공간을 설정할 수 있는 다양한 응용에 적용이 가능할 것으로 사료된다. In this paper, we study the enhancement of VQ (Vector Quantization) design for text independent speaker recognition. In a concrete way, we present a non-iterative method which makes a vector quantization codebook and this method performs non-iterative learning so that the computational complexity is epochally reduced The proposed Classified Space VQ (CSVQ) design method for text Independent speaker recognition is generalized from Semi-noniterative VQ design method for text dependent speaker recognition. CSVQ contrasts with the existing desiEn method which uses the iterative learninE algorithm for every traininE speaker. The characteristics of a CSVQ design is as follows. First, the proposed method performs the non-iterative learning by using a Classified Space Codebook. Second, a quantization region of each speaker is equivalent for the quantization region of a Classified Space Codebook. And the quantization point of each speaker is the optimal point for the statistical distribution of each speaker in a quantization region of a Classified Space Codebook. Third, Classified Space Codebook (CSC) is constructed through Sample Vector Formation Method (CSVQ1, 2) and Hyper-Lattice Formation Method (CSVQ 3). In the numerical experiment, we use the 12th met-cepstrum feature vectors of 10 speakers and compare it with the existing method, changing the codebook size from 16 to 128 for each Classified Space Codebook. The recognition rate of the proposed method is 100% for CSVQ1, 2. It is equal to the recognition rate of the existing method. Therefore the proposed CSVQ design method is, reducing computational complexity and maintaining the recognition rate, new alternative proposal and CSVQ with CSC can be applied to a general purpose recognition.

      • KCI등재

        남녀 아동의 성장기별 생체전기임피던스벡터와 위상각 분포

        김혜진(Hyeoi Jin Kim),김철현(Chul Hyun Kim),정소정(So Chung Chung) 한국체육측정평가학회 2012 한국체육측정평가학회지 Vol.14 No.1

        이 연구는 소아청소년에서 성별과 연령에 따른 위상각과 생체전기임피던스벡터의 수준과 위치를 구하고자 하였다. 또한 연구결과를 바탕으로 위상각과 생체전기임피던스벡터가 소아청소년의 성장수준과 성별에 따른 신체구성 및 체형의 변화에 대한 정보를 제공하고자 하였다. 연구의 목적을 위해 만 6세에서 14세의 건강한 소아청소년 1,270명을 동원하여 신체계측과 생체전기저항법을 측정하여 인체저항과 리액턴스를 측정하였으며, 임피던스 및 위상각과 그래프 상에 임피던스벡터의 분포를 분석하였다. 연구결과 BMI분포 중 67백분위 이상에 대한 임피던스벡터는 유의하게 최좌측 좌표에 분포하였고, BMI 33백분위수 이하는 임피던스벡터의 포물선이 최우측 좌표에 위치하였다. 이와 동시에 위상각은 BMI의 증가와 함께 유의하게 증가했다. 성장기에 따른 여아와 남아의 임피던스 벡터와 위상각은 6~8세에서는 남·여 간의 유사하게 나타났고, 9~11세에서 여아가 남아보다 좌측에 위치하였으며, 12~14세에서 여아의 임피던스벡터는 남아보다 좌측 좌표에 위치하였다. 이때, 위상각은 6~8세에서 남아가 유의하게 높은 수준을 가졌고 연령이 증가한 9~11세에서 보다 증가하였으며, 12~14세에서 여아와 남아 간의 수준은 유사한 수준으로 회귀하였다. 이상의 결과에서 BIVA와 위상각은 성장에 의한 체형과 체세포의 증가를 구분하여 소아청소년의 신체구성을 평가 할 수 있었다. Bioelectrical impedance analysis (BIA) gives resistance (R) and reactance (Xc). R and Xc normalized by body height (H) can be plotted as a bivariate vector (R/H versus Xc/H). R and Xc can also give phase angle. Vector BIA and phase angle is useful for studying the determinants of body composition. We investigated the effect of age or growth of children on BIA results including R, Xc, Z, and phase angle and its relevance to body-composition analysis in a large database of impedance vector distribution stratified by age, sex, and body mass index (BMI) for identifying the possibility to use BIVA and phase angle for children`s growth curve. We recruited 1,279 children aged 6 to 14. First, these children were divided by three groups according to BMI tertile value. Impedance vectors and phase angle were analyzed based on three BMI groups. These children were also divided into three age groups (6-8year group, 9-11year goup, 12-14year group). Impedance vectors and phase angle were analyzed based on three age groups by sex. As results, the impedance vector distribution pattern was influenced by sex, BMI, and age, with shoter vectors in males than females (p<0.001) and shorter vectors with increasing BMI (p<0.001). Phase angle gradually increased with increasing BMI (p<0.001). However, phase angle were larger in men than in women until 11 years old. Phase angle in female aged 12 to 14 years become similar to that in male aged 12 to 14 year. These results suggest that impedance parametes, BIVA, and phase angle can predict children`s growth and body composition. We could recommend that BIVA pattern can be developed for growth curve of children and adolescent.

      • KCI등재

        다차원 인덱스를 위한 벡터형 태깅 연구

        정재윤(Jae-Youn Jung),진현철(Hyeon-Cheol Zin),김종근(Chonggun Kim) 한국정보과학회 2009 정보과학회논문지 : 소프트웨어 및 응용 Vol.36 No.9

        인터넷 사용이 대중화되면서 개인이 정보의 키워드 또는 검색할 주제에 따라 원하는 정보에 쉽게 접근할 수 있다. 이때 다양한 구조를 갖는 자료들의 속성을 잘 나타내는 메타데이터를 이용하면 검색의도에 보다 정확하게 부합하는 검색 결과를 얻을 수 있어 다양한 연구가 지속되고 있다. 본 연구는 소 그룹의 사용자들이 공동으로 관심 있는 웹 콘텐츠의 즐겨찾기를 공동으로 유지 관리하는 용도로 다차원 벡터형 태그를 제안한다. 제안하는 벡터형 태그는 정보 유용성을 나타내는 색인을 벡터방식으로 기술하고 이것을 활용해 정보의 분류·관리·재활용의 효율을 높이는 표현법이다. 벡터방식 태깅은 대상 키워드에 사용자들이 두 개 이상의 요소에 대한 우선순위를 부여하고 벡터 방식으로 표현한다. 이 때 벡터의 기본이 되는 벡터공간은 정보생성시간, 선호순위 등으로 구성한다. 벡터성분으로 산출할 수 있는 벡터크기가 정보의 유용성을 나타내며 순위측정의 기준이 된다. 제안방식에 의한 순위측정은 단순한 링크구조에 의해 측정된 순위와 비교하였을 때, 사용자의 검색의도에 부합하는 순위 정보를 제공하고 있다. A Internet user can easily access to the target information by web searching using some key-words or categories in the present Internet environment. When some meta-data which represent attributes of several data structures well are used, then more accurate result which is matched with the intention of users can be provided. This study proposes a multiple dimensional vector tagging method for the small web user group who interest in maintaining and sharing the bookmark for common interesting topics. The proposed method uses vector tag method for increasing the effect of categorization, management, and retrieval of target information. The vector tag composes with two or more components of the user defined priority. The basic vector space is created time of information and reference value. The calculated vector value shows the usability of information and became the metric of ranking. The ranking accuracy of the proposed method compares with that of a simply link structure, The proposed method shows better results for corresponding the intention of users.

      • KCI등재

        키네틱타이포그라피의 역동적 무브먼트 구현에 관한 연구

        김성혜 한국일러스아트학회 2009 조형미디어학 Vol.12 No.3

        In this paper, I researched techniques of camera works and non-linear altering velocity for emphasizing visual impact with creating dynamic frame mobility based on theory of motion vector while maintaining its own function of delivering information in moving typography. Vector can be defined as a kind of strong power working in the screen, having visual attentionability and directionability. Visual attentionability and hierachy is determined and constructed by a kind and degree of vectors. Accordingly vector is "a screen energy with direction and magnitude" and has three kinds; graphic, index, motion. The magnitude of vector is determined by index, graphic mass, and perceptive velocity. Each vector has a different magnitude of energy; motion vector has more energy size than index vector which has more that than of graphic's. In this research, I studied the techniques of camera works and non-linear altering velocity for maximizing dynamic mobility based on the theory of motion vector which has the highest degree of energy in vectors. And before I begin to search for the spatial mobility, I had to re-clarify the definition of space. Three- dimentional space is divided by opened/negative space and closed/positive space and these two space inevitably create continuous change of volume/mass/closed space and flows of energy. Ultimately spatial dynamism which is perceived by human being can be the combination of visible positive volume and invisible negative volume inevitably created posi's at the same time. And I researched and proposed four techniques for maximizing dynamic mobility in screen: first the velocity must have a rythmic flows(mixed with linear & non-linear sequential speed: beginning, preceding, climax, and ending), secondly camera movement must be mixed shotting by the axis of body and body itself, thirdly controling camera moving based on the degree of visual attentionability in axis X,Y,Z and basically mixing multi-direction, and lastly must completed by multi-complex editing after setting and shotting with multi-camera. 본 논문에서는 무빙타이포 그라피가 그 고유의 기능인 정보 전달력을 최대한 유지함과 동시에 시각적 움직임의 역동성 구현을 위해 동작벡터이론을 근거로한 카메라워크와 비선형적 속도전환법을 연구하였다. 벡터란 일종의 화면 내에서 작용하는 강한 힘, 시선을 이동시키는 지향성을 가진 힘을 말한다. 시각적 임팩트 즉 주의도는 이 벡터의 종류와 값에 의해 그 구조적 위계가 결정된다. 그러므로 벡터는 ‘일정한 방향과 크기를 가진 힘, 에너지 값’이며 그래픽벡터(graphic vector), 지시벡터(index vector), 동작벡터(motion vector)가 있다. 벡터의 크기는 화면상의 방향, 그래픽 질량, 지각된 속도등에 의해 결정되며 각 벡터마다의 크기가 각각 다를 수 있지만, 기본적으로 동작벡터는 지시벡터보다 그 에너지값이 크고 지시벡터는 그래픽벡터보다 더 크다. 본문에서는 역동성을 최대화하기 위하여 벡터값이 가장 높은 동작벡터를 카메라의 움직임과 속도조절을 통해 살펴보았다. 그리고 공간의 역동성에 관한 연구에 앞서 공간 개념에 관하여 재정의 하였다. 입체 공간개념은 열려진 공간과 닫혀진 공간으로 구분되며 두공간은 필연적으로 양공간의 연속적 형태 변화와 에너지흐름을 함께 생성 시킨다. 결국, 사람이 인지하는 공간의 역동성이란 보여지는 파지티브 볼륨과 보여지지는 않지만 파지티브볼륨이 필연적으로 생성시키는 네거티브볼륨과 함께 만들어지는 조합에 의한 것이다. 그리고 카메라워크, 속도와 관련한 네가지의 기술들을 연구, 제안하였다. 첫째, 시간적(속도) 흐름에서 선형 및 비선형적 흐름을 섞되 전조, 상기, 엔딩의 리듬감을 가지며 극적인 흐름을 반드시 가질 것. 둘째, 카메라 이동시 화각이 입체적인 바디 이동에 의한 무빙을 하되 축 이동을 함께 섞을 것. 세 번째, x,y,z의 이동방향은 우향, 하향, 전출 방향이 시각적 주의도가 높으므로 이 사실을 염두하여 조절할 것이나 단방향 이동보다는 혼합공간 동시이동 하는 것이 공간적 입체성을 극대화 시킬 수 있다는 점. 마지막으로, 카메라 셋팅은 싱글 셋팅에 의한 평면적 촬영이아니라 멀티 셋팅에 의한 복합편집으로 최종화면이 완성되어야 한다는 점이다

      • KCI등재

        선형 판별분석과 공통벡터 추출방법을 이용한 음성인식

        남명우,노승용 한국음향학회 2001 韓國音響學會誌 Vol.20 No.4

        본 논문에서는 선형 판별분석 (LDA: Linear Discriminant Analysis)과 공통벡터 추출방법을 이용한 음성인식방법을 제안하였다. 음성신호는 화자의 성별, 나이, 출생지, 주위 잡음, 정신적 상태, 발성기관의 구조 등과 같은 다양한 정보를 포함하고 있다. 이로 인해 같은 음성신호라 할지라도 서로 다른 화자가 발성하게 되면 서로 다른 특성을 보이게 된다. 음성신호의 이러한 성질은 같은 음성군 (class)에 포함된 공통된 특성벡터를 추출하는 일을 상당히 어렵게 한다. 음성신호에서 공통된 특징 벡터를 추출하는 방법은 KLT (Karhunen-Loeve Transformation)와 같이 선형 대수적인 접근방법이 많이 사용되어지고 있으나, 본 논문에서는 M. Bilginer et al.이 제안한 공통벡터 추출 방법을 사용하였다. M. Bilginer et al.이 제안한 방법은 주어진 훈련 음성신호들에 대하여 최적의 공통 벡터를 추출하여 주면서 공통벡터 추출에 사용된 훈련 데이터에 대해서는 100%의 인식결과를 보여준다. 그러나 공통벡터 추출을 위한 훈련 음성신호의 수를 무한히 늘릴 수 없다는 점과 공통벡터들간의 구별정보 (discriminant information)가 정의되지 않았다는 단점이 있다. 본 논문에서는 단어그룹간 (class) 구별정보를 추출된 공통벡터와 결합해 단어간의 오인식률 (error rate)을 감소시킬 수 있는 방법과 공통벡터 추출방법에 적합한 파라미터 가공 방법을 제안하였다. 공통벡터 추출방법은 음성신호의 시간 축 정규화 방법과 벡터의 차원 크기에 따라 인식시간과 인식률에 영향을 받는다. 따라서 부적절한 시간 축 정렬과 너무 큰 벡터의 차원 수는 인식률 저하 등과 같이 알고리즘의 효율성을 떨어뜨린다. 본 논문에서 제안한 방법을 사용하여 실험한 결과 알고리즘의 효율성이 증가되었으며, 기존방법보다 약 2%정도의 향상된 인식률을 얻을 수 있었다.낮추는 효과를 나타내었다.다. 이상의 결과를 통하여 추출 온도와 용매 농도에 따른 수율의 차이가 있었으며 free radical 소거 활성에서는 종자 에탄을 추출물이 과피 에탄올 추출물 보다 145배 이상의 현저히 높은 활성을 나타내었다.을 나타내었다.'Lian(연)' : repeatability, continuance, plenty and intercommunicate, 2. 'Lian(연)'-'Lian(염)': integrity, 3. 'He (하)'-'He(화)' : peace, harmony and combination, 4. 'He(하)'-'He(하)' : clear river, 5.'He(하)'-'He(하)' ; all work goes well. When the Chinese use lotus patterns in lucky omen patterns, same pronunciation and pitch of Chinese language more prominent than natural properties or the image of Buddhism. I guess that it cause praying individual's peace and happiness more serious than philosophical meaning or symbol that base in Buddhism for ordinary people.ML., -9.00~12.49 and -19.81~19.81%, respectively). Therefore, it is concluded that the two formulations are bioequivalent for both the extent and the rate of absorption after single dose administration.ation.ion.ion.ation.ion.n. fibrosis, collagen bundle) was This paper describes Linear Discriminant Analysis and common vector extraction for speech recognition. Voice signal contains psychological and physiological properties of the speaker as well as dialect differences, acoustical environment effects, and phase differences. For these reasons, the same word spelled out by different speakers can be very different heard. This property of speech signal make it very difficult to extract common properties in the same speech class (word or phoneme). Linear algebra method like BT (Karhunen-Loeve Transformation) is generally used for common properties extraction In the speech signals, but common vector extraction which is suggested by M. Bilginer et at. is used in this paper. The method of M. Bilginer et al. extracts the optimized common vector from the speech signals used for training. And it has 100% recognition accuracy in the trained data which is used for common vector extraction. In spite of these characteristics, the method has some drawback-we cannot use numbers of speech signal for training and the discriminant information among common vectors is not defined. This paper suggests advanced method which can reduce error rate by maximizing the discriminant information among common vectors. And novel method to normalize the size of common vector also added. The result shows improved performance of algorithm and better recognition accuracy of 2% than conventional method.

      • KCI등재

        복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 방법론

        박종인,김남규 한국지능정보시스템학회 2019 지능정보연구 Vol.25 No.3

        According to the rapidly increasing demand for text data analysis, research and investment in text mining are being actively conducted not only in academia but also in various industries. Text mining is generally conducted in two steps. In the first step, the text of the collected document is tokenized and structured to convert the original document into a computer-readable form. In the second step, tasks such as document classification, clustering, and topic modeling are conducted according to the purpose of analysis. Until recently, text mining-related studies have been focused on the application of the second steps, such as document classification, clustering, and topic modeling. However, with the discovery that the text structuring process substantially influences the quality of the analysis results, various embedding methods have actively been studied to improve the quality of analysis results by preserving the meaning of words and documents in the process of representing text data as vectors. Unlike structured data, which can be directly applied to a variety of operations and traditional analysis techniques, Unstructured text should be preceded by a structuring task that transforms the original document into a form that the computer can understand before analysis. It is called "Embedding" that arbitrary objects are mapped to a specific dimension space while maintaining algebraic properties for structuring the text data. Recently, attempts have been made to embed not only words but also sentences, paragraphs, and entire documents in various aspects. Particularly, with the demand for analysis of document embedding increases rapidly, many algorithms have been developed to support it. Among them, doc2Vec which extends word2Vec and embeds each document into one vector is most widely used. However, the traditional document embedding method represented by doc2Vec generates a vector for each document using the whole corpus included in the document. This causes a limit that the document vector is affected by not only core words but also miscellaneous words. Additionally, the traditional document embedding schemes usually map each document into a single corresponding vector. Therefore, it is difficult to represent a complex document with multiple subjects into a single vector accurately using the traditional approach. In this paper, we propose a new multi-vector document embedding method to overcome these limitations of the traditional document embedding methods. This study targets documents that explicitly separate body content and keywords. In the case of a document without keywords, this method can be applied after extract keywords through various analysis methods. However, since this is not the core subject of the proposed method, we introduce the process of applying the proposed method to documents that predefine keywords in the text. The proposed method consists of (1) Parsing, (2) Word Embedding, (3) Keyword Vector Extraction, (4) Keyword Clustering, and (5) Multiple-Vector Generation. The specific process is as follows. all text in a document is tokenized and each token is represented as a vector having N-dimensional real value through word embedding. After that, to overcome the limitations of the traditional document embedding method that is affected by not only the core word but also the miscellaneous words, vectors corresponding to the keywords of each document are extracted and make up sets of keyword vector for each document. Next, clustering is conducted on a set of keywords for each document to identify multiple subjects included in the document. Finally, a Multi-vector is generated from vectors of keywords constituting each cluster. The experiments for 3.147 academic papers revealed that the single vector-based traditional approach cannot properly map complex documents because of interference among subjects in each vector. With the proposed multi-vector based method, we ascertained that complex documents ... 텍스트 데이터에 대한 다양한 분석을 위해 최근 비정형 텍스트 데이터를 구조화하는 방안에 대한 연구가 활발하게 이루어지고 있다. doc2Vec으로 대표되는 기존 문서 임베딩 방법은 문서가 포함한 모든 단어를 사용하여벡터를 만들기 때문에, 문서 벡터가 핵심 단어뿐 아니라 주변 단어의 영향도 함께 받는다는 한계가 있다. 또한기존 문서 임베딩 방법은 하나의 문서가 하나의 벡터로 표현되기 때문에, 다양한 주제를 복합적으로 갖는 복합문서를 정확하게 사상하기 어렵다는 한계를 갖는다. 본 논문에서는 기존의 문서 임베딩이 갖는 이러한 두 가지한계를 극복하기 위해 다중 벡터 문서 임베딩 방법론을 새롭게 제안한다. 구체적으로 제안 방법론은 전체 단어가 아닌 핵심 단어만 이용하여 문서를 벡터화하고, 문서가 포함하는 다양한 주제를 분해하여 하나의 문서를 여러 벡터의 집합으로 표현한다. KISS에서 수집한 총 3,147개의 논문에 대한 실험을 통해 복합 문서를 단일 벡터로 표현하는 경우의 벡터 왜곡 현상을 확인하였으며, 복합 문서를 의미적으로 분해하여 다중 벡터로 나타내는제안 방법론에 의해 이러한 왜곡 현상을 보정하고 각 문서를 더욱 정확하게 임베딩할 수 있음을 확인하였다

      • KCI등재
      • KCI등재

        벡터 볼록 최적화 문제를 위한 벡터 변분부등식

        이규명 대한수학회 2003 대한수학회논문집 Vol.18 No.4

        본 논문에서는 벡터값을 가지는 함수로 이루어진 벡터 변분 부등식들의 해집합사이의 관계, 미분 불가능한 볼록함수로 이루어진 벡터 볼록 최적화 문제의 해집합들과 볼록함수의 아래미분으로 표현된 벡터 변분부등식의 해집합들과의 관계, 제약집합이 볼록 함수로 구체적으로 주어질 때의 벡터 변분부등식의 해가 될 필요 충분조건, 섭동된 강 단조 벡터 변분부등식의 안정성 결과와 섭동된 벡터 강 볼록 최적화문제에의 적용에 대한 최근 연구 결과를 정리한다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼