http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
전성해(Sunghae Jun) 한국지능시스템학회 2017 한국지능시스템학회논문지 Vol.27 No.5
컴퓨터와 인간은 분명 다르지만 기본적으로 데이터를 저장하고 처리하는 개념적 측면에서는 서로 유사한 구조를 갖는다. 하지만 수집된 전체 데이터를 처리하고 분석하는 컴퓨터와는 달리 인간은 요약된 패턴 단위로 데이터를 처리한다. 즉 인간은 전체 데이터를 다루기보다는 요약된 정보를 통해 최적의 의사결정을 한다. 전체 데이터보다 요약된 정보만을 관리하면 시간과 비용 면에서 더 효율적인 시스템을 구축할 수 있다. 특히 빅데이터 환경에서 인공지능의 학습을 위한 대용량 데이터의 처리 및 분석을 위하여 요약된 정보에 기반 한 데이터학습에 대한 필요성이 제기되고 있다. 본 연구에서는 이와 같이 요약된 정보에 기반 한 심볼릭 인공지능 시스템의 효율적인 구축을 위하여 통계학의 심볼릭 데이터분석에 대하여 연구한다. 특히 대표적인 데이터언어인 R에서 제공하는 심볼릭 데이터분석 함수를 이용한 심볼릭 인공지능에 대한 방법을 소개한다. 제안방법의 성능평가를 위하여 객관적인 기계학습 데이터 사례를 이용하였다. Computers and humans are different, but basically they have a similar structure in conceptual aspects of data storing and processing. However, unlike computers that process and analyze the entire data collected, humans process the data in a summarized pattern. In other words, humans make the best decisions through summarized information rather than whole data. By managing only summarized information, you can build a more efficient system in terms of time and cost. In particular, there is a need for learning from data based on summarized information for processing and analyzing large amounts of data for artificial intelligence learning in a big data environment. In this paper, symbolic data analysis of statistics is studied for efficient construction of symbolic artificial intelligence system based on the information summarized in this way. We introduce a method for symbolic artificial intelligence using symbolic data analysis functions provided by R data language. In order to evaluate the performance of proposed method, objective machine learning data were used.
임수현(Soohyun Im),강기훈(Kee-Hoon Kang) 한국데이터정보과학회 2018 한국데이터정보과학회지 Vol.29 No.2
심볼릭 자료 중 한 가지인 구간형 자료는 관측치가 단일 값이 아닌 구간형으로 주어진다. 본 논문에서는 선형회귀분석에 초점을 맞추어 구간형 자료의 회귀분석을 위한 방법들을 소개한다. 또한, 이 방법들 중 하나인 재표본 방법에서 균일분포 대신 절단정규분포를 사용하는 것을 제안한다. 이는 구간형 자료에서 중심 근처에 더 많은 정보가 있을 것이라고 기대하는 것에서 연유한 것이다. 소개된 방법들을 모의실험을 통해 성능을 비교하고, 미세 먼지와 관련된 실제 자료에 이러한 방법들을 적용한다. 표본의 크기가 커지면서 방법간에 차이는 거의 없고, 재표본 방법에서는 제안된 접근법이 더 우수함을 알 수 있다. The interval data, which is one of the symbolic data, is given as an interval in which all observations are not a single value. In this paper, we introduce some regression approaches for interval-valued data to focus on linear regression analysis. In addition, we propose to use truncated normal distribution instead of uniform distribution in the resampling approach. It is assumed that it has more information near the center point of the interval. Several methods are compared through simulation. Also, we apply these approaches to the real data related to the fine dust. As the sample size increases, there is little difference between the methods. In terms of resampling method, the proposed one shows better performance.