RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • Clustering using K-Means and Fuzzy C-Means on Food Productivity

        Adriyendi 보안공학연구지원센터 2016 International Journal of u- and e- Service, Scienc Vol.9 No.12

        This paper provided an overview of analysis and implementation clustering for food productivity. Food productivity is determined by food production. Rice is one of staple food in Indonesia. Rice production is influencing adequacy level of national food production. Rice productivity is very important to accomplishment food affordability. Rice productivity per province in Indonesia must be increased, because large population and high consumption. Rice productivity that fluctuates and tends to decrease, need to clustering to determinant category cluster of productivity. Clustering is using K-Means and Fuzzy C-Means. Method improvement of K-Means is modification Intra Cluster Distance and Inter Cluster Distance. Calculate distance (Inter Cluster Distance and Intra Cluster Distance) to evaluate the clustering results and to compare the efficiency of the clustering algorithms. Method improvement of Fuzzy C-Means is modification algorithm, alternative process and iteration. Data processing is using Excel software. Clustering produce three cluster (C1, C2, C3) is convergence. Measurement cluster based on comparison of membership cluster, consistency, and productivity. Membership cluster, there is point data anomaly (x22, x23, x29, x33). Consistency data on K-Means (C1 = 72.73%, C2 = 93.75%, C3 = 100%). Consistency data on Fuzzy C-Means (C1 = 100%, C2 = 88.33%, C3 = 87.50%). Rice Productivity is Cluster 1 (decrease), Cluster 2 (decrease, except 3 provinces), and Cluster 3 (increase, except 1 province). Majority in rice productivity is 70.59%. Result of clustering showed that majority rice productivity on category cluster is low productivity.

      • KCI등재

        Approximate k values using Repulsive Force without Domain Knowledge in k-means

        ( Jung-jae Kim ),( Minwoo Ryu ),( Si-ho Cha ) 한국인터넷정보학회 2020 KSII Transactions on Internet and Information Syst Vol.14 No.3

        The k-means algorithm is widely used in academia and industry due to easy and simple implementation, enabling fast learning for complex datasets. However, k-means struggles to classify datasets without prior knowledge of specific domains. We proposed the repulsive k-means (RK-means) algorithm in a previous study to improve the k-means algorithm, using the repulsive force concept, which allows deleting unnecessary cluster centroids. Accordingly, the RK-means enables to classifying of a dataset without domain knowledge. However, three main problems remain. The RK-means algorithm includes a cluster repulsive force offset, for clusters confined in other clusters, which can cause cluster locking; we were unable to prove RK-means provided optimal convergence in the previous study; and RK-means shown better performance only normalize term and weight. Therefore, this paper proposes the advanced RK-means (ARK-means) algorithm to resolve the RK-means problems. We establish an initialization strategy for deploying cluster centroids and define a metric for the ARK-means algorithm. Finally, we redefine the mass and normalize terms to close to the general dataset. We show ARK-means feasibility experimentally using blob and iris datasets. Experiment results verify the proposed ARK-means algorithm provides better performance than k-means, k’-means, and RK-means.

      • An Improved K-means Algorithm based on Mapreduce and Grid

        Li Ma,Lei Gu,Bo Li,Yue Ma,Jin Wang 보안공학연구지원센터 2015 International Journal of Grid and Distributed Comp Vol.8 No.1

        The traditional K-means clustering algorithm is difficult to initialize the number of clusters K, and the initial cluster centers are selected randomly, this makes the clustering results very unstable. Meanwhile, algorithms are susceptible to noise points. To solve the problems, the traditional K-means algorithm is improved. The improved method is divided into the same grid in space, according to the size of the data point property value and assigns it to the corresponding grid. And count the number of data points in each grid. Selecting M(M>K) grids, comprising the maximum number of data points, and calculate the central point. These M central points as input data, and then to determine the k value based on the clustering results. In the M points, find K points farthest from each other and those K center points as the initial cluster center of K-means clustering algorithm. At the same time, the maximum value in M must be included in K. If the number of data in the grid less than the threshold, then these points will be considered as noise points and be removed. In order to make the improved algorithm can adapt to handle large data. We will parallel the improved k-mean algorithm and combined with the MapReduce framework. Theoretical analysis and experimental results show that the improved algorithm compared to the traditional K-means clustering algorithm has high quality results, less iteration and has good stability. Parallelized algorithm has a very high efficiency in data processing, and has good scalability and speedup.

      • 퍼지 K-평균 군집화의 재현성 평가

        허명회,손은진 高麗大學校統計硏究所 2003 應用統計 Vol.18 No.-

        Rand index는 군집화의 재현성을 평가하기 위한 자료 분할법에서 두 군집화 결과간의 일치도를 재는 지표이지만 (Rand, 1971) 개체가 1개 군집에 명확히 할당되는 군집화에만 적용될 수 있다. 따라서, 본 연구의 대상인 퍼지 K-평균 군집화(fuzzy K-means clustering)에서는 개체가 각 군집에 속할 소속도(membership)로 제시되므로 Rand index를 원형 그대로 사용할 수 없다. 본 연구의 목적은 퍼지 K-평균 군집화 결과 간 일치성 평가에 활용 가능하도록 Rand index를 확장하는 것이다. 제안 방법을 요약하면 다음과 같다. 1) 훈련 데이터로부터 얻은 퍼지 K-평균 군집화 규칙을 테스트 자료의 각 개체에 적용하여 K개 (=군집 수) 퍼지 소속도를 구한다. 독립적인 다른 훈련 데이터로부터 얻게 되는 퍼지 K-평균 군집화 규칙을 테스트 자료의 동일 개체에 적용하여 또 다른 K개 퍼지 소속도를 구한다. 2) 각 퍼지 군집화 규칙에 따른 군집 소속도에 비례하게 테스트 자료의 개체를 독립적으로 K개 군집 중 하나에 임의 할당하는 역 퍼지화 작업을 시행하여 명확한 분할(hard partition) 자료를 만든다. 3) 대응하는 두 개의 분할 군집화 결과로부터 통상적인 Rand index (또는 Hubert and Arabie (1985)의 C.(corrected) Rand index)를 산출한다. 4) 앞의 두 단계를 일정 수 반복하여 Rand index의 몬테칼로(Monte Carlo) 분포를 산출한다. 그 분포의 평균을 확장(extended) Rand index로 정의한다. 퍼지 K-평균 군집화에서 군집 수 K를 결정하는 문제에 확장 Rand index를 활용할 수 있다. 몇 개의 적용 사례를 제시하고 토의할 것이다. Rand index is an evaluation measure of consistency between two clustering rules (Rand. 1971). Hence it can be used to predict whether the clustering patterns are reproducible in the future. The index, however, cannot be applied to the fuzzy K-means clustering which has clear merits in dealing with overlapping clusters. The aim of this study is to extend Rand index or corrected Rand index of Hubert and Arabie (1985) for the use in fuzzy K-means clustering. The proposed method can be summarized as follows : Step 1: Partition the data into three parts - two training samples and one. test sample. Then, derive a K-means clustering rule from the first training sample and another rule from the second training sample. Then, apply both rules separately to the test sample units to obtain the list of cluster membership pairs. Step 2: Perform the inverse procedure opposite to make things fuzzy. In other words, generate a pair of hard partitions according to respective memberships of fuzzy partitions. Step 3: Compute Rand index or corrected Rand index of Hubert and Arabie (1985) from a pair of hard partitions. Step 4: Repeat Steps 3 and 4 for sufficient number of times. Then, one obtains a batch of Rand indices. Define Extended Rand Index by the average of Rand indices. We may use Extended Rand Index in determination of the number of clusters Kin fuzzy K-means clustering. Several examples are illustrated.

      • KCI등재후보

        CCD 카메라와 K-means 군집화를 이용한 하천 수위 자동 감지

        곽준영 ( Joon Young Kwak ),고병철 ( Byoung Chul Ko ),남재열 ( Jae Yeal Nam ) 한국화상학회 2011 한국화상학회지 Vol.17 No.3

        논문에서는 하천 수위 감지용 CCD카메라에서 입력된 동영상에서 다리 기둥 영역과 물 영역을 구분하여 수위를 감지하는 방법을 제안한다. 하천 영상에서는 다리 기둥이 있고 그 사이로 강물이 흐르기 때문에, 물이 흐르는 부분에서만 강한 움직임이 발생하게 된다. 따라서, 본 논문에서는 optical flow를 사용하여 강물의 움직임을 감지하고 움직임이 감지된 픽셀들을 Y 축으로 투영시켜 움직임 누적 히스토그램을 생성한다. 이후, 생성된 움직임 누적 히스토그램에 대해 K-means 군집화를 적용 시킨다. 단순히 기둥 영역과 물 영역을 구분하기 위해서는 K = 2인 K-means 군집화를 수행하면 되지만, 기둥 영역과 물보라가 심한 부분, 물이 잔잔하게 흐르는 부분으로 나누기 위해서 K = 3인 K-means 군집화를 수행한다. K-means 군집화에 의해 3개의 군집으로 나뉜 히스토그램에서 위쪽 첫 번째 군집과 두 번째 군집의 경계를 검출하면 그 부분이 곧 하천의 수위가 된다. 본 논문에서는 K = 2, K = 3 일 경우의 K-means 군집화를 사용한 방법과 기존의 CCD카메라 기반의 수위감지알고리즘을 비교 실험하였고, 실험 결과 기존의 연구보다 움직임벡터와 K-mean 군집화 방법을 결합한 방법이 가장 좋은 성능을 보여 주었다. In this paper, we propose a new automatic water-level detection algorithm for flood prevention using a CCD camera and K-mean clustering. The input video that is captured of the river consists of the column of a bridge and flowing water. Moreover, in contrast to the static column region, the water region exhibits slow and fast movement, according to the speed of the water. Using this fact, optical flows are detected using image sequences and detected moving vectors that are projected onto the Y-axis to make an accumulated motion histogram. From the accumulated motion histogram, a K-means clustering algorithm is executed to distinguish the real water region from the concrete column region. In particular, these authors prove that K=3 for K-mean clustering effectively distinguishes the column region from the spray of the water and the real water. The proposed algorithm is successfully applied to various river videos containing columns, and its detection performance is better than another related method.

      • KCI등재

        맵리듀스를 이용한 다중 중심점 집합 기반의 효율적인 클러스터링 방법

        강성민(Sungmin Kang),이석주(Seokjoo Lee),민준기(Jun-ki Min) 한국정보과학회 2015 정보과학회 컴퓨팅의 실제 논문지 Vol.21 No.7

        데이터 사이즈가 증가함에 따라서 대용량 데이터를 분석하여 데이터의 특성을 파악하는 것이 매우 중요해졌다. 본 논문에서는 분산 병렬 처리 프레임워크인 맵리듀스를 활용한 k-Means 클러스터링 기반의 효과적인 클러스터링 기법인 MCSK-Means (Multi centroid set k-Means)알고리즘을 제안한다. k-Means 알고리즘은 임의로 정해지는 k개의 초기 중심점들의 위치에 따라서 클러스터링 결과의 정확도가 많은 영향을 받는 문제점을 가지고 있다. 이러한 문제를 해결하기 위하여, 본 논문에서 제안하는 MCSK-Means 알고리즘은 k개의 중심점들로 이루어진 m개의 중심점 집합을 사용하여 임의로 생성되는 초기 중심점의 의존도를 줄였다. 또한, 클러스터링 단계를 거친 m개의 중심점 집합들에 속한 중심점들에 대하여 직접 계층 클러스터링 알고리즘을 적용하여 k개의 클러스터 중심점들을 생성하였다. 본 논문에서는 MCSK-Means 알고리즘을 맵리듀스 프레임워크 환경에서 개발하여 대용량 데이터를 효율적으로 처리할 수 있도록 하였다. As the size of data increases, it becomes important to identify properties by analyzing big data. In this paper, we propose a k-Means based efficient clustering technique, called MCSKMeans (Multi centroid set k-Means), using distributed parallel processing framework MapReduce. A problem with the k-Means algorithm is that the accuracy of clustering depends on initial centroids created randomly. To alleviate this problem, the MCSK-Means algorithm reduces the dependency of initial centroids using sets consisting of k centroids. In addition, we apply the agglomerative hierarchical clustering technique for creating k centroids from centroids in m centroid sets which are the results of the clustering phase. In this paper, we implemented our MCSK-Means based on the MapReduce framework for processing big data efficiently.

      • KCI등재

        기술평가자료를 이용한 군집화기반 성과예측모형 개발

        이영찬 한국자료분석학회 2011 Journal of the Korean Data Analysis Society Vol.13 No.3

        The purpose of this study is to build a clustering-based performance prediction model to predict financial performance of small-medium enterprises using KIBO technology rating data. The clustering-based performance prediction model is ex-post model to predict future's performance without a priori information such as bankruptcy/non-bankruptcy. The exogenous variables for predicting the financial performance (cluster: by k-means clustering) are 45 KTRS technology rating data. Specifically, after performing k-means clustering using conventional financial ratios (view of growth, profitability, activity, stability, efficiency) of companies, three clusters are derived from k-means clustering analysis. In addition, this paper uses discriminant analysis in order to select technology rating variables that are significant to predicting financial performance. Lastly, this paper uses case-based reasoning with k-nearest neighbor in order to predict future's financial performance (clusters). Although the ex-post information, the results of analysis show the good predictive power through AUROC. 본 연구의 목적은 기술보증기금의 기술평가 자료를 이용한 사례기반추론을 통해 기술보증지원을 받은 중소기업들의 재무성과를 예측하는 군집화기반 성과예측모형을 구축하는 것이다. 군집화기반 성과예측모형이란 부도/건전과 같은 사전적 정보가 없는 상태에서 미래의 성과를 예측하는 사후적(ex-post) 모형으로서, 성과는 기존 재무자료를 이용한 재무성과를 의미하며, 재무성과(군집: k-평균 군집분석 사용)를 예측하기 위한 외생변수는 45개 KTRS 기술평가항목이다. 구체적으로, 기술보증평가를 받은 기업의 성장성, 수익성, 활동성, 안정성, 효율성 관점의 기존 재무비율을 이용하여 k-평균 군집분석을 수행한 후 상위그룹, 중위그룹, 하위그룹의 세 가지 군집을 추출하였다. 또한 45개 기술평가 항목 중 어떤 항목이 재무성과를 예측하는데 유용한 가를 파악하기 위해 판별분석을 사용하였다. 마지막으로 재무성과 예측에 유의한 기술평가항목을 이용하여 미래의 재무성과를 예측하기 위해 데이터마이닝 기법인 k-최근접 이웃법(k-nearest neighbor)을 이용한 사례기반추론을 적용하였다. 분석결과, 사후적인 기술평가항목을 이용하였음에도 불구하고 k-최근접 이웃법을 이용한 검증집합의 예측력이 비교적 높은 것으로 나타났다.

      • KCI등재

        K-Means Clustering을 활용한 냉수대 발생 분포에 관한 연구

        김범규(Bum-Kyu Kim),윤홍주(Hong-Joo Yoon),이준호(Jun Ho Lee) 한국전자통신학회 2021 한국전자통신학회 논문지 Vol.16 No.2

        본 연구에서는 한국 남동해역에 발생하는 냉수대의 공간적인 분포를 구분하기 위해 2016 ∼ 2018년의 고리, 양포의 해양 관측 부이 수온자료와 GHTSST Level 4 재분석 해수면 온도자료를 K-means clustering 기법을 활용하여 분석하였다. 부이자료는 남동해역에서 고리와 양포 지점의 수온변화 및 냉수대 발생을 파악하기 위해 활용하였다. 그 결과 냉수대 발생 시점에 고리와 양포의 수온이 동일하게 감소하였다. 이에 냉수대 발생시 SST의 변화를 보기 위해 수온의 역수와 SST의 분산을 비교하였다. 수온이 변화하는 시점에 SST의 분산도 증가하는 것을 나타내었는데 이를 통해 냉수대 발생시 해역의 SST의 수온분포에 변화가 있다는 것을 알 수 있었다. 냉수대 발생해역을 분류하기 위해 K-means clustering을 활용하였다. Elbow 기법을 활용하여 분류를 위한 최적의 K값을 찾아낸 후 분류를 진행한 결과 연안의 차가운 해수가 존재하는 지역을 찾아낼 수 있었다. 이를 통해 냉수대 발생해역의 공간적인 분포 및 확산범위를 추정하여 향후 냉수대로 인한 피해 파악 및 공간적인 확산 예측연구에 활용할 수 있을 것이라 판단된다. In this study, in order to analyze the spatial distribution of cold water occurred in the Southeast Sea of Korea, the K-means clustering method was used to analyze the ocean observatory buoy of Gori and Yangpo and GHTSST Level 4 from 2016 to 2018. The buoy data was used to identify the change in sea water temperature and the cold water occurrence at Gori and Yangpo in the Southeast Sea. As a result, the sea water temperature of Gori and Yangpo decreased equally at the cold water occurrence. Therefore, the reciprocal of the sea water temperature and the variance of SST were compared to see the changes of SST when the cold water occurs. When the reciprocal of the sea water temperature increases, the dispersion of SST also increases. Through this, it can be seen that there is a change in the water temperature distribution of SST in the sea when the cold water occurs. After that, K-means clustering was used to classify the cold water. After analyzing the optimal K value for clustering by using the Elbow method, it was possible to classify a region with cold water. Through this, it is estimated that the spatial distribution and diffusion range of the cold water, and it can be estimated and used in future studies to identify damage caused by the cold water and predict spatial spread.

      • Clustering Amelioration and Optimization with Swarm Intelligence for Color Image Segmentation

        Kiranpreet,Prince Verma 보안공학연구지원센터 2015 International Journal of Database Theory and Appli Vol.8 No.5

        Cluster examination is data mining task for the assignment of collection a set of items in such a path, to the point that questions in the same gathering (called a cluster) are more like one another than to those in different gatherings (clusters). K-means grouping is a technique for group investigation which intends to parcel n perceptions into k groups in which every perception fits in with the cluster with the closest mean. This paper, decided the aftereffect of standard parameter estimations of shading picture division with k-means and the modified k-means with ABC and ACO algorithms. The paper demonstrates that division of color picture with modified k-mean consolidated with swarm Intelligence calculations for color image segmentation gives preferable results over simple k-means and Modified k-means with Ant colony optimization gives better results than modified k-means with Artificial bee colony.

      • KCI등재

        Improved K-means Clustering Algorithm based on Dynamic Clustering

        Jennefer Mononteliza 사단법인 미래융합기술연구학회 2020 아시아태평양융합연구교류논문지 Vol.6 No.4

        Cluster analysis can find not only potential and valuable structured information in the data set, but also provide pre-processing functions for other data mining algorithms, and then can refine the processing results to improve the accuracy of the algorithm. Therefore, cluster analysis has become one of the hot research topics in the field of data mining. K-means algorithm, as a clustering algorithm based on the partitioning idea, can compare the differences between the data set classes and classes. We can use the K-means algorithm to mine the clustering results and further discover the potentially valuable knowledge in the data set. Help people make more accurate decisions. This paper summarizes and analyzes the traditional K-means algorithm, summarizes the improvement direction of the K-means algorithm, fully considers the dynamic change of information in the K-means clustering process, and reduces the standard setting value for the termination condition of the algorithm to reduce The number of iterations of the algorithm reduces the learning time; the redundant information generated by the dynamic change of information is deleted to reduce the interference in the dynamic clustering process, so that the algorithm achieves a more accurate and efficient clustering effect. Experimental results show that when the amount of data is large, compared with the traditional K-means algorithm, the improved K-means algorithm has a greater improvement in accuracy and execution efficiency.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼