RISS 학술연구정보서비스

다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      • 무료
      • 기관 내 무료
      • 유료
      • Robust estimation of Gaussian linear structural equation models with equal error variances

        Park Sion,Park Gunwoong 한국통계학회 2022 Journal of the Korean Statistical Society Vol.51 No.3

        This study develops a new approach to learning Gaussian linear structural equation models (SEMs) with equal error variances from possibly corrupted observations by outliers. More precisely, we consider the two types of corrupted Gaussian linear SEMs depending on the outlier type and develop a structure learning algorithm for the models. The proposed algorithm consists of two steps in which the effect of outliers is eliminated: Step (1) infers the ordering using conditional variances, and Step (2) estimates the presence of edges using conditional independence relationships. Various numerical experiments verify that the proposed algorithm is empirically consistent even when corrupted samples exist. It is further confirmed that the proposed algorithm performs better than the state-of-the-art US, GDS, PC, and GES algorithms in noisy data settings. Through the corrupted real examination marks data, we also demonstrate that the proposed algorithm is well-suited to capturing the interpretable relationships between subjects.

      • KCI우수등재

        방향성 그래피컬 모델을 이용한 미세먼지 이동 경로 추정

        박건웅(Gunwoong Park) 한국데이터정보과학회 2019 한국데이터정보과학회지 Vol.30 No.1

        본 연구의 목적은 베이지안 네트워크라고 불리는 방향성 비순환 그래피컬 모델(directed acyclic graphical model; DAG model)을 이용하여 서울시 미세먼지 (PM-10)의 이동 경로를 분석하는 것이다. 이를 위하여 연속형 자료들의 관계망을 찾을 수 있는 정규분포 방향성 비순환 그래피컬 모델 (Gaussian DAG model) 을 이용하였다. 모델의 학습방법으로는 제약 기반 접근법과 점수 기반 접근법을 모두 사용하는 혼합형 max-min hill climbing(MMHC) 알고리즘을 사용하였으며, 이를 통해 미세먼지의 이동 경로가 부분적으로 계절성 풍향과 일치함을 확인하였다. 우리 연구의 결과는 최근 서울시에서 고려중인 공기 정화탑 건설 사업에서 적절한 정화탑 위치를 선정하는데 도움이 될 것으로 기대한다. The main objective of this paper is to analyze the fine dust (PM-10) directed pathway in Seoul using directed acyclic graphical (DAG) models. In this paper, a Gaussian DAG model is applied which is one of the most widely used for recovering the underlying structure of multivariate continuous data. Among a number of constraint-based and score-based algorithms for learning directed graphs, we exploit the hybrid max-min hill climbing (MMHC) algorithm where both constraint-based and score-based approaches are applied. We verify through the 2017 Seoul fine dust data that our method is well suited for estimating the partial fine dust pathway where it is consistent to seasonal wind directions. We expect that the estimated fine dust pathway can be exploited for various fine dust reduction methodologies.

      • KCI우수등재

        타자들의 특성을 위한 포아송 방향성 비순환 그래피컬 모델

        박혜원(Hyewon Park),박건웅(Gunwoong Park) 한국데이터정보과학회 2019 한국데이터정보과학회지 Vol.30 No.4

        야구에서 단순 통계량을 가공하여 과학적으로 분석하는 세이버메트릭스 (sabermetrics) 분야의 중요성은 점차 강조되고 있다. 하지만 야구 통계량들이 이루는 인과 및 상관 관계 자체에 대한 연구는 상대적으로 많이 이루어지지 않고 있다. 따라서 본 연구에서는 통계량들의 확률적 의존관계를 모델링할 수 있는 베이지안 네트워크 (bayesian network) 또는 방향성 비순환 그래피컬 모델 (directed acyclic graphical models; DAG models)을 이용하여, 타자 관련 통계의 직·간접적인 관계망을 찾는 데 초점을 맞추었다. 이를 위하여, 다변량 가산 자료의 인과관계망을 보여줄 수 있는 포아송 방향성 비순환 그래피컬 모델을 이용하였다. 이를 통해 지표간의 관계를 이용한 새로운 관점의 타자 능력 지수 혹은 세이버메트릭스 통계량을 찾기를 기대한다. In baseball, the sabermetrics has been more important which measures the performance of baseball players in a refined way. However, many works focus on a new measure of player’s overall performance without considering the relationships between baseball statistics. Hence, the main objective of this study is to find a direct or causal network of batter’s statistics using a Bayesian network or a directed acyclic graphical (DAG) model that models the probabilistic dependencies of statistics. Since the baseball statistics we consider are multivariate count data, we applied the Poisson directed acyclic graphical model and we also applied the ODS algorithm to learn the players’ batting statistics networks. We expect to find a new perspective of hitter ability index or sabermetrics using the relationship between indicators.

      • KCI등재

        복합미생물을 이용한 폐패각 소멸 처리

        방건웅(GunWoong Bahng),박현(Hyun Park),서명희(Myung Hee Suh),홍한의(Hany Hong) 대한환경공학회 2021 대한환경공학회지 Vol.43 No.8

        목적: 우리나라는 세계적인 수산물 생산/소비국가로서 굴을 포함한 조개류도 예외는 아니다. 굴은 국내 양식산업에서 단일 품종으로는 가장 큰 비중을 차지한다. 생산량은 매년 평균 30만 톤 이상이다. 문제는 굴을 채취한 다음에 발생하는 굴 껍데기로서 28만 톤 이상에 이른다. 이 가운데 70% 정도는 재활용되고 있으나 남는 껍데기가 6만톤 이상이 되어 악취, 수질 오염 등의 심각한 환경 문제를 유발하고 있다. 이 문제를 해결하기 위하여 일부 지자체에서 미생물을 이용하는 방법을 검토하고 있으나 악취를 제거하는 수준에 머물고 있을 뿐 굴 껍데기 자체를 소멸시키지 못하고 있다. 본 연구에서는 기존의 단일종 미생물이 아닌 복합미생물을 이용하여 굴 껍데기 소멸처리 문제를 해결하고자 시도하였다. 방법: 국내에서 음식물류 폐기물 처리 장치로는 최초로 Q 마크를 받은 장비를 이용하였다. 굴 껍데기와 음식물류 폐기물을 1:1로 혼합하여 투입한 다음에 복합미생물을 이용하여 80℃의 높은 온도에서 분해 소멸 처리를 하였다. 복합미생물은 호기성 미생물 및 혐기성 미생물들을 포함하는 다양한 토양 미생물들이 하나의 활성화된 공생 관계의 생태계를 이루도록 제조하여 강력한 분해 상승효과가 얻어지도록 하였다. 결과 및 토의 : 실험 결과 음식물류 폐기물에서 오는 유기성분을 분해하려면 최소 48시간 이상 처리하여야 하는 것으로 나타났으며 유기성분이 분해된 다음 굴 껍질이 조각 형태로 남는 것으로 나타났다. 처리된 시료의 주성분은 탄산칼슘으로서 아라고나이트와 캘사이트로 확인되었다. 복합미생물의 구성을 분석한 결과 초기에는 주로 Firmicutes이었으나 실험 시작 29시간 후에는 Proteobacteria가 절반을 차지하였고, 77시간이 지나면서 Firmicutes A로 바뀌었다. 72시간 만에 유기성 성분은 모두 분해되고 투입 중량 대비 10% 이하로 감소되었다. 음식물쓰레기중 유기성분을 분해하기 위해서는 최소 48시간 이상의 처리가 필요하며, 유기성분이 분해된 후 굴 껍질이 미세한 입자로 변하는 것으로 나타났다. 입자의 주성분은 탄산칼슘으로서 아라고나이트와 방해석으로 확인되었다. 결론: 패각의 주성분이 탄산칼슘이고 탄산칼슘이 생석회와 이산화탄소로 분해되는 온도가 약 800℃임을 감안할 때, 패각의 중량 감소 결과는 기존의 열분해 기전으로 설명하기 어렵다. 복합미생물에 의한 새로운 패각 분해 기전에 대한 탐색이 필요하다. Objectives : Korea is a global aquatic product producer/consumer country, and shellfish including oysters are no exception. Oysters occupy the largest proportion as a single variety in the domestic aquaculture industry. The production volume reaches an average of more than 300,000 tons per year. The oyster shells left after harvesting oyster is reaching over 280,000 tons/yr. About 70 % of these are recycled, but the remaining shells which are over 60,000 tons, causing serious environmental problems such as odor and water pollution. In order to solve this problem, some local governments investigated the possibility of applying microorganisms, but it was effective only to remove odors and it was not possible to decompose the oyster shell itself. In this study, an attempt was made to solve the problem of waste shell decomposition by using multi-complex microorganisms rather than microorganisms composed of a few species. Methods : As a waste food extinction facility in Korea, the first certified Q mark equipment was used. After mixing oyster shells and food wastes in a 1:1 ratio, they were subjected to decomposition and extinction treatment at a high temperature of 80 ℃ using multi-complex microorganisms. Multi-complex microorganisms are composed of various soil microorganisms, including aerobic and anaerobic microorganisms. They are in an activated ecosystem by forming a symbiotic relationship to obtain a strong decomposition synergistic effect. Results and Discussion : The composition of complex microorganisms was mainly Firmicutes at the beginning, but Proteobacteria accounted for a half after 29 hours from the start of the experiment, and after 77 hours, it was shifted to Firmicutes A. All-organic components were decomposed within 72 hours, and the shell was changed to a powder form, and the total weight was reduced to less than 10% of the input total weight. It was found that treatment for at least 48 hours was required to decompose organic components from food waste, and after the organic components were decomposed, oyster shells were transformed into fine particles. The main components of the particles were calcium carbonate, which was identified as Aragonite and Calcite. Conclusions : Considering that the main component of the shell is calcium carbonate, and the temperature at which calcium carbonate is decomposed into quicklime and carbon dioxide is around 800 ℃, the result of weight loss of the shell is difficult to explain with the existing thermal decomposition mechanism. It is necessary to explore further a new possible mechanism of shell decomposition by complex microorganisms.

      • KCI등재

        Asymptotic bias of the ℓ _2-regularized error variance estimator

        Choi Semin,Park Gunwoong 한국통계학회 2024 Journal of the Korean Statistical Society Vol.53 No.1

        This study considers the ℓ_2-regularized error variance estimator, an effective tool for non-sparse linear models. Specifically, this study investigates previously unex- plored theoretical properties of this estimator, particularly its asymptotic bias in high dimensional settings where the number of variables increases with increase in the number of observations. This study proves that the estimator is asymptotically unbiased in large-sample settings (lim p∕n < 1), while it is asymptotically biased in general ultra-high dimensional settings (lim p∕n > 1). Specifically, the asymptotic bias of the ℓ_2-regularized estimator in ultra-high dimensional settings is accurately derived where the covariates are independent.

      • KCI우수등재

        사전 지식을 이용한 가우시안 선형 구조 방정식 학습

        김영환(Youngwhan Kim),김예술(Yesool Kim),박건웅(Gunwoong Park) 한국데이터정보과학회 2020 한국데이터정보과학회지 Vol.31 No.4

        베이지안 네트워크를 이용한 변수간 방향성 관계 추론은 모집단에서 조차 불가능하다고 알려져 있었으나, 최근 연구에서 오차의 분산을 이용하여 가우시안 선형 구조방정식의 식별가능함을 증명하였다. 하지만 제안된 식별성 조건은 다양한 형태의 변수를 가진 데이터에서는 만족하기 어렵다. 따라서 본 연구에서는 사전 지식을 활용하여 모델 식별성 가정이 만족하지 않더라도 가우시안 선형 구조 방정식을 학습하는 방법을 제안한다. 제안하는 알고리즘은 첫번째로 인과 및 방향성 관계를 알고 있는 노드 그룹과 모르는 노크 그룹을 나누고, 두번째로 모르는 노드 그룹에서의 오더링을 불확실성 점수로 학습하고, 마지막으로 조건부 독립관계를 통하여 변수간 방향성 선이 존재하는지 파악한다. 다양한 모의실험을 통하여 본 연구에서 제안한 방법이 기존의 선형 구조 방정식 학습에 쓰이는 Uncertainty Scoring (US), Greedy DAG Search (GDS), Linear non-Gaussian Models (LINGAM) 알고리즘들과 일반적인 방향성 비순환 그래피컬 모델 학습에 쓰이는 PC, Greedy Equivalent Search (GES) 알고리즘들보다 평균적으로 더 정확하게 그래프를 추정하는 것을 확인하였다. 마지막으로 실제 2014 - 2019년 부동산 거래 데이터에 적용하여 해석 가능한 변수간 관계를 찾는 것을 확인하였다. Learning Bayesian network remains an open challenge due to non-identifiability. Recent work proves that a Gaussian linear structural equation model can be identifiable using its error variances. However, the proposed model identifiability condition may not be satisfied for some data sets with different types of variables. In this work, we provide a new algorithm for learning Gaussian linear structural equation models using prior information, when the model identifiability conditions are not satisfied. The proposed method consists of three steps; (i) find the set of nodes of which causal and directional relationship are known; (ii) learn the ordering using uncertainty scores; and (iii) estimate directional edges using conditional independence tests. We verify through diverse numerical experiments that the proposed method performs better than the state-of-art Gaussian linear SEMs learning US, GDS, and LINGAM algorithms, and partial graph learning PC and GES algorithms. Lastly, the proposed algorithm is applied to real 2014 - 2019 real estate transaction data and finds explainable relationships between variables.

      • KCI등재

        서울 공공자전거 신규 대여소를 위한 수요량 예측 분석

        김예술,박시온,박건웅,Kim, Yesool,Park, Sion,Park, Gunwoong 한국통계학회 2020 응용통계연구 Vol.33 No.6

        Seoul public bike program facilitates access to bicycles and offers potential for greater mobility and health for users. Furthermore, it would have positive impacts on transport congestion, energy use, and the environment. Hence, it is important to find future rental locations by taking to account both bike-demand and regional imbalance. This paper first finds eligible candidates of rental locations with the required spatial conditions such as a sufficient sidewalk width and accessibility of bike pick-up vehicles. And then, estimates public bike daily usage for each selected location via random forest based on Seoul public bike historical usage, Seoul geographical features, regional characteristics, and populations. This study contributes to a better comprehension of the Seoul public bike program, and would be useful in determining new public bike rental locations. 서울시는 시민의 건강 증진과 이산화탄소 저감을 통한 저탄소 녹색성장 실현을 목표로 2015년부터 2020년 현재까지 공공자전거 대여소를 확장하고 있다. 매년 공공자전거에 대한 시민들의 접근성과 이용률이 증가하고 있으며, 이에 서울시는 수요와 접근성을 모두 고려한 공공자전거 대여소 신규 입지를 확장하고자 노력하고 있다. 공공자전거 대여소 위치는 주변 지형지물에 영향을 받으며, 수요량은 지역적 특성에 영향을 받으므로 이들을 고려한 신규 대여소 입지를 선정해야 할 필요성이 있다. 따라서 본 연구는 서울시 공공자전거의 새로운 입지 선정을 위하여 2019년 서울시 공공자전거 데이터와 지리정보체계, 대중교통, 인구 등의 데이터를 전처리하여 신규 대여소 거치가 가능한 장소를 선별하고, 랜덤 포레스트를 이용하여 신규 대여소의 이용량을 예측하였다. 이를 바탕으로 평균 경사도, 대중교통과의 거리, 특화 시설과의 거리, 하천과의 거리 등이 자전거 이용량에 영향을 미치는 주요한 요소임을 도출할 수 있었다. 본 결과는 신규 대여소 설치 지역을 결정하는데 객관적인 통계적 지표가 될 것으로 기대한다.

      • KCI등재

        Learning-to-rank 기법을 활용한 서울 경마경기 순위 예측

        정준형,신동욱,황세용,박건웅,Junhyoung Chung,Donguk Shin,Seyong Hwang,Gunwoong Park 한국통계학회 2024 응용통계연구 Vol.37 No.2

        This research applies both point-wise and pair-wise learning strategies within the learning-to-rank (LTR) framework to predict horse race rankings in Seoul. Specifically, for point-wise learning, we employ a linear model and random forest. In contrast, for pair-wise learning, we utilize tools such as RankNet, and LambdaMART (XGBoost Ranker, LightGBM Ranker, and CatBoost Ranker). Furthermore, to enhance predictions, race records are standardized based on race distance, and we integrate various datasets, including race information, jockey information, horse training records, and trainer information. Our results empirically demonstrate that pair-wise learning approaches that can reflect the order information between items generally outperform point-wise learning approaches. Notably, CatBoost Ranker is the top performer. Through Shapley value analysis, we identified that the important variables for CatBoost Ranker include the performance of a horse, its previous race records, the count of its starting trainings, the total number of starting trainings, and the instances of disease diagnoses for the horse.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료
