RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 학위유형
        • 주제분류
          펼치기
        • 수여기관
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 지도교수
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 치안 텍스트 데이터를 활용한 머신러닝 기반의 유사도 분석 및 토픽 모델링 연구

        김용진 과학기술연합대학원대학교 2021 국내석사

        RANK : 248686

        According to the Korea National Statistical Office's social survey, the "crime occurrence" factor was selected in 2016 and 2018 as the social factor that the public feels the most anxious. Total crime occurrence and major indicator crime occurrence statistics show that total crime occurrence, violent crime, and theft crime are decreasing, but violent crime and intelligent crime are increasing. As a way to improve policing, a new policing system is needed that can respond to changes in the times other than the increase in the number of police officers. According to recent overseas policing activities, it is attempting to introduce a smart policing system that combines ICT technology with existing policing activities such as FredPol of the U.S., HART of the U.K., and Tian Wang(天網) of China. For smart policing technology research, research based on police data should be conducted, but due to the nature of the data, it is not publicly available, and data handling is limited, so research has not been actively conducted. The purpose of this study was to analyze textual data from police fields and to research machine learning-based natural language processing for use in police action, response, and criminal investigation. There are two types of police data used in the study: 112 emergency report data and KICS virtual data, respectively. Through a study based on 112 emergency report data, similarity search among 112 emergency report case types and 112 emergency report potential case types were analyzed, and similar crime estimation and search technology based on crime facts was studied through a study based on KICS virtual data. The study of similarity search between 112 emergency report case types is based on the report content and report type at the time of 112 emergency reports, expressed in TF-IDF Document Term Matrix, a count-based vector expression method, and through the t-SNE dimension reduction method After visualizing the types in the vector space, cluster analysis between types through K-means++ was performed to search for similarities between 112 emergency report case types. 112 emergency report potential case types analysis was analyzed through the LDA's Topic Modeling method based on data of type 'None' at the time of receipt of 112 emergency reports, which was not classified into a particular type, and a new potential event type was studied due to changes in the crime environment. The study of similar crime estimation and search technology based on crime facts is conducted by creating a word embedding model (Word2Vec, Doc2Vec, FastText, GloVe) using KICS virtual data, and measuring the similarity based on Cosine Similarity and Word Mover's Distance in the created word embedding model. The performance of each word embedding model and similarity measurement method was compared. Based on the performance results, models and methods were selected to establish a similar crime estimation and search system. The results of this study will help to explore the scope of initial response when receiving 112 emergency reports, and to derive potential event types for 112 emergency reports to contribute to improving 112 report reception and improving 112 emergency report data quality. It is also expected to be based on the establishment of an efficient criminal investigation system based on the research of similar crime estimation technology. 통계청 사회조사 결과 국민이 가장 불안함을 느끼는 사회적 요인으로 ‘범죄발생’ 요인이 2016년과 2018년에 선정되었다. 총 범죄 발생 및 주요지표범죄 발생비를 보면 총 범죄 발생과 폭력범죄, 절도범죄는 감소하고 있지만, 강력범죄와 지능범죄의 경우 증가하고 있는 추세이다. 치안력 증대를 위한 방법으로 경찰관 수 증원 이외의 시대 변화에 대응할 수 있는 새로운 치안활동 시스템이 필요하다. 최근 해외 치안 활동을 살펴보면 미국의 프레드폴(Pred Pol), 영국의 HART, 중국의 톈왕(天網) 등 기존 치안 활동에 ICT기술을 융합한 스마트치안 시스템의 도입을 시도하고 있다. 스마트치안 기술 연구를 위해 치안데이터를 기반으로 한 연구가 이루어져야 하지만 데이터 특성 상 공개되어 있지 않고, 데이터 취급에도 제한이 많아 활발한 연구가 이루어지지는 못하였다. 본 연구는 치안현장에서 발생한 텍스트 데이터를 분석하여 경찰의 현장출동 및 대응 그리고 범죄 수사 등에 활용하기 위한 머신러닝 기반의 자연어처리 연구를 목적으로 하였다. 연구에 사용된 치안데이터의 종류는 총 2가지로 각각 112신고 데이터와 KICS 가상데이터이다. 112신고 데이터를 기반으로 한 연구를 통해 112신고 사건유형 간 유사도 탐색과 112신고 잠재적 사건유형을 분석하였고, KICS 가상데이터를 기반으로 한 연구를 통해 범죄사실 기반의 유사범죄 추정 및 탐색기술을 연구하였다. 112신고 사건유형 간 유사도 탐색 연구는 112신고 접수 당시 신고내용과 신고유형을 바탕으로 카운트 기반의 벡터표현 방법인 TF-IDF Document Term Matrix로 표현하고, t-SNE 차원축소 방법을 거쳐 112신고 사건유형을 벡터공간에 시각화를 한 후 K-means++를 통하여 유형 간 군집분석 하여 사건유형 간 유사도를 탐색하였다. 112신고 잠재적 사건유형 분석은 112신고 접수 시 신고내용이 특정 유형으로 분류되지 않은 ‘None’ 유형의 데이터를 수집한 후, LDA기반의 토픽모델링 분석을 하여 범죄 환경변화에 따른 새로운 잠재적 사건유형 도출 방법을 연구하였다. 범죄사실 기반의 유사범죄 추정 및 탐색기술 연구는 KICS 가상데이터를 사용하여 워드 임베딩 모델(Word2Vec, Doc2Vec, FastText, GloVe)을 만들고, 만들어진 워드 임베딩 모델에 Cosine Similarity와 Word Mover’s Distance 기반의 유사도를 측정하여 각각 워드 임베딩 모델 및 유사도 측정 방법 간 성능을 비교하였다. 성능 결과를 바탕으로 모델 및 방법을 선정하여 유사범죄 추정 및 탐색 시스템을 구축하였다. 본 연구 결과를 통해 112신고 접수 시 초동 대응범위 탐색에 도움을 주고, 112신고의 잠재적 사건 유형을 도출하여 112신고 접수 업무의 개선과 112신고 데이터 품질향상에 기여 할 것이다. 또한, 유사범죄 추정 기술 연구를 바탕으로 효율적인 범죄 수사 시스템 구축에 기반이 될 것이라 기대한다.

      • 주제어 유사도 분석에 기반한 협업문서 생성제어 시스템 구현

        조성웅 전남대학교 대학원 2003 국내석사

        RANK : 248623

        인터넷에서의 공동작업과 지식정보 공유를 보다 쉽고 효율적으로 하기위해 시간과 공간을 초월하는 동적인 협업시스템이 필요하게 되었다. 현재까지 구축되어진 협업시스템들로는 BSCW(Basic Support Cooperative Work), GIA(Group Interaction) System, Open Meeting System과 WIKI System 등이 있다. 이러한 협업시스템 중에서 웹 저작 도구인 WIKI system은 연구원들 간의 자유스러운 정보교환을 보장하는 협업공간을 제공함으로써 지식정보의 생산성을 극대화 시킨다. 하지만 정보량이 방대해짐에 따라 시스템에 존재하는 문서와 유사한 신규문서의 생성에 어떠한 규제가 없기 때문에 공통된 주제의 문서가 다중 생성됨으로써 정보 공유의 힘이 분산되는 문제점을 발생시킨다. 본 논문에서는 이러한 문제를 해결하기 위해서 협업문서 생성제어 시스템을 제안하여 구현 하였다. 제안한 시스템은 파서(parser), 문서 분류시스템, 유사성 측정시스템으로 설계되어, 신규 협업문서에 대해 적절한 주제어를 도출하고, 기존의 협업문서와의 유사도 평가를 통해 불필요한 별도의 협업 문서 집단이 생기는 것을 방지함으로써 주제의 분산을 줄여 정보 공유의 힘이 분산되는 것을 방지하여 각 분야의 전문가들의 원활한 정보공유와 지식창출을 효과적으로 할 수 있게 하였다. To do cooperative work and share information more effectively on the Internet, the need for a dynamic collaboration system has been increased. There are BSCW[Basic Support Cooperative Work], GIA(Group Interaction) SYSTEM, The Open Meeting and WIKI in currently developed collaboration systems. Among such systems, WIKI, a Web authoring tool, maximizes the productivity of knowledge information by providing collaboration space to ensure efficient information exchange between researchers. Because there is no restriction in creating the new document which is similar to a previously created document, WIKI produces multiplicate documents with the same topic. This causes the power of information sharing to deconcentrate. In this thesis, we propose a creation control system for collaboration documents to solve such a problem. The proposed system is composed of parser, document classification module and similarity estimation module. It extracts appropriate keywords and estimates the similarity to previous collaboration documents. By showing the order list of duplicate documents, we prevented users from creating unnecessary documents and condensed the power of information sharing.

      • BERT와 LDA 토픽 모델링을 활용한 국방이슈 분석 : ‐ 국방혁신 4.0 중심으로

        박두홍 국방대학교 국방대학교 국방관리대학원 2024 국내석사

        RANK : 248620

        “국방혁신 4.0”은 현재 정부의 국방개혁 계획이다. 국방혁신 4.0 기본계획은 여러 차례에 걸친 회의와 세미나를 통해 발전되어 2023년 3월 3일에 대통령으로부터 최종 재가를 받았다. 동 기본계획은 “ ‘국방개혁에 관한 법률’에 근거하여 작성한 국방기획체계 상의 기획문서로서 국방기획지침, 합동군사전략서, 합동군사전략목표기획서 및 국방중기계획서 작성에 기준을 제공하며, ‘19년에 발간된 「국방개혁2.0 기본계획」을 대체한다.” [3] 본 논문에서는 “국방혁신 4.0”이 일반 언론보도에서는 어느 정도 이슈가 되고 있고, 영향을 미치고 있는지를 중점적으로 다루었다. 이를 위해, 현 정부에서 처음으로 “국방혁신 4.0”을 공식 발표한 국정과제 발표일을 기준으로 이전과 이후의 각각 1년 동안 국방 관련 기사를 수집하였고, “국방혁신 4.0” 기본계획 토픽 모델링을 하기 위해 국방부 홈페이지 보도자료의 「국방혁신 4.0 기본계획」 발표에 첨부된 한글 문서를 데이터셋으로 구성하였다. 수집된 데이터셋을 대상으로 KeyBERT 모델을 사용하여 키워드 집합을 추출하였고, 이 키워드를 기반으로 LDA(Latent Dirichlet Allocation) 토픽 모델링을 사용하여 국정과제 발표 전과 후의 국방 이슈 토픽들이 무엇인지와 국방혁신 4.0 기본계획에 대한 토픽을 분석하였다. 더 나아가, “국방혁신 4.0” 기본계획의 핵심 내용과 국정과제 발표 이전 및 이후 국방 이슈 토픽과의 유사도를 비교하기 위해 BERT 기반 모델을 사용하였다. 이를 통해 민간 언론에서 관심이 높은 국방 관련 주요 이슈들이 무엇인지 국정과제 발표 전과 후를 구분하여 알 수 있었다. 또한, 국정과제 발표 전후로 어떻게 관심 토픽이 변화되었는지, 그리고 “국방혁신 4.0”에 대한 민간 언론사의 국방분야 관심도가 높아지고 있다는 유의미한 결과를 분석할 수 있었다. Defense Innovation 4.0 is the current government’s defense reform plan. In this paper, we focused on how much impact Defence Innovation 4.0 had on news. To achieve this, first we collected defense-related articles for one year before and after the announcement of the national polisy agenda. Then we extract the keyword sets of the article using the KeyBERT model. Based on these keywords, we analyze how major defense issues changed using Latent Dirichlet Allocation (LDA) topic modeling. In addition to analyzing how major defense issues changed using LDA topic modeling and conducting a SentenceBERT-based similarity comparison with the core content of the Defense Innovation 4.0 master plan. Through our research, we seek to gain valuable insights into how Defense Innovation 4.0 has influenced the discourse around defense-related topics within the media landscape.

      • 속성과 가중치를 적용한 악성코드 유사도 분석

        정용욱 전남대학교 대학원 2013 국내박사

        RANK : 232318

        과거에는 전문적인 지식과 기술력을 투자하여 자체적으로 제작?유포 되던 악성코드가, 현재는 악성코드 생성기(malware generator)만 사용하면 누구나 원하는 기능의 악성코드를 쉽게 제작할 수 있게 되어 악성코드가 보다 빠르게 유포되고 있다. 즉, 그룹화 된 악성코드 생성기를 이용하여 기존 안티바이러스(anti-virus)에서 보유한 악성코드의 스트링(string)을 변경하고 공격 기능을 강화시켜 배포할 수 있게 되었다. 오늘날 대부분의 악성코드들이 최초 공개된 소스(source)에 기반을 두어 그 감염 방법과 증상들이 다양해지는 악성코드로 발전하고 있다. 기존 유사도 비교 방법에서 사용되는 기준 또는 속성(attribute)만을 이용했을 경우, 새로운 악성 스트링에 대한 미탐율이 증가하는 문제점이 발생한다. 또한, 안티바이러스 업체에서 운영하는 악성코드 자동분석시스템의 1차적 스트링 기반 검색을 거친 이후 2차적으로 휴리스틱 규칙(heuristic rule) 기반 행위를 분석하는 과정에서 오탐율이 증가하는 문제를 안고 있다. 본 논문에서는 위와 같은 문제점을 개선하기 위하여 유사도 관련 연구를 통해 다양한 악성코드 속성을 선정하고, AHP(Analytic Hierarchy Process) 기법을 반영한 속성별 가중치를 적용하여 악성코드의 종류를 점수화하여 표현한다. 이어서, 알려진 전체 악성코드 데이터(MD: Malware Data)와 정상 데이터(AD: Average Data))에 대한 유사도 비교를 통하여 탐지율과 오탐율을 측정한다. 구해진 값으로 ROC(Receiver-Operating Characteristic curve) 그래프를 작성하고 악성코드에 대한 탐지율이 높으면서 오탐율이 낮은 최적지점을 임계치로 선정한다. 선정된 임계치로 새로운 실험 데이터(TD: Test Data)와 악성코드 생성기 그룹의 유사도를 비교하여 해당하는 악성코드 그룹으로 분류되도록 한다. 결과적으로, 본 논문에서는 원형 악성코드 생성기에서 제작되어 유포된 변종 악성코드를 식별하고 분류하는 방법을 제안한다. 본 연구를 통하여, 새로운 악성코드에 대한 불필요한 분석시간을 최소화하고 악성코드 자동분석시스템에서 탐지가 어려운 변종 악성코드를 악성코드 생성기 그룹으로 분류함으로써, 향후 변종 악성코드의 정확한 식별 및 행위 예측에 활용될 수 있기를 기대한다.

      • 머신러닝 기법을 적용한 통일 후 북한 도시 토지이용 변화 시뮬레이션

        원석환 경희대학교 대학원 2018 국내박사

        RANK : 232300

        본 연구의 목적은 시뮬레이션 분석을 통한 통일 이후 북한 지역의 도시 토지이용 변화를 추정하는 것이다. 통일이라는 발생하지 않은 이벤트를 가정하여 북한 도시의 토지이용 변화를 추정하였다. 통일의 방법은 현재 남한 체제와 동일한 자유민주주의 시장경제 체제로의 통일을 가정하며, 통일 이후의 북한은 남한의 과거 도시 토지이용 변화 패턴과 유사할 것으로 가정한다. 따라서 도시 유사도 분석 결과 탐색된 북한의 도시는 공간적으로 가장 유사한 과거 남한의 도시 토지이용 변화 패턴으로 변화가 발생할 것이라는 가정으로 연구를 진행하였다. 본 연구는 크게 도시 유사도 분석과 도심화 패턴을 적용한 시뮬레이션 분석으로 구분할 수 있다. 도시 유사도 분석은 1980년대 기준의 남한 도시와 2015년 기준의 북한 도시 중 공간적으로 유사한 도시를 탐색하는 분석이다. 이러한 도시 유사도 분석을 위해서 통계분석 방법 중 다양한 특성을 지닌 관찰 대상을 유사성을 바탕으로 유사한 집단으로 분류하는 방법인 군집분석을 시행하였다. 도시 유사도 분석은 원격탐사 기법과 지리 정보 시스템을 활용한 공간분석, 통계분석 기법을 접목한 분석 방법이라고 할 수 있다. 분석 결과, 2015년 기준 북한의 남포특별시와 1980년대 기준 남한의 인천시가 가장 유사한 도시 유사도를 나타냄을 확인할 수 있었다. 따라서 본 연구는 북한의 남포특별시를 기준으로 통일 이후 도시 토지이용 변화 시뮬레이션을 위한 모델의 근간을 인천광역시의 토지이용 변화 패턴으로 설정하여 모델을 구축하였다. 시뮬레이션 분석은 도심화 패턴 탐색을 위한 모델 적합도 연구와 시뮬레이션 결과에 따른 유효성 검증, 향후 북한 도시의 토지이용 변화 시뮬레이션 분석으로 구분된다. 도심화 패턴을 가장 유의성 높게 반영하는 모델을 선정하기 위해서 통계 분석의 일종인 다항 로지스틱 회귀분석과 머신러닝의 일종인 의사결정나무, 서포트 벡터 머신 알고리즘을 활용한 분석을 통해 토지이용 변화 추정 정확도를 비교 분석하여 도심화 패턴 탐색을 위한 모델링에 있어 적합한 방법론을 선정하였다. 유효성 검증이 진행된 적합한 모델을 선정하여 북한 도시 데이터를 적용하여 향후 북한 도시의 토지이용 변화 시뮬레이션 분석을 진행하였다. 시뮬레이션 분석은 지리 정보 시스템, 통계 분석, 머신러닝 기법을 접목한 분석 방법이라고 할 수 있다. 기존의 연구에서 진행되었던 토지이용 변화 요소에 대한 변수의 일부 추출 접근 방식이 아닌 다양한 공간변수와 각각의 토지이용 변화에 대한 규칙을 학습시켜 토지이용 변화에 대한 추정을 수행하는 머신러닝 기반 시뮬레이션 모델을 구축하였다. 이를 통해 시뮬레이션 단계 및 기준 토지이용별 추정 정확도가 가장 높은 모델을 결합한 시뮬레이션 통합 모델을 구축하였다. 통합 모델 구축에 활용된 알고리즘은 의사결정나무 알고리즘의 일종인 C5.0과 서포트 벡터 머신 알고리즘의 일종인 kernlab의 가우시안 방사형 기반 커널 알고리즘을 사용하였다. 해당 모델을 활용하여 북한 도시(남포특별시)의 시나리오별 토지이용 변화를 추정하였다. 남포특별시의 토지이용 변화 시뮬레이션 분석은 단계별 비포장도로의 일부의 포장화, 철도역 신설, 신규 도심지역 개발을 가정한 시나리오로 진행하였다. 신규 도심지역 개발은 선행연구에서 제안한 남포특별시의 개발가능 후보지 중 일부지역을 선정한 시나리오를 구성하였다. 분석 결과, 지역의 교통 접근성 변화와 신규 도심지역의 개발 영향은 해당 지역의 도심화는 물론이며 타 지역까지 연계되어 도심화 현상이 나타나게 되는 것을 확인할 수 있었다. 따라서 교통 시설의 신설과 신규 도심지역의 개발을 위한 정책 수립 단계에서 해당 지역의 발전과 함께 타 지역과의 도심 연계성을 고려하는 것이 중요할 것임을 고찰할 수 있었다. 통일은 우리 민족의 삶과 번영을 위한 국가적 과제이며 국토의 지속가능한 발전을 위해 달성해야 할 중요한 과제임을 인식하여, 통일 대비를 위한 다양한 학제 간 연구가 지속적으로 진행되어야 할 것이다. 이러한 관점에서 본 연구는 통일 한국 시대의 북한 도시화 현상을 미시적으로 추정하여, 향후 북한 도시의 개발 정책 수립 시 전략적인 대응을 할 수 있는 측면에서 연구의 의의를 지닌다. This study aims to estimate land-use changes in North Korea after the unification through simulation. The study assumed the unification under the free democracy and market economy regime. After unification, the patterns of land-use changes in North Korea's cities are expected to be similar to those in South Korea's cites in the past. This study is composed of urban similarity analysis and urbanization pattern-based simulation. Urban similarity analysis is used to find the similar cities in South Korea in 1980s to cities in North Korea in 2015. A cluster analysis, one of the statistical analysis methods, was conducted for the urban similarity analysis. The urban similarity analysis is a combine remote sensing, spatial analysis for geographic information system and statistical analysis. The results indicate that Nampo city in North Korea is the most similar to Incheon city in South Korea. Thus, the simulation model for Nampo city after the unification was implemented for reflect the land-use changes of Incheon city. The simulation analysis consists of exploration of urban patterns, validation of simulated results, and analysis of the land-use changes in North Korea's city in the future. The estimation accuracy of land use change was measured by polynomial regression analysis, decision tree analysis and support vector machine analysis. On this basis, suitable methodologies were selected for the modelling of the urban pattern search. The simulation analysis is a combine geographic information system, statistical analysis and machine learning techniques. The hybrid model uses the ‘C5.0’ a kind of decision tree algorithm and the ‘RBF kernel’ a kind of support vector machine algorithm. The land use change of North Korea's city(Nampo city) was estimated based on this model. The scenario of newly constructing roads and railroad stations, and developing new urban areas was used in the simulation. The simulated results showed that the urban sprawl impact through improvement of traffic accessibility and the development of new urban areas could be linked to the region and other regions. Therefore, it was showed that importance of consider development of region and connectivity with other regions in the establishment of the transportation facilities and the development of a new urban area. The unification is a national challenge for the nation's life and prosperity, and a vital task for the sustainable development of the land. Various interdisciplinary studies need to be conducted in preparation for the unification. From this perspective, this study estimated the urbanization of North Korea's cities at the micro-scale after the unification. This study provides a strategic guidance for policy making of the North Korea's cities in the future.

      • 회귀분석을 이용한 유사도 기반 구매시점 추천

        張銀實 동국대학교 대학원 2007 국내박사

        RANK : 232287

        As e-commerce has become more and more common, Internet shopping malls have increased rapidly. These cyber-malls must provide special, advanced services to their users as a part of active marketing strategies in order to survive in the e-commerce market. These services, however, have not included information on when customers can purchase the best products at the lowest price. In this regard, research that provides information on the best time to purchase must be performed so that consumers can purchase the best products at the lowest price. Most of the current research for price estimation regards the estimation of stock prices and research on the estimation of product prices for consumers in e-commerce is lacking. If Internet shopping malls can aid consumers in determining whether to purchase a product by providing consumers with information on when they can purchase products at a low price as well as providing product information for them, consumers will be more able and willing to access this kind of helpful information. In this study, methods for recommending a time to purchase products at a low price and a product recommendation system are proposed regarding this necessity. The proposed product recommendation system provides consumers with information on the point of purchase at a low price along with a wide range of information on the products the consumers intend to purchase. The flow pattern of dependent variables for products is analyzed to find information on the point of purchase. A product recommendation system including an agent for recommending the point of purchase, which informs the consumer of the most appropriate time to purchase products depending on changes in price patterns, is designed. The procedures and methods for finding information on the point of purchase from the agent are as follows: Firstly, patterns similar to the patterns of the selling price are searched for by using the selling price in the database on past sales records in order to determine changes in price patterns. Secondly, information is provided on the point of purchase, which helps consumers to determine whether or not to purchase products depending on changes in the patterns of future selling prices by analyzing those kinds of patterns based on the searched past price patterns. In this case, to estimate changes in the patterns of future selling prices, information regarding the point of purchase where weight is applied to factors affecting sales prices obtained by regression analysis is recommended. The similarity and regression analysis techniques used in this study have rarely been adopted in research for predicting the flow of sales prices in e-commerce; this study, therefore, fills this gap. The techniques of this study have the following strengths: Firstly, similarity is used mainly for time-series data queries. If sales information in e-commerce is approached by using similarities, quantitative measurement can be performed to improve reliability and accuracy. Secondly, regression analysis allows the analysis of causality by using both dependent and independent variables and to predict the future by measuring effects on independent variables. As a result of the performance test, it turned out that the shorter the window of the patterns for future sales prices, the higher the hit ratio of the recommended point of purchase. This means that the hit ratio of the recommended point of purchase is higher in the near future. The hit ratio of the patterns was high in the order of maintenance, decrease, and increase. When recommendations were made by applying weight to factors affecting the gradient or selling price, the cost of purchase was reduced by about 5% compared to when recommendations were made based on the basic information on patterns. This is expected to ensure convenience and efficiency for consumers in purchasing products from Internet shopping malls due to a reduction in the cost of the purchase. The technique of similarity using regression analysis proposed in this study will be applied to a variety of products--excluding used cars--in order to test its applicability. Also, the agent that has the function of recommending the point of purchase, the product recommendation system, and a system with preferences researched in the past will be studied.

      • 코사인 유사도를 이용한 사람과 강화학습 인공지능 게임플레이 분석

        허민구 호서대학교 대학원 2021 국내석사

        RANK : 232286

        최근, 사람 대신 인공지능 에이전트를 이용하여 게임 테스트를 자동화하는 연구가 관심을 끌고 있다. 본 논문은 게임 밸런싱 자동화를 위한 선행 연구로써 사람과 인공지능으로부터 플레이 데이터를 수집하고 이들의 유사도를 분석하고자 한다. 이때, 사람과 유사한 플레이를 할 수 있는 인공지능의 생성을 위해 학습 단계에서 제약사항을 추가하였다. 플레이 데이터는 10명의 사람과 특정 학습량마다 생성한 60개의 인공지능 모델을 대상으로 각각 10회 게임을 실시하여 획득하였다. 수집한 데이터는 코사인 유사도 방법으로 프레임별 위치, 액션 위치, 죽은 위치 방법으로 비교 분석했다. 사람과 인공지능을 비교하여 유사도가 0.9이상인 인공지능을 확인했다. 사람과 사람의 유사도를 확인하여 유사한 사람간의 집단을 만들어 사람집단과 유사도가 0.9 이상인 인공지능 에이전트를 찾을 수 있었다. Recently, research on automating game tests using artificial intelligence agents instead of humans is attracting attention. This paper aims to collect play data from human and artificial intelligence and analyze their similarity as a preliminary study for game balancing automation. At this time, constraints were added at the learning stage in order to create artificial intelligence that can play similar to humans. Play data was acquired by playing 10 games each for 14 people and 60 artificial intelligence models created for each specific amount of learning. The collected data were compared and analyzed with position per frame, action position, and dead position methods by cosine similarity method. By comparing human and artificial intelligence, we confirmed artificial intelligence with a similarity of 0.9 or higher. By checking the similarities between humans and humans, we were able to create a group of similar people and find an artificial intelligence agent with a similarity of 0.9 or higher.

      • 대통사지 출토 인장와의 제작흔 가시화 및 유사도 분석

        안소린 공주대학교 일반대학원 2021 국내석사

        RANK : 232284

        삼국유사에 기록된 대통사는 위치(웅천주), 연도(대통 원년), 목적(양제 기원)이 뚜렷한 사찰로, 백제의 불교 문화를 이해하는 중요한 위치에 있다. 그동안 연화문와당, 석조, 반죽동 당간지주 등을 통해 존재를 인지하고 있었으나 위치에 대해 정확히 밝혀진 바가 없었다. 일제강점기 가루베 지온에 의해 ‘大通’명 인장와가 발견된 이후 꾸준히 발굴조사가 진행되었으며, 최근 들어 반죽동 일대에서 대통사지 관련 발굴지가 대거 발견되었다. 특히 대통사지를 입증하는 ‘大通’명 인장와는 과거 수량이 부족하여 구체적인 연구가 진행되기 어려웠으나, 근래에 출토 수량이 늘어남에 따라 심층 연구의 필요성이 제기되었다. 대통사지 관련 인장와는 기초자료가 부족하며, 제작기법 분석을 위해 정밀한 형상자료가 필요한 상태이다. 따라서 이 연구에서는 3차원 고정밀 스캐닝을 진행하여 형상정보를 기록하였고, 제작흔 가시화 및 ‘大通’명 유사도 분석을 통해 기록화를 진행하였으며, 결과를 분석하여 인장와에 대한 아카이브를 구축하였다. 먼저 육안관찰, 분광측색계 및 실체현미경을 이용한 기재적 특징 조사를 실시하였다. 인장 형태는 원형 및 장방형으로 구분되며, 인장 글자는 ‘大’, ‘大通’, ‘大通寺’, ‘大通之寺’ 4종류로 확인되었다. 색도 측정 결과 L*은 44∼63, a*는 0∼14, b*는 3∼22 범위에 분포하였고, 반죽동 176번지는 다른 출토지에 비해 출토 인장와의 색도 범위가 넓은 편이었다. 실체현미경을 통해 인장와 표면에 흑색 및 갈색의 유리질 물질을 공통적으로 확인하였으며 크기는 불규칙적으로 분포하였다. 이러한 인장와를 대상으로 3차원 고정밀 스캐닝을 이용하여 평균 점간격 0.11㎜의 3차원 모델을 구축하였다. 각 인장와별로 디지털 형상 실측을 수행하였고, 선행연구에 따른 두께를 통해 크게 백제시대와 고려시대 기와로 구분되는 특징을 보였다. 대통사지 관련 인장와 18점에 4가지 렌더링 기술을 적용하여 10가지 제작기법을 뚜렷이 가시화하였다. 특히 육안으로 확인하기 어려운 흔적들 중 도구흔(NG-1)은 날카로운 도구로 인장 표면을 다듬은 흔적으로 재질이 목재일 가능성이 높으며, 타날흔(NB-1, HE-2)은 타날 후 물손질을 하고 남은 무문 타날로 판단되었다. 특히 원형 인장은 심도맵을 추가로 적용하여 세밀하게 관찰하였으며, 4가지 유형의 서체적 특징을 파악하였다. 특이하게도 유형 B 서체는 모든 ‘大通’명 인장와가 해당되었다. 가시화를 통해 인장와의 미세 형상 파악(곡률맵), 표면 요철 확인(노말맵), 글자 윤곽(AO맵), 압인 강도(심도맵) 등에 적합한 렌더링 방법을 발견하였다. 이러한 방법론은 기와뿐만 아니라 표면에 양·음각의 곡률이 있는 매장문화재의 형상분석에 활용 가능하며, 전통적인 가시화 방법(탁본)을 충분히 대체할 수 있는 기술로 판단된다. 3차원 스캐닝을 이용하여 획득한 3차원 형상정보는 사업 목적이 기록에만 집중되어 있어 활용도가 매우 낮은 상황이다. 이를 극복하기 위하여 인장와의 3차원 모델을 이용한 치수 분석과 시각화 및 정량분석을 시도하였고, 유사도 분석 결과 객관적이고 가시적인 유형 분류를 제안할 수 있었다. 치수 분석은 인장의 권선 및 글자 크기를 측정하였으며, 이를 기반으로 글자의 비율을 산출한 결과 ‘通’자에서 출토 위치에 따른 차이를 확인하였다. 이러한 결과는 시각화 분석을 통해 입체적인 관점으로 검증하였으며, 서체학적 특징이 동일한 8점의 ‘大通’명 인장와는 총 4개 유형으로 구분되었다. 유형 A(NG-1)는 권선과 글자가 가장 작은 특징을 지니며, 이는 국립 공주박물관에 소장되어 있다. 유형 B는 반죽동 176번지 출토 인장와(CH-1, CH-2, CH-4)로 권선과 글자가 중간 크기이며, 유형 C는 국립부여박물관 소장(NB-1, NB-2) 인장와로 권선과 글자가 가장 큰 특징을 보였다. 유형 D는 반죽동 197-4(HE-1, HE-2)에서 출토되었으며 완형인 글자가 없지만, 유사도 분석을 통해 ‘通’자 크기가 다른 유형임을 확인하였다. 유사도 분석 결과 선행연구와 달리 국립공주박물관 소장 인장와(NG-1)와 국립부여박물관 소장 인장와(NB-1, NB-2)는 권선 및 글자 크기 차이로 인해 다른 인장으로 압인된 것으로 판단되었다. 또한 국립부여박물관 소장 인장와 2점은 권선 크기와 출토 위치가 동일하여 같은 시기에 제작된 것으로 파악하였다. 이러한 인장와의 제작흔 가시화 및 유사도 분석 결과는 대통사지 출토 인장와의 기준데이터로써 의미가 있으며, 향후 다양한 출토 유물에 확대 적용된다면 시대별 생산과 유통의 변화양상 파악에 기여할 것으로 기대된다. The Daetong Temple that is recorded in the Samguk yusa (Memorabilia of the Three Kingdoms) has a clear location (Uncheonju), year of founding (first year of Daetong), and purpose (origin of Yangje). It also has an important role to play in understanding the Buddhist culture of Baekje. Its existence was recognized through the lotus design roof tiles, stone basin, and flagpole supports found in Banjuk-dong, but no precise location had been found. Excavations have been going on steadily since the discovery of the Daetong stamped roof tiles by Garube Jion during the Japanese Occupation, and recently, a large number of excavations related to the Daetong Temple have been conducted in the area around Batter-dong. It has been difficult to carry out detailed studies using Daetong stamped roof tiles to prove the great communion site due to their insufficient quantity. However, the growth in excavations in recent years has indicated a need for further in-depth research. Basic data on the seals related to Daetong Temple are lacking, and precise shape data are needed to analyze the manufacturing techniques. In this study, three-dimensional high-precision scanning was done to record the shape information, which was documented through the visualization of production marks and similarity analyses with Daetong stamped roof tiles. The results were further evaluated to construct an archive of the stamped roof tiles. The physical characteristics of the tiles were investigated using visual observation, a spectrum colorimeter, and a stereoscopic microscope. The tile forms were divided into circular and rectangular and four types of seal letters were identified Dae(a Chinese character 大), Daetong(a Chinese character 大通), Daetongsa(a Chinese character 大通寺), and Daetongjisa(a Chinese character 大通之寺). The chromaticity measurements indicated that L* signified 44-63, a* signified 0-14, and b* signified a distribution in the range of 3-22. The Banjuk-dong 176 street address had a wider chromaticity range among the excavated stamped roof tiles than other sites. A stereoscopic microscope examination found that black and brown glassy substances were commonly identified on the tensile and surface, and the sizes were irregularly distributed. A three-dimensional model with an average point spacing of 0.11 ㎜ was constructed using three-dimensional high-precision scanning for the tiles. A digital shape measurement was performed for each stamped roof tiles, and the tiles’ characteristics were largely divided into the Baekje period and the Goryeo period according to thickness, following previous studies. There were a total of 10 manufacturing techniques clearly visualized applying 4 rendering techniques to the stamped roof tiles and 18 to the Daetong Temple. In particular, among the traces that are difficult to identify with the naked eye, tool marks (NG-1) appeared as traces of the tensile surface being trimmed with a sharp tool, wood being the likely material and the marks (NB-1, HE-2) were cleaned with hands after being beaten. This was considered to be the plain beating technique that remained after the process was complete. In particular, circular stamped roof tiles were observed in detail through the additional application of a Depth Map, and four types of typographic features were identified. Interestingly, the type B typeface included all of the Daetong stamped roof tiles. Visualization demonstrated a suitable rendering method, such as, grasping the fine shape of the tension wand (curvature map), checking surface irregularities (normal map), character outlines (ambient occlusion map), and stamping strength (depth map). This methodology can be used not only for roof tiles but also for the shape analysis of buried cultural properties with positive and negative curvatures on the surface, and it is considered to sufficiently replace the traditional visualization method (brass rubbing). Three-dimensional shape information acquired using three-dimensional scanning is very low in utilization, as its business purpose is concentrated only on record-keeping. To overcome this; dimensional analysis, visualization, and quantitative analysis were attempted using a three-dimensional model using a tensile wire, and, as a result of similarity analysis, an objective and visible classification of types was proposed. Dimensional analysis produced two-dimensional information on the tiles and verified it in a three-dimensional perspective through visualization analysis. The similarity analysis of eight of the Daetong stamped roof tiles with the same typographic characteristics showed four types, types A-D. Type A (NG-1) had the smallest characteristics of boundary line and letters, which are in the possession of the Gongju National Museum. Type B was a stamped roof tiles wall unearthed at the Banjuk-dong 176 street address (CH-1, CH-2, and CH-4), and the boundary lines and letters had a moderate size; the letters were the largest feature. Type D was excavated at the Banjuk-dong 197-4 street address (HE-1, HE-2), and no complete characters were seen, but through similarity analysis, it was found that the size of the Tong(a Chinese character 通) indicated a different type. As a result of the similarity analysis, unlike previous studies, it was found that the stamped roof tiles of the Gongju National Museum (NG-1) and those of the Buyeo National Museum (NB-1, NB-2) were stamped with different seals due to the differences in boundary lines and font sizes. In addition, the stamped roof tiles and the two pieces from Buyeo National Museum were found to have been produced at the same time because the boundary line size and excavation location were the same. The visualization and similarity analysis results of these stamped roof tiles provide significant standard data for the stamped roof tiles excavated at Daetong Temple, and if this is expanded to other relics excavated in the future, it is expected to contribute to the understanding of changes in production and distribution by period.

      • 전력수요 패턴 분석을 통한 스마트 미터 데이터의 이상치 식별 및 결측치 대체 기법

        고세현 고려대학교 대학원 2019 국내석사

        RANK : 232237

        ICT 기술의 발달로 전력 시스템은 공급자 중심의 단방향성 전력망에서 수요자 중심의 양방향성 전력망인 스마트그리드로 변화하고 있으며, 이에 따라 AMI를 통한 전력 데이터들이 기하급수적으로 축적되고 있다. 이러한 전력 데이터들을 사용한 여러 가지 서비스들이 점점 상용화되는 단계에 놓여있는 현 시점에서 정확한 전력 서비스의 제공을 위해서는 스마트 미터 데이터의 높은 품질이 반드시 필요하다. 본 논문에서는 이와 같은 시대적, 기술적 배경 하에서 한국 내 상업용 빌딩의 스마트 미터로부터 측정된 실제 데이터를 분석하여 데이터의 이상치와 결측 구간이 발생하는 패턴의 종류를 정의한 뒤, 통계적 방법을 통해 스마트 미터 데이터의 이상치를 판별하고 전력소비 패턴 분석을 통한 유사 과거 상황 탐색 방법으로 결측 구간을 대체 할 것이다. 이를 통해 최종적으로 스마트 미터 데이터 셋의 품질을 높이는 데에 기여할 것이다.

      • 범죄 사건 유사도 정의 방법론에 기반한 지역 특성에 따른 범죄 유형 분석 및 활용

        이현호 서울대학교 대학원 2019 국내석사

        RANK : 232237

        지역 특성에 따른 죄종별 범죄 발생율의 차이에 관한 연구는 지속적으로 이루어져 왔다. 하지만 지역 특성에 따른 특정 죄종 사건의 범죄 유형을 심층 분석하는 연구는 상대적으로 덜 진행되었다. 본 논문에서는 침입절도를 주 분석 대상으로 하여 도시지역인지 여부에 따라 그 범죄 유형이 유의미하게 차이가 있는지를 확인했다. 침입절도의 범죄 유형은 과거사건 기록상의 피해품, 침입대상, 침입대상 성질, 침입수단 등의 수법 항목으로 파악했다. 도시지역 및 비도시지역 침입절도 범죄 유형의 분포를 강명종 외(2019)의 유사도 정의 알고리즘을 이용하여 피의자의 특성을 고려한 범죄 유형 간 의미적 구조를 나타내는 비유사도 행렬의 형태로 요약하고, 몬테카를로 시뮬레이션을 이용하여 이 두 지역의 범죄 유형간 비유사도 행렬이 유의미하게 다르다는 것을 통계적으로 확인했다. The study of the difference in crime incidence by type of crime considering local characteristics has been conducted continuously. However, analysis of crime patterns of specific type of crime according to regional characteristics have been rarely conducted. The purpose of this paper is to find significant difference in intrusion theft crime patterns according to whether it occurs in urban area or not. The intrusion theft patterns are described by the stolen goods, intrusion target, characteristics of intrusion target, intrusion method from past case records. The crime patterns in urban and non-urban areas is summarized in the form of dissimilarity matrices that show the semantic structure between crime patterns considering the characteristics of suspects using the algorithm from Kang et al(2018). Monte-Carlo simulation confirms significant difference between the dissimilarity matrices which summarize crime patterns of the two regions.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼