RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        형사소송에서 필적분석증거의 허용성과 그 한계

        권영법(Kwon, Young-Bub) 대검찰청 2012 형사법의 신동향 Vol.0 No.35

        The 「Law on the Identity Verification by Confirming the Fact of Self‒signature」 hadbeen enacted and will be enforced soon. Accordingly, the use of signature instead of thumbprint or seal is gradually increasing. The use of signature is helpful in active dealings on credit however, there is also a possibility of ill‒use. If a document is suspected of forgery, handwriting analysis is required and handwriting analysis is based on the hypothesis that“the handwriting of each individual is unique, handwriting shows the characteristic of an individual and there are no two handwritings that are perfectly same”. However, this hypothesis has never been validated and, furthermore, it is very difficult to test its validity. In Korea, the two elements of handwriting analysis standard are the constancy and the scarcity. However, in case of the constancy, handwriting of an individual changes as time passes by. As for the scarcity, it can differ dependent on the quantity/quality of exemplar‒document/questioned ‒ document and the experience/qualification of the handwriting analysis specialist. When these facts are considered, it is very difficult to warrantthe validity and reliability of handwriting analysis. It is known that the accuracy of handwriting analysis specialist is 85% while the accuracy of ordinary person is 70%. However, this is based onthe assumption that there had not been any impact of external factors. Ifthe fairness of handwriting analysis would be questionable, it can be said that the accuracy difference between ordinary person and handwriting analysis specialist is not on significant level. In addition, the handwriting analyses for criminal cases in Korea are mostly done by government institutes such as the National Scientific, Criminal & Investigation Laboratory; therefore, the fairness of it is not warranted. The handwriting analysis should meet the objective requirements such as; the authenticity of the exemplar document should have been validated, there should be sufficient evidences thatvalidate that the exemplar document and questioned document had been prepared by same person, the creation timing of the exemplar document should be within the same time frame with the creation timing of questioned document and all cautions during the requested writing had been abode by. In the absence of any one of these, the admissibility of handwriting analysis as an evidence in the court should be denied. Evena handwriting analysis specialist witness would be allowed after all above objective requirements had been met, still the handwriting verification of the questioned document should be done by the judge and jurywhile the handwriting analysis specialist would just explain the similarity and difference between the questioned document and exemplar document in the court. At present in Korea, there is no curriculum for the handwriting analysis in universities which would teach the theories and practice of document authenticity analysis including the handwriting analysis. Also, there is neither chartered certificate system nor an association of handwriting analysis specialists. In the criminal cases, most of the handwriting analyses are done by government institutes. Accordingly, there is minimal accumulation of handwriting analysis theories and it is difficult to find empirical studies on the accuracy rate of handwriting analysis. Another issue is that the number of handwriting analysis requirement is too many for one handwriting analysis specialist in a government institute because the number of handwriting analysis specialist itself is very small. The judgment on the sameness between an exemplar document and a questioned document should be consequently made by a judge; however, there is no information being published in Korea, which would provide the judges with theoretical and practical basic information on the handwriting analysis. 「본인서명사실 확인 등에 관한 법률」이 제정되어 시행을 앞두고 있으며 무인 또는 날인을 갈음한 서명이용이 점차 많아지고 있다. 이러한 서명의 이용은 활발한 신용거래에 도움을 줄 수 있으나 악용될 소지도 많다. 문서가 위조될 경우 필적분석을 하게 되는데 필적분석은 “각 개인의 필적은 고유하고 필적은 개인의 특징을 나타내고 완전히 동일한 필적은 없다”는 가설에서 출발하고 있다. 그러나, 그 가설은 입증된 바 없고 나아가 성립되기도 매우 어렵다. 우리나라에서 필적분석의 기준으로 삼고 있는 두 가지 요소 중, 항상성(恒常性)의 경우 세월에 따라 개인필적도 변경이 되며, 희소성(稀少性)이라는 요소도 대조자료와 의심자료의 양과 질, 분석관의 경험과 자질에 따라 달라진다는 사실을 감안한다면 필적분석의 타당도와 신뢰도를 확보한다는 것은 매우 힘들다. 필적분석 전문가의 정확도가 85%, 일반인의 정확도가 70%에 이르고 있다고 조사되고 있는데, 이는 필적분석시 외부적 요인이 영향을 미치지 않은 경우이고, 그 공정성이 의문시 된다면 일반인과 전문분석가의 정확도의 차이는 유의미한 수준이 아니라고 할 것이다. 나아가 우리나라는 형사사건에 있어 필적분석이 대부분 국립과학수사연구소 등 국가기관에서 이루어지고 있으므로 그 공정성이 담보되고 있지 않다. 그러므로 필적분석은 대조자료의 진정성이 입증되고, 대조자료와 의심자료가 동일인에 의해 작성되었음을 입증하기에 충분한 증거가 있어야 하고, 대조자료의 작성시기가 의심문서와 같은 시기에 작성되고, 시필시 주의사항이 준수되는 등 객관적 요건을 모두 갖추어야 하고 이를 결여한 경우 증거능력이 부정되어야 할 것이고, 이러한 객관적 요건을 갖추어 필적분석 전문가증인이 허용되더라도 의심문서의 필적확인은 판사와 배심원이 하여야 할 것이고, 필적분석 전문가는 법정에서 의심문서와 대조문서의 유사ㆍ차이점에 대해서만 설명만 할 수 있다고 할 것이다. 현재 우리나라는, 대학에서 필적분석 등을 포함한 문서감정을 전문으로 이론과 실습을 담당하는 과정도 개설되어 있지 않고, 공인된 자격증제도도 시행되고 있지 않고, 문서 분석인협회도 없으며, 형사사건에서 필적분석은 대부분 국가기관이 실시하고 있다. 이에따라 필적분석은 이론적인 축적도 미미하고, 오류율 등에 대한 실증적인 연구도 거의 찾기 어려운 실정이며, 필적분석인이 극소수여서 국가기관의 경우 1명당 담당하는 분석 건수가 너무 많다는 문제점이 지적되고 있다. 결국 대조문서와 의심문서의 동일성판단은 판사가 하여야 하는데 현재 국내에서는 판사로 하여금 필적분석에 대한 이론적ㆍ실무적인 기초자료를 제공해주는 자료도 발간되지 않고 있다. 따라서 필적분석을 포함한 문서 분석인의 자격증이수과정을 개설하고, 공인자격증을 수여하는 제도가 강구되어야 하겠고, 재판을 담당하는 판사로 하여금 필적분석에 대한 이론적 ․ 실무적인 기초 소양을 제공하는 책자를 정기적으로 발간하고, 법관연수시 이를 연수하도록 하는 방안이 강구되어야하며, 국가기관이 담당하는 필적분석 등 문서감정을 단계적으로 중립적인 기관으로 이관하여야 할 것이고, 신용거래에 있어 서명 외에 본인의 신분증제시 등 신원확인을 하는 제도적 장치가 강구되어야 하겠다.

      • KCI등재

        교사 중핵역할 관점에 기반한 초등학교 체육업무 공문서 분석: 네크워크 텍스트 분석(NTA)을 중심으로

        장병권(Chang, Byung Kweon) 한국체육교육학회 2021 한국체육교육학회지 Vol.26 No.2

        목적: 이 연구는 초등학교 체육업무 공문서 분석을 통하여 초등학교에서 체육업무의 특징을 살펴보고 학교체육 내실화를 위한 근거를 제시하고자 수행되었다. 방법: 연구대상은 C도 소재 H초등학교의 2016학년도(2016.03.01.~2017.02.28.) 체육업무 공문서 212건이다. 문서수집은 업무관리시스템을 활용하였으며 연구대상의 선정은 분석대상 학교의 업무분장을 활용하여 체육업무에 한정하였다. 분석방법은 빈도분석과 네트워크 텍스트 분석을 활용하였다. 결과: 분석 결과는 다음과 같다. 첫째, 연구대상 학교의 체육업무 공문서는 생산문서 40건, 접수문서 172건으로 나타났다. 월별 빈도수 최대치는 생산문서(3월, 9건)와 접수문서(10월, 29건)가 상이했다. 둘째, 공문서 제목에 출현한 단어의 빈도는 생산문서에서는 ‘제출’, ‘2016’, ‘현황’, ‘계획’, ‘수영장’, ‘○○초’, ‘○○(지역명)’, ‘피구’, ‘학교스포츠클럽’ 순으로 나타났으며 접수문서에서는 ‘알림’, ‘2016’, ‘안내’, ‘제출’, ‘개최’, ‘협조’, ‘현황’, ‘계획’ 순으로 나타났다. 셋째, 네트워크 분석결과 생산문서는 5개, 접수문서는 4개의 주요 클러스터로 구성되었다. 결론: 분석결과에 따른 시사점과 향후 과제로는 첫째, 체육행정에서 체육교육으로, 둘째, 엘리트 체육에서 풀뿌리 체육으로, 셋째, 단위학교, 지역교육지원청, 도교육청의 기능 재정립을 제시하였다. Purpose: This study analyzed the official documents for physical education in elementary schools, examined the characteristics of physical education, and presented the basis for the improvement of school physical education. Methods: The subjects of this study are 212 official documents for physical education in 2016 (2016.03.01.-2017.02.28.) of H elementary school located in C province. The Work Management System was used for document collection, and the selection of the study subjects was limited to physical education work by utilizing the work division of the school to be analyzed. Frequency analysis and network next analysis(NTA) were used for analysis method. Results: There were three noticeable result were found. First, there were 40 production documents and 172 documents received as the official documents for physical education work of the school to be studied. The maximum monthly frequency was different for production documents (March, 9 cases) and received documents (October, 29 cases). Second, the frequency of words appearing in the titles of official documents were "Submission", "2016", "Status", "Plan", "Swimming Pool", "○○ Elementary School", "○○ (region name)", "Dodge Ball", "School Sports Club" appeared in the order. In the received documents, ‘Notification’, ‘2016’, ‘Information’, ‘Submission’, ‘Holding’, ‘Cooperation’, ‘Situation’, and ‘Plan’ appeared in order. Third, as a result of network analysis, production documents were composed of five and received documents were composed of four major clusters. Conclusion: Implications and future tasks are as follows. First, from physical administration to physical education, second, from elite to grass-roots physical education, and third, to re-establish the functions of unit schools, regional education support offices, and provincial offices of education.

      • KCI등재

        일반논문 : 질적 연구 방법으로서 문서분석

        김영천 ( Young Chun Kim ),정상원 ( Sang Won Jung ) 인하대학교 교육연구소 2015 교육문화연구 Vol.21 No.6

        문서를 기반으로 하는 많은 연구들이 있음에도 불구하고 국내에서 연구 방법으로서 문서분석 을 이론화 하려는 노력은 거의 없는 것이 현재의 실정이다. 따라서, 이 연구는 문서분석과 관련 된 학자들의 논의를 통해 문서의 개념과 문서를 기반으로 한 다양한 연구들을 살펴보았다. 또한 질적 연구에 사용될 수 있는 다양한 문서의 종류를 살펴보고 그러한 문서들을 기반으로 한 연구 에서 문서들이 어떠한 역할을 하였는지 살펴보았다. 이러한 연구의 결과는 질적 연구자들이 정 보의 원천으로서 문서의 사용에 대한 이해를 넓힐 수 있도록 도울 것이며 이를 통해 그들이 자 신들의 연구에 문서 분석 방법을 도입할 수 있도록 도울 수 있을 것이다. Nonetheless, there are so many studies based on using documents. There is little effort to theorizing document analysis research as a qualitative method in Korea. So, this article tried to review the definition of documents and the scholar`s argument of using documents. And after review of some studies that using documents as sources of information, we attempted to list the kinds of documents that can be used in research. This study can help researchers with understanding the use of documents as sources of information and trying to adopt document method to their study.

      • KCI등재

        공유 문서를 활용한 과학 수업에서 나타난 학생 담화의 특징 -인식 네트워크 분석(ENA)의 활용-

        신은혜 한국과학교육학회 2024 한국과학교육학회지 Vol.44 No.1

        This study analyzed students’ discourse and learning to investigate the impact of using Google Docs in science classes. The researcher, who is also a science teacher, conducted classes for 49 second-year middle school students. The classes included one using Google Docs and another using traditional paper worksheets covering identical content. Students’ discourse collected from each class was compared and analyzed using Epistemic Network Analysis (ENA). The findings indicated that in the class using Google Docs, the proportion of discourse related to task was higher compared to the traditional class. More specifically, discourse regarding taking and uploading photos was prominent. However, such discourse did not lead to peer learning as intended by the teacher. An analysis based on achievement levels revealed that the class utilizing Google Docs had a relatively higher proportion of discourse from lower-achieving students. Additionally, differences were observed in the types of utterances and connection structures between the higher and lower-achieving students. The higher-achieving students took a leading role in providing suggestions and explanations, while the lower-achieving students played a role in transcribing them, with this tendency being more pronounced in the class using Google Docs. Lastly, students’ changes in perception regarding the cause of static electricity were visualized using ENA. Based on the research findings, this study proposes strategies to enhance collaborative learning using Google Docs, including the use of open-ended problems to allow diverse opinions and outputs, and exploring the potential use of ENA to assess the learning effects of conceptual learning. 본 연구는 과학 수업에서 공유 문서의 활용이 학생의 담화 패턴과학습에 미치는 영향을 조사하기 위해 학생들의 담화를 인식 네트워크분석(Epistemic Network Analysis) 방법으로 분석하였다. 49명의 중학교 2학년 학생을 대상으로 과학 교사인 연구자 본인이 Google Docs 를 기반으로 제작된 활동지를 활용한 공유 문서와 동일 내용의 종이활동지를 활용한 일반 수업을 실시하고, 각 수업에서 수집된 담화를비교 분석하였다. 분석 결과, 공유 문서 활용 수업에서는 일반 수업에비해 과제 수행과 관련된 발언의 비율이 더 높았으며, 특히 사진 촬영과 업로드에 대한 담화가 두드러졌다. 그러나 이러한 담화가 교사가의도한 동료 학습으로 이어지지는 않았다. 성취 수준에 따른 분석결과에서는 공유 문서 활용 수업에서 하위 수준 학생의 발언 비율이상대적으로 더 높았으며, 상위 학생과 하위 학생 간의 발언 유형 및연결 구조에서 차이가 나타났다. 또한 상위 수준 학생이 의견과 설명제시를 주도하면 하위 학생이 이를 받아 적는 역할 분담이 관찰되었으며, 공유 문서 활용 수업에서 그러한 경향이 더 뚜렷하였다. 마지막으로 인식 네트워크 분석으로 정전기의 원인에 대한 학생의 인식 변화를 시각화하였다. 연구 결과를 바탕으로 공유 문서를 활용하여 협력 학습을 촉진하기 위해 다양한 의견과 산출물의 공유가 가능한 개방적 문제를 포함하는 전략과 인식 네트워크 분석을 활용한 개념 학습 효과 확인 가능성을 제언하였다.

      • KCI등재

        인자점수와 자기조직화지도를 이용한 희소한 문서데이터의 군집화

        전성해(Sunghae Jun) 한국지능시스템학회 2012 한국지능시스템학회논문지 Vol.22 No.2

        통계학과 기계학습의 다양한 기법을 이용하여 문서집합을 군집화하기 위해서는 우선 군집화분석에 적합한 데이터구조로 대상 문서집합을 변환해야 한다. 문서군집화를 위한 대표적인 구조가 문서-단어행렬이다. 각 문서에서 발생한 특정단어의 빈도값을 갖는 문서-단어행렬은 상당부분의 빈도값이 0인 희소성문제를 갖는다. 이 문제는 문서군집화의 성능에 직접적인 영향을 주어 군집화결과의 성능감소를 초래한다. 본 논문에서는 문서-단어행렬의 희소성문제를 해결하기 위하여 인자분석을 통한 인자점수를 이용하였다. 즉, 문서-단어행렬을 문서-인자점수행렬로 바꾸어 문서군집화의 입력데이터로 사용하였다. 대표적인 문서군집화 알고리즘은 자기조직화지도에 적용하여 문서-단어행렬과 문서-인자점수행렬에 대한 문서군집화의 결과들을 비교하였다. The retrieved documents have to be transformed into proper data structure for the clustering algorithms of statistics and machine learning. A popular data structure for document clustering-term matrix. This matrix has the occurred frequency value of a term in each document. There is a sparsity problem in this matrix because most frequencies of the matrix are 0 values. This problem affects the clustering performance. The sparsensess of document-term matrix decrease the performance of clustering result. So, this research uses the factor score by factor analysis to solve the sparsity problem in document clustering. The document-term matrix is transformed to document-factor score matrix using factor scores in this paper. Also, the document-factor score matrix is used as input data for document clustering. To compare the clustering performances between document-term matrix and document-factor score matrix, this research applies two matrices to self organizing map (SOM) clustering.

      • KCI등재

        한글 형태소 및 키워드 분석에 기반한 웹 문서 분류

        박단호,최원식,김홍조,이석룡,Park, Dan-Ho,Choi, Won-Sik,Kim, Hong-Jo,Lee, Seok-Lyong 한국정보처리학회 2012 정보처리학회논문지D Vol.19 No.4

        최근 초고속 인터넷과 대용량 데이터베이스 기술의 발전으로 웹 문서의 양이 크게 증가하였으며, 이를 효과적으로 관리하기 위하여 문서의 주제별 자동 분류가 중요한 문제로 대두되고 있다. 본 연구에서는 한글 형태소 및 키워드 분석에 기초한 문서 특성 추출 방법을 제안하고, 이를 이용하여 웹 문서와 같은 비구조적 문서의 주제를 예측하여 문서를 자동으로 분류하는 방법을 제시한다. 먼저, 문서 특성 추출을 위하여 한글 형태소 분석기를 사용하여 용어를 선별하고, 각 용어의 빈도와 주제 분별력을 기초로 주제 분별 용어인 키워드 집합을 생성한 후, 각 키워드에 대하여 주제 분별력에 따라 점수화한다. 다음으로, 추출된 문서 특성을 기초로 상용 소프트웨어를 사용하여 의사 결정 트리, 신경망 및 SVM의 세 가지 분류 모델을 생성하였다. 실험 결과, 제안한 특성 추출 방법을 이용한 문서 분류는 의사 결정 트리 모델의 경우 평균 Precision 0.90 및 Recall 0.84 로 상당한 정도의 분류 성능을 보여 주었다. With the current development of high speed Internet and massive database technology, the amount of web documents increases rapidly, and thus, classifying those documents automatically is getting important. In this study, we propose an effective method to extract document features based on Hangeul morpheme and keyword analyses, and to classify non-structured documents automatically by predicting subjects of those documents. To extract document features, first, we select terms using a morpheme analyzer, form the keyword set based on term frequency and subject-discriminating power, and perform the scoring for each keyword using the discriminating power. Then, we generate the classification model by utilizing the commercial software that implements the decision tree, neural network, and SVM(support vector machine). Experimental results show that the proposed feature extraction method has achieved considerable performance, i.e., average precision 0.90 and recall 0.84 in case of the decision tree, in classifying the web documents by subjects.

      • KCI등재

        용어 사전의 특성이 문서 분류 정확도에미치는 영향 연구

        정혜강,김남규 대한경영정보학회 2018 경영과 정보연구 Vol.37 No.4

        As the volume of unstructured data increases through various social media, Internet news articles, and blogs, the importance of text analysis and the studies are increasing. Since text analysis is mostly performed on a specific domain or topic, the importance of constructing and applying a domain-specific dictionary has been increased. The quality of dictionary has a direct impact on the results of the unstructured data analysis and it is much more important since it present a perspective of analysis. In the literature, most studies on text analysis has emphasized the importance of dictionaries to acquire clean and high quality results. However, unfortunately, a rigorous verification of the effects of dictionaries has not been studied, even if it is already known as the most essential factor of text analysis. In this paper, we generate three dictionaries in various ways from 39,800 news articles and analyze and verify the effect each dictionary on the accuracy of document classification by defining the concept of Intrinsic Rate. 1) A batch construction method which is building a dictionary based on the frequency of terms in the entire documents 2) A method of extracting the terms by category and integrating the terms 3) A method of extracting the features according to each category and integrating them. We compared accuracy of three artificial neural network-based document classifiers to evaluate the quality of dictionaries. As a result of the experiment, the accuracy tend to increase when the “Intrinsic Rate” is high and we found the possibility to improve accuracy of document classification by increasing the intrinsic rate of the dictionary. 다양한 소셜 미디어 활동과 인터넷 뉴스 기사, 블로그 등을 통해 유통되는 비정형 데이터의 양이 급증함에 따라 비정형 데이터를 분석하고 활용하기 위한 연구가 활발히 진행되고 있다. 텍스트 분석은 주로 특정 도메인 또는 특정 주제에 대해 수행되므로, 도메인별 용어 사전의 구축과 적용에 대한 중요성이 더욱강조되고 있다. 용어 사전의 품질은 비정형 데이터 분석 결과의 품질에 직접적인 영향을 미치게 되며, 분석 과정에서 정제의 역할을 수행함으로써 분석의 관점을 정의한다는 측면에서 그 중요성이 더욱 강조된다. 이렇듯 용어 사전의 중요성은 기존의 많은 연구에서도 강조되어 왔으나, 용어 사전이 분석 결과의 품질에어떤 방식으로 어떤 영향을 미치는지에 대한 엄밀한 분석은 충분히 이루어지지 않았다. 따라서 본 연구에서는 전체 문서에서의 용어 빈도수에 기반을 두어 사전을 구축하는 일괄 구축 방식, 카테고리별 주요 용어를 추출하여 통합하는 용어 통합 방식, 그리고 카테고리별 주요 특질(Feature)을 추출하여 통합하는 특질통합 방식의 세 가지 방식으로 사전을 구축하고 각 사전의 품질을 비교한다. 품질을 간접적으로 평가하기위해 각 사전을 적용한 문서 분류의 정확도를 비교하고, 각 사전에 고유율의 개념을 도입하여 정확도의 차이가 나타나는 원인을 심층 분석한다. 본 연구의 실험에서는 5개 카테고리의 뉴스 기사 총 39,800건을 분석하였다. 실험 결과를 심층 분석한 결과 문서 분류의 정확도가 높게 나타나는 사전의 고유율이 높게 나타남을 확인하였으며, 이를 통해 사전의 고유율을 높임으로써 분류의 정확도를 더욱 향상시킬 수 있는 가능성을 발견하였다.

      • KCI등재

        태그간 의미 분석을 이용한 다중 문서 요약 기법

        허지욱(Jee-Uk Heu),주영도(Young-Do Joo),이동호(Dong-Ho Lee) 한국정보과학회 2012 정보과학회논문지 : 데이타베이스 Vol.39 No.1

        최근 인터넷의 급속한 발달과 보급으로 인하여 웹 상에서 생성되는 문서의 양은 하루가 다르게 증가하고 있다. 하지만 사용자는 많은 시간과 노력을 들여 자신이 원하는 정보가 담긴 문서를 찾기 위하여 검색 엔진의 도움을 받더라도 검색된 문서를 일일이 검토해야 한다는 어려움이 존재한다. 사용자들의 이러한 어려움을 해소하기 위하여 문서의 핵심을 효과적으로 요약하는 다중 문서 요약 기법에 대한 연구가 활발히 진행되어왔다. 그러나 기존의 다중 문서 요약 기법들은 대부분 확률이론 및 기계학습에 근거한 방법을 사용하기 때문에 학습 및 요약 과정에 높은 비용이 요구되며 새롭게 출현하는 고유명사들에 대한 분석이 용이하지 않다는 단점들을 가지고 있다. 본 논문은 이러한 단점들을 해결하기 위하여 고유명사를 포함한 문서 내에 존재하는 단어들에 대한 태그 클러스터를 폭소노미 시스템인 플리커를 이용하여 실시간으로 획득하여 분석시간과 계산비용을 줄이고, 단어들간 의미적 관계를 분석하여 중요 단어들을 추려내며 이를 기반으로 단어의 중요도와 다른 단어들간의 의미적인 관계를 분석하여 중요문장들을 추려내는 다중문서 요약 기법을 제안한다. Recently, the amount of documents created on the web has been rapidly increasing day by day, due to the rapid propagation and the development of the internet. In order to find the necessary information, the user has to manually review all of the searched documents in spite of the assistance of search engines, and it requires too much time and effort. To address this problem, various multi-document summarization techniques have been studied to efficiently summarize the core of the original document. However, most of all existing multi-document summarization techniques suffer from a high cost in learning and summarization processes because their methods are mainly based on probability theory and machine learning, and failed to analyze the proper nouns which are emergently upraised. To overcome these drawbacks, we propose a novel multi-document summarization technique that analyze the importance of the key words and the semantic relatedness among them, and then detect the key sentences in the document based on the tag cluster of the each word including proper nouns in the document by exploiting Flickr which is one of the representative folksonomy systems to reduce analysis time and computing cost between each words in the documents.

      • 온라인 스포츠패션 시장에서 소비자 빅데이터 분석

        김춘정,나영주 한국감성과학회 2022 춘계학술대회 Vol.2022 No.-

        자전거 페달링시 다리의 움직임 및 국부과열로 인한 마찰, 지면의 요철이나 추락시 충격, 진동 및 흔들림으로 인해 다양한 문제와 더불어 불편함이 발생한다. 장시간 라이딩시 물집, 궤양, 자극, 외상, 타박상 및 상처, 심지어 혈액순환문제 및 전립선문제와 같은 피부수준과 근육수준에서 일반적인 문제가 발생할 수 있다. 그러므로 사이클링 팬츠는 부드럽고 위생적이며 pH에 강하고 통기성, 항박테리아성, 신축성 등을 가진 기능성 소재로 만들어진 시트패드를 부착하여 신체부위를 보호한다. 이중 멜빵형 스타일의 빕과 빕숏은 바지부분과 어깨를 통해 앞쪽에서 뒤쪽으로 이어지는 어깨끈은 로드 레이스에서 발생할 수 있는 격렬한 움짐임에서 어깨끈이 쉽게 제자리에서 벗어나지 않기 때문에 라이더들이 자주 사용한다. 따라서 온라인상에서 이들의 장단점 및 소비자의 반응을 데이터 분석을 실시하였다. 쇼핑몰 리뷰데이터수집으로서 사이클웨어의 소비자 리뷰에 대한 데이터는 네이버쇼핑몰 G마켓, 옥션, 11번가, 인터파크와 기타 오픈마켓에서 사이클 의류 하의중 패드가 부착된 빕숏, 빕, 쇼츠, 타이츠를 대상으로 각 제품에 대한 제품명, 브랜드, 사용자 리뷰, 평점, 리뷰작성일 등을 크롤링하였다. 웹 크롤링은 오픈소스프로그램인 Pythonver.3을 사용하여 각제품에 대한 제품명, 브랜드, 사용자리뷰, 평점, 리뷰작성일 등을 크롤링하였으며 2016년1월1일~ 2020년6월30일까지의 데이터를 대상으로 하였다. 총7,257건의 데이터가 수집되었으며 이중 리뷰에 상품명만 있는 등 의미없는 데이터를 가진 16건을 제외하고 총7,241건이 분석에 사용되었다. 크롤링된 사이클웨어 하의는 Sant**, Ard****, NS*, M**, San** 등 10개 브랜드로 총42개 제품이었다. 수집된 리뷰데이터는 Rver.4.0.2를 이용하여 한국어형태소분석기인 KoNLPPackages로 형태소분석을 실시하였다. 구두점, 숫자, 접속사, 조사 등 해석에 의미가 없는 불용어(stopwords)들을 제거하고 명사, 형용사, 동사를 추출하였다. 형태소분석시 sejongdictionary에 사이클웨어 관련용어들로 구성된 userdictionary를 추가하여 사용하였다. 추출된 말뭉치에서 유사어, 동의어 등에 대해 전처리를 실시하고 단어문서행렬(TermDocumentMatrix)를 계산하였다. 또한 동시출현 빈도행렬 (co-occurrence matrix)를 계산하였으며 ggplot2package를 이용하여 워드클라우드를, Gephi0.9.2를 이용하여 네트워크분석을 시각화하였다. 그리고 SPSSver.25를 사용하여 사이클웨어 하의종류에 대한 리뷰건수, 평점 등의 차이를 조사하고자 빈도분석, 교차분석과 카이제곱검정, 일원배치 분산분석등을 실시하였다. 구글 트렌드분석을 통해 사이클웨어 하의에 대한 검색 동향을 비교 분석하였다. 그 결과, 사이클웨어 하의의 주요 키워드는 긍정과 부정에 모두 ‘사이즈’, ‘가성비’, ‘패드’등에 대한 출현빈도수가 높게 나타났다. 또한 실질적으로 인터넷쇼핑몰의 사이클링 팬츠제품들에서는 관련 정보가 부족한 실정이며 부정적인 리뷰 중에서는 패드에 대한 불만이 많아 이에 대한 개선이 요구된다. 본 연구는 사이클웨어 하의에 대한 소비자의견 빅데이터를 실시간으로 분석하여 소비자들의 요구사항과 불편사항을 파악할 수 있는 가능성을 살펴보았다. 하지만 좀 더객관적인 지표로 활용하기 위해서는 다양한 포털사이트, 블로그, 트위터, 페이스북 등 크롤링의 범위를 확대하고 데이터를 수집하여 데이터베이스화하는 것이 필요하겠다.

      • KCI우수등재

        위협인자 및 공격 패턴 기반 HWP 문서형 악성코드 탐지 시그니처 생성

        최민지,정동재,조호묵,원유재 한국정보과학회 2023 정보과학회논문지 Vol.50 No.6

        최근 코로나19로 재택근무가 증가함에 따라 업무에서 주로 사용되는 전자 문서에 악성코드를 삽입한 문서형 악성코드 공격이 활발하게 발생되고 있다. 문서형 악성코드는 메신저, 이메일, 웹사이트와 같은 다양한 경로에서 유입되고 있으며, 문서형 악성코드는 문서 내에 악성코드를 인코딩하거나 난독화하여 숨기기 때문에 기존의 행위 기반 보안 솔루션 및 내부 메일 모니터링 서버를 쉽게 우회할 수 있다. 따라서 본 논문에서는 HWP 문서의 포맷 구조 분석을 통해 총 5가지의 위협인자를 분류하였고 위협인자의 공격코드 패턴 분석을 통해 악성 HWP 문서를 탐지할 수 있는 시그니처를 생성하였다. 이를 통해 최신 악성 HWP 문서를 효과적으로 탐지할 수 있는 시그니처 생성 방안을 제안하며 향후에는 시그니처 생성 및 탐지에 기계학습을 적용하여 연구를 확장할 계획이다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼