        일본 고전 서적의 디지털 아카이브 구축현황에 관해 -“역사적 전적 NW 사업”의 현황 및 주요 학술 데이터베이스 소개-

        양성윤 한국고전문학교육학회 2022 고전문학과 교육 Vol.49 No.-

        This paper outlines the recent progress of the "Project to Build an International Collaborative Research Network for Premodern Japanese Texts (NIJL-NW project)," which is being promoted as a national project alongside the establishment of classical digital archives in Japan. This paper introduces digital archives and various academic databases useful in classical Japanese studies and explains their characteristics. Currently, the project is being carried out regarding social contributions and data applications for existing digital archives, pointing out problems vis-a-vis the original purpose of aiming for an "open digital archive" of digital image data, academic databases, and full text. In particular, I pointed out that to function as "effective information," the database of classical data needs to be based on the formation and exchange of research communities, and that exemplary databases exist already. I suggest that if worldwide researchers make their research knowledge accessible through autonomous and continuous exchanges, they can devise ways to build digital archives and practical ways to use them, to make them more easily utilized by researchers worldwide. 이 논문에서는 일본의 고전 서적에 관한 다양한 디지털 아카이브의 구축 현황을 파악하고자, 고전 서적에 관련한 디지털 아카이브의 기축이자 국책 사업으로 추진 중인 ‘일본 역사적 전적(典籍)의 국제 공동연구 네트워크 구축계획’(이하, ‘역사적 전적 NW사업’)의 진행 양상과 현재 구축된 데이터베이스를 개관하며 필자의 비평을 덧붙였다. 더불어 고전 일본학 연구에서 주로 활용되는 디지털 아카이브 및 각종 학술 데이터베이스를 선별해 소개하며 유용성에 관해 설명했다. 국문학연구자료관이 중심이 된 ‘역사적 전적 NW사업’과 그 후속 사업인 ‘데이터 구동에 의한 과제 해결형 인문학의 창성’ 프로젝트는, 현재까지 구축된 디지털 아카이브를 바탕으로 자료의 사회적 공헌 및 응용 측면에서 진행되고 있다. 그런데 이런 진행 상황은 디지털 화상 데이터의 정비 및 풀텍스트 데이터의 구축으로 ‘열린 디지털 아카이브’를 지향하고자 한 본래의 취지에서 다소 멀어진 측면이 있고 바로 이 지점에서 성찰할 부분이 있다는 것을 지적했다. 특히 다양한 고전 서적의 내용을 쉽게 탐색하여 ‘유효한 정보’로서 활용하기 위해서는 고전 서적 자료의 데이터베이스화 작업이, 자료 선정 및 목록화의 정비 단계에서부터 전위적인 연구 공동체의 형성과 교류를 바탕으로 한 최전선의 연구 성과, 이른바 ‘교류지(交流知)’에 기반할 필요가 있다. 실제로 모범적인 데이터베이스도 그렇게 이뤄지고 있다는 점을 지적했다. 향후 세계의 연구자들이 자율적이고 지속적인 교류를 통해서 연구의 지견을 열어간다면, 세계 각국의 연구자들이 더욱 수월하게 활용할 수 있는 디지털 아카이브의 구축 방식과 활용방법도 새로이 구상할 수 있다고 제언했다.

      • KCI등재

        데이터 병렬성을 활용한 로그 파일 재구축 부하 개선 연구

        서주연,성한승,최원기,박상현 한국정보과학회 2020 데이타베이스 연구 Vol.36 No.3

        Redis, an in-memory database that uses DRAM which is a volatile device as its main repository, has the advantage of rapid data processing but the risk of data loss is high. To prevent the data loss, Redis provides AOF method that appends log records for performed commands to the log file. However, there is a constant increase in the log file due to continuous records. Although Redis provides log file reconstruction methods to prevent sudden increase in the log file, additional memory usage and latency in data processing are required, adding to the burden in terms of performance and resources. In this research, we propose the log file reconstruction method using data parallelism to improve the overhead occurred in the log file reconstruction. Also, we perform reconstruction without AOF Rewrite buffer that is the major cause of reconstruction overhead through our method, so the memory usage and data processing performance are improved. The proposed model is evaluated via memtier-benchmark and we confirmed the reconstruction overhead has been considerably improved. 휘발성 장치인 DRAM을 주 저장소로 사용하는 인메모리 데이터베이스인 Redis는 신속한 데이터 처리의장점을 지녔지만, 데이터 유실 위험이 크다. Redis는 데이터 유실 방지를 위해, 수행한 명령어를 로그 파일에덧붙여 기록하는 AOF 기법을 제공한다. 하지만 계속되는 기록으로 인하여 로그 파일이 기약 없이 증가하는현상이 발생한다. Redis는 로그 파일 재구축 기법을 제공하여 로그 파일 급증을 방지하지만, 부가적인 메모리사용과 데이터 처리 지연이 요구되어 성능 및 자원 측면에서 부담이 가중된다. 본 연구에서는 로그 파일 재구축 시 발생하는 부하를 개선하기 위해 데이터 병렬성을 활용한 로그 파일 재구축 기법을 제안한다. 또한, 재구축 부하의 주요 원인이 되는 AOF Rewrite 버퍼 없이 재구축 작업을 수행하여, 메모리 사용량과 데이터처리 성능을 향상시킨다. 제안하는 모델은 memtier-benchmark를 통해 평가되었으며, 재구축 부하가 크게개선되었음을 확인하였다.

      • Development of the Cost Estimation Model for the Digital Document Database Construction Projects

        Yong Won Seo(서용원),Sojung Kim(김소정) 성신여자대학교 경영연구소 2015 경영관리연구 Vol.8 No.2

        최근 데이터베이스 구축 사업이 활성화되고 관련 산업의 규모가 증가하고 있다. 상당수의 데이터 베이스구축사업이 공공부문에서 발주되고 있으며, 이에 따라 관련 예산을 적정한 규모로 산정하기 위한 모형의 수립이 요구되고 있다. 본 연구에서는 데이터베이스 구축 사업의 규모와 이에 따른 수행 예산을 산정하기 위한 모형을 수립하여 제시한다. 데이터베이스 구축 프로세스를 순서 독립적인 작업 요소로 분해하고, 사업의 난이도 요인을 보정요인으로 반영하였다. 제시된 비용산정 시스템은 18개의 작업요인으로 구성되어 있으며, 각 작업요소의 적정 일일작업량과 보정요인의 계수는 전문가 델파이 설문 및 실제 작업량 측정으로부터 산정되었다. 제시된 모형을 실제 사업에 대해 시뮬레이션한 결과 실제 비용을 근사하게 추정하는 것으로 나타났다. As the market size of the database construction industry is rapidly increasing in Korea, of which the major portion is the governmental database construction projects, needs to estimate the cost of the database construction projects are increasing. Because there are only few estimation methods for database construction projects, however, many database construction companies and their customers are suffering from the underestimated or overestimated budgets, resulting in financial problems or social loss in the public sector. Thus, the purpose of this study is to develop the cost estimation system for the governmental database construction projects. Based upon strategic considerations and basic principles, the database construction process is divided into the work elements, which are independent of the content types. Because the working environment also affects the productivity of the database construction, the adjustment factors for each work element are defined. The proposed cost estimation system consists of 18 elementary activities, which classified into 8 activity groups. The standard time for each activity is determined by measuring the actual work performance on the real-world project sites, and the adjustment coefficients are determined by surveys to the experts. The accuracy of the cost estimation system is demonstrated by applying the system onto the previously executed projects. We expect this proposed system can increase the correctness of the database construction budgets and improve the business condition of the relevant industry.

      • 대전광역시 지리정보체계 구축의 기본방향

        강경원 公州敎育大學 敎育硏究所 1996 公州敎大論叢 Vol.33 No.2

        GIS의 등장은 지도학적 발전을 넘어 실생활에 다양한 혜택을 주는 유용한 도구로서 자 리매김을 하고 있다. 그 유용성을 인식한 나머지 세계 각국, 우리나라, 지방 등 다양한 지 역의 차원에서 정부와 민간은 GIS의 도입과 개발을 서두르고 있다. 대전광역시에서도 이 에 대한 관심을 갖고 이의 도입을 추진하고 있으나 초기 단계에서 흔히 직면하는 기술적 안 제약과 인력 및 재원의 부족으로 애로를 겪고 있다. 본 연구에서는 대전시의 지리정보시스템의 추진현황을 살펴보고 개발수요를 조사 분석함으 로써 GIS도입 전망을 파악하였으며 아울러 문제점을 도출하여 GIS개발의 목표와 과제를 선 정하였다. 그리고 대전광역시의 실정에 맞는 개략적인 GIS의 개념설계를 시도하였다. 대전시의 지리정보시스템의 구축을 위해서는 다른 여러 가지 전략과 방법이 함께 적용 되어야 하겠으나 현실적으로 보아 무엇보다도 시급한 것은 GIS추진위원회의 구성과 기본 계획의 수립이다. 이는 GIS개발의 주체를 정하여 적극적으로 추진하고 책임의 소재를 명 확히 할 필요가 있기 때문이다. 또한 계획에 의거하여 합리적인 절차에 따라 사업이 추진 되어야 한다. GIS의 구축은 여러 가지 관점에서 중대한 사업이므로 동반하는 어려움이 매 우 많다. 이 난관을 극복하기 위해서는 대전시는 비용,시간,노력의 중복투자를 최소화할 수 있는 종합적인 기본 계획을 필요로 하는 것이다. 현재 추진 중인 국가지리정보체계(NGIS)와 보조를 맞추어 개발을 추진함은 당연하나 NGIS의 단점을 보완할 수 있는 독자적인 지리정보체계의 구축을 시도하는 편이 바람직할 것이며 이에 필수적인 대전시 나름의 데이터베이스의 표준화가 요망된다. 또한 장기적 안 목에서 위성측위체계(GPS)와의 접목을 통한 보다 유용한 지리정보체계의 구축이 기대되 며 이를 위한 적극적인 연구가 요망된다.

      • KCI등재

        국가R&D보고서 참고문헌 기술항목 구축 개선방안 연구

        이강산다정,이혜진,현미환 한국융합학회 2022 한국융합학회논문지 Vol.13 No.1

        본 연구의 목적은 한국과학기술정보연구원(이하 KISTI)에서 구축한 국가R&D보고서 데이터베이스의 참고 문헌 데이터를 분석하여, 문제점을 도출하고 시스템 상의 구축 기술항목의 보완점을 찾는 것이다. 이를 위하여 KISTI DB에 등록된 국가R&D보고서의 참고문헌 기술 현황을 조사하고 현재 구축과정 및 지침, 유형, 항목 등의 구분의 작성 내용을 분석하였다. 이를 바탕으로 DB로 구축한 참고문헌 유형의 구분 결과에 대하여 적절성 및 정확성을 확인하였다. 그 결과 시스템으로 구축한 항목의 문제점과 구축 지침의 수정사항을 도출하였다. 이를 통해 데이터베이스 구축이 효율적으로 진행되도록 시스템 변경사항을 도출하여 데이터 품질이 향상될 것으로 기대된다. 또한 기술규정 표준화를 통하여 향후 제공할 수 있는 융합 서비스 방안에 대하여 후속 연구를 제안하였다. The purpose of this study is to analyze the reference data of the National R&D Report database built by the Korea Institute of Science and Technology Information(KISTI) to derive problems and to find complementary points for the construction technical items in the system. To this end, we investigated the descriptions of references in the National R&D Report constructed in the KISTI DB and analyzed the construction process, guidelines, types, items, etc. Based on this, the appropriateness and accuracy of the classification results of the reference types constructed with the DB were checked. As a result, the problems of the items built into the system and corrections to the construction guidelines were derived. Through this, database construction can proceed efficiently and data quality is expected to improve. In addition, a follow-up study was proposed on the convergence service plan that can be provided in the future through standardization of technical regulations.

      • KCI등재

        국내 학술논문 저자명 전거데이터 구축 방안에 관한 연구

        이석형,곽승진,Lee, Seok-Hyoung,Kwak, Seung-Jin 한국비블리아학회 2010 한국비블리아학회지 Vol.21 No.1

        본 연구의 목적은 국내 학술지, 회의자료 등 학술논문에 나타나는 저자명을 중심으로 저자명 전거데이터를 구축하기 위한 방안과 이를 적용한 전거데이터 구축시스템을 제시하는데 있다. 학술논문 저자명 전거데이터를 구축하기 위해 저자명 식별 요소를 분석하고 이를 토대로 저자 식별방법을 제안하였으며, 국내 학술논문의 저자명을 대상으로 실제 저자명 전거레코드를 구성하였다. 또한, 학술논문의 입수주기 및 규모를 고려하여 학술정보 데이터베이스구축과 동시에 전거데이터가 구축, 관리되고 학술정보 서비스와 연계될 수 있도록 학술논문 관리시스템과 서비스시스템과 본 연구의 제안 시스템이 상호 연계성을 가질 수 있도록 설계되었다. In this paper, we proposed the effectively method for constructing of name authority data in korean academic papers and designed the authority database system that is applied the method. For these, we analyze the requisite for identifying the author name and suggest the author identification method. Because construction of name authority record costs time and effort, and considering frequently period of large-scale acquisitions of academic papers, our suggestion includes the system that be able to manage and construct the name authority database, and that is tightly connected with the academic paper management and service systems.

      • KCI등재

        문학 및 작가 연구와 DB의 활용 -김수영 DB ‘별길’의 데이터 분석 사례를 중심으로

        김지아,김재원,유시어도어준 연세대학교 인문학연구원 2022 人文科學 Vol.124 No.-

        This study aims to propose a method of using digital humanities methodology for literature and writer research in the field of modern literature. Therefore, this paper introduces cases of database construction in which literature information and data are structured and modeled into a single database and examines the research trends of specific literature research using data cases inquired in the DB. The database used in this study is "Byul-gil," a Kim Soo-young literature research DB established by a research team affiliated with the Department of Korean Language and Literature at Yonsei University. The DB was built to contain all the articles related to Kim Soo-young for the user’s usefulness and convenience. However, this study does not stop there; it explores how this built database can be studied and utilized as academic knowledge, not just a set of data. Therefore, we conducted a historical and contemporary analysis of Kim Soo-young's research by inquiring about the data of "Byul-gil." As a result, it was found that research on Kim Soo-young's literature started in 1985 and is currently ongoing, but was most actively studied in 2013 and 2018. Furthermore, this study tried to capture the difference between studies conducted between 2013 and 2018 by a qualitative method of examining the study of Kim Soo-young's literature on a yearly basis. To that end, we calculated the number of papers by keyword provided by the database and presented a list of top keywords by year. As a result of examining the list, it was found that in the case of the top-level keyword, the number of papers studied on related topics around a specific year is small. The significance of this study is that it provides an opportunity to view existing syntactic researchers through digital humanities methodology in the age of computational turn. In particular, in modern literature, research on not only writers and literature but also images and popular cultural content is continuously carried out, so related research using the methodology is required. 본 연구는 디지털 인문학 방법론을 현대문학 분야에서 문학 및 작가 연구에 활용하는 방안을 제안하는 것을 목적으로 한다. 이에 본고는 문헌 정보와 자료를 하나의 데이터베이스로 구조화 및 모델화한 데이터베이스 구축 사례를 소개하고 해당 DB에서 조회되는 데이터 사례를 활용해 특정 문학 연구의 연구 경향에 대해 살펴본다. 먼저 본 연구에서 활용하는 데이터베이스는 연세대학교 국어국문학과 소속 연구팀에서 구축한 김수영 문학 연구 DB인 ‘별길’이다. 해당 DB의 구축은 온전히 김수영 문학 연구에 대한 자료가 필요한 사용자의 원활하고 정확한 검색, 즉 사용자의 유용성과 편의성을 목적으로 한국학술지인용색인(KCI)에서 제공하는 검색 서비스를 통해 조회가 가능한 김수영 관련 논문 전반이 수록되었다. 여기서 그치지 않고 본 연구는 이 구축된 데이터베이스가 단순히 학술적 정보 및 자료의 집합이 아닌 학술적 지식으로서 연구되고 활용될 수 있는가에 대한 의미화 작업을 시도한다. 이에 본 연구는 ‘별길’의 데이터를 조회해 김수영 관련 연구의 역사적·통시적 분석을 실행한다. 그 결과, 김수영 문학 관련 연구는 1985년부터 시작되어 현재까지 진행 중에 있는데 2013년도와 2018년도에 가장 활발하게 연구되었다. 나아가 본 연구는 김수영 문학 연구를 1년 단위로 살펴보는 정성적 방법을 통해 2013-2018년 사이에 이루어진 연구들 간의 미세한 변화를 포착하고자 했다. 이를 위해 별길이 제공하는 주제어 별 논문 편수를 계산한 후에 연도별로 상위주제어 목록을 제시하고, 최상위 주제어의 경우에 특정 연도 전후로는 관련 주제로 연구된 논문의 편수가 확연하게 적은 편수를 기록하는 현상을 발견한다. 이에 더해 본 연구는 연구의 대상이 된 김수영의 작품을 온톨로지로 엮어 시각화하고 논문들 간의 관계성 및 그것들이 공유하는 맥락을 도출한다. 본 연구의 연구사적 의의는 디지털 전환의 시대에 기존의 통시적 연구사를 디지털 인문학 방법론을 통해 새롭게 조망하는 계기를 제공한다는 점에 있다. 특히 현대문학 분야에서는 작가 및 문학에 대한 연구뿐만 아니라 영상 및 대중문화 콘텐츠에 대한 연구가 지속적으로 이루어지고 있는 바, 해당 방법론을 활용한 관련 연구의 착수가 촉구된다.

      • KCI등재

        수집 데이터 기반 경량 이상 데이터 감지 알림 시스템 개발

        조우진,구재회 국제문화기술진흥원 2024 The Journal of the Convergence on Culture Technolo Vol.10 No.1

        Due to global issues such as climate crisis and rising energy costs, there is an increasing focus on energy conservation and management. In the case of South Korea, approximately 53.5% of the total energy consumption comes from industrial complexes. In order to address this, we aimed to improve issues through the 'Shared Network Utility Plant' among companies using similar energy utilities to find energy-saving points. For effective energy conservation, various techniques are utilized, and stable data supply is crucial for the reliable operation of factories. Many anomaly detection and alert systems for checking the stability of data supply were dependent on Energy Management Systems (EMS), which had limitations. The construction of an EMS involves large-scale systems, making it difficult to implement in small factories with spatial and energy constraints. In this paper, we aim to overcome these challenges by constructing a data collection system and anomaly detection alert system on embedded devices that consume minimal space and power. We explore the possibilities of utilizing anomaly detection alert systems in typical institutions for data collection and study the construction process.

      • KCI등재
      • KCI등재

        남북 의료 용어 데이터베이스 구축의 쟁점과 실제

        박주원(Park, Juwon),김숙정(Kim, Sukjeong),도원영(Doh, Wonyoung) 한국사전학회 2021 한국사전학 Vol.- No.38

        본 연구는 남북 의료 용어 데이터베이스를 구축하면서 고려한 쟁점과 실제 처리 방안을 보이는 데 목적이 있다. 본고는 의료 용어를 증상 자각, 진단, 치료의 보건의료 스크립트 내에서 사용되는 용어 중 공공의료 체계에 수렴된 정제된 형식의 용어로 규정하였다. 이에 부합하는 자료로서 KCD와 건강보험 EDI를 분석하였고, 이들로부터 남측 의료 용어를 추출하기 위해 용어화가 필요하며 그 기준과 절차가 어떠한지 밝혔다. 북측 의료 용어는 남측 용어와 대조하는 방식으로 목록을 확보하였고, 이때 일대일 대응형뿐만 아니라 이를 이용한 조합형 생성의 가능성과 조합형 생성 시 유의점을 강조하였다. 마지막으로 관련 정보들을 담아 낼 데이터베이스를 구조화할 때 고려해야 하는 문제들을 논의하였다. 작업의 효율성, 정확성을 높이기 위해 수집된 정보 중 기준 정보를 선택하여 표제어를 설정해야 하며, 다양한 용어의 수집 가능성을 인지하고 이를 통제하여야 함을 지적하였다. 이와 함께 의료 용어에 적용 가능한 분류 체계의 기준도 살폈다. This paper aims to examine the issues to be considered when building North and South Korean public medical terminology database, and to introduce how to deal with them in practice. ‘Public medical terminology’ using in this study is defined as well-arranged terms converging to the public health care system. According to this definition, KCD and EDI for national health insurance are chosen as primary data. South Korean public medical terminology is selected and refined from these data based on certain standards and procedures. North Korean public medical terminology is confirmed by contrast between North and South Korean. It can include not only words matching exactly but also words made by combination. As to structuralizing a database, it should be considered how to set headwords and control a variety of information and which classification system to apply to effectively manage medical terminology.

