RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 학위유형
        • 주제분류
          펼치기
        • 수여기관
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 지도교수
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • PDF 문헌에서의 핵심문장 자동 추출 연구

        정선기 경기대학교 대학원 2024 국내석사

        RANK : 247807

        This study aims to enhance user convenience in providing documents by focusing on extracting primarily declarative/modifying sentences from the entire body text of PDF documents. Through the refinement of this data into sentences with formal consistency and the study of its semantic normalization, this study aims to construct a database ultimately. To extract textual information from PDF documents, a structural approach to the PDF format itself is still essential. However, in the current context where research outputs such as academic papers and research reports are being actively produced more than ever before, the format of documents varies depending on the publishing institution or organization and the author, each having its unique document writing style. This presents a limitation to the method of structural access to PDF through which extraction rules cannot be applied to new forms of documents due to the inherent characteristics of the internal structure of PDF files. To overcome this limitation, performs rule-based extraction according to structural interpretation. Instead, it extracts all sentence-type information from the document and refines it using a deep learning-based pre-trained Korean language model, thereby conducting basic sentence data extraction. In addition, conducted research on building a database using the morphological and semantic similarity of sentences based on the extracted sentences. The summary of the study is as follows. First, this study performed fine-tuning of a deep learning-based pre-trained Korean language model to automatically extract textual information from PDF documents, with a specific focus on classifying and refining sentences that constitute the main body. Extracted textual information from 200 randomly selected research reports publicly available on the National Knowledge Information System(NKIS). The extracted information was then categorized into four classes, and this served as the training data for fine-tuning. To classify sentence data constituting the main body, a comparative experiment was conducted using fine-tuned language models of five types. The fine-tuned model using KLUEBERT achieved an accuracy of 87.9% and an F1 Score of 84.0%. Second, This study conducted a study on the morphological and semantic normalization of data to build a database using sentences in main text area. For morphological normalization, constructed predicate-argument structure data where subjects and objects depend on predicates, focusing on the predicate of the sentence. We manually created a dataset of 1,000 entries to fine-tune a large language model (LLM) for future construction of a large-scale dataset. Fine-tuning three types of LLMs and conducting performance comparison experiments, the KoAlpaca–Polyglot 5.8B model achieved 44.6% BLEU and an average of 47.8% ROUGE-N(1-4). For the study of semantic normalization of data, multiplied the basic form of sentence data, weighted by TF-IDF, with the data transformed into predicate-argument structure. Using cosine similarity, formed clusters of similar sentences present in different documents on homogeneous topics. Qualitatively comparing the results, it was observed that the data transformed into predicate-argument structures formed more similar data clusters than the basic form of sentence data. 이 연구는 PDF 형식 문헌의 본문영역 전체를 대상으로 주로 서술식/개조식 문장을 추출하여 형태적 일관성을 가지는 문장 데이터로의 정제와 이것의 의미적 정규화 연구를 통하여 데이터베이스를 구축, 궁극적으로 문헌의 제공에 있어서 이용자 편의를 향상하는 것을 목적으로 한다. PDF 문헌에서 문자형 정보를 추출하기 위해서는 여전히 PDF 파일의 전산구조적 분석과 문헌 서술구조의 이용이 필수적이다. 그러나 학술논문, 연구보고서 등의 연구성과물이 과거의 여느 시점보다 활발하게 도출되는 현재에는 문헌을 출판하는 기관·단체에 따라서, 저자에 따라서 고유한 문헌 작성 양식을 가진다. 이는 PDF 파일 내부 전산구조의 특징이 되거나, 새로운 양식으로 작성된 문헌의 도출로 이어져 PDF의 전산구조적 접근, 혹은 문헌의 서술구조를 이용하는 방법으로는 새로운 양식의 문헌에 이전의 추출규칙을 적용할 수 없는 한계점이 발생한다. 이 연구에서는 이를 극복하기 위하여, 구조적 해석에 따른 규칙기반 추출을 최소화하여 문서 내 모든 문자형 정보를 추출하고, 이를 심층학습 기반 한국어 사전학습 언어모델을 이용한 분류체계를 구성하여 불필요한 영역에 속하는 정보를 분류하여 정제하는 방법으로 문헌 본문영역 전체를 구성하는 문장 데이터의 자동추출을 실시하였다. 그리고, 추출된 문장을 기반으로 하여 문장의 형태적·의미적 유사성을 이용한 데이터베이스를 구축하는 연구를 수행하였다. 연구결과를 요약하면 다음과 같다. 첫째, PDF 형식 문헌에서 자동으로 문자형 정보를 추출하고, 특히 본문을 구성하는 문장을 분류하여 정제할 수 있는 심층학습 기반 한국어 사전학습 언어모델의 미세조정을 수행하였다. 국가정책포털 에 공개된 무작위 연구보고서 200권에서 문자형 정보를 추출하고, 이를 네 가지 분류로 표지부착을 수행하여 미세조정을 위한 학습데이터를 구축하였다. 본문을 구성하는 문장 데이터를 분류하기 위하여 미세조정된 5종류의 언어모델을 통한 비교실험 결과, KLUEBERT를 이용한 미세조정 모델이 정확도 87.9%, F1 Score 84.0%를 기록하였다. 둘째, 문헌 내 본문영역을 구성하는 문장을 활용하여 데이터베이스의 구축을 위하여 데이터의 형태적·의미적 정규화 연구를 수행하였다. 문장의 형태적 정규화를 위하여 문장의 서술어를 중심으로 주어와 목적어가 서술어에 종속되는 술어-논항 구조 데이터를 구성하였으며, 향후 대규모 데이터를 구축할 수 있도록 데이터 1,000건을 수작업 구성하여 대규모 언어모델(LLM)의 미세조정을 수행하였다. 3종의 LLM을 미세조정하여 성능 비교실험을 실시하여 KoAlpaca–Polyglot 5.8B 모델이 BLEU에서 44.6%, ROUGE-N(1-4)에서 평균 47.8%를 도출하였다. 데이터의 의미적 정규화 연구를 위하여 TF-IDF로 가중치를 곱한 기본적 형태의 문장 데이터와, 이를 술어-논항 구조로 변환한 데이터를 각각 코사인 유사도를 이용하여 동질 주제의 다른 문헌에 존재하는 유사문장과 군집을 이루도록 하였으며, 정성적 비교 결과 기본적 형태의 문장 데이터보다 술어-논항 구조로 변환한 데이터가 더 유사한 데이터군집을 이루는 것을 확인하였다.

      • PDF 파일의 페이지단위 복구 기법

        장지원 고려대학교 정보보호대학원 2017 국내석사

        RANK : 247807

        안티 포렌식 기법 중 하나인 데이터 삭제 기법은 그 행위의 단순함에 비해 포렌식 분석 관점에서의 그 영향력은 상당하다. 학계에서는 데이터 삭제 기법에 대응하여 지속적으로 삭제된 파일 복구 기법에 대해 연구하였으며, 대표적으로 파일시스템 기반 파일 복구 기법과 파일 포맷 기반 복구 기법이 존재한다. 파일이 삭제되고 난 후 해당 파일의 메타데이터가 파일시스템 상에 존재한다면, 이를 이용하여 손쉽게 파일을 복구할 수 있으나, 메타데이터가 존재하지 않는 경우엔 시그니처 기반 카빙 기법을 이용하여 파일을 복구하거나 파일 포맷에 기반한 복구기법을 적용해야 한다. 이때 파일 포맷에 기반한 복구기법은 파일 구조에 대한 분석과 복구 가능한 기법이 제시되어야 한다. 본 논문은 PDF 파일의 구조적 특성에 기반한 삭제된 PDF 파일의 페이지 단위 복구 기법을 제시한다. 해당 기법은 PDF 파일의 1개 페이지를 구성하는 Page Object의 태그 값을 이용한다. 각 태그 값을 일종의 시그니쳐로서 활용하여 Object를 추출하며, 추출된 Object들을 분석하여 PDF파일의 메타데이터를 재조합한 후 페이지 단위로 재구성한다. 페이지 단위로 복구한다는 것은 삭제된 PDF 파일이 온전하지 않더라도 PDF 파일을 구성했던 일부 페이지라도 복구할 수 있음을 의미한다. 해당 기법을 이용하면 온전하지 않은 상태의 PDF파일에 대한 복구가 가능하다. 이는 디지털 포렌식 분석 관점에서 기존보다 더 많은 데이터를 복구하는데 활용될 수 있다.

      • PDF를 적용한 한국의 고문서 디지털화 방안에 관한 연구

        정나영 숙명여자대학교 대학원 2002 국내석사

        RANK : 247807

        본 연구에서는 PDF를 적용한 한국의 고문서 디지털화 활용 방안 에 관하여 고찰하였다. 먼저 한국의 고문서 개념과 종류들을 고찰하 고 국내외 고문서 디지털화 사례 등을 살펴본 뒤, PDF를 적용한 고 문서의 원문을 디지털화하는 작업을 수행하면서 발생하는 문제점과 사례 등을 비교·분석하여 보다 많은 이용자가 고문서를 친근하고 편리하게 접근할 수 있는 활용 방안을 제시하였다 고문서의 원문 활용에 대하여 4가지 방법의 실례로 들었는데 첫 번째는 고문서 <한글> 97 파일의 PDF텍스트파일 변환, 두 번째는 고문서 <한글> 97 파일의 PDF이미지파일 변환, 세 번째는 고문서 <한글> Wordian 파일의 PDF텍스트파일 변환, 마지막으로 네 번째 는 고문서 기존 이미지파일(TIFF, JPG)을 PDF이미지파일로 변환한 경우였다. 변환 결과, 세 번째의 <한글> Wordian 파일을 PDF텍스트파일로 변환한 경우가 가장 적은 저장 용량을 차지하였고 변환율도 우수하 였으며 텍스트파일로 디지털화하는 데에 수월하였다. 기존 이미지파 일에서는 JPG보다 TIFF가 PDF로 변환하는데 더 적합하였으며 저 장 용량도 더 적게 차지하였다. 고문서 디지털화의 수준이 미약한 현 시점에서는 PDF텍스트파일 과 PDF이미지파일로 나누어 우선적으로 단계적인 디지털화를 시작 하는 것도 바람직한 방법이 될 수 있다. 즉, 상대적으로 중요도와 이용도가 높은 고문서나 우리나라 고문서를 대표할만한 국보급이나 보물급 고문서, 역사적인 사료로서 중요한 가치를 가지고 있는 고문 서 등 우선 순위(Priority)가 높은 고문서들은 PDF텍스트파일로 구 축하여 서비스하고, 중요도가 상대적으로 낮은 고문서들은 PDF텍스 트와 PDF이미지파일 중에 하나를 선택하여 제공하거나 기존의 TIFF나 JPG파일로 서비스했던 정보들은 PDF이미지파일로 전환하 여 서비스할 수 있을 것이다. 또한 각각의 고문서 정보가 가지는 특성에 따라 내용적인 측면이 보다 중요하다면 텍스트 정보를 위주로 구축하여 자세하고 이해하 기 쉬운 해제와 함께 서비스하고, 내용적인 측면보다 고문서 자체가 가지는 물리적인(physical) 측면이 보다 가치 있다면 이미지정보를 좀 더 부각시켜 차별적인 서비스를 제공할 수 있어야 할 것이다. 보 다 국가적인 차원에서 고문서를 디지털화하고 관리하여 이용자가 보다 손쉽게 고문서에 접근하고 그것을 효율적으로 활용할 수 있도 록 지원되어야 하며 여기에 맞는 이용자 교육과 정보서비스의 질적 향상과 제공되는 포맷 등의 업데이트에도 역점을 두어 이용자 중심 의 양질의 정보를 제공해야 할 것이다. In this thesis, digitalization of Korean paleographs was analyzed. The concept and the types of Korean paleographs were explained, and some digitalization cases were shown. After that, problems arisen during digitalization process of original paleograph text and the examples were compared and analyzed for easier and convenient access of paleographs. There were 4 concrete cases given. First case is converting a paleograph <한글> 97 file into PDF text file. Second is converting a palegraph <한글> 97 into PDF image file; third is converting a paleograph <한글> wordian file into PDF text file. Fourth and the last concrete case is converting a existing paleograph image file(TIFF, JPG) into PDF image file. After comparing the conversion results given above, we found out that the third case, which is converting <한글> wordian file into PDF text file took the least memory space and was excellent in conversion ratio. Also, it was much easier to digitalize into text file. In conversion of existing image file, TIFF was more adequate than JPG to convert into PDF. At the present stage, since the paleograph digitalization isn't fully established yet, gradual digitalization, allocating PDF text file or PDF image file should be desirable. Paleographs with high priority, such as paleographs on the level of national treasures, paleographs as valuable historical records, important paleographs in frequent use, should be served in PDF text file. Paleographs with lower priority should be served in PDF text or PDF image file. Also, information which has been served in existing TIFF or JPG file should be served after being converted into PDF image file. Depending on the characteristics of the information, if the contents are more important, text-oriented digitalization should be established. If the physical aspect of the paleographs is more important than the content aspect, image information should be more emphasized for the better and distinctive service. By providing national level of digitalization support and management, users should be able to access paleographs easily and to use them efficiently. Besides, user education, quality improvement in information service, update of formats should be offered for the user-centered quality information.

      • PDF를 이용한 이기종 PLM 시스템의 CAD 데이터 관리 방안 연구

        최병배 서울과학기술대학교 산업대학원 2012 국내석사

        RANK : 247807

        PLM (Product Lifecycle Management) systems are now widely used in many areas of industry where in past the design and manufacture of products relied on manual processes or on the accumulated experience of skilled craftsmen. This is because efficiency and time-to-market are the key factors to success in today’s competitive market. PLM is the process of managing the entire lifecycle of a product from its conception, through design and manufacture, to service and disposal. In fact, CAD/CAM/CAE systems are key components of PLM systems. In general, it may be necessary to exchange exact geometry between different PLM systems. This is because a supplier uses a different PLM system than the one used by the manufacturer or others. Hence, there exists an increasing need for vendor neutral data formats that allow the digital exchange of information among heterogeneous PLM systems. Although several neutral data formats such as IGES, DXF, and STEP are available, they are not perfect yet in exchanging exact geometric data. In general, all the users in a PLM system need to have a fast and easy access to the geometry and dimensions of products. However, PLM systems currently used in defense R&D, deal with various types of 2D/3D CAD files and technical documents without appropriate regulations or standards. Furthermore, they frequently encounter routine obstacles such as font breakage and slow viewing speed in case of large CAD files that contain the design history. In this context, this thesis presents a study on the management of CAD data from heterogeneous PLM systems by using PDF(Portable Document Format). PDF has an advantage in that various types of 2D/3D CAD files and most types of document files can be converted into a unified file format. In addition, using PDF can reduce the file size and prevent the illegal modification of files by using data coding and compression technology. In this study, several 3D CAD models were first designed by using commercial CAD systems such as CATIA, Pro/E, and I-DEAS. Each CAD file was then converted into a PDF file and compared with each other in terms of the file size, the exactness of geometry, loss of the design history, and so on. Based on the analysis, it can be concluded that the CAD data management can be much improved by using PDF. 우리 주위에 만들어지는 제품 설계는 대부분이 2D 도면을 직접 드로잉하거나 CAD(computer aided design)를 이용하여 제품을 설계하거나 수정을 하였다. CAD로 설계함으로써 설계되고 있는 도면은 다양한 한글폰트로 CAD 도면이 작성 되고 있다. 그리고 기존의 2D 즉 X, Y 축으로 평면설계에서 지금의 3D 즉 X, Y ,Z 라는 3차원의 입체적 설계를 하게 되면서 가공 및 제작상 시간을 단축하게 되었다. 현대 기술 발달로 인해 3D라는 입체적인 설계분야가 발전하고 있지만 아직까지 제품 제작시 필요한 도면은 2D로 작성된 CAD 데이터로 관리되고 있다. 현재 국방에서 사용하는 PLM(Product Lifecycle Management)을 이용한 형상관리시스템에는 다양한 업체들이 사용하고 있는 이기종(異機種) 2D/3D CAD의 설계도면, 기타 기술자료가 사용되고 있으나 적절한 규정이 없이 설계되고 있어 아직까지는 표준이 정립되지 못한 상태이다. PLM시스템 안에서 이루어지는 형상관리를 이용하는 모든 사용자가 형상 확인 및 치수 등 관련된 자료 검색을 빠르게 실행하여야 한다. 그러나 일부 큰 용량의 2D와 3D CAD를 사용하면 CAD의 History(이력)를 포함하여 파일의 용량이 크고 웹(Web)에서의 전송 속도가 걸려 Viewing 속도가 늦고 뷰어에서 형상 및 글씨의 깨짐 현상이 발생하고 있다. PDF(Portable Document Format)의 장점을 이용하여 다양한 2D/3D CAD파일 및 형상에 관련된 자료파일을 하나의 파일포맷으로 통합관리 할 수 있다. 이에 본 연구에서는 PDF을 이용한 PLM 통합서버 관리를 연구 하였으며, 특히 PDF File를 활용시 이기종 CAD를 사용하더라도 형상 확인이 가능하고, 대부분의 문서가 표현 가능하고, 통합적 서버 관리가 유용하고, Data 용량이 작고, 암호화 및 압축 기술을 통해 내용의 변조가 어렵다는 장점을 가지고 있다. 이는 하나의 내부적인 서버 뿐 만이 아니라 웹상에서도 빠르게 접근하여, 고가의 이기종 CAD를 사용하여 발생하는 자료(Data) 공유, 자료의 빠른 접근(Access) 및 경제적인 측면을 연구하였다. 결론적으로 전 세계적으로 사용하고 있는 PDF를 이용하여 형상정보체계의 PLM 통합서버에서 2D, 3D CAD File을 합리적으로 관리하는 방법을 연구 하였다. 즉, 대표적인 3D CAD를 이용하여 동일한 모델을 모델링하여 활용한 경우와 PDF로 변환하여 활용한 경우를 연구하였으며, Data Size의 감소에 따른 형상 및 치수에 대한 연구를 하였다.

      • 3차원 CAD 뷰어 기반 대화형 PDF 문서 자동 생성 시스템

        박경호 중앙대학교 대학원 2008 국내석사

        RANK : 247806

        제품 개발에서 3D CAD의 도입이 증가하고 있으며 이러한 3D 데이터의 부서간 공유를 위하여여 PDM 및 뷰어 등의 시스템을 활용이 증가하고 있다. 표준 문서 포맷인 PDF는 3D 데이터의 공유 및 정보 교환을 목적으로 문서 내에서 3D 콘텐츠를 포함할 수 있도록 확장되었다. 이러한 PDF의 3D 기능을 엔지니어링 응용 분야에 활용하게 되면 부서 간 또는 협력사간 커뮤니케이션이 보다 명확해 질 수 있다. 본 연구에서는 상용 3D 뷰어와 같은 응용 프로그램에서 3D 데이터가 포함된 정형화된 엔지니어링 문서의 작성을 자동화하기 위한 시스템을 개발하였다. 시스템은 U3D 변환 모듈과 PDF 변환 모듈 2개의 모듈로 구성이 되었다. U3D 변환 모듈은 상용뷰어 시스템과 연계하여 뷰어상의 3D모델의 형상정보, 조립정보, 분해정보를 추출하여 U3D로 변환하는 모듈이다. PDF 변환 모듈은 뷰어로 부터 변환된 U3D 파일과 설계와 관련된 주석 정보, 사용자가 PDF 문서 내에서 조립체의 조립 및 분해 등의 조작을 직접 할 수 있도록 하는 자바스크립트를 PDF에 적용토록 하는 모듈이다. U3D 변환 모듈과 PDF 변환 모듈을 통하여 3D 데이터를 사용자가 직접 조작 가능한 대화형 PDF 문서를 자동으로 생성할 수 있다. PDF is widely accepted as a standard document format and now it supports 3D contents as well. Within the engineering application areas, this new 3D feature may be used to support sharing of 3D documents and thus collaboration between engineering departments, suppliers and partners. In this paper, we describe a system that automatically generates formatted engineering documents including 3D data converted from 3D applications such as commercial 3D CAD viewer. The system consists of two major modules. One is U3D conversion module and the other is PDF conversion module. U3D conversion module extracts geometry, view data, assembly and disassembly information from 3D viewer and converts to U3D format, currently in IDTF text file format. PDF conversion module generates a PDF file and inserts U3D data, various annotation information, and scripts for custom generated operations such as assembly and disassembly in the PDF document.

      • Screening of Novel Antibiotics Inhibiting Bacterial Peptide Deformylase(PDF) : 세균의 Peptide Deformylase(PDF)를 저해하는 새로운 항균물질의 스크리닝

        김현주 Handong Global Uniersity 2005 국내석사

        RANK : 247805

        Peptide deformylase (PDF)는 세균의 단백질 생합정 과정에 있어 필수적인 효소인 반면 포유동물의 세포에서는 요구되어지지 않기에 새로운 항생 물질의 개발을 위한 좋은 target으로 알려져 있다. 세균에서의 단백질 생합성은 formylated methionine 로 시작되며 peptide가 합성되는 동안 formyl group은 peptide deformylase (PDF)에 의해 제거되어지고 mature단백질이 생성된다. 본 연구에서는 pET-14b 백터에 클로닝한 Staphylococcus aureus 6538p의 pof 유전자를 Escherichia coli BL2l(DE3) 에 형절전환시켰다. PDF 단백질은 Isopropy1-β-D-thiogalactopyranoside (IPTG)의 유도에 의해 대량 발현되어졌고 N-말단에 histine 이 연속적으로 6개가 붙어있는 fusion 단백질인 PDf 는 nickel-nitrilotriacetic acid (Ni-NTA) metal-affinity chromatography를 이용하여 순수 분리되어졌다. 순수 분리 정제된 PDf 효소의 활성을 확인하기 위해, PDF/FDH coupled assay 방법을 응용하였다. PDf의 기질로 사용되는 formy-Methionine-Alanine-Serine (fMAS)로부터 peptide deformylase (PDF)에 의해 생성된 formate 가 다시 formate dehydrogenase (FDH)에 의해 산화 되어지는데, 이때 부산물로 생성되는 NADH의 양을 340 nm에서 측정함으로써 PDF의 활성정도를 간접적으로 측정되었다. 75,000 개의 화합물 은행과 토양 미생물 배양액이 본 연구에서 확립된 PDF 저해제 검색계를 이용하여 평가되어졌다. 그 결과 약 150개의 화합물 (0.2 %)이 25 μM에서 50 % 이상의 저해 효과를 보였으며,그 중 12개는 Staphylococcus aureus에 대해 항균 효과도 보였다. 이들 증 4개는 컴퓨터 모델링을 통해 PDF와 결합한 구조를 추측해 보았다. Peptide deformylase (PDF) is essential and unique to bacteria for cytoplasm protein synthesis, but not required in mammalian cells, thus making it an attractive target for the discovery of novel antibacterial drugs. Protein synthesis in eubacteria begins with a formulated methionine, and the formal group of the nascent polapeptide is removed by peptide deformalase (PDF) to produce a mature protein. In this study, a def gene from Staphylococcus aureus 6538p was cloned in pET-14b vector and transformed into Escherichia coli BL21(DE3). PDF protein was overexposed by addition of Isopropal-β-D-thiogalactoparanoside (IPTG). NH_(2)-terminal His-tagged PDF protein was purified by nickel-nitrilotriacetic acid (Ni-NTA) metal-affinity chromatography. Enzymatic activity of purified 6xHis-tagged PDF was tested on the substrate, formal-Methionine-Alanine-Serine (fMAS), by formats dshadrogsnass-couplsd spectrometric assay. For the discovery of new PDF inhibitors from chemical libraries and culture booths of soil bacteria, a target-oriented screening system ' a 96-well plate was developed. About 75,000 commercial chemical libraries were tested in this screening system. About 150 chemicals (0.2 %) inhibited more than 50 % PDF enzyme activity at 25 μM, and twelve chemicals among them have antibacterial activity also against Staphylococcus aureus. The structure of PDF-inhibitor complex was proposed by computer modeling.

      • Three dimensional structures of MetC, AroB, and PDF from Xanthomonas oryzae pv. oryzae and virtual screening of putative antibacterial drug candidates based on the structures : MetC, AroB 와 PDF 의 삼차원 구조연구와 그 구조에 기반을 둔 벼흰 잎마름병에 대한 병 방제

        고호푸옹투이 건국대학교 대학원 2009 국내석사

        RANK : 247803

        벼는 동남 아시아를 비롯한 많은 나라에서 주식으로 쓰이는 작물이며, 벼흰잎마름병은 벼흰잎마름병균에 의해 유도되어진다. 벼흰잎마름병균은 벼농사에 문제를 일으키는 가장 중요한 병원균이며, 2006년에는 한국에서만 1000억원의 손실을 입혔다. 그러나 현재까지 효과적인 병방제약제가 존재하지 않고 있는 실정이다. 최근 벼흰잎마름병균의 전체 게놈서열이 결정되었고, 그 4,538개 유전자로 부터 100여개의 drug target 유전자가 선정되었다. 그 중에 일부는 벼흰잎마름병균의 생존에 필수적인 유전자이며, 일부는 병원성을 일으키는데 중요한 작용을 한다. XooPDF와 XooAroB는 생존에 필수적이며, XooMetC는 병원성을 일으키는데 중요한 역할을 하는 유전자이다. Peptide deformylase (PDF)는 새로 생성되는 peptide chain에서 N-terminal amino-acid인 Met의 N-formyl group을 제거하는 역할을 하며, 이 과정은 미생물 생존에 필수적이다. PDF 결정은 sodium acetate trihydrate를 사용하여 287K에서 얻어졌으며, 2.7 Å resolution 으로 diffraction되었으며, P6122 의 space group에 a = b = 59.0 Å 및 c= 266.3 Å의 unit cell parameter를 가졌다. Asymmetric unit에 한분자가 존재하고, 64.9%의 solvent 함유량을 가졌다. XooPDF의 구조는 molecular replacement로 풀렸으며 R-factor 19%과 R-free 24%로 refine되었다. Cystathionine gamma lyase liked protein (MetC)는 중요한 병원성관련 단백질로 두 가지 다른 모양의 단백질 결정을 얻었다. Plate-shape은 primitive orthogonal space group P212121로 2.9 Å resolution 과 pyramide-shape은 tetragonal space group P41 (or P43)로 3.2 Å resolution으로 diffraction하였다. P212121 space group의 경우 3~4개의 monomer가 asymmetric unit안에 존재해서 solvent 함유량이 59.3내지 45.7%이고, P41 (or P43) space group의 경우 4~5개의 monmer가 asymmetric unit안에 존재해서 solvent 함유량이 52.5내지 40.6%이다. Pyramid-shape의 결정으로 molecular replacement에 의해 구조가 풀렸으며, 구조 model은 R-factor 21.6%과 R-free 29%로 refine되었다. 3-dehydroquinase synthase (AroB)는 shikimate pathway에서 aromatic compounds합성에 중요한 역할을 하며, 순수분리된 단백질은 hanging-drop vapour-diffusion방법에 의해 결정이 얻어졌고 얻어진 결정은 2.5 Å resolution 으로 diffraction되었다. 얻어진 결정은 a = b = 118.2, c=98.2 Å 의 unit cell을 가지는 tetragonal space group P43212를 가지고 asymmetric unit내에 두 개의 단백질 분자를 가지고 solvent 함유량이 40.4%이다. 완료된 MetC와 PDF단백질 구조들을 가지고 ICM virtual screening프로그램으로 병방제약제 선구물질을 찾고있으며 MetC구조로부터 61개, PDF구조로부터 207개의 화학물질을 찾았다. Rice (Oryza sativa L.) is an important staple for human consumption especially in East, South and South East Asia. Bacterial blight (BB) caused by Xanthomonas oryzae pv. oryzae (Xoo) is the most destructive bacterial disease of rice. In 2006, BB resulted in a loss worth 100 million dollars in South Korea. However, there have been no effective anti-bacterial drugs against Xoo. Recently, determination of the whole genome sequence of Xoo provided valuable information for developing antibacterial drugs against Xoo. Approximately, a hundred genes coding essential enzymes from the 4, 538 putative genes of Xoo were selected as drug target protein candidates. There are two strategies for selection of target: (1) protein that are essential for Xoo survival and (2) protein that are essential for Xoo virulence. In this work, two targets of strategy (1), XooPDF and XooaroB, and one target of strategy (2) XooMetC were purified, crystallized and structural study. Peptide deformylase (PDF) catalyzes the removal of N-formyl group from the N-terminal of newly synthesized polypeptides, and this process is crucial for cell survival. Crystals of PDF were obtained using sodium acetate trihydrate as precipitant at 287K. Crystals diffracted to 2.7 Å resolution and belonged to the crystallographic space group of P6122 with unit-cell parameters of a = b = 59.0 Å, and c= 266.3 Å. There are one monomer exists in the asymmetric unit, with a corresponding crystal volume per protein weight of 3.50 Å3 Da-1 and a solvent content of 64.9% . Structure of XooPDF was solved by molecular replacement and was refined to a final crystallography R-factor of 19% and R-free of 24%. Cystathionine gamma lyase liked protein (MetC), an important virulence factor of rice pathogenic bacteria Xoo. Crystals of MetC with two different shapes, plate- and pyramid-shape, diffracted to 2.9 Å and 3.2 Å resolution and belonged to a primitive orthogonal space group P212121 and tetragonal space group P41 (or P43) with unit-cell parameters of a = 73.0 Å, b = 144.9 Å, c = 152.3 Å, and a = b = 78.2 Å, c = 300.7 Å, respectively. For P212121 space group, three or four monomers exist in the asymmetric unit with a corresponding Vm of 3.02 or 2.26 Å3 Da-1 and a solvent content of 59.3 or 45.7%. For P41 (or P43) space group, four or five monomers exist in the asymmetric unit with a corresponding Vm of 2.59 or 2.09 Å3 Da-1 and a solvent content of 52.5 or 40.6%. Data of pyramid-shape crystal was used to solve the structure by molecular replacement. At 2.9 Å resolution, the model was refined to a final crystallography R- factor of 21.6 % and R-free of 29%. 3-dehydroquinase synthase (AroB) plays a role in the synthesis of aromatic compounds via the shikimate pathway. The purified protein was crystallized using the hanging-drop vapour-diffusion method and yielded crystals that diffracted to 2.5 Å resolution. The crystals belonged to the tetragonal space group P43212, with unit-cell parameters a = b = 118.2, c=98.2 Å . According to a Matthews coefficient calculation, the crystal contained two molecules in the asymmetric unit, with a corresponding VM of 2.06 Å3Da-1 and a solvent content of 40.4%. Virtual screening compounds in to the active sites of MetC and PDF structure using ICM program is proceeding to find potent inhibitors. 61 ligands of MetC and 207 ligands of PDF were selected as the lead compound for the first results.

      • 전자기록의 장기적 보존 및 활용을 위한 유형별 문서보존포맷에 관한 연구

        성환혁 韓國外國語大學校 大學院 2008 국내석사

        RANK : 247791

        2000년대 이후 세계적인 IT 강국으로 주목받아 온 우리나라는 전자정부를 표방한 이래 공공기관의 생산기록 중 90% 이상이 전자적으로 생산, 관리하고 있다. 이들 기록의 대다수는 전자문서를 포함하고 있으며, 전자문서의 유형도 기존의 워드프로세싱 문서에서 벗어나 날로 다양화 되고 있다. 따라서 이러한 전자문서의 변화에 맞추어, 장기적 보존을 위한 문서보존포맷 역시 수정 및 보완되는 것은 필수적인 과정이라 하겠다. 그러나 기존의 문서보존포맷은 이러한 전자문서 유형 변화에 충분히 대응할 수 없는 실정이다. 본 연구는 이러한 문제의식 하에 전자문서를 유형별로 구분하고 각각의 선정기준을 제시하여 문서유형에 적합한 보존포맷을 검토, 제언하였다. 연구를 위해 국내외 문서보존포맷 선정 사례를 조사하였고, 현재 국내 문서보존포맷인 PDF/A-1에 대해서는 기록학적, 기술적 관점을 모두 적용하여 연구, 분석하였다. 또한 기존에 기록학계에서 연구되었던 PDF 계열의 포맷 외에, 현재 IT 분야 및 사무용 소프트웨어 시장에서 주목받고 있는 표준 문서 포맷에 대해서도 기록학적 관점에서 보존포맷으로 가능성이 있는지 검토하였다. 본 연구에서는 이러한 연구를 바탕으로 ICA에서 제시한 전자기록의 유형별 구분을 참고하여 전자문서를 텍스트 문서, 다차원 문서, 다매체 문서로 구분하였다. 또한 이렇게 구분된 전자문서 유형별로 적합한 보존포맷을 찾기 위해, 기존 문서보존포맷인 PDF/A-1과 차기 문서보존포맷으로 주목받아 오던 PDF/A-2, 그리고 IT 분야에서 큰 관심을 받고 있는 표준 문서 포맷 ODF와 OpenXML을 두고 연구를 진행하였다. 이상 네 가지 포맷을 유형별로 세분화된 각각의 선정기준에 따라 평가하였으며, 최종적으로 텍스트 문서에 대해서는 PDF/A-2를, 다차원 문서와 다매체 문서에 대해서는 ODF를 우선 검토하도록 제언하였다. 본 연구는 미약하나마 기존에 하나로 인식되던 전자문서를 세 가지로 구분하고, 각각의 선정기준을 별도로 개발하였다는 점에서 의의가 있다. 또한 ODF와 OpenXML과 같은 표준 문서 포맷을 연구하여 생산단계의 문서 포맷이 보존포맷으로 가능성이 있는지 확인하고, 보존포맷 없이 생산 문서 포맷만을 방안에 대해 문제를 제기하였다. 문서보존포맷으로 PDF와 같이 이미지에 기반한 포맷이 아닌, XML과 같이 텍스트에 기반한 문서보존포맷에 대한 연구 방향을 제시한 것도 하나의 성과라 할 수 있다. Since the government of South Korea, which has been drawing the world’s attention in terms of its highly advanced Informational Technology in 2000s, has proclaimed itself to be ‘e-government’, 90% of records of public institutions have been produced and managed electronically. The great majority of those records contain electronic documents, and the format of the electronic document has become more varied except for the existing word processing document. Therefore, in accordance with this change of electronic document, it is inevitably necessary to modify and amend document preservation format for long-term preservation. However, in practice, existing document preservation format is unable to respond effectively to the change. Having this criticism in mind, the current research examined and suggested suitable document preservation formats through sorting electronic documents by types and advancing the standard of selection. In order to fulfil this study, the researcher investigated the domestic and international cases of the selection of document preservation format. Regarding PDF/A-1 which is currently used as document preservation format in Korea, analysis was carried out from the both archival and technological points of view. Moreover, except PDF, which has been studied previously in Archival Studies, this research reviewed the others which have been noticed as standard document format in IT industry and office software market whether they are utilisable as document preservation format in archival usage. Being based on the studies above and referencing the typological guidelines of electronic records which ICA (International Council on Archives) recommended, this research classified electric documents into three categories: text document, multidimensional document, and multimedia document. Furthermore, in order to find suitable document preservation format for each of these classified electronic document types, PDF/A-1, which is the existing document preservation format, PDF/A-2, which is regarded as the next document preservation format, and standard document format ODF and OpenXML, which are spotlighted in IT industry were considered in this study. These four kinds of format were estimated according to the standards of selection which are subdivided by types. As a result, PDF/A-2 was suggested as suitable format for text documents, and ODF was recommended as a priority for multidimensional and multimedia documents. This research is meaningful in terms of that it classified electric documents, which have been considered as similar, into three categories and developed the standards of selection for each of three separately. The present study also examined the possibility of utilisation of the document format in producing stage as document preservation format through investigating standard document format such as ODF or OpenXML. Then, this study established an argument about the utilisation of only producing document format without document preservation format. It is also regarded as one of this research’s findings that it suggested the direction of future works on text-based document preservation format, for instant XML, which is different from image-based format, such as PDF.

      • PDF Uncertainties and K-factor for the W' Boson Search in pp collisions at sqrt(s) = 8 TeV : 질량중심에너지 8 TeV인 양성자-양성자 충돌실험에서 W' 입자 탐색을 위한 파톤분포함수의 불확실성과 K-factor 연구

        이정은 경북대학교 대학원 2013 국내석사

        RANK : 247759

        질량중심에너지가 8 TeV인 양성자-양성자 충돌실험에서 생성되는 확장된 표준모형에서 예견하는 무거운 하전 벡터 게이지보존 (W') 입자의 질량에 따른 정밀한 이론적 생성단면석 예측을 위해 W' 입자 질량을 0.3 TeV부터 4 TeV까지 증가시켜가며 양성자 내부 파톤분포함수의 불확실성과 K-factor를 구하였다. 파톤분포함수의 불확실성은 PDF4LHC 그룹에서 제시한 새로운 방법을 바탕으로 LHAPDF를 이용하여 구할 수 있으며 그 결과 값은 2.2%에서 6.1%정도 나타난다. K-factor는 NNLO 생성단면적과 LO 생성단면적의 비로 FEWZ 코드를 통해 구하면 1.14에서 1.36정도의 값을 가진다. 이 두 결과를 2012년 6월까지 획득한 총 3.7 fb-1의 데이터에 적용시켜 95%의 유의수준에서 W' 입자 질량에 대한 하한선을 2.85 TeV/c2로 구할 수 있었다.

      • 휘발성 메모리를 이용한 DRM환경에서의 디지털 문서변환 소프트웨어 구조 설계 및 구현

        권가지 경북대학교 대학원 2014 국내석사

        RANK : 247742

        Digital document standard PDF (Portable Document Format) format is ideal for digital document storage. Because it shows superior performance in preservation of the original document configuration, playback of different environments, search of using a metafile, it is used for digital document storage from various agencies, including the electronic document depository. In addition, the file in PDF format, there as well as some characteristics for the storage of document, authentication processing, distribution, and change limit, the elements a security basis, compared to other document formats, has the advantage of security. However, there is a limit to the corresponding security policy of a high level of enterprises and institutions dealing with secret granular access control rights in cooperation spill prevention of the document, the policy of the organization, such as history monitoring requests. In order to maintain a higher level of security than required, the application of security Additional models such as the Enterprise DRM (Digital Rights Management) is required. Because when you create a document that is not suitable for creating and modifying documents, the format of the other types are used mainly, conversion process of the kind of document is inevitably required. The PDF electronic document conversion existing environment, not the DRM environment, it is developed with security in mind a normal environment. PDF document conversion that is DRM applied is limited or possibility of outflow of unencrypted document when applying the DRM of the transformed document is exist on the PC or user PDF conversion device. Until now, study for the prevention of leakage of internal corporate documents was done mainly in the enterprise for introduction of DRM technology improvements, security policy research. But appropriate recognition of the vulnerability of security that may occur in the conversion process of documents was insufficient. In this paper, we propose a Software Architecture which can solve problems of PDF conversion in a DRM environment, using analyzing the vulnerabilities of existing-several PDF conversion. The proposed software structure was designed to be complement of the vulnerabilities without compromising the performance. And was designed to structure of server-based to securely manage a volatile memory elements vulnerability by utilizing the characteristics of the volatile memory capable of data easy corruption. The structure that is designed, for verification factual, was implemented similar corporate environments. By comparing performance ▪ analysis of the conventional method and the proposed method, verified the superiority of the proposed method.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼