RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      문서구조 추출기법을 이용한 엔지니어링 문서 텍스트 정보의 XML 변환

      한글로보기

      https://www.riss.kr/link?id=A82739213

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      본 연구에서는 교량의 구조계산서와 같이 여러 종류의 머리기호를 사용하며 제목의 계층구조가 복잡한 형식을 띄는 엔지니어링 문서의 비구조화된 텍스트 정보를 제목의 계층 구조에 따른 준구조화된 XML 문서로 변환시키는 방법을 제시한다. 텍스트 정보로부터 제목의 계층구조를 자동으로 추출하기 위해 문서구조분석 방법의 하나인 문서구조추출 기법을 이용하는 방법을 개발하였으며 특히 개조식 구문의 식별방법을 개발하여 구조계산서 문서 계층구조의 제목추출괴정 및 계층구분의 전체 정확도를 향상시킬 수 있는 방법을 제시하였다. 제시된 방법에 따른 응용모듈을 개발하였으며 총 40개의 교량 구조계산서를 대상으로 그 성능을 평가하였다. 먼저 20개의 강거더 상부 구조계산서를 대상으로 선행 연구결과와 비교하여 본 연구에서 개발된 응용모듈의 정확성과 신뢰도가 향상됨을 보였다. 또한 다른 구조형식에 대한 구조계산서 20개에 대하여 개발된 모듈의 적용성을 평가하였다. 그 결과 본 연구에서 제안한 방법에 의한 문서 계층구조 분석의 최종 정확도는 평균 99% 수준 이상을 나타내고 표준펀치는 1.52로 나타나 본 연구에서 제시된 방법이 다양한 형식의 머리기호를 사용하여 제목을 구분하는 여러 엔지니어링 문서에도 적용이 가능함을 보였다.
      번역하기

      본 연구에서는 교량의 구조계산서와 같이 여러 종류의 머리기호를 사용하며 제목의 계층구조가 복잡한 형식을 띄는 엔지니어링 문서의 비구조화된 텍스트 정보를 제목의 계층 구조에 따른 ...

      본 연구에서는 교량의 구조계산서와 같이 여러 종류의 머리기호를 사용하며 제목의 계층구조가 복잡한 형식을 띄는 엔지니어링 문서의 비구조화된 텍스트 정보를 제목의 계층 구조에 따른 준구조화된 XML 문서로 변환시키는 방법을 제시한다. 텍스트 정보로부터 제목의 계층구조를 자동으로 추출하기 위해 문서구조분석 방법의 하나인 문서구조추출 기법을 이용하는 방법을 개발하였으며 특히 개조식 구문의 식별방법을 개발하여 구조계산서 문서 계층구조의 제목추출괴정 및 계층구분의 전체 정확도를 향상시킬 수 있는 방법을 제시하였다. 제시된 방법에 따른 응용모듈을 개발하였으며 총 40개의 교량 구조계산서를 대상으로 그 성능을 평가하였다. 먼저 20개의 강거더 상부 구조계산서를 대상으로 선행 연구결과와 비교하여 본 연구에서 개발된 응용모듈의 정확성과 신뢰도가 향상됨을 보였다. 또한 다른 구조형식에 대한 구조계산서 20개에 대하여 개발된 모듈의 적용성을 평가하였다. 그 결과 본 연구에서 제안한 방법에 의한 문서 계층구조 분석의 최종 정확도는 평균 99% 수준 이상을 나타내고 표준펀치는 1.52로 나타나 본 연구에서 제시된 방법이 다양한 형식의 머리기호를 사용하여 제목을 구분하는 여러 엔지니어링 문서에도 적용이 가능함을 보였다.

      더보기

      다국어 초록 (Multilingual Abstract)

      This paper proposes a method for transforming unstructured text contents of engineering documents which have complex hierarchical structure of subtitles with various heading symbols into a semi-structured XML document according to the hierarchical subtitle structure. In order to extract the hierarchical structure from plain text information this study employed a method of document structure extraction which is an analysis technique of the document structure. In addition a method for processing enumerative text contents was developed to increase overall accuracy during extraction of the subtitles and construction of a hierarchical subtitle structure. An application module was developed based on the proposed method and the performance of the module was evaluated with 40 test documents containing structural calculation records of bridges. The first test group of 20 documents related to the superstructure of steel girder bridges as applied in a previous study and they were used to verify the enhanced performance of the proposed method. The test results show that the new module guarantees an increase in accuracy and reliability in comparison with the test results of the previous study. The remaining 20 test documents were used to evaluate the applicability of the method. The final mean value of accuracy exceeded 99% and the standard deviation was 1.52. The final results demonstrate that the proposed method can be applied to diverse heading symbols in various types of engineering documents to represent the hierarchical subtitle structure in a semi-structured XML document.
      번역하기

      This paper proposes a method for transforming unstructured text contents of engineering documents which have complex hierarchical structure of subtitles with various heading symbols into a semi-structured XML document according to the hierarchical sub...

      This paper proposes a method for transforming unstructured text contents of engineering documents which have complex hierarchical structure of subtitles with various heading symbols into a semi-structured XML document according to the hierarchical subtitle structure. In order to extract the hierarchical structure from plain text information this study employed a method of document structure extraction which is an analysis technique of the document structure. In addition a method for processing enumerative text contents was developed to increase overall accuracy during extraction of the subtitles and construction of a hierarchical subtitle structure. An application module was developed based on the proposed method and the performance of the module was evaluated with 40 test documents containing structural calculation records of bridges. The first test group of 20 documents related to the superstructure of steel girder bridges as applied in a previous study and they were used to verify the enhanced performance of the proposed method. The test results show that the new module guarantees an increase in accuracy and reliability in comparison with the test results of the previous study. The remaining 20 test documents were used to evaluate the applicability of the method. The final mean value of accuracy exceeded 99% and the standard deviation was 1.52. The final results demonstrate that the proposed method can be applied to diverse heading symbols in various types of engineering documents to represent the hierarchical subtitle structure in a semi-structured XML document.

      더보기

      목차 (Table of Contents)

      • Abstract
      • 요지
      • 1. 서론
      • 2. 구조계산서의 제목구조 추출 방법
      • 3. 구조계산서 텍스트 정보의 XML 변환 모듈 개발
      • Abstract
      • 요지
      • 1. 서론
      • 2. 구조계산서의 제목구조 추출 방법
      • 3. 구조계산서 텍스트 정보의 XML 변환 모듈 개발
      • 4. 응용모듈의 성능평가
      • 5. 결론
      • 감사의 글
      • 참고문헌
      더보기

      참고문헌 (Reference)

      1 박상일, "엔지니어링 문서의 문장 자동 계층정의 방법론" 한국전산구조공학회 22 (22): 323-330, 2009

      2 Zhu, Y., "Web-based construction document processing via a malleable frame" 15 (15): 157-169, 2001

      3 Zhiliang, M., "Utilizing exchanged documents in construction projects for decision support based on data warehousing technique" 14 (14): 405-412, 2005

      4 Rezgui, Y, "Ontology-centered knowledge management using information retrieval techniques" 20 (20): 261-270, 2006

      5 Soibelman, L., "Management and analysis of unstructured construction data types" 22 (22): 15-27, 2008

      6 Van Rijsbergen, C.J, "Information Retrieval (2nd ed.)" Butterworth- Heinemann 1979

      7 Bray, T., "Extensible Markup Language (XML) 1.0. World Wide Web Consortium"

      8 Burry, M., "Computer- aided design decision support: interfacing knowledge and information" 10 (10): 203-215, 2001

      9 Caldas, C.H, "Automating hierarchical document classification for construction management information systems" 12 (12): 395-406, 2003

      10 이상호, "Automatic Extraction of Apparent Semantic Structure from Text Contents of a Structural Calculation Document" ASCE-AMER SOC CIVIL ENGINEERS 24 (24): 313-324, 201005

      1 박상일, "엔지니어링 문서의 문장 자동 계층정의 방법론" 한국전산구조공학회 22 (22): 323-330, 2009

      2 Zhu, Y., "Web-based construction document processing via a malleable frame" 15 (15): 157-169, 2001

      3 Zhiliang, M., "Utilizing exchanged documents in construction projects for decision support based on data warehousing technique" 14 (14): 405-412, 2005

      4 Rezgui, Y, "Ontology-centered knowledge management using information retrieval techniques" 20 (20): 261-270, 2006

      5 Soibelman, L., "Management and analysis of unstructured construction data types" 22 (22): 15-27, 2008

      6 Van Rijsbergen, C.J, "Information Retrieval (2nd ed.)" Butterworth- Heinemann 1979

      7 Bray, T., "Extensible Markup Language (XML) 1.0. World Wide Web Consortium"

      8 Burry, M., "Computer- aided design decision support: interfacing knowledge and information" 10 (10): 203-215, 2001

      9 Caldas, C.H, "Automating hierarchical document classification for construction management information systems" 12 (12): 395-406, 2003

      10 이상호, "Automatic Extraction of Apparent Semantic Structure from Text Contents of a Structural Calculation Document" ASCE-AMER SOC CIVIL ENGINEERS 24 (24): 313-324, 201005

      11 Liu, S., "A review of structured document retrieval (SDR) technology to improve information access performance in engineering document management" 59 (59): 3-16, 2008

      12 Meziane, F, "A document management methodology based on similarity contents" 158 (158): 15-36, 2003

      13 Liu, S., "A computational framework for retrieval of document fragments based on decomposition schemes in engineering information management" 20 (20): 401-413, 2006

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2013-01-01 평가 학술지 통합 (등재유지)
      2001-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      1998-07-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼