RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      URL 정규화의 적용 효과 및 평가 = Effects and Evaluations of URL Normalization

      한글로보기

      https://www.riss.kr/link?id=A82293294

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      A web page can be represented by syntactically different URLs. URL normalization is a process of transforming URL strings into canonical form. Through this process, duplicate URL representations for a web page can be reduced significantly. A number of...

      A web page can be represented by syntactically different URLs. URL normalization is a process of transforming URL strings into canonical form. Through this process, duplicate URL representations for a web page can be reduced significantly. A number of normalization methods have been heuristically developed and used, and there has been no study on analyzing the normalization methods systematically. In this paper, we give a way to evaluate normalization methods in terms of efficiency and effectiveness of web applications, and give users guidelines for selecting appropriate methods. To this end, we examine all the effects that can take place when a normalization method is adopted to web applications, and describe seven metrics for evaluating normalization methods. Lastly, the evaluation results on 12 normalization methods with the 25 million actual URLs are reported.

      더보기

      국문 초록 (Abstract)

      하나의 웹 문서는 문법적으로 서로 다른 두개 이상의 URL들로 표현 가능하다. URL 정규화는 URL을 정형화된 형태로 변환하는 과정이다. 정규화 과정을 통하여, 동일 웹 문서를 나타내는 URL들은 ...

      하나의 웹 문서는 문법적으로 서로 다른 두개 이상의 URL들로 표현 가능하다. URL 정규화는 URL을 정형화된 형태로 변환하는 과정이다. 정규화 과정을 통하여, 동일 웹 문서를 나타내는 URL들은 문법적으로 동일 URL들로 변환된다. 현재까지 정규화 방법의 개발 및 적용은 개발자의 경험적 지식에 기반을 두고 있으며, 체계적인 분석에 대한 연구가 부재하다. 본 논문에서는 웹 어플리케이션의 효율성과 효과성 측면에서 정규화 방법들을 평가하여 적절한 정규화 방법의 선택에 대한 지침 제공을 목적으로 한다. 또한, 웹 어플리케이션에서 정규화 적용으로 발생하는 효과를 분석하고, URL 정규화 평가를 위한 7가지 척도를 기술한다. 끝으로, 실제 웹 문서에서 추출된 약 2천 5백만개의 URL들을 대상으로 12개의 정규화방법이 평가된다.

      더보기

      목차 (Table of Contents)

      • 요약
      • Abstract
      • 1. 서론
      • 2. URL 정규화
      • 3. 정규화 평가 척도
      • 요약
      • Abstract
      • 1. 서론
      • 2. URL 정규화
      • 3. 정규화 평가 척도
      • 4. 실험적 평가
      • 5. 결론 및 향후 계획
      • 참고문헌
      • 저자소개
      더보기

      참고문헌 (Reference)

      1 "Web Server Survey" 2004.

      2 "Uniform Resource Identifiers (URI) Generic Syntax" 2005.

      3 "On URL Normalization" Springer-Verlag 3481 (3481): 1076-1085, 2005.

      4 "Mercator: A Scalable, Extensible Web Crawler" 2 (2): 219-229, 1999.

      5 "Implementation of a Web Robot and Statistics on the Korean Web" Springer-Verlag 2713 : 341-350, 2003.

      6 "Design and Implementation of a High-performance Distributed Web Crawler" 357-368, 2002.

      7 "Crawling Towards Eternity : Building an Archive of the World Wide Web" 2 (2): 37-40, 1997.

      1 "Web Server Survey" 2004.

      2 "Uniform Resource Identifiers (URI) Generic Syntax" 2005.

      3 "On URL Normalization" Springer-Verlag 3481 (3481): 1076-1085, 2005.

      4 "Mercator: A Scalable, Extensible Web Crawler" 2 (2): 219-229, 1999.

      5 "Implementation of a Web Robot and Statistics on the Korean Web" Springer-Verlag 2713 : 341-350, 2003.

      6 "Design and Implementation of a High-performance Distributed Web Crawler" 357-368, 2002.

      7 "Crawling Towards Eternity : Building an Archive of the World Wide Web" 2 (2): 37-40, 1997.

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2014-09-01 평가 학술지 통합(기타)
      2013-04-26 학술지명변경 한글명 : 정보과학회논문지 : 데이타베이스</br>외국어명 : Journal of KIISE : Databases KCI등재
      2011-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2009-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2007-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2005-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2002-01-01 평가 등재학술지 선정(등재후보2차) KCI등재
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼