RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      박테리아 coding, non coding DNA서열의 부호 엔트로피 분석 = Symbolic entropy analysis of coding and non coding DNA sequences in bacteria

      한글로보기

      https://www.riss.kr/link?id=A40019375

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      본 연구는 박테리아 DNA서열의 부호화 정보 엔트로피 측정으로 생물적 기능을 정보량으로 정량화 시킬 수 있음을 제시한다. DNA서열은 네 개의 염기 아데닌, 구아닌, 시토신, 티아민으로 구성되어 있다. DNA 서열을 부호 서열로 구성하기 위해 염기를 두 가지 방법으로 분류했다. 첫 번째로 염기를 그들의 화학적 구조에 따라 purine "quot;={A,G}와 pyrimidine "quot;={C,T}으로 분류하였다. 두 번째는 화학적 구조와 수소결합의 강도를 모두 고려하여 분류하였다. 우선 수소 결합을 살펴보면 약한 수소 결합을 가지는 "quot;={A,T}와 강한 수소결합을 가지는 "quot;={G,C}로 분류하였다. 화학적 결합과 수소 결합을 모두 고려하면A=[1 1]=3 , G=[1 0]=2, T=[0 1]=1, C=[0 0]=0 으로 4개의 심볼 값을 가지게 된다. 이렇게 구성된 심볼 서열로 세 개의 부호를 하나의 워드로 사용하여 단백질 코딩 서열과 논 코딩 서열의 엔트로피를 계산하였다. 박테리아의 게놈 서열은 모두 무작위적으로 보이지만 단백질 코딩 서열과 논 코딩 서열이 서로 다른 엔트로피 값을 가지고 통계적으로 유의함을 확인했다
      번역하기

      본 연구는 박테리아 DNA서열의 부호화 정보 엔트로피 측정으로 생물적 기능을 정보량으로 정량화 시킬 수 있음을 제시한다. DNA서열은 네 개의 염기 아데닌, 구아닌, 시토신, 티아민으로 구성...

      본 연구는 박테리아 DNA서열의 부호화 정보 엔트로피 측정으로 생물적 기능을 정보량으로 정량화 시킬 수 있음을 제시한다. DNA서열은 네 개의 염기 아데닌, 구아닌, 시토신, 티아민으로 구성되어 있다. DNA 서열을 부호 서열로 구성하기 위해 염기를 두 가지 방법으로 분류했다. 첫 번째로 염기를 그들의 화학적 구조에 따라 purine "quot;={A,G}와 pyrimidine "quot;={C,T}으로 분류하였다. 두 번째는 화학적 구조와 수소결합의 강도를 모두 고려하여 분류하였다. 우선 수소 결합을 살펴보면 약한 수소 결합을 가지는 "quot;={A,T}와 강한 수소결합을 가지는 "quot;={G,C}로 분류하였다. 화학적 결합과 수소 결합을 모두 고려하면A=[1 1]=3 , G=[1 0]=2, T=[0 1]=1, C=[0 0]=0 으로 4개의 심볼 값을 가지게 된다. 이렇게 구성된 심볼 서열로 세 개의 부호를 하나의 워드로 사용하여 단백질 코딩 서열과 논 코딩 서열의 엔트로피를 계산하였다. 박테리아의 게놈 서열은 모두 무작위적으로 보이지만 단백질 코딩 서열과 논 코딩 서열이 서로 다른 엔트로피 값을 가지고 통계적으로 유의함을 확인했다

      더보기

      다국어 초록 (Multilingual Abstract)

      The purpose of this study was that an entropy might play a role in revealing information contents of biological functioning in DNA sequences. A DNA sequences can be identified with a word over the four nucleic acid bases: adenine, guanine, cytosine, thymine. DNA sequences are converted into two type of symbolic sequences according to their chemical and biological characteristics, In primary classification, the four bases A, C, G, T can be divided into two classes according to the chemical structures, i.e., purine "1"={A,G} and pyrimidine "0"={C,T}. Further classification can be also made according to the strength of the hydrogen bond, i.e., weak H bonds "1"={A,T} and strong H bonds "0"={G,C}. Combination of chemical structure and H bond strength leads to symbol value for four nucleic acid bases; A=[1 1]="3", G=[1 0]="2", T=[0 1]="1", C=[0 0]="0". We calculated the corrected information entropy and entropy rate of a distribution of words with three symbols in the coding and non coding sequences. Although all the CDS sequences in bacteria look like random sequences, we find that coding sequences and non coding sequences have different entropy values with statistical significance

      번역하기

      The purpose of this study was that an entropy might play a role in revealing information contents of biological functioning in DNA sequences. A DNA sequences can be identified with a word over the four nucleic acid bases: adenine, guanine, cytosine, t...

      The purpose of this study was that an entropy might play a role in revealing information contents of biological functioning in DNA sequences. A DNA sequences can be identified with a word over the four nucleic acid bases: adenine, guanine, cytosine, thymine. DNA sequences are converted into two type of symbolic sequences according to their chemical and biological characteristics, In primary classification, the four bases A, C, G, T can be divided into two classes according to the chemical structures, i.e., purine "1"={A,G} and pyrimidine "0"={C,T}. Further classification can be also made according to the strength of the hydrogen bond, i.e., weak H bonds "1"={A,T} and strong H bonds "0"={G,C}. Combination of chemical structure and H bond strength leads to symbol value for four nucleic acid bases; A=[1 1]="3", G=[1 0]="2", T=[0 1]="1", C=[0 0]="0". We calculated the corrected information entropy and entropy rate of a distribution of words with three symbols in the coding and non coding sequences. Although all the CDS sequences in bacteria look like random sequences, we find that coding sequences and non coding sequences have different entropy values with statistical significance

      더보기

      목차 (Table of Contents)

      • Ⅰ. 연구 배경
      • Ⅱ. 데이터 구성
      • 1. 데이터 획득
      • 2.데이터 정보
      • Ⅲ.분석 방법
      • Ⅰ. 연구 배경
      • Ⅱ. 데이터 구성
      • 1. 데이터 획득
      • 2.데이터 정보
      • Ⅲ.분석 방법
      • 1.부호화
      • 2. Information Entropy and conditional Entropy
      • Ⅳ. 분석 결과
      • Ⅴ. 결론 및 토의
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼