본문 바로가기

mRNA2

[ROSALIND] Open reading frame (6-frame 번역하기) 문제 설명 DNA에서 상보적인 mRNA 서열을 만들고, mRNA가 단백질로 번역딘다. mRNA 서열이 단백질로 번역될 때 항상 mRNA의 전체 서열을 사용하는 것이다. mRNA 서열 중 start codon (AUG)가 있는 모든 곳에서 번역이 가능하고 모든 end codon (UAG, UAA, UGA)에서 번역이 종료된다. 그러므로 mRNA에서 번역이 시작될 수 있는 시점은 첫번째, 두번째, 세번째 염기서열이 있다. 이것을 three frame translation이라 부른다. 하지만 DNA에는 상보적인 반대 서열이 존재하기 때문에 이 서열까지 고려한다면 단백질 번역의 시작이 가능한 곳은 총6곳이다. 이렇게 번역이 가능한 구간을 open reading frame (ORF)이라 부른다. 이번 문제에서는 .. 2023. 5. 30.
[ROSALIND] 단백질 서열에서 mRNA 서열 예측해보기 문제 설명 연구자들이 새로운 단백질을 발견했을 때 이 단백질이 어떤 mRNA 서열에서부터 번역된 것인지 알아야 유전체에서 이 단백질을 만드는 구간을 찾을 수 있기 때문에 단백질 서열로 mRNA 서열을 예측하는 것은 매우 중요한 일이다. 하지만 하나의 mRNA가 특정한 단백질로 번역되는 반면에 단백질에서 mRNA 서열을 알아내는건 경우의 수가 너무 많기 때문에 생각보다 힘든 일이다. 아래의 그림에 보이는 것처럼 하나의 아미노산은 여러 개의 codon이 될 수 있기 때문이다. 문제 최대 길이가 1000개의 아미노산으로 이루어진 단백질 서열이 주어졌을 때 mRNA가 될 수 있는 경우의 수를 출력해야한다. 이 때, 파이썬에서 int가 가질 수 있는 가장 큰 값은 2,147,483,647 (2^31−1)이기 때문.. 2023. 5. 29.