본문 바로가기

아미노산2

[ROSALIND] 단백질 서열에서 mRNA 서열 예측해보기 문제 설명 연구자들이 새로운 단백질을 발견했을 때 이 단백질이 어떤 mRNA 서열에서부터 번역된 것인지 알아야 유전체에서 이 단백질을 만드는 구간을 찾을 수 있기 때문에 단백질 서열로 mRNA 서열을 예측하는 것은 매우 중요한 일이다. 하지만 하나의 mRNA가 특정한 단백질로 번역되는 반면에 단백질에서 mRNA 서열을 알아내는건 경우의 수가 너무 많기 때문에 생각보다 힘든 일이다. 아래의 그림에 보이는 것처럼 하나의 아미노산은 여러 개의 codon이 될 수 있기 때문이다. 문제 최대 길이가 1000개의 아미노산으로 이루어진 단백질 서열이 주어졌을 때 mRNA가 될 수 있는 경우의 수를 출력해야한다. 이 때, 파이썬에서 int가 가질 수 있는 가장 큰 값은 2,147,483,647 (2^31−1)이기 때문.. 2023. 5. 29.
[ROSALIND] 단백질 질량 구하기 문제 설명 단백질은 아미노산(amino acid)으로 이루어져 있다. 아미노산이 2개 합쳐질 때 peptide bond가 형성 되는데 이 때 물 분자(H2O) 하나가 빠지게 된다. 이렇게 여러 아미노산이 연결된 것을 polypeptide라 부르고, n개 아미노산이 연결되었다면 n-1개의 물 분자가 빠진 것이다. Polypeptide의 양쪽 끝에는 다른 아미노산과 결합되지 않았기 때문에 하나의 물 분자가 남아있다고 볼 수 있다. 즉, polypeptide의 질량는 각 residue(물 분자가 빠진 아미노산)의 개별 질량와 물 분자 1개(물 분자의 monoisotopic mass는 18.01056 Da이)의 질량으로 계산할 수 있다. 아미노산의 질량을 계산할 때 monoisotopic mass를 이용하는데 .. 2023. 5. 26.