๐งฌ Biology/๋ฐ์ด์ค ์ฝ๋ฉ ๋ฌธ์ 20 [ROSALIND] (k, d)-motif ์ฐพ๊ธฐ ๋ฌธ์ ์ค๋ช Motif๋ ๋น์ทํ ์์ด์ ๊ฐ์ง์ผ๋ก์ ๋น์ทํ ๊ธฐ๋ฅ์ ํ๋ ๊ฒ์ผ๋ก ์๋ ค์ง DNA ๋ด์ ์งง์ ์์ด๋ค์ด๋ค. ์๋ฅผ ๋ค์ด, A๋ผ๋ ๋จ๋ฐฑ์ง์ด DNA์ ๊ฒฐํฉํ๋ ์์น๋ DNA ์์์ ์ฌ๋ฌ ์์น์ ์กด์ฌํ์ง๋ง ๋ชจ๋ ๋น์ทํ ์์ด์ ๊ฐ์ ธ์ผ A๊ฐ ๊ฒฐํฉํ ์ ์์ ๊ฒ์ด๋ค. ํ์ง๋ง motif๋ 100% ๋๊ฐ์ ์์ด์ด ์๋ ์ ์๊ธฐ ๋๋ฌธ์ ์ด๋ฌํ motif๋ฅผ ์ฐพ๊ธฐ ์ํด์๋ ์ด๋ ์ ๋ ์ผ๊ธฐ์์ด์ ์ฐจ์ด๋ฅผ ๊ณ ๋ คํด์ผ ํ๋ค. ์ด ๋ฌธ์ ์์๋ (k, d)-motif๋ฅผ ์ฐพ๋๋ฐ ์ฌ๊ธฐ์ k๋ k ๊ธธ์ด๋ฅผ ๊ฐ์ง motif๋ฅผ ๋ปํ๊ณ , d๋ ์ต๋ d ๊ฐ์๋งํผ ์ผ๊ธฐ์์ด ์ฐจ์ด๊ฐ ์์ ์ ์๋ค๋๊ฑธ ๋ปํ๋ค. ์ด๋ฌํ (k, d)-motif๋ ์์ด์ ์ง์ ์กด์ฌํ์ง ์์ ์๋ ์๋ค. ์๋ฅผ ๋ค์ด, ์ฐ๋ฆฌ๊ฐ ์ฐพ์ 15 bp ๊ธธ์ด๋ฅผ ๊ฐ์ง (k, d)-motif๊ฐ .. 2023. 7. 2. [ROSALIND] ํจํด์ ์ซ์๋ก ๋ฌธ์ (ํ์ด๋ณด๊ธฐ) DNA ์์ด์ด ์ฃผ์ด์ก์ ๋ ๊ฐ์ ๊ธธ์ด์ ์์ด๋ค์ด ์ํ๋ฒณ ์์ผ๋ก ์ ๋ ฌ๋๋ค๋ฉด ์ฃผ์ด์ง ์์ด์ ๋ช ๋ฒ์งธ ์๋ฆฌ์ ์๋์ง ์ถ๋ ฅํ์์ค. ์์ AGT ์์ ๊ฒฐ๊ณผ 11 ํด๊ฒฐ def pattern_index(pattern): nuc_number = {'A':0, 'C':1, 'G':2, 'T':3} if len(pattern) == 1: return nuc_number[pattern] return 4 * pattern_index(pattern[:-1]) + nuc_number[pattern[-1]] print(pattern_index('CCGAAAACATCCAAGTCTCCAA')) ์๋ ๊ทธ๋ฆผ์์ ์ฒ๋ผ DNA ์์ด์๋ A, C, G, T ๋ก ์ด 4๊ฐ์ง ์ผ๊ธฐ์์ด๋ง ๊ฐ๋ฅํ๊ธฐ ๋๋ฌธ์ ํญ์ 4๊ฐ์ฉ ๊ธธ์ด๊ฐ ์ฆ๊ฐํ๊ฒ.. 2023. 7. 1. [ROSALIND] ์ ํ ์๋ฆฌ(restriction site) ์ฐพ๊ธฐ ๋ฌธ์ ์ค๋ช ๋ฐ์ด๋ฌ์ค๋ ์์ฒด ์ฆ์์ด ๋ถ๊ฐ๋ฅํ๊ธฐ ๋๋ฌธ์ ์์ฃผ์ ์์คํ ์ ์ด์ฉํด ์ฆ์ํ๊ฒ ๋๋ค. ๋ฐํ ๋ฆฌ์คํ์ง(bacteriophage)๋ ๋ฐํ ๋ฆฌ์(bacteria)๋ฅผ ์์ฃผ๋ก ์ผ๋ ๋ฐ์ด๋ฌ์ค์ธ๋ฐ ๋ฐ์ด๋ฌ์ค๋ ์ด๋ป๊ฒ๋ ์นจํฌํด์ ์์ ์ DNA๊ฐ ์ฆํญ๋ ์ ์๊ฒ ๋ฐํ ๋ฆฌ์์ ์ฝ์ ์ ํ๋ ค ํ๊ณ , ๋ฐํ ๋ฆฌ์๋ ์ด๊ฒ์ ๋ง๊ธฐ ์ํด ์ธํฌ ๊ธฐ๋ฅ์ ๋ณต์กํ๊ฒ ํ๊ฑฐ๋ ๋ฐ์ด๋ฌ์ค๋ฅผ ๊ณต๊ฒฉํ๋ ๊ธฐ์์ ๊ฐ์ถ์๋ค. ์ ํ ํจ์(restriction enzyme)์ด๋ผ ๋ถ๋ฆฌ๋ ๋จ๋ฐฑ์ง์ ๋ฐ์ด๋ฌ์ค์ DNA๋ฅผ ์ ๋จํจ์ผ๋ก์ ๋ฐํ ๋ฆฌ์คํ์ง๊ฐ ๊ธฐ๋ฅ์ ํ์ง ๋ชปํ๊ฒ ๋ง๋๋ค. ์ด๋ฐ ์ ํ ํจ์๋ ์ด๋ค DNA๋ฅผ ์ฐพ์ ์ ๋จํ ์ ์์๊น? ์ ํ ํจ์๋ homodimer์ด๋ฏ๋ก 2๊ฐ์ ๋๊ฐ์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ๋ก ์ด๋ฃจ์ด์ ธ ์๋ค. ๊ฐ ๊ตฌ์กฐ๋ ์ ํ ํจ์์์ DNA์ ์ด์ค ๊ฐ๋ฅ ์ค ํ ๊ฐ๋ฅ์ฉ ์ .. 2023. 6. 16. [ROSALIND] ๋ถ๋ถ์ ์์ด ๋ฌธ์ ์ค๋ช ๋น์ทํ ์ข ์ ๊ณตํต์ ์ผ๋ก ๊ฐ์ง ์ ์ ์๋ค๋ ๋ง๋ค. ํ์ง๋ง ์งํํ๋ฉด์ ์ ์ ์๋ค์ ์์๋ค์ ๋ณํ๊ฐ ์๊ธธ ์ ์๊ณ ์ผ๋ถ ์ ์ ์๋ ์์ด์ง์๋ ์๊ธฐ ๋๋ฌธ์ ์ ์ ์๋ค์ ์์๋ฅผ ํ์ธํ๋ฉด ์ ์ ์ ์ฌ๋ฐฐ์ด์ด ์ด๋ป๊ฒ ๋์๋์ง๋ฅผ ์ ์ ์๋ค. ๋ฌธ์ (ํ์ด๋ณด๊ธฐ) ๋ถ๋ถ์ ์์ด์ด๋ ์ ์ฒด n๊ฐ์์ k๊ฐ๋ง ๋ฝ์ ํ ๋ชจ๋ ๋ฐฐ์ด ์์๋ฅผ ๊ณ ๋ คํ๋ ๊ฒ์ด๋ค. ์ด ๋, n๊ณผ k๊ฐ ์ฃผ์ด์ก์ ๋ ๋ชจ๋ ๊ฐ๋ฅํ ์์์ ๊ฐ์์์ 1,000,000์ผ๋ก ๋๋ ๋๋จธ์ง๋ฅผ ์ถ๋ ฅํ์์ค. ์์ 21 7 ์์ ๊ฒฐ๊ณผ 51200 ํด๊ฒฐ def factorial(n): ans = 1 while n > 1: ans *= n n -= 1 return ans with open('rosalind_pper.txt', 'r') as f: n, k = map(int, f.read.. 2023. 6. 15. [ROSALIND] Open reading frame (6-frame ๋ฒ์ญํ๊ธฐ) ๋ฌธ์ ์ค๋ช DNA์์ ์๋ณด์ ์ธ mRNA ์์ด์ ๋ง๋ค๊ณ , mRNA๊ฐ ๋จ๋ฐฑ์ง๋ก ๋ฒ์ญ๋๋ค. mRNA ์์ด์ด ๋จ๋ฐฑ์ง๋ก ๋ฒ์ญ๋ ๋ ํญ์ mRNA์ ์ ์ฒด ์์ด์ ์ฌ์ฉํ๋ ๊ฒ์ด๋ค. mRNA ์์ด ์ค start codon (AUG)๊ฐ ์๋ ๋ชจ๋ ๊ณณ์์ ๋ฒ์ญ์ด ๊ฐ๋ฅํ๊ณ ๋ชจ๋ end codon (UAG, UAA, UGA)์์ ๋ฒ์ญ์ด ์ข ๋ฃ๋๋ค. ๊ทธ๋ฌ๋ฏ๋ก mRNA์์ ๋ฒ์ญ์ด ์์๋ ์ ์๋ ์์ ์ ์ฒซ๋ฒ์งธ, ๋๋ฒ์งธ, ์ธ๋ฒ์งธ ์ผ๊ธฐ์์ด์ด ์๋ค. ์ด๊ฒ์ three frame translation์ด๋ผ ๋ถ๋ฅธ๋ค. ํ์ง๋ง DNA์๋ ์๋ณด์ ์ธ ๋ฐ๋ ์์ด์ด ์กด์ฌํ๊ธฐ ๋๋ฌธ์ ์ด ์์ด๊น์ง ๊ณ ๋ คํ๋ค๋ฉด ๋จ๋ฐฑ์ง ๋ฒ์ญ์ ์์์ด ๊ฐ๋ฅํ ๊ณณ์ ์ด6๊ณณ์ด๋ค. ์ด๋ ๊ฒ ๋ฒ์ญ์ด ๊ฐ๋ฅํ ๊ตฌ๊ฐ์ open reading frame (ORF)์ด๋ผ ๋ถ๋ฅธ๋ค. ์ด๋ฒ ๋ฌธ์ ์์๋ .. 2023. 5. 30. [ROSALIND] ๋จ๋ฐฑ์ง ์์ด์์ mRNA ์์ด ์์ธกํด๋ณด๊ธฐ ๋ฌธ์ ์ค๋ช ์ฐ๊ตฌ์๋ค์ด ์๋ก์ด ๋จ๋ฐฑ์ง์ ๋ฐ๊ฒฌํ์ ๋ ์ด ๋จ๋ฐฑ์ง์ด ์ด๋ค mRNA ์์ด์์๋ถํฐ ๋ฒ์ญ๋ ๊ฒ์ธ์ง ์์์ผ ์ ์ ์ฒด์์ ์ด ๋จ๋ฐฑ์ง์ ๋ง๋๋ ๊ตฌ๊ฐ์ ์ฐพ์ ์ ์๊ธฐ ๋๋ฌธ์ ๋จ๋ฐฑ์ง ์์ด๋ก mRNA ์์ด์ ์์ธกํ๋ ๊ฒ์ ๋งค์ฐ ์ค์ํ ์ผ์ด๋ค. ํ์ง๋ง ํ๋์ mRNA๊ฐ ํน์ ํ ๋จ๋ฐฑ์ง๋ก ๋ฒ์ญ๋๋ ๋ฐ๋ฉด์ ๋จ๋ฐฑ์ง์์ mRNA ์์ด์ ์์๋ด๋๊ฑด ๊ฒฝ์ฐ์ ์๊ฐ ๋๋ฌด ๋ง๊ธฐ ๋๋ฌธ์ ์๊ฐ๋ณด๋ค ํ๋ ์ผ์ด๋ค. ์๋์ ๊ทธ๋ฆผ์ ๋ณด์ด๋ ๊ฒ์ฒ๋ผ ํ๋์ ์๋ฏธ๋ ธ์ฐ์ ์ฌ๋ฌ ๊ฐ์ codon์ด ๋ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค. ๋ฌธ์ ์ต๋ ๊ธธ์ด๊ฐ 1000๊ฐ์ ์๋ฏธ๋ ธ์ฐ์ผ๋ก ์ด๋ฃจ์ด์ง ๋จ๋ฐฑ์ง ์์ด์ด ์ฃผ์ด์ก์ ๋ mRNA๊ฐ ๋ ์ ์๋ ๊ฒฝ์ฐ์ ์๋ฅผ ์ถ๋ ฅํด์ผํ๋ค. ์ด ๋, ํ์ด์ฌ์์ int๊ฐ ๊ฐ์ง ์ ์๋ ๊ฐ์ฅ ํฐ ๊ฐ์ 2,147,483,647 (2^31−1)์ด๊ธฐ ๋๋ฌธ.. 2023. 5. 29. [ROSALIND] DNA ์์ด์์ motif ์ฐพ๊ธฐ ๋ฌธ์ ์ค๋ช ์๋ก ๋ค๋ฅธ ์ข ์ ์ ์ ์ฒด์์ ๊ณตํต์ ์ผ๋ก ๊ฐ์ง DNA ์์ด์ด ๋ฐ๊ฒฌ๋๋ค๋ฉด ์ด ์์ด์ ๋ ์ข ์์ ๋ชจ๋ ๋น์ทํ ๊ธฐ๋ฅ์ ํ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐ ํ ์ ์๋ค. ์ด๋ฌํ ์์ด์ ๋ชจํฐํ(motif)๋ผ๊ณ ๋ถ๋ฅธ๋ค. ๋ถ์์๋ฌผํ ๋ถ์ผ์์๋ ์ด๋ค ์๋ฌผ์ ์ ์ ์ฒด์์ ์ด๋ฐ ๋ชจํฐํ๋ฅผ ์ฐพ๋ ์ผ์ ํํ ํ๋ ๊ฒ์ ๋ณผ ์ ์๋ค. ๋ชจํฐํ์ฒ๋ผ ์ ์ฌํ ์์ด์ด ์ฌ๋ฌ๋ฒ์ด๋ ํ ์ ์ ์ฒด์์ ๋ฐ๊ฒฌ๋๋ ๊ฒฝ์ฐ๋ ์๋๋ฐ ์ด๋ฌํ ์์ด์ repeat์ด๋ผ ๋ถ๋ฅธ๋ค. Repeat์ ๋๋ค์ผ๋ก ์๊ฒจ๋ ์์ด์ด๋ผ๊ธฐ์๋ ์ ๋ง ์์ฃผ ๋ฐ์ํ๋ ๊ฒ์ ํ์ธํ ์ ์๋ค. ์ธ๊ฐ ์ ์ ์ฒด์์ ๊ฐ์ฅ ํํ repeat์ Alu repeat์ด๋ผ๋ ๊ฑด๋ฐ ์ด๊ฒ์ 300 bp ์ ๋์ ๊ธธ์ด์ ํ ์ฌ๋์๊ฒ์ 100๋ง๋ฒ ์ ๋ ๋ฐ์ํ๋ ๊ฒ์ผ๋ก ์๋ ค์ ธ ์๋ค. ํ์ง๋ง ์ด๋ฌํ Alu repeat์ ์ข์ ์ญํ .. 2023. 5. 28. [ROSALIND] DNA์ ์ธํธ๋ก (intron) ์์ญ ์ ๊ฑฐ ํ ๋จ๋ฐฑ์ง๋ก ๋ฒ์ญ ๋ฌธ์ ์ค๋ช DNA์ ์ ์ฌ ๊ณผ์ (transcription)์ DNA์ ์ผ๋ถ๋ฅผ RNA๋ก ๋ง๋๋ ๊ณผ์ ์ด๋ค. ์ธํฌ์ ํต ๋ด์์ RNA polymerase (RNAP)๋ผ๋ RNA ์คํฉํจ์๊ฐ DNA์ ๋ ๊ฐ๋ฅ ์ค ํ ๊ฐ๋ฅ์ ํ ํ๋ฆฟ(template strand)์ผ๋ก ์ฌ์ฉํด ์๋ณด์ ์ธ ์์ด์ ๋ง๋ ๋ค. ์ด ๋ A์ ์ผ๊ธฐ์์ผ๋ก T ๋์ U๋ฅผ ์ฌ์ฉํ๊ณ , ์ด๋ ๊ฒ ์์ฑ๋ ์์ด์ precursor mRNA (pre-mRNA)๋ผ๊ณ ๋ถ๋ฅธ๋ค. Pre-mRNA๋ intron๊ณผ exon์ผ๋ก ๊ตฌ์ฑ๋์ด ์๋๋ฐ ๋จ๋ฐฑ์ง๋ก ๋ฒ์ญ๋๊ธฐ ์ ์ intron ์์ญ์ ์ ๊ฑฐ๋๊ณ exon ์์ญ๋ผ๋ฆฌ ์ด์ด ๋ถ์ ์์ด์ mRNA๋ผ ๋ถ๋ฅธ๋ค. ์ด๋ฌํ intron ์ ๊ฑฐ ๊ณผ์ ์ spliceosome์ด๋ผ ๋ถ๋ฆฌ๋ ๋ค์ํ RNA์ ๋จ๋ฐฑ์ง ๊ตฌ์ฑ์ด ์คํ์ํค๋ฉฐ ์ด ๊ณผ์ ์ splicin.. 2023. 5. 27. [ROSALIND] ๋จ๋ฐฑ์ง ์ง๋ ๊ตฌํ๊ธฐ ๋ฌธ์ ์ค๋ช ๋จ๋ฐฑ์ง์ ์๋ฏธ๋ ธ์ฐ(amino acid)์ผ๋ก ์ด๋ฃจ์ด์ ธ ์๋ค. ์๋ฏธ๋ ธ์ฐ์ด 2๊ฐ ํฉ์ณ์ง ๋ peptide bond๊ฐ ํ์ฑ ๋๋๋ฐ ์ด ๋ ๋ฌผ ๋ถ์(H2O) ํ๋๊ฐ ๋น ์ง๊ฒ ๋๋ค. ์ด๋ ๊ฒ ์ฌ๋ฌ ์๋ฏธ๋ ธ์ฐ์ด ์ฐ๊ฒฐ๋ ๊ฒ์ polypeptide๋ผ ๋ถ๋ฅด๊ณ , n๊ฐ ์๋ฏธ๋ ธ์ฐ์ด ์ฐ๊ฒฐ๋์๋ค๋ฉด n-1๊ฐ์ ๋ฌผ ๋ถ์๊ฐ ๋น ์ง ๊ฒ์ด๋ค. Polypeptide์ ์์ชฝ ๋์๋ ๋ค๋ฅธ ์๋ฏธ๋ ธ์ฐ๊ณผ ๊ฒฐํฉ๋์ง ์์๊ธฐ ๋๋ฌธ์ ํ๋์ ๋ฌผ ๋ถ์๊ฐ ๋จ์์๋ค๊ณ ๋ณผ ์ ์๋ค. ์ฆ, polypeptide์ ์ง๋๋ ๊ฐ residue(๋ฌผ ๋ถ์๊ฐ ๋น ์ง ์๋ฏธ๋ ธ์ฐ)์ ๊ฐ๋ณ ์ง๋์ ๋ฌผ ๋ถ์ 1๊ฐ(๋ฌผ ๋ถ์์ monoisotopic mass๋ 18.01056 Da์ด)์ ์ง๋์ผ๋ก ๊ณ์ฐํ ์ ์๋ค. ์๋ฏธ๋ ธ์ฐ์ ์ง๋์ ๊ณ์ฐํ ๋ monoisotopic mass๋ฅผ ์ด์ฉํ๋๋ฐ .. 2023. 5. 26. ์ด์ 1 2 3 ๋ค์