๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

๐Ÿงฌ Biology/์ƒ๋ฌผ์ •๋ณดํ•™ ์•Œ๊ณ ๋ฆฌ์ฆ˜2

k-mer๋กœ ํŒจํ„ด ๋นˆ๋„ ๊ตฌํ•˜๊ธฐ Goal 1. K-mer๋ž€? 2. K-mer๋กœ ์„œ์—ด ํŒจํ„ด ๋นˆ๋„ ๊ตฌํ•˜๊ธฐ K-mer๋ž€? ์ƒ๋ฌผ์ •๋ณดํ•™์—์„œ k-mer๋ผ๋Š” ๋ง์„ ํ”ํžˆ ๋“ค์–ด ๋ณผ ์ˆ˜ ์žˆ๋‹ค. K-mer๋ž€ ์‰ฝ๊ฒŒ ์–˜๊ธฐํ•ด์„œ k ์ˆซ์ž๋งŒํผ ๊ธธ์ด๋ฅผ ๊ฐ€์ง„ ์„œ์—ด์„ ์–˜๊ธฐํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด 3-mer๋ผ๋ฉด 3 bp ๊ธธ์ด๋ฅผ ๊ฐ€์ง„ "ATA", "ATT", "GCT", "AGT" ๋“ฑ 3๊ฐœ์˜ ์—ผ๊ธฐ๋กœ ์ด๋ฃจ์–ด์ง„ DNA ์„œ์—ด ๊ฐ™์€๊ฑธ ์–˜๊ธฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค. K-mer๋กœ ํŒจํ„ด ๋นˆ๋„ ๊ตฌํ•˜๊ธฐ ๋ฌธ์ œ DNA ๋ณต์ œ๋ฅผ ์‹œ์ž‘ํ•˜๋Š” ์‹œ์ ์„ origin of replication, ์ฆ‰ ori ๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค. Vibrio cholerae๋ผ๋Š” ๊ท ์˜ ori ์„œ์—ด์€ ์•„๋ž˜์™€ ๊ฐ™๋‹ค. atcaatgatcaacgtaagcttctaagcatgatcaaggtgctcacacagtttatccacaacctgagtggatgacatcaag.. 2023. 6. 14.
๋‹ˆ๋“ค๋งŒ-๋ธŒ๋‹ˆ์‰ฌ(๋ถ„์‰ฌ) ์•Œ๊ณ ๋ฆฌ์ฆ˜ (Needleman-Wunsch) Goal 1. ๋‹ˆ๋“ค๋งŒ-๋ธŒ๋‹ˆ์‰ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ž€? 2. ๋‹ˆ๋“ค๋งŒ-๋ธŒ๋‹ˆ์‰ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์•Œ์•„๋ณด๊ธฐ ๋‹ˆ๋“ค๋งŒ-๋ธŒ๋‹ˆ์‰ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ž€? ๋‘๊ฐœ์˜ DNA๋‚˜ ๋‹จ๋ฐฑ์งˆ ์„œ์—ด์ด ์žˆ์„ ๋•Œ sequence alignment๋ฅผ ํ•˜๊ธฐ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค. Alignment๋ž€ ์‰ฝ๊ฒŒ ๋งํ•ด์„œ ๋‘ ์„œ์—ด์ด ์–ด๋–ค ๋ถ€๋ถ„์— ๋งค์น˜๊ฐ€ ๋˜๊ณ  ์–ด๋–ค ๋ถ€๋ถ„์—” ๋งค์น˜๊ฐ€ ์•ˆ ๋˜๋Š”์ง€ ๋ณด์—ฌ์ฃผ๋Š” ๊ฒƒ์ด๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ATGCA์™€ ATCG๋ฅผ align ํ•œ๋‹ค๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ์ •๋ ฌํ•  ์ˆ˜ ์žˆ๋‹ค. ATGCA AT-CG ์ตœ๋Œ€ํ•œ ๋งค์น˜๋˜๋Š” ๋ถ€๋ถ„์„ ๋งž์ถ”๊ณ  ๋งค์น˜๊ฐ€ ๋˜์ง€ ์•Š๋Š” ๋ถ€๋ถ„์€ ํ•˜์ดํ”ˆ(-)์œผ๋กœ ํ‘œ์‹œํ•˜๋ฉฐ ์ด๊ฑธ "gap"์ด๋ผ ๋ถ€๋ฅธ๋‹ค. ์ด๋Ÿฐ์‹์œผ๋กœ ๋‘ ์„œ์—ด์ด ๋งค์น˜๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ž˜ ๋๋Š”์ง€ ํŒ๋‹จํ•˜๋Š” ๊ธฐ์ค€์œผ๋กœ alignment score๋ฅผ ์‚ฌ์šฉํ•˜๊ฒŒ ๋˜๋Š”๋ฐ ๋งค์น˜๊ฐ€ ๋˜๋ฉด ํ”Œ๋Ÿฌ์Šค ๊ฐ’์„ ๋ถ€์—ฌํ•˜๊ณ  ๋งค์น˜๊ฐ€ ๋˜์ง€ ์•Š๊ฑฐ๋‚˜ gap์ด .. 2023. 6. 14.