๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿงฌ Biology/์ƒ๋ฌผ์ •๋ณดํ•™ ์•Œ๊ณ ๋ฆฌ์ฆ˜

๋‹ˆ๋“ค๋งŒ-๋ธŒ๋‹ˆ์‰ฌ(๋ถ„์‰ฌ) ์•Œ๊ณ ๋ฆฌ์ฆ˜ (Needleman-Wunsch)

by HelloRabbit 2023. 6. 14.
728x90

Goal

1. ๋‹ˆ๋“ค๋งŒ-๋ธŒ๋‹ˆ์‰ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ž€?
2. ๋‹ˆ๋“ค๋งŒ-๋ธŒ๋‹ˆ์‰ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์•Œ์•„๋ณด๊ธฐ

 

๋‹ˆ๋“ค๋งŒ-๋ธŒ๋‹ˆ์‰ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ž€?

๋‘๊ฐœ์˜ DNA๋‚˜ ๋‹จ๋ฐฑ์งˆ ์„œ์—ด์ด ์žˆ์„ ๋•Œ sequence alignment๋ฅผ ํ•˜๊ธฐ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค. Alignment๋ž€ ์‰ฝ๊ฒŒ ๋งํ•ด์„œ ๋‘ ์„œ์—ด์ด ์–ด๋–ค ๋ถ€๋ถ„์— ๋งค์น˜๊ฐ€ ๋˜๊ณ  ์–ด๋–ค ๋ถ€๋ถ„์—” ๋งค์น˜๊ฐ€ ์•ˆ ๋˜๋Š”์ง€ ๋ณด์—ฌ์ฃผ๋Š” ๊ฒƒ์ด๋‹ค.

 

์˜ˆ๋ฅผ ๋“ค์–ด ATGCA์™€ ATCG๋ฅผ align ํ•œ๋‹ค๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ์ •๋ ฌํ•  ์ˆ˜ ์žˆ๋‹ค.

ATGCA
AT-CG

 

์ตœ๋Œ€ํ•œ ๋งค์น˜๋˜๋Š” ๋ถ€๋ถ„์„ ๋งž์ถ”๊ณ  ๋งค์น˜๊ฐ€ ๋˜์ง€ ์•Š๋Š” ๋ถ€๋ถ„์€ ํ•˜์ดํ”ˆ(-)์œผ๋กœ ํ‘œ์‹œํ•˜๋ฉฐ ์ด๊ฑธ "gap"์ด๋ผ ๋ถ€๋ฅธ๋‹ค.

 

์ด๋Ÿฐ์‹์œผ๋กœ ๋‘ ์„œ์—ด์ด ๋งค์น˜๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ž˜ ๋๋Š”์ง€ ํŒ๋‹จํ•˜๋Š” ๊ธฐ์ค€์œผ๋กœ alignment score๋ฅผ ์‚ฌ์šฉํ•˜๊ฒŒ ๋˜๋Š”๋ฐ ๋งค์น˜๊ฐ€ ๋˜๋ฉด ํ”Œ๋Ÿฌ์Šค ๊ฐ’์„ ๋ถ€์—ฌํ•˜๊ณ  ๋งค์น˜๊ฐ€ ๋˜์ง€ ์•Š๊ฑฐ๋‚˜ gap์ด ์ƒ์„ฑ๋˜๋ฉด ํŒจ๋„ํ‹ฐ ๊ฐ’์„ ๋ถ€์—ฌํ•ด์„œ ์ด ํ•ฉ์„ alignment score๋กœ ์‚ฌ์šฉํ•œ๋‹ค. Alignment score๊ฐ€ ๋†’์„์ˆ˜๋ก ๋‘ ์„œ์—ด์ด ๊ณตํ†ต์ ์ธ ์กฐ์ƒ์œผ๋กœ๋ถ€ํ„ฐ ํŒŒ์ƒ๋˜์–ด ๋ณ€์ด๊ฐ€ ์ถ•์ ๋œ ์„œ์—ด์ด๋ผ๋Š” ๊ฒƒ์— ์ข€ ๋” ๊ทผ๊ฑฐ๋ฅผ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋‹ค.

 

๋‹ˆ๋“ค๋งŒ-๋ธŒ๋‹ˆ์‰ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์›๋ฆฌ

์šฐ์„  score์™€ ๋ฐฉํ–ฅ ์ถ”์ ์„ ํ•˜๊ธฐ ์œ„ํ•œ ๋งคํŠธ๋ฆญ์Šค๊ฐ€ 2๊ฐœ ํ•„์š”ํ•˜๋‹ค. ๊ฐ๊ฐ ์„ธ๋กœ์™€ ๊ฐ€๋กœ์ค„์— ๋‘ ์„œ์—ด์„ ๋„ฃ๊ณ  gap ํŒจ๋„ํ‹ฐ ๊ฐ€๋กœ์„ธ๋กœ ์ค„์„ ์ถ”๊ฐ€ํ•œ๋‹ค. ์ด ์‹œ์ž‘์ ์„ Initialization์ด๋ผ ๋ถ€๋ฅธ๋‹ค.

 

์ด์ œ ๋งคํŠธ๋ฆญ์Šค๋ฅผ ์ฑ„์›Œ๋‚˜๊ฐ€์•ผ ํ•˜๋Š”๋ฐ ๋ฐฉ๋ฒ•์€ ๋Œ€๊ฐ์„ , ์™ผ์ชฝ, ๋˜๋Š” ์œ„์ชฝ์˜ ์ˆซ์ž์—์„œ ์ด์–ด๋‚˜๊ฐ€๋Š” ๊ฒƒ์ด๋‹ค.

 

์œ„์— ํ•˜์ด๋ผ์ดํŠธ ๋œ ์ƒ์ž์˜ ์ ์ˆ˜๋ฅผ ๊ณ„์‚ฐ์„ ์•„๋ž˜์™€ ๊ฐ™์ด ํ•  ์ˆ˜ ์žˆ๋‹ค.

์ด ์ค‘์—์„œ ๊ฐ€์žฅ ๋†’์€ ๊ฐ’์„ ์‚ฌ์šฉํ•ด์•ผํ•˜๊ธฐ ๋•Œ๋ฌธ์— 1๋กœ ์ฑ„์›Œ๋„ฃ์œผ๋ฉด ๋œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  1์€ ๋Œ€๊ฐ์„ ์œผ๋กœ๋ถ€ํ„ฐ ๊ณ„์‚ฐ๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์— Traceback Matrix์—๋„ ๋Œ€๊ฐ์„ ์ด๋ผ ํ‘œ๊ธฐ๋ฅผ ํ•œ๋‹ค.

์ด๋Ÿฐ์‹์œผ๋กœ ๋‚˜๋จธ์ง€ ์ƒ์ž๋“ค๋„ ์ฑ„์›Œ๋‚˜๊ฐ„๋‹ค.

์œ„์™€ ๊ฐ™์ด ๋ชจ๋“  ์ƒ์ž๋ฅผ ์ฑ„์šด ํ›„์— Traceback Matrix๋ฅผ ์ด์šฉํ•ด์„œ ๊ฐ€์žฅ ์˜ค๋ฅธ์ชฝ ์•„๋ž˜ ์นธ์—์„œ๋ถ€ํ„ฐ "๋"์ด๋ผ๊ณ  ํ‘œ๊ธฐ๋˜์–ด ์žˆ๋Š” ๊ณณ๊นŒ์ง€ ๊ฑฐ์Šฌ๋Ÿฌ ์˜ฌ๋ผ๊ฐ„๋‹ค.

Traceback Matrix๋ฅผ ๋ณด๋ฉด ๋Œ€๊ฐ์„  -> ๋Œ€๊ฐ์„  -> ์™ผ์ชฝ -> ๋Œ€๊ฐ์„  -> ๋Œ€๊ฐ์„  -> ๋ ์ˆœ์„œ๋กœ ์ด์–ด์ง„๊ฑธ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๊ฒƒ์„ ์ด์ œ ์ฐจ๋ก€๋Œ€๋กœ ๋‘ ์„œ์—ด์— ์ ์šฉ์„ ํ•ด์•ผํ•œ๋‹ค.

Alignment ๊ทœ์น™

 

์œ„์˜ ๊ทœ์น™์„ ๋”ฐ๋ผ์„œ ๋‘ ์„œ์—ด์„ ๋’ค์—์„œ๋ถ€ํ„ฐ ์จ๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ์ •๋ ฌ์ด ๋˜๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค!

์ตœ์ข… sequence alignment

 

์ฐธ๊ณ 

https://www.cs.sjsu.edu/~aid/cs152/NeedlemanWunsch.pdf

https://enjoybioinfo.blogspot.com/2020/10/needleman-wunsch-algorithm.html

 

 

๋Œ“๊ธ€