Goal
1. ๋๋ค๋ง-๋ธ๋์ฌ ์๊ณ ๋ฆฌ์ฆ์ด๋?
2. ๋๋ค๋ง-๋ธ๋์ฌ ์๊ณ ๋ฆฌ์ฆ ์์๋ณด๊ธฐ
๋๋ค๋ง-๋ธ๋์ฌ ์๊ณ ๋ฆฌ์ฆ์ด๋?
๋๊ฐ์ DNA๋ ๋จ๋ฐฑ์ง ์์ด์ด ์์ ๋ sequence alignment๋ฅผ ํ๊ธฐ ์ํ ์๊ณ ๋ฆฌ์ฆ์ด๋ค. Alignment๋ ์ฝ๊ฒ ๋งํด์ ๋ ์์ด์ด ์ด๋ค ๋ถ๋ถ์ ๋งค์น๊ฐ ๋๊ณ ์ด๋ค ๋ถ๋ถ์ ๋งค์น๊ฐ ์ ๋๋์ง ๋ณด์ฌ์ฃผ๋ ๊ฒ์ด๋ค.
์๋ฅผ ๋ค์ด ATGCA์ ATCG๋ฅผ align ํ๋ค๋ฉด ์๋์ ๊ฐ์ด ์ ๋ ฌํ ์ ์๋ค.
ATGCA
AT-CG
์ต๋ํ ๋งค์น๋๋ ๋ถ๋ถ์ ๋ง์ถ๊ณ ๋งค์น๊ฐ ๋์ง ์๋ ๋ถ๋ถ์ ํ์ดํ(-)์ผ๋ก ํ์ํ๋ฉฐ ์ด๊ฑธ "gap"์ด๋ผ ๋ถ๋ฅธ๋ค.
์ด๋ฐ์์ผ๋ก ๋ ์์ด์ด ๋งค์น๊ฐ ์ผ๋ง๋ ์ ๋๋์ง ํ๋จํ๋ ๊ธฐ์ค์ผ๋ก alignment score๋ฅผ ์ฌ์ฉํ๊ฒ ๋๋๋ฐ ๋งค์น๊ฐ ๋๋ฉด ํ๋ฌ์ค ๊ฐ์ ๋ถ์ฌํ๊ณ ๋งค์น๊ฐ ๋์ง ์๊ฑฐ๋ gap์ด ์์ฑ๋๋ฉด ํจ๋ํฐ ๊ฐ์ ๋ถ์ฌํด์ ์ด ํฉ์ alignment score๋ก ์ฌ์ฉํ๋ค. Alignment score๊ฐ ๋์์๋ก ๋ ์์ด์ด ๊ณตํต์ ์ธ ์กฐ์์ผ๋ก๋ถํฐ ํ์๋์ด ๋ณ์ด๊ฐ ์ถ์ ๋ ์์ด์ด๋ผ๋ ๊ฒ์ ์ข ๋ ๊ทผ๊ฑฐ๋ฅผ ๊ฐ์ง ์ ์๋ค.
๋๋ค๋ง-๋ธ๋์ฌ ์๊ณ ๋ฆฌ์ฆ ์๋ฆฌ
์ฐ์ score์ ๋ฐฉํฅ ์ถ์ ์ ํ๊ธฐ ์ํ ๋งคํธ๋ฆญ์ค๊ฐ 2๊ฐ ํ์ํ๋ค. ๊ฐ๊ฐ ์ธ๋ก์ ๊ฐ๋ก์ค์ ๋ ์์ด์ ๋ฃ๊ณ gap ํจ๋ํฐ ๊ฐ๋ก์ธ๋ก ์ค์ ์ถ๊ฐํ๋ค. ์ด ์์์ ์ Initialization์ด๋ผ ๋ถ๋ฅธ๋ค.
์ด์ ๋งคํธ๋ฆญ์ค๋ฅผ ์ฑ์๋๊ฐ์ผ ํ๋๋ฐ ๋ฐฉ๋ฒ์ ๋๊ฐ์ , ์ผ์ชฝ, ๋๋ ์์ชฝ์ ์ซ์์์ ์ด์ด๋๊ฐ๋ ๊ฒ์ด๋ค.
์์ ํ์ด๋ผ์ดํธ ๋ ์์์ ์ ์๋ฅผ ๊ณ์ฐ์ ์๋์ ๊ฐ์ด ํ ์ ์๋ค.
์ด ์ค์์ ๊ฐ์ฅ ๋์ ๊ฐ์ ์ฌ์ฉํด์ผํ๊ธฐ ๋๋ฌธ์ 1๋ก ์ฑ์๋ฃ์ผ๋ฉด ๋๋ค. ๊ทธ๋ฆฌ๊ณ 1์ ๋๊ฐ์ ์ผ๋ก๋ถํฐ ๊ณ์ฐ๋์๊ธฐ ๋๋ฌธ์ Traceback Matrix์๋ ๋๊ฐ์ ์ด๋ผ ํ๊ธฐ๋ฅผ ํ๋ค.
์ด๋ฐ์์ผ๋ก ๋๋จธ์ง ์์๋ค๋ ์ฑ์๋๊ฐ๋ค.
์์ ๊ฐ์ด ๋ชจ๋ ์์๋ฅผ ์ฑ์ด ํ์ Traceback Matrix๋ฅผ ์ด์ฉํด์ ๊ฐ์ฅ ์ค๋ฅธ์ชฝ ์๋ ์นธ์์๋ถํฐ "๋"์ด๋ผ๊ณ ํ๊ธฐ๋์ด ์๋ ๊ณณ๊น์ง ๊ฑฐ์ฌ๋ฌ ์ฌ๋ผ๊ฐ๋ค.
Traceback Matrix๋ฅผ ๋ณด๋ฉด ๋๊ฐ์ -> ๋๊ฐ์ -> ์ผ์ชฝ -> ๋๊ฐ์ -> ๋๊ฐ์ -> ๋ ์์๋ก ์ด์ด์ง๊ฑธ ํ์ธํ ์ ์๋ค. ์ด๊ฒ์ ์ด์ ์ฐจ๋ก๋๋ก ๋ ์์ด์ ์ ์ฉ์ ํด์ผํ๋ค.
์์ ๊ท์น์ ๋ฐ๋ผ์ ๋ ์์ด์ ๋ค์์๋ถํฐ ์จ๋ณด๋ฉด ์๋์ ๊ฐ์ด ์ ๋ ฌ์ด ๋๋ ๊ฒ์ ์ ์ ์๋ค!
์ฐธ๊ณ
https://www.cs.sjsu.edu/~aid/cs152/NeedlemanWunsch.pdf
https://enjoybioinfo.blogspot.com/2020/10/needleman-wunsch-algorithm.html
'๐งฌ Biology > ์๋ฌผ์ ๋ณดํ ์๊ณ ๋ฆฌ์ฆ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
k-mer๋ก ํจํด ๋น๋ ๊ตฌํ๊ธฐ (0) | 2023.06.14 |
---|
๋๊ธ