최근 수정 시각 : 2025-11-26 17:41:57

연관 불균형




{{{#!wiki style="margin: -5px -10px; padding: 5px 10px; background-image: linear-gradient(to right, #3300ff, #9966ff)"
'''[[집단유전학|집단유전학
{{{#!wiki style="font-family: Times New Roman, serif; font-style: Italic; display: inline;"
]]'''
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<tablewidth=100%> 기반 학문
유기화학 · 생물학(분자생물학 · 유전학 · 계통 생물학) · 수학​(선형대수학 · 미분적분학 · 수치 해석학 · 자료구조) · 통계학
<colcolor=#000,#fff> 기반 및 법칙
멘델 유전 법칙 · 자연 선택 · 유전적 부동(유전자 병목현상 · 창시자 효과) · 유전자 흐름(종분화 · (고리종) · 하디-바인베르크 법칙(멘델 집단) · 집단구조 · F-통계량(FST · FIS ·FIT) · 발룬드 효과 · 할데인의 딜레마 · 베르그만 법칙 · 알렌 법칙 · 볼프의 법칙 · 로지스틱 방정식 · 먹이사슬 · PCR · SNP(SSCP · AFLP · RFLP · RAPD ·) · STR · 인간 게놈 · 인간 게놈 프로젝트 · Fitness landscape · 피셔의 자연선택 기본정리 · 프라이스 방정식 무한 대립유전자 모델 · Ewens의 추출 공식 · Watterson 추정량 · 타이포스트로피 변형 · 힐-로버슨 간섭
현상 & 연구
자연선택. 생존겅쟁(성선택 성내경쟁) 진화(수렴적 진화 생태적 지위 · 지위의 미세분화 · 공동진화 · 적응도(절대 적응도 포괄 적합도) · 고고학(고대인류 · ANE · 아나톨리아 수렵채집인 · ANS · WSHG · EHG · WHG) · 종분화-생식적 격리( ) · 인류 분산 경로 · 어족(우랄-알타이 제어 알타이 제어 우랄어족) · 생활양식(수렵채집인 · 반농반목 · 유목민 · 농경민) · 문화(말타-뷰렛 문화) 상 염색체 다양성 · 베스터마르크 효과 · 형질(어깨너비 · · 피부색 · 두형) · 질병(바이러스 · · 정신질환 · 유전병) · 하플로그룹(하플로그룹/집단 · 하플로그룹 지도)
하플로그룹
Y-DNA (부계) <colcolor=#000,#fff>하플로그룹 A · 하플로그룹 BT(하플로그룹 B · 하플로그룹 C · 하플로그룹 D · 하플로그룹 E · 하플로그룹 F · 하플로그룹 G · 하플로그룹 H · 하플로그룹 I · 하플로그룹 J · 하플로그룹 K (Y-DNA) · 하플로그룹 L) · 하플로그룹 M · 하플로그룹 NO(하플로그룹 N · 하플로그룹 O) · 하플로그룹 P · 하플로그룹 Q · 하플로그룹 R
mt-DNA (모계) 하플로그룹 D (mt-DNA)
관련 문서 & 개념
유전자(유전체 · 성염색체) · 유전자 검사(23And me, 유후) · 인종(북유럽인 · 북아시아인 · 동남아시아인 · 동유럽인 · 동아시아인 · 서유럽인 · 서아시아인 · 남유럽인 · 남아시아인 · 북아프리카인 · 아프리카인) · 민족(에스니시티) · ISOGG
}}}}}}}}}}}} ||

1. 개요2. 설명3. 측정
3.1. 정규화
4. 사례
4.1. 인간
5. 원인6. 다른 변인간 관계

1. 개요

연관 불균형(Linkage Disequilibrium, LD)은 두 유전자 좌위(locus)에 존재하는 대립유전자들이 무작위적으로 결합하지 않고, 특정 조합으로 더 자주 혹은 더 적게 함께 나타나는 현상을 의미한다.

2. 설명

연관불균형은 모건(Thomas H. Morgan)과 스터테번트(Alfred Sturtevant)의 염색체 지도 연구에서 가깝게 위치한 유전자들이 함께 유전되는 경향이 관찰되었다. 그러나 이 당시엔 물리적 연관(linkage) 개념만 존재했으며, 대립 유전자 조합 빈도의 ‘통계적 불균형’이라는 개념은 아직 정립되지 않았다.

그러다, 시월 라이트(Sewall Wright)와 론돌프 피셔(R.A. Fisher)의 모델에서 대립유전자 조합이 무작위 결합에서 벗어나는 현상에 대한 이론적 기반이 마련되었고, 1960~70년대에 C.A.B. 스미스(C.A.B. Smith), 해스티(Haseman), 해스틴스(Hastings) 등이 두 좌위의 대립유전자 결합을 나타내는 통계적 지표([math(D)])를 정의했다.
즉, 대립유전자 조합의 실제 빈도 ≠ 기대 빈도

라는 연관 불균형의 핵심 정의가 확립된 것이다. 이후 이러한 지표를 정규화 시킨 표준 불균형 정도([math(D')]) 등이 등장하는 등 다양한 통계학적 방법론이 적용되어, 변인간 비교 가능한 지표들이 등장했다.

연관 불균형의 핵심적인 의의는, 상술했지만 유전자형의 실제 분포가 하디-바인베르크 법칙이 예상하는 무작위 결합과 일치하지 않는 상태이다. 즉, 하디-바인베르크 법칙에서 설명할 수 없는 다른 유전자형 빈도를 설명할 수 있는 모델인 것이다.

이 개념이 함의하는 중요한 포인트는 단순히 물리적으로 가까운 유전자끼리 상속된다는 의미를 넘어, 집단의 역사, 유전자 흐름, 자연선택, 재조합율 등을 수리과학적으로 반영할 수 있다는 점에 있어서, 매우 중요한 집단유전학 개념으로 작용한다.

3. 측정

기본적으로 연관 불균형은 생식자가 '유성생식'을 하는 개체란 전제하에, 다음과 같이 측정된다.

[math(D = p_{AB} - p_A p_B)]

여기서

[math(D)]는 연관 불균형 계수를, [math(p_A)]는 대립 유전자 A의 빈도, [math(p_B)]는 대립 유전자 B의 빈도, [math(p_{AB})]는 동일한 생식자에서 A, B가 둘 다 함께 존재하는 빈도를 의미한다. 하나만 존재하는 것을 디플로타입, 두 개 존재하는 것을 하플로타입이란 정의에 의해 [math(p_{AB})]는 하플로타입으로도 볼 수 있다. 또, [math(p)]는 각각 해당 유전자 좌위에 놓여진 유전자형을 가지는 생식자의 비율을 의미한다고도 볼 수 있다.

다만 연관 불균형은 다음과 같은 조건에서만 성립한다.

[math(D \neq 0)]

만약 [math(D = 0)]이 된다면

[math(p_{AB} = p_A p_B)]

가 되므로, 이는 대립 유전자군이 서로 평형 상태에 놓여져 있다고 해석할 수 있다. 즉, 연관 불균형 상태가 붕괴된 상태인 것이다.

대립 유전자 빈도의 기댓값이 실제값 보다 작은 경우는

[math(D<0)]

으로, 기댓값이 실제값 보다 큰 경우는

[math(D>0)]

으로 나타난다.

3.1. 정규화

위 일반형은 대립 유전자 빈도의 기댓값의 범위가 [math(-0.25 < D < 0.25)]에서만 유효하단 한계가 있다. 이러한 한계를 보완하기 위해 표준 정규분포로 표준화 작업을 시행한 것이 정규화 불균형 계수([math(D')])인데, 이는 다음과 같이 기술된다. [1]

[math(D' = \begin{cases} \dfrac {D} {D_{max}} & \text(D > 0) \\
\dfrac {D} {D_{min}} & \text(D < 0)
\end{cases})]

여기서

[math(D_{max} = \max\{-p_A p_B,\,-(1-p_A)(1-p_B)})]

를 의미하며,

[math(D_{min} = \min\{p_A (1-p_B),\,(1-p_A) p_B})]

를 의미한다.

중괄호 안에 있는 변인 중, 최대-최소에 따라 맞추어서 최대일 땐 가장 큰 것을 택해서, 최소일 땐 가장 작은 것을 사용하면 된다. 예를들면 [math(D_{max})]에서 양수인 값 중 가장 큰 값을 택해서 사용하면 된단 뜻이다.

정규화된 연관 불균형 계수는 기존의 문제를 해결함으로써 기댓값 범위를 [math([0, 1])]로 늘려서 [-1, 1]까지 모든 실수의 경우의 수를 반영할 수 있다. 만약 관찰하고자 하는 유전자 좌위에 존재하는 대립 유전자가 2개 이상일 경우 이러한 유전자-유전자간 관계를 파악하기 위해 상관계수로 나타내는데, 이때 연관 불균형은 다음과 같이 적용된다.

[math(r^2=\frac{D^2}{p_A(1-p_A)p_B (1-p_B)})]

이것을 도식화 하면 다음과 같은 Hit-map으로 나타낼 수 있다.

4. 사례

4.1. 인간

2004년, 인간의 염색체 중 에르고티오네인 운반체(ergothioneine transporter) 유전자를 암호화하는 유전자 중 하나인 L503F는 소화관 자가 면역 질환인 크론병(crohn's disease) 발병에 큰 영향을 준다고 제시되어 주목을 받았다. [2]

Huff와 동료들은 인간의 염색체 중 에르고티오네인 운반체 유전자 근처에 위치한 인터페론 조절 인자 1(interferon regulatory factor 1)를 암호화하는 IRF1과 인터류킨-5(interleukin-5)를 암호화하는 IL5가 원인 유전자일 가능성을 제시하였다.

실제 크론병 환자를 대상으로 염색체 빈도를 계산한 결과, 에르고티오네인 운반체 유전자와 IL5 사이에서 재조합이 일어나지 않은 연관 불균형 상태의 염색체의 빈도가 크론병 환자들에서 높게 나타났다. 따라서 두 유전자들 중 하나가 크론병 발병률을 높이는 원인 유전자일 것이라는 가정을 증명한 것이다.

5. 원인

연관 불균형은 여러 요인으로 발생하는데, 물리적 거리, 유전적 부동, 선택, 집단 혼합으로 인해 나타난다.

물리적 거리의 경우, 두 좌위가 가까울수록 재조합이 적게 일어나 연관 불균형이 유지된다. 그러나, 반대로 멀면 재조합으로 인해 빠르게 연관 불균형이 사라진다. 이러한 평형 상태를 유지하는 것을

다음으로 유전적 부동은 대표적으로 유전적 병목현상창시자 효과가 있는데, 작은 집단에서는 무작위 표본 추출 효과로 특정 대립유전자 조합이 우연히 증가하여 연관 불균형이 발생한다. 즉, 전체 모집단에서 소수의 개체가 집단을 이루면 초기 조합 구조가 고정되어 연관 불균형이 높은 경향이 있다. 대표적으로 아메리카 원주민의 괴혈병이나 2형 당뇨 등은 이러한 연관 불균형으로 인해
이는 후술할 '유전적 다양성'과 밀접한 관련이 있다.

선택(Selection)은 자연선택성선택으로 나뉘는데, 이러한 선택압에서 특정 대립 유전자 조합이 유리하면 그 조합이 증가하고, 연관 불균형이 유지된다. 이는 선택적 싹슬이가 작용한 사례로, 특정 대립 유전자 SNP가 주변 SNP까지 함께 증가시키므로, 강한 연관 불균형 패턴을 만든다.

집단 혼합(Genetic Admixture)는 일반적으로 서로 다른 대립유전자 구조를 가진 두 집단이 섞이면 초기에는 매우 강한 연관 불균형이 관찰되는데, 그러다 세대가 지나 재조합이 일어나면 연관 불균형이 서서히 감소한다. 즉, 유전적 평형인 하디-바인베르크 평형에 수렴하는 양상을 띈다.

위 같은 이유로 인해 연관 불균형이 발생한다. 그러나, 이는 세대교차나 다양한 진화생물학적 이유에 의해 금방 교정되는 것을 알 수 있다.

6. 다른 변인간 관계


[1] Lewontin, R. C. (1964). “The interaction of selection and linkage. I. General considerations; heterotic models”. 《Genetics》 49 (1): 49–67. PMC 1210557. PMID 17248194.[2] Huff CD et al., 2012. Mol Biol Evol, 29: 101-11