분자생물학·생화학 Molecular Biology · Biochemistry | |||||||
{{{#!wiki style="word-break: keep-all; margin:0 -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" | <colbgcolor=#717845> 기반 | 생물물리학 · 물리화학 (둘러보기) · 분자화학 (유기화학 · 무기화학 · 고분자화학) · 수학 (미분방정식 · 이산수학 · 매듭이론) | |||||
기본 물질 | 아미노산 (카복실산) · 리간드 | ||||||
유전체 | 유전체 기본 구조 | 아데닌 · 타이민 · 구아닌 · 사이토신 · 유라실 · 리보스 · 디옥시리보스 · 뉴클레오타이드 (핵산) | |||||
유전체 혼합 구성 | 인트론 · 엑손 · 오페론 · 프로모터 | ||||||
유전체 세부 종류 | RNA | MRNA · TRNA · RRNA(리보솜) · 리보자임 · miRNA · siRNA · RDDM | |||||
DNA | A형 구조 · B형 구조 · Z형 구조 · Alu · 게놈 · 텔로미어 · 유전자 · 유전자 목록 | ||||||
관련 물질 | 효소 | 보조인자 · 조효소 (NADH · NADPH · FAD) · 뉴클레이스 · 디하이드록실레이스 · 레닌 · 루비스코 · 루시페레이스 · 라이소자임 · 라이페이스 · 말테이스 · 셀룰레이스 · 아데닐산고리화효소 · 아밀레이스(디아스타아제) · 역전사효소 · 트립신 · 펩신 · 유전체 중합 효소 · 리보자임 · 미카엘리스 멘텐 방정식 | |||||
제어 물질 | 사이토카인 · 신경전달물질 (ATP) · 수용체 (GPCR) | ||||||
기타 | 뉴클레오솜 · 히스톤 · 프리온 · 호르몬 · 샤페론 | ||||||
현상 및 응용 | 물질대사 · 펩타이드 결합 (알파 헬릭스 구조 · 베타병풍) · 센트럴 도그마 · 전사 (전사 인자) · 번역 · 복제 · 유전 알고리즘 · 유전 부호 · 대사경로 · TCA 회로 · 산화적 인산화 · 기질 수준 인산화 · 해당과정 · 오탄당 인산경로 · 포도당 신생합성 · 글리코겐 대사 · 아미노산 대사 · 단백질 대사회전 · 지방산 대사 · 베타 산화 · RNA 이어맞추기 · 신호전달 · DNA 메틸화 (인핸서) · 세포분열 (감수분열 · 체세포분열) · 능동수송 · 수동수송 · 페토의 역설 · 하플로그룹 | ||||||
기법 | ELISA · PCR · 돌연변이유도 · 전기영동 (SDS-PAGE · 서던 블로팅 · 웨스턴 블롯) · 유전체 편집 (CRISPR) · DNA 수선 · 바이오 컴퓨팅 (DNA 컴퓨터) · DNA 시퀀싱 · STR · SNP · SSCP | ||||||
기타 문서 | 일반생물학 · 분자유전학 · 생리학 · 유전학 · 진화생물학 · 면역학 · 약학 (약리학 둘러보기) · 세포학 · 구조생물학 · 기초의학 둘러보기 · 식품 관련 정보 · 영양소 · 네른스트 식 · 샤가프의 법칙 · 전구체 | }}}}}}}}} |
{{{#!wiki style="margin: -5px -10px; padding: 5px 10px; background-image: linear-gradient(to right, #3300ff, #9966ff)" '''[[집단유전학|집단유전학 {{{#!wiki style="font-family: Times New Roman, serif; font-style: Italic; display: inline;"]]''' {{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" | <tablewidth=100%> 기반 학문 | |||||
유기화학 · 생물학(분자생물학 · 유전학 · 계통 생물학) · 수학(선형대수학 · 미분적분학 · 수치 해석학 · 자료구조) · 통계학 | ||||||
<colcolor=#000,#fff> 기반 및 법칙 | ||||||
멘델 유전 법칙 · 자연 선택 · 유전적 부동(유전자 병목현상 · 창시자 효과) · 유전자 흐름(종분화 · 고리종) · 하디-바인베르크 법칙(멘델 집단) · 집단구조 · F-통계량(FST · FIS ·FIT) · 발룬드 효과 · 할데인의 딜레마 · 베르그만 법칙 · 알렌 법칙 · 볼프의 법칙 · 로지스틱 방정식 · 먹이사슬 · PCR · SNP(SSCP · AFLP · RFLP · RAPD ·) · STR · 인간 게놈 · 인간 게놈 프로젝트 · Fitness landscape · 피셔의 자연선택의 기본정리 · 무한 대립유전자 모델 · Ewens의 추출 공식 · Watterson 추정량 · 타이포스트로피 변형 · 힐-로버슨 간섭 | ||||||
현상 & 연구 | ||||||
진화(수렴적 진화 생태적 지위 · 지위의 미세분화 · 공동진화 · 포괄 적합도) · 고고학(고대인류 · ANE · 아나톨리아 수렵채집인 · ANS · WSHG · EHG · WHG) · 종분화-생식적 격리( ) · 인류 분산 경로 · 어족(우랄-알타이어족 · 알타이 제어 · 우랄어족) · 생활양식(수렵채집인 · 반농반목 · 유목민 · 농경민) · 문화(말타-뷰렛 문화) 상 염색체 다양성 · 베스터마르크 효과 · 형질(어깨너비 · 키 · 피부색 · 두형) · 질병(바이러스 · 암 · 정신질환 · 유전병) · 하플로그룹(하플로그룹/집단 · 하플로그룹 지도) | ||||||
하플로그룹 | ||||||
Y-DNA (부계) | <colcolor=#000,#fff>하플로그룹 A · 하플로그룹 BT(하플로그룹 B · 하플로그룹 C · 하플로그룹 D · 하플로그룹 E · 하플로그룹 F · 하플로그룹 G · 하플로그룹 H · 하플로그룹 I · 하플로그룹 J · 하플로그룹 K (Y-DNA) · 하플로그룹 L) · 하플로그룹 M · 하플로그룹 NO(하플로그룹 N · 하플로그룹 O) · 하플로그룹 P · 하플로그룹 Q · 하플로그룹 R | |||||
mt-DNA (모계) | 하플로그룹 D (mt-DNA) | |||||
관련 문서 & 개념 | ||||||
유전자(유전체 · 성염색체) · 유전자 검사(23And me, 유후) · 인종(북유럽인 · 북아시아인 · 동남아시아인 · 동유럽인 · 동아시아인 · 서유럽인 · 서아시아인 · 남유럽인 · 남아시아인 · 북아프리카인 · 아프리카인) · 민족(에스니시티) · ISOGG |
1. 개요
하플로그룹(Haplogroup)은 분자유전학적으로 인간의 혈통, 기원, 진출 경로, 게놈 등을 분석해서 같은 변이끼리 집단 별로 묶어 놓은 것이다.2. 상세
하플로그룹의 탄생은 인간 게놈 프로젝트와도 깊은 연관이 있다.하플로그룹의 역사를 간단하게 짚어 보면 인간 게놈 프로젝트가 시작되던 1993년부터 동시에 시작됐으며, 'A Nomenclature System for the Tree of Human Y-Chromosomal Binary Haplogroups(인간 Y-염색체 이진 하플로그룹 트리에 대한 명명법 체계)'가 나온 2002년부터 본격적으로 시작되었다.
하플로그룹은 인류의 진출-확산 경로, 분포, 혈통, 질병 등을 추정하기 위해 도입된 개념인데 특히 인류의 진출-확산 경로와 분포를 파악하기 위해서 많이 사용된다. 그렇기 때문에 하플로그룹을 검출할 땐 오직 성 염색체(Y염색체)와 미토콘드리아로만 돌연변이(이하 변이)를 측정한다. 왜냐하면 다른 상 염색체를 이용할 경우, 부계와 모계의 염색체가 섞이기 때문에 집단 별로 묶기엔 다소 무리가 있기 때문이다.
좀 더 확장해서 설명하면 성 염색체는 교차가 일어나지 않고, 성 염색체 중 하나인 Y염색체의 경우, 유전 방식상 아버지에게서 아들로만 전달될 수 있어[1] 순수 부계 혈통만을 파악할 수 있기 때문이고, 미토콘드리아의 경우, 성별과 상관 없이 100% 어머니에게서 자손으로만 전달될 수 있어 순수 모계 혈통을 파악할 수 있기 때문이다.
상염색체나 여성의 X염색체는 감수분열 과정에서 유전자 교환이 일어나지만 Y염색체는 감수분열 시 X염색체와 결합하는 pseudoautosomal region을 제외하곤 유전자 교환이 일어날 수 없기 때문에 더욱 적합하다.
그렇기에 부, 모 각각의 고유 형질이 서로 결합될 확률이 사실상 0%라서 부계, 모계 별 인류의 진출 경로, 유전자 풀 구성을 측정하기에 아주 적합한 도구다.[2]
미토콘드리아의 경우, 원래 독립된 박테리아였으나 생명체가 진화 과정에서 흡수한 세포내 기관[3]의 DNA이다.[4] 세포 하나당 미토콘드리아가 1000개 이상 존재하므로 적은 샘플에서도 DNA 정보를 증폭해서 찾아내기 쉬운 장점이 있다. 그래서 고인류 인골에서 하플로그룹이 Y-DNA보다 mt-DNA가 더 잘 검출되기도 한다.
따라서 성 염색체를 이루는 오직 아버지에게서만 전달되는 Y-DNA와 오직 모계 혈통으로만 전달된다는 미토콘드리아의 mt-DNA[5]의 DNA 염기서열 중 복제 오류로 생겨난 염기서열 다양성을 알아내어 혈통을 추정한다.
최상위 하플로그룹을 대문자 알파벳으로 명명하며, 부수적인 변이를 대문자 알파벳 뒤에 숫자와 소문자 알파벳으로 명명한다. 예를 들면 "AACTCTTGATAAACCGTGCTG"라는 변이가 있다 치자. 이걸 어떤 인류 집단이 공통적으로 갖고 있으면 이걸 하플로그룹 Q와 같이 대문자로 선언한다. 여기서 부수적 변이가 생기면 하위 분기군(서브 클레이드)를 Q1a, Q1b와 같이 명명하는 것이다.
Haplogroup을 줄여서 'Hg'라고도 쓴다.
하플로그룹의 이용 범위는 DNA 법의학(Jobling et al. 1997), 의학 및 유전학(Jobling and Tyler-smtith), 인간 진화 연구(Hammer and Zegura 1996) 등 다양한 학문에서 연구 방법으로 사용된다. 이러한 방법은 과거 빅토리아 여왕의 혈우병 유전자를 추적할 때도 쓰인 것이지만 현재 유전학에서 쓰이는 하플로그룹은 족보 추적을 쉽게 하기 위해 부계 지표인 Y염색체와 모계 지표인 mt-DNA를 주로 쓴다는 점에서 과거의 연구와 차이를 보여준다.
3. 하플로그룹의 원리
방 청소를 하지 않으면 시간이 지날수록 방 안에 먼지가 쌓이듯, 마찬가지로 생물집단(방)도 유전적 부동(청소)이 일어나지 않으면 돌연변이 된 DNA(먼지)가 쌓이게 된다. 이 변이 DNA(먼지)가 축적돼서 결국 집단을 이루는 주류 형질이 되는 것이다. 여기서 하플로그룹은 이러한 변이를 집단 내 공통적으로 갖고 있는지를 조사한다. 조사 후 발견된 공통 변이는 DNA(먼지)가 발견된 순서로 알파벳 순으로 명명한다. 즉, 하플로그룹의 단위는 집단 내 공통 변이 정도인 것이다.여기서 하플로그룹에서 사용하는 돌연변이를 측정하는 방법은 크게 두 가지로 나뉜다. 이들을 각각 SNP, STR이라고 한다. 위 측정법에 대한 설명은 각각의 문서를 참고하길 바라고 이 방법으로 인류의 진출 경로와 집단, 민족의 기원, 확산 등을 추정할 수 있다.
돌연변이의 종류는 두 가지로 나뉘는데, 암호화 DNA 변이와 비암호화 DNA 변이로 나뉜다.[6] 이 둘은 단백질로 발현 유무의 차이[7]인데 암호화 DNA에서 변이가 발생하면 단백질로 발현이 되지만, 비암호화 DNA에선 아무리 변이가 발생해도 단백질로 발현되지 않는다.
여기서 하플로그룹은 비암호화 DNA(정크 DNA) 변이를 집단별로 나누어 선언하는 것이다. 비암호와 DNA에서 일어나는 변이가 암호화 DNA에서 일어나는 변이보다 확률상 더 많이 일어나기 때문이다. (전체 DNA 중 98%가 비암호화 DNA이기 때문.)
만약 변이로 인해 단백질로 발현이 되고, 그 발현된 형질이 서식하는 환경에서 생존에 유리한 형질이면, 차츰 대를 거듭할수록 집단 전체를 구성해 진화를, 그 집단이 속한 환경에 부적합하면 도태되는 것이고 그렇게 해서 진화가 이루어졌다고 본다. 즉 진화는 집단의 유전자 풀이 변화해야 일어나는 것이다. 그런데 Y-DNA 비재조합 부분, 즉 Y염색체에 존재하는 비활성화 DNA(NRY)에도 마찬가지로 변이가 일어나게 된다. 이것이 SNP에 의해 집단별로 폭발적인 특성이 나타난다. 이때 SNP 또는 STR을 이용해 변이를 측정하고 하플로그룹을 명명한다. 참고로 DNA의 복제 오류의 발생률은 초기 단계에서 무려 0.0001%이다. 즉, 10만 명의 자손 중 한 명 꼴로 돌연변이가 일어나게 된다는 것이다. [8] 그렇게 돌연변이가 일어난 자손이, 대를 거듭해 자손을 낳고, 집단 내에 축적돼서 결국은 그 유전적 집단의 주류 특성을 이룬다. 이렇다는 건 돌연변이가 축적될 수 있는 유전자 사이 지역(intergenic region)이나 지역의 염기 서열 차이, 혹은 염기서열이 바뀌어도 아미노산 서열이 바뀌지 않는 침묵 돌연변이(silent mutation)의 발생 양상을 찾아야 한다. 이것이 SNP다. 이런 중립적인 돌연변이는 시간에 따라 누적될 것으로 예상할 수 있다. 집단의 유전자 풀이 변화하면 이는 진화를 했다고 보며, 하디-바인베르크 법칙이 성립이 되지 않는 집단에서 진화가 일어난다. 하플로그룹은 유전자 풀 내에서 비암호와 DNA 돌연변이를 검출해서 집단 별로 묶는 시스템인 것이다.
그리고 이러한 돌연변이를 검출하는 것을 SNP라고 하며, 하플로그룹은 SNP를 이용한 방법론 중 하나인 셈이다.[9] 단순 진출 경로 추정뿐만 아니라 이를 이용해 혈통을 추정할 수도 있으며 이 혈통을 거슬러 올라가면 DNA의 변형 정도, 즉 돌연변이에 따라 같은 조상을 지닌 집단 별로 분리가 가능하고 이를 트리 형태로 나타낼 수 있다. 인류가 이동, 교류, 확산에 따라 거주지를 바꾸게 될 때, 원 거주지 집단의 일부만 그 이동에 참여하게 되므로 떨어져 나간 집단이 원래의 집단보다 중립 돌연변이의 다양성이 적게 된다. 따라서 돌연변이 다양성을 거슬러 올라가는 방향으로 추적해서 인류의 이동, 교류, 확산 양상을 복원해낼 수 있는 것이다. 일반적으로 일부다처제 양상과 전쟁 등을 이유로 부계의 단절 가능성이 높고, 반면 족외혼 때문에 서로 다른 두 집단 간 모계 유전정보의 차이가 적어질 수 있기 때문에 Y염색체의 하플로 패턴의 대립 양상이 mt-DNA 하플로 패턴보다 역사적인 사건을 설명하는 데 주로 사용된다.
연구의 편의를 위해서 일부러 수정 시에 섞이지 않은 유전자를 선택했으며, Y염색체와 mt-DNA를 제외한 다른 염색체들은 감수분열시에 교차를 함으로써 염색체가 서로 섞이는 과정을 겪으므로 짧게는 수대, 길게는 수백 대를 거슬러 올라가는 유전자를 이용한 족보추적에는 난점을 보여주기 때문에, 앞으로도 계속 사용될 예정이다. 심플하게 1/2을 각 대마다 거듭제곱을 하면 어떻게 될지 생각해보자. 10대만 거슬러 올라가도 10대조의 유전자는 이론상으로는 1/1024밖에 남아있지 않게 된다.(…) 여기에 교차까지 생각하면 더더욱 카오스가 된다.(…)[10]
4. 명명법
하플로그룹의 명명법은 기본적으로 부계와 모계로 나뉜다.부계의 경우 국제계통유전학회 산하 소속인 YCC(Y Chromosome Consortium)에서 제공하는 가이드대로 명명해야 한다. 이는 일종의 수학/약어 및 기호의 유전학 버전이라 보면 된다. 학자마다 SNP를 정의하는 명명이 다 다르면, 학자들 서로의 연구에 혼란을 주기 때문이다. 부계 기준 명명법은 다음 문단과 같다.
4.1. 고유 클래스
우선 하플로그룹 명명은 다음과 같이 나타난다.1. 발견된 순서대로 하플로그룹 선언: 대문자 알파벳으로 선언한다.
2. 이후 첫 번째 변이 발생: 최초 하플로타입에 변이가 일어난 순으로 자연수를 붙인다.
3. 첫 번째 변이 이후 변이 발생: 첫 번째 변이때 자연수 뒤에 변이가 일어난 순으로 소문자 알파벳을 붙임.
4. 첫 번째 변이 후 변이 발생 후 변이 발생: 소문자 알파벳 뒤에 변이 발생 순으로 다시 자연수를 붙인다.
즉 대문자 하플로타입 뒤에 자연수가 오고 그 뒤에 소문자 알파벳이 오는 순으로 명명한다. 이 과정을 집단 단위에서 변이가 더 이상 검출되지 않을 때까지 반복한다.
추상적으로 다가올 수도 있으니 이를 예를 들어 적용해보면 다음과 같다.
1.Y-하플로그룹 [math(X)][11]
2. 이후 첫 번째 변이 발생 -> [math(X1)] [상세]
3. X1 이후 첫 번째 변이 발생 -> [math(X1)]a
4. X1a 이후 첫 번째 변이 발생 -> [math(X1)]a1
5. X1a1 이후 첫 번째 변이 발생 -> [math(X1)]a1a
로 말이다. 다만 위의 경우는 모두 변이가 연속적으로 첫 번째에서만 일어났을 경우만 해당하고, 첫 번째로 일어나고 두 번째로 일어나는 변이는 다음과 같이 나타난다.
1. Y-하플로그룹 [math(X)]
2. X1a 이후 두 번째 변이 발생 -> [math(X1)]a2
3. X1a2 이후 첫 번째 변이 발생 -> [math(X1)]a2a
와 같이 X1a 뒤에 2를 붙이는 식으로 말이다. 추가로, X1 이후 첫 번째 변이인 X1a가 아니라 그 후에 발생한 변이는 X1b로 나타내고 이에 대한 명명도 위와 같이 나타낸다.
또 최초 하플로타입(대문자)에서 두 번째 변이가 일어났다면 다음과 같이 나타난다.
1. Y-하플로그룹 [math(X)]
2. 이후 두 번째 변이 발생 -> [math(X2)]
나머지 과정은 상위 과정과 동일하다. 이와 같이 하플로그룹을 명명하며 계통수를 그려나간다.[13]
정리해보자면, X라는 부모가 있다면 자손 X1, X2는 각각 형과 동생이다. 이때 형이 만든 자식 중 첫 째를 X1a, 둘 째를 X1b라고 칭하며, 동생이 만든 자식 중 첫 째를 X2a, 둘 째를 X2b라고 한다.
그리고 집단 단위에서 변이가 엄청나게 일어나서, 이를테면, Y-DNA 기준, P1b1a1b와 같이 세부적인 하플로 타입을 집단 단위로 갖고 있고 여기서 더 많이 분화가 됐으면 아예 새로운 하플로그룹으로 명명한다. 왜냐하면 너무 난해하기 때문이다.
그리고 주의해야 할 것은 하플로그룹의 최상위 클래스는 돌연변이가 일어난 시기 순서대로 선언한 것이 아니라 발견된 순서대로 선언한 것이다. 실례로 알파벳상 마지막 부계 하플로그룹은 T지만, 실제로 돌연변이가 일어난 시기가 가장 마지막(최근)인 하플로그룹은 N과 O다. Y-DNA 기준 거의 완벽한 트리의 형태를 지니며 발견된 순서대로, 알파벳 순으로 차례로 배열한다.[14]
예시
어떤 사람이 서울에서 부산으로 넘어갔다. 서울에 있던 사람의 기존 하플로 타입을 Z라고 가정해보자. 여기서 이들이 대를 거듭해 자손을 낳았는데 Z 인자에 변이가 일어났다.
이때 변형된 Z타입 인자를 'Z1'으로 표기한다. 만약 Z1보단 늦게 분화한 새로운 돌연변이 그룹이 존재하면 이땐 Z2로 명명한다.[15][16]
그러다 그 자손들의 후손들 중 어떤 자손의 하플로 인자가 변형됐으면 이때는 'Z1a'로 표기한다.[17]
이후 어떤 이유로 그 후손들이 부산에서 대구, 대전, 광주 순서대로 각각 분화했다고 치자. 그럼 이때 각 지역으로 분화한 자손들의 유전적 변이 행태는 다음과 같게 된다.
대구 - Z1a1
대전 - Z1a2
광주 - Z1a3
물론 위 세 지역 모두 변이가 일어났다는 대전제하에 표기할 수 있는 것이지 부산에서 위 세 지역으로 이동했으나 변이가 없으면 그냥 기존(부산)에 있던 하플로 타입을 그대로 명명한다.
세 지역의 경우를 모두 살펴 보기엔 너무 많으니 대전만을 예로 들어보겠다. 대전에서 자손을 잘 낳다가 낳은 그 자손의 유전자가 변이되면 이번엔 Z1a2에서 Z1a2a가 되는 것이다. 그리고 그 변형된 유전자가 같은 지역에서 또 변형이 되면 Z1a2a1이 되는 것이고 이러한 형태를 이어간다.
그러다 그 자손이 대전에서 평양, 속초 순서대로 각각 분화했다. 그럼 이땐 이렇게 표기한다.
평양 - Z1a2a1a
속초 - Z1a2a1b
위 양상을 토대로 직전의 선조 하플로 타입에서 변이된 게 있으면 그걸 표기하기 위해 새롭게 선언하는 걸 알 수 있다.
여기서 유전적 거리(DNa distance)가 일정 수준 이상 멀어졌다고 판별해 새로운 하플로 타입으로 분류한다.
즉, Z1a2a1a1a1a1a1a1같이 끝없이 길어지게 만들지 않는다는 뜻이다.
이때 변형된 Z타입 인자를 'Z1'으로 표기한다. 만약 Z1보단 늦게 분화한 새로운 돌연변이 그룹이 존재하면 이땐 Z2로 명명한다.[15][16]
그러다 그 자손들의 후손들 중 어떤 자손의 하플로 인자가 변형됐으면 이때는 'Z1a'로 표기한다.[17]
이후 어떤 이유로 그 후손들이 부산에서 대구, 대전, 광주 순서대로 각각 분화했다고 치자. 그럼 이때 각 지역으로 분화한 자손들의 유전적 변이 행태는 다음과 같게 된다.
대구 - Z1a1
대전 - Z1a2
광주 - Z1a3
물론 위 세 지역 모두 변이가 일어났다는 대전제하에 표기할 수 있는 것이지 부산에서 위 세 지역으로 이동했으나 변이가 없으면 그냥 기존(부산)에 있던 하플로 타입을 그대로 명명한다.
세 지역의 경우를 모두 살펴 보기엔 너무 많으니 대전만을 예로 들어보겠다. 대전에서 자손을 잘 낳다가 낳은 그 자손의 유전자가 변이되면 이번엔 Z1a2에서 Z1a2a가 되는 것이다. 그리고 그 변형된 유전자가 같은 지역에서 또 변형이 되면 Z1a2a1이 되는 것이고 이러한 형태를 이어간다.
그러다 그 자손이 대전에서 평양, 속초 순서대로 각각 분화했다. 그럼 이땐 이렇게 표기한다.
평양 - Z1a2a1a
속초 - Z1a2a1b
위 양상을 토대로 직전의 선조 하플로 타입에서 변이된 게 있으면 그걸 표기하기 위해 새롭게 선언하는 걸 알 수 있다.
여기서 유전적 거리(DNa distance)가 일정 수준 이상 멀어졌다고 판별해 새로운 하플로 타입으로 분류한다.
즉, Z1a2a1a1a1a1a1a1같이 끝없이 길어지게 만들지 않는다는 뜻이다.
이처럼 분화한 지역에 따른 기록을 통해 인류의 진출 경로를 파악 및 추론하는데 사용하는 것이 하플로 그룹이다.
가장 기본이 되는 하플로들을 대문자 A, B, C 등으로 분류하고 그 하플로에서 나뉘는 서브클래스를 숫자, 소문자의 연속적인 배열로 붙인다. 지중해 원주민 하플로인 E1b1b를 예로 들어서 보면 이해하기 편할 것이다. 가장 큰 분류인 E, 그리고 그 밑의 트리를 1, b, 1, b의 순서로 나누는 것이다. 이 말은 즉 E2도 있고, E1a도 있다는 말이다. 한국인의 특징을 보여주는 하플로인 O2b도 마찬가지로 O-2-b의 순서. O2b의 상위는 O2이고 O2의 상위는 O가 된다. 서브클래스는 상세한 분류에서는 필요하지만 너무 번잡하므로 적절히 대표되는 상위클래스로 말한다.
4.2. 이명
각 하플로 집단별로 이명을 가지고 있다. 고유 클래스 명명법대로면 하플로 타입에 따라 이름이 지나치게 길어져 번잡해질 때가 있기 때문에 이렇게 따로 이명으로 부르기도 한다. 예를 들어 O1b2의 경우는 O-M176으로도 불리고, N1a1a는 N-tat, Q1a1a는 Q-M120과 같이 말이다. 실제로 현재 C2b라고 불리는 하플로그룹은 불과 2013년까지만 해도 C3f로 불리고, N1c는 N3로 불리는 등 현재와는 다른 표기로 사용되었다. 그 외에도 하플로그룹의 연구가 현재진행형이기 때문에 위의 트리가 바뀌기도 해서 차라리 M176 같은 이명으로 부르는 것이 더 나을 수도 있다.5. 계통도
유전학인 만큼 기본적으로 계통도의 구조를 따른다. 특히 Y-DNA 부계 Hg의 계통도가 그러한데 부계 Hg은 거의 완벽한 나뭇가지에서 줄기를 뻗는 트리 형태의 계통도를 띈다. 반면 모계 Hg의 경우, 트리와는 다소 다른 초기 Hg에서 단순하게 분화한 구조를 띈다.이것은 전통적으로 수컷은 유전자 풀에 변화를 주는 요인에 많은 노출이 있었음을, 암컷은 상대적으로 유전자 풀 변화를 주는 요인에 적은 노출이 있었음을 시사한다.
6. 활용
이렇게 정의된 하플로는 통계분석의 형태로 연구된다. 현대의 특정 지역, 특정 지역에서 주로 검출되는 하플로타입을 확인하고, 고대 인골의 하플로타입을 확인하고 인류가 아프리카에서 어떻게 분화되어 이동했는가 확인하는 것이다. 여기서 중요한 것이 비율이다.각 하플로의 대단위는 대부분 늦어도 1만 년 이전에 분화된 것이기 때문에[18] 역사시대의 인류 중 특정 하플로만으로 도배한 경우는 특수한 경우를 제외하고는 드물다. 그리고 지역에 따라서는 대단위로는 동질체라도 서브클래스를 나누면 완전히 다른 집단의 합일 경우도 많다. 예를 들어 서유럽에서 많이 검출되는 하플로그룹은 R1b지만, 이 중에서 켈트 계열도 있고, 게르만 계열도 있으며 각 서브클래스의 분포에 따라서 그것을 확인할 수 있다. 따라서 지역에 따라 서브클래스를 상세히 나눠서 조사하는 것은 꼭 필요하다. 하지만 그것이 귀찮(…)기 때문에 보통은 높은 단위로 말할 뿐이다.
또한 하플로그룹의 연구는 기본적으로 통계분석을 통해 비율을 확인하는 것이기 때문에 특정 민족을 나타내는 하플로는 특정 민족에 절대다수인 하플로와 동의어가 아니다. 주변 지역이나 주변 민족에 비해 유달리 많이 나타나는 하플로를 뜻하는 것이다. O2b의 경우 한국인을 나타내는 하플로라는 일반인에 의한 2차 창작 주장도 있지만 이것 또한 동아시아에 인류가 존재하지 않았을 때 동아시아로 이동한 O하플로에서 분화된 한 종류의 하플로이며 일본인, 조선족, 만주족도 상당수 가지고 있는 하플로그룹이다. 중국의 경우에는 한족은 O-M122가 많다고 하지만 사실상 연구한 인구 자료가 적으며, 티베트족은 D-M174, 위구르족은 P-P295가 많은 등 지역별 나타나는 하플로그룹이 다르나 이것을 마치 대표 하플로그룹으로 상상하며 만든 2차 창작은 잘못된 내용을 가지고 있다. O2b와 O3에도 수많은 하위 하플로가 있으며 종류도 다르다. 중요한 건 O2b나 O3의 경우도 농경을 했을 거라는 것은 증거없는 추측일 뿐이며 아프리카 북부에서부터 이동하기 시작한 인류가 동남아에 정착하면서 생긴 Y하플로이며 이것이 인류가 아직 동아시아에 없었을 당시에 이동하면서 북상을 하였다. 그리고 수렵을 거쳐 농경, 목축을 하였다.
7. 의의
7.1. 인류 조상 추적
하플로그룹이 도입된 계기이자 순기능이다. 인류 조상을 추적하기 위해서 여러 분자유전학적 방법들을 통해 시행했으나 저마다 가진 한계가 명확했다. 이를 해결하기 위해서 부계와 모계를 따로 나누어 각각의 유전체를 뜯어서 공통 염기와 SNP를 분류했다.이때 사용한 유전체는 Y염색체와 미토콘드리아로 이들을 활용하여 인류의 공통 조상을 추적한 결과 우리 인류는 모두 20만 년 전 어떤 여성을 통해 기원했으며, 지금 이 글을 읽는 당신도, 이 글을 쓰고 있는 나도, 국적과 인종 불문하고 모든 인류가 해당 여성에서 기원했다는 것이다. 즉, 그 여성은 우리들의 공통된 어머니란 것이다.
그렇기에 우리들의 어머니의 하플로그룹을 '미토콘드리아 이브'라고 칭하며 이 미토콘드리아 이브의 형질은 모든 인류가 갖고 있다. 그리고 우리 인류의 공통 조상이자, 모든 인류의 아버지인 Y염색체 아담도 마찬가지로 모든 인류가 아담의 형질을 갖고 있다.
7.2. 인류 진출 경로 추적
6~700만 년 전에 침팬지와 갈라진 인류는, 독자적 진화 시간을 고려하면 현재 2~3종의 아종을 가질 가능성이 매우 크다. 하지만 여러 민족의 유전적 차이[19]에도 불구하고, 현존하는 어떤 인류 집단에서 남녀를 뽑아 자손을 만들더라도 생식 능력에 문제가 없는 자손을 볼 수 있다. 이는 사실 현재 인류의 조상이 '크기 병목'[20]을 거쳤다는 것을 의미하는데 실제로 인류는 겉보기로 확인할 수 있는 여러 차이에도 불구하고 유전적 다양성이 굉장히 떨어지는 편으로 친척인 침팬지는 물론이고 멸종위기종인 고릴라보다도 유전적 다양성이 떨어진다.유전자 분석을 통해 하플로그룹을 정의하고, 인류의 공통된 조상을 추적할 수는 있었지만 하플로그룹의 쓰임새는 그것으로 그치는 것이 아니다. 인류가 대를 이어서 퍼져나가고 그 과정에서 병목현상이나 창시자 효과 등으로 인간의 유전자는 상대적으로 극심한 변화를 보여주기도 한다. 하플로그룹은 인류에 문명이 생기기 아주 오래 전부터 대륙간 이동을 나타내는 자료로서 인종간 그 차이가 달라도 어느 정도 지역적으로 유사성이 있으면 같은 하플로그룹으로 무작위 영어 스펠링으로 나뉘어 있다. 아주 옛날에 인류가 아프리카에서 대륙간 이동한 하플로그룹의 1차 자료를 마치 민족의 이동처럼 2차 창작, 3차 창작이 일본, 중국에서는 일반인에 의해 나타나기도 하지만 하플로그룹 자체가 문명이 생기기 전 아주 오래 전에 인류가 시베리아는 C 동아시아는 O 등 각 지역에 이주하여 정착한 것이기 때문에 이것으로 마치 민족의 이동이나 민족의 대표 하플로는 무엇일 것이다 등 상상의 2차 창작은 내용적으로 잘못된 것이며 의미가 없다는 것이다. 이는 전세계에서 하플로그룹에 관심을 가진 사람들 대부분이 범하는 실수로, 역사를 개인의 정치적인 잣대에 따라 해석하려는 태도 때문에 이러한 생각을 하는 일이 많다.
7.3. Y-DNA 하플로그룹의 특징
Y염색체 하플로그룹은 위에서 설명한 대로 부계유전의 특징을 지니고 있다. mt-DNA로 역사시대의 인류의 족보를 추적하지 않는 것이 아니다. 오히려 그것이 더 먼저 이루어졌다.인류의 이동은 남성, 여성이 같이 이동하며 고위 귀족의 경우에도 자손이 남성, 여성이 많기 때문에 인류 이동에 대해서 미트콘드리아 mt-DNA와 함께 인류 이동에 대해 추적하는 데 쓰인다. Y 하플로그룹을 마치 집단 혈통의 이동이나 씨족 이동으로 생각하는 건 잘못된 것이다. 왜냐면 혈통을 구분할 수 있는 인간의 염색체는 서로 매우 각기 다르게 되어 있는데 Y 하플로그룹의 경우 아프리카 기원설을 뒷받침하기 위해 동양인이면 동양인 그룹, 서양인이면 서양인 그룹으로 매우 큰 범위로 나뉘어져 있으며 이것을 씨족으로 나눈 것이 아니라 아프리카에서부터 9만 년 전 아시아에 도착한 것은 A, 8만 년 전 아시아 도착한 것은 B 등 발견된 순서로부터 임의로 스펠링을 정한 것뿐이라서 지역의 거리가 가까울수록 존재하는 Y 하플로그룹은 비율이 비슷비슷하며 지역 거리가 멀수록 임의로 정한 Y 하플로염색체가 스펠링이 다른 것이다.
즉 예를 들어 포르투갈과 스페인이 지역 거리가 가까워 집단유전학자들에 의해 같은 가상의 R이라는 Y 하플로그룹과 그 하위로 나뉘어질 수는 있지만 포루투갈의 가상의 R이라는 Y 하플로를 가진 사람이 프랑스의 가상의 E라는 하플로그룹을 가진 사람과 유전적으로 더 가까울 수 있다. 또한 옛부터 지배층의 경우 하층민보다 인구가 적은 경우가 자주 있었다. 지배층의 경우 근친으로 인한 혈연 권력이 중요했기 때문에 자녀의 수가 노동력을 중시하던 하층민보다 훨씬 적은 경우가 많았다. 또한 근대에는 인구 구조가 달랐으나 현대에 들어 농업 인구가 폭발적 증가하였고 상층류보다 농업을 돕는 자녀의 수가 훨씬 중요한 하층민의 인구 증가 폭발로 인해 현대에 들어 Y 하플로그룹의 비율이 완전히 달라지는 경우가 대부분이다.
Y염색체 하플로그룹은 미토콘드리아로 유명한 mt-DNA에 비해서 인류의 이동 과정을 더 잘 알 수 있다는 것은 잘못된 상식이며 아프리카에서 인류의 이동은 남성과 여성 모두 이동하였으며 귀족층의 자손도 지속적으로 남성, 여성이 절반씩 나타났기 때문에 둘다 인류 이동, 즉 아프리카에서의 인류 이동을 알아보는 데 쓰인다. 그래서 역사적으로 인류 이동에 대해서는 mt-DNA와 함께 Y염색체도 사용된다. 특히 아프리카 기원설은 미토콘드리아 DNA 분석을 통해 학계의 많은 지지를 얻고 있다
7.4. mt-DNA 하플로그룹의 특징
위에서 적은 것처럼, mt-DNA 하플로그룹은 난자에서 오기 때문에 모계유전의 특징이 있다. 그리고 Y염색체 하플로그룹보다 일반적으로 유해에서 더 오래 남아 있기 때문에 고인골에서 검출이 쉬운 장점이 있어 고인류의 이동에 대해 알아보기 쉽다. 즉 인류의 아프리카 기원설은 Y염색체보다는 고인골에 검출이 쉬운 mt-DNA 분석에 의해 많은 지지를 받고 있다. 이는 상염색체와 성염색체(X,Y) DNA는 핵 내에만 존재하는 데 비해, 미토콘드리아는 세포 내에 대체로 복수로 - 세포에 따라서는 수백 개 이상 - 존재하기 때문에 절대량이 많기 때문이다. 따라서 Y염색체 하플로그룹은 주로 살아 있는 사람들에서 나온 자료가 절대다수인 데 비해, mt-DNA는 고인골에서도 높은 빈도로 검출된다.[21]그리고 Y염색체보다 오래간다는 것도 mt-DNA를 활용하는 이유 중 하나가 된다. 그래서 10만년 전의 고인류의 이동과 선사시대와 근대까지 인종 이동에 대해 정확성에는 mt-DNA를 더 자주 사용한다.
7.5. 하플로그룹의 집단
8. 한계
공통 조상 추적에 있어선 하플로그룹만큼 직접적이고 정확한 것이 없지만, 인류 진출 경로에 관해선 분명한 한계점을 갖고 있다.9. 하플로그룹에 대한 오해들
9.1. 대문자 라틴 문자가 같다 해서 같은 하플로그룹이다?
대문자 라틴 문자, 즉 최초 상위 클래스가 같다고 해서 하플로그룹이 같을 수 있다고 오해할 수 있다. 결론부터 말해서 절대 아니다.우선 하플로그룹을 볼 때는 문자와 숫자 하나하나에 민감해질 필요가 있다. 예를 들어 중국 중북부에서 기원한 하플로그룹 O (Y-DNA)는 각각의 진출 경로를 따라 분화된 하플로그룹이 있는데, 이를 O1, O2, O3라 한다. 이들은 모두 O로 상위 클래스가 같은데, 이는 공통 조상이 같다는 의미지 O1, O2, O3의 기원지는 모두 다르다. 이 공통 조상이 형성된 기원지를 기준으로 O1은 중국 중부, O2는 중국 북부, O3는 중국 동남부에서 기원했다.
하플로그룹 명칭도 엄연히 유전자 이름인 만큼 분기군 하나하나를 예민하게 봐야 한다.
9.2. 하플로그룹으로 외형을 구분한다?
집단 단위 | 개인 단위 |
O | X |
집단 단위에선 가능하지만 개인 단위에선 불가능에 가깝다.
하플로그룹으로 외형을 구분하는 건 확실히 무리가 있다. 여기서 말하는 외형은 얼굴 뿐만 아니라 겉으로 보이는 모든 형질을 의미한다. 왜냐하면 하플로그룹은 상염색체가 아닌 Y염색체와 미토콘드리아의 정보를 검출하는 것이기에 상염색체의 정보는 알 수 없기 때문이다.
외형은 단순히 Y염색체와 미토콘드리아로만 결정되는 것이 아니다. 외형은 다인자 유전에 의해 결정되기 때문에, 다른 상염색체들이 매우 밀접하게 관여하기 때문이다. 물론 Y염색체도 관여를 하긴 하지만 인간을 기준으로 2.17% 밖에 관여하지 않는다.
외형에 관한 생물 법칙 중 가장 대표적인 베르그만 법칙과 알렌 법칙이 적용되는 인간도 '집단 관점'에선 하플로그룹과 높은 상관에 있다. 예를들어 부계 혈통 기준 바이킹의 주류 하플로그룹이라고 잘 알려진 I1a2 계열의 경우, 어떤 인골에서 I1a2가 검출됐을 때 "이 인간은 높은 확률로 큰 키, 흰 피부, 금발 벽안이었을 것이다."라고 추정은 할 수 있는 것이다. 왜냐하면 바이킹은 그 지역에서 보편적으로 나타는 특성에 속한 인구 집단이기 때문이다. [22]
대표적으로 아인슈타인과 넬슨 만델라가 그 예다. 아인슈타인의 경우 Y-DNA 하플로그룹이 E1b1b1b2이고, 넬슨 만델라는 E1b1a다. 위 두 인물은 Y-DNA 하플로그룹이 E1b1계열로 같은데도, 아인슈타인은 백인, 넬슨 만델라는 흑인이라는 직관적인 외형 차이를 보여준다.
이는 집단 별 고유의 외형이 존재하고 외형은 성염색체가 아닌, 상염색체가 97.8% 관여한다는 것을 시사한다.
뿐만 아니라 Y-DNA 하플로그룹 C의 사례를 보면 알 수 있다. 인류 분산 경로에서도 설명했듯, 이란 북부에서 기원한 하플로그룹 C는 파미르 → 중앙아시아 → 알타이 → 바이칼[23]과 인도 → 동남아시아 등으로 진출했다.
하지만 북부 루트를 통해 분산한 C2와 남부 루트를 통해 분산한 C1b는 현대 인류 기준, 외형이 전혀 다른 것을 볼 수 있다. C2 계열은 주로 시베리아인, 몽골인에게서 많이 검출되는 반면, C1b는 파푸아인, 동남아시아인에게서 많이 검출된다.
위 사진에 나온 칭기즈 칸[24]과 동남아시아인을 보면 알 수 있듯, 부계 하플로그룹은 똑같은 C 계열이지만 실제론 전혀 다른 외형을 가지고 있는 것을 볼 수 있다. 즉, 하플로그룹 계열은 C로 같을 순 있어도, 외모는 전혀 다른 걸 알 수 있다..
하지만 개인 단위에선 불가능해도, 몽골인이라는 집단 단위로 봤을 땐 높은 상관을 띔을 알 수 있다.
예를들어 본인이 한국인이고 Y-DNA 하플로그룹이 중동에서 많이 검출되는 J가 나왔다고 해서 이 사람을 중동인의 외형으로 추정할 수 있을까? 아니다.
하지만 J가 주류라는 집단인 중동 지역이라면 중동 집단 인구의 외형 특성을 가질 확률이 높다고 추정할 순 있다.
또 여성의 경우, Y염색체가 존재하지 않아 순수 모계 유전자로밖에 추정할 수 없는데, 만약 모계 유전자가 동남아시아에서 주로 검출되는 mt-DNA 하플로그룹 M이라고 가정해보자. 그럼 해당 여성은 동남아시아인인가? 라고 물을 땐 알 수 없다는 게 맞다.
이처럼 하플로그룹으로 인종을 추정하기엔 다소 무리가 있고 확률상 2.17% 정돈 예측할 순 있다. 애초에 하플로그룹은 인종 구분의 목적이 아닌 고인류의 분산 경로를 추정하기 위해 도입된 방법론이다.
즉 이미 역사가 나타나기 전, 완전 구석기 시대에 분화한 상태로 구인류가 유럽, 아시아 등지에 도착하여 살고 있었기 때문에 특히 Y염색체로 고대부터 근대까지의 하플로그룹으로 인종을 구분하거나 이동을 구분하는 것은 의미가 없다.
고대 중세까지 알 수 있는 미토콘드리아의 경우 아프리카에서 전 지역으로 이동한 것은 알 수 있으나 최근까지밖에 알 수 없는 Y염색체로 인류의 이동이나 역사를 알 수 없으며 앞서 아인슈타인과 넬슨 만델라의 사례만 보더라도, 하플로그룹만 가지고 인종을 구분하는 것 자체가 무의미하다.
수만 년 전부터 식량이나 기후로 인해 이동한 인류를 순서대로 알파벳 표시한 것으로 지역끼리 거리가 가까울수록 유전자 자체가 매우 달라도 같은 하플로그룹 알파벳으로 불리는 경우도 많으며, 옛부터 지배층의 경우 하층민보다 인구가 적은 경우가 자주 있었으며 지배층의 경우 근친으로 인한 혈연 권력이 중요했기 때문에 자녀의 수가 노동력을 중시하던 하층민보다 훨씬 적은 경우가 많았다.
또한 근대에는 인구 구조가 달랐으나 현대에 들어 농업 인구의 폭발적 증가로 인해 상층류보다 농업을 도울 수 있는 자녀의 수가 훨씬 중요한 하층민들의 인구 증가 폭발이나 대규모 이주로 인해 현대에 들어 Y 하플로그룹의 비율이 완전히 달라지는 경우가 대부분이다.
9.3. 인류를 우생학적으로 분류한다?
하플로그룹은 분야 특성상 민감하게 받아들일 수도 있기에, 이러한 우생학적 연관을 떠올리는 건 충분히 합리적인 발상이다. 하지만 하플로그룹에 대해서 더 알게 되면 오히려 우생학과 거리는 멀고, 인류 평등에 기여할 수 있는 분야란 걸 알 수 있다.실제로, 우월한 북방 게르만족인 아리아인만이 인류의 주류를 이루어야 한다는 나치의 홀로코스트를 주장한 아돌프 히틀러의 하플로그룹이 E1a1b인 유대인한테 주로 검출되는 하플로그룹이 나타났으며, 오히려 나치가 말한 '순수 아리아인'의 혈통은 I 계열과 R1a 계열이라 볼 수 있다. [25] I 계열이야 북방 게르만족(바이킹, 데인, 노르드인 등)들의 주류 하플로그룹이라 그럴 수 있다 쳐도, R1a 계열의 경우는 말이 좀 달라진다.
Y-DNA 하플로그룹 R1a 계열은, 현대 인류에선 슬라브족의 주류 하플로그룹인데, 슬라브족은 나치의 학살 대상 민족에 포함되었다. 하플로그룹 R 문서를 가보면 알 수 있겠지만, 아리아인의 고유 형질인 큰 키, 흰피부, 금발벽안은 R1a의 분포와 밀접한 관련이 있다. 즉, 역설적으로 나치는 순수 아리안 혈통에 가장 가까운 슬라브족을 학살 대상으로 삼았단 것이다. [26] 이처럼 하플로그룹은 나치의 유사과학적 사상을 반박하는 논리적, 과학적 도구이며 증명이다.
재차 강조하지만 하플로그룹은 인류를 우생학적으로 분류하기 위해 탄생한 것이 아니라 인류의 진출경로와 혈통, 민족 구성을 알기 위해 도입된 개념이다. 모든 생물은 각자 서식 환경에 맞게 적응과 진화했다는 공통점이 있을 뿐, 생물 사이에는 우열이 없다.
다른 생물과 비교할 필요 없이 같은 인간만 보더라도 고위도에서 서식하던 백인들이 오스트레일리아로 이주하자 피부암 발병률이 극도로 증가했을 뿐만 아니라, 아프리카에서 서식하던 흑인들이 미국과 같이 고위도 지역에 서식하자, 비타민 D 결핍 문제가 심각해지고 구루병 환자 다수가 흑인인 점 등 각각의 환경에 맞게 적응과 진화를 한 것임을 알 수 있다.
즉, 우월한 생물종은 그 지역의 환경에 서식하기에 적합한 형질을 가진 생물종이 우월한 생물종인 것이다. 백인이 아프리카나 적도 부근에 가면 그 지역 환경과 적합하지 않은 형질들에 의해 열등한 생물종이 되는 것이다. 애초에 '고등' 또는 '하등' 생물이란 개념은 현재는 전혀 통용되지 않는다. 박테리아와 사람 사이에도 우열이 없는데 인류 내에서? 오히려 이것은 이 분야를 연구하는 학자들부터 더 잘 인식하고 있다.
더군다나 mt-DNA 항목에서 설명했듯이, 변화 파악에 요긴하게 쓰이는 영역은 변화가 있어도 비암호화 DNA를 대상으로 단일염기다형성을 분석하기에 형질적 차이도 발생한다고 보기는 힘들며, '우생학적 우열'과는 무관하다는 점도 염두에 두어야 한다. 염색체와 유전 얘기만 나오면 조건반사적으로 우생학을 떠올리는 낡아빠진 생각은 이제 그만 접어둘 때가 됐다.
오히려 흔하게 널린 하플로는 주변 지역에도 많으므로 우생학보다는 평화에 기여할 수도 있다.[27]
하지만 하플로그룹을 다루는 사람들 중에 정치적인 해석이 은연중에 개입되어 어떤 하플로그룹이 우월하고 열등한지에 대한 쓸데없는 논쟁을 하는 사람들은 존재한다는 게 불편한 진실이다.
결론은 정치적인 해석이나 개입 없이 순수하게 과학적인 결과만으로 해석해야 한다는 점이다.
9.4. 국가별 대표하는 하플로그룹이 존재한다?
하플로그룹에 대한 개념이 제대로 안 잡혀 있는 경우 특정 국가 국민의 하플로그룹을 조사했을 때 단순히 많이 검출되는 하플로그룹을 그 국가를 특정하는 하플로그룹이라고 생각할 수도 있다.하지만 그건 그저 특정 표본에서 흔한 '빈도', 즉 주류를 이루고 있는 하플로 타입이란 것이지, 절대로 특정 표본을 대표하거나 일반화를 시킬 수 있는 하플로그룹은 아니란 것이다. 가령 한국에서 가장 많은 성씨는 김씨지만, 대한민국을 김씨공화국이라 부를 수 없는 것과 마찬가지.
대한민국의 흔한 빈도로 검출되는 하플로그룹이 O1b2(이명: O2b)인데 하플로그룹 C가 검출되기도 하고 나머지 N, Q, R, D 등 다양하게 검출된다.
어디까지나 '주류 하플로그룹'의 관점으론 볼 수 있어도, '대표 하플로그룹' 관점으로 보기엔 무리가 있단 것이다.
9.5. 연구자들이 하플로만을 맹목적으로 믿는다?
당연히 오해다. 과학기술의 힘으로 연구를 하는 것이긴 하지만 근본적으로 다른 고고학과 다를 것이 없다. 단 학문영역이 좀 다를 뿐이다. 하플로그룹은 집단유전학적 방법으로 연구를 하는 것이고, 나온 연구결과 자체는 심하게 말하면 통계 데이터에 그칠 뿐이다. 이렇게 나온 데이터를 역사적인 사건, 고고학적인 발굴 등과 연관시켜서 연구하는 것이다. 단지 연구방법에서 과학기술이 훨씬 더 많이 들어가는 것이 다를 뿐인데 왜 적대감을 가져야 할까?과학자들은 매드 사이언티스트로 대표되는 것도 아니고, 이러한 연구를 과학자들만이 하는 것도 아니다. 하플로그룹 검출기술인 단일염기다형성, STR의 원리나 기기 사용법만 알아도 고고학자들이 검출하는 데에 전혀 문제가 없다.
오히려 그러한 의심을 가지는 것이 문제다. 왜 다른 고고학적인 연구결과는 충분히 검토할 만한 근거로 쓰면서 단지 과학기술이 많이 들어갔다고 의심을 해야 하는 것인가? 또한 고고학적인 연구에 이미 과학기술이 깊이 관여되어 있는 상황에서[28] 유전자를 통한 추적을 한단 이유로 편견을 가지는 것이 더 문제가 아닌가?
그리고 유전자를 통한 추적은 이미 대를 이어온 선조들의 흔적이기도 해서 빼도 박도 못하고 부정할 수 없는 노릇이다. 민족의 기원 및 구성이 자신의 이상과 다르다고[29] 이를 배척하는 건 친자 검사 결과나 암 진단 등 의학 기술에 대해 거부하는 것과 다를 것이 없다.
9.6. 하플로그룹의 근본적인 한계
하플로그룹의 근본적인 한계 또한 무시할 수 없다. 앞서 문단에서 상술했듯 하플로그룹은 일종의 통계학적 데이터에 불과하다. 다만 좀 더 구체적으로 설명해서 '현대인'의 유전학적 통계 데이터일 뿐이다.즉 어디까지나 현대 인류의 유전자 풀로만 구성된 유전자형을 토대로 빈도에 대한 통계를 낸 집단유전학적 방법론에 불과한1 것이다. 이것이 가진 한계는 바로 유전적 부동을 고려할 수 없다는 것을 시사한다. 이렇다는 건 고대 인류에서 현대 인류로 넘어오기까지 겪었던 여러가지 자연재해, 역사적 사건 등이 영향을 끼친 것을 고려할 수 없으며, 결국 유전사를 해석함에 있어 근본적인 한계가 발생함을 의미한다.
[1] 이 때문에 여성의 부계 하플로그룹은 검출할 수 없다. 여성의 부계 하플로그룹을 검출하기 위해선 해당 여성의 아버지를 통해서만 검출할 수 있다.[2] 참고로 돌연변이는 연속적으로 항상 일어난다. 지금 이 문서를 읽고 있는 당신도 당신의 부모님께는 없는 유전 형질을 보유하고 있다.[3] 엽록체나 미토콘드리아같이 자체 DNA가 있는 세포 소기관은 원래 독립 생물이었다. 이것이 (아마도) 감염이나 포식 등으로 다른 세포에 들어갔다가 현재처럼 공생으로 진화한 것이다. 생물학자 린 마굴리스('코스모스'로 유명한 칼 세이건의 첫 아내였다.)가 처음 주장했고 지금은 정설이다.[4] 단 현존하는 미토콘드리아 DNA는 원래 독립 생물일 때보다 훨씬 줄어들었다. 이는 대부분이 세포핵으로 자리를 옮겼기 때문이다.[5] mitochondria -DNA의 줄임말이다.[6] 사담으로, 비암호화 DNA는 정크 DNA로도 널리 알려져 있는데 이름 그대로 쓸모없는 DNA이지만 최근 노화 등 여러가지 기능을 하는 것으로 밝혀져 논란이 되고 있다.[7] 단백질로 발현이 된다는 것은 쉽게 설명하면 변이가 일어난 유전자로 인해 몸에 새로운 부분이 생기거나 없어지는 등 새로운 형질이 생기는 것을 의미한다.[8] 하지만 실제론 리보솜 자체의 교정장치를 거치면서 100억 분의 1로 줄어든다.[9] 참고로 SNP로 코로나 변이를 측정하기도 한다.[10] 실제로는 그 정도로 완전히 랜덤하게 섞이지도 않고, 유전자가 그렇게 막 섞인 생식세포가 치명적인 돌연변이를 품고 수정, 출산을 거쳐 다시 자손을 볼 때까지 살기도 힘들지만.[11] 여기서 [math(X)]는 Y-DNA 하플로그룹으로 실제 존재하지 않은 타입이며, 예를 들기 위해 선언한 임의의 하플로 타입이다. 하지만 mt-dna 하플로그룹엔 존재하는 집단이다.[상세] 최초 하플로타입에 변이가 먼저 일어난 순서로 자연수 붙임.[13] 물론 실제 계통수는 아니다. 편의상 계통수라고 지칭했을 뿐.[14] 알파벳이 가장 마지막에 있다 해서 가장 늦게 분화한 것이 아니다. 다시 말하지만 분화순이 아니라 발견순이다.[15] Z1 != Z2이다. 왜냐하면 분기군이 서로 다르기 때문이다. 같은 돌연변이(같은 염기서열)가 아니란 소리다. 비유하면 부모님은 Z로 같지만 Z1이 형이고, Z2는 동생인 것이다.[16] 즉, 공통 하플로그룹에서 분화한 순서대로 숫자가 매겨지는 것이다.[17] 주의해야 할 건 꼭 이주를 해야만 명명하는 것이 아니라, 변이의 여부로 명명하는 것이다. 같은 지역에서 변이가 일어나면 그 지역에서 변이된 하플로를 선언한다.[18] 물론 몇가지 예외가 있다. 게르만족의 I1a1은 7000년 전에, 한국인의 O2b는 9000년 전에 나타나서 각각 30%에 가까운 비율을 차지하고 있다. 하지만 이는 특수한 사례다.[19] 흑인은 비타민 D의 합성이 매우 부족하고, 백인은 피부암 발병 확률이 높다. 피그미족은 숲속의 생활에 적응하여 키가 작아졌고, 티벳 원주민은 고지 적응 특성이 여러모로 확연한 등 실례는 매우 많다.[20] 교배 때 문제가 생기지 않을 정도로 최소한의 유전적 동질성을 가져야만 종으로서 호모 사피엔스(homo sapiens)가 성립한다. 7만 년 전 추정 인구는 약 15,000명으로 멸종위기종이었다. 이것은 번식 않는 노인이나 어린이 등의 인구를 제외했기 때문에 '실제 인구'는 이 두 배 이상은 됐을 것이나 타 동물에 비해 소수였음에는 매한가지이다.[21] 고인골에서 DNA를 얻으려면 우선 묻혀 있던 지역의 온도가 낮아야 하며(그래야 DNA 파괴 속도가 느려진다) 토양이 산성이면 뼈가 아예 녹아 없어지기 때문에 곤란하다. 스반테 파보 팀이 최초로 박물관의 네안데르탈 인의 유해에서 DNA를 찾아냈을 때도 위 두 조건을 만족했기 때문에 가능했다고 한다. 우리나라는 대부분이 산성 토양이라서 이 점에서는 상당히 불리하다고 알려져 있다. 시신이 관에 있는 경우라면 얘기가 달라진다.[22] 물론 위 형질들은 I 고유의 형질은 아니다.[23] 그 이후는 동시베리아 → 베링기아 → 북아메리카로 이동한 것과 한반도, 만주, 연해주로 진출한다.[24] R로 추정하는 학자도 있지만, C일 가능성이 높다.[25] 물론 히틀러의 상염색체가 실제로 유대인 클러스터와 일치한다고 보기엔 무리가 있다. 상술한대로 외형은 상염색체로 인한 집단 단위에서 결정되기 때문이다.[26] 물론 현대 슬라브족은 수 없이 많은 혼혈을 거쳐 탄생했기 때문에 완전 순수 아리아인이라 볼 순 없겠지만, 거의 높은 상관을 띈다.[27] 지배층들의 혈통 연구 등을 보면 알겠지만 우월한(시대에 따라 달라질 수는 있다.) 특성을 지닌 그룹은 일반적으로 숫자가 많지 않을 수도 있다. 까놓고 학자적 특성을 가진 그룹, 과학기술이 발달하기 전 짱 먹었던 전사적 특성을 가진 그룹은 숫자가 생각보다 많지 않다. 대부분은 농부와 같은 노동자 그룹인 경우가 많다. 현실 역시 우월한 사람들이 많지 않다는 것을 증명하는데, 일반적으로 역피라미드가 아니라 피라미드를 이루기 때문이다. 쉬운 예를 들어, 우월한 사람들이 많다면 일정 수준의 어려운 문제들을 맞춘 사람의 숫자가 틀린 사람 숫자보다 많아질 결과가 나올 확률이 높은데 현실은 정반대인 것처럼 말이다.[28] 방사성 동위원소를 이용한 연대 측정은 물론이고, 유물에 남은 생체 분자들의 흔적을 추적하는 방법은 요즘엔 오히려 유물 자체(토기 등)를 관찰하는 것보다 더 시간을 투자하기도 한다.[29] 예를 들면 한민족은 단일민족이라는 등...