력사를 찾아서

환기9217해,신시배달5917해 단기 4353해,서기 2020해, 대한민국 101해(나뉨 72해),

[스크랩]고인골 게놈데이타로 알아 보는 한국인의 기원-7-1)

댓글 0

환국시대/유전학

2020. 10. 5.

동아 상염색체

고인골 게놈데이타로 알아 보는 한국인의 기원-7-1)

 

초재추천 2조회 337  20.10.02 08:36  댓글 5

 

5.f-statistics-2

 

이번에는 앞의 글, f-statistics-1에서 나타난 일반적인 예측과 틀리게 나타나는 현상, 즉, 한반도 남부지역 사람들이 수도권보다 더 중국 섬서성의 해생불랑문화인 석묘문화(Shimao)인들과 유전적으로 더 가깝게 나타난 것과, f3-statistics에서 북방한족인 산서성 한족보다 양자강 중류의 호북성 한족이 한국인에 유전적으로 더 가깝게 나오는 것 등의 원인에 대해서, 보다 구체적인 답을 구하고, 아울러 한국인의 조상 및 기원과 관련되어 논쟁의 대상이 된 여러 문제들을 해결하는 데, 분자인류학적 접근이 어떤 도움을 줄 수 있는 지를 현대 동아시아의 광범위한 여러 인구집단을 비교대상으로 하고, 한국인 샘플에 대해서도 지역별로 더 세분화시켜  f4-statistics를 통해서, 탐구해 보기로 한다. 쟁점이 되는 문제들은 많지만, 현재 수준에서 f-statistics로 접근이 가능한 것으로 보이는 문제는 다음과 같다.

 

1) 한반도에 살던 선사시대인들과 많은 교류의 흔적이 남아 있는 일본열도의 죠몽인과 한국인은 유전적으로 관계가 있는가?

 

2) 요하유역 문화인 홍산문화, 하가점하층문화, 하가점상층문화인들은 한국인과 다른 동아시아인들과 비교해서, 어느 정도 영향을 미쳤는가? 이들 문화의 고인골은 유전적으로 한반도의 어느 지방과 가까운가?

 

3) 산동성지역 Bianbian이나 Boshan, Xiaogao, Xiaojingshan인들은 후에 대문구문화, 산동용산문화 등으로 이어지고, 산동성지역에 살던 이들을 진한통일 이전을 다룬 사서에서 동이(東夷)로 일컫는다. 진한 이후에 중국사서에서 동북지방에 살던 한국인의 조상을 포함한 여러 민족을 동이라고 했는 데, 현재 역사학계의 주류는 동이의 개념이 춘추전국시대에서 진한통일 이후 변화했기 때문에, 산동성의 동이와 한국인과는 관계가 없다고 한다. 과연 그러한가?  

 

4) 황하유역은 중국 한족들의 기원이 된 화하족이 발생한 지역으로, Sino-Titetan어군이 기원이 되는 지역으로, 한국인들과는 요하유역이나 산동성지역에 비해, 관계가 먼 것으로 여겨졌으나, 한국인의 부계 하플로를 보면, 황하유역 기원이 유력하고, 실제 중국 한족들에게서 가장 높은 비율로 나오는 M117이나 F444가 각각 거의 10%에 가까운 비율로 나오고 있다. 황하유역 선사시대인들은 상염색체상으로도 부계하플로와 같이, 한국인과 관계가 있는가?

 

5) 오르도스식 청동기라 하여, 중국 북방 초원지대의 문화에 영향을 받은 유물들이 한반도에서 많이 출토된다. 이것은 어떤 경로로, 어느 집단에 의해 도입되었다고 볼 수 있는가?

 

6)한반도 서해안에 있는 분구묘는 중국 양자강 하류지역에 있는 토돈묘와 유사한 양식이라 한다. 이렇게 유사한 무덤을 만든 사람들은 유전적으로도 어떤 관계가 있을까?

 

7) 앞서의 여러 비교 결과를 통해서, 연해주지역의 선사시대인들이 한국인과 유전적으로 밀접한 관계가 있음을 확인할 수 있었다. 그렇다면, 옛 발해의 영역이기도 한 이 지역에 살았던 발해의 주류라는 말갈족과 한국인은 유전적으로 어떠한가?

 

이번에 비교대상이 되는 현대의 동아시아 인구집단에 대해서, 간단히 설명하자면, 먼저 중국 북방의 Daur는 몽골어계에 속하고, Hezhen와 Oroqen은 퉁구스어계에, 그리고, 러시아 아무르강과 연해주지역에 거주하는 Ulchi도 퉁구스계에 속한다. Mongola는 중국 내몽골자치구의 몽골인이 아닌, 몽골인민공화국의 할흐(Khalkha) 몽골인이다. 그리고, 동북방은 아니지만, 중국 서북방 청해성(靑海省)의 Tu(土族)은 선비족 토욕혼의 후예라고도 하고, 칭기스칸 몽골군이 이 지역에 주둔하여 남은 이들이라고도 한다. 이 밖에 Bonan(保安族)도 녕하회족자치구(寧夏回族自治區)에 거주하는 몽골어계이며, Salar(撒拉族)은 청해성에 거주하는 이슬람교를 믿는 투르크어계 민족이다.

 

 

중국 한족은 Han으로 표시되는 HGDP에 나오는 샘플들은 HGDP에서 중원의 하남성으로 표시되어 있지만, 실제로는 하남성지역의 샘플이기 보다는 중국 남북의 여러 지역 샘플을 모은 것이다. 왕전초 논문에 나온 중국 각 지역 샘플로는 가장 북방인 북경 서쪽

의  Han_Shanxi  산서성(山西省) 한족부터, 약간 남쪽으로 황해 연안의 Han_Shandong 산동성(山東省) 한족, 황해를 따라서 계속 아래로 내려가면서 Han_Jiangsu 강소성(江蘇省)한족, Han_Zhejiang 절강성(浙江省) 한족, Han_Fujian 복건성(福建省)한족, 가장 남쪽의 Han_Guangdong 광동성(廣東省) 한족이 있다. 그리고, 강소성에서 내륙의 서쪽으로 양자강을 거슬러 올라가면서, 이번에 코로나바이러스 발원지로 유명해진 무한(武漢)이 있는 Han_Hubei 호북성(湖北省) 한족,  하나의 직할시이면서, 인구가 3천만에 이르는 Han_Chongqing 중경(重慶)의 한족, 더 상류로 가면, 산지로 둘러싸여서, 외부에서 접근이 어렵지만, 내부에는 너른 분지가 있어서, 삼국시대 유비집단이 세운 촉나라의 근거지가 되었고, 현재에도 인구가 8300만에 이르는 Han_Sichuan사천성 (四川省)한족이 있다.

 

Tibeto-Burman계의 민족으로는 왕전초 논문에, 6개 지역의 티벳인들이 나오는 데,  수도인 Lhasa티벳인만을 이번 비교에 넣었으며, 호북성과 호남성,귀주성 등지의 거주하는 Tujia(土家)족, 그리고, 운남성의 려강지역에 주로 거주하는 Naxi족이 있다.

 

운남성에는 Tai-Kradai계열을 대표하는 Dai(傣族)가 있고, 광서장족자치구의 Maonan(毛南)도 Tai-Kradai계열로서, 장족(壯族)대신 택한 이유는 장족은 주로 평지에 거주하며 주위의 다른 민족들과 혼혈이 많은 데 비해, 모남족은 산지에 비교적 혼혈이 적은 광서지역 토착의 성분을 더 많이 가지고 있기 때문이다. 다른 주요한 남방계 민족으로 Hmong-Mien계의 중국의 양자강 남부지역과 동남아시아에까지 폭넓게 분포하는 Miao(묘족)과 절강성 남부와 복건성북부에 거주하는 She(서족)이 있다. 그리고, Austronesian계열로 대만원주민 Ami와  Atayal이 있다.

 

일본인은 HGDP에 나오는 Japanese외에 새로 PGP(Personal Genome Project)에 참가한 23andme에서 검사받은 일본인 샘플을 Jpn_23andme로 추가하였다. 이유는 앞서 언급한 대로, HGDP의 Japanese는 일본에서 동북방면의 니이가타현에서도 외딴 섬에서 나온 샘플로 동북지역 죠몽인성분이 높아서, 일본인 전체를 대표하기에는 부적합하다고 보기 때문이다. 23andme의 샘플들은 그 수도 얼마 안되고, 지역도 명시되지 않아서, 어느 정도 편향이 있는 지 알 수 없지만, 최소한 동북의 외딴 섬에서만 나온 Japanese보다는 일본인을 보다 잘 대표할 수 있다고 본다. 후에 나오는 f4-statistics의 여러 결과들을 통해 이 점을 확인할 수 있을 것이다.

 

한국인 샘플로는 HumanOrigin 데이타셋에 나온 한국인 샘플 수도권 서울의 Korean외, Kor_kb(경북), Kor_kn(경남), Kor_jn(전남), Kor_jj(제주) 등으로, 23andme나 Wegene 등을 DTC(Direct to Customer)유전자 검사회사를 통해 측정한 샘플들을 추가하였다. 비록, 이들 지역 각각을 대표하는 샘플들의 수는 2~3명으로 적지만, 이 샘플들을 사용한 f-statistics을 실행하기에 중복되는 SNP수가 적어서, 이번 비교에 포함되지 못한 여러 다른 DTC회사들인 23mofang, LivingDNA, Myheritage 등을 통해 검사한 다른 한국인 샘플 데이타를 이용하여 실행한 이전 f-statistics과 유사한 결과를 보였으므로, 앞으로 더 많은 샘플을 통한 검증에서도 크게 차이가 나지 않은 대표성이 있는 결과로 본다.

 

위의 현대 동아시아 집단에 대한 설명에서 볼 수 있듯이, 이번 분석에 동아시아지역의 모든 인구집단이 포함된 것은 아니지만, 동아시아에 존재하는 언어학적으로 인류학적으로 중요하고 대표적인 인구집단들과 지리적으로 동아시아 내 세분화된 지역을 대표할 수 있는 집단은 거의 망라되어 있다고 보며, 한국인과 고인골 데이타들의 관계를 아는 데, 필요한 인구집단들은 거의 이 범위 안에 있다고 할 수 있다.

 

1)       죠몽인

 

이번 F4-statistics는 맨 앞에, 선사시대 동아시아인을 놓고, 그 다음에 Outgroup인 Mbuti 피그미인, 세번째에는 한반도 중부 서울의 현대 한국인, 그리고, 4번째에는 Test집단으로 다른 현대의 동아시아인 집단이 나온다. 수직으로 된 황색 선이 f4값이 0이고, 그 오른쪽의 양의 값이 나오면, 선사시대 동아시아인, 여기서는 죠몽인과 한국인 및 비교가 되는 Test집단과의 관계에서, 한국인이 이 동아시아인 집단보다 죠몽인과 혼혈이 더 많이 되었거나, 유전적으로 공유하는 성분이 많다는 것으로, 황색선 왼쪽으로 f4 값이 음이면 4번째에 있는 Test집단의 현대 동아시아인이 한국인보다, 죠몽인과 혼혈이 더 많이 되었거나, 유전적으로 더 공유하는 성분이 많다고 해석한다. D-statistics와 마찬가지로, 수평의 error_bar가 빨간색으로 표시되어 Z-score가 |3|보다 클 때, 이 결과가 의미가 있는 것이다.

 

그림23) f4-stat (Jomon,Mbuti,Korean,Test)

 

한국인보다 죠몽인에게서 가장 거리가 먼 집단으로, 죠몽인과 같이 부계하플로 D가 많은 티벳인이 나오는 데 이것으로 볼 때도 부계하플로와 같은 Uniparental marker가 유사한 집단이라고 해서, 반드시 상염색체상에서 유전적 거리가 가깝게 나오는 것은 아니라는 것을 다시 한 번 확인할 수 있다. 티벳인 D부계하플로는 D1a1와 D1a2이고, 죠몽인과 현대 일본인은 D1b인 데, 위의 f-statistics결과에서 확인할 수 있듯이, 이 두 집단은 분리된 시간(D1a의 TMRCA 45,000년 전)이 아주 오래되었다는 것을 알 수 있다. 인도양상 안다만제도의 Onge인은 티벳인과 달리, 죠몽인과 같은 부계하플로 D1b 에 속하는 데, 상염색체 분석에는 죠몽인은 이 Onge인과도 공유하는 유전적 성분이 거의 없다는 결과도 있다(Gakuhari et al. 2020). 이 결과들은 죠몽인이 동아시아인을 형성한 주류 인구집단들과 아주 오래 전에 분리된 독특한 인구집단이라는 사실을 보여 준다. 그리고, Daur, Oroqen, Hezhen 등의 북방계 민족들과 Dai나 여러 중국 한족들도 한국인보다 죠몽인에게서 거리가 멀다고 나온다.

 

반면에, HGDP의 Japanese일본인이나 23andme의 Jap_23andme일본인들은 예상할 수 있듯이, 서울의 한국인보다 죠몽인에 확실히 가깝다.  그리고, 오호츠크해를 사이에 두고,  홋카이도 및 사할린섬의 죠몽인들과 교류를 하였을 연해주와 아무르강 유역의 Ulchi인도 서울의 한국인보다 죠몽인에 가까와 보이고, 급한 조류로 인해 거리가 멀지는 않지만, 선사시대인의 기술로는 항해가 어렵다고 여겨졌던 오키나와 남쪽 끝의 야에야마제도(八重山諸島)와 대만섬 사이에 최근 교류를 한 흔적이 발굴되고 있는 것으로 보아서, 죠몽인과 대만 원주민 사이에도 어떤 유전적 영향이 있었을 것이고, 그것을 반영하듯 Ami와 Atayal도 서울의 한국인과 비슷하거나, 조금 더 죠몽인에 가깝다는 결과가 나온다. Ulchi인과 대만원주민 Ami와 Atayal의 죠몽인과의 관계에 대한 위의 f4-statistics결과는 Kanzawa-Kiriyama et. 2019 <Late Jomon male and female genome sequences from the Funadomari site in Hokkaido, Japan>에 나온 분석결과들과도 거의 일치한다.

 

한국인과 죠몽인의 관계를 지역별로 나누어서 살펴 보면, Admixture분석에서 일본인의 거의 절반 정도 죠몽인 성분이 나온, 제주도인이 서울의 한국인보다 죠몽인에 의미있게 가깝다고 나온다. 그 다음, 전남과 경북이 서울 사람보다 약간 죠몽인에 가깝게 나오지만 큰 의미를 두기 어렵고, 일본과 가장 거리가 가깝고, 신석기 시대부터 흑요석 무역 등을 통해서, 일본열도의 선사시대인과 가장 교류의 역사가 깊은 경남지역은 서울지역과 죠몽인과의 유전적 거리가 거의 차이가 없다. 이러한 결과로 볼 때, 전남지역의 전방후원분을 남긴 사람들이 일본 열도에서 온 사람들 일 수도 있겠지만, 이들이 한반도 인구집단에 남긴 흔적은 미미하다고도 할 수 있을 것이다.

 

물론, 전남의 영산강유역 전방후원분에 묻힌 사람들이나, 경남의 가야에 온 일본열도인들은 죠몽인과의 혼혈이 거의 안 된, 한반도인들과 분리가 된 지, 얼마 안 된 사람들이라면, 이렇게 죠몽인과의 유전적 거리로 일본열도인의 영향여부를 판단하기는 어려울 것이다. 그러나, 큐슈 서북부의 사세보야요이인과 같이, 한반도에서 건너간 것이 확실한 부계하플로 O1b2a(47z)에 속하는 샘플이 현대일본인보다 휠씬 높은 죠몽인 비율을 보여 주는 것을 볼 때, 야요이시대부터 이미 죠몽인과의 혼혈은 있었던 것으로 보인다. 원래 사세보야요이인과 한반도 각 지역 사람들과의 f-statistics분석도 하려고 했으나, 사세보야요이인의 데이타 퀄리티가 좋지 않아서, 실행할 수 없었다. 차후에, 보다 많은 야요이시대인이나 고분시대 초기 일본열도인의 고인골 자료가 나온다면, 이 자료들을 통해서, 다시 이 부분에 대한 검증을 시도해 볼 것이다.

 

역사시대에 들어서, 특별히 일본인들과의 연관이 크지 않은 제주도가 의미있게 죠몽인과의 유전적 거리가 가깝고, 전남이나 경남지역과 같은 일본인과의 교류의 역사가 확인가능한 지역에서 그러한 영향이 적은 수도권지역인과 죠몽인과의 유전적 거리가 별차이가 없는 것은 한반도 남단 전체에 이러한 신호가 평탄하게 된 것이라 볼 수 있고, 이것은 오래 전 선사시대(아마도 구석기) 죠몽인이 거쳐간 흔적일 가능성이 있다고 할 수 있다. 그러므로, 동아시아의 변방인 일본열도나 티벳지역이 동아시아에 오래 전에 진입한 인류의 흔적을 보존하고 있듯이, 한국인들의 거주지역에서 변방인 제주도는 한반도인들에게서 많이 사라진 오래 전 선사시대인들의 신호를 상염색체 방면에서 더 많이 보존하고 있다고 볼 수 있다.

 

 

2)       홍산문화인

그림24) f4-stat(WLR_MN,Mbuti,Korean,Test)

 

우하량유적과 함께 홍산문화를 대표하는 WLR_MN 반랍산유적에서 나온 고인골과 한국인 및 다른 동아시아 인구집단을 비교한 위의 그래프를 보면, 한국인 내부의 지역별 인구집단을 제외한 다른 거의 모든 동아시아 인구집단이 서울의 한국인보다 홍산문화인과의 거리가 더 먼 것으로 나타난다. Ulchi인과 Hezhen 두 퉁구스계 민족이 약간 차이가 나게 가깝고, 중국의 여러지역 한족 중에는 유일하게 산동성 한족, 그리고, 두 일본인 집단 등이 한국인 만큼은 아니지만, 홍산문화인에 어느 정도 근접해 있을 뿐이다. 이로써 볼 때, 현대의 동아시아 인구집단 중에, 상염색체상으로 확실히 홍산문화인과 연관을 주장할 수 있는 집단은 한국인뿐이라 해도 과언이 아니라 할 수 있다.

 

한국인 중에서 전남지역은 서울지역보다 홍산문화인과의 거리가 약간 멀고, 서울, 경남, 제주, 경북의 순으로 홍산문화인과 유전적 공유성분이 높다고 나오지만, 그리 큰 의미 있는 차이는 아니다. 한국인과 홍산문화인이 공유하는 유전적 성분이 다른 동아시아인 집단에 비해 높은 것에 대한 원인으로, 다음과 같이 추정해 볼 수 있다.

 

1)  원래 홍산문화인과 비슷한 시기에 한반도에 존재했던 한국인의 조상인구집단이 홍산문화인과 유전적으로 유사했다. 즉, 현대 한국인은 신석기 초중기이전부터 한반도에 존재했던 홍산문화인과 유사한 유전자를 지닌 사람들이 계승되어 내려온 사람들이다.

 

2) 홍산문화가 소멸된 뒤, 요서지역에서는 소하연문화-하가점하층문화-하가점상층문화 등으로 이어지는  데, 이들 중에 홍산문화와 유전적으로도 강한 계승관계를 지닌 어떤 인구집단이 한반도로 대거 이주하여, 현대 한국인의 주류가 되었기 때문이다.

 

위 1)의 추정에도 언제부터 홍산문화와 유전적으로 유사한 사람이 존재했는 지에 따라서, 다른 모델이 나올 수 있다. 즉, 세석기(Microlithic)을 사용하기 시작한 구석기 후기부터 요서와 한반도에 공통적으로 이러한 유형의 사람들이 존재했는 지, 혹은 실제로, 한국인의 조상과 홍산문화인은 일종의 형제간으로서, 홍산문화 이전의 소하서, 흥륭와, 조보구문화의 등의 신석기 문화 어느 한 시기에서 갈라져서, 한쪽은 그대로 요서에 남아 홍산문화를 이루어내고, 한반도로 이주한 쪽은 빗살무늬토기인이 되었을 수도 있다.

 

현재 데이타로 볼 때, 큰 차이는 아니지만, 앞에서 죠몽인과 같은 비교적 오래 전 흔적을 보존하고 있는 제주도인이 서울지역보다 홍산문화인과 가까운 것을 볼 때, 홍산문화인과 가까운 유전자를 지닌 사람들이 한반도에 정착한 시기는 오래 된 것으로, 청동기 이전 신석기 시대에 이미 그랬던 것이 아닐까 생각해 볼 수 있다. 그러나, 나중에 보겠지만, 하가점하층문화나 하가점상층문화인 역시, 한국인과 공유하는 유전자가 많다는 사실을 고려할 때, 이후에 한반도에 유입된 사람들이 공헌한 것도 적지 않을 것으로 보인다. 이것에 대해 보다 정확히 알기 위해서는 한반도의 구석기, 신석기, 청동기시대의 고인골에서 데이타가 나와 각각과 비교해야 할 것이다.

 

◆ 홍산문화의 부계하플로그룹 구성비율 문제

 

한국인과 홍산문화인와의 연관은 홍산문화 우하량유적에서 나온 고인골의 모계하플로와 대응을 통해서도 이미 서술된 바 있고, 고고학자들 중에도 홍산문화의 제단, 적석총 등의 묘제, 옥기 등을 통해서, 한국문화의 연관을 주장하는 사람들도 있다. 그러나, 이에 반해서, 홍산문화 우하량유적에서 나온 고인골의 부계 하플로 측정에서 6개의 샘플 중에서 N1(XN1a,N1c)이 4, C2이 1, O3a 1가 나왔는 데(Cui et al. 2013), 이 비율이 현대 한국인의 부계하플로 그룹 비율과 크게 다르므로, 홍산문화와 한국인과는 관련이 없다는 주장을 하는 이들이 있다. 이들은 분자인류학 연구자도 아니고, 논문으로 이러한 주장을 펴낸 것은 아니지만, 네이버의 역사 커뮤니티나 블로그 등을 근거지로 지속적으로 분자인류학에 대한 편향되고, 잘못된 정보를 퍼뜨려서, 많은 사람들에게 영향을 주기에 여기에 대해 언급하기로 한다.  

 

앞서, 죠몽인과 한국인, 현대 티벳인이나 안다만제도의 Onge인과의  f4-statistics의 결과를 설명하는 부분에서 언급했듯이, 부계하플로나 모계 하플로와 같은 Uniparental Marker는 인구집단간의 유전적 연관을 추정하는 데, 한계를 가진다. 부계 하플로를 결정하는 SNP는 인간의 염색체가 가진 30억개의 염기 중 극히 일부인 수천개 정도에 불과하다. 인구집단간의 유전적 친연관계를 결정하는 데, 전체적인 상염색체에서의 유전적 거리가 어떠한 지를 이것을 판단할 수 있는 데이타가 있다면, 그것을 먼저 보아야 할 것이다. 그 다음에, 인구집단간의 유전적 관계를 보다 구체적으로 알기 위해서, 고인골에 나타난 부계하플로나 모계 하플로를 참조한다면, 부계하플로 N1이나 O2와 같은 매크로 하플로그룹의 비율이 아니라, 구체적인 하위 하플로그룹의 유형을 검토해야 한다.

 

일반적으로 선사시대 유적에서 나온 고인골에서 Y하플로그룹을 측정가능한 것은 고인골의 훼손이나 오염 등의 문제로 적은 수로 한정되어 있다. 유적에서 나온  고인골 가운데, 일부의 아주 적은 수의 고인골만이 Y하플로그룹 측정이 가능하다. 그래서, 고인골에서 측정된 Y부계하플로로 현대 인구집단과의 비교를 위해서는 통계적으로 유의미한 추정을 할 수 없는 몇 개 안되는 샘플들에서의 하플로그룹 비율을 보는 것이 아니라, 고인골 데이타로는 충분한 하위 하플로그룹을 파악하기 어려운 경우가 많지만, 가능한 정도까지 하위하플로를 탐색해서, 이 구체적인 하위하플로 그룹이 대응하는 현대 인구집단에 존재하는 지를 알아 보는 것을 우선시한다. 즉, 이 경우 정량적인(quantitative) 분석보다는, 정성적인(qualitative) 분석을 해야 한다는 것이다.

 

홍산문화에서 6개 샘플 중에서 66%로 부계하플로 N1(XN1a,N1c)이 나왔는 데, 부계하플로 N1(XN1a,N1c)이 이렇게 높은 비율로 나오는 현대 인구집단은 동아시아에서는 찾을 수 없고, 시베리아의 일부 우랄계 언어를 사용하는 민족들(Nganasan, Khants, Mansi, etc) 이다. 어차피 이들에게는 홍산문화의 계승자로 한국인만 아니라면, 다른 어떤 인구집단이 되든 상관없을 것이므로, 이들도  홍산문화의 계승자일 수도 있다. 그러나, 이것도, 홍산문화에 나타나는 하플로 N1의 하위유형이 무엇이며, 이 하위 하플로그룹이 일치하는 지를 살펴야 한다. 즉, 하플로N1의 서로 다른 하위 하플로가 각 인구집단에 나타나면, 그 비율이 아무리 비슷하든, 두 인구집단은 관련이 없는 것이다.

 

또 하나, 염두에 두어야 할 것은, 특정 인구집단이 전체 상염색체나 모계하플로 방면에서는 큰 변화가 없이 지속성이 있더라도, 통시적인 시대의 변화에 따라 부계하플로의 구성비율은 변화가 있을 수 있다는 것이다. 예를 들어, 징기스칸의 부계하플로로 알려진 C2a의 star-cluster와 같은 부계하플로가 급격하게 확장해서, 중앙아시아지역의 여러 인구집단에서 부계하플로 구성비가 많이 바뀌었지만, 대부분의 인구집단은 이전과 같이, Turkic계열의 언어를 말하고, 상염색체 전체의 구성은 유사하다.

 

한국인과 일본인은 상염색체상으로 가깝고, 모계하플로의 구성비는 매우  유사하지만, 부계하플로에 있어서, 현대 일본인에게서 하플로 D가 지역에 따라서 30~40%에 이르게 높게 나타나지만, 한국인에게서는 2%정도로 낮다. 분자인류학 연구 초기 단계에 이러한 한국인과 일본인의 부계하플로 구성비에서 하플로 D의 큰 차이만 보고서, 한국인과 일본인의 유전적으로 동질적인 인구집단에서 분화했다는 것을 부정하는 견해가 있었다. 이것은 일본열도에서도 아마도 역사시대에 부계 하플로 D의 특정 하위 하플로가 급격히 확장한 것에 기인한 것으로 보이는 데, 이렇게 부계하플로는 사회적 선택(social selection)에 영향을 받기 쉽기 때문에, 원래 유전적 동질성이 강한 집단이라 하더라도, 분화된 이후에, 시대와 지역을 달리하면, 그 구성비율은 잘 변화될 수 있다. 그러므로, 하위유형이 제대로 구분되지 않고, 매크로 하플로그룹으로 분류된 부계하플로의 구성비율만으로, 시대가 다른 두 집단간의 유전적 유사성을 확인하려는 것은 부적합하다고 볼 수 있다.

 

한국인의 주류는 언제 형성되었는가라는 문제에 대해서, 북한 학계는 구석기시대에 존재한 ‘승리산사람’과 같은 집단이 연속해서 이어져 내려오는 것이라하고, 혹자는 신석기시대 빗살무늬토기인이 주류가 되었다라고, 청동기시대에 한반도에 진입한 집단이 주류라고 하고, 또는 철기시대의 점토대토기를 만들었던 사람들이라고도 한다. 이렇게, 한국인도 지구상의 거의 모든 다른 인구집단처럼, 단일한 종족이 수만년 동안 변함없이 이어져 내려 온 것이 아니라, 다른 시기에 한반도로 진입한 여러 다른 인구집단이 혼혈하여, 생긴 것이고, 이 서로 다른 인구집단은 아마도 부계하플로의 비율도 많이 달랐을 것이다. 중국 동북지역의 선사시대 유적에서 나온 고인골들의 부계하플로 비율을 보면, 홍산문화와 소하연문화시기까지 하플로 N의 비율이 절대적으로 높다가, 하가점하층문화에서부터 하플로 O의 비율이 점차 증가하는 것을 볼 수 있다.

 

홍산문화시기 한반도에 존재한 빗살무늬토기를 만들었던 집단도 홍산문화인과 비슷하게, 하플로 N1의 비율이 높았을 가능성이 크다. 한반도에 빗살무늬토기가 성행한 것과 유사한 시기에 핀란드, 폴란드 등의 북동유럽에서 Comb Ceramic Culture라고 해서, 역시 사선으로 빗금을 그은 무늬가 있는 토기가 나타났고, 유럽고고학계에서는 이 토기가 시베리아나 북중국 등의 아시아방면에서 기원했다고 본다. 현재 핀란드나 에스토니아와 같은 우랄계 언어를 사용하는 북동유럽의 국가에서 부계하플로 N1의 비율이 높은 데, 현대 핀란드인에서 부계하플로 N1은 약 60%의 비율로 절대 다수 이고, 주변의 스웨덴, 라트비아, 에스토니아, 러시아 등지에서도 20~40%로 높은 비율로 나온다.

 

이 북동유럽의 N1은 홍산문화의 부계하플로 N과는 하위 하플로유형은 달라서, 이 지역은 거의 N1c에 속한다. Cui et al. 2013 논문에서 홍산문화 우하량유적에서 나온 고인골의 부계하플로가  N1(xN1a,N1c)로 표기되는 데, 이는 하플로 N1중에서 N1a와 N1c(M178)는 eXclude, 곧 배제한다는 의미이다. 홍산문화 우하량유적에서의 높은 부계하플로 N1의 비율을 보고, 이것이 현대의 핀란드, 에스토니아, 라트비아, 러시아, 폴란드 등의 북동유럽에서의 높은 부계하플로 N1의 비율과 유사하기에, 홍산문화가 소멸된 후, 그 후예들이 핀란드로 이동한 것이다라는 의견도 있다. 그러나,  N1 아래 서로 다른 하위하플로가 있고, 이 하위하플로 중에 N1a,N1c 등은 이미 분리된 지 적어도 10,000년이 넘고, 홍산문화 우하량유적의 고인골은 N1c가 없으므로,  핀란드인은 홍산문화와는 관계가 없다고 말할 수 있다. 

 

어쨌든 Comb ceramic culture에서 발굴된 고인골에서 하플로 N1이 다수는 아니지만, 이 시기부터 본격적으로 북동유럽에 등장함으로서, Comb ceramic의 아시아적 기원과 하플로 N1의 등장이 서로 관련이 있음을 알 수 있다. 그러므로, 한반도의 부계하플로 하위 유형이 북동유럽과 같은 N1c인지 혹은 홍산문화와 유사한 것인지 알 수 없지만, 한반도 주위의 신석기 시대 요서지역과 산동성지역(후리문화) 모두 하플로 N의 비율이 높았고, 시베리아 혹은 북중국에서 유래한 것으로 추정되는 Comb ceramic토기가 등장하던 시절 북동유럽에 하플로 N1이 나타나는 것을 볼 때, 한반도의 빗살무늬토기가 유행하던 시기, 부계하플로 N이 다수였을 가능성이 높다고 말 할 수 있을 것이다.

 

요서지역에서 하플로 O는 홍산문화에서도 존재했지만, 그 비율은 그리 높지 않았다. 그러나, 이후에, 이 비율은 지속적으로 상승했으리라고 추정할 수 있는 근거가 있는 데, 그것은 최근에, 우하량 유적의 최고 등급 대묘에서 나온 고인골의 부계하플로가 O2a2b1(M117)에 속하는 것으로 알려졌기 때문이다. 여러 역사적 사례에서 증명하듯이, 사회적 계급 분화가 진행될수록 수장급에 자원이 집중되기에, 다른 외부적인 유입이 없어도, 홍산문화시기에 최고급 수장이 하플로 O였다면, 이후에, 홍산문화 내에서 부계하플로 O의 비율이 증가했을 것이다.

 

이런 내부적인 요인 외에, 더 중요한 것은 홍산문화 이후에 나타나는 하가점하층문화, 하가점상층문화 등에 지속적으로 하플로 O가 다수인 황하유역이나 중원지역으로부터 인구유입이 암시되고 있다. 현재 학계의 주류 의견은 청동기시대 요동방면에서 한반도로 진입한 집단이 한국인의 주류가 되었다는 것으로 보이는 데, 이들 청동기시대 요동방면에 존재했던 인구집단은 황하유역에서의 인구집단 유입 외에, 발해만을 사이에 두고, 산동성방면에서도 영향을 많이 받았는 데, 산동성방면에도, 홍산문화와 같이, 하플로 N이 다수였던 후리문화 이후에는 대문구문화, 산동용산문화 등으로 이어지면서, 점차 하플로 O가 다수가 된 것으로 보인다. 이러한 여러 방면에서의 하플로 O의 인구 유입이 결국, 현재와 같이, 현대 한국인의 부계하플로 그룹 비율이 홍산문화인과 다르게 되는 요인이 되었을 것이다. 

 

이러한 변화과정이 일시적으로 한 번에 일어난 것이 아니라, 수 천년에 걸쳐서, 완만하게 이루어졌고, 새로 요서나 요동지역에 등장한 하플로 O그룹은 그 전부터 존재한 집단에 천천히 동화되어 갔기에, 위의 f4-statistics의 결과와 같이, 비록 부계하플로그룹의 구성비율은 다르지만, 현대 한국인이 홍산문화인과 유전적 성분을 가장 많이 공유하는 것으로 나타난 것이다. 그렇지만, 현대 한국인에게 존재하는 하플로 O도 원래 출발지였던 황하유역의 황토고원이나 산동성의 교동반도 혹은 더 남쪽으로 강소성 일대 등에서 기원했을 유전자도 여전히 지니고 있는 데, 이러한 흔적은 뒤에 나올 f4-statistics의 다른 분석들을 통해서, 확인할 것이다.

 

덧붙여서, 홍산문화 우하량유적의 부계하플로를 측정한 Cui et al. 2013 < Y Chromosome analysis of prehistoric human populations in the West Liao River Valley, Northeast China> 이라는  논문 자체도 문제가 있는 데, 우선 중국인 연구자들의 고질적인 나쁜 습관을 따라, 부계하플로를 측정한 고인골을 시퀀싱한 raw data를 공개하여 제공하지 않는다. 논문에 나온 가설을 다른 연구자들도 검증할 수 있도록 제공해야 할 Raw data를 잘 내놓지 않는 중국인 연구자들의 문제는 2020년이 된 지금에서도 잘 개선이 안 되고 있는 데, 하버드 대학이나 독일 막스플랑크연구소와 같은 외국의 연구기관과 공동으로 진행한 연구를 제외하고, 자기들 국내 연구자들끼리 한 연구에서는 논문에서 데이타를 공개했다고 하고, 사이트를 적어 놓았는 데, 막상 그 사이트에 가서 다운로드를 받으려면 Lock이 걸려 있는 경우도 있다.

 

그리고, raw data 대신 supplement에서 측정된 Y-SNP와 Y-STR값을 제공하는 데, Y-SNP하플로와 Y-STR이 통상적으로 매칭되기 어려운 샘플들이 있다, 즉 이 논문의 저자들이 Y-SNP하플로도 제대로 측정했는 지를 의심할만한 정황이 있는 것이다. 이 논문에서 raw data를 제공하지 않음으로써, 이 논문에서 저자들이 측정했다는 대략적인 하플로 그룹외에, 하부의 어떤 유형을 나타내는 SNP가 양성인지 음성인지 확인할 수 없다. 물론 홍산문화의 고인골 데이타 자체의 퀄리티가 낮아서, 매크로 하플로 그룹 분류외에 더 하위 단계의 하플로를 결정하기 어려울 수도 있지만, 많은 경우, 이 논문에서 내놓은 결과와 같이, 특정 하위 하플로를 대표하는 SNP의 음양성 여부만 확인하기 쉬운 데, 실은 이 대표적인 SNP외에도, 그와 평행하는 많은 SNP들이 있고, 하플로 그룹에 대한 연구가 진행될수록, 이후에, 평행하는 SNP의 숫자가 증가한다. Raw data가 제공되었다면, 2013년 당시에는 확인하지 못한, 이러한 하위하플로그룹을 대표하는 SNP와 평행하는 여러 SNP들의 음양성여부를 통해서, 하위 하플로그룹을 판단할 수도 있었을 것이다.

 

결국, 이 논문에 나온 매크로 부계하플로 측정 결과만으로는 한국인과의 관련을 확인하기는 어려운 것이고, 2020년 또 다른 홍산문화의 반랍산유적에서 나온 고인골 데이타로 상염색체에 대한 분석을 실행할 수 있는 현재의 시점에서, 홍산문화인과 한국인과의 유전적 관련성을 판단할 수 있는 자료로서 유효성을 가지기 어렵고, 개략적인 참고자료로만 활용할 수 있을 것이다.

 

출처; http://cafe.daum.net/molanthro/I4qd/140