ơAND
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Hà Nội - 2018
Nguyễn Bảo Trang
PHÂN TÍCH ĐA DẠNG DI TRUYỀN VÙNG SIÊU BIẾN ADN TY THỂ
NGƯỜI VIỆT NAM THUỘC 5 DÂN TỘC KINH, THÁI, HMONG,
LOLO VÀ GIARAI
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội - 2020
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Nguyễn Bảo Trang
PHÂN TÍCH ĐA DẠNG DI TRUYỀN VÙNG SIÊU BIẾN ADN TY THỂ
NGƯỜI VIỆT NAM THUỘC 5 DÂN TỘC KINH, THÁI, HMONG,
LOLO VÀ GIARAI
Chuyên ngành: Sinh học thực nghiệm
Mã số: 8420101.14
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. NGUYỄN THÙY DƯƠNG
PGS. TS. NGUYỄN QUANG HUY
Hà Nội - 2020
LỜI CẢM ƠN
Để thực hiện thành công luận văn thạc sĩ này, tôi xin gửi lời cảm ơn sâu sắc
và chân thành đến TS. Nguyễn Thùy Dương (Trưởng phòng Hệ gen học người Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ Việt Nam), người
đã trực tiếp hướng dẫn, chỉ bảo tận tình trong suốt thời gian tôi thực hiện đề tài. Cô
là người đã tạo điều kiện cũng như truyền cho tôi những kinh nghiệm quý báu trong
nghiên cứu khoa học.
Trong suốt thời gian học tập và nghiên cứu vừa qua, tôi đã nhận được sự
dạy dỗ, khích lệ và hỗ trợ nhiều mặt của PGS. TS. Nguyễn Quang Huy (Trưởng
khoa Sinh học, Trường Đại học Khoa học tự nhiên, Đại học Quốc gia Hà Nội). Sự
quan tâm, giúp đỡ của thày đã góp phần không nhỏ giúp tôi hoàn thành luận văn
tốt nghiệp này. Tôi xin chân thành cảm ơn những sự trợ giúp quý báu đó.
Tôi cũng xin được bày tỏ lòng biết ơn của mình đến PGS. TS. Nông Văn
Hải (Chủ tịch Hội đồng Khoa học, Viện Nghiên cứu hệ gen), tập thể cán bộ Phòng
Hệ gen học người và các cán bộ Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học
và Công nghệ Việt Nam đã tạo điều kiện thuận lợi và tận tình hướng dẫn, trợ giúp
tôi thực hiện tốt đề tài nghiên cứu này.
Tôi xin chân thành cảm ơn các thầy cô thuộc Khoa Sinh học, Trường Đại
học Khoa học tự nhiên, Đại học Quốc gia Hà Nội đã tạo điều kiện tốt nhất cho tôi
để hoàn thành luận văn này.
Luận văn được thực hiện trong khuôn khổ của đề tài thuộc Bộ Khoa học và
Công nghệ mã số ĐTĐL.CN-05/15 và đề tài cấp cơ sở thuộc Viện Nghiên cứu hệ
gen – Viện Hàn lâm Khoa học và Công nghệ Việt Nam.
Hà Nội, ngày 30 tháng 12 năm 2019
Học viên cao học
Nguyễn Bảo Trang
MỤC LỤC
DANH MỤC CÁC HÌNH ....................................................................................... iv
DANH MỤC CÁC BẢNG ........................................................................................v
MỞ ĐẦU ....................................................................................................................1
Chương 1. TỔNG QUAN .........................................................................................3
1.1. Đặc điểm của ADN ty thể người ........................................................................3
1.1.1. Cấu trúc ADN ty thể .................................................................................. 3
1.1.2. Cấu trúc vùng điều khiển D-loop ở ADN ty thể........................................ 4
1.1.3. ADN ty thể, vùng D-loop và hai đoạn siêu biến HV-I và HV-II trong
nghiên cứu di truyền quần thể người .................................................................... 5
1.1.4. Tình hình nghiên cứu di truyền quần thể người Việt Nam dựa trên hai
đoạn siêu biến HV-I và HV-II thuộc vùng D-loop và ý nghĩa thực tiễn của đề tài
luận văn ................................................................................................................ 8
1.2. Một số đặc điểm dân tộc học của người Kinh, Thái, Hmong, Lolo và Giarai ...9
Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU .......................12
2.1. Đối tượng nghiên cứu .......................................................................................12
2.2. Hóa chất và thiết bị ...........................................................................................14
2.3. Phương pháp nghiên cứu ..................................................................................15
2.3.1. Phương pháp tách chiết ADN tổng số ..................................................... 15
2.3.2. Phương pháp điện di kiểm tra trên gel agarose ....................................... 16
2.3.3. Phương pháp khuếch đại đoạn ADN bằng PCR ...................................... 16
2.3.4. Phương pháp giải trình tự ADN .............................................................. 17
2.3.5. Phương pháp phân tích số liệu ................................................................. 17
Chương 3. KẾT QUẢ VÀ THẢO LUẬN .............................................................19
3.1. Tách chiết và tinh sạch ADN tổng số từ các mẫu máu ....................................19
3.2. Khuếch đại đoạn gen chứa trình tự gen HV-I và HV-II ...................................19
i
3.3. Xác định trình tự và phân tích số liệu các đoạn gen HV-I và HV-II của các
mẫu nghiên cứu .........................................................................................................21
3.3.1. Xác định các đa hình thuộc hai vùng siêu biến HV-I và HV-II của các
mẫu nghiên cứu .................................................................................................. 21
3.3.2. Phân tích thống kê các đa hình thuộc hai vùng siêu biến HV-I và HV-II ở
các dân tộc Kinh, Thái, Hmong, Lolo và Giarai ................................................ 24
3.4. Phân tích đa dạng di truyền của các mẫu nghiên cứu thuộc các dân tộc Kinh,
Thái, Hmong, Lolo và Giarai trên cơ sở trình tự vùng siêu biến ADN ty thể ..........35
KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................38
TÀI LIỆU THAM KHẢO ......................................................................................39
PHỤ LỤC .................................................................................................................44
ii
DANH MỤC CÁC CHỮ VIẾT TẮT
Chữ viết tắt
Tiếng Anh
Tiếng Việt
bp
Base pair
Cặp bazơ
ADN
Deoxyribonucleic acid
Axit Deoxyribonucleic
ddNTP
Dideoxynucleoside triphosphate
Dideoxynucleoside triphosphate
dNTP
Deoxynucleoside triphosphate
Deoxynucleoside triphosphate
EDTA
Ethylene
acid
EtOH
Ethanol
Etanol
HV1
Hypervariable segment 1
Đoạn siêu biến 1
HV2
Hypervariable segment 2
Đoạn siêu biến 2
PCR
Polymerase chain reaction
Phản ứng chuỗi polymerase
RNA
Ribonucleic acid
Axit ribonucleic
TAE
Tris – acetate – EDTA
Tris – acetate – EDTA
SNP
Single nucleotide polymorphism
Đa hình nucleotide đơn
diamine
tetra-acetic Axit ethylene diamine tetraacetic
iii
DANH MỤC CÁC HÌNH
Hình 1. Cấu trúc của ADN ty thể người .....................................................................4
Hình 2. Cấu trúc vùng D-loop của ADN ty thể người ................................................5
Hình 3. Sơ đồ mô tả quá trình di cư của các nhóm đơn bội ADN ty thể người..........6
Hình 4. Ảnh điện di ADN tổng số trên gel agarose 0,8% .........................................19
Hình 5. Ảnh điện di sản phẩm PCR khuếch đại đoạn gen HV-I của một số mẫu đại
diện trên gel agarose 1% ...........................................................................................20
Hình 6. Ảnh điện di sản phẩm PCR khuếch đại đoạn gen HV-II của một số mẫu đại
diện trên gel agarose 1% ...........................................................................................20
Hình 7. Kết quả giải trình tự một số mẫu đại diện chứa một số đa hình trên đoạn
HV-I ..........................................................................................................................22
Hình 8. Biểu đồ thống kê đa hình trên 2 đoạn HV-I và HV-II của vùng D-loop phát
hiện được ở các dân tộc Kinh, Thái, Hmong, Lolo và Giarai khi so sánh với trình tự
tham chiếu rCRS .......................................................................................................23
iv
DANH MỤC CÁC BẢNG
Bảng 1. Mẫu nghiên cứu của mỗi dân tộc Kinh, Thái, Hmong, Lolo và Giarai .......12
Bảng 2. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Kinh và Thái .....24
Bảng 3. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Kinh và Hmong
...................................................................................................................................25
Bảng 4. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Kinh và Giarai
...............................................................................................................................…26
Bảng 5. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Kinh và Lolo.....27
Bảng 6. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Thái và Hmong ........... 28
Bảng 7. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Thái và Lolo .....29
Bảng 8. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Thái và Giarai.. .30
Bảng 9. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Hmong và Lolo
...................................................................................................................................31
Bảng 10. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Hmong và Giarai
...................................................................................................................................32
Bảng 11. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Lolo và Giarai
...................................................................................................................................33
Bảng 12. Tần suất nhóm đơn bội 182 mẫu nghiên cứu thuộc 5 dân tộc Kinh, Thái,
Hmong, Lolo và Giarai ............................................................................................. 36
v
MỞ ĐẦU
Việc giải mã ADN hệ gen của người được cho là đóng một vai trò quan trọng
trong việc tìm hiểu về quá trình tiến hóa, nguyên nhân gây bệnh và sự tương tác
giữa môi trường và di truyền ở người. Chính vì điều này đã có rất nhiều nhà khoa
học cũng như các phòng thí nghiệm lớn trên toàn thế giới đã và đang tập trung giải
mã ADN. Một trong những hướng nghiên cứu được tập trung nhiều nhất là giải mã
ADN ty thể do ADN ty thể có các đặc tính như di truyền theo dòng mẹ, ít trao đổi
chéo, số lượng bản sao lớn trong mỗi tế bào và ít bị phân hủy theo thời gian. Do đó,
các nghiên cứu liên quan đến ADN ty thể đã giải quyết được những vấn đề then
chốt trong quá trình tiến hóa và giải thích lịch sử di truyền của các quần thể người ở
các vùng địa lý khác nhau cũng như trong các khoảng thời gian khác nhau [23, 33].
Bên cạnh đó, đã có nhiều nghiên cứu chỉ ra rằng mặc dù cấu trúc hệ gen của các cá
thể người tương đối giống nhau (99,9%), sự khác biệt vẫn lên đến 0,1%. Phần khác
biệt này chủ yếu là các đa hình nucleotide đơn (SNP) và có ảnh hưởng đến nhân
chủng học của mỗi dân tộc. Do đó, các SNP trên ADN ty thể thích hợp để nghiên
cứu các mẫu ADN cổ đại, ứng dụng rộng rãi trong sinh học và y học. Trong phân tử
ADN ty thể, dù mang chức năng quan trọng, nhưng vùng điều khiển (D-loop) lại có
tỷ lệ đột biến cao gấp 10 lần so với vùng mã hóa. Tuy nhiên, sự biến đổi trên vùng
D-loop phân bố không đều, trong đó mật độ biến đổi cao nhất của các vị trí đa hình
được tìm thấy ở hai đoạn siêu biến 1 và 2 (HV-I và HV-II) [11]. HV-I và HV-II
chứa nhiều điểm đa hình, có trình tự thay đổi theo thời gian và khác nhau giữa các
vùng địa lý, nên được tập trung nghiên cứu nhiều [15].
Nghiên cứu đa dạng di truyền của các dân tộc Việt Nam hiện nay vẫn còn là
một vấn đề mới và chưa có nhiều công trình được công bố. Một số phòng thí
nghiệm trọng điểm cũng đang bắt đầu nghiên cứu về vấn đề này để hiểu rõ hơn về
nguồn gốc tiến hóa và bổ sung thêm dữ liệu di truyền của các dân tộc Việt Nam.
Chính vì điều này, chúng tôi tập trung nghiên cứu về các đa hình nucleotide đơn
(SNP) ở vùng siêu biến của ADN ty thể của 5 dân tộc Kinh, Thái, Hmong, Lolo và
Giarai với các nội dung chính bao gồm:
1
− Tách chiết ADN tổng số từ mẫu máu của 182 cá thể thuộc 5 dân tộc Kinh,
Thái, Hmong, Lolo và Giarai.
− Khuếch đại và xác định trình tự hai đoạn gen HV-I và HV-II trên ADN ty thể
của các mẫu nghiên cứu.
− Phân tích trình tự và phân loại theo nhóm đơn bội của các mẫu nghiên cứu
thuộc 5 dân tộc Kinh, Thái, Hmong, Lolo và Giarai.
2
Chương 1. TỔNG QUAN
1.1. Đặc điểm của ADN ty thể người
ADN ty thể người (mitochondrial DNA – mtDNA) là một trong những đối
tượng được nghiên cứu nhiều nhất đối với hệ thống di truyền người. Trong đó, phần
lớn các đột biến được tập trung trên vùng điều khiển D-loop (vùng siêu biến). Chính
vì điều này, vùng điều khiển D-loop nắm giữ chìa khóa quan trọng đối với lịch sử
tiến hóa và các mối quan hệ di truyền quần thể [9].
1.1.1. Cấu trúc ADN ty thể
Hệ gen ty thể người là phân tử ADN mạch kép, có cấu trúc dạng mạch vòng
với kích thước 16569 bp, nằm bên trong ty thể và không liên kết với protein histon.
Phân tử ADN ty thể người được chia thành hai vùng là vùng mã hóa chứa 37 gen và
vùng không mã hóa (vùng D-loop). ADN ty thể bao gồm hai chuỗi nucleotide:
chuỗi nặng (H-strand) có chứa nhiều guanin và chuỗi nhẹ (L-strand) chứa nhiều
cytosin. Trong đó, 37 gen mã hóa cho 22 tRNA, 2 rRNA (12S và 16S) tham gia vào
quá trình dịch mã ở ty thể và 13 chuỗi polypeptide cần thiết cho hệ thống
phosphoryl hóa oxy hóa [35]. Hình 1 thể hiện rõ 13 chuỗi polypeptide này bao gồm
7 tiểu phần của phức hệ I (NADH dehydrogenase) là ND1, ND2, ND3, ND4L,
ND4, ND5 và ND6; 1 tiểu phần của phức hệ III (phức hệ bc1) là cytochrome b
(Cytb); 3 tiểu phần của phức hệ IV (cytochrome c oxidase) là CO I, CO II và CO
III; và 2 tiểu phần của phức hệ V (ATP synthase) là ATPase 6 và 8. Còn tất cả các
protein khác của ty thể bảo gồm 4 tiểu đơn vị của phức hệ II (succinate
dehydrogenase), tiểu đơn vị ADN polymerase γ của ty thể, các thành phần của RNA
polymerase của ty thể, yếu tố phiên mã (mtTFA), các protein ribosome của ty thể,
các yếu tố kéo dài chuỗi và các enzyme trao đổi chất của ty thể đều được mã hóa
bởi ADN nhân [18]. Hầu hết các gen trên ADN ty thể là liên tục không chứa các
đoạn intron, chỉ cách nhau bởi một hoặc hai cặp base không mã hóa. Mã di truyền
trên ADN ty thể chỉ sử dụng hai codon kết thúc: 'AGA' và 'AGG', trong khi DNA
nhân sử dụng ba codon kết thúc: 'UAA', 'UGA' và 'UAG'.
3
Hình 1. Cấu trúc của ADN ty thể người
https://www.sciencedirect.com/science/article/pii/S0531556514001181
1.1.2. Cấu trúc vùng điều khiển D-loop ở ADN ty thể
Vùng duy nhất không mã hóa ở ADN ty thể là vùng điều khiển, hay còn gọi
là vùng D-loop (displacement loop) chiếm khoảng 7% ADN ty thể. Vùng D-loop có
chức năng điều hòa sự sao chép của ADN ty thể và sự biểu hiện của các gen. Vùng
D-loop chứa các điểm khởi đầu sao chép của chuỗi nặng và chuỗi nhẹ và chứa
promoter cho sự phiên mã chuỗi nặng và chuỗi nhẹ.
Cấu trúc của D-loop là cấu trúc sợi ba, có kích thước 1121 bp, chứa các trình
tự promoter cho quá trình phiên mã và trình tự khởi đầu sao chép cho chuỗi nặng và
nhẹ. Các loại ty thể khác nhau thuộc các nhóm đơn bội (halogroup) khác nhau dựa
trên trình tự đặc trưng của vùng D-loop. Vùng D-loop định vị ở vị trí 16024-576
trên genome ty thể bao gồm hai đoạn siêu biến 1 và 2 (HV-I và HV-II). Trình tự
đoạn siêu biến 1 (HV-I) có kích thước 359 bp (vị trí 16024-16383) và đoạn siêu
biến 2 (HV-II) có kích thước 315 bp (vị trí 57-372). Các đoạn siêu biến HV-I và
HV-II có các đoạn lặp lại liên tiếp các nucleotide Cytosin, thường được gọi là các
đoạn poly C [9].
4
Hình 2. Cấu trúc vùng D-loop của ADN ty thể người
https://www.sciencedirect.com/science/article/pii/S0531556514001181
Trên ngân hàng dữ liệu gen quốc tế về ADN ty thể đã công bố hàng nghìn
trình tự hoàn chỉnh vùng D-loop của nhiều dân tộc khác nhau thuộc các châu lục
trên thế giới. Tuy nhiên, do hai vùng siêu biến HV-I và HV-II có tần số đột biến cao
và có chứa nhiều điểm đa hình nên được tập trung nghiên cứu.
1.1.3. ADN ty thể, vùng D-loop và hai đoạn siêu biến HV-I và HV-II trong
nghiên cứu di truyền quần thể người
ADN ty thể (mtADN) có tốc độ tiến hóa nhanh, không xảy ra hiện tượng tái
tổ hợp, đặc điểm quan trọng là di truyền theo dòng mẹ, số lượng bản sao lớn và tỷ lệ
đột biến cao, vì vậy mtADN được lựa chọn là một công cụ hữu hiệu trong các
nghiên cứu về nhân chủng học tiến hóa người [27]. Phân tích các biến thể trên chuỗi
ADN ty thể đã được sử dụng rộng rãi để nghiên cứu quan hệ tiến hóa của các cá thể
và quần thể, cả trong phạm vi giữa các loài. Vì vậy, những dữ liệu mtADN có thể
phục vụ như là một “mã vạch” phân loại cho các loài mục tiêu [37]. Các đột biến
trên ADN ty thể xảy ra nhiều hơn 5 đến 10 lần so với ADN nhân [10]. Điều này là
có thể vì ở ADN nhân có nhiều cơ chế để sửa chữa các sai hỏng khi quá trình sao
chép mắc lỗi. Bên cạnh đó, ty thể là nơi luôn diễn ra các quá trình oxy hóa và sản
sinh ra các chất oxy hóa mạnh như các gốc tự do. Các chất này là một nhân tố phát
sinh đột biến khi chúng tác động lên hệ gen của ty thể [18].
Một tế bào có trung bình khoảng 4000 ty thể nên các đột biến có hại có thể
xảy ra ở tất cả các mô, sinh dưỡng và sinh dục. Ở tế bào sinh dưỡng, các đột biến
5
làm giảm việc sản xuất năng lượng cho tế bào, trong khi đó, ở tế bào sinh dục của
mẹ, các đột biến sẽ được truyền cho thế hệ sau và tạo ra các đa hình ADN ty thể.
Robin E. D. và Wong R. năm 1988 đã chỉ ra rằng mỗi tế bào chứa 1 bản sao của
ADN nhân nhưng lại có hàng trăm bản sao của ADN ty thể cùng với việc ADN ty
thể tồn tại ở dạng vòng, nằm trong tế bào chất, do đó việc thu nhận ADN ty thể dễ
dàng hơn. Điều này hữu ích với việc thu thập mẫu cho các nghiên cứu [30].
Trong phân tử ADN ty thể, dù mang chức năng quan trọng, nhưng vùng điều
khiển (D-loop) lại có tỷ lệ đột biến cao gấp 10 lần so với vùng mã hóa. Tuy nhiên,
sự biến đổi trên vùng D-loop phân bố không đều, trong đó mật độ biến đổi cao nhất
của các vị trí đa hình được tìm thấy ở hai đoạn siêu biến 1 và 2 (HV-I và HV-II)
[11]. HV-I và HV-II chứa nhiều điểm đa hình, có trình tự thay đổi theo thời gian và
khác nhau giữa các vùng địa lý, nên được tập trung nghiên cứu nhiều [15].
Hình 3. Sơ đồ mô tả quá trình di cư của các nhóm đơn bội ADN ty thể người [32]
Do hệ gen ty thể có đặc tính di truyền theo mẹ nên các đa hình được tích luỹ
và phát tán theo các dòng phả hệ mẫu hệ, tạo nên tính đa hình ADN ty thể hay các
nhóm đơn bội (Haplogroup) đặc trưng theo quần thể. Theo đó, mỗi haplogroup có
một bộ các đa hình nucleotide đơn (Single Nucleotide Polymorphisms – SNP) đặc
trưng. Việc phân loại và sắp xếp các nhóm haplogroup sẽ giúp phân tích các dòng
ADN ty thể theo phả hệ mẫu hệ, từ đó có thể dựng cây phả hệ tiến hóa các nhóm
6
haplogroup và con đường di cư của ADN ty thể. Các nghiên nhân chủng học phân
tử cho thấy, người hiện đại bắt đầu xuất hiện ở châu Phi cách đây khoảng 200.000
năm [16] (hình 3).
Nghiên cứu hoàn chỉnh trình tự hệ gen ty thể đã hỗ trợ cho việc xác định lịch
sử nhân chủng học tiến hóa của loài người ở các châu lục trên thế giới. Người châu
Phi đặc trưng bởi Macro-haplogroup L và 7 haplogroup (L0, L1, L2, L3, L4, L5 và
L6) phân bố khắp các lục địa châu Phi. Khoảng 85.000 năm trước, haplogroup L3 di
cư ra khỏi vùng Đông Phi tới các lục địa châu Á và châu Âu, các vùng rất đa dạng
về môi trường, các dân tộc, các nền văn hóa và ngôn ngữ. Hai dòng ADN ty thể M
và N xuất hiện từ L3 là tổ tiên của tất cả các dòng ADN ty thể trên lục địa Á, Âu.
Các haplogroup phát sinh từ Macro-haplogroup M xuất hiện tại các lục địa Ấn Độ
và Đông Nam Á, điều này chứng tỏ đã có một quá trình thực dân hóa rất nhanh dọc
theo bờ biển phía nam châu Á vào khoảng 60.000 năm trước [22, 38]. Một sự mở
rộng khác của Macro-haplogroup M theo hướng Bắc châu Á vào khoảng 45.000
năm trước đã tạo ra hơn 30 haplogroup khác. Với quần thể người châu Âu,
haplogroup L3 và Macro-haplogroup N tạo nên 9 Macro-haplogroup (H, I, J, K, T,
U, V, W và X), xuất hiện phổ biến rộng khắp châu lục cách đây khoảng 45.000 năm
[38]. Trong khi với người châu Mỹ, các nghiên cứu nhân chủng học phân tử chỉ ra
họ là con cháu của người châu Á, đặc trưng bởi các Macro-haplogroup: A, B, C, D
và X vào khoảng 18.000 năm trước [25].
Tại châu Á, Đông Nam Á là vùng rất đa dạng về môi trường, các dân tộc, các
nền văn hóa và ngôn ngữ. Các nhà khoa học hiện đang tập trung nghiên cứu về một
sô vấn đề như: các dân tộc cư trú ban đầu ở khu vực Đông Á, hướng di cư giữa
Đông Nam Á và Bắc Á, các mối quan hệ di truyền của Đông Á, và tác động di
truyền của thực tiễn xã hội khác nhau trên dân cư Đông Á. Những hiểu biết bắt
nguồn từ ADN ty thể và/hoặc dữ liệu nhiễm sắc thể Y, nghiên cứu các SNP hoặc
nhiều locus dữ liệu trong tái sắp xếp toàn bộ gen, kết hợp với việc sử dụng các mô
phỏng, phương pháp dựa trên mô hình để suy ra các thông số về nhân chủng học
chắc chắn sẽ cung cấp thêm vào lịch sử dân số của khu vực Đông Á [13, 34].
7
1.1.4. Tình hình nghiên cứu di truyền quần thể người Việt Nam dựa trên hai
đoạn siêu biến HV-I và HV-II thuộc vùng D-loop và ý nghĩa thực tiễn của đề
tài luận văn
Các nghiên cứu về cấu trúc genome ty thể nói chung và vùng D-loop nói
riêng của các dân tộc người Việt Nam còn ít, các thông tin còn rất hạn chế và rời
rạc. Năm 2002, Oota và cộng sự đã công bố về đoạn HV-I thuộc vùng D-loop trên
genome ty thể của 35 cá thể người Việt Nam định cư tại Hoa Kỳ.
Năm 2005, Phòng thí nghiệm trọng điểm Công nghệ gen thuộc Viện Công
nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã nghiên cứu trình
tự vùng điều kiển (D-loop) trên genome ty thể của 5 cá thể người Việt Nam thuộc 3
dân tộc Kinh, Tày và Hmong từ đó ứng dụng để giám định hài cốt liệt sỹ [3, 4].
Năm 2008, Nguyễn Đăng Tôn và cộng sự đã phát hiện 73 đa hình mới xuất hiện khi
nghiên cứu tần số các nhóm đơn bội (halogroup) của ty thể ở 78 mẫu nghiên cứu
của các cá thể người Việt Nam thuộc 3 dân tộc Kinh, Tày và Mường [5].
Một số nghiên cứu đã bắt đầu tập trung nghiên cứu về sự đa dạng di truyền
nhờ phân tích trình tự các đoạn siêu biến trên vùng D-loop của ADN ty thể của một
số dân tộc Việt Nam. Năm 2014, nhóm nghiên cứu của Trần Vân Khánh đã nghiên
cứu đa dạng di truyền trên dân tộc Mường ở Việt Nam [6]. Năm 2016, Đỗ Mạnh
Hưng và cộng sự đã phát hiện được 79 nhóm đơn bội khi phân tích vùng HV-II hệ
gen ty thể của 169 cá thể người Việt Nam thuộc các dân tộc Kinh, Mường, Garai và
Ê đê [2]. Và gần đây nhất, Trần Thị Thúy Hằng và cộng sự đã giải trình tự vùng
HV-I và HV-II của 100 cá thể thuộc hai dân tộc Kinh và Mường và phát hiện được
12 điểm đa hình phổ biến trên cả hai dân tộc này [7].
Có thể thấy rằng các nghiên cứu trong nước về trình tự vùng D-loop hệ gen
ty thể của các dân tộc Việt Nam còn rất ít và mới chỉ nghiên cứu với số lượng mẫu
nhỏ, không mang tính đặc trưng cho quần thể. Trong nghiên cứu này, chúng tôi đã
khuếch đại và giải trình tự vùng điều khiển D-loop của 182 mẫu cá thể người Việt
Nam thuộc các dân tộc Kinh, Thái, Hmong, Lolo và Giarai. Các số liệu đa hình thu
được về vùng điều khiển D-loop của các dân tộc Kinh, Thái, Hmong, Lolo và Giarai
sẽ được so sánh với nhau và so sánh với trình tự chuẩn rCRS đã được công bố trên
8
ngân hàng cơ sở dữ liệu về ADN ty thể, từ đó phân loại sơ bộ theo các nhóm đơn
bội sử dụng Haplogrep2 và PhyloTree Build 17.
1.2. Một số đặc điểm dân tộc học của người Kinh, Thái, Hmong, Lolo và
Giarai
Dân tộc Kinh
Dân tộc Kinh (Việt) là một dân tộc hình thành tại khu vực địa lý mà ngày
nay là miền Bắc Việt Nam và miền nam Trung Quốc. Người Kinh ở Việt Nam có
dân số khoảng 65.795.718 người, là dân tộc chính chiếm 86,83% dân số cả nước.
Người Kinh cư trú tại tất cả 63 tỉnh và thành phố của Việt Nam và một số nước
khác, nhưng đông nhất vẫn là các vùng đồng bằng và thành thị trong nước. Các tỉnh
và thành phố có số lượng người Kinh lớn nhất là: Thành phố Hồ Chí Minh
(6.699.124 người), Hà Nội (6.370.244 người), Thanh Hóa (2.801.321 người), Nghệ
An (2.489.952 người), Đồng Nai (2.311.315 người), An Giang (2.029.888 người).
Ngôn ngữ chính sử dụng là tiếng Việt theo nhóm Việt-Mường (ngữ hệ Nam Á) [1].
Do điều kiện sống quần cư, người Kinh kiếm sống chủ yếu bằng sản xuất
nông nghiệp, trong đó trồng trọt ruộng nước là chủ đạo. Dân số đông và trải dài
khắp lãnh thổ Việt Nam nên trang phục của người Kinh khá đa dạng và phong phú
tùy thuộc vào từng vùng miền và mang những nét đặc sắc riêng. Người Kinh
thường ở nhà trệt với các khu nhà có thêm sân, vườn và ao. Đại bộ phận người Kinh
sinh sống thành từng làng, dăm ba làng họp thành một xã. Gia đình của người Kinh
hầu hết là những gia đình nhỏ gồm hai thế hệ theo chế độ phụ quyền nhưng người
quản lý kinh tế trong gia đình lại thường là phụ nữ [1].
Dân tộc Thái
Dân tộc Thái (còn có tên gọi khác là Tay Thanh, Man Thanh, Tay Mười,
Hàng Tổng, Tay Dọ và Thổ) thuộc nhóm ngôn ngữ Tày – Thái (ngữ hệ Thái-Ka
Đai). Dân tộc Thái ở Việt Nam có khoảng 1.328.725 người, là dân tộc có dân số
đứng thứ 3 tại Việt Nam và định cư chủ yếu ở các tỉnh từ Tây Bắc đến Thanh Hóa,
Nghệ An. Họ được phân chia thành hai nhóm chính: Thái Ðen (Tay Ðăm) và Thái
Trắng (Tay Ðón hoặc Khao) [1].
9
Người Thái trồng lúa nước với hệ thống thuỷ lợi nông nghiệp vùng thung
lũng độc đáo. Bản người Thái thường gồm 50 nóc nhà sàn. Nhà sàn người Thái đen
nóc hình mai rùa, chỏm đầu đốc có khau cút. Nam nữ Thái được tự do tìm hiểu và
lựa chọn người vợ, người chồng của mình. Trước, người Thái theo chế độ hôn nhân
mua bán và ở rể nên việc lấy vợ và lấy chồng phải qua 2 bước cơ bản là cưới lên
(đong khửn) và cưới xuống (đong lông) [1].
Dân tộc Hmong
Dân tộc Hmong (còn có tên gọi khác là Mẹo, Mèo, Miêu Hạ và Mán Trắng)
có dân số là 787.604 người, đứng hàng thứ 8 trong bảng danh sách các dân tộc ở
Việt Nam. Người Mông sinh sống tập trung ở các tỉnh miền núi Bắc Bộ, trong đó
tập trung tại các tỉnh như Hà Giang (21,7%), Điện Biên (16%), Sơn La, Lai Châu,
Yên Bái và một số ít ở miền núi tỉnh Nghệ An, Đắk Lắk, Thanh Hóa [1].
Kinh tế chủ yếu là nương định canh hoặc nương du canh và ruộng bậc thang
trồng ngô, lúa, lúa mạch; nghề phụ có trồng lanh, các cây ăn quả như táo, lê, v.v..
Người Hmong quần tụ trong từng bản vài chục nóc nhà. Người Hmong rất coi
trọng dòng họ bao gồm những người có chung tổ tiên. Người cùng họ dù không
biết nhau, dù cách xa bao đời nhưng họ vẫn có thể nhận ra nhau qua cách trao đổi
các đặc trưng riêng (chẳng hạn như những nghi lễ thờ cúng tổ tiên, nghi lễ ma chay,
v.v.). Phong tục cấm ngặt những người cùng họ lấy nhau. Tình cảm gắn bó giữa
những người trong họ sâu sắc. Gia đình nhỏ, phụ hệ. Phong tục cướp vợ khá phổ
biến [1].
Dân tộc Lolo
Dân tộc Lolo (có tên gọi khác là Màn Dì, Mùn Di, Di, La La, Qua La, Ô
Man, hay Lu Lộc Màn) thuộc nhóm ngôn ngữ Tạng-Miến (ngữ hệ Hán – Tạng).
Dân tộc này có dân số khoảng 3.307 người cư trú ở các huyện Đồng Văn, Mèo Vạc
(Hà Giang), Bảo Lạc (Cao Bằng), Mường Khương (Lào Cai) [1].
Người Lolo chủ yếu làm ruộng nước và nương định canh với các cây trồng
chính như lúa nếp, lúa tẻ và ngô. Người Lolo sống tập trung trong các bản với tình
cộng đồng cao. 30 dòng họ khác nhau thường quần tụ trong phạm vi một làng bản,
thờ cúng chung một ông tổ và có một khu nghĩa địa riêng. Họ thích các quan hệ
10
hôn nhân nội bộ tộc người và thực hiện nguyên tắc ngoại hôn giữa các dòng họ.
Phong tục cưới xin của người Lolo mang nặng tính gả bán với việc thách cưới cao.
Sau hôn nhân cô dâu cư trú bên chồng, con trai cô có thể lấy con gái cậu song
không thể ngược lại. [1].
Dân tộc Giarai
Người Giarai (có tên gọi khác là Chơ ray, Giơ ray) với dân số khoảng
317.557 người. Họ cư trú tập trung ở vùng núi Tây Nguyên, tỉnh Gia Lai – Kon
Tum đến phía Bắc tỉnh Đắc Lắk, với ngôn ngữ chính là tiếng Giarai, một ngôn ngữ
thuộc phân nhóm ngôn ngữ Chăm của ngữ tộc Malay-Polynesia trong ngữ hệ Nam
Đảo. Người Giarai thuộc nhóm chủng tộc Austronesia [1].
Người Gia Rai là một nhánh lớn của tộc người Rang Đê cổ hay còn gọi là
người Ê đê cổ được ghi chép khá nhiều trong các bia ký Chăm Pa, sự tấn công của
đế quốc Mông Cổ, sau này là Nam Tiến của người Việt đã đẩy bộ phận người Chăm
Pa lên vùng bình nguyên Cheo Reo hòa hợp với người Ê đê cổ tạo ra nhóm tộc
người tự gọi là Anak Jarai tức con cái của Giarai. Người Giarai lấy kinh tế trồng trọt
là cái gốc của hoạt động sản xuất, trong đó việc trồng lúa là nguồn sống chính của
cư dân. Họ ở trong nhà sàn cho mỗi gia đình một vợ một chồng mẫu hệ. Dòng họ
của người Giarai theo chế độ mẫu hệ nên phả hệ hoàn toàn tính về dòng mẹ. Mỗi họ
là khối cộng đồng máu mủ được tập hợp lại và thường được phân chia nhiều ngành
hoặc phân đôi, thành họ khác. Ở dân tộc Giarai, người cùng ngành họ và dòng mẹ bị
nghiêm cấm lấy nhau. Do là chế độ mẫu hệ nên phong tục cưới xin thường do nhà
gái chủ động. Phong lục chồng chết, vợ lấy em chồng và ngược lại được bảo lưu.
Khi đã thành vợ chồng thì đàn ông phải sang nhà vợ và không có trường hợp ngược
lại [1].
11
Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Đối tượng nghiên cứu
Đối tượng chính của nghiên cứu này là 182 mẫu máu được thu thập từ các cá
thể người khỏe mạnh của 5 dân tộc Kinh, Thái, Hmong, Lolo và Giarai sinh sống tại
các tỉnh phía Bắc và Tây Nguyên. Trong đó, 51 mẫu máu thuộc dân tộc Kinh, 24
mẫu máu thuộc dân tộc Thái, 41 mẫu máu thuộc dân tộc Hmong, 36 mẫu máu thuộc
dân tộc Lolo và 30 mẫu máu thuộc dân tộc Giarai (Bảng 1). Các cá thể người được
lựa chọn là những người không có cùng huyết thống, có cả bốn ông bà nội ngoại
thuộc cùng một dân tộc. Sau khi được cung cấp thông tin về nghiên cứu và giải
thích các nội dung trong phiếu, các đối tượng cho mẫu sẽ điền các thông tin xác
nhận đồng ý tự nguyện tham gia nghiên cứu vào “Phiếu đồng ý tự nguyện tham gia
nghiên cứu”. Chỉ khi có chữ ký xác nhận của người cho mẫu hoặc người được ủy
quyền, việc lấy mẫu máu mới được tiến hành. Mỗi đối tượng nghiên cứu được lấy
từ 2-5ml máu toàn phần, các mẫu máu được bảo quản trong ống chống đông chứa
EDTA và giữ ở -20oC.
Bảng 1. Mẫu nghiên cứu của mỗi dân tộc Kinh, Thái, Hmong, Lolo và Giarai
Dân tộc
Mã số mẫu
Tổng số mẫu
Kinh
Kinh01, Kinh02, Kinh03, Kinh04, Kinh05, Kinh06,
51
Kinh07, Kinh08, Kinh09, Kinh10, Kinh11, Kinh12,
Kinh13, Kinh14, Kinh15, Kinh16, Kinh17, Kinh18,
Kinh19, Kinh20, Kinh21, Kinh22, Kinh23, Kinh24,
Kinh25, Kinh26, Kinh27, Kinh28, Kinh29, Kinh20,
Kinh21, Kinh22, Kinh23, Kinh24, Kinh25, Kinh26,
Kinh27, Kinh28, Kinh29, Kinh30, Kinh31, Kinh32,
Kinh33, Kinh34, Kinh699, Kinh700, Kinh701,
Kinh702, Kinh703, Kinh704, Kinh705, Kinh706,
Kinh707, Kinh708, Kinh709, Kinh710, Kinh711,
Kinh712, Kinh713, Kinh714, Kinh715
Thái
Thai55, Thai56, Thai57, Thai99, Thai130, Thai136,
12
24
- Xem thêm -