BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM
KHOA HỌC VÀ CÔNG NGHỆ VN
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
TÔ VĂN QUANG
Tô Văn Quang
SINH HỌC THỰC NGHIỆM
GIẢI MÃ VÙNG GEN BARCODING
(CYTOCHROME C OXIDASE 1 – CO1) CHO MỘT SỐ MẪU
BƯỚM NGÀY THU TẠI HÀ GIANG, VIỆT NAM
LUẬN VĂN THẠC SĨ: SINH HỌC THỰC NGHIỆM
NĂM 2021
Thành phố Hồ Chí Minh - 2021
BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM
KHOA HỌC VÀ CÔNG NGHỆ VN
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
Tô Văn Quang
GIẢI MÃ VÙNG GEN BARCODING
(CYTOCHROME C OXIDASE 1 – CO1) CHO MỘT SỐ MẪU
BƯỚM NGÀY THU TẠI HÀ GIANG, VIỆT NAM
Chuyên ngành: Sinh học thực nghiệm
Mã số: 8 42 01 14
LUẬN VĂN THẠC SĨ NGÀNH
CÔNG NGHỆ SINH HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. Trần Thị Việt Thanh
Thành phố Hồ Chí Minh - 2021
Lời cam đoan
Tôi xin cam đoan đề tài nghiên cứu trong luận văn này là công trình
nghiên cứu của tôi dựa trên những tài liệu, số liệu do chính tôi tự tìm hiểu và
nghiên cứu. Chính vì vậy, các kết quả nghiên cứu đảm bảo trung thực và
khách quan nhất. Đồng thời, kết quả này chưa từng xuất hiện trong bất cứ một
nghiên cứu nào. Các số liệu, kết quả nêu trong luận văn là trung thực nếu sai
tôi hoàn chịu trách nhiệm.
Tác giả luận văn
Tô Văn Quang
Lời cảm ơn
Tôi xin gởi lời cám ơn chân thành đến quý thầy cô Học viện Khoa học
và Công nghệ và Khoa Công nghệ Sinh học vì những kiến thức quý báu đã
truyền đạt cho tôi trong suốt thời gian học tập.
Tôi xin cảm ơn dự án VIETBIO, đặc biệt cảm ơn Tiến sĩ Christoph
Häuser, Thomas von Rintelen, Théo Léger và tất cả mọi người ở Bảo tàng
Lịch sử Tự nhiên Berlin đã nhiệt tình hỗ trợ tập huấn và tài trợ nghiên cứu để
tôi thực hiện luận văn tốt nhất có thể.
Tôi xin gởi lời cảm ơn sâu sắc đến giáo viên hướng dẫn Tiến sĩ Trần
Thị Việt Thanh, Bảo tàng Thiên nhiên Việt Nam vì đã tận tình chỉ bảo, luôn
giúp đỡ, hướng dẫn tôi trong suốt quá trình nghiên cứu và thực hiện luận văn.
Tôi trân trọng gởi lời cảm ơn tới Tiến sĩ Lưu Hồng Trường, Viện
trưởng Viện Sinh thái học Miền Nam đã tạo điều kiện cho tôi được học tập,
nghiên cứu và thực hiện luận văn.
Cuối cùng tôi xin bày tỏ lòng biết ơn tới gia đình, bạn bè lớp 2019A và
2019B, anh chị em đồng nghiệp, những người luôn động viên, giúp đỡ tôi
vượt qua mọi khó khăn trong quá trình học tập và nghiên cứu để hoàn thành
luận văn.
Danh mục các ký hiệu và chữ viết tắt
BLAST
:
Basic Local Alignment Search Tool
Công cụ tìm kiếm gióng cột cục bộ cơ bản
BOLD
:
Barcode of Life Data System
Hệ thống dữ liệu mã vạch của sự sống
bp
:
base pair
cặp ba-zơ
CO1
:
Cytochrome c oxidase 1
DNA
:
Deoxyribonucleic Acid
GenBank
:
Genetic Sequence Data Bank
Ngân hàng dữ liệu trình tự di truyền
ITS
:
Internal Transcribed Spacer
matK
:
maturase K
PCR
:
Polemerase Chain Reaction
Phản ứng khuếch đại gen
rbcL
:
ribulose-1,5-bisphosphate carboxylase large subunit
VN-HG
:
Việt Nam – Hà Giang
Danh mục các bảng
Trang
Bảng 1.1. Một số cặp mồi sử dụng trong nghiên cứu mã vạch DNA ở bướm . 8
Bảng 1.2. Dữ liệu mã vạch DNA của nhóm bướm trên BOLD ........................ 9
Bảng 1.3. Dữ liệu mã vạch DNA của nhóm bướm ở Việt Nam trên BOLD .. 12
Bảng 2.1. Danh sách các mẫu bướm được dùng trong nghiên cứu ................ 17
Bảng 2.2. Danh sách các mẫu được lựa chọn trên BOLD có trình tự vùng gen
CO1 tương ứng với mẫu nghiên cứu............................................................... 20
Bảng 3.1. Danh sách các mẫu nghiên cứu được cấp mã số trên GenBank ..... 23
Bảng 3.2. Tổng hợp mức độ tương đồng (%) và vị trí sai khác của các mẫu
nghiên cứu với các mẫu tương đồng nhất trên BOLD .................................... 39
Bảng 3.3. Các loài bướm có trình tự vùng gen CO1 lần đầu tiên ghi nhận cho
Việt Nam ......................................................................................................... 44
Danh mục các hình ảnh
Trang
Hình 1.1. Số lượng mã vạch DNA và số lượng loài đại diện thuộc các họ
bướm khác nhau được ghi nhận ở Việt Nam đã có trên BOLD ..................... 12
Hình 1.2. Vị trí cao nguyên đá Đồng Văn trên bản đồ Việt Nam................... 13
Hình 2.1. Vị trí thu mẫu (chấm tròn
) thuộc xã Lũng Cú, huyện Đồng Văn 16
Hình 2.2. Bốn nucleotide được thể hiện bằng bốn màu khác nhau trên phần
mềm ChromasPro 2.1.10 ................................................................................. 19
Hình 3.1. Kết quả điện di sản phẩm PCR của các mẫu vật ............................ 22
Hình 3.2. Kết quả giải trình tự hai chiều của mẫu Hes9 thể hiện trên phần
mềm ChromasPro 2.1.10 ................................................................................. 22
Hình 3.3. Thông tin, dữ liệu mẫu OK342239 của loài Carterocephalus alcina
thể hiện trên trang web của GenBank ............................................................. 24
Hình 3.4. Thông tin, dữ liệu mẫu OK340917 của loài Dodona ouida thể hiện
trên trang web của GenBank ........................................................................... 25
Hình 3.5. Cây phát sinh chủng loại mẫu OK342239 và OK342240 với các loài
thuộc giống Carterocephalus .......................................................................... 26
Hình 3.6. Cây phát sinh chủng loại mẫu OK342222 và OK342223 với các loài
thuộc giống Sebastonyma ................................................................................ 27
Hình 3.7. Cây phát sinh chủng loại mẫu OK342114 và OK342115 với các loài
thuộc giống Catochrysops ............................................................................... 28
Hình 3.8. Cây phát sinh chủng loại mẫu OK342112 và OK342113 với các loài
thuộc giống Cigaritis (Spindasis) ................................................................... 29
Hình 3.9. Cây phát sinh chủng loại mẫu OK342117 và OK342118 với các loài
thuộc giống Curetis ......................................................................................... 30
Hình 3.10. Cây phát sinh chủng loại mẫu Nym-A09 và Nym-B09 với các loài
thuộc giống Dilipa........................................................................................... 31
Hình 3.11. Cây phát sinh chủng loại mẫu OK342273 và OK342274 với các
loài thuộc giống Symbrenthia.......................................................................... 32
Hình 3.12. Cây phát sinh chủng loại mẫu OK342127 và OK342128 với các
loài thuộc giống Vanessa ................................................................................ 33
Hình 3.13. Cây phát sinh chủng loại mẫu OK342129 và OK342130 với các
loài thuộc giống Colias ................................................................................... 34
Hình 3.14. Cây phát sinh chủng loại mẫu OK342226 và OK342227 với các
loài thuộc giống Gonepteryx ........................................................................... 35
Hình 3.15. Cây phát sinh chủng loại mẫu OK342235 và OK342236 với các
loài thuộc giống Pieris .................................................................................... 36
Hình 3.16. Cây phát sinh chủng loại mẫu OK340914, OK340915, OK340916,
OK340917, OK340918 và OK340919 với các loài thuộc giống Dodona ...... 38
Hình 3.17. Cây phát sinh chủng lọai của các mẫu nghiên cứu với các mẫu có
độ tương đồng cao nhất tham khảo trên BOLD .............................................. 40
Hình 3.18. Tình trạng phân loại của loài Curetis bulis. .................................. 41
Hình 3.19. Tình trạng phân loại của loài Dodona eugenes............................. 42
Hình 3.20. Mẫu OK342127 (bên trái) và OK342128 (bên phải) của loài
Vanessa indica thu được tại tỉnh Hà Giang .................................................... 43
Hình 3.21. Mẫu OK340918 (bên trái) và OK340919 (bên phải) của loài
Dodona dipoea thu được tại tỉnh Hà Giang .................................................... 44
Hình 3.22. Mẫu OK340914 (bên trái) và OK340915 (bên phải) của loài
Dodona eugenes thu được tại tỉnh Hà Giang .................................................. 45
Hình 3.23. Mẫu OK340916 (bên trái) và OK340917 (bên phải) của loài
Dodona ouida thu được tại tỉnh Hà Giang ...................................................... 45
Hình 3.24. Mẫu OK342222 (bên trái) và OK342223 (bên phải) của loài
Sebastonyma dolopia thu được tại tỉnh Hà Giang .......................................... 45
Hình 3.25. Mẫu OK342114 (bên trái) và OK342115 (bên phải) của loài
Catochrysops strabo thu được tại tỉnh Hà Giang............................................ 46
Hình 3.26. Mẫu OK342236 (bên trái) và OK342235 (bên phải) của loài
Pieris canidia thu được tại tỉnh Hà Giang ...................................................... 46
Hình 3.27. Mẫu OK342125 (bên trái) và OK342126 (bên phải) của loài
Dilipa morgiana thu được tại tỉnh Hà Giang .................................................. 47
Hình 3.28. Mẫu OK342226 (bên trái) và OK342227 (bên phải) của loài
Gonepteryx amintha thu được tại tỉnh Hà Giang ............................................ 47
1
MỤC LỤC
Trang
MỤC LỤC ........................................................................................................ 1
MỞ ĐẦU .......................................................................................................... 3
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU ........................................................ 5
1.1. MÃ VẠCH DNA ....................................................................................... 5
1.2. TÌNH HÌNH NGHIÊN CỨU MÃ VẠCH DNA CỦA BƯỚM NGÀY .... 7
1.2.1. Nghiên cứu trên thế giới.................................................................. 7
1.2.2. Nghiên cứu ở Việt Nam ................................................................ 11
1.2.3. Nghiên cứu ở Cao nguyên đá Đồng Văn, tỉnh Hà Giang ............. 13
CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ............. 16
2.1. VẬT LIỆU................................................................................................ 16
2.2. PHƯƠNG PHÁP NGHIÊN CỨU............................................................ 18
2.2.1. Định loại mẫu vật .......................................................................... 18
2.2.2. Tách chiết DNA tổng số................................................................ 18
2.2.3. Phản ứng khuếch đại gen và giải trình tự...................................... 18
2.2.4. Phân tích dữ liệu............................................................................ 19
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ............................................... 22
3.1. KẾT QUẢ ................................................................................................ 22
3.1.1. Giải trình tự vùng gen CO1 của các mẫu bướm ........................... 22
3.1.2. Xây dựng cây phát sinh chủng loại cho từng loài bướm .............. 26
3.1.2.1. Giống Carterocephalus .......................................................... 26
3.1.2.2. Giống Sebastonyma................................................................ 27
3.1.2.3. Giống Catochrysops ............................................................... 28
3.1.2.4. Giống Cigaritis (Spindasis) ................................................... 29
3.1.2.5. Giống Curetis ......................................................................... 30
3.1.2.6. Giống Dilipa........................................................................... 31
3.1.2.7. Giống Symbrenthia ................................................................ 32
3.1.2.8. Giống Vanessa ....................................................................... 33
3.1.2.9. Giống Colias .......................................................................... 34
3.1.2.10. Giống Gonepteryx ................................................................ 35
2
3.1.2.11. Giống Pieris ......................................................................... 36
3.1.2.12. Giống Dodona ...................................................................... 37
3.1.3. Xây dựng cây phát sinh chủng loại cho tất cả mẫu nghiên cứu .... 38
3.2. THẢO LUẬN ........................................................................................... 41
3.2.1. Phân tích tình trạng phân loại một số loài bướm .......................... 41
3.2.2. Một số ghi nhận mới cho Việt Nam .............................................. 43
3.2.3. Một số ghi nhận mới cho GenBank .............................................. 46
CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ ............................................... 48
4.1. KẾT LUẬN .............................................................................................. 48
4.2. KIẾN NGHỊ ............................................................................................. 48
TÀI LIỆU THAM KHẢO ............................................................................ 50
PHỤ LỤC
Phụ lục 1. Hình ảnh 28 mẫu vật đại diện cho 14 loài bướm ngày sử dụng trong
luận văn.
Phụ lục 2. Trình tự vùng gen CO1 của các mẫu nghiên cứu và các mẫu so sánh
tương đồng nhất.
Phụ lục 3. Dẫn chứng 28 trình tự của 14 loài bướm ngày trong luận văn được
công bố trên GenBank.
Công trình của tác giả "Phương pháp tách chiết DNA tổng số từ mẫu bướm"
3
MỞ ĐẦU
Mã vạch DNA trong những năm gần đây được xem như một công cụ hữu
hiệu hỗ trợ nghiên cứu phân loại học truyền thống với ưu điểm nhanh, chi phí
thấp, độ chính xác cao. Việc sử dụng mã vạch DNA xác định tên loài được thực
hiện thành công trên nhiều đối tượng động vật khác nhau, từ động vật bậc thấp
như động vật thân mềm, côn trùng cho tới các loài động vật bậc cao như lưỡng
cư, bò sát, chim và thú. Vùng gen CO1 (Cytochrome c oxidase subunit 1) trong
gen ti thể có độ dài 658 bp (base pair) được các nhà khoa học công nhận là
vùng gen chuẩn để nhận dạng loài trên Hệ thống dữ liệu mã vạch của sự sống
(BOLD). Bướm ngày là nhóm sinh vật nhận được nhiều sự quan tâm nhất kể
từ lúc mã vạch DNA bắt đầu được nghiên cứu, và ngày càng mở rộng ở khắp
nơi trên thế giới, hỗ trợ các nhà khoa học trong quá trình định danh bằng hình
thái thông thường, góp phần giải quyết những vấn đề phức tạp trong mối quan
hệ di truyền và tiến hóa giữa các loài với nhau.
Việt Nam là quốc gia có sự đa dạng về bướm ngày cao, với gần 1.200
loài đã được ghi nhận, trong đó có rất nhiều loài đặc hữu và quý hiếm, có ý
nghĩa bảo tồn. Tuy nhiên, các dữ liệu công bố về mã vạch DNA ở Việt Nam
còn rất hạn chế, cho thấy tiềm năng nghiên cứu mã vạch DNA trên bướm ở
Việt Nam là rất lớn. Đặc biệt, khu hệ bướm ở Cao nguyên đá Đồng Văn, tỉnh
Hà Giang có thành phần loài đa dạng và có tính đặc hữu cao ở Việt Nam, nhưng
dữ liệu về mã vạch DNA thì rất ít. Chính vì thế, đề tài luận văn “Giải mã vùng
gen Barcoding (Cytochrome c oxidase 1 - CO1) cho một số mẫu bướm ngày
thu tại Hà Giang, Việt Nam” được thực hiện với những mục tiêu cụ thể như
sau:
(1) Giải trình tự vùng gen CO1 cho 20-30 mẫu vật của 10-15 loài và đăng
ký thành công các trình tự nghiên cứu với GenBank.
(2) So sánh trình tự mẫu nghiên cứu với trình tự các mẫu tương tự đã
công bố trên BOLD nhằm kiểm tra tính chính xác của quá trình định tên loài.
(3) Phân tích sự sai khác về hình thái đối sánh với kết quả đọc trình tự
của một số loài có hình thái tương đồng.
4
Nghiên cứu di truyền các loài sinh vật là hướng đi giàu tiềm năng, phù
hợp với xu thế chung trên thế giới. Kết quả của luận văn không những góp phần
bổ sung cơ sở dữ liệu mã vạch DNA các loài sinh vật trong nước và quốc tế,
mà còn là thông tin cơ sở cho các nghiên cứu sâu hơn nhằm hoàn thiện bức
tranh đa dạng sinh học, giúp giải quyết các vấn đề liên quan đến phân loại học,
sinh thái học và tiến hóa trong tương lai.
5
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. MÃ VẠCH DNA
Phân loại học đã có nhiều sự thay đổi đáng kể trong gần ba thế kỉ qua.
Trước đây, các mẫu vật được thu thập và xử lý cẩn thận để bảo toàn những đặc
điểm phân biệt, và đòi hỏi sự đánh giá của các chuyên gia phân loại nhằm so
sánh những khác biệt về giải phẫu giữa các loài có quan hệ họ hàng gần nhau.
Phương pháp phân loại truyền thống này trong nhiều trường hợp còn gặp nhiều
khó khăn và hạn chế, đặc biệt với mẫu không nguyên vẹn, hoặc mẫu vật có hình
thái tương đồng, hoặc biến đổi hình thái (do yếu tố khí hậu, địa lý) trong cùng
một loài, dẫn đến việc có rất nhiều tên đồng danh hoặc định danh sai. Sự phát
triển vượt trội của khoa học kỹ thuật, đặc biệt là công nghệ máy tính và công
nghệ gen đã tạo ra những biến đổi lớn trong phân loại học, trong đó yếu tố di
truyền đóng một vai trò vô cùng quan trọng trong việc xác định mối quan hệ và
quá trình tiến hóa giữa các loài với nhau. Mã vạch DNA (DNA barcodes hoặc
DNA barcoding) được xem như là một công cụ hữu hiệu cho phép nhận dạng
chính xác loài với lượng mẫu rất nhỏ thông qua mẫu vật còn nguyên hoặc không
nguyên vẹn, có thể bị hư hỏng (tiêu bản sấy khô, mẫu lâu năm) hoặc đã bị xử
lý công nghiệp [1]. Nguyên lý của phương pháp mã vạch DNA là dựa trên việc
so sánh các trình tự DNA ngắn giữa mẫu chưa biết với nguồn cơ sở dự liệu gen
sẵn có, từ đó xác định tên loài cho mẫu nghiên cứu. Về lý thuyết và thực
nghiệm, phương pháp mã vạch DNA đã được chứng minh trên nhiều đối tượng
khác nhau, bao gồm virus, vi khẩn, nấm, tảo, thực vật và động vật [1, 2].
Trải qua gần ba thập kỉ, các nhà khoa học đã thu thập được một nguồn
cơ sở dữ liệu trình tự nucleotide khổng lồ ở khắp nơi trên thế giới, và được lưu
trữ trên Ngân hàng dữ liệu trình tự di truyền (Genetic Sequence Data Bank –
GenBank) tại địa chỉ http://www.ncbi.nlm.nih.gov. GenBank được xây dựng
và chia sẻ bởi Trung tâm Thông tin Công nghệ sinh học Quốc gia (National
Center for Biotechnology Information – NCBI) trực thuộc Viện Y tế Quốc gia
Hoa Kỳ (National Institutes of Health – NIH). Đây là một kho dữ liệu toàn diện
chứa 2,1 tỷ trình tự nucleotide có sẵn công khai cho khoảng 478.000 loài, và
thường xuyên được cập nhật theo các quy tắc thống nhất với Cơ quan lưu trữ
6
Nucleotide Châu Âu (European Nucleotide Archive – ENA) và Ngân hàng Dữ
liệu DNA Nhật Bản (DNA Data Bank of Japan – DDBJ), đảm bảo phạm vi phủ
sóng trên toàn cầu [3]. Đồng thời, một Hệ thống dữ liệu mã vạch của sự sống
(Barcode of Life Data System – BOLD) có địa chỉ www.barcodinglife.org cũng
đã được xây dựng để quản lý, giới hạn các trình tự được chọn làm mã vạch
DNA có chất lượng và độ tin cậy cao dựa vào các trình tự đã có trên GenBank
[4]. Đi kèm với đó là Công cụ tìm kiếm gióng cột cục bộ cơ bản (Basic local
alignment search tool – BLAST), là một phương pháp sử dụng thuật toán
heuristics để truy vấn các vùng tương đồng ở bên trong các chuỗi trình tự
(nucleotide hoặc protein) với nhau, nhằm xác định trình tự đang thao tác giống
hoặc gần giống với trình tự nào có trong GenBank. BLAST và trang web
https://blast.ncbi.nlm.nih.gov/Blast.cgi lần đầu tiên được giới thiệu vào khoảng
năm 1990, có cập nhật sửa đổi vào năm 1997 [5, 6]. Sau đó, với sự phát triển
vượt bậc của khoa học công nghệ, đặc biệt là công nghệ thông tin và công nghệ
sinh học, vào cuối năm 2009, NCBI đã thay thế các bộ công cụ cũ, cung cấp
phiên bản BLAST mới hơn (được gọi là BLAST+) dựa trên bộ công cụ NCBI
C++ làm nền tảng phát triển trở về sau [7]. Đây là một công cụ quan trọng thiết
yếu hỗ trợ các nhà khoa học có thể dễ dàng kiểm tra, đối chiếu dữ liệu nghiên
cứu với các dữ liệu đã có sẵn một cách nhanh chóng và chính xác.
Khái niệm mã vạch DNA được đề xuất dựa trên vùng gen Cytochrome c
oxidase 1 (viết tắt là CO1) của gen ti thể (mitochondrial), có độ dài 658 bp [2].
Sau này, các kết quả nghiên cứu trên nhiều nhóm sinh vật cho thấy có những
vùng gen khác cũng có thể được lựa chọn làm mã vạch DNA, bên cạnh vùng
gen CO1 được sử dụng rộng rãi trên động vật, thì các vùng gen rbcL, matK,
ITS, … thường được sử dụng trên thực vật, nấm và các loài sinh vật khác [1].
Do đó, chưa có đoạn gen chuẩn nào được sử dụng làm mã vạch chung cho tất
cả các loài trên thế giới. Việc lựa chọn những đoạn gen đặc trưng để làm mã
vạch và kết hợp các đoạn mã vạch DNA với nhau là rất cần thiết, giúp phân
biệt các loài tốt hơn, đặc biệt là các loài quan hệ họ hàng gần gũi với nhau [1].
Do có tính bảo thủ cao, vùng gen CO1 đã đạt được nhiều thành công lớn
và được lựa chọn là gen mã vạch chuẩn cho nhiều nhóm trong giới động vật,
7
điển hình như là côn trùng, cá, chim [1]. Đặc biệt, bướm ngày là một trong
những nhóm sinh vật nhận được nhiều sự quan tâm nhất kể từ lúc mã vạch
DNA bắt đầu được nghiên cứu đến nay. Cách tiếp cận này đã giúp giải quyết
mối quan hệ phức tạp giữa các loài bướm với nhau, hỗ trợ rất nhiều trong nghiên
cứu sinh thái học, tiến hóa và phân loại học với những thông tin chi tiết được
trình bày trong phần nội dung tiếp theo.
1.2. TÌNH HÌNH NGHIÊN CỨU MÃ VẠCH DNA CỦA BƯỚM NGÀY
1.2.1. Nghiên cứu trên thế giới
Bướm ngày (sau đây gọi tắt là bướm) là một trong những nhóm côn trùng
đẹp, có màu sắc sặc sỡ và nhận được nhiều sự quan tâm tìm hiểu của các nhà
khoa học từ những thế kỉ trước. Chúng đóng vai trò vô cùng quan trọng trong
việc nghiên cứu sự hình thành loài, sinh thái học quần xã, địa lí sinh học, biến
đổi khí hậu, tương tác giữa côn trùng và thực vật, bao gồm cả loài chỉ thị và
loài dịch hại [8].
Bướm thuộc bộ Lepidoptera, siêu họ Papilionoidea và có sự sắp xếp về
mặt phân loại học khá phức tạp. Các nghiên cứu sinh học phân tử và di truyền
gần đây đã khẳng định rằng, siêu họ này với khoảng 18.800 loài được chia làm
07 họ chính là Papilionidae, Hesperiidae, Hedylidae, Pieridae, Lycaenidae,
Riodinidae và Nymphalidae [8, 9, 10]. Các họ này phân bố ở khắp nơi trên thế
giới, ngoại trừ họ Hedylidae phân bố chủ yếu ở khu vực Trung và Nam Mỹ, có
số lượng ít nhất với 36 loài; Nymphalidae, Lycaenidae, Hesperiidae là những
họ có số lượng nhiều nhất với khoảng 6.000, 5.200 và 4.000 loài tương ứng;
trong khi đó, Riodinidae, Pieridae và Papilionidae có số lượng loài không nhiều
với khoảng 1.500, 1.100, 1.000 loài đã được mô tả [8, 9, 10].
Cùng với sự phát triển của xu hướng nghiên cứu di truyền và sinh học
phân tử, nghiên cứu mã vạch DNA, đặc biệt là trình tự vùng gen CO1 của nhóm
bướm đã thu hút sự quan tâm của các nhà khoa học trong thời gian qua. Đồng
thời, một số cặp mồi cũng đã được phát triển để có thể thu nhận tốt nhất trình
tự vùng gen CO1 trong nghiên cứu mã vạch ở bướm (xem Bảng 1.1).
6
5
4
3
2
1
Stt
ATTCAACCAATCATAAAGATATTGG
TAAACTTCTGGATGTCCAAAAAATCA
ATTCAACCAATCATAAAGATATTGG
CTCCWCCAGCAGGATCAAAA
ATTCAACCAATCATAAAGATATTGG
CCTGTTCCAGCTCCATTTTC
GCTTTCCCACGAATAAATAATA
TAAACTTCTGGATGTCCAAAAAATCA
LepF
LepR
LepF
Enh_LepR
LepF
MH-MR1
MH-MF1
LepR
LepR
TAAACTTCTGGATGTCCAAAAAATCA
AAACTAATARCCTTCAAAG
TAAACTTCAGGGTGACCAAAAAATCA
HCO2198
tRWF1
GGTCAACAAATCATAAAGATATTGG
Trình tự từ 5’đến 3’
LCO1490
Cặp mồi
700
407
307
609
658
658
(bp)
Độ dài
Cặp mồi cải tiến [15, 16]
chỉnh [13, 14]
được nối lại với nhau hoàn
hỏng. Hai đoạn ngắn này sau đó
mẫu lâu năm hoặc mẫu bị hư
Cặp mồi đoạn ngắn dùng cho
[12, 13]
Cặp mồi đặc hiệu cho côn trùng
Cặp mồi phổ quát [2, 11]
Ghi chú
Bảng 1.1 . Một số cặp mồi sử dụng trong nghiên cứu mã vạch DNA ở bướm.
8
Theo thống kê của BOLD, tính đến tháng 07 năm 2021, ước tính có
khoảng 151.656 mẫu vật đã được giải trình tự với 146.944 mã vạch DNA được
9
định danh, đại diện cho 9.855 loài, chiếm hơn 50% tổng số loài bướm trên thế
giới (xem Bảng 1.2).
Bảng 1.2. Dữ liệu mã vạch DNA của nhóm bướm trên BOLD.
Họ
Số lượng
mẫu vật
Số lượng
mã vạch DNA
Số lượng
loài đại diện
% tổng
số loài
Nymphalidae
59.820
57.287
4.342
72,37
Lycaenidae
25.674
24.888
1.837
35,33
Hesperiidae
38.586
38.144
1.957
48,93
Riodinidae
4.959
4.659
502
33,47
14.684
14.055
741
67,36
7.333
7.313
442
44,20
600
598
34
94,44
151.656
146.944
9.855
52,32
Pieridae
Papilionidae
Hedylidae
Tổng
Ở khu vực Nam Mỹ, vào năm 2017, các nhà khoa học đã phân tích và
tập hợp được một thư viện mã vạch DNA cho 417 loài, chủ yếu ở khu vực rừng
Đại Tây Dương (Atlantic forest), đông bắc Argentina [17]. Sau đó, các nhà
khoa học tiếp tục điều tra bổ sung, mở rộng khảo sát trọng tâm ở vùng rừng
Andes (Andean forest), tây bắc Argentina, qua đó xây dựng được ngân hàng dữ
liệu vùng gen CO1 với tỉ lệ phân loại trên 98% cho gần 500 loài, chiếm khoảng
40% tổng số loài đã được biết ở Argentina [18].
Trong khi đó, ở khu vực Bắc Mỹ gồm Mỹ và Canada, 814 trong tổng số
846 loài đã được cập nhật dữ liệu mã vạch DNA với tỉ lệ phân biệt các loài đơn
lẻ là hơn 80% [19].
Một nghiên cứu mã vạch DNA mới đây đã tổng hợp được dữ liệu trình
tự vùng gen CO1 của 459 loài bướm, chiếm 97% tổng số loài ở Châu Âu [20],
trong đó Romania có 180 loài với tỉ lệ nhận biết các loài riêng biệt là 90% [21],
và vùng bán đảo Iberia có 228 loài với gần 94% là các loài tách biệt [22].
Trình tự vùng gen CO1 cũng mới được thực hiện nghiên cứu trên các
loài bướm ở châu Phi trong thời gian gần đây. Cụ thể, các nhà khoa học đã xác
10
định được mã vạch DNA của 116 loài, qua đó nâng tổng số lượng mã vạch
DNA lên 147 loài và 16 loài định danh đến giống trên tổng số hơn 1.300 loài ở
Nigeria, với khả năng phân tách các loài riêng biệt đạt 90,2% [23].
Mặc dù số lượng bướm không nhiều, chỉ khoảng 500 loài, nhưng Trung
Á là khu vực điểm nóng về độ phong phú với nhiều chi, loài phụ và nhóm loài
đặc hữu đa dạng [13]. Bằng cách nghiên cứu mã vạch DNA ở Kazakhstan,
Kyrgyzstan, Tajikistan, Turkmenistan, Uzbekistan và một phần tây nam nước
Nga (phần Châu Á), các nhà khoa học đã khuếch đại thành công đoạn gen CO1
của 353 loài bướm, trong đó tỉ lệ các loài phân biệt rõ ràng chiếm 90% [13].
Cách đó không xa, mã vạch DNA của 81 trên tổng số 320 loài bướm ở
Pakistan cũng đã được thu thập với 100% là các loài khác nhau [24]. Qua phân
tích và so sánh dữ liệu với khu hệ bướm ở Trung Á, các nhà khoa học nhận
định khu hệ bướm ở Pakistan phản ánh khả năng cách ly di truyền hiệu quả với
các nước láng giềng qua dãy núi Pamir (cao tới hơn 5.000 mét), tạo nên sự hiện
diện của nhiều vùng đặc hữu ở khu vực này [24].
Ở khu vực Đông Nam Á, đã có 233 loài bướm ở Malaysia được giải trình
tự vùng gen CO1 nhưng tỉ lệ phân biệt các loài không cao, chiếm khoảng 78%
[25]. Trong khi ở Thái Lan, một khảo sát mới đây nhất đã ghi nhận được trình
tự vùng gen CO1 cho 51 loài bướm từ 10 công viên đô thị ở thủ đô Bangkok,
trong đó có 05 loài định danh đến giống [26].
Có thể thấy, các nghiên cứu mã vạch DNA, đặc biệt là tính đặc hiệu cao
của vùng gen CO1, đã hỗ trợ rất nhiều cho việc phân loại và định danh các loài
bướm ở khắp nơi trên thế giới. Từ đó, nhiều nghiên cứu chuyên sâu trên từng
nhóm cụ thể hơn đã được thực hiện liên quan đến hệ thống phân loại họ, giống
hoặc chi tiết hơn tới các loài phụ. Dựa trên dữ liệu di truyền của 304 loài đại
diện cho 80% các giống khác nhau, các nhà khoa học đã đánh giá lại những
nghiên cứu trước đó và đề xuất hệ thống phân loại họ Riodinidae với một số
tộc (tribe) và tộc phụ (subtribe) mới được bổ sung thêm [27].
Qua phân tích trình tự vùng gen CO1 của 165 mẫu vật thuộc giống
Ypthima ở Malaysia, các nhà khoa học đề xuất loài Y. newboldi, trước đây được
11
xem là loài phụ của Y. baldus, nên là một loài riêng biệt; đồng thời ủng hộ một
quan điểm khác cho rằng Y. nebulosa nên là tên đồng danh của loài Y.
horsfieldii humei [28].
Khi nghiên cứu trên vùng gen CO1 của 10 loài phụ Losaria coon, các
nhà khoa học đã chứng minh được rằng, chúng bao gồm hai loài riêng biệt với
04 loài phụ của L. coon và 06 loài phụ của L. doubledayi [29]. Trong khi các
loài phụ của L. coon chỉ giới hạn ở nam Sumatra, đảo Java và Bawean không
quá tách biệt về mặt di truyền, thì các loài phụ của L. doubledayi xuất hiện rộng
rãi ở các vùng từ bắc Ấn Độ đến bắc Sumatra, có khoảng cách di truyền tương
đối tách biệt nhau do tác động bởi các yếu tố địa hình và cây chủ [29].
Bằng cách nghiên cứu trên vùng gen CO1 kết hợp cùng CO2, các nhà
khoa học đã chứng minh, hai loài phụ Dodona eugenes formosana và D. e.
esakii đặc hữu ở Đài Loan là cùng một loài, và loài này được chứng minh là
một loài mới D. formosana tách biệt hoàn toàn với loài D. eugenes trước đó
[30].
1.2.2. Nghiên cứu ở Việt Nam
Nghiên cứu mã vạch DNA ở Việt Nam mới được quan tâm nghiên cứu
trong những năm gần đây. Một số khảo sát trên vùng gen CO1 của cá, chim, bò
sát đã được thực hiện thành công, giúp xác định tên loài cho các mẫu vật bảo
tàng [31, 32, 33] và sản phẩm từ động vật [34, 35, 36], đặc biệt là hỗ trợ xác
định mối quan hệ di truyền, qua đó phát hiện các loài mới và ghi nhận mới cho
khu hệ động vật Việt Nam [37, 38, 39]. Tuy nhiên, đến nay chỉ mới có duy nhất
một nghiên cứu trên nhóm bướm ở nước ta được công bố, và nghiên cứu này
đã giúp phát hiện một loài mới cho khoa học, đặc hữu tại khu vực cao nguyên
Kon Tum [40]. Việt Nam là quốc gia có sự đa dạng về bướm rất cao, với 1.181
loài thuộc 06 họ đã được ghi nhận, trong đó Nymphalidae (418 loài),
Lycaenidae (318 loài) và Hesperiidae (288 loài) là những họ có số lượng phong
phú nhất, còn Papilionidae (69 loài), Pieridae (57 loài) và Riodinidae (31 loài)
có số lượng tương đối ít [41]. Thống kê trên BOLD hiện có 80 trình tự của 45
loài bướm ngày đã được ghi nhận, chiếm 3,81% tổng số loài đã được mô tả ở
Việt Nam (xem Bảng 1.3). Họ Nymphalidae có nhiều loài nhất với 41 trình tự
- Xem thêm -