ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Nguyễn Thị Thảo
NGHIÊN CỨU GEN MÃ HÓA ENZYME THAM GIA
THỦY PHÂN CELLULOSE TỪ KHU HỆ VI KHUẨN TRONG
RUỘT MỐI BẰNG KỸ THUẬT METAGENOMICS
LUẬN ÁN TIẾN SĨ SINH HỌC
Hà Nội - Năm 2015
1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Nguyễn Thị Thảo
NGHIÊN CỨU GEN MÃ HÓA ENZYME THAM GIA
THỦY PHÂN CELLULOSE TỪ KHU HỆ VI KHUẨN RUỘT
MỐI BẰNG KỸ THUẬT METAGENOMICS
LUẬN ÁN TIẾN SĨ SINH HỌC
Chuyên ngành: Di truyền học
Mã số: 62 42 01 21
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. GS. TS Trương Nam Hải
2. TS Đỗ Thị Huyền
Hà Nội - Năm 2015
2
LỜI CAM ĐOAN
Tôi xin cam đoan:
Đây là công trình nghiên cứu của tôi và một số kết quả cùng cộng tác
với các cộng sự khác.
Các số liệu và kết quả trình bày trong luận án là trung thực, một phần
đã được công bố trên các tạp chí khoa học chuyên ngành với sự đồng ý và cho
phép của các đồng tác giả.
Phần còn lại chưa được tác giả nào công bố trong bất kì công trình nào
khác.
Hà Nội, ngày tháng năm 2015
Tác giả
Nguyễn Thị Thảo
3
LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc tới GS.TS Trương Nam Hải và TS
Đỗ Thị Huyền phòng Kỹ thuật di truyền, Viện Công nghệ sinh học, Viện Hàn
lâm Khoa học và Công nghệ Việt Nam đã thu nhận, hướng dẫn tận tình, quan
tâm hết mực và tạo mọi điều kiện cho tôi hoàn thành luận án này.
Luận án được thực hiện tại phòng Kỹ thuật di truyền. Phòng Thí
nghiệm trọng điểm Công nghệ Gen, Viện Công nghệ sinh học, Viện Hàn lâm
Khoa học và Công nghệ Việt Nam và được hỗ trợ bởi đề tài Nghị định thư với
Nhật Bản: “Phân lập hệ gen mã hóa cho enzyme thủy phân lignocellulose từ
khu hệ vi sinh ruột mối Việt Nam bằng kỹ thuật Metagenomics”.
Trong thời gian học tập và nghiên cứu tại phòng Kỹ thuật di truyền, tôi
đã nhận được sự giúp đỡ và sự chỉ bảo tận tình về chuyên môn của tập thể cán
bộ nghiên cứu của phòng. Tôi xin chân thành cảm ơn sự giúp đỡ quý báu đó!
Tôi xin bày tỏ lòng cảm ơn sâu sắc đến các thầy cô giáo trong Khoa
Sinh học, Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội đã giảng
dạy và chỉ bảo cho tôi những kiến thức chuyên môn và kỹ năng cần thiết.
Để hoàn thành luận án, tôi đã nhận được nhiều sự giúp đỡ quý báu và
nhiệt tình của các đồng nghiệp công tác tại khoa Sinh học, Trường Đại học
Vinh, tôi xin chân thành cảm ơn sự giúp đỡ quý báu đó!
Với tất cả lòng biết ơn, tôi xin dành cho gia đình, bố mẹ, chồng và con,
những người thân đã thông cảm, động viên, tạo điều kiện và chia sẻ khó khăn
cùng tôi trong thời gian qua!
Nguyễn Thị Thảo
4
MỤC LỤC
MỞ ĐẦU .................................................................................................................................. 14
1. Tính cấp thiết của đề tài ................................................................................. 18
2. Mục tiêu của đề tài ......................................................................................... 20
3. Đối tượng và phạm vi nghiên cứu .................................................................. 20
4. Nội dung nghiên cứu ...................................................................................... 20
5. Ý nghĩa khoa học và thực tiễn của đề tài ....................................................... 20
6. Đóng góp mới của đề tài ................................................................................ 20
Chƣơng 1. TỔNG QUAN TÀI LIỆU................................................................................. 21
1.1. GIỚI THIỆU CHUNG VỀ LIGNOCELLULOSE ........................................................ 21
1.1.1. Cellulose .................................................................................................... 22
1.1.2. Hemicellulose ............................................................................................ 23
1.1.3. Lignin ......................................................................................................... 24
1.2. GIỚI THIỆU CHUNG VỀ CELLULASE................................................................ 24
1.2.1. Cơ chế hoạt động của cellulase và sự thủy phân cellulose ........................ 24
1.2.2. Cấu trúc của cellulase ................................................................................ 26
1.2.2.1. Cấu trúc chung của cellulase ..................................................................... 26
1.2.2.2. Cellulosome thủy phân cellulose ............................................................. 27
1.3. CELLULASE CỦA VI KHUẨN .................................................................... 28
1.3.1. Sơ lược về họ cellulase ............................................................................... 28
1.3.2. Cellulase của vi khuẩn và vi khuẩn cổ ....................................................... 30
1.3.2.1. Cellulase vi khuẩn và vi khuẩn cổ ưa ấm ................................................ 30
1.3.2.2. Cellulase ở vi khuẩn và vi khuẩn cổ ưa nhiệt .......................................... 31
1.3.3. Ứng dụng của cellulase .............................................................................. 31
1.3.3.1. Ứng dụng của cellulase trong công nghệ sản xuất bia, rượu vang, chế
biến thực phẩm và thức ăn ......................................................................... 32
1.3.3.2. Ứng dụng cellulase trong dệt may ........................................................... 33
1.3.3.3. Ứng dụng cellulase trong chế biến bột giấy và giấy ............................... 33
5
1.3.3.4. Ứng dụng của cellulase trong sản xuất cồn sinh học .............................. 34
1.4. MỐI VÀ HỆ VI SINH VẬT RUỘT MỐI LIÊN QUAN ĐẾN SỰ THỦY PHÂN
LIGNOCELLULOSE .................................................................................................... 35
1.4.1. Sơ lược về mối và đa dạng mối ở Việt Nam .............................................. 35
1.4.2. Hệ vi sinh vật trong ruột mối bậc thấp ....................................................... 36
1.4.3. Sự tiêu hóa lignocellulose của mối ............................................................. 38
1.4.4. Tình hình nghiên cứu gen mã hóa cellulase của sinh vật trong đường
ruột mối bậc thấp ....................................................................................... 39
1.5. KHÁI QUÁT CHUNG VỀ METAGENOMICS ............................................................ 41
1.5.1. Phương pháp tiếp cận tìm gen mới bằng Metagenomics ........................... 42
1.5.2. Phân lập gen từ thư viện DNA đa hệ gen .................................................. 43
1.5.3. Khai thác và phân lập gen từ dữ liệu trình tự DNA đa hệ gen .................. 45
1.5.3.1. Phương pháp giải trình tự của một số hệ thống máy thế hệ mới ............ 45
1.5.3.2. Tập hợp các read thành contig ................................................................. 47
1.5.4. Ứng dụng của Metagenomics .................................................................... 50
1.5.4.1. Ứng dụng của Metagenomics trong khai thác gen mới và đánh giá sự
đa dạng vi sinh vật ..................................................................................... 50
1.5.4.2. Tiềm năng ứng dụng của Metagenomics ................................................. 53
Chƣơng 2. ĐỐI TƢỢNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU................................ 55
2.1. ĐỐI TƢỢNG, VẬT LIỆU, HÓA CHẤT VÀ THIẾT BỊ MÁY MÓC ......................... 55
2.1.1. Đối tượng và vật liệu .................................................................................. 55
2.1.2. Hóa chất và thiết bị máy móc ..................................................................... 56
2.2. PHƢƠNG PHÁP NGHIÊN CỨU............................................................................... 58
2.2.1. Các phương pháp vi sinh ............................................................................ 59
2.2.2. Các phương pháp sinh học phân tử ............................................................ 59
2.2.2.1. Tách chiết DNA hệ gen của mối .............................................................. 59
2.2.2.2. Phương pháp thu nhận vi khuẩn ruột mối và tách chiết DNA đa hệ
gen của chúng ............................................................................................ 59
2.2.2.3. Tinh sạch DNA đa hệ gen bằng phương pháp máng đơn (troughing) .... 60
6
2.2.2.4. Giải trình tự DNA đa hệ gen bằng máy giải trình tự thế hệ mới
HiSeq2000 của Illumina ............................................................................ 61
2.2.2.5. Phương pháp biến nạp DNA plasmid vào vi khuẩn E. coli bằng sốc nhiệt ... 62
2.2.2.6. Phương pháp tách chiết DNA plasmid từ tế bào vi khuẩn E. coli .......... 63
2.2.2.7. Phương pháp cắt và ghép nối gen ........................................................... 63
2.2.2.8. Phương pháp tinh sạch DNA từ gel agarose bằng QIAquick Gel
Extraction kit.............................................................................................. 64
2.2.2.9. Kỹ thuật PCR ........................................................................................... 64
2.2.2.10. Thiết kế vector biểu hiện pET22b(+) mang gen egc ............................. 66
2.2.2.11. Điện di DNA trên gel agarose ............................................................... 66
2.2.2.12. Phương pháp biểu hiện gen ................................................................... 66
2.2.2.13. Điện di biến tính protein trên gel polyacrylamide-SDS ....................... 67
2.2.2.14. Điện di protein trên gel polyacrylamide không SDS ............................. 68
2.2.3. Các phương pháp hóa sinh protein ............................................................. 68
2.2.3.1. Phương pháp tinh chế protein bằng sắc kí ái lực his-tag ...................... 68
2.2.3.2. Định lượng protein bằng phương pháp Bradford ................................... 69
2.2.3.3. Định lượng đường khử bằng phương pháp DNS ..................................... 69
2.2.3.4. Phương pháp xác định hoạt tính endoglucanase .................................... 70
2.2.3.5. Phương pháp xác định hoạt tính β-glucosidase và β-xylosidase ............ 71
2.2.3.6. Xác định ảnh hưởng của nhiệt độ, pH, các ion kim loại và một số hóa
chất lên hoạt tính endoglucanase .............................................................. 72
2.2.3.7. Xác định độ bền của enzyme ................................................................... 72
2.2.3.8. Xác định thông số động học của enzyme ................................................. 72
2.2.4. Các phương pháp tin sinh học và xử lý số liệu bằng phần mềm sinh học. 73
2.2.4.1. Phân tích trình tự DNA đa hệ gen vi khuẩn ruột mối .............................. 73
2.2.4.2. So sánh trình tự ORF của dữ liệu DNA đa hệ gen với CSDL của NCBI ..... 74
2.2.4.3. Thiết kế mồi bằng phần mềm FastPCR ................................................... 75
2.2.4.4. Kiểm tra vị trí của các enzyme hạn chế trên gen quan tâm bằng phần
mềm trực tuyến RestrictionMapper ........................................................... 75
7
2.2.4.5. Chuyển mã trình tự DNA sang trình tự axit amin bằng chương trình
dịch mã ExPASy ......................................................................................... 75
2.2.4.6. Xây dựng cây phát sinh loài của loài mối nghiên cứu với các loài mối
khác bằng phần mềm Genedoc và MEGA5 ............................................... 75
2.2.4.7. Dự đoán cấu trúc của EGC bằng phần mềm Phyre2 .............................. 76
Chƣơng 3. KẾT QUẢ VÀ THẢO LUẬN ......................................................................... 77
3.1. KẾT QUẢ ĐỊNH LOÀI MỐI NGHIÊN CỨU BẰNG PHƢƠNG PHÁP PHÂN TỬ . 77
3.1.1. Tách chiết DNA hệ gen của mối................................................................. 79
3.1.2. PCR khuếch đại đoạn DNA của gen mã hóa RNA ribosome 16S ti thể mối . 79
3.1.3. Phân tích sản phẩm PCR................................................................................76
3.2. TÁCH CHIẾT, ĐỌC VÀ PHÂN TÍCH TRÌNH TỰ DNA ĐA HỆ GEN VI KHUẨN
RUỘT MỐI C. gestroi ..................................................................................................... 86
3.2.1. Tách chiết và tinh sạch DNA đa hệ gen vi khuẩn ruột mối C. gestroi ....... 86
3.2.2. Đọc và phân tích trình tự DNA đa hệ gen vi khuẩn ruột mối C. gestroi ............. 87
3.2.2.1. Tập hợp trình tự và xác định gen ............................................................. 87
3.2.2.2. Đa dạng vi sinh vật ruột mối C. gestroi ................................................... 90
3.3. GEN MÃ HÓA ENZYME THUỶ PHÂN CELLULOSE CỦA VI KHUẨN RUỘT
MỐI C. gestroi ................................................................................................................. 96
3.3.1. Dự đoán chức năng gen của DNA đa hệ gen vi khuẩn ruột mối C. gestroi..... 96
3.3.2. Gen mã hóa enzyme phân hủy cellulose .................................................... 98
3.3.3. Lựa chọn ORF cellulase để biểu hiện ....................................................... 100
3.4. TÁCH DÕNG GEN egc...................................................................................................104
3.4.1. Trình tự ORF GL0130684 ........................................................................ 105
3.4.2. Khuếch đại gen egc ................................................................................... 105
3.4.3. Ghép nối sản phẩm khuếch đại gen egc vào vector tách dòng
pJET1.2/blunt ......................................................................................... 106
3.4.4. Biến nạp sản phẩm ghép nối vào tế bào E. coli DH10b ........................... 107
3.4.5. Cắt kiểm tra plasmid tái tổ hợp bằng enzyme hạn chế ............................. 108
8
3.4.6. Phân tích trình tự gen wegc phân lập được từ DNA đa hệ gen vi khuẩn
ruột mối C. gestroi ................................................................................... 108
3.4.7. Khuếch đại gen egc không chứa tín hiệu tiết từ khuôn pJET-wegc ......... 111
3.4.8. Thiết kế vector biểu hiện gen egc ............................................................. 111
3.4.8.1. Ghép nối gen egc vào vector biểu hiện.................................................. 111
3.4.8.2. Cắt kiểm tra plasmid tái tổ hợp pET22-egc........................................... 113
3.5. BIỂU HIỆN GEN egc TRONG VI KHUẨN E. coli BL21(DE3) ................... 114
3.5.1. Chọn dòng biểu hiện gen egc trong tế bào E. coli BL21(DE3) ................ 114
3.5.2. Ảnh hưởng của nhiệt độ đến sự biểu hiện gen egc trong tế bào E. coli
BL21(DE3) .............................................................................................. 116
3.5.3. Ảnh hưởng của nồng độ IPTG đến hiệu quả cảm ứng ............................. 117
3.5.4. Điện di và kiểm tra hoạt tính endoglucanase của EGC ............................... 119
3.5.5. Tinh chế protein EGC bằng cột sắc kí ái lực His-tag ............................... 120
3.5.6. Tính đặc hiệu cơ chất của EGC ................................................................ 124
3.5.7. Ảnh hưởng của nhiệt độ đến hoạt tính endoglucanase của EGC ............. 126
3.5.8. Ảnh hưởng của pH đến hoạt tính của EGC .............................................. 127
3.5.9. Độ bền nhiệt của EGC .............................................................................. 128
3.5.10. Ảnh hưởng của một số ion kim loại và hóa chất lên hoạt tính của EGC 128
3.5.11. Đặc điểm động học của EGC.................................................................. 132
KẾT LUẬN VÀ KIẾN NGHỊ ...........................................................................................135
TÀI LIỆU THAM KHẢO..................................................................................................138
9
DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮT
Tên viết tắt
BglB
BglF
BglG
Tên tiếng Anh
Beta-glucosidase B
Beta-glucosidase F
Beta-glucosidase G
BLAST
Basic Local Alignment
Search Tool
bp
BSA
Base pair
Bovine serum albumin
BWA
Burrows-Wheeler Aligner
CD
Carbohydrate binding
domain
Catalytic domain
cDNA
Complementary DNA
CBD
Cel12A
Cel45A
(EGV)
Cel48A
Cel5A
Cel6A
(CBHII)
Cel6B
(EGVI)
Cel7A
(CBHI)
Tên tiếng Việt
Beta-glucosidase B
Beta-glucosidase F
Beta-glucosidase G
Công cụ so sánh mức độ tương
đồng về trình tự nucleotide/axit
amin trực tuyến của NCBI
Cặp base
Albumin huyết thanh bò
Phần mềm kiểm tra các sai lệch
nhỏ trong quá trình giải trình tự các
đoạn DNA, cũng như quá trình tập
hợp so với hệ gene tham khảo lớn
Vùng liên kết với carbohydrate
Vùng xúc tác
DNA được tổng hợp từ khuôn
mRNA nhờ enzyme phiên mã
ngược reverse transcriptase
Endoglucanase glycoside
hydrolase family 12
Endoglucanase glycoside
hydrolase family 45
Exoglucanase glycoside
hydrolase family 5
Endoglucanase glycoside
hydrolase family 5
cellobiohydrolase cel6A
(cellobiohydrolase II)
Endoglucanase thuộc họ 12
Endoglucanase thuộc họ 45
Exoglucanase thuộc họ 48
Endoglucanase thuộc họ GH 5
Cellobiohydrolase II (exoglucanase
II) thuộc họ GH6
Endoglucanase EGVI
Endoglucanase thuộc họ GH 6
Cellobiohydrolase cel7A
(Cellobiohydrolase I)
Cellobiohydrolase I (exoglucanase
II) thuộc họ GH7
10
Endoglucanase Cel9A
Endoglucanase thuộc họ 9
glycoside hydrolase family 9
Enzyme phân huỷ cellulose thuộc
glycoside hydrolase family 9
Cel9B
họ GH 9
Carboxymethyl cellulose
Cơ chất carboxymethyl cellulose
CMC
Cơ sở dữ liệu protein của sinh vật
nhân sơ và nhân chuẩn đơn bào/cơ
Clusters of Orthologous/
sở dữ liệu từ 7 hệ gen sinh vật nhân
COG/KOG eukaryotic orthologous
chuẩn: 3 loài động vật, 1 loài thực
groups Group
vật, Arabidopsis thaliana, 2 loài
nấm và các ký sinh trùng nội bào
Cơ sở dữ liệu
CSDL
2'-deoxyadenosine 5'2'-deoxyadenosine 5'-triphosphate
dATP
triphosphate
2'-deoxycytidine 5'2'-deoxycytidine 5'-triphosphate
dCTP
triphosphate
2'-deoxyguanosine 5'2'-deoxyguanosine 5'-triphosphate
dGTP
triphosphate
Deoxyribonucleic acid
Axit deoxyribonucleic
DNA
Acid 3,5-Dinitrosalicylic
DNS/DNSA 3,5-Dinitrosalicylic
2’-deoxyribonucleoside 5’2’-deoxyribonucleoside 5’dNTP
triphosphate
triphosphate
2'-deoxythymidine 5'2'-deoxythymidine 5'-triphosphate
dTTP
triphosphate
Ethylene diamine tetraacetic
Axit ethylene diamine tetraacetic
EDTA
acid
Endoglucanase
Endoglucanase
EGC
Evolutionary genealogy of
Cơ sở dữ liệu chứa các nhóm
genes: Non-supervised
eggNOG
orthologous
Orthologous Groups
Một trong 3 tiểu đơn vị chính của
Endoglucanase E
cellulosome ở Clostridium
EngE
cellulovorans
Emultion PCR
PCR nhũ tương
ePCR
expressed sequence tag
Trình tự cDNA ngắn
EST
FragGeneScan
Phần
mềm
dự
đoán
gen
FGS
Cel9A
11
Kb
Km
LB
Gigabyte
Glycoside hydrolase
Histidin
High performance liquid
chromatography
High Throughput
Sequencing
Integrated Microbial
Genomes
Isopropy-β-Dthiogalactosidase
International Union of
Biochemistry and Molecular
Biology
Kilo base
Kilodalton
Kyoto Encyclopedia of
Genes and Genomes
Kilobase
Michaelis constant
Luria-Betani
LBA
Luria-Betani ampicillin
Mb
Megabyte
MEGAN
MEtaGeneomic ANalyser
MGA
MetaGeneAnnotator
MGM
MetaGeneMark
Gb
GH
His (H)
HPLC
HTS
IMG
IPTG
IUBMB
Kb
kdal
KEGG
MG-RAST
NCBI
Metagenomic Rapid
Annotations using
Subsystems Technology
National Center for
Biotechnology Information
12
FragGeneScan
Gigabyte
Glycoside hydrolase
Axit amin histidin
Sắc ký lỏng hiệu năng cao
Giải trình tự thông lượng cao
Cơ sở dữ liệu tích hợp hệ gen vi
sinh vật
Chất cảm ứng Isopropy-β-Dthiogalactosidase
Liên minh Quốc tế về Hóa sinh và
Sinh học phân tử
Kilo base
Đơn vị đo trọng lượng của protein
Cơ sở dữ liệu về hệ gene, enzyme
và các sản phẩm sinh học
Kilobase
Hằng số Michaelis
Môi trường nuôi cấy LB
Môi trường nuôi cấy LB bổ sung
ampicillin
Megabyte
Phần mềm phân tích trình tự đa hệ
gene MEGAN
Phần mềm dự đoán gene
MetaGeneAnnotato
Phần mềm dự đoán gene
MetaGeneMark
Cơ sở dữ liệu để dự đoán chức
năng gene và đa dạng sinh vật
Trung tâm thông tin về Công nghệ
Sinh học của Mỹ
NGS
Next-Generation
Sequencing
Đọc trình tự bằng máy thế hệ mới
NR
Non-Redundant
OD
OPH
ORF
PCR
Optimal density
Orphelia
Open Reading Frame
Polymarase Chain Reaction
PE
pair-end
PFAM
pNPG
protein families
p-nitrophenol-β-glucoside
4-nitrophenyl β-Dxylopyranoside
Prodigal
quantitative PCR (real -time
PCR)
Rapid Annotation using
Subsystem Technology
pNPX
PRD
qPCR
RAST
RDP
Ribosomal Database Project
RNA
SDS
Ribonucleic acid
Sodium dodecyl sulphate
SDS-polyacrylamide gel
electrophoresis
SDS-PAGE
SE
SMF
TEMED
w/v
Vmax
single-end read
Sequencing and Microarray
Facility
N, N, N’, N’tetramethylethylenediamine
Weight/volume
Maximum velocity
13
Cơ sở dữ liệu chứa các trình tự
non-redundant từ cơ sở dữ liệu
NCBI
Mật độ quang học
Phần mềm dự đoán gene
Khung đọc mở
Phản ứng trùng hợp
Read có cả hai đầu tương đồng với
contig
Cơ sở dữ liệu các họ protein
p-nitrophenol-β-glucoside
4-nitrophenyl β-D-xylopyranoside
Phần mềm dự đoán gene Prodigal
PCR định lượng
Công nghệ dự đoán hệ gene vi khuẩn
và vi khuẩn cổ
Cơ sở dữ liệu trình tự rRNA tiểu đơn
vị nhỏ của vi khuẩn và vi khuẩn cổ
Axit ribonucleic
Sodium dodecyl sulphate
Điện di trên gel polyacrylamide
biến tính
Read có một đầu tương đồng với
contig
Cơ sở dữ liệu trình tự
N, N, N’, N’tetramethylethylenediamine
Khối lượng/thể tích
Vận tốc tối đa
DANH MỤC BẢNG
Bảng 1.1. Tỷ lệ của cellulose, hemicellulose và lignin trong sinh khối
lignocellulose. ........................................................................................... 22
Bảng 1.2. Các nhóm cellulase chính của vi khuẩn. .................................................. 29
Bảng 3.1. Tỷ lệ tương đồng và sai khác về trình tự nucleotide giữa các vùng
430 bp gen rRNA 16S ti thể mối Coptotermes thu thập từ 6 địa điểm. .. 81
Bảng 3.2. Mức độ tương đồng vùng trình tự 430 bp gen rRNA 16S ti thể của 6
mẫu mối Coptotermes với trình tự tương ứng của cơ sở dữ liệu NCBI. ..... 83
Bảng 3.3. Mức độ tương đồng vùng trình tự 126 bp gen rRNA 16S của 2 mẫu
mối Coptotermes với trình tự tương ứng của cơ sở dữ liệu NCBI. ......... 83
Bảng 3.4. Các tham số trình tự nucleotide của DNA đa hệ gen vi khuẩn trong
C. gestroi được tập hợp bằng phần mềm SOAPdenovo. .......................... 89
Bảng 3.5. Kết quả dự đoán gen................................................................................. 89
Bảng 3.6. Kết quả so sánh các read chất lượng cao với các CSDL hệ gen. ............ 90
Bảng 3.7. Đa dạng vi sinh vật ruột mối C. gestroi được dự đoán bằng MEGAN
dựa vào CSDL NR (non-redundant database) của NCBI. ....................... 91
Bảng 3.8. Đa dạng taxon của 7 ngành vi khuẩn chiếm ưu thể nhất sống trong
ruột mối C. gestroi. ................................................................................. 93
Bảng 3.9. Các ORF của vi khuẩn sống trong ruột C. gestroi nghiên cứu mã hóa
enzyme thuộc các họ GH có khả năng phân hủy cellulose. ......................... 99
Bảng 3.10. Các ORF mã hóa cellulase của vi sinh vật sống trong ruột C. gestroi. .... 100
Bảng 3.11. Sự tương đồng trình tự nucleotide 5 ORF hoàn thiện của vi khuẩn
sống trong ruột C. gestroi mã hóa endoglucanase với trình tự của các
gen tương ứng của NCBI. ...................................................................... 102
Bảng 3.12. Sự tương đồng trình tự axit amin của các ORF vi sinh vật sống trong
ruột C. gestroi mã hóa endoglucanase với trình tự tương ứng của NCBI. 102
Bảng 3.13. Kết quả đánh giá hàm lượng protein EGC được tinh chế. .................. 123
Bảng 3.14. Kết quả đánh giá hàm lượng protein EGC được tinh chế ở phân đoạn 5... 123
14
DANH MỤC HÌNH
Hình 1.1. Cấu trúc của lignocellulose . .................................................................... 21
Hình 1.2. Cấu trúc tinh thể và vô định hình của cellulose.. ..................................... 23
Hình 1.3. Cơ chế phân hủy/khử polime hóa cellulose bằng cellulase...................... 25
Hình 1.4. Hoạt động của exoglucanase Cel7A ở Trichoderma reesei. .................... 26
Hình 1.5. Một mô hình cấu trúc cellulosome của C. cellulovorans.. ....................... 28
Hình 1.6. Sơ đồ chuyển hóa sinh khối lignocellulose thành cồn sinh học. .............. 35
Hình 1.7. Sự phân loại các ngành vi khuẩn ruột sau của 2 loài mối bậc thấp. ......... 37
Hình 1.8. Sự phân hủy cellulose của mối bậc thấp.. ................................................ 38
Hình 1.9. Các phương pháp chính tiếp cận của Metagenomics để tìm gen mới. ..... 42
Hình 1.10. Các bước cơ bản của quá trình giải trình tự DNA bằng máy giải trình
tự thế hệ mới của Illumina. .................................................................... 46
Hình 1.11. Hai sơ đồ tạo contig... ............................................................................. 47
Hình 2.1. Các bước cơ bản trong nghiên cứu của đề tài. ......................................... 58
Hình 2.2. Các bước tách vi khuẩn ruột mối từ mối thợ. ........................................... 60
Hình 2.3. Đường chuẩn BSA ................................................................................... 69
Hình 2.4. Đường chuẩn glucose. .............................................................................. 70
Hình 2.5. Đường chuẩn pNG được đo ở bước sóng 410 nm ................................... 71
Hình 2.6. Sự phụ thuộc của tốc độ phản ứng vào nồng độ cơ chất theo
Lineweaver-Burk. .................................................................................. 73
Hình 2.7. Các bước phân tích và khai thác gen từ dữ liệu DNA đa hệ gen vi
khuẩn ruột mối Coptotermes. ................................................................ 74
Hình 3.1. Các địa điểm thu thập mối để nghiên cứu. ............................................... 77
Hình 3.2. Mối thu thập ở phường Văn Quán, quận Hà Đông, Hà Nội .................... 78
Hình 3.3. Điện di đồ sản phẩm tách chiết DNA hệ gen của mối nghiên cứu trên
gel agarose 0,8%.. .................................................................................. 79
Hình 3.4. Điện di đồ hỗn hợp sản phẩm PCR khuếch đại các đoạn gen mã hóa
rRNA 16S ti thể mối bằng cặp mồi thứ nhất ......................................... 80
Hình 3.5. Cây phát sinh loài giữa 6 mẫu mối nghiên cứu và 21 loài khác được
xây dựng dựa trên các trình tự có mức độ tương đồng cao nhất với
đoạn DNA kích thước 430 bp. .............................................................. 82
15
Hình 3.6. Cây phát sinh loài giữa 2 mẫu mối nghiên cứu và 31 loài khác được
xây dựng dựa trên các trình tự tương đồng cao nhất với vùng DNA
kích thước 126 bp. ................................................................................. 85
Hình 3.7. Điện di đồ DNA đa hệ gen của hệ vi khuẩn ruột mối C. gestroi trên gel
agarose 0,8%.......................................................................................... 87
Hình 3.8. Tỷ lệ % của 7 bảy ngành vi khuẩn chiếm ưu thế nhất có mặt trong ruột
mối C. gestroi nghiên cứu. .................................................................... 94
Hình 3.9. Số ORF của 12 bộ vi khuẩn chiếm ưu thế nhất trong ruột mối C.
gestroi nghiên cứu. ................................................................................ 94
Hình 3.10. Các lớp chức năng của các ORF tham gia con đường sinh học được
dự đoán dựa vào sơ sở dữ liệu KEGG. .................................................. 97
Hình 3.11. Phân tích cây phát sinh loài giữa EGC và các endogucanase dựa trên
sự tương đồng về trịnh tự axit amin.. .................................................. 103
Hình 3.12. Dự đoán chức năng của trình tự ORF GL0130684 bằng BlastP với cơ
cở dữ liệu gen của NCBI.. ................................................................... 104
Hình 3.13. Mô hình cấu trúc 3D của EGC được xử lý bằng phần mềm Phyre2.. .. 104
Hình 3.14. Điện di đồ sản phẩm khuếch đại gen wegc trên gel agarose 0,8%.. .... 106
Hình 3.15. Điện di đồ sản phẩm tách DNA plasmid tái tổ hợp pJET-wegc trên
gel agarose 0,8%. ................................................................................. 107
Hình 3.16. Điện di đồ kiểm tra sản phẩm cắt DNA plasmid tái tổ hợp pJET-wegc
trên gel agarose 0,8%. ......................................................................... 108
Hình 3.17. So sánh trình tự axit amin của ORF GL013068 và của đoạn DNA
phân lập được từ DNA đa hệ gen vi khuẩn ruột mối C. gestroi.......... 109
Hình 3.18. Sơ đồ thiết kế vector biểu hiện mang gen egc. ..................................... 110
Hình 3.19. Điện di đồ sản phẩm PCR khuếch đại gen egc từ khuôn là gen wegc
trên gel agarose 0,8%. ......................................................................... 111
Hình 3.20. Cấu trúc 3D của trình tự axit amin gen egc được thiết lập bằng phần
mềm Phyre 2 ........................................................................................ 112
Hình 3.21. Điện di đồ sản phẩm cắt gen egc và mở vòng vector pET22b(+) bằng
cặp enzyme hạn chế NcoI/XhoI trên gel agarose 0,8%.. ..................... 113
Hình 3.22. Điện di đồ kiểm tra plasmid . ............................................................... 113
Hình 3.23. Điện di đồ protein tổng số từ sản phẩm biểu hiện gen egc trong chủng
E. coli BL21(DE3) ở môi trường LBA, nhiệt độ 37oC, sau 4 giờ cảm
16
ứng 0,5 mM IPTG ở 3 dòng tế bào khác nhau trên gel
polyacrylamide 12,6% có SDS. ........................................................... 114
Hình 3.24. Điện di đồ protein kiểm tra khả năng tan của protein EGC biểu hiện
trong chủng E. coli BL21(DE3), môi trường LBA ở 37oC sau 4 giờ
cảm ứng 0,5 mM IPTG trên gel polyacrylamide 12,6% có SDS.. ...... 115
Hình 3.25. Điện di đồ protein EGC biểu hiện trong chủng E. coli BL21(DE3) sau
4 giờ cảm ứng 0,5 mM IPTG ở 20oC, 25oC, 30oC và 37oC trên gel
polyacrylamide 12,6% có SDS.. .......................................................... 116
Hình 3.26. Mật độ tế bào biểu hiện E. coli BL21(DE3) mang pET22-egc cảm
ứng IPTG ở các nồng độ từ 0,0 đến 2,0 mM. ...................................... 117
Hình 3.27. Điện di đồ protein EGC biểu hiện ở 20oC trong tế bào E. coli
BL21(DE3) cảm ứng 10 nồng độ IPTG khác nhau trên gel
polyacrylamide 12,6% có SDS.. .......................................................... 118
Hình 3.28. Điện di đồ protein EGC biểu hiện ở 20oC trong tế bào E. coli
BL21(DE3) trên gel polyacrylamide 9% không có SDS. ................... 119
Hình 3.29. Biểu đồ sắc ký tinh chế protein EGC bằng cột sắc ký ái lực His-tag... 120
Hình 3.30. Điện di đồ kiểm tra sản phẩm trong các phân đoạn tinh chế enzyme EGC
bằng cột sắc kí ái lực His-tag trên gel polyacrylamide 12,6% có SDS. ...... 121
Hình 3.31. Điện di đồ protein tinh chế trên gel polyacrylamid 9%-0,1% CMC
không có SDS.. .................................................................................... 122
Hình 3.32. Phân tích độ sạch của sản phẩm tinh chế protein EGC bằng cột sắc kí
ái lực His-tag trên gel polyacrylamide 12,6% có SDS. ....................... 124
Hình 3.33. Hoạt tính endoglucanase trên các cơ chất khác nhau. .......................... 125
Hình 3.34. Ảnh của nhiệt độ đến hoạt tính endoglucanase của EGC. ................... 126
Hình 3.35. Ảnh hưởng của pH đến hoạt tính endoglucanase của EGC ở 40oC. .... 127
Hình 3.36. Hoạt tính của EGC khi xử lý ở các nhiệt độ khác nhau……………...126
Hình 3.37. Ảnh hưởng của ion kim loại và một số hóa chất lên hoạt tính
endoglucanase của EGC. ..................................................................... 129
Hình 3.38. Ảnh hưởng nồng độ Co2+ đến phần trăm hoạt tính endoglucanase của
EGC. .................................................................................................... 131
Hình 3.39. Sự phụ thuộc của tốc độ phản ứng của enzyme vào nồng độ cơ chất
CMC theo Linewever-Burk. ................................................................ 132
17
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Cellulase là nhóm enzyme được sử dụng phổ biến trong các ngành công
nghiệp như chế biến thực phẩm, chế biến thức ăn, sản xuất giấy, sản xuất rượu, sản
xuất bia, công nghệ dệt…. Đặc biệt, cellulase đang được quan tâm nghiên cứu ứng
dụng trong sản xuất nhiên liệu sinh học [8] như cồn sinh học từ nguồn phế phẩm
lignocellulose dồi dào thay thế cho nguồn nhiên liệu hóa thạch đang trên đà cạn
kiệt. Trong vòng hơn 25 năm qua, sản lượng cồn sinh học đã tăng trưởng và đạt
mức nhảy vọt kể từ năm 2000. Cồn sinh học có thể được dùng như nguồn nhiên liệu
độc lập cho các loại xe có động cơ chuyên biệt hoặc làm phụ gia nhiên liệu cho loại xe
có động cơ truyền thống với tỉ lệ lên đến 30% [126]. Ở nước ta, ước tính hàng năm,
nguồn nguyên liệu lignocellulose từ phế phẩm nông nghiệp như rơm, rạ, lá mía và
bã cây mía bỏ phí lên đến 50 triệu tấn. Biện pháp xử lý nguồn phế phẩm này chủ
yếu là đốt đã gây ra những ảnh hưởng tiêu cực đến môi trường sống và sức khoẻ
con người [32, 135]. Việc tận dụng được nguồn nguyên vật liệu lignocellulose phế
phẩm này vào sản xuất cồn sinh học sẽ đem đến nhiều lợi ích to lớn cho môi trường
cũng như cho nền kinh tế của nước ta.
Việc sử dụng cellulase thay thế các hóa chất truyền thống như axit, kiềm và
nhiệt độ cao vào trong quá trình sản xuất của các ngành công nghiệp đã giải quyết
được nhiều vấn đề như hạn chế ô nhiễm môi trường, tiết kiệm năng lượng và bảo vệ
được sức khoẻ người lao động cũng như tăng hiệu quả sản xuất. Tuy nhiên, vấn đề
đặt ra là cần thiết phải có được nguồn cellulase hoạt động ở điều kiện pH và nhiệt
độ thích hợp cho các quá trình sản xuất đó [95]. Hơn nữa, việc sản xuất cồn sinh
học đang gặp một số khó khăn trong việc giảm chi phí sản xuất đặc biệt là nguồn
cellulase để phân cắt cellulose thành glucose hiệu quả [62, 154]. Do đó, vấn đề quan
trọng nhất là tìm ra được nguồn cellulase mới phù hợp với điều kiện sản xuất của
các ngành công nghiệp liên quan, phát triển các phức hợp cellulase hiệu quả và ổn
định để khắc phục khó khăn trong quá trình sản xuất.
Metagenomics là kỹ thuật cho phép thu nhận trực tiếp DNA đa hệ gen của
toàn bộ các vi sinh vật trong môi trường sống nhất định [44, 121]. Chính vì lợi thế
18
là thu nhận và phân tích được tất cả hệ gen của vi sinh vật phong phú và đa dạng,
đặc biệt là 99% vi sinh vật chưa nuôi cấy được [4] mà Metagenomics trở thành
công cụ giúp các nhà nghiên cứu khai thác nguồn gen mới hiệu quả nhất. Thực tế đã
chứng minh, sau 20 năm phát triển, đặc biệt là khoảng 5 năm gần đây, khi kỹ thuật
giải mã gen thế hệ mới được áp dụng, Metagenomics đã được sử dụng rất hiệu quả
để tìm hiểu sự đa dạng vi sinh vật cũng như khai thác các gen mới từ nhiều môi
trường sống khác nhau như nước, đất, sinh vật (các đường tiêu hóa), phế thải, …
Mối đóng một vai trò quan trọng đối với hệ sinh thái bởi khả năng phân hủy
sinh khối lignocellulose và góp phần vào chu trình carbon. Khả năng phân hủy hiệu
quả lignocellulose của mối là kết quả hoạt động tổng hợp của cellulase và
hemicellulase được tiết ra từ bản thân mối và từ vi sinh vật sống trong ruột mối.
Trong đó, hệ vi sinh vật ruột mối đóng vai trò quan trọng trong việc tiêu hóa hiệu
quả nguồn thức ăn lignocellulose của mối [16, 68]. Vì vậy, vi sinh vật ruột mối
mang nguồn gen mã hóa enzyme phong phú cần được khai thác nhằm tìm ra các
cellulase mới liên quan đến sự phân hủy cellulose.
Ở Việt Nam, cho đến nay, hơn 100 loài mối khác nhau đã được mô tả [1,
45]. Tuy nhiên, hệ vi sinh vật của chúng vẫn chưa được nghiên cứu. Vì thế toàn bộ
hệ enzyme thủy phân lignocellulose có nguồn gốc từ vi sinh vật trong ruột mối cũng
chưa được điều tra và khảo sát. Với đặc điểm đặc trưng của quần xã vi sinh vật sống
trong ruột mối và vai trò của chúng giúp vật chủ phân hủy thức ăn, quần xã vi sinh
vật ở mối bậc thấp được xem là nguồn khai thác gen cellulase mới lý tưởng sử dụng
trong quá trình thủy phân cellusose. Mặc dù, trên thế giới cũng đã có nhiều nghiên
cứu về gen cellulase của vi sinh vật ruột mối bậc thấp, nhưng tất cả đều tập trung
nghiên cứu sự đa dạng của động vật nguyên sinh và nguồn gen của chúng, rất ít
nghiên cứu nào đánh giá sự đa dạng của vi khuẩn cũng như sự đa dạng gen cellulase
của chúng ở môi trường ruột mối bậc thấp. Chính vì vậy, bằng kỹ thuật
Metagenomics với hướng tiếp cận là giải trình tự đa hệ gen, chúng tôi lựa chọn đối
tượng là vi khuẩn ruột mối bậc thấp thuộc chi Coptotermes để thực hiện đề tài
“Nghiên cứu gen mã hóa enzyme tham gia thủy phân cellulose từ khu hệ vi
khuẩn ruột mối bằng kỹ thuật Metagenomics”.
19
2. Mục tiêu của đề tài
Phân lập, tách dòng và biểu hiện được 1 gen mã hóa cellulase từ DNA đa hệ
gen vi khuẩn ruột mối bằng kỹ thuật Metagenomics.
3. Đối tƣợng và phạm vi nghiên cứu
Đối tượng là vi khuẩn ruột mối thuộc chi Coptotermes. Mối do Viện Sinh
thái và Bảo vệ công trình cung cấp.
4. Nội dung nghiên cứu
(1) Tách chiết DNA đa hệ gen của vi khuẩn ruột mối Coptotermes.
(2) Giải trình tự và xử lý trình tự DNA đa hệ gen.
(3) Từ bộ dữ liệu trình tự DNA đa hệ gen, dự đoán gen và chú thích gen theo
hai khía cạnh là đa dạng sinh vật và chức năng.
(4) Chọn 1 trình tự gen để thiết kế mồi, phân lập, tách dòng và biểu hiện.
(5) Xác định đặc điểm của sản phẩm biểu hiện gen phân lập được.
5. Ý nghĩa khoa học và thực tiễn của luận án
Ý nghĩa khoa học
(1) Đã phân lập, tách dòng và biểu hiện được 1 gen mã hóa endoglucanase từ
DNA đa hệ gen của vi khuẩn ruột mối Coptotermes gestroi.
(2) Đã đánh giá được sự đa dạng vi khuẩn và đa đạng gen cellulase của vi
khuẩn sống trong ruột mối C. gestroi ở Việt Nam.
Ý nghĩa thực tiễn
Góp phần đánh giá tiềm năng và khả năng sử dụng nguồn gen mã hóa
endoglucanase từ vi khuẩn ruột mối C. gestroi ở Việt Nam vào quá trình
phân giải cơ chất cellulose thuộc một số lĩnh vực trong các ngành công
nghiệp.
6. Đóng góp mới của đề tài
(1) Đây là nghiên cứu đầu tiên ở Việt Nam ứng dụng kỹ thuật Metagenomics
để tìm hiểu sự đa dạng vi khuẩn trong ruột mối Coptotermes và bước đầu
phân lập được gen mã hóa protein có hoạt tính endoglucanase từ DNA đa
hệ gen vi khuẩn ruột mối C. gestroi.
20
- Xem thêm -