ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Nguyễn Thị Thảo
NGHIÊN CỨU SÀNG LỌC GENE MÃ HÓA ENZYME THAM GIA THỦY PHÂN
CELLULOSE TỪ KHU HỆ VI SINH VẬT TRONG RUỘT MỐI BẰNG KỸ THUẬT
METAGENOMICS
Chuyên ngành: Di truyền học
Mã số: 62420121
TÓM TẮT DỰ THẢO LUẬN ÁN TIẾN SĨ SINH HỌC
1
Hà Nội - 2014
2
Công trình đƣợc hoàn thành tại:
Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Trƣờng Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
1. GS. TS. Trƣơng Nam Hải
Ngƣời hƣớng dẫn khoa học:
2.
TS. Đỗ Thị Huyền
Phản biện:
1.
2.
3.
Dự thảo lu ận án s ẽ đƣợc b ảo v ệ trƣớc H ội đ ồng cấp Đ ại h ọc Qu ốc gia ch ấm
luận án tiến sĩ họp tại Trƣờng Đại học Khoa học Tự nhiên
vào hồi
giờ
ngày
tháng
năm
Có thể tìm hiểu luận án tại:
-
Thƣ viện Quốc gia Hà Nội
-
Trung tâm thông tin – Thƣ viện, Đại học quốc gia Hà Nội
3
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Cellulase là nhóm enzyme đƣợc sử dụng phổ biến trong các ngành công nghiệp nhƣ
chế biến thực phẩm, chế biến thức ăn, sản xuất giấy, sản xuất rƣợu, sản xuất bia, công nghệ
dệt…. Đặc biệt, cellulase đang đƣợc quan tâm nghiên cứu ứng dụng trong sản xuất nhiên
liệu sinh học nhƣ cồn sinh học từ nguồn phế phẩm lignocellulose dồi dào thay thế cho nguồn
nhiên liệu hóa thạch đang trên đà cạn kiệt. Trong vòng 25 năm qua, sản lƣợng cồn sinh học
đã tăng trƣởng và đạt mức nhảy vọt kể từ năm 2000. Cồn sinh học có thể đƣợc dùng nhƣ
nguồn nhiên liệu độc lập cho các loại xe có động cơ chuyên biệt hoặc làm phụ gia nhiên liệu
cho loại xe có động cơ truyền thống với tỉ lệ lên đến 30%. Ở nƣớc ta, ƣớc tính hàng năm,
nguồn nguyên liệu lignocellulose từ phế phẩm nông nghiệp nhƣ rơm, rạ, lá mía và bã cây
mía bỏ phí lên đến 50 triệu tấn. Các biện pháp xử lý nguồn phế phẩm này chủ yếu là đốt đã
gây ra những ảnh hƣởng tiêu cực đến môi trƣờng sống và sức khoẻ con ngƣời. Việc tận
dụng đƣợc nguồn nguyên vật liệu lignocellulose phế phẩm này vào sản xuất cồn sinh
học sẽ đem đến nhiều lợi ích to lớn cho môi trƣờng cũng nhƣ cho nền kinh tế của nƣớc ta.
Việc sử dụng cellulase thay thế các hoá chất truyền thống nhƣ acid, kiềm và nhiệt độ
cao vào trong quá trình sản xuất của các ngành công nghiệp đã giải quyết đƣợc nhiều vấn đề
nhƣ hạn chế ô nhiễm môi trƣờng và bảo vệ đƣợc sức khoẻ ngƣời lao động cũng nhƣ tăng
hiệu quả sản xuất. Tuy nhiên, vấn đề đặt ra là cần thiết phải có đƣợc nguồn cellulase hoạt
động ở điều kiện pH và nhiệt độ thích hợp cho các quá trình sản xuất đó. Hơn nữa, việc sản
xuất cồn sinh học đang gặp một số khó khăn trong việc giảm chi phí sản xuất đặc biệt là
nguồn cellulase để phân cắt cellulose thành glucose hiệu quả. Do đó, vấn đề quan trọng nhất
là tìm ra đƣợc nguồn cellulase mới phù hợp với điều kiện sản xuất của các ngành công
nghiệp liên quan, phát triển các phức hợp cellulase hiệu quả và ổn định để khắc phục khó
khăn trong quá trình sản xuất.
Metagenomics là kỹ thuật cho phép thu nhận trực tiếp DNA đa hệ gene của toàn bộ
các vi sinh vật trong môi trƣờng sống nhất định. Chính vì lợi thế là thu nhận và phân tích
đƣợc tất cả hệ gene của vi sinh vật phong phú và đa dạng, đặc biết là 99% vi sinh vật không
nuôi cấy đƣợc mà Metagenomics trở thành công cụ giúp các nhà nghiên cứu khai thác nguồn
gene mới hiệu quả nhất. Thực tế đã chứng minh, sau 20 năm phát triển, đặc biệt là khoảng 5
năm gần đây, khi kỹ thuật giải mã gene thế hệ mới đƣợc áp dụng, Metagenomics đã đƣợc
sử dụng rất hiệu quả để tìm hiểu sự đa dạng vi sinh vật cũng nhƣ khai thác các gene mới từ
nhiều môi trƣờng sống khác nhau nhƣ nƣớc, đất, các đƣờng tiêu hóa, phế thải, …
Mối đóng một vai trò quan trọng đối với hệ sinh thái bởi khả năng phân hủy sinh khối
lignocellulose và góp phần vào chu trình carbon. Khả năng phân hủy hiệu quả lignocellulose
4
của mối là kết quả hoạt động tổng hợp của các enzyme cellulase và hemicellulase đƣợc tiết
ra từ bản thân mối và từ vi sinh vật sống cộng sinh trong ruột mối.
Trong đó, hệ vi sinh vật cộng sinh trong ruột mối đóng vai trò quan trọng trong việc tiêu hóa
hiệu quả nguồn thức ăn lignocellulose của mối. Vì vậy, ruột mối là một nguồn gene cellulase
phong phú cần đƣợc khai thác nhằm tìm ra các enzyme mới liên quan đến sự phân hủy
cellulose.
Ở Việt Nam cho đến nay đã tìm thấy hơn 100 loài mối khác nhau. Tuy nhiên, hệ vi
sinh vật của các loài mối ở Việt Nam vẫn chƣa đƣợc nghiên cứu vì thế toàn bộ hệ enzyme
thủy phân lignocellulose có nguồn gốc từ vi sinh vật cộng sinh trong ruột mối cũng chƣa
đƣợc điều tra và khảo sát. Với đặc điểm đặc trƣng của quần xã vi sinh vật sống cộng sinh
trong ruột mối và vai trò của chúng giúp vật chủ phân hủy thức ăn, quần xã vi sinh vật ở mối
bậc thấp đƣợc xem là nguồn khai thác gene cellulase mới lý tƣởng sử dụng trong quá trình
thủy phân cellusose. Do đó, để nghiên cứu hệ vi sinh vật ruột mối và khai thác gene mới mã
hóa cellulase từ hệ vi sinh vật tƣơng ứng sống cộng sinh trong ruột hiệu quả, chúng tôi đã
tiến hành đề tài “Nghiên cứu sàng lọc gene mã hoá enzyme tham gia thủy phân cellulose
từ khu hệ vi sinh vật trong ruột mối bằng kỹ thuật Metagenomics”.
2. Mục tiêu của đề tài
1. Đánh giá đƣợc sự đa dạng vi sinh vật ruột mối và đa dạng gene mã hoá cellulase của
chúng.
2. Phân lập, tách dòng và biểu hiện đƣợc một gene mã hoá cellulase từ DNA đa gene
vi sinh vật ruột mối.
3. Xác định đƣợc ảnh hƣởng của một số điều kiện đến hoạt động của protein do gene
tách dòng đƣợc mã hoá.
3. Đối tƣợng và phạm vi nghiên cứu
Nghiên cứu đƣợc tiến hành trên đối tƣợng là vi sinh vật ruột mối thợ Coptotermes
thu thập ở miền Bắc Việt Nam.
4. Nội dung nghiên cứu
1. Xác định đối tƣợng để tách lấy DNA đa hệ gen của vi sinh vật và định danh đối
tƣợng.
2. Xây dựng phƣơng pháp để tách chiết và tinh sạch DNA đa hệ gene.
3. Giải trình tự và xử lý trình tự DNA đa hệ gene.
4. Dự đoán gene theo hai khía cạnh là đa dạng vi sinh vật và đa dạng gene từ bộ dữ
liệu trình tự DNA đa hệ gene.
5. Chọn một trình tự gene để thiết mồi, phân lập, tách dòng và biểu hiện.
5
6. Xác định đặc điểm của sản phẩm biểu hiện gene phân lập đƣợc.
1. Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học
1. Đã định loại đƣợc một loài mối bậc thấp Coptotermes gestroi thu thập ở sáu địa
điểm tại Hà Nội và Hƣng Yên bằng phƣơng pháp phân tử.
2. Đã đánh giá đƣợc sự đa dạng vi sinh vật và đa đạng gene cellulase của vi khuẩn
sống trong ruột mối C. gestroi.
Ý nghĩa thực tiễn
3. Đã phân lập, tách dòng và biểu hiện đƣợc một gene mã hoá endoglucanase. Đây
là enzyme đƣợc ứng dụng rộng rãi trong nhiều ngành công nghiệp.
4. Đóng góp mới của đề tài
1. Đây là nghiên cứu đầu tiên về sự đa dạng vi sinh vật ruột mối bậc thấp C. gestroi
cũng nhƣ đa dạng gen cellulase của chúng.
2. Trình tự của gen đã phân lập, tách dòng và biểu hiện đƣợc có độ sai khác so với
trình tự gene tƣơng ứng của các cơ sở dữ liệu.
5. Bố cục của luận án
Luận án gồm 151 trang bao gồm: phần mở đầu 3 trang; chƣơng 1: tổng quan tài liệu 37
trang; chƣơng 2: đối tƣợng và phƣơng pháp nghiên cứu 22 trang; chƣơng 3: kết quả và thảo
luận 58 trang; kết luận và kiến nghị 2 trang. Các công trình khoa học của tác giả 1 trang. Tài
liệu tham khảo 19 trang. Trong luận án có 19 bảng và 62 hình.
Chƣơng 1. TỔNG QUAN TÀI LIỆU
1.1. GIỚI THIỆU CHUNG VỀ LIGNOCELLULOSE
Nêu đại cƣơng về đặc điểm cấu trúc chung của ba thành phần chính cấu tạo nên
lignocellulose là cellulose, hemicellulose và lignin.
1.2. GIỚI THIỆU CHUNG VỀ CELLULASE
Nêu tổng quan về cơ chế hoạt động của cellulase và sự thủy phân cellulose. Cấu trúc
của cellulase.
1.3. CELLULASE CỦA VI KHUẨN
Nêu tổng quan về các họ cellulase, đặc biệt các loài vi khuẩn và vi khuẩn cổ tạo ra
cellulase. Đồng thời đặc điểm về nhiệt độ, pH và kích thƣớc cellulase của các vi khuẩn đƣợc
đƣa ra cụ thể. Ngoài ra, phần này còn nêu một số ứng dụng nổi bật của cellulase.
6
1.4. MỐI VÀ HỆ VI SINH VẬT RUỘT MỐI LIÊN QUAN ĐẾN SỰ THỦY PHÂN
LIGNOCELLULOSE
Sơ lƣợc về mối và đa dạng mối ở Việt Nam. Nêu tổng quan hệ vi sinh vật trong ruột
mối bậc thấp và sự tiêu hóa lignocellulose của mối. Khái quát tính hình nghiên cứu gene mã
hóa cellulase của sinh vật trong đƣờng ruột mối bậc thấp
1.5. KHÁI QUÁT CHUNG VỀ METAGENOMICS
Nếu khái quát: phƣơng pháp tiếp cận tìm gene mới bằng Metagenomics, các nghiên
cứu phân lập gene từ thƣ viện DNA đa hệ gene và hơn phƣơng pháp khai thác và phân lập
gene từ dữ liệu trình tự DNA đa hệ gene. Nêu rõ phƣơng pháp giải trình tự của một số hệ
thống máy thế hệ mới. Đặc biệt, đƣa ra các nghiên cứu ứng dụng của Metagenomics trong
khai thác gene mới và đánh giá sự đa dạng vi sinh vật. Ngoài ra tiềm năng ứng dụng của
Metagenomics cũng đƣợc đề cập.
Chƣơng 2. ĐỐI TƢỢNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU
2.1. ĐỐI TƢỢNG, VẬT LIỆU, HÓA CHẤT VÀ THIỆT BỊ MÁY MÓC
Trong nghiên cứu này, chúng tôi đã sử dụng đối tượng là vi sinh vật ruột mối thuộc
chi Coptotermes do Viện Sinh thái và Bảo vệ công trình cung cấp; các chủng vi sinh vật
dùng làm thể nhận trong thí nghiệm tách dòng gene và làm thể nhận biểu hiện gene; plasmid
sử dụng để tách dòng và biểu hiện gene; các cặp mồi PCR.
Các loại hóa chất sử dụng trong nghiên cứu đều đƣợc đặt mua từ các công ty đạt tiêu
chuẩn quốc tế nhƣ Bio-Lab (Mỹ), Fermentas (Mỹ), Sigma (Mỹ), Merck (Đức).
2.2. PHƢƠNG PHÁP NGHIÊN CỨU
2.2.1. Các phƣơng pháp vi sinh
2.2.2. Các phƣơng pháp sinh học phân tử
2.2.2.1. Tách chiết DNA tổng số của mối
2.2.2.2. Phƣơng pháp thu nhận vi sinh vật ruột mối và tách chiết DNA đa hệ gene của chúng
2.2.2.3. Tinh sạch DNA đa hệ gene bằng phƣơng pháp máng đơn (troughing)
2.2.2.4. Giải trình tự DNA đa hệ gene hiệu năng cao bằng máy giải trình tự thế hệ mới
HiSeq2000 của Illumina
2.2.2.5. Phƣơng pháp biến nạp bằng sốc nhiệt DNA plasmid vào vi khuẩn E. coli
2.2.2.6. Phƣơng pháp tách chiết DNA plasmid từ tế bào vi khuẩn E. coli
2.2.2.7. Phƣơng pháp cắt và ghép nối gene
2.2.2.8. Phƣơng pháp tinh sạch DNA từ gel agarose bằng QIAquick Gel Extraction kit
2.2.2.9. Kỹ thuật PCR
7
2.2.2.10. Thiết kế vector biểu hiện pET22b(+) mang gene egc
2.2.2.11. Điện di DNA trên gel agarose
2.2.2.12. Phƣơng pháp biểu hiện gene
2.2.2.13. Điện di biến tính protein trên gel polyacrylamide-SDS
2.2.2.14. Điện di protein trên gel polyacrylamide không SDS
2.2.3. Các phƣơng pháp hóa sinh protein
2.2.3.1. Phƣơng pháp tinh sạch protein bằng sắc kí ái lực his-tag
2.2.3.2. Định lƣợng protein bằng phƣơng pháp Bradford
2.2.3.3. Định lƣợng đƣờng khử bằng phƣơng pháp DNS
2.2.3.4. Phƣơng pháp xác định hoạt tính endoglucanase
2.2.3.5. Phƣơng pháp xác định hoạt tính β-glucosidase và β-xylosidase
2.2.3.6. Xác định ảnh hƣởng của nhiệt độ, pH, các ion kim loại và một số hóa chất lên hoạt
tính endoglucanase
2.2.3.7. Xác định độ bền của enzyme
2.2.4. Các phƣơng pháp tin sinh học và xử lý số liệu bằng phần mềm sinh học
2.2.4.1. Phân tích trình tự DNA đa hệ gene vi sinh vật ruột mối
2.2.4.2. So sánh trình tự ORF của dữ liệu DNA đa hệ gene với CSDL của NCBI
2.2.4.3. Thiết kế mồi bằng phần mềm FastPCR
2.2.4.4. Kiểm tra vị trí của các enzyme hạn chế trên gene quan tâm bằng phần mềm trực
tuyến RestrictionMapper
2.2.4.5. Chuyển mã trình tự DNA sang trình tự amino acid bằng chƣơng trình dịch mã
ExPASy
2.2.4.6. Xây dựng cây chủng loài của loài mối nghiên cứu với các loài mối khác bằng phần
mềm Genedoc và MEGA5
2.2.4.7. Dự đoán cấu trúc của EGC bằng phần mềm Phyre2
2.2.4.8. Xác định độ tinh sạch của protein EGC tinh sạch đƣợc bằng phần mềm Quantity
One
Chƣơng 3. KẾT QUẢ VÀ THẢO LUẬN
3.1. THU THẬP MỐI
3.1.1. Thu thập mối
Từ tháng 4 đến tháng 6 năm 2012, sáu tổ mối đƣợc thu thập ở sáu địa điểm khác
nhau. Các tổ mối thu đƣợc ghi rõ địa điểm, sắp xếp vào các hộp đựng mẫu. Năm địa điểm
thu đƣợc mối tại Hà Nội là Văn Quán, Hà Đông; Tản Lĩnh, Ba Vì; Bùi Xƣờng Trạch, Đống
Đa; Thái Hà, Đống Đa; Võng Thị, Tây Hồ và một địa điểm tại tỉnh Văn Lâm, Hƣng Yên.
Trong tổ thu đƣợc có hai đẳng cấp là mối lính và mối thợ. Mối lính thực hiện chức năng bảo
8
vệ. Còn mối thợ thực hiện chức năng tìm kiếm và dự trữ thức ăn. Chính vì mối thợ có vai trò
then chốt trong tìm kiếm và tiêu hoá thức ăn, dó đó chúng là đối tƣợng quan trọng đƣợc lựa
chọn để tách lấy vi sinh vật đƣờng ruột.
Mối của sáu tổ đều ăn gỗ và có hình dạng bên ngoài giống nhau. Dựa vào hình thái,
rất ngẫu nhiên, cả sáu mẫu mối đƣợc các nhà nghiên cứu thuộc Viện Sinh thái và Bảo vệ
công trình đã định loại ở bậc giống đều là Coptotermes.
3.1.2. Kết quả định loài mối nghiên cứu bằng phƣơng pháp phân tử
3.1.2.1. Tách DNA tổng số của mối
Để xác định loài mối bằng phƣơng pháp phân tử, trƣớc hết, chúng tôi tiến hành tách
chiết DNA tổng số của mối. DNA tổng số mối của cả sáu mẫu thu thập ở sáu địa điểm tách
chiết đƣợc đều nguyên vẹn và có kích thƣớc lớn hơn 10 kb. Mẫu DNA này sẽ đƣợc sử dụng
trực tiếp làm khuôn để khuếch đại đoạn gene ARN ribosome16S (rARN 16S) ti thể.
3.1.2.2. PCR khuếch đại đoạn DNA của gene ARN ribosome 16S ti thể mối
bp
TH VT BXT VL
M VQ TL
1000
500
Sản phẩm PCR của cặp mồi thứ
400
nhất
Sản
100
phẩm PCR của cặp mồi thứ hai
Hình 3.1. Điện di đồ hỗn hợp sản phẩm PCR khuếch đại các đoạn gene mã hóa rARN 16S ti
thể mối bằng hai cặp mồi LR-J-13007, LR-N-13398 và FST-F, FST-R từ khuôn DNA tổng số của mối
Coptotermes trên gel agarose 1,7%. ĐC M: Thang chuẩn 100 bp (Fermentas); các ĐC TH, VT, BXT,
VL, VQ và TL tương ứng là sản phẩm PCR từ khuôn là DNA hệ gene mối thu thập ở Thái Hà, Võng
Thị, Bùi Xương Trạch, Văn Lâm, Văn Quán và Tản Lĩnh.
Hai cặp mồi gồm cặp thứ nhất là LR-J-13007, LR-N-13398 và cặp thứ hai là FSTF,
FST-R đƣợc sử dụng để khuếch đại hai đoạn DNA của gene mã hóa RNA ribosome ti thể
mối. Kết quả là ở 54oC, cặp mồi thứ nhất đã khuếch đại hiệu quả đoạn DNA duy nhất đậm
nét, kích thƣớc lớn hơn 400 bp và bé hơn 500 bp từ DNA tổng số của cả sáu mẫu mối.
Tuy nhiên, chỉ ở 57oC, cặp mồi thứ hai mới khuếch đại đƣợc một băng DNA duy nhất kích
thƣớc lớn hơn 100 bp từ hai mẫu khuôn DNA tổng số thu thập ở Văn Quán và Tản Lĩnh,
9
còn bốn mẫu DNA còn lại không có đoạn DNA nào đƣợc khuếch đại (Hình 3.1). Tất cả các
đoạn DNA khuếch đại đƣợc đều đƣợc đọc và phân tích trình tự nucleotide.
3.1.2.3. Phân tích sản phẩm PCR
Phân tích trình tự nucleotide đoạn DNA được khuếch đại bằng cặp mồi thứ nhất
Trình tự nucleotide của sáu đoạn DNA khuếch đại bằng cặp mồi thứ nhất đƣợc sắp
xếp và so sánh với nhau đã thể hiện rằng tất cả các trình tự đều tƣơng đồng với nhau trong
vùng 430 bp và không có sự khác nhau giữa ba mẫu mối thu thập ở Võng Thị, Văn Lâm và
Bùi Xƣơng Trạch. Tuy nhiên, giữa hai mẫu mối Văn Quán và Thái Hà khác với các nhóm
khác từ 0,5-0,9%; mẫu mối Tản Lĩnh khác với các mẫu mối khác từ 0,5-1,5% (Bảng 3.1).
Đồng thời, mức độ tƣơng đồng trình tự nucleotide của sáu đoạn DNA trên cũng đƣợc so
sánh với các trình tự tƣơng ứng của NCBI bằng BlastN. Kết quả cho thấy có sự giống nhau
rất cao (97-99%) giữa sáu trình tự nghiên cứu với các trình tự tƣơng ứng của C. gestroi
(Bảng 3.2). Để xác định rõ hơn mỗi quan hệ giữa mối Coptotermes nghiên cứu và các loài
thuộc giống này, cây phát sinh loài đƣợc thiết lập bằng phần mềm MEGA5 (Hình 3.2) dựa
vào trình tự vùng 430 bp cùng với 21 trình tự (giống từ 92-99%) của gene tƣơng ứng mã
hoá rARN 16S của các loài mối thuộc giống Coptotermes. Kết quả cho thấy tất cả sáu mẫu
mối thu tại sáu địa điểm nằm hoàn toàn trong nhánh tiến hóa của C. gestroi.
Phân tích trình tự nucelotide đoạn DNA được khuếch đại bằng cặp mồi thứ hai
Hai trình tự nghiên cứu chỉ khác nhau 1 nucleotide duy nhất. Kết quả so sánh mức
giống nhau của hai trình tự nghiên cứu với các trình tự tƣơng ứng của NCBI bằng Blastn
cho thấy, mức giống nhau thể hiện cao nhất (99-100%) đối với các trình tự của Coptotermes
gestroi. (Bảng 3.3). Đồng thời, các trình tự tƣơng ứng trên ngân hàng gene có mức giống
nhau từ 95-100 % so với hai trình tự nghiên cứu và xây dựng cây phát sinh loài bằng phần
mềm MEGA5 thể hiện mỗi quan hệ giữa hai mẫu mối nghiên cứu và các loài mối thuộc
giống Coptotermes. Giống với kết quả phân tích trình tự đoạn 430 bp, cây phát sinh loài cũng
cho thấy hai mẫu mối nghiên cứu nằm hoàn toàn trong nhánh tiến hóa của C. gestroi.
Nhƣ vậy, những kết quả phân tích trên đã chứng minh đầy đủ và chắc chắn rằng, ở
mức độ phân tử, sáu mẫu mối nghiên cứu thu thập ở sáu địa điểm đều thuộc loài Coptotermes
gestroi.
10
CTanLinhVN
CVongThiVN
64
CHungYenVN
CBuiXuongTrachVN
40 CgestEF092285SG
CgestDQ004478SG
CgestDQ004480SG
62
CgestDQ915942SG
CThaiHaVN
61
CVanQuanVN
67
C. crassus
CgestDQ004481MY
92
CgestDQ004487AU
39
68 CgestEF156760US
CgestAY558905AG
55
70
0.005
CgestAY558906TC
CcarvAY558909MY
CkalsAY683211MY
43
ClactAY558912AU
44
CformAB626146JP
65
CformU17778US
CformAB626145JP
100
CformAY558911CN
54 CformDQ007344US
CformGU075666CN
31
CinteAY558904TG
CcrasAY558901BZ
68
CvastAY558898US
97
Hình 3.2.
Cây phát sinh
loài giữa loài mối
nghiên cứu và
21 loài khác
được xây dựng
dựa trên các
trình tự có mức
độ giống cao
nhất với đoạn
DNA kích thước
430 bp được
khuếch lại bằng
cặp mồi LR-J-13007 và LR-N-13398.
Bảng 3.1. Tỷ lệ giống nhau và khác nhau về trình tự nucleotide giữa các vùng 430 bp gene
rARN ti thể mối Coptotermes thu thập từ 6 địa điểm.
Tỷ lệ giống nhau (%)
BXT
BXT
VQ
VL
TL
TH
VT
99,1
100
99,5
99,5
100
99,1
98,5
99,5
99,1
99,5
99,5
100
99,1
99,5
VQ
4
VL
0
4
TL
2
6
2
TH
2
2
2
4
VT
0
4
0
2
99,5
2
Số nucleotide khác nhau
BXT: Bùi Xương Trạch; VQ: Văn Quán; VL: Văn Lâm; TL: Tản Lĩnh; TH: Thái Hà; VT: Võng Thị
11
Bảng 3.2: Mức độ giống nhau vùng trình tự 430 bp gene rARN 16S của sáu mẫu mối
Coptotermes với trình tự tương ứng của cơ sở dữ liệu NCBI.
Loài
Địa điểm
Mã số gene
C. formosanus
C. formosanus
C. formosanus
C. gestroi CgA2
AB626145
AY558911
U17778
DQ004487
C. gestroi
AY558905
C. gestroi
AY558906
C. gestroi CgS3
C. gestroi CgF2
C. kalshoveni
C. lacteus
C. vastator
DQ004478
EF156760
AY683211
AY558912
AY558898
Nhật Bản
Trung Quốc
Hoa Kỳ
Australia
Đảo
Antigua
và
Barbuda
Quần đảo Turk và
Caico
Singapore
Hoa Kỳ
Malaysia
Australia
Hoa Kỳ
Mức độ giống nhau (%)
BXT
93
94
93
98
VL
93
94
93
98
TL
93
93
93
97
TH
94
94
93
98
VQ
93
94
93
97
VT
93
94
93
98
99
99
98
99
98
99
98
98
98
98
98
98
99
99
99
99
99
99
98
95
93
93
98
95
93
93
98
94
92
92
98
95
93
93
98
94
93
93
98
95
93
92
(BXT: Bùi Xương Trạch; VQ: Văn Quán; VL: Văn Lâm; TL: Tản Lĩnh; TH: Thái Hà; VT: Võng Thị).
3.2. TÁCH CHIẾT VÀ TINH SẠCH DNA ĐA HỆ GENE VI SINH VẬT SỐNG TRONG RUỘT
MỐI
Toàn bộ ruột mối thợ gồm ruột trƣớc, ruột giữa và ruột sau đều đƣợc tách lấy. Sau
đó, DNA đa hệ gene của hệ vi sinh vật ruột mối đƣợc tách lấy và tinh sạch. Kết quả cho thấy
sản phẩm tinh chế chỉ còn một băng DNA đa hệ gene duy nhất đậm nét có kích thƣớc lơn
hơn 10 kb (Hình 3.3).
M
1
kb
DNA đa hệ gen
10 Hình 3.3. Điện di đồ DNA đa hệ gene của hệ vi sinh vật ruột mối
Coptotermes gestroi trên gel agarose
0,8%. ĐC M: Thang chuẩn 1 kb (Fermentas); ĐC 1: DNA đa hệ gene
được tinh chế bằng phương pháp Máng đơn.
Để có đủ lƣợng DNA cần thiết cho việc nghiên cứu, chúng tôi đã tách chiết DNA đa
hệ gene vi sinh vật từ khoảng 1.000.000 ruột mối thợ Coptotermes gestroi của sáu mẫu mối
thu thập ở sáu địa điểm và thu đƣợc gần 11 µg DNA đa hệ gene sạch có nồng độ 114 ng/µl
và OD260/280 đạt 1,83. Trong đó, 8,5 µg DNA đa hệ gene đƣợc đọc trình tự.
12
3.3. ĐỌC VÀ PHÂN TÍCH TRÌNH TỰ DNA ĐA HỆ GENE VI SINH VẬT RUỘT MỐI
Coptotermes 3.3.1. Tập hợp trình tự và xác định gene
Trình tự DNA đa hệ gene vi sinh vật ruột mối C. gestroi đƣợc đọc bằng máy giải trình
tự HiSeq 2000 của Illumina. Dữ liệu gồm các read tốt có tổng kích thƣớc là 5,4 Gb. Những
read tốt này đƣợc sử dụng để tập hợp thành các contig có kích thƣớc dài hơn bằng phần
mềm SOAPdenovo. Với k = 41, phần mềm đã lắp ráp tất cả các read thành các contig tối ƣu
nhất gồm số lƣợng contig nhiều nhất 79.262 contig có tổng chiều dài dài nhất khoảng 90,1
Mb, kích thƣớc contig dài nhất là 183.853 bp và kích thƣớc contig ngắn nhất là 500 bp. Từ
79.262 contig, phần mềm MetaGeneAnnotator đã dự đoán đƣợc 125.431 ORF.
3.3.2. Đa dạng vi sinh vật ruột mối C. gestroi
Trên cơ sở bộ dữ liệu trình tự DNA đa hệ gene, mức độ đa dạng vi sinh vật ruột mối
C. gestroi đƣợc đánh giá dựa theo hai cách:
Thứ nhất, các read chất lƣợng cao đƣợc so sánh với các trình tự của CSDL. Trong
số đó, 34,07% các read giống với gene vi khuẩn, 0,032% giống với gene của nấm, 3,79%
giống với gene vi sinh vật đƣờng ruột ngƣời và 0,189% giống với trình tự của RDP. Tổng
số read có trình tự giống với CSDL là 206.742.13. Trong đó, tổng số read có trình tự giống
với CSDL của vi khuẩn là 186.147.74. Do đó, nếu chỉ xét riêng các read có trình tự tƣơng
đồng với các CSDL thì số read của vi khuẩn chiếm 90% và chỉ một tỷ lệ nhỏ (< 1%) là của
nấm.
Thứ hai, tất cả các ORF đƣợc phần mềm MEGAN (MEtaGeneomic ANalyser) phân
tích dựa vào CSDL NR. Kết quả cho thấy 80% ORF thuộc vi khuẩn, 0,42% thuộc vi khuẩn
cổ, 0,58% thuộc eukaryote, một tỷ lệ nhỏ thuộc vi rút (0,20%) và còn lại 18,79% là các ORF
không dự đoán đƣợc. Từ dữ liệu, tổng số 1.460 loài vi sinh vật đƣợc xác định có mặt trong
ruột mối C. gestroi, trong đó, vi khuẩn có độ đa dạng cao nhất, với 1.368 loài (chiếm tới
93,7% tổng số loài đƣợc dự đoán) (Bảng 3.3) thuộc 628 chi, 217 họ, 97 bộ, 41 lớp và 22
ngành.
Bảng 3.3. Đa dạng vi sinh vật ruột mối C. gestroi được dự đoán bằng MEGAN dựa vào
CSDL NR (non-redundant database) của NCBI.
Ngành
Lớp
Bộ
Họ
Chi
Loài
Số gene
Tỷ lệ (%)
Vi khuẩn
22
41
97
217
628
1368
100340
80
Vi khuẩn cổ
4
10
15
21
47
61
533
0,42
Eukaryota
20
14
25
33
43
24
731
0,58
Vi rút
-
-
1
11
13
7
249
0,2
23570
18,79
Không dự
đoán được
13
Tổng số
46
65
138
282
731
1460
125423
100
Trong số 22 ngành vi khuẩn đƣợc dự đoán có 7 ngành chiếm ƣu thế nhất gồm
Firmicutes, Proteobacteria, Spirochaetes, Bacteroidetes, Synergistetes, Planctomycetes và
Actinobacteria. Số ORF của các loài thuộc các ngành này chiếm đến 57,72% (Bảng 3.4) tổng
số ORF vi khuẩn dự đoán đƣợc..
Bảng 3.4. Đa dạng loài 7 ngành vi khuẩn chiếm ưu thể nhất sống trong ruột mối C. gestroi
Ngành
Lớp
Bộ
Họ
Chi
Loài
Tỷ lệ có mặt (%)
Firmicutes
4
8
40
126
429
22,48
Proteobacteria
6
41
84
260
490
17,84
Spirochaetes
1
1
3
8
34
17,4
Bacteroidetes
4
5
13
67
159
11,6
Synergistetes
1
1
1
9
11
4,27
Planctomycetes
2
3
3
9
10
1,14
Actinobacteria
1
5
37
72
135
0,48
Ở bậc phân loại bộ, trong số 97 bộ vi khuẩn dự đoán đƣợc có 12 bộ chiếm ƣu thế
nhất thể hiện ở hình (Hình 3.5). Trong đó, chỉ có bộ Pseudomonades không thuộc 7 ngành
chiếm ƣu thể, còn lại đều thuộc 7 ngành chiếm ƣu thế trên.
Hình 3.4. Bảy ngành vi khuẩn chiếm ưu thế nhất có mặt trong ruột mối C.gestroi nghiên cứu
Trong đó, Clostridiales, Actinobacteria, Bacillales, Enterobacteriales, Bacillales,
Pseudomonades và Bacteroidales là những bộ có các loài phổ biến có khả năng phân huỷ
cellulose, nhƣ Ruminococcus albus (62 ORF), Ruminococcus flavefaciens (40 ORF),
Acetivibrio cellulolyticus (85 ORF), Pseudomonas fluorescens (1258 ORF).
Xét bậc phân loại chi, Treponema là chi thuộc bộ Spirochaetales chiếm ƣu thế nhất
(chiếm đến 91,2% bộ, 15% tổng số vi khuẩn xác định đƣợc). Chi chiếm ƣu thế thứ hai là
Lactococcus (thuộc bộ Lactobacillales) chiếm 7,8%, tiếp đến là Pseudomonas (thuộc bộ
Pseudomonades) chiếm 4,6% tổng số vi khuẩn có mặt trong mẫu ruột mối thu thập đƣợc.
14
Ngoài ra còn có năm chi cũng chiếm ƣu thế là Pseudomonas (5823 ORF), Enterobacter
(3412 ORF), Dysgonomonas (2984 ORF), Clostridium (2968 ORF) và Bacteroides (2414
ORF). Những trình tự của tám chi ƣu thế nhất này chiếm đến 51,36% so với tổng tất cả các
chi dự đoán đƣợc. Trong đó, Clostridium và Bacteroides là hai chi có rất nhiều loài phổ biến
có khả năng phân hủy cellulose. Trong dữ liệu cũng chỉ ra nhiều loài thuộc hai bộ có khả
năng phân huỷ cellulose nhƣ C. acetobutylicum (32 ORF), C. cellulolyticum (40 ORF), C.
cellulovorans (46 ORF), C. papyrosolvens (53 ORF), B.cellulosilyticus (156 ORF).
Hình 3.5. Mười hai bộ vi khuẩn chiếm ưu thế nhất trong ruột mối Coptotermes gestroi. ORF
được chú thích dựa vào CSDL NR.
3.4. GENE MÃ HOÁ ENZYME THUỶ PHÂN CELLULOSE CỦA VI SINH VẬT RUỘT MỐI
Coptotermes gestroi
3.4.1. Chú thích chức năng của DNA đa hệ gene
Toàn bộ các trình tự amino acid tƣơng ứng của 125.431 ORF trong dữ liệu DNA đa
hệ gene vi sinh vật ruột mối C. gestroi đƣợc chú thích bằng Blastp dựa vào CSDL eggNOG,
COG và KEGG. Các ORF này đƣợc chú thích chức năng sâu hơn dựa trên CSDL COG và
KEGG. Dựa vào COG, 7.428 ORF đƣợc chú thích liên quan đến quá trình chuyển hóa
carbohydrate gồm 210 nhóm COG. Trong đó, 518 ORF thuộc các nhóm COG1472,
COG2723, COG1904, COG3459, COG1486, COG1363, COG2730,
COG2273, COG3405 liên quan trực tiếp đến sự phân hủy cellulose. Dựa vào KEGG, kết quả
chú thích cũng thể hiện các ORF liên quan đến các con đƣờng chuyển hóa carbohydrate
chiếm tỷ lệ cao 12,28% (12.763/103.918 ORF) và cao hơn rất nhiều so với kết quả dự đoán
dựa vào CSDL KOG. Trong đó, 587 ORF mã hóa enzyme phân hủy lignocellulose gồm 316
ORF cellulase, 259 ORF hemicellulase và 12 ORF còn lại mã hóa pectatelyase và
pectinesterase .
15
3.4.2. Gene mã hóa enzyme phân hủy cellulose
Toàn bộ 316 ORF đƣợc chú thích (dựa vào CSDL KEGG) thuộc 11 họ GH khác
nhau liên quan trực tiếp đến sự thủy phân cellulose thể hiện tám chức năng 6-phosphoβglucosidase, licheninase, glucan endo-1,3-β-D-glucosidase, endoglucanase, cellulose 1,4βcellobiosidase, glucan 1,3- β-glucosidase và cellobiose phosphorylase (Bảng 3.5).
Bảng 3.5. Các ORF mã hóa cellulase của vi sinh vật sống trong ruột C. gestroi.
STT
Mã EC
Enzyme
ORF hoàn
thiện
ORF thiếu ORF thiếu ORRF thiếu Tổng
đầu 5’
đầu 3’
cả 2 đầu
số
1
6-phospho3.2.1.86 βglucosidase
19
20
15
6
60
2
3.2.1.21 β-glucosidase
29
40
55
87
211
3
cellobiose
2.4.1.20 phosphorylase
1
1
2
4
4
cellulose 1,43.2.1.91 βcellobiosidase
1
3
4
5
3.2.1.4 endoglucanase
12
31
5
8
6
6
3.2.1.58
glucan 1,3-βglucosidase
7
3.2.1.39
glucan endo-1,3-β-Dglucosidase
8
3.2.1.73 licheninase
0
0
2
0
2
Tổng
số
55
71
80
110
316
2
1
3
1
1
3.4.3. Lựa chọn ORF cellulase để biểu hiện
Trong số 316 ORF đƣợc chú thích mã hóa các enzyme tham gia thủy phân cellulose
có 55 ORF hoàn thiện, 71 ORF thiếu đầu 5’, 80 ORF thiếu đầu 3’ và 110 ORF thiếu cả hai
đầu 5’ và 3’ (Bảng 3.5). 55 ORF hoàn thiện gồm 19 ORF mã hóa 6-phospho-βglucosidase,
29 ORF mã hóa β-glucosidase, 5 ORF mã hóa endoglucanase và 2 ORF mã hóa glucan 1,3β-glucosidase. Đặc biệt, endoglucanase có rất nhiều ứng dụng trong công nghiệp. Do vậy,
trong nghiên cứu này, 5 ORF hoàn thiện đƣợc chú thích chức năng endoglucanase là những
trình tự chúng tôi đặc biệt quan tâm.
Từ tỷ lệ tƣơng đồng và giống của trình tự nucleotide và trình tự amino acid của 5
16
ORF, bƣớc đầu ORF GL0130684 đƣợc lựa chọn. Để chắc chắn về dự đoán ORF GL0130684
mã hoá endoglucanase, chúng tôi đã xây dựng cây phân loại để xem xét mỗi quan hệ của
trình tự amino acid ORF GL0130684 với các trình tự amino acid tƣơng ứng của NCBI. Kết
quả cho thấy, trình tự amino acid của GL0130684 thể hiện hoạt tính endoglucanase rõ ràng
(Hình 3.6) và thống nhất khi so sánh với các cơ sở dữ liệu COG, pfarm, PRK thông qua
Blastp của NCBI. Hơn nữa, phần mềm Phyre 2 đã đƣa ra cấu trúc 3D và chức năng
endoglucanase của trình tự amino acid của ORF GL0130684. Với những đặc điểm đã phân
tích cho thấy ORF GL0130684 đƣợc dự đoán đúng chức năng endoglucanase với tỷ lệ cao,
do đó ORF GL0130684 đƣợc lựa chọn để phân lập, tách dòng và biểu hiện. Chúng tôi kí
hiệu ORF GL0130684 là gen egc.
Escherichia-
coli-endoglucanase-(WP001592871)
41
Escherichia-
61
Escherichia-
100
coli-endoglucanase-(WP021532881)
coli-endoglucanase-(WP021527136)
Enterobacteriaceae-endoglucanase-III-(WP001295222)
40
Citrobacter-
94
Enterobacteriaceae-endoglucanase-III-(WP000783609)
farmeri-endoglucanase-(GAL50460)
100
Citrobacter-
koseri-endoglucanase-III-(WP012135658)
65
Salmonella-enterica-endoglucanase-(WP 024145245)
ericagi-endoglucanase-
100
Enterobacteriaceae-bacterium-FGI57-endoglucanaseY(WP015962575)
EGCGL0130684
gnolyticus-endoglucanase-III-(WP
(WP024147272)
96
013364269)
66
Yokenella-regensburgei-endoglucanase-III(WP006817672)
Yokenella-regensburgei-ATCC49455-endoglucanase(KFD24598)
100
0.05
Hình 3.6. Phân tích cây phát sinh loài giữa EGC và các endogucanase dựa trên sự tương
đồng về trịnh tự amino acid. 0,05 là chỉ số thể hiện sự khác nhau giữa 2 nhóm là 5 nucleotide/100
amino acid; các con số trên các nhánh là chỉ số Bootstrap. Tên các loài trên cây gồm: tên loài và mã
số gene.
3.5. TÁCH DÒNG GENE egc
3.5.1. Trình tự ORF GL0130684
Gene egc chúng tôi lựa chọn có chiều dài 1107 bp. Phân tích đặc điểm của trình tự
amino acid bằng chƣơng trình Expasy trực tuyến cho thấy, trình tự amino acid của gene egc
chứa một đoạn tín hiệu tiết dài 22 amino acid (từ amino acid đầu tiên cho đến amino acid
thứ 22), tƣơng ứng với độ dài trình tự nucleotide là 66 bp (từ đầu gene cho đến bp thứ 66).
17
3.5.2. Khuếch đại gene egc
Để khuếch đại đƣợc gene egc từ khuôn DNA đa hệ gene vi sinh vật sống trong ruột
mối với xác suất cao nhất, hai mồi xuôi GL0130684f1, GL0130684f2 và một mồi ngƣợc
GL0130684r đã đƣợc sử dụng. Trong đó, mồi xuôi GL0130684f1 khuếch đại gene egc từ đầu
gen (cả trình tự mã hoá tín hiệu tiết) và mồi xuôi GL0130684f2 khuếch đại gene egc từ vị trí
ngay sau trình tự mã hoá tín hiệu tiết (không mang trình tự mã hoá tín hiệu tiết).
Trong khi khuếch đại gene egc, Vent DNA polymerase đã đƣợc sử dụng. Cả ba mồi đều
đƣợc bổ sung vào cùng một phản ứng PCR.
Một đoạn DNA kích thƣớc lớn hơn 1 kb đƣợc khuếch đại (Hình 3.7) tƣơng đƣơng
với kích thƣớc của gene egc mong muốn. Tuy nhiên, đoạn DNA khuếch đại đƣợc với số
lƣợng ít (băng DNA không rõ ràng), do đó, để thuận tiện cho việc tách dòng, sản phẩm
khuếch đại có đoạn DNA mong muốn đƣợc sử dụng làm khuôn để khuếch đại đoạn DNA
đó lên với số lƣợng lớn hơn. Kết quả đúng nhƣ dƣ đoán, lƣợng DNA mong muốn đƣợc
khuếch đại lên với số lƣợng lớn hơn (Hình 3.10). Đoạn DNA đƣợc thu hồi bằng bộ kit tinh
chế DNA QIAQuick gel extraction để ghép nối vào vector tách dòng.
kb
1
M
(-)
M
( -) 2
10
1,5
1,0
Sản phẩm PCR
Hình 3.7. Điện di đồ sản phẩm khuếch đại gene egc trên gel agarose 0,8%. ĐC (-): đối chứng
âm; ĐC 1: sản phẩm PCR lần thứ nhất từ khuôn DNA đa hệ gene vi sinh vật trong ruột mối; ĐC 2:
sản phẩm PCR lần thứ hai từ khuôn là sản phẩm PCR lần thứ nhất; ĐC M; thang chuẩn DNA 1 kb
(Fermentas).
3.5.3. Ghép nối sản phẩm khuếch đại gene egc vào vector tách dòng pJET1.2 blunt
Trong nghiên cứu này, vector pJET1.2/blunt đƣợc sử dụng để tách dòng gene egc.
Tỷ lệ sản phẩm PCR và vector pJET1 trong phản ứng ghép nối gene là 3:1. Hỗn hợp phản
ứng đƣợc ủ ở nhiệt độ thích hợp. Sản phẩm của phản ứng ghép nối sẽ đƣợc biến nạp vào tế
bào E. coli DH10b bằng phƣơng pháp sốc nhiệt để chọn dòng mang plasmid mong muốn.
3.5.4. Biến nạp sản phẩm ghép nối vào tế bào E. coli DH10b
Plasmid tái tổ hợp pJET-egc đƣợc biến nạp vào tế bào vi khuẩn E. coli DH10b bằng
phƣơng pháp sốc nhiệt.
18
Các dòng tế bào biến nạp đƣợc nuôi cấy trên môi trƣờng LBA ở 37oC và lắc qua
đêm để tế bào sinh trƣởng và tổng hợp số lƣợng lớn. Những khuẩn lạc mọc trên đĩa môi
trƣờng LBA chính là các dòng tế bào E. coli DH10b mang plasmid tái tổ hợp pJET-egc. Bốn
dòng khuẩn lạc của sản phẩm biến nạp đƣợc lựa chọn tách chiết DNA plasmid đều chứa
plasmid có kích thƣớc đồng nhất và lớn hơn kích thƣớc của dòng pJET1.2/blunt chỉ mang
một đoạn DNA ngắn không đáng kế.
3.5.5. Cắt kiểm tra plasmid tái tổ hợp bằng enzyme hạn chế
M HindIII XbaI
16
EcoRV SalI
XhoI
XbaI
858 511
352
377
BglII 384,
BglII
HindIII,
340
wegc Eco47
624
R PlacUV5
Bla (ApR)
SalI BglII EcoRV
kb
4,5
Sản phẩm
cắt
2,5
pJETwegc
4,2 Kb
2782
XhoI
1
Sản phẩm
cắt
Rep(pMB1)
A
B
Hình 3.8. A. Vị trí cắt của các enzyme cắt kiểm tra plasmid tái tổ hợp trên gene egc và trên
vector pJET1.2/blunt. B. Điện di đồ sản phẩm cắt plasmid tái tổ bằng sáu enzyme hạn chế HindIII,
SbalI, XhoI, SalI, BglII và EcoRV. Các ĐC HindIII, XbaI, XhoI, SalI, BglII và EcoRV tương ứng là sản
phẩm cắt plasmid bằng enzyme HindIII, XbaI, XhoI, SalI, BglII và EcoRV.
Sáu enzyme hạn chế gồm BglII, SalI, EcoRV, XhoI, XbaI và HindIII đƣợc sử dụng
để cắt kiểm tra các plasmid tái tổ hợp. BglII, XhoI, XbaI và HindIII cắt plasmid tái tổ hợp
trên vector pJET1.2/blunt và không cắt trên gene egc. Kết quả cắt kiểm tra plasmid tái tổ hợp
đúng nhƣ tính toán lý thuyết (Hình 3.8). Nhƣ vậy, dòng plasmid chúng tôi lựa chọn cắt kiểm
tra chính là pJET-egc mong muốn.
3.5.6. Phân tích trình tự gene egc phân lập đƣợc từ DNA đa hệ gene vi sinh vật ruột
mối
Trình tự nucleotide của gene egc phân lập đƣợc từ DNA đa hệ gene vi sinh vật mối
chỉ khác với trình tự của ORF GL013068 một nucelotide ở vi trí 588/1104 Điều ngẫu nhiên
là nucleotide sai khác này lại không làm thay đổi amino acid tƣơng ứng. Nghĩa là trình tự
amino acid của đoạn DNA phân lập đƣợc và của ORF GL013068 giống hệt nhau. Gene egc
này phân lập đƣợc có cả trình tự mã hoá tín hiệu tiết nên đƣợc đặt tên là gene wegc để phân
biệt với gene egc không có tính hiệu tiết. Nhƣ vậy, plasmid tái tổ hợp chúng tôi có đƣợc là
pJET-wegc. Điều đó chứng tỏ, trong ba mồi sử dụng để khuếch đại gene egc thì cặp mồi
GL0130684f1 và GL0130684r đã khuếch đại đƣợc wegc. Trình tự tín hiệu tiết trong gene
19
wegc sẽ đƣợc thay thế bằng trình tự tín hiệu tiết của protein pelB có trong vector biểu hiện
pET22b+ , do đó, trình tự tín hiệu tiết cần phải loại bỏ khỏi gene wegc. Để loại bỏ trình tự tín
hiệu tiết này khỏi gene wegc, chúng tôi sử dụng cặp mồi GL0130684f2 và GL0130684r để
khuếch đại đúng đoạn DNA đích không có trình tự tín hiệu tiết từ khuôn plasmid tái tổ hợp
pJET-wegc.
3.5.7. Khuếch đại gene egc không chứa tín hiệu tiết từ khuôn pJET-wegc
Ở nhiệt độ bắt cặp giữa mồi và khuôn là 50oC, trong 30 chu kỳ PCR, cặp mồi đặc
hiệu GL0130684f2 và GL0130684r đã khuếch đại hiệu quả gene egc không mang tín hiệu
tiết có kích thƣớc bé hơn wegc từ khuôn pJET-wegc (Hình 3.9). Gene egc này sẽ đƣợc tinh
chế bằng bộ kit QIAQuick gel và ghép nối vào vector
Kb
1
2
M
biểu hiện pET22b(+).
10
1,5
1,0
wegc
egc
Hình 3.9. Điện di đồ sản phẩm PCR khuếch đại
gene egc từ khuôn là gene wegc trên gel agarose 0,
8%. ĐC 1: gene wegc; ĐC 2: gene egc được khuếch
đại từ gene wegc; ĐC M: thang chuẩn DNA 1 kb (Fermentas).
3.5.8. Thiết kế vector biểu hiện gene egc
3.5.8.1. Ghép nối gene egc vào vector biểu hiện
Trong nghiên cứu này, vector pET22b(+) đƣợc sử dụng để biểu hiện gene egc.
pET22b(+) là vector phù hợp cho biểu hiện protein tái tổ hợp trong vật chủ E. coli. Cả gene
egc và vector pET22b(+) đều đƣợc xử lý bằng cặp enzyme hạn chế XhoI và NcoI. Sản phẩm
cắt là gene egc kích thƣớc 1041 bp và pET22b(+) dạng thẳng kích thƣớc 5431 bp đều có hai
đầu dính tƣơng ứng giống nhau. Đặc điểm này giúp cho quá trình ghép nối chúng với nhau
hiệu quả cao. Sản phẩm ghép nối pET22-egc sẽ đƣợc biến nạp vào tế bào E.coli DH10B
bằng sốc nhiệt để chọn dòng mong muốn.
3.5.8.2. Cắt kiểm tra plasmid tái tổ hợp pET22-egc
Plasmid tái tổ hợp pET22-egc chỉ có một trình tự cắt duy nhất của XhoI và của NcoI ở hai
đầu của gene egc. Khi sử dụng cặp enzyme này để cắt kiểm tra pET22-egc sẽ tạo ra hai đoạn
DNA, đoạn thứ nhất chính là gene egc kích thƣớc 1041 bp và đoạn thứ hai chính là vector
pET22b(+) kích thƣớc 5431 bp. Kết quả cắt kiểm tra bốn dòng plasmid đều tạo ra hai đoạn
DNA có kích đúng bằng kích thƣớc của gene egc và pET22b(+) (Hình 3.10). Nhƣ vậy,
20
- Xem thêm -