Đăng ký Đăng nhập
Trang chủ Xây dựng cơ sở dữ liệu ssrs (simple sequence repeats) từ ests (expressed sequenc...

Tài liệu Xây dựng cơ sở dữ liệu ssrs (simple sequence repeats) từ ests (expressed sequence tags) của cây dứa (ananas comosus)

.PDF
83
84
50

Mô tả:

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH BỘ MÔN CÔNG NGHỆ SINH HỌC ***000*** TRẦN NGUYỄN MINH ĐĂNG XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) Thành phố Hồ Chí Minh Tháng 09/2006 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH BỘ MÔN CÔNG NGHỆ SINH HỌC ***000*** XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) Luận văn kỹ sƣ Chuyên ngành: Công Nghệ Sinh Học Giáo viên hƣớng dẫn: Sinh viên thực hiện: TS. TRẦN THỊ DUNG TRẦN NGUYỄN MINH ĐĂNG Cử Nhân LƢU PHÚC LỢI Khóa: 2002-2006 Thành phố Hồ Chí Minh Tháng 09/2006 MINISTRY OF EDUCATION AND TRAINING NONG LAM UNIVERSITY, HCMC DEPARTMENT OF BIOTECHNOLOGY ***000*** BUILDING SSRs (SIMPLE SEQUENCE REPEATS) DATABASE FROM ESTs (EXPRESSED SEQUENCE TAGS) OF PINEAPPLE (Ananas comosus) Graduation thesis Major: Biotechnology Professor Student PhD. Tran Thi Dung TRAN NGUYEN MINH DANG BSc. LƢU PHÚC LỢI Term: 2002 - 2006 Ho Chi Minh City 09/2006 LỜI CẢM ƠN XIN CHÂN THÀNH CẢM ƠN Ban Giám Hiệu trƣờng Đại học Nông Lâm Tp. Hồ Chí Minh đã tạo mọi điều kiện cho tôi trong suốt thời gian học tập. Các thầy cô trong bộ môn Công Nghệ Sinh Học cùng các thầy cô đã trực tiếp giảng dạy trong suốt bốn năm qua. Xin bày tỏ lòng biết ơn sâu sắc đến:  TS. Trần Thị Dung  Cử Nhân Lƣu Phúc Lợi Đã tận tụy hƣớng dẫn, truyền đạt kiến thức giúp cho tôi hoàn thành khóa luận này. Cùng toàn thể lớp Công Nghệ Sinh Học 28 thân thiện đã hỗ trợ, giúp đỡ và động viên tôi trong suốt thời gian làm đề tài. Thành kính ghi ơn ba mẹ cùng những ngƣời thân trong gia đình luôn tạo điều kiện và động viên con trong suốt quá trình học tập tại trƣờng. Tháng 08 năm 2006 Trần Nguyễn Minh Đăng iv TÓM TẮT KHOÁ LUẬN TRẦN NGUYỄN MINH ĐĂNG, đại học Nông Lâm TP. Hồ Chí Minh, tháng 08/2006. “XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus)” Hội đồng hướng dẫn:  TS. Trần Thị Dung  Cử Nhân. Lưu Phúc Lợi Khóa luận được thực hiện tại bộ môn Công Nghệ Sinh Học, trường đại học Nông Lâm TP. Hồ Chí Minh, trong khoảng thời gian từ tháng 3/2006 đến 8/2006. Trong những năm qua sinh học không ngừng phát triển, đã tạo ra những kho dữ liệu rất lớn về trình tự gene, protein,... của thực vật, động vật,… Và với các thành tựu vốn có của công nghệ thông tin, những trình tự gene này đã và đang được lưu trữ trong cơ sở dữ liệu sinh học lớn như NCBI, EMBL, DDBj,…Vì các cơ sở dữ liệu này quá lớn và chứa rất nhiều thông tin khác nhau, không tập trung thành từng gene cụ thể nên khó có thể thực hiện việc truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt, trong đó có phương pháp microsatellite. Do vậy, mục tiêu của chúng tôi là tiến hành xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa Ananas comosus được lấy ở cơ sở dữ liệu sinh học NCBI. Để đạt được mục tiêu trên, khóa luận cần đảm bảo thực hiện nội dung như sau:  Dùng Perl script để thu nhận trình tự các nucleotide của gene từ trang cơ sở dữ liệu GenBank NCBI.  Tìm và tách các đoạn microsatellite có thể có trong mỗi đoạn gen.  Tìm hiểu về mô hình dữ liệu quan hệ, sử dụng mô hình này vào việc lưu trữ dữ liệu các trình tự nucleotide và trình tự SSRs của Ananas comosus, và tạo cơ sở dữ liệu chứa những trình tự này. Sau đó chuyển các dữ liệu này vào cơ sở dữ liệu chính.  Kết hợp các phần mềm quản lý cơ sở dữ liệu và phần mềm tạo web, thiết kế trang web chia sẻ thông tin với người dùng. v MỤC LỤC Nội dung Trang LỜI CẢM ƠN ...............................................................................................................iv TÓM TẮT KHOÁ LUẬN .............................................................................................v DANH SÁCH CÁC HÌNH ............................................................................................x DANH SÁCH CÁC BẢNG ..........................................................................................xi DANH SÁCH CÁC TỪ VIẾT TẮT .......................................................................... xii Phần 1. Mở đầu ..............................................................................................................1 1.1. Đặt vấn đề ................................................................................................................ 1 1.1.1. Sơ lược về sinh – tin học ...........................................................................................1 1.1.2. Sơ lược về cây dứa .....................................................................................................2 1.1.3. Sơ lược về phương pháp Microsatellite...................................................................2 1.2. Mục tiêu của khóa luận ......................................................................................... 3 Phần 2. Tổng quan tài liệu ............................................................................................4 2.1. Giới thiệu về cây dứa ............................................................................................. 4 2.1.1. Vị trí phân loại ............................................................................................................4 2.1.2. Nguồn gốc và phân bố ...............................................................................................4 2.1.3. Đặc điểm hình thái .....................................................................................................5 2.1.3.1. Rễ ................................................................................................................. 5 2.1.3.2. Thân ............................................................................................................. 5 2.1.3.3. Lá ................................................................................................................. 5 2.1.3.4. Hoa ............................................................................................................... 5 2.1.3.5. Quả ............................................................................................................... 6 2.3.1.6. Hạt ................................................................................................................ 6 2.1.4. Đặc điểm trồng trọt ....................................................................................................6 2.1.4.1. Yếu tố khí hậu .............................................................................................. 6 2.1.4.2. Yếu tố đất đai ............................................................................................... 6 2.1.4.3. Yếu tố sinh vật ............................................................................................. 7 2.1.5. Giá trị kinh tế và sử dụng ..........................................................................................7 2.1.6. Các giống trồng ..........................................................................................................8 2.1.6.1. Nhóm Cayenne............................................................................................. 8 2.1.6.2. Nhóm Queen ................................................................................................ 9 2.1.6.3. Nhóm Spanish .............................................................................................. 9 vi 2.1.6.4. Nhóm Abacaxi ........................................................................................... 10 2.1.6.5. Các giống trồng trong nước ....................................................................... 11 2.1.7. Tình hình phát triển của cây dứa trong và ngoài nước ........................................11 2.2. Các Marker phân tử ............................................................................................ 12 2.2.1. Isozymes ....................................................................................................................12 2.2.2. ALP ............................................................................................................................12 2.2.3. AFLP ..........................................................................................................................12 2.2.4. RAPD .........................................................................................................................13 2.2.5. SSCP ..........................................................................................................................14 2.2.6. SNP ............................................................................................................................14 2.2.7. SSR.............................................................................................................................15 2.2.8. Kỹ thuật STS và SCARP ..................................................................................15 2.2.9. RFLP ..........................................................................................................................15 2.3. Chi tiết về microsatellite ..................................................................................... 16 2.3.1. Định nghĩa .................................................................................................................16 2.3.2. Các phương pháp phát hiện microsatellite ............................................................16 2.3.2.1. Phương pháp lai ......................................................................................... 17 2.3.2.2. Phương pháp PCR ...................................................................................... 17 2.3.3. Vai trò của microsatellite ........................................................................................18 2.3.4. Ứng dụng ...................................................................................................................19 2.4. EST ........................................................................................................................ 19 2.4.1. Sơ lược về EST .........................................................................................................19 2.4.2. Nguồn gốc của EST .................................................................................................20 2.5. Cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu ......................................................... 20 2.5.1. Nguyên nhân ra đời của mô hình quan hệ .............................................................20 2.5.2. Cơ sở dữ liệu và hệ quản trị cơ sở dữ liệ ..........................................................21 2.5.2.1. Định nghĩa cơ sở dữ liệu ............................................................................ 21 2.5.2.2. Hệ quản trị cơ sở dữ liệu ............................................................................ 21 2.5.3. Các mô hình dữ liệu .................................................................................................23 2.5.3.1. Định nghĩa .................................................................................................. 23 2.5.3.2. So sánh các mô hình dữ liệu ...................................................................... 23 2.5.4. Người dùng ...............................................................................................................24 2.5.5. Cơ sở dữ liệu quan hệ và hệ tập tin theo lối cũ ....................................................25 2.5.5.1. Vấn đề 1: Cấu trúc logic và cấu trúc vật lý ................................................ 25 vii 2.5.5.2. Vấn đề 2: Dư thừa dữ liệu .......................................................................... 25 2.5.5.3. Vấn đề 3: Sự khai thác dữ liệu của người sử dụng .................................... 25 2.6. Internet và Web ................................................................................................... 26 2.6.1. Sơ lược về Internet ...................................................................................................26 2.6.1.1. Tóm lược lịch sử phát triển ........................................................................ 26 2.6.1.2. Tổng quát về Internet ................................................................................. 26 2.6.2. Các dịch vụ được cung cấp trên Internet ...............................................................28 2.6.2.1. Phân loại khối thông tin ............................................................................. 28 2.6.2.2. Các dịch vụ cơ bản ..................................................................................... 28 2.6.3. Tích hợp cơ sở dự liệu với web ..............................................................................28 2.7. Ngôn ngữ lập trình Perl và Javascript .............................................................. 28 2.7.1. Ngôn ngữ Perl ...........................................................................................................28 2.7.1.1. Tóm tắt lịch sử phát triển ........................................................................... 28 2.7.1.2. Ứng dụng.................................................................................................... 29 2.7.1.3. Một số module của Perl thường được sử dụng .......................................... 29 2.7.2. Ngôn ngữ Javascript.................................................................................................30 2.7.2.1. Định nghĩa Javascript ................................................................................. 31 2.7.2.2. Javascript có thể làm gì? ............................................................................ 31 2.7.2.3. Ưu và nhược điểm của Javascript .............................................................. 31 2.8. Cơ sở dữ liệu sinh học ......................................................................................... 32 2.8.1. NCBI ..........................................................................................................................32 2.8.1.1. Vài nét về NCBI......................................................................................... 32 2.8.1.2. Một số cơ sở dữ liệu trong NCBI............................................................... 33 2.8.1.3. Một số công cụ trong NCBI ....................................................................... 33 Phần 3. Phƣơng pháp và chƣơng trình sử dụng .......................................................35 3.1. Các chƣơng trình và ngôn ngữ lập trình đƣợc sử dụng .................................. 35 3.1.1. Hệ điều hành .............................................................................................................35 3.1.2. Các chương trình phân tích trình tự .......................................................................35 3.1.2.1. Chương trình so sánh trình tự ClustalW .................................................... 35 3.1.2.2. Chương trình tìm kiếm các trình tự tương đồng – BLAST ....................... 36 3.1.2.3. Hệ quả trị CSDL quan hệ MySQL ............................................................. 36 3.1.2.4. Apache web Server .................................................................................... 37 3.2. Thu nhận trình tự SSRs ...................................................................................... 38 3.2.1. Thu thập và chọn lọc dữ liệu...................................................................................40 viii 3.2.2. Thu nhận trình tự SSR .............................................................................................41 3.3. Xây dựng CSDL, công cụ để giúp ngƣời dùng có thể khai thác tốt dữ liệu. .. 44 3.3.1. Xây dựng cơ sở dữ liệu ............................................................................................44 3.3.1.1. Tạo bảng chứa dữ liệu ................................................................................ 44 3.3.1.2. Xây dựng mối quan hệ ............................................................................... 46 3.3.1.3. Nhập dữ liệu vào bảng ............................................................................... 47 3.4. Thiết kế giao diện web để truy xuất thông tin tại cơ sở dữ liệu ...................... 47 3.5. Tích hợp các công cụ sinh học vào trang web ................................................... 48 Phần 4. Kết quả và thảo luận .....................................................................................49 4.1. Kết quả thu nhận trình tự microsatellite .......................................................... 49 4.1.1. Kết quả thu nhận trình tự của Ananas comosus....................................................49 4.1.2. Kết quả thu nhận trình tự SSRs ..............................................................................50 4.2. Xây dựng CSDL, công cụ để giúp ngƣời dùng có thể khai thác tốt dữ liệu ... 51 4.2.1. Cơ sở dữ liệu trình tự Ananas comosus .................................................................51 4.2.2. Kết quả sau khi lập CSDL của trình tự microsatellite .........................................52 4.2.3. Mô hình quan hệ .......................................................................................................57 4.3. Trang web thể hiện thông tin cơ sở dữ liệu SSRs của Ananas comosus ......... 59 4.3.1. Trang chủ (HOME PAGE) .....................................................................................60 4.3.2. Trang thông tin về microsatellite (ABOUT SSRs PAGE) ..................................60 4.3.3. Trang thông tin về Ananas comosus (Ananas comosus PAGE) .........................60 4.3.4. Trang cơ sở dữ liệu ESTs (ESTs PAGE) ..............................................................61 4.3.5. Trang cơ sở dữ liệu SSRs (SSRs PAGE) ..............................................................62 4.3.6. Trang công cụ ...........................................................................................................64 4.3.6.1. Trang tích hợp công cụ để tìm kiếm SSR .................................................. 64 Phần 5. Kết luận và đề nghị ........................................................................................65 5.1. Kết luận ................................................................................................................ 65 5.2. Đề nghị .................................................................................................................. 65 Phần 6. Tài liệu tham khảo .........................................................................................66 ix DANH SÁCH CÁC HÌNH Hình Trang Hình 1. 1. Định nghĩa bioinformatics được mở rộng ...................................................... 2 Hình 1. 2. Tìm hiểu nguồn gốc dựa vào Microsatellite ................................................... 3 Hình 2. 1. Các giống dứa Natal Queen - Red Spanish – Cayenne ................................ 11 Hình 2. 2. Sơ đồ một hệ quản trị cơ sở dữ liệu.............................................................. 22 Hình 2. 3. So sánh cơ sở dữ liệu quan hệ và hệ tập tin theo lối cũ ............................... 25 Hình 2. 4. Tương tác giữa Perl script-DBI-DBD-và RBDMS ...................................... 30 Hình 2. 5. Tương quan giữa NCBI, NLM (National Library of Medicine và NIH) ..... 32 Hình 3. 1. Sơ đồ tóm tắt quá trình thu nhận trình tự SSR của Steven Schroeder ......... 38 Hình 3. 2. Kết quả thiết kế mồi cuối cùng của Steven Schroeder ................................. 39 Hình 3. 3. Sơ đồ tóm tắt quá trình thu nhận trình tự chính từ NCBI............................. 40 Hình 3. 4. Sơ đồ tóm tắt quá trình thu nhận trình tự microsatellite .............................. 41 Hình 3. 5. Nội dung tập tin “sequence31052006.txt” để thu nhận SSR........................ 42 Hình 3. 6. Nội dung tập tin “ssrout31052006.txt”......................................................... 42 Hình 3. 7. Nội dung tập tin “labdbout31052006.txt” .................................................... 43 Hình 3. 8. Nội dung tập tin “new_ids31052006.txt” ..................................................... 44 Hình 3. 9. Sơ đồ trình tự nhập dữ liệu vào bảng ........................................................... 47 Hình 3. 10. Trang web mẫu về trình tự microsatellite .................................................. 48 Hình 4. 1. Nội dung mẫu tin về Ananas comosus trên NCBI ....................................... 50 Hình 4. 2. Mô hình quan hệ giữa các bảng .................................................................... 57 Hình 4. 3. Sơ đồ cấu trúc của trang web ....................................................................... 59 Hình 4. 4. Nội dung trang thông tin về microsatellite ................................................... 60 Hình 4. 5. Nội dung trang thông tin về Ananas comosus .............................................. 61 Hình 4. 6. Trang cơ sở dữ liệu ESTs ............................................................................. 61 Hình 4. 7. Trang cơ sở dữ liệu SSRs (All) .................................................................... 62 Hình 4. 8. Trang cơ sở dữ liệu SSRs chọn lọc theo “Motif Length Group ID” ............ 63 Hình 4. 9. Trang web tìm kiếm trình tự microsatellite .................................................. 64 x DANH SÁCH CÁC BẢNG Bảng Trang Bảng 3. 1. Nội dung tblStrain ........................................................................................ 44 Bảng 3. 2. Nội dung tblMotifLengthGroup ................................................................... 45 Bảng 3. 3. Nội dung tblEST .......................................................................................... 45 Bảng 3. 4. Nội dung tblGenBank .................................................................................. 45 Bảng 3. 5. Nội dung tblSSR .......................................................................................... 46 Bảng 4. 1. Phân loại giống Ananas comosus tại NCBI ................................................. 49 Bảng 4. 2. Các trình tự SSRs trên cây dứa Ananas comosus có trong CSDL ............... 52 Bảng 4. 3. Ví dụ nhiều đoạn microsatellite trong một trình tự chính ............................ 57 Bảng 4. 4. Số trình tự trong cơ sở dữ liệu ..................................................................... 51 Bảng 4. 5. Các loại Motif trong cơ sở dữ liệu ............................................................... 62 xi DANH SÁCH CÁC TỪ VIẾT TẮT AFLP Amplified Fragment Length Polymorphism ALP Amplicon Length Polymorphism AP-PCR Arbitrary Primer- PCR ASP Active Server Page BLAST Basic Local Alignment Search Tool CGI Common Gateway Interface CSDL Cơ sở dữ liệu DBD Database Driver DBI Database Interface DNA deoxyribonucleic acid EST Expressed Sequence Tag GUI Graphical User Interface HTML Hypertext Markup Language HTTP Hypertext Transfer Protocol JSP Java Server Page NCBI the National Center for Biotechnology Information NIG the National Institute of Genetics NIH the National Institutes of Health NLM the Nation Library of Medicine Perl Practical Extraction and Report Language PHP Hypertext Preprocessior RAPD Random Amplififed Polymorphic DNA RDBMS Relational Database Management System RFLP Restriction Fragment Length Polymorphism SNP Single Nucleotide Polymorphism SSCP Single- Strand Conformation Polymorphism SSR Simple Sequence Repeats STS Sequence Tagged Site xii 1 Phần 1 MỞ ĐẦU 1.1. Đặt vấn đề 1.1.1. Sơ lƣợc về sinh – tin học Dữ liệu sinh học đang được thu nhận với tốc độ rất nhanh. Đến tháng 8 năm 2000, ngân hàng dữ liệu GENEBANK đã có 8.214.000 mục liên quan đến các trình tự sinh học DNA và cơ sở dữ liệu SWISS-PROT có 88.166 mục liên quan đến các trình tự protein. Trung bình những sơ sở dữ liệu đang tăng gấp đôi kích thước sau mỗi chu kỳ 15 tháng. Ngoài ra sự ra đời của vô số dự án nghiên cứu gen, xác định cấu trúc protein được mã hóa trong bộ gen... đã tạo ra một lượng lớn thông tin sinh học và thông tin này ngày càng đa dạng và phong phú. Do dữ liệu sinh học tăng trưởng mạnh mẽ nên công cụ tin học đã trở thành một phương tiện không thể thiếu trong phân tích xử lý dữ liệu sinh học. Công nghệ thông tin có thể quản lý nguồn dữ liệu khổng lồ, phân tích các dữ liệu đa dạng và luôn biến đổi trong thế giới tự nhiên. Ngành Sinh Tin học được xem là lĩnh vực nghiên cứu liên ngành nhằm kết hợp các kỹ thuật xử lý, tính toán và tổ chức thông tin bằng thiết bị tin học với các kỹ thuật, công cụ phổ biến trong ngành sinh học phân tử. Sinh tin học hiện đang là ngành nghiên cứu khoa học khá mới tại Việt Nam, ra đời với mục tiêu xây dựng các công cụ để tính toán , mô phỏng và đưa ra những chương trình máy tính phục vụ nghiên cứu sinh học. Nhưng định nghĩa trên chưa hoàn toàn đầy đủ, vì bioinformatics không chỉ đơn thuần là sự kết hợp giữa công nghệ sinh học và công nghệ thông tin, mà là sự kết hợp của nhiều ngành khoa học khác nhau như toán học, thống kê, khoa học máy tính, sinh học, hóa học, vật lý,… Ngoài ra, sự kết hợp này có sự đan xen tương hỗ với nhau. Vì thế, thành quả nghiên cứu mang lại của ngành học này không chỉ đóng góp cho sinh học mà còn cho các ngành khác. Như vậy, định nghĩa đầy đủ về Bioinformatics như sau: 2 SINH HỌC VẬT LÝ Bioinformatics HÓA HỌC TOÁN HỌC THỐNG KÊ KHOA HỌC MÁY TÍNH Hình 1. 1. Định nghĩa bioinformatics đƣợc mở rộng 1.1.2. Sơ lƣợc về cây dứa (Ananas comosus) Dứa là loại cây ăn trái nhiệt đới có giá trị dinh dưỡng cao, được tiêu thụ rộng rãi trên thị trường thế giới. Nước khóm còn có chứa men Bromelin có tác dụng phân hủy protein làm kích thích tiêu hóa. Ngoài ra, nước khóm còn cung cấp nhiều năng lượng, 1ml nước khóm cho 1 calori. Toàn bộ trái khóm có 60% phần ăn được. Phần lớn việc sản xuất khóm trên thế giới được dùng đóng hộp, các sản phẩm chính gồm có: Xắt khoanh vô hộp, nước khóm hộp. Các dạng khác là sy rô, rượu, nước giải khát, hay trích acid citric, men bromelin... Ngoài việc ăn tươi và đóng hộp, các phụ phẩm khác của khóm còn được sử dụng để: chế biến thức ăn gia súc; dệt vải; thân lá khóm cũng có thể dùng làm nguyên liệu chế biến bột giấy. 1.1.3. Sơ lƣợc về phƣơng pháp Microsatellite (SSR) Microsatellite là một công cụ đắc lực để giải quyết vấn đề như định danh và phát hiện những cây bị mất lai lịch đồng thời cũng đánh giá mức độ đa dạng di truyền của cây. Ngoài ra phương pháp này hỗ trợ rất lớn cho công tác chọn giống cây trồng. 3 Hình 1. 2. Tìm hiểu nguồn gốc dựa vào Microsatellite 1.2. Mục tiêu của khóa luận Các nhà nghiên cứu đã tìm ra rất nhiều trình tự của cây dứa, vì vậy cũng sẽ có rất nhiều đoạn Microsatellite trong những trình tự đó. Khi đó các cơ sở dữ liệu này quá lớn và chứa rất nhiều thông tin khác nhau, không tập trung thành từng gene cụ thể nên khó có thể thực hiện việc truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt. Việc xây dựng cơ sở dữ liệu Microsatellite để phục vụ cho việc tìm hiểu đa dạng và quan hệ di truyền; phân biệt loài và cá thể, lập bản đồ di truyền, xác định gen; chọn giống nhờ chỉ thị phân tử. Vì vậy, khóa luận “Xây dựng cơ sở dữ liệu SSRs (Simple Sequence Repeats) từ ESTs (Expressed Sequence Tags) của cây dứa (Ananas comosus)” được thực hiện với các mục tiêu lần lượt như sau: Thu nhận trình tự SSR của cây dứa từ CSDL ESTs được lấy tại trang chính NCBI. Hai là xây dựng CSDL và công cụ để giúp người dùng có thể khai thác tốt dữ liệu. Ba là dùng giao diện web để truy xuất thông tin về cơ sở dữ liệu và thực hiện việc chia sẻ thông tin đó, giúp cho việc tìm kiếm, quản lý thông tin được tốt hơn . Bốn là tích hợp vào trang web công cụ để tìm trình tự SSRs và một số công cụ sinh học khác. 4 Phần 2 TỔNG QUAN TÀI LIỆU 2.1. Giới thiệu về cây dứa [9, 19] 2.1.1. Vị trí phân loại Ngành : Magnoliophyta Lớp : Liliopsida Bộ : Poales Họ : Bromeliaceae Tên khoa học : Ananas comosus (Merr.) Tên tiếng Anh : Pineapple Tên thường gọi : Dứa, thơm, khóm 2.1.2. Nguồn gốc và phân bố Họ dứa gồm khoảng 50 chi và 1700 – 2000 loài, có nguồn gốc ở vùng nhiệt đới châu Mỹ, Braxin hay Paraguay, được Christopher Columbus phát hiện khi đến đảo Guadeloup năm 1943. Năm 1939, sau khi khảo sát Nam Mỹ, Baker và Collins cho rằng nguồn gốc cây dứa là ở một vùng rộng lớn nằm giữa vĩ tuyến Nam 15 o đến 30o, kinh tuyến Tây 40o đến 60o, chủ yếu là ở Nam Braxin, Bắc Argentina và Paraguay. (Claude, 1963) M. Bertoni lại khoanh vùng nguồn gốc dứa vào lưu vực Panama và Paragoay đã cho rằng cây dứa đã di cư từ đó lên phía bắc tới các bộ lạc Tupi – Guarani trong vùng. Và do đó, sự trao đổi giữa các bộ lạc đã đưa dứa tiến dần từng bước lên Trung Mỹ và vùng Caribe. Sự phổ biến của cây dứa gắn liền với sự mở rộng đường hàng hải trong quá trình thực dân hóa các thuộc địa. Đến thế kỷ 17, cây dứa đã phổ biến hầu hết ở các vùng nhiệt đới. Theo tài liệu của J. Lan (1928) và Nguyễn Công Thuận (1939) thì giống “dứa ta” đã có ở Việt Nam cách đây hơn 100 năm, có thể là do các thuyền buồm Tây Ban Nha, Bồ Đào Nha mang những giống mới trong đó có dứa vào nước ta. 5 Năm 1913, giống “dứa tây” đã được người Pháp đưa đến trồng đầu tiên. Năm 1939, giống dứa Cayen không gai được trồng đầu tiên ở Sơn Tây và về sau phát triển ra nhiều vùng ở nước ta. 2.1.3. Đặc điểm hình thái 2.1.3.1. Rễ Rễ dứa thuộc loại ăn nông, phần lớn do nhân giống bằng chồi nên mọc từ thân ra, nhỏ và phân nhiều nhánh. Rễ có thể ăn sâu 0,9m thường tập trung ở tầng đất 10cm – 20cm và phát triển rộng . Rễ gồm có rễ cái và rễ nhánh: mọc ra từ phôi hạt, rễ bất định: mọc ra từ các mầm rễ. 2.1.3.2. Thân Dứa là cây thân cỏ, chia làm 2 phần: một phần trên mặt đất, một phần dưới mặt đất. Phần trên thường bị các lá hình giải vây kín, xếp thành hình hoa thị ở gốc nên khó nhìn thấy. Thân trưởng thành dài 20cm – 30cm, đường kính 3cm – 7cm, trọng lượng 200g – 400g. Trung tâm của thân là một mô rỗng, mềm, chứa các chất dinh dưỡng có nhiều tinh bột ở giữa, nối tiếp là một lớp bó mạch có nhiều xơ và ngoài cùng được bao bọc bởi một biểu bì và gốc lá. 2.1.3.3. Lá Lá mọc trên thân cây theo hình xoắn ốc, chụm lại ở gốc thành hình phễu, trong có nước và chất hữu cơ bị phân hủy nên là môi trường sống thích hợp cho một số động vật nhỏ, thực vật (một số cây ăn thịt, giáp xác thấp, lưỡng thê…). Lá thường dày, không có cuống, hẹp ngang và dài. Mặt lá và lưng lá thường có một lớp phấn trắng hoặc một lớp sáp có tác dụng làm giảm độ bốc hơi nước cho lá. Thường thì có gai nhọn và cứng ở mép lá, tuy nhiên cũng có giống lá không có gai như Cayen. Gốc lá hút nước và chất dinh dưỡng thay cho rễ. 2.1.3.4. Hoa Hoa mẫu 3, tập hợp quanh trục lớn thành bông ngắn, chùm hay chùy. Với lá bắc màu tím ở dưới hoa gồm có ba lá đài, ba cánh hoa, sáu nhị đực 6 xếp thành hai vòng, một nhị cái có ba tâm bì và bầu dưới. cánh hoa màu xanh, đỏ tía, gốc có màu trắng nhạt, trên mặt cánh hoa có những vảy. Cả tràng hoa có dạng một ống dài hơi loe ở phía đầu, ở giữa lồi lên ba núm nhụy tím mờ của vòi nhụy. Ba tuyến mật thông ra gốc vài nhị cái qua các ống dẫn. Hoa dứa bất thụ. 2.1.3.5. Quả Quả dứa là loại quả kép do 100 quả - 150 quả nhỏ họp lại. Các giống khác nhau thì hình dạng quả và mắt quả (các quả nhỏ) cũng khác nhau: hình bầu dục, mắt quả lồi hay hình ống, mắt quả to hay hình chóp cụt, mắt quả rất to, phẳng. Phần ăn được gồm trục hoa và các lá bắc mọng nước, còn quả thật nằm trong các mắt dứa. 2.3.1.6. Hạt Cây dứa thường không có hạt nếu để thụ phấn tự do. Nếu đem lai các giống với nhau thì có thể có hạt. Hạt rất bé, tím đen, hình bóng tròn, dài độ 3mm, mỗi quả con chỉ có vài hạt. 2.1.4. Đặc điểm trồng trọt 2.1.4.1. Yếu tố khí hậu Cây dứa là cây ăn quả nhiệt đới thích hợp nhiệt độ cao, sinh trưởng phát triển tốt ở nhiệt độ 30oC – 31oC, nhiệt độ giới hạn dưới 5oC và trên 40oC (Claude và Tisseau, 1963). Nhiệt độ tối ưu 24oC – 27oC. Dứa rất mẫn cảm với nhệt độ thấp. Khi nhiệt độ hạ thấp đến 10oC, cây ngừng sinh trưởng, 5oC cây bị rét gây hại, 0oC bị rét cóng, nếu càng kéo dài thì càng thiệt hại nghiêm trọng. 2.1.4.2. Yếu tố đất đai Đất đai thích hợp cho trồng dứa phải tơi xốp, thoáng, có kết cấu hạt, không có nước đọng trong mùa mưa, như đất cát thịt, đất latercte trên đồi núi, đất phèn nếu được thoát nước tốt. Tỷ lệ Mn/Fe trong đất cao sẽ có hại cho dứa, để khắc phục cần phun sulfat sắt 1%. 7 Hiện nay, ở nước ta, cây dứa được trồng trên nhiều loại đất: đỏ bazan, đá vôi, đất đỏ váng… ở miền Bắc, đất phèn ở Đồng bằng sông Cửu Long, đất xám ở miền Đông Nam Bộ. Các giống khác nhau thì có yêu cầu về độ pH khác nhau. Cayen trơn có độ pH = 5,6 – 6,0, dứa tây nhóm Queen có thể sinh trưởng tốt trên đất phèn có độ pH <= 4,0. Dứa có yêu cầu về thành phần dinh dưỡng kho áng cần thiết cho cây như N, P, K, Ca, Mg, Bo, trong đó N và K là hai nguyên tố đóng vai trò chủ đạo, các nguyên tố vi lượng khác ít ảnh hưởng đến năng suất cây dứa. Lượng phân bón phụ thuộc vào điều kiện đất đai (tốt hay xấu), mật độ trồng trên một đơn vị diện tích và đặc tính của từng giống (chịu được phân bón nhiều hay ít). 2.1.4.3. Yếu tố sinh vật So với nhiều loại cây trồng khác, dứa ít bị côn trùng gây hại. Đối tượng sâu hại quan trọng và phổ biến hầu khắp ở các vùng trồng dứa trên thế giới là rệp sáp (Dysmicocus hoặc Pseudoeocus brevipes). Ngoài ra còn có một loại sâu non (Adoretus chinensis Thanber) phá hoại rễ, tạo vết thương cơ giới, tạo điều kiện cho tuyến trùng và nấm bệnh xâm nhập sinh sống và sinh sản, gây nên hiện tượng thối đen thân chồi dứa, làm lụi tàn vườn dứa. Các bệnh hại dứa như bệnh thối nõn (do nấm Phytophthora cinnamonic, nấm Phytophthora palmisora hay vi khuẩn Erwinia chrysanthemi), bệnh héo virus, bệnh luộc lá… cũng gây ra nhiều thiệt hại cho vùng trồng dứa. 2.1.5. Giá trị kinh tế và sử dụng Dứa ngoài để ăn tươi như một quả có giá trị dinh dưỡng cao, còn có thể chế biến thành nhiều loại sản phẩm, đa phần là làm đồ hộp xuất khẩu như dứa khoanh, dứa rẻ quạt, nước dứa làm rượu, làm dấm, bột dứa dùng trong giải khát. Trong 100g thịt quả có trung bình: Acid hữu cơ: 0,6 g (78% acid citric, còn lại là acid malic và acid khác). Vitamin A. 8 Vitamin C. Khoáng: Ca (16mg), P (11mg), Fe (0,3mg), Cu (0,07mg). Hydrat carbon: 13,7g. Nước: 85,5g Khi phân tích thành phần dinh dưỡng trong dứa Cayenne ở Hawaii cho thấy trong đường tổng số 11% - 13% là saccharose và còn lại là glucose và fructose. Trong quả dứa còn có men bromelin giúp cho việc tiêu hóa rất tốt. Người ta đã chiết và sản xuất bromelin dùng trong công nghiệp thực phẩm, thuộc da, vật liệu làm phim… Sản phẩm phụ của cây dứa để lên men dùng làm thức ăn gia súc. Sau khi thu hoạch quả, lá dứa dùng để lấy sợi (2% - 2,5% cellulose), sản phẩm dệt từ dứa bền, đẹp, chất lượng hơn cả đay. Thân cây dứa có chứa 12,5% tinh bột là nguyên liệu dùng để lên men rượu, làm môi trường nuôi cấy nấm và vi khuẩn. Dứa là cây ăn quả chịu hạn trồng ở vùng đồi có khả năng bảo vệ đất, chống xói mòn, một số giống dứa có thể trồng xen ở tầng thấp dưới tán một số cây ăn quả khác và cây công nghiệp, vừa có tác dụng phủ đất chống xói mòn, vừa tăng thu nhập. 2.1.6. Các giống trồng [20] 2.1.6.1. Nhóm Cayenne Được trồng rất phổ biến trên thế giới, đồng thời được ưa chuộng nhất để đóng hộp. Giống tiêu biểu là Smooth Cayenne (Cayenne lisse). Đặc tính đóng hộp: rất tốt. Ăn tươi: tốt. Xuất khẩu tươi: khá. Các đặc điểm về hình thái: Lá: gần như không gai, chỉ có một ít gai ở chóp lá. Chồi: ít chồi. Dạng trái: hình trụ, mắt dẹp, cạn. Trọng lượng trái: trung bình 2,5 kg.
- Xem thêm -

Tài liệu liên quan