Luận văn Xây dựng cơ sở dữ liệu SSRs (Simple Sequence Repeats) từ ESTs (Expressed Sequence Tags) của cây Dứa (Ananas comosus)
MỤC LỤC Nội dung Trang LỜI CẢM ƠN .iv TÓM TẮT KHOÁ LUẬN . v DANH SÁCH CÁC HÌNH . x DANH SÁCH CÁC BẢNG .xi DANH SÁCH CÁC TỪ VIẾT TẮT . xii Phần 1. Mở đầu . 1 1.1. Đặt vấn đề . 1 1.1.1. Sơ lược về sinh – tin học . 1 1.1.2. Sơ lược về cây dứa . 2 1.1.3. Sơ lược về phương pháp Microsatellite . 2 1.2. Mục tiêu của khóa luận . 3 Phần 2. Tổng quan tài liệu . 4 2.1. Giới thiệu về cây dứa . 4 2.1.1. Vị trí phân loại . 4 2.1.2. Nguồn gốc và phân bố . 4 2.1.3. Đặc điểm hình thái . 5 2.1.3.1. Rễ . 5 2.1.3.2. Thân . 5 2.1.3.3. Lá . 5 2.1.3.4. Hoa . 5 2.1.3.5. Quả . 6 2.3.1.6. Hạt . 6 2.1.4. Đặc điểm trồng trọt . 6 2.1.4.1. Yếu tố khí hậu . 6 2.1.4.2. Yếu tố đất đai . 6 2.1.4.3. Yếu tố sinh vật . 7 2.1.5. Giá trị kinh tế và sử dụng . 7 2.1.6. Các giống trồng . 8 2.1.6.1. Nhóm Cayenne . 8 2.1.6.2. Nhóm Queen . 9 2.1.6.3. Nhóm Spanish . 9 2.1.6.4. Nhóm Abacaxi . 10 2.1.6.5. Các giống trồng trong nước . 11 2.1.7. Tình hình phát triển của cây dứa trong và ngoài nước . 11 2.2. Các Marker phân tử . 12 2.2.1. Isozymes . 12 2.2.2. ALP . 12 2.2.3. AFLP . 12 2.2.4. RAPD . 13 2.2.5. SSCP . 14 2.2.6. SNP . 14 2.2.7. SSR . 15 2.2.8. Kỹ thuật STS và SCARP . 15 2.2.9. RFLP . 15 2.3. Chi tiết về microsatellite . 16 2.3.1. Định nghĩa . 16 2.3.2. Các phương pháp phát hiện microsatellite . 16 2.3.2.1. Phương pháp lai . 17 2.3.2.2. Phương pháp PCR . 17 2.3.3. Vai trò của microsatellite . 18 2.3.4. Ứng dụng . 19 2.4. EST . 19 2.4.1. Sơ lược về EST . 19 2.4.2. Nguồn gốc của EST . 20 2.5. Cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu . 20 2.5.1. Nguyên nhân ra đời của mô hình quan hệ . 20 2.5.2. Cơ sở dữ liệu và hệ quản trị cơ sở dữ liệ . 21 2.5.2.1. Định nghĩa cơ sở dữ liệu . 21 2.5.2.2. Hệ quản trị cơ sở dữ liệu . 21 2.5.3. Các mô hình dữ liệu . 23 2.5.3.1. Định nghĩa . 23 2.5.3.2. So sánh các mô hình dữ liệu . 23 2.5.4. Người dùng . 24 2.5.5. Cơ sở dữ liệu quan hệ và hệ tập tin theo lối cũ . 25 2.5.5.1. Vấn đề 1: Cấu trúc logic và cấu trúc vật lý . 25 2.5.5.2. Vấn đề 2: Dư thừa dữ liệu . 25 2.5.5.3. Vấn đề 3: Sự khai thác dữ liệu của người sử dụng . 25 2.6. Internet và Web . 26 2.6.1. Sơ lược về Internet . 26 2.6.1.1. Tóm lược lịch sử phát triển . 26 2.6.1.2. Tổng quát về Internet . 26 2.6.2. Các dịch vụ được cung cấp trên Internet . 28 2.6.2.1. Phân loại khối thông tin . 28 2.6.2.2. Các dịch vụ cơ bản . 28 2.6.3. Tích hợp cơ sở dự liệu với web . 28 2.7. Ngôn ngữ lập trình Perl và Javascript . 28 2.7.1. Ngôn ngữ Perl . 28 2.7.1.1. Tóm tắt lịch sử phát triển . 28 2.7.1.2. Ứng dụng. 29 2.7.1.3. Một số module của Perl thường được sử dụng . 29 2.7.2. Ngôn ngữ Javascript. 30 2.7.2.1. Định nghĩa Javascript . 31 2.7.2.2. Javascript có thể làm gì? . 31 2.7.2.3. Ưu và nhược điểm của Javascript . 31 2.8. Cơ sở dữ liệu sinh học . 32 2.8.1. NCBI . 32 2.8.1.1. Vài nét về NCBI . 32 2.8.1.2. Một số cơ sở dữ liệu trong NCBI . 33 2.8.1.3. Một số công cụ trong NCBI . 33 Phần 3. Phƣơng pháp và chƣơng trình sử dụng . 35 3.1. Các chƣơng trình và ngôn ngữ lập trình đƣợc sử dụng . 35 3.1.1. Hệ điều hành . 35 3.1.2. Các chương trình phân tích trình tự . 35 3.1.2.1. Chương trình so sánh trình tự ClustalW . 35 3.1.2.2. Chương trình tìm kiếm các trình tự tương đồng – BLAST . 36 3.1.2.3. Hệ quả trị CSDL quan hệ MySQL . 36 3.1.2.4. Apache web Server . 37 3.2. Thu nhận trình tự SSRs . 38 3.2.1. Thu thập và chọn lọc dữ liệu . 40 3.2.2. Thu nhận trình tự SSR . 41 3.3. Xây dựng CSDL, công cụ để giúp ngƣời dùng có thể khai thác tốt dữ liệu. . 44 3.3.1. Xây dựng cơ sở dữ liệu . 44 3.3.1.1. Tạo bảng chứa dữ liệu . 44 3.3.1.2. Xây dựng mối quan hệ . 46 3.3.1.3. Nhập dữ liệu vào bảng . 47 3.4. Thiết kế giao diện web để truy xuất thông tin tại cơ sở dữ liệu . 47 3.5. Tích hợp các công cụ sinh học vào trang web . 48 Phần 4. Kết quả và thảo luận . 49 4.1. Kết quả thu nhận trình tự microsatellite . 49 4.1.1. Kết quả thu nhận trình tự của Ananas comosus. 49 4.1.2. Kết quả thu nhận trình tự SSRs . 50 4.2. Xây dựng CSDL, công cụ để giúp ngƣời dùng có thể khai thác tốt dữ liệu . 51 4.2.1. Cơ sở dữ liệu trình tự Ananas comosus . 51 4.2.2. Kết quả sau khi lập CSDL của trình tự microsatellite . 52 4.2.3. Mô hình quan hệ . 57 4.3. Trang web thể hiện thông tin cơ sở dữ liệu SSRs của Ananas comosus . 59 4.3.1. Trang chủ (HOME PAGE) . 60 4.3.2. Trang thông tin về microsatellite (ABOUT SSRs PAGE) . 60 4.3.3. Trang thông tin về Ananas comosus (Ananas comosus PAGE) . 60 4.3.4. Trang cơ sở dữ liệu ESTs (ESTs PAGE) . 61 4.3.5. Trang cơ sở dữ liệu SSRs (SSRs PAGE) . 62 4.3.6. Trang công cụ . 64 4.3.6.1. Trang tích hợp công cụ để tìm kiếm SSR . 64 Phần 5. Kết luận và đề nghị . 65 5.1. Kết luận . 65 5.2. Đề nghị . 65 Phần 6. Tài liệu tham khảo . 66
Các file đính kèm theo tài liệu này:
- TRAN NGUYEN MINH DANG - 02126145.pdf