Luận án Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên spheciospongia vesparium thu nhận tại vùng biển miền trung, Việt Nam

Lời cảm ơn . i

Lời cam đoan . ii

MỤC LỤC. iii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT. vi

DANH MỤC CÁC BẢNG . viii

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ . ix

MỞ ĐẦU . 1

CHƯƠNG I. TỔNG QUAN . 3

1.1. Hải miên và vi sinh vật liên kết hải miên. 3 .

1.1.1. Giới thiệu về hải miên. 3 .

1.1.2. Vi sinh vật liên kết hải miên . 6

1.2. Sơ lược về metagenomics . 14

1.3. Chất ức chế protease (PIs) . 19

1.3.1. Sơ lược protease. 19 .

1.3.2. Chất ức chế protease và phân loại . 20 .

1.3.3. Cơ chế hoạt động của PIs. 25

1.3.4. Ứng dụng của chất ức chế protease . 28.

1.3.5. Tình hình nghiên cứu PIs từ vi sịnh vật liên kết với hải miên trong và

ngoài nước. 31

1.4. Hệ biểu hiện gen ngoại lai Escherichia coli và Pichia pastoris. 35

CHƯƠNG II. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU . 37

2.1. Vật liệu nghiên cứu . 37 .

2.1.1 Vật liệu . 37

2.1.2. Đối tượng nghiên cứu . . 39

2.1.3. Hóa chất . . 39

2.1.4. Máy móc thiết bị . 39 .

2.1.5. Dung dịch và môi trường sử dụng . 40 .

2.2. Phương pháp nghiên cứu . 42

2.2.1. Phương pháp tách DNA metagenome của VSV liên kết hải miên.

187 trang | Chia sẻ: honganh20 | Lượt xem: 672 | Lượt tải: 2Free

Bạn đang xem trước 20 trang tài liệu Luận án Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên spheciospongia vesparium thu nhận tại vùng biển miền trung, Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ng chỉ có nhóm A: Chỉnh sửa và xử lý RNA (RNA processing and modification) và nhóm B: Cấu trúc và động lực học của chất nhiễm sắc (Chromatin Structure and dyamics) là hầu như không có gen tương đồng. Hình 3.6. Phân loại chức năng gen trên cơ sở dữ liệu COG (Trục tung: Số gen, trục hoành: Nhóm chức năng gen) Kết quả phân loại nhóm chức năng enzyme cho thấy, dữ liệu gen chủ yếu thuộc vào nhóm GH (Glycoside Hydrolase) với khoảng gần 5000 gen, tiếp theo sau là hai nhóm Carbohydrate Esterase (CE) và Glycosyl Transferase (GT) với khoảng 2500 gen tương đồng. Số lượng đoạn trình tự thuộc nhóm chức năng Carbohydrate 62 Binding Module (CBM) thấp hơn 1 chút, khoảng 2000 trình tự. Các nhóm chức năng còn lại có số lượng gen tương đồng không đáng kể, khoảng dưới 1.000 trình tự gen (Hình 3.7). Hình 3.7.Phân nhóm chức năng của enzyme trên cơ sở dữ liệu CAZy (Trục tung: Số gen được chú giải, trục hoành: Nhóm chức năng gen) Kết quả phân loại trên cơ sở dữ liệu KEGG cho thấy gen dự đoán chủ yếu có chức năng liên quan đến con đường trao đổi chất (M: Metabolism); tiếp theo đó là nhóm quá trình phát triển tế bào (C: Cellular Process) và nhóm xử lý thông tin di truyền (G: Gentic Information Processing). Một phần nhỏ gen tham gia vào nhóm hệ thống sinh vật (O: Organismal Systems) và nhóm bệnh ở người (H: Human Diseases) (Hình 3.8). 63 Hình 3.8. Kết quả phân loại trên cơ sở dữ liệu KEGG (Trục tung: Nhóm chức năng gen, trục hoành: Số gen chú giải) G: Xử lý thông tin di truyền (Gentic Information Processing); C: Quá trình phát triển tế bào (Cellular Processes); M: Trao đổi chất (Metabolism); O: Hệ thống sinh vật (Organismal Systems); H: Bệnh ở người (Human Diseases) 64 3.3.4. Đa dạng sinh học vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 biển Quảng Trị Vùng siêu biến V4 của gen 16S rRNA vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 biển Quảng Trị đã được khuếch đại và gắn mã vạch (barcodes) (Phụ lục 6), sản phẩm PCR được kiểm tra trên agarose gel 1,8 % (Hình 3.9a), cho thấy kích thước tương ứng 300 bp như tính toán lý thuyết. Sản phẩm PCR sau khi được gắn mã vạch cũng được kiểm tra trên agarose gel 1,8 % (Hình 3.9b). (a) (b) Hình 3.9. Điện di đồ sản phẩm PCR trên gel agarose 1,8 % (a). Giếng 1: Sản phẩm PCR vùng V4 gen 16S rRNA của vi khuẩn liên kết hải miên Spheciospongia vesparium QT2; Giếng M: DNA marker 1 kb GeneRulerTM (b). Giếng 3. Sản phẩm PCR sau khi gắn mã vạch của kết hải miên Spheciospongia vesparium QT2; Giếng M: DNA marker 1 kb GeneRulerTM Sản phẩm PCR vùng siêu biến V4 gen 16S rRNA sau khi gắn mã vạch đã được giải trình tự, phân tích và so sánh với cơ sở dữ liệu Silva để xác định tính đa dạng của vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 ở các mức độ phân loại khác nhau. Với mẫu hải miên này, có 58,29 % reads (45.965 reads/ 78.849 reads) đạt yêu cầu sử dụng cho phân loại, trong đó 82,93 % thuộc giới (domain) vi khuẩn, 16,84% thuộc cổ khuẩn (Archaea) và 0,23 % không nhận dạng được (Bảng 3.5; Hình 3.10) 65 Bảng 3.5. Phân loại các reads 16S rRNA của hải miên Spheciospongia vesparium QT2 theo giới và ngành Giới Số reads % tổng số reads Tên ngành (Phylum) Số reads % tổng số reads Vi khuẩn (Bacteria) 38119 82,93 Thaumarchaeota 7742 16,84 Cổ khuẩn (Archaea) 7741 16,84 Acidobacteria 1905 4,14 Không xác định (Unclassified) 106 0,23 Actinobacteria 3225 7,02 Bacteroidetes 882 1,92 Chloroflexi 3747 8,15 Deferribacteres 61 0,13 Gemmatimonadetes 3417 7,43 Nitrospirae 839 1,82 Proteobacteria 23658 51,47 Spirochaetes 383 0,83 Unclassified 106 0,23 Đối với cổ khuẩn, chỉ nhận dạng được ngành Thaumarchaeota với tỉ lệ 16,84 % tổng số reads, là một trong những ngành chiếm ưu thế. Ngành Proteobacteria chiếm tới hơn nửa số reads nhận được, gần 51,5 %. Các ngành chiếm ưu thế khác trong cộng đồng vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 lần lượt là Chloroflexi (8,15 % reads), Gemmatimonadetes (7,43 % reads), Actinobacteria (7,06 % reads), Acidobacteria (4,14 % reads) và Nitrospirae (1,82 % reads). Các ngành còn lại mỗi ngành chỉ chiếm dưới 1 % tổng số reads. 66 Hình 3.10. Phân loại vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 theo giới (bên trái) và ngành (bên phải) Các reads tiếp tục được phân loại đến mức thấp hơn là lớp và bộ. Bảng 3.6 và Phụ lục 7 cho thấy 21 lớp vi khuẩn và 36 bộ đã được nhận dạng, trong đó 3 lớp chiếm đa số (Gammaproteobacteria 22,63 % reads), Marine_Group_I (15,55 % reads) và Betaproteobacteria (14,59 % reads). Có 0,23 % reads không được nhận dạng. Bảng 3.6. Phân loại các reads 16S rRNA vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 đến lớp và bộ Lớp % tổng số reads Bộ % tổng số reads Gammaproteobacteria 22,63 Oceanospirillales 15,30 Marine_Group_I 15,55 Nitrosomonadales 14,59 Betaproteobacteria 14,59 Nitrosopumilus 12,94 Deltaproteobacteria 8,41 Unclassified 7,88 Gemmatimonadetes 7,43 Acidimicrobiales 7,01 Acidimicrobiia 7,01 BD2-11_terrestrial_group 5,17 Alphaproteobacteria 4,56 Sh765B-TzT-29 4,87 Caldilineae 4,33 Caldilineales 4,33 Acidobacteria 3,56 BPC015 3,10 67 TK10 2,06 Alteromonadales 3,07 Cytophagia 1,92 Rhodospirillales 2,99 Nitrospira 1,82 PAUC43f_marine_benthic _group 2,26 Anaerolineae 1,34 Nitrospirales 1,82 Soil_Crenarchaeotic_ Group(SCG) 1,29 Order_II_Incertae_Sedis 1,70 JTB23 1,06 Anaerolineales 1,34 Spirochaetes 0,83 Pseudomonadales 1,27 Holophagae 0,58 Desulfurellales 1,23 SAR202_clade 0,27 GR-WP33-30 1,17 Unclassified 0,23 HOC36 1,04 SC3-20 0,21 Spirochaetales 0,83 JG30-KF-CM66 0,14 Desulfobacterales 0,83 Deferribacteres 0,13 Rhodobacterales 0,79 Chromatiales 0,62 TK85 0,58 E01-9C-26_marine_group 0,56 Xanthomonadales 0,37 Rickettsiales 0,34 Bdellovibrionales 0,30 32-21 0,27 Aeromonadales 0,26 Cytophagales 0,22 Acidobacteriales 0,18 Rhizobiales 0,17 MNG3 0,14 Deferribacterales 0,13 KI89A_clade 0,12 Kordiimonadales 0,12 68 Các bộ có tỉ lệ reads lớn hơn 10 % gồm Oceanospirillales (15,3 % reads), Nitrosomonadales (14,59 % reads) và Nitrosopumilus (12,94 % reads). Đối với phân loại mức bộ, có tới 7,88 % reads không được nhận dạng. Ở mức phân loại họ và chi, số lượng reads không được nhận dạng tăng lên rất nhiều, 58,53 % cho phân loại mức họ và tới 72,07 % cho phân loại đến chi. Bảng 3.7: Phân loại reads 16S rRNA vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 đến họ; chi Họ % tổng số reads Chi % tổng số reads Unclassified 58,53 Unclassified 72,07 Hahellaceae 14,33 Endozoicomonas 13,94 Sva0996_marine_group 6,47 Caldilinea 4,33 Caldilineaceae 4,33 Shewanella 3,07 Shewanellaceae 3,07 Nitrospira 1,82 Nitrospiraceae 1,82 Defluviicoccus 1,61 Rhodothermaceae 1,70 Pseudomonas 0,92 Rhodospirillaceae 1,61 Spirochaeta 0,38 Desulfurellaceae 1,23 Acinetobacter 0,35 Anaerolineaceae 1,12 Bdellovibrio 0,30 Pseudomonadaceae 0,92 Aeromonas 0,26 Nitrospinaceae 0,83 Granulosicoccus 0,23 OCS155_marine_group 0,55 Persicobacter 0,22 Rhodobacteraceae 0,38 Pseudovibrio 0,14 Spirochaetaceae 0,38 Ruegeria 0,13 Sinobacteraceae 0,38 Rhodovulum 0,11 Moraxellaceae 0,35 Pseudospirillum 0,11 TK34 0,34 Bdellovibrionaceae 0,29 Aeromonadaceae 0,26 Granulosicoccaceae 0,22 Flammeovirgaceae 0,22 69 Acidobacteriaceae 0,18 PAUC34f 0,13 Kordiimonadaceae 0,12 Oceanospirillaceae 0,11 SAR86_clade 0,10 Trong số 22 họ nhận dạng, chỉ có họ Hahellaceae chiếm tỉ lệ 14,33 % tổng số reads, các họ khác chiếm tỉ lệ reads trên 1 % gồm Sva0996_marine_group, một họ candidate (6,47 % reads), Caldilineaceae (4,33 % reads), Shewanellaceae (3,07 % reads), Nitrospiraceae (1,82 % reads), Rhodothermaceae (1,7 % reads), Rhodospirillaceae (1,61 %), Desulfurellaceae (1,23 %) và Anaerolineaceae (1,12 %). Tổng cộng có 16 chi vi khuẩn liên kết hải miên Spheciospongia vesparium QT2 được nhận dạng, trong đó chi Endozoicomonas chiếm đa số (14,94 % reads), chi Caldilinea chiếm 4,33 %, chi Shewanella 3,07 %, Nitrospira chiếm 1,82 % reads và Defluviicoccus chiếm 1,61 % reads. Các chi còn lại mỗi chi chỉ chiếm không tới 1 % tổng số reads (Bảng 3.7; Hình 3.11). Hình 3.11. Phân loại vi sinh vật liên kết hải miên Spheciospongia vespariumQT2 biển Quảng Trị theo chi Đã nhận dạng 10 ngành, 21 lớp, 36 bộ, 22 họ và 16 chi vi khuẩn liên kết với hải miên Spheciospongia vesparium QT2 biển Quảng Trị. 70 Sự đa dạng vi sinh vật liên kết hải miên biển được các nhà khoa học quan tâm nghiên cứu từ lâu do tầm quan trọng của chúng trong sinh thái hải miên cũng như khả năng sản sinh các chất có hoạt tính sinh học. Theo Li et al. (2006), vi khuẩn liên kết hải miên từ cùng một vị trí địa lý có sự đa dạng vi khuẩn trội khác nhau, chứng tỏ vi khuẩn liên kết hải miên là đặc hiệu vật chủ. Ví dụ, Proteobacteria cấu trúc α, β và γ chiếm đa số trong hải miên, và vi khuẩn có mối quan hệ phát sinh loài gần cũng được tìm thấy trong các loại hải miên khác nhau (Li et al., 2006). Kết quả nhận được đối với cộng đồng vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 cho thấy, các ngành chủ yếu cũng được tìm thấy trong các loài hải miên khác (Proteobacteria, Gemmatimonadetes, Acidobacteria, Actinobacteria, Chloroflexi). Riêng ngành Thaumarchaeota phát hiện khá nhiều trong loài hải miên này, chiếm tới 16,84 % tổng số reads. Các chi trong hải miên Spheciospongia vesparium QT2 cũng chủ yếu là từ α và γ proteobacteria (Defluviicoccus và Shewanella, tương ứng), kết quả này trùng với kết quả của Li et al (2006); Hardoim &Costa (2014). Ngoài ra, Gemmatimonadetes và Nitrospira cũng được tìm thấy ở Spheciospongia vesparium QT2 và một số loài hải miên Ircinia (Hardoim & Costa., 2014). Kết quả nghiên cứu bằng phương pháp 16S metagenomics cho thấy có 15 ngành vi sinh vật (có độ phong phú lớn hơn 0,1 %) đã được tìm thấy liên kết với các mẫu hải miên Việt Nam (Phụ lục 7). Trong khi các nghiên cứu dựa vào phương pháp phân lập truyền thống chỉ phân lập được một lượng số lượng hạn chế các vi sinh vật liên kết với hải miên, phương pháp nghiên cứu đa dạng vi sinh vật không qua nuôi cấy như 16S metagenomics cho phép phát hiện được nhiều vi sinh vật mới và chưa được phân lập trước đây. Các nghiên cứu dựa vào phân lập thường chỉ phân lập được một số các vi khuẩn thuộc một vài ngành phổ biến như Proteobacteria (α và γ - Proteobacteria), Bacteroidetes, Cyanobacteria, Firmicutes. Trong đó các Chi như Bacillus, Streptomyces, Pseudovibrio, Vibrio, . thường được phân lập lặp đi lặp lại từ nhiều mẫu môi trường khác nhau (đất, hải miên, trầm tích, ). Vì vậy những vi khuẩn này thường được biết đến như những vi khuẩn cỏ dại “weedy bacteria” bởi chúng có thể phát triển nhanh trên các môi trường phân lập. Tuy nhiên, bằng phương pháp 16S metagenomics chúng tôi đã phát hiện được nhiều 71 ngành hiếm được phân lập hoặc chưa được phân lập thông qua phương pháp nuôi cấy như Thaumarchaeota, Acidobacteria, Chloroflexi, Deferribacteres, Deinococcus-Thermus, Planctomycetes, Delta-proteobacteria, Epsilon- proteobacteria, Beta-proteobacteria, Spirochaetes, Verrucomicrobia (Phụ lục 8). 3.3.5. Khai thác gen có hoạt tính ức chế protease (PIs) dựa trên cơ sở dữ liệu (CSDL) metagenomics Bằng các công cụ tin sinh học, đã khai thác được 50 gen hoàn chỉnh liên quan đến chất ức chế protease từ CSDL là metagenomics QT2 (Quảng Trị) (Bảng 3.8). Trong đó có 28 gen, chiếm 56 % được chú giải thuộc họ Serpin (Serine protease inhibitor); còn lại 22 gen (44 %) thuộc nhóm Inter-alpha-trypsin inhibitor. Gen ngắn nhất là 198 bp, mã hóa cho 66 axit amin; gen dài nhất là 2406 bp, mã hóa cho 802 axit amin. Một số gen cũng đã được xác định là gen mới ở Việt Nam (Bảng 3.9). Nhằm xác định lại độ tin cậy của kết quả chú giải trên, một số trình tự axít amin đã được lựa chọn để so sánh protein trên NCBI. Kết quả sau so sánh cho thấy các axít amin này thuộc nhóm ức chế protease tương ứng với kết quả chú giải (Phụ lục 9). Bảng 3.8. Kết quả sàng lọc các gen có hoạt tính protease inhibitor từ CSDL metagenomics QT2 TT Contig Locus_tag Acid amin Uni_ accession_1 UniProtKB_ product Uni_ score Uni_ Evalue 1 contig000016 Prokka_05808 442 Q5RB37 ITIH chain H3 89.4 1.00E-17 2 contig000019 Prokka_06418 323 O02668 ITIH chain H2 61.2 5.00E-09 3 contig000019 Prokka_06445 398 Q61703 ITIH chain H2 71.6 4.00E-12 4 contig000046 Prokka_10704 429 Q9D154 Serpin 184 6.00E-52 5 contig000046 Prokka_10705 405 Q5BIR5 Serpin 214 1.00E-63 6 contig000127 Prokka_20087 328 Q3T052 ITIH chain H4 62 3.00E-09 7 contig000172 Prokka_24210 400 Q8BJD1 ITIH chain H5 71.6 4.00E-12 8 contig000213 Prokka_27784 418 Q5BIR5 Serpin B8 216 5.00E-64 72 9 contig000213 Prokka_27785 405 Q99574 Neuroserpin 209 2.00E-61 10 contig000314 Prokka_34813 736 A6X935 ITIH 171 6.00E-43 11 contig000433 Prokka_41698 419 Q5BIR5 Serpin B8 231 6.00E-70 12 contig000631 Prokka_52340 325 Q3T052 ITIH chain H4 58.9 3.00E-08 13 contig000726 Prokka_56621 398 Q61703 ITIH chain H2 57 2.00E-07 14 contig000981 Prokka_67673 428 Q90935 Neuroserpin 214 1.00E-62 15 contig001114 Prokka_72799 419 Q5BIR5 Serpin B8 219 4.00E-65 16 contig001390 Prokka_82416 386 A6X935 ITIH 114 4.00E-26 17 contig001690 Prokka_91580 454 Q5BIR5 Serpin B8 152 5.00E-40 18 contig001737 Prokka_93032 412 Q5BIR5 Serpin B8 214 1.00E-63 19 contig001737 Prokka_93033 223 Q99574 Neuroserpin 87.8 6.00E-19 20 contig001813 Prokka_95168 412 Q99574 Neuroserpin 207 3.00E-60 21 contig002069 Prokka_102253 280 Q8PTN8 serpin 175 7.00E-50 22 contig002236 Prokka_106102 324 A2VE29 ITIH chain H5 64.7 4.00E-10 23 contig002339 Prokka_108516 478 Q14624 ITIH chain H4 63.5 2.00E-09 24 contig002592 Prokka_114432 355 Q90935 Neuroserpin 197 3.00E-57 25 contig002838 Prokka_119867 334 Q14624 ITIH chain H4 55.5 3.00E-07 26 contig003102 Prokka_125566 401 Q8BJD1 ITIH chain H5 58.5 5.00E-08 27 contig003892 Prokka_140659 323 Q3T052 ITIH chain H4 67 7.00E-11 28 contig004584 Prokka_152589 631 Q61703 ITIH chain H2 66.2 6.00E-10 29 contig005997 Prokka_173538 430 Q8PTN8 Serpin 206 2.00E-59 30 contig006820 Prokka_184178 417 Q5BIR5 Serpin B8 237 5.00E-72 31 contig007047 Prokka_186946 497 Q61703 ITIH chain H2 122 2.00E-28 32 contig007181 Prokka_188591 146 Q96P15 Serpin B11 105 5.00E-26 73 33 contig007964 Prokka_197295 66 Q90935 Neuroserpin 51.6 7.00E-08 34 contig008443 Prokka_202257 443 P50453 Serpin B9 213 2.00E-62 35 contig010618 Prokka_222724 382 Q8BJD1 ITIH chain H5 64.3 8.00E-10 36 contig012483 Prokka_237228 378 Q9JK88 Serpin I2 57 1.00E-07 37 contig015758 Prokka_258680 430 Q9S7T8 Serpin-ZX 143 1.00E-36 38 contig020504 Prokka_283125 394 Q90935 Neuroserpin 73.2 8.00E-13 39 contig020772 Prokka_284248 402 Q90935 Neuroserpin 213 1.00E-62 40 contig020806 Prokka_284376 802 Q61703 ITIH chain H2 142 2.00E-33 41 contig020909 Prokka_284844 362 A6X935 ITIH 104 6.00E-23 42 contig021896 Prokka_288956 722 P56652 ITIH chain H3 170 8.00E-43 43 contig024785 Prokka_300295 303 Q29052 ITIH chain H1 55.5 3.00E-07 44 contig030105 Prokka_318139 717 Q9GLY5 ITIH chain H3 116 2.00E-25 45 contig033816 Prokka_328453 391 B4USX2 Serpin B10 220 1.00E-65 46 contig038363 Prokka_339464 376 Q9CQV3 Serpin B11 82 7.00E-16 47 contig040171 Prokka_346561 423 Q99574 Neuroserpin 211 1.00E-61 48 contig044964 Prokka_352966 457 Q5JJ64 Serpin 249 7.00E-76 49 contig060339 Prokka_377096 149 Q9UIV8 Serpin B13 66.6 4.00E-12 50 contig067320 Prokka_385523 98 Q5NBM0 Putative serpin 66.2 1.00E-12 Chú thích: ITIH: Inter-alpha-trypsin inhibitor heavy; Serpin: serine protease inhibitor; I: Inhibitor Bảng 3.9. Ví dụ về gen mới được sàng lọc STT Tên gen Chiều dài Nu Độ tương đồng (%) Đặc điểm 1 Predicted_gene_ 346561 1398 55.98 Neuroserpin; AltName: Full=Peptidase inhibitor 12; Short=PI-12; AltName: Full=Serpin I1; Flags: Precursor 2 Predicted_gene_ 1893 49.75 Inter-alpha-trypsin inhibitor 74 91473 heavy chain H2; Short=ITI heavy chain H2; Short=ITI- HC2; Short=Inter-alpha- inhibitor heavy chain 2 Việc phát hiện các con đường sinh tổng hợp quan tâm trong hệ cộng sinh phức tạp như hải miên là thách thức cực lớn bởi sự đa dạng cao của hệ vi sinh vật liên kết. Vì vậy, chiến lược khai thác (mining) metagenome được áp dụng để phát hiện các hợp chất chưa biết từ vi sinh vật không nuôi cấy được và có thể khám phá các hợp chất được vi sinh vật liên kết sản sinh (Barone et al., 2014). Các chiến lược metagenomics được sử dụng thành công để phân lập và xác định các enzyme có hoạt tính sinh học mới, hoặc các chất chuyển hóa thứ cấp từ các thành phần không thể phục hồi của các cộng đồng vi sinh vật từ các mẫu môi trường khác nhau. Các enzyme thích nghi lạnh có thể hoạt động mạnh hơn tới 10 lần ở nhiệt độ thấp và trung bình (Singh., 2010; Selvin et al., 2012; Baroneet al., 2014; Alma’abadi et al., 2015,). Một nghiên cứu trước đây đã xây dựng một thư viện plasmid chứa khoảng 50.000 bản sao từ DNA metagenomics phân lập ở các mẫu nước biển (Jiang et al., 2010). Các mẫu nước biển được thu thập từ Biển Đông. DNA plasmid từ các dòng vô tính được chọn ngẫu nhiên và được cắt bằng enzyme giới hạn EcoRІ. Các DNA có kích thước khoảng 1-15 kb, trung bình khoảng 4,0 kb. Kết quả này xác nhận rằng thư viện metagenomics biển có chứa các phân tử DNA từ bộ gen không bị biến đổi. Các metagenome biển của vi sinh vật xuất hiện tự nhiên cũng được chứng minh có chứa một nhóm gen rất lớn. Hầu hết các gen này không được tìm thấy bằng phương pháp phân lập truyền thống. Từ thư viện này, Jiang et al. (2011) đã khai thác 1 gen mới, được gọi là Spi1C. Gen này có khung đọc mở dài 642 bp, với hàm lượng G + C là 49,92 %, mã hóa 214 axít amin. Trọng lượng phân tử tương đối được dự đoán (Mr) là khoảng 24 kDa và điểm đẳng điện là 4,33. Những giá trị này phù hợp với trọng lượng phân tử khoảng 20-40 kDa quan sát được của đa số các protein serpin (Torres-Castillo et al., 2009). Chỉ số không ổn định của Spi1C đã được xác định là 24,90, như vậy, Spi1C được coi là một Serpin tương đối ổn định. Trình tự axít amin của Spi1C đã được so sánh (BLAST) trên cơ sở dữ liệu NCBI (National Center for Biotechnology Information) và ExPaSy (Expert Protein Analysis System). Kết quả cho thấy protein Spi1C tương đồng 57- 75 60 % với các chất ức chế protease Serpin I4. Trong nghiên cứu này, chúng tôi cũng đã sàng lọc được trên 50 % gen (28 gen) liên quan đến chất ức chế serpin, và kết quả so sánh trên NCBI, ExPaSy cho thấy các gen này tương đồng trên 50 % với các chất ức chế serpin khác (Phụ lục 9). Theo hiểu biết của chúng tôi thì đây là công trình thứ hai công bố về khai thác gen ức chế protease từ cơ sở dữ liệu metagenomics từ môi trường biển. Chất ức chế serpin là một siêu họ quan trọng và lớn nhất của chất ức chế protease. Chúng hoạt động như một điều biến (modulator) và tham gia vào rất nhiều quá trình phân giải protein quan trọng, liên kết hóa trị với protein đích và bất hoạt chúng (Jiang et al., 2011). Do đó kết quả nghiên cứu của chúng tôi mở ra một tiềm năng triển vọng về khai thác các gen này để nghiên cứu và ứng dụng trong các ngành y dược. 3.4. Nghiên cứu biểu hiện gen ức chế protease (PIs) trong hệ Escherichia coli Dựa vào kết quả khai thác gen PIs từ CSDL metagenomics QT2, đã thiết kế một số cặp mồi để tách dòng các gen ức chế protease thuộc họ serpin mong muốn với template là DNA metagenome mẫu QT2 bằng phương pháp PCR. Tuy nhiên, mặc dù đã thay đổi rất nhiều thông số trong chu trình PCR nhưng vẫn không tách dòng được theo phương pháp PCR thông thường. Vì vậy, dựa vào kết quả sàng lọc gen (Bảng 3.8), trình tự gen contig 000046, contig000433 và contig020504 đã được tổng hợp (GenScript) và đưa vào vector tách dòng pUC57. Các gen lựa chọn ngoài là gen được chú giải thuộc họ serpin (ức chế serine protease) còn có một số ưu điểm hơn các contig khác như: gen mới, trình tự gen hoàn chỉnh (có độ tương đồng dưới 85 % với các gen liên quan đến chất ức chế protease đã được công bố trên ngân hàng gen NCBI), trọng lượng protein dự đoán khoảng 30-55 kDa (thuận tiện cho quá trình biểu hiện, tinh sạch và thu hồi protein tái tổ hợp), ngoài ra, các contig này đều có giá trị Uni-evalue cao và tin cậy. Các contig 000046, contig000433 và contig020504 được đặt tên là PI-QT, PI-QT1 và PI-QT2, tương ứng. Trong quá trình nghiên cứu, đã thiết kế thành công các vectơ biểu hiện pET- 32a(+) trong hệ E. coli và vectơ pPIC9 biểu hiện trong P. pastoris mang 3 gen PI- QT, PI-QT1 và PI-QT2. Tuy nhiên, các gen PI-QT1 và PI-QT2 biểu hiện protein tái tổ hợp nằm trong cặn tế bào ở dạng không tan trong hệ E.coli BL21 (DE3) và không biểu hiện được trong hệ P. pastoris SDM1168 dưới các điều kiện nghiên cứu. Chỉ 76 có gen PI-QT biểu hiện trong cả hệ E. coli và P. pastoris thu được protein tái tổ hợp ở trạng thái tan. Vì vậy, trong luận án này chỉ báo cáo về quá trình biểu hiện gen PI- QT trong 2 hệ biểu hiện nghiên cứu. 3.4.1. Phân tích trình tự a xít amin và cây phân loại của protein PI-QT Gen PI-QT có kích thước 1287 bp, mã hóa cho 429 axít amin, trọng lượng protein dự đoán khoảng 50 kDa, điểm đẳng điện theo lý thuyết là 4.56. So sánh trình tự axít amin của PI-QT với các trình tự trong cơ sở dữ liệu NCBI cho thấy protein PI-QT tương đồng với các serpin khoảng 50 – 55 % và peptide PI-QT có các vùng bảo thủ giống với các trình tự của protein này trong vi sinh vật (Hình 3.12). Hình 3.12: So sánh trình tự axít amin của protein PI-QT với các trình tự tương đồng trên cơ sở dữ liệu NCBI 77 Các chuỗi peptide được xử lý bằng phần mềm ClustalW. Các serpin đã biết (từ CSDL NCBI) bao gồm: RKU17271, RKU16626, RKU24896, RKU24895, RKU11755 (chất ức chế protease Serpin I4 từ vi khuẩn); RKZ34327 (protein vi khuẩn họ serpin); WP_068816727 (chất ức chế protease Serpin I4 từ vi khuẩn Phormidesmis priestleyi), WP_058997120 (chất ức chế protease Serpin I4 từ vi khuẩn Leptolyngbya sp. NIES-2104), WP_106255732 (chất ức chế protease Serpin I4 từ vi khuẩn Leptolyngbya frigida), WP_048868337 (chất ức chế protease Serpin I4 từ vi khuẩn Scytonema tolypothrichoides), RCJ36945 (chất ức chế protease Serpin I4 từ vi khuẩn Nostoc minutum NIES-26), WP_092470061 (chất ức chế protease Serpin I4 từ vi khuẩn Desulfallas arcticus), WP_041285583 (chất ức chế protease Serpin I4 từ vi khuẩn Desulfallas gibsoniae), AGL02566 (chất ức chế protease Serpin I4 từ vi khuẩn Desulfallas gibsoniae DSM 7213). Hình 3.13: (A) Mối quan hệ phát sinh gen của protein PI-QT với các serpin khác. (B) Cấu trúc protein của PI-QT đã được dự đoán bằng SWISS-MODEL. (C) Cấu trúc protein của PI-QT đã được dự đoán bằng (PS)2-v2. Cây phân loại protein dựa trên phương pháp neighbor-joining giữa protein PI-QT với 2 loại serpin vi khuẩn khác đã được xây dựng (Hình 3.13 A): một loại serpin từ một ngành ứng viên của vi khuẩn ban đầu được xác định trong hệ vi sinh 78 vật của hải miên biển và một serpin khác từ vi khuẩn ngành Firmicutes và Cyanobacteria. Dựa trên dữ liệu so sánh, protein PI-QT có thể thấy là một loại serpin vi khuẩn mới. Cấu trúc protein của PI-QT được dự đoán theo mô hình SWISS- MODEL (Hình 3.13 B) và (PS) 2-v2 (Hình 3.13 C). Gen PI-QT cũng đã được đăng ký trên ngân hàng gen NCBI với mã số MK359987.1 (Phụ lục 10). 3.4.2. Thiết kế vectơ biểu hiện pET-32a(+) mang gen PI-QT Gen PI-QT được gắn thêm 2 điểm cắt của enzyme giới hạn EcoRI và NotI vào hai đầu của gen và tách dòng vào vectơ pUC57 (GenScript, Mỹ). Do đó, để gắn gen PI-QT vào vectơ biểu hiện pET-32a(+), vectơ pUC57 chứa gen PI-QT và pET- 32a(+) đã được xử lý bằng enzyme EcoRI và NotI (Hình 3.14 A), sau đó được tinh sạch lại bằng kít tinh sạch gel (Fermentas, Mỹ). M 1 2 3 M 1 2 3 4 5 6.0 kb 2.7 kb 1.3 kb Hình 3.14. Gel agarose của vectơ cắt bằng EcoRI/NotI (A) và gel agarose của plasmid tái tổ hợp được cắt bằng enzyme EcoRI/ NotI (B) (A): giếng M: Marker DNA 1 kb (Thermo); giếng 1: Vectơ pET-32a(+) cắt mở vòng bằng EcoRI/NotI; giếng 2: Gen PI-QT tinh sạch; giếng 3: Vectơ [pUC57/ PI-QT] được cắt bằng EcoRI/NotI. (B): giếng M: Marker 1kb (Thermo); giếng 1: Plasmid [pET-32a(+)/PI-QT]; giếng 2, 3, 4: Plasmid [pET-32a(+)/PI-QT] cắt bởi enzyme EcoRI/ NotI; giếng 5: Vectơ pET- 32a(+). 79 Gen PI-QT được đưa vào vectơ biểu hiện pET-32a(+) đã mở vòng sử dụng enzyme T4 DNA ligase, và biến nạp vào chủng E. coli TOP10F', sau đó trải trên đĩa LB có bổ sung ampicillin (50 μg/mL). Một vài khuẩn lạc trắng và 1 khuẩn lạc xanh được chọn ngẫu nhiên để tách plasmid và cắt plasmid tách được bằng enzyme EcoRI và NotI. Phân tích trên gel agarose 1 % cho thấy có 1 băng ~ 1,3 kb (tương đương kích thước của g

Các file đính kèm theo tài liệu này:

luan_an_sang_loc_va_bieu_hien_gen_ma_hoa_protein_uc_che_prot.pdf