Lời cảm ơn . i
Lời cam đoan . ii
MỤC LỤC. iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT. vi
DANH MỤC CÁC BẢNG . viii
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ . ix
MỞ ĐẦU . 1
CHƯƠNG I. TỔNG QUAN . 3
1.1. Hải miên và vi sinh vật liên kết hải miên. 3 .
1.1.1. Giới thiệu về hải miên. 3 .
1.1.2. Vi sinh vật liên kết hải miên . 6
1.2. Sơ lược về metagenomics . 14
1.3. Chất ức chế protease (PIs) . 19
1.3.1. Sơ lược protease. 19 .
1.3.2. Chất ức chế protease và phân loại . 20 .
1.3.3. Cơ chế hoạt động của PIs. 25
1.3.4. Ứng dụng của chất ức chế protease . 28.
1.3.5. Tình hình nghiên cứu PIs từ vi sịnh vật liên kết với hải miên trong và
ngoài nước. 31
1.4. Hệ biểu hiện gen ngoại lai Escherichia coli và Pichia pastoris. 35
CHƯƠNG II. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU . 37
2.1. Vật liệu nghiên cứu . 37 .
2.1.1 Vật liệu . 37
2.1.2. Đối tượng nghiên cứu . . 39
2.1.3. Hóa chất . . 39
2.1.4. Máy móc thiết bị . 39 .
2.1.5. Dung dịch và môi trường sử dụng . 40 .
2.2. Phương pháp nghiên cứu . 42
2.2.1. Phương pháp tách DNA metagenome của VSV liên kết hải miên.
187 trang |
Chia sẻ: honganh20 | Ngày: 03/03/2022 | Lượt xem: 347 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận án Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên spheciospongia vesparium thu nhận tại vùng biển miền trung, Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ng chỉ có nhóm A: Chỉnh sửa và xử
lý RNA (RNA processing and modification) và nhóm B: Cấu trúc và động lực học
của chất nhiễm sắc (Chromatin Structure and dyamics) là hầu như không có gen
tương đồng.
Hình 3.6. Phân loại chức năng gen trên cơ sở dữ liệu COG (Trục tung: Số gen, trục
hoành: Nhóm chức năng gen)
Kết quả phân loại nhóm chức năng enzyme cho thấy, dữ liệu gen chủ yếu
thuộc vào nhóm GH (Glycoside Hydrolase) với khoảng gần 5000 gen, tiếp theo sau
là hai nhóm Carbohydrate Esterase (CE) và Glycosyl Transferase (GT) với khoảng
2500 gen tương đồng. Số lượng đoạn trình tự thuộc nhóm chức năng Carbohydrate
62
Binding Module (CBM) thấp hơn 1 chút, khoảng 2000 trình tự. Các nhóm chức
năng còn lại có số lượng gen tương đồng không đáng kể, khoảng dưới 1.000 trình tự
gen (Hình 3.7).
Hình 3.7.Phân nhóm chức năng của enzyme trên cơ sở dữ liệu CAZy (Trục tung: Số
gen được chú giải, trục hoành: Nhóm chức năng gen)
Kết quả phân loại trên cơ sở dữ liệu KEGG cho thấy gen dự đoán chủ yếu có
chức năng liên quan đến con đường trao đổi chất (M: Metabolism); tiếp theo đó là
nhóm quá trình phát triển tế bào (C: Cellular Process) và nhóm xử lý thông tin di
truyền (G: Gentic Information Processing). Một phần nhỏ gen tham gia vào nhóm
hệ thống sinh vật (O: Organismal Systems) và nhóm bệnh ở người (H: Human
Diseases) (Hình 3.8).
63
Hình 3.8. Kết quả phân loại trên cơ sở dữ liệu KEGG (Trục tung: Nhóm chức năng
gen, trục hoành: Số gen chú giải)
G: Xử lý thông tin di truyền (Gentic Information Processing); C: Quá trình phát
triển tế bào (Cellular Processes); M: Trao đổi chất (Metabolism);
O: Hệ thống sinh vật (Organismal Systems); H: Bệnh ở người (Human Diseases)
64
3.3.4. Đa dạng sinh học vi sinh vật liên kết hải miên Spheciospongia vesparium
QT2 biển Quảng Trị
Vùng siêu biến V4 của gen 16S rRNA vi sinh vật liên kết hải miên
Spheciospongia vesparium QT2 biển Quảng Trị đã được khuếch đại và gắn mã vạch
(barcodes) (Phụ lục 6), sản phẩm PCR được kiểm tra trên agarose gel 1,8 % (Hình
3.9a), cho thấy kích thước tương ứng 300 bp như tính toán lý thuyết. Sản phẩm PCR
sau khi được gắn mã vạch cũng được kiểm tra trên agarose gel 1,8 % (Hình 3.9b).
(a) (b)
Hình 3.9. Điện di đồ sản phẩm PCR trên gel agarose 1,8 %
(a). Giếng 1: Sản phẩm PCR vùng V4 gen 16S rRNA của vi khuẩn liên kết hải miên
Spheciospongia vesparium QT2; Giếng M: DNA marker 1 kb GeneRulerTM
(b). Giếng 3. Sản phẩm PCR sau khi gắn mã vạch của kết hải miên Spheciospongia
vesparium QT2; Giếng M: DNA marker 1 kb GeneRulerTM
Sản phẩm PCR vùng siêu biến V4 gen 16S rRNA sau khi gắn mã vạch đã
được giải trình tự, phân tích và so sánh với cơ sở dữ liệu Silva để xác định tính đa
dạng của vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 ở các mức độ
phân loại khác nhau. Với mẫu hải miên này, có 58,29 % reads (45.965 reads/ 78.849
reads) đạt yêu cầu sử dụng cho phân loại, trong đó 82,93 % thuộc giới (domain) vi
khuẩn, 16,84% thuộc cổ khuẩn (Archaea) và 0,23 % không nhận dạng được (Bảng
3.5; Hình 3.10)
65
Bảng 3.5. Phân loại các reads 16S rRNA của hải miên Spheciospongia vesparium
QT2 theo giới và ngành
Giới Số
reads
% tổng số
reads
Tên ngành
(Phylum)
Số
reads
% tổng số
reads
Vi khuẩn
(Bacteria)
38119 82,93 Thaumarchaeota 7742 16,84
Cổ khuẩn
(Archaea)
7741 16,84 Acidobacteria 1905 4,14
Không xác
định
(Unclassified)
106 0,23 Actinobacteria 3225 7,02
Bacteroidetes 882 1,92
Chloroflexi 3747 8,15
Deferribacteres 61 0,13
Gemmatimonadetes 3417 7,43
Nitrospirae 839 1,82
Proteobacteria 23658 51,47
Spirochaetes 383 0,83
Unclassified 106 0,23
Đối với cổ khuẩn, chỉ nhận dạng được ngành Thaumarchaeota với tỉ lệ 16,84
% tổng số reads, là một trong những ngành chiếm ưu thế. Ngành Proteobacteria
chiếm tới hơn nửa số reads nhận được, gần 51,5 %. Các ngành chiếm ưu thế khác
trong cộng đồng vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 lần
lượt là Chloroflexi (8,15 % reads), Gemmatimonadetes (7,43 % reads),
Actinobacteria (7,06 % reads), Acidobacteria (4,14 % reads) và Nitrospirae (1,82 %
reads). Các ngành còn lại mỗi ngành chỉ chiếm dưới 1 % tổng số reads.
66
Hình 3.10. Phân loại vi sinh vật liên kết hải miên Spheciospongia vesparium QT2
theo giới (bên trái) và ngành (bên phải)
Các reads tiếp tục được phân loại đến mức thấp hơn là lớp và bộ. Bảng 3.6
và Phụ lục 7 cho thấy 21 lớp vi khuẩn và 36 bộ đã được nhận dạng, trong đó 3 lớp
chiếm đa số (Gammaproteobacteria 22,63 % reads), Marine_Group_I (15,55 %
reads) và Betaproteobacteria (14,59 % reads). Có 0,23 % reads không được nhận
dạng.
Bảng 3.6. Phân loại các reads 16S rRNA vi sinh vật liên kết hải miên
Spheciospongia vesparium QT2 đến lớp và bộ
Lớp % tổng số
reads
Bộ % tổng số
reads
Gammaproteobacteria 22,63 Oceanospirillales 15,30
Marine_Group_I 15,55 Nitrosomonadales 14,59
Betaproteobacteria 14,59 Nitrosopumilus 12,94
Deltaproteobacteria 8,41 Unclassified 7,88
Gemmatimonadetes 7,43 Acidimicrobiales 7,01
Acidimicrobiia 7,01 BD2-11_terrestrial_group 5,17
Alphaproteobacteria 4,56 Sh765B-TzT-29 4,87
Caldilineae 4,33 Caldilineales 4,33
Acidobacteria 3,56 BPC015 3,10
67
TK10 2,06 Alteromonadales 3,07
Cytophagia 1,92 Rhodospirillales 2,99
Nitrospira
1,82 PAUC43f_marine_benthic
_group
2,26
Anaerolineae 1,34 Nitrospirales 1,82
Soil_Crenarchaeotic_
Group(SCG)
1,29
Order_II_Incertae_Sedis
1,70
JTB23 1,06 Anaerolineales 1,34
Spirochaetes 0,83 Pseudomonadales 1,27
Holophagae 0,58 Desulfurellales 1,23
SAR202_clade 0,27 GR-WP33-30 1,17
Unclassified 0,23 HOC36 1,04
SC3-20 0,21 Spirochaetales 0,83
JG30-KF-CM66 0,14 Desulfobacterales 0,83
Deferribacteres 0,13 Rhodobacterales 0,79
Chromatiales 0,62
TK85 0,58
E01-9C-26_marine_group 0,56
Xanthomonadales 0,37
Rickettsiales 0,34
Bdellovibrionales 0,30
32-21 0,27
Aeromonadales 0,26
Cytophagales 0,22
Acidobacteriales 0,18
Rhizobiales 0,17
MNG3 0,14
Deferribacterales 0,13
KI89A_clade 0,12
Kordiimonadales 0,12
68
Các bộ có tỉ lệ reads lớn hơn 10 % gồm Oceanospirillales (15,3 % reads),
Nitrosomonadales (14,59 % reads) và Nitrosopumilus (12,94 % reads). Đối với
phân loại mức bộ, có tới 7,88 % reads không được nhận dạng. Ở mức phân loại họ
và chi, số lượng reads không được nhận dạng tăng lên rất nhiều, 58,53 % cho phân
loại mức họ và tới 72,07 % cho phân loại đến chi.
Bảng 3.7: Phân loại reads 16S rRNA vi sinh vật liên kết hải miên
Spheciospongia vesparium QT2 đến họ; chi
Họ % tổng số
reads
Chi % tổng số reads
Unclassified 58,53 Unclassified 72,07
Hahellaceae 14,33 Endozoicomonas 13,94
Sva0996_marine_group 6,47 Caldilinea 4,33
Caldilineaceae 4,33 Shewanella 3,07
Shewanellaceae 3,07 Nitrospira 1,82
Nitrospiraceae 1,82 Defluviicoccus 1,61
Rhodothermaceae 1,70 Pseudomonas 0,92
Rhodospirillaceae 1,61 Spirochaeta 0,38
Desulfurellaceae 1,23 Acinetobacter 0,35
Anaerolineaceae 1,12 Bdellovibrio 0,30
Pseudomonadaceae 0,92 Aeromonas 0,26
Nitrospinaceae 0,83 Granulosicoccus 0,23
OCS155_marine_group 0,55 Persicobacter 0,22
Rhodobacteraceae 0,38 Pseudovibrio 0,14
Spirochaetaceae 0,38 Ruegeria 0,13
Sinobacteraceae 0,38 Rhodovulum 0,11
Moraxellaceae 0,35 Pseudospirillum 0,11
TK34 0,34
Bdellovibrionaceae 0,29
Aeromonadaceae 0,26
Granulosicoccaceae 0,22
Flammeovirgaceae 0,22
69
Acidobacteriaceae 0,18
PAUC34f 0,13
Kordiimonadaceae 0,12
Oceanospirillaceae 0,11
SAR86_clade 0,10
Trong số 22 họ nhận dạng, chỉ có họ Hahellaceae chiếm tỉ lệ 14,33 % tổng số
reads, các họ khác chiếm tỉ lệ reads trên 1 % gồm Sva0996_marine_group, một họ
candidate (6,47 % reads), Caldilineaceae (4,33 % reads), Shewanellaceae (3,07 %
reads), Nitrospiraceae (1,82 % reads), Rhodothermaceae (1,7 % reads),
Rhodospirillaceae (1,61 %), Desulfurellaceae (1,23 %) và Anaerolineaceae (1,12
%). Tổng cộng có 16 chi vi khuẩn liên kết hải miên Spheciospongia vesparium QT2
được nhận dạng, trong đó chi Endozoicomonas chiếm đa số (14,94 % reads), chi
Caldilinea chiếm 4,33 %, chi Shewanella 3,07 %, Nitrospira chiếm 1,82 % reads và
Defluviicoccus chiếm 1,61 % reads. Các chi còn lại mỗi chi chỉ chiếm không tới 1
% tổng số reads (Bảng 3.7; Hình 3.11).
Hình 3.11. Phân loại vi sinh vật liên kết hải miên Spheciospongia
vespariumQT2 biển Quảng Trị theo chi
Đã nhận dạng 10 ngành, 21 lớp, 36 bộ, 22 họ và 16 chi vi khuẩn liên kết với hải
miên Spheciospongia vesparium QT2 biển Quảng Trị.
70
Sự đa dạng vi sinh vật liên kết hải miên biển được các nhà khoa học quan
tâm nghiên cứu từ lâu do tầm quan trọng của chúng trong sinh thái hải miên cũng
như khả năng sản sinh các chất có hoạt tính sinh học. Theo Li et al. (2006), vi
khuẩn liên kết hải miên từ cùng một vị trí địa lý có sự đa dạng vi khuẩn trội khác
nhau, chứng tỏ vi khuẩn liên kết hải miên là đặc hiệu vật chủ. Ví dụ, Proteobacteria
cấu trúc α, β và γ chiếm đa số trong hải miên, và vi khuẩn có mối quan hệ phát sinh
loài gần cũng được tìm thấy trong các loại hải miên khác nhau (Li et al., 2006). Kết
quả nhận được đối với cộng đồng vi sinh vật liên kết hải miên Spheciospongia
vesparium QT2 cho thấy, các ngành chủ yếu cũng được tìm thấy trong các loài hải
miên khác (Proteobacteria, Gemmatimonadetes, Acidobacteria, Actinobacteria,
Chloroflexi). Riêng ngành Thaumarchaeota phát hiện khá nhiều trong loài hải miên
này, chiếm tới 16,84 % tổng số reads. Các chi trong hải miên Spheciospongia
vesparium QT2 cũng chủ yếu là từ α và γ proteobacteria (Defluviicoccus và
Shewanella, tương ứng), kết quả này trùng với kết quả của Li et al (2006); Hardoim
&Costa (2014). Ngoài ra, Gemmatimonadetes và Nitrospira cũng được tìm thấy ở
Spheciospongia vesparium QT2 và một số loài hải miên Ircinia (Hardoim & Costa.,
2014).
Kết quả nghiên cứu bằng phương pháp 16S metagenomics cho thấy có 15
ngành vi sinh vật (có độ phong phú lớn hơn 0,1 %) đã được tìm thấy liên kết với các
mẫu hải miên Việt Nam (Phụ lục 7). Trong khi các nghiên cứu dựa vào phương
pháp phân lập truyền thống chỉ phân lập được một lượng số lượng hạn chế các vi
sinh vật liên kết với hải miên, phương pháp nghiên cứu đa dạng vi sinh vật không
qua nuôi cấy như 16S metagenomics cho phép phát hiện được nhiều vi sinh vật mới
và chưa được phân lập trước đây. Các nghiên cứu dựa vào phân lập thường chỉ phân
lập được một số các vi khuẩn thuộc một vài ngành phổ biến như Proteobacteria (α
và γ - Proteobacteria), Bacteroidetes, Cyanobacteria, Firmicutes. Trong đó các Chi
như Bacillus, Streptomyces, Pseudovibrio, Vibrio, . thường được phân lập lặp đi
lặp lại từ nhiều mẫu môi trường khác nhau (đất, hải miên, trầm tích, ). Vì vậy
những vi khuẩn này thường được biết đến như những vi khuẩn cỏ dại “weedy
bacteria” bởi chúng có thể phát triển nhanh trên các môi trường phân lập. Tuy
nhiên, bằng phương pháp 16S metagenomics chúng tôi đã phát hiện được nhiều
71
ngành hiếm được phân lập hoặc chưa được phân lập thông qua phương pháp nuôi
cấy như Thaumarchaeota, Acidobacteria, Chloroflexi, Deferribacteres,
Deinococcus-Thermus, Planctomycetes, Delta-proteobacteria, Epsilon-
proteobacteria, Beta-proteobacteria, Spirochaetes, Verrucomicrobia (Phụ lục 8).
3.3.5. Khai thác gen có hoạt tính ức chế protease (PIs) dựa trên cơ sở dữ liệu
(CSDL) metagenomics
Bằng các công cụ tin sinh học, đã khai thác được 50 gen hoàn chỉnh liên
quan đến chất ức chế protease từ CSDL là metagenomics QT2 (Quảng Trị) (Bảng
3.8). Trong đó có 28 gen, chiếm 56 % được chú giải thuộc họ Serpin (Serine
protease inhibitor); còn lại 22 gen (44 %) thuộc nhóm Inter-alpha-trypsin inhibitor.
Gen ngắn nhất là 198 bp, mã hóa cho 66 axit amin; gen dài nhất là 2406 bp, mã hóa
cho 802 axit amin. Một số gen cũng đã được xác định là gen mới ở Việt Nam (Bảng
3.9). Nhằm xác định lại độ tin cậy của kết quả chú giải trên, một số trình tự axít
amin đã được lựa chọn để so sánh protein trên NCBI. Kết quả sau so sánh cho thấy
các axít amin này thuộc nhóm ức chế protease tương ứng với kết quả chú giải (Phụ
lục 9).
Bảng 3.8. Kết quả sàng lọc các gen có hoạt tính protease inhibitor từ CSDL
metagenomics QT2
TT
Contig Locus_tag
Acid
amin
Uni_
accession_1
UniProtKB_
product
Uni_
score
Uni_
Evalue
1 contig000016 Prokka_05808 442 Q5RB37 ITIH chain H3 89.4 1.00E-17
2 contig000019 Prokka_06418 323 O02668 ITIH chain H2 61.2 5.00E-09
3 contig000019 Prokka_06445 398 Q61703 ITIH chain H2 71.6 4.00E-12
4 contig000046 Prokka_10704 429 Q9D154 Serpin 184 6.00E-52
5 contig000046 Prokka_10705 405 Q5BIR5 Serpin 214 1.00E-63
6 contig000127 Prokka_20087 328 Q3T052 ITIH chain H4 62 3.00E-09
7 contig000172 Prokka_24210 400 Q8BJD1 ITIH chain H5 71.6 4.00E-12
8 contig000213 Prokka_27784 418 Q5BIR5 Serpin B8 216 5.00E-64
72
9 contig000213 Prokka_27785 405 Q99574 Neuroserpin 209 2.00E-61
10 contig000314 Prokka_34813 736 A6X935 ITIH 171 6.00E-43
11 contig000433 Prokka_41698 419 Q5BIR5 Serpin B8 231 6.00E-70
12 contig000631 Prokka_52340 325 Q3T052 ITIH chain H4 58.9 3.00E-08
13 contig000726 Prokka_56621 398 Q61703 ITIH chain H2 57 2.00E-07
14 contig000981 Prokka_67673 428 Q90935 Neuroserpin 214 1.00E-62
15 contig001114 Prokka_72799 419 Q5BIR5 Serpin B8 219 4.00E-65
16 contig001390 Prokka_82416 386 A6X935 ITIH 114 4.00E-26
17 contig001690 Prokka_91580 454 Q5BIR5 Serpin B8 152 5.00E-40
18 contig001737 Prokka_93032 412 Q5BIR5 Serpin B8 214 1.00E-63
19 contig001737 Prokka_93033 223 Q99574 Neuroserpin 87.8 6.00E-19
20 contig001813 Prokka_95168 412 Q99574 Neuroserpin 207 3.00E-60
21 contig002069 Prokka_102253 280 Q8PTN8 serpin 175 7.00E-50
22 contig002236 Prokka_106102 324 A2VE29 ITIH chain H5 64.7 4.00E-10
23 contig002339 Prokka_108516 478 Q14624 ITIH chain H4 63.5 2.00E-09
24 contig002592 Prokka_114432 355 Q90935 Neuroserpin 197 3.00E-57
25 contig002838 Prokka_119867 334 Q14624 ITIH chain H4 55.5 3.00E-07
26 contig003102 Prokka_125566 401 Q8BJD1 ITIH chain H5 58.5 5.00E-08
27 contig003892 Prokka_140659 323 Q3T052 ITIH chain H4 67 7.00E-11
28 contig004584 Prokka_152589 631 Q61703 ITIH chain H2 66.2 6.00E-10
29 contig005997 Prokka_173538 430 Q8PTN8 Serpin 206 2.00E-59
30 contig006820 Prokka_184178 417 Q5BIR5 Serpin B8 237 5.00E-72
31 contig007047 Prokka_186946 497 Q61703 ITIH chain H2 122 2.00E-28
32 contig007181 Prokka_188591 146 Q96P15 Serpin B11 105 5.00E-26
73
33 contig007964 Prokka_197295 66 Q90935 Neuroserpin 51.6 7.00E-08
34 contig008443 Prokka_202257 443 P50453 Serpin B9 213 2.00E-62
35 contig010618 Prokka_222724 382 Q8BJD1 ITIH chain H5 64.3 8.00E-10
36 contig012483 Prokka_237228 378 Q9JK88 Serpin I2 57 1.00E-07
37 contig015758 Prokka_258680 430 Q9S7T8 Serpin-ZX 143 1.00E-36
38 contig020504 Prokka_283125 394 Q90935 Neuroserpin 73.2 8.00E-13
39 contig020772 Prokka_284248 402 Q90935 Neuroserpin 213 1.00E-62
40 contig020806 Prokka_284376 802 Q61703 ITIH chain H2 142 2.00E-33
41 contig020909 Prokka_284844 362 A6X935 ITIH 104 6.00E-23
42 contig021896 Prokka_288956 722 P56652 ITIH chain H3 170 8.00E-43
43 contig024785 Prokka_300295 303 Q29052 ITIH chain H1 55.5 3.00E-07
44 contig030105 Prokka_318139 717 Q9GLY5 ITIH chain H3 116 2.00E-25
45 contig033816 Prokka_328453 391 B4USX2 Serpin B10 220 1.00E-65
46 contig038363 Prokka_339464 376 Q9CQV3 Serpin B11 82 7.00E-16
47 contig040171 Prokka_346561 423 Q99574 Neuroserpin 211 1.00E-61
48 contig044964 Prokka_352966 457 Q5JJ64 Serpin 249 7.00E-76
49 contig060339 Prokka_377096 149 Q9UIV8 Serpin B13 66.6 4.00E-12
50 contig067320 Prokka_385523 98 Q5NBM0 Putative serpin 66.2 1.00E-12
Chú thích: ITIH: Inter-alpha-trypsin inhibitor heavy; Serpin: serine protease inhibitor; I: Inhibitor
Bảng 3.9. Ví dụ về gen mới được sàng lọc
STT Tên gen
Chiều
dài Nu
Độ tương
đồng (%)
Đặc điểm
1
Predicted_gene_
346561
1398 55.98
Neuroserpin; AltName:
Full=Peptidase inhibitor 12;
Short=PI-12; AltName:
Full=Serpin I1; Flags:
Precursor
2 Predicted_gene_ 1893 49.75 Inter-alpha-trypsin inhibitor
74
91473 heavy chain H2; Short=ITI
heavy chain H2; Short=ITI-
HC2; Short=Inter-alpha-
inhibitor heavy chain 2
Việc phát hiện các con đường sinh tổng hợp quan tâm trong hệ cộng sinh
phức tạp như hải miên là thách thức cực lớn bởi sự đa dạng cao của hệ vi sinh vật
liên kết. Vì vậy, chiến lược khai thác (mining) metagenome được áp dụng để phát
hiện các hợp chất chưa biết từ vi sinh vật không nuôi cấy được và có thể khám phá
các hợp chất được vi sinh vật liên kết sản sinh (Barone et al., 2014).
Các chiến lược metagenomics được sử dụng thành công để phân lập và xác
định các enzyme có hoạt tính sinh học mới, hoặc các chất chuyển hóa thứ cấp từ các
thành phần không thể phục hồi của các cộng đồng vi sinh vật từ các mẫu môi trường
khác nhau. Các enzyme thích nghi lạnh có thể hoạt động mạnh hơn tới 10 lần ở
nhiệt độ thấp và trung bình (Singh., 2010; Selvin et al., 2012; Baroneet al., 2014;
Alma’abadi et al., 2015,). Một nghiên cứu trước đây đã xây dựng một thư viện
plasmid chứa khoảng 50.000 bản sao từ DNA metagenomics phân lập ở các mẫu
nước biển (Jiang et al., 2010). Các mẫu nước biển được thu thập từ Biển Đông.
DNA plasmid từ các dòng vô tính được chọn ngẫu nhiên và được cắt bằng enzyme
giới hạn EcoRІ. Các DNA có kích thước khoảng 1-15 kb, trung bình khoảng 4,0 kb.
Kết quả này xác nhận rằng thư viện metagenomics biển có chứa các phân tử DNA
từ bộ gen không bị biến đổi. Các metagenome biển của vi sinh vật xuất hiện tự
nhiên cũng được chứng minh có chứa một nhóm gen rất lớn. Hầu hết các gen này
không được tìm thấy bằng phương pháp phân lập truyền thống. Từ thư viện này,
Jiang et al. (2011) đã khai thác 1 gen mới, được gọi là Spi1C. Gen này có khung
đọc mở dài 642 bp, với hàm lượng G + C là 49,92 %, mã hóa 214 axít amin. Trọng
lượng phân tử tương đối được dự đoán (Mr) là khoảng 24 kDa và điểm đẳng điện là
4,33. Những giá trị này phù hợp với trọng lượng phân tử khoảng 20-40 kDa quan
sát được của đa số các protein serpin (Torres-Castillo et al., 2009). Chỉ số không ổn
định của Spi1C đã được xác định là 24,90, như vậy, Spi1C được coi là một Serpin
tương đối ổn định. Trình tự axít amin của Spi1C đã được so sánh (BLAST) trên cơ
sở dữ liệu NCBI (National Center for Biotechnology Information) và ExPaSy
(Expert Protein Analysis System). Kết quả cho thấy protein Spi1C tương đồng 57-
75
60 % với các chất ức chế protease Serpin I4. Trong nghiên cứu này, chúng tôi cũng
đã sàng lọc được trên 50 % gen (28 gen) liên quan đến chất ức chế serpin, và kết
quả so sánh trên NCBI, ExPaSy cho thấy các gen này tương đồng trên 50 % với các
chất ức chế serpin khác (Phụ lục 9). Theo hiểu biết của chúng tôi thì đây là công
trình thứ hai công bố về khai thác gen ức chế protease từ cơ sở dữ liệu
metagenomics từ môi trường biển. Chất ức chế serpin là một siêu họ quan trọng và
lớn nhất của chất ức chế protease. Chúng hoạt động như một điều biến (modulator)
và tham gia vào rất nhiều quá trình phân giải protein quan trọng, liên kết hóa trị với
protein đích và bất hoạt chúng (Jiang et al., 2011). Do đó kết quả nghiên cứu của
chúng tôi mở ra một tiềm năng triển vọng về khai thác các gen này để nghiên cứu
và ứng dụng trong các ngành y dược.
3.4. Nghiên cứu biểu hiện gen ức chế protease (PIs) trong hệ Escherichia coli
Dựa vào kết quả khai thác gen PIs từ CSDL metagenomics QT2, đã thiết kế
một số cặp mồi để tách dòng các gen ức chế protease thuộc họ serpin mong muốn
với template là DNA metagenome mẫu QT2 bằng phương pháp PCR. Tuy nhiên,
mặc dù đã thay đổi rất nhiều thông số trong chu trình PCR nhưng vẫn không tách
dòng được theo phương pháp PCR thông thường. Vì vậy, dựa vào kết quả sàng lọc
gen (Bảng 3.8), trình tự gen contig 000046, contig000433 và contig020504 đã được
tổng hợp (GenScript) và đưa vào vector tách dòng pUC57. Các gen lựa chọn ngoài
là gen được chú giải thuộc họ serpin (ức chế serine protease) còn có một số ưu điểm
hơn các contig khác như: gen mới, trình tự gen hoàn chỉnh (có độ tương đồng dưới
85 % với các gen liên quan đến chất ức chế protease đã được công bố trên ngân
hàng gen NCBI), trọng lượng protein dự đoán khoảng 30-55 kDa (thuận tiện cho
quá trình biểu hiện, tinh sạch và thu hồi protein tái tổ hợp), ngoài ra, các contig này
đều có giá trị Uni-evalue cao và tin cậy. Các contig 000046, contig000433 và
contig020504 được đặt tên là PI-QT, PI-QT1 và PI-QT2, tương ứng.
Trong quá trình nghiên cứu, đã thiết kế thành công các vectơ biểu hiện pET-
32a(+) trong hệ E. coli và vectơ pPIC9 biểu hiện trong P. pastoris mang 3 gen PI-
QT, PI-QT1 và PI-QT2. Tuy nhiên, các gen PI-QT1 và PI-QT2 biểu hiện protein tái
tổ hợp nằm trong cặn tế bào ở dạng không tan trong hệ E.coli BL21 (DE3) và không
biểu hiện được trong hệ P. pastoris SDM1168 dưới các điều kiện nghiên cứu. Chỉ
76
có gen PI-QT biểu hiện trong cả hệ E. coli và P. pastoris thu được protein tái tổ hợp
ở trạng thái tan. Vì vậy, trong luận án này chỉ báo cáo về quá trình biểu hiện gen PI-
QT trong 2 hệ biểu hiện nghiên cứu.
3.4.1. Phân tích trình tự a xít amin và cây phân loại của protein PI-QT
Gen PI-QT có kích thước 1287 bp, mã hóa cho 429 axít amin, trọng lượng
protein dự đoán khoảng 50 kDa, điểm đẳng điện theo lý thuyết là 4.56. So sánh
trình tự axít amin của PI-QT với các trình tự trong cơ sở dữ liệu NCBI cho thấy
protein PI-QT tương đồng với các serpin khoảng 50 – 55 % và peptide PI-QT có
các vùng bảo thủ giống với các trình tự của protein này trong vi sinh vật (Hình
3.12).
Hình 3.12: So sánh trình tự axít amin của protein PI-QT với các trình tự
tương đồng trên cơ sở dữ liệu NCBI
77
Các chuỗi peptide được xử lý bằng phần mềm ClustalW. Các serpin đã biết
(từ CSDL NCBI) bao gồm: RKU17271, RKU16626, RKU24896, RKU24895,
RKU11755 (chất ức chế protease Serpin I4 từ vi khuẩn); RKZ34327 (protein vi
khuẩn họ serpin); WP_068816727 (chất ức chế protease Serpin I4 từ vi khuẩn
Phormidesmis priestleyi), WP_058997120 (chất ức chế protease Serpin I4 từ vi
khuẩn Leptolyngbya sp. NIES-2104), WP_106255732 (chất ức chế protease Serpin
I4 từ vi khuẩn Leptolyngbya frigida), WP_048868337 (chất ức chế protease Serpin
I4 từ vi khuẩn Scytonema tolypothrichoides), RCJ36945 (chất ức chế protease
Serpin I4 từ vi khuẩn Nostoc minutum NIES-26), WP_092470061 (chất ức chế
protease Serpin I4 từ vi khuẩn Desulfallas arcticus), WP_041285583 (chất ức chế
protease Serpin I4 từ vi khuẩn Desulfallas gibsoniae), AGL02566 (chất ức chế
protease Serpin I4 từ vi khuẩn Desulfallas gibsoniae DSM 7213).
Hình 3.13: (A) Mối quan hệ phát sinh gen của protein PI-QT với các serpin
khác. (B) Cấu trúc protein của PI-QT đã được dự đoán bằng SWISS-MODEL. (C)
Cấu trúc protein của PI-QT đã được dự đoán bằng (PS)2-v2.
Cây phân loại protein dựa trên phương pháp neighbor-joining giữa protein
PI-QT với 2 loại serpin vi khuẩn khác đã được xây dựng (Hình 3.13 A): một loại
serpin từ một ngành ứng viên của vi khuẩn ban đầu được xác định trong hệ vi sinh
78
vật của hải miên biển và một serpin khác từ vi khuẩn ngành Firmicutes và
Cyanobacteria. Dựa trên dữ liệu so sánh, protein PI-QT có thể thấy là một loại
serpin vi khuẩn mới. Cấu trúc protein của PI-QT được dự đoán theo mô hình
SWISS- MODEL (Hình 3.13 B) và (PS) 2-v2 (Hình 3.13 C).
Gen PI-QT cũng đã được đăng ký trên ngân hàng gen NCBI với mã số
MK359987.1 (Phụ lục 10).
3.4.2. Thiết kế vectơ biểu hiện pET-32a(+) mang gen PI-QT
Gen PI-QT được gắn thêm 2 điểm cắt của enzyme giới hạn EcoRI và NotI
vào hai đầu của gen và tách dòng vào vectơ pUC57 (GenScript, Mỹ). Do đó, để gắn
gen PI-QT vào vectơ biểu hiện pET-32a(+), vectơ pUC57 chứa gen PI-QT và pET-
32a(+) đã được xử lý bằng enzyme EcoRI và NotI (Hình 3.14 A), sau đó được tinh
sạch lại bằng kít tinh sạch gel (Fermentas, Mỹ).
M 1 2 3 M 1 2 3 4 5
6.0
kb
2.7 kb
1.3 kb
Hình 3.14. Gel agarose của vectơ cắt bằng EcoRI/NotI (A) và gel agarose của plasmid
tái tổ hợp được cắt bằng enzyme EcoRI/ NotI (B)
(A): giếng M: Marker DNA 1 kb (Thermo); giếng 1: Vectơ pET-32a(+) cắt mở vòng
bằng EcoRI/NotI; giếng 2: Gen PI-QT tinh sạch; giếng 3: Vectơ [pUC57/ PI-QT] được
cắt bằng EcoRI/NotI.
(B): giếng M: Marker 1kb (Thermo); giếng 1: Plasmid [pET-32a(+)/PI-QT]; giếng 2, 3,
4: Plasmid [pET-32a(+)/PI-QT] cắt bởi enzyme EcoRI/ NotI; giếng 5: Vectơ pET-
32a(+).
79
Gen PI-QT được đưa vào vectơ biểu hiện pET-32a(+) đã mở vòng sử dụng
enzyme T4 DNA ligase, và biến nạp vào chủng E. coli TOP10F', sau đó trải trên đĩa
LB có bổ sung ampicillin (50 μg/mL). Một vài khuẩn lạc trắng và 1 khuẩn lạc xanh
được chọn ngẫu nhiên để tách plasmid và cắt plasmid tách được bằng enzyme
EcoRI và NotI. Phân tích trên gel agarose 1 % cho thấy có 1 băng ~ 1,3 kb (tương
đương kích thước của g
Các file đính kèm theo tài liệu này:
- luan_an_sang_loc_va_bieu_hien_gen_ma_hoa_protein_uc_che_prot.pdf