BẢNG KÍ HIỆU VÀ CHỮ VIẾT TẮT .i
DANH MỤC HÌNH.iv
DANH MỤC BẢNG.v
MỞ ĐẦU .1
CHƢƠNG 1. TỔNG QUAN.2
1.1. Lignocellulose và hệ enzyme phân giải lignocellulose.2
1.1.1. Cấu trúc lignocellulose .2
1.1.1.1. Cellulose.2
1.1.1.2. Hemicellulose.3
1.1.1.3. Lignin .4
1.1.2. Hệ enzyme phân giải lignocellulose.4
1.1.2.1. Enzyme tiền xử lý .5
1.1.2.2. Hemicellulase.6
1.1.2.3. Cellulase.7
1.1.2.4. Hoạt động của cellulosome.9
1.2. Hệ vi sinh vật dạ cỏ dê - nguồn khai thác lignocellulase tiềm năng11
1.2.1. Cấu trúc hệ tiêu hóa ở dê.11
1.2.2. Hệ vi sinh vật dạ cỏ động vật nhai lại .12
1.2.3. Enzyme thủy phân lignocellulose có nguồn gốc từ vi sinh vật dạ cỏ .16
1.3. Metagenomics .19
1.3.1. Khái quát về phương pháp metagenomics .19
1.3.2. Các phương pháp tiếp cận tìm gen mới bằng Metagenomics .19
1.3.2.1. Phân lập gen từ thư viện DNA metagenome.20
1.3.2.2. Khai thác và phân lập gen từ dữ liệu trình tự DNA metagenome .21
42 trang |
Chia sẻ: anan10 | Lượt xem: 671 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu đa dạng hệ vi khuẩn và enzyme thủy phân lignocellulose từ dữ liệu metagenome của vi khuẩn trong dạ cỏ dê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
có khả năng xúc tác (scaffodin) và vùng enzyme. Hai thành phần
chính này được lắp ghép thành cellulosome hoàn chỉnh nhờ ái lực liên kết cao của
cohesin trên protein khung với dokerin thuộc miền mang hoạt tính xúc tác. Tất cả
các enzyme thuộc cellulosome đều chứa dockerin. Dockerin có kích thước khoảng
70 axit amin với hai đoạn lặp (khoảng 22 axit amin) và thường định vị ở đầu C của
enzyme trong phức hệ. Cohesin là trình tự dài 150 axit amin, phân bố lặp ngẫu
nhiên trên protein khung [32]. Tương tác cohesin-dockerin đóng vai trò quan trọng
trong sự hình thành cellulosme và có tính đặc hiệu cao. Ví dụ, protein khung của C.
thermocellum chứa 9 cohesin loại I và một cohesin loại II ở đầu C. Tuy nhiên,
cohesin loại II không nhận biết dockerin loại I nằm ở vùng xúc tác mà nhận biết
10
dockerin loại II định vị trên protein bề mặt tế bào vi khuẩn. Cohesin/dockerin loại I
không thể tương tác được với dockerin/cohesin loại II đã đảm bảo phức hệ được lắp
ráp chính xác và phân biệt với liên kết trên bề mặt tế bào [64]. Ngoài ra, tương tác
này còn mang tính đặc trưng cho loài. Nhóm nghiên cứu của Page và cộng sự
(1997) đã chứng minh được dockerin của enzyme cellulosome ở C. cellulolyticum
không nhận biết và liên kết với cohesin của scaffoldin ở C. thermocellum [78].
Protein khung trong cellulosome đóng nhiều vai trò liên kết: (1) liên kết phức
hệ cellulosome (2) liên kết với cơ chất đặc hiệu và (3) liên kết với protein trên bề mặt
tế bào. Protein khung có thể chứa số lượng cohesin khác nhau từ 1 đến 11 (thường
trên 4) dẫn đến nhiều loại enzyme khác nhau có thể được liên kết vào cellulosome.
Các enzyme của cellulosome gồm có cellulase, hemicellulase, pectinase, chitinase và
nhiều enzyme phụ trợ giúp phân giải thành tế bào thực vật. Vì vậy, cellulosome có
khả năng thủy phân hiệu quả hơn hẳn các enzyme thủy phân tự do đơn lẻ. Trong khi
cohesin giúp liên kết với các enzyme thủy phân thì vai trò liên kết với cơ chất thuộc
về yếu tố CBM. Đến nay, tất cả yếu tố CBM thuộc scaffoldin của cellulosome được
nghiên cứu đều nằm trong họ CBM3. Đây là họ CBM có liên kết mạnh với bề mặt
cellulose tinh thể, giải thích cho tính đặc hiệu của cellulosome với cơ chất của chúng
[6].
Hình 1.5. Cấu trúc cellulosome của C. thermocellum [1]
11
Thành phần scaffoldin (CipA) liên kết với thành tế bào vi khuẩn thông qua tương tác giữa cohesin
loại II và dockerin loại II. CipA chứa một CBM giúp phức hệ bám vào cơ chất và cohesin loại I
liên kết với dockerin loại I của đơn vị xúc tác.
Tóm lại, phức hệ cellulosome có những ưu thế vượt trội, làm tăng hiệu quả
thủy phân cellulose như sau:
Tổ chức phức hệ là tối ưu nhờ tỉ lệ và vị trí sắp xếp hợp lý giữa các
thành phần trong phức hệ
Cấu trúc không gian tối ưu, tránh tình trạng cản trở hoạt động giữa các
thành phần.
Không có cạnh tranh liên kết giữa các thành phần do toàn bộ phức hệ
liên kết với một vị trí duy nhất thông qua domain liên kết mạnh nhưng độ đặc
hiệu thấp, liên kết với phổ rộng vị trí trên thành tế bào thực vật.
Sự thủy phân diễn ra liên tiếp đến sản phẩm cuối nhờ hỗn hợp các
enzyme có hoạt tính khác nhau
1.2. Hệ vi sinh vật dạ cỏ dê - nguồn khai thác lignocellulase tiềm năng
1.2.1. Cấu trúc hệ tiêu hóa ở dê
Dê thuộc lớp Thú (Mammalia) trong họ Bò (Bovidae), bộ Guốc chẵn
(Artiodactyla). Ở Việt Nam, dê đã được nuôi từ lâu nhằm mục đích lấy thịt và sữa,
trong đó các giống dê phổ biến là dê Cỏ, dê Bách Thảo, dê Boer...
Giống như phần lớn các đại diện khác cùng họ, dê là động vật ăn cỏ. Chúng
không có răng cửa cũng như răng nanh. Việc lấy thức ăn hoàn toàn phụ thuộc vào
phần lợi cứng trên, răng cửa dưới, môi và lưỡi. Để tiêu hóa và hấp thụ được nguồn
thức ăn nghèo dinh dưỡng này, dạ dày của dê có cấu tạo kép gồm bốn ngăn (túi): Ba
túi trước (dạ cỏ, dạ tổ ong, dạ lá sách) và túi thứ tư tương tự dạ dày của động vật dạ
dày đơn, gọi là dạ múi khế. Trong đó, dạ cỏ là dạ lớn nhất, chiếm hầu hết nửa trái
khoang bụng, từ cơ hoành đến xương chậu. Thành trong dạ cỏ tạo thành những nếp
gấp lớn và được bao phủ bởi các nhú gai. Đâyđược coi là một bể lên men kị khí, là
nơi cư trú của nhiều loài vi sinh vật. Hệ vi sinh vật này tiết ra một hệ các enzyme
phân giải phong phú biến dạ cỏ trở thành một bể lên men kị khí tự nhiên. Các quá
trình lên men chính được diễn ra ở đây nhờ các enzyme tạo bởi hệ vi sinh vật này.
12
Hình 1.6. Cấu trúc hệ tiêu hóa dê.
Từ trái qua phải lần lượt là dạ cỏ, dạ tổ ong, dạ múi khế và dạ lá sách
1.2.2. Hệ vi sinh vật dạ cỏ động vật nhai lại
Hệ vi sinh vật trong dạ cỏ của động vật nhai lại rất đa dạng, bao gồm vi
khuẩn, vi khuẩn cổ, động vật nguyên sinh, nấm và thực khuẩn thể. Ở dạ cỏ hoạt
động bình thường, protein và carbohydrate được lên men bởi một hệ vi sinh vật
phức tạp này tạo ra axit béo bay hơi (VFAs), NH4, CO2 và H2. Trong đó, VFA được
hấp thụ qua thành dạ cỏ là nguồn năng lượng chủ yếu cho động vật ăn cỏ. Vi khuẩn
là nhóm chiếm ưu thế trong hệ vi sinh vật (1010 - 1011 trên 1ml dịch dạ cỏ [56]).
Dựa trên môi trường sống, vi khuẩn dạ cỏ được chia thành 4 nhóm: (1) vi khuẩn
sống tự do trong pha lỏng; (2) vi khuẩn sống bám trên thức ăn; (3) vi khuẩn trên
biểu mô dạ cỏ và (4) vi khuẩn cộng sinh trên bề mặt động vật nguyên sinh [17, 69].
Trong đó, nhóm liên kết với thức ăn chiếm tỉ lệ cao tới 70% tổng số vi khuẩn và
đóng vai trò chủ đạo trong hoạt động của các enzyme phân giải endoglucanse và
xylanse [69, 71]. Dựa trên các gen đích (rrs hoặc mcrA), phân tích qPCR cho thấy
có khoảng từ 108 đến 1010 bản sao gen của vi khuẩn cổ trên 1 gram dịch dạ cỏ. Vi
khuẩn cổ dạ cỏ chủ yếu thuộc nhóm sinh metan. Chúng đóng vai trò trong việc duy
trì nồng độ H+ thấp nhờ việc chuyển hóa CO2, giúp duy trì môi trường pH gần trung
tính phù hợp cho quá trình phân giải lignocellulose. Nấm chỉ chiếm tỉ lệ nhỏ
(khoảng 8%) trong thành phần sinh vật của hệ sinh thái dạ cỏ nhưng cũng có vai trò
nhất định trong quá trình phân giải thức ăn [48]. Hoạt động phối hợp nhịp nhàng
giữa các loài vi sinh vật trong dạ cỏ đem đến hiệu quả phân giải thức ăn cho động
vật ăn cỏ. Không có một thành viên nào trong quần xã sinh vật có thể độc lập
13
chuyển hóa được hoàn toàn lignocellulose, tinh bột hay protein mà chúng cần hợp
tác tham gia vào một chuỗi quá trình phân giải cơ chất theo từng nấc để đưa đến sản
phẩm cuối cùng.
Ban đầu, các phương pháp định loại truyền thống dựa trên nuôi cấy như phân
lập, liệt kê và xác định đặc tính dinh dưỡng được sử dụng để nghiên cứu độ đa dạng
của hệ vi sinh vật dạ cỏ của động vật nhai lại. Nhóm nghiên cứu của Dehority và
Grubb sau khi phân lập và nuôi cấy vi khuẩn trong dạ cỏ dê (Capra hircus) chỉ xác
định được 11 nhóm vi khuẩn, trong đó có Butyrivibrio fibriosolvens, Streptoccous
bovis, Bacteroides ruminicola, họ Peptococcaceae, một số loài thuộc chi
Bacteroides và một số nhóm chưa thể định loại. Bằng phương pháp này, hơn 200
loài vi khuẩn và ít nhất 100 loài động vật nguyên sinh và nấm đã được xác định
trong dạ cỏ của một số động vật nhai lại. Tuy nhiên, những kết quả này không đại
diện được cho tính đa dạng của toàn bộ hệ vi sinh vật trong khu hệ bởi phần lớn vi
sinh vật trong dạ cỏ không thể nuôi cấy được. Với sự phát triển của công nghệ,
nhiều phương pháp nghiên cứu đa dạng không cần nuôi cấy đã ra đời như phân tích
trình tự gen 16S/18S rRNA, giải trình tự hệ gen, kĩ thuật dấu vân tay DNA (DNA
fingerprinting) hay Metagenomics. Ứng dụng phương pháp phân tích trình tự gen
16S rRNA hệ vi sinh vật dạ cỏ gia súc có trên dữ liệu Ribosomal Database Project
đến năm 2010, nhóm nghiên cứu của Kim và cộng sự (2011) công bố có 13.478
trình tự thuộc về khoảng 7.000 loài vi khuẩn và 3.516 trình tự thuộc về khoảng
1.500 loài vi khuẩn cổ, lần lượt chiếm khoảng 79% và 21% bộ dữ liệu trình tự phân
tích [54]. Đáng chú ý là nghiên cứu này chỉ ra rằng chỉ có 6,5% trình tự vi khuẩn và
1,7% trình tự vi khuẩn cổ thuộc về nhóm có thể nuôi cấy được cho thấy những hạn
chế của các phương pháp truyền thống dựa trên nuôi cấy khi đánh giá độ đa dạng
sinh vật. Ngoài ra, tiềm năng sinh vật trong hệ sinh thái dạ cỏ động vật nhai lại là rất
lớn do trong tổng số các loài vi khuẩn và vi khuẩn cổ được phân tích mới chỉ có 88
loài vi khuẩn và sáu chi vi khuẩn cổ đã được biết đến.Theo kết quả này, các trình tự
vi khuẩn được phân chia thành 5.271 đơn vị phân loại (operation taxonomic
units_OTUs) ở mức độ loài (khoảng cách di truyền 0,03) đại diện cho 19 ngành
hiện có. Trong đó, các ngành Firmicutes (2958 OTUs), Bacteroidetes (1610 OTUs)
14
và Proteobacteria (226 OTUs) là các ngành chiếm ưu thế, 16 ngành vi khuẩn còn
lại chỉ chiếm dưới 3% được xếp thành nhóm ngành thiểu số. Hơn 90% trình tự
thuộc ngành Firmicutes được xác định nằm trong lớp Clostridia, còn lại thuộc các
lớp Bacilli, Erysipelotrichi và nhóm chưa xác định. Trong lớp Clostridia, các họ
Lachnospiraceae, Ruminococcaceae và Veillonellaceae được tìm thấy nhiều nhất
với các chi phổ biến là Butyrivibrio, Acetivibrio, Ruminococcus, Succiniclasticum,
Pseudobutyrivibrio và Mogibacterium. Ngoài ra, phổ biến trong lớp Bacilli là chi
Streptococci. Đối với vi khuẩn thuộc ngành Bacteroidetes, hầu hết các trình tự
(88,5%) được xếp vào lớp Bacteroidia (15 chi), phần còn lại thuộc lớp
Sphingobacteria (2 chi) và nhóm chưa định loại được đến lớp. Trong lớp
Bacteroidia, chi Prevotella chiếm ưu thế với các loài chủ yếu là Prevotella
ruminicola, Prevotella brevis, Prevotella bryantii và Prevotella albensis. Tất cả
năm lớp của ngành Proteobacteria đều có mặt khi phân tích dữ liệu dạ cỏ. Lớp
Gammaproteobacteria chiếm khoảng 73% số lượng trình tự với các chi
Ruminobacter, Succinivibrio, Escherichia/Shigella và Pseudomonas (số lượng trình
tự mỗi chi chiếm khoảng 2% các trình tự Gammaproteobacteria). Ngoài ra, các
trình tự thuộc nhóm Cổ khuẩn cũng được xác định. Hầu hết các trình tự vi khuẩn cổ
trong dữ liệu được xác định thuộc ngành Euryarchaeota. Trong đó, hơn 90% trình
tự thuộc cổ khuẩn sinh metan chi Methanobrevibacter (>60%), Methanomicrobium
(~15%) và một nhóm cổ khuẩn không thể nuôi cấy được xếp vào nhóm rumen
cluster C (~16%). Hai nhóm Cổ khuẩn chi Methanobrevibacter chiếm ưu thế là M.
gottschalkii (bao gồm M. gottschalkii, M. thaueri và M. millerae) và M.
ruminantium (M. ruminantium và M. olleyae).
Nhiều loài nấm kị khí cũng được tìm thấy trong mẫu dịch dạ cỏ và phân của
động vật nhai lại. Nấm trong dạ cỏ chiếm khoảng 10% tổng số sinh khối, độ đa
dạng phụ thuộc vào thành phần dinh dưỡng và cơ thể vật chủ [58]. Chúng được xếp
vào ngành nấm mới riêng biệt Neocallimastigomycota. Nghiên cứu trên 267 287
trình tự, Liggenstoffer và cộng sự đã phân loại được một phần nhóm nấm này vào
các chi Neocallimastix, Piromyces, Anaeromyces, Caecomyces, Orpinomyces và
Cyllamyces [65]. Trong đó, chi Piromyces chiếm ưu thế với 36% số trình tự. Chi
15
Orpinomyces và Cyllamyces có số lượng ít nhất với 1,1% và 0,7% số trình tự. Tuy
nhiên, vẫn còn khoảng 38,3% trình tự chưa được phân loại, không tương ứng các
chi đã có.
Vi khuẩn được tìm thấy trong dạ cỏ của động vật nhai lại chủ yếu là vi khuẩn
Gram (-), số lượng vi khuẩn Gram (-) tăng lên khi tăng lượng thức ăn chứa nhiều
năng lượng. Hầu hết chúng chỉ sống được trong điều kiện yếm khí, pH tối ưu sinh
trưởng từ 6,0 đến 6,9 và nhiệt độ tối ưu là 39oC, phù hợp với điều kiện môi trường
trong dạ cỏ [51]. Thành phần vi khuẩn dạ cỏ thay đổi tùy theo loài động vật, tuổi và
thành phần thức ăn. Sử dụng kỹ thuật giải trình tự pyrosequencing để xác định
thành phần vi khuẩn trong dạ cỏ của động vật nhai lại từ một đến hai năm tuổi, Jami
và cộng sự đã khẳng định quần thể vi khuẩn dạ cỏ được hình thành rất sớm sau khi
con non được sinh ra thông qua hiện tượng giảm số lượng các nhóm vi khuẩn hiếu
khí và vi khuẩn hiếu khí tùy ý đồng thời tăng nhóm vi khuẩn kỵ khí [47]. Hệ vi
khuẩn có thể truyền từ mẹ sang con non qua âm đạo, bề mặt vú, da hoặc nước bọt
và do đó phụ thuộc rất nhiều vào tương tác giữa mẹ và con non. Một số nhóm vi
khuẩn cần thiết cho chức năng của dạ cỏ trưởng thành, đặc biệt là vi khuẩn phân
giải cellulose có thể được phát hiện ngay từ ngày tuổi đầu tiên, trước khi thực phẩm
rắn được tiêu thụ. Chế độ dinh dưỡng của động vật cũng ảnh hưởng đến thành phần
và số lượng của hệ vi sinh vật trong dạ cỏ của chúng. Nhóm nghiên cứu của
Kocherginskaya đã phân tích độ đa dạng vi sinh vật dạ cỏ của bò ở hai chế độ ăn
khác nhau: chủ yếu là ngô và chủ yếu là cỏ khô [55]. Kết quả là hệ vi sinh vật giữa
hai nhóm tiêu thụ nguồn thức ăn khác nhau có sự khác biệt rõ rệt. Trong khi, vật
nuôi chủ yếu tiêu thụ ngô có lượng vi khuẩn nhiều và đa dạng hơn với nhóm
Cytophaga- Flavobacter-Bacteroides và Proteobacteria còn nhóm tiêu thụ cỏ khô
có độ đa dạng thấp hơn và vi khuẩn chiếm ưu thế là nhóm gram dương hàm lượng
G+C thấp. Nghiên cứu trên dạ cỏ trâu, Berseem và cộng sự đưa ra thành phần vi
sinh vật chủ yếu bao gồm Ruminococcus albusand và R. flavefaciens (59.8%),
Bacteroides succinogenes (Fibrobacter succinogenes) (19.2%), Butyrivibrio
fibrisolvens (11.1%), Clostridium lochheadi (3.8%) và C. longisporum (1.3%) [51].
Trong khi đó, phân tích thành phần vi khuẩn ở pha rắn và pha lỏng trong dạ cỏ dê
16
(Capra hircus), nhóm nghiên cứu của Cunha chỉ ra nhóm vi khuẩn ưu thế ở cả hai
pha là Firmicutes và Bacteroidetes [16]. Tuy nhiên, khi phân tích gần 1500 trình tự
từ dữ liệu DNA metagenome hệ vi sinh vật cũng từ dạ cỏ dê, Lim và cộng sự lại
đưa ra kết quả nhóm vi khuẩn Prevotella ruminicola 23, Butyrivibrio proteoclasticu
B316 và Butyrivibrio fibrisolvens chiếm số lượng nhiều nhất [66]. Dù thành phần vi
khuẩn ưu thế khác nhau nhưng nhìn chung đây đều là những vi khuẩn có khả năng
sản sinh ra các enzyme phân giải lignocellulose, thành phần chính trong thức ăn của
động vật nhai lại
1.2.3. Enzyme thủy phân lignocellulose có nguồn gốc từ vi sinh vật dạ cỏ
Vi sinh vật trong hệ tiêu hóa nói chung và trong dạ cỏ nói riêng là đối tượng
nghiên cứu rộng rãi trong suốt 50 năm qua. Nhiều nhóm nghiên cứu đã phân lập và
xác định được các chủng vi sinh vật có trong dạ cỏ của một số động vật nhai lại
khác nhau. Trong số đó, nhiều loài được chứng minh là có khả năng phân hủy
lignocellulose, chủ yếu là nấm và vi khuẩn kị khí như Anaeromyces mucronatus,
Caecomyces communis, Cyllamyces aberensis, Fibrobacter succinogenes,
Ruminococcus flavefaciens, Ruminococcus albus, Butyrivibrio fibrisolvens,
Prevotellaruminicola, Eubacterium cellulosolvens và Eubacterium
ruminantium[18, 56]. Cùng với đó, những enzyme phân giải có nguồn gốc từ các
vi sinh vật này cũng được phát hiện và nghiên cứu.
Varel và Dehority (1989) đánh giá hệ vi khuẩn trong dạ cỏ bò đã cho thấy F.
succinogenes, R. flavefaciens và R. albus chiếm tỉ lệ cao trong tổng số vi khuẩn
phân giải lignocellulose (lần lượt là 33%, 2,6% và 46%) [104]. Ngoài ra, khả năng
thủy phân cellulose của ba loại vi khuẩn này cao hơn nhiều so với các nhóm vi
khuẩn thủy phân khác cư trú trong dạ cỏ. Do đó, F. succinogenes, R. flavefaciens và
R. albus được coi là đại diện cho nhóm vi khuẩn dạ cỏ có khả năng phân giải
lignocellulose. Ngoài ra, Butyrivibrio fibrisolvens và Prevotella.sp cũng được chú ý
nhờ khả năng phân giải xylan.
Ba nhóm enzyme phân giải cellulose quan trọng là endoglucanase,
exoglucanase và β-glucosidase đều được phát hiện ở vi sinh vật phân giải
lignocellulose dạ cỏ. Những enzyme này thuộc 14 họ GH, chủ yếu là họ GH5 và 9.
17
Exoglucanase GH6 chỉ được tìm thấy ở nấm kị khí. Các enzyme chuyển hóa xylan
như endo-β-1,4-xylanases, β-xylosidase hay endoxylanase cũng được tìm thấy trong
dạ cỏ. Nhóm có số lượng lớn nhất đến từ họ GH10 và 11. Một số hemicellulase phụ
trợ khác như acetyl xylan esterase và feruloyl esterase thuộc các họ GH 1, 2, 3, 4 và
6 cũng được sản xuất bởi vi sinh vật dạ cỏ [59].Từ những năm 90, nhiều gen mã hóa
cho các enzyme có hoạt tính cellulase, hemicellulase từ chúng đã được phân lập
bằng phương pháp tách dòng phân tử và biểu hiện trong Escherichia coli [5, 31, 52,
89]. Ở F. succinogenes, gen mã cho endoglucanase, cel-3, là gen đầu tiên được giải
trình tự [70] và sau đó ít nhất bảy trình tự glucanse khác cũng được công bố [33,
67]. Nhiều gen mã cho endoglucanase được tìm thấy như endB, celD, celE, celF,
celG và gần đây nhất là endA [15]. Các enzyme này đều thuộc họ GH5 hoặc GH9,
trừ celF thuộc họ GH51. Sự phát triển của công nghệ giải trình tự mới đã mở ra
cách tiếp cận mới: phân tích trình tự toàn bộ hệ gen. Trình tự hệ gen của F.
succinogenes, R. albus và P. ruminicola dòng 23 đã được giải mã và công bố. Năm
2003, nhóm nghiên cứu của Morrison và cộng sự đã thực hiện dự án giải trình tự hệ
gen của F. succinogenes S85 [72]. Dữ liệu này đã cho thấy có 104 khung đọc mở
(ORF) liên quan tới các enzyme thủy phân lignocellulose bao gồm 83 glycosyl
hydrolase, 7 pectate lyase và 14 carbohydrate esterase nằm trong 49 họ enzyme
khác nhau. Trong đó, đã xác định được 24 gen endoglucanase và cellodextrinase
thuộc các họ 2, 3, 5, 8, 10, 13 và 32; 23 gen khác mã cho xylanase và các enzyme
liên quan. So sánh với dữ liệu phân tích một phần hệ gen của R. flavefaciens FD1,
trong khoảng 4 Mb dữ liệu R. flavefaciens chỉ có 65 gen liên quan tới glycosyl
hydrolase, 12 gen polysaccharide lyase, 23 gen carbohydrate esterase và phát hiện
các gen mã cho yếu tố CBM [50]. Như vậy, F. succinogenes có số lượng và độ đa
dạng về enzyme thủy phân lignocellulose cao hơn R. flavefaciens. Ngoài những
enzyme phân giải tự do, những vi khuẩn này cũng tiết ra phức hệ enzyme phân giải
hiệu quả cellulosome. Trong số những cellulosome được nghiên cứu, cellulosome
tiết ra từ R. flavefaciens có cấu trúc khác biệt nhất [82]. Ở một số loài vi khuẩn như
Clostridium thermocellum, Acetivibrio cellulolyticus và Bacteroides cellulosolven,
cellulosome liên kết với thành tế bào vi khuẩn thông qua một protein bề mặt chứa
18
vùng bề mặt tương đồng (SLH). Trong khi đó, cellulosome của R. flavefaciens lại
tương tác hóa trị với bề mặt tế bào nhờ khung protein ScaE có motif tín hiệu
sortase, một trong những enzyme liên quan tới protein neo vào thành tế bào vi
khuẩn Gram (-), ở đầu C. Với kết cấu phức tạp nhưng linh hoạt, dạng cellulosome
này đã đem đến khả năng phân giải thành tế bào thực vật hiệu quả cao cho R.
flavefaciens.
Ở phạm vi rộng hơn, dữ liệu Metagenome giúp nghiên cứu toàn bộ các gen
liên quan đến tổng hợp enzyme phân giải từ tất cả các vi sinh vật có mặt trong dạ
cỏ. Giải mã hệ gen vi sinh vật sống bám trên cơ chất thực vật được ủ trong dạ cỏ bò,
nhóm nghiên cứu của Hess và cộng sự thu được 268 gigabase dữ liệu metagenomic
DNA [42]. Tiếp đó, 27.755 gen có hoạt tính trên carbohydrate như endoglucanase,
β-glucosidase và cellobiohydrolase đã được dự đoán, 80 ORFs chứa cohesin
domain và 188 ORFs chứa dokerin domain. Trong số 90 gen tiềm năng đã được
biểu hiện, 57% gen mã cho protein biểu hiện hoạt tính phân giải cellulose. Nhóm
nghiên cứu cũng lắp ráp thành công 15 hệ gen của vi sinh vật không nuôi cấy được.
Từ thư viện BAC metagenome hệ vi sinh vật dạ cỏ bò với khoảng 6000 dòng, Gong
và cộng sự (2012) đã phân tích và lựa chọn từ 25 dòng có hoạt tính trên cellulose
được một gen mã cho cellullase, Cel14b22, hoạt động tối ưu ở pH 6.0 và 50oC với
độ ổn định ở phạm vi pH rộng từ 4.0 đến 10.0 [39]. Ngoài ra, nhóm nghiên cứu của
Rashamuse cũng tìm được hai gen cel5A và cel5B mã hóa cho hai enzyme mang
hoạt tính kép endo-cellulase/xylanase có nguồn gốc từ vi khuẩn dạ cỏ bò [81]. Với
dữ liệu hệ gen vi sinh vật dạ cỏ trâu, Nguyễn Hồng Nhung và các cộng sự tại Trung
tâm quốc gia về kĩ thuật di truyền và công nghệ sinh học, Thái Lan đã phân tích và
tìm ra 15 ORFs liên quan tới enzyme phân giải lignocellulose chủ yếu thuộc họ
GH5. Đồng thời, enzyme BT-01 có hoạt tính cellulase ở pH thấp [75]. Nhiều nhóm
enzyme lignocellulase đã được nghiên cứu từ hệ gen vi sinh vật dạ cỏ của động vật
nhai lại. Tuy nhiên, nghiên cứu DNA metagenome hệ vi sinh vật dạ cỏ chủ yếu tập
trung vào một số gia súc như trâu, bò và cừu, đến nay mới chỉ có duy nhất dự án
phân tích tin sinh học hệ enzyme phân giải thành tế bào thực vật của nhóm tác giả
trường Đại học Quốc gia Seoul, Hàn Quốc thực hiện trên dê [66]. Trong số 0,2 Mb
19
metagenome của vi sinh vật trong dạ cỏ dê được giải trình tự và lắp ráp thành 114
031 contig, nhóm đã tìm được khoảng 80 trình tự có vùng dockerin-1, nhiều trình tự
mã hóa vùng CBM thuộc nhiều họ (nhiều nhất là CBM 4-9 với gần 100 trình tự và
khoảng 50 trình tự mã hóa các vùng CBM khác như CBM 2, 3, 5, 11, 49, X-2) và
trên 100 trình tự mã cho Fibronectin 3.
1.3. Metagenomics
1.3.1. Khái quát về phương pháp metagenomics
Metagenomics (nghiên cứu đa hệ gen) là phương pháp nghiên cứu (phân
tích) đa hệ gen (Metagenome) của tất cả các vi sinh vật thu nhận trực tiếp từ mẫu
môi trường tự nhiên mà không thông qua nuôi cấy [40, 44, 93]. Metagenomics bắt
nguồn từ ý tưởng tách dòng DNA trực tiếp từ các mẫu môi trường của Pace vào
năm 1991. Đến năm 1995, Healy và cộng sự đã xây dựng được một thư viện DNA
metagenome của các sinh vật trong cỏ khô và tìm được dòng có hoạt tính cellulase
từ thư viện. Sau thành công của Healy và cộng sự, rất nhiều thư viện DNA
metagenome của vi sinh vật trong các môi trường sống đã được xây dựng nhằm
khai thác gen cũng như nghiên cứu sự đa dạng vi sinh vật, ví dụ môi trường nước
biển [10, 85, 105], môi trường đất [109]. Cho đến nay, sau hơn 20 năm phát triển,
Metagenomics trở thành một công cụ mạnh mẽ được sử dụng rất rộng rãi để nghiên
cứu sự đa dạng vi sinh vật, chức năng của chúng, sự tương tác và tiến hóa trong các
môi trường như đất, nước, hệ tiêu hóa của động vật và người, dạ cỏ của động vật
nhai lại [46, 103]...
1.3.2. Các phương pháp tiếp cận tìm gen mới bằng Metagenomics
Metagenomics nghiên cứu đa hệ gen quần xa ̃sinh vâṭ thông qua ba bư ớc: (1)
tách chiết DNA metagenome của vi sinh vật trong mẫu thu thập; (2) thiết lập thư
viện DNA metagenome hoặc giải trình tư ̣DNA metagenome và (3) sàng lọc hoặc
phân lập gen mong muốn. Những bước khai thác metagenome về cơ bản tương tự
như genome nhưng các trình tự thu được có tính bao quát, đại diện cho một quần xã
sinh vật. Đặc biệt là phương pháp này không phụ thuộc vào bước nuôi cấy, thích
hợp nghiên cứu hệ vi sinh vật thuộc hệ sinh thái mini đặc biệt như dạ cỏ, ruột mối
20
chứa hàm lượng lớn vi sinh vật kị khí khó nuôi cấy hay hệ sinh thái khắc nhiệt như
ở suối nước nóng.
Metagenomics tiếp cận metagenome theo hai phương pháp chính là (1) phân
lập gen dựa trên việc thiết lập thư viện DNA metagenome và (2) khai thác trình tự
DNA và phân lập gen dựa trên dữ liệu giải trình tự DNA metagenome. Trong đó,
cách tiếp cận thứ hai đang ngày càng trở nên có ưu thế hơn [46, 77].
1.3.2.1. Phân lập gen từ thư viện DNA metagenome
Trong giai đoạn đầu phát triển, cách tiếp cận metagenome chủ yếu được sử
dụng là phân lập gen dựa vào thư viện DNA metagenome. Phương pháp này tiến
hành theo các bước như sau: Trước hết, DNA metagenome được tách chiết trực tiếp
từ mẫu môi trường. Tiếp theo, hệ gen vi sinh vật thu được sẽ bị phân cắt bởi
enzyme giới hạn để tạo thành các đoạn DNA nhỏ hơn. Kích thước của các đoạn
DNA này phải vừa đủ để chứa trọn vẹn trình tự của gen mong muốn. Bước tiếp theo
là đưa các đoạn DNA vào vector thích hợp và chuyển vào chủng vi sinh vật chủ. Từ
đó, thư viện metagenome được xây dựng với số lượng dòng đủ lớn, đảm bảo chứa
được toàn bộ các gen trong hệ gen. Cuối cùng, các gen trong từng dòng được biểu
hiện và sàng lọc trên môi trường có cơ chất đặc hiệu tùy thuộc gen được quan tâm.
Từ đó, các dòng mang gen mã hóa cho tính trạng mong muốn sẽ được lựa chọn, giải
trình tự để thu được trình tự gen. Nhiều cellulase từ thư viện DNA metagenome của
vi sinh vật trong dạ cỏ trâu, manh tràng thỏ hoặc vi sinh vật sống trong chất thải của
nhà máy giấy đa ̃đươc̣ phát hiêṇ nhờ phương pháp này [26, 29, 108].
Trước đây, các thư viện được xây dựng với những đoạn DNA chèn có kích
thước nhỏ hơn 10kb. Với sự ra đời của các vector mang mới như cosmid, fosmid
hay BAC đã nâng kích thước đoạn chèn lên khoảng 40-200 kb, đảm bảo xác suất
chứa trọn ven gen trong một đoạn chèn. Tế bào chủ thường được dùng là E. coli.
Ngoài ra, một số dòng tế bào khác bao gồm Streptomyces lividans, Rhizobium
leguminosarum, Pseudomonas aeruginosa, Pseudomonas putida và Ralstonia
metallidurans có thể sử dụng để phát hiện các chất chuyển hóa thứ sinh và hợp chất
có hoạt tính sinh học mới [88]. Để đảm bảo thư viện bao hàm được tất cả hệ gen thì
chất lượng thư viện phải cao và số lượng dòng phải đủ lớn. Tuy nhiên, điều này lại
21
dẫn đến việc phân lập gen dựa trên việc sàng lọc thư viện DNA metagenome tốn r
Các file đính kèm theo tài liệu này:
- 01050003347_6714_2002646.pdf