Luận văn Nghiên cứu đa dạng hệ vi khuẩn và enzyme thủy phân lignocellulose từ dữ liệu metagenome của vi khuẩn trong dạ cỏ dê

BẢNG KÍ HIỆU VÀ CHỮ VIẾT TẮT .i

DANH MỤC HÌNH.iv

DANH MỤC BẢNG.v

MỞ ĐẦU .1

CHƢƠNG 1. TỔNG QUAN.2

1.1. Lignocellulose và hệ enzyme phân giải lignocellulose.2

1.1.1. Cấu trúc lignocellulose .2

1.1.1.1. Cellulose.2

1.1.1.2. Hemicellulose.3

1.1.1.3. Lignin .4

1.1.2. Hệ enzyme phân giải lignocellulose.4

1.1.2.1. Enzyme tiền xử lý .5

1.1.2.2. Hemicellulase.6

1.1.2.3. Cellulase.7

1.1.2.4. Hoạt động của cellulosome.9

1.2. Hệ vi sinh vật dạ cỏ dê - nguồn khai thác lignocellulase tiềm năng11

1.2.1. Cấu trúc hệ tiêu hóa ở dê.11

1.2.2. Hệ vi sinh vật dạ cỏ động vật nhai lại .12

1.2.3. Enzyme thủy phân lignocellulose có nguồn gốc từ vi sinh vật dạ cỏ .16

1.3. Metagenomics .19

1.3.1. Khái quát về phương pháp metagenomics .19

1.3.2. Các phương pháp tiếp cận tìm gen mới bằng Metagenomics .19

1.3.2.1. Phân lập gen từ thư viện DNA metagenome.20

1.3.2.2. Khai thác và phân lập gen từ dữ liệu trình tự DNA metagenome .21

42 trang | Chia sẻ: anan10 | Lượt xem: 975 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu đa dạng hệ vi khuẩn và enzyme thủy phân lignocellulose từ dữ liệu metagenome của vi khuẩn trong dạ cỏ dê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

có khả năng xúc tác (scaffodin) và vùng enzyme. Hai thành phần chính này được lắp ghép thành cellulosome hoàn chỉnh nhờ ái lực liên kết cao của cohesin trên protein khung với dokerin thuộc miền mang hoạt tính xúc tác. Tất cả các enzyme thuộc cellulosome đều chứa dockerin. Dockerin có kích thước khoảng 70 axit amin với hai đoạn lặp (khoảng 22 axit amin) và thường định vị ở đầu C của enzyme trong phức hệ. Cohesin là trình tự dài 150 axit amin, phân bố lặp ngẫu nhiên trên protein khung [32]. Tương tác cohesin-dockerin đóng vai trò quan trọng trong sự hình thành cellulosme và có tính đặc hiệu cao. Ví dụ, protein khung của C. thermocellum chứa 9 cohesin loại I và một cohesin loại II ở đầu C. Tuy nhiên, cohesin loại II không nhận biết dockerin loại I nằm ở vùng xúc tác mà nhận biết 10 dockerin loại II định vị trên protein bề mặt tế bào vi khuẩn. Cohesin/dockerin loại I không thể tương tác được với dockerin/cohesin loại II đã đảm bảo phức hệ được lắp ráp chính xác và phân biệt với liên kết trên bề mặt tế bào [64]. Ngoài ra, tương tác này còn mang tính đặc trưng cho loài. Nhóm nghiên cứu của Page và cộng sự (1997) đã chứng minh được dockerin của enzyme cellulosome ở C. cellulolyticum không nhận biết và liên kết với cohesin của scaffoldin ở C. thermocellum [78]. Protein khung trong cellulosome đóng nhiều vai trò liên kết: (1) liên kết phức hệ cellulosome (2) liên kết với cơ chất đặc hiệu và (3) liên kết với protein trên bề mặt tế bào. Protein khung có thể chứa số lượng cohesin khác nhau từ 1 đến 11 (thường trên 4) dẫn đến nhiều loại enzyme khác nhau có thể được liên kết vào cellulosome. Các enzyme của cellulosome gồm có cellulase, hemicellulase, pectinase, chitinase và nhiều enzyme phụ trợ giúp phân giải thành tế bào thực vật. Vì vậy, cellulosome có khả năng thủy phân hiệu quả hơn hẳn các enzyme thủy phân tự do đơn lẻ. Trong khi cohesin giúp liên kết với các enzyme thủy phân thì vai trò liên kết với cơ chất thuộc về yếu tố CBM. Đến nay, tất cả yếu tố CBM thuộc scaffoldin của cellulosome được nghiên cứu đều nằm trong họ CBM3. Đây là họ CBM có liên kết mạnh với bề mặt cellulose tinh thể, giải thích cho tính đặc hiệu của cellulosome với cơ chất của chúng [6]. Hình 1.5. Cấu trúc cellulosome của C. thermocellum [1] 11 Thành phần scaffoldin (CipA) liên kết với thành tế bào vi khuẩn thông qua tương tác giữa cohesin loại II và dockerin loại II. CipA chứa một CBM giúp phức hệ bám vào cơ chất và cohesin loại I liên kết với dockerin loại I của đơn vị xúc tác. Tóm lại, phức hệ cellulosome có những ưu thế vượt trội, làm tăng hiệu quả thủy phân cellulose như sau:  Tổ chức phức hệ là tối ưu nhờ tỉ lệ và vị trí sắp xếp hợp lý giữa các thành phần trong phức hệ  Cấu trúc không gian tối ưu, tránh tình trạng cản trở hoạt động giữa các thành phần.  Không có cạnh tranh liên kết giữa các thành phần do toàn bộ phức hệ liên kết với một vị trí duy nhất thông qua domain liên kết mạnh nhưng độ đặc hiệu thấp, liên kết với phổ rộng vị trí trên thành tế bào thực vật.  Sự thủy phân diễn ra liên tiếp đến sản phẩm cuối nhờ hỗn hợp các enzyme có hoạt tính khác nhau 1.2. Hệ vi sinh vật dạ cỏ dê - nguồn khai thác lignocellulase tiềm năng 1.2.1. Cấu trúc hệ tiêu hóa ở dê Dê thuộc lớp Thú (Mammalia) trong họ Bò (Bovidae), bộ Guốc chẵn (Artiodactyla). Ở Việt Nam, dê đã được nuôi từ lâu nhằm mục đích lấy thịt và sữa, trong đó các giống dê phổ biến là dê Cỏ, dê Bách Thảo, dê Boer... Giống như phần lớn các đại diện khác cùng họ, dê là động vật ăn cỏ. Chúng không có răng cửa cũng như răng nanh. Việc lấy thức ăn hoàn toàn phụ thuộc vào phần lợi cứng trên, răng cửa dưới, môi và lưỡi. Để tiêu hóa và hấp thụ được nguồn thức ăn nghèo dinh dưỡng này, dạ dày của dê có cấu tạo kép gồm bốn ngăn (túi): Ba túi trước (dạ cỏ, dạ tổ ong, dạ lá sách) và túi thứ tư tương tự dạ dày của động vật dạ dày đơn, gọi là dạ múi khế. Trong đó, dạ cỏ là dạ lớn nhất, chiếm hầu hết nửa trái khoang bụng, từ cơ hoành đến xương chậu. Thành trong dạ cỏ tạo thành những nếp gấp lớn và được bao phủ bởi các nhú gai. Đâyđược coi là một bể lên men kị khí, là nơi cư trú của nhiều loài vi sinh vật. Hệ vi sinh vật này tiết ra một hệ các enzyme phân giải phong phú biến dạ cỏ trở thành một bể lên men kị khí tự nhiên. Các quá trình lên men chính được diễn ra ở đây nhờ các enzyme tạo bởi hệ vi sinh vật này. 12 Hình 1.6. Cấu trúc hệ tiêu hóa dê. Từ trái qua phải lần lượt là dạ cỏ, dạ tổ ong, dạ múi khế và dạ lá sách 1.2.2. Hệ vi sinh vật dạ cỏ động vật nhai lại Hệ vi sinh vật trong dạ cỏ của động vật nhai lại rất đa dạng, bao gồm vi khuẩn, vi khuẩn cổ, động vật nguyên sinh, nấm và thực khuẩn thể. Ở dạ cỏ hoạt động bình thường, protein và carbohydrate được lên men bởi một hệ vi sinh vật phức tạp này tạo ra axit béo bay hơi (VFAs), NH4, CO2 và H2. Trong đó, VFA được hấp thụ qua thành dạ cỏ là nguồn năng lượng chủ yếu cho động vật ăn cỏ. Vi khuẩn là nhóm chiếm ưu thế trong hệ vi sinh vật (1010 - 1011 trên 1ml dịch dạ cỏ [56]). Dựa trên môi trường sống, vi khuẩn dạ cỏ được chia thành 4 nhóm: (1) vi khuẩn sống tự do trong pha lỏng; (2) vi khuẩn sống bám trên thức ăn; (3) vi khuẩn trên biểu mô dạ cỏ và (4) vi khuẩn cộng sinh trên bề mặt động vật nguyên sinh [17, 69]. Trong đó, nhóm liên kết với thức ăn chiếm tỉ lệ cao tới 70% tổng số vi khuẩn và đóng vai trò chủ đạo trong hoạt động của các enzyme phân giải endoglucanse và xylanse [69, 71]. Dựa trên các gen đích (rrs hoặc mcrA), phân tích qPCR cho thấy có khoảng từ 108 đến 1010 bản sao gen của vi khuẩn cổ trên 1 gram dịch dạ cỏ. Vi khuẩn cổ dạ cỏ chủ yếu thuộc nhóm sinh metan. Chúng đóng vai trò trong việc duy trì nồng độ H+ thấp nhờ việc chuyển hóa CO2, giúp duy trì môi trường pH gần trung tính phù hợp cho quá trình phân giải lignocellulose. Nấm chỉ chiếm tỉ lệ nhỏ (khoảng 8%) trong thành phần sinh vật của hệ sinh thái dạ cỏ nhưng cũng có vai trò nhất định trong quá trình phân giải thức ăn [48]. Hoạt động phối hợp nhịp nhàng giữa các loài vi sinh vật trong dạ cỏ đem đến hiệu quả phân giải thức ăn cho động vật ăn cỏ. Không có một thành viên nào trong quần xã sinh vật có thể độc lập 13 chuyển hóa được hoàn toàn lignocellulose, tinh bột hay protein mà chúng cần hợp tác tham gia vào một chuỗi quá trình phân giải cơ chất theo từng nấc để đưa đến sản phẩm cuối cùng. Ban đầu, các phương pháp định loại truyền thống dựa trên nuôi cấy như phân lập, liệt kê và xác định đặc tính dinh dưỡng được sử dụng để nghiên cứu độ đa dạng của hệ vi sinh vật dạ cỏ của động vật nhai lại. Nhóm nghiên cứu của Dehority và Grubb sau khi phân lập và nuôi cấy vi khuẩn trong dạ cỏ dê (Capra hircus) chỉ xác định được 11 nhóm vi khuẩn, trong đó có Butyrivibrio fibriosolvens, Streptoccous bovis, Bacteroides ruminicola, họ Peptococcaceae, một số loài thuộc chi Bacteroides và một số nhóm chưa thể định loại. Bằng phương pháp này, hơn 200 loài vi khuẩn và ít nhất 100 loài động vật nguyên sinh và nấm đã được xác định trong dạ cỏ của một số động vật nhai lại. Tuy nhiên, những kết quả này không đại diện được cho tính đa dạng của toàn bộ hệ vi sinh vật trong khu hệ bởi phần lớn vi sinh vật trong dạ cỏ không thể nuôi cấy được. Với sự phát triển của công nghệ, nhiều phương pháp nghiên cứu đa dạng không cần nuôi cấy đã ra đời như phân tích trình tự gen 16S/18S rRNA, giải trình tự hệ gen, kĩ thuật dấu vân tay DNA (DNA fingerprinting) hay Metagenomics. Ứng dụng phương pháp phân tích trình tự gen 16S rRNA hệ vi sinh vật dạ cỏ gia súc có trên dữ liệu Ribosomal Database Project đến năm 2010, nhóm nghiên cứu của Kim và cộng sự (2011) công bố có 13.478 trình tự thuộc về khoảng 7.000 loài vi khuẩn và 3.516 trình tự thuộc về khoảng 1.500 loài vi khuẩn cổ, lần lượt chiếm khoảng 79% và 21% bộ dữ liệu trình tự phân tích [54]. Đáng chú ý là nghiên cứu này chỉ ra rằng chỉ có 6,5% trình tự vi khuẩn và 1,7% trình tự vi khuẩn cổ thuộc về nhóm có thể nuôi cấy được cho thấy những hạn chế của các phương pháp truyền thống dựa trên nuôi cấy khi đánh giá độ đa dạng sinh vật. Ngoài ra, tiềm năng sinh vật trong hệ sinh thái dạ cỏ động vật nhai lại là rất lớn do trong tổng số các loài vi khuẩn và vi khuẩn cổ được phân tích mới chỉ có 88 loài vi khuẩn và sáu chi vi khuẩn cổ đã được biết đến.Theo kết quả này, các trình tự vi khuẩn được phân chia thành 5.271 đơn vị phân loại (operation taxonomic units_OTUs) ở mức độ loài (khoảng cách di truyền 0,03) đại diện cho 19 ngành hiện có. Trong đó, các ngành Firmicutes (2958 OTUs), Bacteroidetes (1610 OTUs) 14 và Proteobacteria (226 OTUs) là các ngành chiếm ưu thế, 16 ngành vi khuẩn còn lại chỉ chiếm dưới 3% được xếp thành nhóm ngành thiểu số. Hơn 90% trình tự thuộc ngành Firmicutes được xác định nằm trong lớp Clostridia, còn lại thuộc các lớp Bacilli, Erysipelotrichi và nhóm chưa xác định. Trong lớp Clostridia, các họ Lachnospiraceae, Ruminococcaceae và Veillonellaceae được tìm thấy nhiều nhất với các chi phổ biến là Butyrivibrio, Acetivibrio, Ruminococcus, Succiniclasticum, Pseudobutyrivibrio và Mogibacterium. Ngoài ra, phổ biến trong lớp Bacilli là chi Streptococci. Đối với vi khuẩn thuộc ngành Bacteroidetes, hầu hết các trình tự (88,5%) được xếp vào lớp Bacteroidia (15 chi), phần còn lại thuộc lớp Sphingobacteria (2 chi) và nhóm chưa định loại được đến lớp. Trong lớp Bacteroidia, chi Prevotella chiếm ưu thế với các loài chủ yếu là Prevotella ruminicola, Prevotella brevis, Prevotella bryantii và Prevotella albensis. Tất cả năm lớp của ngành Proteobacteria đều có mặt khi phân tích dữ liệu dạ cỏ. Lớp Gammaproteobacteria chiếm khoảng 73% số lượng trình tự với các chi Ruminobacter, Succinivibrio, Escherichia/Shigella và Pseudomonas (số lượng trình tự mỗi chi chiếm khoảng 2% các trình tự Gammaproteobacteria). Ngoài ra, các trình tự thuộc nhóm Cổ khuẩn cũng được xác định. Hầu hết các trình tự vi khuẩn cổ trong dữ liệu được xác định thuộc ngành Euryarchaeota. Trong đó, hơn 90% trình tự thuộc cổ khuẩn sinh metan chi Methanobrevibacter (>60%), Methanomicrobium (~15%) và một nhóm cổ khuẩn không thể nuôi cấy được xếp vào nhóm rumen cluster C (~16%). Hai nhóm Cổ khuẩn chi Methanobrevibacter chiếm ưu thế là M. gottschalkii (bao gồm M. gottschalkii, M. thaueri và M. millerae) và M. ruminantium (M. ruminantium và M. olleyae). Nhiều loài nấm kị khí cũng được tìm thấy trong mẫu dịch dạ cỏ và phân của động vật nhai lại. Nấm trong dạ cỏ chiếm khoảng 10% tổng số sinh khối, độ đa dạng phụ thuộc vào thành phần dinh dưỡng và cơ thể vật chủ [58]. Chúng được xếp vào ngành nấm mới riêng biệt Neocallimastigomycota. Nghiên cứu trên 267 287 trình tự, Liggenstoffer và cộng sự đã phân loại được một phần nhóm nấm này vào các chi Neocallimastix, Piromyces, Anaeromyces, Caecomyces, Orpinomyces và Cyllamyces [65]. Trong đó, chi Piromyces chiếm ưu thế với 36% số trình tự. Chi 15 Orpinomyces và Cyllamyces có số lượng ít nhất với 1,1% và 0,7% số trình tự. Tuy nhiên, vẫn còn khoảng 38,3% trình tự chưa được phân loại, không tương ứng các chi đã có. Vi khuẩn được tìm thấy trong dạ cỏ của động vật nhai lại chủ yếu là vi khuẩn Gram (-), số lượng vi khuẩn Gram (-) tăng lên khi tăng lượng thức ăn chứa nhiều năng lượng. Hầu hết chúng chỉ sống được trong điều kiện yếm khí, pH tối ưu sinh trưởng từ 6,0 đến 6,9 và nhiệt độ tối ưu là 39oC, phù hợp với điều kiện môi trường trong dạ cỏ [51]. Thành phần vi khuẩn dạ cỏ thay đổi tùy theo loài động vật, tuổi và thành phần thức ăn. Sử dụng kỹ thuật giải trình tự pyrosequencing để xác định thành phần vi khuẩn trong dạ cỏ của động vật nhai lại từ một đến hai năm tuổi, Jami và cộng sự đã khẳng định quần thể vi khuẩn dạ cỏ được hình thành rất sớm sau khi con non được sinh ra thông qua hiện tượng giảm số lượng các nhóm vi khuẩn hiếu khí và vi khuẩn hiếu khí tùy ý đồng thời tăng nhóm vi khuẩn kỵ khí [47]. Hệ vi khuẩn có thể truyền từ mẹ sang con non qua âm đạo, bề mặt vú, da hoặc nước bọt và do đó phụ thuộc rất nhiều vào tương tác giữa mẹ và con non. Một số nhóm vi khuẩn cần thiết cho chức năng của dạ cỏ trưởng thành, đặc biệt là vi khuẩn phân giải cellulose có thể được phát hiện ngay từ ngày tuổi đầu tiên, trước khi thực phẩm rắn được tiêu thụ. Chế độ dinh dưỡng của động vật cũng ảnh hưởng đến thành phần và số lượng của hệ vi sinh vật trong dạ cỏ của chúng. Nhóm nghiên cứu của Kocherginskaya đã phân tích độ đa dạng vi sinh vật dạ cỏ của bò ở hai chế độ ăn khác nhau: chủ yếu là ngô và chủ yếu là cỏ khô [55]. Kết quả là hệ vi sinh vật giữa hai nhóm tiêu thụ nguồn thức ăn khác nhau có sự khác biệt rõ rệt. Trong khi, vật nuôi chủ yếu tiêu thụ ngô có lượng vi khuẩn nhiều và đa dạng hơn với nhóm Cytophaga- Flavobacter-Bacteroides và Proteobacteria còn nhóm tiêu thụ cỏ khô có độ đa dạng thấp hơn và vi khuẩn chiếm ưu thế là nhóm gram dương hàm lượng G+C thấp. Nghiên cứu trên dạ cỏ trâu, Berseem và cộng sự đưa ra thành phần vi sinh vật chủ yếu bao gồm Ruminococcus albusand và R. flavefaciens (59.8%), Bacteroides succinogenes (Fibrobacter succinogenes) (19.2%), Butyrivibrio fibrisolvens (11.1%), Clostridium lochheadi (3.8%) và C. longisporum (1.3%) [51]. Trong khi đó, phân tích thành phần vi khuẩn ở pha rắn và pha lỏng trong dạ cỏ dê 16 (Capra hircus), nhóm nghiên cứu của Cunha chỉ ra nhóm vi khuẩn ưu thế ở cả hai pha là Firmicutes và Bacteroidetes [16]. Tuy nhiên, khi phân tích gần 1500 trình tự từ dữ liệu DNA metagenome hệ vi sinh vật cũng từ dạ cỏ dê, Lim và cộng sự lại đưa ra kết quả nhóm vi khuẩn Prevotella ruminicola 23, Butyrivibrio proteoclasticu B316 và Butyrivibrio fibrisolvens chiếm số lượng nhiều nhất [66]. Dù thành phần vi khuẩn ưu thế khác nhau nhưng nhìn chung đây đều là những vi khuẩn có khả năng sản sinh ra các enzyme phân giải lignocellulose, thành phần chính trong thức ăn của động vật nhai lại 1.2.3. Enzyme thủy phân lignocellulose có nguồn gốc từ vi sinh vật dạ cỏ Vi sinh vật trong hệ tiêu hóa nói chung và trong dạ cỏ nói riêng là đối tượng nghiên cứu rộng rãi trong suốt 50 năm qua. Nhiều nhóm nghiên cứu đã phân lập và xác định được các chủng vi sinh vật có trong dạ cỏ của một số động vật nhai lại khác nhau. Trong số đó, nhiều loài được chứng minh là có khả năng phân hủy lignocellulose, chủ yếu là nấm và vi khuẩn kị khí như Anaeromyces mucronatus, Caecomyces communis, Cyllamyces aberensis, Fibrobacter succinogenes, Ruminococcus flavefaciens, Ruminococcus albus, Butyrivibrio fibrisolvens, Prevotellaruminicola, Eubacterium cellulosolvens và Eubacterium ruminantium[18, 56]. Cùng với đó, những enzyme phân giải có nguồn gốc từ các vi sinh vật này cũng được phát hiện và nghiên cứu. Varel và Dehority (1989) đánh giá hệ vi khuẩn trong dạ cỏ bò đã cho thấy F. succinogenes, R. flavefaciens và R. albus chiếm tỉ lệ cao trong tổng số vi khuẩn phân giải lignocellulose (lần lượt là 33%, 2,6% và 46%) [104]. Ngoài ra, khả năng thủy phân cellulose của ba loại vi khuẩn này cao hơn nhiều so với các nhóm vi khuẩn thủy phân khác cư trú trong dạ cỏ. Do đó, F. succinogenes, R. flavefaciens và R. albus được coi là đại diện cho nhóm vi khuẩn dạ cỏ có khả năng phân giải lignocellulose. Ngoài ra, Butyrivibrio fibrisolvens và Prevotella.sp cũng được chú ý nhờ khả năng phân giải xylan. Ba nhóm enzyme phân giải cellulose quan trọng là endoglucanase, exoglucanase và β-glucosidase đều được phát hiện ở vi sinh vật phân giải lignocellulose dạ cỏ. Những enzyme này thuộc 14 họ GH, chủ yếu là họ GH5 và 9. 17 Exoglucanase GH6 chỉ được tìm thấy ở nấm kị khí. Các enzyme chuyển hóa xylan như endo-β-1,4-xylanases, β-xylosidase hay endoxylanase cũng được tìm thấy trong dạ cỏ. Nhóm có số lượng lớn nhất đến từ họ GH10 và 11. Một số hemicellulase phụ trợ khác như acetyl xylan esterase và feruloyl esterase thuộc các họ GH 1, 2, 3, 4 và 6 cũng được sản xuất bởi vi sinh vật dạ cỏ [59].Từ những năm 90, nhiều gen mã hóa cho các enzyme có hoạt tính cellulase, hemicellulase từ chúng đã được phân lập bằng phương pháp tách dòng phân tử và biểu hiện trong Escherichia coli [5, 31, 52, 89]. Ở F. succinogenes, gen mã cho endoglucanase, cel-3, là gen đầu tiên được giải trình tự [70] và sau đó ít nhất bảy trình tự glucanse khác cũng được công bố [33, 67]. Nhiều gen mã cho endoglucanase được tìm thấy như endB, celD, celE, celF, celG và gần đây nhất là endA [15]. Các enzyme này đều thuộc họ GH5 hoặc GH9, trừ celF thuộc họ GH51. Sự phát triển của công nghệ giải trình tự mới đã mở ra cách tiếp cận mới: phân tích trình tự toàn bộ hệ gen. Trình tự hệ gen của F. succinogenes, R. albus và P. ruminicola dòng 23 đã được giải mã và công bố. Năm 2003, nhóm nghiên cứu của Morrison và cộng sự đã thực hiện dự án giải trình tự hệ gen của F. succinogenes S85 [72]. Dữ liệu này đã cho thấy có 104 khung đọc mở (ORF) liên quan tới các enzyme thủy phân lignocellulose bao gồm 83 glycosyl hydrolase, 7 pectate lyase và 14 carbohydrate esterase nằm trong 49 họ enzyme khác nhau. Trong đó, đã xác định được 24 gen endoglucanase và cellodextrinase thuộc các họ 2, 3, 5, 8, 10, 13 và 32; 23 gen khác mã cho xylanase và các enzyme liên quan. So sánh với dữ liệu phân tích một phần hệ gen của R. flavefaciens FD1, trong khoảng 4 Mb dữ liệu R. flavefaciens chỉ có 65 gen liên quan tới glycosyl hydrolase, 12 gen polysaccharide lyase, 23 gen carbohydrate esterase và phát hiện các gen mã cho yếu tố CBM [50]. Như vậy, F. succinogenes có số lượng và độ đa dạng về enzyme thủy phân lignocellulose cao hơn R. flavefaciens. Ngoài những enzyme phân giải tự do, những vi khuẩn này cũng tiết ra phức hệ enzyme phân giải hiệu quả cellulosome. Trong số những cellulosome được nghiên cứu, cellulosome tiết ra từ R. flavefaciens có cấu trúc khác biệt nhất [82]. Ở một số loài vi khuẩn như Clostridium thermocellum, Acetivibrio cellulolyticus và Bacteroides cellulosolven, cellulosome liên kết với thành tế bào vi khuẩn thông qua một protein bề mặt chứa 18 vùng bề mặt tương đồng (SLH). Trong khi đó, cellulosome của R. flavefaciens lại tương tác hóa trị với bề mặt tế bào nhờ khung protein ScaE có motif tín hiệu sortase, một trong những enzyme liên quan tới protein neo vào thành tế bào vi khuẩn Gram (-), ở đầu C. Với kết cấu phức tạp nhưng linh hoạt, dạng cellulosome này đã đem đến khả năng phân giải thành tế bào thực vật hiệu quả cao cho R. flavefaciens. Ở phạm vi rộng hơn, dữ liệu Metagenome giúp nghiên cứu toàn bộ các gen liên quan đến tổng hợp enzyme phân giải từ tất cả các vi sinh vật có mặt trong dạ cỏ. Giải mã hệ gen vi sinh vật sống bám trên cơ chất thực vật được ủ trong dạ cỏ bò, nhóm nghiên cứu của Hess và cộng sự thu được 268 gigabase dữ liệu metagenomic DNA [42]. Tiếp đó, 27.755 gen có hoạt tính trên carbohydrate như endoglucanase, β-glucosidase và cellobiohydrolase đã được dự đoán, 80 ORFs chứa cohesin domain và 188 ORFs chứa dokerin domain. Trong số 90 gen tiềm năng đã được biểu hiện, 57% gen mã cho protein biểu hiện hoạt tính phân giải cellulose. Nhóm nghiên cứu cũng lắp ráp thành công 15 hệ gen của vi sinh vật không nuôi cấy được. Từ thư viện BAC metagenome hệ vi sinh vật dạ cỏ bò với khoảng 6000 dòng, Gong và cộng sự (2012) đã phân tích và lựa chọn từ 25 dòng có hoạt tính trên cellulose được một gen mã cho cellullase, Cel14b22, hoạt động tối ưu ở pH 6.0 và 50oC với độ ổn định ở phạm vi pH rộng từ 4.0 đến 10.0 [39]. Ngoài ra, nhóm nghiên cứu của Rashamuse cũng tìm được hai gen cel5A và cel5B mã hóa cho hai enzyme mang hoạt tính kép endo-cellulase/xylanase có nguồn gốc từ vi khuẩn dạ cỏ bò [81]. Với dữ liệu hệ gen vi sinh vật dạ cỏ trâu, Nguyễn Hồng Nhung và các cộng sự tại Trung tâm quốc gia về kĩ thuật di truyền và công nghệ sinh học, Thái Lan đã phân tích và tìm ra 15 ORFs liên quan tới enzyme phân giải lignocellulose chủ yếu thuộc họ GH5. Đồng thời, enzyme BT-01 có hoạt tính cellulase ở pH thấp [75]. Nhiều nhóm enzyme lignocellulase đã được nghiên cứu từ hệ gen vi sinh vật dạ cỏ của động vật nhai lại. Tuy nhiên, nghiên cứu DNA metagenome hệ vi sinh vật dạ cỏ chủ yếu tập trung vào một số gia súc như trâu, bò và cừu, đến nay mới chỉ có duy nhất dự án phân tích tin sinh học hệ enzyme phân giải thành tế bào thực vật của nhóm tác giả trường Đại học Quốc gia Seoul, Hàn Quốc thực hiện trên dê [66]. Trong số 0,2 Mb 19 metagenome của vi sinh vật trong dạ cỏ dê được giải trình tự và lắp ráp thành 114 031 contig, nhóm đã tìm được khoảng 80 trình tự có vùng dockerin-1, nhiều trình tự mã hóa vùng CBM thuộc nhiều họ (nhiều nhất là CBM 4-9 với gần 100 trình tự và khoảng 50 trình tự mã hóa các vùng CBM khác như CBM 2, 3, 5, 11, 49, X-2) và trên 100 trình tự mã cho Fibronectin 3. 1.3. Metagenomics 1.3.1. Khái quát về phương pháp metagenomics Metagenomics (nghiên cứu đa hệ gen) là phương pháp nghiên cứu (phân tích) đa hệ gen (Metagenome) của tất cả các vi sinh vật thu nhận trực tiếp từ mẫu môi trường tự nhiên mà không thông qua nuôi cấy [40, 44, 93]. Metagenomics bắt nguồn từ ý tưởng tách dòng DNA trực tiếp từ các mẫu môi trường của Pace vào năm 1991. Đến năm 1995, Healy và cộng sự đã xây dựng được một thư viện DNA metagenome của các sinh vật trong cỏ khô và tìm được dòng có hoạt tính cellulase từ thư viện. Sau thành công của Healy và cộng sự, rất nhiều thư viện DNA metagenome của vi sinh vật trong các môi trường sống đã được xây dựng nhằm khai thác gen cũng như nghiên cứu sự đa dạng vi sinh vật, ví dụ môi trường nước biển [10, 85, 105], môi trường đất [109]. Cho đến nay, sau hơn 20 năm phát triển, Metagenomics trở thành một công cụ mạnh mẽ được sử dụng rất rộng rãi để nghiên cứu sự đa dạng vi sinh vật, chức năng của chúng, sự tương tác và tiến hóa trong các môi trường như đất, nước, hệ tiêu hóa của động vật và người, dạ cỏ của động vật nhai lại [46, 103]... 1.3.2. Các phương pháp tiếp cận tìm gen mới bằng Metagenomics Metagenomics nghiên cứu đa hệ gen quần xa ̃sinh vâṭ thông qua ba bư ớc: (1) tách chiết DNA metagenome của vi sinh vật trong mẫu thu thập; (2) thiết lập thư viện DNA metagenome hoặc giải trình tư ̣DNA metagenome và (3) sàng lọc hoặc phân lập gen mong muốn. Những bước khai thác metagenome về cơ bản tương tự như genome nhưng các trình tự thu được có tính bao quát, đại diện cho một quần xã sinh vật. Đặc biệt là phương pháp này không phụ thuộc vào bước nuôi cấy, thích hợp nghiên cứu hệ vi sinh vật thuộc hệ sinh thái mini đặc biệt như dạ cỏ, ruột mối 20 chứa hàm lượng lớn vi sinh vật kị khí khó nuôi cấy hay hệ sinh thái khắc nhiệt như ở suối nước nóng. Metagenomics tiếp cận metagenome theo hai phương pháp chính là (1) phân lập gen dựa trên việc thiết lập thư viện DNA metagenome và (2) khai thác trình tự DNA và phân lập gen dựa trên dữ liệu giải trình tự DNA metagenome. Trong đó, cách tiếp cận thứ hai đang ngày càng trở nên có ưu thế hơn [46, 77]. 1.3.2.1. Phân lập gen từ thư viện DNA metagenome Trong giai đoạn đầu phát triển, cách tiếp cận metagenome chủ yếu được sử dụng là phân lập gen dựa vào thư viện DNA metagenome. Phương pháp này tiến hành theo các bước như sau: Trước hết, DNA metagenome được tách chiết trực tiếp từ mẫu môi trường. Tiếp theo, hệ gen vi sinh vật thu được sẽ bị phân cắt bởi enzyme giới hạn để tạo thành các đoạn DNA nhỏ hơn. Kích thước của các đoạn DNA này phải vừa đủ để chứa trọn vẹn trình tự của gen mong muốn. Bước tiếp theo là đưa các đoạn DNA vào vector thích hợp và chuyển vào chủng vi sinh vật chủ. Từ đó, thư viện metagenome được xây dựng với số lượng dòng đủ lớn, đảm bảo chứa được toàn bộ các gen trong hệ gen. Cuối cùng, các gen trong từng dòng được biểu hiện và sàng lọc trên môi trường có cơ chất đặc hiệu tùy thuộc gen được quan tâm. Từ đó, các dòng mang gen mã hóa cho tính trạng mong muốn sẽ được lựa chọn, giải trình tự để thu được trình tự gen. Nhiều cellulase từ thư viện DNA metagenome của vi sinh vật trong dạ cỏ trâu, manh tràng thỏ hoặc vi sinh vật sống trong chất thải của nhà máy giấy đa ̃đươc̣ phát hiêṇ nhờ phương pháp này [26, 29, 108]. Trước đây, các thư viện được xây dựng với những đoạn DNA chèn có kích thước nhỏ hơn 10kb. Với sự ra đời của các vector mang mới như cosmid, fosmid hay BAC đã nâng kích thước đoạn chèn lên khoảng 40-200 kb, đảm bảo xác suất chứa trọn ven gen trong một đoạn chèn. Tế bào chủ thường được dùng là E. coli. Ngoài ra, một số dòng tế bào khác bao gồm Streptomyces lividans, Rhizobium leguminosarum, Pseudomonas aeruginosa, Pseudomonas putida và Ralstonia metallidurans có thể sử dụng để phát hiện các chất chuyển hóa thứ sinh và hợp chất có hoạt tính sinh học mới [88]. Để đảm bảo thư viện bao hàm được tất cả hệ gen thì chất lượng thư viện phải cao và số lượng dòng phải đủ lớn. Tuy nhiên, điều này lại 21 dẫn đến việc phân lập gen dựa trên việc sàng lọc thư viện DNA metagenome tốn r

Các file đính kèm theo tài liệu này:

01050003347_6714_2002646.pdf