Luận án Xác định và phân tích hoàn chỉnh trình tự hệ gen ty thể của 6 giống lợn bản địa tại một số tỉnh miền bắc Việt Nam

LỜI CAM ĐOAN .i

LỜI CẢM ƠN.ii

MỤC LỤC. iii

DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIỆT TẮT.v

DANH MỤC CÁC BẢNG .vi

DANH MỤC CÁC HÌNH .vii

MỞ ĐẦU .1

Chương 1. TỔNG QUAN TÀI LIỆU .4

1.1. Nguồn gốc, phân loại và quá trình thuần hóa lợn nhà.4

1.1.1. Nguồn gốc . 4

1.1.2. Phân loại . 5

1.1.3. Quá trình thuần hóa. 5

1.2. Đặc điểm và một số ứng dụng của hệ gen ty thể.7

1.2.1. Đặc điểm cấu trúc hệ gen ty thể ở động vật có vú. 7

1.2.2. Một số ứng dụng của hệ gen ty thể. 9

1.3. Phát sinh chủng loại phân tử, xây dựng và phân tích cây phát sinh chủng

loại phân tử.11

1.3.1. Cây phát sinh chủng loại . 11

1.3.2. Phân tích phát sinh chủng loại. 13

1.4. Tình hình nghiên cứu sử dụng mtDNA trên các giống lợn.17

1.4.1. Nghiên cứu các giống lợn trên thế giới . 17

1.4.2. Nghiên cứu giống lợn Việt Nam. 19

Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU .25

2.1. Đối tượng và địa điểm nghiên cứu .25

2.1.1. Đối tượng. 25

2.1.2. Địa điểm. 25

2.2. Hóa chất và thiết bị.28

2.2.1. Hóa chất. 28

2.2.2. Thiết bị. 30

2.3. Phương pháp nghiên cứu .30

2.3.2. Phương pháp tách chiết DNA tổng số. 32

2.3.3. Khuếch đại mtDNA. 33

2.3.4. Xác định trình tự hệ gen ty thể. 33

2.3.5. Nhóm phương pháp lắp ráp, dóng hàng trình tự, dự đoán và chú giải hệ gen. 35

pdf146 trang | Chia sẻ: honganh20 | Ngày: 03/03/2022 | Lượt xem: 391 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận án Xác định và phân tích hoàn chỉnh trình tự hệ gen ty thể của 6 giống lợn bản địa tại một số tỉnh miền bắc Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ít nhất 2 biến thể (Ỉ với 3 vị trí, Hạ Lang và Hương mỗi giống có 1 vị trí) (bảng 3.17). Kết quả so sánh trình tự tương đồng cho thấy độ tương đồng cao về trình tự D-loop giữa giống Hạ Lang và giống Hương (hai giống bản địa có cùng nơi cư trú tại địa bàn tỉnh Cao Bằng). Đây là cơ sở để xây dựng giả thuyết nguồn gốc giống giữa hai giống lợn Hạ Lang và Hương có phải có chung nguồn gốc hoặc thực chất chỉ là một giống. Để khẳng định điều này cần có các nghiên cứu dựa trên các chỉ thị di truyền khác cũng như các nghiên cứu về đặc điểm hình thái học. 77 Bảng 3.17. Các vị trí SNP trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam STT Giống Vị trí Ỉ Mường Khương Mường Lay Móng Cái Hạ Lang Hương 1 24 G/A - - - - - 2 183 T/C - - - - - 3 215 T/C - - - - - 4 242 T/C T/C T/C T/C - - 5 280 - C/T C/T - - - 6 407 - - - T/C T/C T/C 7 454 - C/T C/T C/T C/T C/T 8 503 A/G - - - - - 9 562 T/C - - - - - 10 706 G G - G - - 11 714 A - A - - - 12 736 - - A - - - 13 734 G/G/A - - - - - 14 744 A - - - - - 15 746 - - A - - - 16 754 G/G/A - - - - - 17 756 - - A - - - 18 764 G/G/A - - - - - 19 766 - - A - - - 20 774 A - - - - - 21 776 - - A - - - 22 791 C - - - - - 23 813 - T/T/C - - - - 24 1032 A/G - - - - - 25 1165 - - - - A/C/A A/C/A "T/C": Vị trí có 1 biến thể thay thế nucleotide; "G/G/A": Vị trí có mặt ít nhất 2 biến thể; "-": Vị trí không có đa hình. Khi so sánh khác biệt trình tự vùng D-loop của nhóm lợn bản địa Việt Nam với các nhóm lợn khác trên thế giới có thể thấy tại vị trí nucleotide thứ 454 (hình 3.5.) tất cả các nhóm lợn Việt Nam trừ lợn Ỉ khác biệt với hầu hết các giống lợn còn lại ở biến thể này (C/T). Dóng hàng đa trình tự vùng D-loop cho thấy, vùng trình tự này của giống lợn Ỉ mang khá nhiều các điểm khác biệt với 5 giống lợn bản địa Việt 78 Nam còn lại, trong đó có một số điểm có sự khác biệt với hầu hết các giống lợn khác trên thế giới. Kết quả này cũng phù hợp với kết quả phân tích chỉ số tương đồng khi giống lợn Ỉ là giống có chỉ số tương đồng thấp nhất, so với 5 giống lợn bản địa Việt Nam còn lại. Hình 3.5. Vị trí khác biệt trên trình tự vùng D-loop của các giống lợn bản địa Việt Nam và các giống lợn đã được công bố sau khi dóng hàng đa trình tự Đa phần các khác biệt trình tự vùng D-loop của lợn Ỉ với các giống lợn khác này là đơn nucleotide. Với đoạn trình tự so sánh từ nucleotide thứ 151 tới vị trí nucleotide thứ 200 được thể hiện ở hình 3.6. 79 Hình 3.6. Một phần trình tự D-loop của lợn Ỉ và các giống lợn đã được công bố sau khi tiến hành sắp xếp. Kết quả tại hình 3.6 cho thấy tại các vị trí 154 (T/C), 159 (G/A), 182 (C/T) hay tại các vị trí khác như 295 (G/A), 307 (T/C), (phần này không được thể hiện trên hình) trình tự lợn Ỉ có sự khác biệt với các giống lợn Duroc, Hampshire, Iberian, Landrace, Large White, Pietrain, WB-European thuộc Châu Âu; giống lợn Jeju, giống lợn bản địa Hàn Quốc, giống lợn hoang WB-China northeast thuộc Châu Á. Bên cạnh đó ở các giống WB-Korea, WB-Malaysia cũng có các khác biệt với lợn Ỉ tại vị trí nucleotide thứ 182 (C/T). Vị trí nucleotide thứ 183, ngoại trừ các giống lợn Banna mini và Wei có trình tự tương đồng là C, các giống lợn còn lại đều có trình tự chung là T. Ngoài ra còn có các vị trí khác không được thể hiện trên hình như nucleotide thứ 215, 242, 503, cũng là các điểm mà trình tự lợn Ỉ khác biệt với hầu hết các giống lợn khác, đa phần là các giống lợn Châu Âu. 80 3.4.2. Trình tự vùng mã hóa hệ gen ty thể 3.4.2.1. Mức độ tương đồng Trình tự hệ gen ty thể của các giống lợn nghiên cứu sau khi đã được loại bỏ vùng D-loop, so sánh mức độ tương đồng, kết quả thu được hệ số tương đồng được thể hiện tại bảng 3.18. Các giống lợn trong nhóm lợn Lang của Việt Nam (Hạ Lang, Hương và Móng Cái) có mức độ tương đồng với nhau khá cao. Hai giống bản địa tại tỉnh Cao Bằng (Hương và Hạ Lang) thể hiện mức độ gần gũi về di truyền khi so sánh trình tự vùng mã hóa với chỉ số tương đồng cao (0,999). So với vùng D-loop, trình tự vùng mã hóa của giống Ỉ không thể hiện mức độ đặc trưng cao. Có thể thấy sự khác biệt của giống lợn Ỉ so với các giống lợn khác chủ yếu tập trung ở vùng kiểm soát của hệ gen ty thể. Kết quả so sánh tương đồng cũng cho thấy ngoài giống lợn rừng Malaysia, giống lợn Lanyu của Trung Quốc cũng có độ tương đồng thấp nhất so với các giống còn lại. 81 Bảng 3.18. So sánh tương đồng các trình tự vùng mã hóa hệ gen ty thể của 6 giống lợn Việt Nam với các giống lợn trên thế giới TT Các giống lợn 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 Aba ID 2 Xiang 0.996 ID 3 Bamei 0.996 0.998 ID 4 Huzu 0.996 0.999 0.999 ID 5 Bihu199 0.963 0.965 0.966 0.966 ID 6 Wei 0.996 0.998 0.999 0.999 0.966 ID 7 WBJiangxi 0.996 0.998 0.998 0.999 0.966 0.998 ID 8 WBFuijan 0.995 0.997 0.997 0.998 0.964 0.997 0.997 ID 9 WBYunnan 0.991 0.994 0.994 0.994 0.961 0.994 0.994 0.993 ID 10 WBVietnam 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.994 ID 11 Dahe 0.993 0.996 0.996 0.996 0.963 0.996 0.996 0.997 0.991 0.996 ID 12 Halang 0.994 0.997 0.997 0.997 0.964 0.997 0.997 0.996 0.992 0.996 0.994 ID 13 Huong 0.995 0.997 0.997 0.997 0.964 0.997 0.997 0.996 0.993 0.997 0.995 0.999 ID 14 Lantang 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.993 0.997 0.995 0.998 0.998 ID 15 Mongcai 0.994 0.997 0.997 0.997 0.964 0.997 0.997 0.997 0.992 0.996 0.995 0.998 0.998 0.998 ID 16 WBHainan 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.996 0.994 0.998 0.995 0.996 0.996 0.997 0.996 ID 17 Banna_Mini 0.995 0.997 0.997 0.998 0.965 0.997 0.997 0.996 0.993 0.998 0.995 0.996 0.996 0.997 0.995 0.997 ID 18 I 0.989 0.992 0.992 0.992 0.959 0.992 0.992 0.993 0.988 0.993 0.994 0.992 0.992 0.991 0.992 0.992 0.994 ID 19 Muongkhuong0.995 0.997 0.997 0.997 0.964 0.997 0.997 0.997 0.993 0.996 0.996 0.997 0.997 0.996 0.997 0.996 0.996 0.993 ID 20 Muonglay 0.989 0.992 0.992 0.992 0.959 0.992 0.992 0.993 0.987 0.991 0.994 0.992 0.992 0.991 0.992 0.991 0.991 0.995 0.994 ID 21 Jinhua 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.993 0.998 0.995 0.996 0.996 0.997 0.996 0.997 0.997 0.991 0.996 0.991 ..33 .. 33 82 3.4.2.2. Mức độ khác biệt So sánh sự khác biệt trình tự mã hóa cho phép tìm kiếm sự sai khác trình tự của hệ gen ty thể ngoại trừ vùng trình tự D-loop với sự đa dạng cao đã được so sánh riêng. Kết quả, các vùng có mức độ khác biệt thường rơi vào các vùng gen mã hóa cho protein và tRNA, trong khi các vùng còn lại khá bảo thủ. Bên cạnh đó, trong số các biến thể SNP đáng chú ý có biến thể tại vị trí 2250 nằm trên gen mã hóa 12S rRNA. Tất cả các giống bản địa Việt Nam ngoại trừ giống Ỉ không có biến thể (C/T) nằm ở vùng này, trong khi hầu hết các giống lợn khác đều có, kết quả này được minh chứng ở hình 3.7. So sánh một số vùng trình tự khác trong nội bộ các giống lợn Châu Âu và Châu Á cho thấy sự tương đồng cao, nhưng khi so sánh giữa hai vùng địa lý Á, Âu này lại thấy tồn tại sự khác biệt tại một số vị trí nucleotide thứ 4365 và 4386 (G/A) hay 6857 (A/T) và 6884 (G/A). Các giống lợn Châu Âu ngoại trừ Duroc và Landraces có thêm vị trí khác biệt tại 4398 (T/C). Tại các vị trí biến đổi khác như: 1560 (C/T), 1913 (A/G), 1988 (C/T), thuộc vùng gen 12S rRNA; 2539 (T/C), 2990 (T/C), thuộc vùng gen 16S rRNA, cũng như: 15652 (C/T), 15688 (T/C), thuộc vùng gen Cytb và những điểm nằm phân bố trên một số gen mã hóa cho protein khác, cho thấy trình tự của các giống lợn Châu Âu khác biệt so với các giống lợn bản địa Việt Nam. Hình 3.7. Biến thể trình tự tại vị trí nucleotide 2250 vùng mã hóa hệ gen ty thể các giống lợn Tại hình 3.8 cũng minh họa một sự khác biệt về trình tự, biến thể xuất hiện tại vị trí nucleotide 11318 thuộc vùng gen ND5, trong đó sự thay thế nucleotide C/T 83 xảy ra hầu hết ở các giống lợn nhà và lợn rừng khác trên thế giới. Sáu giống lợn bản địa Việt Nam không có biến thể này, ngoại trừ giống lợn Ỉ. Kết quả so sánh biến thể trình tự này thể hiện có sự tương đồng giữa giống lợn Ỉ với giống Banamini (ở lưu vực sông Mekong); giữa nhóm 5 giống lợn Việt Nam (Hương, Móng Cái, Mường Lay, Mường Khương và Hạ Lang) với giống lợn Lantang (ở khu vực miền nam Trung Quốc) cho phép đưa ra những dự đoán về những mối liên hệ gần gũi trong quá trình phát sinh chủng loài giữa các giống lợn này. Điều này sẽ được kiểm chứng trong kết quả phân tích về phát sinh chủng loại được trình bày ở phần sau. Hình 3.8. Biến thể trình tự tại vị trí nucleotide 11318 trình tự vùng mã hóa hệ gen ty thể các giống lợn Tương tự như khi so sánh trình tự vùng D-loop, trong số nhóm các giống lợn bản địa Việt Nam, trình tự mã hóa của giống lợn Ỉ có sự khác biệt lớn nhất so với các giống còn lại. Cụ thể, so sánh trình tự hệ gen ty thể của lợn Ỉ với các giống lợn khác, thấy nhiều điểm khác biệt. Hình 3.9 thể hiện các khác biệt cho các vùng gen đó, vùng được lựa chọn làm đại diện là hai đoạn trình tự nhỏ lần lượt thuộc các gen ND1 (hình 3.9.A) và COX1 (hình 3.9.B). Trong các đoạn này, giữa các giống lợn Châu Âu cho thấy sự tương đồng cao, và giữa các giống Châu Á và cả lợn Ỉ cũng có độ tương đồng trình tự cao nhưng giữa hai vùng địa lý này lại tồn tại sự khác biệt về 84 trình tự như tại vị trí nucleotide thứ 4365 và 4386 (G/A) hay 6857 (A/T) và 6884 (G/A), các giống lợn Châu Âu ngoại trừ Duroc và Landraces có thêm vị trí khác biệt tại 4398 (T/C). Ngoài ra, một số giống Châu Á như Lanyu hay WB-China northeast cũng cho thấy một số sự đồng khác biệt với giống Châu Âu tại một số điểm như tại vị trí 4386 (G/A) và vị trí 6884 của Lanyu chuyển G thành A. Lanyu cũng có sự biến đổi tại vị trí 6857 nhưng nucleotide biến đổi là G. WB-China northeast cũng có thêm một vị trí biến đổi tại 6876 (G/A). Giống lợn WB-Malaysia có ba vị trí biến đổi tại 4371, 4374 và 6889. Bihu có một vị trí khác biệt tại 4356 (A/G) và Dahe có một vị trí khác biệt tại 6890 (T/C). 85 Hình 3.9. Một phần trình tự hoàn chỉnh của lợn Ỉ và các giống lợn đã được công bố sau khi tiến hành sắp xếp. A. Một phần trình tự gen ND1, B. Một phần trình tự gen COX1 Kết quả so sánh đa hình trình tự mtDNA giữa các giống lợn nhằm tìm ra các điểm tương đồng và khác biệt, qua đó đã phần nào giải thích được mức độ đa dạng di truyền trong nội bộ các giống lợn Việt Nam và một số giống lợn khác trên thế giới. Kết quả so sánh ở hai vùng trình tự của hệ gen ty thể cũng cho thấy mức độ tương đồng cao trong nội bộ các giống lợn Châu Âu và Châu Á. Mặt khác, những thay thế đơn phân trong chuỗi trình tự của các giống lợn bản địa Việt Nam có xu hướng tương đồng hơn với các giống lợn Châu Á so với các giống Châu Âu. Các biến thể trình tự của nhóm lợn Việt Nam tại các vị trí chưa được liệt kê ở trên chủ yếu là khác biệt đối với các giống lợn Châu Âu. Có thể thấy, các giống lợn bản địa Việt Nam có điểm chung là trong hệ gen ty thể phần lớn các vị trí biến thể có sự khác biệt lớn với nhóm lợn Châu Âu. Điều này giúp đưa ra hai nhận định, thứ nhất là có mức độ tương đồng tương đối cao về trình tự mtDNA giữa các giống lợn Châu Âu với nhau và giữa các giống Châu Á với nhau. Nhận định này phù hợp với quan điểm của Yu và cs (2013) khi cho rằng 86 các giống lợn nhà Châu Âu có mối liên hệ gần theo dòng mẹ, tồn tại một khoảng cách p gần như bằng nhau giữa giống lợn rừng Châu Âu với các giống lợn kiểu Âu (0,0168) và với các giống lợn kiểu Á (0,0181) [30]. Thứ hai, các giống lợn bản địa Việt Nam có xu hướng tương đồng hơn với nhau về trình tự mtDNA so với các giống lợn Châu Á khác. Những đặc điểm khác biệt trong trình tự hệ gen ty thể các giống lợn bản địa tạo nên những nét đặc trưng về mặt di truyền, góp phần vào việc bảo tồn các giống lợn bản địa Việt Nam. 3.5. Phân tích về quan hệ phát sinh chủng loại Quan hệ phát sinh chủng loại của 6 giống lợn bản địa Việt Nam và 17 giống lợn nhà và lợn rừng Á - Âu được xác định thông qua việc phân tích tính đa hình vùng D-loop và trình tự hoàn chỉnh hệ gen ty thể các giống lợn. Để tăng cường độ tin cậy về nguồn gốc và quan hệ phát sinh chủng loại, dữ liệu vùng D- loop và dữ liệu trình tự hoàn chỉnh được phân tích một cách độc lập để xây dựng các cây phát sinh chủng loại riêng biệt. Đối với giống lợn Móng Cái ngoài kết quả trình tự của luận án, chúng tôi còn sử dụng trình tự của nhóm tác giả Tran Thi Thuy Nhien (2016) [66] (kí hiệu trên cây phát sinh chủng loại là MongCai_TN) để xây dựng cây phát sinh chủng loại, cũng như phân tích về quan hệ tiến hóa. Các trình tự hệ gen ty thể của các giống lợn cũng được dóng hàng thông qua thuật toán MUSCLE của phần mềm MEGA nhằm xác định các vị trí tương đồng. Từ kết quả đó, các mô hình thay thế nucleotide phù hợp nhất cho trình tự D-loop và trình tự hoàn chỉnh cũng được xác định lần lượt là HKY+G và TN93+I. Phân tích phát sinh chủng loại phân tử được tiến hành dựa trên dữ liệu rời rạc bằng phương pháp suy luận Bayes, thuật toán phân tích Bayes trên phần mềm BEAST v1.8.3 với thiết lập ban đầu Yule process. Chuỗi Markov Chain Monte Carlo (MCMC) [45] 10.000.000 được sử dụng để tính toán xác suất hậu nghiệm của cây. Sau đó, cây phát sinh chủng loại sẽ được dựng bằng phần mềm Tree Annotater v.1.8.4. thông qua việc sử dụng kết quả tính toán. Cây được xác định gốc nhờ sử dụng trình tự tương đồng đối chứng của giống lợn hoang Malaysia (WB Malasia - Sus barbatus). Trình tự của giống lợn hoang Malaysia được chọn lựa là nhóm ngoại (outgroup) bởi nó được biết đến là có sự khác biệt với nhóm lợn hoang Châu Âu và Châu Á, thường được sử dụng trong các 87 nghiên cứu trước đây về phát sinh chủng loại ở lợn [63, 56]. 3.5.1. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự vùng D-loop Cây phát sinh chủng loại được xây dựng dựa trên trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam, cùng với các giống lợn nhà, các giống lợn hoang dã thuộc nhóm lợn Châu Âu (như giống lợn Duroc, Landraces, Hampshire, Pietrain, Iberian, Đại Bạch, lợn hoang Châu Âu) và lợn Châu Á (thuộc khu vực sông Mekong, khu vực Đông Bắc Á, khu vực sông Trường Giang, khu vực sông Hoàng Hà, Nam Trung Quốc). Kết quả xây dựng cây phát sinh chủng loại vùng D-loop của các giống lợn được trình bày ở hình 3.10. Cây phát sinh chủng loại cho thấy có sự phân nhánh giữa các giống lợn Châu Á và Châu Âu (giá trị bootstrap là 77%). Ước lượng khoảng cách tiến hóa thông qua tính toán khoảng cách p theo cặp được thực hiện theo phương pháp tính khả dĩ thành phần tối đa (maximum composite likelihood) bằng phần mềm MEGA7. Khoảng cách p giữa hai nhóm này là 0,0136 - 0,019. Hai giống Lanyu và WB- Malaysia là nhóm ngoại với khoảng cách tiến hóa với nhóm còn lại lần lượt nằm trong khoảng 0,0243 - 0,0296 và 0,0329 - 0,0482. Giống lợn rừng Bắc Trung Quốc (WB-China northeast) cho thấy có mối quan hệ gần gũi với các giống lợn Châu Âu. Nhóm lợn Châu Á có sự phân tách để tạo thành năm nhánh tách biệt nhau, là nhóm Đông Bắc Châu Á (North East Asia), thung lũng sông Hoàng Hà (Yellow River Valley), nhóm sông Mê Kông (Mekong River), nhóm Nam Trung Quốc (South China) và nhóm sông Trường Giang (Yangtze River Region). Giống lợn Ỉ của Việt Nam ở cùng nhánh với giống lợn Banna Mini (thuộc vùng sông Mê Kông, với khoảng cách p là 0,0006, giá trị bootstrap đạt 99%). Điều thú vị là 3 giống lợn bản địa tại vùng Đông Bắc Bộ (lợn Móng Cái, Hạ Lang, và Hương) đều có cùng cặp taxon chị em với giống lợn Lantang (thuộc vùng Nam Trung Quốc, khoảng cách p từ 0,0006 - 0,0016. Đặc biệt, giống lợn Móng Cái có quan hệ gần nhất với lợn Lantang khi là các taxon chị em trong cùng nhánh phụ), mặc dù giá trị bootstrap ủng hộ chỉ đạt 52% trên cây D-loop (hình 3.10) nhưng đạt 88% bootstrap trên cây sử dụng trình tự hệ gen hoàn chỉnh (hình 3.11). Đối với giống lợn Móng Cái, taxon MongCai_TN có trình tự mtDNA được công bố bởi Tran Thi Thuy Nhien và cs khác biệt khá lớn về kích thước và đoạn lặp so với các giống lợn khác nên nằm ở nhánh tách biệt với hầu 88 hết các giống lợn Châu Á khác và nằm rất xa với taxon từ kết quả nghiên cứu của chúng tôi. Hai giống lợn bản địa thuộc khu vực Tây Bắc Bộ (gồm lợn Mường Khương và lợn Mường Lay) có quan hệ di truyền gần gũi với giống lợn Bamei (thuộc khu vực lưu vực sông Hoàng Hà với khoảng cách p là 0,0012). Kết quả về phát sinh chủng loại thể hiện trên cây phù hợp với dự đoán về sự gần gũi giữa hai giống lợn bản địa của Việt Nam là Hương và Hạ Lang khi chúng có những sự tương đồng về hình thái và phân bố địa lý. Giá trị xác suất bootstrap tương đối thấp đối với các nút trong của nhánh các giống lợn ở khu vực miền núi phía bắc Việt Nam (Hương, Hạ Lang và Móng Cái). Điều này có thể được giải thích bởi có ít các vị trí cung cấp thông tin có mặt trong các trình tự được phân tích, khi mà chỉ có một hoặc hai vị trí nucleotide hỗ trợ cho việc tạo nút [15]. Có thể thấy trên cây chủng loại phát sinh, một giống lợn bản địa nổi tiếng của Việt Nam là lợn Ỉ, cùng với Banna mini và WB Korea nằm ở nhánh khá tách biệt với các giống lợn còn lại thuộc Châu Á. Trong đó, giống lợn Ỉ có vị trí tách biệt với 5 giống lợn bản địa Việt Nam khác. Ở phía ngoài cùng trên nhánh còn lại là hai giống lợn thuộc khu vực Mekong là Dahe và WB-Yunnan. Các giống lợn Châu Âu cho thấy mối quan hệ khá gần gũi, nằm trong cùng nhóm này là cặp taxon chị em WB-European và Iberian, khoảng cách p giữa hai giống này là 0,0004, có khoảng cách p xa hơn tới cặp này lần lượt là Pietrain (0,0004), Large White (0,0006), Hampshire (0,0019), Landraces (0,0021), Duroc (0,0035). Nhánh ngoài cùng của nhóm này lại là một giống lợn Châu Á WB-China northeast (0,0085). Nhánh phát sinh của nhóm lợn Châu Á cho thấy một sự phân nhánh khá đa dạng. Giống lợn Châu Âu Berkshire nằm ở các nhánh lân cận với các giống Châu Á. Kết quả này tương đồng với công bố trước đây về hai giống Large White và Berkshire có liên quan đến nguồn gốc Châu Á. Các nghiên cứu trước đã thông báo có 2 haplotype riêng biệt của mtDNA (Châu Á và Châu Âu) của lợn LargeWhite, cho thấy đã có sự lai chéo giữa giống lợn Châu Âu và lợn Châu Á xảy ra trong suốt quá trình hình thành giống này [115, 116]. Tương tự với giống Berkshire, các nghiên cứu cũng chỉ ra rằng một số giống lợn Trung Quốc đóng góp đáng kể vào sự phát triển của giống Berkshire [115]. Các giống lợn thuộc vùng sông Trường Giang là Wei, Bihu (0,0008) và Jinhua (0,0012) nằm khá gần nhau. Một giống lợn khác cũng thuộc khu vực sông 89 Trường Giang là WB-Jiangxi lại có quan hệ gần gũi với hai giống lợn Nam Trung Quốc là Lantang (0,001) và WB-Fuijan (0,0012). Hai đại diện duy nhất của khu vực sông Hoàng Hà là Bamei và Huzu lần lượt tạo thành nhóm với giống lợn Aba (0,0006) và Xiang (0,0008) đều thuộc khu vực sông Trường Giang. Kết quả tính toán khoảng cách p cũng cho thấy, khoảng cách trung bình tương đối gần trong nhóm các con lợn Việt Nam là 0,0039±0,00112 (trị số trung bình ± độ lệch chuẩn) so với khoảng cách p trung bình chung của nhóm lợn Việt Nam với các giống lợn Châu Âu, Châu Á là 0,01279±0,00196. Phân tích khoảng cách cặp giữa các giống lợn cho thấy, lợn Mường Lay có khoảng cách gần nhất với lợn Bamei (0,00104) của Trung Quốc. Lợn Hương có khoảng cách p lớn nhất với nhóm lợn Châu Âu khi phân tích khoảng cách p ở vùng D-loop và vùng mã hóa tương ứng là 0,0120 và 0,0144. Lợn Hương và Hạ Lang có khoảng cách p bằng 0,0000 (có sự đồng nhất 100% về trình tự). Lợn Hạ Lang và Hương có khoảng cách tiến hóa ngắn nhất với lợn Lantang (khoảng cách p = 0,00104). Khoảng cách tiến hóa của giống lợn Ỉ là xa nhất so với 5 giống lợn bản địa Việt Nam còn lại, cụ thể là giống lợn Ỉ có khoảng cách p với Hương và Hạ Lang là 0,0081; khoảng cách với 3 giống Móng Cái, Mường Khương và Mường Lay là 0,00782. Quan hệ giữa các giống lợn này được thể hiện rõ trên cây phát sinh chủng loại ở phần kết quả dưới đây, khi giống lợn Ỉ nằm ở phân nhánh xa hơn so với nhánh các giống còn lại của Việt Nam. 90 Hình 3.10. Cây phát sinh chủng loại vùng D-loop: Quan hệ phát sinh chủng loại được phân tích sử dụng phương pháp suy luận Bayes bằng phần mềm BEAST v1.8.3 [117]. Cây phát sinh chủng loại được dựng lên sử dụng phần mềm Tree Annotator, thông qua việc so sánh các trình tự ở vùng D-loop của hệ gen ty thể của 6 giống lợn bản địa Việt Nam và các giống lợn Châu Âu, Châu Á. Giá trị bootstrap được thể hiện trên các nút với 1000 lần lặp lại. Giống Móng Cái có 2 taxon (MongCai: là kết quả của Luận án, MongCai_TN là công bố của Tran Thi Thuy Nhien và cs [66]). WB-China 99 52 47 54 44 54 100 88 98 77 72 64 25 46 11 34 65 36 66 100 86 99 44 64 54 51 26 52 74 91 3.5.2. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh Sau khi trình tự hoàn chỉnh của các giống lợn Châu Âu, Châu Á được tải về từ ngân hàng gen (GenBank-NCBI), từ dữ liệu dóng hàng đa trình tự của 27 giống lợn nhà và lợn rừng Châu Âu và Châu Á, chúng tôi tiến hành xây dựng cây phát sinh chủng loại. Ở cây này, các giống lợn vẫn được phân chia một cách rõ ràng thành 2 nhánh chính: nhánh Châu Á (bao gồm cả giống Berkshire, điều này đã được lý giải bằng việc đưa ra nhận định có sự lai chéo giữa nhóm lợn Châu Âu và Châu Á diễn ra trong quá trình hình thành giống Bershire [116, 1]; nhánh Châu Âu (bao gồm cả giống lợn hoang phía Bắc Trung Quốc - WB China northest, với khoảng cách p chỉ là 0,007). Quan hệ phát sinh chủng loại của nhóm lợn Lang Việt Nam (Hương, Hạ Lang và Móng Cái) một lần nữa được khẳng định ở cây dựa trên trình tự hoàn chỉnh so với cây dựa trên trình tự vùng D-loop. Tuy nhiên đối với taxon MongCai_TN đã trở thành taxon chị em với taxon MongCai thu được từ kết quả nghiên cứu của chúng tôi. Điều này phù hợp với sự tương đồng về trình tự ở toàn bộ vùng mã hóa của hệ gen ty thể giữa hai công bố khoa học về dữ liệu trình tự hệ gen ty thể của các cá thể lợn Móng Cái. Bên cạnh đó, cả hai cây có sự tương đồng cao ở nhánh phát sinh này, cùng với những tương đồng về đặc điểm hình thái giữa giống lợn Hương và giống Lantang ở tỉnh Quảng Đông, miền nam Trung Quốc, điều này đã được nhắc tới trong nghiên cứu của Rothschild và Ruvinsky [87, 118]. Từ quan hệ phát sinh này có thể đưa ra giả thiết về nguồn gốc chung của nhóm lợn bản địa Việt Nam với lợn Lantang xuất phát từ hoạt động giao thương trong quá khứ từ hàng ngàn năm trước giữa tỉnh Quảng Đông Trung Quốc với các tỉnh biên giới miền núi phía bắc Việt Nam. Cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh hệ gen ty thể cũng cho thấy một số các hướng phân chia lớn. Đầu tiên, hai giống lợn là Lanyu và lợn hoang WB - Malaysia có sự tách biệt hẳn với những giống lợn còn lại. Chúng nằm tại các nhánh riêng biệt và xa nhất của cây với khoảng cách p lần lượt tới nhóm bên trong lần lượt là 0,0185 và 0,0303. 92 Hình 3.11. Cây phát sinh chủng loại của trình tự hoàn chỉnh: Quan hệ phát sinh chủng loại được phân tích sử dụng phương pháp suy luận Bayes bằng phần mềm BEAST v1.8.3 [117]. Cây phát sinh chủng loại được dựng lên sử dụng phần mềm Tree Annotator, thông qua việc so sánh các trình tự hoàn chỉnh của hệ gen ty thể của 6 giống lợn bản địa Việt Nam và các giống lợn Châu Âu, Châu Á. Giá trị bootstrap được thể hiện trên các nút với 1000 lần lặp lại. Giống Móng Cái có 2 taxon (MongCai: là kết quả của Luận án, MongCai_TN là công bố của Tran Thi Thuy Nhien và cs [66]). 94 44 46 35 41 56 92 84 97 36 74 54 97 99 66 100 42 54 100 95 100 64 55 55 86 39 56 93 Khoảng cách tiến hóa trung bình xác định được là tương đối gần trong nhóm các con lợn bản địa Việt Nam (0,00209) thuộc nghiên cứu này, lớn hơn khi so sánh với nhóm lợn Châu Á (0,00694) và đặc biệt có khoảng cách rất xa với nhóm lợn Châu Âu (0,01734). Khoảng cách tiến hóa gần trong nhóm lợn Lang của Việt Nam được ước lượng thông qua khoảng cách cặp giữa các trình tự đối với nhóm lợn (Hương, Hạ Lang, Móng Cái) đạt giá trị khoảng cách p trung bình ± độ lệch chuẩn là: 0,00445 ± 0,00198 trong nội bộ nhóm, cho thấy chúng có mối quan hệ gần theo dòng mẹ. Nhưng khi so sánh với các nhóm Châu Á, Châu Âu thì cho thấy sự khác biệt, khoảng cách p trung bình là (0,01743 ± 0,00179, giữa các nhóm). Phân tích khoảng cách cặp giữa các giống lợn cho thấy, lợn Mường Lay có khoảng cách gần nhất với lợn Mường Khương (0,00104), lợn Hương và Hạ Lang có khoảng cách p bằng 0,0000 (có sự đồng nhất 100% về trình tự), trật tự phân nhánh với giá trị bootstrap ủng hộ là 100%. Lợn Hạ lang và Hương có khoảng cách tiến hóa ngắn nhất với lợn Lantang (0,00104). Hai giống lợn đều có khoảng cách tiến hóa xa nhất với lợn hoang Malaysia (0,03673 và 0,03562) rồi sau đó là giống Lanyu (0,02471 và 0,02361). Phân tích về phát sinh chủng loại của trình tự vùng D-loop (hình 3.1

Các file đính kèm theo tài liệu này:

  • pdfluan_an_xac_dinh_va_phan_tich_hoan_chinh_trinh_tu_he_gen_ty.pdf
Tài liệu liên quan