LỜI CAM ĐOAN .i
LỜI CẢM ƠN.ii
MỤC LỤC. iii
DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIỆT TẮT.v
DANH MỤC CÁC BẢNG .vi
DANH MỤC CÁC HÌNH .vii
MỞ ĐẦU .1
Chương 1. TỔNG QUAN TÀI LIỆU .4
1.1. Nguồn gốc, phân loại và quá trình thuần hóa lợn nhà.4
1.1.1. Nguồn gốc . 4
1.1.2. Phân loại . 5
1.1.3. Quá trình thuần hóa. 5
1.2. Đặc điểm và một số ứng dụng của hệ gen ty thể.7
1.2.1. Đặc điểm cấu trúc hệ gen ty thể ở động vật có vú. 7
1.2.2. Một số ứng dụng của hệ gen ty thể. 9
1.3. Phát sinh chủng loại phân tử, xây dựng và phân tích cây phát sinh chủng
loại phân tử.11
1.3.1. Cây phát sinh chủng loại . 11
1.3.2. Phân tích phát sinh chủng loại. 13
1.4. Tình hình nghiên cứu sử dụng mtDNA trên các giống lợn.17
1.4.1. Nghiên cứu các giống lợn trên thế giới . 17
1.4.2. Nghiên cứu giống lợn Việt Nam. 19
Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU .25
2.1. Đối tượng và địa điểm nghiên cứu .25
2.1.1. Đối tượng. 25
2.1.2. Địa điểm. 25
2.2. Hóa chất và thiết bị.28
2.2.1. Hóa chất. 28
2.2.2. Thiết bị. 30
2.3. Phương pháp nghiên cứu .30
2.3.2. Phương pháp tách chiết DNA tổng số. 32
2.3.3. Khuếch đại mtDNA. 33
2.3.4. Xác định trình tự hệ gen ty thể. 33
2.3.5. Nhóm phương pháp lắp ráp, dóng hàng trình tự, dự đoán và chú giải hệ gen. 35
146 trang |
Chia sẻ: honganh20 | Ngày: 03/03/2022 | Lượt xem: 380 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận án Xác định và phân tích hoàn chỉnh trình tự hệ gen ty thể của 6 giống lợn bản địa tại một số tỉnh miền bắc Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ít nhất 2 biến thể (Ỉ với 3 vị trí, Hạ Lang và Hương mỗi giống
có 1 vị trí) (bảng 3.17). Kết quả so sánh trình tự tương đồng cho thấy độ tương đồng
cao về trình tự D-loop giữa giống Hạ Lang và giống Hương (hai giống bản địa có
cùng nơi cư trú tại địa bàn tỉnh Cao Bằng). Đây là cơ sở để xây dựng giả thuyết
nguồn gốc giống giữa hai giống lợn Hạ Lang và Hương có phải có chung nguồn gốc
hoặc thực chất chỉ là một giống. Để khẳng định điều này cần có các nghiên cứu dựa
trên các chỉ thị di truyền khác cũng như các nghiên cứu về đặc điểm hình thái học.
77
Bảng 3.17. Các vị trí SNP trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam
STT
Giống
Vị trí
Ỉ
Mường
Khương
Mường
Lay
Móng
Cái
Hạ
Lang
Hương
1 24 G/A - - - - -
2 183 T/C - - - - -
3 215 T/C - - - - -
4 242 T/C T/C T/C T/C - -
5 280 - C/T C/T - - -
6 407 - - - T/C T/C T/C
7 454 - C/T C/T C/T C/T C/T
8 503 A/G - - - - -
9 562 T/C - - - - -
10 706 G G - G - -
11 714 A - A - - -
12 736 - - A - - -
13 734 G/G/A - - - - -
14 744 A - - - - -
15 746 - - A - - -
16 754 G/G/A - - - - -
17 756 - - A - - -
18 764 G/G/A - - - - -
19 766 - - A - - -
20 774 A - - - - -
21 776 - - A - - -
22 791 C - - - - -
23 813 - T/T/C - - - -
24 1032 A/G - - - - -
25 1165 - - - - A/C/A A/C/A
"T/C": Vị trí có 1 biến thể thay thế nucleotide; "G/G/A": Vị trí có mặt ít nhất 2 biến
thể; "-": Vị trí không có đa hình.
Khi so sánh khác biệt trình tự vùng D-loop của nhóm lợn bản địa Việt Nam
với các nhóm lợn khác trên thế giới có thể thấy tại vị trí nucleotide thứ 454 (hình
3.5.) tất cả các nhóm lợn Việt Nam trừ lợn Ỉ khác biệt với hầu hết các giống lợn còn
lại ở biến thể này (C/T). Dóng hàng đa trình tự vùng D-loop cho thấy, vùng trình tự
này của giống lợn Ỉ mang khá nhiều các điểm khác biệt với 5 giống lợn bản địa Việt
78
Nam còn lại, trong đó có một số điểm có sự khác biệt với hầu hết các giống lợn
khác trên thế giới. Kết quả này cũng phù hợp với kết quả phân tích chỉ số tương
đồng khi giống lợn Ỉ là giống có chỉ số tương đồng thấp nhất, so với 5 giống lợn bản
địa Việt Nam còn lại.
Hình 3.5. Vị trí khác biệt trên trình tự vùng D-loop của các giống lợn bản địa
Việt Nam và các giống lợn đã được công bố sau khi dóng hàng đa trình tự
Đa phần các khác biệt trình tự vùng D-loop của lợn Ỉ với các giống lợn khác
này là đơn nucleotide. Với đoạn trình tự so sánh từ nucleotide thứ 151 tới vị trí
nucleotide thứ 200 được thể hiện ở hình 3.6.
79
Hình 3.6. Một phần trình tự D-loop của lợn Ỉ và các giống lợn đã được công
bố sau khi tiến hành sắp xếp.
Kết quả tại hình 3.6 cho thấy tại các vị trí 154 (T/C), 159 (G/A), 182 (C/T) hay
tại các vị trí khác như 295 (G/A), 307 (T/C), (phần này không được thể hiện trên
hình) trình tự lợn Ỉ có sự khác biệt với các giống lợn Duroc, Hampshire, Iberian,
Landrace, Large White, Pietrain, WB-European thuộc Châu Âu; giống lợn Jeju,
giống lợn bản địa Hàn Quốc, giống lợn hoang WB-China northeast thuộc Châu Á.
Bên cạnh đó ở các giống WB-Korea, WB-Malaysia cũng có các khác biệt với lợn Ỉ
tại vị trí nucleotide thứ 182 (C/T). Vị trí nucleotide thứ 183, ngoại trừ các giống lợn
Banna mini và Wei có trình tự tương đồng là C, các giống lợn còn lại đều có trình
tự chung là T. Ngoài ra còn có các vị trí khác không được thể hiện trên hình như
nucleotide thứ 215, 242, 503, cũng là các điểm mà trình tự lợn Ỉ khác biệt với
hầu hết các giống lợn khác, đa phần là các giống lợn Châu Âu.
80
3.4.2. Trình tự vùng mã hóa hệ gen ty thể
3.4.2.1. Mức độ tương đồng
Trình tự hệ gen ty thể của các giống lợn nghiên cứu sau khi đã được loại bỏ
vùng D-loop, so sánh mức độ tương đồng, kết quả thu được hệ số tương đồng được
thể hiện tại bảng 3.18.
Các giống lợn trong nhóm lợn Lang của Việt Nam (Hạ Lang, Hương và Móng
Cái) có mức độ tương đồng với nhau khá cao. Hai giống bản địa tại tỉnh Cao Bằng
(Hương và Hạ Lang) thể hiện mức độ gần gũi về di truyền khi so sánh trình tự vùng
mã hóa với chỉ số tương đồng cao (0,999). So với vùng D-loop, trình tự vùng mã
hóa của giống Ỉ không thể hiện mức độ đặc trưng cao. Có thể thấy sự khác biệt của
giống lợn Ỉ so với các giống lợn khác chủ yếu tập trung ở vùng kiểm soát của hệ
gen ty thể.
Kết quả so sánh tương đồng cũng cho thấy ngoài giống lợn rừng Malaysia,
giống lợn Lanyu của Trung Quốc cũng có độ tương đồng thấp nhất so với các giống
còn lại.
81
Bảng 3.18. So sánh tương đồng các trình tự vùng mã hóa hệ gen ty thể của 6 giống lợn Việt Nam với các giống lợn trên thế giới
TT Các giống lợn
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 Aba ID
2 Xiang 0.996 ID
3 Bamei 0.996 0.998 ID
4 Huzu 0.996 0.999 0.999 ID
5 Bihu199 0.963 0.965 0.966 0.966 ID
6 Wei 0.996 0.998 0.999 0.999 0.966 ID
7 WBJiangxi 0.996 0.998 0.998 0.999 0.966 0.998 ID
8 WBFuijan 0.995 0.997 0.997 0.998 0.964 0.997 0.997 ID
9 WBYunnan 0.991 0.994 0.994 0.994 0.961 0.994 0.994 0.993 ID
10 WBVietnam 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.994 ID
11 Dahe 0.993 0.996 0.996 0.996 0.963 0.996 0.996 0.997 0.991 0.996 ID
12 Halang 0.994 0.997 0.997 0.997 0.964 0.997 0.997 0.996 0.992 0.996 0.994 ID
13 Huong 0.995 0.997 0.997 0.997 0.964 0.997 0.997 0.996 0.993 0.997 0.995 0.999 ID
14 Lantang 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.993 0.997 0.995 0.998 0.998 ID
15 Mongcai 0.994 0.997 0.997 0.997 0.964 0.997 0.997 0.997 0.992 0.996 0.995 0.998 0.998 0.998 ID
16 WBHainan 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.996 0.994 0.998 0.995 0.996 0.996 0.997 0.996 ID
17 Banna_Mini 0.995 0.997 0.997 0.998 0.965 0.997 0.997 0.996 0.993 0.998 0.995 0.996 0.996 0.997 0.995 0.997 ID
18 I 0.989 0.992 0.992 0.992 0.959 0.992 0.992 0.993 0.988 0.993 0.994 0.992 0.992 0.991 0.992 0.992 0.994 ID
19 Muongkhuong0.995 0.997 0.997 0.997 0.964 0.997 0.997 0.997 0.993 0.996 0.996 0.997 0.997 0.996 0.997 0.996 0.996 0.993 ID
20 Muonglay 0.989 0.992 0.992 0.992 0.959 0.992 0.992 0.993 0.987 0.991 0.994 0.992 0.992 0.991 0.992 0.991 0.991 0.995 0.994 ID
21 Jinhua 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.993 0.998 0.995 0.996 0.996 0.997 0.996 0.997 0.997 0.991 0.996 0.991
..33
..
33
82
3.4.2.2. Mức độ khác biệt
So sánh sự khác biệt trình tự mã hóa cho phép tìm kiếm sự sai khác trình tự
của hệ gen ty thể ngoại trừ vùng trình tự D-loop với sự đa dạng cao đã được so sánh
riêng. Kết quả, các vùng có mức độ khác biệt thường rơi vào các vùng gen mã hóa
cho protein và tRNA, trong khi các vùng còn lại khá bảo thủ. Bên cạnh đó, trong số
các biến thể SNP đáng chú ý có biến thể tại vị trí 2250 nằm trên gen mã hóa 12S
rRNA. Tất cả các giống bản địa Việt Nam ngoại trừ giống Ỉ không có biến thể (C/T)
nằm ở vùng này, trong khi hầu hết các giống lợn khác đều có, kết quả này được
minh chứng ở hình 3.7.
So sánh một số vùng trình tự khác trong nội bộ các giống lợn Châu Âu và
Châu Á cho thấy sự tương đồng cao, nhưng khi so sánh giữa hai vùng địa lý Á, Âu
này lại thấy tồn tại sự khác biệt tại một số vị trí nucleotide thứ 4365 và 4386 (G/A)
hay 6857 (A/T) và 6884 (G/A). Các giống lợn Châu Âu ngoại trừ Duroc và
Landraces có thêm vị trí khác biệt tại 4398 (T/C). Tại các vị trí biến đổi khác như:
1560 (C/T), 1913 (A/G), 1988 (C/T), thuộc vùng gen 12S rRNA; 2539 (T/C),
2990 (T/C), thuộc vùng gen 16S rRNA, cũng như: 15652 (C/T), 15688 (T/C),
thuộc vùng gen Cytb và những điểm nằm phân bố trên một số gen mã hóa cho
protein khác, cho thấy trình tự của các giống lợn Châu Âu khác biệt so với các
giống lợn bản địa Việt Nam.
Hình 3.7. Biến thể trình tự tại vị trí nucleotide 2250 vùng mã hóa hệ gen ty thể
các giống lợn
Tại hình 3.8 cũng minh họa một sự khác biệt về trình tự, biến thể xuất hiện
tại vị trí nucleotide 11318 thuộc vùng gen ND5, trong đó sự thay thế nucleotide C/T
83
xảy ra hầu hết ở các giống lợn nhà và lợn rừng khác trên thế giới. Sáu giống lợn bản
địa Việt Nam không có biến thể này, ngoại trừ giống lợn Ỉ.
Kết quả so sánh biến thể trình tự này thể hiện có sự tương đồng giữa giống
lợn Ỉ với giống Banamini (ở lưu vực sông Mekong); giữa nhóm 5 giống lợn Việt
Nam (Hương, Móng Cái, Mường Lay, Mường Khương và Hạ Lang) với giống lợn
Lantang (ở khu vực miền nam Trung Quốc) cho phép đưa ra những dự đoán về
những mối liên hệ gần gũi trong quá trình phát sinh chủng loài giữa các giống lợn
này. Điều này sẽ được kiểm chứng trong kết quả phân tích về phát sinh chủng loại
được trình bày ở phần sau.
Hình 3.8. Biến thể trình tự tại vị trí nucleotide 11318 trình tự vùng mã hóa hệ
gen ty thể các giống lợn
Tương tự như khi so sánh trình tự vùng D-loop, trong số nhóm các giống lợn
bản địa Việt Nam, trình tự mã hóa của giống lợn Ỉ có sự khác biệt lớn nhất so với
các giống còn lại. Cụ thể, so sánh trình tự hệ gen ty thể của lợn Ỉ với các giống lợn
khác, thấy nhiều điểm khác biệt. Hình 3.9 thể hiện các khác biệt cho các vùng gen
đó, vùng được lựa chọn làm đại diện là hai đoạn trình tự nhỏ lần lượt thuộc các gen
ND1 (hình 3.9.A) và COX1 (hình 3.9.B). Trong các đoạn này, giữa các giống lợn
Châu Âu cho thấy sự tương đồng cao, và giữa các giống Châu Á và cả lợn Ỉ cũng có
độ tương đồng trình tự cao nhưng giữa hai vùng địa lý này lại tồn tại sự khác biệt về
84
trình tự như tại vị trí nucleotide thứ 4365 và 4386 (G/A) hay 6857 (A/T) và 6884
(G/A), các giống lợn Châu Âu ngoại trừ Duroc và Landraces có thêm vị trí khác
biệt tại 4398 (T/C). Ngoài ra, một số giống Châu Á như Lanyu hay WB-China
northeast cũng cho thấy một số sự đồng khác biệt với giống Châu Âu tại một số
điểm như tại vị trí 4386 (G/A) và vị trí 6884 của Lanyu chuyển G thành A. Lanyu
cũng có sự biến đổi tại vị trí 6857 nhưng nucleotide biến đổi là G. WB-China
northeast cũng có thêm một vị trí biến đổi tại 6876 (G/A). Giống lợn WB-Malaysia
có ba vị trí biến đổi tại 4371, 4374 và 6889. Bihu có một vị trí khác biệt tại 4356
(A/G) và Dahe có một vị trí khác biệt tại 6890 (T/C).
85
Hình 3.9. Một phần trình tự hoàn chỉnh của lợn Ỉ và các giống lợn đã được
công bố sau khi tiến hành sắp xếp.
A. Một phần trình tự gen ND1, B. Một phần trình tự gen COX1
Kết quả so sánh đa hình trình tự mtDNA giữa các giống lợn nhằm tìm ra các
điểm tương đồng và khác biệt, qua đó đã phần nào giải thích được mức độ đa dạng
di truyền trong nội bộ các giống lợn Việt Nam và một số giống lợn khác trên thế
giới. Kết quả so sánh ở hai vùng trình tự của hệ gen ty thể cũng cho thấy mức độ
tương đồng cao trong nội bộ các giống lợn Châu Âu và Châu Á. Mặt khác, những
thay thế đơn phân trong chuỗi trình tự của các giống lợn bản địa Việt Nam có xu
hướng tương đồng hơn với các giống lợn Châu Á so với các giống Châu Âu. Các
biến thể trình tự của nhóm lợn Việt Nam tại các vị trí chưa được liệt kê ở trên chủ
yếu là khác biệt đối với các giống lợn Châu Âu.
Có thể thấy, các giống lợn bản địa Việt Nam có điểm chung là trong hệ gen
ty thể phần lớn các vị trí biến thể có sự khác biệt lớn với nhóm lợn Châu Âu. Điều
này giúp đưa ra hai nhận định, thứ nhất là có mức độ tương đồng tương đối cao về
trình tự mtDNA giữa các giống lợn Châu Âu với nhau và giữa các giống Châu Á
với nhau. Nhận định này phù hợp với quan điểm của Yu và cs (2013) khi cho rằng
86
các giống lợn nhà Châu Âu có mối liên hệ gần theo dòng mẹ, tồn tại một khoảng
cách p gần như bằng nhau giữa giống lợn rừng Châu Âu với các giống lợn kiểu Âu
(0,0168) và với các giống lợn kiểu Á (0,0181) [30]. Thứ hai, các giống lợn bản địa
Việt Nam có xu hướng tương đồng hơn với nhau về trình tự mtDNA so với các
giống lợn Châu Á khác. Những đặc điểm khác biệt trong trình tự hệ gen ty thể các
giống lợn bản địa tạo nên những nét đặc trưng về mặt di truyền, góp phần vào việc
bảo tồn các giống lợn bản địa Việt Nam.
3.5. Phân tích về quan hệ phát sinh chủng loại
Quan hệ phát sinh chủng loại của 6 giống lợn bản địa Việt Nam và 17
giống lợn nhà và lợn rừng Á - Âu được xác định thông qua việc phân tích tính đa
hình vùng D-loop và trình tự hoàn chỉnh hệ gen ty thể các giống lợn. Để tăng
cường độ tin cậy về nguồn gốc và quan hệ phát sinh chủng loại, dữ liệu vùng D-
loop và dữ liệu trình tự hoàn chỉnh được phân tích một cách độc lập để xây dựng
các cây phát sinh chủng loại riêng biệt. Đối với giống lợn Móng Cái ngoài kết
quả trình tự của luận án, chúng tôi còn sử dụng trình tự của nhóm tác giả Tran
Thi Thuy Nhien (2016) [66] (kí hiệu trên cây phát sinh chủng loại là
MongCai_TN) để xây dựng cây phát sinh chủng loại, cũng như phân tích về
quan hệ tiến hóa.
Các trình tự hệ gen ty thể của các giống lợn cũng được dóng hàng thông
qua thuật toán MUSCLE của phần mềm MEGA nhằm xác định các vị trí tương
đồng. Từ kết quả đó, các mô hình thay thế nucleotide phù hợp nhất cho trình tự
D-loop và trình tự hoàn chỉnh cũng được xác định lần lượt là HKY+G và
TN93+I. Phân tích phát sinh chủng loại phân tử được tiến hành dựa trên dữ liệu
rời rạc bằng phương pháp suy luận Bayes, thuật toán phân tích Bayes trên phần
mềm BEAST v1.8.3 với thiết lập ban đầu Yule process. Chuỗi Markov Chain
Monte Carlo (MCMC) [45] 10.000.000 được sử dụng để tính toán xác suất hậu
nghiệm của cây. Sau đó, cây phát sinh chủng loại sẽ được dựng bằng phần mềm
Tree Annotater v.1.8.4. thông qua việc sử dụng kết quả tính toán.
Cây được xác định gốc nhờ sử dụng trình tự tương đồng đối chứng của giống
lợn hoang Malaysia (WB Malasia - Sus barbatus). Trình tự của giống lợn hoang
Malaysia được chọn lựa là nhóm ngoại (outgroup) bởi nó được biết đến là có sự
khác biệt với nhóm lợn hoang Châu Âu và Châu Á, thường được sử dụng trong các
87
nghiên cứu trước đây về phát sinh chủng loại ở lợn [63, 56].
3.5.1. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự vùng D-loop
Cây phát sinh chủng loại được xây dựng dựa trên trình tự vùng D-loop của 6
giống lợn bản địa Việt Nam, cùng với các giống lợn nhà, các giống lợn hoang dã
thuộc nhóm lợn Châu Âu (như giống lợn Duroc, Landraces, Hampshire, Pietrain,
Iberian, Đại Bạch, lợn hoang Châu Âu) và lợn Châu Á (thuộc khu vực sông Mekong,
khu vực Đông Bắc Á, khu vực sông Trường Giang, khu vực sông Hoàng Hà, Nam
Trung Quốc). Kết quả xây dựng cây phát sinh chủng loại vùng D-loop của các giống
lợn được trình bày ở hình 3.10.
Cây phát sinh chủng loại cho thấy có sự phân nhánh giữa các giống lợn Châu
Á và Châu Âu (giá trị bootstrap là 77%). Ước lượng khoảng cách tiến hóa thông
qua tính toán khoảng cách p theo cặp được thực hiện theo phương pháp tính khả
dĩ thành phần tối đa (maximum composite likelihood) bằng phần mềm MEGA7.
Khoảng cách p giữa hai nhóm này là 0,0136 - 0,019. Hai giống Lanyu và WB-
Malaysia là nhóm ngoại với khoảng cách tiến hóa với nhóm còn lại lần lượt nằm
trong khoảng 0,0243 - 0,0296 và 0,0329 - 0,0482. Giống lợn rừng Bắc Trung Quốc
(WB-China northeast) cho thấy có mối quan hệ gần gũi với các giống lợn Châu Âu.
Nhóm lợn Châu Á có sự phân tách để tạo thành năm nhánh tách biệt nhau, là nhóm
Đông Bắc Châu Á (North East Asia), thung lũng sông Hoàng Hà (Yellow River
Valley), nhóm sông Mê Kông (Mekong River), nhóm Nam Trung Quốc (South
China) và nhóm sông Trường Giang (Yangtze River Region).
Giống lợn Ỉ của Việt Nam ở cùng nhánh với giống lợn Banna Mini (thuộc
vùng sông Mê Kông, với khoảng cách p là 0,0006, giá trị bootstrap đạt 99%).
Điều thú vị là 3 giống lợn bản địa tại vùng Đông Bắc Bộ (lợn Móng Cái, Hạ
Lang, và Hương) đều có cùng cặp taxon chị em với giống lợn Lantang (thuộc
vùng Nam Trung Quốc, khoảng cách p từ 0,0006 - 0,0016. Đặc biệt, giống lợn
Móng Cái có quan hệ gần nhất với lợn Lantang khi là các taxon chị em trong
cùng nhánh phụ), mặc dù giá trị bootstrap ủng hộ chỉ đạt 52% trên cây D-loop
(hình 3.10) nhưng đạt 88% bootstrap trên cây sử dụng trình tự hệ gen hoàn chỉnh
(hình 3.11). Đối với giống lợn Móng Cái, taxon MongCai_TN có trình tự
mtDNA được công bố bởi Tran Thi Thuy Nhien và cs khác biệt khá lớn về kích
thước và đoạn lặp so với các giống lợn khác nên nằm ở nhánh tách biệt với hầu
88
hết các giống lợn Châu Á khác và nằm rất xa với taxon từ kết quả nghiên cứu
của chúng tôi. Hai giống lợn bản địa thuộc khu vực Tây Bắc Bộ (gồm lợn
Mường Khương và lợn Mường Lay) có quan hệ di truyền gần gũi với giống lợn
Bamei (thuộc khu vực lưu vực sông Hoàng Hà với khoảng cách p là 0,0012).
Kết quả về phát sinh chủng loại thể hiện trên cây phù hợp với dự đoán về sự gần
gũi giữa hai giống lợn bản địa của Việt Nam là Hương và Hạ Lang khi chúng có
những sự tương đồng về hình thái và phân bố địa lý. Giá trị xác suất bootstrap
tương đối thấp đối với các nút trong của nhánh các giống lợn ở khu vực miền núi
phía bắc Việt Nam (Hương, Hạ Lang và Móng Cái). Điều này có thể được giải
thích bởi có ít các vị trí cung cấp thông tin có mặt trong các trình tự được phân
tích, khi mà chỉ có một hoặc hai vị trí nucleotide hỗ trợ cho việc tạo nút [15].
Có thể thấy trên cây chủng loại phát sinh, một giống lợn bản địa nổi tiếng
của Việt Nam là lợn Ỉ, cùng với Banna mini và WB Korea nằm ở nhánh khá tách
biệt với các giống lợn còn lại thuộc Châu Á. Trong đó, giống lợn Ỉ có vị trí tách
biệt với 5 giống lợn bản địa Việt Nam khác. Ở phía ngoài cùng trên nhánh còn lại
là hai giống lợn thuộc khu vực Mekong là Dahe và WB-Yunnan.
Các giống lợn Châu Âu cho thấy mối quan hệ khá gần gũi, nằm trong
cùng nhóm này là cặp taxon chị em WB-European và Iberian, khoảng cách p
giữa hai giống này là 0,0004, có khoảng cách p xa hơn tới cặp này lần lượt là
Pietrain (0,0004), Large White (0,0006), Hampshire (0,0019), Landraces
(0,0021), Duroc (0,0035). Nhánh ngoài cùng của nhóm này lại là một giống lợn
Châu Á WB-China northeast (0,0085).
Nhánh phát sinh của nhóm lợn Châu Á cho thấy một sự phân nhánh khá đa
dạng. Giống lợn Châu Âu Berkshire nằm ở các nhánh lân cận với các giống Châu
Á. Kết quả này tương đồng với công bố trước đây về hai giống Large White và
Berkshire có liên quan đến nguồn gốc Châu Á. Các nghiên cứu trước đã thông báo
có 2 haplotype riêng biệt của mtDNA (Châu Á và Châu Âu) của lợn LargeWhite,
cho thấy đã có sự lai chéo giữa giống lợn Châu Âu và lợn Châu Á xảy ra trong suốt
quá trình hình thành giống này [115, 116]. Tương tự với giống Berkshire, các
nghiên cứu cũng chỉ ra rằng một số giống lợn Trung Quốc đóng góp đáng kể vào sự
phát triển của giống Berkshire [115].
Các giống lợn thuộc vùng sông Trường Giang là Wei, Bihu (0,0008) và
Jinhua (0,0012) nằm khá gần nhau. Một giống lợn khác cũng thuộc khu vực sông
89
Trường Giang là WB-Jiangxi lại có quan hệ gần gũi với hai giống lợn Nam Trung
Quốc là Lantang (0,001) và WB-Fuijan (0,0012). Hai đại diện duy nhất của khu vực
sông Hoàng Hà là Bamei và Huzu lần lượt tạo thành nhóm với giống lợn Aba
(0,0006) và Xiang (0,0008) đều thuộc khu vực sông Trường Giang.
Kết quả tính toán khoảng cách p cũng cho thấy, khoảng cách trung bình
tương đối gần trong nhóm các con lợn Việt Nam là 0,0039±0,00112 (trị số trung
bình ± độ lệch chuẩn) so với khoảng cách p trung bình chung của nhóm lợn Việt
Nam với các giống lợn Châu Âu, Châu Á là 0,01279±0,00196. Phân tích khoảng
cách cặp giữa các giống lợn cho thấy, lợn Mường Lay có khoảng cách gần nhất
với lợn Bamei (0,00104) của Trung Quốc. Lợn Hương có khoảng cách p lớn nhất
với nhóm lợn Châu Âu khi phân tích khoảng cách p ở vùng D-loop và vùng mã
hóa tương ứng là 0,0120 và 0,0144. Lợn Hương và Hạ Lang có khoảng cách p
bằng 0,0000 (có sự đồng nhất 100% về trình tự). Lợn Hạ Lang và Hương có
khoảng cách tiến hóa ngắn nhất với lợn Lantang (khoảng cách p = 0,00104).
Khoảng cách tiến hóa của giống lợn Ỉ là xa nhất so với 5 giống lợn bản địa Việt
Nam còn lại, cụ thể là giống lợn Ỉ có khoảng cách p với Hương và Hạ Lang là
0,0081; khoảng cách với 3 giống Móng Cái, Mường Khương và Mường Lay là
0,00782. Quan hệ giữa các giống lợn này được thể hiện rõ trên cây phát sinh
chủng loại ở phần kết quả dưới đây, khi giống lợn Ỉ nằm ở phân nhánh xa hơn so
với nhánh các giống còn lại của Việt Nam.
90
Hình 3.10. Cây phát sinh chủng loại vùng D-loop: Quan hệ phát sinh chủng loại được phân tích sử dụng phương pháp suy
luận Bayes bằng phần mềm BEAST v1.8.3 [117]. Cây phát sinh chủng loại được dựng lên sử dụng phần mềm Tree Annotator,
thông qua việc so sánh các trình tự ở vùng D-loop của hệ gen ty thể của 6 giống lợn bản địa Việt Nam và các giống lợn Châu Âu,
Châu Á. Giá trị bootstrap được thể hiện trên các nút với 1000 lần lặp lại. Giống Móng Cái có 2 taxon (MongCai: là kết quả của
Luận án, MongCai_TN là công bố của Tran Thi Thuy Nhien và cs [66]).
WB-China
99
52
47
54
44
54
100
88
98
77
72
64
25
46
11
34
65 36
66
100
86
99
44
64
54
51
26
52
74
91
3.5.2. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh
Sau khi trình tự hoàn chỉnh của các giống lợn Châu Âu, Châu Á được tải về
từ ngân hàng gen (GenBank-NCBI), từ dữ liệu dóng hàng đa trình tự của 27 giống
lợn nhà và lợn rừng Châu Âu và Châu Á, chúng tôi tiến hành xây dựng cây phát
sinh chủng loại. Ở cây này, các giống lợn vẫn được phân chia một cách rõ ràng
thành 2 nhánh chính: nhánh Châu Á (bao gồm cả giống Berkshire, điều này đã được
lý giải bằng việc đưa ra nhận định có sự lai chéo giữa nhóm lợn Châu Âu và Châu
Á diễn ra trong quá trình hình thành giống Bershire [116, 1]; nhánh Châu Âu (bao
gồm cả giống lợn hoang phía Bắc Trung Quốc - WB China northest, với khoảng
cách p chỉ là 0,007). Quan hệ phát sinh chủng loại của nhóm lợn Lang Việt Nam
(Hương, Hạ Lang và Móng Cái) một lần nữa được khẳng định ở cây dựa trên trình
tự hoàn chỉnh so với cây dựa trên trình tự vùng D-loop. Tuy nhiên đối với taxon
MongCai_TN đã trở thành taxon chị em với taxon MongCai thu được từ kết quả
nghiên cứu của chúng tôi. Điều này phù hợp với sự tương đồng về trình tự ở toàn bộ
vùng mã hóa của hệ gen ty thể giữa hai công bố khoa học về dữ liệu trình tự hệ gen
ty thể của các cá thể lợn Móng Cái. Bên cạnh đó, cả hai cây có sự tương đồng cao ở
nhánh phát sinh này, cùng với những tương đồng về đặc điểm hình thái giữa giống
lợn Hương và giống Lantang ở tỉnh Quảng Đông, miền nam Trung Quốc, điều này
đã được nhắc tới trong nghiên cứu của Rothschild và Ruvinsky [87, 118]. Từ quan
hệ phát sinh này có thể đưa ra giả thiết về nguồn gốc chung của nhóm lợn bản địa
Việt Nam với lợn Lantang xuất phát từ hoạt động giao thương trong quá khứ từ
hàng ngàn năm trước giữa tỉnh Quảng Đông Trung Quốc với các tỉnh biên giới
miền núi phía bắc Việt Nam.
Cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh hệ gen ty thể
cũng cho thấy một số các hướng phân chia lớn. Đầu tiên, hai giống lợn là Lanyu và
lợn hoang WB - Malaysia có sự tách biệt hẳn với những giống lợn còn lại. Chúng
nằm tại các nhánh riêng biệt và xa nhất của cây với khoảng cách p lần lượt tới nhóm
bên trong lần lượt là 0,0185 và 0,0303.
92
Hình 3.11. Cây phát sinh chủng loại của trình tự hoàn chỉnh: Quan hệ phát sinh chủng loại được phân tích sử dụng phương
pháp suy luận Bayes bằng phần mềm BEAST v1.8.3 [117]. Cây phát sinh chủng loại được dựng lên sử dụng phần mềm Tree
Annotator, thông qua việc so sánh các trình tự hoàn chỉnh của hệ gen ty thể của 6 giống lợn bản địa Việt Nam và các giống lợn
Châu Âu, Châu Á. Giá trị bootstrap được thể hiện trên các nút với 1000 lần lặp lại. Giống Móng Cái có 2 taxon (MongCai: là kết
quả của Luận án, MongCai_TN là công bố của Tran Thi Thuy Nhien và cs [66]).
94
44
46
35
41
56
92
84
97
36
74
54
97
99
66
100
42
54
100
95
100
64
55
55
86
39
56
93
Khoảng cách tiến hóa trung bình xác định được là tương đối gần trong nhóm
các con lợn bản địa Việt Nam (0,00209) thuộc nghiên cứu này, lớn hơn khi so sánh
với nhóm lợn Châu Á (0,00694) và đặc biệt có khoảng cách rất xa với nhóm lợn
Châu Âu (0,01734). Khoảng cách tiến hóa gần trong nhóm lợn Lang của Việt Nam
được ước lượng thông qua khoảng cách cặp giữa các trình tự đối với nhóm lợn
(Hương, Hạ Lang, Móng Cái) đạt giá trị khoảng cách p trung bình ± độ lệch chuẩn
là: 0,00445 ± 0,00198 trong nội bộ nhóm, cho thấy chúng có mối quan hệ gần theo
dòng mẹ. Nhưng khi so sánh với các nhóm Châu Á, Châu Âu thì cho thấy sự khác
biệt, khoảng cách p trung bình là (0,01743 ± 0,00179, giữa các nhóm).
Phân tích khoảng cách cặp giữa các giống lợn cho thấy, lợn Mường Lay có
khoảng cách gần nhất với lợn Mường Khương (0,00104), lợn Hương và Hạ Lang có
khoảng cách p bằng 0,0000 (có sự đồng nhất 100% về trình tự), trật tự phân nhánh
với giá trị bootstrap ủng hộ là 100%. Lợn Hạ lang và Hương có khoảng cách tiến
hóa ngắn nhất với lợn Lantang (0,00104). Hai giống lợn đều có khoảng cách tiến
hóa xa nhất với lợn hoang Malaysia (0,03673 và 0,03562) rồi sau đó là giống Lanyu
(0,02471 và 0,02361).
Phân tích về phát sinh chủng loại của trình tự vùng D-loop (hình 3.1
Các file đính kèm theo tài liệu này:
- luan_an_xac_dinh_va_phan_tich_hoan_chinh_trinh_tu_he_gen_ty.pdf