MỞ ĐẦU . 1
CHƯƠNG 1. TỔNG QUAN NGHIÊN CỨU. 2
1.1. TỔNG QUAN VỀ ĐA HÌNH NUCLEOTIDE ĐƠN. 2
1.1.1. Đặc điểm của đa hình nucleotide đơn.2
1.1.2. Tầm quan trọng và ứng dụng của đa hình nucleotide đơn.4
1.1.2.1. Bản đồ SNP.4
1.1.2.2. Phát triển SNP và y học.5
1.1.2.3. Phát triển SNP và dược phẩm.6
1.2. HỆ GEN TY THỂ . 7
1.2.1. Đặc điểm cấu trúc và di truyền hệ gen ty thể .7
1.2.1.1. Cấu trúc hệ gen ty thể .7
1.2.1.2. Đặc điểm di truyền hệ gen ty thể.9
1.2.2. Đặc điểm vùng điều khiển (D-loop) trên ty thể.10
1.2.3. Tình hình nghiên cứu hệ gen ty thể trên thế giới và ở Việt Nam.12
1.2.3.1. Tình hình nghiên cứu trên thế giới.12
1.2.3.2. Tình hình nghiên cứu DNA ty thể tại Việt Nam.13
1.3. ĐẶC ĐIỂM DÂN TỘC HỌC CỦA CÁC DÂN TỘC TRONG NGHIÊN
CỨU . 15
1.3.1. Người Kinh.15
1.3.2. Người Cờ Lao.16
1.3.3. Người Phù Lá.17
CHƯƠNG 2. NGUYÊN VẬT LIỆU, PHƯƠNG PHÁP NGHIÊN CỨU. 19
2.1. VẬT TƯ, THIẾT BỊ . 19
2.1.1. Nguyên vật liệu.19
2.1.2. Hóa chất.18
2.1.3. Thiết bị.19
2.2. PHƯƠNG PHÁP NGHIÊN CỨU. 21
2.2.1. Tách chiết DNA tổng số .21
2.2.2. Phương pháp điện di kiểm tra trên gel agarose.22
105 trang |
Chia sẻ: honganh20 | Ngày: 03/03/2022 | Lượt xem: 451 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Nghiên cứu đặc điểm đa hình nucleotide đơn ở hai vùng siêu biến HVS-I và HVS-II trên D - Loop ty thể của một số dân tộc Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
C
E F
D
30
31
32
33
34
35
36
Hình 3.7. Kết quả so sánh trình tự vùng HVS-II với trình tự chuẩn rCRS của
120 mẫu dân tộc tộc Kinh, Cờ Lao và Phù Lá;
K01-K51: 51 mẫu dân tộc Kinh 01; C01-C34: 34 mẫu dân tộc Cờ Lao; P01-
P35: 35 mẫu dân tộc Phù Lá (.): Nucleotide trùng với nucleotide trên trình tự
chuẩn (-): nucleotide bị khuyết
37
38
39
40
41
42
43
44
Hình 3.8. Kết quả so sánh trình tự vùng HVS-I với trình tự chuẩn rCRS của
120 mẫu dân tộc tộc Kinh, Cờ Lao và Phù Lá;
K01-K51: 51 mẫu dân tộc Kinh 01; C01-C34: 34 mẫu dân tộc Cờ Lao; P01-
P35: 35 mẫu dân tộc Phù Lá (.): Nucleotide trùng với nucleotide trên trình tự
chuẩn (-): nucleotide bị khuyết
Kết quả đã phát hiện được tổng cộng 109 điểm đa hình (có trình tự
khác với trình tự tham chiếu) ở 3 dân tộc, bao gồm 71 điểm nằm trên HVS-I
và 39 điểm trên HVS-II (Bảng 3.1). Như vậy, trung bình cứ mỗi 5 nucleotide
trên vùng HVS-I và 9 nucleotide trên HVS-II sẽ xuất hiện 1 điểm đa hình. Kết
quả này cao hơn nhiều so với trung bình toàn bộ hệ gen (cứ mỗi 1000
nucleotide mới xuất hiện 1 SNP), cho thấy tốc độ đột biến rất cao ở 2 khu vực
này, đặc biệt là vùng siêu biến HVS-I.
Hầu hết các đa hình được phát hiện (108/109) là các đa hình dạng thay
thế nucleotide. Hơn 1 nửa trong số chúng là các đa hình dạng thay thế C>T và
T>C. Chỉ có duy nhất 1 đa hình thêm nucleotide là -315T,C. Đa hình này
được phát hiện với tần số rất cao (xấp xỉ 90%) ở cả 3 dân tộc. Ngoài ra còn có
2 đa hình khác cũng xuất hiện với tần số rất cao ở cả 3 dân tộc là A73G và
A263G. Đáng chú ý, đa hình A73G xuất hiện với tần số 100% ở 3 dân tộc
trong nghiên cứu. Đa hình này cũng xuất hiện với tần số 100% trong các
nghiên cứu trước về hệ gen ty thể ở các tộc người ở Việt Nam như Mường,
Thái, Tày, Mông và Mảng [5]. A73G cũng phổ biến ở một số quốc gia châu Á
láng giềng như người Makrani ở Pakistan [37], người Quảng Tây ở Trung
Quốc và người Thái Lan [38].
Bảng 3.1. Thống kê các đa hình xuất hiện ở 2 vùng trình tự HVS-I và HVS-II
ở 120 mẫu nghiên cứu
45
STT SNP
Tổng
số
Kinh Cờ Lao Phù Lá
Số lượng Tần số Số lượng Tần số Số lượng Tần số
1 C61A 1 0 0.00% 1 2.94% 0 0.00%
2 G62A 1 0 0.00% 1 2.94% 0 0.00%
3 T63C 2 0 0.00% 2 5.88% 0 0.00%
4 C64T 4 0 0.00% 3 8.82% 1 2.86%
5 G66A 2 0 0.00% 2 5.88% 0 0.00%
6 A73G 120 51 100.00% 34 100.00% 35 100.00%
7 G94A 2 0 0.00% 1 2.94% 1 2.86%
8 G103A 1 1 1.96% 0 0.00% 0 0.00%
9 C114T 3 1 1.96% 1 2.94% 1 2.86%
10 T131C 1 1 1.96% 0 0.00% 0 0.00%
11 G143A 1 1 1.96% 0 0.00% 0 0.00%
12 T146C,A 14 8 15.69% 4 11.76% 2 5.71%
13 C150T 29 14 27.45% 8 23.53% 7 20.00%
14 C151T 2 2 3.92% 0 0.00% 0 0.00%
15 T152C 16 5 9.80% 3 8.82% 8 22.86%
16 A153G 1 1 1.96% 0 0.00% 0 0.00%
17 A183G 1 0 0.00% 1 2.94% 0 0.00%
18 G185A 3 2 3.92% 0 0.00% 1 2.86%
19 A189G 5 2 3.92% 2 5.88% 1 2.86%
20 T195C 7 4 7.84% 2 5.88% 1 2.86%
21 T199C 18 10 19.61% 3 8.82% 5 14.29%
46
22 A200G 3 0 0.00% 0 0.00% 3 8.57%
23 T204C 9 5 9.80% 0 0.00% 4 11.43%
24 G207A 7 2 3.92% 1 2.94% 4 11.43%
25 A210G 13 5 9.80% 7 20.59% 1 2.86%
26 A215G 3 1 1.96% 2 5.88% 0 0.00%
27 T226C 1 1 1.96% 0 0.00% 0 0.00%
28 A234G 2 1 1.96% 0 0.00% 1 2.86%
29 A235G 7 0 0.00% 1 2.94% 6 17.14%
30 A249G 1 1 1.96% 0 0.00% 0 0.00%
31 T252C 1 0 0.00% 1 2.94% 0 0.00%
32 G255A 1 1 1.96% 0 0.00% 0 0.00%
33 A263G 118 50 98.04% 33 97.06% 35 100.00%
34 T279C 1 1 1.96% 0 0.00% 0 0.00%
35 -315T,C 112 48 94.12% 30 88.24% 34 97.14%
36 T316C 101 40 78.43% 30 88.24% 31 88.57%
37 T324C 1 1 1.96% 0 0.00% 0 0.00%
38 A356C 1 0 0.00% 1 2.94% 0 0.00%
39 A16062G 3 0 0.00% 3 8.82% 0 0.00%
40 T16099C 1 1 1.96% 0 0.00% 0 0.00%
41 T16110C 15 1 1.96% 1 2.94% 13 37.14%
42 T16116C 5 3 5.88% 1 2.94% 1 2.86%
43 T16117C 11 7 13.73% 2 5.88% 2 5.71%
44 C16132T 5 2 3.92% 2 5.88% 1 2.86%
47
45 C16135T 3 1 1.96% 2 5.88% 0 0.00%
46 T16148C 2 0 0.00% 0 0.00% 2 5.71%
47 G16153A 27 15 29.41% 6 17.65% 6 17.14%
48 T16160C 4 3 5.88% 1 2.94% 0 0.00%
49 T16164C 19 9 17.65% 7 20.59% 3 8.57%
50 C16171T 1 1 1.96% 0 0.00% 0 0.00%
51 C16172T 2 1 1.96% 0 0.00% 1 2.86%
52 T16181C 1 1 1.96% 0 0.00% 0 0.00%
53 A16186G 5 1 1.96% 3 8.82% 1 2.86%
54 A16190G 1 1 1.96% 0 0.00% 0 0.00%
55 C16191T 11 0 0.00% 1 2.94% 10 28.57%
56 T16196C 13 6 11.76% 5 14.71% 2 5.71%
57 C16198T 1 1 1.96% 0 0.00% 0 0.00%
58 A16199G 2 2 3.92% 0 0.00% 0 0.00%
59 C16203T 1 0 0.00% 1 2.94% 0 0.00%
60 A16204C 1 0 0.00% 1 2.94% 0 0.00%
61 A16205C 1 0 0.00% 1 2.94% 0 0.00%
62 A16206C 15 9 17.65% 6 17.65% 0 0.00%
63 A16207C 42 24 47.06% 13 38.24% 5 14.29%
64 C16208A,T 2 0 0.00% 0 0.00% 2 5.71%
65 T16214C 51 29 56.86% 13 38.24% 9 25.71%
66 C16217T 2 2 3.92% 0 0.00% 0 0.00%
67 A16229G 10 0 0.00% 0 0.00% 10 28.57%
48
68 T16235C 1 1 1.96% 0 0.00% 0 0.00%
69 G16239A 1 0 0.00% 1 2.94% 0 0.00%
70 T16243C 12 6 11.76% 4 11.76% 2 5.71%
71 C16244T 3 2 3.92% 1 2.94% 0 0.00%
72 A16246C 3 0 0.00% 3 8.82% 0 0.00%
73 C16249T 56 20 39.22% 19 55.88% 17 48.57%
74 C16260T 3 2 3.92% 0 0.00% 1 2.86%
75 C16268T 1 0 0.00% 1 2.94% 0 0.00%
76 T16269C 2 2 3.92% 0 0.00% 0 0.00%
77 T16275C 4 2 3.92% 0 0.00% 2 5.71%
78 C16282T 6 0 0.00% 6 17.65% 0 0.00%
79 C16283A 1 0 0.00% 1 2.94% 0 0.00%
80 C16286T 2 1 1.96% 0 0.00% 1 2.86%
81 C16287T 9 5 9.80% 4 11.76% 0 0.00%
82 C16288T 2 0 0.00% 1 2.94% 1 2.86%
83 T16289C 1 1 1.96% 0 0.00% 0 0.00%
84 C16292A 13 5 9.80% 7 20.59% 1 2.86%
85 A16295G 1 1 1.96% 0 0.00% 0 0.00%
86 T16297C 3 2 3.92% 0 0.00% 1 2.86%
87 G16299A 1 1 1.96% 0 0.00% 0 0.00%
88 G16300A 5 1 1.96% 2 5.88% 2 5.71%
89 C16304T 2 2 3.92% 0 0.00% 0 0.00%
90 A16310G 1 0 0.00% 0 0.00% 1 2.86%
49
91 C16316T 8 1 1.96% 1 2.94% 6 17.14%
92 C16317T 2 0 0.00% 2 5.88% 0 0.00%
93 C16318T 2 0 0.00% 1 2.94% 1 2.86%
94 A16319T 1 1 1.96% 0 0.00% 0 0.00%
95 C16320T 1 1 1.96% 0 0.00% 0 0.00%
96 C16321T 3 3 5.88% 0 0.00% 0 0.00%
97 C16322T 1 1 1.96% 0 0.00% 0 0.00%
98 T16323C 13 6 11.76% 3 8.82% 4 11.43%
99 T16324C 14 5 9.80% 5 14.71% 4 11.43%
100 A16326G 2 2 3.92% 0 0.00% 0 0.00%
101 C16327T,G 3 2 3.92% 1 2.94% 0 0.00%
102 T16330C 27 11 21.57% 3 8.82% 13 37.14%
103 A16331G 2 2 3.92% 0 0.00% 0 0.00%
104 A16335G 1 0 0.00% 1 2.94% 0 0.00%
105 T16337C 27 7 13.73% 16 47.06% 4 11.43%
106 A16344G 10 0 0.00% 0 0.00% 10 28.57%
107 G16345A 7 0 0.00% 1 2.94% 6 17.14%
108 C16353T 8 4 7.84% 2 5.88% 2 5.71%
109 A16361G 3 1 1.96% 0 0.00% 2 5.71%
Ngoài ra, kết quả xác định các đa hình cũng đã chỉ ra: dân tộc Kinh có
tổng số các đa hình được phát hiện cao nhất trong 3 dân tộc với tổng cộng 78
điểm đa hình, bao gồm 51 đa hình HVS-I và 27 đa hình HVS-II. Trong số đó,
có nhiều đa hình lần đầu tiên được phát hiện thấy khi so với các nghiên cứu
trước đây, đặc biệt là 6 đa hình phổ biến (có tần số allele từ 0,1 trở lên), bao
gồm: T152C (tần số allele f = 0,1); T199C (f = 0,2); T16140C (f = 0,18);
50
T16297C (f = 0,12); T16311C (f = 0,14) và T16362C (f = 0,14). Ở 2 dân tộc
còn lại, số lượng đa hình được phát hiện ít hơn. Ở dân tộc Cờ Lao, chỉ có 65
điểm đa hình được phát hiện (41 đa hình HVS-I và 24 đa hình HVS-II). Trong
khi đó, ở dân tộc Phù Lá, có 55 điểm đa hình, bao gồm 35 đa hình HVS-I và
24 đa hình HVS-II. Như vậy, có thể thấy trình tự 2 vùng siêu biến của dân tộc
Kinh có tính đa hình cao hơn so với 2 dân tộc còn lại. Điều này có thể được
giải thích do lịch sử phát triển lâu đời, dân số đông và sự phân bố rộng khắp
của dân tộc Kinh. Do đó, có thể dẫn đến sự giao thoa di truyền và giải thích
cho sự đa dạng di truyền cao ở dân tộc này. Tuy nhiên, số lượng đa hình trung
bình trên mỗi mẫu ở cả 3 dân tộc hầu như không có sự khác biệt (Bảng 3.2).
Bảng 3.2. Số lượng các đa hình trung bình phát hiện được trong từng dân tộc
Dân tộc
Kinh Cờ Lao Phù Lá
Cỡ mẫu 51 34 35
Số đa hình phát hiện 9.4 ± 2.1 9.7 ± 2.3 9.5 ± 1.9
Số đa hình trên HVS-I 4.3 ± 1.9 4.6 ± 1.8 4.3 ± 1.2
Số đa hình trên HVS-II 5.1 ± 1.1 5.1 ± 1.2 5.2 ± 1.6
3.4. PHÂN TÍCH THỐNG KÊ SO SÁNH ĐA HÌNH VÀ TÍNH TOÁN
KHOẢNG CÁCH DI TRUYỀN GIỮA 3 DÂN TỘC KINH, CỜ LAO VÀ
PHÙ LÁ.
Sau khi xác định được các đa hình xuất hiện ở 2 vùng siêu biến, chúng
tôi loại bỏ các đa hình có tần số quá thấp và tiếp tục phân tích những đa hình
có tần số allele hiếm (minor allele frequency - MAF) ở ít nhất một nhóm
trong ba nhóm cá thể lớn hơn hoặc bằng 0,1 (10%). Kết quả còn lại 34 đa
hình, trong đó có 22 đa hình thuộc vùng HVS-I và 12 đa hình thuộc vùng
HVS-II. Thông tin và tần số xuất hiện của các đa hình được lựa chọn phân
tích trên từng nhóm cá thể thuộc tộc người Kinh, Cờ Lao và Phù Lá được liệt
kê trong bảng 3.3.
51
Bảng 3.3. Tần suất các đa hình trình tự vùng siêu biến D-loop thuộc hệ gen ty
thể ở ba nhóm cá thể thuộc các tộc người Kinh, Cờ Lao và Phù Lá
STT SNP
Vùng trình
tự
Tần số
Kinh Cờ Lao Phù Lá
1 A73G HVS-II 100% 100% 100%
2 T146C,A HVS-II 15.69% 11.76% 5.71%
3 C150T HVS-II 27.45% 23.53% 20%
4 T152C HVS-II 9.80% 8.82% 22.86%
5 T199C HVS-II 19.61% 8.82% 14.29%
6 T204C HVS-II 9.80% 0% 11.43%
7 G207A HVS-II 3.92% 2.94% 11.43%
8 A210G HVS-II 9.80% 20.59% 2.86%
9 A235G HVS-II 0% 2.94% 17.14%
10 A263G HVS-II 98.04% 97.06% 100%
11 -315T,C HVS-II 94.12% 88.24% 97.14%
12 T316C HVS-II 78.43% 88.24% 88.57%
13 T16110C HVS-I 1.96% 2.94% 37.14%
14 T16117C HVS-I 13.73% 5.88% 5.71%
15 G16153A HVS-I 29.41% 17.65% 17.14%
16 T16164C HVS-I 17.65% 20.59% 8.57%
17 C16191T HVS-I 0% 2.94% 28.57%
18 T16196C HVS-I 11.76% 14.71% 5.71%
19 A16206C HVS-I 17.65% 17.65% 0%
52
20 A16207C HVS-I 47.06% 38.24% 14.29%
21 T16214C HVS-I 56.86% 38.24% 25.71%
22 A16229G HVS-I 0% 0% 28.57%
23 T16243C HVS-I 11.76% 11.76% 5.71%
24 C16249T HVS-I 39.22% 55.88% 48.57%
25 C16282T HVS-I 0% 17.65% 0%
26 C16287T HVS-I 9.80% 11.76% 0%
27 C16292A HVS-I 9.80% 20.59% 2.86%
28 C16316T HVS-I 1.96% 2.94% 17.14%
29 T16323C HVS-I 11.76% 8.82% 11.43%
30 T16324C HVS-I 9.80% 14.71% 11.43%
31 T16330C HVS-I 21.57% 8.82% 37.14%
32 T16337C HVS-I 13.73% 47.06% 11.43%
33 A16344G HVS-I 0% 0% 28.57%
34 G16345A HVS-I 0% 2.94% 17.14%
Các đa hình này sẽ được phân tích thống kê, sử dụng kiểm định Fisher
exact từng đôi một giữa các nhóm tộc người nhằm xác định liệu có sự phân
bố khác nhau giữa các nhóm hay không. Kết quả thu được đã cho thấy: có 14
trong tổng số 34 đa hình có sự khác biệt có ý nghĩa thống kê giữa các nhóm
với giá trị p<0,05. Hầu hết chúng nằm trên vùng siêu biến HVS-I, chỉ có duy
nhất 2 đa hình A210G và A235G xuất hiện ở HVS-II (Bảng 3.4).
Bảng 3.4. Các đa hình có phân bố khác biệt ở các tộc người trong nghiên cứu
Đa hình Kinh – Cờ Lao* Kinh – Phù Lá* Cờ Lao – Phù Lá*
A210G - - 0.028
53
A235G - 0.003 -
T16110C - <0.001 0.001
C16191T - <0.001 0.006
A16206C - 0.014 0.011
A16207C - 0.003 0.03
T16214C - 0.008 -
A16229G - <0.001 0.001
C16282T 0.003 - 0.011
C16292A - - 0.028
C16316T - 0.031 -
T16337C 0.001 - 0.001
A16344G - <0.001 0.001
G16345A - 0.003 -
(*)Giá trị p được tính bằng kiểm định Fisher exact (2 phía) bằng phần
mềm SPSS version 23.
Kết quả cũng chỉ ra: trong 3 dân tộc, người Kinh và người Cờ Lao có
nhiều sự tương đồng hơn. Chỉ có 2 đa hình C16282T và T16337C thể hiện sự
khác biệt giữa 2 dân tộc này. Đáng chú ý, 2 đa hình này cũng có thể được
xem là các đa hình đặc trưng cho người Cờ Lao (giá trị p thu được khi so sánh
với 2 dân tộc còn lại đều <0,05). Cụ thể, trong khi đa hình C16282T chỉ xuất
hiện ở người Cờ Lao với tần số 17.65% thì đa hình T16337C cũng xuất hiện
với tần số cao hơn hẳn (47.06% ở người Cờ Lao so với 13.73% và 11.43% ở
người Kinh và người Phù Lá).
So với 2 dân tộc Kinh và Cờ Lao, người Phù Lá ít thể hiện sự tương
đồng nhất. Có đến 10 đa hình thể hiện sự khác biệt có ý nghĩa thống kê giữa
người Phù Lá với người Kinh. Một số lượng tương ứng đa hình cũng thể hiện
sự khác biệt giữa người Phù Lá và người Cờ Lao. Trong số chúng, có 6 đa
hình T16110C, C16191T, C16191T, A16207C, A16229G và A16344G có thể
được xem là đặc trưng cho người Phù Lá. Đáng chú ý, có 2 điểm đa hình chỉ
54
xuất hiện ở tộc người Phù Lá mà không xuất hiện trên các cá thể thuộc hai tộc
người còn lại là A16229G và A16344G.
Nhằm làm rõ thêm sự khác biệt giữa 3 dân tộc, chúng tôi đã tiến hành
tính toán khoảng cách di truyền (giá trị d) giữa các cá thể thuộc 3 nhóm tộc
người bằng phần mềm MEGA X. Kết quả tính toán được thể hiện ở bảng 3.5.
Kết quả này một lần nữa xác nhận có sự khác biệt di truyền giữa dân tộc Phù
Lá với 2 dân tộc còn lại với giá trị d = 0,014 lớn hơn so với khoảng cách di
truyền giữa 2 dân tộc Kinh và Cờ Lao.
Bảng 3.5. Khoảng cách di truyền giữa các dân tộc trong nghiên cứu
Kinh Cờ Lao Phù Lá
Kinh
Cờ Lao 0.01
Phù Lá 0.014 0.014
Như vậy, ở nghiên cứu này chúng tôi đã xác định được các đặc điểm
số lượng, tần suất và các dạng đa hình ở 3 dân tộc Kinh, Cờ Lao và Phù Lá.
Dân tộc Kinh được xem là có tính đa hình cao nhất trong số 3 dân tộc. Ngoài
ra, dựa trên các phân tích thống kê cũng như tính toán khoảng cách di truyền,
2 dân tộc Kinh và Cờ Lao được xem là có sự tương đồng lớn hơn trong khi
dân tộc Phù Lá lại có sự tương đồng ít hơn đối với 2 dân tộc này. Đặc biệt,
chúng tôi cũng đã xác định được một số các đa hình đặc trưng cho các dân
tộc, bao gồm 2 đa hình C16282T và T16337C đặc trưng cho người Cờ Lao và
6 đa hình T16110C, C16191T, C16191T, A16207C, A16229G và A16344G
đặc trưng cho người Phù Lá.
Việc xác định và làm rõ được các đặc điểm đa hình 2 vùng siêu biến
HVS-I, HVS-II trên ty thể ở 120 mẫu dân tộc Kinh, Cờ Lao và Phù Lá sẽ là
những cơ sơ dữ liệu ban đầu để chúng tôi có thể tiếp tục nghiên cứu sâu hơn
về lịch sử di truyền và nguồn gốc tiến hóa của các tộc người Việt Nam.
55
KẾT LUẬN
Trong nghiên cứu này, chúng tôi đã tiến hành nghiên cứu đặc điểm đa
hình nucleotide đơn trên 2 vùng siêu biến HVS-I và HVS-II ở 3 dân tộc cư trú
tại phía Bắc Việt Nam là Kinh, Cờ Lao và Phù Lá. Nghiên cứu đã thu được
các kết quả như sau:
1. Đã tách chiết được 120 mẫu DNA tổng số có chất lượng tốt từ 120 mẫu
máu thuộc 3 dân tộc trong nghiên cứu.
2. Đã khuếch đại thành công 2 vùng siêu biến HVS-I và HVS-II trên ty thể
của 120 mẫu thuộc 3 dân tộc bằng phương pháp PCR. Tất cả các sản phẩm
PCR được tinh sạch bằng kit và sử dụng trực tiếp cho phản ứng giải trình tự
Sanger.
3. Đã giải trình tự thành công 2 vùng siêu biến HVS-I và HVS-II của 120
mẫu dân tộc. Xác định được số lượng, thành phần và tần suất các đa hình nằm
trên 2 vùng siêu biến của 3 dân tộc.
- Dân tộc Kinh có tính đa hình cao nhất với tổng cộng 78 điểm đa hình
được xác định, bao gồm 51 đa hình HVS-I và 27 đa hình HVS-II
- Dân tộc Cờ Lao có 65 điểm đa hình: 41 đa hình HVS-I và 24 đa hình
HVS-II).
- Dân tộc Phù Lá có 55 điểm đa hình: 35 đa hình HVS-I và 24 đa hình
HVS-II.
4. Dựa trên phân tích thống kê các đa hình và tính toán khoảng cách di
truyền, xác định được giữa 2 dân tộc Kinh và Cờ Lao có sự tương đồng lớn
hơn trong khi dân tộc Phù Lá thể hiện sự tương đồng ít hơn đối với 2 dân tộc
này.
Xác định được 2 đa hình C16282T và T16337C đặc trưng cho dân tộc Cờ Lao
và 6 đa hình T16110C, C16191T, C16191T, A16207C, A16229G, A16344G
đặc trưng cho người Phù Lá.
56
KIẾN NGHỊ
Thực hiện thêm các nghiên cứu với số lượng và cỡ mẫu lớn hơn về đa
hình hệ gen ty thể nhằm làm rõ lịch sử di truyền cũng như mối quan hệ giữa
các dân tộc Việt.
57
TÀI LIỆU THAM KHẢO
1. Kim, J., J.M. Basak, and D.M. Holtzman., The role of apolipoprotein E in
Alzheimer's disease. Neuron, 2009. 63(3): p. 287-303.
2. Tổng điều tra dân số và nhà ở Việt Nam - Kết quả toàn bộ. Tổng điều tra
dân số và nhà ở Việt Nam, 2009: p. 3-5.
3. Trần Thị Thúy Hằng., Đa hình thái đơn nucleotid vùng gen ty thể HV1 và
HV2 trên người tộc người Kinh và tộc người Mường của Việt Nam. Tạp chí
Nghiên cứu y học, 2017. 106: p. 33-40.
4. Nguyễn Đăng Tôn, Vũ Hải Chi, Trần Thị Ngọc Diệp, Địch Thị Kim
Hương, Bùi Thị Tuyết, Nguyễn Hải Hà, Huỳnh Thị Thu Huệ, Trần Thị
Phương Liên, Phan Văn Chi, Nông Văn Hải., Đa hình đơn bội ADN ty thể
của các cá thể người Việt Nam. Tạp chí Công nghệ sinh học, 2008. 6(4): p.
579-590.
5. Nguyễn Thy Ngọc, Nguyễn Quang Huy, Nguyễn Đăng Tôn, Nguyễn
Thùy Dương., Đa hình vùng D-loop hệ gen ty thể của các cá thể tộc người
Kinh và Mảng cùng trong nhóm ngữ hệ Nam Á. Tạp chí Công nghệ sinh học,
2018. 16(2): p. 231-240.
6. Karki, R., et al., Defining "mutation" and "polymorphism" in the era of
personal genomics. BMC medical genomics, 2015. 8: p. 37-37.
7. What are single nucleotide polymorphisms (SNPs)? U.S National Library
of Medicine 2020.
8. Barreiro, L.B., et al., Natural selection has driven population
differentiation in modern humans. Nature genetics, 2008. 40(3): p. 340.
9. Stenson, P.D., et al., The Human Gene Mutation Database: providing a
comprehensive central mutation database for molecular diagnostics and
personalised genomics. 2009, Springer.
58
10. Salisbury, B.A., et al., SNP and haplotype variation in the human genome.
Mutation Research/Fundamental and Molecular Mechanisms of Mutagenesis,
2003. 526(1-2): p. 53-61.
11. Collins, F.S., L.D. Brooks, and A. Chakravarti, A DNA polymorphism
discovery resource for research on human genetic variation. Genome Res,
1998. 8(12): p. 1229-31.
12. McPherson, J.D., et al., A physical map of the human genome. Nature,
2001. 409(6822): p. 934-941.
13. Venter, J.C., et al., The sequence of the human genome. science, 2001.
291(5507): p. 1304-1351.
14. Bekris, L.M., et al., Multiple SNPs within and surrounding the
apolipoprotein E gene influence cerebrospinal fluid apolipoprotein E protein
levels. Journal of Alzheimer's disease, 2008. 13(3): p. 255-266.
15. Hirst, J., Why does mitochondrial complex I have so many subunits?
Biochemical Journal, 2011. 437(2): p. e1-e3.
16. Smith, P.M., J.L. Fox, and D.R. Winge, Reprint of: Biogenesis of the
cytochrome bc1 complex and role of assembly factors. Biochimica et
Biophysica Acta (BBA)-Bioenergetics, 2012. 1817(6): p. 872-882.
17. Giles, R.E., et al., Maternal inheritance of human mitochondrial DNA.
Proc Natl Acad Sci U S A, 1980. 77(11): p. 6715-9.
18. Brown, W.M., et al., Mitochondrial DNA sequences of primates: tempo
and mode of evolution. Journal of molecular evolution, 1982. 18(4): p. 225-
239.
19. Robin, E.D. and R. Wong, Mitochondrial DNA molecules and virtual
number of mitochondria per cell in mammalian cells. Journal of cellular
physiology, 1988. 136(3): p. 507-513.
20. Pakendorf, B. and M. Stoneking, mitochondrial DNA and human
evolution. Annual Review of Genomics and Human Genetics, 2005. 6(1): p.
165-183.
59
21. Howell, N., C. Howell, and J. Elson, Time dependency of molecular rate
estimates for mtDNA: this is not the time for wishful thinking. Heredity,
2008. 101(2): p. 107-108.
22. Chen, M.-H., H.-M. Lee, and C.-Y. Tzen, Polymorphism and
heteroplasmy of mitochondrial DNA in the D-loop region in Taiwanese.
Journal-Formosan Medical Association, 2002. 101(4): p. 268-276.
23. Greenberg, B.D., J.E. Newbold, and A. Sugino, Intraspecific nucleotide
sequence variability surrounding the origin of replication in human
mitochondrial DNA. Gene, 1983. 21(1-2): p. 33-49.
24. www.mitomap.org.
25. Li, H. and R. Durbin, Inference of human population history from
individual whole-genome sequences. Nature, 2011. 475(7357): p. 493-496.
26. Kutanan, W., et al., Complete mitochondrial genomes of Thai and Lao
populations indicate an ancient origin of Austroasiatic groups and demic
diffusion in the spread of Tai–Kadai languages. Human genetics, 2017.
136(1): p. 85-98.
27. Torroni, A., et al., Harvesting the fruit of the human mtDNA tree. Trens
in Genetics, 2006. 22(6): p. 339-345.
28. Lippold, S., et al., Human paternal and maternal demographic histories:
insights from high-resolution Y chromosome and mtDNA sequences.
Investigative genetics, 2014. 5(1): p. 13.
29. Stewart, J.B. and P.F. Chinnery, The dynamics of mitochondrial DNA
heteroplasmy: implications for human health and disease. Nature Reviews
Genetics, 2015. 16(9): p. 530-542.
30. Stoneking, M. and F. Delfin, The human genetic history of East Asia:
weaving a complex tapestry. Current Biology, 2010. 20(4): p. R188-R193.
31. Ivanova, R., et al., Mitochondrial DNA polymorphism in the Vietnamese
population. European journal of immunogenetics, 1999. 26(6): p. 417-422.
60
32. Oota, H., et al., Extreme mtDNA homogeneity in continental Asian
populations. American Journal of Physical Anthropology: The Official
Publication of the American Association of Physical Anthropologists, 2002.
118(2): p. 146-153.
33. Huỳnh Thị Thu Huệ, Nguyễn Đăng Tôn, Lê Thị Thu Hiền, Nông Văn
Hải., Phân tích trình tự vùng điều khiển (D-loop) trên genome ty thể của 5 cá
thể người Việt Nam. Tạp chí Công nghệ sinh học, 2005. 3(1): p. 15-22.
34. Đỗ Mạnh Hưng, Phạm Nhật Khôi, Vũ Phương Nhung, Nguyễn Văn
Phòng, Nguyễn Thùy Dương, Nông Văn Hải, Nguyễn Đăng Tôn., Sự đa dạng
di truyền vùng HV2 hệ gen ty thể của một số nhóm người Việt. Tạp chí Công
nghệ sinh học, 2016. 38(2): p. 243-249.
35. Pischedda, S., et al., Phylogeographic and genome-wide investigations of
Vietnam ethnic groups reveal signatures of complex historical demographic
movements. Scientific reports, 2017. 7(1): p. 1-15.
36. Duong, N.T., et al., Complete human mtDNA genome sequences from
Vietnam and the phylogeography of Mainland Southeast Asia. Scientific
reports, 2018. 8(1): p. 1-13.
37. Siddiqi, M.H., et al., Genetic characterization of the Makrani people of
Pakistan from mitochondrial DNA control-region data. Legal Medicine, 2015.
17(2): p. 134-139.
38. Yang, X., et al., Mitochondrial DNA polymorphisms are associated with
the longevity in the Guangxi Bama population of China. Molecular biology
reports, 2012. 39(9): p. 9123-9131.
61
DANH MỤC PHỤ LỤC
Trang
1. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc
Kinh và Cờ Lao
...63
2. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc
Kinh và Phù Lá
77
3. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Cờ
Lao và Phù Lá
88
62
PHỤ LỤC
1. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Kinh
và Cờ Lao
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
POPULATION * A73G 85 100.0% 0 0.0% 85 100.0%
POPULATION * T146C,A 85 100.0% 0 0.0% 85 100.0%
POPULATION * C150T 85 100.0% 0 0.0% 85 100.0%
POPULATION * T152C 85 100.0% 0 0.0% 85 100.0%
POPULATION * T199C 85 100.0% 0 0.0% 85 100.0%
POPULATION * T204C 85 100.0% 0 0.0% 85 100.0%
POPULATION * G207A 85 100.0% 0 0.0% 85 100.0%
POPULATION * A210G 85 100.0% 0 0.0% 85 100.0%
POPULATION * A235G 85 100.0% 0 0.0% 85 100.0%
POPULATION * A263G 85 100.0% 0 0.0% 85 100.0%
POPULATION * -315T,C 85 100.0% 0 0.0% 85 100.0%
POPULATION * T316C 85 100.0% 0 0.0% 85 100.0%
POPULATION * T16110C 85 100.0% 0 0.0% 85 100.0%
POPULATION * T16117C 85 100.0% 0 0.0% 85 100.0%
POPULATION * G16153A 85 100.0% 0 0.0% 85 100.0%
POPULATION * T16164C 85 100.0% 0 0.0% 85 100.0%
POPULATION * C16191T 85 100.0% 0 0.0% 85 100.0%
POPULATION * T16196C 85 100.0% 0 0.0% 85 100.0%
POPULATION * A16206C 85 100.0% 0 0.0% 85 100.0%
POPULATION * A16207C 85 100.0% 0 0.0% 85 100.0%
POPULATION * T16214C 85 100.0% 0 0.0% 85 100.0%
POPULATION * A16229G 85 100.0% 0 0.0% 85 100.0%
POPULATION * T16243C 85 100.0% 0 0.0% 85 100.0%
POPULATION * C16249T 85 100.0% 0 0.0% 85 100.0%
POPULATION * C16282T 85 100.0% 0 0.0% 85 100.0%
POPULATION * C16287T 85 100.0% 0 0.0% 85 100.0%
POPULATION * C16292A 85 100.0% 0 0.0% 85 100.0%
POPULATION * C16316T 85 100.0% 0 0.0% 85 100.0%
POPULATION * T16323C 85 100.0% 0 0.0% 85 100.0%
POPULATION * T16324C 85 100.0% 0 0.0% 85 100.0%
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
POPULATION * T16337C 85 100.0% 0 0.0% 85 100.0%
POPULATION * A16344G 85 100.0% 0 0.0% 85 100.0%
POPULATION * G16345A 85 100.0% 0 0.0% 85 100.0%
POPULATION * A73G
Crosstab
A73G Total
1
POPULATION
CO LAO
Count 34 34
Expected Count 34.0 34.0
KINH
Count 51 51
Expected Count 51.0 51.0
Total
Count 85 85
Expected Count 85.0 85.0
Chi-Square Tests
Value
63
Pearson Chi-Square .a
N of Valid Cases 85
a. No statistics are computed because
A73G is a constant.
POPULATION * T146C,A
Crosstab
T146C,A Total
0 1 2
POPULATION
CO LAO
Count 30 4 0 34
Expected Count 30.0 3.2 .8 34.0
KINH
Count 45 4 2 51
Expected Count 45.0 4.8 1.2 51.0
Total
Count 75 8 2 85
Expected Count 75.0 8.0 2.0 85.0
Chi-Square Tests
Value df Asymp. Sig. (2-
sided)
Exact Sig. (2-
sided)
Pearson Ch
Các file đính kèm theo tài liệu này:
- nghien_cuu_dac_diem_da_hinh_nucleotide_don_o_hai_vung_sieu_b.pdf