Nghiên cứu đặc điểm đa hình nucleotide đơn ở hai vùng siêu biến HVS-I và HVS-II trên D - Loop ty thể của một số dân tộc Việt Nam

MỞ ĐẦU . 1

CHƯƠNG 1. TỔNG QUAN NGHIÊN CỨU. 2

1.1. TỔNG QUAN VỀ ĐA HÌNH NUCLEOTIDE ĐƠN. 2

1.1.1. Đặc điểm của đa hình nucleotide đơn.2

1.1.2. Tầm quan trọng và ứng dụng của đa hình nucleotide đơn.4

1.1.2.1. Bản đồ SNP.4

1.1.2.2. Phát triển SNP và y học.5

1.1.2.3. Phát triển SNP và dược phẩm.6

1.2. HỆ GEN TY THỂ . 7

1.2.1. Đặc điểm cấu trúc và di truyền hệ gen ty thể .7

1.2.1.1. Cấu trúc hệ gen ty thể .7

1.2.1.2. Đặc điểm di truyền hệ gen ty thể.9

1.2.2. Đặc điểm vùng điều khiển (D-loop) trên ty thể.10

1.2.3. Tình hình nghiên cứu hệ gen ty thể trên thế giới và ở Việt Nam.12

1.2.3.1. Tình hình nghiên cứu trên thế giới.12

1.2.3.2. Tình hình nghiên cứu DNA ty thể tại Việt Nam.13

1.3. ĐẶC ĐIỂM DÂN TỘC HỌC CỦA CÁC DÂN TỘC TRONG NGHIÊN

CỨU . 15

1.3.1. Người Kinh.15

1.3.2. Người Cờ Lao.16

1.3.3. Người Phù Lá.17

CHƯƠNG 2. NGUYÊN VẬT LIỆU, PHƯƠNG PHÁP NGHIÊN CỨU. 19

2.1. VẬT TƯ, THIẾT BỊ . 19

2.1.1. Nguyên vật liệu.19

2.1.2. Hóa chất.18

2.1.3. Thiết bị.19

2.2. PHƯƠNG PHÁP NGHIÊN CỨU. 21

2.2.1. Tách chiết DNA tổng số .21

2.2.2. Phương pháp điện di kiểm tra trên gel agarose.22

105 trang | Chia sẻ: honganh20 | Lượt xem: 695 | Lượt tải: 2

Bạn đang xem trước 20 trang tài liệu Nghiên cứu đặc điểm đa hình nucleotide đơn ở hai vùng siêu biến HVS-I và HVS-II trên D - Loop ty thể của một số dân tộc Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

C E F D 30 31 32 33 34 35 36 Hình 3.7. Kết quả so sánh trình tự vùng HVS-II với trình tự chuẩn rCRS của 120 mẫu dân tộc tộc Kinh, Cờ Lao và Phù Lá; K01-K51: 51 mẫu dân tộc Kinh 01; C01-C34: 34 mẫu dân tộc Cờ Lao; P01- P35: 35 mẫu dân tộc Phù Lá (.): Nucleotide trùng với nucleotide trên trình tự chuẩn (-): nucleotide bị khuyết 37 38 39 40 41 42 43 44 Hình 3.8. Kết quả so sánh trình tự vùng HVS-I với trình tự chuẩn rCRS của 120 mẫu dân tộc tộc Kinh, Cờ Lao và Phù Lá; K01-K51: 51 mẫu dân tộc Kinh 01; C01-C34: 34 mẫu dân tộc Cờ Lao; P01- P35: 35 mẫu dân tộc Phù Lá (.): Nucleotide trùng với nucleotide trên trình tự chuẩn (-): nucleotide bị khuyết Kết quả đã phát hiện được tổng cộng 109 điểm đa hình (có trình tự khác với trình tự tham chiếu) ở 3 dân tộc, bao gồm 71 điểm nằm trên HVS-I và 39 điểm trên HVS-II (Bảng 3.1). Như vậy, trung bình cứ mỗi 5 nucleotide trên vùng HVS-I và 9 nucleotide trên HVS-II sẽ xuất hiện 1 điểm đa hình. Kết quả này cao hơn nhiều so với trung bình toàn bộ hệ gen (cứ mỗi 1000 nucleotide mới xuất hiện 1 SNP), cho thấy tốc độ đột biến rất cao ở 2 khu vực này, đặc biệt là vùng siêu biến HVS-I. Hầu hết các đa hình được phát hiện (108/109) là các đa hình dạng thay thế nucleotide. Hơn 1 nửa trong số chúng là các đa hình dạng thay thế C>T và T>C. Chỉ có duy nhất 1 đa hình thêm nucleotide là -315T,C. Đa hình này được phát hiện với tần số rất cao (xấp xỉ 90%) ở cả 3 dân tộc. Ngoài ra còn có 2 đa hình khác cũng xuất hiện với tần số rất cao ở cả 3 dân tộc là A73G và A263G. Đáng chú ý, đa hình A73G xuất hiện với tần số 100% ở 3 dân tộc trong nghiên cứu. Đa hình này cũng xuất hiện với tần số 100% trong các nghiên cứu trước về hệ gen ty thể ở các tộc người ở Việt Nam như Mường, Thái, Tày, Mông và Mảng [5]. A73G cũng phổ biến ở một số quốc gia châu Á láng giềng như người Makrani ở Pakistan [37], người Quảng Tây ở Trung Quốc và người Thái Lan [38]. Bảng 3.1. Thống kê các đa hình xuất hiện ở 2 vùng trình tự HVS-I và HVS-II ở 120 mẫu nghiên cứu 45 STT SNP Tổng số Kinh Cờ Lao Phù Lá Số lượng Tần số Số lượng Tần số Số lượng Tần số 1 C61A 1 0 0.00% 1 2.94% 0 0.00% 2 G62A 1 0 0.00% 1 2.94% 0 0.00% 3 T63C 2 0 0.00% 2 5.88% 0 0.00% 4 C64T 4 0 0.00% 3 8.82% 1 2.86% 5 G66A 2 0 0.00% 2 5.88% 0 0.00% 6 A73G 120 51 100.00% 34 100.00% 35 100.00% 7 G94A 2 0 0.00% 1 2.94% 1 2.86% 8 G103A 1 1 1.96% 0 0.00% 0 0.00% 9 C114T 3 1 1.96% 1 2.94% 1 2.86% 10 T131C 1 1 1.96% 0 0.00% 0 0.00% 11 G143A 1 1 1.96% 0 0.00% 0 0.00% 12 T146C,A 14 8 15.69% 4 11.76% 2 5.71% 13 C150T 29 14 27.45% 8 23.53% 7 20.00% 14 C151T 2 2 3.92% 0 0.00% 0 0.00% 15 T152C 16 5 9.80% 3 8.82% 8 22.86% 16 A153G 1 1 1.96% 0 0.00% 0 0.00% 17 A183G 1 0 0.00% 1 2.94% 0 0.00% 18 G185A 3 2 3.92% 0 0.00% 1 2.86% 19 A189G 5 2 3.92% 2 5.88% 1 2.86% 20 T195C 7 4 7.84% 2 5.88% 1 2.86% 21 T199C 18 10 19.61% 3 8.82% 5 14.29% 46 22 A200G 3 0 0.00% 0 0.00% 3 8.57% 23 T204C 9 5 9.80% 0 0.00% 4 11.43% 24 G207A 7 2 3.92% 1 2.94% 4 11.43% 25 A210G 13 5 9.80% 7 20.59% 1 2.86% 26 A215G 3 1 1.96% 2 5.88% 0 0.00% 27 T226C 1 1 1.96% 0 0.00% 0 0.00% 28 A234G 2 1 1.96% 0 0.00% 1 2.86% 29 A235G 7 0 0.00% 1 2.94% 6 17.14% 30 A249G 1 1 1.96% 0 0.00% 0 0.00% 31 T252C 1 0 0.00% 1 2.94% 0 0.00% 32 G255A 1 1 1.96% 0 0.00% 0 0.00% 33 A263G 118 50 98.04% 33 97.06% 35 100.00% 34 T279C 1 1 1.96% 0 0.00% 0 0.00% 35 -315T,C 112 48 94.12% 30 88.24% 34 97.14% 36 T316C 101 40 78.43% 30 88.24% 31 88.57% 37 T324C 1 1 1.96% 0 0.00% 0 0.00% 38 A356C 1 0 0.00% 1 2.94% 0 0.00% 39 A16062G 3 0 0.00% 3 8.82% 0 0.00% 40 T16099C 1 1 1.96% 0 0.00% 0 0.00% 41 T16110C 15 1 1.96% 1 2.94% 13 37.14% 42 T16116C 5 3 5.88% 1 2.94% 1 2.86% 43 T16117C 11 7 13.73% 2 5.88% 2 5.71% 44 C16132T 5 2 3.92% 2 5.88% 1 2.86% 47 45 C16135T 3 1 1.96% 2 5.88% 0 0.00% 46 T16148C 2 0 0.00% 0 0.00% 2 5.71% 47 G16153A 27 15 29.41% 6 17.65% 6 17.14% 48 T16160C 4 3 5.88% 1 2.94% 0 0.00% 49 T16164C 19 9 17.65% 7 20.59% 3 8.57% 50 C16171T 1 1 1.96% 0 0.00% 0 0.00% 51 C16172T 2 1 1.96% 0 0.00% 1 2.86% 52 T16181C 1 1 1.96% 0 0.00% 0 0.00% 53 A16186G 5 1 1.96% 3 8.82% 1 2.86% 54 A16190G 1 1 1.96% 0 0.00% 0 0.00% 55 C16191T 11 0 0.00% 1 2.94% 10 28.57% 56 T16196C 13 6 11.76% 5 14.71% 2 5.71% 57 C16198T 1 1 1.96% 0 0.00% 0 0.00% 58 A16199G 2 2 3.92% 0 0.00% 0 0.00% 59 C16203T 1 0 0.00% 1 2.94% 0 0.00% 60 A16204C 1 0 0.00% 1 2.94% 0 0.00% 61 A16205C 1 0 0.00% 1 2.94% 0 0.00% 62 A16206C 15 9 17.65% 6 17.65% 0 0.00% 63 A16207C 42 24 47.06% 13 38.24% 5 14.29% 64 C16208A,T 2 0 0.00% 0 0.00% 2 5.71% 65 T16214C 51 29 56.86% 13 38.24% 9 25.71% 66 C16217T 2 2 3.92% 0 0.00% 0 0.00% 67 A16229G 10 0 0.00% 0 0.00% 10 28.57% 48 68 T16235C 1 1 1.96% 0 0.00% 0 0.00% 69 G16239A 1 0 0.00% 1 2.94% 0 0.00% 70 T16243C 12 6 11.76% 4 11.76% 2 5.71% 71 C16244T 3 2 3.92% 1 2.94% 0 0.00% 72 A16246C 3 0 0.00% 3 8.82% 0 0.00% 73 C16249T 56 20 39.22% 19 55.88% 17 48.57% 74 C16260T 3 2 3.92% 0 0.00% 1 2.86% 75 C16268T 1 0 0.00% 1 2.94% 0 0.00% 76 T16269C 2 2 3.92% 0 0.00% 0 0.00% 77 T16275C 4 2 3.92% 0 0.00% 2 5.71% 78 C16282T 6 0 0.00% 6 17.65% 0 0.00% 79 C16283A 1 0 0.00% 1 2.94% 0 0.00% 80 C16286T 2 1 1.96% 0 0.00% 1 2.86% 81 C16287T 9 5 9.80% 4 11.76% 0 0.00% 82 C16288T 2 0 0.00% 1 2.94% 1 2.86% 83 T16289C 1 1 1.96% 0 0.00% 0 0.00% 84 C16292A 13 5 9.80% 7 20.59% 1 2.86% 85 A16295G 1 1 1.96% 0 0.00% 0 0.00% 86 T16297C 3 2 3.92% 0 0.00% 1 2.86% 87 G16299A 1 1 1.96% 0 0.00% 0 0.00% 88 G16300A 5 1 1.96% 2 5.88% 2 5.71% 89 C16304T 2 2 3.92% 0 0.00% 0 0.00% 90 A16310G 1 0 0.00% 0 0.00% 1 2.86% 49 91 C16316T 8 1 1.96% 1 2.94% 6 17.14% 92 C16317T 2 0 0.00% 2 5.88% 0 0.00% 93 C16318T 2 0 0.00% 1 2.94% 1 2.86% 94 A16319T 1 1 1.96% 0 0.00% 0 0.00% 95 C16320T 1 1 1.96% 0 0.00% 0 0.00% 96 C16321T 3 3 5.88% 0 0.00% 0 0.00% 97 C16322T 1 1 1.96% 0 0.00% 0 0.00% 98 T16323C 13 6 11.76% 3 8.82% 4 11.43% 99 T16324C 14 5 9.80% 5 14.71% 4 11.43% 100 A16326G 2 2 3.92% 0 0.00% 0 0.00% 101 C16327T,G 3 2 3.92% 1 2.94% 0 0.00% 102 T16330C 27 11 21.57% 3 8.82% 13 37.14% 103 A16331G 2 2 3.92% 0 0.00% 0 0.00% 104 A16335G 1 0 0.00% 1 2.94% 0 0.00% 105 T16337C 27 7 13.73% 16 47.06% 4 11.43% 106 A16344G 10 0 0.00% 0 0.00% 10 28.57% 107 G16345A 7 0 0.00% 1 2.94% 6 17.14% 108 C16353T 8 4 7.84% 2 5.88% 2 5.71% 109 A16361G 3 1 1.96% 0 0.00% 2 5.71% Ngoài ra, kết quả xác định các đa hình cũng đã chỉ ra: dân tộc Kinh có tổng số các đa hình được phát hiện cao nhất trong 3 dân tộc với tổng cộng 78 điểm đa hình, bao gồm 51 đa hình HVS-I và 27 đa hình HVS-II. Trong số đó, có nhiều đa hình lần đầu tiên được phát hiện thấy khi so với các nghiên cứu trước đây, đặc biệt là 6 đa hình phổ biến (có tần số allele từ 0,1 trở lên), bao gồm: T152C (tần số allele f = 0,1); T199C (f = 0,2); T16140C (f = 0,18); 50 T16297C (f = 0,12); T16311C (f = 0,14) và T16362C (f = 0,14). Ở 2 dân tộc còn lại, số lượng đa hình được phát hiện ít hơn. Ở dân tộc Cờ Lao, chỉ có 65 điểm đa hình được phát hiện (41 đa hình HVS-I và 24 đa hình HVS-II). Trong khi đó, ở dân tộc Phù Lá, có 55 điểm đa hình, bao gồm 35 đa hình HVS-I và 24 đa hình HVS-II. Như vậy, có thể thấy trình tự 2 vùng siêu biến của dân tộc Kinh có tính đa hình cao hơn so với 2 dân tộc còn lại. Điều này có thể được giải thích do lịch sử phát triển lâu đời, dân số đông và sự phân bố rộng khắp của dân tộc Kinh. Do đó, có thể dẫn đến sự giao thoa di truyền và giải thích cho sự đa dạng di truyền cao ở dân tộc này. Tuy nhiên, số lượng đa hình trung bình trên mỗi mẫu ở cả 3 dân tộc hầu như không có sự khác biệt (Bảng 3.2). Bảng 3.2. Số lượng các đa hình trung bình phát hiện được trong từng dân tộc Dân tộc Kinh Cờ Lao Phù Lá Cỡ mẫu 51 34 35 Số đa hình phát hiện 9.4 ± 2.1 9.7 ± 2.3 9.5 ± 1.9 Số đa hình trên HVS-I 4.3 ± 1.9 4.6 ± 1.8 4.3 ± 1.2 Số đa hình trên HVS-II 5.1 ± 1.1 5.1 ± 1.2 5.2 ± 1.6 3.4. PHÂN TÍCH THỐNG KÊ SO SÁNH ĐA HÌNH VÀ TÍNH TOÁN KHOẢNG CÁCH DI TRUYỀN GIỮA 3 DÂN TỘC KINH, CỜ LAO VÀ PHÙ LÁ. Sau khi xác định được các đa hình xuất hiện ở 2 vùng siêu biến, chúng tôi loại bỏ các đa hình có tần số quá thấp và tiếp tục phân tích những đa hình có tần số allele hiếm (minor allele frequency - MAF) ở ít nhất một nhóm trong ba nhóm cá thể lớn hơn hoặc bằng 0,1 (10%). Kết quả còn lại 34 đa hình, trong đó có 22 đa hình thuộc vùng HVS-I và 12 đa hình thuộc vùng HVS-II. Thông tin và tần số xuất hiện của các đa hình được lựa chọn phân tích trên từng nhóm cá thể thuộc tộc người Kinh, Cờ Lao và Phù Lá được liệt kê trong bảng 3.3. 51 Bảng 3.3. Tần suất các đa hình trình tự vùng siêu biến D-loop thuộc hệ gen ty thể ở ba nhóm cá thể thuộc các tộc người Kinh, Cờ Lao và Phù Lá STT SNP Vùng trình tự Tần số Kinh Cờ Lao Phù Lá 1 A73G HVS-II 100% 100% 100% 2 T146C,A HVS-II 15.69% 11.76% 5.71% 3 C150T HVS-II 27.45% 23.53% 20% 4 T152C HVS-II 9.80% 8.82% 22.86% 5 T199C HVS-II 19.61% 8.82% 14.29% 6 T204C HVS-II 9.80% 0% 11.43% 7 G207A HVS-II 3.92% 2.94% 11.43% 8 A210G HVS-II 9.80% 20.59% 2.86% 9 A235G HVS-II 0% 2.94% 17.14% 10 A263G HVS-II 98.04% 97.06% 100% 11 -315T,C HVS-II 94.12% 88.24% 97.14% 12 T316C HVS-II 78.43% 88.24% 88.57% 13 T16110C HVS-I 1.96% 2.94% 37.14% 14 T16117C HVS-I 13.73% 5.88% 5.71% 15 G16153A HVS-I 29.41% 17.65% 17.14% 16 T16164C HVS-I 17.65% 20.59% 8.57% 17 C16191T HVS-I 0% 2.94% 28.57% 18 T16196C HVS-I 11.76% 14.71% 5.71% 19 A16206C HVS-I 17.65% 17.65% 0% 52 20 A16207C HVS-I 47.06% 38.24% 14.29% 21 T16214C HVS-I 56.86% 38.24% 25.71% 22 A16229G HVS-I 0% 0% 28.57% 23 T16243C HVS-I 11.76% 11.76% 5.71% 24 C16249T HVS-I 39.22% 55.88% 48.57% 25 C16282T HVS-I 0% 17.65% 0% 26 C16287T HVS-I 9.80% 11.76% 0% 27 C16292A HVS-I 9.80% 20.59% 2.86% 28 C16316T HVS-I 1.96% 2.94% 17.14% 29 T16323C HVS-I 11.76% 8.82% 11.43% 30 T16324C HVS-I 9.80% 14.71% 11.43% 31 T16330C HVS-I 21.57% 8.82% 37.14% 32 T16337C HVS-I 13.73% 47.06% 11.43% 33 A16344G HVS-I 0% 0% 28.57% 34 G16345A HVS-I 0% 2.94% 17.14% Các đa hình này sẽ được phân tích thống kê, sử dụng kiểm định Fisher exact từng đôi một giữa các nhóm tộc người nhằm xác định liệu có sự phân bố khác nhau giữa các nhóm hay không. Kết quả thu được đã cho thấy: có 14 trong tổng số 34 đa hình có sự khác biệt có ý nghĩa thống kê giữa các nhóm với giá trị p<0,05. Hầu hết chúng nằm trên vùng siêu biến HVS-I, chỉ có duy nhất 2 đa hình A210G và A235G xuất hiện ở HVS-II (Bảng 3.4). Bảng 3.4. Các đa hình có phân bố khác biệt ở các tộc người trong nghiên cứu Đa hình Kinh – Cờ Lao* Kinh – Phù Lá* Cờ Lao – Phù Lá* A210G - - 0.028 53 A235G - 0.003 - T16110C - <0.001 0.001 C16191T - <0.001 0.006 A16206C - 0.014 0.011 A16207C - 0.003 0.03 T16214C - 0.008 - A16229G - <0.001 0.001 C16282T 0.003 - 0.011 C16292A - - 0.028 C16316T - 0.031 - T16337C 0.001 - 0.001 A16344G - <0.001 0.001 G16345A - 0.003 - (*)Giá trị p được tính bằng kiểm định Fisher exact (2 phía) bằng phần mềm SPSS version 23. Kết quả cũng chỉ ra: trong 3 dân tộc, người Kinh và người Cờ Lao có nhiều sự tương đồng hơn. Chỉ có 2 đa hình C16282T và T16337C thể hiện sự khác biệt giữa 2 dân tộc này. Đáng chú ý, 2 đa hình này cũng có thể được xem là các đa hình đặc trưng cho người Cờ Lao (giá trị p thu được khi so sánh với 2 dân tộc còn lại đều <0,05). Cụ thể, trong khi đa hình C16282T chỉ xuất hiện ở người Cờ Lao với tần số 17.65% thì đa hình T16337C cũng xuất hiện với tần số cao hơn hẳn (47.06% ở người Cờ Lao so với 13.73% và 11.43% ở người Kinh và người Phù Lá). So với 2 dân tộc Kinh và Cờ Lao, người Phù Lá ít thể hiện sự tương đồng nhất. Có đến 10 đa hình thể hiện sự khác biệt có ý nghĩa thống kê giữa người Phù Lá với người Kinh. Một số lượng tương ứng đa hình cũng thể hiện sự khác biệt giữa người Phù Lá và người Cờ Lao. Trong số chúng, có 6 đa hình T16110C, C16191T, C16191T, A16207C, A16229G và A16344G có thể được xem là đặc trưng cho người Phù Lá. Đáng chú ý, có 2 điểm đa hình chỉ 54 xuất hiện ở tộc người Phù Lá mà không xuất hiện trên các cá thể thuộc hai tộc người còn lại là A16229G và A16344G. Nhằm làm rõ thêm sự khác biệt giữa 3 dân tộc, chúng tôi đã tiến hành tính toán khoảng cách di truyền (giá trị d) giữa các cá thể thuộc 3 nhóm tộc người bằng phần mềm MEGA X. Kết quả tính toán được thể hiện ở bảng 3.5. Kết quả này một lần nữa xác nhận có sự khác biệt di truyền giữa dân tộc Phù Lá với 2 dân tộc còn lại với giá trị d = 0,014 lớn hơn so với khoảng cách di truyền giữa 2 dân tộc Kinh và Cờ Lao. Bảng 3.5. Khoảng cách di truyền giữa các dân tộc trong nghiên cứu Kinh Cờ Lao Phù Lá Kinh Cờ Lao 0.01 Phù Lá 0.014 0.014 Như vậy, ở nghiên cứu này chúng tôi đã xác định được các đặc điểm số lượng, tần suất và các dạng đa hình ở 3 dân tộc Kinh, Cờ Lao và Phù Lá. Dân tộc Kinh được xem là có tính đa hình cao nhất trong số 3 dân tộc. Ngoài ra, dựa trên các phân tích thống kê cũng như tính toán khoảng cách di truyền, 2 dân tộc Kinh và Cờ Lao được xem là có sự tương đồng lớn hơn trong khi dân tộc Phù Lá lại có sự tương đồng ít hơn đối với 2 dân tộc này. Đặc biệt, chúng tôi cũng đã xác định được một số các đa hình đặc trưng cho các dân tộc, bao gồm 2 đa hình C16282T và T16337C đặc trưng cho người Cờ Lao và 6 đa hình T16110C, C16191T, C16191T, A16207C, A16229G và A16344G đặc trưng cho người Phù Lá. Việc xác định và làm rõ được các đặc điểm đa hình 2 vùng siêu biến HVS-I, HVS-II trên ty thể ở 120 mẫu dân tộc Kinh, Cờ Lao và Phù Lá sẽ là những cơ sơ dữ liệu ban đầu để chúng tôi có thể tiếp tục nghiên cứu sâu hơn về lịch sử di truyền và nguồn gốc tiến hóa của các tộc người Việt Nam. 55 KẾT LUẬN Trong nghiên cứu này, chúng tôi đã tiến hành nghiên cứu đặc điểm đa hình nucleotide đơn trên 2 vùng siêu biến HVS-I và HVS-II ở 3 dân tộc cư trú tại phía Bắc Việt Nam là Kinh, Cờ Lao và Phù Lá. Nghiên cứu đã thu được các kết quả như sau: 1. Đã tách chiết được 120 mẫu DNA tổng số có chất lượng tốt từ 120 mẫu máu thuộc 3 dân tộc trong nghiên cứu. 2. Đã khuếch đại thành công 2 vùng siêu biến HVS-I và HVS-II trên ty thể của 120 mẫu thuộc 3 dân tộc bằng phương pháp PCR. Tất cả các sản phẩm PCR được tinh sạch bằng kit và sử dụng trực tiếp cho phản ứng giải trình tự Sanger. 3. Đã giải trình tự thành công 2 vùng siêu biến HVS-I và HVS-II của 120 mẫu dân tộc. Xác định được số lượng, thành phần và tần suất các đa hình nằm trên 2 vùng siêu biến của 3 dân tộc. - Dân tộc Kinh có tính đa hình cao nhất với tổng cộng 78 điểm đa hình được xác định, bao gồm 51 đa hình HVS-I và 27 đa hình HVS-II - Dân tộc Cờ Lao có 65 điểm đa hình: 41 đa hình HVS-I và 24 đa hình HVS-II). - Dân tộc Phù Lá có 55 điểm đa hình: 35 đa hình HVS-I và 24 đa hình HVS-II. 4. Dựa trên phân tích thống kê các đa hình và tính toán khoảng cách di truyền, xác định được giữa 2 dân tộc Kinh và Cờ Lao có sự tương đồng lớn hơn trong khi dân tộc Phù Lá thể hiện sự tương đồng ít hơn đối với 2 dân tộc này. Xác định được 2 đa hình C16282T và T16337C đặc trưng cho dân tộc Cờ Lao và 6 đa hình T16110C, C16191T, C16191T, A16207C, A16229G, A16344G đặc trưng cho người Phù Lá. 56 KIẾN NGHỊ Thực hiện thêm các nghiên cứu với số lượng và cỡ mẫu lớn hơn về đa hình hệ gen ty thể nhằm làm rõ lịch sử di truyền cũng như mối quan hệ giữa các dân tộc Việt. 57 TÀI LIỆU THAM KHẢO 1. Kim, J., J.M. Basak, and D.M. Holtzman., The role of apolipoprotein E in Alzheimer's disease. Neuron, 2009. 63(3): p. 287-303. 2. Tổng điều tra dân số và nhà ở Việt Nam - Kết quả toàn bộ. Tổng điều tra dân số và nhà ở Việt Nam, 2009: p. 3-5. 3. Trần Thị Thúy Hằng., Đa hình thái đơn nucleotid vùng gen ty thể HV1 và HV2 trên người tộc người Kinh và tộc người Mường của Việt Nam. Tạp chí Nghiên cứu y học, 2017. 106: p. 33-40. 4. Nguyễn Đăng Tôn, Vũ Hải Chi, Trần Thị Ngọc Diệp, Địch Thị Kim Hương, Bùi Thị Tuyết, Nguyễn Hải Hà, Huỳnh Thị Thu Huệ, Trần Thị Phương Liên, Phan Văn Chi, Nông Văn Hải., Đa hình đơn bội ADN ty thể của các cá thể người Việt Nam. Tạp chí Công nghệ sinh học, 2008. 6(4): p. 579-590. 5. Nguyễn Thy Ngọc, Nguyễn Quang Huy, Nguyễn Đăng Tôn, Nguyễn Thùy Dương., Đa hình vùng D-loop hệ gen ty thể của các cá thể tộc người Kinh và Mảng cùng trong nhóm ngữ hệ Nam Á. Tạp chí Công nghệ sinh học, 2018. 16(2): p. 231-240. 6. Karki, R., et al., Defining "mutation" and "polymorphism" in the era of personal genomics. BMC medical genomics, 2015. 8: p. 37-37. 7. What are single nucleotide polymorphisms (SNPs)? U.S National Library of Medicine 2020. 8. Barreiro, L.B., et al., Natural selection has driven population differentiation in modern humans. Nature genetics, 2008. 40(3): p. 340. 9. Stenson, P.D., et al., The Human Gene Mutation Database: providing a comprehensive central mutation database for molecular diagnostics and personalised genomics. 2009, Springer. 58 10. Salisbury, B.A., et al., SNP and haplotype variation in the human genome. Mutation Research/Fundamental and Molecular Mechanisms of Mutagenesis, 2003. 526(1-2): p. 53-61. 11. Collins, F.S., L.D. Brooks, and A. Chakravarti, A DNA polymorphism discovery resource for research on human genetic variation. Genome Res, 1998. 8(12): p. 1229-31. 12. McPherson, J.D., et al., A physical map of the human genome. Nature, 2001. 409(6822): p. 934-941. 13. Venter, J.C., et al., The sequence of the human genome. science, 2001. 291(5507): p. 1304-1351. 14. Bekris, L.M., et al., Multiple SNPs within and surrounding the apolipoprotein E gene influence cerebrospinal fluid apolipoprotein E protein levels. Journal of Alzheimer's disease, 2008. 13(3): p. 255-266. 15. Hirst, J., Why does mitochondrial complex I have so many subunits? Biochemical Journal, 2011. 437(2): p. e1-e3. 16. Smith, P.M., J.L. Fox, and D.R. Winge, Reprint of: Biogenesis of the cytochrome bc1 complex and role of assembly factors. Biochimica et Biophysica Acta (BBA)-Bioenergetics, 2012. 1817(6): p. 872-882. 17. Giles, R.E., et al., Maternal inheritance of human mitochondrial DNA. Proc Natl Acad Sci U S A, 1980. 77(11): p. 6715-9. 18. Brown, W.M., et al., Mitochondrial DNA sequences of primates: tempo and mode of evolution. Journal of molecular evolution, 1982. 18(4): p. 225- 239. 19. Robin, E.D. and R. Wong, Mitochondrial DNA molecules and virtual number of mitochondria per cell in mammalian cells. Journal of cellular physiology, 1988. 136(3): p. 507-513. 20. Pakendorf, B. and M. Stoneking, mitochondrial DNA and human evolution. Annual Review of Genomics and Human Genetics, 2005. 6(1): p. 165-183. 59 21. Howell, N., C. Howell, and J. Elson, Time dependency of molecular rate estimates for mtDNA: this is not the time for wishful thinking. Heredity, 2008. 101(2): p. 107-108. 22. Chen, M.-H., H.-M. Lee, and C.-Y. Tzen, Polymorphism and heteroplasmy of mitochondrial DNA in the D-loop region in Taiwanese. Journal-Formosan Medical Association, 2002. 101(4): p. 268-276. 23. Greenberg, B.D., J.E. Newbold, and A. Sugino, Intraspecific nucleotide sequence variability surrounding the origin of replication in human mitochondrial DNA. Gene, 1983. 21(1-2): p. 33-49. 24. www.mitomap.org. 25. Li, H. and R. Durbin, Inference of human population history from individual whole-genome sequences. Nature, 2011. 475(7357): p. 493-496. 26. Kutanan, W., et al., Complete mitochondrial genomes of Thai and Lao populations indicate an ancient origin of Austroasiatic groups and demic diffusion in the spread of Tai–Kadai languages. Human genetics, 2017. 136(1): p. 85-98. 27. Torroni, A., et al., Harvesting the fruit of the human mtDNA tree. Trens in Genetics, 2006. 22(6): p. 339-345. 28. Lippold, S., et al., Human paternal and maternal demographic histories: insights from high-resolution Y chromosome and mtDNA sequences. Investigative genetics, 2014. 5(1): p. 13. 29. Stewart, J.B. and P.F. Chinnery, The dynamics of mitochondrial DNA heteroplasmy: implications for human health and disease. Nature Reviews Genetics, 2015. 16(9): p. 530-542. 30. Stoneking, M. and F. Delfin, The human genetic history of East Asia: weaving a complex tapestry. Current Biology, 2010. 20(4): p. R188-R193. 31. Ivanova, R., et al., Mitochondrial DNA polymorphism in the Vietnamese population. European journal of immunogenetics, 1999. 26(6): p. 417-422. 60 32. Oota, H., et al., Extreme mtDNA homogeneity in continental Asian populations. American Journal of Physical Anthropology: The Official Publication of the American Association of Physical Anthropologists, 2002. 118(2): p. 146-153. 33. Huỳnh Thị Thu Huệ, Nguyễn Đăng Tôn, Lê Thị Thu Hiền, Nông Văn Hải., Phân tích trình tự vùng điều khiển (D-loop) trên genome ty thể của 5 cá thể người Việt Nam. Tạp chí Công nghệ sinh học, 2005. 3(1): p. 15-22. 34. Đỗ Mạnh Hưng, Phạm Nhật Khôi, Vũ Phương Nhung, Nguyễn Văn Phòng, Nguyễn Thùy Dương, Nông Văn Hải, Nguyễn Đăng Tôn., Sự đa dạng di truyền vùng HV2 hệ gen ty thể của một số nhóm người Việt. Tạp chí Công nghệ sinh học, 2016. 38(2): p. 243-249. 35. Pischedda, S., et al., Phylogeographic and genome-wide investigations of Vietnam ethnic groups reveal signatures of complex historical demographic movements. Scientific reports, 2017. 7(1): p. 1-15. 36. Duong, N.T., et al., Complete human mtDNA genome sequences from Vietnam and the phylogeography of Mainland Southeast Asia. Scientific reports, 2018. 8(1): p. 1-13. 37. Siddiqi, M.H., et al., Genetic characterization of the Makrani people of Pakistan from mitochondrial DNA control-region data. Legal Medicine, 2015. 17(2): p. 134-139. 38. Yang, X., et al., Mitochondrial DNA polymorphisms are associated with the longevity in the Guangxi Bama population of China. Molecular biology reports, 2012. 39(9): p. 9123-9131. 61 DANH MỤC PHỤ LỤC Trang 1. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Kinh và Cờ Lao ...63 2. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Kinh và Phù Lá 77 3. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Cờ Lao và Phù Lá 88 62 PHỤ LỤC 1. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Kinh và Cờ Lao Case Processing Summary Cases Valid Missing Total N Percent N Percent N Percent POPULATION * A73G 85 100.0% 0 0.0% 85 100.0% POPULATION * T146C,A 85 100.0% 0 0.0% 85 100.0% POPULATION * C150T 85 100.0% 0 0.0% 85 100.0% POPULATION * T152C 85 100.0% 0 0.0% 85 100.0% POPULATION * T199C 85 100.0% 0 0.0% 85 100.0% POPULATION * T204C 85 100.0% 0 0.0% 85 100.0% POPULATION * G207A 85 100.0% 0 0.0% 85 100.0% POPULATION * A210G 85 100.0% 0 0.0% 85 100.0% POPULATION * A235G 85 100.0% 0 0.0% 85 100.0% POPULATION * A263G 85 100.0% 0 0.0% 85 100.0% POPULATION * -315T,C 85 100.0% 0 0.0% 85 100.0% POPULATION * T316C 85 100.0% 0 0.0% 85 100.0% POPULATION * T16110C 85 100.0% 0 0.0% 85 100.0% POPULATION * T16117C 85 100.0% 0 0.0% 85 100.0% POPULATION * G16153A 85 100.0% 0 0.0% 85 100.0% POPULATION * T16164C 85 100.0% 0 0.0% 85 100.0% POPULATION * C16191T 85 100.0% 0 0.0% 85 100.0% POPULATION * T16196C 85 100.0% 0 0.0% 85 100.0% POPULATION * A16206C 85 100.0% 0 0.0% 85 100.0% POPULATION * A16207C 85 100.0% 0 0.0% 85 100.0% POPULATION * T16214C 85 100.0% 0 0.0% 85 100.0% POPULATION * A16229G 85 100.0% 0 0.0% 85 100.0% POPULATION * T16243C 85 100.0% 0 0.0% 85 100.0% POPULATION * C16249T 85 100.0% 0 0.0% 85 100.0% POPULATION * C16282T 85 100.0% 0 0.0% 85 100.0% POPULATION * C16287T 85 100.0% 0 0.0% 85 100.0% POPULATION * C16292A 85 100.0% 0 0.0% 85 100.0% POPULATION * C16316T 85 100.0% 0 0.0% 85 100.0% POPULATION * T16323C 85 100.0% 0 0.0% 85 100.0% POPULATION * T16324C 85 100.0% 0 0.0% 85 100.0% Case Processing Summary Cases Valid Missing Total N Percent N Percent N Percent POPULATION * T16337C 85 100.0% 0 0.0% 85 100.0% POPULATION * A16344G 85 100.0% 0 0.0% 85 100.0% POPULATION * G16345A 85 100.0% 0 0.0% 85 100.0% POPULATION * A73G Crosstab A73G Total 1 POPULATION CO LAO Count 34 34 Expected Count 34.0 34.0 KINH Count 51 51 Expected Count 51.0 51.0 Total Count 85 85 Expected Count 85.0 85.0 Chi-Square Tests Value 63 Pearson Chi-Square .a N of Valid Cases 85 a. No statistics are computed because A73G is a constant. POPULATION * T146C,A Crosstab T146C,A Total 0 1 2 POPULATION CO LAO Count 30 4 0 34 Expected Count 30.0 3.2 .8 34.0 KINH Count 45 4 2 51 Expected Count 45.0 4.8 1.2 51.0 Total Count 75 8 2 85 Expected Count 75.0 8.0 2.0 85.0 Chi-Square Tests Value df Asymp. Sig. (2- sided) Exact Sig. (2- sided) Pearson Ch

Các file đính kèm theo tài liệu này:

nghien_cuu_dac_diem_da_hinh_nucleotide_don_o_hai_vung_sieu_b.pdf