Luận án Xây dựng cơ sở dữ liệu về tần số allele 22 locus đa hình Str trên nhiễm sắc thể thường ở quần thể người mông tại Hà Giang, Việt Nam

MỞ ĐẦU .3

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .5

1.1. Tổng quan về đoạn lặp ngắn ngẫu nhiên – STR.5

1.1.1. Short tandem repeat – STR .5

1.1.2. Bộ kit Powerplex Fusion system được sử dụng trong giám định

.18

1.1.3. Cơ sở dữ liệu tần số STR.21

1.1.4. Di truyền quần thể và dân tộc .21

1.2. Tình hình nghiên cứu trong và ngoài nước .24

CHƯƠNG 2. NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN

CỨU .26

2.1. Nguyên vật liệu .26

2.1.1. Địa điểm thu mẫu.26

2.1.2. Thu thập và bảo quản .27

2.2. Phương pháp nghiên cứu .27

2.2.1. Khuếch đại đoạn gen .27

2.2.2. Tính toán tần số và các chỉ số pháp y .30

2.2.3. Xác định mối liên hệ giữa quần thể người Mông tại Hà Giang và

các quần thể khác .31

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN .32

3.1. Kết quả thu mẫu và khuếch đại ADN.32

3.2. Kết quả tính tần số các locus và xác định các allele có tần số

thấp .34

3.3. Kết quả phân tích thống kê.42

3.3.1. Kiểm định cân bằng Hardy-Weinberg .42

3.3.2. Gía trị dị hợp tử mong đợi và quan sát được .44

3.3.3. Kiểm tra tính di truyền liên kết của các locus STR .45

3.4. Kết quả phân tích các chỉ số pháp y .472

95 trang | Chia sẻ: honganh20 | Lượt xem: 728 | Lượt tải: 3Free

Bạn đang xem trước 20 trang tài liệu Luận án Xây dựng cơ sở dữ liệu về tần số allele 22 locus đa hình Str trên nhiễm sắc thể thường ở quần thể người mông tại Hà Giang, Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

.0 0 6 4 1 0 .0 1 2 8 2 18.2 0 .0 0 3 2 1 18.3 0 .1 0 2 5 6 38 19 0 .0 0 3 2 1 0 .0 2 8 8 5 0 .0 7 0 5 1 0 .1 9 5 5 1 0 .0 5 7 6 9 0 .4 2 6 2 8 0 .0 2 5 6 4 0 .0 0 3 2 1 19.3 0 .0 0 6 4 1 20 0 .0 5 7 6 9 0 .0 0 6 4 1 0 .0 5 4 4 9 0 .0 1 2 8 2 0 .0 8 6 5 4 0 .0 5 4 4 9 0 .0 0 3 2 1 21 0 .0 6 4 1 0 0 .0 0 6 4 1 0 .0 2 8 8 5 0 .1 7 6 2 8 0 .0 6 7 3 1 22 0 .0 1 9 2 3 0 .0 1 2 8 2 0 .0 8 9 7 4 0 .1 1 5 3 8 0 .0 8 6 5 4 22.2 0 .0 0 3 2 1 23 0 .0 1 6 0 3 0 .2 9 8 0 8 0 .0 3 5 2 6 0 .1 0 2 5 6 23.2 0 .0 0 6 4 1 24 0 .0 0 3 2 1 0 .2 1 1 5 4 0 .0 1 9 2 3 0 .2 2 4 3 6 39 24.2 0 .0 5 4 4 9 25 0 .0 2 2 4 4 0 .0 1 9 2 3 0 .2 1 1 5 4 25.2 0 .0 3 5 2 6 26 0 .0 2 2 4 4 0 .0 8 9 7 4 26.2 0 .0 0 3 2 1 27 0 .0 0 3 2 1 0 .0 2 5 6 4 28 0 .0 1 6 0 3 0 .0 0 3 2 1 29 0 .1 8 9 1 0 30 0 .0 0 3 2 1 0 .2 1 7 9 5 40 30.2 0 .0 1 6 0 3 31 0 .1 6 0 2 6 31.2 0 .1 6 0 2 6 32 0 .0 1 9 2 3 32.2 0 .1 0 5 7 7 33.2 0 .1 1 2 1 8 34.2 0 .0 0 3 2 1 41 Các allele có tần số thấp là các allele có tần số ≤ 5/2N, trong đó N là kích thước mẫu. Như vậy, đối với nghiên cứu này thì các allele có tần số ≤ 0.016026 được coi là các allele có tần số thấp, ít xuất hiện trong quần thể. Bảng 3.3 thống kê các allele có tần số thấp phát hiện được trong quần thể nghiên cứu. Số lượng allele có tần số thấp thấy nhiều nhất ở locus D18S51 và FGA. Kết quả này khác so với nghiên cứu thực hiện trên quần thể người Kinh hay các quần thể người dân tộc khác trước đó [4], [27], [37]. Tuy nhiên, nghiên cứu cùng trên đối tượng là người Mông của tác giả Nguyễn Như Giang, năm 2014 lại không công bố số liệu, do đó không thể tiến hành so sánh. Mặt khác, các allele được tìm thấy là có tần số thấp là đánh giá tương đối, tùy thuộc vào kích thước mẫu, N càng lớn thì tần số càng nhỏ dẫn đến việc allele A trong nghiên cứu này là allele có tần số thấp nhưng có thể không phải allele có tần số thấp trong nghiên cứu khác là hoàn toàn có khả năng. Bảng 3.3. Các allele có tần số thấp phát hiện được trong quần thể L o cu s D 3 S 1 3 5 8 D 1 S 1 6 5 6 D 2 S 4 4 1 D 1 0 S 1 2 4 8 D 1 3 S 3 1 7 P en ta E D 1 6 S 5 3 9 D 1 8 S 5 1 D 2 S 1 3 3 8 C S F 1 P O P en ta D allele 19 16.3 19.3 9.1 13 15 10 12 17 7 14 8 24 15 12 17 20 21 22 16 26 30 9 14 7 15 L o cu s v W A D 2 1 S 1 1 D 7 S 8 2 0 D 5 S 8 1 8 T P O X D 8 S 1 1 7 9 D 1 2 S 3 9 1 D 1 9 S 4 3 3 F G A D 2 2 S 1 0 4 5 T H 0 1 allele 20 34.2 13 15 7 8 9 14 10 8 17 15 12.2 15 16 18.2 18 22.2 23.2 26.2 28 13 18 19 20 42 3.3. Kết quả phân tích thống kê 3.3.1. Kiểm định cân bằng Hardy-Weinberg Các STR allele được di truyền cho con cái từ bố và mẹ theo quy luật di truyền Mendel, do đó tần số của một allele có thể dự đoán được theo quy luật phân bố khả năng. Nếu 2 allele A và a có tần số p và q trong một quần thể, thì tần số có kiểu hình đồng hợp AA sẽ là p2, kiểu hình dị hợp Aa là 2pq. Như vậy, từ tần số allele có thể tính được tần số allele mong đợi và tần số allele đó trong thực tế, và nếu giá trị mong đợi và thực tế tương đương nhau thì đồng nghĩa với allele của locus trong quần thể đó đang ở trạng thái cân bằng [11]. Cân bằng Hardy – Weinberg (HWE) giúp dự đoán tần số kiểu gen hay allele có ở trạng thái di truyền cân bằng hay không [33]. Bộ số liệu trong nghiên cứu này được kiểm định có đạt cân bằng HWE hay không, dưới giá trị p value = 0.002. Dựa trên kết quả phân tích cho thấy, toàn bộ 22 locus (không tính 2 locus trên NST giới tính) đều tuân theo cân bằng HWE (Bảng 3.4). Điều này có nghĩa là đối với các locus STR trong bộ kit Powerplex Fusion Systems thì các allele đều đang ở trạng thái cân bằng. Quần thể đạt cân bằng HWE có nghĩa là quần thể đó được coi là: quần thể giao phỗi ngẫu nhiên, không có hiện tượng di nhập gen hay đột biến phát sinh allele mới [33]. Tuy nhiên, những điều trên không tồn tại trong tự nhiên. Do đó mà việc kiểm định HWE trong nghiên cứu này chỉ trả lời câu hỏi là các locus có đang ở trạng thái di truyền cân bằng hay không, các allele trong một locus là di truyền độc lập và có thể dự đoán tần số của các allele trong một kiểu gen nếu các locus đó theo cân bằng HWE. Bảng 3.4. Kết quả kiểm định cân bằng HWE bằng phần mềm Arlequin v3.5 Locus #Genot P-value s.d. Steps done D3S1358 156 0.26 0.00039 1001000 D1S1656 156 0.927 0.00023 1001000 43 D2S441 156 0.422 0.00046 1001000 D10S1248 156 0.495 0.00049 1001000 D13S317 156 0.19 0.00039 1001000 Penta E 156 0.962 0.00016 1001000 D16S539 156 0.041 0.00017 1001000 D18S51 156 0.073 0.00016 1001000 D2S1338 156 0.188 0.00028 1001000 CSF1PO 156 0.559 0.00046 1001000 Penta D 156 0.463 0.00043 1001000 TH01 156 0.167 0.00039 1001000 vWA 156 0.844 0.00033 1001000 D21S11 156 0.018 0.00013 1001000 D7S820 156 0.755 0.00047 1001000 D5S818 156 0.574 0.00043 1001000 TPOX 156 0.738 0.0005 1001000 D8S1179 156 0.134 0.00028 1001000 D12S391 156 0.277 0.00041 1001000 D19S433 156 0.628 0.00037 1001000 FGA 156 0.21 0.00028 1001000 D22S1045 156 0.274 0.00035 1001000 44 3.3.2. Gía trị dị hợp tử mong đợi và quan sát được Các giá trị dị hợp tử mong đợi (EH) và dị hợp tử quan sát được (OH) của từng locus được cho trong Bảng 3.5. Có năm locus có giá trị EH > OH và 17 locus có EH < OH. Khi giá trị OH lớn hơn EH dưới kiểm định cân bằng HWE, có nghĩa là điều kiện chấp nhận đặt ra là không phù hợp. Như có nói ở trên, một quần thể trong tự nhiên không thể là một quần thể HWE. Do đó, hiện tượng OH> EH xảy ra có thể giải thích rằng quần thể nghiên cứu không giao phối ngẫu nhiên, điều này xảy ra thường xuyên trong quần thể loài người; quần thể nghiên cứu có hiện tượng di nhập gen, chịu tác động của chọn lọc tự nhiên, có phát sinh đột biến, và có biểu hiện của giao phối cận huyết [11], [38]. Bảng 3.5. Kết quả tính các chỉ số EH và OH của từng locus, các locus được đánh dấu đậm có giá trị OH<EH. Locus Số lượng OH EH. s.d. Steps done D3S1358 156 0.71154 0.26009 0.00039 1001000 D1S1656 156 0.85256 0.92682 0.00023 1001000 D2S441 156 0.69231 0.42209 0.00046 1001000 D10S1248 156 0.64744 0.49487 0.00049 1001000 D13S317 156 0.58974 0.18994 0.00039 1001000 Penta E 156 0.92949 0.96151 0.00016 1001000 D16S539 156 0.8141 0.04126 0.00017 1001000 D18S51 156 0.86538 0.07271 0.00016 1001000 D2S1338 156 0.78846 0.18777 0.00028 1001000 CSF1PO 156 0.64103 0.55855 0.00046 1001000 Penta D 156 0.76923 0.46318 0.00043 1001000 45 TH01 156 0.70513 0.16747 0.00039 1001000 vWA 156 0.76923 0.84353 0.00033 1001000 D21S11 156 0.85897 0.01771 0.00013 1001000 D7S820 156 0.6859 0.75476 0.00047 1001000 D5S818 156 0.76923 0.57426 0.00043 1001000 TPOX 156 0.57051 0.73766 0.0005 1001000 D8S1179 156 0.79487 0.13364 0.00028 1001000 D12S391 156 0.77564 0.27693 0.00041 1001000 D19S433 156 0.80128 0.6282 0.00037 1001000 FGA 156 0.83974 0.2096 0.00028 1001000 D22S1045 156 0.77564 0.27364 0.00035 1001000 3.3.3. Kiểm tra tính di truyền liên kết của các locus STR Các locus được đánh giá tính di truyền liên kết – linkage disequilibrium (LD) theo cặp, đánh giá sử dụng kiểm định Chi-Square với giá trị p = 0.002 (Bảng 3.6). Trong bộ 22 locus có locus D7S820 và D12S391 có p < 0.002, có nghĩa là hai locus trên di truyền liên kết cân bằng. Chi tiết các giá trị của kiểm định Chi-square các locus theo từng cặp được cho trong phần phụ lục 3. 46 Bảng 3.6. Bảng ma trận đánh giá linkage disequilibrium của các locus. Dấu "-" là không có ý nghĩa thống kê, "+" là có ý nghĩa thống kê so với p = 0.002 Locus D 3S 1358 D 1S 1656 D 2S 441 D 10S 1248 D 13S 317 P enta E D 16S 539 D 18S 51 D 2S 1338 C S F 1P O P enta D T H 01 vW A D 21S 11 D 7S 820 D 5S 818 T P O X D 8S 1179 D 12S 391 D 19S 433 F G A D 22S 1045 D3S1358 * - - - - - - - - - - - - - - - - - - - - - D1S1656 - * - - - - - - - - - - - - - - - - - - - - D2S441 - - * - - - - - - - - - - - - - - - - - - - D10S1248 - - - * - - - - - - - - - - - - - - - - - - D13S317 - - - - * - - - - - - - - - - - - - - - - - Penta E - - - - - * - - - - - - - - - - - - - - - - D16S539 - - - - - - * - - - - - - - - - - - - - - - D18S51 - - - - - - - * - - - - - - - - - - - - - - D2S1338 - - - - - - - - * - - - - - - - - - - - - - CSF1PO - - - - - - - - - * - - - - + - - - + - - - Penta D - - - - - - - - - - * - - - - - - - - - - - TH01 - - - - - - - - - - - * - - - - - - - - - - vWA - - - - - - - - - - - - * - - - - - - - - - D21S11 - - - - - - - - - - - - - * - - - - - - - - D7S820 - - - - - - - - - + - - - - * - - - - - - - D5S818 - - - - - - - - - - - - - - - * - - - - - - TPOX - - - - - - - - - - - - - - - - * - - - - - D8S1179 - - - - - - - - - - - - - - - - - * - - - - D12S391 - - - - - - - - - + - - - - - - - - * - - - D19S433 - - - - - - - - - - - - - - - - - - - * - - FGA - - - - - - - - - - - - - - - - - - - - * - D22S1045 - - - - - - - - - - - - - - - - - - - - - * 47 3.4. Kết quả phân tích các chỉ số pháp y 3.4.1. Chỉ số khả năng trùng hợp ngẫu nhiên - Match probability (MP) Chỉ số khả năng trùng hợp ngẫu nhiên là khả năng trùng lặp giữa mẫu xem xét với một mẫu trong quần thể tham khảo. Tuy nhiên, chỉ số này cần được đánh giá giữa các quần thể, do đó một locus có MP lớn trong quần thể này cũng có thể có MP nhỏ khi cách đánh giá thay đổi [33]. Hình 3.1 là biểu đồ biểu diễn các giá trị MP của từng locus, trong đó locus CSF1PO và TPOX cho giá trị MP lớn nhất. Ngược lại, locus Penta E cho giá trị MP là nhỏ nhất đối với quần thể nghiên cứu. Hình 3.1. Biểu đồ màu theo giá trị chỉ số MP của từng locus 3.4.2. Chỉ số khả năng loại trừ - Power of Exclusion Khả năng loại trừ - power of exclusion (PE) là khả năng loại trừ một cá thể ngẫu nhiên có là bố/mẹ của mẫu xem xét hay không. Giá trị PE đối với từng locus là khả năng loại trừ trong tính toán của locus đó. Như vậy, PE càng lớn, tiệm cận 1, đối với từng cá thể thì khả năng loại trừ càng cao, đồng nghĩa với khả năng nhận định theo huyết thống dựa trên tính toán xác xuất thống kê càng chính xác [39]. Đối với mỗi locus khác nhau thì sẽ có PE khác nhau, các giá trị này quyết định trọng số của locus đó trong quá trình tính toán xác xuất hai hồ 48 sơ ADN là có khả năng trùng nhau hay không. Với cùng một bộ kit thì giá trị PE của mỗi locus cũng khác nhau. Ở quần thể trong nghiên cứu này, locus Penta E có PE lớn nhất, nằm trong khoảng (0,85; 0,9). Ngược lại, locus TPOX cho PE nhỏ nhất, trong khoảng (0,25; 0,3) (Hình 3.2). Trong khi đó, giá trị PE lớn nhất xác định được ở locus Penta E và nhỏ nhất ở locus D3S1358 ở quần thể người Kinh, sử dụng cùng bộ kit [4]. Hình 3.2. Biều đồ màu theo giá trị chỉ só PE của từng locus 3.4.3. Chỉ số khả năng phân biệt – Discrimination capacity Chỉ số khả năng phân biệt – DC của từng locus là chỉ số đánh giá khả năng phân biệt cá thể của locus đó. Trong quá trình tạo lập hồ sơ ADN cho truy nguyên cá thể thì điều đặc biệt quan trọng đó là các chỉ thị locus STR được sử dụng phải có khả năng phân biệt cao. Đối với một locus theo cân bằng HWE, thì giá trị DC sẽ bằng 1 – giá trị PI (sẽ được đề cập ở phần sau). Chỉ số này càng gần 1 thì khả năng phân biệt của locus đó càng lớn. Hình 3.3 cho thấy giá trị DC của các locus khác nhau, từ khoảng 0,75 đến gần 1. Trong đó, locus Penta E cho giá trị DC lớn nhất, ngược lại thì locus TPOX cho DC nhỏ nhất. Kết quả này cho thấy sự tương đồng giữa các kết quả phân tích trước về số 49 allele của từng locus, cũng như các chỉ số pháp y liên quan. Locus Penta E có số allele xác định được là nhiều nhất, cũng có PE là lớn nhất, MP nhỏ và DC lớn nhất. Trong khi đó, locus TPOX có PE nhỏ nhất, MP lớn và DC nhỏ nhất. Hình 3.3. Biều đồ màu theo giá trị DC của từng locus 3.4.4. Chỉ số đa hình - Polymorphic information content Chỉ số đa hình – PIC là chỉ số đánh giá tính đa hình của các locus được sử dụng. Locus có tính đa hình càng lớn thì càng có ý nghĩa trong tính toán khả năng về mối quan hệ huyết thống giữa 2 cá thể. Đối với quần thể Mông trong nghiên cứu này, locus Penta E có giá trị PIC là lớn nhất 0,908266864265989, còn locus TPOX là nhỏ nhất với PIC = 0,519750407231249 (Bảng 3.8). Kết quả này cũng cho thấy sự tương quan giữa các chỉ số pháp y của từng locus. Penta E cũng được đánh giá có tính đa hình cao và được sử dụng làm chỉ thị đánh giá sự đa dạng quần thể trong nghiên cứu khác [40]. 3.4.5. Chỉ số Parternity index – PI Hình 15 biểu diễn chỉ số parternity index – PI của từng locus trên quần thể người Mông thu được. Trong đó, locus Penta E có PI lớn nhất, còn locus 50 TH0, TPOX, D2S441, D3S1358, CSF1PO, D10S1248, và D13S317 có PI nhỏ nhất. Giá trị PI có giá trị trong tính toán trọng số của các chỉ thị và khả năng một kiểu gen là cha hoặc mẹ của kiểu gen kiểm chứng. Giá trị PI ≤ 1 thì chỉ thị đó không có ý nghĩa trong tính toán xác suất thống kê [33]. Do đó, các locus trong nghiên cứu đều phù hợp cho phục đích giám định do đều có PI > 1. Hình 3.4. Biểu đồ màu theo giá trị của chỉ số PI của các locus 3.5. Các chỉ số pháp y đánh giá tần số các allele của một quần thể Các chỉ số kết hợp có thể dùng cho đánh giá chất lượng của bảng tần số và khả năng ứng dụng của bảng tần số đó trong công tác giám định thực tế [11], [33]. Các chỉ số Combined PE và Combinded DC càng lớn, càng gần một hoặc bằng 1 thì chứng minh rằng các locus được sử dụng cho các tần số allele có khả năng phân biệt và loại trừ cao, do đó có thể dùng để cho công tác giám định thực tế. Đối với chỉ số Combinded MP thì ngược lại, giá trị này càng nhỏ có nghĩa là khả năng trùng lặp ngẫu nhiên giữa 2 bộ hồ sơ ADN càng thấp, do đó sai số trong tính toán xác xuất thống kê càng nhỏ. Bảng 3.8 thể hiện chi tiết các giá trị MP, PE, DC và các giá trị combinded của các chỉ số đó, cùng với chỉ số PIC đối với bộ 22 locus của bộ kit Powerplex Fusion trên quần thể người Mông 51 trong nghiên cứu này. Giá trị Combinded PE (CPE) thu được là 0,999999987 cho thấy khả năng loại trừ của các locus và của bộ số liệu là rất cao. Giá trị Combinded DC thu được tiệm cận 1 (1,00000000000000) chứng tỏ khả năng phân biệt rất tốt của các locus. Thêm vào đó, giá trị combinded MP tại rất nhỏ, chỉ bằng 3,86 ×10-23. Như vậy, có thể kết luận dựa trên các chỉ số kết hợp là bộ số liệu tần số allele của 22 locus STR trên NST thường thu được trong nghiên cứu này hoàn toàn có thể ứng dụng được trong công tác giám định thực tế. Bảng số liệu tần số thu được trong nghiên cứu này sẽ được đưa vào làm cơ sở dữ liệu cho tính toàn bằng phần mềm STR – VN version 1.0, một phần mềm được xây dựng bởi nhóm nghiên cứu thuộc Viện Công nghệ Sinh học – Viện Hàn lâm Khoa học và Công nghệ Việt Nam (Hình 3.5). Bảng 3.7. Các chỉ số MP, PE, DC và PIC của các locus Locus MP PE DC PIC CSF1PO 0.210141 0.343027 0.789859 0.557019 D10S1248 0.162475 0.351705 0.837525 0.613837 D12S391 0.094017 0.554641 0.905983 0.731492 D13S317 0.170201 0.278753 0.8298 0.611476 D16S539 0.160339 0.625471 0.839661 0.673925 D18S51 0.069855 0.725402 0.930145 0.793209 D19S433 0.095743 0.601422 0.904257 0.731159 D1S1656 0.048159 0.699924 0.951841 0.818746 D21S11 0.05498 0.712627 0.94502 0.820474 D22S1045 0.124589 0.554641 0.875411 0.695176 D2S1338 0.064924 0.577803 0.935076 0.789711 D2S441 0.110125 0.416461 0.889875 0.699439 D3S1358 0.145135 0.446335 0.854865 0.650858 D5S818 0.112508 0.543237 0.887492 0.702541 D7S820 0.123932 0.406783 0.876068 0.667303 D8S1179 0.087525 0.589557 0.912475 0.737462 FGA 0.035667 0.674753 0.964333 0.852489 Penta.D 0.062541 0.543237 0.937459 0.783956 Penta.E 0.017834 0.855961 0.982166 0.908267 TH01 0.143162 0.436238 0.856838 0.654371 TPOX 0.232906 0.256979 0.767094 0.51975 vWA 0.118919 0.543237 0.881082 0.699066 Combined 3.86E-23 0.999999987 1.00000000000000 52 3.6. Kết quả phân tích mối tương quan di truyền với các quần thể khác Sự khác biệt về tần số allele các locus giữa các quần thể khác nhau có mối liên hệ về mối tương quan di truyền giữa các quần thể đó. Mối tương quan này có thể liên quan đến vị trí địa lý hoặc theo các nhóm ngôn ngữ [3]. Trong nghiên cứu này, bảng số liệu tần số allele của quần thể người Mông được so sánh với hai quần thể thuộc cùng một ngữ hệ đó là quần thể người Miao ở Quỳ Châu [41], và quần thể người Yao ở Quảng Đông [42], Trung Quốc. Hai quần thể này cùng với quần thể người Mông ở Việt Nam thuộc ngữ hệ H’mông – Dao. Ngoài ra, so sánh còn bao gốm các quần thể khác như: quần thể Kinh tại Việt Nam [4] và quần thể người Thái tại Thái Lan [43] thuộc nhóm ngữ hệ Nam Á; hai quần hể người Hán tại tỉnh Vân Nam và Liêu Ning, Trung Quốc thuộc Hình 3.5. Hình ảnh giao diện phần mềm STR-VN version 1.0 53 nhóm ngữ hệ Hán – Tạng [44], [45]; quần thể người Hàn tại Hàn Quốc [46]; quần thể người Nhật tại Nhật Bản [47]; người Ấn Độ tại Ấn Độ [48]; quần thể người Hà Lan tại Hà Lan [49] và quần thể người Ovambo – African tại Namibia [50]. Các quần thể người Hà Lan đại diện cho chủng người da trắng – Caucasian và người Ovambo đại diện cho chủng người da đen – African. Dựa trên kết quả phân tích tương quan di truyền qua cây phát sinh chủng loại (Hình 3.6) cho thấy, quần thể người Mông có mối quan hệ di truyền gần gũi với người Miao và Yao ở Trung Quốc. Kết quả này khẳng định mối quan hệ gần gũi và lịch sử hình thành các quần thể người H’mông – Dao tại khu vực Đông Nam Á và Trung Quốc. Châu Á là nơi có sự đa dạng về chủng tộc, nhóm người rất cao [8]. Các nhóm người có đặc điểm di truyền quần thể riêng và có mối quan hệ tương quan với nhau và có liên quan đến điều kiện địa lý. Điều này thể hiện rõ ràng trên cây chủng loại xây dựng được. Hai quần thể thuộc ngữ hệ Nam Á và có vị trí địa lý gần nhau như người Kinh và người Thái nằm cùng trong một nhánh với giá trị bootstrap 67 (Hình 3.6). Quần thể người Hán tại Vân Nam gần gũi với các nhánh của nhóm Nam Á và Mông – Dao hơn so với nhóm Hán tại Liêu Ning. Kết quả này có được có thể do ảnh hưởng bởi khoảng cách địa lý, khi mà tỉnh Vân Nam nằm ở phía Nam Trung Quốc, có đường biên giới chung với Việt Nam và Thái Lan, do đó sự pha trộn vốn gen với các nhóm người lân cận hơn so với nhóm tại Liêu Ning nằm ở phía Bắc Trung Quốc. Nhóm phía Bắc này do đó cũng gần với các nhóm người Hàn Quốc và Nhật Bản hơn (Hình 3.6). Các nhóm thuộc chủng người da trắng, người da đen và nhóm phía Nam Châu Á có sự khác biệt rõ ràng so với các nhóm còn lại. Kết quả này tương đồng với các kết quả nghiên cứu trước đó. [4], [44], [51], [52] 54 Hình 3.6. Cây phát sinh chủng loại về mối tương quan di truyền giữa người Mông và các quần thể khác 55 CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ 4.1. Kết luận Dựa trên các kết quả có được từ nghiên cứu khảo sát và xây dựng cơ sở dữ liệu tần số allele 22 locus đa hình STR ở quần thể người Mông tại Hà Giang, Việt Nam bằng bộ kit Powerplex Fusion Systems, có thể kết luận như sau: (1) Khuếch đại thành công 22 locus bằng bộ kit Powerplex Fusion System đối với 156 mẫu là người Mông tại Hà Giang, Việt Nam. Quá trình và phương pháp thu thập mẫu được sử dụng trong nghiên cứu này là phù hợp và có thể ứng dụng cho các nghiên cứu khác. (2) Các locus được sử dụng trong bộ kit đã được đánh giá tính hiệu quả và chính xác dựa trên các phân tích thống kê. Kết quả cho thấy, bộ kit Powerplex Fusion System là phù hợp cho công tác giám định pháp y, xét nghiệm huyết thống cũng như có thể sử dụng trong nghiên cứu đánh giá sự đa dạng và di truyền của quần thể người Mông tại Hà Giang, Việt Nam. (3) Đề tài đã xây dựng thành công bộ cơ sở dữ liệu tần số allele 22 locus STR cho quần thể người Mông tại Hà Giang, và có thể đưa vào sử dụng trong thực tế xét nghiệm huyết thống, truy nguyên cá thể trong giám định pháp y, hoặc xác định nhóm người. (4) Kết quả phân tích cho thấy mối liên hệ di truyền gần gũi giữa quần thể người Mông tại Hà Giang, Việt Nam với quần thể người Miao và Yao ở Trung Quốc. Kết quả này khẳng định ứng dụng của tần số allele các locus STR trong nghiên cứu đa dạng và di truyền quần thể. Kết quả cũng lần đầu khẳng định mối quan hệ gần gũi về di truyền giữa các nhóm Mông tại Việt Nam và Trung Quốc mà đã được khẳng định trước đó dựa trên các bằng chứng khác. 56 4.2. Kiến nghị Dựa trên các kết quả thu được, chúng tôi đề xuất một số nội dung sau: (1) Bổ sung bảng tần số allele 22 locus STR trên NST bằng bộ kit Powerplex Fusion Systems vào quy trình xác định xác xuất thống kê trong giám định pháp y, truy nguyên cá thể, xác định huyết thống hoặc tìm kiếm người mất tích. (2) Mở rộng số lượng mẫu nghiên cứu lớn hơn, ít nhất là 500 cá thể nhằm cải thiện hiệu quả tính toán và giảm thiểu sai số thống kê. (3) Mở rộng nghiên cứu và xây dựng cơ sở dữ liệu tần số allele các locus STR đối với các nhóm dân tộc khác tại Việt Nam, nhằm phục vụ cho công tác giám định và nghiên cứu. 57 TÀI LIỆU THAM KHẢO [1] M. G. J. Tilanus, “Short tandem repeat markers in diagnostics: what’s in a repeat?,” Leukemia, vol. 20, no. 8, pp. 1353–1355, Aug. 2006. [2] J. M. Butler, “Short Tandem Repeat Analysis for Human Identity Testing,” in Current Protocols in Human Genetics, vol. Chapter 14, Hoboken, NJ, USA: John Wiley & Sons, Inc., 2004, p. Unit 14.8. [3] J. K. Pritchard, M. Stephens, and P. Donnelly, “Inference of population structure using multilocus genotype data.,” Genetics, vol. 155, no. 2, pp. 945–59, Jun. 2000. [4] H. L. Tran, H. T. Nguyen, T. T. Pham, M. H. Nguyen, H. Hoang, and H. H. Chu, “Allele frequencies for 22 autosomal STRs in the Kinh population in Vietnam,” Int. J. Legal Med., Jan. 2019. [5] I. Shimada, B. Brinkmann, N. Q. Tuyen, and C. Hohoff, “Allele frequency data for 16 STR loci in the Vietnamese population.,” Int. J. Legal Med., vol. 116, no. 4, pp. 246–8, Aug. 2002. [6] X. Zhang et al., “Genetic polymorphisms of 20 autosomal STR loci in the Vietnamese population from Yunnan Province, Southwest China,” Int. J. Legal Med., vol. 131, no. 3, pp. 661–662, May 2017. [7] P. Lertrit et al., “Genetic history of Southeast Asian populations as revealed by ancient and modern human mitochondrial DNA analysis,” Am. J. Phys. Anthropol., vol. 137, no. 4, pp. 425–440, Dec. 2008. [8] T. H. P.-A. S. HUGO Pan-Asian SNP Consortium et al., “Mapping human genetic diversity in Asia.,” Science, vol. 326, no. 5959, pp. 1541– 5, Dec. 2009. [9] H. McColl et al., “The prehistoric peopling of Southeast Asia.,” Science, vol. 361, no. 6397, pp. 88–92, Jul. 2018. [10] M. Lipson et al., “Ancient genomes document multiple waves of migration in Southeast Asian prehistory,” Science (80-. )., vol. 361, no. 6397, pp. 92–95, Jul. 2018. [11] J. M. (John M. Butler, Fundamentals of forensic DNA typing, First. Academic Press/Elsevier, 2009. [12] A. J. Jeffreys, “The man behind the DNA fingerprints: an interview with Professor Sir Alec Jeffreys,” Investig. Genet., vol. 4, p. 21, 2013. [13] Z. Wong, V. Wilson, I. Patel, S. Povey, and A. J. Jeffreys, “Characterization of a panel of highly variable minisatellites cloned from 58 human DNA,” Ann. Hum. Genet., vol. 51, no. 4, pp. 269–288, 1987. [14] L. Roewer, “DNA fingerprinting in forensics: Past, present, future,” Investigative Genetics, vol. 4, no. 1. BioMed Central, p. 22, 18-Nov- 2013. [15] L. L. Cavalli-Sforza and M. W. Feldman, “The application of molecular genetic approaches to the study of human evolution.,” Nat. Genet., vol. 33 Suppl, pp. 266–75, Mar. 2003. [16] M. A. Jobling and P. Gill, “Encoded evidence: DNA in forensic analysis,” Nat. Rev. Genet., vol. 5, no. 10, pp. 739–751, Oct. 2004. [17] R. Chakraborty, M. Kimmel, D. N. Stivers, L. J. Davison, and R. Deka, “Relative mutation rates at di-, tri-, and tetranucleotide microsatellite loci,” Proc. Natl. Acad. Sci. U. S. A., vol. 94, no. 3, pp. 1041–1046, Feb. 1997. [18] H. Fan and J. Y. Chu, “A Brief Review of Short Tandem Repeat Mutation,” Genomics, Proteomics and Bioinformatics, vol. 5, no. 1. Beijing Genomics Institute, pp. 7–14, 2007. [19] M. Zavodna, A. Bagshaw, R. Brauning, and N. J. Gemmell, “The effects of transcription and recombination on mutational dynamics of short tandem re

Các file đính kèm theo tài liệu này:

luan_an_xay_dung_co_so_du_lieu_ve_tan_so_allele_22_locus_da.pdf