MỞ ĐẦU .3
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .5
1.1. Tổng quan về đoạn lặp ngắn ngẫu nhiên – STR.5
1.1.1. Short tandem repeat – STR .5
1.1.2. Bộ kit Powerplex Fusion system được sử dụng trong giám định
.18
1.1.3. Cơ sở dữ liệu tần số STR.21
1.1.4. Di truyền quần thể và dân tộc .21
1.2. Tình hình nghiên cứu trong và ngoài nước .24
CHƯƠNG 2. NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN
CỨU .26
2.1. Nguyên vật liệu .26
2.1.1. Địa điểm thu mẫu.26
2.1.2. Thu thập và bảo quản .27
2.2. Phương pháp nghiên cứu .27
2.2.1. Khuếch đại đoạn gen .27
2.2.2. Tính toán tần số và các chỉ số pháp y .30
2.2.3. Xác định mối liên hệ giữa quần thể người Mông tại Hà Giang và
các quần thể khác .31
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN .32
3.1. Kết quả thu mẫu và khuếch đại ADN.32
3.2. Kết quả tính tần số các locus và xác định các allele có tần số
thấp .34
3.3. Kết quả phân tích thống kê.42
3.3.1. Kiểm định cân bằng Hardy-Weinberg .42
3.3.2. Gía trị dị hợp tử mong đợi và quan sát được .44
3.3.3. Kiểm tra tính di truyền liên kết của các locus STR .45
3.4. Kết quả phân tích các chỉ số pháp y .472
95 trang |
Chia sẻ: honganh20 | Ngày: 03/03/2022 | Lượt xem: 404 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận án Xây dựng cơ sở dữ liệu về tần số allele 22 locus đa hình Str trên nhiễm sắc thể thường ở quần thể người mông tại Hà Giang, Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
.0
0
6
4
1
0
.0
1
2
8
2
18.2
0
.0
0
3
2
1
18.3
0
.1
0
2
5
6
38
19
0
.0
0
3
2
1
0
.0
2
8
8
5
0
.0
7
0
5
1
0
.1
9
5
5
1
0
.0
5
7
6
9
0
.4
2
6
2
8
0
.0
2
5
6
4
0
.0
0
3
2
1
19.3
0
.0
0
6
4
1
20
0
.0
5
7
6
9
0
.0
0
6
4
1
0
.0
5
4
4
9
0
.0
1
2
8
2
0
.0
8
6
5
4
0
.0
5
4
4
9
0
.0
0
3
2
1
21
0
.0
6
4
1
0
0
.0
0
6
4
1
0
.0
2
8
8
5
0
.1
7
6
2
8
0
.0
6
7
3
1
22
0
.0
1
9
2
3
0
.0
1
2
8
2
0
.0
8
9
7
4
0
.1
1
5
3
8
0
.0
8
6
5
4
22.2
0
.0
0
3
2
1
23
0
.0
1
6
0
3
0
.2
9
8
0
8
0
.0
3
5
2
6
0
.1
0
2
5
6
23.2
0
.0
0
6
4
1
24
0
.0
0
3
2
1
0
.2
1
1
5
4
0
.0
1
9
2
3
0
.2
2
4
3
6
39
24.2
0
.0
5
4
4
9
25
0
.0
2
2
4
4
0
.0
1
9
2
3
0
.2
1
1
5
4
25.2
0
.0
3
5
2
6
26
0
.0
2
2
4
4
0
.0
8
9
7
4
26.2
0
.0
0
3
2
1
27
0
.0
0
3
2
1
0
.0
2
5
6
4
28
0
.0
1
6
0
3
0
.0
0
3
2
1
29
0
.1
8
9
1
0
30
0
.0
0
3
2
1
0
.2
1
7
9
5
40
30.2
0
.0
1
6
0
3
31
0
.1
6
0
2
6
31.2
0
.1
6
0
2
6
32
0
.0
1
9
2
3
32.2
0
.1
0
5
7
7
33.2
0
.1
1
2
1
8
34.2
0
.0
0
3
2
1
41
Các allele có tần số thấp là các allele có tần số ≤ 5/2N, trong đó N là kích
thước mẫu. Như vậy, đối với nghiên cứu này thì các allele có tần số ≤ 0.016026
được coi là các allele có tần số thấp, ít xuất hiện trong quần thể. Bảng 3.3 thống
kê các allele có tần số thấp phát hiện được trong quần thể nghiên cứu. Số lượng
allele có tần số thấp thấy nhiều nhất ở locus D18S51 và FGA. Kết quả này khác
so với nghiên cứu thực hiện trên quần thể người Kinh hay các quần thể người
dân tộc khác trước đó [4], [27], [37]. Tuy nhiên, nghiên cứu cùng trên đối tượng
là người Mông của tác giả Nguyễn Như Giang, năm 2014 lại không công bố số
liệu, do đó không thể tiến hành so sánh. Mặt khác, các allele được tìm thấy là
có tần số thấp là đánh giá tương đối, tùy thuộc vào kích thước mẫu, N càng lớn
thì tần số càng nhỏ dẫn đến việc allele A trong nghiên cứu này là allele có tần
số thấp nhưng có thể không phải allele có tần số thấp trong nghiên cứu khác là
hoàn toàn có khả năng.
Bảng 3.3. Các allele có tần số thấp phát hiện được trong quần thể
L
o
cu
s
D
3
S
1
3
5
8
D
1
S
1
6
5
6
D
2
S
4
4
1
D
1
0
S
1
2
4
8
D
1
3
S
3
1
7
P
en
ta E
D
1
6
S
5
3
9
D
1
8
S
5
1
D
2
S
1
3
3
8
C
S
F
1
P
O
P
en
ta D
allele 19 16.3
19.3
9.1
13
15
10
12
17
7
14
8
24
15 12
17
20
21
22
16
26
30
9
14
7
15
L
o
cu
s
v
W
A
D
2
1
S
1
1
D
7
S
8
2
0
D
5
S
8
1
8
T
P
O
X
D
8
S
1
1
7
9
D
1
2
S
3
9
1
D
1
9
S
4
3
3
F
G
A
D
2
2
S
1
0
4
5
T
H
0
1
allele 20 34.2 13
15
7
8
9
14
10 8
17
15 12.2
15
16
18.2
18
22.2
23.2
26.2
28
13
18
19
20
42
3.3. Kết quả phân tích thống kê
3.3.1. Kiểm định cân bằng Hardy-Weinberg
Các STR allele được di truyền cho con cái từ bố và mẹ theo quy luật di
truyền Mendel, do đó tần số của một allele có thể dự đoán được theo quy luật
phân bố khả năng. Nếu 2 allele A và a có tần số p và q trong một quần thể, thì
tần số có kiểu hình đồng hợp AA sẽ là p2, kiểu hình dị hợp Aa là 2pq. Như vậy,
từ tần số allele có thể tính được tần số allele mong đợi và tần số allele đó trong
thực tế, và nếu giá trị mong đợi và thực tế tương đương nhau thì đồng nghĩa
với allele của locus trong quần thể đó đang ở trạng thái cân bằng [11]. Cân bằng
Hardy – Weinberg (HWE) giúp dự đoán tần số kiểu gen hay allele có ở trạng
thái di truyền cân bằng hay không [33]. Bộ số liệu trong nghiên cứu này được
kiểm định có đạt cân bằng HWE hay không, dưới giá trị p value = 0.002. Dựa
trên kết quả phân tích cho thấy, toàn bộ 22 locus (không tính 2 locus trên NST
giới tính) đều tuân theo cân bằng HWE (Bảng 3.4). Điều này có nghĩa là đối
với các locus STR trong bộ kit Powerplex Fusion Systems thì các allele đều
đang ở trạng thái cân bằng. Quần thể đạt cân bằng HWE có nghĩa là quần thể
đó được coi là: quần thể giao phỗi ngẫu nhiên, không có hiện tượng di nhập
gen hay đột biến phát sinh allele mới [33]. Tuy nhiên, những điều trên không
tồn tại trong tự nhiên. Do đó mà việc kiểm định HWE trong nghiên cứu này chỉ
trả lời câu hỏi là các locus có đang ở trạng thái di truyền cân bằng hay không,
các allele trong một locus là di truyền độc lập và có thể dự đoán tần số của các
allele trong một kiểu gen nếu các locus đó theo cân bằng HWE.
Bảng 3.4. Kết quả kiểm định cân bằng HWE bằng phần mềm Arlequin v3.5
Locus #Genot P-value s.d. Steps done
D3S1358 156 0.26 0.00039 1001000
D1S1656 156 0.927 0.00023 1001000
43
D2S441 156 0.422 0.00046 1001000
D10S1248 156 0.495 0.00049 1001000
D13S317 156 0.19 0.00039 1001000
Penta E 156 0.962 0.00016 1001000
D16S539 156 0.041 0.00017 1001000
D18S51 156 0.073 0.00016 1001000
D2S1338 156 0.188 0.00028 1001000
CSF1PO 156 0.559 0.00046 1001000
Penta D 156 0.463 0.00043 1001000
TH01 156 0.167 0.00039 1001000
vWA 156 0.844 0.00033 1001000
D21S11 156 0.018 0.00013 1001000
D7S820 156 0.755 0.00047 1001000
D5S818 156 0.574 0.00043 1001000
TPOX 156 0.738 0.0005 1001000
D8S1179 156 0.134 0.00028 1001000
D12S391 156 0.277 0.00041 1001000
D19S433 156 0.628 0.00037 1001000
FGA 156 0.21 0.00028 1001000
D22S1045 156 0.274 0.00035 1001000
44
3.3.2. Gía trị dị hợp tử mong đợi và quan sát được
Các giá trị dị hợp tử mong đợi (EH) và dị hợp tử quan sát được (OH) của
từng locus được cho trong Bảng 3.5. Có năm locus có giá trị EH > OH và 17
locus có EH < OH. Khi giá trị OH lớn hơn EH dưới kiểm định cân bằng HWE,
có nghĩa là điều kiện chấp nhận đặt ra là không phù hợp. Như có nói ở trên,
một quần thể trong tự nhiên không thể là một quần thể HWE. Do đó, hiện tượng
OH> EH xảy ra có thể giải thích rằng quần thể nghiên cứu không giao phối
ngẫu nhiên, điều này xảy ra thường xuyên trong quần thể loài người; quần thể
nghiên cứu có hiện tượng di nhập gen, chịu tác động của chọn lọc tự nhiên, có
phát sinh đột biến, và có biểu hiện của giao phối cận huyết [11], [38].
Bảng 3.5. Kết quả tính các chỉ số EH và OH của từng locus, các locus được đánh dấu đậm có giá
trị OH<EH.
Locus Số lượng OH EH. s.d. Steps done
D3S1358 156 0.71154 0.26009 0.00039 1001000
D1S1656 156 0.85256 0.92682 0.00023 1001000
D2S441 156 0.69231 0.42209 0.00046 1001000
D10S1248 156 0.64744 0.49487 0.00049 1001000
D13S317 156 0.58974 0.18994 0.00039 1001000
Penta E 156 0.92949 0.96151 0.00016 1001000
D16S539 156 0.8141 0.04126 0.00017 1001000
D18S51 156 0.86538 0.07271 0.00016 1001000
D2S1338 156 0.78846 0.18777 0.00028 1001000
CSF1PO 156 0.64103 0.55855 0.00046 1001000
Penta D 156 0.76923 0.46318 0.00043 1001000
45
TH01 156 0.70513 0.16747 0.00039 1001000
vWA 156 0.76923 0.84353 0.00033 1001000
D21S11 156 0.85897 0.01771 0.00013 1001000
D7S820 156 0.6859 0.75476 0.00047 1001000
D5S818 156 0.76923 0.57426 0.00043 1001000
TPOX 156 0.57051 0.73766 0.0005 1001000
D8S1179 156 0.79487 0.13364 0.00028 1001000
D12S391 156 0.77564 0.27693 0.00041 1001000
D19S433 156 0.80128 0.6282 0.00037 1001000
FGA 156 0.83974 0.2096 0.00028 1001000
D22S1045 156 0.77564 0.27364 0.00035 1001000
3.3.3. Kiểm tra tính di truyền liên kết của các locus STR
Các locus được đánh giá tính di truyền liên kết – linkage disequilibrium
(LD) theo cặp, đánh giá sử dụng kiểm định Chi-Square với giá trị p = 0.002
(Bảng 3.6). Trong bộ 22 locus có locus D7S820 và D12S391 có p < 0.002, có
nghĩa là hai locus trên di truyền liên kết cân bằng.
Chi tiết các giá trị của kiểm định Chi-square các locus theo từng cặp được
cho trong phần phụ lục 3.
46
Bảng 3.6. Bảng ma trận đánh giá linkage disequilibrium của các locus. Dấu "-" là không có ý nghĩa thống kê, "+" là có ý nghĩa thống kê so với p = 0.002
Locus
D
3S
1358
D
1S
1656
D
2S
441
D
10S
1248
D
13S
317
P
enta E
D
16S
539
D
18S
51
D
2S
1338
C
S
F
1P
O
P
enta D
T
H
01
vW
A
D
21S
11
D
7S
820
D
5S
818
T
P
O
X
D
8S
1179
D
12S
391
D
19S
433
F
G
A
D
22S
1045
D3S1358 * - - - - - - - - - - - - - - - - - - - - -
D1S1656 - * - - - - - - - - - - - - - - - - - - - -
D2S441 - - * - - - - - - - - - - - - - - - - - - -
D10S1248 - - - * - - - - - - - - - - - - - - - - - -
D13S317 - - - - * - - - - - - - - - - - - - - - - -
Penta E - - - - - * - - - - - - - - - - - - - - - -
D16S539 - - - - - - * - - - - - - - - - - - - - - -
D18S51 - - - - - - - * - - - - - - - - - - - - - -
D2S1338 - - - - - - - - * - - - - - - - - - - - - -
CSF1PO - - - - - - - - - * - - - - + - - - + - - -
Penta D - - - - - - - - - - * - - - - - - - - - - -
TH01 - - - - - - - - - - - * - - - - - - - - - -
vWA - - - - - - - - - - - - * - - - - - - - - -
D21S11 - - - - - - - - - - - - - * - - - - - - - -
D7S820 - - - - - - - - - + - - - - * - - - - - - -
D5S818 - - - - - - - - - - - - - - - * - - - - - -
TPOX - - - - - - - - - - - - - - - - * - - - - -
D8S1179 - - - - - - - - - - - - - - - - - * - - - -
D12S391 - - - - - - - - - + - - - - - - - - * - - -
D19S433 - - - - - - - - - - - - - - - - - - - * - -
FGA - - - - - - - - - - - - - - - - - - - - * -
D22S1045 - - - - - - - - - - - - - - - - - - - - - *
47
3.4. Kết quả phân tích các chỉ số pháp y
3.4.1. Chỉ số khả năng trùng hợp ngẫu nhiên - Match probability (MP)
Chỉ số khả năng trùng hợp ngẫu nhiên là khả năng trùng lặp giữa mẫu
xem xét với một mẫu trong quần thể tham khảo. Tuy nhiên, chỉ số này cần được
đánh giá giữa các quần thể, do đó một locus có MP lớn trong quần thể này cũng
có thể có MP nhỏ khi cách đánh giá thay đổi [33]. Hình 3.1 là biểu đồ biểu diễn
các giá trị MP của từng locus, trong đó locus CSF1PO và TPOX cho giá trị MP
lớn nhất. Ngược lại, locus Penta E cho giá trị MP là nhỏ nhất đối với quần thể
nghiên cứu.
Hình 3.1. Biểu đồ màu theo giá trị chỉ số MP của từng locus
3.4.2. Chỉ số khả năng loại trừ - Power of Exclusion
Khả năng loại trừ - power of exclusion (PE) là khả năng loại trừ một cá
thể ngẫu nhiên có là bố/mẹ của mẫu xem xét hay không. Giá trị PE đối với từng
locus là khả năng loại trừ trong tính toán của locus đó. Như vậy, PE càng lớn,
tiệm cận 1, đối với từng cá thể thì khả năng loại trừ càng cao, đồng nghĩa với
khả năng nhận định theo huyết thống dựa trên tính toán xác xuất thống kê càng
chính xác [39]. Đối với mỗi locus khác nhau thì sẽ có PE khác nhau, các giá trị
này quyết định trọng số của locus đó trong quá trình tính toán xác xuất hai hồ
48
sơ ADN là có khả năng trùng nhau hay không. Với cùng một bộ kit thì giá trị
PE của mỗi locus cũng khác nhau. Ở quần thể trong nghiên cứu này, locus
Penta E có PE lớn nhất, nằm trong khoảng (0,85; 0,9). Ngược lại, locus TPOX
cho PE nhỏ nhất, trong khoảng (0,25; 0,3) (Hình 3.2). Trong khi đó, giá trị PE
lớn nhất xác định được ở locus Penta E và nhỏ nhất ở locus D3S1358 ở quần
thể người Kinh, sử dụng cùng bộ kit [4].
Hình 3.2. Biều đồ màu theo giá trị chỉ só PE của từng locus
3.4.3. Chỉ số khả năng phân biệt – Discrimination capacity
Chỉ số khả năng phân biệt – DC của từng locus là chỉ số đánh giá khả
năng phân biệt cá thể của locus đó. Trong quá trình tạo lập hồ sơ ADN cho truy
nguyên cá thể thì điều đặc biệt quan trọng đó là các chỉ thị locus STR được sử
dụng phải có khả năng phân biệt cao. Đối với một locus theo cân bằng HWE,
thì giá trị DC sẽ bằng 1 – giá trị PI (sẽ được đề cập ở phần sau). Chỉ số này
càng gần 1 thì khả năng phân biệt của locus đó càng lớn. Hình 3.3 cho thấy giá
trị DC của các locus khác nhau, từ khoảng 0,75 đến gần 1. Trong đó, locus
Penta E cho giá trị DC lớn nhất, ngược lại thì locus TPOX cho DC nhỏ nhất.
Kết quả này cho thấy sự tương đồng giữa các kết quả phân tích trước về số
49
allele của từng locus, cũng như các chỉ số pháp y liên quan. Locus Penta E có
số allele xác định được là nhiều nhất, cũng có PE là lớn nhất, MP nhỏ và DC
lớn nhất. Trong khi đó, locus TPOX có PE nhỏ nhất, MP lớn và DC nhỏ nhất.
Hình 3.3. Biều đồ màu theo giá trị DC của từng locus
3.4.4. Chỉ số đa hình - Polymorphic information content
Chỉ số đa hình – PIC là chỉ số đánh giá tính đa hình của các locus được
sử dụng. Locus có tính đa hình càng lớn thì càng có ý nghĩa trong tính toán khả
năng về mối quan hệ huyết thống giữa 2 cá thể. Đối với quần thể Mông trong
nghiên cứu này, locus Penta E có giá trị PIC là lớn nhất 0,908266864265989,
còn locus TPOX là nhỏ nhất với PIC = 0,519750407231249 (Bảng 3.8). Kết
quả này cũng cho thấy sự tương quan giữa các chỉ số pháp y của từng locus.
Penta E cũng được đánh giá có tính đa hình cao và được sử dụng làm chỉ thị
đánh giá sự đa dạng quần thể trong nghiên cứu khác [40].
3.4.5. Chỉ số Parternity index – PI
Hình 15 biểu diễn chỉ số parternity index – PI của từng locus trên quần
thể người Mông thu được. Trong đó, locus Penta E có PI lớn nhất, còn locus
50
TH0, TPOX, D2S441, D3S1358, CSF1PO, D10S1248, và D13S317 có PI
nhỏ nhất. Giá trị PI có giá trị trong tính toán trọng số của các chỉ thị và khả
năng một kiểu gen là cha hoặc mẹ của kiểu gen kiểm chứng. Giá trị PI ≤ 1 thì
chỉ thị đó không có ý nghĩa trong tính toán xác suất thống kê [33]. Do đó, các
locus trong nghiên cứu đều phù hợp cho phục đích giám định do đều có PI >
1.
Hình 3.4. Biểu đồ màu theo giá trị của chỉ số PI của các locus
3.5. Các chỉ số pháp y đánh giá tần số các allele của một quần thể
Các chỉ số kết hợp có thể dùng cho đánh giá chất lượng của bảng tần số
và khả năng ứng dụng của bảng tần số đó trong công tác giám định thực tế [11],
[33]. Các chỉ số Combined PE và Combinded DC càng lớn, càng gần một hoặc
bằng 1 thì chứng minh rằng các locus được sử dụng cho các tần số allele có khả
năng phân biệt và loại trừ cao, do đó có thể dùng để cho công tác giám định
thực tế. Đối với chỉ số Combinded MP thì ngược lại, giá trị này càng nhỏ có
nghĩa là khả năng trùng lặp ngẫu nhiên giữa 2 bộ hồ sơ ADN càng thấp, do đó
sai số trong tính toán xác xuất thống kê càng nhỏ. Bảng 3.8 thể hiện chi tiết các
giá trị MP, PE, DC và các giá trị combinded của các chỉ số đó, cùng với chỉ số
PIC đối với bộ 22 locus của bộ kit Powerplex Fusion trên quần thể người Mông
51
trong nghiên cứu này. Giá trị Combinded PE (CPE) thu được là 0,999999987
cho thấy khả năng loại trừ của các locus và của bộ số liệu là rất cao. Giá trị
Combinded DC thu được tiệm cận 1 (1,00000000000000) chứng tỏ khả năng
phân biệt rất tốt của các locus. Thêm vào đó, giá trị combinded MP tại rất nhỏ,
chỉ bằng 3,86 ×10-23. Như vậy, có thể kết luận dựa trên các chỉ số kết hợp là bộ
số liệu tần số allele của 22 locus STR trên NST thường thu được trong nghiên
cứu này hoàn toàn có thể ứng dụng được trong công tác giám định thực tế.
Bảng số liệu tần số thu được trong nghiên cứu này sẽ được đưa vào làm
cơ sở dữ liệu cho tính toàn bằng phần mềm STR – VN version 1.0, một phần
mềm được xây dựng bởi nhóm nghiên cứu thuộc Viện Công nghệ Sinh học –
Viện Hàn lâm Khoa học và Công nghệ Việt Nam (Hình 3.5).
Bảng 3.7. Các chỉ số MP, PE, DC và PIC của các locus
Locus MP PE DC PIC
CSF1PO 0.210141 0.343027 0.789859 0.557019
D10S1248 0.162475 0.351705 0.837525 0.613837
D12S391 0.094017 0.554641 0.905983 0.731492
D13S317 0.170201 0.278753 0.8298 0.611476
D16S539 0.160339 0.625471 0.839661 0.673925
D18S51 0.069855 0.725402 0.930145 0.793209
D19S433 0.095743 0.601422 0.904257 0.731159
D1S1656 0.048159 0.699924 0.951841 0.818746
D21S11 0.05498 0.712627 0.94502 0.820474
D22S1045 0.124589 0.554641 0.875411 0.695176
D2S1338 0.064924 0.577803 0.935076 0.789711
D2S441 0.110125 0.416461 0.889875 0.699439
D3S1358 0.145135 0.446335 0.854865 0.650858
D5S818 0.112508 0.543237 0.887492 0.702541
D7S820 0.123932 0.406783 0.876068 0.667303
D8S1179 0.087525 0.589557 0.912475 0.737462
FGA 0.035667 0.674753 0.964333 0.852489
Penta.D 0.062541 0.543237 0.937459 0.783956
Penta.E 0.017834 0.855961 0.982166 0.908267
TH01 0.143162 0.436238 0.856838 0.654371
TPOX 0.232906 0.256979 0.767094 0.51975
vWA 0.118919 0.543237 0.881082 0.699066
Combined 3.86E-23 0.999999987 1.00000000000000
52
3.6. Kết quả phân tích mối tương quan di truyền với các quần thể khác
Sự khác biệt về tần số allele các locus giữa các quần thể khác nhau có
mối liên hệ về mối tương quan di truyền giữa các quần thể đó. Mối tương quan
này có thể liên quan đến vị trí địa lý hoặc theo các nhóm ngôn ngữ [3]. Trong
nghiên cứu này, bảng số liệu tần số allele của quần thể người Mông được so
sánh với hai quần thể thuộc cùng một ngữ hệ đó là quần thể người Miao ở Quỳ
Châu [41], và quần thể người Yao ở Quảng Đông [42], Trung Quốc. Hai quần
thể này cùng với quần thể người Mông ở Việt Nam thuộc ngữ hệ H’mông –
Dao. Ngoài ra, so sánh còn bao gốm các quần thể khác như: quần thể Kinh tại
Việt Nam [4] và quần thể người Thái tại Thái Lan [43] thuộc nhóm ngữ hệ Nam
Á; hai quần hể người Hán tại tỉnh Vân Nam và Liêu Ning, Trung Quốc thuộc
Hình 3.5. Hình ảnh giao diện phần mềm STR-VN version 1.0
53
nhóm ngữ hệ Hán – Tạng [44], [45]; quần thể người Hàn tại Hàn Quốc [46];
quần thể người Nhật tại Nhật Bản [47]; người Ấn Độ tại Ấn Độ [48]; quần thể
người Hà Lan tại Hà Lan [49] và quần thể người Ovambo – African tại Namibia
[50]. Các quần thể người Hà Lan đại diện cho chủng người da trắng – Caucasian
và người Ovambo đại diện cho chủng người da đen – African.
Dựa trên kết quả phân tích tương quan di truyền qua cây phát sinh chủng
loại (Hình 3.6) cho thấy, quần thể người Mông có mối quan hệ di truyền gần
gũi với người Miao và Yao ở Trung Quốc. Kết quả này khẳng định mối quan
hệ gần gũi và lịch sử hình thành các quần thể người H’mông – Dao tại khu vực
Đông Nam Á và Trung Quốc.
Châu Á là nơi có sự đa dạng về chủng tộc, nhóm người rất cao [8]. Các
nhóm người có đặc điểm di truyền quần thể riêng và có mối quan hệ tương
quan với nhau và có liên quan đến điều kiện địa lý. Điều này thể hiện rõ ràng
trên cây chủng loại xây dựng được. Hai quần thể thuộc ngữ hệ Nam Á và có vị
trí địa lý gần nhau như người Kinh và người Thái nằm cùng trong một nhánh
với giá trị bootstrap 67 (Hình 3.6). Quần thể người Hán tại Vân Nam gần gũi
với các nhánh của nhóm Nam Á và Mông – Dao hơn so với nhóm Hán tại Liêu
Ning. Kết quả này có được có thể do ảnh hưởng bởi khoảng cách địa lý, khi mà
tỉnh Vân Nam nằm ở phía Nam Trung Quốc, có đường biên giới chung với Việt
Nam và Thái Lan, do đó sự pha trộn vốn gen với các nhóm người lân cận hơn
so với nhóm tại Liêu Ning nằm ở phía Bắc Trung Quốc. Nhóm phía Bắc này
do đó cũng gần với các nhóm người Hàn Quốc và Nhật Bản hơn (Hình 3.6).
Các nhóm thuộc chủng người da trắng, người da đen và nhóm phía Nam Châu
Á có sự khác biệt rõ ràng so với các nhóm còn lại. Kết quả này tương đồng với
các kết quả nghiên cứu trước đó. [4], [44], [51], [52]
54
Hình 3.6. Cây phát sinh chủng loại về mối tương quan di truyền giữa người Mông và các
quần thể khác
55
CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ
4.1. Kết luận
Dựa trên các kết quả có được từ nghiên cứu khảo sát và xây dựng cơ sở
dữ liệu tần số allele 22 locus đa hình STR ở quần thể người Mông tại Hà Giang,
Việt Nam bằng bộ kit Powerplex Fusion Systems, có thể kết luận như sau:
(1) Khuếch đại thành công 22 locus bằng bộ kit Powerplex Fusion System
đối với 156 mẫu là người Mông tại Hà Giang, Việt Nam. Quá trình và
phương pháp thu thập mẫu được sử dụng trong nghiên cứu này là phù
hợp và có thể ứng dụng cho các nghiên cứu khác.
(2) Các locus được sử dụng trong bộ kit đã được đánh giá tính hiệu quả và
chính xác dựa trên các phân tích thống kê. Kết quả cho thấy, bộ kit
Powerplex Fusion System là phù hợp cho công tác giám định pháp y,
xét nghiệm huyết thống cũng như có thể sử dụng trong nghiên cứu đánh
giá sự đa dạng và di truyền của quần thể người Mông tại Hà Giang, Việt
Nam.
(3) Đề tài đã xây dựng thành công bộ cơ sở dữ liệu tần số allele 22 locus
STR cho quần thể người Mông tại Hà Giang, và có thể đưa vào sử dụng
trong thực tế xét nghiệm huyết thống, truy nguyên cá thể trong giám
định pháp y, hoặc xác định nhóm người.
(4) Kết quả phân tích cho thấy mối liên hệ di truyền gần gũi giữa quần thể
người Mông tại Hà Giang, Việt Nam với quần thể người Miao và Yao ở
Trung Quốc. Kết quả này khẳng định ứng dụng của tần số allele các
locus STR trong nghiên cứu đa dạng và di truyền quần thể. Kết quả cũng
lần đầu khẳng định mối quan hệ gần gũi về di truyền giữa các nhóm
Mông tại Việt Nam và Trung Quốc mà đã được khẳng định trước đó dựa
trên các bằng chứng khác.
56
4.2. Kiến nghị
Dựa trên các kết quả thu được, chúng tôi đề xuất một số nội dung sau:
(1) Bổ sung bảng tần số allele 22 locus STR trên NST bằng bộ kit Powerplex
Fusion Systems vào quy trình xác định xác xuất thống kê trong giám
định pháp y, truy nguyên cá thể, xác định huyết thống hoặc tìm kiếm
người mất tích.
(2) Mở rộng số lượng mẫu nghiên cứu lớn hơn, ít nhất là 500 cá thể nhằm
cải thiện hiệu quả tính toán và giảm thiểu sai số thống kê.
(3) Mở rộng nghiên cứu và xây dựng cơ sở dữ liệu tần số allele các locus
STR đối với các nhóm dân tộc khác tại Việt Nam, nhằm phục vụ cho
công tác giám định và nghiên cứu.
57
TÀI LIỆU THAM KHẢO
[1] M. G. J. Tilanus, “Short tandem repeat markers in diagnostics: what’s in
a repeat?,” Leukemia, vol. 20, no. 8, pp. 1353–1355, Aug. 2006.
[2] J. M. Butler, “Short Tandem Repeat Analysis for Human Identity
Testing,” in Current Protocols in Human Genetics, vol. Chapter 14,
Hoboken, NJ, USA: John Wiley & Sons, Inc., 2004, p. Unit 14.8.
[3] J. K. Pritchard, M. Stephens, and P. Donnelly, “Inference of population
structure using multilocus genotype data.,” Genetics, vol. 155, no. 2, pp.
945–59, Jun. 2000.
[4] H. L. Tran, H. T. Nguyen, T. T. Pham, M. H. Nguyen, H. Hoang, and H.
H. Chu, “Allele frequencies for 22 autosomal STRs in the Kinh
population in Vietnam,” Int. J. Legal Med., Jan. 2019.
[5] I. Shimada, B. Brinkmann, N. Q. Tuyen, and C. Hohoff, “Allele
frequency data for 16 STR loci in the Vietnamese population.,” Int. J.
Legal Med., vol. 116, no. 4, pp. 246–8, Aug. 2002.
[6] X. Zhang et al., “Genetic polymorphisms of 20 autosomal STR loci in the
Vietnamese population from Yunnan Province, Southwest China,” Int. J.
Legal Med., vol. 131, no. 3, pp. 661–662, May 2017.
[7] P. Lertrit et al., “Genetic history of Southeast Asian populations as
revealed by ancient and modern human mitochondrial DNA analysis,”
Am. J. Phys. Anthropol., vol. 137, no. 4, pp. 425–440, Dec. 2008.
[8] T. H. P.-A. S. HUGO Pan-Asian SNP Consortium et al., “Mapping
human genetic diversity in Asia.,” Science, vol. 326, no. 5959, pp. 1541–
5, Dec. 2009.
[9] H. McColl et al., “The prehistoric peopling of Southeast Asia.,” Science,
vol. 361, no. 6397, pp. 88–92, Jul. 2018.
[10] M. Lipson et al., “Ancient genomes document multiple waves of
migration in Southeast Asian prehistory,” Science (80-. )., vol. 361, no.
6397, pp. 92–95, Jul. 2018.
[11] J. M. (John M. Butler, Fundamentals of forensic DNA typing, First.
Academic Press/Elsevier, 2009.
[12] A. J. Jeffreys, “The man behind the DNA fingerprints: an interview with
Professor Sir Alec Jeffreys,” Investig. Genet., vol. 4, p. 21, 2013.
[13] Z. Wong, V. Wilson, I. Patel, S. Povey, and A. J. Jeffreys,
“Characterization of a panel of highly variable minisatellites cloned from
58
human DNA,” Ann. Hum. Genet., vol. 51, no. 4, pp. 269–288, 1987.
[14] L. Roewer, “DNA fingerprinting in forensics: Past, present, future,”
Investigative Genetics, vol. 4, no. 1. BioMed Central, p. 22, 18-Nov-
2013.
[15] L. L. Cavalli-Sforza and M. W. Feldman, “The application of molecular
genetic approaches to the study of human evolution.,” Nat. Genet., vol.
33 Suppl, pp. 266–75, Mar. 2003.
[16] M. A. Jobling and P. Gill, “Encoded evidence: DNA in forensic analysis,”
Nat. Rev. Genet., vol. 5, no. 10, pp. 739–751, Oct. 2004.
[17] R. Chakraborty, M. Kimmel, D. N. Stivers, L. J. Davison, and R. Deka,
“Relative mutation rates at di-, tri-, and tetranucleotide microsatellite
loci,” Proc. Natl. Acad. Sci. U. S. A., vol. 94, no. 3, pp. 1041–1046, Feb.
1997.
[18] H. Fan and J. Y. Chu, “A Brief Review of Short Tandem Repeat
Mutation,” Genomics, Proteomics and Bioinformatics, vol. 5, no. 1.
Beijing Genomics Institute, pp. 7–14, 2007.
[19] M. Zavodna, A. Bagshaw, R. Brauning, and N. J. Gemmell, “The effects
of transcription and recombination on mutational dynamics of short
tandem re
Các file đính kèm theo tài liệu này:
- luan_an_xay_dung_co_so_du_lieu_ve_tan_so_allele_22_locus_da.pdf