ỤC LỤ
Mở đầu .1
Chương 1: TỔNG QUAN TÀI LIỆU.3
1.1 Lịch sử nghiên cứu chỉ thị ADN ứng dụng trong khoa học hình sự .3
1.2 Chỉ thị ADN sử dụng trong khoa học hình sự .4
1.2.1 STR – Short Tandem Repeats .4
1.2.2 SNP – Single Nucleotide Polymorphism .7
1.3 Các phương pháp phân tích sử dụng chỉ thị ADN .9
1.3.1 Đa hình chiều dài các đoạn cắt giới hạn (RFLP – Retriction Fragment
Length Polymorphism) .9
1.3.2 Phương pháp PCR các chỉ thị STRs .10
1.3.3 Điện di và phát hiện STRs .10
1.3.4 Giải trình tự thế hệ mới – Next Generation Sequencing (NGS).11
1.4 Hệ thống giải trình tự thế hệ mới của ILLUMINA – MiSeq FGx.14
1.4.1 Công nghệ giải trình tự của Illumina.14
1.4.2 Giải pháp NGS cho linh vực hình sự của Illumina .16
1.4.3 Tình hình thực tế ở Việt Nam .17
Chương 2: NGUYÊN LIỆU VÀ PHưƠNG PHÁP NGHIÊN CỨU .19
2.1 Nguyên liệu, hóa chất và thiết bị .19
2.1.1 Đối tượng nghiên cứu.19
2.1.2 Hóa chất .19
2.1.3 Dụng cụ thí nghiệm .19
2.2 Phương pháp nghiên cứu.19
30 trang |
Chia sẻ: anan10 | Lượt xem: 626 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận văn Đánh giá bộ kit forenseq trên hệ thống miseq fgx ứng dụng trong định danh cá thể người Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
......... 27
3.3 Đánh giá độ tƣơng đồng ....................................................................................... 29
3.4 Đánh giá độ phân giải .......................................................................................... 31
3.5 Trƣờng hợp các mẫu có chất lƣợng kém ............................................................ 32
3.6 Trƣờng hợp các mẫu cho nhận ngẫu nhiên trong quần thể ............................. 33
3.7 Trƣờng hợp mẫu lẫn ............................................................................................. 36
3.8 Khảo sát tần suất iSNPs trong quần thể ngƣời Việt Nam (Kinh) .................... 38
3.9 Khảo sát tần suất 5 locus STR mới trong bộ ForenSeq trong quần thể
ngƣời Việt Nam (Kinh) ......................................................................................... 40
3.9.1 Locus D4S2408 ................................................................................................ 41
3.9.2 Locus D6S1043 ................................................................................................ 42
3.9.3 Locus D9S1122 ................................................................................................ 43
3.9.4 Locus D17S1301 .............................................................................................. 44
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
3.9.5 Locus D20S482 ................................................................................................ 44
KẾT LUẬN VÀ KIẾN NGHỊ .................................................................................... 45
Tài liệu tham khảo ...................................................................................................... 48
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
1
Mở đầu
Từ khi Ray White lần đầu tiên mô tả chỉ thị ADN (DNA marker) dựa trên
phương pháp đa hình chiều dài đoạn cắt giới hạn (Restriction Fragment Length
Polymorphisms – RFLP) vào năm 1980 thì một loạt các chỉ thị ADN đã được
nghiên cứu và ứng dụng trong di truyền học động vật nói chung và di truyền người
nói riêng. Đến năm 1984, Alec J. Jeffreys đã nghiên cứu và phát hiện ra chỉ thị
minisatellite khi ông nhận thấy tính đa hình của các đoạn gen mã hóa cho
myoglobin ở người. Ông phát hiện ra rằng ở những cá thể khác nhau thì số lượng
những đoạn lặp khác nhau hay còn được gọi là số lượng đa hình của những đoạn lặp
(Variable Number of Tandem Repeat – VNTR). Từ đó, ông và những cộng sự trong
phòng thí nghiệm đã liệt kê những ứng dụng của chỉ thị minisatellite. Và một trong
những ứng dụng quan trọng của chị thị này được Jeffreys nghiên cứu là sử dụng
trong giám định ADN hình sự (DNA Forensic) để phân biệt giữa người này và
người khác.
Trong khoảng hơn 15 năm phát triển, những ứng dụng của các chỉ thị phân
tử trong lĩnh vực hình sự đã có những tiến bộ vượt bậc và đạt được nhiều thành tựu
mới. Các quy trình được xây dựng, hoàn thiện và được phổ biến sử dụng trong phân
tích các mẫu sinh học hình sự. Theo ông Bruce Budowle – Cục điều tra Liên bang
Mỹ, không có bất cứ lĩnh vực nào được hưởng lợi ích nhiều từ những công cụ sinh
học phân tử hơn là trong khoa học hình sự. Với công nghệ ADN, các nhà khoa học
có thể loại bỏ những đối tượng tình nghi sai với mẫu thu nhận được, từ đó khoanh
vùng, định hướng điều tra. Những chứng cứ phạm tội là những bằng chứng mạnh
mẽ để kết luận tội phạm.
Công nghệ giải trình tự bằng phương pháp điện di mao quản là tiêu chuẩn
vàng để thực hiện các phân tích ADN hình sự. Tuy nhiên, công nghệ này còn bị giới
hạn với những khó khăn đặc thù về những mẫu án hình sự như là hàm lượng mẫu ít,
độ đứt gãy cao, nhiều tạp chất, thậm chí là lẫn từ nhiều nguồn khác nhau, Hệ
thống giải trình tự thế hệ mới (Next Generation Sequencing – NGS) của Illumina –
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
2
hệ thống MiSeq FGx mới được đưa ra thị trường vào đầu năm 2015 đang được
nhiều phòng thí nghiệm cũng như nhiều đơn vị có uy tín trong lĩnh vực hình sự
đánh giá là phương pháp của tương lai cũng như là giải pháp hoàn thiện nhất, đồng
bộ nhất cho những phân tích trong hình sự.
Trung tâm Sinh học Pháp lý, Viện Khoa học Hình sự là đơn vị đầu tiên mua
và cũng là một trong những đơn vị đầu tiên ứng dụng hệ thống giải trình tự thế hệ
mới – MiSeq® FGx trên thế giới. Vì vậy, chúng tôi thực hiện đề tài: “Đánh giá bộ
kit ForenSeq trên hệ thống MiSeq FGx ứng dụng trong định danh cá thể ngƣời
Việt Nam”. Trước đây, chưa có một nghiên cứu nào đánh giá khả năng ứng dụng
hệ thống MiSeq® FGx trong phân tích ADN hình sự với đối tượng là người Việt
Nam, do vậy đề tài của chúng tôi thực hiện là một trong những đề tài đầu tiên đánh
giá thử nghiệm bộ kit cũng như hệ thống giải trình tự thế hệ mới trên mẫu người
Việt Nam. Mục tiêu của đề tài nghiên cứu này gồm có hai mục tiêu chính: Đầu tiên,
so sánh và đánh giá bộ kit ForenSeqTM DNA Signature Prep trên hệ thống giải trình
tự thế hệ mới MiSeq® FGx với bộ AmpFℓSTR® Identifiler® Plus PCR
Amplification Kit trên hệ thống điện di mao quản. Thứ hai là khảo sát và xây dựng
tần số của 5 locus STR là D4S2408, D6S1043, D9S1122, D17S1301, D20S482 và
94 SNP mang thông tin nhận dạng ứng dụng trong định danh cá thể người Việt
Nam. Đề tài được thực hiện tại Trung tâm giám định Sinh học Pháp lý, Viện Khoa
học Hình sự, với sự cộng tác của Công ty BIOMEDIC, Công ty GENTIS và Viện
Công nghệ Sinh học
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
3
Chƣơng 1 - TỔNG QUAN TÀI LIỆU
1.1 Lịch sử nghiên cứu chỉ thị ADN ứng dụng trong khoa học hình sự
Người đặt nền móng cho ứng dụng những chỉ thị ADN trong lĩnh vực hình
sự là Alec J. Jeffreys. Khi Jeffreys nghiên cứu gen mã hóa cho myoglobin ở người
thì ông cũng phát hiện được một đoạn minisatellite ADN ngắn song song lặp đi lặp
lại [21]. Những đoạn ADN ngắn này có sự biến đổi giữa những cá thể khác nhau.
Ngay sau khi Jeffreys và cộng sự công bố những kết quả nghiên cứu của mình, đã
có nhiều nghi vấn xuất hiện xung quanh việc sử dụng chỉ thị minisatellite để giải
quyết những khó khăn tranh chấp đến có liên quan đến các vấn đề hình sự. Đến năm
1986 thì những dấu vân ADN (DNA Fingerprint) đã thực sự được sử dụng trong
những giám định của khoa học hình sự bằng phương pháp lai đầu dò với việc kết
hợp nhiều minisatellite [21]. Thuật ngữ “DNA fingerprint” ra đời do các chỉ thị
ADN có giá trị phân biệt cá thể như dấu vân tay. Chính vì vậy, ngay từ khi ra đời,
các chỉ thị ADN đã được áp dụng và phục vụ cho công tác điều tra tội phạm và tư
pháp nên thuật ngữ “Forensic DNA” đã tồn tại và được sử dụng rộng rãi cho đến
ngày nay.
Đến những năm 1983, Karry Mullis đã phát minh ra kỹ thuật phản ứng chuỗi
trùng hợp (PCR – polymerase Chain Reaction). Cùng với những thử nghiệm thành
công của Jeffreys trên chỉ thị đoạn lặp ngắn nối tiếp (STR – Short Tandem
Repeats), việc ứng dụng phương pháp PCR trong phân tích ADN hình sự đã cho
thấy những ưu điểm rõ rệt như là độ nhạy cao hơn, có thể kết hợp thực hiện đồng
thời nhiều locus gen khác nhau, cách thức tiến hành đơn giản, nhanh chóng hơn, có
thể phân tích được những mẫu có chất lượng kém, bị đứt gãy nhiều [21]. Đến năm
1988, cục điều tra liên bang Mỹ - FBI bắt đầu ứng dụng dấu vết ADN trong điều tra
những vụ án. Tháng 11 năm 1988, trung tâm Bandury của phòng thí nghiệm Cold
Spring Harbor được đặt là nơi để mọi người tìm đến nếu có quan tâm đến những
ứng dụng trong hình sự của dấu vân ADN. Đến năm 1993, bộ kit STR đầu tiên được
ứng dụng. Sau đó, lần lượt các đơn vị lớn như là Cảnh sát Hoàng gia Anh xây dựng
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
4
cơ sở dữ liệu tội phạm (năm 1995) [14] và cục điều tra liên bang Mỹ xây dựng cơ
sở dữ liệu gen tội phạm bằng hệ thống CODIS với 13 locus.
Những ứng dụng của phân tích chỉ thị ADN trong khoa học hình sự tập trung
vào xác định kiểu ADN của cá thể; xác định mối quan hệ huyết thống cha – con, mẹ
- con, anh – em trai, chị - em gái, bà nội – cháu gái, ông nội – cháu trai, ; xác định
nạn nhân trong những vụ tìm người mất tích do thảm họa hoặc chiến tranh; xây
dụng cơ sở dữ liệu tàng thư tội phạm quốc gia; thẻ ADN cá nhân,
1.2 Chỉ thị ADN sử dụng trong khoa học hình sự
Để thực hiện được mục đích phân biệt cá thể, điều quan trọng là các chỉ thị
ADN phải có tính đa hình cao hoặc có thể kết hợp số lượng lớn với những chỉ thị ít
đa hình để có khả năng phân biệt giữa các mẫu [5]. Tính đa hình của các chỉ thị
ADN được thể hiện ở hai dạng là tính đa hình trong trình tự và tính đa hình trong độ
dài [5]. Trong phân tích ADN hình sự, có hai chỉ thị ADN truyền thống được
nghiên cứu và được ứng dụng trong giám định ADN hình sự để phân biệt giữa
người này với người khác. Đó là chỉ thị những trình tự ngắn lặp đi lặp lại nối tiếp
nhau (STR – Short Tandem Repeats) và chỉ thị đa hình đơn nucleotide (SNP –
Single Nucleotide Polymorphism) [5].
1.2.1 STRs – Short Tandem Repeats
STR là các đoạn ngắn có tính lặp lại nối tiếp nhau trong trình tự (thường là 2
– 6 nucleotide). Trong hình sự, các nhà nghiên cứu thường chọn những STR có đơn
vị lặp là 4 nucleotide để sử dụng trong phân tích. Số lần lặp lại của các đơn vị có thể
rất khác nhau giữa những cá thể khác nhau. Thậm chí là có sự khác nhau trong trình
tự của chính các alen có số đơn vị lặp giống nhau. Chính tính đa hình trong độ dài
và trình tự của STRs tạo nên hiệu quả trong mục đích nhận dạng người, định danh
cá thể trong các vụ việc mang tính hình sự [5].
STRs là công cụ được ứng dụng trong phân tích ADN hình sự từ những năm
1991. Tính đa hình của STRs không chỉ thể hiện ở số lượng các đơn vị lặp lại mà
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
5
còn thể hiện trong trình tự của chúng. STRs thường được chia làm một số loại dựa
trên phương thức lặp lại của các tiểu đơn vị [5]
- STRs lặp lại đơn giản gồm những đơn vị có trình tự và chiều dài giống
hệt nhau. Trình tự của STRs gồm hai hay nhiều hơn các đơn vị lặp lại liên
tiếp nhau.
- STRs lặp lại phức tạp gồm một vài trình tự lặp lại có sự khác nhau về độ
dài và trình tự
Một số yếu tố được đề ra khi lựa chọn những locus khác nhau:
- Có mức độ đa hình cao trong một locus, có khả năng phân biệt cao với tỉ
lệ di hợp tử quan sát được là 70%
- Có tỉ lệ đột biến thấp, chiều dài của alen phải ở trong kích thước 90 – 500
bp để đảm bảo có khả năng phân tích những mẫu đứt gãy.
- Các locus được chọn phải nằm trên những nhiễm sắc thể riêng nhau (hoặc
có vị trí các khá xa nhau) để đảm bảo các locus liên kết cùng nhau là
không được chọn
- Có tính ổn định và độ lặp lại khi thực hiện thí nghiệm
- Dễ dàng giải thích kết quả, tức là chọn những locus ít có hiện tượng
stutter (Hiện tượng polymerase bị trượt có thể xuất hiện trong quá trình
khuếch đại các trình tự lặp lại, quy trình chuẩn bị thư viện, tạo cluster. Có
thể tạo ra các đoạn ADN đích có kích thước bé đi hoặc là lớn hơn kích
thước trình tự đích)
Bộ kit STRs đầu tiên được ứng dụng trong hình sự là bộ kit có 4 locus
“quadruplex” và được mở rộng sử dụng cho xét xử tại tòa án. Lúc đấy, khả năng
cho nhận là khá cao theo tiêu chuẩn hiện đại, chỉ khoảng 10-4. Năm 1996, hệ thống
kết hợp gồm có 6 locus với locus Amelogenin kiểm tra trên nhiễm sắc thể giới tính
Y được giới thiệu [4]. Đến năm 1998, hệ thống CODIS – Combined ADN Index
System là chương trình được FBI hỗ trợ để xây dựng cơ sở dữ liệu tội phạm cũng
như phần mềm để có thể thực hiện được để phân tích ADN. Hệ thống CODIS gồm
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
6
một hệ gồm 13 locus nằm trên các nhiễm sắc thể khác nhau, ngoài ra còn được bổ
sung thêm locus Amelogenin cho nhiễm sắc thể giới tính.
Hình 1.1. Hệ thống CODIS 13 STR loci và vị trí trên nhiễm sắc thể
Bên cạnh đó, nguồn cơ sở dữ liệu có tính đa dạng dựa trên việc lựa chọn
phân tích các STR khác nhau tùy thuộc vào từng khu vực địa lí như là nguồn dữ liệu
của Châu Âu hoặc là các loci mở rộng hơn của U.S. Từ năm 2000, cả hai hãng lớn
Promega và Applied Biosystems đều xây dựng bộ kit thương mại có kết hợp 16 loci
trong cùng một phản ứng PCR; với cốt lõi vẫn là các locus có trong hệ 13 CODIS,
Amelogenin và thêm 2 STRs nữa. Hiện nay, trên thị trường có rất nhiều bộ kit của
nhiều hãng khác nhau như là QIAGEN, Promega, Applied Biosystems, đưa ra
thị trường những bộ kit tách biệt STRs nằm trên nhiễm sắc thể thường và STRs nằm
trên nhiễm sắc thể giới tính [5].
Bảng 1.1. Các bộ kit STRs thương mại phổ biến trên thị trường
Hãng Nhiễm sắc thể thƣờng Nhiễm sắc thể Y Nhiễm sắc thể X
Applied
Biosystems
AmpFLSTR®
Identifiler® Plus PCR
Amplification Kit (16
locus)
AmpFLSTR®
Yfiler® PCR
Amplification Kit
(16 locus)
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
7
AmpFLSTR®
Identifiler® Direct PCR
Amplification Kit (16
locus)
GlobalFiler STR kit (24
locus)
Promega PowerPlex 16 (16 locus)
Power Plex Fusion (24
locus)
PowerPlex 23 (23
locus)
Qiagen Investigator HDPlex Kit
(12 locus)
Investigator
Argus – X Kit
(12 locus)
1.2.2 SNP – Single Nucleotide Polymorphism
Một biến đổi trong trình tự giữa những cá thể tại một điểm cụ thể trong hệ
gen thường được gọi là tính đa hình đơn nucleotide hay còn gọi là SNP (Single
Nucleotide Polymorphism) [5]. SNP rất phong phú trong hệ gen của người cũng
như được sử dụng để nghiên cứu mối tương quan với các bệnh di truyền. Hàng triệu
SNP tồn tại trong các cá thể riêng biệt. Do vậy SNP có thể được sử dụng để giúp
phân biệt giữa những cá thể [5, 6].
Có nhiều nghiên cứu đã chỉ ra SNP là chỉ thị phân tử đầy tiềm năng. SNP có
đủ khả năng để thay thế STRs và sẽ được ứng dụng trong tương lai [6]. Những
SNPs có một số ưu điểm vượt trội hơn so với STRs. Đầu tiên và quan trọng nhất là
sản phẩm PCR của các SNPs có kích thước bé hơn 100bp. Điều này có nghĩa là chỉ
thị SNPs có khả năng khôi phục lại thông tin ADN từ những mẫu bị đứt gãy mạnh
tốt hơn so với STRs (các amplicon có kích thước từ 300bp – 400bp) [6]. Thứ hai là
theo nguyên tắc có thể kết hợp nhiều SNPs hơn so với STRs do không bị giới hạn
bởi phương pháp phát hiện. Thứ ba là xử lý mẫu và phân tích dữ liệu có thể được tự
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
8
động hóa hoàn toàn. Thứ tư là không có hiện tượng stutter, do vậy có thể đơn giản
hóa và dễ dàng giải thích được kết quả gọi tên alen. Cuối cùng, khả năng dự đoán
nguồn gốc chủng tộc và những đặc điểm kiểu hình có thể thực hiện với sự lựa chọn
cẩn thận các SNPs ancestry và SNPs phenotype [5,6].
Bảng 1.2. So sánh chỉ thị STRs và SNPs [5]
Đặc điểm STRs – Short Tandem
Repeats
SNPs – Single Nucleotide
Polymorphism
Tần số xuất hiện
trong hệ gen
1 trên mỗi 15kb 1 trên mỗi 1kb
Khả năng cung
cấp thông tin
Cao Thấp, chỉ khoảng 20% - 30% thông
tin như STRs
Tỉ lệ đột biến 1/ 1000 1/ 100000000
Loại chỉ thị 2, 3, 4 thậm chí là 5
nucleotide lặp lại với nhiều
alen
Thường là chỉ thị bi-allelic với 6 khả
năng: A/G, A/C, A/T, G/C, G/T,
C/T
Số lượng alen Thường là từ 5 – 20 Phổ biến là 2
Phương pháp
phát hiện
Điện di gel hoặc điện di mao
quản
Phân tích trình tự, lai microchip
Kích thước đoạn
amplicon
75 – 400bp Thường là < 100bp
Khả năng dự
đoán nguồn gốc
chủng tộc
Giới hạn Một vài SNPs có liên kết với nguồn
gốc chủng tộc
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
9
Thông tin kiểu
hình
Không Có thể dự đoán những đặc điểm
kiểu hình như màu mắt, màu tóc,
Lợi thế chính
trong ứng dụng
khoa hoc hình sự
Nhiều alen cho phép tăng tỉ lệ
thành công hơn trong việc
phát hiện những mẫu lẫn
Sản phẩm PCR có kích thước nhỏ
hơn cho phép tăng tỉ lệ thành công
với những mẫu đứt gãy
Tỉ lệ đột biến thấp có thể hỗ trợ
trong phân tích quan hệ huyết thống
dễ dàng hơn
Có khả năng dự đoán kiểu hình
Giới hạn trong
ứng dụng hình sự
Giải thích dữ liệu phải tính
những yếu tố nhiễu như hiện
tượng stutter, hiện tượng
nhiễu màu thuốc nhuộm, alen
giả hình kiếm,
Yêu cầu cần kết hợp nhiều locus.
Gặp khó khăn trong giải quyết mẫu
lẫn.
Cả hai chỉ thị phân tử là STRs và SNPs đều có những ưu điểm và nhược
điểm nhất định trong phân tích ADN hình sự. Theo nghiên cứu của các nhà khoa
học, nếu phân tích 50 SNP thì độ tin cậy đạt tương đương với hệ thống CODIS.
Hiện nay, một số phòng thí nghiệm phân tích ADN trên thế giới đã ứng dụng SNP
trong giải quyết các vụ việc nhằm xác định quan hệ huyết thống trực hệ.
1.3 Các phƣơng pháp phân tích sử dụng chỉ thị ADN
1.3.1 Đa hình chiều dài các đoạn cắt giới hạn (RFLP – Restriction Fragment
Length Polymorphism)
Phương pháp đầu tiên phân tích ADN đã được sử dụng để nhận dạng người
chính là phương pháp RFLP. Trong phương pháp này, hệ gen sẽ được cắt ngẫu
nhiên bằng các enzyme cắt giới hạn tại vị trí đặc hiệu đã biết trước trình tự. Kỹ
thuật này nhận biết sự khác nhau giữa người này với người khác thông qua độ dài
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
10
đoạn ADN sau khi nó được điện di để phân tách dựa vào kích thước. Sự xuất hiện
hay vắng mặt của các vị trí đặc hiệu trên mẫu ADN sẽ tạo ra sản phẩm có kích
thước khác nhau. Sau đó, sản phẩm ADN được phân tách trên gel và phát hiện bằng
cách lai với một đầu dò là trình tự bổ sung với ADN mẫu.
RFLP không được sử dụng lâu trong hình sự nhận dạng ADN người và
nhanh chóng bị thay thế bởi phương pháp khác sử dụng kỹ thuật PCR. Nguyên nhân
là do các phương pháp dựa vào PCR giúp làm tăng số lượng bản copy trong một
lượng mẫu tương đối nhỏ, có thể giúp phân tích mẫu bị đứt gãy. Ngược lại, phương
pháp RFLP yêu cầu một lượng lớn mẫu tốt, không bị đứt gãy [12].
1.3.2 Phương pháp PCR các chỉ thị STRs
Chỉ thị STRs có tính đa hình rất cao. Trong quần thể người có một số lượng
lớn tính đa hình dựa vào độ dài của chỉ thị STRs. Sự khác biệt giữa người này và
người khác chính là số lần lặp lại của các đơn vị trong trình tự. Mỗi cá thể bình
thường sẽ có 2 alen trên một cặp nhiễm sắc thể được sử dụng để xác định các mối
quan hệ trực hệ (bố - con, mẹ - con). Nhiễm sắc thể Y cũng có STRs. Các Y – STRs
chỉ xuất hiện ở nam giới được ứng dụng để xác định quan hệ huyết thống theo dòng
nội [5]. Ngoài ra, trên nhiễm sắc thể X cũng có các STR và cũng được ứng dụng để
phân tích một số mối quan hệ huyết thống có liên quan đến nhiễm sắc thể X [5].
Mồi cho phản ứng PCR của các STRs được thiết kế bổ sung với trình tự nằm
ở vùng biên (flanking regions) của trình tự lặp lại. Phương pháp hiện nay sử dụng
để phân tích ADN hình sự, một trong hai mồi được gắn màu huỳnh quang. Các alen
khác nhau của các locus khác nhau phải được phân biệt bằng màu sắc khác nhau khi
kết hợp nhiều locus trong một phản ứng PCR. Như vậy việc gắn huỳnh quang để
ngăn chặn những alen của các locus khác nhau bị trùng kích thước lên nhau [12].
1.3.3 Điện di và phát hiện STRs
Điện di trên gel đã từng được sử dụng để phân tách các đoạn ADN trong sử
dụng phương pháp RFLP và phân tích STRs trước khi những hệ thống điện di mao
quản trở nên có sẵn. Sử dụng kết quả điện di mao quản giúp phân tích nhanh và
chính xác hơn. Hiện nay, công nghệ điện di mao quản đang được coi là “tiêu chuẩn
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
11
vàng” trong phân tích giám định hình sự [20]. Hầu hết những hệ thống điện di mao
quản đều được sản xuất bởi công ty Applied Biosystems. Điện di mao quản sử dụng
một mao quản dài và hẹp có chứa polymer đặc biệt cho phép phân tách các đoạn
ADN khác nhau theo kích thước. Sản phẩm PCR được bổ sung vào ống mao quản.
Trong suốt quá trình điện di, những đoạn có kích thước nhỏ sẽ chạy nhanh hơn
những đoạn lớn. Trong quá trình phân tách, các đoạn sản phẩm PCR sẽ được chiếu
chùm tia laser cho phép phát hiện những màu huỳnh quang khác nhau được gắn ở
mồi để phát ra ánh sáng có bước sóng riêng. Hệ thống sẽ phát hiện các bước sóng
và cho phép so sánh với hệ thống thang chuẩn được điện di song song với mẫu. Từ
đó, một loạt các đỉnh được dựng lên và thể hiện mối quan hệ giữa tín hiệu huỳnh
quang được gắn vào mỗi đoạn STR với một thuốc nhuộm đặc biệt so với thời gian
di chuyển của nó. Hệ thống phần mềm của máy tính sẽ xử lí thông tin cũng như
cung cấp kích thước của các alen khác nhau trong quá trình điện di và kiểu gen của
chúng (số lần đơn vị lặp lại) [12].
Hình 1.2. Hình ảnh máy điện di mao quản 3130xl với 16 mao quản
1.3.4 Giải trình tự thế hệ mới – Next Generation Sequencing (NGS)
1.3.4.1 Tổng quan về NGS
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
12
Công nghệ giải trình tự thế hệ mới với những đặc điểm như là hiệu suất cao,
giảm chi phí đã phát triển nhanh chóng trong những năm gần đây và trở thành một
công cụ phân tích quan trọng cho nhiều nhà di truyền học. Hàng triệu hoặc hàng tỉ
phân tử ADN có thể được giải trình tự đồng thời. Do đó, hiệu suất của quá trình giải
trình tự được tăng lên một cách đáng kể và giảm thiểu việc phải tách dòng trình tự
đích giống như phương pháp Sanger trước đó [20].
Năm 2005, Roche giới thiệu hệ thống giải trình tự hệ genome 454 – là hệ
thống giải trình tự dữ liệu đầu ra lớn theo phương pháp pyrosequencing đầu tiên
trên thế giới. Hệ thống này có thể tạo ra 200 000 đoạn đọc có độ dài khoảng 110bp
[13]. Năm 2007, Applied Biosystems (ABI) giới thiệu hệ thống giải trình tự thế hệ
thứ hai SOLiD dựa trên công nghệ nối các đoạn oligonucleotide. Hệ thống SOLiD
sử dụng việc nhân bản cầu pha cứng (solid – phase bridge amplification), trong đó
các đoạn tiếp hợp đầu 5’ và 3’ được gắn vào mỗi đầu của khuôn ADN. Cũng trong
thời gian đó, Illumina cho ra mắt hệ thống giải trình tự Solexa. Hệ thống này đơn
giản hóa phương pháp xây dựng thư viện và đảo đầu bằng phương pháp huỳnh
quang dẫn dến việc tạo ra các đoạn đọc có độ dài 35bp [3]. Năm 2010, một hệ thống
giải trình tự nhanh hơn, chi phí thấp hơn dựa trên công nghệ bán dẫn Ion Torrent
được giới thiệu. Đây là hệ thống duy nhất xác định trình tự không dựa vào tín hiệu
huỳnh quang mà dựa vào việc đo sự thay đổi pH do việc giải phóng ra ion H+ khi
gắn nucleotide bằng công nghệ bán dẫn [16].
Tất cả những phương pháp giải trình tự mới đã dẫn tới ba cải tiến đáng kể so
với công nghệ truyền thống [20]
- Đầu tiên là các công nghệ này không yêu cầu tách dòng các đoạn ADN,
mà thay vào đó cần chuẩn bị của các thư viện NGS theo từng mục đích
- Thứ hai là thay vì hàng trăm phản ứng giải trình tự thì những công nghệ
mới có thể thực hiện được hàng triệu phản ứng đồng thời.
- Thứ ba, trình tự được xuất ra trực tiếp mà không cần phải điện di. Số lần
đọc của NGS là vô cùng lớn, cho phép quá trình giải trình tự toàn bộ hệ
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
13
gen trong thời gian ngắn và được ứng dụng rộng rãi trong nhiều lĩnh vực
khoa học và đời sống
Tuy nhiên, nhược điểm của các hệ thống giải trình tự mới này là độ dài đoạn
đọc tương đối ngắn, dẫn đến những khó khăn trong việc cắt nối các trình tự, lắp ráp,
chú thích và phân tích tin sinh học [20].
1.3.4.2 Triển vọng ứng dụng của công nghệ NGS trong phân tích ADN hình sự
So với các lĩnh vực nghiên cứu khác, phân tích ADN trong hình sự phải đối
mặt với nhiều thách thức như là lượng mẫu ít, số bản sao thấp, nhiều chất ức chế,
mẫu đứt gãy mạnh và bị nhiễm giữa nhiều nguồn mẫu khác nhau, phải có độ chính
xác cao cũng như phải cân nhắc vấn đề thời gian và chi phí [20].
Hiện nay, công nghệ chính được sử dụng trong phân tích hình sự là PCR kết
hợp với điện di mao quản dựa trên phương pháp phân tích các đoạn ADN và phát
hiện sự khác nhau về độ dài của các chỉ thị STR. Đây đang được coi là tiêu chuẩn
vàng của phân tích với những ưu điểm của công nghệ này là:
- Thời gian thực hiện từ khâu tách chiết mẫu tới khi phân tích được kết quả
tương đối ngắn.
- Quy trình thực hiện đơn giản, có khả năng linh động trong việc lựa chọn
các bộ kit khác nhau tùy theo mối quan hệ muốn phân tích
Tuy nhiên, công nghệ này vẫn còn tồn tại nhiều hạn chế nhất định trong quá
trình PCR cũng như giới hạn trong việc phát hiện do còn tồn tại các yếu tố nhiễu
làm ảnh hưởng tới quá trình đọc kết quả [5, 12, 20].
- Đòi hỏi kỹ thuật viên có kinh nghiệm và trình độ tốt để nhận định kết quả
trong các trường hợp nhiễu như nhận định alen thật, alen giả, alen hiếm,
mẫu lẫn từ nhiều nguồn...
- Trong trường hợp các mẫu hiện trường thường là các mẫu có chất lượng
kém, bị đứt gãy mạnh thì độ phân giải của hệ thống là không được cao.
Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH
14
Thường không đủ số locus => các giám định viên phải thực hiện lại nhiều
lần mới thu được kết quả để đối chiếu và so sánh.
- Các yếu tố nhiễu phát sinh trong quá trình PCR như hiện tượng stutter,
phát sinh trong quá trình điện di mao quản như là
Các file đính kèm theo tài liệu này:
- 01050003407_1_9776_2002704.pdf