LỜI CAM ĐOAN
LỜI CẢM ƠN
BẢNG KÍ HIỆU VÀ CHỮ VIẾT TẮT
DANH MỤC HÌNH
DANH MỤC BẢNG
ĐẶT VẤN ĐỀ . 1
CHƢƠNG 1. TỔNG QUAN TÀI LIỆU. 3
1.1 ĐẶC ĐIỂM GIẢI PHẪU VÀ MÔ HỌC XƢƠNG. 3
1.1.1 Thành phần và cấu trúc của bộ xƣơng. 3
1.1.2. Phân bố ADN trong xƣơng. 7
1.1.3. Các yếu tố ảnh hƣởng đến cấu trúc và sự tồn tại của ADN hài cốt. 9
1.1.4. Cơ sở khoa học của phân tích ADN trong giám định nhận dạng cá
thể. 11
1.2. PHÂN TÍCH ADN TY THỂ TRONG NHẬN DẠNG CÁ THỂ. 13
1.2.1 Cấu trúc hệ gen ty thể . 13
1.2.2 Vùng gen điều khiển CR (Control Region hay Displacement Dloop) . 14
1.2.3 Cơ sở khoa học đánh giá tính đa hình vùng D-loop ở ngƣời . 15
1.2.4 Đặc điểm trình tự ADN ty thể ứng dụng trong giám định . 17
1.2.4.1. Trình tự tham chiếu rCRS. 17
1.2.4.2. Sự biến đ i nucleotide . 17
1.2.5 Ứng dụng phân tích ADN trong giám định nhận dạng cá thể. 18
1.2.5.1 Trên thế giới. 18
1.2.5.2. Tình hình nghiên cứu ở Việt Nam. 20
1.3. CÁC PHƢƠNG PHÁP GIẢI TRÌNH TỰ. 21
1.3.1 Công nghệ giải trình tự Sanger. 21
1.3.2. Công nghệ đọc trình tự thế hệ mới (NGS_Next Generation
Sequencing). 22
1.3.3. Công nghệ đọc trình tự bán dẫn Ion bằng Ion Torrent . 25
CHƢƠNG 2. VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU . 29
2.1 VẬT LIỆU . 29
2.1.1 Đối tƣợng nghiên cứu . 29
87 trang |
Chia sẻ: honganh20 | Ngày: 04/03/2022 | Lượt xem: 434 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng công nghệ giải trình tự thế hệ mới ion S5 x ltm trong giám định hài cốt lâu năm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
anh học.
Những kỹ thuật này có mức độ phân biệt thấp (trừ sử dụng trong HLA) và
ứng dụng của chúng bị hạn chế ở một số các mẫu thử còn nguyên vẹn, chƣa bị
bất kỳ một sự thoái giáng nào. Phƣơng pháp đƣợc phát triển đầu tiên bởi Alec
Jeffreys dựa trên phân tích các locus chứa t hợp ngắn các nucleotide lặp lại
dƣới điều kiện lai không quá ngặt nghèo để tạo thành một kiểu mẫu ADN
(ADN pattern) duy nhất đối với từng cá thể (trừ trƣờng hợp sinh đôi). Tuy
nhiên phƣơng pháp phân tích dấu ấn ADN này rất khó thực hiện ở các phòng
thí nghiệm và có khi có những kết quả khác nhau tùy thuộc vào từng phòng
thí nghiệm thực hiện [4]. Thêm vào đó, số lƣợng ADN cần thiết để tạo ra kết
quả đã hạn chế số lƣợng các mẫu sinh học có thể ứng dụng với kỹ thuật này.
Cuối những năm 1980 các kỹ thuật phân tích ADN (ADN profiling) thay thế
dần các kỹ thuật sử dụng dấu ấn ADN (ADN fingerprinting) nhờ phân tích
các locus chứa đoạn lặp lại ngẫu nghiên với số lƣợng thay đ i (minisatellilte
hoặc VNTR- variable number of tandem repeat) dựa trên các điều kiện lai
nghiêm ngặt. Các dữ liệu tạo ra từ các kỹ thuật này giúp các nhà khoa học dễ
phân tích và sử dụng hơn. Cũng tại thời điểm này một kỹ thuật mới là phản
ứng trùng hợp chuỗi (polymerase chain reaction, PCR) đƣợc xem là bƣớc
ngoặt trong công nghệ sinh học ra đời và đƣợc áp dụng rộng rãi sau đó để
phân tích ADN ở nhiều labo công nghệ sinh học. Số lƣợng ADN thông qua
một quy trình khuếch đại invitro tăng lên rất nhiều lần đã giúp giảm đi đáng
kể lƣợng đi ADN cần thiết ban đầu từ mẫu sinh học và thời gian cần thiết để
phân tích. Đây chính là hai khía cạnh quan trọng cho phân tích ADN trong đó
chính là số lƣợng mẫu sinh học thƣờng rất hạn chế và thời gian để trả lời kết
quả phân tích rất quan trọng đối với các nhà điều tra pháp y. Những năm 1990
20
những đoạn lặp lại ngắn ngẫu nhiên (Short Tandem Repeats, STRs) chỉ từ 2
đến 6 nucleotide bắt đầu đƣợc ứng dụng rộng rãi trong pháp y tạo nên cơ hội
phân tích ADN bị thoái biến mà trƣớc đây không thể phân tích đƣợc. Một vài
các STRs có thể đƣợc phân tích trong một kỹ thuật ADN và với sự n i lên của
hệ thống phát hiện laser huỳnh quang tự động cho phép phân tích các locus
STRs có kích thƣớc tƣơng đƣơng bằng các sử dụng các chất huỳnh quang
khác nhau trong quá trình khuếch đại ADN [37]. Các kỹ thuật này tạo ra các
thông tin về ADN để có thể xây dựng các cơ sở dữ liệu kỹ thuật số phục vụ
cho công tác nhận dạng pháp y. Cho đến ngày nay 3 nguồn thông tin dữ liệu
chính về ADN đƣợc sử dụng trong giám định pháp y là ADN ty thể, STRs
bao gồm Y-STRs và các STRs nhiễm sắc thể thƣờng và các điểm đa hình
nucleotide (Single Nucleotide Polymorphism, SNP).
1.2.5.2. Tình hình nghiên cứu ở Việt Nam
Theo thống kê Việt Nam hiện tại còn hơn 500.000 liệt sĩ còn thiếu
thông tin, việc nghiên cứu và ứng dụng kỹ thuật phân tích ADN để xác định
cá thể đã đƣợc bắt đầu vào những năm cuối của thế kỷ 20 và đã có nhƣng
thành quả nhất định. Năm 2003, Viện Pháp Y quân đội phối hợp với Viện
Công nghệ sinh học thực hiện đề tài khoa học cấp nhà nƣớc "Nghiên cứu ứng
dụng công nghệ ADN trong việc xác định hài cốt liệt sĩ" có mã số KC.04.23
[38]. Hiện nay, công nghệ giám định gen trên ADN ti thể đã đƣợc ứng dụng
trong thực tiễn tại Việt Nam, với hàng trăm trƣờng hợp đƣợc xác định thành
công. Từ năm 2000, viện Công nghệ sinh học đã bắt đầu sử dụng ADN trong
phân tích giám định hài cốt liệt sĩ. Đến năm 2019, Trung tâm giám định ADN
đƣợc thành lập để đảm nhiệm nhiệm vụ này, sau một năm phân tích trên 2870
lƣợt mẫu, trung tâm Giám định ADN đã bàn giao 669 kết quả giám định ADN
có chất lƣợng tốt có thể đƣợc dùng so sánh đối khớp [39]. Nhƣ vậy, việc giám
định các mẫu xƣơng sử dụng hệ gen ti thể đã đƣợc tiến hành từ lâu và thu
đƣợc nhiều kết quả. Tuy nhiên, tại Việt Nam, nhu cầu giám định hài cốt rất
lớn, số lƣợng mẫu cần giám định hàng năm lên tới hàng trăm nghìn mẫu.
Nghiên cứu về tình hình giám định ADN có vao trò đích truy nguyên cá thể từ
các mẫu đã bị phân hủy mạnh, đặc biệt là các hài cốt lâu năm là hết sức cấp
bách hiện nay.
21
1.3. CÁC PHƢƠNG PHÁP GIẢI TRÌNH TỰ
1.3.1 Công nghệ giải trình tự Sanger
Phƣơng pháp Sanger Sequencing hay còn gọi là phƣơng pháp enzyme
đƣợc Sanger và cộng sự phát minh năm 1977.
Nguyên tắc cơ bản của phƣơng pháp dideoxy dựa vào hoạt động của
enzyme ADN polymerase trong quá trình t ng hợp ADN. Enzyme ADN
polymerase xúc tác gắn các nucleotide vào mạch đơn ADN đang t ng hợp ở
vị trí 3'có chứa nhóm -OH tự do, khi gặp nucleotide không có nhóm 3'-OH
(ddNTP) có đánh dấu huỳnh quang (hình 1.8) thì phản ứng t ng hợp bị dừng
lại. Đặc trƣng của phƣơng pháp là sử dụng dideoxynucleotide để làm ngừng
phản ứng t ng hợp ADN một cách ngẫu nhiên. Trong phản ứng sử dụng
đoạn ADN mồi là đoạn ADN mạch đơn có kích thƣớc 20 nucleotide [40].
”
Hình 1.8. Phân tử ddNTP huỳnh quang trong Sanger Sequencing
Đây là phƣơng pháp giải trình tự đƣợc sử dụng rộng rãi nhất trong
khoảng 40 năm gần đây. Công nghệ lần đầu tiên đƣợc thƣơng mại hóa bởi Hệ
sinh học ứng dụng vào năm 1986 (Adams, 2008). Ngày nay, các công ty
thƣơng mại đã cho ra đời các thế hệ máy đọc trình tự dựa trên nhiều công
nghệ mới (Next Generation Sequencing - NGS), đặc biệt dành cho những dự
án phân tích gen tự động quy mô lớn. Tuy nhiên, phƣơng pháp Sanger vẫn
đƣợc sử dụng rộng rãi cho các dự án quy mô nhỏ hơn và để xác nhận kết quả
22
của NGS. Công nghệ này vẫn có lợi thế hơn các công nghệ giải trình tự đọc
ngắn, rằng có thể tạo ra trình tự ADN đọc > 500 nucleotide. Trong nhiều năm,
giải trình tự Sanger đã xác định ADN ty thể của ba vùng siêu biến HV1
(16024-16365), HV2 (73-340), HV3 (438-574) trong vùng điều khiển ty thể
[41][42].
1.3.2. Công nghệ đọc trình tự thế hệ mới (NGS_Next Generation
Sequencing)
Công nghệ giải trình tự thế hệ mới (NGS) là công cụ quan trọng trong
nghiên cứu sự biểu hiện ADN, ARN trên toàn bộ gen và các đa hình
Nucleotide đơn (SNP), đột biến, thay thế đoạn gen [43]. NGS là một bƣớc
tiến vƣợt bậc về công nghệ đọc trình tự, cho phép đọc đƣợc từ 8 Gb đến 600
Gb - tức là cho phép đọc trình tự nguyên bộ gene còn đƣợc gọi là đọc trình tự
bộ gene (whole genome sequencing). Với các tiến bộ về thiết bị và hóa chất,
hiện nay đọc trình tự bộ gene của một cơ thể sống có thể đƣợc thực hiện tại
các phòng thí nghiệm đƣợc cấp kinh phí vừa phải (Bảng 1.2) với thiết bị đọc
trình tự thế hệ mới nhƣ solid, solexa, ion-proton, 454trong thời gian ngắn
(thậm chí chỉ trong 24 giờ) thay vì phải kéo dài hàng năm và giá thành rẻ.
Trình tự bộ gene vi khuẩn hay virus có thể đƣợc đọc dễ dàng với các thiết bị
có công suất nhỏ khoảng 6 -10 Gbases mà không cần đến hàng trăm Gbases.
NGS là một công cụ mạnh nhất để phát hiện đƣợc các tác nhân gây bệnh, các
đột biến với tỷ lệ thấp. Chính vì vậy, đọc trình tự thế hệ mới là một công cụ
không thể thiếu đƣợc trong phát hiện và định lƣợng các đột biến trong ung
thƣ, trong bệnh di truyền
Nguyên lý đọc trình tự gen thế hệ mới: theo 2 nguyên lý chính.
Nguyên lý thứ nhất đọc trình tự bằng t ng hợp (sequencing by synthesis,
SBS) đã đƣợc các thế hệ máy Roche 454, Ion Torrent và Illumina sử dụng.
Nguyên lý thứ hai đó là đọc trình tự gắn nối (sequencing by ligation, SBL)
đƣợc sử dụng ở máy SOLiD do George Church phát minh. SBL đã đƣợc sử
dụng để xác định trình tự genome và là nền tảng cho các thiết bị đọc trình
tự thế hệ mới [44].
Công nghệ đọc trình tự gen thế hệ mới đƣợc thực hiện theo 3 bƣớc
23
chính nhƣ sau:
Bƣớc 1: Chuẩn bị các đoạn ADN và gắn lên các giá bám: Trƣớc hết
ADN bộ gene đƣợc cắt nhỏ thành các đoạn ADN ngắn nhờ siêu âm hay nhờ
khí dung, sau đó 2 đầu các đoạn ADN ngắn này đƣợc gắn 2 đoạn adapter có
trình tự nhận biết bởi các đoạn dò và trình tự mồi PCR. Các đoạn ADN này sẽ
đƣợc gắn lên các giá bám là các hạt nano (Roche 454, SOLiD hay Ion
Torrent) nhờ các đoạn dò đặc hiệu adapter đã gắn sẵn trên các giá bám này.
Bƣớc 2: Khuyếch đại các đoạn ADN trên giá bám bằng mồi đặc hiệu
adapter: Nếu giá bám là vi bản thì thành phần PCR đƣợc bơm trải lên vi bản
và khi thực hiện PCR sẽ có từng cụm sản phẩm khuyếch đại đƣợc gắn trên
các vị trí tách rời nhau. Nếu giá bám là các vi hạt thì phải nhũ hoá thành phần
PCR để các giọt nhũ chỉ chứa một vi hạt, nhờ vậy sau khi thực hiện PCR mỗi
vi hạt chỉ có một loại sản phẩm khuyếch đại bám lên. Sau đó, các vi hạt đƣợc
loại bỏ nhũ dịch và bơm vào một vi chip có chứa hàng chục ngàn đến hàng
trăm ngàn giếng kích thƣớc nano (nanowell), kích thƣớc này cho phép mỗi
nanowell chỉ chứa đƣợc một vi hạt.
Bƣớc 3: Đọc trình tự bằng t ng hợp hoặc bằng gắn nối: Nguyên tắc
cũng gần giống pyrosequencing, tuy nhiên có một số điểm khác biệt bao gồm:
(i) Thay vì phải huỷ bỏ các thành phần A T, C, và G còn dƣ thừa trong phản
ứng trƣớc khi cho thành phần tham gia mới vào thì ở đọc trình tự thế hệ mới,
thành phần tham gia đọc trình tự dƣ thừa này đƣợc thu hồi sau khi thu đƣợc
tín hiệu và bơm thành phần tham gia mới; (ii) Tín hiệu t ng hợp đƣợc ghi
nhận sau mỗi lần bơm các thành phần tham gia vào có thể là tín hiệu phát
quang dựa trên hệ thống luciferinluciferase (Roche 454), tín hiệu điện do thay
đ i pH, tín hiệu huỳnh quang đƣợc đánh dấu trên các nucleotide A, T, C hay
G hay cũng có thể là tín hiệu huỳnh quang đƣợc gắn lên probe; (iii) T ng hợp
mạch b sung dựa trên mạch khuôn có thể là kéo dài đầu 3‟ của mạch b sung
bằng các nucleotide (A, T, C hay G) và cứ mỗi khi một nucleotide đƣợc kéo
dài thì sẽ có một tín hiệu phát quang (Roche 454), huỳnh quang (Illumina)
hay pH (ion Torrent) đƣợc ghi nhận, hay có thể là kéo dài đầu 3‟ của mạch b
sung mỗi lần 2 base nhờ sự kéo dài và nối đoạn dò dựa trên sợi khuôn và cứ
24
mỗi khi t ng hợp đƣợc 2 base thì sẽ có một tín hiệu huỳnh quang đƣợc ghi
nhận (SOLiD).
Thứ tự của các lần b sung các thành phần đọc trình tự vào chip
nanowell hay vào vi bản đƣợc máy tính ghi lại đồng thời với thứ tự và cƣờng
độ tín hiệu t ng hợp sợi b sung của từng cụm ADN bám lên vi bản hay trên
vi hạt, nhờ vậy mà sẽ đọc đƣợc trình tự của các đoạn ADN trên từng cụm. Vì
--có đến hàng trăm ngàn cụm nên sẽ có hàng trăm ngàn trình tự sẽ đƣợc đọc,
tƣơng ứng với hàng trăm ngàn đoạn ADN từ bộ gene sẽ đọc đƣợc. Các trình
tự của các đoạn đọc đƣợc sẽ đƣợc phần mềm của thiết bị nối lại với nhau
bằng cách so sánh trình tự, tìm các đoạn trùng lặp ở hai đầu và nhƣ vậy là sẽ
có kết quả của trình tự nguyên bộ gene [45].
Quy trình một chiều có khả năng tự động hóa cao, với khả năng tạo ra
hàng Gb dữ liệu ADN trong một lần chạy, các hệ gen lớn của các động vật có
vú có thể giải trình tự trong một vài tuần tại thời điểm công nghệ đƣợc phát
triển. Khả năng chạy nhiều mẫu trên 1 flow cell đồng nghĩa với việc có thể
thực hiện nhiều ứng dụng trong một lần chạy.
Bảng 1.2 T ng hợp một số công nghệ giải trình tự thế hệ mới [30].
TT Hãng
(Phƣơng pháp)
Kích
thƣớc
đoạn
đọc
(bp)
Độ
chính
xác
(%)
Công
suất
Thời
gian
cho
một
lần
đọc
Ƣu
điểm
Nhƣợc
điểm
1 Pacific Biosciences
(Single-molecule
real-time
sequencing)
14000 87 500-
100Mb
30
phút-
4 giờ
Đọc
đƣợc
đoàn
dài
nhất,
nhanh
nhất
Công
suất
trung
bình,
giá
thành
thiết bị
đắt đỏ
2 Ion Torrent (Ion 400 98 Đến 80 2 giờ Rẻ và
nhanh
Công
suất
25
Torrent sequecing) triệu chóng
cho kết
quả
trung
bình
3 454- ROCHE
(Pyrosesequencing)
700 99,9 Đến 6
tỷ
24
giờ
Đọc
đoạn
dài
Chi phí
đọc đắt,
tỷ lệ lỗi
cao khi
gặp các
đoạn
trình tự
lặp lại.
4 Illumina
(Sequencing by
synthesis)
50-
300
99.9 Đến 6
tỷ
1-11
ngày
Công
suất lớn
Thiết bị
đắt, cần
ADN
nồng độ
cao
5 SOLiD
(Sequencing by
ligation)
50+50 99.9 1,2-
1,4 tỉ
1-2
tuần
Giá
thành rẻ
Đọc
chậm
1.3.3. Công nghệ đọc trình tự bán dẫn Ion bằng Ion Torrent
Công nghệ này đƣợc cấp phép từ ADN Electronics Ltd và đƣợc phát
triển bởi Ion Torrent Systerms Inc và ra đời năm 2010.
Đọc trình tự bán dẫn ion (Ion semiconductor sequencing) là phƣơng
pháp đọc trình tự ADN trên cơ sở phát hiện ion hydro đƣợc giải phóng trong
quá trình polyme hóa của ADN, còn đƣợc gọi là đọc trình tự giải phóng ion
(ion torrent sequencing), đọc trình tự thông qua pH (pH-mediated
sequencing), đọc trình tự silicon (silicon sequencing). Ứng dụng chính của
công nghệ này gồm: Đọc lại các trình tự của các mẫu có nhiều chỉ thị
barcode; đọc trình tự các thƣ viện đã đƣợc gắn adapter (vùng 100 kb-1Mb);
đọc trình tự genome của vi khuẩn và virus; đọc trình tự các mẫu
metagenomic; đọc trình tự các RNA ngắn; Giá trị số liệu trình tự thu trên các
máy khác nhau.
Nguyên lý của công nghệ: Khác với các công nghệ đọc trình tự khác,
26
công nghệ đọc trình tự ion torrent sử dụng nucleotide không bị biến đ i hoặc
không sử dụng các mắt đọc. Trong hệ thống đọc trình tự, mỗi giếng chứa một
sợi ADN khuôn và đƣợc đƣa vào một loại dNTP. Nếu loại dNTP này b sung
với nucleotide trên sợi khuôn thì nó sẽ liên kết và kéo dài sợi t ng hợp. Điều
này dẫn tới sự giải phóng một ion hydro, tạo thành một cảm ứng ion ISFET
(ion-sensitive field-effect transistor) và xác định một phản ứng đã xảy ra. Nếu
trình tự sợi khuôn có sự lặp lại của một loại nucleotide, thì sẽ có nhiều phân
tử dNTP kết hợp trong cùng một chu kỳ, dẫn tới số phân tử hydro tƣơng ứng
đƣợc giải phóng và tín hiệu điện tử tăng lên một cách tỷ lệ thuận.
Quy trình công nghệ: Mỗi giếng trên chip bán dẫn có chứa một phân tử
ADN khuôn sợi đơn, một ADN polymerase đƣợc nhũ tƣơng hóa với mỗi loại
dNTP A, C, G hoặc T (Rusk, 2011; Pennisi, 2010; Perkel, 2011). Nếu một
dNTP đƣa vào b sung với nucleotide trên sợi khuôn thì nó liên kết vào sợi
ADN t ng hợp bằng ADN polymerase và có phản ứng hóa học xảy ra. Ion
hydro giải phóng làm thay đ i pH của dung dịch và nó đƣợc phát hiện bởi
ISFET. Những dNTP không đƣợc t ng hợp, đƣợc rửa sạch trƣớc khi một chu
kỳ mới với một loại dNTP khác đƣợc đƣa vào (Pennisi, 2010).
Dƣới các giếng là một lớp nhạy cảm với ion, tiếp theo là một lớp cảm
ứng ion ISFET. Tất cả các lớp đƣợc chứa trong một chip bán dẫn CMOS,
giống với các chip đang đƣợc sử dụng trong công nghiệp điện tử. Mỗi chip
chứa một dãy giếng với một máy phát hiện ISFET đƣợc cảm ứng bằng ion
hydro giải phóng. Một loạt tín hiệu điện tử đƣợc truyền dẫn từ chip tới máy
tính và đƣợc dịch thành một trình tự ADN không cần qua một tác nhân trung
gian. Hiện tƣợng liên kết nucleotide đƣợc đo trực tiếp bằng điện tử, không
dùng nucleotide biến đ i và đo đạc bằng quang học (Davies, 2010; Pennisi,
2010).
27
Hình 1.9. Công nghệ đọc trình tự bán dẫn Ion bằng Ion Torrent [50]
Ƣu nhƣợc điểm của máy Ion Torrent: độ chính xác của máy đọc trình
tự bán dẫn ion năm 2011 là 99,6% trên 50 base đƣợc đọc với 100 Mb /lần
28
chạy với chiều dài đọc đƣợc là 100 cặp base. Độ chính xác cho các đoạn lặp
lại là 98%. Ƣu điểm chính của đọc trình tự bán dẫn ion là: tốc độ đọc
nhanh; chi phí vận hành và đầu tƣ thấp [51]; không dùng nucleotide biến
đ i và xác định bằng quang học. Vì hệ thống ghi lại hiện tƣợng liên kết
nucleotide tự nhiên nên đọc trình tự trong một thời gian thực. Tốc độ đọc
trình tự chỉ bị giới hạn bởi vòng quay nucleotides trong hệ thống Ion
Torrent Systems Inc; mỗi liên kết đọc mất 4 giây và mỗi lần chạy khoảng 1
giờ đọc đƣợc 100-200 bp [52].
Nếu chip đƣợc nâng cấp thì số lần đọc sẽ đƣợc tăng lên. Tuy nhiên, có
hạn chế vì rất khó để xác định một đoạn lặp lại. Tín hiệu đƣợc tạo ra từ số lặp
lại cao sẽ là khó khăn để phân biệt đƣợc từ sự lặp lại của một số khác nhau
nhƣng tƣơng tự. Ví dụ: lặp lại của đoạn 7 khó phân biệt với đoạn 8. Hạn chế
khác của hệ thống này là chiều dài đọc ngắn hơn các phƣơng pháp khác nhƣ
Sanger sequencing hoặc Illumina. Chiều dài đọc đƣợc là một lợi thế cho quá
trình lắp ráp genome de novo, với Ion Torrent Systems có thể đọc đƣợc 400
cặp base cho một lần chạy [51]. Chính vì vậy, việc lựa chọn thế hệ máy đọc
Ion Torrent sẽ là sự lựa chọn phù hợp cho việc giải trình tự hệ gen các cơ thể
sinh vật với điều kiện của các viện nghiên cứu của Việt Nam hiện nay.
Đối với máy đọc trình tự bán dẫn ion, với ƣu điểm là đọc trình tự
nhanh, liên tục và kinh tế, máy có thể sử dụng trong đa số phòng thí nghiệm
lớn và nhỏ nhƣ một máy để bàn [49] hoặc ở ngoài các trung tâm đặc trƣng,
trong các bệnh viện. Công nghệ này phù hợp trong các ứng dụng nhỏ nhƣ đọc
trình tự của hệ gen của vi khuẩn, đọc trình tự transcriptome vi khuẩn, đọc trình
tự gen đích amplicon, hoặc kiểm tra chất lƣợng của thƣ viện trình tự [53] [54].
Từ khi ra đời tới nay công nghệ đọc trình tự bán dẫn ion đã đƣợc ứng dụng trong
nhiều công trình nghiên cứu, nhƣ: dựa trên đọc trình tự ADN của rRNA để định
danh vi khuẩn hay vi nấm [55]; đọc trình tự hệ gen vi sinh vật [56]; nghiên cứu
đột biến, chức năng của gen đích [57][58], nghiên cứu y sinh [45], các nghiên
cứu cũng đƣa ra đƣợc ƣu nhƣợc điểm của công nghệ [59].
29
CHƢƠNG 2. VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU
2.1 VẬT LIỆU
2.1.1 Đối tƣợng nghiên cứu
Trong nghiên cứu này, chúng tôi sử dụng t ng số 96 mẫu, trong đó bao
gồm 13 mẫu sinh phẩm tóc và móng tay của 6 mẫu thân nhân và 7 mẫu lab
member; 48 mẫu xƣơng và 35 mẫu răng của ngƣời đã hi sinh trong chiến
tranh. Việt Nam (1955-1975) theo hồ sơ bảo mật và đƣợc sự đồng ý của Cục
ngƣời có công – Bộ thƣơng binh - Lao động và Xã hội (Chi tiết danh sách
mẫu ở phần phụ lục).
Đặc điểm của mẫu xƣơng và răng: mẫu trải qua nhiều năm dƣới lòng
đất, có màu ngả vàng, nâu đậm, nhiều mẫu bị vỡ, mủn.
Các mẫu này sẽ đƣợc chia vào 2 chip khi đọc trình tự (hình 2.1)
Những mẫu này đã đƣợc giải trình tự Sanger và hoàn thiện hồ sơ pháp lý.
Hình 2.1. Sơ đồ mẫu đọc trên chip 1 và chip 2
35 mẫu hài cốt
Chip 1
6 mẫu thân nhân Chip 2
7 mẫu labmber
48 mẫu hài cốt
30
2.1.2 Địa điểm và thời gian thực hiện đề tài
Địa điểm thực hiện: Trung tâm giám định ADN, Viện Công nghệ sinh
học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam.
Thời gian: Đề tài đƣợc thực hiện từ 12/2019 đến tháng 9/2020
2.1.3. Hóa chất
Để thực hiện đƣợc giải trình tự mtADN bằng hệ thống Ion Torrent S5,
bộ kit Precision ID mtADN Control Region Panel (Thermofisher Scientific)
đƣợc sự dụng. Trong bộ kit này, các panel đƣợc đƣợc thiết kế nhắm vào các
vùng điều khiển trên ty thể tại vị trí 15954 – 610 và bao gồm các vùng siêu
biến ( HV1, HV2, HV3).
Hai t hợp mồi đƣợc thiết kế gồm 14 cặp mồi, trong đó Pool 1 và Pool
2 đều chứa 7 cặp tƣơng ứng 1-3-5-7-9-11-13 và 2-4-6-8-10-12-14 (Hình 2.2
và Bảng 2.1). Việc sử dụng 2 t hợp mồi là cần thiết, bởi vì độ trùng lặp trung
bình giữa các mồi trong 2 t hợp là 18 bp, khoảng cách trung bình giữa hai
mồi liền kề là ~153bp, khi chạy 2 t hợp mồi đồng thời, sẽ lấy đƣợc toàn bộ
trình tự vùng siêu biến của hệ gen ty thể.
Hình 2.2. Vị trí 14 cặp mồi dùng cho Pool 1 và Pool 2
31
Bảng 2.1. Danh sách 14 cặp mồi dùng cho Pool 1 và Pool 2 [60]
T hợp Mồi Vị trí bắt
đầu
Vị trí kết
thúc
Khoảng
cách
Trùng lặp
giữa các
mồi
1 1 15954 16069 116 14
2 2 16056 16131 76 22
1 3 16110 16225 116 4
2 4 16222 16341 120 3
1 5 16336 16458 120 11
2 6 16448 16552 105 11
1 7 16542 80 108 65
2 8 16 116 104 1
1 9 119 248 130 1
2 10 248 329 82 31
1 11 299 411 113 27
2 12 385 480 196 21
1 13 460 543 84 25
2 14 519 610 92 N/A
Bên cạnh các tổ hợp đƣợc liệt kê ở bảng trên thì trong bộ kit
Precision ID mtADN Control Region còn chứa một số mồi suy biến. Cụ thể
nhƣ sau: T hợp 1 gồm 7 cặp mồi với 45 mồi suy biến, t hợp 2 gồm 7 cặp
mồi với 68 mồi suy biến. Tần suất suy biến mitomap >700 lần [61]. Các mồi
suy biến đƣợc sử dụng để phù hợp với tính chất suy biến cao của ADN ty thể.
Ngoài ra, để phục vụ cho nghiên cứu này, chúng tôi đã sử dụng các loại
hóa chất và trang thiết bị khác, cụ thể đƣợc trình bày tại bảng dƣới đây.
32
Bảng 2.2: Danh sách các loại Kit sử dụng trong chuẩn bị thư viện
STT Hóa chất/trang thiết bị Mục đích sử dụng
Hóa chất
1 Precision ID mtADN Control Region
Panel (Thermofisher Scientific)
Giải trình tự
2 Quantification Kit Định lƣợng ADN đầu vào
3 Precision ID Library Kit Chuẩn bị thƣ viện
4 Precision ID Ioncode 1-96 giếng Gắn Barcode
Trang thiết bị
1 Ion Chip 520 Chíp đọc trình tự
2 Precision ID Ioncode 1-96 giếng Gắn Barcode
3 Applied Biosystems® 7500 Real-Time
PCR
Máy chạy qPCR
4 PCR Eppendorf Khuếch đại mẫu, tạo thƣ viện
5 Ion Chef™ System Hệ thông chuẩn bị thƣ viện
và khuônHID
6 HID Ion S5™ XL System Hệ thống đọc trình tự
7 Phần mềm Converge analysis sofware Phân tích trình tự
Các vật dụng phụ trợ yêu cầu trong quy trình:
- Bộ lƣu điện (UPS) > 2500W
- Máy ly tâm (microcentrifuge) vừa cho ống 0.2 mL, ống 1.5 mL và tạo
lực 21,000g
- Máy vortex
- Pipette (P2, P10, P20, P200, P1000 uL)
- Ống tube PCR 200 ul, ống 1.5 mL, 2 mL
- Đĩa 96 giếng nhựa, ống strip dùng cho phản ứng PCR
- Đầu tip có lọc
- Giấy lau không bụi
- Găng tay không bột
33
- Nƣớc sinh học phân tử (Nuclease-free Water, Molecular Biology
Grade)
- Dung dịch cồn isopropyl alcohol 70%.
2.2. PHƢƠNG PHÁP NGHIÊN CỨU
2.2.1 Sơ đồ nghiên cứu
Chúng tôi thực hiện theo sơ đồ minh họa ở hình 2.3 với các bƣớc nhƣ
sau: Bƣớc đầu xử lý mẫu hài cốt, sau đó tách ADN từ đối tƣợng nghiên cứu,
chọn mẫu, kiểm tra chất lƣợng và nồng độ ADN đầu vào bằng phƣơng pháp
Realtime PCR; Chuẩn bị thƣ viện ADN cho giải trình tự thế hệ mới; Chuẩn
bị khuôn trên thiết bị Ion Chef; Chạy giải trình tự NGS; phân tích kết quả và
kiểm chứng các mẫu bằng phƣơng pháp giải trình tự Sanger.
Hình 2.3. Sơ đồ thí nghiệm
2.2.2. Quy trình thực hiện
Mỗi bƣớc thực hiện nghiên cứu đều tuân thủ nguyên tắc tránh nhiễm
Tách chiết ADN t ng số
Phân tích kết quả bằng Converge analysis sofware và
kiểm chứng lại với kết quả Sanger
Chọn mẫu – Định lƣợng ADN đầu vào bằng Realtime
PCR
Chuẩn bị thƣ viện thủ công
Tiến hành cài đặt và chạy máy
Xử lý mẫu hài cốt
34
của phòng thí nghiệm: mặc áo, đội mũ bảo hộ phòng thí nghiệm, đeo khẩu
trang, găng tay, quấn băng dính nối liền phần ngoài của tay áo với găng tay
cao su. Thƣờng xuyên dùng Bleach làm sạch găng tay và tay áo. Làm sạch tủ
an toàn sinh học và khu vực làm việc bằng Bleach, cồn 70 độ và nƣớc vô
trùng. Đƣa vật tƣ tiêu hao, hóa chất sinh phẩm vào UV Crosslinker ít nhất 30
phút trƣớc khi sử dụng. Dung dịch đệm khử khoáng và nƣớc khử ion và các
hóa chất vô cơ cũng đƣợc khử trùng bề mặt vật dụng chứa và UV Crosslinker
ít nhất 30 phút trƣớc khi sử dụng.
2.2.2.1 Xử lý vật lý và hóa học mẫu hài cốt
Mẫu xƣơng và răng đƣợc làm sạch toàn bộ bề mặt, loại bỏ đất, mùn và
các lớp mềm bên ngoài bằng Dremel Tool (Dremel 2050, Mỹ). Sau đó, mẫu
đƣợc xử lý sạch bằng nƣớc khử ion vô trùng, bleach 2% và cồn ethanol tuyệt
đối. Cuối cùng, để mẫu khô tự nhiên trong tủ vô trùng 12 giờ trƣớc khi nghiền
thành bột bằng hệ thống máy Tissue Lyzer II (QIAgen).
Sau quá trình xử lý vật lý, 100 mg mỗi mẫu đƣợc sử dụng cho bƣớc xử
lý hóa học. Quá trình khử khoáng và phân cắt từng tế bào, giải phóng ADN
đƣợc thực hiện bằng cách b sung 500 µl dung dịch đệm G2 QIAgen và
Proteinase K (Ambion Pro-K, 20 mg/mL), ủ trong máy lắc ở 56°C nhằm loại
khoáng và phân cắt giải phóng các tế bào xƣơng (phòng thí nghiệm xác định
ADN AFDIL)
2.2.2.2 Tách chiết thu ADN từ mẫu hài cốt
ADN từ mẫu hài cốt đƣợc tách chiết thông qua sử dụng hệ thống máy
EZ1 Invesigator Advanced QIAgen có sử dụng bộ kit QIAamp DNA
investigator Kit – QIAgen theo hƣớng dẫn của nhà sản xuất. Cụ thể, với mỗi
mẫu, ly tâm dịch lysis ở 6000 vòng/5 phút, thu 500 µl dịch n i vào tube 2 ml.
B sung 400 µl đệm MTL + 1 µl cRNA (nhằm bảo vệ và tăng hiệu quả tách
chiết ADN) + 50 µl NaOAC vào mỗi mẫu. Sau đó, vortex kỹ và spin nhẹ hỗn
hợp trƣớc khi đƣa vào hệ thống máy EZ1.
Để hệ thống EZ1 hoạt động cần gắn chip Advanced XL DNA
Investigator vào thiết bị. Sau đó khởi động máy EZ1, lần lƣợt đƣa mẫu và các
vật tƣ nhƣ tube, đầu tip theo tuần tự từng bƣớc mà máy đã cài đặt sẵn và ấn
35
lệnh “run” để bắt đầu quy trình thu AND tự động.
2.2.2.3 Định lượng ADN t ng số
Sau khi tách chiết đƣợc ADN, thực hiện định lƣợng ADN t ng số bằng
bộ sinh phẩm Quantifiler Trio DNA Quantification Kit trong phản ứng
Realtime PCR.
Mỗi tube phản ứng cho từng mẫu riêng biệt sẽ gồm 8 µl Quantrifiler
Trio Primer mix, 10 µl Quantrifiler THP PCR Reaction Mix và 2 µl ADN
mẫu hoặc đối chứng đã biết nồng độ ADN t ng số. Nồng độ ADN t ng số của
mỗi mẫu đƣa ra dựa trên thông số tƣơng quan giữa mẫu và đối chứng.
Bảng 2.3: Nồng độ mẫu xây dựng đường chuẩn:
STT Mẫu Nồng độ (ng/ul)
1 Standard 1 50
2 Standard 2 5
3 Standard 3 0,5
4 Standard 4 0,05
5 Standard 5 0,005
Bảng 2.4: Thành phần phản ứng Realtime PCR
Thành phần x1 (ul)
Master mix 10
Các file đính kèm theo tài liệu này:
- luan_van_ung_dung_cong_nghe_giai_trinh_tu_the_he_moi_ion_s5.pdf