Luận văn Ứng dụng công nghệ giải trình tự thế hệ mới ion S5 x ltm trong giám định hài cốt lâu năm

LỜI CAM ĐOAN

LỜI CẢM ƠN

BẢNG KÍ HIỆU VÀ CHỮ VIẾT TẮT

DANH MỤC HÌNH

DANH MỤC BẢNG

ĐẶT VẤN ĐỀ . 1

CHƢƠNG 1. TỔNG QUAN TÀI LIỆU. 3

1.1 ĐẶC ĐIỂM GIẢI PHẪU VÀ MÔ HỌC XƢƠNG. 3

1.1.1 Thành phần và cấu trúc của bộ xƣơng. 3

1.1.2. Phân bố ADN trong xƣơng. 7

1.1.3. Các yếu tố ảnh hƣởng đến cấu trúc và sự tồn tại của ADN hài cốt. 9

1.1.4. Cơ sở khoa học của phân tích ADN trong giám định nhận dạng cá

thể. 11

1.2. PHÂN TÍCH ADN TY THỂ TRONG NHẬN DẠNG CÁ THỂ. 13

1.2.1 Cấu trúc hệ gen ty thể . 13

1.2.2 Vùng gen điều khiển CR (Control Region hay Displacement Dloop) . 14

1.2.3 Cơ sở khoa học đánh giá tính đa hình vùng D-loop ở ngƣời . 15

1.2.4 Đặc điểm trình tự ADN ty thể ứng dụng trong giám định . 17

1.2.4.1. Trình tự tham chiếu rCRS. 17

1.2.4.2. Sự biến đ i nucleotide . 17

1.2.5 Ứng dụng phân tích ADN trong giám định nhận dạng cá thể. 18

1.2.5.1 Trên thế giới. 18

1.2.5.2. Tình hình nghiên cứu ở Việt Nam. 20

1.3. CÁC PHƢƠNG PHÁP GIẢI TRÌNH TỰ. 21

1.3.1 Công nghệ giải trình tự Sanger. 21

1.3.2. Công nghệ đọc trình tự thế hệ mới (NGS_Next Generation

Sequencing). 22

1.3.3. Công nghệ đọc trình tự bán dẫn Ion bằng Ion Torrent . 25

CHƢƠNG 2. VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU . 29

2.1 VẬT LIỆU . 29

2.1.1 Đối tƣợng nghiên cứu . 29

87 trang | Chia sẻ: honganh20 | Lượt xem: 850 | Lượt tải: 3Free

Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng công nghệ giải trình tự thế hệ mới ion S5 x ltm trong giám định hài cốt lâu năm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

anh học. Những kỹ thuật này có mức độ phân biệt thấp (trừ sử dụng trong HLA) và ứng dụng của chúng bị hạn chế ở một số các mẫu thử còn nguyên vẹn, chƣa bị bất kỳ một sự thoái giáng nào. Phƣơng pháp đƣợc phát triển đầu tiên bởi Alec Jeffreys dựa trên phân tích các locus chứa t hợp ngắn các nucleotide lặp lại dƣới điều kiện lai không quá ngặt nghèo để tạo thành một kiểu mẫu ADN (ADN pattern) duy nhất đối với từng cá thể (trừ trƣờng hợp sinh đôi). Tuy nhiên phƣơng pháp phân tích dấu ấn ADN này rất khó thực hiện ở các phòng thí nghiệm và có khi có những kết quả khác nhau tùy thuộc vào từng phòng thí nghiệm thực hiện [4]. Thêm vào đó, số lƣợng ADN cần thiết để tạo ra kết quả đã hạn chế số lƣợng các mẫu sinh học có thể ứng dụng với kỹ thuật này. Cuối những năm 1980 các kỹ thuật phân tích ADN (ADN profiling) thay thế dần các kỹ thuật sử dụng dấu ấn ADN (ADN fingerprinting) nhờ phân tích các locus chứa đoạn lặp lại ngẫu nghiên với số lƣợng thay đ i (minisatellilte hoặc VNTR- variable number of tandem repeat) dựa trên các điều kiện lai nghiêm ngặt. Các dữ liệu tạo ra từ các kỹ thuật này giúp các nhà khoa học dễ phân tích và sử dụng hơn. Cũng tại thời điểm này một kỹ thuật mới là phản ứng trùng hợp chuỗi (polymerase chain reaction, PCR) đƣợc xem là bƣớc ngoặt trong công nghệ sinh học ra đời và đƣợc áp dụng rộng rãi sau đó để phân tích ADN ở nhiều labo công nghệ sinh học. Số lƣợng ADN thông qua một quy trình khuếch đại invitro tăng lên rất nhiều lần đã giúp giảm đi đáng kể lƣợng đi ADN cần thiết ban đầu từ mẫu sinh học và thời gian cần thiết để phân tích. Đây chính là hai khía cạnh quan trọng cho phân tích ADN trong đó chính là số lƣợng mẫu sinh học thƣờng rất hạn chế và thời gian để trả lời kết quả phân tích rất quan trọng đối với các nhà điều tra pháp y. Những năm 1990 20 những đoạn lặp lại ngắn ngẫu nhiên (Short Tandem Repeats, STRs) chỉ từ 2 đến 6 nucleotide bắt đầu đƣợc ứng dụng rộng rãi trong pháp y tạo nên cơ hội phân tích ADN bị thoái biến mà trƣớc đây không thể phân tích đƣợc. Một vài các STRs có thể đƣợc phân tích trong một kỹ thuật ADN và với sự n i lên của hệ thống phát hiện laser huỳnh quang tự động cho phép phân tích các locus STRs có kích thƣớc tƣơng đƣơng bằng các sử dụng các chất huỳnh quang khác nhau trong quá trình khuếch đại ADN [37]. Các kỹ thuật này tạo ra các thông tin về ADN để có thể xây dựng các cơ sở dữ liệu kỹ thuật số phục vụ cho công tác nhận dạng pháp y. Cho đến ngày nay 3 nguồn thông tin dữ liệu chính về ADN đƣợc sử dụng trong giám định pháp y là ADN ty thể, STRs bao gồm Y-STRs và các STRs nhiễm sắc thể thƣờng và các điểm đa hình nucleotide (Single Nucleotide Polymorphism, SNP). 1.2.5.2. Tình hình nghiên cứu ở Việt Nam Theo thống kê Việt Nam hiện tại còn hơn 500.000 liệt sĩ còn thiếu thông tin, việc nghiên cứu và ứng dụng kỹ thuật phân tích ADN để xác định cá thể đã đƣợc bắt đầu vào những năm cuối của thế kỷ 20 và đã có nhƣng thành quả nhất định. Năm 2003, Viện Pháp Y quân đội phối hợp với Viện Công nghệ sinh học thực hiện đề tài khoa học cấp nhà nƣớc "Nghiên cứu ứng dụng công nghệ ADN trong việc xác định hài cốt liệt sĩ" có mã số KC.04.23 [38]. Hiện nay, công nghệ giám định gen trên ADN ti thể đã đƣợc ứng dụng trong thực tiễn tại Việt Nam, với hàng trăm trƣờng hợp đƣợc xác định thành công. Từ năm 2000, viện Công nghệ sinh học đã bắt đầu sử dụng ADN trong phân tích giám định hài cốt liệt sĩ. Đến năm 2019, Trung tâm giám định ADN đƣợc thành lập để đảm nhiệm nhiệm vụ này, sau một năm phân tích trên 2870 lƣợt mẫu, trung tâm Giám định ADN đã bàn giao 669 kết quả giám định ADN có chất lƣợng tốt có thể đƣợc dùng so sánh đối khớp [39]. Nhƣ vậy, việc giám định các mẫu xƣơng sử dụng hệ gen ti thể đã đƣợc tiến hành từ lâu và thu đƣợc nhiều kết quả. Tuy nhiên, tại Việt Nam, nhu cầu giám định hài cốt rất lớn, số lƣợng mẫu cần giám định hàng năm lên tới hàng trăm nghìn mẫu. Nghiên cứu về tình hình giám định ADN có vao trò đích truy nguyên cá thể từ các mẫu đã bị phân hủy mạnh, đặc biệt là các hài cốt lâu năm là hết sức cấp bách hiện nay. 21 1.3. CÁC PHƢƠNG PHÁP GIẢI TRÌNH TỰ 1.3.1 Công nghệ giải trình tự Sanger Phƣơng pháp Sanger Sequencing hay còn gọi là phƣơng pháp enzyme đƣợc Sanger và cộng sự phát minh năm 1977. Nguyên tắc cơ bản của phƣơng pháp dideoxy dựa vào hoạt động của enzyme ADN polymerase trong quá trình t ng hợp ADN. Enzyme ADN polymerase xúc tác gắn các nucleotide vào mạch đơn ADN đang t ng hợp ở vị trí 3'có chứa nhóm -OH tự do, khi gặp nucleotide không có nhóm 3'-OH (ddNTP) có đánh dấu huỳnh quang (hình 1.8) thì phản ứng t ng hợp bị dừng lại. Đặc trƣng của phƣơng pháp là sử dụng dideoxynucleotide để làm ngừng phản ứng t ng hợp ADN một cách ngẫu nhiên. Trong phản ứng sử dụng đoạn ADN mồi là đoạn ADN mạch đơn có kích thƣớc 20 nucleotide [40]. ” Hình 1.8. Phân tử ddNTP huỳnh quang trong Sanger Sequencing Đây là phƣơng pháp giải trình tự đƣợc sử dụng rộng rãi nhất trong khoảng 40 năm gần đây. Công nghệ lần đầu tiên đƣợc thƣơng mại hóa bởi Hệ sinh học ứng dụng vào năm 1986 (Adams, 2008). Ngày nay, các công ty thƣơng mại đã cho ra đời các thế hệ máy đọc trình tự dựa trên nhiều công nghệ mới (Next Generation Sequencing - NGS), đặc biệt dành cho những dự án phân tích gen tự động quy mô lớn. Tuy nhiên, phƣơng pháp Sanger vẫn đƣợc sử dụng rộng rãi cho các dự án quy mô nhỏ hơn và để xác nhận kết quả 22 của NGS. Công nghệ này vẫn có lợi thế hơn các công nghệ giải trình tự đọc ngắn, rằng có thể tạo ra trình tự ADN đọc > 500 nucleotide. Trong nhiều năm, giải trình tự Sanger đã xác định ADN ty thể của ba vùng siêu biến HV1 (16024-16365), HV2 (73-340), HV3 (438-574) trong vùng điều khiển ty thể [41][42]. 1.3.2. Công nghệ đọc trình tự thế hệ mới (NGS_Next Generation Sequencing) Công nghệ giải trình tự thế hệ mới (NGS) là công cụ quan trọng trong nghiên cứu sự biểu hiện ADN, ARN trên toàn bộ gen và các đa hình Nucleotide đơn (SNP), đột biến, thay thế đoạn gen [43]. NGS là một bƣớc tiến vƣợt bậc về công nghệ đọc trình tự, cho phép đọc đƣợc từ 8 Gb đến 600 Gb - tức là cho phép đọc trình tự nguyên bộ gene còn đƣợc gọi là đọc trình tự bộ gene (whole genome sequencing). Với các tiến bộ về thiết bị và hóa chất, hiện nay đọc trình tự bộ gene của một cơ thể sống có thể đƣợc thực hiện tại các phòng thí nghiệm đƣợc cấp kinh phí vừa phải (Bảng 1.2) với thiết bị đọc trình tự thế hệ mới nhƣ solid, solexa, ion-proton, 454trong thời gian ngắn (thậm chí chỉ trong 24 giờ) thay vì phải kéo dài hàng năm và giá thành rẻ. Trình tự bộ gene vi khuẩn hay virus có thể đƣợc đọc dễ dàng với các thiết bị có công suất nhỏ khoảng 6 -10 Gbases mà không cần đến hàng trăm Gbases. NGS là một công cụ mạnh nhất để phát hiện đƣợc các tác nhân gây bệnh, các đột biến với tỷ lệ thấp. Chính vì vậy, đọc trình tự thế hệ mới là một công cụ không thể thiếu đƣợc trong phát hiện và định lƣợng các đột biến trong ung thƣ, trong bệnh di truyền Nguyên lý đọc trình tự gen thế hệ mới: theo 2 nguyên lý chính. Nguyên lý thứ nhất đọc trình tự bằng t ng hợp (sequencing by synthesis, SBS) đã đƣợc các thế hệ máy Roche 454, Ion Torrent và Illumina sử dụng. Nguyên lý thứ hai đó là đọc trình tự gắn nối (sequencing by ligation, SBL) đƣợc sử dụng ở máy SOLiD do George Church phát minh. SBL đã đƣợc sử dụng để xác định trình tự genome và là nền tảng cho các thiết bị đọc trình tự thế hệ mới [44]. Công nghệ đọc trình tự gen thế hệ mới đƣợc thực hiện theo 3 bƣớc 23 chính nhƣ sau: Bƣớc 1: Chuẩn bị các đoạn ADN và gắn lên các giá bám: Trƣớc hết ADN bộ gene đƣợc cắt nhỏ thành các đoạn ADN ngắn nhờ siêu âm hay nhờ khí dung, sau đó 2 đầu các đoạn ADN ngắn này đƣợc gắn 2 đoạn adapter có trình tự nhận biết bởi các đoạn dò và trình tự mồi PCR. Các đoạn ADN này sẽ đƣợc gắn lên các giá bám là các hạt nano (Roche 454, SOLiD hay Ion Torrent) nhờ các đoạn dò đặc hiệu adapter đã gắn sẵn trên các giá bám này. Bƣớc 2: Khuyếch đại các đoạn ADN trên giá bám bằng mồi đặc hiệu adapter: Nếu giá bám là vi bản thì thành phần PCR đƣợc bơm trải lên vi bản và khi thực hiện PCR sẽ có từng cụm sản phẩm khuyếch đại đƣợc gắn trên các vị trí tách rời nhau. Nếu giá bám là các vi hạt thì phải nhũ hoá thành phần PCR để các giọt nhũ chỉ chứa một vi hạt, nhờ vậy sau khi thực hiện PCR mỗi vi hạt chỉ có một loại sản phẩm khuyếch đại bám lên. Sau đó, các vi hạt đƣợc loại bỏ nhũ dịch và bơm vào một vi chip có chứa hàng chục ngàn đến hàng trăm ngàn giếng kích thƣớc nano (nanowell), kích thƣớc này cho phép mỗi nanowell chỉ chứa đƣợc một vi hạt. Bƣớc 3: Đọc trình tự bằng t ng hợp hoặc bằng gắn nối: Nguyên tắc cũng gần giống pyrosequencing, tuy nhiên có một số điểm khác biệt bao gồm: (i) Thay vì phải huỷ bỏ các thành phần A T, C, và G còn dƣ thừa trong phản ứng trƣớc khi cho thành phần tham gia mới vào thì ở đọc trình tự thế hệ mới, thành phần tham gia đọc trình tự dƣ thừa này đƣợc thu hồi sau khi thu đƣợc tín hiệu và bơm thành phần tham gia mới; (ii) Tín hiệu t ng hợp đƣợc ghi nhận sau mỗi lần bơm các thành phần tham gia vào có thể là tín hiệu phát quang dựa trên hệ thống luciferinluciferase (Roche 454), tín hiệu điện do thay đ i pH, tín hiệu huỳnh quang đƣợc đánh dấu trên các nucleotide A, T, C hay G hay cũng có thể là tín hiệu huỳnh quang đƣợc gắn lên probe; (iii) T ng hợp mạch b sung dựa trên mạch khuôn có thể là kéo dài đầu 3‟ của mạch b sung bằng các nucleotide (A, T, C hay G) và cứ mỗi khi một nucleotide đƣợc kéo dài thì sẽ có một tín hiệu phát quang (Roche 454), huỳnh quang (Illumina) hay pH (ion Torrent) đƣợc ghi nhận, hay có thể là kéo dài đầu 3‟ của mạch b sung mỗi lần 2 base nhờ sự kéo dài và nối đoạn dò dựa trên sợi khuôn và cứ 24 mỗi khi t ng hợp đƣợc 2 base thì sẽ có một tín hiệu huỳnh quang đƣợc ghi nhận (SOLiD). Thứ tự của các lần b sung các thành phần đọc trình tự vào chip nanowell hay vào vi bản đƣợc máy tính ghi lại đồng thời với thứ tự và cƣờng độ tín hiệu t ng hợp sợi b sung của từng cụm ADN bám lên vi bản hay trên vi hạt, nhờ vậy mà sẽ đọc đƣợc trình tự của các đoạn ADN trên từng cụm. Vì --có đến hàng trăm ngàn cụm nên sẽ có hàng trăm ngàn trình tự sẽ đƣợc đọc, tƣơng ứng với hàng trăm ngàn đoạn ADN từ bộ gene sẽ đọc đƣợc. Các trình tự của các đoạn đọc đƣợc sẽ đƣợc phần mềm của thiết bị nối lại với nhau bằng cách so sánh trình tự, tìm các đoạn trùng lặp ở hai đầu và nhƣ vậy là sẽ có kết quả của trình tự nguyên bộ gene [45]. Quy trình một chiều có khả năng tự động hóa cao, với khả năng tạo ra hàng Gb dữ liệu ADN trong một lần chạy, các hệ gen lớn của các động vật có vú có thể giải trình tự trong một vài tuần tại thời điểm công nghệ đƣợc phát triển. Khả năng chạy nhiều mẫu trên 1 flow cell đồng nghĩa với việc có thể thực hiện nhiều ứng dụng trong một lần chạy. Bảng 1.2 T ng hợp một số công nghệ giải trình tự thế hệ mới [30]. TT Hãng (Phƣơng pháp) Kích thƣớc đoạn đọc (bp) Độ chính xác (%) Công suất Thời gian cho một lần đọc Ƣu điểm Nhƣợc điểm 1 Pacific Biosciences (Single-molecule real-time sequencing) 14000 87 500- 100Mb 30 phút- 4 giờ Đọc đƣợc đoàn dài nhất, nhanh nhất Công suất trung bình, giá thành thiết bị đắt đỏ 2 Ion Torrent (Ion 400 98 Đến 80 2 giờ Rẻ và nhanh Công suất 25 Torrent sequecing) triệu chóng cho kết quả trung bình 3 454- ROCHE (Pyrosesequencing) 700 99,9 Đến 6 tỷ 24 giờ Đọc đoạn dài Chi phí đọc đắt, tỷ lệ lỗi cao khi gặp các đoạn trình tự lặp lại. 4 Illumina (Sequencing by synthesis) 50- 300 99.9 Đến 6 tỷ 1-11 ngày Công suất lớn Thiết bị đắt, cần ADN nồng độ cao 5 SOLiD (Sequencing by ligation) 50+50 99.9 1,2- 1,4 tỉ 1-2 tuần Giá thành rẻ Đọc chậm 1.3.3. Công nghệ đọc trình tự bán dẫn Ion bằng Ion Torrent Công nghệ này đƣợc cấp phép từ ADN Electronics Ltd và đƣợc phát triển bởi Ion Torrent Systerms Inc và ra đời năm 2010. Đọc trình tự bán dẫn ion (Ion semiconductor sequencing) là phƣơng pháp đọc trình tự ADN trên cơ sở phát hiện ion hydro đƣợc giải phóng trong quá trình polyme hóa của ADN, còn đƣợc gọi là đọc trình tự giải phóng ion (ion torrent sequencing), đọc trình tự thông qua pH (pH-mediated sequencing), đọc trình tự silicon (silicon sequencing). Ứng dụng chính của công nghệ này gồm: Đọc lại các trình tự của các mẫu có nhiều chỉ thị barcode; đọc trình tự các thƣ viện đã đƣợc gắn adapter (vùng 100 kb-1Mb); đọc trình tự genome của vi khuẩn và virus; đọc trình tự các mẫu metagenomic; đọc trình tự các RNA ngắn; Giá trị số liệu trình tự thu trên các máy khác nhau. Nguyên lý của công nghệ: Khác với các công nghệ đọc trình tự khác, 26 công nghệ đọc trình tự ion torrent sử dụng nucleotide không bị biến đ i hoặc không sử dụng các mắt đọc. Trong hệ thống đọc trình tự, mỗi giếng chứa một sợi ADN khuôn và đƣợc đƣa vào một loại dNTP. Nếu loại dNTP này b sung với nucleotide trên sợi khuôn thì nó sẽ liên kết và kéo dài sợi t ng hợp. Điều này dẫn tới sự giải phóng một ion hydro, tạo thành một cảm ứng ion ISFET (ion-sensitive field-effect transistor) và xác định một phản ứng đã xảy ra. Nếu trình tự sợi khuôn có sự lặp lại của một loại nucleotide, thì sẽ có nhiều phân tử dNTP kết hợp trong cùng một chu kỳ, dẫn tới số phân tử hydro tƣơng ứng đƣợc giải phóng và tín hiệu điện tử tăng lên một cách tỷ lệ thuận. Quy trình công nghệ: Mỗi giếng trên chip bán dẫn có chứa một phân tử ADN khuôn sợi đơn, một ADN polymerase đƣợc nhũ tƣơng hóa với mỗi loại dNTP A, C, G hoặc T (Rusk, 2011; Pennisi, 2010; Perkel, 2011). Nếu một dNTP đƣa vào b sung với nucleotide trên sợi khuôn thì nó liên kết vào sợi ADN t ng hợp bằng ADN polymerase và có phản ứng hóa học xảy ra. Ion hydro giải phóng làm thay đ i pH của dung dịch và nó đƣợc phát hiện bởi ISFET. Những dNTP không đƣợc t ng hợp, đƣợc rửa sạch trƣớc khi một chu kỳ mới với một loại dNTP khác đƣợc đƣa vào (Pennisi, 2010). Dƣới các giếng là một lớp nhạy cảm với ion, tiếp theo là một lớp cảm ứng ion ISFET. Tất cả các lớp đƣợc chứa trong một chip bán dẫn CMOS, giống với các chip đang đƣợc sử dụng trong công nghiệp điện tử. Mỗi chip chứa một dãy giếng với một máy phát hiện ISFET đƣợc cảm ứng bằng ion hydro giải phóng. Một loạt tín hiệu điện tử đƣợc truyền dẫn từ chip tới máy tính và đƣợc dịch thành một trình tự ADN không cần qua một tác nhân trung gian. Hiện tƣợng liên kết nucleotide đƣợc đo trực tiếp bằng điện tử, không dùng nucleotide biến đ i và đo đạc bằng quang học (Davies, 2010; Pennisi, 2010). 27 Hình 1.9. Công nghệ đọc trình tự bán dẫn Ion bằng Ion Torrent [50] Ƣu nhƣợc điểm của máy Ion Torrent: độ chính xác của máy đọc trình tự bán dẫn ion năm 2011 là 99,6% trên 50 base đƣợc đọc với 100 Mb /lần 28 chạy với chiều dài đọc đƣợc là 100 cặp base. Độ chính xác cho các đoạn lặp lại là 98%. Ƣu điểm chính của đọc trình tự bán dẫn ion là: tốc độ đọc nhanh; chi phí vận hành và đầu tƣ thấp [51]; không dùng nucleotide biến đ i và xác định bằng quang học. Vì hệ thống ghi lại hiện tƣợng liên kết nucleotide tự nhiên nên đọc trình tự trong một thời gian thực. Tốc độ đọc trình tự chỉ bị giới hạn bởi vòng quay nucleotides trong hệ thống Ion Torrent Systems Inc; mỗi liên kết đọc mất 4 giây và mỗi lần chạy khoảng 1 giờ đọc đƣợc 100-200 bp [52]. Nếu chip đƣợc nâng cấp thì số lần đọc sẽ đƣợc tăng lên. Tuy nhiên, có hạn chế vì rất khó để xác định một đoạn lặp lại. Tín hiệu đƣợc tạo ra từ số lặp lại cao sẽ là khó khăn để phân biệt đƣợc từ sự lặp lại của một số khác nhau nhƣng tƣơng tự. Ví dụ: lặp lại của đoạn 7 khó phân biệt với đoạn 8. Hạn chế khác của hệ thống này là chiều dài đọc ngắn hơn các phƣơng pháp khác nhƣ Sanger sequencing hoặc Illumina. Chiều dài đọc đƣợc là một lợi thế cho quá trình lắp ráp genome de novo, với Ion Torrent Systems có thể đọc đƣợc 400 cặp base cho một lần chạy [51]. Chính vì vậy, việc lựa chọn thế hệ máy đọc Ion Torrent sẽ là sự lựa chọn phù hợp cho việc giải trình tự hệ gen các cơ thể sinh vật với điều kiện của các viện nghiên cứu của Việt Nam hiện nay. Đối với máy đọc trình tự bán dẫn ion, với ƣu điểm là đọc trình tự nhanh, liên tục và kinh tế, máy có thể sử dụng trong đa số phòng thí nghiệm lớn và nhỏ nhƣ một máy để bàn [49] hoặc ở ngoài các trung tâm đặc trƣng, trong các bệnh viện. Công nghệ này phù hợp trong các ứng dụng nhỏ nhƣ đọc trình tự của hệ gen của vi khuẩn, đọc trình tự transcriptome vi khuẩn, đọc trình tự gen đích amplicon, hoặc kiểm tra chất lƣợng của thƣ viện trình tự [53] [54]. Từ khi ra đời tới nay công nghệ đọc trình tự bán dẫn ion đã đƣợc ứng dụng trong nhiều công trình nghiên cứu, nhƣ: dựa trên đọc trình tự ADN của rRNA để định danh vi khuẩn hay vi nấm [55]; đọc trình tự hệ gen vi sinh vật [56]; nghiên cứu đột biến, chức năng của gen đích [57][58], nghiên cứu y sinh [45], các nghiên cứu cũng đƣa ra đƣợc ƣu nhƣợc điểm của công nghệ [59]. 29 CHƢƠNG 2. VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 2.1 VẬT LIỆU 2.1.1 Đối tƣợng nghiên cứu Trong nghiên cứu này, chúng tôi sử dụng t ng số 96 mẫu, trong đó bao gồm 13 mẫu sinh phẩm tóc và móng tay của 6 mẫu thân nhân và 7 mẫu lab member; 48 mẫu xƣơng và 35 mẫu răng của ngƣời đã hi sinh trong chiến tranh. Việt Nam (1955-1975) theo hồ sơ bảo mật và đƣợc sự đồng ý của Cục ngƣời có công – Bộ thƣơng binh - Lao động và Xã hội (Chi tiết danh sách mẫu ở phần phụ lục). Đặc điểm của mẫu xƣơng và răng: mẫu trải qua nhiều năm dƣới lòng đất, có màu ngả vàng, nâu đậm, nhiều mẫu bị vỡ, mủn. Các mẫu này sẽ đƣợc chia vào 2 chip khi đọc trình tự (hình 2.1) Những mẫu này đã đƣợc giải trình tự Sanger và hoàn thiện hồ sơ pháp lý. Hình 2.1. Sơ đồ mẫu đọc trên chip 1 và chip 2 35 mẫu hài cốt Chip 1 6 mẫu thân nhân Chip 2 7 mẫu labmber 48 mẫu hài cốt 30 2.1.2 Địa điểm và thời gian thực hiện đề tài Địa điểm thực hiện: Trung tâm giám định ADN, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam. Thời gian: Đề tài đƣợc thực hiện từ 12/2019 đến tháng 9/2020 2.1.3. Hóa chất Để thực hiện đƣợc giải trình tự mtADN bằng hệ thống Ion Torrent S5, bộ kit Precision ID mtADN Control Region Panel (Thermofisher Scientific) đƣợc sự dụng. Trong bộ kit này, các panel đƣợc đƣợc thiết kế nhắm vào các vùng điều khiển trên ty thể tại vị trí 15954 – 610 và bao gồm các vùng siêu biến ( HV1, HV2, HV3). Hai t hợp mồi đƣợc thiết kế gồm 14 cặp mồi, trong đó Pool 1 và Pool 2 đều chứa 7 cặp tƣơng ứng 1-3-5-7-9-11-13 và 2-4-6-8-10-12-14 (Hình 2.2 và Bảng 2.1). Việc sử dụng 2 t hợp mồi là cần thiết, bởi vì độ trùng lặp trung bình giữa các mồi trong 2 t hợp là 18 bp, khoảng cách trung bình giữa hai mồi liền kề là ~153bp, khi chạy 2 t hợp mồi đồng thời, sẽ lấy đƣợc toàn bộ trình tự vùng siêu biến của hệ gen ty thể. Hình 2.2. Vị trí 14 cặp mồi dùng cho Pool 1 và Pool 2 31 Bảng 2.1. Danh sách 14 cặp mồi dùng cho Pool 1 và Pool 2 [60] T hợp Mồi Vị trí bắt đầu Vị trí kết thúc Khoảng cách Trùng lặp giữa các mồi 1 1 15954 16069 116 14 2 2 16056 16131 76 22 1 3 16110 16225 116 4 2 4 16222 16341 120 3 1 5 16336 16458 120 11 2 6 16448 16552 105 11 1 7 16542 80 108 65 2 8 16 116 104 1 1 9 119 248 130 1 2 10 248 329 82 31 1 11 299 411 113 27 2 12 385 480 196 21 1 13 460 543 84 25 2 14 519 610 92 N/A Bên cạnh các tổ hợp đƣợc liệt kê ở bảng trên thì trong bộ kit Precision ID mtADN Control Region còn chứa một số mồi suy biến. Cụ thể nhƣ sau: T hợp 1 gồm 7 cặp mồi với 45 mồi suy biến, t hợp 2 gồm 7 cặp mồi với 68 mồi suy biến. Tần suất suy biến mitomap >700 lần [61]. Các mồi suy biến đƣợc sử dụng để phù hợp với tính chất suy biến cao của ADN ty thể. Ngoài ra, để phục vụ cho nghiên cứu này, chúng tôi đã sử dụng các loại hóa chất và trang thiết bị khác, cụ thể đƣợc trình bày tại bảng dƣới đây. 32 Bảng 2.2: Danh sách các loại Kit sử dụng trong chuẩn bị thư viện STT Hóa chất/trang thiết bị Mục đích sử dụng Hóa chất 1 Precision ID mtADN Control Region Panel (Thermofisher Scientific) Giải trình tự 2 Quantification Kit Định lƣợng ADN đầu vào 3 Precision ID Library Kit Chuẩn bị thƣ viện 4 Precision ID Ioncode 1-96 giếng Gắn Barcode Trang thiết bị 1 Ion Chip 520 Chíp đọc trình tự 2 Precision ID Ioncode 1-96 giếng Gắn Barcode 3 Applied Biosystems® 7500 Real-Time PCR Máy chạy qPCR 4 PCR Eppendorf Khuếch đại mẫu, tạo thƣ viện 5 Ion Chef™ System Hệ thông chuẩn bị thƣ viện và khuônHID 6 HID Ion S5™ XL System Hệ thống đọc trình tự 7 Phần mềm Converge analysis sofware Phân tích trình tự Các vật dụng phụ trợ yêu cầu trong quy trình: - Bộ lƣu điện (UPS) > 2500W - Máy ly tâm (microcentrifuge) vừa cho ống 0.2 mL, ống 1.5 mL và tạo lực 21,000g - Máy vortex - Pipette (P2, P10, P20, P200, P1000 uL) - Ống tube PCR 200 ul, ống 1.5 mL, 2 mL - Đĩa 96 giếng nhựa, ống strip dùng cho phản ứng PCR - Đầu tip có lọc - Giấy lau không bụi - Găng tay không bột 33 - Nƣớc sinh học phân tử (Nuclease-free Water, Molecular Biology Grade) - Dung dịch cồn isopropyl alcohol 70%. 2.2. PHƢƠNG PHÁP NGHIÊN CỨU 2.2.1 Sơ đồ nghiên cứu Chúng tôi thực hiện theo sơ đồ minh họa ở hình 2.3 với các bƣớc nhƣ sau: Bƣớc đầu xử lý mẫu hài cốt, sau đó tách ADN từ đối tƣợng nghiên cứu, chọn mẫu, kiểm tra chất lƣợng và nồng độ ADN đầu vào bằng phƣơng pháp Realtime PCR; Chuẩn bị thƣ viện ADN cho giải trình tự thế hệ mới; Chuẩn bị khuôn trên thiết bị Ion Chef; Chạy giải trình tự NGS; phân tích kết quả và kiểm chứng các mẫu bằng phƣơng pháp giải trình tự Sanger. Hình 2.3. Sơ đồ thí nghiệm 2.2.2. Quy trình thực hiện Mỗi bƣớc thực hiện nghiên cứu đều tuân thủ nguyên tắc tránh nhiễm Tách chiết ADN t ng số Phân tích kết quả bằng Converge analysis sofware và kiểm chứng lại với kết quả Sanger Chọn mẫu – Định lƣợng ADN đầu vào bằng Realtime PCR Chuẩn bị thƣ viện thủ công Tiến hành cài đặt và chạy máy Xử lý mẫu hài cốt 34 của phòng thí nghiệm: mặc áo, đội mũ bảo hộ phòng thí nghiệm, đeo khẩu trang, găng tay, quấn băng dính nối liền phần ngoài của tay áo với găng tay cao su. Thƣờng xuyên dùng Bleach làm sạch găng tay và tay áo. Làm sạch tủ an toàn sinh học và khu vực làm việc bằng Bleach, cồn 70 độ và nƣớc vô trùng. Đƣa vật tƣ tiêu hao, hóa chất sinh phẩm vào UV Crosslinker ít nhất 30 phút trƣớc khi sử dụng. Dung dịch đệm khử khoáng và nƣớc khử ion và các hóa chất vô cơ cũng đƣợc khử trùng bề mặt vật dụng chứa và UV Crosslinker ít nhất 30 phút trƣớc khi sử dụng. 2.2.2.1 Xử lý vật lý và hóa học mẫu hài cốt Mẫu xƣơng và răng đƣợc làm sạch toàn bộ bề mặt, loại bỏ đất, mùn và các lớp mềm bên ngoài bằng Dremel Tool (Dremel 2050, Mỹ). Sau đó, mẫu đƣợc xử lý sạch bằng nƣớc khử ion vô trùng, bleach 2% và cồn ethanol tuyệt đối. Cuối cùng, để mẫu khô tự nhiên trong tủ vô trùng 12 giờ trƣớc khi nghiền thành bột bằng hệ thống máy Tissue Lyzer II (QIAgen). Sau quá trình xử lý vật lý, 100 mg mỗi mẫu đƣợc sử dụng cho bƣớc xử lý hóa học. Quá trình khử khoáng và phân cắt từng tế bào, giải phóng ADN đƣợc thực hiện bằng cách b sung 500 µl dung dịch đệm G2 QIAgen và Proteinase K (Ambion Pro-K, 20 mg/mL), ủ trong máy lắc ở 56°C nhằm loại khoáng và phân cắt giải phóng các tế bào xƣơng (phòng thí nghiệm xác định ADN AFDIL) 2.2.2.2 Tách chiết thu ADN từ mẫu hài cốt ADN từ mẫu hài cốt đƣợc tách chiết thông qua sử dụng hệ thống máy EZ1 Invesigator Advanced QIAgen có sử dụng bộ kit QIAamp DNA investigator Kit – QIAgen theo hƣớng dẫn của nhà sản xuất. Cụ thể, với mỗi mẫu, ly tâm dịch lysis ở 6000 vòng/5 phút, thu 500 µl dịch n i vào tube 2 ml. B sung 400 µl đệm MTL + 1 µl cRNA (nhằm bảo vệ và tăng hiệu quả tách chiết ADN) + 50 µl NaOAC vào mỗi mẫu. Sau đó, vortex kỹ và spin nhẹ hỗn hợp trƣớc khi đƣa vào hệ thống máy EZ1. Để hệ thống EZ1 hoạt động cần gắn chip Advanced XL DNA Investigator vào thiết bị. Sau đó khởi động máy EZ1, lần lƣợt đƣa mẫu và các vật tƣ nhƣ tube, đầu tip theo tuần tự từng bƣớc mà máy đã cài đặt sẵn và ấn 35 lệnh “run” để bắt đầu quy trình thu AND tự động. 2.2.2.3 Định lượng ADN t ng số Sau khi tách chiết đƣợc ADN, thực hiện định lƣợng ADN t ng số bằng bộ sinh phẩm Quantifiler Trio DNA Quantification Kit trong phản ứng Realtime PCR. Mỗi tube phản ứng cho từng mẫu riêng biệt sẽ gồm 8 µl Quantrifiler Trio Primer mix, 10 µl Quantrifiler THP PCR Reaction Mix và 2 µl ADN mẫu hoặc đối chứng đã biết nồng độ ADN t ng số. Nồng độ ADN t ng số của mỗi mẫu đƣa ra dựa trên thông số tƣơng quan giữa mẫu và đối chứng. Bảng 2.3: Nồng độ mẫu xây dựng đường chuẩn: STT Mẫu Nồng độ (ng/ul) 1 Standard 1 50 2 Standard 2 5 3 Standard 3 0,5 4 Standard 4 0,05 5 Standard 5 0,005 Bảng 2.4: Thành phần phản ứng Realtime PCR Thành phần x1 (ul) Master mix 10

Các file đính kèm theo tài liệu này:

luan_van_ung_dung_cong_nghe_giai_trinh_tu_the_he_moi_ion_s5.pdf