MỤC LỤC
LỜI CAM ĐOAN . ii
LỜI CẢM ƠN . iii
MỤC LỤC . v
DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT . viii
DANH MỤC BẢNG . ix
DANH MỤC HÌNH . x
DANH MỤC BẢNG . ix
MỞ ĐẦU . 1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU . 4
1.1. Tổng quan về bệnh hemophilia B . 4
1.1.1. Một số dấu mốc về lịch sử phát hiện và nghiên cứu bệnh hemophilia B. 4
1.1.2. Khái quát về bệnh hemophilia B . 6
1.2. Cấu trúc và chức năng của yếu tố IX trong quá trình đông máu. 10
1.2.1. Các yếu tố đông máu . 10
1.2.2. Vai trò của yếu tố IX trong quá trình đông máu . 11
1.2.3. Cấu trúc yếu tố IX và quá trình hoạt hóa yếu tố IX . 13
1.2.4. Mối tương tác giữa yếu tố IX với các nhân tố hoạt hóa và đồng yếu tố . 15
1.3. Phân tích di truyền bệnh hemophilia B. 18
1.3.1. Vai trò của phân tích di truyền trong bệnh hemophilia B . 18
1.3.2. Đặc điểm đột biến trên gen F9 . 19
1.3.3. Đặc điểm các đa hình nucleotide liên kết với gen F9. 27
1.4. Các kỹ thuật phân tích di truyền trong bệnh hemophilia B. 30
1.4.1. Kỹ thuật phân tích đột biến . 31
1.4.2. Kỹ thuật phân tích liên kết . 36
1.5. Tình hình nghiên cứu về các biến đổi di truyền trên gen F9. 38
1.5.1. Tình hình nghiên cứu trên thế giới . 38
1.5.2. Tình hình nghiên cứu trong nước . 42
CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU . 45
2.1. Đối tượng nghiên cứu . 45
2.2. Phương pháp nghiên cứu. 46
2.2.1. Thiết kế nghiên cứu . 46vi
2.2.2. Công thức tính cỡ mẫu trong nghiên cứu đa hình nucleotide . 46
2.2.3. Các bước nghiên cứu . 46
2.3. Hóa chất và thiết bị nghiên cứu. 50
2.3.1. Hóa chất. 50
2.3.2. Vật tư – Trang thiết bị . 51
2.4.1. Thu thập mẫu nghiên cứu. 52
2.4.2. Tách chiết ADN. 52
2.4.3. Thiết kế các trình tự mồi để khuếch đại gen tổng hợp yếu tố IX. 52
2.4.4. Khuếch đại các phân đoạn a1-a8 bằng kỹ thuật Longrange PCR . 53
2.4.5. Tinh sạch sản phẩm Longrange PCR khuếch đại các vùng gen F9 . 54
2.4.7. Khẳng định kết quả giải trình tự gen F9 trên NGS . 55
2.4.8. Khẳng định các mất đoạn/lặp đoạn gen F9 bằng kỹ thuật MLPA . 56
2.4.9. Phân tích đột biến gen từ dữ liệu giải trình tự. 56
2.4.10. Phân tích đa hình nucleotide trên gen F9 từ dữ liệu giải trình tự. 58
154 trang |
Chia sẻ: thinhloan | Ngày: 13/01/2023 | Lượt xem: 561 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu đột biến và đa hình di truyền trên gen mã hóa yếu tố IX ở bệnh nhân Hemophilia B, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ủa kỹ thuật MLPA dựa trên phản ứng khuếch đại của một hỗn hợp
probe, trong đó mỗi probe phát hiện một trình tự ADN cụ thể. Trong nghiên cứu này,
chúng tôi sử dụng bộ kit SALSA MLPA P207 F9 với thiết kế chứa 9 probe MLPA đặc
hiệu cho 9 vùng gen bao phủ toàn bộ gen F9. Đầu tiên, mẫu ADN của bệnh nhân sẽ
được biến tính để tách thành các sợi đơn, sau đó chúng được lai với hỗn hợp probe.
Mỗi probe gồm 2 oligonucleotide sẽ gắn đặc hiệu vào mỗi trình tự đích trên chuỗi
ADN. Tiếp đến chúng được nối với nhau để tạo thành một probe riêng biệt thông qua
phản ứng nối sử dụng enzyme ligase. Cuối cùng tất cả các cặp probe đã nối được
khuếch đại thông qua phản ứng PCR với cùng một trình tự primer PCR giống nhau.
Sau phản ứng PCR, một tập hợp các đoạn ADN duy nhất sẽ được tạo ra. Do một
primer PCR được gắn huỳnh quang, nên sản phẩm khuếch đại được quan sát khi thực
hiện phân tích đoạn trên hệ thống điện di mao quản AB3500. Dữ liệu điện di mao quan
sẽ được phân tích trên phần mềm Coffalyser, theo đó chiều cao của mỗi đỉnh probe ở
mỗi bệnh nhân được so sánh tương đối với chiều cao của đỉnh probe tương ứng ở mẫu
tham chiếu (là người bình thường), từ đó sẽ cho phép phát hiện các biến đổi về số
lượng bản sao (mất/thêm đoạn gen) [82].
2.4.9. Phân tích đột biến gen từ dữ liệu giải trình tự
Bước 1: Xử lý dữ liệu
Sử dụng các phần mềm tin sinh chuyên dụng cho NGS gồm Miseq Reporter và
CLC Genomics Workbench 9.5.2. Miseq Reporter để kiểm tra chất lượng của xét
57
nghiệm giải trình tự và phân tích dữ liệu ở mức cơ bản. CLC Genomics Workbench
cho phép loại bỏ những đoạn đọc ngắn, không đảm bảo chất lượng, loại bỏ các adapter
dư thừa, các biến đổi nucleotide có độ tin cậy thấp.
Bước 2: Phân tích các biến đổi di truyền
Sử dụng phần mềm CLC Genomic Workbench ghép nối (alignment) dữ liệu
thu được với gen tham chiếu (NG_007994.1 và NM_000133.3) để xác định những
biến đổi đơn nucleotide (SNV), các chèn đoạn, mất đoạn ngắn (indels). Các biến đổi
nucleotide được chú giải theo danh pháp của Hiệp hội các biến đổi di truyền người
(Human Genome Variation Society, HGVS).
Đối chiếu với cơ sở dữ liệu quốc tế (cơ sở dữ liệu của EAHAD
( CDC (https://www.cdc.gov/ncbddd/hemophilia), cơ sở dữ
liệu SNP quốc tế (https://www.ncbi.nlm.nih.gov/snp) để nhận định các biến đổi
nucleotide đã biết và biến đổi mới.
Bước 3: Dự đoán chức năng in silico của các biến đổi di truyền mới
Thực hiện theo hướng dẫn của UKHCDO [51].
- Các mất đoạn/chèn đoạn gen, các đột biến dẫn đến kết thúc chuỗi: là các biến
đổi gây ảnh hưởng lớn đến cấu trúc gen, được khẳng định là đột biến gây bệnh.
- Các biến đổi sai nghĩa: sử dụng công cụ online PolyPhen-2 và SIFT để kiểm
tra mức độ ảnh hưởng tới cấu trúc và chức năng của protein thông qua điểm đánh giá
thu được.
Diễn giải kết quả dự đoán theo bảng dưới đây:
Biến đổi Chỉ số polyphen-2 Chỉ số SIFT
Không gây bệnh 0 – 0,15 0,05 - 1
Có khả năng gây bệnh 0,15 – 0,85 0 – 0,05
(Giá trị càng gần 0
càng chắc chắn khả
năng gây bệnh)
Gây bệnh 0,85 – 1
(Giá trị càng gần 1 càng chắc
chắn khả năng gây bệnh)
58
Bước 4: Khẳng định đột biến gây bệnh
Kết hợp các thông tin về chẩn đoán lâm sàng, nồng độ yếu tố FIX cơ sở của
bệnh nhân, điểm đánh giá trên phần mềm PolyPhen-2, SIFT và các biến đổi di truyền
đi kèm (nếu có) để khẳng định đột biến gây bệnh.
2.4.10. Phân tích đa hình nucleotide trên gen F9 từ dữ liệu giải trình tự
Bước 1: Xử lý dữ liệu (thực hiện như bước xử lý dữ liệu phân tích đột biến gen)
Bước 2: Phân tích các biến đổi nucleotide trên gen F9
Sử dụng phần mềm CLC Genomic Workbench ghép nối (alignment) dữ liệu thu
được với gen tham chiếu (F9_NC000023.11) để xác định những biến đổi nucleotide.
Các biến đổi nucleotide được chú giải theo danh pháp của Hiệp hội các biến đổi di
truyền người (Human Genome Variation Society, HGVS).
Đối chiếu với cơ sở dữ liệu SNP quốc tế (https://www.ncbi.nlm.nih.gov/snp) để
nhận định các biến đổi nucleotide đã biết và biến đổi mới.
Xác đinh đa hình dị hợp tử: khi tần suất alen đa hình < 70%
Tính toán chỉ số đa hình
- Tần số alen: được tính toán bằng cách đếm trực tiếp từ dữ liệu phân tích của
301 NST X (từ 100 mẫu người phụ nữ khỏe mạnh và 100 bệnh nhân).
- Tần số dị hợp tử quan sát được (Observed Heteoygosity, Ho):
Ho =
- Phân tích mối liên kết giữa các SNP: Phân tích mối liên kết giữa các SNP:
kết hợp quan sát sự xuất hiện của các đa hình dị hợp tử trong các mẫu nghiên cứu và
kết quả phân tích trên phần mềm Haploview 4.2 sử dụng giá trị D’. Giá trị D’ thể hiện
trong các ô vuông (Hình 2.2). Mức độ liên kết của các SNP tăng dần theo mầu sắc của
ô vuông, màu càng đỏ đậm thể hiện mối liên kết càng chặt chẽ. Ô vuông đỏ đậm
không chứa con số thể hiện mối liên kết hoàn toàn (D’ = 1).
Số cá thể dị hợp tử
Tổng số cá thể quan sát
59
Hình 2.2: Xác định giá trị D’ trên phần mềm Haploview
+ Nếu D’ = 0: hai SNP cân bằng liên kết hoàn toàn (di truyền độc lập với nhau)
+ D’ = 1: hai SNP mất cân bằng liên kết hoàn toàn (luôn di truyền cùng nhau)
+ 0 < D’ <1: hai SNP mất cân bằng liên kết không hoàn toàn (di truyền cùng nhau
nhưng không hoàn toàn).
- Tiêu chuẩn lựa chọn các đa hình có giá trị thông tin:
+ Các đa hình có tỷ lệ dị hợp tử cao
+ Đa hình cân bằng liên kết hoàn toàn hoặc mất cân bằng liên kết không hoàn
toàn với các đa hình khác.
- Khảo sát khả năng ứng dụng của bộ đa hình: Áp dụng bộ chỉ thị đa hình
phân tích trên 23 người phụ nữ mang gen. Hiệu quả chẩn đoán của mỗi SNP được tính
bằng số lượng SNP dị hợp tử trong số 23 mẫu. Hiệu quả của bộ SNP được tính bằng
tổng số trường hợp mẫu dị hợp tử khi phối hợp bộ đa hình.
2.4.11. Xử lý số liệu
Số liệu được xử lý, phân tích trên phần mềm SPSS 16.0 và Microsoft Office
Excel 365.
2.4.12. Vấn đề đạo đức nghiên cứu
Nghiên cứu được tiến hành dưới sự đồng ý của Ban Lãnh đạo Viện, khoa Di
truyền & Sinh học phân tử và Hội đồng Khoa học của Viện. Nghiên cứu nhằm thiết
lập bộ công cụ chẩn đoán phân tử trong bệnh hemophilia B, góp phần kiểm soát gen
bệnh. Các thông tin về bệnh nhân trong nghiên cứu hoàn toàn được giữ bí mật.
D’ = 1
(100%
)
D’ = 0.75
(75%)
60
CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU
3.1. Chuẩn bị mẫu nghiên cứu
3.1.1. Thu thập mẫu nghiên cứu
Trong nghiên cứu này, để phục vụ mục tiêu phân tích đột biến trên người bệnh
hemophilia B và khảo sát các đa hình nucleotide trên quần thể người bình thường,
chúng tôi đã thu thập mẫu từ các đối tượng là 100 bệnh nhân hemophilia B và 100 phụ
nữ khỏe mạnh. Trong đó, 100 người phụ nữ khỏe mạnh lựa chọn cho nghiên cứu là
những người đang tham gia hiến máu tại Viện Huyết học – Truyền máu TW, có độ
tuổi trung bình là 24 ± 14, không có quan hệ huyết thống, không có tiền sử chảy máu
lâu cầm. 100 bệnh nhân trong nghiên cứu thuộc Trung tâm hemophilia, Viện Huyết
học – Truyền máu TW. Một số đặc điểm của các bệnh nhân nghiên cứu được trình bày
ở Bảng 3.1.
Bảng 3.1. Đặc điểm của các bệnh nhân nghiên cứu
Bệnh nhân hemophilia B
(n=100)
Đặc điểm N Tỷ lệ (%)
Giới tính
Nam 99 99
Nữ 1 1
Mức độ bệnh
Nặng 79 79
Trung bình 17 17
Nhẹ 4 4
Tình trạng xuất hiện
ức chế
Có 0 0
Không 100 100
Độ tuổi trung bình
(x ± SD)
22 ±16
Bảng 1 cho thấy, bệnh nhân trong nghiên cứu chủ yếu là nam giới (99 bệnh
nhân), chỉ có 01 trường hợp là nữ giới. Trong số đó, 79% bệnh nhân có bệnh mức độ
bệnh nặng (nồng độ FIX <1%), 17% bệnh nhân có mức độ bệnh trung bình (nồng độ
FIX từ 1 – 5%), 4% bệnh nhân có mức độ nhẹ (nồng độ FIX từ 5 – 40%). Tất cả các
bệnh nhân tham gia nghiên cứu không xuất hiện ức chế FIX trong quá trình điều trị.
61
3.1.2. Chuẩn bị vật liệu nghiên cứu
Các mẫu sau khi thu thập được tiến hành tách chiết ADN để phục vụ cho
nghiên cứu. Quá trình tách chiết ADN sử dụng bộ kít QIAamp DNA Blood Mini Kit).
Sau khi tách, các mẫu ADN được kiểm tra chất lượng đồng thời bằng phương pháp đo
quang trên máy nanodrop 2000 và điện di trên gel agarose. Kết quả kiểm tra chất
lượng các mẫu ADN sau tách được trình bày ở phụ lục 01. Hình ảnh điện di ADN và
kết quả đo nồng độ của một số mẫu nghiên cứu được trình bày ở Hình 3.1 và Bảng 3.2.
Hình 3.1. Kết quả tách chiết ADN tổng số
HB1-HB6: 6 mẫu bệnh nhân (từ 1 đến 6)
NK1-NK6:6 phụ nữ khỏe mạnh (từ 1 đến 6)
M: thang ADN 1kb (Thermo Fisher)
Bảng 3.2. Kết quả nồng độ và độ tinh sạch của một số mẫu ADN
STT Tên mẫu
Nồng độ
(ng/µl)
A260 /A280
1 HB1 108.8 1.9
2 HB2 94 1.91
3 HB3 150.1 1.91
4 HB4 108.1 1.9
5 HB5 93 1.91
6 HB6 225.6 1.88
7 NK1 90 1.95
8 NK2 93.6 1.94
9 NK3 111.7 1.9
10 NK4 119 1.88
11 NK5 207.5 1.9
12 NK6 207.5 1.91
Kết quả tách chiết ADN thể hiện ở Hình 3.1 và Bảng 3.2 cho thấy các mẫu
ADN thu được đều đạt chất lượng để thực hiện các bước nghiên cứu tiếp theo với
nồng độ cao (>100 ng/µl), băng ADN nguyên vẹn; độ tinh sạch thông qua chỉ số A260
/A280 nằm trong khoảng từ 1,7 – 2,2.
62
3.2. Xây dựng quy trình giải trình tự gen mã hóa yếu tố IX trên hệ thống NGS
3.2.1. Thiết kế bộ mồi khuếch đại toàn bộ gen F9
Để khuếch đại được toàn bộ gen F9 bằng phản ứng LR-PCR cần phải phân
đoạn gen F9 thành những vùng gen nhỏ hơn. Gen F9 có kích thước xấp xỉ 35 kb, cấu
trúc gồm 8 exon và 7 intron. Sau khi nghiên cứu trình tự gen F9, chúng tôi quyết định
chia gen F9 thành 8 phân đoạn, mỗi phân đoạn có kích thước từ khoảng 4000 bp -
6000 bp. Tiếp đó, sử dụng phần mềm Primer3 để thiết kế các trình tự mồi cho 8 phân
đoạn này. Các trình tự mồi sau thiết kế (Bảng 3.3) được kiểm tra độ bao phủ gen F9
bằng phần mềm CLC Genomic Workbench (Hình 3.2).
Bảng 3.3. Phân đoạn ADN và các trình tự mồi thiết kế
Đoạn
Tên
mồi
Trình tự (5'-3')
Vùng gen
F9
khuếch
đại
Kích
thước
(bp)
Đoạn
gối
đầu
(bp)
a1
F9-1F CCACAAGAGAAAGCAGGACG
Đầu 5’ 4056
F9-1R TGAAGAGAATGGGCAGTGGT
a2
F9-2F AAGAGGACAAAAGACAAGCTAGG
exon 1
intron 1
4560 375
F9-2R TGCCTGCATCCATTTACAGTCG
a3
F9-3F CACAGGTCTAGAGGAGGCAGAT Từ exon 2
đến
intron 3
5572 446
F9-3R TGCCTATTCTCCCTCTTCTCTGTC
a4
F9-4F TGCCTGAACCCAAAGTACACAC
exon 4
intron 4
5594 436
F9-4R GGTGATTAGCTCTGGGTGGATGT
a5
F9-5F TGCTTAACTTCCTGGGACTGTCTC
exon 5
intron 5
5724 314
F9-5R CACAGCCATATTCACCAGGACC
a6
F9-6F CTGCCTGGTTCTTCACATACACTG
exon 6 4765 589
F9-6R TGCCTTAGTCACAGCAGGTTTG
a7
F9-7F CACCACCTCCATCCAGTTCCTTAT
Intron 6 5723 229
F9-7R GCAGGGCTCATTCATTCTTTCCAC
a8
F9-8F TCAGCTTTGTAGGTCTCCAGGTAG Từ exon 7
đến vùng
poly A
5305 582
F9-8R GCCACAGAGAAGACCAATACAGG
63
Kết quả thiết kế mồi ở Bảng 3.3 cho thấy các phân đoạn a1-a8 được thiết kế gối
đầu nhau, vùng trình tự gối đầu của mỗi đoạn dài từ 229 bp đến 589 bp. Phân đoạn lớn
nhất (a5) có chiều dài 5724 bp, phân đoạn nhỏ nhất (a1) có chiều dài 4056 bp.
Hình 3.2. Kết quả kiểm tra độ bao phủ gen F9 của các trình tự mồi
Hình ảnh lắp ráp các trình tự mồi trên gen tham chiếu trên phần mềm CLC cho
thấy, 8 cặp mồi thiết kế đã bao phủ toàn bộ gen F9, đảm bảo quá trình khuếch đại sẽ
thu được gen F9 hoàn chỉnh.
3.2.2. Tối ưu quy trình LR- PCR khuếch đại 8 vùng gen F9
Sau khi thiết kế các trình tự primer, bước tiếp theo cần thực hiện là tối ưu quy
trình LR-PCR để khuếch đại 8 phân đoạn của gen F9. Với công cụ NEB Tm
Calculator (https://tmcalculator.neb.com), chúng tôi đã xác định được nhiệt độ nóng
chảy (Tm) của từng cặp mồi riêng biệt khi sử dụng Q5 High-Fidelity 2x Master Mix
và tính toán được nhiệt độ gắn mồi trung bình theo lý thuyết của cả 8 cặp mồi là
68,6oC. Dựa vào đây, chúng tôi sử dụng dải nhiệt độ với biên độ ±2-3oC so với Tm
trung bình để tối ưu phản ứng LR-PCR cho từng cặp mồi riêng biệt. Các nhiệt độ được
lựa chọn cho bước gắn mồi trong phản ứng LR-PCRlà 65oC,66oC, 67oC, 68oC,
69oC,70oC.Kết quả phản ứng LR-PCR được kiểm tra bằng điện di trên gel agarose 1%,
sử dụng 1kb DNA ladder (Thermo Fisher) (Hình 3.3- 3.6).
Hình 3.3. Kết quả phản ứng LR-PCR tối ưu đoạn a1 và a2
Giếng M: Thang ADN chuẩn 1 kb (Thermo Fisher);
a1: phân đoạn a1(4056 bp); a2: phân đoạn a2 (4560 bp)
64
Hình 3.4. Kết quả phản ứng LR-PCR tối ưu đoạn a3 và a4
Giếng M: Thang ADN chuẩn 1 kb (Thermo Fisher);
a3: phân đoạn a3 (5572 bp); a4: phân đoạn a4 (5594 bp)
Hình 3.5. Kết quả phản ứng LR-PCR tối ưu đoạn a5 và a6
Giếng M: Thang ADN chuẩn 1 kb (Thermo Fisher);
a5: phân đoạn a5 (5724 bp); a6: phân đoạn a6 (4765 bp)
Hình 3.6. Kết quả phản ứng LR-PCR tối ưu đoạn a7 và a 8 ở các điều kiện
nhiệt độ bắt cặp mồi khác nhau (từ 65-70oC). Giếng M: Thang ADN chuẩn 1 kb
(Thermo Fisher); a7: phân đoạn a7(5723 bp); a8: phân đoạn a8 (5305 bp)
Từ hình ảnh các kết quả điện di cho thấy nhiệt độ bắt cặp của các cặp mồi có sự
khác biệt tương đối rõ. Các cặp mồi khuếch đại đoạn a1, a2,a5, a6, a7 cho sản phẩm
tương đối đặc hiệu, rõ nét ở nhiệt độ gắn mồi là 66oC (Hình 3.3, 3.5, 3.6), trong khi đó
mồi cho đoạn a3, a4 có sản phẩm đặc hiệu, rõ nét ở nhiệt độ gắn mồi là 68oC (Hình
65
3.4), riêng mồi để nhân đoạn a8 ở tất cả các dải nhiệt độ đều không có sản phẩm (Hình
3.6).
Lặp lại thử nghiệm tối ưu đoạn a8 ở cùng điều kiện, ở điều kiện giảm Tm xuống
60oC, 62oC, 64oC, phản ứng LR-PCR vẫn không có sản phẩm. Để loại trừ nguyên nhân
do bộ kit Q5 High-Fidelity 2x Master Mix không phù hợp để khuếch đại đoạn a8,
chúng tôi đã thử nghiệm với bộ hóa chất Qiagen Longrange PCR Kit, phản ứng PCR
khuếch đại đoạn a8 vẫn không thành công (Hình 3.7).
Hình 3.7. Kết quả phản ứng LR-PCR tối ưu đoạn a8
(kit Qiagen Longrange PCR)
Khả năng phản ứng LR-PCR khuếch đại đoạn a8 không thành công được là do
các trình tự primer không gắn được vào mạch khuôn, chúng tôi thiết kế lại cặp mồi
nhân đoạn a8. Ở lần thiết kế này mồi F9-8F được giữ nguyên, mồi F9-8R được thiết
kế dịch vào trong gen so với vị trí lần đầu 1274 nucleotide (F9-8R’: 5’-
AGAACTAAAGGAACTAGCAAG-3’). Kết quả tối ưu đoạn a8 sử dụng Q5 High-
Fidelity 2x Master Mix với cặp mồi F9-8F và F9-8R’ được thể hiện trên hình 3.8.
Kết quả điện di hình 3.8 cho thấy, với cặp mồi F9-8F và F9-8R’, ở nhiệt độ
69oC phản ứng LR-PCR khuếch đại đoạn a8 đã cho sản phẩm tương đối đặc hiệu,
đúng kích thước 4031 bp. Như vậy, phản ứng LR-PCR khuếch đại các phân đoạn a1-
a8 của gen F9 đã được tối ưu thành công với bộ kit Q5 High-Fidelity 2x Master. Bằng
8 phản ứng LR-PCR ở 3 điều kiện Tm khác nhau chúng tôi đã khuếch đại được toàn
bộ gen F9 dài 35kb thông qua các phân đoạn a1-a8 (Hình 3.9).
3000 bp
66
Hình 3.8. Kết quả phản ứng LR-PCR tối ưu đoạn a8
(với cặp mồi F9-8F và F9-8R’)
Giếng M: Thang ADN chuẩn 1 kb (Thermo Fisher); a8: phân đoạn a8 (5305 bp)
Hình 3.9. Hình ảnh khuếch đại các phân đoạn a1-a8 ở điều kiện Tm tối ưu.
Giếng M: Thang ADN chuẩn 1 kb (Thermo Fisher);
a1- a8: các phân đoạn a1 -a8 của gen F9
Để khảo sát tính ổn định của phản ứng LR-PCR với các điều kiện Tm tối ưu,
chúng tôi thực hiện khuếch đại gen F9 của 10 bệnh nhân lựa chọn ngẫu nhiên. Kết quả
cho thấy sản phẩm phản ứng LR- PCR ở tất cả các mẫu đều có băng ADN đặc hiệu, rõ
nét, đúng kích thước theo thiết kế (kết quả không nêu tại đây).
Từ các kết quả trên, chúng tôi nhận thấy điều kiện tối ưu về thành phần phản
ứng và chu trình nhiệt cho phản ứng LR-PCR khuếch đại các phân đoạn đoạn từ a1-a8
của gen F9 như sau:
Bảng 3.4. Thành phần phản ứng LR-PCR khuếch đại các đoạn a1-a8
Thành phần Nồng độ Thể tích (µl)
Q5 High-Fidelity 2x Mastermix 1X 12,5
Primer F 10 pM 1
Primer R 10 pM 1
ADN khuôn 100 ng 1
H20 9,5
Tổng thể tích 25
67
Bảng 3.5. Chu trình nhiệt của phản ứng LR-PCR cho đoạn a1, a2, a5, a6, a7
Nhiệt độ Thời gian Số chu kỳ
97oC 3 phút 1
97oC 30 giây
35 66oC 45 giây
72oC 5 phút
72oC 10 phút 1
15oC ∞ 1
Bảng 3.6. Chu trình nhiệt của phản ứng LR-PCR cho đoạn a3 và a4
Nhiệt độ Thời gian Số chu kỳ
97oC 3 phút 1
97oC 30 giây
35 68oC 45 giây
72oC 5 phút
72oC 10 phút 1
15oC ∞ 1
Bảng 3.7. Chu trình nhiệt độ của phản ứng LR-PCR cho đoạn a8
Nhiệt độ Thời gian Số chu kỳ
97oC 3 phút 1
97oC 30 giây
35 69oC 45 giây
72oC 5 phút
72oC 10 phút 1
15oC ∞ 1
Quy trình LR-PCR với thành phần và các điều kiện đã tối ưu được sử dụng để
khuếch đại các đoạn a1-a8 cho tất cả các mẫu nghiên cứu trong đề tài. Sản phẩm của
phản ứng LR-PCR sau đó được tinh sạch và chuẩn bị thư viện ADN phục vụ bước giải
trình tự gen F9 bằng kỹ thuật NGS.
3.2.3. Chuẩn bị thư viện ADN
Sản phẩm PCR khuếch đại gen F9 được sử dụng để chuẩn bị thư viện ADN
phục vụ bước giải trình tự NGS. Chúng tôi sử dụng bộ kit Nextera XT DNA Library
preparation để chuẩn bị thư viện với mục tiêu thu được các đoạn ADN có kích thước
nằm trong khoảng 300 bp đến 500 bp. Quy trình cắt sản phẩm PCR được thực hiện
theo hướng dẫn đi kèm của bộ kit. Kết quả được thể hiện trên Hình 3.10.
68
Hình 3.10. Kết quả kiểm tra thư viện ADN trên hệ thống điện di mao quản BiOptic
Kết quả kiểm tra tư viện ở Hình 3.10 cho thấy các đoạn ADN trong thư viện
chủ yếu tập trung ở khoảng kích thước 462 bp, nằm trong vùng tiêu chuẩn là từ 300
bp đến 500 bp.
3.2.4. Giải trình tự với quy trình NGS đã tối ưu
Thư viện ADN được tinh sạch bằng Agencourt Ampure XP, sau đó thực hiện
giải trình tự sử dụng bộ kit Miseq Reagent. Kết quả giải trình tự cho thấy các chỉ số
đánh giá chất lượng đáp ứng các tiêu chí kỹ thuật với Q30 = 90,5%; density = 1153
K/mm2; Cluster passing filter = 88,2% (Hình 3.11 a). Dữ liệu giải trình tự thu được
bao phủ hoàn toàn gen F9 (35kb) (Hình 3.11 b). Độ bao phủ (coverage) tối thiểu cho
mỗi nucleotide là 100X.
(a)
Q30 = 93,8%; density = 896 K/mm2; Cluster passing filter = 91,7%.
69
(b)
Hình 3.11. Các chỉ số chất lượng và hình ảnh kết quả giải trình tự
(a) Các chỉ số chất lượng giải trình tự thu được
(b) Một số hình ảnh kết quả giải trình tự NGS
70
3.2.5. Khẳng định kết quả giải trình tự NGS
Để khẳng định độ tin cậy của quy trình giải trình tự gen NGS đã xây dựng,
chúng tôi thực hiện giải trình tự gen F9 của 10 bệnh nhân (lựa chọn ngẫu nhiên) với
đồng thời cả hai quy trình là quy trình NGS và quy trình Sanger đã chuẩn hóa. Kết quả
phân tích dữ liệu thu được từ hai quy trình cho thấy, tất cả 10/10 (100%) bệnh nhân
khảo sát đều thu được các thông tin đột biến gen giống nhau (Hình 3.12).
Kết quả giải trình tự NGS Kết quả giải trình tự Sanger
(1) Mẫu HB04
Bất thường c.128G>A Bất thường c.128G>A
(2) Mẫu HB05
Bất thường c.382T>C Bất thường c.382T>C
71
(3) Mẫu HB06
Bất thường c.676C>T Bất thường c.676C>T
(4) Mẫu HB08
Bất thường c.689G>T Bất thường c.689G>T
(5) Mẫu HB12
Bất thường c.127C>T Bất thường c.127C>T
72
(6) Mẫu HB15
Bất thường c.677G>A Bất thường c.677G>A
(7) Mẫu HB18
Bất thường c.470G>T Bất thường c.470G>T
(8) Mẫu HB19
Bất thường c.1135C>T Bất thường c.1135C>T
73
(9) Mẫu HB22
Bất thường c.874C>T và c.933G>C Bất thường c.874C>T và c.933G>C
(10) Mẫu HB25
Đột biến c.956T>C Đột biến c.956T>C
Hình 3.12. Kết quả phân tích đột biến với quy trình NGS và Sanger
3.3. Giải trình tự gen F9 ở các mẫu nghiên cứu
Áp dụng quy trình giải trình tự bằng NGS xây dựng ở trên, chúng tôi đã giải
trình tự gen F9 cho tất cả các mẫu nghiên cứu (100 bệnh nhân và 100 phụ nữ khỏe
mạnh). Ngoại trừ dữ liệu của 3 bệnh nhân có mã số H14, H94, H97 thì dữ liệu giải
trình tự thu được của 197 mẫu còn lại (97 bệnh nhân và 100 người khỏe mạnh) đều
bao phủ hoàn toàn gen F9 (35 kb), đạt yêu cầu để phân tích các biến đổi di truyền (bao
gồm đột biến và đa hình nucleotide) trên gen F9. Mẫu H14, H94, H97 là các mẫu bị
khuyết sản phẩm Longrange PCR ở các phân đoạn a5 (H14), a2-a8 (H94), a4-a6 (H97)
do có mất đoạn gen (Hình 3.13), nên chỉ thu được dữ liệu giải trình tự của các vùng
74
gen còn lại (Hình 3.14). Lý do của hiện tượng khuyết các phân đoạn gen ở 3 mẫu H14,
H94, H97 đã được khẳng định (bằng kỹ thuật MLPA) là do có mất đoạn gen
(Hình.3.15).
Mẫu H14: không khuếch đại được đoạn a5
Mẫu H94: không khuếch đại được đoạn a2-a8
Mẫu H97: không khuếch đại được đoạn a4-a6
Hình 3.13. Kết quả Longrange PCR của các mẫu H14, H94, H97
Mẫu H14: Thiếu exon 5
6000 bp
3000 bp
6000 bp
3000 bp
6000 bp
3000 bp
75
Mẫu H94:Thiếu exon 1 - 8
Mẫu H97: Thiếu exon 4 -6
Hình 3.14. Kết quả giải trình tự gen NGS của các mẫu H14, H94, H97
Mẫu H14: Đột biến mất exon 5
76
Mẫu H94: Đột biến mất đoạn gen từ exon 1 đến exon 8
Mẫu H97: Đột biến mất đoạn gen từ exon 4 đến exon 6
Hình 3.15. Kết quả phân tích MLPA của các mẫu H14, H94, H97
3.4. Phân tích đột biến gen ở 100 bệnh nhân nghiên cứu
Với mục tiêu lập bản đồ đột biến gen của 100 bệnh nhân hemophilia B (99 bệnh
nhân nam và 01 bệnh nhân nữ) tham gia nghiên cứu, chúng tôi đã phối hợp phân tích
dữ liệu NGS và MLPA thu được của 100 bệnh nhân này. Kết quả phân tích cho thấy,
tỷ lệ phát hiện đột biến trong nghiên cứu là 100%. Trong đó, tất cả các bệnh nhân là
nam giới đều mang một đột biến gen gây bệnh. Bệnh nhân là nữ giới mang đột biến
c.881A>G đồng hợp tử trên cả hai nhiễm sắc thể X. Kết quả giải trình tự gen F9 của
100 bệnh nhân được trình bày ở phụ lục 02.
Từ dữ liệu giải tình tự gen chúng tôi nhận thấy trong số các đột biến gen phát
hiện được ở 100 bệnh nhân có 58 biến đổi di truyền khác nhau. Trong đó, có 42 đột
biến gây bệnh đã được công bố và 16 đột biến mới chưa được công bố trong cơ sở dữ
liệu cơ sở dữ liệu của EAHAD ( và CDC
(https://www.cdc.gov/ncbddd/hemophilia/champs.html). Tỷ lệ đột biến mới gặp trong
nghiên cứu là 27,59%.
77
Trong số 16 đột biến mới, có 5 đột biến mất đoạn, 2 đột biến dẫn đến dừng dịch
mã, 1 đột biến chèn đoạn, 1 đột biến vùng promoter và 7 đột biến điểm dẫn tới thay thế
axit amin. Chúng tôi đã sử dụng song song hai phần mềm Polyphen-2 và SIFT để khảo
sát tác động của 7 đột biến thay thế tới cấu trúc và chức năng của phân tử yếu tố IX.
Kết quả dược trình bày ở bảng 3.8
Bảng 3.8: : Danh sách 16 đột biến mới phát hiện trong nghiên cứu
STT Đột biến
Thay đổi axit
amin
Loại đột biến Vị trí
Nồng độ FIX
ở bệnh nhân
Polyphen2-
score
SIFT
score
1 c.88G>T p.Val30Phe Đột biến thay thế exon 1 0,9 0,844 0,21
2 c.192T>G p.Cys64Trp Đột biến thay thế exon 2 0,1 1 0
0,2
0,2
4 c.689G>T p.Gly230Val Đột biến thay thế exon 6 0,1 0,995 0
5 c.942T>A p.His314Gln Đột biến thay thế exon 8 5,7 0,778 0,1
6 c.1069G>C p.Gly357Arg Đột biến thay thế exon 8 0,1 1 0
7 c.1220G>C p.Cys407Ser Đột biến điểm exon 8 0,5 0,997 0
8 del_exon 4-6* - Mất 3 exon - 0,1 -
9 c.-21C>T - Đột biến điểm promoter 4,5 -
10 c348-349insGA pGlu116Glufs*15 Chèn đoạn exon 5 0,3 -
11 del_exon 5* - Mất exon 5 exon 5 0,4 -
12 c.874C>T p.Gln292* Đột biến dừng dịch mã exon 8 0,4 -
13 c.952delC p.Leu318Phefs*8 Mất 1 nucleotide exon 8 0,1 -
14 c.1060del A p.Ser354Valfs*14 Mất 1 nucleotide exon 8 0,3 -
15 c.1084A>T P.Lys362* Đột biến dừng dịch mã exon 8 0,1 -
16 c.1159-1161del p.Lys387del Mất 3 nucleotide exon 8 0,2 -
0Đột biến thay thế3 c.470G>T p.Cys157Phe exon 5 0,999
Bảng 3.9. Danh sách 58 đột biến phát hiện trong nghiên cứu
STT
Biến đổi
nucleotide
(HGVS
cDNA)
Biến đổi axit
amin
(HGVS protein)
Vị trí Domain Tình trạng
Số
trường
hợp
1 c.-21C>T - promoter - Mới 1
2 c.88G>T p.Val30Phe exon 1 PRO Mới 1
3 c.128G>A p.Arg43Gln exon 2 PRO
Đã công bố
[97]
3
4 c.127C>T p.Arg43Trp exon 2 PRO
Đã công bố
[97]
6
5 c.137G>T p.Arg46Met exon 2 PRO
Đã công bố
[98]
1
78
STT
Biến đổi
nucleotide
(HGVS
cDNA)
Biến đổi axit
amin
(HGVS protein)
Vị trí Domain Tình trạng
Số
trường
hợp
6 c.149G>A p.Gly50Asp exon 2 GLA
Đã công bố
[77]
3
7 c.192T>G p.Cys64Trp exon 2 GLA Mới 1
8 c.206G>A p.Cys69Tyr exon 2 GLA
Đã công bố
[99]
3
9 c.215A>G p.Glu72Gly exon 2 GLA
Đã công bố
[100]
1
10 c.223C>T p.Arg75* exon 2 GLA
Đã công bố
[97]
2
11 c.253-1G>C splice site intron 2 -
Đã công bố
[101]
1
12 c.277+4A>G - intron 3 -
Đã công bố
[98]
1
13 c.278-3A>G Splice site intron 3 -
Đã công bố
[101]
2
14 c.344A>G p.Tyr115Cys exon 4 EGF1
Đã công bố
[102]
1
15 c.349T>A p.Cys117Ser exon 4 EGF1
Đã công bố
[103]
2
16 c.382T>C p.Cys128Arg exon 4 EGF1
Đã công bố
[104]
1
17 c.383G>A p.Cys128Tyr exon 4 EGF1
Đã công bố
[98]
1
18
c348-
349insGA
pGlu116Glufs*15 exon 5 EGF1 Mới 1
19 c.422G>A p.Cys141Tyr exon 5 EGF2
Đã công bố
[105]
1
20 c.433T>C p.Cys145Arg exon 5 EGF2
Đã công bố
[106]
1
21 c.470G>T p.Cys157Phe exon 5 EGF2
Mới 2
22 del_exon 5* - exon 5 EGF2 Mới 1
23 c.520+13A>G - intron 5 -
Đã công bố
[106]
1
24 c.676C>T p.Arg226Trp exon 6 Activation
Đã công bố
[107]
2
25 c.677G>A p.Arg226Gln exon 6 Activation
Đã công bố
[108]
2
26 c.689G>T p.Gly23