Tóm tắt Luận án Thiết kế, sàng lọc một số dẫn xuất Flavonoid và đánh giá hoạt tính gây độc lên dòng tế bào Hela dựa vào các tính toán hóa lượng tử - Bùi Thị Phương Thúy

Mô hình QSDARMLR được thành lập bằng cách thay đổi độ dịch chuyển

hóa họci của oxy và cac bon.

Chọn lựa độ dịch chuyển hóa họci bằng thuật toán thêm dần và loại bỏ

dần từng trường hợp kết hợp với thuật toán di truyền (GA).

Quá trình mô hình hóa được thực hiện bằng cách theo dõi các giá trị

thống kê SE, R2adj, R2test và F-stat với mức độ tin cậy α là 0,05. Tất cả

các mô hình QSDARMLR được đánh giá bằng kỹ thuật đánh giá chéo

loại bỏ dần từng trường hợp. Các mô hình QSDARMLR tốt nhất với k =

5, 6, 7 cho ở bảng Bảng 3.14. Giá trị R2fitness và SE của các mô hình

QSDARMLR (với số biến số k từ 2 đến 9) cho ở Bảng 3.13.

Mô hình QSDARMLR tốt nhất (với k bằng 7) với các biến số i của các

nguyên tố O1, O11, C2, C3, C6, C7 và C2’ với các giá trị R2fitness là 0,9057

và sai số SE là 0.1213 QSDARMLR. Các nguyên tử này cũng đóng góp

quan trọng nhất đối với các hoạt tính kháng ung thư của các chất dẫn

xuất flavone và isoflavone.

28 trang | Chia sẻ: trungkhoi17 | Lượt xem: 652 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Thiết kế, sàng lọc một số dẫn xuất Flavonoid và đánh giá hoạt tính gây độc lên dòng tế bào Hela dựa vào các tính toán hóa lượng tử - Bùi Thị Phương Thúy, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ợc thực hiện bằng cách theo dõi các giá trị thống kê SE, R2adj, R2test và F-stat với mức độ tin cậy α là 0,05. Tất cả các mô hình QSDARMLR được đánh giá bằng kỹ thuật đánh giá chéo loại bỏ dần từng trường hợp. Các mô hình QSDARMLR tốt nhất với k = 5, 6, 7 cho ở bảng Bảng 3.14. Giá trị R2fitness và SE của các mô hình QSDARMLR (với số biến số k từ 2 đến 9) cho ở Bảng 3.13. Mô hình QSDARMLR tốt nhất (với k bằng 7) với các biến số i của các nguyên tố O1, O11, C2, C3, C6, C7 và C2’ với các giá trị R2fitness là 0,9057 và sai số SE là 0.1213 QSDARMLR. Các nguyên tử này cũng đóng góp quan trọng nhất đối với các hoạt tính kháng ung thư của các chất dẫn xuất flavone và isoflavone. 6 Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ dịch chuyển hóa học i trong các mô hình QSDARMLR Biến số xi QSDARMLR MPxk,% GMPmxi,% m = 5 m = 6 m = 7 m = 5 m = 6 m = 7 R2luyện 0,802 0,861 0,906 - - - - R2adj 0,752 0,817 0,869 - - - - SE 0,167 0,143 0,121 - - - - R2thử 0,631 0,673 0,800 - - - - Hằng số 14,459 37,055 32,99 - - - - O1 0 0,014 0,016 0,133 7,649 9,949 5,91 O11 0,004 0,008 0,006 18,599 11,386 9,501 13,162 C2 - - -0,045 - - 16,448 5,483 C3 - -0,058 -0,063 - 14,348 17,603 10,65 C4 -0,068 -0,078 - 71,64 27,471 - 33,037 C6 0,006 -0,059 -0,047 5,169 16,424 14,965 12,186 C7 -0,005 -0,075 -0,059 4,46 22,722 20,312 15,832 C2' - - -0,037 - - 11,222 3,741 Ba mô hình QSDARMLR (với k từ 5 đến 7) là các nguyên tử O1, O11, C2, C3, C4, C6, C7 và C2’ trong Bảng 3.14 được chọn để tính toán tỷ lệ phần trăm đóng góp của các nguyên từ đối với hoạt tính kháng ung thư. Các giá trị phần trăm đóng góp MPmxk,%, và GMPmxk%, cũng như các giá trị thống kê trong mô hình QSDARMLR (với k từ 5 đến 7) cũng được chỉ ra trong Bảng 3.14. Các giá trị độ dịch chuyển hóa học của cac bon à oxy trong phân tử flavone và isoflavone sắp xếp theo giá trị GMPmxk,% as C4 > C7 > O11 > C6 > C3 > O1 > C2 > C2’. Các vị trị O1, C2, C3 và C4 là các vị trí quan trọng trong khung phân tử. Bởi vì đây là các oxy và cac bon của nhóm cacbonyl C4 = O11 và O1 với cặp electron tự do. Trong trườn hợp này electron  của liên kết C2 = C3 và C4 = O11 tạo thành hệ liên hợp. Nhóm cacbonyl C4 = O11 thực hiện các phản ứng oxy hóa khử. Nghiên cứu này phù hợp với các nghiên cứu thực nghiệm. Hơn nữa, các vị trí C6, C7 và C3 cũng cho thấy rằng các vị trí quan trọng đã khảo sát và nghiên cứu bằng các nhóm thế gắn vào các nguyên tử C3, C6 và C7 để thiết kế các dẫn xuất mới. Như vậy, để thiết các các dẫn xuất mới với hoạt tính pGI50 cao bằng cách gắn các nhóm thế mới vào các vị trí C3, C6 và C7 trong phân tử flavone và isoflavone. 3.2.3.2. Mô hình mạng thần kinh QSDARANN Mô hình mạng thần kinh QSDARANN được xây dựng bằng mạng thần kinh trên phần mềm INForm đã được khảo sát kiến trúc mạng. Kiến trúc I(7)-HL(2)-O(1) bao gồm lớp nhập I(7) với yếu tố đầu vào đã được chọn là O1, O11, C2, C3, C6, C7 và C2’ là các biến số trong mô hình tuyến 7 tính QSDARMLR với k = 7 và một lớp xuất O(1) với yếu tố đầu ra (pGI50) như là biến mục tiêu, cấu trúc một lớp ẩn HL(2) với hai nút. Giải thuật lan truyền ngược, sai số 0,001 được sử dụng để luyện kiểu mạng thần kinh này. Các tham số để luyện mạng nơ ron là tốc độ học 0,7; momen = 0,7; vòng lặp 10000 và sai số MSE = 0,0305764. Hàm truyền sigmoid được sử dụng cho mỗi nơ ron của lớp nhập và lớp xuất. Sau khi luyện mô hình thần kinh QSDARANN, R2thử = 0,800; giá trị R2luyện đạt được 0,924 cao hơn giá trị R2luyện = 0,906 đối với mô hình tuyến tính QSDARMLR. 3.2.3.3. Kiểm tra khả năng dự đoán Bảng 3.15 Hoạt tính pGI50,tt của các dẫn xuất kiểm tra và các giá trị ARE,% từ các mô hình QSDARMLR (với k = 7) và QSDARANN với kiến trúc I(7)-HL(2)-O(1) Hợp chất pGI50tn pGI50,tt ARE,% QSADRMLR QSDARANN QSDARMLR QSDARANN a1 5,745 5,781 5,789 0,636 0,764 a2 5,699 5,758 5,796 1,039 1,697 a3 5,796 5,808 5,708 0,209 1,515 a4 5,921 6,181 5,957 4,389 0,606 a5 5,699 5,394 5,755 5,344 0,975 a6 5,658 5,503 5,723 2,730 1,157 MARE,% 2,391 1,119 Sau khi sử dụng các mô hình QSDARMLR và QSDARANN để dự đoán hoạt tính kháng ung thư của các dẫn xuất kiểm tra, độ lệch khoảng dự đoán là có thể chấp nhận. Các mô hình QSDARMLR và QSDARANN thỏa mãn các đòi hỏi thực tế để dự đoán hoạt tính kháng ung thư pGI50 của các dẫn xuất mới. Một lần nữa chúng tôi khẳng định khả năng dự đoán của các mô hình quan hệ cấu trúc hoạt tính là đáng tin cậy. 3.2.4. Xây dựng mô hình QSSRMLR 3.2.4.1. Nguyên tắc xây dựng 3.2.4.2. Tính toán các tham số hóa lý 3.2.4.3. Xây dựng mô hình Mô hình tuyến tính QSSRMLR cũng được nghiên cứu, phát triển từ các kỹ thuật hồi quy tuyến tính. Mô hình quan hệ cấu trúc - cấu trúc (QSSR) là mối quan hệ giữa những hợp chất (y) và các hợp chất có cấu trúc tương tự (x). Các mô hình QSSRMLR được xây dựng bằng phương pháp hồi quy tuyến tính. Kỹ thuật hồi quy đa biến tuyến tính được sử dụng để xây dựng mối quan hệ tuyến tính giữa các hợp chất có cấu trúc tương tự. Những mối quan hệ tuyến tính này được xây dựng bằng cách 8 sử dụng các bộ mô tả điện tích nguyên tử của các chất dự đoán và các chất mục tiêu. Tất cả các bộ mô tả điện tích nguyên tử bao gồm các nguyên tử tính O1, C2, C3, C4, C5, C6, C7, C8, C9, C10, O11, C1', C2', C3', C4', C5', C6'. Các mô hình tuyến tính QSSRMLR với các giá trị thống kê rất tốt R2luyện = 0,999 và R2thử = 0,999: Fla-A1 = 0,00015+1,018 (Fla-A5)-0,513 (Fla-A21)+0,497 (Fla-A22) Fla-A2 = -0,00020+1,260 (Fla-A6) + 0,871 (Fla-A14)-1,134 (Fla-A24) Fla-A3 = 0,00002+0,935 (Fla-A7) + 0,582 (Fla-A16) -0,517 (Fla-A28) isoFla-A4=-0,000002+0,980(isoFla-A8)-0,233(isoFla-A18)+0,252(isoFla- A19) Fla-A5 = -0,00015+0,982 (Fla-A1) +0,499 (Fla-A21) -0,483 (Fla-A22) Fla-A6 =0,00019+0,682 (Fla-A2)-0,587 (Fla-A14)+0,907 (Fla-A24) Fla-A7 = -0,00003+1,037 (Fla-A3)+-0,041 (Fla-A16)+0,004 (Fla-A27) isoFla-A8=0,0000051+1,006(isoFla-A4)+0,253(isoFla-A18)- 0,259(isoFla-A19) Fla-A9 = 0,000004+0,047 (Fla-A5) +1,025 (Fla-A11) -0,072 (Fla-A23) Fla-A10 = 0,00012+0,977 (Fla-A9) -1,055 (Fla-A21) +1,079 (Fla-A22) 3.2.4.4. Kiểm tra khả năng dự đoán Mô hình hồi quy tuyến tính nhận được từ các dẫn xuất flavone và isoflavone này có thể ứng dụng để dự đoán tính chất hóa lý cũng như hoạt tính kháng ung thư của các flavone và isoflavone có cấu trúc tương tự. Phân tích ANOVA một yếu tố cũng chỉ ra rằng kết quả dự đoán tính chất hóa lý và hoạt tính kháng ung thư của các dẫn xuất flavone và isoflavone từ mô hình Hình 3.6. Quan hệ giữa tính chất hóa lý dự đoán và dữ liệu thực nghiệm QSSRMLR thì không khác các giá trị tính chất hóa lý tham khảo, giá trị hoạt tính kháng ung thư xác định từ thực nghiệm với (Ftt = 0,0010 < F0,05 = 3,9423). 3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1) 3.2.5.1. Dữ liệu 3.2.5.2. Xây dựng mô hình QSARMLR (3.16) 9 Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE k Tham số mô tả phân tử 2D, 3D trong các mô hình MSE R² R²pred 2 xvc3, Dipole 0,063 0,657 0,630 3 xvp3, xvpc4, Dipole 0,034 0,820 0,798 4 xvp6, xvpc4, Dipole, LogP 0,027 0,866 0,843 5 xp8, Dipole, Volume, knotpv, LogP 0,023 0,891 0,867 6 xp8, xvp8, Dipole, knotpv, SHBa, LogP 0,019 0,914 0,890 7 xp8, xvp8, Dipole, Hmaxpos, knotpv, SHBa, LogP 0,015 0,933 0,910 8 xp6, SaaCH, k2, nvx, knotp, knotpv, SHBa, LogP 0,015 0,936 0,909 9 xp8, ABSQ, SsOH, Hmaxpos, phia, knotp, knotpv, SHBa, LogP 0,012 0,955 0,932 10 xp8, ABSQ, SsOH, Hmaxpos, nvx, phia, knotp, knotpv, SHBa, LogP 0,012 0,955 0,928 Bảng 3.19. Các giá trị thống kê và giá trị phần trăm đóng góp MPmxk,% và GMPmxk,% đối với các tham số mô tả phân tử 2D3, D trong các mô hình QSARMLR (với k là 8, 9, 10). QSARMLR MPmxi,% GMPmxi, % m = 8 M = 9 m = 10 m = 8 m = 9 m = 10 R2 0,936 0,955 0,955 R2 pred 0,909 0,932 0,928 SE 0,124 0,107 0,110 Hệ số -13,133 3,044 2,946 k2 -4,926 - - 23,638 7,879 xp6 -2,899 - - 6,399 2,133 xp8 - 4,473 4,282 14,301 12.181 8,827 nvx 3,487 - 0,036 45,229 1,138 15,456 knotp -8,350 -2,673 -2,794 9,072 7,879 7,325 8,092 knotpv 34,40 15,54 15,917 9,681 11,878 10,813 10,790 SHBa -0,225 0,019 0,016 4,398 1,004 0,770 2,057 Hmaxpos - -1,203 -1,201 3,439 3,060 2,166 SaaCH -0,166 - - 1,490 0,497 ABSQ - -5,982 -5,939 33,101 29,255 20,785 SsOH - 0,359 0,358 2,924 2,609 1,844 phia - 3,067 2,999 21,167 18,413 13,193 logP 0,050 0,839 0,793 0,093 4,308 3,624 2,675 Sự biến thiên các giá trị R2, R2pred và SE trong các mô hình QSARMLR với các tham số mô tả 2D và 3D, tương ứng chỉ ra trong Bảng 3.18. Để xây dựng các mô hình QSARMLR, các tham số mô tả 2D và 3D được chọn lựa bằng kĩ thuật hồi quy từng bước. Các tham số mô tả 2D, 3D được chọn dựa trên cơ sở các giá trị thống kê R2, SE và F-stat. Các mô hình được đánh giá chéo bằng kĩ thuật loại bỏ dần từng trường hợp (LOO) để xác định giá trị R2pred. 9 mô hình phù hợp nhất được chỉ 10 ra trong Bảng 3.18. Các giá trị phần trăm đóng góp trung bình MPmxk,%, GMPmxk, % và các giá trị thống kê khác đối với các mô hình (với k là 8, 9 và 10), được đưa ra trong Bảng 3.19. Sự xắp xếp mức độ ảnh hưởng quan trọng của các tham số 2D, 3D trong các mô hình QSARMLR theo thứ tự là GMPmxk,%: SaaCH < SsOH < SHBa < xp6 < Hmaxpos < logP < k2 < knotp < xp8 < knotpv < phia < nvx < ABSQ. Các tham số mô tả ABSQ, nvx, phia, knotpv, xp8, knotp, k2 và LogP được xem là các tham số mô tả quan trọng nhất trong mỗi phân tử. Mô hình QSARMLR (3.16) như sau: pGI50 = 3,044 + 4,473×xp8 -5,982×ABSQ + 0,359×SsOH - 1,203×Hmaxpos + 3,067×phia -2,673×knotp + 15,540×knotpv + 0,019×SHBa + 0,839×LogP (3.16) Với n = 34; R2 = 0,955; R2Adj= 0,932; R2Pred = 0,745; SE = 0,107; F = 42,182. 3.2.5.3. Xây dựng mô hình QSARANN(1) Mô hình QSARANN(1) được xây dựng bằng kỹ thuật neuro-fuzzy với thuật toán di truyền sử dụng phần mềm INForm. Mô hình mạng thần kinh nhân tạo có kiến trúc mạng I(9)-HL(5)-O(1) được xây dựng. Kiến trúc mạng này bao gồm lớp input I(9) với 9 nơ ron tương ứng với 9 biến độc lập xp8, ABSQ, SsOH, Hmaxpos, phia, knotp, knotpv, SHBa và LogP; lớp ẩn HL(5) với 5 nơ ron và lớp output O(1) với 1 nơ ron là hoạt tính sinh học pGI50. Thuật toán lan truyền ngược được ứng dụng để luyện mạng thần kinh. Hàm truyền cho mỗi nơ ron là đường tiếp tuyến Hypecbol; mỗi tham số luyện mạng khác nhau được sử dụng cho quá trình luyện mạng với tốc độ huấn luyện (moment) là 0.7 và tốc độc học là 0.01; sai số tổng cộng là 0,0003017, sai số dự đoán là 0,00001 với 300000 vòng lặp. Sau khi luyện mạng mô hình mạng thần kinh thu được có kiến trúc I(9)-HL(5)-O(1), với giá trị thống kê R2train là 0,8963 và R2pred là 0,8883. 3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1) Sau khi sử dụng các mô hình QSARMLR (3.16) và QSARANN(1) để dự đoán hoạt tính sinh học pGI50 của sáu hợp chất trong nhóm kiểm tra chỉ ra khả năng dự đoán chính xác của các mô hình QSAR với các sai số nằm trong khoảng tin cậy của phép đo thực nghiệm. Tuy nhiên, các mô hình QSARMLR (3.16) và QSARANN(1) đều có khả năng dự báo tốt đối với hoạt tính sinh học của các hợp chất mới. 11 Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.16) và QSARANN(1) Hợp chất pGI50,exp pGI50,pred ARE,% M1 M2 M1 M2 Fla-1 5,699 5,3879 5,7371 5,4589 0,6685 Fla-11 5,699 5,9188 6,0478 3,8568 6,1204 Fla-24 5,6198 5,9316 5,7662 5,5482 2,6051 Fla-25 5,6383 5,8627 5,6843 3,9799 0,8158 Fla-26 5,699 5,8841 5,7058 3,2479 0,1193 Fla-30 5,0862 4,8677 4,9365 4,2959 2,9433 MARE,% 4,3979 2,2121 3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR; QSARPCA-ANN 3.2.6.1. Dữ liệu 3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE k Tham số mô tả phân tử 2D, 3D trong các mô hình R2 R2pred SE 2 a1, a2 0,756 0,731 0,430 3 a1, a2, a3 0,774 0,732 0,417 4 a1, a2, a3, a4 0,805 0,772 0,390 5 a1, a2, a3, a4, a5 0,832 0,756 0,365 6 a1, a4, a5, a6, a7, a8 0,854 0,812 0,342 7 a1, a2, a3, a4, a5, a9, a10 0,836 0,721 0,365 8 a1, a2, a3, a4, a5, a8, a9, a10 0,837 0,693 0,367 9 a1, a2, a3, a4, a5, a8, a9, a10, a11 0,838 0,682 0,369 10 a1, a2, a3, a4, a5, a6, a8, a9, a10, a11 0,841 0,650 0,368 Đối với các mô hình QSARMLR, mức độ quan trọng của mô tả phân tử 2D và 3D được sắp xếp theo các giá trị GMPmxk,%: MaxQp > ABSQ > ka2 > MaxNeg > LogP > ka3 > SdssC > SdO > Ovality > ABSQon. Mô hình QSARMLR (3.17) với k = 6: pGI50 = 8,509 + 2,8540MaxQp + 0,0247SdO + 0,2192LogP - 3,6969Ovality + 0,2969SdssC + 0,3635ka3 (3.17) Sáu biến số MaxQp, SdO, ka3, LogP, Ovality and SdssC được chọn để xây dựng mô hình QSARPCR (3.18). pGI50 = 5,48356 + 0,38027×PC1 - 0,11868×PC2 + 0,34789×PC3 + 0,06995×PC4 + 0,21850×PC5 + 0,35057×PC6 (3.18) 12 Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxk,%, GMPmxk,% của các tham số mô tả phân tử 2D, 3D trong các mô hình QSARMLR (với k = 5, 6, 7) Biến số QSARMLR MPmxi,% GMPmxi, % m m = 5 m = 6 m = 7 m = 5 m = 6 m = 7 R2 0,832 0,854 0,836 R2adj 0,820 0,841 0,820 SE 0,365 0,342 0,365 R2pred 0,756 0,812 0,721 Hệ số 3,883 8,509 4,790 ABSQ -0,222 - -0,257 27,945 18,636 19,005 21,862 ABSQon - - 0,0143 - - 0,433 0,144 MaxQp 3,416 2,8540 3,588 24,043 25,862 25,908 25,271 MaxNeg - - 6,122 - 24,203 23,890 16,031 SdO 0,0125 0,0247 0,0126 6,192 3,792 3,665 4,550 ka2 0,133 - 0,143 27,484 17,617 17,426 20,842 LogP 0,156 0,2192 0,163 15,651 9,829 9,672 11,717 Ovality - -3,6969 - 5,292 4,393 2,315 4,000 SdssC - 0,2969 - 4,382 5,613 7,236 5,744 ka3 - 0,3635 - 5,351 9,324 3,473 6,049 3.2.6.3. Xây dựng mô hình QSARPCA-ANN Mô hình QSARPCA-ANN được xây dựng bằng kỹ thuật neurofuzzy với thuật toán di truyền bằng chương trình INForm. Kiến trúc mạng nơ-ron nhân tạo I(6) -HL(9) - O(1) đã được xây dựng. Mô hình QSARPCA-ANN bao gồm lớp đầu vào I(6) với 6 nơ ron là các biến độc lập PC1, PC2, PC3, PC4, PC5 và PC6 tương ứng với các tham số MaxQp, SdO, ka3, LogP, Ovality và SdssC; lớp ẩn HL(9) với 9 nơ ron thần kinh và lớp đầu ra O (1) với 1 nơ ron là hoạt tính sinh học pGI50. Thuật toán lan truyền ngược được sử dụng để luyện mạng nơ ron. Hàm truyền trên mỗi nơ ron được sử dụng là hàm truyền sigmoid; các thông số khác được sử dụng để huấn luyện mạng thần kinh này bao gồm tỷ lệ luyện là 0,7 và tốc độ học 0,7; sai số MSE = 0,003447 với số vòng lặp là 5000. Sau khi luyện mạng nơ ron I(6) - HL(9)- O(1), giá trị R2 là 0,897298 và R2pred là 0,88718. 3.2.6.4. Khả năng dự đoán của các mô hình Các hoạt tính dự báo từ các mô hình QSAR được so sánh với các hoạt tính thực nghiệm và so sánh với nhau bằng cách sử dụng giá trị trung bình sai số tương đối MARE%. Các giá trị MARE,% cho thấy rằng khả 13 năng dự báo của mô hình QSARMLR (3.17) thấp hơn cả hai mô hình QSARPCR và QSARPCA-ANN, như trong Bảng 3.23. Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.17) (M1), QSARPCR (M2) và QSARPCA-ANN (M3) Hợp chất pGI50,exp pGI50,pred ARE,% M1 M2 M3 M1 M2 M3 Flav-8 5,921 5,234 5,526 5,471 3,214 8,979 7,890 Flav-22 5,745 5,485 5,699 5,556 3,755 0,001 2,513 Flav-32 6,097 5,423 5,697 5,351 5,567 10,895 4,161 Flav-74 5,699 5,815 5,895 5,736 1,964 3,362 0,585 Flav-80 5,699 6,034 6,288 6,086 0,773 3,399 0,083 MARE,% 3,055 5,327 3,045 Do giá trị MARE,% mô hình QSARPCR (3.18) là cao nhất. Sau khi sử dụng các mô hình QSARMLR (3.17), QSARPCR(3.18) và QSARPCA-ANN để dự đoán các hoạt tính sinh học pGI50 của sáu hợp chất trong nhóm thử nghiệm khả năng dự đoán chính xác của một mô hình QSAR được thể hiện bởi các sai số có thể chấp nhận được trong khoảng tin cậy của phép đo thực nghiệm. Do đó, các mô hình QSARMLR (3.17), QSARPCR (3.18) và QSARPCA-ANN có khả năng dự đoán tính sinh học của các chất mới. 3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN(2) 3.2.7.1. Dữ liệu 3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20) Bảng 3.24 Các mô hình QSARMLR với các giá trị R2 , SE và R2pred tương ứng k Điện tích nguyên tử trong các mô hình R2 SE R2pred 2 O1, C7 0,816 0,139 0,765 3 O1, C4, C6 0,86 0,124 0,8 4 O1, C2, C4, C5 0,901 0,107 0,829 5 O1, C2, C4, C5, C3’ 0,924 0,096 0,873 6 O1, O11, C3, C4, C6, C7, 0,938 0,089 0,903 7 O11, C4, C6, C8, C9, C2’, C6’ 0,959 0,074 0,879 8 O11, C3, C6, C7, C8, C9, C10, C3’ 0,97 0,065 0,696 9 O1, O11, C3, C4, C6, C7, C8, C9, C10 0,978 0,057 0,563 10 O1, O11, C3, C6, C7, C8, C9, C2’, C3’, C6’ 0,978 0,059 0,358 Mô hình QSARMLR (3.19) với k = 6 với giá trị R2 là 0,938 và giá trị R2pred cao nhất là 0,903. pGI50 = 6,7116 − 42,3105 O1 − 8,1592O11 + 3,0139 C3 −19,0370 C4 + 6,6117 C6 + 4,6038C7 14 Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxk,%, GMPmxk,% của điện tích nguyên tử trong các mô hình QSARMLR Biến QSARMLR MPmxi GMPmxi m = 5 m = 6 m = 7 m = 5 m = 6 m = 7 R2 0,924 0,938 0,959 R2adj 0,905 0,919 0,943 SE 0,096 0,089 0,074 R2pred 0,873 0,903 0,879 Hằng số −0,933 6,712 4,714 O1 −101,208 −42,311 − 57,602 24,629 − 27,410 O11 − −8,159 −32,8026 − 18,632 21,462 13,365 C2 −15,426 − − 13,418 − − 4,473 C3 − 3,014 − − 4,216 − 1,405 C4 −6,874 −19,037 −60,070 15,121 42,447 38,387 31,985 C5 − − − − C6 − 6,612 20,877 − 6,572 5,779 4,117 C7 − 4,604 − − 3,505 − 1,168 C8 − − 16,902 − − 5,696 1,899 C9 − − 95,421 − − 22,597 7,532 C2' − − −24,472 − − 2,497 0,832 C3' −16,117 − − 11,801 − − 3,934 C6' − − −25,422 − − 3,582 1,194 Đối với 3 mô hình QSARMLR với k = 5 – 7 biến số, vị trí các nguyên tử quan trọng sắp xếp theo các giá trị GMPmxk,%: C4 > O1 > O11 > C9 > C2 > C6 > C3. Các nguyên tử C4, O1, O11 là các các vị trí quan trọng nhất trong các phân tử, Bảng 3.25. 3.2.7.3. Xây dựng mô hình QSARANN(2) Kiến trúc mạng nơ ron nhân tạo bao gồm ba lớp I(6)-HL(4)-O(1); Lớp đầu vào I(6) bao gồm sáu nơ ron là các tham số O1, O11, C3, C4, C6 và C7; Nơ ron lớp đầu ra O(1) là hoạt tính sinh học pGI50; Lớp ẩn HL(4) bao gồm bốn nơ ron. Mạng thần kinh đa lớp sử dụng thuật toán lan truyền ngược để luyện mạng. Hàm truyền sigmoid trên mỗi nút của mạng; Các thông số mạng thần kinh bao gồm tỷ lệ luyện 0,7 và tốc độ học 0,7; sai số MSE = 0,000816 với 10,000 vòng lặp. Sau khi luyện mạng thần kinh, giá trị R2 là 0,993 và R2pred là 0,971 trong khi đối với mô hình QSARMLR (3.19), giá trị R2 là 0,938 và R2pred là 0,903. 3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới Khả năng dự báo của mô hình QSARMLR (3.19), thấp hơn các mô hình QSARPLS và QSARANN (2) tương ứng như trong Bảng 3.26. Mô hình 15 QSARANN (2) có sai số với giá trị MARE % là 1,161 nhỏ hơn MARE,% của cả hai mô hình QSARMLR (3.19) và QSARPLS. Vì vậy, khả năng dự báo của mô hình QSARANN (2) tốt hơn so với mô hình QSARMLR (3.19) và QSARPLS. Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19) (M1), QSARPLS (M2) và QSARANN(2) (M3) Hợp chất pGI50,exp pGI50,pred ARE,% M1 M2 M3 M1 M2 M3 Fla 2 5,921 6,008 5,801 5,851 1,472 2,020 1,180 Fla 9 5,745 5,692 5,608 5,741 0,925 2,376 0,070 Fla 12 6,097 5,759 5,842 5,814 5,548 4,188 4,646 Fla 15 5,699 5,651 5,652 5,712 0,840 0,828 0,236 Fla 16 5,699 5,651 5,655 5,719 0,835 0,775 0,347 Isofla 32 5,137 5,092 5,083 5,112 0,877 1,046 0,490 MARE,% 1,749 1,872 1,161 Sau khi sử dụng các mô hình QSARMLR (3.19), QSARPLS, QSARANN(2) để dự đoán các hoạt tính sinh học pGI50 của 6 hợp chất trong nhóm thử nghiệm, sai số của dự đoán nằm trong khoảng sai số cho phép của các phép đo thực nghiệm. Do đó, các mô hình QSARMLR (3.19), QSARPLS và QSARANN(2) thích hợp để dự đoán các hoạt tính sinh học của các chất mới. 3.3. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN 3.3.1. Phân lập cynaroside từ actiso Cynaroside phân lập từ lá actiso, cấu trúc cynaroside xác định bằng phương pháp phổ NMR, Hình 3.8. Hình 3.8 Cấu trúc phân tử cynaroside, C12H20O11 3.3.2. Phân lập quercetin từ xa kê Quercetin phân lập từ lá xa kê, cấu trúc quercetin xác định bằng phương pháp phổ NMR, Hình 3.9. 16 Hình 3.9 Cấu trúc phân tử quercetin, C15H10O7 3.3.3. Phân lập luteolin từ tía tô Luteolin phân lập từ lá tía tô, cấu trúc luteolin xác định bằng phương pháp phổ NMR, Hình 3.10. Hình 3.10 Cấu trúc luteolin, C15H10O6 3.3.4. Phân lập daidzin từ đậu nành 3.3.4.1. Xác định cấu trúc daidzin bằng phương pháp NMR Daidzin phân lập từ hạt đậu nành, cấu trúc daidzin xác định bằng phương pháp phổ NMR, Hình 3.11. Hình 3.11 Cấu trúc phân tử của daidzin, C21H20O9 3.3.4.2. Xác định cấu trúc phân tử daidzin bằng phương pháp đo nhiễu xạ tia X Daidzin phân lập từ hạt đậu nành, cấu trúc daidzin xác định bằng phương pháp đo nhiễu xạ tia X đơn tinh thể, Hình 3.12. 17 Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 50% 3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió 3.3.5.1. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp NMR Kaempferol-3-O-methylether phân lập từ củ gừng gió, cấu trúc kaempferol-3-O-methylether xác định bằng phương pháp phổ NMR, Hình 3.13. Hình 3.13 Cấu trúc phân tử của kaempferol-3-O-methylether, C16H12O6 3.3.5.2. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp đo nhiễu xạ tia X Kaempferol-3-O-methylether phân lập từ củ gừng gió, cấu trúc kaempferol-3-O-methylether xác định bằng phương pháp đo nhiễu xạ tia X đơn tinh thể, Hình 3.14. 18 Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 50% 3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L- rhamnopyranoside) từ gừng gió Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12) Kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) phân lập từ củ gừng gió, cấu trúc kaempferol-3-O-(2,4-O-diacetyl-alpha-L- rhamnopyranoside) xác định bằng phương pháp phổ NMR, Hình 3.13. 3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid chiết xuất Các hợp chất chiết xuất với GML1 là daidzin, POL1 là luteolin, CSL1 là cynaroside, AIL1 là quercetin, ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4-O-diacetyl-alpha-l-rhamnopyranoside) 19 phân lập từ actiso, xa kê, đậu nành, tía tô và gừng gió được thử nghiệm in vitro hoạt tính kháng ung thư Hela trên tế bào Hela, kết quả cho ở Bảng 3.28. Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát từ thực nghiệm in vitro Flavonoid GI50 (µg/ml) GI50 (µM) pGI50 Lần 1 Lần 2 Lần 3 TB ± ĐLC TB TB CSL1 4,41 4,79 4,96 4,72 ± 0,280 10,533 4,977 AIL1 4,36 4,38 3,81 4,18 ± 0,327 13,839 4,859 POL1 4,75 5,38 4,95 5,03 ± 0,321 17,584 4,755 GML1 8,09 7,87 7,70 7,88 ± 0,195 18,937 4,723 ZZL1 15,05 15,24 15,82 15,37 ± 0,401 51,223 4,291 ZZL2 39,65 38,03 38,90 38,86 ± 0,814 75,292 4,123 3.4. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH TỪ CÁC FLAVONOID TỰ NHIÊN 3.4.1. Mô hình QESAR Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự đoán từ mô hình QESARMLR và QESARANN Hợp chất Nhóm thế pGI50,tt vị trí C6 vị trí C3' QESARMLR QESARANN fla-1a [103] -H -H 5,954 5,709 fla-1c -OCH2CONHCH3 -OH 5,928 5,795 fla-2c -OCH2CONHCH3 -H 5,954 5,814 fla-3c -OCH2(CH3)C=NOH -OH 5,974 5,816 fla-4c -OH -OCH2CONHCH3 6,128 5,873 fla-5c -OH -OCH2CH3C=NOH 6,172 5,886 isofla-6b [103] -H -H 5,092 5,011 isofla-7c -OCH2CONHCH3 -OH 5,328 5,308 isofla-8c -OCH2CONHCH3 -H 5,367 5,341 isofla-9c -OCH2(CH3)C=NOH -OH 5,369 5,350 isofla-10c -OH -OCH2CONHCH3 5,502 5,452 isofla-11c -OH -OCH2CH3C=NOH 5,543 5,486 ZZL1 (*) -H -H 4,291(*) 4,291(*) Flav-11(n) -OCH2CONHCH3 -OH 4,345 4,387 Flav-12(n) -OCH2CONHCH3 -OH 4,789 4,715 Flav-13(n) -OCH2(CH3)C=NOH -OH 4,963 4,960 Flav-14(n) -OH -OCH2CONHCH3 5,528 5,512 Flav-15(n) -OH -OCH2CH3C=NOH 5,530 5,513 20 ZZL2 (*) -H -H 4,123 (*) 4,123(*) Flav-16(n) -OCH2CONHCH3 -OH 4,139 4,159 Flav-17(n) -OCH2CONHCH3 -OH 4,398 4,414 Flav-18(n) -OCH2(CH3)C=NOH -OH 4,615 4,870 Flav-19(n) -OH -OCH2CONHCH3 4,980 5,103 Flav-20(n) -OH -OCH2CH3C=NOH 5,100 5,231 20 dẫn xuất mới được thiết kế từ vị trí C3’, C6 còn trống của flavone 1a, flavone 6b, và ZZL1, ZZL2 from Zingiber zerumbet L,. Các hoạt tính kháng ung thư dự đoán pGI50 của các dẫn xuất mới cao hơn hợp chất mẫu. Các mô hình QESARMLR và QESARANN đã phát triển là tin cậy và có thể ứng dụng để dự đoán hoạt tính kháng ung thư pGI50. 3.4.2. Mô Hình QSDAR 18 dẫn xuất mới được thiết kế từ vị trí C3, C6 và C7 còn trống của flavone 22 và isoflavone 26. Các hoạt tính kháng ung thư dự đoán pGI50 của các dẫn xuất mới cao hơn flavone 22 và isoflavone 26, tương ứng. Các mô hình QSDARMLR và QSDARANN đã phát triển là tin

Các file đính kèm theo tài liệu này:

tom_tat_luan_an_thiet_ke_sang_loc_mot_so_dan_xuat_flavonoid.pdf