MỤC LỤC
A – MỞ ĐẦU
LỜI MỞ ĐẦU . 1
B –TỔNG QUAN
Chương 1: TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA
CẤU TRÚC VÀ HOẠT TÍNH . 3
1.1. HOẠT TÍNH . . . 4
1.1.1. Hoạt tính sinh học. . 4
1.1.2. Hoạt tính hóa học . . . . 4
1.2. CÁC THAM SỐ CẤU TRÚC . . 5
1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR. 5
Chương 2: CƠ HỌC LƯỢNG TỬ, LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ. 9
2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG
BORN-OPPENHEIMER . . 9
2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM . 11
2.2.1. Giới thiệu . . . 11
2.2.2. Phương pháp PM3 . . . 13
Chương 3: PHƯƠNG PHÁP XỬ LÝ SỐ LIỆU . . 16
3.1. PHƯƠNG PHÁP HỒI QUI ĐA BIẾN TUYẾN TÍNH. . 16
3.1.1. Tương quan và hồi qui . . 16
3.1.2. Phân tích hồi qui đa biến tuyến tính . 20
3.1.2.1. Các thủ tục chọn biến . . . 20
3.1.2.1. Đánh giá mô hình . . . 21
3.2. PHƯƠNG PHÁP MẠNG NƠRONNHÂN TẠO . . 22
3.2.1. Nơron sinh học và nơron nhân tạo. 25
.2.2.1. Nơron sinh học . . 23
3.2.2.2. Nơron nhân tạo . . 24
3.2.2. Cấu trúc mạng nơron đa lớp . . 25
3.2.3. Luyện mạng: Kỹ thuật lan truyền ngược . 26
3.2.4. Ngừng tiến trình luyện . . 27
3.2.5. Các yếu tố ảnh hưởng đến tính tổng quát hóa của mạng . . 28
Chương 4: CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE . 30
4.1. BỆNH DOMUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔIMUỖI. 30
4.2. N-ACYLPIPERIDINE –CHẤT ĐUỔI MUỖI MỚI. 33
C –PHƯƠNG PHÁP
Chương 5: PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN. 37
5.1. PHẦN MỀM . . . 37
5.1.1. Hyperchem 8.03. . . 37
5.1.2. Stagraphics Centurion XV . . . 37
5.1.3. NeuroSolution 5.07 . . . 37
5.1.4. Microsoft Excel . . . 37
5.2. CÁC BƯỚC THỰC HIỆN. . 37
5.2.1. Tính toán hóa lượng tử . . 38
5.2.2. Phân tích hồi qui đa biến tuyến tính . 38
5.2.3. Tính toán mạng nơron . . 39
D –KẾT QUẢ VÀ BÀN LUẬN
Chương 6: KHẢO SÁT MỐI QUAN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH
CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE . 42
6.1. DỮ LIỆU . . . . 42
6.2. KẾT QUẢVÀ BÀN LUẬN . . 44
6.2.1. Phương pháp hồi qui đa biến tuyến tính. 44
6.2.1.1. Tính toán với hoạt tính PT 25 . . 45
6.2.1.2. Tính toán với hoạt tính PT 2.5 . . 47
6.2.2. Phương pháp mạng nơron . . 48
6.3. ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU TRÚC LÊN
HOẠT TÍNH . . . 55
E –KẾT LUẬN
KẾT LUẬN . . . 60
TÀI LIỆU THAM KHẢO
PHỤ LỤC
79 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2216 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất N-Acylpiperidine, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
người ta có thể ước tính hay dự đoán giá trị của y từ một giá trị của x. Đường biểu diễn
biểu thức toán học ấy được gọi là đường hồi qui của y theo x.
i
k
j
ijjiikkiii xxxxy
1
022110 ... (3.2)
i thường được gọi là sai số, là chênh lệch giữa giá trị quan sát được yk và
trung bình của tập con các giá trị của biến y tại điểm xk.
i được xem là biến ngẫu nhiên, độc lập có phân phối chuẩn, có trung bình
bằng 0 và phương sai là 2 .
Các hệ số trong phương trình được ước lượng theo nguyên tắc bình phương tối
thiểu nghĩa là làm sao cho tổng bình phương các phần dư dưới đây là nhỏ nhất.
N
i
k
j
ijji xy
1
2
1
0 (3.3)
Khi thu được các dữ liệu cần thiết (yi, xji) trong đó số bộ dữ liệu N ít nhất phải
lớn hơn số biến độc lập k thì người ta có thể xác định được các hệ số hồi qui theo
chuẩn bình phương cực tiểu như sau:
)min()min(
1
2
2
1
eyyMin
N
i
i
N
i
tính
ii
(3.4)
Điều kiện này đạt được khi đạo hàm của i2 theo các hệ số i triệt tiêu.
Chương 3
19
,0
i
e
với i = 1, 2,..., N. (3.5)
Ta giả thiết rằng hàm f phụ thuộc tuyến tính vào bộ kxxx ,...,, 21 như vậy ta chỉ
cần tìm kiếm các hệ số phù hợp. Trong khảo sát QSAR, biến yi là hoạt tính hoá chất,
biến xi là các tham số hoá lí.
Giá trị thống kê đặc trưng cho mô hình hồi qui là hệ số xác định (coefficient of
determination) hay hệ số R2.
Một số mô hình hồi qui đa biến tuyến tính
Mô hình MLR có dạng tổng quát như sau:
Dạng lý thuyết:
kk xxx ...22110 (3.6)
Dạng ước tính
exbxbxbby kk ...22110 (3.7)
Dạng ước tính với N trường hợp quan sát:
ikikiii exbxbxbby ...22110 (3.8)
Dạng ước tính bằng phương pháp bình phương cực tiểu:
kikiii xbxbxbby ...ˆ 22110 (3.9)
Trong đó: iyˆ là giá trị dự đoán của y.
ix là biến độc lập.
ib là các hệ số hồi qui.
Mô hình MLR có thể xuất hiện dưới một số dạng đặc biệt như sau:
Dạng tương tác: giả sử hai biến x1 và x2 có hệ tương tác thì mô hình MLR có
thể được viết:
21222110ˆ xxbxbxbbyi (3.10)
Dạng đa thức: mô hình hồi qui dạng đa thức bậc k có thể biểu diễn dưới dạng
Chương 3
20
tổng quát sau:
k
k xbxbxbby ...ˆ
2
210 (3.11)
3.1.2 Phân tích hồi qui đa biến tuyến tính
Các mô hình hồi qui đa biến tuyến tính có thể được thiết lập một cách tự động
bởi các chương trình phân tích thống kê như SPSS, SAS, BMDP, MINITAB,
Stagraphics-Plus, Microsoft EXEL, Stagraphics Centurion XV….
3.1.2.1 Các thủ tục chọn biến
Nhiều mô hình hồi qui có thể được xây dựng từ cùng một tập biến. Muốn sàn
lọc các biến độc lập xi có liên quan tuyến tính với biến phụ thuộc trong một nhóm dữ
liệu có N trường hợp quan sát, người ta có thể dùng nhiều phương pháp. Ba thủ tục
phổ biến mà ta sẽ nghiên cứu là: đưa dần vào (forward selection), loại trừ dần
(backward elimination), và hồi qui từng bước. Sau đây là các thủ tục chọn biến được
thực hiện trong phần mềm Stagraphics Centurion XV.
Phương pháp đưa dần vào: biến đầu tiên được xem xét để đưa vào phương
trình là biến có tương quan thuận hay nghịch lớn nhất với biến phụ thuộc. Có 2 tiêu
chuẩn để đưa biến vào:
F-to-enter: là giá trị nhỏ nhất của thống kê F mà một biến phải đạt được
để được đưa vào.
F-to-remove: là giá trị F tối thiểu mà thống kê F của biến độc lập đó
phải đạt được để ở lại trong phương trình.
Phương pháp loại trừ dần: khởi đầu với tất cả các biến đều ở trong phương
trình, sau đó loại trừ dần bằng tiêu chuẩn loại trừ. Có hai tiêu chuẩn loại trừ:
F-to-enter: là giá trị nhỏ nhất của thống kê F mà một biến phải đạt được
để được đưa vào.
F-to-remove: là giá trị F tối thiểu mà thống kê F của biến độc lập đó
phải đạt được để ở lại trong phương trình.
Phương pháp chọn từng bước: là sự kết hợp của thủ tục đưa dần vào và thủ
tục loại trừ dần, đây là phương pháp phổ biến nhất. Biến thứ nhất được chọn giống
Chương 3
21
như cách chọn dần từng bước. Sau khi biến thứ nhất được đưa vào, thủ tục chọn từng
bước khác với đưa dần vào ở chỗ biến thứ nhất được xem xét xem có nên loại bỏ nó ra
khỏi phương trình căn cứ theo tiêu chuẩn ra giống như thủ tục loại trừ dần. Các bước
như thế được tiếp tục cho đến khi không còn biến nào thỏa điều kiện ra nữa.
3.1.2.2 Đánh giá mô hình
Để đánh giá mức độ phù hợp của mô hình với bộ dữ liệu thực nghiệm, người ta
dùng các đại lượng sau:
Hệ số xác định (R2): bình phương hệ số tương quan giữa các giá trị yitính tính
theo mô hình hồi qui và các giá trị yi thực nghiệm.
N
i
i
N
i
tính
ii
yy
yy
R
1
2
1
2
2
)(
)(
1 (3.12)
Trong đó: y là giá trị trung bình của các giá trị iy .
Ý nghĩa: R2 cho biết sự phù hợp của mô hình với bộ dữ liệu thực nghiệm.
Nếu giá trị R2 càng gần 1 thì mô hình mô tả tốt các số liệu thực nghiệm, các giá trị yitính
tính toán rất gần các giá trị yi thực nghiệm.
Hệ số 2R hiệu chỉnh ( 2aR ): được sử dụng để phản ánh sát hơn mức độ phù
hợp của mô hình MLR. 2aR không nhất thiết phải tăng lên khi nhiều biến được thêm
vào phương trình.
1
)1( 222
kN
RkRRa (3.13)
Tính tổng quát của mô hình (Q2): Việc xác định tính tổng quát dựa trên
phương pháp tham chiếu chéo (cross validation). Phương pháp này được thực hiện
gồm các bước sau:
Chia ngẫu nhiên tập dữ liệu thành k tập con phân biệt.
Lặp lại k lần, mỗi lần chừa ra một tập con để kiểm tra, phần còn lại để
luyện
Chương 3
22
Tính giá trị Q2 :
N
i
i
N
i
tính
ii
yy
yy
Q
1
2
1
2
2
)(
)(
1 (3.14)
Giá trị Q2 càng gần 1 thì khả năng đoán nhận càng chính xác hay nói cách khác
mô hình có khả năng tổng quát hóa.
Khả năng dự đoán ngoại của mô hình: phương pháp này được thực hiện
như sau: chia bộ dữ liệu thành 2 nhóm nhỏ, dùng một nhóm luyện (training set) có N
trường hợp để thiết lập mô hình hồi qui và sau đó dùng mô hình ấy để dự đoán tác
dụng của một nhóm thử (test set) có M trường hợp.
Nếu mô hình tìm được có sự tuyến tính cao giữa các biến phụ thuộc và các biến
độc lập thì phương pháp phân tích MLR có ưu điểm sau:
Những mối quan hệ dữ liệu quan sát được mô tả rõ ràng.
Là phương pháp đơn giản cho việc đoán nhận mẫu mới.
Tuy nhiên phương pháp này sẽ không phù hợp trong những trường hợp mà giữa
các biến độc lập có liên hệ chặt chẽ với nhau hoặc số biến lớn hơn số mẫu quan sát.
Nếu mô hình không tuyến tính với các biến độc lập, khi đó ta có mô hình hồi
qui phi tuyến.
3.2 PHƯƠNG PHÁP MẠNG NƠRON NHÂN TẠO (Artificial
Neural Network) 2, 8, 19, 22
Trong thực tế, mối quan hệ giữa biến phụ thuộc và các biến độc lập thường là
không tuyến tính, chẳng những như thế mà có đôi lúc mối quan hệ này rất phức tạp.
Việc áp dụng phương pháp phân tích hồi qui đa biến phi tuyến hay phi tham số vào
việc khảo sát QSAR để mô tả được các quan hệ này là điều khó khăn và hết sức cần
thiết. Một trong những phương pháp xử lý số liệu mới được ứng dụng mạnh trong
khảo sát QSAR là mạng nơron nhân tạo (ANN).
Lý thuyết ANN được hai nhà bác học người Mỹ là McCulloch và Pitts đề xuất
Chương 3
23
vào năm 1943, đến khoảng giữa thập niên 80 của thế kỷ XX thì nó bắt đầu thật sự
được tìm hiểu và ứng dụng mạnh vào rất nhiều lĩnh vực khoa học – kỹ thuật khác nhau
trong đó có hoá học. Dựa trên cơ sở hệ thần kinh của sinh vật, hai nhà bác học người
Mỹ đã mô phỏng lại và xây dựng ANN tạo nhằm mô phỏng các mối quan hệ phức tạp
giữa biến phụ thuộc và biến độc lập.
ANN gồm những nơron là những đơn vị xử lý nhị phân mà cấu trúc và cách xử
lý của nó được mô phỏng và đơn giản hóa từ cấu trúc và quá trình tiếp nhận – xử lý
thông tin phức tạp của bộ não con người.
Để có khái niệm tổng quát về mạng nơron, phần này sẽ giới thiệu sơ lược về
cấu tạo và hoạt động của nơron sinh học, các thành phần cơ bản của nơron nhân tạo,
cách truyền thông tin, mạng lan truyền đa lớp và trạng thái hoạt động của mạng.
3.2.1 Nơron sinh học và nơron nhân tạo
3.2.1.1 Nơron sinh học
Hình 3 Cấu tạo một nơron sinh học
Hệ thần kinh con người bao gồm khoảng 1010 tế bào thần kinh hay còn gọi là
nơron. Một nơron sinh học tiêu biểu gồm một thân tế bào (soma hay cell body) với
một nhân (nucleus) bên trong. Thân tế bào bao gồm nhiều sợi nhánh (dendrites) và sợi
trục (axon). Có dạng như hình trên.
Những sợi nhánh có nhiệm vụ nhận tín hiệu được tích lũy, sợi trục tiếp nhận tín
hiệu và truyền sang một nơron khác ở vị trí khớp nối (synapse).
Chương 3
24
Nhưng không phải lúc nào tín hiệu đưa vào cũng được truyền đi và truyền
nguyên vẹn mà chỉ khi tín hiệu đó đạt đến một giới hạn nào đó và khi truyền qua
synapse nó được biến đổi tùy thuộc vào lực synapse.
Một tín hiệu có cường độ xi khi qua synapse I sẽ có cường độ là si ứng với lực
synapse wi:
si = xi . wi (3.15)
3.2.1.2 Nơron nhân tạo
Cấu tạo của một nơron nhân tạo đơn (được mô tả bởi hình sau:
Hình 4 Cấu tạo một nơron nhân tạo
Đầu vào của một nơron gồm các dữ liệu nhập hoặc từ đầu ra của các nơron
khác. Người ta thường tổ hợp đầu vào bằng cách tính tổng trọng số dữ liệu nhập pi:
n
i
ii pwI
1
(3.16)
Với wi là trọng số đặc trưng cho liên kết giữa nơi truyền dữ liệu (tín hiệu) đến
và nơi nhận dữ liệu (tín hiệu). Giá trị đầu ra được tạo bằng cách dùng các hàm truyền
(transfer function) f trên I: V = f(I)
Trong ANN thường dùng các hàm truyền sau:
p2
pn
V = f(I)
w1
w2
wn
.
.
.
n
i
ii pwI
1
p1
Chương 3
25
3.2.2 Cấu trúc mạng nơron đa lớp
Một mạng lan truyền tổng quát là mạng có n (n > 2) lớp: lớp thứ nhất gọi là lớp
nhập (input layer), lớp thứ n gọi là lớp xuất (output layer), và (n – 2) lớp ẩn (hidden
layer). Số nút của lớp nhập và lớp xuất do bài toán qui định, còn số nút của lớp ẩn do
người thiết kế mạng quyết định. Trong mạng lan truyền tiến, mỗi nút của lớp thứ i (0 <
i < n) liên kết với mọi nút ở lớp thứ (i +1), và các nút trong cùng lớp không liên kết với
nhau. Lớp nhập nhận dữ liệu vào và truyền lại cho tất cả các nơron cho lớp ẩn thứ
nhất. Các nơron trong lớp ẩn thứ nhất tổ hợp các giá trị đầu vào và tạo lại đầu ra rồi
truyền đi cho tất cả các nơron ẩn lớp kế tiếp… Lớp cuối cùng, lớp xuất, là lớp cho kết
quả thật (giá trị biến phụ thuộc).
Hình 5 Sơ đồ cấu tạo mạng nơron nhân tạo có 3 lớp
p1
p2
Pn
a1
an
wji
wkj
wlk
Dữ liệu nhập
Lớp xuất Lớp nhập
Dữ liệu ra
.
.
. . .
.
.
.
.
Lớp ẩn
Tanh
xx
xx
ee
eexf
)(
-
1
0
1
0
1
Logistic (sigmoid)
x
x
e
exf
1
)(
Threshold
0 if x< 0
f(x) =
1 if x >= 1
Chương 3
26
Mạng lan truyền chỉ có thể ở một trong hai trạng thái: trạng thái ánh xạ và trạng
thái học.
Ở trạng thái ánh xạ, thông tin lan truyền từ lớp nhập đến lớp xuất và mạng
thực hiện ánh xạ để tính được các biến phụ thuộc như sau: trước tiên, các nơron nhập
nhận các giá trị biến độc lập được đưa vào, mỗi nơron nhập chuyển giá trị nó nhận
được cho tất cả các nơron ẩn của lớp ẩn kế cận. Mỗi nơron ẩn tính tổng trọng hóa của
tất cả các dữ liệu nhập. Sau đó một hàm truyền được áp dụng lên tổng trọng để nén
chúng vào một miền giới hạn của hàm truyền (tùy mỗi loại hàm truyền mà ta sử dụng
sẽ có miền giới hạn khác nhau). Mỗi nơron ẩn này lại chuyển kết quả của mình đến
các nơ ron ở lớp kế tiếp… cho đến các nơron lớp xuất. Mỗi nút xuất thực hiện các thao
tác tương tự như đã thực hiện trong nút ẩn để cho ra giá trị kết xuất của nút xuất – là
giá trị của các biến phụ thuộc cần xác định.
Trạng thái học: bản chất ánh xạ do mạng thực hiện tùy thuộc vào giá trị các
trọng số trong mạng. Lan truyền ngược là một phương pháp cho phép xác định tập
trọng tốt nhất của mạng để giải một bài toán được cho. Việc áp dụng phương pháp lan
truyền ngược là một quá trình lặp đi lặp lại nhiều lần hai tiến trình chính: ánh xạ và lan
truyền ngược sai số. Hai tiến trình này được áp dụng trên một tập mẫu xác định. Ta gọi
chung tiến trình này là học hay luyện mạng.
Một lợi ích của mạng lan truyền là có thể xây dựng mô hình nhiều kết xuất. Có
thể nó đòi hỏi ít công việc hơn và ít tính toán máy hơn. Ngoài ra một mô hình duy nhất
sẽ có tính nhất quán mà những mô hình phát triển riêng biệt không thể có.
3.2.3 Luyện mạng: Kỹ thuật lan truyền ngược
Quá trình luyện mạng được bắt đầu với các giá trị trọng số tùy ý, và tiến hành
lặp đi lặp lại. Mỗi lần lặp được gọi là một thế hệ (epoch). Trong mỗi thế hệ, mạng hiệu
chỉnh các trọng số sao cho sai số (độ lệch giữa các kết xuất và giá trị đích) giảm dần.
Tiến trình điều chỉnh nhiều lần giúp cho trọng dần dần đạt được tập giá trị tối ưu.
Để cập nhật trọng số trong mỗi thế hệ luyện, mạng phải xử lý tất cả các mẫu
trong tập mẫu. Đầu tiên mạng thực hiện phép toán lan truyền tiến, nghĩa là mạng thực
hiện ánh xạ các biến nhập của mẫu hiện hành thành các giá trị xuất. Sau đó, xác xuất
được tính dựa trên sai số của kết xuất và giá trị đích. Trên cơ sở sai số tính toán, mạng
Chương 3
27
sẽ cập nhật lại bộ trọng số theo nguyên tắc lan truyền ngược sai số - gọi là giai đoạn
lan truyền ngược (back propagation).
Kỹ thuật cơ bản trong lan truyền ngược là cập nhật bộ trọng số theo hướng
giảm gradient. Ví dụ khi áp dụng trong QSAR, trước hết mạng tính các kết xuất hoạt
tính ai theo các dữ liệu nhập (các thông số cấu trúc) từ các trọng số đã khởi tạo ban
đầu. Sau đó tính gradient ig .
Cuối cùng chỉnh sửa các trọng số wi+1 cho vòng lặp kế tiếp theo gradient ig và
tốc độ luyện hiện tại: iiii gww 1 (wi là trọng số hiện tại).
Các bước này được thực hiện lặp lại nhiều lần cho đến khi đạt được điều kiện
ngừng luyện.
Hình 6 Sơ đồ kỹ thuật lan truyền ngược
3.2.4 Ngừng tiến trình luyện
Khi mạng được luyện, ánh xạ của nó dần dần trở nên phức tạp. Nó sẽ băng qua
một cấu hình tổng quát hóa tốt nhất tại một điểm nào đó; sau điểm đó, mạng sẽ học để
mô hình hóa nhiễu, khi đó mạng sẽ trả lời chính xác những gì nó được học, còn đối với
các dữ liệu mới thì mạng cho kết quả hoàn toàn sai. Hiện tượng này được gọi là hiện
Input (giá trị thực)
W1
W2
W3
Output (giá trị tính)
Output (giá trị thực)
W1 điều chỉnh
W2 điều chỉnh
W3 điều chỉnh
Điều chỉnh
Sai số
Chương 3
28
tượng quá luyện hay quá khớp (overfitting). Nếu ta có thể xác định được thời điểm
mạng đạt đến điểm đó, ta có thể ngừng luyện trước khi xảy ra quá khớp và có thể sử
dụng cấu hình mạng tổng quát hóa tốt nhất này.
Thường tiêu chuẩn ngừng luyện là dựa trên gradient lỗi, mạng sẽ luyện đến khi
không còn lỗi hoặc lỗi nhỏ hơn một giá trị nào đó do ta cho trước. Nhưng khi mạng
được luyện đến không còn lỗi thì mạng không còn tính tổng quát hoá nghĩa là lúc đó
mạng bị quá luyện.
Ta có thể ngăn ngừa hiện tượng quá luyện bằng cách tìm giá trị gradient lỗi và
số nút ẩn phù hợp. Điều này đòi hỏi nhiều thời gian.
Nếu không bị giới về khả năng tính toán (phần cứng) thì ta có thể cho mạng
một lượng nút ẩn thừa để luyện và dùng phương pháp dừng luyện bằng bộ kiểm tra.
Phương pháp này được thực hiện như sau: chia bộ mẫu ra thành ba tập, tập số một
dùng để luyện mạng, tập số hai dùng để kiểm tra hiện tượng quá khớp, bộ số ba dùng
để kiểm tra tính tổng quát hoá của mạng. Luyện mạng với tập mẫu luyện nhưng định
kì ngừng luyện để đánh giá sai số trên tập mẫu kiểm tra (khi đánh giá sai số trên tập
mẫu kiểm tra, ta chỉ cần thực hiện ánh xạ cho từng mẫu mà không phải trải qua giai
đoạn lan truyền ngược). Khi sai số trong mẫu kiểm tra đi lên, thì quá khớp đã bắt đầu.
Khi đó, ta ngừng luyện, trở về các trọng sinh ra lỗi thấp nhất trên mẫu kiểm tra, và
dùng các trọng đó cho mô hình của ta. Như vậy, song song với tiến trình luyện ta phải
tính sai số trên tập mẫu kiểm tra.
3.2.5 Các yếu tố ảnh hưởng đến tính tổng quát hoá của mạng nơron
Mạng có tính tổng quát hoá khi nó có thể dự đoán tốt các dữ liệu mới. Các yếu
tố ảnh hưởng nhiều đến tính tổng quát hoá của mạng là:
Kích thước tập mẫu: mạng học để mô hình hóa dữ liệu và có thể mô hình hóa
cả nhiễu, có thể ngăn nó quá khớp bằng cách tạo mẫu luyện đủ lớn để bù cho mức
nhiễu trong dữ liệu. Nhưng việc tăng mẫu thường gặp phải khó khăn trong thực hành
vì thực tế mẫu hiếm khi đủ lớn để ngăn được nhiễu.
Số nút ẩn: mỗi trọng số trong mạng là một tham số làm tăng khả năng của
mạng, số trọng số trong mạng là một hàm theo số nút của mạng, nó quyết định mức độ
Chương 3
29
tự do mà mạng có thể khớp với dữ liệu. Do đó, mạng chỉ đạt được trạng thái tối ưu khi
tìm được số nút ẩn phù hợp. Để tìm số nút ẩn tối ưu thì phải luyện nhiều mạng với số
nút ẩn khác nhau. Hơn nữa, phải luyện cho đến khi mạng hội tụ. Phương pháp này
cũng tạm ổn nhưng đòi hỏi thời gian máy tính khá nhiều. Quá trình tìm mạng tối ưu
chủ yếu tập trung vào việc tìm số nút ẩn, nhưng số nút nhập cũng quan trọng. Khi
dùng nhiều nút nhập ta sẽ cho mạng nhiều mức tự do hơn – nhiều khả năng để mô hình
hóa một cách chính xác các hàm phức tạp, hay nhiều khả năng để quá khớp.
Thời gian luyện mạng cũng quan trọng không kém. Trong thực tế, việc luyện
mạng đến hội tụ là một bài toán không dễ. Giai đoạn luyện có thể rất dài khi phải
luyện đến giá trị gradient lỗi rất nhỏ cho đến khi một nút ẩn nào đó tìm được giá trị tối
ưu. Vì vậy, mạng cần đủ thời gian để luyện và dừng luyện đúng lúc.
Mạng chỉ có giá trị sử dụng khi có tính tổng quát hoá cao.
Chương 4
30
Chương 4
CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE
----------
4.1 BỆNH DO MUỖI GÂY RA VÀ CÁC HÓA CHẤT
ĐUỔI MUỖI 13-15
Muỗi đốt, ngoài chuyện khó chịu, ngứa ngáy tại chỗ, muỗi còn là trung gian
truyền một số bệnh ký sinh trùng ở nhiều vùng nhiệt đới và cận nhiệt đới. Sau đây là
một vài bệnh nguy hiểm thường gặp:
Sốt rét là một chứng bệnh gây ra bởi ký sinh trùng loại protozoa tên
Plasmodium, lây truyền từ người này sang người khác khi những người này bị muỗi
đốt. Muỗi lan truyền bệnh là những loài Anopheles, thuộc nhóm Plasmodium. Chúng
hút máu người bệnh, tiêu hóa máu nhưng không tiêu hóa ký sinh trùng. Bệnh phổ biến
ở các khu vực nhiệt đới và cận nhiệt đới của châu Mỹ, châu Á và châu Phi. Sốt rét là
một trong những bệnh truyền nhiễm phổ biến nhất và là vấn đề nghiêm trọng đối với
sức khoẻ cộng đồng. Bệnh có thể chữa và phòng bằng thuốc căn bản Chloroquine.
Sốt Dengue còn gọi là Sốt Đập Lưng (breakbone fever) do muỗi Aedes
Aegyti truyền virus từ người bệnh sang người lành. Bệnh ít gây tử vong ngoại trừ
trường hợp Sốt Đập Lưng Xuất Huyết thường thấy ở các quốc gia Đông Nam Á và
châu Mỹ La Tinh. Bệnh nhân có triệu chứng như đau xương khớp, nhức đầu, nóng sốt,
nổi ban trên da và làm cơ thể suy nhược. Không có thuốc chữa khỏi bệnh mà cũng
chưa có thuốc tiêm ngừa. Sốt xuất huyết đang là vấn đề nan giải của mọi quốc gia vì
dịch bệnh ngày một gia tăng.
Sốt vàng (Yellow Fever) là chứng bệnh sốt gây vàng da do siêu vi trùng
thuộc họ Flaviviridae gây ra. Đây là một chứng bệnh sốt xuất huyết quan trọng tại
Châu Phi và Nam Mỹ mặc dầu hiện nay đã có vắc-xin hiệu nghiệm. Sốt vàng từng gây
nhiều trận dịch tàn khốc, gây tử vong khắp nơi cho đến thế kỷ 20 khi khoa học khám
phá ra bệnh lây do muỗi đốt và nghiên cứu được phương cách phòng chống bằng
vắc-xin. Sốt vàng cũng do muỗi Aedes Aegypti truyền một loại virus.
Bệnh Giun Chỉ (Filariasis) có nhiều ở vùng nhiệt đới và bán nhiệt đới. Giun
Chương 4
31
chỉ bạch huyết (Lymphatic filariasis) là một bệnh nhiễm ký sinh trùng Wuchereria
bancrofti, Brugia malayi hoặc Brugia timori. Loài ký sinh trùng này được truyền từ
người này sang người khác do muỗi đốt và phát triển thành giun trưởng thành trong hệ
mạch bạch huyết, gây nên tổn thương và tổ chức sưng phồng. Bệnh phù chân voi
(Elephantiasis) gồm đau, biến dạng chi cơ thể và cơ quan sinh dục - đây là các dấu
hiệu cổ điển trong giai đoạn muộn của bệnh này. Bệnh có thể chữa được bằng thuốc
diethylcarbamazine.
Viêm não Nhật Bản: tác nhân truyền bệnh là muỗi Culicinea
tritaeniorhyunchus, thường có ở nông thôn. Người là ký chủ trong chu trình truyền
bệnh và thường trẻ em mắc bệnh nhiều hơn người lớn. Tỉ lệ tử vong từ 7-33% hay cao
hơn nhưng tỉ lệ di chứng ngược lại với tỉ lệ tử vong . Các di chứng của bệnh thường là
liệt dai dẳng, mất điều hòa trương lực, chậm phát triển trí tuệ và rối loạn tính cách. Vì
đây là bệnh do virus gây ra nên các hiểu biết bệnh học còn nhiều hạn chế. Việc điều trị
dựa vào điều trị triệu chứng và tiêm phòng là chủ yếu.
Các vấn đề về phòng tránh, xua đuổi hay tiêu diệt muỗi đã được con người quan
tâm từ lâu. Nó là vấn đề nan giải của nhiều quốc gia trên thế giới.
Hình 7 Thuốc xịt muỗi và muỗi thuộc nhóm Plasmodium
Từ xưa, con người đã biết dùng hóa chất để đuổi muỗi như đốt vỏ cam quýt và
một số thảo mộc có chứa tinh dầu hoặc dùng nhiệt để tạo điều kiện phát tán các hương
liệu đối kháng với muỗi, hay dùng các loại cây củ tươi như hành tây cắt đôi đặt trong
phòng,… Các phương pháp dân gian này có nhiều hạn chế là không giết được muỗi,
chỉ đuổi được muỗi trong khoảng thời gian và một vùng không gian nhất định, đôi khi
lại còn gây ra phiền hà đối với nhiều người khác.
Chương 4
32
Ngày nay, thuốc đuổi muỗi thông dụng sử dụng các hóa chất tổng hợp – được
điều chế thông qua công nghệ cao và tiên tiến của ngành dược phẩm. Sau đây là một
vài hóa chất được sử dụng trong sản phẩm thuốc đuổi muỗi đã đăng kí với Cơ quan
Bảo Vệ Môi Sinh của Hoa Kì US EPA (United State Environmental Protection
Agency):
DEET tên hóa học là N,N-diethyl-meta-toluamide hoặc N,N-diethyl-3-
methyl-benzamide là thành phần hoạt chất được tìm thấy trong nhiều sản phẩm đuổi
muỗi nhất.
DEET được điều chế vào năm 1946 sau khi chiến tranh thế giới lần thứ 2
nhấn mạnh cần ngăn ngừa muỗi và các côn trùng khác đốt chích. DEET được sử dụng
hơn 50 năm nay và được xem là “tiêu chuẩn vàng” cho các hoạt chất đuổi muỗi. Kể từ
năm 1957 hóa chất này đã có mặt ở khắp mọi nơi và là hóa chất chống muỗi và các
loài côn trùng hút máu khác được sử dụng rộng rãi nhất trên thế giới.
Hóa chất DEET hoạt động bằng cách làm cho muỗi và họ hàng nhà muỗi
không thể đánh hơi mùi mồ hôi hấp dẫn của con người ở gần đó. Một cuộc nghiên cứu
mới được thực hiện gần đây cho thấy những kết quả như sau:
Một sản phẩm chứa 23.8% DEET có công dụng ngăn muỗi cắn khoảng 5
giờ đồng hồ.
Một sản phẩm chứa 20% DEET có công dụng ngăn muỗi cắn gần 4 giờ
đồng hồ.
Một sản phẩm chứa 6.65% DEET có công dụng ngăn muỗi cắn gần 2
tiếng đồng hồ.
Những sản phẩm chứa 4.75% DEET và 2% dầu đậu nành: cả hai loại này
đều có công dụng ngăn muỗi cắn trong vòng khoảng 90 phút đồng hồ.
Ủy ban Sức Khỏe Môi Trường của Hội Bác Sĩ Nhi Khoa Hoa Kỳ (The
American Academy of Pediatrics Committee on Environmental Health) mới đây cho
biết những sản phẩm chứa DEET có thể dùng một cách an toàn cho trẻ em và cho phụ
nữ mang thai hoặc đang cho con bú.
Picaridin (tên hóa học là 1-methylpropyl 2-(2-hydroxyethyl)-
1-piperidinecarboxylat) là chất lỏng không màu không mùi được sử dụng như là thuốc
diệt côn trùng như ruồi, muỗi, chiggers, và bọ ve. Các sản phẩm có chứa khoảng
Chương 4
33
5-20% hoạt chất.
Tinh dầu bạch đàn chanh được tìm thấy trong lá và cành cây bạch đàn. Nó
đã được đăng ký đầu tiên vào năm 1948 như là một thuốc trừ sâu và thuốc diệt côn
trùng và bọ ve. Như với hầu hết các loại dầu thực vật, không có tác dụng phụ cho con
người. Sản phẩm có chứa khoảng 30–40% của các thành phần hoạt chất.
PMD (p-mentane-3,8-diol) là hóa chất tổng hợp của tinh dầu bạch đàn
chanh. Nó được áp dụng cho da hoặc quần áo để xua đuổi côn trùng. Sản phẩm có
chứa 8-10% thành phần hoạt chất có tác dụng bảo vệ như DEET ở nồng độ thấp.
IR3535 (tên hóa học là etyl 3-(N-butyl-N-axetyl)-aminopropionat), cũng
được gọi là Merck 3.535, được sử dụng như một thuốc diệt côn trùng chống muỗi và
loài cắn đốt khác. Sản phẩm có chứa khoảng 7.5-20.07% của các thành phần hoạt chất.
Permethrin được đăng ký để sử dụng như một loại thuốc trừ sâu và thuốc
đuổi muỗi. Sản phẩm Permethrin được sử dụng trên quần áo, giày, lưới, giường.
Permethrin dùng ngâm tẩm quần áo, giầy dép như một cách phòng chống bọ ve, muỗi,
các loài côn trùng và vẫn còn hiệu quả sau khi giặt rửa nhiều lần.
Allethrin là hóa chất đuổi muỗi thường được sử dụng cho vùng không gian
rộng, là chất dễ bay hơi, được sử dụng trong các sản phẩm thương mại như nhang,
miếng dán, nến và đèn xông muỗi.
Hiện thị trường có nhiều sản phẩm phòng chống muỗi với những cách thức sử
dụng khác nhau. Loại diệt muỗi bằng nhang hoặc bình xịt (với các nhãn hiệu như
Mosfly, Jumbo, Raid Max...); loại thuốc chống muỗi dùng cho cá nhân dưới dạng kem
bôi (Soffell) hay thuốc xịt lên da có hương thơm; loại máy xông muỗi, máy bắt muỗi;
keo dán đuổi muỗi;… Tuy nhiên, nguyên liệu của các các loại
Các file đính kèm theo tài liệu này:
- KH7842O Samp193T M7888I QUAN H7878 2727882NH L4317906NG .pdf