Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất N-Acylpiperidine

MỤC LỤC

A – MỞ ĐẦU

LỜI MỞ ĐẦU . 1

B –TỔNG QUAN

Chương 1: TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA

CẤU TRÚC VÀ HOẠT TÍNH . 3

1.1. HOẠT TÍNH . . . 4

1.1.1. Hoạt tính sinh học. . 4

1.1.2. Hoạt tính hóa học . . . . 4

1.2. CÁC THAM SỐ CẤU TRÚC . . 5

1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR. 5

Chương 2: CƠ HỌC LƯỢNG TỬ, LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ. 9

2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG

BORN-OPPENHEIMER . . 9

2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM . 11

2.2.1. Giới thiệu . . . 11

2.2.2. Phương pháp PM3 . . . 13

Chương 3: PHƯƠNG PHÁP XỬ LÝ SỐ LIỆU . . 16

3.1. PHƯƠNG PHÁP HỒI QUI ĐA BIẾN TUYẾN TÍNH. . 16

3.1.1. Tương quan và hồi qui . . 16

3.1.2. Phân tích hồi qui đa biến tuyến tính . 20

3.1.2.1. Các thủ tục chọn biến . . . 20

3.1.2.1. Đánh giá mô hình . . . 21

3.2. PHƯƠNG PHÁP MẠNG NƠRONNHÂN TẠO . . 22

3.2.1. Nơron sinh học và nơron nhân tạo. 25

.2.2.1. Nơron sinh học . . 23

3.2.2.2. Nơron nhân tạo . . 24

3.2.2. Cấu trúc mạng nơron đa lớp . . 25

3.2.3. Luyện mạng: Kỹ thuật lan truyền ngược . 26

3.2.4. Ngừng tiến trình luyện . . 27

3.2.5. Các yếu tố ảnh hưởng đến tính tổng quát hóa của mạng . . 28

Chương 4: CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE . 30

4.1. BỆNH DOMUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔIMUỖI. 30

4.2. N-ACYLPIPERIDINE –CHẤT ĐUỔI MUỖI MỚI. 33

C –PHƯƠNG PHÁP

Chương 5: PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN. 37

5.1. PHẦN MỀM . . . 37

5.1.1. Hyperchem 8.03. . . 37

5.1.2. Stagraphics Centurion XV . . . 37

5.1.3. NeuroSolution 5.07 . . . 37

5.1.4. Microsoft Excel . . . 37

5.2. CÁC BƯỚC THỰC HIỆN. . 37

5.2.1. Tính toán hóa lượng tử . . 38

5.2.2. Phân tích hồi qui đa biến tuyến tính . 38

5.2.3. Tính toán mạng nơron . . 39

D –KẾT QUẢ VÀ BÀN LUẬN

Chương 6: KHẢO SÁT MỐI QUAN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH

CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE . 42

6.1. DỮ LIỆU . . . . 42

6.2. KẾT QUẢVÀ BÀN LUẬN . . 44

6.2.1. Phương pháp hồi qui đa biến tuyến tính. 44

6.2.1.1. Tính toán với hoạt tính PT 25 . . 45

6.2.1.2. Tính toán với hoạt tính PT 2.5 . . 47

6.2.2. Phương pháp mạng nơron . . 48

6.3. ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU TRÚC LÊN

HOẠT TÍNH . . . 55

E –KẾT LUẬN

KẾT LUẬN . . . 60

TÀI LIỆU THAM KHẢO

PHỤ LỤC



79 trang | Chia sẻ: maiphuongdc | Lượt xem: 2378 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất N-Acylpiperidine, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

người ta có thể ước tính hay dự đoán giá trị của y từ một giá trị của x. Đường biểu diễn biểu thức toán học ấy được gọi là đường hồi qui của y theo x. i k j ijjiikkiii xxxxy    1 022110 ... (3.2) i thường được gọi là sai số, là chênh lệch giữa giá trị quan sát được yk và trung bình của tập con các giá trị của biến y tại điểm xk. i được xem là biến ngẫu nhiên, độc lập có phân phối chuẩn, có trung bình bằng 0 và phương sai là 2 . Các hệ số trong phương trình được ước lượng theo nguyên tắc bình phương tối thiểu nghĩa là làm sao cho tổng bình phương các phần dư dưới đây là nhỏ nhất.                    N i k j ijji xy 1 2 1 0  (3.3) Khi thu được các dữ liệu cần thiết (yi, xji) trong đó số bộ dữ liệu N ít nhất phải lớn hơn số biến độc lập k thì người ta có thể xác định được các hệ số hồi qui theo chuẩn bình phương cực tiểu như sau:   )min()min( 1 2 2 1 eyyMin N i i N i tính ii             (3.4) Điều kiện này đạt được khi đạo hàm của i2 theo các hệ số i triệt tiêu. Chương 3 19 ,0 i e  với i = 1, 2,..., N. (3.5) Ta giả thiết rằng hàm f phụ thuộc tuyến tính vào bộ kxxx ,...,, 21 như vậy ta chỉ cần tìm kiếm các hệ số phù hợp. Trong khảo sát QSAR, biến yi là hoạt tính hoá chất, biến xi là các tham số hoá lí. Giá trị thống kê đặc trưng cho mô hình hồi qui là hệ số xác định (coefficient of determination) hay hệ số R2. Một số mô hình hồi qui đa biến tuyến tính Mô hình MLR có dạng tổng quát như sau:  Dạng lý thuyết: kk xxx   ...22110 (3.6)  Dạng ước tính exbxbxbby kk  ...22110 (3.7)  Dạng ước tính với N trường hợp quan sát: ikikiii exbxbxbby  ...22110 (3.8)  Dạng ước tính bằng phương pháp bình phương cực tiểu: kikiii xbxbxbby  ...ˆ 22110 (3.9) Trong đó: iyˆ là giá trị dự đoán của y. ix là biến độc lập. ib là các hệ số hồi qui. Mô hình MLR có thể xuất hiện dưới một số dạng đặc biệt như sau:  Dạng tương tác: giả sử hai biến x1 và x2 có hệ tương tác thì mô hình MLR có thể được viết: 21222110ˆ xxbxbxbbyi  (3.10)  Dạng đa thức: mô hình hồi qui dạng đa thức bậc k có thể biểu diễn dưới dạng Chương 3 20 tổng quát sau: k k xbxbxbby  ...ˆ 2 210 (3.11) 3.1.2 Phân tích hồi qui đa biến tuyến tính Các mô hình hồi qui đa biến tuyến tính có thể được thiết lập một cách tự động bởi các chương trình phân tích thống kê như SPSS, SAS, BMDP, MINITAB, Stagraphics-Plus, Microsoft EXEL, Stagraphics Centurion XV…. 3.1.2.1 Các thủ tục chọn biến Nhiều mô hình hồi qui có thể được xây dựng từ cùng một tập biến. Muốn sàn lọc các biến độc lập xi có liên quan tuyến tính với biến phụ thuộc trong một nhóm dữ liệu có N trường hợp quan sát, người ta có thể dùng nhiều phương pháp. Ba thủ tục phổ biến mà ta sẽ nghiên cứu là: đưa dần vào (forward selection), loại trừ dần (backward elimination), và hồi qui từng bước. Sau đây là các thủ tục chọn biến được thực hiện trong phần mềm Stagraphics Centurion XV.  Phương pháp đưa dần vào: biến đầu tiên được xem xét để đưa vào phương trình là biến có tương quan thuận hay nghịch lớn nhất với biến phụ thuộc. Có 2 tiêu chuẩn để đưa biến vào:  F-to-enter: là giá trị nhỏ nhất của thống kê F mà một biến phải đạt được để được đưa vào.  F-to-remove: là giá trị F tối thiểu mà thống kê F của biến độc lập đó phải đạt được để ở lại trong phương trình.  Phương pháp loại trừ dần: khởi đầu với tất cả các biến đều ở trong phương trình, sau đó loại trừ dần bằng tiêu chuẩn loại trừ. Có hai tiêu chuẩn loại trừ:  F-to-enter: là giá trị nhỏ nhất của thống kê F mà một biến phải đạt được để được đưa vào.  F-to-remove: là giá trị F tối thiểu mà thống kê F của biến độc lập đó phải đạt được để ở lại trong phương trình.  Phương pháp chọn từng bước: là sự kết hợp của thủ tục đưa dần vào và thủ tục loại trừ dần, đây là phương pháp phổ biến nhất. Biến thứ nhất được chọn giống Chương 3 21 như cách chọn dần từng bước. Sau khi biến thứ nhất được đưa vào, thủ tục chọn từng bước khác với đưa dần vào ở chỗ biến thứ nhất được xem xét xem có nên loại bỏ nó ra khỏi phương trình căn cứ theo tiêu chuẩn ra giống như thủ tục loại trừ dần. Các bước như thế được tiếp tục cho đến khi không còn biến nào thỏa điều kiện ra nữa. 3.1.2.2 Đánh giá mô hình Để đánh giá mức độ phù hợp của mô hình với bộ dữ liệu thực nghiệm, người ta dùng các đại lượng sau:  Hệ số xác định (R2): bình phương hệ số tương quan giữa các giá trị yitính tính theo mô hình hồi qui và các giá trị yi thực nghiệm.        N i i N i tính ii yy yy R 1 2 1 2 2 )( )( 1 (3.12) Trong đó: y là giá trị trung bình của các giá trị iy .  Ý nghĩa: R2 cho biết sự phù hợp của mô hình với bộ dữ liệu thực nghiệm. Nếu giá trị R2 càng gần 1 thì mô hình mô tả tốt các số liệu thực nghiệm, các giá trị yitính tính toán rất gần các giá trị yi thực nghiệm.  Hệ số 2R hiệu chỉnh ( 2aR ): được sử dụng để phản ánh sát hơn mức độ phù hợp của mô hình MLR. 2aR không nhất thiết phải tăng lên khi nhiều biến được thêm vào phương trình. 1 )1( 222    kN RkRRa (3.13)  Tính tổng quát của mô hình (Q2): Việc xác định tính tổng quát dựa trên phương pháp tham chiếu chéo (cross validation). Phương pháp này được thực hiện gồm các bước sau:  Chia ngẫu nhiên tập dữ liệu thành k tập con phân biệt.  Lặp lại k lần, mỗi lần chừa ra một tập con để kiểm tra, phần còn lại để luyện Chương 3 22  Tính giá trị Q2 :        N i i N i tính ii yy yy Q 1 2 1 2 2 )( )( 1 (3.14) Giá trị Q2 càng gần 1 thì khả năng đoán nhận càng chính xác hay nói cách khác mô hình có khả năng tổng quát hóa.  Khả năng dự đoán ngoại của mô hình: phương pháp này được thực hiện như sau: chia bộ dữ liệu thành 2 nhóm nhỏ, dùng một nhóm luyện (training set) có N trường hợp để thiết lập mô hình hồi qui và sau đó dùng mô hình ấy để dự đoán tác dụng của một nhóm thử (test set) có M trường hợp. Nếu mô hình tìm được có sự tuyến tính cao giữa các biến phụ thuộc và các biến độc lập thì phương pháp phân tích MLR có ưu điểm sau:  Những mối quan hệ dữ liệu quan sát được mô tả rõ ràng.  Là phương pháp đơn giản cho việc đoán nhận mẫu mới. Tuy nhiên phương pháp này sẽ không phù hợp trong những trường hợp mà giữa các biến độc lập có liên hệ chặt chẽ với nhau hoặc số biến lớn hơn số mẫu quan sát. Nếu mô hình không tuyến tính với các biến độc lập, khi đó ta có mô hình hồi qui phi tuyến. 3.2 PHƯƠNG PHÁP MẠNG NƠRON NHÂN TẠO (Artificial Neural Network) 2, 8, 19, 22 Trong thực tế, mối quan hệ giữa biến phụ thuộc và các biến độc lập thường là không tuyến tính, chẳng những như thế mà có đôi lúc mối quan hệ này rất phức tạp. Việc áp dụng phương pháp phân tích hồi qui đa biến phi tuyến hay phi tham số vào việc khảo sát QSAR để mô tả được các quan hệ này là điều khó khăn và hết sức cần thiết. Một trong những phương pháp xử lý số liệu mới được ứng dụng mạnh trong khảo sát QSAR là mạng nơron nhân tạo (ANN). Lý thuyết ANN được hai nhà bác học người Mỹ là McCulloch và Pitts đề xuất Chương 3 23 vào năm 1943, đến khoảng giữa thập niên 80 của thế kỷ XX thì nó bắt đầu thật sự được tìm hiểu và ứng dụng mạnh vào rất nhiều lĩnh vực khoa học – kỹ thuật khác nhau trong đó có hoá học. Dựa trên cơ sở hệ thần kinh của sinh vật, hai nhà bác học người Mỹ đã mô phỏng lại và xây dựng ANN tạo nhằm mô phỏng các mối quan hệ phức tạp giữa biến phụ thuộc và biến độc lập. ANN gồm những nơron là những đơn vị xử lý nhị phân mà cấu trúc và cách xử lý của nó được mô phỏng và đơn giản hóa từ cấu trúc và quá trình tiếp nhận – xử lý thông tin phức tạp của bộ não con người. Để có khái niệm tổng quát về mạng nơron, phần này sẽ giới thiệu sơ lược về cấu tạo và hoạt động của nơron sinh học, các thành phần cơ bản của nơron nhân tạo, cách truyền thông tin, mạng lan truyền đa lớp và trạng thái hoạt động của mạng. 3.2.1 Nơron sinh học và nơron nhân tạo 3.2.1.1 Nơron sinh học Hình 3 Cấu tạo một nơron sinh học Hệ thần kinh con người bao gồm khoảng 1010 tế bào thần kinh hay còn gọi là nơron. Một nơron sinh học tiêu biểu gồm một thân tế bào (soma hay cell body) với một nhân (nucleus) bên trong. Thân tế bào bao gồm nhiều sợi nhánh (dendrites) và sợi trục (axon). Có dạng như hình trên. Những sợi nhánh có nhiệm vụ nhận tín hiệu được tích lũy, sợi trục tiếp nhận tín hiệu và truyền sang một nơron khác ở vị trí khớp nối (synapse). Chương 3 24 Nhưng không phải lúc nào tín hiệu đưa vào cũng được truyền đi và truyền nguyên vẹn mà chỉ khi tín hiệu đó đạt đến một giới hạn nào đó và khi truyền qua synapse nó được biến đổi tùy thuộc vào lực synapse. Một tín hiệu có cường độ xi khi qua synapse I sẽ có cường độ là si ứng với lực synapse wi: si = xi . wi (3.15) 3.2.1.2 Nơron nhân tạo Cấu tạo của một nơron nhân tạo đơn (được mô tả bởi hình sau: Hình 4 Cấu tạo một nơron nhân tạo Đầu vào của một nơron gồm các dữ liệu nhập hoặc từ đầu ra của các nơron khác. Người ta thường tổ hợp đầu vào bằng cách tính tổng trọng số dữ liệu nhập pi:    n i ii pwI 1 (3.16) Với wi là trọng số đặc trưng cho liên kết giữa nơi truyền dữ liệu (tín hiệu) đến và nơi nhận dữ liệu (tín hiệu). Giá trị đầu ra được tạo bằng cách dùng các hàm truyền (transfer function) f trên I: V = f(I) Trong ANN thường dùng các hàm truyền sau: p2 pn V = f(I) w1 w2 wn . . .    n i ii pwI 1 p1 Chương 3 25 3.2.2 Cấu trúc mạng nơron đa lớp Một mạng lan truyền tổng quát là mạng có n (n > 2) lớp: lớp thứ nhất gọi là lớp nhập (input layer), lớp thứ n gọi là lớp xuất (output layer), và (n – 2) lớp ẩn (hidden layer). Số nút của lớp nhập và lớp xuất do bài toán qui định, còn số nút của lớp ẩn do người thiết kế mạng quyết định. Trong mạng lan truyền tiến, mỗi nút của lớp thứ i (0 < i < n) liên kết với mọi nút ở lớp thứ (i +1), và các nút trong cùng lớp không liên kết với nhau. Lớp nhập nhận dữ liệu vào và truyền lại cho tất cả các nơron cho lớp ẩn thứ nhất. Các nơron trong lớp ẩn thứ nhất tổ hợp các giá trị đầu vào và tạo lại đầu ra rồi truyền đi cho tất cả các nơron ẩn lớp kế tiếp… Lớp cuối cùng, lớp xuất, là lớp cho kết quả thật (giá trị biến phụ thuộc). Hình 5 Sơ đồ cấu tạo mạng nơron nhân tạo có 3 lớp p1 p2 Pn a1 an wji wkj wlk Dữ liệu nhập Lớp xuất Lớp nhập Dữ liệu ra . . . . . . . . . Lớp ẩn Tanh xx xx ee eexf     )( - 1 0 1 0 1 Logistic (sigmoid) x x e exf   1 )( Threshold 0 if x< 0 f(x) = 1 if x >= 1 Chương 3 26 Mạng lan truyền chỉ có thể ở một trong hai trạng thái: trạng thái ánh xạ và trạng thái học.  Ở trạng thái ánh xạ, thông tin lan truyền từ lớp nhập đến lớp xuất và mạng thực hiện ánh xạ để tính được các biến phụ thuộc như sau: trước tiên, các nơron nhập nhận các giá trị biến độc lập được đưa vào, mỗi nơron nhập chuyển giá trị nó nhận được cho tất cả các nơron ẩn của lớp ẩn kế cận. Mỗi nơron ẩn tính tổng trọng hóa của tất cả các dữ liệu nhập. Sau đó một hàm truyền được áp dụng lên tổng trọng để nén chúng vào một miền giới hạn của hàm truyền (tùy mỗi loại hàm truyền mà ta sử dụng sẽ có miền giới hạn khác nhau). Mỗi nơron ẩn này lại chuyển kết quả của mình đến các nơ ron ở lớp kế tiếp… cho đến các nơron lớp xuất. Mỗi nút xuất thực hiện các thao tác tương tự như đã thực hiện trong nút ẩn để cho ra giá trị kết xuất của nút xuất – là giá trị của các biến phụ thuộc cần xác định.  Trạng thái học: bản chất ánh xạ do mạng thực hiện tùy thuộc vào giá trị các trọng số trong mạng. Lan truyền ngược là một phương pháp cho phép xác định tập trọng tốt nhất của mạng để giải một bài toán được cho. Việc áp dụng phương pháp lan truyền ngược là một quá trình lặp đi lặp lại nhiều lần hai tiến trình chính: ánh xạ và lan truyền ngược sai số. Hai tiến trình này được áp dụng trên một tập mẫu xác định. Ta gọi chung tiến trình này là học hay luyện mạng. Một lợi ích của mạng lan truyền là có thể xây dựng mô hình nhiều kết xuất. Có thể nó đòi hỏi ít công việc hơn và ít tính toán máy hơn. Ngoài ra một mô hình duy nhất sẽ có tính nhất quán mà những mô hình phát triển riêng biệt không thể có. 3.2.3 Luyện mạng: Kỹ thuật lan truyền ngược Quá trình luyện mạng được bắt đầu với các giá trị trọng số tùy ý, và tiến hành lặp đi lặp lại. Mỗi lần lặp được gọi là một thế hệ (epoch). Trong mỗi thế hệ, mạng hiệu chỉnh các trọng số sao cho sai số (độ lệch giữa các kết xuất và giá trị đích) giảm dần. Tiến trình điều chỉnh nhiều lần giúp cho trọng dần dần đạt được tập giá trị tối ưu. Để cập nhật trọng số trong mỗi thế hệ luyện, mạng phải xử lý tất cả các mẫu trong tập mẫu. Đầu tiên mạng thực hiện phép toán lan truyền tiến, nghĩa là mạng thực hiện ánh xạ các biến nhập của mẫu hiện hành thành các giá trị xuất. Sau đó, xác xuất được tính dựa trên sai số của kết xuất và giá trị đích. Trên cơ sở sai số tính toán, mạng Chương 3 27 sẽ cập nhật lại bộ trọng số theo nguyên tắc lan truyền ngược sai số - gọi là giai đoạn lan truyền ngược (back propagation). Kỹ thuật cơ bản trong lan truyền ngược là cập nhật bộ trọng số theo hướng giảm gradient. Ví dụ khi áp dụng trong QSAR, trước hết mạng tính các kết xuất hoạt tính ai theo các dữ liệu nhập (các thông số cấu trúc) từ các trọng số đã khởi tạo ban đầu. Sau đó tính gradient ig . Cuối cùng chỉnh sửa các trọng số wi+1 cho vòng lặp kế tiếp theo gradient ig và tốc độ luyện hiện tại: iiii gww 1 (wi là trọng số hiện tại). Các bước này được thực hiện lặp lại nhiều lần cho đến khi đạt được điều kiện ngừng luyện. Hình 6 Sơ đồ kỹ thuật lan truyền ngược 3.2.4 Ngừng tiến trình luyện Khi mạng được luyện, ánh xạ của nó dần dần trở nên phức tạp. Nó sẽ băng qua một cấu hình tổng quát hóa tốt nhất tại một điểm nào đó; sau điểm đó, mạng sẽ học để mô hình hóa nhiễu, khi đó mạng sẽ trả lời chính xác những gì nó được học, còn đối với các dữ liệu mới thì mạng cho kết quả hoàn toàn sai. Hiện tượng này được gọi là hiện Input (giá trị thực) W1 W2 W3 Output (giá trị tính) Output (giá trị thực) W1 điều chỉnh W2 điều chỉnh W3 điều chỉnh Điều chỉnh Sai số Chương 3 28 tượng quá luyện hay quá khớp (overfitting). Nếu ta có thể xác định được thời điểm mạng đạt đến điểm đó, ta có thể ngừng luyện trước khi xảy ra quá khớp và có thể sử dụng cấu hình mạng tổng quát hóa tốt nhất này. Thường tiêu chuẩn ngừng luyện là dựa trên gradient lỗi, mạng sẽ luyện đến khi không còn lỗi hoặc lỗi nhỏ hơn một giá trị nào đó do ta cho trước. Nhưng khi mạng được luyện đến không còn lỗi thì mạng không còn tính tổng quát hoá nghĩa là lúc đó mạng bị quá luyện. Ta có thể ngăn ngừa hiện tượng quá luyện bằng cách tìm giá trị gradient lỗi và số nút ẩn phù hợp. Điều này đòi hỏi nhiều thời gian. Nếu không bị giới về khả năng tính toán (phần cứng) thì ta có thể cho mạng một lượng nút ẩn thừa để luyện và dùng phương pháp dừng luyện bằng bộ kiểm tra. Phương pháp này được thực hiện như sau: chia bộ mẫu ra thành ba tập, tập số một dùng để luyện mạng, tập số hai dùng để kiểm tra hiện tượng quá khớp, bộ số ba dùng để kiểm tra tính tổng quát hoá của mạng. Luyện mạng với tập mẫu luyện nhưng định kì ngừng luyện để đánh giá sai số trên tập mẫu kiểm tra (khi đánh giá sai số trên tập mẫu kiểm tra, ta chỉ cần thực hiện ánh xạ cho từng mẫu mà không phải trải qua giai đoạn lan truyền ngược). Khi sai số trong mẫu kiểm tra đi lên, thì quá khớp đã bắt đầu. Khi đó, ta ngừng luyện, trở về các trọng sinh ra lỗi thấp nhất trên mẫu kiểm tra, và dùng các trọng đó cho mô hình của ta. Như vậy, song song với tiến trình luyện ta phải tính sai số trên tập mẫu kiểm tra. 3.2.5 Các yếu tố ảnh hưởng đến tính tổng quát hoá của mạng nơron Mạng có tính tổng quát hoá khi nó có thể dự đoán tốt các dữ liệu mới. Các yếu tố ảnh hưởng nhiều đến tính tổng quát hoá của mạng là:  Kích thước tập mẫu: mạng học để mô hình hóa dữ liệu và có thể mô hình hóa cả nhiễu, có thể ngăn nó quá khớp bằng cách tạo mẫu luyện đủ lớn để bù cho mức nhiễu trong dữ liệu. Nhưng việc tăng mẫu thường gặp phải khó khăn trong thực hành vì thực tế mẫu hiếm khi đủ lớn để ngăn được nhiễu.  Số nút ẩn: mỗi trọng số trong mạng là một tham số làm tăng khả năng của mạng, số trọng số trong mạng là một hàm theo số nút của mạng, nó quyết định mức độ Chương 3 29 tự do mà mạng có thể khớp với dữ liệu. Do đó, mạng chỉ đạt được trạng thái tối ưu khi tìm được số nút ẩn phù hợp. Để tìm số nút ẩn tối ưu thì phải luyện nhiều mạng với số nút ẩn khác nhau. Hơn nữa, phải luyện cho đến khi mạng hội tụ. Phương pháp này cũng tạm ổn nhưng đòi hỏi thời gian máy tính khá nhiều. Quá trình tìm mạng tối ưu chủ yếu tập trung vào việc tìm số nút ẩn, nhưng số nút nhập cũng quan trọng. Khi dùng nhiều nút nhập ta sẽ cho mạng nhiều mức tự do hơn – nhiều khả năng để mô hình hóa một cách chính xác các hàm phức tạp, hay nhiều khả năng để quá khớp.  Thời gian luyện mạng cũng quan trọng không kém. Trong thực tế, việc luyện mạng đến hội tụ là một bài toán không dễ. Giai đoạn luyện có thể rất dài khi phải luyện đến giá trị gradient lỗi rất nhỏ cho đến khi một nút ẩn nào đó tìm được giá trị tối ưu. Vì vậy, mạng cần đủ thời gian để luyện và dừng luyện đúng lúc. Mạng chỉ có giá trị sử dụng khi có tính tổng quát hoá cao.  Chương 4 30 Chương 4 CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE ---------- 4.1 BỆNH DO MUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔI MUỖI 13-15 Muỗi đốt, ngoài chuyện khó chịu, ngứa ngáy tại chỗ, muỗi còn là trung gian truyền một số bệnh ký sinh trùng ở nhiều vùng nhiệt đới và cận nhiệt đới. Sau đây là một vài bệnh nguy hiểm thường gặp:  Sốt rét là một chứng bệnh gây ra bởi ký sinh trùng loại protozoa tên Plasmodium, lây truyền từ người này sang người khác khi những người này bị muỗi đốt. Muỗi lan truyền bệnh là những loài Anopheles, thuộc nhóm Plasmodium. Chúng hút máu người bệnh, tiêu hóa máu nhưng không tiêu hóa ký sinh trùng. Bệnh phổ biến ở các khu vực nhiệt đới và cận nhiệt đới của châu Mỹ, châu Á và châu Phi. Sốt rét là một trong những bệnh truyền nhiễm phổ biến nhất và là vấn đề nghiêm trọng đối với sức khoẻ cộng đồng. Bệnh có thể chữa và phòng bằng thuốc căn bản Chloroquine.  Sốt Dengue còn gọi là Sốt Đập Lưng (breakbone fever) do muỗi Aedes Aegyti truyền virus từ người bệnh sang người lành. Bệnh ít gây tử vong ngoại trừ trường hợp Sốt Đập Lưng Xuất Huyết thường thấy ở các quốc gia Đông Nam Á và châu Mỹ La Tinh. Bệnh nhân có triệu chứng như đau xương khớp, nhức đầu, nóng sốt, nổi ban trên da và làm cơ thể suy nhược. Không có thuốc chữa khỏi bệnh mà cũng chưa có thuốc tiêm ngừa. Sốt xuất huyết đang là vấn đề nan giải của mọi quốc gia vì dịch bệnh ngày một gia tăng.  Sốt vàng (Yellow Fever) là chứng bệnh sốt gây vàng da do siêu vi trùng thuộc họ Flaviviridae gây ra. Đây là một chứng bệnh sốt xuất huyết quan trọng tại Châu Phi và Nam Mỹ mặc dầu hiện nay đã có vắc-xin hiệu nghiệm. Sốt vàng từng gây nhiều trận dịch tàn khốc, gây tử vong khắp nơi cho đến thế kỷ 20 khi khoa học khám phá ra bệnh lây do muỗi đốt và nghiên cứu được phương cách phòng chống bằng vắc-xin. Sốt vàng cũng do muỗi Aedes Aegypti truyền một loại virus.  Bệnh Giun Chỉ (Filariasis) có nhiều ở vùng nhiệt đới và bán nhiệt đới. Giun Chương 4 31 chỉ bạch huyết (Lymphatic filariasis) là một bệnh nhiễm ký sinh trùng Wuchereria bancrofti, Brugia malayi hoặc Brugia timori. Loài ký sinh trùng này được truyền từ người này sang người khác do muỗi đốt và phát triển thành giun trưởng thành trong hệ mạch bạch huyết, gây nên tổn thương và tổ chức sưng phồng. Bệnh phù chân voi (Elephantiasis) gồm đau, biến dạng chi cơ thể và cơ quan sinh dục - đây là các dấu hiệu cổ điển trong giai đoạn muộn của bệnh này. Bệnh có thể chữa được bằng thuốc diethylcarbamazine.  Viêm não Nhật Bản: tác nhân truyền bệnh là muỗi Culicinea tritaeniorhyunchus, thường có ở nông thôn. Người là ký chủ trong chu trình truyền bệnh và thường trẻ em mắc bệnh nhiều hơn người lớn. Tỉ lệ tử vong từ 7-33% hay cao hơn nhưng tỉ lệ di chứng ngược lại với tỉ lệ tử vong . Các di chứng của bệnh thường là liệt dai dẳng, mất điều hòa trương lực, chậm phát triển trí tuệ và rối loạn tính cách. Vì đây là bệnh do virus gây ra nên các hiểu biết bệnh học còn nhiều hạn chế. Việc điều trị dựa vào điều trị triệu chứng và tiêm phòng là chủ yếu. Các vấn đề về phòng tránh, xua đuổi hay tiêu diệt muỗi đã được con người quan tâm từ lâu. Nó là vấn đề nan giải của nhiều quốc gia trên thế giới. Hình 7 Thuốc xịt muỗi và muỗi thuộc nhóm Plasmodium Từ xưa, con người đã biết dùng hóa chất để đuổi muỗi như đốt vỏ cam quýt và một số thảo mộc có chứa tinh dầu hoặc dùng nhiệt để tạo điều kiện phát tán các hương liệu đối kháng với muỗi, hay dùng các loại cây củ tươi như hành tây cắt đôi đặt trong phòng,… Các phương pháp dân gian này có nhiều hạn chế là không giết được muỗi, chỉ đuổi được muỗi trong khoảng thời gian và một vùng không gian nhất định, đôi khi lại còn gây ra phiền hà đối với nhiều người khác. Chương 4 32 Ngày nay, thuốc đuổi muỗi thông dụng sử dụng các hóa chất tổng hợp – được điều chế thông qua công nghệ cao và tiên tiến của ngành dược phẩm. Sau đây là một vài hóa chất được sử dụng trong sản phẩm thuốc đuổi muỗi đã đăng kí với Cơ quan Bảo Vệ Môi Sinh của Hoa Kì US EPA (United State Environmental Protection Agency):  DEET tên hóa học là N,N-diethyl-meta-toluamide hoặc N,N-diethyl-3- methyl-benzamide là thành phần hoạt chất được tìm thấy trong nhiều sản phẩm đuổi muỗi nhất. DEET được điều chế vào năm 1946 sau khi chiến tranh thế giới lần thứ 2 nhấn mạnh cần ngăn ngừa muỗi và các côn trùng khác đốt chích. DEET được sử dụng hơn 50 năm nay và được xem là “tiêu chuẩn vàng” cho các hoạt chất đuổi muỗi. Kể từ năm 1957 hóa chất này đã có mặt ở khắp mọi nơi và là hóa chất chống muỗi và các loài côn trùng hút máu khác được sử dụng rộng rãi nhất trên thế giới. Hóa chất DEET hoạt động bằng cách làm cho muỗi và họ hàng nhà muỗi không thể đánh hơi mùi mồ hôi hấp dẫn của con người ở gần đó. Một cuộc nghiên cứu mới được thực hiện gần đây cho thấy những kết quả như sau:  Một sản phẩm chứa 23.8% DEET có công dụng ngăn muỗi cắn khoảng 5 giờ đồng hồ.  Một sản phẩm chứa 20% DEET có công dụng ngăn muỗi cắn gần 4 giờ đồng hồ.  Một sản phẩm chứa 6.65% DEET có công dụng ngăn muỗi cắn gần 2 tiếng đồng hồ.  Những sản phẩm chứa 4.75% DEET và 2% dầu đậu nành: cả hai loại này đều có công dụng ngăn muỗi cắn trong vòng khoảng 90 phút đồng hồ. Ủy ban Sức Khỏe Môi Trường của Hội Bác Sĩ Nhi Khoa Hoa Kỳ (The American Academy of Pediatrics Committee on Environmental Health) mới đây cho biết những sản phẩm chứa DEET có thể dùng một cách an toàn cho trẻ em và cho phụ nữ mang thai hoặc đang cho con bú.  Picaridin (tên hóa học là 1-methylpropyl 2-(2-hydroxyethyl)- 1-piperidinecarboxylat) là chất lỏng không màu không mùi được sử dụng như là thuốc diệt côn trùng như ruồi, muỗi, chiggers, và bọ ve. Các sản phẩm có chứa khoảng Chương 4 33 5-20% hoạt chất.  Tinh dầu bạch đàn chanh được tìm thấy trong lá và cành cây bạch đàn. Nó đã được đăng ký đầu tiên vào năm 1948 như là một thuốc trừ sâu và thuốc diệt côn trùng và bọ ve. Như với hầu hết các loại dầu thực vật, không có tác dụng phụ cho con người. Sản phẩm có chứa khoảng 30–40% của các thành phần hoạt chất.  PMD (p-mentane-3,8-diol) là hóa chất tổng hợp của tinh dầu bạch đàn chanh. Nó được áp dụng cho da hoặc quần áo để xua đuổi côn trùng. Sản phẩm có chứa 8-10% thành phần hoạt chất có tác dụng bảo vệ như DEET ở nồng độ thấp.  IR3535 (tên hóa học là etyl 3-(N-butyl-N-axetyl)-aminopropionat), cũng được gọi là Merck 3.535, được sử dụng như một thuốc diệt côn trùng chống muỗi và loài cắn đốt khác. Sản phẩm có chứa khoảng 7.5-20.07% của các thành phần hoạt chất.  Permethrin được đăng ký để sử dụng như một loại thuốc trừ sâu và thuốc đuổi muỗi. Sản phẩm Permethrin được sử dụng trên quần áo, giày, lưới, giường. Permethrin dùng ngâm tẩm quần áo, giầy dép như một cách phòng chống bọ ve, muỗi, các loài côn trùng và vẫn còn hiệu quả sau khi giặt rửa nhiều lần.  Allethrin là hóa chất đuổi muỗi thường được sử dụng cho vùng không gian rộng, là chất dễ bay hơi, được sử dụng trong các sản phẩm thương mại như nhang, miếng dán, nến và đèn xông muỗi. Hiện thị trường có nhiều sản phẩm phòng chống muỗi với những cách thức sử dụng khác nhau. Loại diệt muỗi bằng nhang hoặc bình xịt (với các nhãn hiệu như Mosfly, Jumbo, Raid Max...); loại thuốc chống muỗi dùng cho cá nhân dưới dạng kem bôi (Soffell) hay thuốc xịt lên da có hương thơm; loại máy xông muỗi, máy bắt muỗi; keo dán đuổi muỗi;… Tuy nhiên, nguyên liệu của các các loại

Các file đính kèm theo tài liệu này:

KH7842O Samp193T M7888I QUAN H7878 2727882NH L4317906NG .pdf