Tóm tắt Luận án Mô phỏng quá trình ghi nhớ của nơron sinh học

CHƯƠNG 4. HAI LUẬT HỌC HIỆU QUẢ CHO LÝ THUYẾT

CỘNG HƯỞNG THÍCH NGHI MỜ

4.1 Giới thiệu chung

ART là một ANN mà học các mẫu huấn luyện để hình thành véc tơ trọng số của các

cụm. Sau đó, sử dụng véc tơ trọng số đã học được để nhớ lại các cụm tương tự với mẫu vào.

Ưu điểm quan trọng nhất của ART là học các mẫu huấn luyện để véc tơ trọng số của cụm

được chọn chứa các thông tin từ mẫu huấn luyện hiện tại.

26 trang | Chia sẻ: lavie11 | Lượt xem: 842 | Lượt tải: 1Free

Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Mô phỏng quá trình ghi nhớ của nơron sinh học, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

t. Hàm sigmoid được sử dụng thường xuyên nhất có dạng: (1.2) với β là tham số lặp Các nơ-ron nhân tạo kết nối với nhau tạo thành các mạng nơ-ron nhân tạo. 1.3 Mô phỏng quá trình ghi nhớ thông tin của các mạng nơ-ron nhân tạo Một ANN có hai quá trình gồm quá trình học và quá trình nhớ lại. Ba lược đồ học của ANN là học có giám sát, học không giám sát, và lai giữa hai lược đồ học giám sát và học không giám sát. 4 Có bốn kiểu luật học gồm: luật lỗi-làm đúng (error-correction), luật của Boltzmann, luật của Hebb, và luật học cạnh tranh. Đối với luật lỗi-làm đúng, mô hình học có giám sát theo nguyên tắc sau: dùng lỗi do sự chênh lệnh giữa tín hiệu ra thực và tín hiệu ra mong đợi để thay đổi trọng số kết nối sao cho giảm dần được lỗi. Luật học Boltman là một quy tắc học tập ngẫu nhiên mà điều chỉnh trọng số kết nối để trạng thái của các nơ-ron đáp ứng một phân phối xác suất mong đợi. Luật học của Hebb được phát biểu: Nếu tế bào thần kinh ở hai khớp thần kinh được kích hoạt đồng thời và liên tục thì sự liên kết của hai khớp thần kinh sẽ được tăng lên. Luật học cạnh tranh chỉ cho phép một nơ-ron được kích hoạt cung cấp tín hiệu ra ở một thời điểm. CHƯƠNG 2. CƠ SỞ LÝ THUYẾT 2.1 Logic mờ 2.1.1 Định nghĩa Cho X là tập khác rỗng. Một tập mờ A trên X được đặc trưng bằng một hàm thuộcviên với µA(x) thể hiện mức độ thành viên của phần tử x vào tập mờ A đối với mọi x X. 2.1.2 Các phép toán với tập mờ Cho A, B là hai tập mờ trên X. Với mọi x X, Phép giao của hai tập A, B được định nghĩa: (2.1) Phép hợp của hai tập A, B được định nghĩa: (2.2) Phép bù một tập mờ A được định nghĩa: (2.3) Phép nối mờ của A, B là một ánh xạ: (2.4) thỏa mãn C(0, 0) = C(0, 1) = C(1, 0) = 0 và C(1, 1) = 1. Một kết nối mờ (2.5) thỏa mãn T(x, 1) = x với x [0,1] được gọi là triangular norm hay t-norm. 5 Một phân tách mờ là một ánh xạ (2.9) thỏa mãn D(0, 0) = 0 và D(0, 1) = D(1, 0) = D(1, 1) = 1. Một phân tách mờ (2.10) thỏa mãn S(1, x) = x với x [0,1] được gọi là triangular co-norm hay short s-norm. Một thao tác (2.14) được gọi là gợi ý mờ nếu I mở rộng suy diễn thông thường [0, 1] x [0, 1] với I(0, 0) = I(0, 1) = I(1, 1) = 1 và I(1, 0) = 0. 2.2 Toán học hình thái 2.2.1 Lưới đầy đủ Lưới đầy đủ là một tập có thứ tự, từng phần L trong đó mỗi tập con có một chặn trên và chặn dưới trong L. Lớp các tập mờ kế thừa cấu trúc lưới đầy đủ của chu kỳ đơn [0, 1]. 2.2.2 Các thao tác cơ bản của hình thái toán học Phép co rút là một ánh xạ từ một lưới đầy đủ L đến một lưới đầy đủ M thỏa mãn công thức sau: (2.18) Phép giãn nở : L M thỏa mãn công thức sau: (2.19) 2.3 Mô hình AM 2.3.1 Khái niệm về AM AM là một cấu trúc nội dung-địa chỉ mà ánh xạ các mẫu dữ liệu vào sang các mẫu dữ liệu ra. Một cấu trúc nội dung-địa chỉ là một dạng bộ nhớ mà cho phép nhớ lại dữ liệu dựa vào mức độ tương tự giữa mẫu dữ liệu vào và các mẫu đã lưu trong bộ nhớ. 2.3.2 Hoạt động của AM AM hoạt động ở hai dạng gồm tự liên kết và liên kết khác loại. Bộ nhớ ở dạng tự liên kết đưa ra một mẫu đã lưu mà giống nhất với mẫu vào hiện tại. Ở dạng liên kết khác loại, 6 mẫu đưa ra khác hoàn toàn mẫu vào về nội dung, kiểu và định dạng nhưng có liên quan với mẫu đưa vào. AM có hai quá trình là học các cặp mẫu và nhớ lại một mẫu đã lưu từ một mẫu vào. 2.3.2 Một số đặc điểm của AM - Các lỗi và nhiễu chỉ gây ra giảm độ chính xác của MẪU RA - Nếu các mẫu vào trực giao thì nhớ lại đúng - Mẫu dữ liệu thường được biểu diễn ở dạng 2 cực. 2.4 Mô hình BAM 2.4.1 Khái niệm về BAM BAM là một dạng ANN điển hình thể hiện cấu trúc bộ nhớ liên kết với khả năng nhớ lại theo cả hai hướng. BAM là ANN có 2 tầng và có các kết nối 2 chiều. Hình 2.3 mô tả cấu trúc tổng quát của mô hình BAM. Hình 2.1: Cấu trúc tổng quát của mô hình BAM 2.4.2 Quá trình học của BAM Quá trình này học và lưu trữ các liên kết giữa các cặp mẫu Đầu tiên, ma trận trọng số Wk lưu cặp mẫu (Ak,Bk ) theo công thức: (2.20) với Ak là véc tơ có m phần tử và Bk là véc tơ có n phần tử. Tổng quát hóa sự liên kết của p cặp mẫu và lưu trong ma trận trọng số W. (2.21) với α là một hằng số. 7 2.4.3 Quá trình nhớ lại của BAM Cho một mẫu vào X, quá trình nhớ lại diễn ra như sau: Đầu tiên, tổng hợp dữ liệu vào của mỗi nơ-ron theo công thức sau: (2.22) với m là số chiều của X, Inputj là tổng trọng số của các dữ liệu vào của nơ-ron j, Xi là thành phần thứ i của mẫu dữ liệu vào X. Sau đó, xác định dữ liệu ra cho nơ-ron bằng cách dùng hàm đầu ra: (2.23) với θj là ngưỡng của nơ-ron j. Lặp lại quá trình trên cho đến khi thu được cặp (Xf,Yf) không thay đổi. Đây là trạng thái BAM hội tụ và Yf chính là mẫu ra của BAM ứng với mẫu vào X. 2.4.4 Hàm năng lượng của BAM Hàm năng lượng E với mỗi trạng thái (A, B) được tính như sau: (2.24) 2.4.5 Chiến lược học nhiều lần dùng số lần lặp tối thiểu để học một cặp mẫu Y.F. Wang và đồng nghiệp thực hiện học nhiều lần các cặp mẫu bằng cách dùng số lần lặp tối thiểu để học một cặp mẫu (MNTP). Khi đó, Wk được tính theo công thức: (2.25) với qk là số dương thể hiện số lần ít nhất dùng (Ak, Bk) cho việc học mà đảm bảo nhớ lại được (Ak, Bk). 2.5 Bộ nhớ liên kết mờ 2.5.1 Giới thiệu chung Cho một tập các liên kết (Ak, Bk), k=1,..,p xác định một ánh xạ G mà G(Ak)=Bk với mọi k=1,..,p. Hơn nữa, ánh xạ G cần có khả năng chịu nhiễu. Quá trình xác định G được gọi là quá trình học và ánh xạ G được gọi là ánh xạ liên kết (nhớ lại các liên kết). Bộ nhớ liên kết mờ là bộ nhớ liên kết mà các mẫu Ak và Bk là các tập mờ với mọi k=1,...,p. 8 2.5.2 Các FAM của Kosko và sự tổng quát hóa Kosko đưa ra hai mô hình FAM đầu tiên gồm max-min FAM và max-product FAM nên ban đầu FAM chưa dùng sai số θ. Sau đó, Chung và Lee tổng quát hóa FAM thành FAM tổng quát. FAM lưu p cặp mẫu. Cho và Mô hình tổng dùng nơ-ron max-C nên có thể dùng một phép nối mờ như CM, CP, CL. Quá trình học thực hiện như sau: ọ (2.33) Cho mẫu vào x, mẫu ra y được nhớ lại từ mẫu vào x được tính bằng: (2.34) 2.6 Mô hình ART 2.6.1 Cấu trúc của ART Cấu trúc chung của mạng ART được thể hiện trong Hình 2.4. Hình 2.2: Cấu trúc của một ART đơn giản Một mạng ART điển hình có hai tầng: tầng dữ liệu vào (F1) và tầng dữ liệu ra (F2). Tính động của mạng được điều khiển bởi hai hệ thống con: hệ thống chú ý và hệ thống định hướng. 2.6.2 Một số mô hình cải tiến từ ART Họ các mô hình được phát triển từ ART để giải quyết tốt hơn các bài toán thực bao gồm ART 1, ART 2, ART 3, ARTMAP, Fuzzy ART, Fuzzy ARTMAP. 9 2.7 Mô hình Fuzzy ART 2.7. 1 So sánh với ART Fuzzy ART được phát triển từ ART 1 để học các lớp nhận dạng ổn định với cả mẫu vào tương tự và mẫu vào nhị phân. 2.7.2 Thuật toán Fuzzy ART Các tham số của mô hình Fuzzy ART: chọn α> 0, tốc độ học β [0, 1], ngưỡng [0, 1]. Bước 1: Khởi tạo véc tơ trọng số. (2.35) Bước 2: Lựa chọn một cụm chiến thắng. Với mỗi dữ liệu vào I và cụm j, hàm chọn Tj được định nghĩa bởi (2.36) Sự chọn cụm được gắn chỉ số bằng j, với (2.39) Bước 3: Kiểm tra trạng thái của mạng là cộng hưởng hay thiết lập lại. Cộng hưởng xuất hiện nếu (2.40) Sau đó việc học sẽ diễn ra. Thiết lập lại xuất hiện nếu (2.41) Sau đó, giá trị của hàm chọn Tj được thiết lập -1 cho các biểu diễn mẫu vào để ngăn sự lựa chọn lại mẫu vào trong quá trình tìm kiếm. Một chỉ số mới j được chọn bởi Công thức (2.39). Quá trình tìm kiếm tiếp tục cho đến khi j được chọn thỏa mãn Công thức (2. 40). Nếu không có cụm đang tồn tại nào thỏa mãn thì một cụm mới j được sinh ra và đặt Bước 4: Học dữ liệu huấn luyện. Véc tơ trọng số của cụm j được cập nhật bởi: (2.42) 10 2.7.3 Fuzzy ART với mã hóa đầy đủ Moore trình bày vấn đề sinh ra cụm mới của ART tương tự khi một số lớn các mẫu vào có véc tơ trọng số bị co rút. Fuzzy ART tránh sinh các cụm nếu các mẫu vào được chuẩn hóa. CHƯƠNG 3. THUẬT TOÁN HỌC MỚI CHO BỘ NHỚ LIÊN KẾT HAI CHIỀU 3.1 Giới thiệu chung BAM là một ANN mà được mở rộng từ các mạng nơ-ron Hopfiled. BAM có thể thực hiện tìm kiếm sự liên kết theo cả hai chiều. BAM có các ưu điểm gồm nhớ lại một mẫu đã lưu từ một dữ liệu vào có chứa nhiễu hoặc không đầy đủ và hội tụ không điều kiện trong chế độ đồng bộ. 3.2 Quá trình học của một số BAM với chiến lược học nhiều lần Mô hình của Y.F Wang, Cruz, và Mulligan Luật học được thể hiện bởi công thức sau: (3.1) với qi thể hiện số lần huấn luyện cặp (Ai, Bi). Để BAM nhớ lại đúng các cặp mẫu đã lưu, qi cần thỏa mãn điều kiện sau: (3.2) với là sự chênh lệch năng lượng lớn nhất giữa cặp mẫu thứ i và các cặp mẫu khác trong vùng A. Tương tự với là sự chênh lệch năng lượng lớn nhất giữa cặp mẫu thứ i và các cặp mẫu khác trong vùng B. Mô hình của T. Wang và Zhuang Luật học của mô hình được thể hiện bởi công thức sau: (3.3) với số gia trọng số ∆Wij được tính bới công thức sau: (3.4) 11 với S(x)=0 nếu x>0 và S(x)=1 nếu x≤0. Quá trình này lặp lại cho đến khi các giá trị của ma trận trọng số W ổn định Mô hình của Zhuang, Huang, và Chen Ban đầu, là bất kỳ. Khi t>0 thì luật học của nơ-ron i ở vùng A được thể hiện bởi công thức sau: (3.7) với j = 1,, n. Luật học của của nơ-ron j ở vùng B được thể hiện bởi công thức sau: (3.8) với i = 1,, m. Quá trình này lặp lại cho đến khi các giá trị của ma trận trọng số W ổn định 3.3 Lý do đề xuất thuật toán học mới Từ việc tổng hợp các nghiên cứu về BAM, tác giả nhận thấy mô hình BAM học nhiều lần sẽ phát huy tốt ưu điểm về phục hồi từ mẫu vào nhiễu. Tuy nhiên, cần phải giảm thời gian học các mẫu mà vẫn giữ được khả năng nhớ lại tốt để đáp ứng cho các ứng dụng thực đòi hỏi thời gian phản hồi ngắn đặc biệt khi số lượng mẫu và kích thước của các mẫu tăng lên. Ngoài ra, BAM cần được cải tiến khả năng lưu trữ và nhớ lại các cặp mẫu không trực giao. 3.4 Thuật toán học mới 3.4.1 Phân tích mối quan hệ giữa MNTP và hàm năng lượng Giả sử BAM học p cặp mẫu. Cặp mẫu (Ai, Bi) được trình bày như sau: và . Mối quan hệ giữa MNTP và hàm năng lượng được thiết lập từ công thức (2.24) và (2.25). Sau dãy các biến đổi, thu được W như sau: 12 (3.11) và Ei được tính bằng: (3.13) Công thức (3.13) thể hiện giá trị tuyệt đối của Ei tỷ lệ thuận với mọi qk của p cặp mẫu (với k=1,p). Nghĩa là, giá trị tuyệt đối của Ei sẽ giảm nhanh khi một số hay mọi qk cùng giảm đồng thời. 3.4.3 Nội dung thuật toán học mới Một số ký hiệu được dùng trong thuật toán: - qi là MNTP của cặp mẫu thứ i - W là ma trận trọng số chung - Ei là năng lượng ứng với trạng thái (Ai, Bi) Quá trình học được thực hiện qua hai bước sau: Bước 1: Khởi tạo giá trị MNTP của mọi cặp mẫu bằng 1 để thu được ma trận trọng số gốc của BAM. Bước 2: Thực hiện lặp các bước sau cho đến khi |Ei| ≅0 với mọi i=1,,p và |x| là giá trị tuyệt đối của x. Bước 2.1: Tính W theo công thức (2.25) Bước 2.2: Tính Ei theo công thức (2.24) với i=1,,p. Bước 2.3: Dựa vào giá trị của Ei để cập nhật qi theo hai luật sau: Luật 1: Nếu |Ei| ≅0 thì không thay đổi qi Luật 2: Nếu |Ei| ≅0 chưa thỏa mãn thì giảm qi xuống h lần để |Ei| giảm xuống sao cho |Ei| ≅0 Ưu điểm của thuật toán học mới Ba lý do chính làm cho thuật toán học mới tốt hơn so với các thuật toán học đã công bố gồm: Sự tăng hay giảm trọng số kết nối được thực hiện bằng phép nhân hoặc phép chia; 13 MNTP của mỗi cặp có thể được thay đổi trong mỗi lần lặp của quá trình học; và năng lượng của mỗi trạng thái ứng với mỗi cặp mẫu tiến đến 0. Vì vậy, BAM cải tiến sẽ có hai ưu điểm gồm (i) quá trình học các cặp mẫu thực hiện nhanh và linh hoạt hơn và (ii) có khả năng lưu và nhớ lại các cặp mẫu không trực giao. 3.5 Kết quả thực nghiệm Các thử nghiệm được làm với ứng dụng nhận dạng mẫu. Các BAM được dùng gồm BAM của Y.F.Wang (WBAM), Zhuang (ZBAM), Tao Wang (TBAM) và BAM cải tiến (FFBAM) ở chế độ tự liên kết. Năm ứng dụng nhận dạng mẫu gồm nhận dạng vân tay, chữ viết tay, phương tiện giao thông, biển hiệu giao thông và tiền xu của Mỹ. Kết quả thực nghiệm cho thấy BAM với thuật toán học mới nhớ lại tốt hơn các BAM khác trong chế độ tự liên kết. Bảng 3.1: Tỷ lệ phần trăm nhận dạng đúng các điểm ảnh trong nhận dạng vân tay WBAM ZBAM TBAM FFBAM 83.370 85.906 85.906 88.007 Bảng 3.2: Tỷ lệ phần trăm nhận dạng đúng các điểm ảnh trong nhận dạng chữ viết tay WBAM ZBAM TBAM FFBAM 75.463 72.964 75.681 75.89 Bảng 3.3: Tỷ lệ phần trăm nhận dạng đúng các điểm ảnh trong nhận dạng biển hiệu giao thông WBAM ZBAM TBAM FFBAM 77.98 28.303 78.303 78.348 Bảng 3.4: Tỷ lệ phần trăm nhận dạng đúng các điểm ảnh trong nhận dạng tiền xu của Mỹ WBAM ZBAM TBAM FFBAM 85.066 45.992 84.896 85.109 14 Bảng 3.5: Tỷ lệ phần trăm nhận dạng đúng các điểm ảnh trong nhận dạng phương tiện giao thông WBAM ZBAM TBAM FFBAM 88.11 18.96 90.076 90.076 CHƯƠNG 4. HAI LUẬT HỌC HIỆU QUẢ CHO LÝ THUYẾT CỘNG HƯỞNG THÍCH NGHI MỜ 4.1 Giới thiệu chung ART là một ANN mà học các mẫu huấn luyện để hình thành véc tơ trọng số của các cụm. Sau đó, sử dụng véc tơ trọng số đã học được để nhớ lại các cụm tương tự với mẫu vào. Ưu điểm quan trọng nhất của ART là học các mẫu huấn luyện để véc tơ trọng số của cụm được chọn chứa các thông tin từ mẫu huấn luyện hiện tại. 4.2 Một số luật học điển hình của ART và Fuzzy ART Các biến được sử dụng: I là dữ liệu vào hiện tại, W là trọng số của các cụm, và β là tham số học nằm trong khoảng [0, 1]. Capenter và đồng nghiệp đưa ra Fuzzy ART gốc với luật học có dạng: (4.1) với là phép AND của logic mờ. Hầu hết các nghiên cứu khác cũng dùng luật học như công thức (4.1). Ngoài ra, các nghiên cứu này cũng thay đổi hàm đầu ra hay học bổ sung thêm quan hệ giữa các cụm. Kenaya và đồng nghiệp đưa ra Euclidean ART để học với luật học như sau: (4.2) với Xjk là mẫu thứ k trong cụm j và L là số các cụm. Yousuf và Murphey dùng luật học cải tiến sau để cập nhật nhiều cụm thỏa mãn điều kiện về ngưỡng. (4.3) với 15 4.3 Lý do đề xuất luật học cải tiến Dựa vào sự tổng hợp các nghiên cứu về ART và Fuzzy ART, tác giả nhận thấy có một hạn chế như sau: Luật học của ART và Fuzzy ART là chưa hiệu quả do không học dữ liệu mới khi bề mặt biểu diễn các mẫu huấn luyện nằm trên bề mặt biểu diễn các véc tơ trọng số của các cụm. Nghĩa là, Fuzzy ART có thể không học một phần lớn tập dữ liệu huấn luyện. Do đó, nhiều thông tin có ích từ các mẫu huấn luyện đó đã không được luuw trong Fuzzy ART. 4.4 Hai Luật học hiệu quả cho Fuzzy ART 4.4.1 Nội dung của hai luật học Sau khi Fuzzy ART chọn được một cụm chiến thắng, việc học mẫu huấn luyện hiện tại diễn ra. Giả sử, cụm chiến thắng là cụm j. Luật học cải tiến thứ nhất Thực hiện cập nhật trọng số cho cụm j theo công thức dưới đây: (4.4) với là tham số học tốc độ học và |y| là giá trị tuyệt đối của y. Sau khi cập nhật có thể điều chỉnh Wij theo luật sau: Do Wij luôn giảm nên khi Wij<0 thì đặt Wij=0. Luật học cải tiến thứ hai Trước tiên, tính sự tăng giá trị bé nhất (MDI) và sự giảm giá trị bé nhất (MDD) của mẫu huấn luyện hiện tại so với trọng số của cụm chiến thắng theo hai công thức sau: (4.5) (4.6) Khi đó, luật học cải tiến thứ hai được trình bày như sau: (4.7) 4.4.2 Thuật toán tìm giá trị tối ưu cho tham số tốc độ học Một tập con ngẫu nhiên được chọn từ tập dữ liệu ban đầu sao cho số mẫu ở mỗi cụm chênh nhau ít nhất. Tập con này được dùng để kiểm tra khả năng phân cụm ứng với mỗi giá trị của tham số tốc độ học. 16 Nội dung thuật toán gồm các bước sau: Bước 1: Khởi tạo tham số tốc độ học dựa vào kích thước của tập dữ liệu để giảm thời gian tìm giá trị của tham số. Sau đó, tính kết quả phân cụm của tập mẫu con. Bước 2: Làm các bước sau: Bước 2.1: Tăng hoặc giảm giá trị của tham tốc độ số học theo các bước nhảy nhỏ như 5% giá trị của tham tốc độ số học hiện tại. Bước 2.2: Tính kết quả phân cụm của tập mẫu con. Bước 2.3: Kiểm tra kết quả phân cụm của tập mẫu con:  Nếu kết quả phân cụm là tăng hoặc giảm thì làm Bước 2.  Nếu kết quả phân cụm là cao nhất, ổn định thì sang Bước 3. Bước 3: Đưa ra giá trị tối ưu của tham số tốc độ học. 4.4.3 Ưu điểm của hai luật học đề xuất Mọi mẫu huấn luyện đều có một mức độ ảnh hưởng giống nhau đến trọng số của cụm được chọn do tham số học lớn hơn 0 và cố định trong suốt quá trình học. Do đó, mọi dữ liệu trong tập huấn luyện được học hiệu quả. Khi học các tập dữ liệu có các mẫu dị thường, do số lượng mẫu dị thường ít trong khi số lượng mẫu chuẩn nhiều và mỗi mẫu lại có mức độ ảnh hưởng giống nhau nên mức độ ảnh hưởng của các mẫu dị thường đến trọng số của các cụm cũng nhỏ. 4.5 Kết quả thực nghiệm Các tập dữ liệu chuẩn từ cơ sở dữ liệu UCI và Shape được dùng trong các thử nghiệm. Các mô hình được thực thi gồm: Fuzzy ART với luật học cải tiến, Fuzzy ART gốc, K-mean, và Euclidean ART. Dữ liệu của các tập dữ liệu được chuẩn hóa về miền [0,1]. Với mỗi tập dữ liệu, các thử nghiệm con được làm với số lượng mẫu tăng dần. Tỷ lệ phần trăm các mẫu được phân cụm đúng được thể hiện trong bảng tương ứng với tập dữ liệu đó. 4.5.1 Thử nghiệm 1: Dùng luật học cải tiến thứ nhất Chín tập dữ liệu chuẩn được chọn gồm Iris (đặc điểm của hoa lan), Wine (chất lượng của rượu vang), Jain (sự co cụm của người dùng mạng), Glass (các dạng mảnh kính vỡ dùng trong điều tra), Blance-Scale (số liệu dùng trong thử nghiệm tâm lý học), Spiral (phổ của các ảnh màu), và các tập điểm tạo thành các hình dạng đặc biệt (Aggregation, Flame, R15). Bảng 4.11 tổng hợp kết quả từ các kiểm tra con của các thử nghiệm. 17 Bảng 4.1: Sự cải thiện khả năng phân cụm của Fuzzy ART với luật học thứ nhất so với mô hình tốt nhất thứ hai Kiểu tập dữ liệu Sự phân bố số mẫu trong các cụm Số mẫu Số cụm Số thuộc tính Mức độ cải thiện (%) 1 Không đều với độ lêch cao 200-400 2 & 3 2 21-32.6 2 Không đều với độ lêch trung bình 150 3 9 15.3 3 Không đều với độ lêch trung bình 200-214 7 9 12.6-13.5 4 Không đều với độ lêch cao 500 3 2 9.8 5 Không đều với độ lêch cao 788 7 7 4.8 6 Không đều với độ lêch thấp 120-200 2 & 3 2 & 4 2.5-5.3 7 Đều với mọi phân cụm 90-201 2 3 & 4 1.5-5 8 Không đều với độ lêch trung bình 250 3 2 0.8 Dữ liệu của Bảng 4.11 thể hiện rằng Fuzzy ART cải tiến thích hợp cho các tập dữ liệu nhỏ, phức tạp. 4.5.2 Thử nghiệm 2: Dùng luật học cải tiến thứ hai Chúng tôi chọn 7 tập dữ liệu chuẩn từ cơ sở dữ liệu UCI bao gồm MONKS (các bài toán của Monk), BALANCE-SCALE (số liệu dùng trong thử nghiệm tâm lý học), WDBC (dữ liệu chuẩn đoán bệnh ung thư), WINE-RED (chất lượng rượu vang đỏ), WINE-WHITE (chất lượng rượu vang trắng), và và các tập điểm tạo thành các hình dạng đặc biệt (D31, R15). Bảng 4.20 tổng hợp kết quả từ các kiểm tra con của các thử nghiệm. Bảng 4.2: Sự cải thiện khả năng phân cụm của Fuzzy ART với luật học thứ hai so với mô hình tốt nhất thứ hai trong thử nghiệm 2 Kiểu tập dữ liệu Sự phân bố số mẫu trong các cụm Số mẫu Số cụm Số thuộc tính Mức độ cải thiện (%) 1 Không đều với độ lệch cao 600-1200 3,4 11 15.2-30.2 2 Không đều với độ lệch cao 1000-3000 3,4 11 11.1-30.1 3 Không đều với độ lệch cao 300-625 2,3 4 18-20.8 4 Không đều với độ lệch cao 400-569 2 30 15.6-16.3 5 Không đều với độ lệch cao 4000-4898 5,6 11 2.5-5.7 6 Không đều với độ lệch trung bình 400-459 2 7 2.5-2.6 18 7 Đều với mọi phân cụm 500-1500 5,10,15 2 2.3-3.8 8 Đều với mọi phân cụm 2000-3100 20,25,31 2 1.5-2.4 Kết quả của các kiểm tra con của bảy thử nghiệm cho thấy khả năng của phân cụm của Fuzzy ART với luật học thứ hai cải thiện đáng kể đối với các tập dữ liệu nhỏ có độ phức tạp cao. Đặc biệt, kết quả phân cụm là cao khi tậpdữ liệu có chứa nhiều mẫu. CHƯƠNG 5. LUẬT HỌC CẢI TIẾN CHO BỘ NHỚ LIÊN KẾT MỜ 5.1 Giới thiệu chung FAM là AM mà học và nhớ lại với các mẫu được biểu diễn ở dạng tập mờ. FAM có ưu điểm là nhớ lại các mẫu đã lưu từ các mẫu vào nhiễu hay không đầy đủ. 5.2 Một số mô hình FAM chuẩn FAM lưu p cặp mẫu (Ak, Bk) với Ak có m phần tử và Bk có n phần tử. Mô hình của Kosko và Kong Các ma trận trọng số kết nối Wk của cặp mẫu (Ak, Bk) được tính: (5.1) Ma trận trọng số kết nối W lưu tất cả các cặp mẫu được tính: (5.2) Mô hình của Junbo, Fan, và Yan Các ma trận trọng số kết nối Wk của cặp mẫu (Ak, Bk) được tính: (5.4) Ma trận trọng số kết nối W lưu tất cả các cặp mẫu được tính: (5.5) Mô hình của Chung và Lee Các ma trận trọng số kết nối Wk của cặp mẫu (Ak, Bk) được tính: 19 (5.7) Ma trận trọng số kết nối W lưu tất cả các cặp mẫu được tính: (5.8) Mô hình của Xiao, Yang, và Yu Các ma trận trọng số kết nối Wk của cặp mẫu (Ak, Bk) được tính: (5.10) với được tính như sau: (5.11) Ma trận trọng số kết nối W lưu tất cả các cặp mẫu được tính: (5.12) Tập các mô hình của S.T. Wang và Lu Các ma trận trọng số kết nối Wk của cặp mẫu (Ak, Bk) được tính: (5.14) Ma trận trọng số kết nối W lưu tất cả các cặp mẫu được tính: (5.15) hoặc (5.16) Họ các FAM gợi ý của Sussner và Valle Các ma trận trọng số kết nối Wk của cặp mẫu (Ak, Bk) được tính: (5.19) với là thao tác IM, IP, IL 20 Ma trận trọng số kết nối W lưu tất cả các cặp mẫu được tính: (5.20) hoặc (5.21) 5.3 Lý do đề xuất luật học cải tiến Từ các phân tích trên, tác giả thấy rằng một số thông tin có ích sẽ bị mất mát trong quá trình học do các FAM chuẩn chỉ lưu trữ tốt nội dung các mẫu hoặc chỉ lưu trữ tốt liên kết giữa các mẫu. Thông tin bị mất mát trong quá trình học có thể dẫn tới khả năng nhớ lại bị hạn chế. 5.4 Luật học cải tiến của FAM 5.4.1 Mô hình FAM với luật học cải tiến Thiết kế của mô hình FAM với luật học cải tiến được trình bày như sau: Quá trình học các cặp mẫu Việc học và lưu trữ p cặp mẫu trong FAM được thực hiện qua hai bước sau: Bước 1: Học và lưu trữ cặp mẫu (Ak, Bk) trong ma trậntrọng số Wk theo cách sau: (5.24) với η là nhân tố điều khiển tỷ lệ giữa nội dung và sự liên kết được lưu. Do dùng nhân tố η nên khi mẫu vào bị nhiễu thì nhiễu sẽ ít ảnh hưởng hơn đến mẫu được nhớ lại. Bước 2: Tổng quát hóa sự liên kết của các cặp mẫu và lưu trữ trong ma trận trọng số chung theo công thức sau: (5.25) Quá trình nhớ lại Việc nhớ lại mẫu ra Y từ mẫu vào X và ma trận trọng số chung W được thực hiện như sau: η (5.26) 21 Điều chỉnh ACAM cho chế độ tự liên kết Để đảm bảo khả năng lưu trữ không giới hạn các cặp mẫu ở chế độ tự liên kết, chúng tôi tính Wii giống như trong Bộ nhớ liên kết hình thái (MAM). (5.27) Khi đó, công thức dùng cho việc nhớ lại được điều chỉnh như sau: η (5.28) 5.4.2 Hai định lý về khả năng nhớ lại hoàn hảo của ACAM Định lý 5.1: (Khả năng nhớ lại các cặp mẫu trong chế độ liên kết khác loại) W trong công thức (5.27) nhớ lại hoàn hảo mọi cặp mẫu (Ak, Bk) nếu và chỉ nếu với mỗi k=1,..,p, mỗi cột của ma trận Wk –W có chứa một số 0. Định lý 5.2: (Khả năng nhớ lại các cặp mẫu trong chế độ tự liên kết) W trong công thức (5.27) nhớ lại hoàn hảo mọi cặp mẫu (Ak, Ak). 5.5 Kết quả thực nghiệm FAM cải tiến (ACAM) được so sánh với các FAM của Junbo, Kosko, Xiao, Susners và Valle (IFAMs). Để đánh giá kết quả, chúng tôi dùng cách tính lỗi chuẩn. 5.5.1 Thử nghiệm với tập dữ liệu về các số Bộ dữ liệu này bao gồm 5 hình ảnh của số 0-4 với kích thước 5 × 5. Các thực nghiệm được làm với các mẫu vào bị méo ở cả hai chế độ (tự liên kết và liên kết khác loại). Bảng 5.1: Kết quả thử nghiệm của bộ nhớ tự liên kết với tập dữ liệu về con số Junbo Kosko Xiao IFAM ACAM Lỗi 0.434 0.914 0.418 0.434 0.346 22 Bảng 5.1 cho thấy tổng số lỗi của các mô hình khác nhau khi nhớ lại từ các ảnh vào bị bóp méo trong chế độ tự liên kết. Lý do các mô hình khác tạo ra số lỗi lớn hơn so với ACAM của là do các mô hình này không thể làm việc tốt với cả hai loại nhiễu co rút và giãn nở trong khi ACAM có một cơ chế để giảm ảnh hưởng của nhiễu. Bảng 5.2: Kết quả thử nghiệm của bộ nhớ liên kết khác loại với tập dữ liệu về con số Junbo Kosko Xiao IFAM ACAM Lỗi 0.675 0.893 0.793 0.675 0.652 Trong chế độ liên kết khác loại, ACAM cũng tạo ra tổng lỗi ít nhất. 5.5.2 Thử nghiệm với tập dữ liệu của Corel Bộ dữ liệu này bao gồm các hình ảnh được lựa chọn từ cơ sở dữ liệu Corel. Các mẫu nhiễu được tạo ra từ các mẫu chuẩn bằng cách tạo ra nhiễu muối tiêu ở mức 25% số lượng điểm ảnh. Trong chế độ tự liên kết, 10 ảnh được sử dụng. Kết quả trong chế độ tự liên kết được trình bày trong bảng 5.3 cho thấy ACAM làm việc hiệu quả trong việc xử lý với nhiễu muối tiêu. Bảng 5.3: Kết quả thử nghiệm của bộ nhớ tự liên kết với tập dữ liệu của Corel Junbo Kosko Xiao IFAM ACAM Lỗi 0.742 0.867 0.694 0.664 0.531 Chế độ liên kết khác loại được thử nghiệm với 10 cặp ảnh, trong đó các ảnh vào khác với ảnh ra. Bảng 5.4 cũng cho thấy ACAM thực hiện tốt hơn so với các mô hình khác trong sự hiện diện của cả

Các file đính kèm theo tài liệu này:

tt_mo_phong_qua_trinh_ghi_nho_cua_he_thong_noron_sinh_hoc_7412_1920324.pdf