Tóm tắt Luận án Mạng neural trong hệ thống điều khiển xe lăn cho người tàn tật nặng sử dụng điện não (eeg) và camera

Giảm bớt số kênh phân tích tín hiệu giúp giảm thời gian xử

lý, việc giảm số kênh tín hiệu dựa vào đặc điểm của từng vị trí điện

cực trên vỏ não cũng như qua quá trình thực nghiệm.

 Việc kết hợp gắn camera để quan sát hướng mắt giúp cho hệ

thống chạy được ổn định và giúp cho người tham gia huấn luyện nhanh

chóng thành thạo với việc điều khiển xe lăn hơn.

 Sử dụng tín hiệu điện não EEG trong lĩnh vực điều khiển

cũng là một đề xuất mới trong luận án vì hiện nay một số công trình

nghiên cứu trong nước chỉ tìm hiểu về tín hiệu điện não, lọc nhiễu tín

hiệu, và sử dụng chớp mắt trong việc nhận dạng và phát hiện ra hiện

tượng chớp mắt.

pdf34 trang | Chia sẻ: honganh20 | Ngày: 22/02/2022 | Lượt xem: 293 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Mạng neural trong hệ thống điều khiển xe lăn cho người tàn tật nặng sử dụng điện não (eeg) và camera, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
phố, phong cảnh, bông hoa và con vật), cái mới cải tiến của luận án so với các công trình trước là tác giả mạnh dạn sử dụng nhận dạng mẫu tín hiệu EEG trực tuyến có kết hợp camera để tăng độ chính xác của giải thuật, ngoài ra trong khâu tiền xử lý tác giả kết hợp giữa trích đặc điểm HHT với giải thuật gom cụm dữ liệu giúp cho việc nhận dạng thông qua mạng neural được nhanh hơn sử dụng phương pháp khác như wavelet transform và giúp cho mạng neural làm việc hiệu quả hơn, chính xác hơn và tránh overfitting. Trang 5 1.4 Mục đích nghiên cứu Tìm ra phương thức thu nhận 5 mẫu tín hiệu điện não EEG một cách dễ dàng và hiệu quả. Sử dụng các công cụ toán học để phân tích tín hiệu thành các đặc trưng cơ bản, sử dụng gom cụm dữ liệu trước khi đưa vào mạng neural để nhận đạng đối tượng. Kết hợp giữa tín hiệu camera và tín hiệu điện não để xác định được thời điểm xuất hiện mẫu tín hiệu chính xác phục vụ cho việc phân loại và điều khiển xe. 1.5 Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu chính trong luận án này là sử dụng mạng neural để phân loại 5 mẫu tín hiệu này thành các dạng lệnh điều khiển tương ứng với 5 lệnh điều khiển xe lăn chạy tới, chạy lui, quay phải, quay trái, dừng lại, trong luận án còn đề cập đến quá trình xử lý ảnh để phát hiện hướng mắt hỗ trợ cho việc điều khiển xe được chính xác và hiệu quả hơn, tuy nhiên trong phần xử lý ảnh tác giả không tập trung nhiều mà chủ yếu phần tín hiệu điện não EEG. 1.6 Những đóng góp của luận án 1.6.1 Đóng góp về mặt lý thuyết Tìm ra được bảng quan sát phù hợp và đơn giản để thu thập dữ liệu, kết hợp một cách khoa học giữa giải thuật trích đặc điểm và gom cụm dữ liệu trước khi đưa vào mạng neural để phân loại từng mẫu dữ liệu. 1.6.2 Đóng góp về mặt thực tiễn Kết quả thực nghiệm của luận án cho thấy rằng, việc phân loại các đối tượng thông qua việc quan sát bằng mắt (những hình ảnh có đặc trưng khác nhau) nhưng đầu óc còn minh mẫn và mắt hoạt động như người bình thường là hoàn toàn thực hiện được. CHƯƠNG 2 – CƠ SỞ LÝ THUYẾT 2.1 Các dạng sóng cơ bản của tín hiệu điện não EEG Sóng Delta có tần số từ 0 đến 3 Hz, biên độ lớn như hình 2.1, sóng này xuất hiện nhiều ở lứa tuổi từ bé đến một tuổi và ở những người lớn trong lúc ngủ, ngủ say, dạng sóng này thường xuất hiện khắp nơi trên da đầu. Trang 6 Hình 2. 1 Dạng sóng Delta Sóng Theta có tần số từ 3 Hz đến 7 Hz thường xuất hiện khi nhắm mắt và khi tinh thần ở trạng thái thư giãn như hình 2.2, xuất hiện ở những người trẻ hoặc lúc tỉnh thức ở người lớn tuổi và thường xuất hiện tại vùng thái dương. Hình 2. 2 Dạng sóng Theta Sóng Alpha có tần số từ 7 đến 13 Hz như hình 2.3, xuất hiện nhiều nhất ở người lớn tuổi, sóng alpha thường xảy ra 2 bên đầu nhưng có biên độ 2 bên không đều nhau. Sóng alpha xuất hiện khi nhắm mắt (trạng thái thư giãn) và thường biến mất khi mở mắt hay bị stress. Hình 2. 3 Dạng sóng Alpha Sóng Beta có biên độ nhỏ như hình 2.4, dãy tần số từ 13 đến 30 Hz. Dạng sóng này thường xuất hiện ở những bệnh nhân người mà thường có tâm trạng cảnh giác, đề phòng, lo lắng Sóng Beta được phân bố đối xứng 2 bên và rõ ràng nhất ở phía trước, thường xuất hiện ở phía trước và trên đỉnh đầu vỏ não, biên độ sóng Beta thường nhỏ hơn 30uV. Hình 2. 4 Dạng sóng Beta Trang 7 Sóng Gamma có dãy tần số từ 30 đến 45 Hz như hình 2.5, thường được gọi là sóng nhanh Beta. Sóng này thường có biên độ thấp và hiếm khi xuất hiện, nhưng việc phát hiện sóng này đóng vai trò rất quan trọng trong việc xác định các bệnh lý về thần kinh, sóng này xảy ra ở trung tâm vỏ não. Hình 2. 5 Dạng sóng Gamma 2.2 Vị trí các điện cực trên thiết bị EEG Não là một trong những cơ quan lớn nhất và phức tạp nhất trong cơ thể con người. Nó được hình thành từ hơn 100 tỉ dây thần kinh, liên lạc tới 1000 tỉ khớp thần kinh, các vị trí được gắn điện điện cực trên đầu theo tiêu chuẩn quốc tế 10/20 như hình 2.6. Hình 2. 6 Tên và vị trí các điện cực theo chuẩn quốc tế 10/20 CHƯƠNG 3 XÂY DỰNG MÔ HÌNH HỆ THỐNG ĐIỀU KHIỂN Để bắt đầu quá trình nghiên cứu, tác giả sử dụng CSDL được cung cấp trên website của trường Đại học San Diego (UCSD) có uy tín của Mỹ, xếp hạng 38 trên thế giới năm 2018, dữ liệu này thu được từ việc người tham gia nhìn vào 5 đối tượng hình ảnh khác nhau (con người, con vật, thành phố, phong cảnh và bông hoa), kích thước hình Trang 8 ảnh 8 bit màu (256 pixel rộng và 384 pixel cao). Tổng số lượng mẫu cho cơ sở dữ liệu này là 21.000 mẫu. Trong chương này, tác giả đã từng bước xây dựng các mô hình từ đơn giản đến phức tạp, sau đó đánh giá kết quả thực nghiệm trên CSDL của trường Đại học San Diego (UCSD) và từ 80 sinh viên trường Cao Đẳng Công Thương TP.HCM để làm rõ phần đóng góp và ý nghĩa khoa học của luận án. 3.1 Mô hình mạng Neural đơn lớp Giai đoạn đầu tiên, tác giả xây dựng mô hình mạng neural để phân ra 2 loại tín hiệu riêng biệt (con vật và không phải con vật), mục đích trong lần nghiên cứu này là đánh giá xem mô hình neural có đáp ứng được yêu cầu phân loại hay không, hệ thống sử dụng phần mềm Matlab cho quá trình thực nghiệm này. CSDL của tín hiệu điện não EEG được trích đặc điểm bằng phương pháp biến đổi Wavelet dạng hình nón Mêhicô và sử dụng mạng Neural đơn lớp để nhận dạng. Mô hình hệ thống được thể hiện trong hình 3.1, mô hình này bao gồm 2 giai đoạn: giai đoạn 1: quá trình tiền xử lý nhẳm xử lý tín hiệu dữ liệu thô và tổng hợp thành 5 tín hiệu sóng Delta, Theta, Alpha, Beta và Gamma. Giai đoạn 2: xây dựng mạng Neural đơn lớp với 5 ngõ vào là 5 tín hiệu sóng Delta, Theta, Alpha, Beta, Gamma và một ngõ ra để xác định kết quả nhận dạng. Hình 3. 1 Mô hình hệ thống Neural đơn lớp Quá trình huấn luyện mạng được thực hiện trên tập dữ liệu huấn luyện với các tham số sau:  Tỷ lệ học cố định là: 0,7  Trọng số khởi tạo ngẫu nhiên trong đoạn từ -0,5 đến 0,5. Dữ liệu thô Kết quả nhận dạng Quá trình tiền xử lý Mạng neural đơn lớp Trang 9  Ngưỡng sai số là 1x10-5 với cách tính sai số dựa trên MSE (Mean Square Error).  Số vòng lặp tối đa là: 5.000. Kết quả thực nghiệm nhận dạng trên tập dữ liệu kiểm tra được thể hiện trong bảng 3.1. Bảng 3. 1 Kết quả thực nghiệm trên dữ liệu kiểm tra Loại ảnh Con vật/Phong cảnh Tỷ lệ nhận dạng France Phong cảnh 99,13% Wild sheep Con vật 98,67% Wild cats Con vật 99,28% Bali, Indonesia Phong cảnh 62,44% Wild animals Con vật 99,64% California Coasts Phong cảnh 56,89% Wolves Con vật 98,64% Mushrooms Phong cảnh 95,16% Kenya Con vật 99,76% The big Apple Phong cảnh 98,79% Snakes, lizards... Con vật 98,32% Caves Con vật 67,18% Polar bears Con vật 99,03% Exotic Hong Kong Phong cảnh 98,72% Images of France Phong cảnh 99,37% Fabulous fruit Phong cảnh 98,25% Wild animals Con vật 93,97% Sand & solitude Con vật 98,42% Lions Con vật 62,78% Great Silk Road Phong cảnh 98,47% Trang 10 Từ kết quả thực nghiệm ở bảng 3.1, chúng ta nhận thấy kết quả nhận dạng chính xác trung bình trên tập dữ liệu kiểm tra là 91,15%. 3.2 Mô hình mạng Neural đa lớp 3.2.1 Mô hình hệ thống Dựa trên những kết quả đạt được từ mô hình mạng Neural đơn lớp, tác giả tiếp tục phát triển mô hình mạng Neural đa lớp với kết quả phân thành 5 lớp tương ứng với 5 tín hiệu điều khiển. Bảng 3.2 mô tả 05 lệnh điều khiển tương ứng với kết quả phân lớp khi người dùng nhìn vào các loại hình ảnh tương ứng. Mô hình này đề xuất sử dụng biến đổi Wavelet để khử tín hiệu và trích xuất đặc trưng, sau đó dùng thuật toán K-mean để gom cụm các đặc trưng của dữ liệu sau đó đưa vào mạng Neural đa lớp để phân loại. Trong mô hình này tác giả chỉ chọn 10 kênh để xử lý nhằm giảm thời gian xử lý và thực hiện. Mô hình hệ thống được mô tả trong hình 3.2. Hình 3. 2 Mô hình hệ thống Neural đa lớp Mô hình mạng neural 3 lớp được trình bày trong hình 3.3. Lớp đầu tiên chứa năm nút đó là Delta, Theta, Alpha, Beta và Gamma. Lớp này được gọi là lớp đầu vào. Lớp thứ hai là lớp ẩn. Số lượng nút ẩn trong lớp ẩn được đặt là 5, 10, 15, 20, 25, 30, 35, 40, 45 và 50. Lớp đầu ra chứa một nút, kết quả của này nút được sử dụng để phân lớp tín hiệu EEG. Hàm hành động được sử dụng trong mô hình này là hàm hyperbolic tangent, giá trị của đầu ra trong khoảng [-1, 1]. Tín hiệu EEG Chọn kênh Biến đổi Wavelet Gom cụm Mạng neural đa lớp Kết quả phân lớp Trang 11 Hình 3. 3 Mô hình mạng Neural đa lớp Trước khi sử dụng mô hình, mạng Neural cần phải vượt qua giai đoạn huấn luyện. Thuật toán huấn luyện được hiển thị trong hình 3.4, thể hiện một quy trình huấn luyện lan truyền ngược. Trang 12 Hình 3. 4 Thuật toán huấn luyện mạng Neural 3.2.2 Kết quả thực nghiệm với mô hình mạng Neural đa lớp Bộ dữ liệu bao gồm 21.000 mẫu được chia thành tập con để huấn luyện (training) (70%), xác nhận (validation) (15%) và thử nghiệm (testing) (15%). Hệ thống sử dụng công cụ Matlab và EEGLab cho quá trình thử nghiệm, mạng Neural chia thành hai giai đoạn thử nghiệm. Giai đoạn huấn luyện được thực hiện trên tập dữ liệu huấn luyện, bằng cách sử dụng các cấu trúc có số nút ẩn khác nhau, trong lớp ẩn của mạng neural, thông qua các tham số sau như sau:  Tỷ lệ học: 0,7  Số vòng lặp tối đa: 5.000 Khởi tạo bộ trọng số ngẫu nhiên Nhận giá trị Delta, Theta, Alpha, Beta, Gamma Tính giá trị nhập của các nút trong lớp ẩn Tính giá trị xuất của các nút trong lớp ẩn Tính giá trị nhập của nút xuất Tính giá trị xuất của nút xuất Tính lỗi của lớp xuất Tính lỗi của lớp ẩn Tính lỗi của hệ thống Lỗi hệ thống <= ngưỡng? Kết thúc Cập nhật trọng số Bắt đầu Đúng Sai Trang 13  Giá trị trọng số khởi tạo ngẫu nhiên từ 0 đến 1  Ngưỡng lỗi trung bình: 10-5 và dựa trên RMSE Độ chính xác của phân loại được đo bằng tỷ lệ kết quả phân loại sai so với tổng số mẫu theo (3.1). = − (3.1) Trong đó, n là tổng số mẫu, ntrue là số mẫu có kết quả phân loại đúng. Bảng 3. 2 Kết quả thực nghiệm Số Neural trong lớp ẩn (Lỗi trung bình) Average Error (Sai số tối thiểu) Minimum Error (Tỷ lệ nhận dạng) Accuracy Rate 5 25.21% 21.98% 78.02% 10 23.77% 20.04% 79.96% 15 20.44% 17.13% 82.87% 20 17.76% 14.21% 85.79% 25 15.43% 11.88% 88.12% 30 12.98% 10.06% 89.94% 35 9.87% 7.74% 92.26% 40 7.74% 6.43% 93.57% 45 9.56% 7.92% 92.08% 50 10.24% 8.63% 91.37% Ta có thể quan sát trong bảng 3.2 và thấy rằng kết quả phân loại của tập dữ liệu thử nghiệm không ngừng tăng lên cho đến khi đạt giá trị tốt nhất có thể (40 Neural trong lớp ẩn và tỷ lệ chính xác là 93,57%). Sau đó, kết quả bắt đầu giảm khi số lượng Neural trong lớp ẩn tăng lên. Điều này xảy ra được gọi là overfitting. Một ma trận nhầm lẫn (confusion matrix) chứa thông tin về phân loại thực tế và dự đoán được thực hiện bởi một hệ thống. Bảng 3.3 mô tả hiệu năng của hệ thống được đánh giá bởi dữ liệu trong ma trận nhầm lẫn với 40 nút ẩn trong lớp ẩn. Bảng 3. 3 Ma trận nhầm lẫn của kết quả phân loại Thực tế Tiên đoán Con vật Phong cảnh Thành phố Con người Bông hoa Trang 14 Con vật 93.8% 1.4% 1.5% 2.0% 1.6% Phong cảnh 1.1% 93.6% 3.1% 1.5% 1.2% Thành phố 1.6% 1.3% 93.5% 1.6% 1.8% Con người 1.9% 1.8% 1.3% 93.2% 1.7% Bông hoa 1.7% 1.9% 0.8% 1.8% 93.8% Để cung cấp một phương pháp trực quan và dễ hiểu hơn trong việc đo lường chất lượng dự đoán, các công thức sau được sử dụng để kiểm tra chất lượng hiệu quả. Độ chính xác Accuracy (AC) là tỷ lệ dự đoán chính xác. Nó được xác định bằng cách sử dụng công thức (3.2). = + + + + (3.2) Độ chính xác Precision (P) là tỷ lệ của các trường hợp đúng được dự đoán là chính xác, được tính bằng công thức (3.3). = + (3.3) Trong đó, True Possitive (TP) đề cập đến các bộ dữ liệu đúng được phân loại chính xác là đúng. True Negative (TN) đề cập đến các bộ dữ liệu sai được phân loại chính xác là sai. False Possitive (FP) đề cập đến các bộ dữ liệu sai được phân loại không chính xác là đúng. False Negative (FN) đề cập đến các bộ dữ liệu đúng được phân loại không chính xác là sai. Tỷ lệ nhận dạng thành với 40 nút ẩn trong lớp ẩn được đưa ra trong bảng 3.4 Bảng 3. 4 Kết quả thực nghiệm TP TN FP FN AC P Con vật 93,8% 93,6% 6,4% 6,2% 93,7% 93,6% Phong cảnh 93,6% 93,2% 6,8% 6,4% 93,4% 93,2% Thành phố 93,5% 93,8% 6,3% 6,6% 93,6% 93,7% Con người 93,2% 93,4% 6,6% 6,8% 93,3% 93,4% Trang 15 Bông hoa 93,8% 93,9% 6,1% 6,2% 93,9% 93,9% Những kết quả này cũng được so sánh với một số nghiên cứu trước đây như xác định tín hiệu EEG dựa trên nháy mắt với 15.360 mẫu và đạt 90,85%, cây quyết định đạt tối đa 85%, dựa trên chuyển động của mắt bằng 2 thí nghiệm với 3.600 mẫu và 8.320 mẫu và đạt 85%. 3.3 Thiết kế mô hình tổng hợp xử lý tín hiệu Mô hình này được phát triển từ mô hình mạng neural đa lớp trong phần 3.2, ngoài việc nhận dạng tín hiệu EEG còn kết hợp với tín hiệu hướng mắt của người dùng thông qua camera. Mô hình này trung vào các vấn đề sau:  Sử dụng biến đổi theo phương pháp Hilbert Huang (HHT) để làm giảm nhiễu tín hiệu EEG vì HHT phù hợp với tín hiệu EEG cho kết quả tốt hơn các phương pháp khác.  Nhận dạng hướng mắt dựa trên hình ảnh khuôn mặt của người dùng kết hợp với nhận dạng tín hiệu EEG nhằm cải thiện hiệu quả của nhận dạng.  Thiết kế một hệ thống bao gồm phần cứng và phần mềm để thử nghiệm trong thế giới thực.  Dữ liệu thực nghiệm được thu thập từ 80 sinh viên trường Cao đẳng Công thương TP.HCM tình nguyện tham gia. Kiến trúc hệ thống bao gồm 3 khối được trình bày trong hình 3.5. Trang 16 Hình 3. 5 Kiến trúc hệ thống mô hình tổng hợp  Khối đầu tiên là khối nhận dạng tín hiệu EEG để trích xuất 5 tính năng.  Khối thứ hai là khối nhận dạng hướng mắt bằng cách nhận dạng mắt và lông mày từ hình ảnh khuôn mặt của người dùng để trích xuất 4 tính năng.  Khối thứ ba là mạng neural đa lớp với 9 nút đầu vào (4 cho camera và 5 cho EEG), 5 nút đầu ra được phân loại thành 5 tín hiệu điều khiển như "đi tiếp", "đi lùi", "rẽ trái", "rẽ phải" và "dừng". 3.3.1 Khối nhận dạng tín hiệu EEG Khối này thực hiện giống như mô hình được trình bày trong phần 3.2. Trước tiên, chọn các kênh có thông tin hữu ích và loại bỏ các kênh có thông tin dư thừa. Kế tiếp, dùng HHT để trích lọc đặc trưng và khử nhiễu dữ liệu. Sau đó, dùng thuật toán gom cụm K-Means để gom các cụm dữ liệu. 3.3.2 Nhận dạng tín hiệu hướng mắt Hình ảnh khuôn mặt được nhận từ camera và được cắt tại khu vực chứa thông tin về mắt để giảm thời gian xử lý, sau đó hình ảnh khuôn mặt được chuyển đổi thành hình ảnh nhị phân thỏa yêu cầu hiển thị Ảnh khuôn mặt Chuyển sang ảnh nhị phân Phát hiện mắt và lông mày Tính tỉ lệ mắt và lông mày Rút trích 04 đặc trưng Tín hiệu EEG Chọn kênh Biến đổi HHT Gom cụm Rút trích 05 đặc trưng MẠNG NEURAL ĐA LỚP Trang 17 đầy đủ 2 chân mày và 2 mắt như hình 3.6, giá trị ngưỡng được tính toán bằng thuật toán isodata. Hình 3. 6 Phát hiện mắt và lông mày  Sử dụng thuật toán phân đoạn ảnh để phát hiện trung tâm đồng tử của mắt, phân đoạn mắt và lông mày như trong hình 3.7. Hình 3. 7 Tâm đồng tử, phân đoạn ảnh mắt và lông mày  Tính tỷ lệ mắt trái và lông mày trái theo công thức (3.4) như trong hình 3.8. = (3.4) Hình 3. 8 Tỷ lệ mắt trái và lông mày trái  Tính tỷ lệ mắt phải và lông mày phải theo công thức (3.5) như trong hình 3.9. = (3.5) Trang 18 Hình 3. 9 Tỷ lệ mắt phải và lông mày phải  Tính toán tỷ lệ trung tâm đồng tử của mắt trái và chiều dài của mắt trái theo công thức (3.6) như trong hình 3.10. = (3.6) Hình 3. 10 Tỷ lệ tâm đồng tử và chiều dài mắt  Tính tỷ lệ trung tâm đồng tử của mắt phải và chiều dài của mắt phải theo công thức (3.7) như trong hình 3.10. = (3.7) 3.3.3 Mô hình mạng Neural đa lớp lan truyền ngược Mô hình mạng neural đa lớp lan truyền ngược được đề xuất bao gồm 3 lớp được trình bày trong hình 3.11. Trang 19 Hình 3. 11 Mô hình mạng Neural  Lớp đầu tiên chứa 9 nút như Delta, Theta, Alpha, Beta, Gamma, d1, d2, d3 và d4. Lớp này được gọi là lớp nhập.  Lớp thứ hai là lớp ẩn, số lượng Neural trong lớp ẩn là 11 Neural.  Lớp xuất chứa 5 nút, kết quả của nút này được sử dụng để phân loại tín hiệu EEG. Do hàm hành động được sử dụng trong mô hình này là hàm hyperbolic tangent, giá trị của nút xuất nằm trong khoảng [-1, 1]. Vì ngõ ra có 5 nút, nút nào có giá trị lớn nhất, nút đó sẽ được chọn và đó là tín hiệu điều khiển. 3.3.4 Chọn tập dữ liệu và kết quả thực nghiệm Dữ liệu thực nghiệm được thu thập từ 80 sinh viên trường Cao đẳng Công thương TP.HCM tham gia tình nguyện. Sinh viên đeo thiết bị Emotiv EEG và ngồi cách bảng quan sát 120cm. Dữ liệu thực nghiệm được chia thành 3 bộ dữ liệu như sau:  Tập dữ liệu huấn luyện được thu thập từ 70% dữ liệu của 60 SV.  Tập dữ liệu kiểm tra đầu tiên được thu thập từ 30% dữ liệu của 60 SV. Trang 20  Tập dữ liệu kiểm tra thứ hai được thu thập từ dữ liệu của 20 SV còn lại. Sau khi huấn luyện mạng Neural từ tập dữ liệu huấn luyện. Kết quả thực nghiệm của tập dữ liệu kiểm tra thứ nhất được thể hiện trong ma trận nhầm lẫn (confusion matrix) thể hiện trong bảng 3.5 và tỷ lệ nhận dạng thể hiện trong bảng 3.6. Bảng 3. 5 Ma trận nhầm lẫn của kết quả phân loại tập dữ liệu kiểm tra thứ nhất Phân loại thực tế Phân loại tiên đoán Con người Con vật Bông hoa Thành phố Phong cảnh Con người 91,2% 1,6% 3,1% 0,9% 2,7% Con vật 1,9% 91,1% 1,2% 3,2% 2,0% Bông hoa 2,8% 2,5% 92,8% 1,7% 1,5% Thành phố 2,4% 2,1% 0,7% 92,1% 1,9% Phong cảnh 1,7% 2,7% 2,2% 2,1% 91,9% Bảng 3. 6 Kết quả thực nghiệm trên tập dữ liệu kiểm tra thứ nhất TP TN FP FN AC P Con người 91.2% 91.3% 8.7% 8.8% 91.3% 91.3% Con vật 91.1% 91.1% 8.9% 8.9% 91.1% 91.1% Bông hoa 92.8% 92.6% 7.4% 7.2% 92.7% 92.6% Thành phố 92.1% 92.2% 7.8% 7.9% 92.2% 92.2% Phong cảnh 91.9% 92.1% 7.9% 8.1% 92.0% 92.1% Kết quả thực nghiệm của tập dữ liệu kiểm tra thứ hai được thể hiện trong ma trận nhầm lẫn (confusion matrix) thể hiện trong bảng 3.7 và tỷ lệ nhận dạng thể hiện trong bảng 3.8. Bảng 3. 7 Ma trận nhầm lẫn của kết quả phân loại tập dữ liệu kiểm tra thứ hai Phân loại thực tế Trang 21 Phân loại tiên đoán Con người Con vật Bông hoa Thành phố Phong cảnh Con người 90.7% 1.9% 2.7% 1.1% 3.1% Con vật 1.4% 90.8% 2.1% 2.6% 2.4% Bông hoa 2.3% 2.3% 92.3% 3.2% 1.7% Thành phố 3.1% 2.6% 1.2% 91.6% 1.3% Phong cảnh 2.5% 2.4% 1.7% 1.5% 91.5% Bảng 3. 8 Kết quả thực nghiệm trên tập dữ liệu kiểm tra thứ hai TP TN FP FN AC P Con người 90.7% 90.9% 9.1% 9.3% 90.8% 90.9% Con vật 90.8% 91.0% 9.0% 9.2% 90.9% 91.0% Bông hoa 92.3% 92.1% 7.9% 7.7% 92.2% 92.1% Thành phố 91.6% 91.8% 8.2% 8.4% 91.7% 91.8% Phong cảnh 91.5% 91.9% 8.1% 8.5% 91.7% 91.9% Kết quả thực nghiệm đối với tín hiệu hướng mắt thể hiện trong bảng 3.9 và đối với tín hiệu EEG thể hiện trong bảng 3.10. Bảng 3.11 so sánh 3 kết quả thực nghiệm. Đồ thị hình 3.12 mô tả so sánh kết quả thực nghiệm của 2 tín hiệu khi nhận dạng riêng biệt. Bảng 3. 9 Kết quả thực nghiệm trên tín hiệu hướng mắt TP TN FP FN AC P Con người 85.1% 85.7% 14.3% 14.9% 85.4% 85.6% Con vật 84.5% 84.1% 15.9% 15.5% 84.3% 84.2% Bông hoa 87.3% 86.3% 13.7% 12.7% 86.8% 86.4% Thành phố 83.6% 84.0% 16.0% 16.4% 83.8% 83.9% Phong cảnh 84.2% 83.2% 16.8% 15.8% 83.7% 83.4% Bảng 3. 10 Kết quả thực nghiệm trên tín hiệu EEG TP TN FP FN AC P Con người 90.2% 89.9% 10.1% 9.8% 90.1% 89.9% Trang 22 Con vật 90.3% 90.0% 10.0% 9.7% 90.2% 90.0% Bông hoa 92.3% 91.8% 8.2% 7.7% 92.1% 91.8% Thành phố 90.7% 90.4% 9.6% 9.3% 90.6% 90.4% Phong cảnh 90.4% 90.5% 9.5% 9.6% 90.5% 90.5% Bảng 3. 11 Kết quả thực nghiệm của 3 phương pháp nhận dạng EEG kết hợp Camera EEG Camera Con người 90,8% 90,1% 85,4% Con vật 90,9% 90,0% 84,3% Bông hoa 92,2% 91,8% 86,8% Thành phố 91,7% 90,4% 83,8% Phong cảnh 91,7% 90,5% 83,7% Hình 3. 12 Kết quả thực nghiệm trên 3 phương pháp riêng biệt 82.0% 84.0% 86.0% 88.0% 90.0% 92.0% 94.0% Con Người Động Vật Hoa Thành Phố Phong Cảnh SO SÁNH KẾT QUẢ THỰC NGHIỆM CỦA 3 PHƯƠNG PHÁP RIÊNG BIỆT EEG Kết hợp Camera EEG Camera Trang 23 CHƯƠNG 4 XÂY DỰNG PHẦN MỀM VÀ PHẦN CỨNG CHO HỆ THỐNG ĐIỀU KHIỂN XE LĂN MÔ HÌNH Trong chương này, tác giả xây dựng hệ thống phần cứng và phần mềm điều khiển xe lăn mô hình dựa trên các mô hình nghiên cứu được ở chương 3. Sau đó, đánh giá các kết quả thực nghiệm thực tế để làm rõ phần đóng góp ý nghĩa thực tiễn của luận án. 4.1 Hệ thống phần mềm điều khiển xe lăn Phần mềm điều khiển xe lăn được thiết kế trên Visual Studio C# 2015, giao diện phần mềm gồm có 4 chức năng chính như sau: 4.1.1 Đăng nhập hệ thống Trong phần này bắt buộc bất kỳ người nào sử dụng phần mềm điều phải có tài khoản (account) để đăng nhập hệ thống, nếu chưa có phải đăng ký vào hệ thống. Tài khoản cá nhân dùng để quản lý cơ sở dữ liệu tín hiệu điện não, thời gian huấn luyện, mức độ chính xác trong quá trình điều khiển. Giao diện của phần đăng nhập như hình 4.1. Đồ thị của 14 kênh tín hiệu EEG Hình ảnh từ camera Vị trí các điện cực Đăng ký/ đăng nhập hệ thống Hiển thị kết quả điều khiển Hình 4. 1 Giao diện đăng nhập hệ thống 4.1.2 Huấn luyện điều khiển xe lăn Đối với một người chưa từng tham gia điều khiển điều phải thực hiện bước này, giống như người chưa từng lái xe phải học lái xe trước khi lái xe, để có thể tự mình điều khiển được người tham gia phải thực hiện điều khiển 5 lệnh với tỉ lệ đạt trên 90% cho mỗi lệnh, mục đích việc huấn luyện này giúp người tham gia làm quen với việc điều khiển xe lăn và quen với việc tập trung trong điều khiển, giao diện phần huấn luyện được thể hiện như hình 4.2. Trang 24 Hình 4. 2 Giao diện huấn luyện 4.1.3 Xem đồ thị dữ liệu Phần mềm cũng có chức năng xem lại đồ thị dữ liệu tín hiệu điện não theo từng kênh, tùy vào mục đích sử nghiên cứu chỉ việc bấm vào vị trí kênh điện cực như hình 4.3. Hình 4. 3 Giao diện xem từng kênh tín hiệu điện não EEG 4.1.4 Trích đặc điểm dữ liệu Để trích đặc điểm dữ liệu ta áp dụng phương pháp HHT như đã trình bày trong phần cơ sở lý thuyết. Tổng số kênh cần xử lý là 10, mỗi kênh được phân tích ra thành 12 IMF (hàm bản chất), như vậy chúng ta có tất cả 120 IMF cho mỗi lần xử lý, chương trình con để trích xuất 1 kênh dữ liệu thành các IMF, sau đó từ các IMF này ta trích xuất ra theo 5 dạng sóng cơ bản như hình 4.4: Trang 25 Hình 4. 4 Một kênh tín hiệu EEG được biến đổi thành các dạng sóng cơ bản 4.2 Hệ thống phần cứng Hệ thống phần cứng bao gồm các thiết bị như bảng quan sát, xe lăn mô hình, thiết bị Emotiv và máy tính có phần mềm điều khiển, hệ thống được mô tả như hình 4.5. Hình 4. 5 Tư thế ngồi và các thiết bị phần cứng 4.2.1 Bảng quan sát Bảng quan sát có kích thước 46x42 cm, có thể điều chỉnh hướng nghiêng như một màn hình laptop cho phù hợp với từng người điều khiển, trên bảng quan sát có 5 hình kích thước mỗi hình là 8x12 cm được đặt cách đều nhau với khoảng cách là 8cm, một camera được đặt giữa hình người và bông hoa dùng để ghi nhận hướng di chuyển của mắt như hình 4.6. Trang 26 Hình 4. 6 Bảng quan sát Camera được gắn trên bảng quan sát để phát hiện sự di chuyển của mắt tương ứng với 05 hình trên bảng điều khiển. Camera được sử dụng của hãng Logitech với model C615, một hãng sản xuất camera nổi tiếng, có kích thước nhỏ gọn, dễ lắp ráp và có độ ổn định cao với các thông số kỹ thuật sau: Độ phân giải HD 1080, tần số quét 30fps, trường ngắm 78o, kết nối máy tính qua cổng USB. Camera được thể hiện trong hình 4.7. Hình 4. 7 Camera Logitech C615 4.2.2 Xe lăn mô hình Xe lăn mô hình dùng để mô phỏng quá trình di chuyển nhận lệnh từ máy tính, xe có kích thước nhỏ gọn có thể chạy tới, chạy lui, quay phải, quay trái và dừng lại phù hợp với yêu cầu của luận án, sơ đồ nguyên lý của mạch điện được thể hiện như hình 4.9, thông số chi tiết về xe được thể hiện trên bảng 4.1. Trang 27 Hình 4. 8 Xe lăn mô hình Bảng 4. 1 Thông số kỹ thuật của xe lăn mô hình Stt Mô tả xe Thông số kỹ thuật 1 Kích thước xe (dài – rộng – cao) 35x30x35 cm 2 Động cơ xe 200 vòng/phút, 9 VDC 3 Số lượng động cơ 02 4 Xe sử dụng pin sạc 9VDC 2000 mA 5 Trọng lượng xe 0.8 kg Sơ đồ nguyên lý của xe lăn bao gồm bộ xử lý arduino UNO3, driver cho 2 động cơ là board LM298, và module bluetooth HC-05 dùng để nhận lệnh điều khiển từ máy tính. Hình 4. 9 Sơ đồ nguyên lý mạch điện 4.2.3 Thiết bị Emotiv Trang 28 Một thiết bị không thể thiếu trong việc thực nghiệm điều khiển đó là thiết bị Emotiv EPOC+ (nón EPOC+) dùng để ghi nhận tín hiệu điện não và phát tín hiệu về máy tính thông qua bluetooth, thiết bị EPOC+ được thể hiện trong hình 4.10. Hình 4. 10

Các file đính kèm theo tài liệu này:

  • pdftom_tat_luan_an_mang_neural_trong_he_thong_dieu_khien_xe_lan.pdf
Tài liệu liên quan