Giảm bớt số kênh phân tích tín hiệu giúp giảm thời gian xử
lý, việc giảm số kênh tín hiệu dựa vào đặc điểm của từng vị trí điện
cực trên vỏ não cũng như qua quá trình thực nghiệm.
 Việc kết hợp gắn camera để quan sát hướng mắt giúp cho hệ
thống chạy được ổn định và giúp cho người tham gia huấn luyện nhanh
chóng thành thạo với việc điều khiển xe lăn hơn.
 Sử dụng tín hiệu điện não EEG trong lĩnh vực điều khiển
cũng là một đề xuất mới trong luận án vì hiện nay một số công trình
nghiên cứu trong nước chỉ tìm hiểu về tín hiệu điện não, lọc nhiễu tín
hiệu, và sử dụng chớp mắt trong việc nhận dạng và phát hiện ra hiện
tượng chớp mắt.
                
              
                                            
                                
            
 
            
                 34 trang
34 trang | 
Chia sẻ: honganh20 | Lượt xem: 540 | Lượt tải: 1 
              
            Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Mạng neural trong hệ thống điều khiển xe lăn cho người tàn tật nặng sử dụng điện não (eeg) và camera, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
 phố, phong cảnh, bông hoa và 
con vật), cái mới cải tiến của luận án so với các công trình trước là tác 
giả mạnh dạn sử dụng nhận dạng mẫu tín hiệu EEG trực tuyến có kết 
hợp camera để tăng độ chính xác của giải thuật, ngoài ra trong khâu 
tiền xử lý tác giả kết hợp giữa trích đặc điểm HHT với giải thuật gom 
cụm dữ liệu giúp cho việc nhận dạng thông qua mạng neural được 
nhanh hơn sử dụng phương pháp khác như wavelet transform và giúp 
cho mạng neural làm việc hiệu quả hơn, chính xác hơn và tránh 
overfitting. 
 Trang 5 
1.4 Mục đích nghiên cứu 
Tìm ra phương thức thu nhận 5 mẫu tín hiệu điện não EEG một 
cách dễ dàng và hiệu quả. 
Sử dụng các công cụ toán học để phân tích tín hiệu thành các đặc 
trưng cơ bản, sử dụng gom cụm dữ liệu trước khi đưa vào mạng neural 
để nhận đạng đối tượng. 
Kết hợp giữa tín hiệu camera và tín hiệu điện não để xác định 
được thời điểm xuất hiện mẫu tín hiệu chính xác phục vụ cho việc 
phân loại và điều khiển xe. 
1.5 Đối tượng và phạm vi nghiên cứu 
Đối tượng nghiên cứu chính trong luận án này là sử dụng mạng 
neural để phân loại 5 mẫu tín hiệu này thành các dạng lệnh điều khiển 
tương ứng với 5 lệnh điều khiển xe lăn chạy tới, chạy lui, quay phải, 
quay trái, dừng lại, trong luận án còn đề cập đến quá trình xử lý ảnh 
để phát hiện hướng mắt hỗ trợ cho việc điều khiển xe được chính xác 
và hiệu quả hơn, tuy nhiên trong phần xử lý ảnh tác giả không tập 
trung nhiều mà chủ yếu phần tín hiệu điện não EEG. 
1.6 Những đóng góp của luận án 
1.6.1 Đóng góp về mặt lý thuyết 
Tìm ra được bảng quan sát phù hợp và đơn giản để thu thập dữ 
liệu, kết hợp một cách khoa học giữa giải thuật trích đặc điểm và gom 
cụm dữ liệu trước khi đưa vào mạng neural để phân loại từng mẫu dữ 
liệu. 
1.6.2 Đóng góp về mặt thực tiễn 
Kết quả thực nghiệm của luận án cho thấy rằng, việc phân loại 
các đối tượng thông qua việc quan sát bằng mắt (những hình ảnh có 
đặc trưng khác nhau) nhưng đầu óc còn minh mẫn và mắt hoạt động 
như người bình thường là hoàn toàn thực hiện được. 
CHƯƠNG 2 – CƠ SỞ LÝ THUYẾT 
2.1 Các dạng sóng cơ bản của tín hiệu điện não EEG 
Sóng Delta có tần số từ 0 đến 3 Hz, biên độ lớn như hình 2.1, 
sóng này xuất hiện nhiều ở lứa tuổi từ bé đến một tuổi và ở những 
người lớn trong lúc ngủ, ngủ say, dạng sóng này thường xuất hiện khắp 
nơi trên da đầu. 
 Trang 6 
Hình 2. 1 Dạng sóng Delta 
Sóng Theta có tần số từ 3 Hz đến 7 Hz thường xuất hiện khi nhắm 
mắt và khi tinh thần ở trạng thái thư giãn như hình 2.2, xuất hiện ở 
những người trẻ hoặc lúc tỉnh thức ở người lớn tuổi và thường xuất 
hiện tại vùng thái dương. 
Hình 2. 2 Dạng sóng Theta 
Sóng Alpha có tần số từ 7 đến 13 Hz như hình 2.3, xuất hiện nhiều 
nhất ở người lớn tuổi, sóng alpha thường xảy ra 2 bên đầu nhưng có 
biên độ 2 bên không đều nhau. Sóng alpha xuất hiện khi nhắm mắt 
(trạng thái thư giãn) và thường biến mất khi mở mắt hay bị stress. 
Hình 2. 3 Dạng sóng Alpha 
Sóng Beta có biên độ nhỏ như hình 2.4, dãy tần số từ 13 đến 30 
Hz. Dạng sóng này thường xuất hiện ở những bệnh nhân người mà 
thường có tâm trạng cảnh giác, đề phòng, lo lắng Sóng Beta được 
phân bố đối xứng 2 bên và rõ ràng nhất ở phía trước, thường xuất hiện 
ở phía trước và trên đỉnh đầu vỏ não, biên độ sóng Beta thường nhỏ 
hơn 30uV. 
Hình 2. 4 Dạng sóng Beta 
 Trang 7 
Sóng Gamma có dãy tần số từ 30 đến 45 Hz như hình 2.5, thường 
được gọi là sóng nhanh Beta. Sóng này thường có biên độ thấp và hiếm 
khi xuất hiện, nhưng việc phát hiện sóng này đóng vai trò rất quan 
trọng trong việc xác định các bệnh lý về thần kinh, sóng này xảy ra ở 
trung tâm vỏ não. 
Hình 2. 5 Dạng sóng Gamma 
2.2 Vị trí các điện cực trên thiết bị EEG 
Não là một trong những cơ quan lớn nhất và phức tạp nhất trong 
cơ thể con người. Nó được hình thành từ hơn 100 tỉ dây thần kinh, liên 
lạc tới 1000 tỉ khớp thần kinh, các vị trí được gắn điện điện cực trên 
đầu theo tiêu chuẩn quốc tế 10/20 như hình 2.6. 
Hình 2. 6 Tên và vị trí các điện cực theo chuẩn quốc tế 10/20 
CHƯƠNG 3 
XÂY DỰNG MÔ HÌNH HỆ THỐNG ĐIỀU KHIỂN 
Để bắt đầu quá trình nghiên cứu, tác giả sử dụng CSDL được 
cung cấp trên website của trường Đại học San Diego (UCSD) có uy 
tín của Mỹ, xếp hạng 38 trên thế giới năm 2018, dữ liệu này thu được 
từ việc người tham gia nhìn vào 5 đối tượng hình ảnh khác nhau (con 
người, con vật, thành phố, phong cảnh và bông hoa), kích thước hình 
 Trang 8 
ảnh 8 bit màu (256 pixel rộng và 384 pixel cao). Tổng số lượng mẫu 
cho cơ sở dữ liệu này là 21.000 mẫu. 
Trong chương này, tác giả đã từng bước xây dựng các mô hình từ 
đơn giản đến phức tạp, sau đó đánh giá kết quả thực nghiệm trên CSDL 
của trường Đại học San Diego (UCSD) và từ 80 sinh viên trường Cao 
Đẳng Công Thương TP.HCM để làm rõ phần đóng góp và ý nghĩa 
khoa học của luận án. 
3.1 Mô hình mạng Neural đơn lớp 
Giai đoạn đầu tiên, tác giả xây dựng mô hình mạng neural để phân 
ra 2 loại tín hiệu riêng biệt (con vật và không phải con vật), mục đích 
trong lần nghiên cứu này là đánh giá xem mô hình neural có đáp ứng 
được yêu cầu phân loại hay không, hệ thống sử dụng phần mềm 
Matlab cho quá trình thực nghiệm này. 
CSDL của tín hiệu điện não EEG được trích đặc điểm bằng 
phương pháp biến đổi Wavelet dạng hình nón Mêhicô và sử dụng 
mạng Neural đơn lớp để nhận dạng. Mô hình hệ thống được thể hiện 
trong hình 3.1, mô hình này bao gồm 2 giai đoạn: giai đoạn 1: quá 
trình tiền xử lý nhẳm xử lý tín hiệu dữ liệu thô và tổng hợp thành 5 tín 
hiệu sóng Delta, Theta, Alpha, Beta và Gamma. Giai đoạn 2: xây dựng 
mạng Neural đơn lớp với 5 ngõ vào là 5 tín hiệu sóng Delta, Theta, 
Alpha, Beta, Gamma và một ngõ ra để xác định kết quả nhận dạng. 
Hình 3. 1 Mô hình hệ thống Neural đơn lớp 
Quá trình huấn luyện mạng được thực hiện trên tập dữ liệu huấn 
luyện với các tham số sau: 
 Tỷ lệ học cố định là: 0,7 
 Trọng số khởi tạo ngẫu nhiên trong đoạn từ -0,5 đến 0,5. 
Dữ liệu thô
Kết quả nhận dạng
Quá trình tiền xử lý
Mạng neural đơn lớp
 Trang 9 
 Ngưỡng sai số là 1x10-5 với cách tính sai số dựa trên MSE 
(Mean Square Error). 
 Số vòng lặp tối đa là: 5.000. 
Kết quả thực nghiệm nhận dạng trên tập dữ liệu kiểm tra được thể 
hiện trong bảng 3.1. 
Bảng 3. 1 Kết quả thực nghiệm trên dữ liệu kiểm tra 
Loại ảnh Con vật/Phong cảnh Tỷ lệ nhận dạng 
France Phong cảnh 99,13% 
Wild sheep Con vật 98,67% 
Wild cats Con vật 99,28% 
Bali, Indonesia Phong cảnh 62,44% 
Wild animals Con vật 99,64% 
California Coasts Phong cảnh 56,89% 
Wolves Con vật 98,64% 
Mushrooms Phong cảnh 95,16% 
Kenya Con vật 99,76% 
The big Apple Phong cảnh 98,79% 
Snakes, lizards... Con vật 98,32% 
Caves Con vật 67,18% 
Polar bears Con vật 99,03% 
Exotic Hong Kong Phong cảnh 98,72% 
Images of France Phong cảnh 99,37% 
Fabulous fruit Phong cảnh 98,25% 
Wild animals Con vật 93,97% 
Sand & solitude Con vật 98,42% 
Lions Con vật 62,78% 
Great Silk Road Phong cảnh 98,47% 
 Trang 10 
Từ kết quả thực nghiệm ở bảng 3.1, chúng ta nhận thấy kết quả 
nhận dạng chính xác trung bình trên tập dữ liệu kiểm tra là 91,15%. 
3.2 Mô hình mạng Neural đa lớp 
3.2.1 Mô hình hệ thống 
Dựa trên những kết quả đạt được từ mô hình mạng Neural đơn 
lớp, tác giả tiếp tục phát triển mô hình mạng Neural đa lớp với kết quả 
phân thành 5 lớp tương ứng với 5 tín hiệu điều khiển. Bảng 3.2 mô tả 
05 lệnh điều khiển tương ứng với kết quả phân lớp khi người dùng 
nhìn vào các loại hình ảnh tương ứng. 
Mô hình này đề xuất sử dụng biến đổi Wavelet để khử tín hiệu và 
trích xuất đặc trưng, sau đó dùng thuật toán K-mean để gom cụm các 
đặc trưng của dữ liệu sau đó đưa vào mạng Neural đa lớp để phân loại. 
Trong mô hình này tác giả chỉ chọn 10 kênh để xử lý nhằm giảm thời 
gian xử lý và thực hiện. Mô hình hệ thống được mô tả trong hình 3.2. 
Hình 3. 2 Mô hình hệ thống Neural đa lớp 
Mô hình mạng neural 3 lớp được trình bày trong hình 3.3. 
Lớp đầu tiên chứa năm nút đó là Delta, Theta, Alpha, Beta và 
Gamma. Lớp này được gọi là lớp đầu vào. 
Lớp thứ hai là lớp ẩn. Số lượng nút ẩn trong lớp ẩn được đặt là 5, 
10, 15, 20, 25, 30, 35, 40, 45 và 50. 
Lớp đầu ra chứa một nút, kết quả của này nút được sử dụng để 
phân lớp tín hiệu EEG. Hàm hành động được sử dụng trong mô hình 
này là hàm hyperbolic tangent, giá trị của đầu ra trong khoảng [-1, 1]. 
Tín hiệu EEG
Chọn kênh
Biến đổi Wavelet
Gom cụm
Mạng neural đa lớp
Kết quả phân lớp
 Trang 11 
Hình 3. 3 Mô hình mạng Neural đa lớp 
Trước khi sử dụng mô hình, mạng Neural cần phải vượt qua giai 
đoạn huấn luyện. Thuật toán huấn luyện được hiển thị trong hình 3.4, 
thể hiện một quy trình huấn luyện lan truyền ngược. 
 Trang 12 
Hình 3. 4 Thuật toán huấn luyện mạng Neural 
3.2.2 Kết quả thực nghiệm với mô hình mạng Neural đa lớp 
Bộ dữ liệu bao gồm 21.000 mẫu được chia thành tập con để huấn 
luyện (training) (70%), xác nhận (validation) (15%) và thử nghiệm 
(testing) (15%). Hệ thống sử dụng công cụ Matlab và EEGLab cho 
quá trình thử nghiệm, mạng Neural chia thành hai giai đoạn thử 
nghiệm. 
Giai đoạn huấn luyện được thực hiện trên tập dữ liệu huấn luyện, 
bằng cách sử dụng các cấu trúc có số nút ẩn khác nhau, trong lớp ẩn 
của mạng neural, thông qua các tham số sau như sau: 
 Tỷ lệ học: 0,7 
 Số vòng lặp tối đa: 5.000 
Khởi tạo bộ trọng số ngẫu nhiên
Nhận giá trị Delta, Theta, 
Alpha, Beta, Gamma
Tính giá trị nhập của các nút trong lớp ẩn
Tính giá trị xuất của các nút trong lớp ẩn
Tính giá trị nhập của nút xuất
Tính giá trị xuất của nút xuất
Tính lỗi của lớp xuất
Tính lỗi của lớp ẩn
Tính lỗi của hệ thống
Lỗi hệ thống <= ngưỡng?
Kết thúc
Cập nhật trọng số
Bắt đầu
Đúng
Sai
 Trang 13 
 Giá trị trọng số khởi tạo ngẫu nhiên từ 0 đến 1 
 Ngưỡng lỗi trung bình: 10-5 và dựa trên RMSE 
Độ chính xác của phân loại được đo bằng tỷ lệ kết quả phân loại 
sai so với tổng số mẫu theo (3.1). 
      =
  −      
 
 (3.1) 
Trong đó, n là tổng số mẫu, ntrue là số mẫu có kết quả phân loại 
đúng. 
Bảng 3. 2 Kết quả thực nghiệm 
Số Neural 
trong lớp 
ẩn 
(Lỗi trung 
bình) 
Average Error 
(Sai số tối thiểu) 
Minimum Error 
(Tỷ lệ nhận 
dạng) 
Accuracy Rate 
5 25.21% 21.98% 78.02% 
10 23.77% 20.04% 79.96% 
15 20.44% 17.13% 82.87% 
20 17.76% 14.21% 85.79% 
25 15.43% 11.88% 88.12% 
30 12.98% 10.06% 89.94% 
35 9.87% 7.74% 92.26% 
40 7.74% 6.43% 93.57% 
45 9.56% 7.92% 92.08% 
50 10.24% 8.63% 91.37% 
Ta có thể quan sát trong bảng 3.2 và thấy rằng kết quả phân loại 
của tập dữ liệu thử nghiệm không ngừng tăng lên cho đến khi đạt giá 
trị tốt nhất có thể (40 Neural trong lớp ẩn và tỷ lệ chính xác là 93,57%). 
Sau đó, kết quả bắt đầu giảm khi số lượng Neural trong lớp ẩn tăng 
lên. Điều này xảy ra được gọi là overfitting. Một ma trận nhầm lẫn 
(confusion matrix) chứa thông tin về phân loại thực tế và dự đoán được 
thực hiện bởi một hệ thống. Bảng 3.3 mô tả hiệu năng của hệ thống 
được đánh giá bởi dữ liệu trong ma trận nhầm lẫn với 40 nút ẩn trong 
lớp ẩn. 
Bảng 3. 3 Ma trận nhầm lẫn của kết quả phân loại 
 Thực tế 
Tiên 
đoán 
 Con 
vật 
Phong 
cảnh 
Thành 
phố 
Con 
người 
Bông 
hoa 
 Trang 14 
Con vật 93.8% 1.4% 1.5% 2.0% 1.6% 
Phong cảnh 1.1% 93.6% 3.1% 1.5% 1.2% 
Thành phố 1.6% 1.3% 93.5% 1.6% 1.8% 
Con người 1.9% 1.8% 1.3% 93.2% 1.7% 
Bông hoa 1.7% 1.9% 0.8% 1.8% 93.8% 
Để cung cấp một phương pháp trực quan và dễ hiểu hơn trong 
việc đo lường chất lượng dự đoán, các công thức sau được sử dụng để 
kiểm tra chất lượng hiệu quả. 
Độ chính xác Accuracy (AC) là tỷ lệ dự đoán chính xác. Nó được 
xác định bằng cách sử dụng công thức (3.2). 
   =
   +   
   +    +    +   
 (3.2) 
Độ chính xác Precision (P) là tỷ lệ của các trường hợp đúng được 
dự đoán là chính xác, được tính bằng công thức (3.3). 
  =
  
   +   
 (3.3) 
Trong đó, True Possitive (TP) đề cập đến các bộ dữ liệu đúng 
được phân loại chính xác là đúng. True Negative (TN) đề cập đến các 
bộ dữ liệu sai được phân loại chính xác là sai. False Possitive (FP) đề 
cập đến các bộ dữ liệu sai được phân loại không chính xác là đúng. 
False Negative (FN) đề cập đến các bộ dữ liệu đúng được phân loại 
không chính xác là sai. 
Tỷ lệ nhận dạng thành với 40 nút ẩn trong lớp ẩn được đưa ra 
trong bảng 3.4 
Bảng 3. 4 Kết quả thực nghiệm 
 TP TN FP FN AC P 
Con vật 93,8% 93,6% 6,4% 6,2% 93,7% 93,6% 
Phong cảnh 93,6% 93,2% 6,8% 6,4% 93,4% 93,2% 
Thành phố 93,5% 93,8% 6,3% 6,6% 93,6% 93,7% 
Con người 93,2% 93,4% 6,6% 6,8% 93,3% 93,4% 
 Trang 15 
Bông hoa 93,8% 93,9% 6,1% 6,2% 93,9% 93,9% 
Những kết quả này cũng được so sánh với một số nghiên cứu 
trước đây như xác định tín hiệu EEG dựa trên nháy mắt với 15.360 
mẫu và đạt 90,85%, cây quyết định đạt tối đa 85%, dựa trên chuyển 
động của mắt bằng 2 thí nghiệm với 3.600 mẫu và 8.320 mẫu và đạt 
85%. 
3.3 Thiết kế mô hình tổng hợp xử lý tín hiệu 
Mô hình này được phát triển từ mô hình mạng neural đa lớp trong 
phần 3.2, ngoài việc nhận dạng tín hiệu EEG còn kết hợp với tín hiệu 
hướng mắt của người dùng thông qua camera. Mô hình này trung vào 
các vấn đề sau: 
 Sử dụng biến đổi theo phương pháp Hilbert Huang (HHT) 
để làm giảm nhiễu tín hiệu EEG vì HHT phù hợp với tín hiệu EEG 
cho kết quả tốt hơn các phương pháp khác. 
 Nhận dạng hướng mắt dựa trên hình ảnh khuôn mặt của 
người dùng kết hợp với nhận dạng tín hiệu EEG nhằm cải thiện hiệu 
quả của nhận dạng. 
 Thiết kế một hệ thống bao gồm phần cứng và phần mềm để 
thử nghiệm trong thế giới thực. 
 Dữ liệu thực nghiệm được thu thập từ 80 sinh viên trường 
Cao đẳng Công thương TP.HCM tình nguyện tham gia. 
Kiến trúc hệ thống bao gồm 3 khối được trình bày trong hình 3.5. 
 Trang 16 
Hình 3. 5 Kiến trúc hệ thống mô hình tổng hợp 
 Khối đầu tiên là khối nhận dạng tín hiệu EEG để trích xuất 
5 tính năng. 
 Khối thứ hai là khối nhận dạng hướng mắt bằng cách nhận 
dạng mắt và lông mày từ hình ảnh khuôn mặt của người dùng để trích 
xuất 4 tính năng. 
 Khối thứ ba là mạng neural đa lớp với 9 nút đầu vào (4 cho 
camera và 5 cho EEG), 5 nút đầu ra được phân loại thành 5 tín hiệu 
điều khiển như "đi tiếp", "đi lùi", "rẽ trái", "rẽ phải" và "dừng". 
3.3.1 Khối nhận dạng tín hiệu EEG 
Khối này thực hiện giống như mô hình được trình bày trong phần 
3.2. Trước tiên, chọn các kênh có thông tin hữu ích và loại bỏ các kênh 
có thông tin dư thừa. Kế tiếp, dùng HHT để trích lọc đặc trưng và khử 
nhiễu dữ liệu. Sau đó, dùng thuật toán gom cụm K-Means để gom các 
cụm dữ liệu. 
3.3.2 Nhận dạng tín hiệu hướng mắt 
Hình ảnh khuôn mặt được nhận từ camera và được cắt tại khu vực 
chứa thông tin về mắt để giảm thời gian xử lý, sau đó hình ảnh khuôn 
mặt được chuyển đổi thành hình ảnh nhị phân thỏa yêu cầu hiển thị 
Ảnh khuôn mặt
Chuyển sang ảnh 
nhị phân
Phát hiện mắt và 
lông mày
Tính tỉ lệ mắt và 
lông mày
Rút trích 04 đặc 
trưng
Tín hiệu EEG
Chọn kênh
Biến đổi HHT
Gom cụm
Rút trích 05 đặc 
trưng
MẠNG NEURAL ĐA LỚP
 Trang 17 
đầy đủ 2 chân mày và 2 mắt như hình 3.6, giá trị ngưỡng được tính 
toán bằng thuật toán isodata. 
Hình 3. 6 Phát hiện mắt và lông mày 
 Sử dụng thuật toán phân đoạn ảnh để phát hiện trung tâm 
đồng tử của mắt, phân đoạn mắt và lông mày như trong hình 3.7. 
Hình 3. 7 Tâm đồng tử, phân đoạn ảnh mắt và lông mày 
 Tính tỷ lệ mắt trái và lông mày trái theo công thức (3.4) như 
trong hình 3.8. 
   =
  
  
(3.4) 
Hình 3. 8 Tỷ lệ mắt trái và lông mày trái 
 Tính tỷ lệ mắt phải và lông mày phải theo công thức (3.5) 
như trong hình 3.9. 
   =
  
  
(3.5) 
 Trang 18 
Hình 3. 9 Tỷ lệ mắt phải và lông mày phải 
 Tính toán tỷ lệ trung tâm đồng tử của mắt trái và chiều dài 
của mắt trái theo công thức (3.6) như trong hình 3.10. 
   =
  
  
(3.6) 
Hình 3. 10 Tỷ lệ tâm đồng tử và chiều dài mắt 
 Tính tỷ lệ trung tâm đồng tử của mắt phải và chiều dài của 
mắt phải theo công thức (3.7) như trong hình 3.10. 
   =
  
  
 (3.7) 
3.3.3 Mô hình mạng Neural đa lớp lan truyền ngược 
Mô hình mạng neural đa lớp lan truyền ngược được đề xuất bao 
gồm 3 lớp được trình bày trong hình 3.11. 
 Trang 19 
Hình 3. 11 Mô hình mạng Neural 
 Lớp đầu tiên chứa 9 nút như Delta, Theta, Alpha, Beta, Gamma, 
d1, d2, d3 và d4. Lớp này được gọi là lớp nhập. 
 Lớp thứ hai là lớp ẩn, số lượng Neural trong lớp ẩn là 11 Neural. 
 Lớp xuất chứa 5 nút, kết quả của nút này được sử dụng để phân 
loại tín hiệu EEG. Do hàm hành động được sử dụng trong mô hình này 
là hàm hyperbolic tangent, giá trị của nút xuất nằm trong khoảng [-1, 
1]. Vì ngõ ra có 5 nút, nút nào có giá trị lớn nhất, nút đó sẽ được chọn 
và đó là tín hiệu điều khiển. 
3.3.4 Chọn tập dữ liệu và kết quả thực nghiệm 
Dữ liệu thực nghiệm được thu thập từ 80 sinh viên trường Cao đẳng 
Công thương TP.HCM tham gia tình nguyện. Sinh viên đeo thiết bị 
Emotiv EEG và ngồi cách bảng quan sát 120cm. Dữ liệu thực nghiệm 
được chia thành 3 bộ dữ liệu như sau: 
 Tập dữ liệu huấn luyện được thu thập từ 70% dữ liệu của 60 SV. 
 Tập dữ liệu kiểm tra đầu tiên được thu thập từ 30% dữ liệu của 
60 SV. 
 Trang 20 
 Tập dữ liệu kiểm tra thứ hai được thu thập từ dữ liệu của 20 SV 
còn lại. 
Sau khi huấn luyện mạng Neural từ tập dữ liệu huấn luyện. Kết 
quả thực nghiệm của tập dữ liệu kiểm tra thứ nhất được thể hiện trong 
ma trận nhầm lẫn (confusion matrix) thể hiện trong bảng 3.5 và tỷ lệ 
nhận dạng thể hiện trong bảng 3.6. 
Bảng 3. 5 Ma trận nhầm lẫn của kết quả phân loại tập dữ liệu kiểm 
tra thứ nhất 
 Phân loại thực tế 
Phân 
loại 
tiên 
đoán 
Con 
người 
Con 
vật 
Bông 
hoa 
Thành 
phố 
Phong 
cảnh 
Con người 91,2% 1,6% 3,1% 0,9% 2,7% 
Con vật 1,9% 91,1% 1,2% 3,2% 2,0% 
Bông hoa 2,8% 2,5% 92,8% 1,7% 1,5% 
Thành phố 2,4% 2,1% 0,7% 92,1% 1,9% 
Phong cảnh 1,7% 2,7% 2,2% 2,1% 91,9% 
Bảng 3. 6 Kết quả thực nghiệm trên tập dữ liệu kiểm tra thứ nhất 
 TP TN FP FN AC P 
Con người 91.2% 91.3% 8.7% 8.8% 91.3% 91.3% 
Con vật 91.1% 91.1% 8.9% 8.9% 91.1% 91.1% 
Bông hoa 92.8% 92.6% 7.4% 7.2% 92.7% 92.6% 
Thành phố 92.1% 92.2% 7.8% 7.9% 92.2% 92.2% 
Phong cảnh 91.9% 92.1% 7.9% 8.1% 92.0% 92.1% 
Kết quả thực nghiệm của tập dữ liệu kiểm tra thứ hai được thể 
hiện trong ma trận nhầm lẫn (confusion matrix) thể hiện trong bảng 
3.7 và tỷ lệ nhận dạng thể hiện trong bảng 3.8. 
Bảng 3. 7 Ma trận nhầm lẫn của kết quả phân loại tập dữ liệu kiểm 
tra thứ hai 
 Phân loại thực tế 
 Trang 21 
Phân 
loại 
tiên 
đoán 
Con 
người 
Con 
vật 
Bông 
hoa 
Thành 
phố 
Phong 
cảnh 
Con người 90.7% 1.9% 2.7% 1.1% 3.1% 
Con vật 1.4% 90.8% 2.1% 2.6% 2.4% 
Bông hoa 2.3% 2.3% 92.3% 3.2% 1.7% 
Thành phố 3.1% 2.6% 1.2% 91.6% 1.3% 
Phong cảnh 2.5% 2.4% 1.7% 1.5% 91.5% 
Bảng 3. 8 Kết quả thực nghiệm trên tập dữ liệu kiểm tra thứ hai 
 TP TN FP FN AC P 
Con người 90.7% 90.9% 9.1% 9.3% 90.8% 90.9% 
Con vật 90.8% 91.0% 9.0% 9.2% 90.9% 91.0% 
Bông hoa 92.3% 92.1% 7.9% 7.7% 92.2% 92.1% 
Thành phố 91.6% 91.8% 8.2% 8.4% 91.7% 91.8% 
Phong cảnh 91.5% 91.9% 8.1% 8.5% 91.7% 91.9% 
Kết quả thực nghiệm đối với tín hiệu hướng mắt thể hiện trong 
bảng 3.9 và đối với tín hiệu EEG thể hiện trong bảng 3.10. Bảng 3.11 
so sánh 3 kết quả thực nghiệm. Đồ thị hình 3.12 mô tả so sánh kết quả 
thực nghiệm của 2 tín hiệu khi nhận dạng riêng biệt. 
Bảng 3. 9 Kết quả thực nghiệm trên tín hiệu hướng mắt 
 TP TN FP FN AC P 
Con người 85.1% 85.7% 14.3% 14.9% 85.4% 85.6% 
Con vật 84.5% 84.1% 15.9% 15.5% 84.3% 84.2% 
Bông hoa 87.3% 86.3% 13.7% 12.7% 86.8% 86.4% 
Thành phố 83.6% 84.0% 16.0% 16.4% 83.8% 83.9% 
Phong cảnh 84.2% 83.2% 16.8% 15.8% 83.7% 83.4% 
Bảng 3. 10 Kết quả thực nghiệm trên tín hiệu EEG 
 TP TN FP FN AC P 
Con người 90.2% 89.9% 10.1% 9.8% 90.1% 89.9% 
 Trang 22 
Con vật 90.3% 90.0% 10.0% 9.7% 90.2% 90.0% 
Bông hoa 92.3% 91.8% 8.2% 7.7% 92.1% 91.8% 
Thành phố 90.7% 90.4% 9.6% 9.3% 90.6% 90.4% 
Phong cảnh 90.4% 90.5% 9.5% 9.6% 90.5% 90.5% 
Bảng 3. 11 Kết quả thực nghiệm của 3 phương pháp nhận dạng 
 EEG kết hợp Camera EEG Camera 
Con người 90,8% 90,1% 85,4% 
Con vật 90,9% 90,0% 84,3% 
Bông hoa 92,2% 91,8% 86,8% 
Thành phố 91,7% 90,4% 83,8% 
Phong cảnh 91,7% 90,5% 83,7% 
Hình 3. 12 Kết quả thực nghiệm trên 3 phương pháp riêng biệt 
82.0%
84.0%
86.0%
88.0%
90.0%
92.0%
94.0%
Con Người Động Vật Hoa Thành Phố Phong Cảnh
SO SÁNH KẾT QUẢ THỰC NGHIỆM CỦA 3 PHƯƠNG 
PHÁP RIÊNG BIỆT
EEG Kết hợp Camera EEG Camera
 Trang 23 
CHƯƠNG 4 
XÂY DỰNG PHẦN MỀM VÀ PHẦN CỨNG CHO HỆ 
THỐNG ĐIỀU KHIỂN XE LĂN MÔ HÌNH 
Trong chương này, tác giả xây dựng hệ thống phần cứng và phần 
mềm điều khiển xe lăn mô hình dựa trên các mô hình nghiên cứu được 
ở chương 3. Sau đó, đánh giá các kết quả thực nghiệm thực tế để làm 
rõ phần đóng góp ý nghĩa thực tiễn của luận án. 
4.1 Hệ thống phần mềm điều khiển xe lăn 
Phần mềm điều khiển xe lăn được thiết kế trên Visual Studio C# 
2015, giao diện phần mềm gồm có 4 chức năng chính như sau: 
4.1.1 Đăng nhập hệ thống 
Trong phần này bắt buộc bất kỳ người nào sử dụng phần mềm 
điều phải có tài khoản (account) để đăng nhập hệ thống, nếu chưa có 
phải đăng ký vào hệ thống. Tài khoản cá nhân dùng để quản lý cơ sở 
dữ liệu tín hiệu điện não, thời gian huấn luyện, mức độ chính xác trong 
quá trình điều khiển. Giao diện của phần đăng nhập như hình 4.1. 
Đồ thị của 14 kênh tín 
hiệu EEG
Hình ảnh từ 
camera
Vị trí các 
điện cực
Đăng ký/ đăng 
nhập hệ thống
Hiển thị kết quả 
điều khiển 
Hình 4. 1 Giao diện đăng nhập hệ thống 
4.1.2 Huấn luyện điều khiển xe lăn 
Đối với một người chưa từng tham gia điều khiển điều phải thực 
hiện bước này, giống như người chưa từng lái xe phải học lái xe trước 
khi lái xe, để có thể tự mình điều khiển được người tham gia phải thực 
hiện điều khiển 5 lệnh với tỉ lệ đạt trên 90% cho mỗi lệnh, mục đích 
việc huấn luyện này giúp người tham gia làm quen với việc điều khiển 
xe lăn và quen với việc tập trung trong điều khiển, giao diện phần huấn 
luyện được thể hiện như hình 4.2. 
 Trang 24 
Hình 4. 2 Giao diện huấn luyện 
4.1.3 Xem đồ thị dữ liệu 
Phần mềm cũng có chức năng xem lại đồ thị dữ liệu tín hiệu điện 
não theo từng kênh, tùy vào mục đích sử nghiên cứu chỉ việc bấm vào 
vị trí kênh điện cực như hình 4.3. 
Hình 4. 3 Giao diện xem từng kênh tín hiệu điện não EEG 
4.1.4 Trích đặc điểm dữ liệu 
Để trích đặc điểm dữ liệu ta áp dụng phương pháp HHT như đã 
trình bày trong phần cơ sở lý thuyết. Tổng số kênh cần xử lý là 10, 
mỗi kênh được phân tích ra thành 12 IMF (hàm bản chất), như vậy 
chúng ta có tất cả 120 IMF cho mỗi lần xử lý, chương trình con để 
trích xuất 1 kênh dữ liệu thành các IMF, sau đó từ các IMF này ta trích 
xuất ra theo 5 dạng sóng cơ bản như hình 4.4: 
 Trang 25 
Hình 4. 4 Một kênh tín hiệu EEG được biến đổi thành các dạng sóng 
cơ bản 
4.2 Hệ thống phần cứng 
Hệ thống phần cứng bao gồm các thiết bị như bảng quan sát, xe 
lăn mô hình, thiết bị Emotiv và máy tính có phần mềm điều khiển, hệ 
thống được mô tả như hình 4.5. 
Hình 4. 5 Tư thế ngồi và các thiết bị phần cứng 
4.2.1 Bảng quan sát 
Bảng quan sát có kích thước 46x42 cm, có thể điều chỉnh hướng 
nghiêng như một màn hình laptop cho phù hợp với từng người điều 
khiển, trên bảng quan sát có 5 hình kích thước mỗi hình là 8x12 cm 
được đặt cách đều nhau với khoảng cách là 8cm, một camera được đặt 
giữa hình người và bông hoa dùng để ghi nhận hướng di chuyển của 
mắt như hình 4.6. 
 Trang 26 
Hình 4. 6 Bảng quan sát 
Camera được gắn trên bảng quan sát để phát hiện sự di chuyển 
của mắt tương ứng với 05 hình trên bảng điều khiển. Camera được sử 
dụng của hãng Logitech với model C615, một hãng sản xuất camera 
nổi tiếng, có kích thước nhỏ gọn, dễ lắp ráp và có độ ổn định cao với 
các thông số kỹ thuật sau: Độ phân giải HD 1080, tần số quét 30fps, 
trường ngắm 78o, kết nối máy tính qua cổng USB. Camera được thể 
hiện trong hình 4.7. 
Hình 4. 7 Camera Logitech C615 
4.2.2 Xe lăn mô hình 
Xe lăn mô hình dùng để mô phỏng quá trình di chuyển nhận lệnh 
từ máy tính, xe có kích thước nhỏ gọn có thể chạy tới, chạy lui, quay 
phải, quay trái và dừng lại phù hợp với yêu cầu của luận án, sơ đồ 
nguyên lý của mạch điện được thể hiện như hình 4.9, thông số chi tiết 
về xe được thể hiện trên bảng 4.1. 
 Trang 27 
Hình 4. 8 Xe lăn mô hình 
Bảng 4. 1 Thông số kỹ thuật của xe lăn mô hình 
Stt Mô tả xe Thông số kỹ thuật 
1 Kích thước xe (dài – rộng – cao) 35x30x35 cm 
2 Động cơ xe 200 vòng/phút, 9 VDC 
3 Số lượng động cơ 02 
4 Xe sử dụng pin sạc 9VDC 2000 mA 
5 Trọng lượng xe 0.8 kg 
Sơ đồ nguyên lý của xe lăn bao gồm bộ xử lý arduino UNO3, 
driver cho 2 động cơ là board LM298, và module bluetooth HC-05 
dùng để nhận lệnh điều khiển từ máy tính. 
Hình 4. 9 Sơ đồ nguyên lý mạch điện 
4.2.3 Thiết bị Emotiv 
 Trang 28 
Một thiết bị không thể thiếu trong việc thực nghiệm điều khiển 
đó là thiết bị Emotiv EPOC+ (nón EPOC+) dùng để ghi nhận tín hiệu 
điện não và phát tín hiệu về máy tính thông qua bluetooth, thiết bị 
EPOC+ được thể hiện trong hình 4.10. 
Hình 4. 10 
            Các file đính kèm theo tài liệu này:
 tom_tat_luan_an_mang_neural_trong_he_thong_dieu_khien_xe_lan.pdf tom_tat_luan_an_mang_neural_trong_he_thong_dieu_khien_xe_lan.pdf