Cảm biến điện thoại thông minh hiện nay ngày càng đa dạng. Khi sử dụng kết hợp nhiều cảm biến sẽ làm tiêu hao năng lượng nên lựa chọn cảm biến gia tốc có ưu điểm tốn ít tài nguyên của thiết bị để xây dựng hệ thống là một trong hướng tiếp cận phù hợp đáp ứng được yêu cầu của bài toán phân tích, nhận dạng hành vi giao thông dựa trên điện thoại thông minh của người điều khiển phương tiện mang theo trong điều kiện, môi trường giao thông đô thị Việt Nam.
27 trang |
Chia sẻ: honganh20 | Lượt xem: 395 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Nhận dạng hành vi của người tham gia giao thông dựa trên cảm biến điện thoại, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ong một thời gian ngắn tương ứng với một hành động cơ bản xảy ra, nếu phát hiện thấy có các hành động sai khác xảy ra thì xác định là một hành vi bất thường. Sự bất thường được đánh giá bằng việc phân đoạn cửa sổ hành động giao thông cơ bản thành các cửa sổ dữ liệu có kích thước nhỏ hơn rồi so sánh nhãn hành động nhận dạng được của các cửa sổ này so với nhãn của hành động giao thông cơ bản đó để xác định sự bất thường hay bình thường dựa trên việc so sánh tỉ lệ sai khác với một tỉ lệ cho trước
Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của Luận án là phân tích, nhận dạng hành vi, hành vi giao thông bất thường của người điều khiển phương tiện. Dựa trên cảm biến gia tốc thu được từ điện thoại thông minh của các đối tượng sử dụng phương tiện để đưa ra giải pháp nhận dạng hành động cơ bản làm cơ sở cho nhận dạng hành vi giao thông bất thường ở đô thị của Việt Nam.
Phương pháp nghiên cứu
Luận án sử dụng các phương pháp khảo sát, tổng hợp, phân tích thông tin cần thiết; tham khảo, đánh giá các nghiên cứu liên quan để từ đó tìm ra hướng giải quyết vấn đề. Xác định rõ đối tượng và phạm vi nghiên cứu để từ đó xây dựng mô hình nhận dạng hành động và hành vi giao thông.
Khảo sát các kỹ thuật thu thập, xử lý dữ liệu cảm biến, phân tích các đặc điểm của phương tiện, hành động giao thông để từ đó đề xuất giải pháp nhận dạng hành động, hành vi giao thông bất thường dựa trên cảm biến thu được. Phương pháp phân tích sử dụng lý thuyết và chứng minh bằng thực nghiệm được áp dụng để thực hiện yêu cầu bài toán đặt ra
Đóng góp của luận án
Đóng góp thứ nhất của luận án: là đề xuất tập thuộc tính đặc trưng dựa trên miền thời gian và miền tần số nhằm biến đổi dữ liệu cảm biến thành dữ liệu đặc trưng phục vụ cho nhận dạng hành động và hành vi bất thường. Kết quả đọ đo phân lớp dữ liệu được sử dụng để đánh giá, lựa chọn tập thuộc tính. Trong đó, sử dụng tham số Hjorth cho các đại lượng khác nhau nhằm thu được các thuộc tính phù hợp để biến đổi dữ liệu cảm biến thành dữ liệu đặc trưng. Tập thuộc tính đặc trưng phù hợp sẽ sử dụng làm cơ sở cho việc xây dựng hệ thống nhận dạng bằng phương pháp phân lớp [CT2], [CT4].
Khảo sát, lựa chọn kích thước cửa sổ và tỉ lệ chồng dữ liệu để phân tích tìm ra các giá trị tương ứng, phù hợp với các hành động. Qua đó, hỗ trợ hệ thống nhận dạng các hành động giao thông có hiệu quả hơn [CT1], [CT2], [CT4]. Kết quả nhận dạng bằng hệ thống đề xuất cao hơn so với một số nghiên cứu đã được công bố đã có [CT4].
Đóng góp thứ hai của luận án: đề xuất giải pháp phát hiện hành vi giao thông bất thường theo một hướng tiếp cận mới, hướng tiếp cận này dựa trên kết quả nhận dạng hành động cơ bản. Trong thời gian ngắn mà một hành động cơ bản xảy ra, nếu hệ thống nhận dạng được chuỗi các hành động bất thường thì xác định đây là hành vi bất thường. Các giải pháp, kết quả thu được của luận án được trình bày trong 4 công trình đã được công bố. Trong đó có 1 bài báo quốc tế có chỉ số SCIE; 3 bài báo hội nghị quốc tế có phản biện và có chỉ số Scopus được thể hiện ở các công trình [CT1], [CT2], [CT3] và [CT4].
Bố cục của luận án
Ngoài phần mở đầu, mục lục, kết luận và tài liệu tham khảo, nội dung chính của luận án được chia thành 3 chương, cụ thể như sau:
Chương 1: Giới thiệu một số khái niệm cơ bản về hành động, hành vi giao thông và bài toán nhận dạng hành vi giao sử dụng dữ liệu cảm biến.
Chương 2: Xây dựng hệ thống nhận dạng hành động giao thông cơ bản dựa trên cảm biến điện thoại.
Chương 3: Dựa trên kết quả của hệ thống nhận dạng hành động, đề xuất giải pháp nhận dạng hành vi giao thông, hành vi bất thường.
TỔNG QUAN VỀ PHÂN TÍCH HÀNH VI
Giới thiệu
Cảm biến thu được từ điện thoại được dùng phân tích trong nhiều bài toán khác nhau. Trong đó có bài toán nhận dạng hành vi. Vì điện thoại thông minh được sử dụng cho nhiều mục đích cá nhân khác nhau cũng như có giới hạn về năng lượng, sự đa dạng về chủng loại, chất lượng của thiết bị phần cứng dẫn đến yêu cầu cần phải xây dựng hệ thống, giải pháp phân tích, phát hiện hành động, hành vi sao cho phù hợp là một bài toán đặt ra cần được giải quyết.
Một số khái niệm cơ bản
Hành động giao thông
Hành động giao thông là việc người điều khiển thay đổi trạng thái của phương tiện trong quá trình tham gia giao thông[10].
Hành vi giao thông
Hành vi giao thông là sự biểu hiện thay đổi trạng thái của phương tiện theo những cách thức, mức độ, tính chất khác nhau trong quá trình lưu thông [10][11][12] [13].
Sử dụng dữ liệu cảm biến để phân tích hành vi
Cảm biến điện thoại thông minh hiện nay ngày càng đa dạng. Khi sử dụng kết hợp nhiều cảm biến sẽ làm tiêu hao năng lượng nên lựa chọn cảm biến gia tốc có ưu điểm tốn ít tài nguyên của thiết bị để xây dựng hệ thống là một trong hướng tiếp cận phù hợp đáp ứng được yêu cầu của bài toán phân tích, nhận dạng hành vi giao thông dựa trên điện thoại thông minh của người điều khiển phương tiện mang theo trong điều kiện, môi trường giao thông đô thị Việt Nam.
Một số nghiên cứu liên quan
Các nghiên cứu công bố gần đây đã chỉ ra hiệu quả của việc kết hợp nhiều loại cảm biến khác nhau trong bài toán phân tích hành vi. Tuy nhiên, việc chỉ sử dụng dữ liệu cảm biến gia tốc sẽ phù hợp với các điện thoại phổ biến và ít tiêu hao năng lượng. Cũng như hướng tiếp cận sử dụng tập đặc trưng và phương pháp phân lớp cho dạng bài toán này.
Phương pháp nhận dạng hành vi giao thông dựa trên cảm biến
Từ những vấn đề trên chúng tôi đề xuất phương phân tích, pháp nhận dạng hành vi giao thông bất thường dựa trên cảm biến gia tốc như Hình 11 dưới đây:
Hình 11. Hệ thống phân tích hành vi bất thường
Kết luận
Trong chương này, chúng tôi đã tìm hiểu, khảo sát các nghiên cứu liên quan đến bài toán nhận dạng hành vi. Làm rõ một số khái niệm cơ bản về hành động, hành vi, hành vi bất thường trong lĩnh vực giao thông. Tìm hiểu phương pháp, kỹ thuật phân tích, nhận dạng hành vi, đặc biệt là hướng tiếp cận sử dụng dữ liệu cảm biến điện thoại thông minh thu được của người điều khiển phương tiện
NHẬN DẠNG HÀNH ĐỘNG GIAO THÔNG
Giới thiệu
Trong chương này, Luận án tập trung vào việc xây dựng hệ thống nhận dạng hành động cơ bản của các đối tượng điều khiển phương tiện giao thông dựa trên tín hiệu cảm biến thu được từ điện thoại mang theo. Hướng tiếp cận sử dụng biến đổi dữ liệu cảm biến thô thành dữ liệu đặc trưng áp dụng kỹ thuật cửa sổ dữ liệu với tập thuộc tính đặc trưng được khảo sát và lựa chọn. Sau đó, nhận dạng bằng phương pháp phân lớp.
Sử dụng dữ liệu cảm biến để nhận dạng hành động giao thông
Sử dụng tín hiệu cảm biến của điện thoại mang theo để phân tích, nhận dạng ngày càng được phổ biến và sử dụng với các yêu cầu khác nhau trong nhiều hệ thống thông minh. Một số hướng nghiên cứu đã sử dụng cảm biến hình ảnh thu được từ camera hoặc kết hợp nhiều cảm biến khác nhau để nhận dạng hành động. Tuy nhiên, hướng tới sự thuận lợi và tiết kiệm năng lượng của thiết bị. Chúng tôi chỉ sử dụng thông tin, dữ liệu đầu vào là cảm biến gia tốc thu được từ điện thoại thông minh mang theo của người tham gia giao thông, vị trí của điện thoại có thể thay đổi trong hành trình[CT2], [CT4].
Một số nghiên cứu liên quan
Đối với bài toán nhận dạng hành động giao thông, một số sự kiện, hành động, hành vi cơ bản của người điều khiển được thể hiện ở công bố của một số nghiên cứu liên quan. Trong đó, các hành hành động, hành vi thường được nhận dạng với các vị trí điện thoại được cố định hoặc biết trước góc xoay so với chuyển động nhằm thu được dữ liệu mẫu ổn định. Ngoài phương pháp so khớp, phương pháp phân lớp cũng thường được sử dụng cho bài toán này dựa trên hướng tiếp cận trích xuất đặc trưng.
Hệ thống nhận dạng hành động sử dụng cảm biến gia tốc
Một số kiến thức cơ sở
Tiền xử lý dữ liệu
Chuẩn bị dữ liệu là một bước quan trọng trong khai phá dữ liệu, dữ liệu được chuẩn bị tốt sẽ giúp hệ thống thực hiện hiệu quả hơn [36][37]. Trong bài toán nhận dạng hành động giao thông sử dụng dữ liệu cảm biến từ điện thoại sau khi tiền xử lý, biến đổi thành dữ liệu đặc trưng và nhận dạng dựa trên phương pháp phân lớp
Cửa sổ dữ liệu
Trong hệ thống nhận dạng đề xuất, cửa sổ dữ liệu được khảo sát nhằm chọn ra kích thước phù hợp với từng loại hành động với mục đích nâng cao kết quả nhận dạng được trình bày như Hình 22 dưới đây:
Hình 22. Phân đoạn chuỗi thành các cửa sổ dữ liệu
Biến đổ hệ tọa độ
Phương pháp biến đổi hệ tọa độ của thiết bị sang hệ tọa độ trái đất cũng thường được áp dụng trong phân tích dữ liệu cảm biến gia tốc[41][42] khi thiết bị cảm biến không cố định theo hướng chuyển động của phương tiện.Phương pháp biến đổi hệ tọa độ của thiết bị cảm biến về hệ trục tọa độ của trái đất được thể hiện như
(a)
(b)
Hình 23. (a) Hướng của điện thoại được xác định bởi hệ tọa độ (X, Y, Z). (b) Hướng di chuyển của phương tiện theo hệ tọa độ trái đất (X’, Y’, Z’)
Biến đổi dữ liệu đặc trưng
Trong kỹ thuật xử lý tín hiệu cảm biến, các thuộc tính đặc trưng thường được lựa chọn dựa trên tính chất thời gian và tần số [44][45]. Phương pháp kết hợp thuộc tính trên các miền thường được sử dụng để phân tích, nhận dạng hành động, hành vi được biểu diễn như trong Hình 24 dưới đây [46].
Hình 24. Kết hợp biểu diễn thông tin trên miền thời gian và miền tần số [46]
Thuộc tính trên miền thời gian
Các thuộc tính trong miền thời gian có đặc điểm tính toán nhanh, thực hiện với các giá trị thống kê, so sánh sự khác biệt của các mẫu dữ liệu. Do tính chất dữ liệu cảm biến thu được của các hành động, hành vi thay đổi theo thời gian.
Thuộc tính trên miền tần số
Các kỹ thuật miền tần số thường được sử dụng để xác định bản chất lặp lại của tín hiệu cảm biến. Tính lặp lại này thường tương quan với bản chất tuần hoàn của một hành động, hành vi nào đó cần nhận dạng.
Tham số Hjorth
Tham số Hjorth [49] là đại lượng thường được sử dụng trong phân tích các tín hiệu y sinh. Đại lượng này chỉ ra tính chất thống kê của một tín hiệu trong miền thời gian gồm ba loại tham số là tính hoạt động (Activity), tính di động (Mobility) và độ phức tạp (Complexity).
Phương pháp đánh giá phân lớp bằng AUC
Các phương pháp đánh giá mô hình thường được sử dụng khi đánh giá với mô hình phân lớp dữ liệu đó là dựa trên ma trận nhầm lẫn. Có hai độ đo thường được sử dụng để đánh giá mô hình phân lớp đó là độ chính xác (Accuracy) và độ đo AUC sử dụng CV10.
Tập thuộc tính đặc trưng
Sự di chuyển của phương tiện giao thông làm thay đổi gia tốc nên các thuộc tính trong miền thời gian có ý nghĩa và hàm chứa những thông tin hữu ích khi phân tích các hành động, hành vi. Tập thuộc tính kết hợp cho nhận dạng được thể hiện như bảng dưới đây:
Miền, tham số Hjorth
Tên tập thuộc tính
Thời gian
T2
Tần số
F2
Hjorth
H2
Thời gian + Tần số
TF2
Thời gian + Hjorth
TH2
Thời gian + Tần số + Hojrth
TFH2
Bảng 21. Tập thuộc tính sử dụng nhận dạng
Đề xuất hệ thống nhận dạng hành động
Việc nhận dạng hành động, hành vi cần có những giải pháp, kỹ thuật phù hợp với yêu cầu thực tiễn của bài toán. Do vậy, chúng tôi xây dựng hệ thống nhận dạng như Hình 2 nhằm nhận dạng hành động giao thông cơ bản (Dừng, Đi thẳng, Rẽ trái, Rẽ phải) được biểu diễn như Hình 27 dưới đây:
Hình 27. Hệ thống nhận dạng hành động giao thông
Hệ thống nhận dạng bao gồm Pha huấn luyện để xây dựng mô hình nhận dạng. Pha thứ hai: nhận dạng các hành động dựa trên dữ liệu cảm biến phát hiện thu được từ điện thoại của đối tượng đang tham gia giao thông dựa trên mô hình đã xây dựng được. Giải pháp nâng cao kết quả nhận dạng thông qua lựa chọn kích thước cửa sổ cho từng hành động dựa trên độ đo AUC được trình bày trong Hình 2 8 sau đây:
Hình 28. Thuật toán tối ưu kích thước cửa sổ và chồng dữ liệu theo AUC
Trong đó pha phát hiện với N nhãn lớp hành động khi sử dụng giải pháp tối ưu cửa sổ sẽ có N kích thước cửa sổ khác nhau, đồng thời cần phải thực hiện N lần phân lớp để xác định kết quả nhãn lớp để đưa ra nhãn lớp phù hợp theo Hình 29 như sau:
Hình 29. Nhận dạng hành động với các kích thước cửa sổ đã được lựa chọn.
Tại một thời điểm, dữ liệu được tiền xử lý với N kích thước cửa sổ tối ưu và được nhận dạng nhãn lớp tương ứng. Sử dụng kỹ thuận nhận dạng như trên sẽ cho kết quả nhãn lớp phù hợp với cửa sổ dữ liệu đầu vào.
Thực nghiệm và đánh giá
Môi trường thực nghiệm
Hệ thống thu thập và phân tích dữ liệu cảm biến của điện thoại được xây dựng dựa trên hệ điều hành Android phiên bản 4.5 đến 6.0; ngôn ngữ Java và bộ công cụ WEKA [53] để phân tích, thực nghiệm. Các đối tượng tham gia thực nghiệm mang điện thoại khi điều khiển phương tiện hoặc ngồi sau các phương tiện do người khác điều khiển trong quá trình tham gia giao thông trên đường phố. Vị trí điện thoại có thể thay đổi tùy ý khi tiến hành thực nghiệm khi đi xe máy.
Dữ liệu thực nghiệm
Hệ thống nhận dạng hành động giao thông được thực hiện để nhận dạng 4 hành động cơ bản là: đi thẳng, dừng, rẽ trái và rẽ phải. Số lượng các mẫu thu được cho thực nghiệm được thể hiện ở bảng sau:
Hành động
Dừng
Đi thẳng
Rẽ trái
Rẽ phải
Số lượng mẫu
361
3797
1750
1656
Bảng 25. Tập mẫu dữ liệu đặc trưng sử dụng nhận dạng hành động giao thông cơ bản
Lựa chọn tập thuộc tính
Để đánh giá, lựa chọn tập thuộc tính phù hợp, chúng tôi sử dụng cách kết hợp các tập thuộc tính với nhau. Thực nghiệm với các tập thuộc tính trên thu được các kết quả về độ chính xác Accuracy và AUC như sau:
Random Forest
J48
Naïve Bayes
KNN
SVM
ACC
AUC
ACC
AUC
ACC
AUC
ACC
AUC
ACC
AUC
H2
82,39%
0,9531
65,57%
0,8881
65,57%
0,8326
66,89%
0,8153
65,41%
0,7273
F2
82,85%
0,9530
79,16%
0,8690
54,29%
0,7970
75,99%
0,8120
51,12%
0,6551
T2
88,79%
0,9730
69,90%
0,9213
69,90%
0,8546
73,91%
0,8596
70,86%
0,7506
TH2
88,39%
0,975
82,06%
0,8620
38,19%
0,8440
78,56%
0,8400
76,45%
0,8090
TF2
88,85%
0,9752
70,60%
0,9134
70,60%
0,8462
74,08%
0,8481
70,99%
0,7384
TFH2
88,32%
0,9768
70,36%
0,9104
70,36%
0,8479
72,39%
0,8406
69,64%
0,7384
Bảng 211, Kết quả phân lớp hành động trên các tập thuộc tính
Kết quả thực nghiệm cho thấy, tập thuộc tính TFH2 kết hợp từ các tập thuộc tính khác cho kết quả cao nhất. Thực nghiệm với dữ liệu đã biến đổi hệ tọa độ thu được kết quả ở bảng sau:
RF
J48
NB
KNN
SVM
AUC
ACC
AUC
ACC
AUC
ACC
AUC
ACC
AUC
ACC
DL thô
0,97676
88,32%
0,910449
85,55%
0,84794
70,36%
0,84058
72,39%
0,73837
69,64%
DL- CT
0,98541
90,97%
0,95921
89,94%
0,94450
86,05%
0,93778
86,40%
0,81313
74,87%
Bảng 212. Kết quả so sánh dữ liệu thô và dữ liệu đã biến đổi hệ tọa độ
Kết quả thực nghiệm cho thấy, sau khi chuyển trục, kết quả nhận dạng hành động thu được cao hơn so với kết quả sử dụng dữ liệu thô ở trên cả 5 thuật toán nên dữ liệu chuyển trục được sử dụng cho nhận dạng hành động và hành vi giao thông.
Khảo sát thuật toán phân lớp
Thực nghiệm cũng được tiến hành bằng dữ liệu thô trên các thuật toán thường được sử dụng trong phân tích hành động người là Random Forest, Naïve Bayes, J48, KNN và SVM với các giá trị mặc định thường dùng cho mỗi thuật toán với phương pháp kiểm chứng chéo CV10 cho kết quả như trong hình dưới đây:
Hình 211. Kết quả phân lớp với các thuật toán khác nhau
Qua thực nghiệm này chúng tôi lựa chọn được thuật toán RF là phù hợp cho hệ thống nhận dạng.
Xây dựng dữ liệu huấn luyện
Thực nghiệm tiến hành trên tập thuộc tính TFH2 cùng với và kết quả phân lớp sử dụng thuật toán rừng ngẫu nhiên tìm ra kích thước cửa sổ khảo sát trong khoảng từ 1 giây, đến 6 giây được sử dụng với mục đích tìm ra kích thước cửa sổ phù hợp nhất đối trên từng nhãn lớp. Kết quả thu được là bộ tham số kích thước cửa sổ và chồng dữ liệu được thể hiện ở Bảng 217 dưới đây:
Hành động
S
G
L
R
Của sổ (giây)
4
6
5
6
Chồng dữ liệu
75%
75%
50%
50%
AUC
0,999422
0,992828
0,996841
0,987251
Bảng 217. Kích thước cửa sổ được tối ưu theo độ đo AUC
Để đánh giá kết quả nhận dạng với tập dữ liệu đặc trưng có được với dữ liệu đã chuyển trục và xây dựng được từ tập dữ liệu huấn luyện với kích thước đã tối ưu sử dụng phương pháp kiểm chứng chéo CV10 trên hai tập TF2 và TFH2 thu được kết quả ở Bảng 218 dưới đây:
RF
J48
NB
KNN
SVM
ACC
AUC
ACC
AUC
ACC
AUC
ACC
AUC
ACC
AUC
TF2
95,78%
0,998550
94,78%
0,978238
90,44%
0,967257
92,04%
0,965410
80,40%
0,836312
TFH2
98,95%
0,999852
98.38%
0,995950
95,25%
0,989185
95,73%
0,982722
83,35%
0,850271
Bảng 218. Kết quả phân lớp với tham số tối ưu trên hai tập TF2 và TFH2
Từ kết quả trên cho thấy, khi bổ sung tham số Hjorth vào tập thuộc tính TF2 ta thu được tập thuộc tính TFH2 mới cho kết quả độ đo Accuracy lớn hơn độ đo trên tập TF2 cùng một thuật toán phân lớp RF được lựa chọn là 3,17% và giá trị độ đo AUC lớn hơn là 0,0013.
Đánh giá hệ thống đề xuất so với một số nghiên cứu hiện tại[CT4].
Để đánh giá hệ thống nhận dạng được đề xuất, qua tìm hiểu thu thập, chúng tôi tiến hành thực nghiệm đánh giá hệ thống dựa trên tập dữ liệu được thu thập bởi công ty HTC của Đài Loan được công bố trong [56]. Thực nghiệm so sánh phương pháp chúng tôi đề xuất so với một số nghiên cứu trên cùng tập dữ liệu này thể hiện ở bảng dưới đây:
Nghiên cứu
Kết quả phân lớp accuracy
Fang et al, [31] (Sử dụng KNN)
83,57%
Guvensan et al [32], (Sử dụng RF)
91,63%
Phương pháp đề xuất (sử dụng RF)
97,33%
Bảng 219. Kết quả so sánh tập thuộc tính với các phương pháp khác trên cùng bộ dữ liệu HTC [56] [CT4]
Kết luận
Trong chương này chúng tôi đề xuất hệ thống nhận dạng để thực hiện nhận dạng hành động giao thông cơ bản là {Dừng, Đi thẳng, Rẽ trái, Rẽ phải} dựa trên cảm biến gia tốc thu được từ điện thoại thông minh của người sử dụng phương tiện khi vị trí điện thoại không cố định. Lựa chọn được tập thuộc tính TFH2 và thuật toán RF cho nhận dạng hành động. Thực nghiệm với hệ thống đề xuất cũng cho kết quả cao hơn so với một số công bố đã có trên cùng một tập dữ liệu.
NHẬN DẠNG HÀNH VI BẤT THƯỜNG
Giới thiệu
Luận án đã tìm hiểu, khảo sát các kỹ thuật phân tích dữ liệu cảm biến sử dụng cho bài toán nhận dạng hành vi. Từ đó, đề xuất giải pháp nhận dạng ra hành vi bất thường dựa trên hệ thống nhận dạng hành động đã được trình bày trong chương 2,
Bài toán nhận dạng hành vi bất thường
Nhận dạng bất thường
Dữ liệu bình thường và bất thường
Một dữ liệu bất thường là một dạng mẫu mà nó khác với định nghĩa của mẫu dữ liệu bình thường. Tuy nhiên, trong thực tế việc định nghĩa một mẫu bất thường khó hơn rất nhiều so với việc định nghĩa mẫu bình thường. Do đó, một trong những hướng tiếp cận và định nghĩa một mẫu bất thường phổ biến đó là dựa vào định nghĩa của mẫu bình thường.
Một số kỹ thuật gán nhãn bất thường
Nhãn của dữ liệu thường được gán bởi các chuyên gia trong lĩnh vực đó. Gán nhãn bất thường khó hơn rất nhiều so với việc gán nhãn bình thường. Do nhãn bất thường luôn thay đổi và phát sinh nên rất khó gán nhãn từ tập dữ liệu huấn luyện. Một số kỹ thuật nhận dạng bất thường cơ bản sử dụng phương pháp gán nhãn được chia thành 3 dạng cơ bản đó là[58][59]: Dạng 1: Phát hiện bởi phương pháp có giám sát. Dạng 2: Phát hiện bất thường sử dụng phương pháp bán giám sát. Dạng 3: Sử dụng phương pháp phát hiện bất thường không giám sát.
Phương pháp đánh giá nhận dạng bất thường
Do sự khó khăn về xác định tính chất bất thường và tính chất bình thường cũng như áp dụng các phương pháp gán nhãn bất thường cho dữ liệu. Việc đánh giá hệ thống phát hiện bất thường được thiết kế cho từng miền, lĩnh vực khác nhau và phổ biến ở hai dạng sau[58]: Đánh giá dựa vào kỹ thuật cho điểm và đánh giá dựa vào kỹ thuật gán nhãn..
Sử dụng cảm biến điện thoại để nhận dạng hành vi bất thường
Các đối tượng tham gia giao thông chịu nhiều tác động từ chính yếu tố tâm lý cá nhân cũng như các yếu tố bên ngoài như hạ tầng giao thông, yếu tố môi trường, đặc tính của phương tiện và cả hiện trạng giao thông trong từng thời điểm. Hướng tiếp cận sử dụng cảm biến điện thoại để nhận dạng hành vi bất thường đang được cộng đồng các nhà nghiên cứu quan tâm. Tuy nhiên, sử dụng chỉ mình cảm biến gia tốc để nhận dạng hành vi được chúng tôi lựa chọn thực hiện trong đề tài nghiên cứu này. Với giải pháp nhận dạng hành vi bất thường là: Nếu chuỗi hành động xảy ra trong khoảng một thời gian ngắn có sự sai khác so với thời gian một hành động cơ bản tương ứng xảy ra thì xác định đây là một hành vi bất thường.
Một số nghiên cứu liên quan
Các phương pháp, kỹ thuật phát hiện hành vi bất thường trong các nghiên cứu trên gặp phải vấn đề khó khăn đó là làm thế nào để xác định, thu thập các mẫu dữ liệu bất thường, trong khi dữ liệu cảm biến gia tốc có nhiều nhiễu từ thiết bị cũng như vị trí điện thoại. Do vậy, để vượt qua được việc phụ thuộc vào mẫu dữ liệu bất thường, chúng tôi đề xuất hướng tiếp cận mới để có thể xác định hành vi giao thông bất thường dựa trên phân tích chuỗi các hành động trong khoảng thời gian ngắn tương ứng một hành động cơ bản diễn ra.
Giải pháp nhận dạng hành vi bất thường dựa trên hệ thống nhận dạng hành động
Một số kỹ thuật nhận dạng hành vi bất thường
Kỹ thuật so khớp DTW
Kỹ thuật so khớp thường sử dụng để tìm sự tương đồng giữa hai chuỗi. Chúng tôi sử dụng phương pháp này để phát hiện hành vi bất thường dựa trên cảm biến gia tốc được mô tả như Hình 31 dưới đây:
Hình 31. Sử dụng DTW để phát hiện hành vi bất thường
Phân lớp dữ liệu với RF và kỹ thuật học sâu
Thuật toán RF và kỹ thuật học sâu được phát triển dựa trên ANN đang được nhiều sự quan tâm của cộng đồng nghiên cứu. Do vậy, chúng tôi sử dụng bộ phân lớp Dl4jMlpClassifier được tích hợp trong gói học sâu WekaDeeplearning4J để nhận dạng hành vi của người tham gia giao thông với tập dữ liệu huấn luyện được gán nhãn bình thường/ bất thường. Phương pháp này được thực hiện như mô tả của hình dưới đây:
Hình 32. Phát hiện bất thường sử dụng
Giải pháp đề xuất nhận dạng hành vi bất thường dựa trên hệ thống nhận dạng hành động
Các kỹ thuật trên gặp sự khó khăn chung đó là sự phụ thuộc vào cách xác định và thu thập mẫu dữ liệu hành vi bất thường. Do vậy, chúng tôi đề xuất giải pháp nhận dạng hành vi như hình dưới đây:
Hình 33.Sơ đồ hệ thống phát hiện hành vi bất thường
Trong hệ thống nhận dạng hành vi này gồm hai pha: pha thứ nhất là pha huấn luyện, pha thứ hai là pha nhận dạng hành vi bất thường. Trong pha huấn luyện được thực hiện dựa trên dữ liệu huấn luyện với mục đích tìm ra bộ tham số cho kết quả nhận dạng hành vi tốt nhất: tương ứng với ; và n là số các bộ giá trị tham gia thực hiện trong pha huấn luyện.
Trong Pha nhận dạng, sử dụng các tham số đã nhận được từ Pha huấn luyện để thực hiện các bước thực hiện nhận dạng hành vi được mô tả như trong Hình 34 sau đây:
Hình 34. Phát hiện hành vi bất thường dựa trên hành động giao thông cơ bản
Thực nghiệm và đánh giá
Môi trường thực nghiệm
Chương trình thu dữ liệu cảm biến được xây dựng và thực hiện trên hệ điều hành Android phiên bản 4.5 đến 6.0. Ngôn ngữ Java được sử dụng để xây dựng hệ thống, thực hiện quy trình tiền xử lý dữ liệu, các mô hình phân lớp trong Bộ công cụ WEKA được sử dụng để phát hiện, nhận dạng phương tiện, hành động hành vi như trong chương 2.
Dữ liệu thực nghiệm
Thực nghiệm thực hiện với phương tiện đặc thù, phổ thông là xe máy. Hành vi bất thường được xác định nhận dạng trong thực nghiệm đó là “hành vi lạng lách”. Hành vi này liên quan đến thay đổi hướng điều khiển phương tiện trong một khoảng thời gian ngắn. Thực nghiệm được tiến hành trên 8 đối tượng là các cán bộ, nhân viên văn phòng và sinh viên. Dữ liệu mẫu về hành vi bất thường thực hiện ở các cung đường vắng, theo cảnh huống giả định của hành vi bất thường đặt ra cùng với các hành vi bình thường. Vị trí của điện thoại khi thu dữ liệu thể hiện ở Bảng 31 sau:
Hành động
Số lượng
Thời gian
Vị trí của điện thoại
Bình thường
15
phút
Cầm tay khi lái xe, cầm tay ngồi sau
Bất thường
10
phút
Cầm tay khi lái xe, cầm tay ngồi sau, bỏ túi
Bảng 31. Thực nghiệm thu dữ liệu nhận dạng hành vi bất thường
Hành vi bất thường – “lạng lách” và hành vi bình thường – “đi thẳng” xảy ra khi người điều khiển phương tiện rẽ trái và rẽ phải liên tục theo dạng mẫu biểu diễn ở Hình 35 sau:
(a)
(b)
Hình 35. Mẫu dữ liệu cảm biến gia tốc của hành vi bất thường (lạng lách): (a); Hành vi bình thường
Trong mẫu dữ liệu cảm biến gia tốc về “hành vi lạng lách”, người điều khiển phương tiện thực hiện đồng thời chuỗi sáu hành động rẽ trái ký hiệu là “L” và hành động rẽ phải “R” lần lượt là: “L, R, R, L, L, R” như Hình 35 (a). Bên cạnh đó, chúng tôi giả định một “hành vi bình thường” gồm 6 hành động di chuyển thẳng. Dữ liệu mẫu cảm biến gia tốc của hành vi này có dạng như Hình 35 (b). Trong đó, các ký hiệu “G” mô tả một hành động phương tiện di chuyển thẳng theo hướng chuyển động.
Dữ liệu cảm biến gia tốc của các hành vi thu thập được sử dụng với các kỹ thuật nhận dạng (DTW, kỹ thuật học sâu, Kỹ thuật đề xuất) nhằm khảo sát, đánh giá tìm ra phương pháp nhận dạng hành vi giao thông phù hợp. Tập mẫu dữ liệu cảm biến gia tốc về hai loại hành vi bình thường và bất thường thu được sử dụng cho thực nghiệm theo từng kích thước cửa sổ dữ liệu được biểu diễn như ở trong Bảng 32 dưới đây:
Mẫu DL bất thường
Mẫu DL bình thường
Tổng số m
Các file đính kèm theo tài liệu này:
- tom_tat_luan_an_nhan_dang_hanh_vi_cua_nguoi_tham_gia_giao_th.docx