LỜI CAM ĐOAN I
LỜI CẢM ƠN II
MỤC LỤC III
DANH MỤC KÝ HIỆU VÀ TỪ VIẾT TẮT V
DANH MỤC HÌNH ẢNH VII
DANH MỤC BẢNG BIỂU IX
MỞ ĐẦU 1
Tính cấp thiết của luận án 1
Mục tiêu của luận án 3
Đối tượng và phạm vi nghiên cứu 4
Phương pháp nghiên cứu 4
Đóng góp của luận án 5
Bố cục của luận án 6
CHƯƠNG 1. TỔNG QUAN VỀ NHẬN DẠNG HÀNH VI 7
1.1 Giới thiệu 7
1.2 Một số khái niệm cơ bản 8
1.2.1 Hành động giao thông 8
1.2.2 Hành vi giao thông 9
1.3 Sử dụng dữ liệu cảm biến để phân tích hành vi 9
1.4 Một số nghiên cứu liên quan 12
1.5 Phương pháp nhận dạng hành vi giao thông dựa trên cảm biến 19
1.6 Kết luận 23
CHƯƠNG 2. NHẬN DẠNG HÀNH ĐỘNG GIAO THÔNG 24
2.1 Giới thiệu 24
2.2 Sử dụng dữ liệu cảm biến để nhận dạng hành động giao thông 24
2.3 Một số nghiên cứu liên quan 25
2.4 Hệ thống nhận dạng hành động sử dụng cảm biến gia tốc 29
2.4.1 Một số kiến thức cơ sở 29
2.4.2 Tập thuộc tính đặc trưng 48
116 trang |
Chia sẻ: honganh20 | Ngày: 21/02/2022 | Lượt xem: 397 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận án Nhận dạng hành vi của người tham gia giao thông dựa trên cảm biến điện thoại, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
u:
(2.15)
trong đó
(2.16)
với a có thể là dữ liệu gia tốc mỗi trục hoặc thành phần ngang hoặc dọc hoặc giá trị hiệu dụng, athr là mức ngưỡng để phân cách hay giá trị tham chiếu được lựa chọn phù hợp, n = 2,, N và sgn là hàm dấu. Khi số lượng điểm cắt không được xác định thì số lượng đỉnh (peaks) trên cửa sổ thời gian có thể ước tính gần đúng bởi công thức sau:
(2.17)
- Diện tích độ lớn tín hiệu (SMA):
Diện tích độ lớn tín hiệu là tổng diện tích được bao bởi độ lớn của mỗi tín hiệu gia tốc ở 3 trục để tính chi phí năng lượng trong các hành động. Đại lượng SMA được tính theo tín hiệu gia tốc như sau:
(2.18)
Trong đó ax(t), ay(t) và az(t) là các tín hiệu gia tốc theo mỗi trục. Đại lượng SMA có thể được sử dụng để phân biệt giữa trạng thái nghỉ và hoạt động của các đối tượng. Trên một cửa sổ N mẫu dữ liệu đại lượng SMA được tính như sau:
(2.19)
với T là độ rộng cửa sổ tính T = t[N]-t[1]. Một số dạng thuộc tính tương tự SMA phản ánh năng lượng của trạng thái hoạt động theo hai thành phần gia tốc dọc và ngang như sau:
với k đại diện cho chiều dọc hoặc chiều ngang
(2.20)
Có thể thấy các thuộc tính phản ánh năng lượng ở công thức (2.13) này giống với đại lượng tốc độ biến thiên ở trên, hai thành phần năng lượng dọc và ngang được sử dụng để phân biệt các hoạt động có sự khác biệt giữa hai thành phần này.
Độ lớn véc tơ tín hiệu (SVMS): Đại lượng SVMS và độ lớn véc tơ tín hiệu vi sai (DSVM) tương tự kiểu chuẩn hóa được định nghĩa như sau:
;
(2.21)
Có thể thấy đại lượng SVMS cũng là một dạng đại lượng hiệu dụng và được tính cụ thể như sau:
(2.22)
Và
(2.23)
với .
Hoặc giá trị DSVM theo công thức sau:
(2.24)
Các thay đổi về đổi hướng của điện thoại được mô tả theo các góc quay: góc xoay (), góc nghiêng () và góc đảo () tương ứng với các trục x, y và z của điện thoại như Hình 25. Con quay hồi chuyển thường được sử dụng để tính góc xoay. Tuy nhiên, trong trường hợp này các góc định hướng có thể được ước tính gần đúng dựa trên dữ liệu cảm biến gia tốc ở 3 trục tọa độ.
Hình 25. Hệ tọa độ và các trục quay trên điện thoại thông minh[48]
Dựa trên các giá trị cảm biến đo được trên 3 trục tọa độ, hai góc xoay () góc nghiêng () có thể được xác định bằng hàm tan nghịch đảo hay atan như sau:
và
(2.25)
hoặc
và
(2.26)
Trong đó, dữ liệu cảm biến trên trục Z là dữ liệu không loại bỏ trọng lực(g). Tuy nhiên trong trường hợp các thành phần của cảm biến gia tốc không chuyển trục (sử dụng dữ liệu gốc), điện thoại có thể ở vị trí bất kỳ do đó có thể tính thêm thành phần góc:
với
(2.27)
Sau khi tính được các thành phần góc quay, các thuộc tính sẽ được tính tương tự như tính cho dữ liệu gia tốc.
- Sử dụng độ tích lũy của các giá trị thay đổi theo thời gian của các thành phần góc quay theo hàm sau:
với trong đó .
(2.28)
Các thuộc tính trong miền thời gian có đặc điểm tính toán nhanh, thực hiện được với các giá trị thống kê, so sánh sự khác biệt của các mẫu dữ liệu. Tính chất dữ liệu cảm biến của các hành động, hành vi thay đổi theo thời gian. Do vậy, các đại lượng thống kê trên miền thời gian có ý nghĩa quan trọng trong việc làm nổi bật những đặc trưng của hành động, hành vi đó, hỗ trợ cho hệ thống nhận dạng thực hiện hiệu quả.
Với dữ liệu chuỗi thời gian như tín hiệu cảm biến gia tốc điện thoại là một dạng tín hiệu số nên có thể biểu diễn và biến đổi dựa vào các đặc trưng trong miền tần số nhằm tìm ra những đặc điểm hỗ trợ hệ thống nhận dạng được các hành động, hành vi dựa trên những đại lượng này.
Thuộc tính trên miền tần số
Các kỹ thuật miền tần số thường được sử dụng để xác định bản chất lặp lại của tín hiệu cảm biến. Tính lặp lại này thường tương quan với bản chất tuần hoàn của một hành động, hành vi nào đó. Kỹ thuật khai triển tín hiệu thường được sử dụng là biến đổi Fourier, cách biến đổ này cho phép biểu diễn những đặc tính quan trọng của miền tần số (phổ) của một tín hiệu dựa trên thời gian như thành phần trung bình (hoặc thành phần một chiều DC) và thành phần tần số trọng yếu [46]. Trong miền đặc trưng phổ này, các chu kỳ hoặc các khoảng lặp lại chính của tín hiệu được đặc trưng bởi các giá trị hoặc các hệ số khác không tại giá trị trục tần số tương ứng. Phép phân tích tần số này thường được tính cho một tín hiệu thời gian có độ dài hay cửa sổ thời gian xác định sử dụng kỹ thuật khai triển Fourier rời rạc bằng các giải thuật khai triển Fourier nhanh (FFT) và khai triển tần số thời gian nhanh[46]. Phép khai triển Fourier rời rạc trên tập N mẫu dữ liệu được biểu diễn theo công thức sau:
(2.29)
trong đó w[m] là hàm cửa sổ. Việc chọn hàm cửa sổ cho phép phân tích tập trung vào các thành phần tần số chính của tín hiệu. Trường hợp không sử dụng hàm cửa sổ có thể coi w[m] = 1, còn khi sử dụng w[m] có nhiều hàm mô tả khác nhau, ví dụ cửa sổ Hamming:
(2.30)
Sau khi khai triển Fourier, thành phần X[k] thường là số phức nên có thể được biểu diễn thành X[k] = XR[k] +jXI[k] trong đó j là số ảo, XR là thành phần thực (real) và XI là thành phần ảo (img).
Thành phần DC, là hệ số đầu tiên trong đặc trưng phổ của một tín hiệu và giá trị của nó thường lớn hơn nhiều các hệ số phổ còn lại.
Năng lượng phổ: Năng lượng của một tín hiệu có thể được tính như tổng bình phương các hệ số phổ được chuẩn hóa theo chiều dài cửa sổ mẫu. Đại lượng này có thể được tính chỉ trong một dải phổ xác định:
(2.31)
Tùy thuộc vào tốc độ lấy mẫu, M sẽ được chọn cho phù hợp. Đại lượng năng lượng phổ trung bình cũng có thể được tính như sau:
(2.32)
Entropy thông tin: Đại lượng Entropy có thể được tính bằng việc sử dụng Entropy thông tin chuẩn hóa của độ lớn các hệ số Fourier rời rạc loại bỏ thành phần DC. Entropy trợ giúp phân biệt giữa các tín hiệu có các giá trị năng lượng tương tự nhưng tương ứng với các mẫu hoạt động khác nhau. Tính Entropy được thực hiện theo công thức sau:
(2.33)
Tham số Hjorth
Tham số Hjorth [49] là đại lượng thường được sử dụng trong phân tích các tín hiệu y sinh. Đại lượng này chỉ ra tính chất thống kê của một tín hiệu trong miền thời gian gồm ba giá trị đại diện cho tính hành động (Activity), tính di động (Mobility) và độ phức tạp (Complexity). Giá trị Activity được tính bởi công thức (2.34) là phương sai của hàm thời gian, có thể chỉ bề mặt phổ công suất trong miền thời gian. Tức là giá trị Activity trả về một giá trị lớn hay nhỏ nếu các thành phần tần số cao của tín hiệu tồn tại nhiều hay ít. Giá trị Mobility được định nghĩa như căn bậc hai tỉ lệ của phương sai đạo hàm bậc một tín hiệu và phương sai của tín hiệu đó theo công thức (2.35), giá trị này tỉ lệ với độ lệch chuẩn phổ công suất. Giá trị Complexity (2.36) chỉ ra hình dạng của một tín hiệu tương tự với dạng sóng hình sin tới mức nào được tính theo công thức (2.36). Giá trị Complexity sẽ hội tụ về 1 khi dạng tín hiệu tương tự như một sóng hình sin. Như vậy ba tham số trên được tính trong miền thời gian nhưng chứa thông tin về phổ tần của một tín hiệu. Cụ thể cách tính 3 giá trị của tham số này như sau:
- Tham số Hjorth hành động ( Hjorth Activity):
(2.34)
trong đó với i = 1,.., N-1.
- Tham số Hjorth chuyển động ( Hjorth Mobility):
trong đó
(2.35)
với với i = 1,.., N-2.
- Tham số Hjorth phức hợp (Hjorth Complexity):
trong đó
(2.36)
với với i = 1,.., N-3.
Với mỗi thuộc tính được lựa chọn có thể áp dụng với các đại lượng khác nhau nhằm biến đổi dữ liệu cảm biến gia tốc thành các dữ liệu đặc trưng sử dụng cho hệ thống nhận dạng phương tiện và hành động. Tổng hợp các thuộc tính và các thành phần áp dụng trên các thuộc tính đó được thể hiện như bảng dưới đây:
Kiểu
Tên đặc trưng
Công thức
Thời gian
SVMS
(2.6)
m
(2.7)
s2
(2.8)
s
(2.8)
Diff = max(x)-min(x)
(2.10)
R
(2.14)
ZC
(2.15)
PAR
(2.11)
SMA
(2.19)
DSVM
(2.24)
I
(2.28)
Tham số Hjorth
A
(2.34)
M
(2.35)
C
(2.36)
Tần số
EFFT
(2.32)
En
(2.33)
Bảng 22. Các thuộc tính đặc trưng
Phương pháp đánh giá phân lớp bằng AUC
Các phương pháp đánh giá mô hình thường được sử dụng khi đánh giá với mô hình phân lớp dữ liệu đó là dựa trên ma trận nhầm lẫn. Giả sử khi phân lớp với tập dữ liệu có các nhãn là: {Dừng, Đi thẳng, Rẽ trái, Rẽ phải}. Mô hình phân lớp dữ liệu vào các nhãn lớp với kết quả được thể hiện bởi thông tin như sau:
Giả sử kết quả phân lớp đối với nhãn là hành động rẽ trái:
TP: là hành động rẽ trái trên thực tế được hệ thống nhận dạng phân loại đúng là rẽ trái.
TN: là hành động không phải là rẽ trái trên thực tế được hệ thống nhận dạng, phân loại không phải nhãn lớp rẽ trái.
FN: là hành động rẽ trái trên thực tế nhưng hệ thống phân loại, nhận dạng là hành động không phải là rẽ trái.
FP: là hành động trên thực tế không phải là rẽ trái nhưng được hệ thống phân loại nhận dạng là hành động rẽ trái.
Có hai độ đo thường được sử dụng để đánh giá mô hình phân lớp đó là độ chính xác (Accuracy) và độ đo AUC. Độ đo accuracy được tính theo công thức sau:
(2.37)
Trong khi đó, độ đo AUC (Area Under Curve) được tính bởi công thức (2.38) là độ lớn của diện tích hình cong ROC[50]. Phương pháp này cho phép dễ dàng so sánh các đường ROC với nhau trong khi phân tích, đánh giá các mô hình.
Công thức tính độ đo AUC của nhãn lớp âm khi phân lớp hai dạng mẫu âm và dương được tính như sau:
(2.38)
Trong đó n0 là kích cỡ của mẫu âm, n1 là kích cỡ của mẫu dương, và R0 là tổng của các xếp hạng của các mẫu âm. Khi đó hiệu suất của các bộ phân lớp được so sánh như ví dụ ở Hình 26 bên dưới:
Hình 26. Độ đo AUC[50]
Giá trị của AUC thường được sử dụng để đánh giá độ tốt của mô hình phân lớp, một mô hình đủ tốt là mô hình có diện tích AUC trên 0.5. Các ngưỡng và ý nghĩa của AUC được thể hiện trong Bảng 23 bên dưới:
AUC
Ý nghĩa
>0.9
Rất tốt
0.8 đến 0.9
Tốt
0.7 đến 0.8
Trung bình
0.6 đến 0.7
Không tốt
0.5 đến 0.6
Vô dụng
Bảng 23. Ý nghĩa diện tích bên dưới đường cong ROC (AUC)
Trong quá trình thực nghiệm của một số nghiên cứu, AUC thường được sử dụng để so sánh, đánh giá hiệu năng của các mô hình, giá trị AUC càng cao thì mô hình có độ chính xác và có tính ổn định hơn [51].
Khi đánh giá mô hình phân lớp dựa trên một tập dữ liệu, phương pháp kiểm chứng chéo (CV10) cũng thường được áp dụng nhằm chia dữ liệu thành n phần bằng nhau. Trong đó sử dụng (n – 1) phần để huấn luyện và phần còn lại để kiểm tra. Thực hiện n lần phân lớp và kiểm tra với các tập huấn luyện và kiểm tra đó nhằm thu được kết quả đánh giá mô hình phân lớp. Kết quả các giá trị độ đo được tính từ trung bình của n lần thực hiện đánh giá. Ví dụ như độ chính xác Accuracy sau n lần thực hiện kiểm chứng chéo được tính bởi công thức sau:
(2.39)
Với trường hợp dữ liệu có N lớp, sau khi thực hiện phương pháp kiểm chứng chéo để thu được độ đo AUC của lớp thứ j là . Theo đó, giá trị độ đo AUC sử dụng để đánh giá mô hình được tính bằng công thức sau:
(2.40)
Thực nghiệm tiến hành đánh giá mô hình phân lớp trên một số tập dữ liệu khác nhau sử dụng cả hai độ đo, độ chính xác Accuracy và AUC. Trong đó, độ đo AUC được sử dụng để lựa chọn kích thước cửa sổ dữ liệu của từng hành động khác nhau.
Tập thuộc tính đặc trưng
Sự di chuyển của phương tiện giao thông làm thay đổi gia tốc nên các thuộc tính trong miền thời gian có ý nghĩa và hàm chứa những thông tin hữu ích khi phân tích các hành động, hành vi. Ngoài ra, cũng cần phân tích những thuộc tính hỗ trợ từ các miền thông tin khác. Để lựa chọn được tập thuộc tính đặc trưng phù hợp, cần kết hợp các thuộc tính trên miền thời gian, miền tần số và các tham số Hjorth. Tuy nhiên, để đánh giá được sự hỗ trợ của các tập thuộc tính. Chúng tôi lần lượt đánh giá và kết hợp với nhau nhằm làm rõ sự ảnh hưởng của các tham số.
Do các thuộc tính trên miền thời gian có yếu tố ảnh hướng lớn đến các hành động, hành vi. Sau khi đánh giá chỉ riêng các tập thuộc tính bằng kết quả phân lớp, tiếp đến là kết hợp các thuộc tính trong miền thời gian và tần số; thuộc tính miền thời gian với tham số Hjorth và cuối cùng là kết hợp các thuộc tính đề xuất trên cả miền thời gian, miền tần số và tham số Hjorth để đánh giá sự tác động của từng tập thuộc tính thể hiện ở Bảng 24. Kết quả cho thấy, khi kết hợp cả ba dạng thuộc tính sẽ thu được tập thuộc tính phù hợp hơn dựa trên độ đo AUC và độ chính xác khi phân lớp. Kết quả này được biểu diễn, chứng minh bằng kết quả thực nghiệm.
Miền, tham số Hjorth
Tên tập thuộc tính
Thời gian
T2
Tần số
F2
Hjorth
H2
Thời gian + Tần số
TF2
Thời gian + Hjorth
TH2
Thời gian + Tần số + Hojrth
TFH2
Bảng 24. Các tập thuộc tính
Tập thuộc tính (T2): tập thuộc tính này bao gồm các thuộc tính trên miền thời gian đó là giá trị trung bình, thuộc tính phương sai, thuộc tính hiệp phương sai, thuộc tính độ lệch chuẩn, thuộc tính độ tương quan, giá trị điểm cắt không, thuộc tính độ đo hiệu dụng trên từng cửa sổ dữ liệu. Cùng với các thuộc tính tỉ lệ đỉnh trên trung bình (Pick Average Ratio) trên các trục X, Y, Z của cảm biến gia tốc nhằm tăng thêm hiệu quả nhận dạng các hành động giao thông. Kết hợp với 4 thuộc tính diện tích độ lớn tín hiệu (SMA) như công thức (2.19) cùng với thuộc tính độ lớn véc tơ tín hiệu vi sai DSVM bởi công thức (2.24) và thuộc tính về giá trị trung bình, phương sai và giá trị ước tính cho tốc độ biến thiên góc quay. Tổng số thuộc tính trong miền thời gian ở tập T2 là 34 thuộc tính.
Tập thuộc tính (F2): Tập thuộc tính này bao gồm các thuộc tính trên miền tần số. Do tính chất của tín hiệu cảm biến gia tốc thu được khi có hành động giao thông xảy ra có thể biểu diễn dưới dạng tần số. Bên cạnh đó, sự thay đổi về tín hiệu đẫn đến thay đổi về giá trị năng lượng, nên các đại lượng liên quan đến năng lượng tín hiệu cũng như độ đo Entropy được lựa chọn nhằm trợ giúp nhận dạng các hành động, hành vi khác nhau. Số lượng các thuộc tính trong tập F2 này là 7 thuộc tính.
Tham số Hjorth (H2): được đề xuất sử dụng chủ yếu trong lĩnh vực phân tích tín hiệu tin sinh học [49][52]. Đặc trưng của tham số này có tính chất thống kê của tín hiệu trong miền thời gian gồm tính hoạt động, tính di động và tính phức hợp của tín hiệu. Để nhận dạng hành động và hành vi, chúng tôi đề xuất sử dụng các tham số này đối với các đại lượng góc xoay cũng như đại lượng trên các trục khác nhau của dữ liệu cảm biến gia tốc. Tập thuộc tính từ tham số Hjorth ký hiệu là H2 bao gồm 18 thuộc tính được sử dụng cho thực nghiệm.
Việc kết hợp các tập thuộc tính với nhau nhằm khảo sát, đánh giá ảnh hưởng của các tập thuộc tính để đưa ra tập thuộc tính phù hợp nhất trong hoạt động nhận dạng các hành động, hành vi giao thông. Số lượng các thuộc tính được lựa chọn gồm 59 thuộc tính trên cả miền thời gian, tần số và đối với tham số Hjorth được mô tả ở bảng sau:
Kiểu
Tên đặc trưng
Công thức
Thuộc tính
Miền thời gian
SVM
(2.6)
arms
m
(2.7)
ax, ay, az, arms, f, q
s2
(2.8)
ax, ay, az, f, q
s
(2.8)
ax, ay, az
Diff = max(x)-min(x)
(2.10)
ax, ay, az
R
(2.14)
(ax, ay), (ax, az), (az, ay)
ZC
(2.15)
ax, ay, az
PAR
(2.11)
ax, ay, az
SMA
(2.19)
ax, ay, az, arms
DSVM
(2.24)
arms
I
(2.28)
f, q
Tham số Hjorth
A
(2.34)
ax, ay, az, arms, f, q
M
(2.35)
ax, ay, az, arms, f, q
C
(2.36)
ax, ay, az, arms, f, q
Miền tần số
EFFT
(2.32)
ax, ay, az, arms
En
(2.33)
ax, ay, az
Bảng 25. Tập thuộc tính trong hệ thống nhận dạng hành động giao thông cơ bản
Đề xuất hệ thống nhận dạng hành động
Với đặc thù giao thông đô thị ở Việt Nam, các loại phương tiện phổ biến là xe máy, xe đạp, ô tô và xe buýt. Tình trạng giao thông xảy ra còn nhiều vấn đề tồn tại. Trong đó nổi lên các hành động, hành vi giao thông phức tạp do các yếu tố cá nhân, điều kiện, môi trường cũng như văn hóa giao thông của người dân. Việc nhận dạng hành động, hành vi cần có những giải pháp, kỹ thuật phù hợp với thực tiễn. Do vậy, chúng tôi xây dựng hệ thống nhận dạng như Hình 27 nhằm nhận dạng hành động giao thông cơ bản (Dừng, Đi thẳng, Rẽ trái, Rẽ phải) để lấy đó làm cơ sở cho nhận dạng hành vi giao thông bất thường.
Hệ thống thực hiện việc thu thập, tiền xử lý dữ liệu, biến đổi để có tập dữ liệu đặc trưng dựa trên tập thuộc tính được đề xuất. Từ một số nghiên cứu đã có cho thấy, kích thước cửa sổ dữ liệu sử dụng trong nhận dạng được cố định đối với tất cả các đối tượng. Điều này gặp phải nhiều khó khăn khi các hành động, hành vi cần nhận dạng có những đặc điểm, tính chất khác nhau. Do đó, hệ thống nhận dạng dựa vào dữ liệu đặc trưng được biến đổi bằng tập thuộc tính đề xuất với cửa sổ dữ liệu khác nhau theo từng loại hành động. Các kích thước cửa sổ được lựa chọn dựa trên đánh giá độ đo AUC khi phân lớp dữ liệu.
Hệ thống nhận dạng phương tiện giao thông, hành động giao thông được xây dựng và biểu diễn như Hình 27 dưới đây:
Hình 27. Hệ thống nhận dạng hành động giao thông
Hệ thống nhận dạng bao gồm 2 pha: pha thứ nhất, sử dụng dữ liệu gia tốc có gán nhãn các loại hành động cơ bản đã được thu thập và xác định trước. Các kỹ thuật tiền xử lý dữ liệu được sử dụng kết hợp với tập thuộc tính đặc trưng được đề xuất để xây dựng tập dữ liệu đặc trưng qua đó xây dựng mô hình phát hiện cho hệ thống bằng phương pháp nhận dạng.
Pha thứ hai: nhận dạng các hành động dựa trên dữ liệu cảm biến thu được từ điện thoại của đối tượng đang tham gia giao thông. Các kỹ thuật biến đổi dữ liệu, trích xuất đặc trưng được áp dụng để tạo mẫu dữ liệu phát hiện, phát hiện nhãn của mẫu dữ liệu này bằng bộ phân lớp.
Mỗi loại hành động, hành vi có tính chất, đặc trưng khác nhau nên kích thước cửa sổ dữ liệu tương ứng cũng khác nhau. Việc tìm một kích thước cửa sổ có kích thước phù hợp chứa đủ các thông tin của tất cả các đối tượng cần phân loại, nhận dạng sẽ gặp nhiều khó khăn dẫn đến cần phải khảo sát và lựa chọn các kích thước phù hợp với từng nhãn lớp. Trong kỹ thuật cửa sổ dữ liệu, kết quả khảo sát, tối ưu nhận được là các giá trị kích thước cửa sổ và chồng dữ liệu phù hợp theo từng nhãn lớp hành động. Các kích thước này sẽ được áp dụng vào việc xây dựng dữ liệu huấn luyện cũng xử lý dữ liệu phát hiện các đối tượng tương ứng. Giải pháp lựa chọn kích thước cửa sổ được trình bày trong hình sau đây:
Hình 28. Thuật toán lựa chọn kích thước cửa sổ và chồng dữ liệu theo AUC
Thuật toán lựa chọn tham số mô hình được thực hiện như sau: Từ tập dữ liệu cảm biến gán nhãn, thực hiện lọc nhiễu và cắt dữ liệu cảm biến gia tốc thành cửa sổ dữ liệu. Sử dụng tập thuộc tính đặc trưng để biến đổi dữ liệu gia tốc từ cửa sổ vừa có được để có dữ liệu đặc trưng tương ứng. Tập dữ liệu đặc trưng thu được sử dụng cho việc xây dựng mô hình phân lớp và đánh giá kết quả dựa trên độ đo AUC. Kết quả tối ưu thu được là các kích thước cửa sổ và chồng dữ liệu được lựa chọn sao cho độ đo AUC khi phân lớp tương ứng tăng so với giá trị của cửa sổ trước nó nhỏ hơn một giá trị Delta cho trước thì lựa chọn kích thước của cửa sổ đó. Trong hoạt động nhận dạng hành động, cửa sổ nhỏ nhất được lựa chọn là 1 giây và kích thước tăng thêm mỗi lần là 1. Qua quá trình thực nghiệm, giá trị chênh lệch độ đo AUC của hai cửa sổ liền nhau (Delta) sử dụng để lựa chọn cửa sổ phù hợp nhất là 0.001.
Thuật toán lựa chọn kích thước cửa sổ dựa trên độ đo phân lớp AUC sử dụng các giải thuật phân lớp với dữ liệu được cắt bởi các kích thước cửa sổ thể hiện trong thuật toán sau:
Thuật toán: Lựa chọn kích thước cửa sổ
gán kích thước cửa sổ khởi tạo là 1 giây
// Tính giá trị AUC tương ứng với W
While true do
if then
else
Break
EndWhile
Return
Thuật toán 2.1. Thuật toán lựa chọn kích thước cửa sổ [CT4]
Sau khi thực hiện thuật toán, kích thước cửa sổ phù hợp được lựa chọn để sử dụng cho nhận dạng các nhãn lớp hành động khác nhau dựa trên các thuật toán phân lớp với tập dữ liệu được xây dựng bởi kích thước của sổ này.
Trong đó, pha phát hiện với N nhãn lớp hành động, sử dụng giải pháp tối ưu cửa sổ sẽ có N kích thước cửa sổ khác nhau, đồng thời cần phải thực hiện N lần phân lớp để xác định kết quả nhãn lớp để đưa ra nhãn lớp phù hợp theo Hình 29 như sau:
Hình 29. Nhận dạng hành động với các kích thước cửa sổ lựa chọn.
Tại một thời điểm, dữ liệu được tiền xử lý với N kích thước cửa sổ tối ưu và được nhận dạng nhãn lớp tương ứng. Việc xác định nhãn lớp được quyết định bởi Thuật toán 2-2 dựa trên giá trị AUC dưới đây. Các bước thực hiện giải thuật được đặc tả dưới dạng giả mã như sau:
Thuật toán: Nhận dạng nhãn lớp hành động (Wi)với i = 1,...,N
1. L ← Rỗng// tập nhãn lớp tương ứng với cửa sổ Wi với i = 1,...,N
2. U ← Rỗng // tập độ đo AUC (Wi), với i = 1,...,N
3. bi← 0 // tổng số nhãn trùng với nhãn Li, i = 1,...,N
4. BL ← “S”//nhãn lớp được lựa chọn, khởi đầu bằng nhãn “S”- “Dừng”
5. Si ← 0 // tổng giá trị AUC của các nhãn trùng với Li
6. For i:=1 to N do //thực hiện N lần
7. For j:=1 to N do // thực hiện N lần
8. //Lj thu được khi nhận dạng với Wj
8. If Lj = Li Then
9. bi = bi + 1 // tăng giá trị khi nhãn phân lớp bằng Li
10. EndIf
11. EndFor
11. Si = bi * Ui;với i = 1,...,N// tính Si
12. EndFor
13. BL = Lm khi Sm == Max(Si) với i = 1,...,N
14. Return BL
Thuật toán 22. Nhận dạng nhãn lớp với N kích thước cửa sổ
Tại một thời điểm, kết quả nhận dạng thu được là tập nhãn lớp Li với i = 1,..,N tương ứng với N cửa sổ đầu vào (tương ứng với các nhãn hành động khác nhau); Ui là giá trị độ đo AUC tương ứng; bi là số lượng các nhãn trùng với nhãn của cửa sổ Li, dựa vào bi ta tính được Si là tổng các giá trị độ đo AUC của các cửa sổ có nhãn lớp trùng với Li. Nhãn lớp BL được chọn tương ứng với nhãn lớp thứ m là Lm mà Sm là giá trị lớn nhất trong các Si với i = 1,...,N.
Thực nghiệm và đánh giá
Môi trường thực nghiệm
Hệ thống thu thập và phân tích dữ liệu cảm biến của điện thoại được xây dựng dựa trên hệ điều hành Android phiên bản 4.5 đến 6.0 sử dụng ngôn ngữ Java. Các mô hình phân tích dữ liệu, phát hiện phương tiện, hành động giao thông sử dụng bộ công cụ WEKA [53].
Thực nghiệm tiến hành với các đối tượng mang điện thoại khi điều khiển phương tiện hoặc ngồi sau các phương tiện do người khác điều khiển trong quá trình tham gia giao thông trên đường phố. Vị trí điện thoại có thể thay đổi tùy ý khi tiến hành thực nghiệm. Do tính chất đặc thù ở các thành phố của Việt Nam và trong khuôn khổ luận án, chúng tôi tiến hành thực nghiệm nhận dạng các hành động cơ bản của phương tiện thông dụng nhất là xe máy.
Qua quá trình khảo sát các công trình nghiên cứu về nhận dạng hành động, hành vi sử dụng phương pháp phân lớp. Chúng tôi lựa chọn một số thuật toán thường được sử dụng cho nhận dạng hành động, hành vi giao thông như RF, k –NN, NB, SVM và J48. Các tham số của thuật toán phân lớp được lựa chọn mặc định trên công cụ WEKA phiên bản 3. 8 thực hiện đánh giá bằng phương pháp kiểm chứng chéo chia dữ liệu thành 10 tập như bảng dưới đây:
TT
Thuật toán
Tham số
1
RF
P = 100; I =100; num-slots = 1; K =10; M = 1.0; V = 0.001; S = 1
2
J48
C = 0.25; M = 2
3
k- NN
K=1; W = 0; A: "weka.core.neighboursearch.LinearNNSearch -A \"weka.core.EuclideanDistance -R first-last
4
NB
5
SVM
S= 0; K= 2; D = 3; G = 0.0; R = 0.0; N = 0.5; M = 40.0; C = 1.0; E = 0.001; P = 0.1
Bảng 26. Tham số mặc định của thuật toán phân lớp sử dụng cho thực nghiệm
Dữ liệu thực nghiệm
Hệ thống nhận dạng hành động giao thông được thực hiện trên từng loại phương tiện. Với mục đích làm cơ sở phát hiện hành vi bất thường, luận án tập trung nhận dạng 4 hành động cơ bản là đi thẳng, dừng, rẽ trái và rẽ phải. Dữ liệu cảm biến gia tốc được chuyển trục dựa vào cảm biến con quan hồi chuyển và cảm biến từ; sau đó thực hiện các bước tiền xử lý dữ liệu khác để thực hiện các thực nghiệm về: lựa chọn tập thuộc tính; khảo sát thuật toán phân lớp; và xây dựng tập dữ liệu huấn luyện dựa trên tối ưu kích thước cửa sổ dữ liệu.
Số lượng
Giới tính
Độ tuổi
Nghề nghiệp
Địa điểm, thời gian thu dữ liệu
11 người
7 nam, 4 nữ
22 đến 40
Sinh viên, giảng viên, nhân viên văn phòng.
Khi đi học, đi làm và trở về trên đường phố Hà Nội
Bảng 27. Thông tin đối tượng tham gia thực nghiệm
Thực nghiệm tiến hành thu dữ liệu khi các đối tượng ngồi sau hoặc điều khiển phương tiện trong hành trình lưu thông. Tần số thu dữ liệu là 50Hz. Các hành động cần được nhận dạng là: {Dừng (S), Đi thẳng (G), Rẽ trái (L), Rẽ phải (R)}.
Hành động
Số lượng
Thời gian
Vị trí của điện thoại
Dừng
11
6 phút
Cầm tay khi lái xe, cầm tay ngồi sau
Đi thẳng
11
20 phút
Cầm tay khi lái xe, cầm tay ngồi sau, bỏ túi
Rẽ trái
3
10 phút
Cầm tay khi lái xe, cầm tay ngồi sau
Rẽ phải
3
10 phút
Cầm tay khi lái xe, cầm tay ngồi sau
Bảng 28. Cảnh huống thu thập dữ liệu của các hành động
Các cảnh huống thực hiện thu thập dữ liệu đối với từng hành động được bố trí như sau: Dữ liệu hành động dừng được thu thập khi phương tiện chuẩn bị dừng cho đến khi phương tiện dừng hẳn. Hành động đi thẳng được thực hiện khi phương tiện di chuyển không thay đổi hướng trong lộ trình.
Dừng chờ
Di chuyển
Đi thẳng
Hình 210. Hành động dừng và hành động đi thẳng
Hành động rẽ trái được thực hiện khi phương tiện chuẩn bị rẽ trái đến khi kết thúc rẽ trái, tương tự là hành động rẽ phải với góc chuyển hướng được mô phỏng như Hình 211.
Dữ liệu phát hiện được thu thập và phân tích nhằm phát hiện ra loại phương tiện mà người dùng điện thoại đang sử dụng, từ kết quả này hệ thống sẽ chuyển sang phát
Các file đính kèm theo tài liệu này:
- luan_an_nhan_dang_hanh_vi_cua_nguoi_tham_gia_giao_thong_dua.docx