Trên cơ sở nghiên cứu, phân tích và đánh giá các sai số trong dữ liệu GPS,
luận án đã thiết kế được 01 bộ lọc xử lý dữ liệu bao gồm 09 bước. Kết quả xử lý
trên 317 bộ dữ liệu lái ngoài thực tế cho thấy: trung bình tỷ lệ các điểm dữ liệu được
loại bỏ/thay thế hoặc bổ sung chiếm khoảng 7%, trong đó lỗi liên quan đến sự trôi
của các giá trị vận tốc bằng không lớn nhất.
Dữ liệu lái ngoài thực tế cũng đã được kiểm định tính dừng theo phương pháp
kiểm định nghiệm đơn vị trên phần mềm EVIEWS. Kết quả kiểm định cho thấy:
chuỗi các giá trị vận tốc tức thời theo thời gian là các chuỗi thời gian dừng.
Với mục đích giảm thiểu các biến, là các thông số của chu trình lái, luận án đã
tiến hành trích chọn các thông số đặc trưng từ 317 bộ dữ liệu, mỗi bộ dữ liệu chứa
33 biến. Kết quả trích chọn giữ lại 14 biến trên tổng số 33 biến. Qua so sánh với các
nghiên cứu khác, luận án đã đi đến nhận định: trong nghiên cứu xây dựng chu trình
lái, cần phải thực hiện trích chọn các thông số đặc trưng trên chính bộ dữ liệu sẽ
được sử dụng để tổng hợp chu trình lái thay vì kế thừa việc lựa chọn các thông số
theo kinh nghiệm của các nghiên cứu khác.
Lý thuyết chuỗi Markov đã được ứng dụng để tổng hợp chu trình lái đặc trưng
cho xe buýt Hà Nội, gọi là HBDC. HBDC có mức độ phù hợp rất cao đối với dữ
liệu lái ngoài thực tế. Độ lệch trong phân bố tần suất gia tốc - vận tốc của HBDC
với dữ liệu lái ngoài thực tế chỉ 13,2%.
Để phù hợp với khả năng đo phát thải trong điều kiện của Việt Nam, luận án
đã tiến hành chuyển đổi từ chu trình lái của phương tiện sang chu trình thử của động
cơ, bao gồm chu trình thử chuyển tiếp (HBTC) và chu trình thử tĩnh (HBSC). Kết
quả so sánh giữa HBTC với ETC, giữa HBSC và ESC cho thấy: sự phân bố tần suất
các chế độ hoạt động của động cơ xe buýt Hà Nội rất khác so với của châu Âu. Sự
khác biệt này sẽ ảnh hướng rất lớn tới kết quả đo phát thải.123
Kết quả đo phát thải theo chu trình thử HBSC trên động cơ diesel D1146TI
cho thấy: CSEF của xe buýt Hà Nội cao hơn so với các EF được các tổ chức Quốc
tế đưa ra nhằm hỗ trợ hoạt động kiểm kê phát thải; và cũng khác biệt lớn so với EF
của xe buýt tại một số nước trong khu vực, ví dụ FBEFPM của xe buýt Hà Nội cao
hơn xe buýt ở Macao khoảng 6,4 lần
219 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 446 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Nghiên cứu xác định đặc trưng phát thải của xe buýt tại Hà Nội, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
uẩn là chu trình thử dạng chuyển tiếp của châu Âu, chu trình ETC-part 1 cho HDVs,
gồm 600 điểm dữ liệu vận tốc theo thời gian với bƣớc thời gian 1 giây. Một trăm điểm
78
trong tổng số 600 điểm dữ liệu của ETC-part 1 đƣợc xóa để tạo khoảng trống một cách
ngẫu nhiên. Sau đó, nghiên cứu này đã sử dụng 3 phƣơng pháp khác nhau để tìm lại
các giá trị ở các vị trí tƣơng ứng trong khoảng trống dữ liệu, bao gồm các phƣơng pháp
sau:
- Phƣơng pháp nội suy spline bậc 3 đƣợc sử dụng trong nghiên cứu của Duran và
cộng sự (2012);
- Phƣơng pháp của Ivan Selesnick (2013);
- Phƣơng pháp sử dụng công cụ có sẵn trong Matlab (hàm FillGap).
Giá trị vận tốc tại các khoảng trống tính đƣợc theo 3 phƣơng pháp trên đã đƣợc
so sánh với giá trị thực của bộ dữ liệu gốc. Toàn bộ thao tác trên đƣợc thực hiện trên
phần mềm Matlab, từng bƣớc đƣợc minh họa trên Hình 3.3.
a, Dữ liệu gốc của ETC-part1
79
b, Tạo
các khoảng trống tín hiệu một cách ngẫu nhiên
c, Bù dữ liệu vào khoảng trống
80
d, Sau khi bù dữ liệu vào khoảng trống
Hình 3.3. Minh họa các bước thực hiện trên bộ dữ liệu gốc ETC-part1
Sử dụng thông số thống kê căn bậc hai của sai số toàn phƣơng trung bình (Root
Mean Square Error, RMSE) để đánh giá độ lệch giữa giá trị ƣớc lƣợng và giá trị thực
tại 100 điểm dữ liệu đƣợc xử lý nhƣ Hình 3.3 đối với 3 phƣơng pháp cho thấy RMSE
của phƣơng pháp sử dụng hàm FillGap cao nhất (RMSE = 0,6 km/h), tiếp theo là
RMSE của phƣơng pháp của Duran và cộng sự (RMSE = 0,4 km/h), thấp nhất là kết
quả xử lý theo phƣơng pháp của Ivan Selesnick (RMSE = 0,2 km/h). Minh họa độ lệch
giữa giá trị thực và giá trị đƣợc ƣớc lƣợng bằng 3 phƣơng pháp tại 100 điểm dữ liệu
đƣợc tạo khoảng trống nhƣ Hình 3.4.
81
Hình 3.4. Độ lệch giữa giá trị thực và giá trị ước lượng
Nhƣ vậy, có thể thấy hàm xử lý khoảng trống tín hiệu theo phƣơng pháp của
Ivan Selesnick xây dựng có khả năng xử lý khá tốt các khoảng trống tín hiệu trong dữ
liệu GPS. Ý tƣởng nhận dạng các điểm dữ liệu dị biệt, các điểm dữ liệu bằng không bị
lỗi; sau đó xóa bỏ chúng để tạo ra các khoảng trống tín hiệu tại vị trí đó và bổ sung giá
trị vào khoảng trống đó theo phƣơng pháp bổ sung khoảng trống tín hiệu của Ivan
Selesnick là một ý tƣởng mới đã đƣợc đề xuất và sử dụng trong luận án này.
3.1.2.3. Dữ liệu GPS đã được xử lý
Kết quả xử lý dữ liệu GPS theo quy trình đã đƣợc thiết kế ở trên (Hình 3.2) nhƣ
sau:
Hình 3.5. Đồ thị vận tốc – thời gian của dữ liệu thô và dữ liệu đã qua xử lý
Pick vận tốc
82
Trên Hình 3.5, chúng ta cũng có thể thấy rõ các điểm dữ liệu bất thƣờng trong bộ
dữ liệu gốc. Trong “trip” hành trình này, mặc dù các pick vận tốc không vƣợt quá giới
hạn (Vlimit = 60km/h) nhƣng nó vẫn có sự đột biến khi so sánh với các giá trị vận tốc
liền kề nó. Vì vậy, mặc dù bƣớc lọc các giá trị vận tốc dị biệt không xử lý đến các
điểm dữ liệu này, nhƣng các điểm dữ liệu này tiếp tục đƣợc xử lý nhờ bƣớc lọc các giá
trị gia tốc dị biệt. Qua đó có thể thấy bộ lọc xử lý dữ liệu đƣợc thiết kế khá chặt chẽ để
có thể phát hiện và xử lý các sai số trong dữ liệu thô.
Thống kê tỷ lệ phần trăm các lỗi trên 317 bộ dữ liệu thô nhƣ Bảng 3.1.
Bảng 3.1. Kết quả lọc dữ liệu GPS
Loại lỗi
Trung bình
(%)
Trung vị
(%)
Độ lệch chuẩn
(%)
Sai về thời gian 1,08e-04 0 0,002
Vận tốc dị biệt 0,015 0 0,036
Sự trôi của các giá trị v = 0 3,181 1,041 3,641
Các giá trị v = 0 bị lỗi (v = 0 giả) 0,163 0,139 0,104
Khoảng trống tín hiệu 2,537 1,824 1,270
Gia tốc dị biệt 1,143 0,918 0,798
Ghi chú: Các giá trị trong bảng trên được tính dựa trên 317 kết quả xử lý dữ liệu độc
lập tương ứng với 317 trip dữ liệu lái ngoài thực tế được đưa vào quá trình lọc.
Kết quả trong Bảng 3.1 cho thấy các điểm dữ liệu đã đƣợc loại bỏ/thay thế hoặc
bổ sung chiếm trung bình khoảng 7% trong tổng số các điểm dữ liệu đã đƣợc qua các
bƣớc lọc từ bƣớc 3 đến bƣớc 8. Trong đó, lỗi do sự trôi của các giá trị v = 0 km/h là
cao nhất (chiếm ~ 3,18% trong toàn tập dữ liệu). Tiếp theo là lỗi do mất tín hiệu đột
ngột (chiếm ~ 2,54%), điều đó cho thấy tín hiệu GPS thu nhận đƣợc cũng hay bị gián
đoạn.
Hiệu quả của bộ lọc Kalman đƣợc sử dụng trong bƣớc cuối cùng của quy trình
tiền xử lý dữ liệu đã đƣợc đánh giá thông qua việc tính toán một số thông số thống kê
mô tả dữ liệu của một “trip” hành trình bất kỳ trƣớc và sau khi xử lý trong hai trƣờng
hợp có sử dụng và không sử dụng bộ lọc Kalman (Bảng 3.2).
83
Bảng 3.2. Một số thông số thống kê mô tả của dữ liệu trước và sau khi qua bộ lọc
Kalman
Thông số Dữ liệu thô
Dữ liệu sau khi xử lý
Không sử dụng bộ
lọc Kalman
Có sử dụng bộ lọc
Kalman
Độ lệch chuẩn của vận
tốc (km/h)
10,94 10,86 10,71
Phân vị 95th của vận
tốc (km/h)
37 37 36,4
Hình 3.6 biểu diễn kết quả xử lý của bộ lọc Kalman trên một phân đoạn dữ liệu
của một “trip” đƣợc lựa chọn ngẫu nhiên.
Hình 3.6. Kết quả làm trơn và khử nhiễu của bộ lọc Kalman
Kết quả trong Bảng 3.2 và Hình 3.6 cho thấy bộ lọc Kalman có vai trò rất quan
trọng nhƣ là công đoạn cuối cùng để làm trơn dữ liệu, khử các nhiễu còn lại. Trƣờng
hợp có sử dụng và không sử dụng bộ lọc Kalman đều cho giá trị độ lệch chuẩn của vận
tốc nhỏ hơn dữ liệu ban đầu. Tuy nhiên, khi sử dụng bộ lọc Kalman thì kết quả xử lý
tốt hơn, độ lệch chuẩn của các giá trị vận tốc nhỏ nhất. Phân vị 95th của vận tốc trong
các trƣờng hợp cũng khá tƣơng đồng. Nhƣ vậy, bộ lọc dữ liệu đã đƣợc thiết kế khá
chặt chẽ.
Các thông số đặc trƣng của hoạt động lái ngoài thực tế đƣợc xác định dựa trên bộ
dữ liệu thô và dữ liệu đã qua xử lý nhƣ Bảng 3.3.
Do dữ liệu thô tồn tại nhiều sai số ngẫu nhiên, nên độ lệch chuẩn của tất cả các
thông số đặc trƣng trong dữ liệu thô đều lớn hơn độ lệch chuẩn của các thông số tƣơng
84
ứng trong dữ liệu đã qua xử lý nhƣ trong Bảng 3.3. So sánh sự phân bố tần suất gia tốc
– vận tốc của bộ dữ liệu thô và bộ dữ liệu đã qua xử lý đƣợc thể hiện trên Hình 3.7.
Hình 3.7. Phân bố tần suất gia tốc – vận tốc của dữ liệu trước và sau khi xử lý
(Chú thích: Hình được minh họa với độ phân giải của vận tốc và gia tốc tương ứng là 5 km/h và 0,5
m/s
2
)
Nhƣ trên Hình 3.7, chúng ta có thể thấy sự phân bố tần suất gia tốc – vận tốc của
dữ liệu thô và dữ liệu đã qua xử lý có hình dáng khá tƣơng đồng. Điều đó cho thấy bộ
lọc đã đƣợc thiết kế để có thể bảo toàn hình dáng của dữ liệu gốc trong khi đã bổ sung
đƣợc các điểm dữ liệu bị thiếu, thay thế các giá trị dị biệt, làm trơn dữ liệu và giảm
thiểu nhiễu.
85
Bảng 3.3. So sánh dữ liệu thô và dữ liệu đã qua xử lý thông qua một số thông số đặc trưng của chu trình lái
Thông số đặc trƣng
Dữ liệu thô Dữ liệu đã qua xử lý
Trung bình Trung vị Độ lệch chuẩn Trung bình Trung vị Độ lệch chuẩn
Vận tốc cực đại (km/h) 50,64 49,00 6,88 46,97 46,30 4,09
Vận tốc trung bình (km/h) 16,72 16,86 1,73 16,67 16,82 1,71
Trung bình các giá trị v≠0 17,19 17,35 1,91 17,38 17,75 1,83
Gia tốc lớn nhất (m/s2) 12,35 11,67 2,18 3,85 3,50 1,07
Gia tốc nhỏ nhất (m/s2) -10,19 -9,17 2,29 -3,39 -3,08 1,22
Gia tốc dƣơng trung bình (m/s2) 0,85 0,85 0,10 0,46 0,45 0,06
Gia tốc âm trung bình (m/s2) -0,84 -0,84 0,09 -0,45 -0,44 0,05
Tỷ lệ thời gian xe chạy ở chế độ tăng tốc (%) 40,75 40,97 1,73 46,90 47,03 1,41
Tỷ lệ thời gian xe chạy ở chế độ giảm tốc (%) 41,12 40,99 1,92 48,79 48,83 1,82
Tỷ lệ thời gian xe chạy ở chế độ ổn định (%) 18,13 17,79 3,31 4,31 3,60 2,73
Tỷ lệ thời gian xe chạy ở chế độ không tải (%) 2,80 0,54 3,63 4,05 3,37 2,62
86
3.1.3. Kết quả trích chọn các thông số đặc trƣng
Trong quá trình xây dựng chu trình lái đặc trƣng, một vài tiêu chuẩn thống kê
cần đƣợc tính toán để tái hiện lại các đặc tính của dữ liệu lái ngoài thực tế. Do đó,
điều trƣớc tiên là cần phải xác định đƣợc số tối thiểu các thông số chu trình lái đủ
mạnh để đặc trƣng cho toàn bộ chu trình lái. Bộ thông số đặc trƣng này là tập con
của bộ các thông số chu trình lái nhƣ đã trình bày trong Mục 1.3.4. Các thông số
đặc trƣng này sau đó đã đƣợc sử dụng để đánh giá tính đại diện của các chu trình lái
đƣợc tạo ra.
Phân cụm các thông số mô tả chu trình lái
Trong nghiên cứu này, 317 “trip” dữ liệu hành trình đƣợc sử dụng để xác định
33 thông số đặc trƣng cho mỗi “trip” dữ liệu tƣơng ứng. Kết quả tính toán đƣợc lƣu
lại trong một bảng dữ liệu với 317 hàng, 33 cột và đƣợc đƣa vào quá trình phân cụm
trên phần mềm IBM SPSS Statistics (Hình 3.8).
Hình 3.8. Phân cụm các biến trên phần mềm SPSS
Kết quả phân cụm nhƣ Bảng 3.4 và Hình 3.9.
Bảng 3.4. Biểu đồ tích tụ các biến vào trong các cụm
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Next Stage
Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 23 26 1.000 0 0 5
2 21 33 .963 0 0 9
3 13 14 .958 0 0 14
87
4 31 32 .955 0 0 16
5 22 23 .955 0 1 9
6 2 3 .943 0 0 8
7 6 7 .938 0 0 17
8 1 2 .910 0 6 21
9 21 22 .908 2 5 13
10 4 10 .901 0 0 28
11 5 11 .900 0 0 14
12 27 28 .871 0 0 24
13 21 24 .840 9 0 18
14 5 13 .786 11 3 24
15 16 17 .785 0 0 23
16 25 31 .782 0 4 18
17 6 8 .764 7 0 19
18 21 25 .674 13 16 26
19 6 9 .668 17 0 27
20 18 29 .650 0 0 25
21 1 12 .622 8 0 30
22 19 30 .558 0 0 25
23 15 16 .519 0 15 29
24 5 27 .426 14 12 27
25 18 19 .282 20 22 26
26 18 21 .216 25 18 28
27 5 6 .208 24 19 29
28 4 18 .170 10 26 31
29 5 15 .035 27 23 30
30 1 5 .003 21 29 32
31 4 20 .003 28 0 32
32 1 4 .000 30 31 0
Ghi chú: Kết quả xuất trực tiếp từ phần mềm SPSS và đƣợc giữ nguyên bản gốc (không dịch).
Bảng 3.4 là kết quả phân cụm dƣới dạng sơ đồ tích tụ mà nó thể hiện số cụm
đƣợc kết hợp ở mỗi giai đoạn (Cột: stage). Vì trong nghiên cứu này sử dụng độ đo
khoảng cách là giá trị tuyệt đối của hệ số tƣơng quan nên khi hệ số tƣơng quan giữa
các biến càng nhỏ thì chúng càng khác biệt, không thể kết hợp trong cùng một cụm.
Giai đoạn 1, có 32 cụm vì tổng số biến đƣa vào thuật toán HAC là 33 biến và trong
giai đoạn đầu tiên chỉ hai biến số 23 và 26 đƣợc kết hợp trong một cụm (Cột:
Cluster combined), do độ đo khoảng cách qua hệ số tƣơng quan là lớn nhất (Cột:
Coefficients). Cụm đƣợc tạo ra ở giai đoạn 1 sẽ tiếp tục đƣợc kết hợp thêm biến
khác vào cụm ở giai đoạn kế tiếp là giai đoạn thứ 5 (xem trong “Next stage”). Ở giai
88
đoạn 5, biến số 22 sẽ đƣợc kết hợp vào trong cụm 1 mà đã chứa biến số 23 và 26
(xem trong “Stage Cluster First Appears”).
Hình 3.9 là biểu đồ hình cây thể hiện quá trình phân cụm mà ở đó kết quả cần
đƣợc đọc từ dƣới lên trên. Đƣờng kẻ ngang đại diện cho các biến số đã đƣợc nhập
vào trong cùng một cụm.
Hình 3.9. Đồ thị phân cụm trên không gian các thông số mô tả chu trình lái
Thuật toán HAC không đƣa ra kết luận về số cụm mà ngƣời sử dụng nó cần
phải quyết định số cụm một cách hợp lý. Khi hai cụm cách nhau khá xa có nghĩa là
tính chất của chúng khác nhau nhiều thì không nên nhập lại thành một cụm. Hiện
nay chƣa có một quy tắc rõ ràng và chắc chắn về việc xác định số cụm [96]. Trong
nghiên cứu này, số cụm đƣợc giữ lại sẽ là số các thông số mô tả chu trình lái đƣợc
giữ lại làm thông số đặc trƣng. Nhƣ vậy, để tránh làm mất thông tin, số cụm càng
lớn càng tốt, nhƣng điều này lại có thể khiến cho quá trình lặp để tìm ra chu trình lái
phù hợp trở thành vòng lặp vô hạn. Do đó, luận án đề xuất 2 trƣờng hợp để hợp
nhất các biến vào trong một cụm nhƣ sau:
89
+ Trường hợp 1: r 0,8
Quá trình phân chia cụm chỉ dừng ở giai đoạn 13 (“Coefficients” r 0,840 ), số
cụm kết quả là: 33 – 13 = 20 cụm.
Sau khi xác định đƣợc số cụm cần đạt, chạy lại thuật toán HAC trên phần
mềm SPSS với số cụm chỉ định (n= 20), luận án đã thu đƣợc kết quả phân cụm trên
không gian các biến nhƣ Bảng 3.5.
Bảng 3.5. Kết quả phân cụm trên không gian các biến ứng với trƣờng hợp 1
Cluster membership
(Liên hệ các biến trong các cụm tƣơng ứng)
stt Các biến Cụm stt Các biến Cụm
1 T_total 1 18 a_max 12
2 T_acc 1 19 a_min 13
3 T_dec 1 20 a_av 14
4 T_c 2 21 a_pos_av 15
5 T_cr 3 22 a_neg_av 15
6 T_i 4 23 RMSA 15
7 P_i 4 24 P95PosAcc 15
8 P_a 5 25 P95NegAcc 16
9 P_d 6 26 Acc_sd 15
10 P_c 2 27 N_stop 17
11 P_cr 3 28 N_rate 17
12 Dist 7 29 VSPmax 18
13 V1 8 30 VSPmin 19
14 V2 8 31 VPSpos_av 20
15 Vmax 9 32 VSPneg_av 20
16 Vsd 10 33 PKE 15
17 P95V 11
Theo Bảng 3.5, các biến T_total, T_acc, T_dec có thể kết hợp vào trong cùng
một cụm (cụm 1), biến T-c và P_c có thể kết hợp vào trong cùng cụm 2,Sau khi
kết hợp các biến trong cụm thích hợp, các biến đại diện cho các cụm đƣợc đƣa ra
trong Bảng 3.6.
Bảng 3.6. Các biến đại diện cho các cụm ứng với trường hợp 1
Cụm Biến số Cụm Biến số
1 T_total 11 P95V
2 P_c 12 a_max
90
3 P_cr 13 a_min
4 P_i 14 a_av
5 P_a 15 PKE
6 P_d 16 P95NegAcc
7 Dist 17 N_rate
8 V1 18 VSPmax
9 Vmax 19 VSPmin
10 Vsd 20 VSPpos_av
+ Trường hợp 2: r 0,7
Quá trình phân chia cụm chỉ dừng ở giai đoạn 17 (“Coefficients” r 0,764 ), số
cụm kết quả là: 33 – 17 = 16 cụm.
Tƣơng tự nhƣ trƣờng hợp 1, sau khi xác định đƣợc số cụm cần đạt, chạy lại
thuật toán HAC trên phần mềm SPSS với số cụm chỉ định (n= 16), luận án đã thu
đƣợc kết quả phân cụm trên không gian các biến nhƣ Bảng 3.7.
Bảng 3.7. Kết quả phân cụm trên không gian các biến ứng với trƣờng hợp 2
Cluster membership
(Liên hệ các biến trong các cụm tƣơng ứng)
stt Các biến Cụm stt Các biến Cụm
1 T_total 1 18 a_max 9
2 T_acc 1 19 a_min 10
3 T_dec 1 20 a_av 11
4 T_c 2 21 a_pos_av 12
5 T_cr 3 22 a_neg_av 12
6 T_i 4 23 RMSA 12
7 P_i 4 24 P95PosAcc 12
8 P_a 4 25 P95NegAcc 13
9 P_d 5 26 Acc_sd 12
10 P_c 2 27 N_stop 14
11 P_cr 3 28 N_rate 14
12 Dist 6 29 VSPmax 15
13 V1 3 30 VSPmin 16
14 V2 3 31 VPSpos_av 13
15 Vmax 7 32 VSPneg_av 13
16 Vsd 8 33 PKE 12
17 P95V 8
91
Tƣơng tự nhƣ trƣờng hợp 1, các biến đại diện cho các cụm đƣợc đƣa ra trong
Bảng 3.8.
Bảng 3.8. Các biến đại diện cho các cụm ứng với trường hợp 2
Cụm Biến số Cụm Biến số
1 T_total 9 a_max
2 P_c 10 a_min
3 V1 11 a_av
4 P_i 12 PKE
5 P_d 13 VPSpos_av
6 Dist 14 N_rate
7 Vmax 15 VSPmax
8 P95V 16 VSPmin
Như vậy, các biến trong Bảng 3.6 hoặc Bảng 3.8 là các thông số đƣợc rút gọn
từ 33 thông số mô tả chu trình lái, mỗi thông số đƣợc giữ lại làm đại diện cho 1 cụm
mà ở đó các biến đã đƣợc gom cụm với nhau theo các tiêu chí đặt ra.
Các thông số đặc trƣng của chu trình lái
Trong các thông số đại diện cho 33 thông số mô tả đặc trƣng lái ngoài thực tế
của hệ thống xe buýt Hà Nội, có thể thấy thông số khoảng cách (Dist), liên quan đến
tổ chức hạ tầng sơ sở của các tuyến buýt, không phản ánh phƣơng thức di chuyển
của xe ngoài thực tế nên thông số này đã không đƣa vào sử dụng để xây dựng chu
trình lái đặc trƣng. Thông số tổng thời gian di chuyển (T_total) chỉ phản ánh đƣợc
một phần đặc trƣng lái ngoài thực tế, liên quan đến vận tốc trung bình, vì còn phụ
thuộc vào chiều dài quãng đƣờng di chuyển. Do đó, hai thông số này đã không đƣợc
sử dụng làm thông số đặc trƣng cho hoạt động lái ngoài thực tế, lựa chọn này cũng
phù hợp với các nghiên cứu xây dựng chu trình lái khác [52, 73]. Nhƣ vậy, các
thông số đặc trƣng đƣợc giữ lại để mô tả đặc trƣng lái ngoài thực tế của hệ thống xe
buýt tại Hà Nội và để tái hiện lại các đặc trƣng đó vào trong chu trình lái đặc trƣng
nhƣ Bảng 3.9.
92
Bảng 3.9. Các thông số đặc trưng của chu trình lái
stt Trƣờng hợp 1 Trƣờng hợp 2
1 P_c P_c
2 P_cr V1
3 P_i P_i
4 P_a P_d
5 P_d Vmax
6 V1 P95V
7 Vmax a_max
8 Vsd a_min
9 P95V a_av
10 a_max PKE
11 a_min VPSpos_av
12 a_av N_rate
13 PKE VSPmax
14 P95NegAcc VSPmin
15 N_rate
16 VSPmax
17 VSPmin
18 VSPpos_av
Các thông số trong Bảng 3.9 được gọi là các thông số đặc trưng của chu
trình lái. Số các thông số đặc trƣng của chu trình lái đƣợc lựa chọn càng lớn thì
mức độ phù hợp của chu trình lái đề xuất với dữ liệu lái ngoài thực tế càng cao. Tuy
nhiên, nếu số thông số đặc trƣng đƣợc giữ lại quá lớn thì quá trình tìm kiếm chu
trình lái phù hợp với dữ liệu lái ngoài thực tế, theo giới hạn đánh giá sự phù hợp đặt
ra, có thể không đạt đƣợc. Do đó, ở giai đoạn này, tác giả chƣa đƣa ra kết luận về
việc giữ lại các thông số đặc trƣng theo trƣờng hợp 1 hay trƣờng hợp 2, do chƣa có
cơ sở vững chắc để lựa chọn. Trong quá trình xây dựng chu trình lái dựa trên lý
thuyết Markov (Mục 3.2), luận án đã đƣa ra kết luận dựa trên kết quả tìm kiếm chu
trình lái đặc trƣng theo cả hai trƣờng hợp. Nếu trƣờng hợp nào mà đƣa ra đƣợc chu
trình lái có mức độ phù hợp với dữ liệu lái ngoài thực tế cao hơn thì kết quả trích
93
chọn của trƣờng hợp đó sẽ đƣợc giữ lại. Hoặc nếu trƣờng hợp nào mà quá trình tìm
kiếm chu trình lái phù hợp không thể kết thúc (vòng lặp vô hạn) thì trƣờng hợp đó
sẽ bị loại bỏ.
So sánh kết quả trích chọn các thông số đặc trƣng của chu trình lái
So sánh kết quả nghiên cứu với một số nghiên cứu khác nhƣ trong Bảng 3.10.
Bảng 3.10. So sánh kết quả trích chọn thông số đặc trưng
Stt
Kết quả trích chọn của trƣờng hợp 2
trong nghiên cứu này (a)
So sánh với các nghiên cứu khác
Brady and
O'Mahony (2013)
[55]
(b)
Torp and Önnegren
(2013) [73]
(a)
(b)
1
Tỷ lệ thời gian chạy ổn định ở Vtb (P_c) x x
2 Vận tốc trung bình toàn bộ chu trình
(V1)
x
x
3 Tỷ lệ thời gian không tải (P_i) x x x
4 Tỷ lệ thời gian giảm tốc (P_d)
x
5 Vận tốc cực đại (Vmax)
x
6 Phân vị 95th của vận tốc (P95V)
7 Gia tốc cực đại (a_max) x x x
8 Gia tốc cực tiểu (a_min) x x x
9 Gia tốc trung bình (a_av)
10 Động năng dƣơng (PKE)
11 Trung bình VSP dƣơng (VSPpos_av)
12 Số lần dừng/1 km (N_rate) x x x
13 VSP cực đại (VSPmax) x
x
14 VSP cực tiểu (VSPmin)
Tổng(c) 14 10 8 14
Ghi chú:
(a)
phƣơng pháp phân cụm phân cấp gộp; (b) phƣơng pháp phân tích hồi quy; (c) tổng
các biến đƣợc lựa chọn bao gồm cả những biến không trùng với các biến đƣợc lựa chọn trong
nghiên cứu này.
Theo Bảng 3.10, các thông số đƣợc trích chọn làm thông số đặc trƣng, theo
các phƣơng pháp khác nhau, khá tƣơng đồng. Trích chọn bằng phân tích hồi quy đã
giữ lại số thông số đặc trƣng nhiều hơn phƣơng pháp phân cụm. Nghiên cứu [73]
thực hiện phƣơng pháp phân cụm phân cấp trên bộ dữ liệu lái đô thị với độ đo
94
khoảng cách giữa các cụm đƣợc xác định thông qua tổng độ lệch bên trong của một
cụm mà cụm đó đã đƣợc xác định là cụm đầu tiên trong quá trình phân tích thành
phần chính PCA.
Trong nghiên cứu này, tác giả đã áp dụng phƣơng pháp phân cụm nhƣ trong
nghiên cứu của Torp (2013) [73] trên bộ dữ liệu đƣợc sử dụng trong nghiên cứu của
đề tài và đã xác định đƣợc 09 thông số đặc trƣng nhƣ sau: T_total, P_c, P_cr, V_sd,
a_max, a_min, a_av, P95PosAcc, N_stop. Bộ 09 thông số này khác với kết quả nhƣ
trong nghiên cứu [73]. Qua đó có thể thấy rằng kết quả thu đƣợc có thể khác nhau
ngay cả khi áp dụng cùng một phƣơng pháp khai phá dữ liệu nhƣng trên các bộ dữ
liệu nguồn với đặc trƣng lái rất khác biệt. Kết luận này trùng với kết quả trong
nghiên cứu [73].
Như vậy, việc trích chọn các thông số đặc trƣng của chu trình lái dựa trên
chính bộ dữ liệu lái ngoài thực tế mà đang đƣợc sử dụng trong nghiên cứu là việc
làm cần thiết, thay vì áp dụng kết quả trích trọn từ các nghiên cứu khác.
Ngoài ra, có thể thấy rằng, 02 bộ thông số đặc trƣng, đƣợc rút gọn từ 33 thông
số ban đầu, đã bao gồm các thông số đƣợc trích chọn trong các nghiên cứu khác,
nhƣng số lƣợng các thông số đƣợc giữ lại nhiều hơn. Do đó, khả năng giữ đƣợc tính
toàn vẹn các đặc trƣng lái ngoài thực tế trong quá trình xây dựng một chu trình lái
cũng sẽ tốt hơn.
3.2. Chu trình lái đặc trƣng cho xe buýt tại Hà Nội
Thực hiện lƣu lại xác suất chuyển dịch trạng thái từ 317 “trip” dữ liệu lái
ngoài thực tế, với độ phân giải của vận tốc là 1km/h và của gia tốc là 0,1m/s2 nhƣ đã
đƣợc phân tích lựa chọn ở trên (Mục 2.5.3), luận án đã thu đƣợc ma trận TPM với
kích thƣớc 179 x 71. Trên phần mềm Matlab, tác giả đã sử dụng mảng cấu trúc để
lƣu giữ TPM, lƣu giữ thông tin về các thông số chu trình lái của 317 trip dữ liệu đầu
vào và các thông số đặc trƣng đƣợc trích chọn,nhƣ minh họa trên Hình 3.10. Ma
trận TPM đã đƣợc sử dụng để xây dựng chu trình lái đặc trƣng.
95
Hình 3.10. Mảng cấu trúc chứa TPM
Với việc giữ lại 18 thông số đặc trƣng (Trƣờng hợp 1) khiến vòng lặp nhƣ
Hình 2.6 trở thành vòng lặp vô hạn, điều đó có nghĩa là không thể tìm ra đƣợc một
chu trình lái mà có thể phù hợp với dữ liệu lái ngoài thực tế khi đƣợc đánh giá thông
qua 18 thông số, với khoảng lệch cho phép [-12,5%; +12,5%] so với trung vị của dữ
liệu lái ngoài thực tế (giới hạn độ lệch đƣợc lựa chọn nhƣ đã lập luận trong Mục
2.6.4). Do đó, loại bỏ kết quả trích chọn các thông số đặc trƣng của Trƣờng hợp 1
(Mục 3.1.3).
Như vậy, 14 thông số đặc trƣng, kết quả trích chọn theo Trƣờng hợp 2, trong
Bảng 3.9, đã đƣợc sử dụng trong quá trình xây dựng chu trình lái đặc trƣng cho xe
buýt tại Hà Nội.
Dựa trên TPM đã lƣu lại đặc trƣng lái ngoài thực tế và 14 thông số đặc trƣng
đƣợc sử dụng trong quá trình xây dựng chu trình lái, luận án đã thu đƣợc một số chu
trình lái đề xuất với giá trị SAFDdiff tƣơng ứng nhƣ Bảng 3.11.
Bảng 3.11. Giá trị SAFDdiff của các chu trình đề xuất
Các chu trình đề
xuất
1 2 3 4 5 6 7 8
SAFDdiff, % 13,2 14,8 14,2 15,2 15,4 15,9 16,8 18,2
96
Chu trình lái đặc trƣng cho xe buýt Hà Nội đƣợc lựa chọn dựa trên giá trị
SAFDdiff nhỏ nhất của các chu trình lái đề xuất. Nhƣ vậy, theo Bảng 3.11, chu trình
lái đặc trƣng cho xe buýt Hà Nội đƣợc lựa chọn là chu trình mà đạt đƣợc giá trị
SAFDdiff nhỏ nhất, bằng 13,2%, gọi tắt là chu trình HBDC. Chu trình HBDC đƣợc
minh họa trên Hình 3.11, các thông số của chu trình HBDC đƣợc đƣa ra trong Bảng
3.12. Dữ liệu vận tốc tức thời gian của HBDC xem Phụ lục 2.
Hình 3.11. Chu trình lái đặc trưng của xe buýt tại Hà Nội
Hình 3.11 cho thấy: gia tốc có biên độ dao động khá lớn trong khoảng từ –
2,78 m/s
2
đến 3,06 m/s2 và có sự đan xen giữa các chế độ tăng tốc và giảm tốc một
cách liên tục. Điều này phù hợp với đặc trƣng của hệ thống giao thông tại Hà Nội
với nhiều điểm giao cắt (chủ yếu là các nút giao đồng mức), mật độ phƣơng tiện lớn
khiến các phƣơng tiện phải thay đổi vận tốc thƣờng xuyên.
Ngoài ra, trong nghiên cứu này, tác giả cũng đã kiểm định lại sự tối ƣu của giá
trị giới hạn 25%, mà đƣợc sử dụng để đánh giá sự phù hợp của chu trình lái đƣợc
tổng hợp so với dữ liệu gốc trong quá trình tìm kiếm chu trình lái đề xuất, khi kế
thừa giá trị giới hạn này theo nghiên cứu của Torp và cộng sự (2013) [73]. Trên
thực tế, giới hạn đánh giá sự phù hợp có ảnh hƣớng lớn tới quá trình xây dựng chu
trình lái. Giới hạn càng nhỏ thì sự phù hợp của chu trình lái đề xuất với dữ liệu lái
ngoài thực tế càng cao và ngƣợc lại. Tuy nhiên, nếu giới hạn này rất nhỏ, tức là các
thông số đặc trƣng của chu trình lái đề xuất chênh lệch rất ít với trung vị của các
thông số đặc trƣng tƣơng ứng của dữ liệu lái ngoài thực tế, thì quá trình lặp để tìm
kiếm chu trình lái phù hợp (chu trình lái đƣợc đề xuất) có thể là một vòng lặp vô
97
hạn. Do vậy, tác giả đã thử chạy chƣơng trình với sự thay đổi của giá trị giới hạn
này, kết quả thu đƣợc nhƣ sau:
- Với giới hạn đánh giá sự phù hợp là 30%, tƣơng ứng với miền giới hạn ±
15% thì giá trị SAFDdiff nhỏ nhất là 13,4%. Nhƣ vậy, đã có sự tăng nhẹ
trong giá trị SAFDdiff nhỏ nhất so với trƣờng hợp áp dụng giới hạn là 25%
nhƣ đã đƣợc sử dụng ở trên, theo kinh nghiệm của Torp và cộng sự
(2013), mà với giới hạn đó giá trị SAFDdiff nhỏ nhất đạt đƣợc là 13,2%.
- Với giới hạn đánh giá sự phù hợp là 20%, tƣơng ứng với miền giới hạn
±10% thì quá trình lặp để tìm kiếm chu trình lái đề xuất phù hợp đã không
thể dừng lại, vòng lặp là vô hạn.
Do đó, việc áp dụng giá trị giới hạn 25% theo kinh nghiệm của Torp và cộng
sự (2013) là phù hợp.
Đánh giá chu trình lái HBDC
Để đánh giá kết quả đạt đƣợc, chu trình HBDC đƣợc so sánh với dữ liệu lái
ngoài thực tế. Việc so sánh đƣợc thực hiện dựa trên các thông số của chu trình lái
(Bảng 3.12) và sự phân bố các nhóm chế độ hoạt động, gọi là bin (Hình 3.12).
Trong đó, mỗi bin (ký hiệu: opModeID) đƣợc xác định bởi sự kết hợp của VSP và
vận tốc tức thời theo cách định nghĩa trong phần mềm MOVES (Motor Vehicle
Emission Simulator) của Cục bảo vệ môi trƣờng Mỹ (MOVES) và đƣợc đề cập đến
trong nghiên cứu gần đây của Qi và cộng sự (2016) [97].
Bảng 3.12. So sánh các thông số đặc trƣng của chu trình lái giữa HBDC và dữ liệu
lái ngoài thực tế
Thông số Đơn vị HBDC
Dữ liệu lái
ngoài thực tế
Phần trăm
độ lệch
tƣơng đối
(%)
Khoảng cách km 18,32 17,51 2,26
Tổng thời gian s 3936 3824 1,44
Thời gian tăng tốc s 1345 1412 2,43
98
Thời gian giảm tốc s 1287 1456 6,16
Thời gian chạy ổn định ở vận tốc trung
bình
s 555 316 27,44
Thời gian chạy ổn định ở vận tốc thấp s 449 320 16,78
Thời gian chạy không tải s 300 328 4,46
Tỷ lệ thời gian tăng tốc % 34,17 36,97 3,9
Các file đính kèm theo tài liệu này:
- tom_tat_luan_an_nghien_cuu_xac_dinh_dac_trung_phat_thai_cua.pdf