MỤC LỤC
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT v
DANH MỤC CÁC CHỮ VIẾT TẮT v
DANH MỤC CÁC BẢNG v
DANH MỤC HÌNH VẼ v
MỞ ĐẦU 5
1. Tính cấp thiết của đề tài 5
2. Mục đích nghiên cứu 5
3. Đối tượng và phạm vi nghiên cứu của luận án 5
4. Ý nghĩa khoa học và thực tiễn của luận án 5
5. Phương pháp nghiên cứu 5
6. Bố cục của luận án 5
Chương 1. TỔNG QUAN VỀ ĐIỀU KHIỂN DỰ BÁO 5
PHI TUYẾN VÀ MÔ HÌNH ROBOT TỰ HÀNH 5
1.1 Tình hình nghiên cứu 5
1.1.1 Điều khiển dự báo 5
1.1.2 Điều khiển Robot tự hành và một số phương tiện chuyển động liên quan 5
1.1.3 Nhận xét 5
1.2 Nội dung nghiên cứu 5
1.3 Mô hình 1 Robot tự hành 5
1.3.1 Phương trình động học 5
1.3.2 Ràng buộc không tích phân được và liên hệ đến vấn đề điều khiển 5
1.4 Mô hình hệ hai robot tự hành Chủ - Tớ (Master – Slave) 5
1.4.1 Mô hình chưa xét đến góc 5
1.4.2 Mô hình có xét đến góc hướng 5
1.4.3 Nhiệm vụ điều khiển bám theo quỹ đạo của Robot tự hành chủ 5
1.5 Kết luận chương 1 5
Chương 2. ĐIỀU KHIỂN DỰ BÁO TUYẾN TÍNH VÀ PHI TUYẾN TRONG CÁC HỆ CHUYỂN ĐỘNG 5
2.1 Điều khiển dự báo Min-Max cho hệ phi tuyến được tuyến tính hóa 5
2.1.1 Điều khiển dự báo kiểu min-max cho hệ không xét đến nhiễu và phân tích ổn định 5
2.1.2 Điều khiển dự báo Min-Max cho hệ không liên tục có nhiễu 5
2.1.3 Mô phỏng 5
2.2 Điều khiển dự báo phi tuyến trực tiếp cho hệ 2 Robot tự hành cấu trúc Chủ -tớ 5
2.2.1 Thiết kế luật điều khiển 5
2.2.2 Khảo sát tính ổn định của hệ thống và xét tính khả thi của thuật toán MPC 5
2.2.3 Kết quả Mô phỏng 5
2.3 Kết luận chương 2 5
Chương 3. ĐIỀU KHIỂN BÁM THEO QUỸ ĐẠO CỦA ROBOT TỰ HÀNH CHỦ CÓ XÉT ĐẾN GÓC HƯỚNG 5
3.1 Thiết lập Bộ điều khiển dự báo trong điều khiển bám quỹ đạo cho hệ hai robot tự hành kiểu Chủ - Tớ (Master – Slave) không nhiễu 5
3.1.1 Thuật toán điều khiển dự báo phi tuyến 5
3.1.2 Tính ổn định của hệ thống 5
3.1.3 Mô phỏng xem xét với hệ hai Robot tự hành 5
3.2 Thiết lập Bộ điều khiển dự báo bền vững bám quỹ đạo cho hệ hai Robot tự hành kiểu Chủ - Tớ (Master - Slave) có nhiễu 5
3.2.1 Thuật toán Điều khiển dự báo có tính đến Nhiễu và Phân tích tính ổn định 5
3.2.2 Kết quả mô phỏng 5
3.3 Kết luận chương 3 5
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA LUẬN ÁN 5
DANH MỤC CÁC CÔNG TRÌNH CÔNG BỐ CỦA LUẬN ÁN 5
TÀI LIỆU THAM KHẢO 5
PHỤ LỤC 1: Code mô phỏng con lắc ngược 5
PHỤ LỤC 2: Code mô phỏng hệ Robot tự hành Master-Slave với quỹ đạo là đường thẳng 5
PHỤ LỤC 3: Code mô phỏng hệ Robot tự hành Master-Slave với quỹ đạo là đường tròn có thay đổi hướng 5
108 trang |
Chia sẻ: vietdoc2 | Ngày: 28/11/2023 | Lượt xem: 440 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận án Điều khiển dự báo phi tuyến cho hệ Robot tự hành và con lắc ngược, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
áp điều khiển dự báo. Do định hướng của phương pháp là thực hiện điều khiển dự báo cho hệ tuyến tính xấp xỉ nên cần tính đến sai lệch gồm 2 thành phần, thứ nhất là sai lệch giữa mô hình gốc phi tuyến và mô hình được tuyến tính hóa và thứ hai là ảnh hưởng gây bởi nhiễu . Sai lệch này sẽ ảnh hưởng đến mô hình dự báo nên giải pháp lúc này sẽ là giữ mô hình tuyến tính xấp xỉ làm mô hình dự báo còn ảnh hưởng của sai lệch nói trên đẩy sang xử lý ở hàm mục tiêu và yêu cầu đặt ra lúc này sẽ là tìm bộ điều khiển làm tối thiểu hóa cận trên của hàm mục tiêu khi chịu ảnh hưởng lớn nhất của sai lệch, vì thế cách tiếp cận đó gọi là phương pháp Min-Max. Như đã biết do sự thay đổi tín hiệu điều khiển tối ưu sau mỗi chu kỳ nên khả năng ổn định bằng bộ điều khiển MPC là khó đạt được mặc dù nếu giữ cố định bộ điều khiển tối ưu hệ có thể ổn định. Thêm nữa kỹ thuật điều khiển dự báo kiểu Min-Max sẽ được triển khai cho mô hình con lắc ngược. Sở dĩ vận dụng phương pháp nói trên cho hệ này là bởi cơ sở của phương pháp điều khiển dự báo kiểu Min-Max được trình bày ở phần sau là triển khai cho hệ tuyến tính mà mô hình con lắc ngược khi làm việc ở lân cận quanh điểm cân bằng có thể được xem là xấp xỉ tuyến tính. Cũng cần lưu ý phương pháp điều khiển dự báo kiểu Min-Max này không giống như phương pháp điều khiển dự báo phi tuyến được thực hiện trực tiếp cho hệ Robot tự hành được triển khai ở chương sau.
2.1.1 Điều khiển dự báo kiểu min-max cho hệ không xét đến nhiễu và phân tích ổn định
Triển khai bước 1 như nêu ở trên cho hệ phi tuyến không liên tục không xét đến ảnh hưởng của nhiễu (2.4) với bộ điều khiển dự báo kiểu Min-Max:
(2.9)
Ý nghĩa của Min – Max được hiểu như sau:
Xem xét ảnh hưởng của sai lệch trong (2.3) tạo ra giá trị lớn nhất (max) có thể hoặc là cận trên (Sup) nếu không có giá trị lớn nhất (xem bổ đề 2.1.2) của hàm mục tiêu tại thời điểm hiện tại l (2.10). Tiếp đó tìm tín hiệu điều khiển làm tối thiểu hóa (Min) của giá trị lớn nhất có thể hoặc Cận trên (Sup) này.
(2.10)
ở đây là những ma trận đối xứng xác định dương với số chiều phù hợp, lần lượt là trạng thái được dự báo dựa vào giá trị đo được và tín hiệu điều khiển tại thời điểm được tính toán tại thời điểm hiện tại .
Ở đây trong công thức (2.10) được thực hiện với cận là vô cùng, trong khi cấu trúc điều khiển dự báo được thể hiện ở bài toán tối ưu hóa dựa trên cửa sổ dự báo là hữu hạn kèm theo thành phần cuối giúp ổn định hệ thống (xem chương 3). Lý do là có sự chuyển đổi giữa 2 trường hợp này do ảnh hưởng của thành phần cuối. Ngoài ra, tuy cửa sổ dự báo là vô hạn (2.10) nhưng mục đích của điều khiển dự báo ở đây là làm tối thiểu hóa cận trên của (2.10) dưới ảnh hưởng của sai lệch.
Khác với các phương pháp trước đây xử lý cho tình huống ràng buộc tín hiệu điều khiển như ở (2.11) bằng kỹ thuật hiệu chỉnh ngược hay anti windup [5].
(2.11)
với thu được từ giả thiết 3 với những giá trị biên của tín hiệu điều khiển cũng như việc thiết kế sẽ được xem xét trong mục tiếp theo. Việc ước lượng giá trị lớn nhất theo sai lệch mô hình sẽ được thực hiện dựa trên bổ đề sau:
Bổ đề 2.1.1. Bất đẳng thức sau là đúng với mọi ma trận và ma trận xác định dương với số chiều phù hợp:
Chứng minh: Kết quả trên là đúng vì tương đương với bất đẳng thức sau
Bổ đề 2.1.2. Với mô hình và bộ điều khiển Min-Max MPC tại thời điểm trích mẫu , nếu tồn tại và một ma trận xác định dương thỏa mãn:
(2.12) thì sẽ tồn tại cận trên của hàm mục tiêu (2.10) với dạng toàn phương như sau:
Chứng minh: Dựa vào dạng toàn phương , ta có ước lượng như sau:
(2.13)
Trong đó (2.14)
Từ (2.14) và Bổ đề 2.1.1, ta dẫn đến:
(2.15)
Ngoài ra từ (2.9) và giả thiết 2.1.1 cũng như sai lệch mô hình đủ nhỏ , ta có được quan hệ:
(2.16)
Từ (2.15), (2.16) và (2.12), dẫn đến bất đẳng thức:
(2.17)
Ta để ý (2.17) đúng với mọi nên
.
Tiếp theo, bộ điều khiển dự báo được thiết lập bằng cách giải bài toán tối ưu hóa 2.1 dạng toàn phương chặn trên mô tả ở bồ đề 2.1.2, để đạt được nghiệm là tại từng thời điểm trích mẫu có tính đến ràng buộc đầu vào. Ý nghĩa của bài toán tối ưu hóa dưới đây thể hiện thông qua miền ràng buộc sẽ là rỗng khi .
Bài toán Tối ưu hóa 2.1.1.
Với miền ràng buộc :
(2.18)
Hình 2.1: Tương quan về tính khả thi giữa 2 thời điểm trích mẫu liên tiếp
Trong hình 2.1 mô tả về tương quan về tính khả thi giữa hai thời điểm trích mẫu liên tiếp: có nghĩa là nghiệm tối ưu của bài toán tối ưu tại thời điểm thứ l cũng là một nghiệm của bài toán tối ưu tại thời điểm thứ l+1.
Bài toán tối ưu hóa 2.1.1 sẽ có nghiệm ứng với (a) có dấu bằng. Tuy nhiên, việc để dấu nhỏ hơn để chuyển về bài toán tối ưu có điểm trong có thể giải bằng các công cụ phần mềm được xây dựng từ phương pháp S-procedure trong [77]. Ngoài ra cũng cần lưu ý: mối liên hệ giữa với đặc trưng cho lần lượt cận trên của hàm mục tiêu, bộ điều khiển tối ưu, ước lượng sai lệch giữa mô hình tuyến tính hóa và mô hình phi tuyến gốc, là không tường minh. Bài toán tối ưu này tương đương với bài toán tối ưu có ràng buộc là Bất đẳng thức Ma trận như mô tả trong [14] thể hiện ở định lý sau đây:
Định lý 2.1.1. Nếu là nghiệm của bài toán tối ưu 2.1.2 sau đây thì nó cũng là nghiệm của bài toán tối ưu hóa 2.1.1 được nêu ở trên.
Bài toán Tối ưu hóa 2.1.2.
ở đây hàm số là không tường minh được xác định từ các diễn đạt được nêu ở trên với quan hệ tương đương như sau . Ngoài ra, miền ràng buộc được thể hiện qua Bất đẳng thức Ma trận sau đây:
(2.19)
Việc giải bài toán tối ưu hóa 2.1.2 này sẽ được triển khai bằng một trong số các công cụ Casadi, Alcado hoặc Yalmip.
Chứng minh: Theo (2.18) ta suy ra:
(2.20)
Dựa vào Bổ đề Schur, ta có (2.20) tương đương với bất đẳng thức ma trận sau:
(2.21)
ở đây
Ngoài ra chúng ta còn có
và .
Thêm nữa nhận xét là đúng bởi vì từ (2.17) ta suy ra:
(2.22)
Dẫn đến (2.23)
Tín hiệu điều khiển được ước lượng của bộ điều khiển thỏa mãn:
(2.24)
Do vậy ta thu được kết luận sau:
(2.25)
Với mục đích phân tích tính ổn định của hệ kín khi sử dụng bộ điều khiển dự báo đề xuất ở trên, giả thiết 2.1.4 và bổ đề 2.1.3 được đưa ra như sau.
Giả thiết 2.1.4: Tồn tại tại mỗi thời điểm trích mẫu sao cho:
với
Có thể thấy giả thiết này là hợp lý với giá trị đầu là phù hợp và thời gian trích mẫu đủ nhỏ.
Ngoài ra, “Tính khả thi” cần được xem xét để ở đây là điều kiện cho phép so sánh hàm ứng viên Lyapunov tại hai thời điểm liên tiếp bằng phương pháp bắc cầu. Giả thiết 4 nói trên được đưa ra để xem xét “tính khả thi” khi giải bài toán tối ưu hóa 2 ở thời điểm trích mẫu l như mô tả ở Bổ đề 2.1.3:
Bổ đề 2.1.3. (Tính khả thi) Nghiệm của bài toán tối ưu hóa 2 trong Định lý 2.1 tại thời điểm trích mẫu cũng nằm trong miền ràng buộc của bài toán tối ưu hóa 2 trong Định lý 2.1 tại thời điểm trích mẫu .
Chứng minh.
Theo (2.17) ta có được quan hệ giữa 2 hàm dạng toàn phương như sau:
(2.26)
(2.27)
Ràng buộc của tín hiệu điều khiển được thể hiện như sau:
(2.28)
Nghiệm của bài toán tối ưu hóa 2 trong định lý 2.1 tại thời điểm trích mẫu sẽ thỏa mãn:
(2.29)
Kết hợp với Giả thiết 4 ta có:
(2.30)
Vì vậy, thỏa mãn ràng buộc sau:
(2.30)
Với . Do đó nghiệm tại thời điểm trích mẫu sẽ nằm trong miền ràng buộc của bài toán tối ưu 2 tại thời điểm trích mẫu với như sau .
Với lưu ý đặc điểm của bộ điều khiển dự báo được triển khai cho mô hình 2.4 (đã loại bỏ nhiễu) là có sự thay đổi ở bài toán tối ưu 2 sau mỗi chu kỳ nên tính ổn định tại điểm cân bằng có thể bị vi phạm mặc dù nếu không có sự thay đổi bài toán tối ưu ở mỗi chu kỳ thì nộ điều khiển là ổn định. Do đó tính ổn định cần được khảo sát dựa trên bổ đề 2.1.4 sau đây
Bổ đề 2.1.4. (Tính ổn định của ĐK dự báo) Giả sử tồn tại nghiệm của bài toán tối ưu hóa 2 trong Định lý 2.1 tại thời điểm ban đầu thì hệ kín thu được từ hệ được loại bỏ nhiễu (2.4) dưới tác động của bộ điều khiển dự báo trong định lý 2.1 sẽ ổn định tiệm cận.
Chứng minh. Từ bổ đề 2.1.3 về tính khả thi, dẫn đến tồn tại nghiệm tối ưu của bài toán tối ưu hóa 2 tại thời điểm trích mẫu và bất đẳng thức sau đây thỏa mãn:
(2.31)
Liên hệ với bất đẳng thức (2.22), ta có được
và với được xem như 1 hàm ứng viên Lyapunov. Có thể thấy rằng tồn tại 1 giá trị đủ nhỏ để và là xác định dương, dẫn đến . Do vậy . Điều này dẫn đến biến trạng thái và tín hiệu điều khiển dự báo sẽ hội tụ đến .
2.1.2 Điều khiển dự báo Min-Max cho hệ không liên tục có nhiễu
Bộ điều khiển dự báo cho hệ được loại bỏ nhiễu (2.4) như ở mục trên sẽ được phát triển như ở định lý 2.1.2 cho hệ có nhiễu bằng cách bổ sung thêm một thành phần có tính đến nhiễu. Ở đây cần lưu ý việc xử lý ảnh hưởng của nhiễu và thành phần sai lệch là độc lập với nhau.
Định lý 2.1.2 Xét hệ không liên tục có nhiễu (2.1) được điều khiển bởi bộ điều khiển dự báo suy biến kế thừa từ định lý 2.1: với thu được từ bài toán tối ưu hóa 2 trong định lý 2.1 và thu được từ giả thiết 3, khi đó sai lệch trạng thái giữa quỹ đạo trạng thái của hệ được loại bỏ nhiễu và hệ thực sẽ hội tụ đến miền hấp dẫn:
và đó cũng là miền hấp dẫn của quỹ đạo trạng thái của hệ (2.1).
Chứng minh.
Ta có (2.32)
Kết hợp với (2.6), ta dẫn đến
(2.33)
Từ (2.5) dẫn đến
(2.34)
Sử dụng hàm ứng viên Lyapunov có được:
(2.35)
Dẫn đến:
(2.36)
Và
Từ đó thu được
(2.37)
Ước lượng (2.37) có thể được viết lại như sau:
(2.38)
Với (2.39)
Do vậy,
(2.40)
Sử dụng giả thiết 3, ta thu được miền hấp dẫn như sau;
(2.41)
2.1.3 Mô phỏng
Để kiểm chứng chất lượng của bộ điều khiển dự báo được đề xuất cho hệ thiếu cơ cấu chấp hành, mô hình con lắc ngược [50,51,35,36,78] (hình 2.2) được thể hiện như sau:
Thay ở phương trình 2 vào phương trình (1) trong quan hệ ở trên thu được:
(2.42)
ở đây và được ký hiệu tương ứng là góc và tốc độ góc.
Hình 2.2: Mô tả con lắc ngược [78]
là tín hiệu điều khiển được xem như là Lực tác động. Ngoài ra khối lượng xe và con lắc lần lượt là , chiều dài con lắc là , biến trạng thái ban đầu của con lắc là
và . Ma trận trọng số của hàm mục tiêu (2.10) trong bài toán tối ưu hóa 1 được lựa chọn như sau
. Việc chuyển mô hình liên tục dạng (2.42) về dạng không liên tục (2.1) được thực hiện thông qua phép xấp xỉ với chu kỳ đủ nhỏ
Hình 2.3: Đáp ứng góc của hệ thực và hệ được loại bỏ nhiễu
Hình 2.4: Đáp ứng tốc độ góc của hệ thực và hệ được loại bỏ nhiễu
Hình 2.5: Tín hiệu điều khiển của Con lắc ngược và hệ được loại bỏ nhiễu
Hình 2.6: Đáp ứng Các thông số của ma trận
Các kết quả chỉ ra trong Hình 2.3-2.7 cho thấy MPC được đề xuất ở trên đảm bảo hệ thống làm việc ổn định và loại bỏ được nhiễu tác động. Giá trị các ma trận L và P của bộ điều khiển dự báo và tín hiệu điều khiển tối ưu đều nằm trong giới hạn cho phép (Hình 2.6, 2.7 và Hình 2.5).
Lưu ý, phương pháp tối thiểu hóa cho cận trên của hàm mục tiêu (mục 2.1.1) là dựa trên sai lệch giữa mô hình phi tuyến và mô hình tuyến tính hóa. Phương pháp này không sử dụng cho trường hợp có nhiễu tác động. Trường hợp có nhiễu tác động được trình bày trong mục 2.1.2. Có thể thấy những kết quả mô phỏng nói trên khẳng định chất lượng đáp ứng thông qua việc so sánh với những nghiên cứu điều khiển xe tự cân bằng dùng phương pháp học tăng cường [3,4] (Danh mục công bố).
Hình 2.7: Đáp ứng hệ số của ma trận trong điều khiển con lắc ngược
2.2 Điều khiển dự báo phi tuyến trực tiếp cho hệ 2 Robot tự hành cấu trúc Chủ -tớ
2.2.1 Thiết kế luật điều khiển
Từ Hình 1.2 với ảnh hưởng của các góc hướng nên để thiết lập mô hình sai lệch bám của hệ 2 Robot tự hành 2 bánh chủ động đưa được về dạng tường minh phục vụ cho việc thiết kế điều khiển sau này thì cần thêm vào ma trận chuyển như sau:
và ,.
Khi đó mô hình sai lệch bám sử dụng biến sai lệch mới thay cho sai lệch tọa độ thuần túy giữa Robot chủ và tớ với :
(2.43)
Từ đó, Mô hình sai lệch bám thu được dạng tường minh sau khi lấy đạo hàm 2 vế của (2.43):
(2.44)
Bài toán thiết kế ở đây là tổng hợp một MPC để đưa về miền lân cận với gốc tọa độ. Dễ dàng thấy rằng: hệ sai lệch bám (2.44) chứa thành phần bất định, trong đó không biết trước, nên khi xây dựng MPC ta coi như hệ trên đã loại bỏ được nhiễu.
Xét hệ được loại bỏ nhiễu từ mô hình thu được trong mục 1.4.1:
(2.45)
Với lần lượt là biến trạng thái và biến điều khiển cho hệ được loại bỏ nhiễu được thể hiện qua mô hình (2.45) và:
,
Theo (2.44) ta sẽ có mô hình sai lệch bám cho hệ được loại bỏ nhiễu là:
(2.46)
Về bản chất tín hiệu điều khiển là nhưng vì các thành phần trong mô hình (2.46) gồm có là những đại lượng hoàn toàn có thể được xác định thông qua giá trị đặt, đo và tính nên có thể xem tín hiệu điều khiển được thiết kế theo bộ điều khiển dự báo sau đây là
Tại thời điểm trích mẫu , và tầm dự báo tk≤t≤tk+T, điều đó có nghĩa là trong cửa sổ dự báo các tín hiệu là hàm liên tục theo thời gian và hàm mục tiêu được xác định như sau:
(2.47)
Bài toán tối ưu được đặt ra tại thời điểm trích mẫu với mục đích tìm tín hiệu điều khiển sau khi giải được như sau:
Bài toán tối ưu 2.2.1: Tìm
Trong đó:
(2.48) được xác định là tập hợp chứa sai lệch giữa biến trạng thái trong mô hình có nhiễu trong mục 1.4.1 và mô hình thu được sau khi loại bỏ nhiễu (2.45)
Ngoài ra là ràng buộc của tín hiệu điều khiển và là ràng buộc của sai lệch trạng thái được xác định trong nội dung được trình bày ở phần dưới đây. Chú ý rằng, ở đây ta sử dụng thuật toán MPC cho hệ được loại bỏ nhiễu với cửa sổ dự báo và cửa sổ điều khiển là bằng nhau và bằng , với là thời gian trích mẫu.
Bài toán tối ưu trên là bài toán tối ưu phi tuyến, có nhiều thuật toán để giải ví dụ như phương pháp IP (interior point), SQP (sequence quadratic programing) [14], branch-and-bound optimization.
Nghiệm của Bài toán tối ưu 2.2.1 tại thời điểm là:
, tương ứng với tín hiệu tối ưu vòng hở là tín hiệu dự báo tối ưu:
Do có nhiễu tác động nên khi áp dụng tín hiệu vào hệ thống thực thì tín hiệu điều khiển có thể không đưa trạng thái thực của hệ thống giống như trạng thái tối ưu . Đặt sai lệch giữa trạng thái của hệ thống với trạng thái của hệ được loại bỏ nhiễu trong bước thứ k là:
(2.49)
Xét , xem xét diễn biến động học của sai lệch thông qua lấy đạo hàm của (2.49) theo thời gian ta được:
(2.50)
ở đây và
Ta thiết kế luật điều khiển bền vững cho hệ thống thực trong khoảng thời gian như sau:
(2.51)
Với là ma trận giả nghịch đảo của ma trận và được tính như sau:
Ta có thể thấy ngay được
Từ đó, ta có thuật toán điều khiển cho hệ trên toàn miền thời gian như sau:
Thuật toán điều khiển 2.2.1:
1. Tại thời điểm , xác định trạng thái thực của hệ thống.
2. Giải Bài toán tối ưu 1 để xác định được tín hiệu điều khiển tối ưu .
3. Tính toán tín hiệu điều khiển cho hệ thống thực:
4. Đưa tín hiệu vào hệ thống trong khoảng thời gian .
5. Cho rồi quay lại bước 1.
2.2.2 Khảo sát tính ổn định của hệ thống và xét tính khả thi của thuật toán MPC
Tính khả thi (Feasibility) của một bài toán tối ưu được hiểu là nó sẽ tồn tại nghiệm tối ưu. Trong trường hợp này cần cho thấy miền ràng buộc khác rỗng của bài toán tối ưu được thiết lập tại thời điểm trích mẫu. Định lý sau đây sẽ xem xét tính khả thi của các bài toán tối ưu được xây dựng theo thuật toán 2.2.1. Từ đó làm cơ sở cho việc so sánh hàm ứng viên Lyapunov được xây dựng sau này giữa 2 thời điểm trích mẫu liên tiếp.
Định lý 2.2.1: Xét hệ sai lệch (2.46) sử dụng Thuật toán điều khiển 2.2.1, nếu Bài toán tối ưu 1 khả thi tại thời điểm thì:
i) Bài toán tối ưu 1 cũng khả thi tại mỗi thời điểm .
ii)Hệ sai lệch (2.46) dưới tác động của bộ điều khiển dự báo là ISS (Input-to state stable).
Để chứng minh ý i), ta sẽ chỉ ra rằng luôn luôn tồn tại một tín hiệu thỏa mãn các ràng buộc của bài toán tối ưu nếu tại thời điểm trước đó bài toán là feasible.
Để chứng minh ý ii), ta sẽ sử dụng định lý Lyapunov chứng minh hệ được loại bỏ nhiễu là ổn định tiệm cận, sau đó ta sẽ chứng minh hệ sai lệch là ổn định ISS.
Ta sẽ sử dụng một số bổ đề và các định nghĩa về terminal region và terminal function, điều kiện ISS như sau:
Định nghĩa 2.2.1: Với hệ sai lệch (2.46), và lần lượt là terminal region và terminal controller nếu : thì với mọi , cho , các điều sau được thỏa mãn:
Định nghĩa 2.2.2 [53]: Hệ (2.46) là ổn định trạng thái theo đầu vào (ISS) nếu tồn tại hàm thuộc lớp KL và một hàm Kappa thỏa mãn : với mọi hệ đảm bảo được : với là thời điểm ban đầu.
Bổ đề 2.2.1 (Lựa chọn tín hiệu điều khiển trung gian tại khoảng thời gian cuối cùng): Xét hệ sau khi đã loại bỏ nhiễu (2.46), cho với , với và thì ta sẽ có tập sẽ là terminal region cho bộ điều khiển :
(2.52)
ở đây được xác định như sau:
Trong đó lần lượt là số trên đường chéo của ma trận P và Q được cho bởi Bài toán tối ưu 2.2.1.
Chứng minh bổ đề 2.2.1:
Đầu tiên, với bộ điều khiển (2.52) hoàn toàn đảm bảo tính chất của Terminal Controller như định nghĩa 2.2.1, bởi vì:
(2.53)
Với
Điều đó chứng tỏ rằng nếu .
Tiếp theo, lấy đạo hàm theo thời gian của ta được:
(2.54)
Thay ta được:
(2.55)
Điều đó chứng tỏ rằng là bất biến với , do đó sẽ đúng với mọi một khi đã có .
Cuối cùng, với , ta có:
(2.56)
khi
Từ Định nghĩa 2.2.1, ta có sẽ là terminal region cho bộ điều khiển được định nghĩa ở trên.
Bổ đề 2.2.2: (Được sử dụng để ước lượng so sánh) Hệ được loại bỏ nhiễu (2.45) với là Lipchiz với hằng số Lipchiz là , với là tốc độ góc lớn nhất của bánh xe trong robot di động.
Thật vậy, ta có:
(2.57)
Tức là
Ta có điều cần chứng minh.
Bổ đề 2.2.3 (Liên hệ giữa Quỹ đạo trạng thái hệ thực có nhiễu và hệ được loại bỏ nhiễu): Cho hệ sai lệch của mô hình sau khi đã loại bỏ nhiễu (2.46) với Thuật toán điều khiển 2.2.1, ta có:
Trạng thái của hệ thống thực sẽ nằm trong Miền trong đó được đưa ra ở (2.48) với số chiều là 2.
Tín hiệu điều khiển thuộc miền ràng buộc .
Chứng minh Bổ đề 2.2.3:
i) Từ và
ta có:
Dẫn đến nghiệm
Sử dụng điều kiện đầu và chặn của nhiễu, ta có:
Từ đó ta có: với được định nghĩa như sau :
Từ đó được cho bởi:
Từ đó ta sẽ có: điều đó có nghĩa là quỹ đạo nằm trong T.
ii) Xét tín hiệu sau:
(2.58)
Việc chứng minh nếu tương đương với chứng minh nếu với mỗi giá trị của và , với tập và được định nghĩa như sau :
Thay (2.58) vào công thức điều khiển ta có:
Ta cần chứng minh:
Đặt:
Ta có: dẫn đến:
Thay vào ta có:
Đặt
Ta thấy:
Bây giờ ta đi tìm . Ta có:
Do đó:
Tương tự ta có:
Do:
Nên ta có:
Đổi lại tên biến ta có:
Dễ thấy: Do nên thỏa mãn ta đều có hay :
Do đó ta sẽ có:
Điều đó chúng tỏ rằng với mọi giá trị của và , và do đó ta sẽ có .
Chứng minh Định lý 2.3:
Từ Bổ đề 2.2.1 ta có sẽ là terminal region nếu cho . Chúng ta giả sử rằng tại thời điểm , tồn tại lời giải khả thi và kết quả tìm được là . Khi cho tín hiệu này vào hệ được loại bỏ nhiễu, sai lệch của hệ được loại bỏ nhiễu sẽ đi vào terminal region tức là . Theo thuật toán 2.1, tín hiệu điều khiển trong khoảng thời gian được đưa vào hệ thống thực, theo Bổ đề 2.2.3 i) trạng thái của hệ thống thực tại thời điểm sẽ thỏa mãn: điều đó có nghĩa là là trạng thái khởi tạo khả thi cho Bài toán tối ưu 2.2.1. Từ đó, để giải Bài toán tối ưu hóa 2.1.1 tại với điều kiện đầu như trên, ta đưa ra tín hiệu điều khiển trung gian được cho như sau:
Với được cho trong Bổ đề 2.2.1. Do là bất biến với ,dẫn đến , ta có điều i) được chứng minh .
ii) Với hệ được loại bỏ nhiễu, xét hàm Lyapunov sau:
Ta có:
Tích phân từ đến ta có:
Do đó:
Từ đó dẫn đến: . Do: và với là hằng số nào đó nên rõ ràng tích phân là tồn tại và nó bị chặn. Lại có nên dãy là dãy giảm và bị chặn dưới bởi 0 nên tồn tại giới hạn hữu hạn . Ta có:
Do đó: dẫn đến do đó hệ sai lệch là ổn định tiệm cận tại gốc tọa độ. Từ đó, sẽ tồn tại hàm Kappa-Ell là β(·, ·) thỏa mãn :
Hơn nữa, vì với nên sẽ tồn tại hàm Kappa là γ (·) thỏa mãn:
Ta có:
Để ý rằng:
Từ đó ta suy ra: , từ đó theo Định nghĩa 2.2 ta có hệ (2.46) ổn định ISS.
2.2.3 Kết quả Mô phỏng
Mô phỏng được thực hiện trên phần mềm Matlab-Simulink R2018a, sử dụng công cụ giải tối ưu Yalmip.
Thông số trong mô phỏng được cho như sau:
a = 20 m/s, L=ρ = 1 (m), b = a/ρ = 20 rad/s.
Các giá trị đầu: ,
Thông số của bộ điều khiển:
Cửa sổ dự báo, thời gian trích mẫu lần lượt là:
Các ma trận trong hàm mục tiêu:
Ma trận phản hồi:
Từ và: ta chọn được: .
Trường hợp 1: Quỹ đạo là đường thẳng:
và
Theo Bài toán tối ưu 2.2.1:
Từ đó ta có:
Λtube = 0.7, , .Ta có kết quả mô phỏng cho trường hợp này là:
Hình 2.8: Quỹ đạo trạng thái của hệ thống trong trường hợp quỹ đạo là đường thẳng.
Hình 2.9: Tín hiệu của bộ điều khiển.
Trường hợp 2: Quỹ đạo là đường tròn:
và
Theo Bài toán tối ưu 2.2.1:
.
Từ đó ta có: λtube = 0.7, , .
Ta có kết quả mô phỏng cho trường hợp này là:
Hình 2.10: Quỹ đạo trạng thái của hệ thống.
Hình 2.11: Tín hiệu điều khiển.
Hình 2.12: Ràng buộc |v|/a+|ω|/b
Hình 2.13: Sai lệch Pe
Hình 2.14: Sai lệch pfe
Từ các hình mô phỏng ta có kết quả: Trong cả 2 trường hợp, quỹ đạo của Robot đều bám theo quỹ đạo đặt, các giá trị đều đúng so với lý thuyết.
Hình 2.15: So sánh việc thay đổi ma trận phản hồi k
Việc ảnh hưởng của chọn hệ số cho ma trận phản hồi được biểu diễn thông qua Hình 2.15. Ta thấy, khi chọn ma trận phản hồi có càng lớn thì sai lệch của hệ thực đối với hệ được loại bỏ nhiễu càng nhỏ. Tuy nhiên, khi đó việc giải tối ưu trở nên khó khăn và có thể không ra kết quả do tập khi đó là bé.
Hình 2.16:Phân phối thời gian tính toán tín hiệu điều khiển cho mỗi lần trích mẫu
Từ kết quả Hình 2.16 cần xem xét khả năng triển khai với thời gian thực Cho thấy phân phối của thời gian tính toán tín hiệu điều khiển của 500 lần trích mẫu. Mô phỏng được thực hiện trên máy tính Dell Inspiron 5448 có cấu hình chip i5-5200U 2.1 Ghz (4 cpus), ram 4GB, sử dụng công cụ Yalmip với solver IPOPT (Interior Point optimizer) để giải bài toán tối ưu. Ta thấy rằng, với một máy tính có cấu hình trung bình như trên thời gian tính toán bộ điều khiển cho mỗi 1 lần trích mẫu là khoảng từ 3 đến 3.5 giây, do đó ta có thể kết luận rằng thuật toán khó có thể chạy thời gian thực được.
2.3 Kết luận chương 2
Chương 2 xem xét hai cách tiếp cận trong điều khiển dự báo cho hệ phi tuyến. Thứ nhất mô hình được tuyến tính hóa và ảnh hưởng của sai lệch sẽ được tính đến trong việc xác định cận trên của hàm mục tiêu (mục 2.1). Ngoài ra việc miền ràng buộc của bài toán tối ưu được thể hiện qua bất đẳng thức ma trận để đảm bảo việc so sánh giữa 2 hàm ứng viên tại 2 chu kỳ trích mẫu liên tiếp. Hướng tiếp cận như vậy đã chọn con lắc ngược làm đối tượng để vận dụng bởi vì chế độ làm việc xung quanh điểm cân bằng cho phép xem xét xấp xỉ mô hình con lắc ngược thành mô hình tuyến tính và sai lệch giữa mô hình gốc và mô hình xấp xỉ vẫn được xem xét trong thiết kế điều khiển. Thứ hai, bước đầu tiến hành bộ điều khiển dự báo trực tiếp cho hệ phi tuyến với yêu cầu bám theo theo quỹ đạo của Robot tự hành chủ của Robot tự hành hai bánh thiếu cơ cấu chấp hành chưa xét đến góc hướng.
Một số đóng góp trong chương này thể hiện như sau:
Đề xuất cấu trúc điều khiển dự báo cho con lắc ngược với việc xem xét ràng buộc thể hiện thông qua bài toán tối ưu hóa tại mỗi thời điểm trích mẫu có cải tiến với xem xét thông qua bất đẳng thức ma trận để khảo sát tính ổn định của hệ kín. Ngoài ra việc thực hiện thuật toán điều khiển dự báo cho thấy hoàn toàn có khả năng triển khai với tình huống thiếu cơ cấu chấp hành do trong mô hình 2.1 có thể thực hiện với cũng như trong mô hình con lắc chỉ có 1 tín hiệu điều khiển là lực nhưng cần điều khiển 2 thành phần góc và vận tốc góc.
Tiến hành bộ điều khiển dự báo trực tiếp cho hệ phi tuyến với yêu cầu bám theo quỹ đạo của Robot tự hành chủ của Robot tự hành hai bánh thiếu cơ cấu chấp hành có ràng buộc tín hiệu điều khiển, chưa xét đến góc hướng với bài toán tối ưu tại mỗi thời điểm trích mẫu được đưa ra phù hợp phục vụ cho việc so sánh hàm ứng viên Lyapunov theo tính chất bắc cầu.
Chương 3. ĐIỀU KHIỂN BÁM THEO QUỸ ĐẠO CỦA ROBOT TỰ HÀNH CHỦ CÓ XÉT ĐẾN GÓC HƯỚNG
Trên cơ sở nội dung đã trình bày ở chương 2, luận án xem xét mở rộng cho tình huống bám theo theo quỹ đạo của Robot tự hành chủ có xét đến đặc điểm thiếu cơ cấu chấp hành dưới tác động của nhiễu. Việc triển khai sẽ được thực hiện dựa trên mô hình xây dựng trong mục 1.3 (Hình 1.3). Nội dung được xem xét trong chương này sẽ tiến hành lần lượt từ chỗ hệ chưa có tác động của nhiễu và những cải tiến khi thêm nhiễu. Cách thức xử lý vẫn theo nguyên tắc loại bỏ nhiễu để có được hệ được loại bỏ nhiễu rồi triển khai điều khiển dự báo cho nó với bản chất là thay đổi khoảng dự báo vô cùng thành hữu hạn, tiếp đến xem xét cho hệ ban đầu có nhiễu và bổ sung thêm những cải tiến trong bài toán tối ưu được thiết lập. Nội dung chương 3 được mở rộng từ mục 2.2 với việc xem xét bổ sung thành phần góc hướng, tức là có tính đến đặc điểm thiếu cơ cấu chấp hành cho hệ Robot tự hành. Điều này đòi hỏi phải đưa ra miền khả thi phù hợp để xem xét tính ổn định trong điều khiển dự báo. Một số vấn đề phức tạp nảy sinh do ảnh hưởng của mô hình, khảo sát tính ổn định thông qua việc thiết lập tín hiệu điều khiển trung gian sẽ được làm rõ.
3.1 Thiết lập Bộ điều khiển dự báo trong điều khiển bám quỹ đạo cho hệ hai robot tự hành kiểu Chủ - Tớ (Master – Slave) không