Luận án Nghiên cứu điều khiển thích nghi cho robot lặn tự hành

MỤC LỤC

LỜI CAM ĐOAN. vi

LỜI CẢM ƠN. vii

TÓM TẮT .viii

DANH MỤC CÁC CHỮ VIẾT TẮT VÀ KÝ HIỆU . x

DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ.xiii

DANH MỤC CÁC BẢNG. xvii

MỞ ĐẦU . 1

1. Tính cấp thiết của đề tài . 2

2. Mục đích nghiên cứu của đề tài. 3

3. Đối tượng và phạm vi nghiên cứu. 3

4. Phương pháp nghiên cứu. 3

5. Ý nghĩa khoa học và thực tiễn. 3

6. Những điểm đóng góp mới của luận án . 4

7. Kết cấu của luận án . 4

CHƯƠNG 1. 5

TỔNG QUAN VỀ ĐIỀU KHIỂN ROBOT LẶN TỰ HÀNH (AUTONOMOUS

UNDERWATER VEHICLE). 5

1.1. Tổng quan về robot lặn tự hành AUV (Autonomous Underwater Vehicle) 5

1.1.1Các ứng dụng của AUV trên thế giới . 6

1.1.2Các ứng dụng của AUV tại Việt Nam . 9

1.1.3Mô hình toán học và phương trình động học tổng quát của AUV . 11

1.2 Tổng quan về điều khiển AUV hiện nay. 18

1.2.1Các nghiên cứu về điều khiển AUV trên thế giới. 18

1.2.2Các nghiên cứu về điều khiển AUV tại Việt Nam . 25

1.3 Kết luận chương 1 . 26

CHƯƠNG 2. 27

CƠ SỞ LÝ THUYẾT ĐIỀU KHIỂN NƠ-RON THÍCH NGHI THIẾT BỊ LẶN

TỰ HÀNH . 27

2.1 Mạng nơ-ron nhân tạo . 27

2.1.1 Tổng quan về mạng nơ-ron nhân tạo trong điều khiển . 27

2.1.1.1 Cấu trúc của mạng nơ-ron . 27iv

2.1.1.2 Các hình trạng của mạng . 31

2.1.1.3 Các luật học của mạng nơ-ron nhân tạo. 32

2.1.2 Điều khiển tự động dùng mạng nơ-ron nhân tạo . 33

2.2 Ứng dụng mạng nơ-ron nhân tạo điều khiển AUV. 34

2.3 Kết luận chương 2 . 38

CHƯƠNG 3. 39

THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN NƠ-RON THÍCH NGHI CHO ROBOT

LẶN TỰ HÀNH. 39

3.1 Mô hình toán học AUV sử dụng trong nghiên cứu. 39

3.1.1Cấu tạo của mô hình NPS AUV II. 39

3.1.2Mô hình toán học AUV. 40

3.2 Mạng nơ-ron thích nghi trong điều khiển . 47

3.2.1Bộ điều khiển nơ-ron thích nghi tương tác . 47

3.2.2Mô hình tổng quát của bộ điều khiển NNC huấn luyện trực tuyến. 48

3.3 Thiết kế hệ thống điều khiển nơ-ron cho AUV. 50

3.3.1Điều khiển riêng biệt các chuyển động của AUV. 50

3.3.2Thiết kế bộ điều khiển nơ-ron cho các hệ thống con . 51

3.3.3Điều khiển tổng hợp các chuyển động của AUV bằng phương pháp tách rời

(decoupled control) . 54

3.4 Hệ thống điều khiển dẫn đường AUV và thực hiện các nhiệm vụ dưới nước

. 55

3.4.1Điều khiển AUV theo quỹ đạo đặt trước . 55

3.4.2Điều khiển AUV bám theo địa hình đáy. 58

3.5 Các phương án thích nghi cho hệ thống điều khiển AUV . 58

3.5.1Mô hình dòng chảy tác động lên AUV . 58

3.5.2Thích nghi với tác động của dòng chảy . 59

3.6 Kết luận chương 3 . 61

156 trang | Chia sẻ: thinhloan | Lượt xem: 1014 | Lượt tải: 4

Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu điều khiển thích nghi cho robot lặn tự hành, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

tại Phụ lục. Hình 3.1 Mô hình NSP AUV II 40 Hình 3.2 Sơ đồ cấu tạo các chi tiết của NSP AUV II Mô hình AUV này có chiều dài 3m, rộng 0,4m và cao 0,25m. Vỏ bằng nhôm 6061 dày 0,25 inch. Trọng lượng toàn bộ là 220kg. Phần mũi làm bằng vật liệu mica đặc biệt chứa ắc-quy, các cảm biến, các mạch điện và công tắc. Nguồn cấp là ắc-quy 12V. Tốc độ cao nhất của AUV là 4 hải lý/giờ (knots), ở tốc độ này AUV duy trì thời gian làm việc được 4 giờ. AUV được thiết kế để hoạt động ở vùng nước nông với độ sâu hoạt động 30m, nếu gia cường thêm có thể hoạt động ở độ sâu tối đa 100m. Cấu tạo hệ động lực AUV này gồm 2 cánh điều khiển hướng phía trước, 2 cánh điều khiển hướng phía sau; 2 cánh điều khiển độ sâu phía trước, 2 cánh điều khiển độ sâu phía sau; 2 chân vịt cố định phía sau vận hành bằng động cơ điện. Ngoài ra NSP AUV II còn có chân vịt đẩy theo chiều ngang (thruster) ở phía trước và phía sau, tuy nhiên với luận án này tác giả không sử dụng đến trong các mô phỏng điều khiển của mình. 3.1.2 Mô hình toán học AUV Phần này mô tả sơ bộ phương pháp diễn giải phương trình động học tuyến tính 6 bậc tự do, các vấn đề chi tiết đã được trình bày trong [31]. Dạng tổng quát và đầy đủ của hệ phương trình động học được thể hiện trong (3.1) và (3.2). ẋ = Ax + Bu (3.1) 41 [ ẋ1 ẋ2 ] = [ −M−1(C + D) −M−1g(t) JB/E(t) 0 ] [ x1 x2 ] + [M −1 0 ] τc (3.2) Trong đó, x1(t) = Δν(t) = ν(t) - νref(t) và x2(t) = Δη(t) = η(t) - ηref(t) là các đại lượng thu được thu được tự trạng thái; M, C, D, g, JB/E, và τC lần lượt là ma trận khối lượng, ma trận lực Coriolis, ma trận lực cản thủy động, ma trận lực trọng trường, ma trận chuyển đổi từ hệ trục Body-fixed{B} sang hệ trục Earth-fixed {E}, và ma trận lực / mô-men điều khiển [30], [31]. Phương trình chuyển động của AUV: Theo [30], [31], phương trình chuyển động động lực học phi tuyến của AUV như sau: 𝑀�̇� + 𝐶(𝑉)𝑉 + 𝐷(𝑉)𝑉 + g(𝜂) + g0 = 𝜏 + 𝜏𝑤𝑖𝑛𝑑 + 𝜏𝑤𝑎𝑣𝑒 (3.3) Trong trường hợp có xét vận tốc dòng chảy, ta được vector vận tốc tương đối là: 𝑉𝑟 = 𝑉 − 𝑉𝑐 , 𝑉𝑐 = [𝑢𝑐 , v𝑐 , 𝑤𝑐 , 0,0,0] 𝑇 Phương trình (3.3) trở thành: 𝑀𝑅𝐵�̇� + 𝐶𝑅𝐵(𝑉)𝑉 + 𝑀𝐴�̇�𝑟 + 𝐶𝐴(𝑉𝑟)𝑉𝑟 + 𝐷(𝑉𝑟)𝑉𝑟 + g(𝜂) + g0 = 𝜏 + 𝜏𝑤𝑖𝑛𝑑 + 𝜏𝑤𝑎𝑣𝑒 (3.4) Nếu chỉ giới hạn ở nước tĩnh trong hồ thì có thể bỏ qua ảnh hưởng của dòng chảy, ảnh hưởng của gió và của sóng. Phương trình chuyển động của AUV cuối cùng là: 𝑀�̇�𝑟 + 𝐶(𝑉𝑟)𝑉𝑟 + 𝐷(𝑉𝑟)𝑉𝑟 + g(𝜂) + g0 = 𝜏 (3.5) Trong đó: - 𝑀 = 𝑀𝑅𝐵 + 𝑀𝐴: ma trận lực quán tính (tính cả quán tính chất lỏng). - 𝐶(𝑉𝑟) = 𝐶𝑅𝐵(𝑉𝑟) + 𝐶𝐴(𝑉𝑟): ma trận lực hướng tâm Coriolis (tính cả quán tính chất lỏng). - 𝐷(𝑉𝑟): ma trận lực cản. - g(𝜂): vector trọng lực/lực đẩy Acsimet và moment (lực phục hồi). 42 - g0: vector trọng lực thêm vào để làm AUV cân bằng. - 𝜏: vector lực điểu khiển đầu vào. Lực và moment xuất phát từ bản thân vật rắn: Theo tài liệu [31], ta có công thức của ma trận quán tính vật rắn (Rigid- body system inertial matrix) 𝑀𝑅𝐵 là duy nhất và thỏa mãn điều kiện sau: 𝑀𝑅𝐵 = 𝑀𝑅𝐵 𝑇 > 0, �̇�𝑅𝐵 = 06×6 (3.6) Trong đó: 𝑀𝑅𝐵 = [ 𝑚 0 0 0 𝑚𝑧𝑔 −𝑚𝑦𝑔 0 𝑚 0 −𝑚𝑧𝑔 0 𝑚𝑥𝑔 0 0 𝑚 𝑚𝑦𝑔 −𝑚𝑥𝑔 0 0 −𝑚𝑧𝑔 𝑚𝑦𝑔 𝐼𝑥 −𝐼𝑥𝑦 −𝐼𝑥𝑧 𝑚𝑧𝑔 0 −𝑚𝑥𝑔 −𝐼𝑦𝑥 𝐼𝑦 −𝐼𝑦𝑧 −𝑚𝑦𝑔 𝑚𝑥𝑔 0 −𝐼𝑧𝑥 −𝐼𝑧𝑦 𝐼𝑧 ] (3.7) Cũng theo tài liệu [31], ma trận Coriolis 𝐶𝑅𝐵(𝑉) thõa mãn điều kiện sau: 𝐶𝑅𝐵(𝑉) = −𝐶𝑅𝐵(𝑉) 𝑇 > 0, ∀𝑣𝑟 ∈ 𝑅 6 (3.8) 𝐶𝑅𝐵(𝑉) = [ 0 0 0 0 0 0 0 0 0 −𝑚(𝑦𝑔𝑞 + 𝑧𝑔𝑟) 𝑚(𝑦𝑔𝑝 + 𝑤) 𝑚(𝑧𝑔𝑝 − v) 𝑚(𝑥𝑔𝑞 − 𝑤) −𝑚(𝑧𝑔𝑟 + 𝑥𝑔𝑝) 𝑚(𝑧𝑔𝑞 + 𝑢) 𝑚(𝑥𝑔𝑟 + v) 𝑚(𝑦𝑔𝑟 − 𝑢) −𝑚(𝑥𝑔𝑝 + 𝑦𝑔𝑞) 𝑚(𝑦𝑔𝑞 + 𝑧𝑔𝑟) −𝑚(𝑥𝑔𝑞 − 𝑤) −𝑚(𝑥𝑔𝑟 + v) −𝑚(𝑦𝑔𝑝 + 𝑤) 𝑚(𝑧𝑔𝑟 + 𝑥𝑔𝑝) −𝑚(𝑦𝑔𝑟 − 𝑢) −𝑚(𝑧𝑔𝑝 − v) −𝑚(𝑧𝑔𝑞 + 𝑢) 𝑚(𝑥𝑔𝑝 + 𝑦𝑔𝑞) 0 −𝐼𝑦𝑧𝑞 − 𝐼𝑥𝑧𝑝 + 𝐼𝑧𝑟 𝐼𝑦𝑧𝑟 + 𝐼𝑥𝑦𝑝 − 𝐼𝑦𝑞 𝐼𝑦𝑧𝑞 + 𝐼𝑥𝑧𝑝 − 𝐼𝑧𝑟 0 −𝐼𝑥𝑧𝑟 − 𝐼𝑥𝑦𝑞 + 𝐼𝑥𝑝 −𝐼𝑦𝑧𝑟 − 𝐼𝑥𝑦𝑝 + 𝐼𝑦𝑞 𝐼𝑥𝑧𝑟 + 𝐼𝑥𝑦𝑞 − 𝐼𝑥𝑝 0 ] (3.9) Vì chọn gốc tọa độ Ob trùng với trọng tâm của AUV, ngoài ra có thể coi như AUV đối xứng qua các mặt phẳng Oxy, Oyz, Oxz (vì vận tốc nhỏ) nên các ma trận 𝑀𝑅𝐵 và ma trận 𝐶𝑅𝐵(𝑉) trở thành: 43 𝐶𝑅𝐵(𝑉) = [ 0 0 0 0 0 0 0 0 0 0 𝑚𝑤 −𝑚v −𝑚𝑤 0 𝑚𝑢 𝑚v −𝑚𝑢 0 0 𝑚𝑤 −𝑚v −𝑚𝑤 0 𝑚𝑢 𝑚v −𝑚𝑢 0 0 𝐼𝑧𝑟 −𝐼𝑦𝑞 −𝐼𝑧𝑟 0 𝐼𝑥𝑝 𝐼𝑦𝑞 −𝐼𝑥𝑝 0 ] (3.10) 𝑀𝑅𝐵 = [ 𝑚 0 0 0 0 0 0 𝑚 0 0 0 0 0 0 𝑚 0 0 0 0 0 0 𝐼𝑥 0 0 0 0 0 0 𝐼𝑦 0 0 0 0 0 0 𝐼𝑧] (3.11) Lực và moment thủy động lực học: Các lực và moment này gồm 3 thành phần: - 𝑀𝐴 : quán tính chất lỏng. - 𝐶𝐴(𝑉𝑟) : Lực hướng tâm Coriolis khi xét tới quán tính chất lỏng. - 𝐷(𝑉𝑟) : lực cản thủy động lực học (hydrodynamic damping). Gọi 𝑇𝐴 là năng lượng thủy động lực học của dòng lưu chất, ta có được phương trình: 𝑇𝐴 = 1 2 𝑉𝑇𝑀𝐴𝑉, �̇�𝐴 = 0 (3.12) Trong đó, ma trận 𝑀𝐴 = 𝑀𝐴 𝑇 ≥ 0 là 1 ma trận quán tính 6x6: 𝑀𝐴 = − [ 𝑋�̇� 𝑋�̇� 𝑋�̇� 𝑋�̇� 𝑋�̇� 𝑋�̇� 𝑌�̇� 𝑌�̇� 𝑌�̇� 𝑌�̇� 𝑌�̇� 𝑌�̇� 𝑍�̇� 𝑍�̇� 𝑍�̇� 𝑍�̇� 𝑍�̇� 𝑍�̇� 𝐾�̇� 𝐾�̇� 𝐾�̇� 𝐾�̇� 𝐾�̇� 𝐾�̇� 𝑀�̇� 𝑀�̇� 𝑀�̇� 𝑀�̇� 𝑀�̇� 𝑀�̇� 𝑁�̇� 𝑁�̇� 𝑁�̇� 𝑁�̇� 𝑁�̇� 𝑁�̇� ] (3.13) Với các giá trị trong ma trận là hệ số quán tính của chất lỏng. Ví dụ, lực quán tính chất lỏng Y theo trục y gây ra bởi gia tốc �̇� theo trục x được tính như sau: 𝑌 = −𝑌�̇��̇� , 𝑌�̇� ≔ 𝜕𝑌 𝜕�̇� (3.14) Theo [28], ma trận quán tính chất lỏng (added mass) phụ thuộc nhiều vào hình dạng của AUV. Bởi vì, ta giả sử rằng AUV đối xứng qua 3 mặt 44 phẳng và gốc của hệ tọa độ {b} đặt tại trọng tâm AUV nên ma trận 𝑀𝐴 trở thành: 𝑀𝐴 = − [ 𝑋�̇� 0 0 0 0 0 0 𝑌�̇� 0 0 0 0 0 0 𝑍�̇� 0 0 0 0 0 0 𝐾�̇� 0 0 0 0 0 0 𝑀�̇� 0 0 0 0 0 0 𝑁�̇�] (3.15) Các thông số này là hằng số khi AUV hoàn toàn chìm trong nước. Các giá trị này thường khó tìm và thường được chọn theo kinh nghiệm trong lân cận từ 10% - 100% giá trị từ ma trận 𝑀𝑅𝐵. Theo tìm hiểu một số thông số từ các AUV, có thể chọn các thông số quán tính chất lỏng ở ma trận 𝑀𝐴 bằng 50% giá trị từ ma trận 𝑀𝑅𝐵. Đối với 1 vật thể cứng khi đi xuyên qua 1 chất lỏng lý tưởng, lực hướng tâm Coriolis 𝐶𝐴(𝑉) có thể luôn được tham số hóa thỏa mãn điều kiện: 𝐶𝐴(𝑉) = −𝐶𝐴(𝑉) 𝑇 > 0, ∀𝑣𝑟 ∈ 𝑅 6 (3.16) Trong đó: 𝐶𝐴(𝑉) = [ 0 0 0 0 −𝑎3 𝑎2 0 0 0 𝑎3 0 −𝑎1 0 0 0 −𝑎2 𝑎1 0 0 −𝑎3 𝑎2 0 −𝑏3 𝑏2 𝑎3 0 −𝑎1 𝑏3 0 −𝑏1 −𝑎2 𝑎1 0 −𝑏2 𝑏1 0 ] (3.17) Với: 𝑎1 = 𝑋�̇�𝑢 + 𝑋�̇�v + 𝑋�̇�𝑤 + 𝑋�̇�𝑝 + 𝑋�̇�𝑞 + 𝑋�̇�𝑟 𝑎2 = 𝑌�̇�𝑢 + 𝑌�̇�v + 𝑌�̇�𝑤 + 𝑌�̇�𝑝 + 𝑌�̇�𝑞 + 𝑌�̇�𝑟 𝑎3 = 𝑍�̇�𝑢 + 𝑍�̇�v + 𝑍�̇�𝑤 + 𝑍�̇�𝑝 + 𝑍�̇�𝑞 + 𝑍�̇�𝑟 (3.18) 𝑏1 = 𝐾�̇�𝑢 + 𝐾�̇�v + 𝐾�̇�𝑤 + 𝐾�̇�𝑝 + 𝐾�̇�𝑞 + 𝐾�̇�𝑟 𝑏2 = 𝑀�̇�𝑢 + 𝑀�̇�v + 𝑀�̇�𝑤 + 𝑀�̇�𝑝 + 𝑀�̇�𝑞 + 𝑀�̇�𝑟 𝑏3 = 𝑁�̇�𝑢 + 𝑁�̇�v + 𝑁�̇�𝑤 + 𝑁�̇�𝑝 + 𝑁�̇�𝑞 + 𝑁�̇�𝑟 Bởi vì, giả sử rằng AUV đối xứng qua 3 mặt phẳng và AUV di chuyển với vận tốc chậm nên ma trận 𝐶𝐴(𝑉) có thể được viết dưới dạng đơn giản sau đây: 45 𝐶𝐴(𝑉𝑟) = −𝐶𝐴 𝑇(𝑉𝑟) = [ 0 0 0 0 −𝑍�̇�𝑤𝑟 𝑌�̇�v𝑟 0 0 0 𝑍�̇�𝑤𝑟 0 −𝑋�̇�𝑢𝑟 0 0 0 −𝑌�̇�v𝑟 𝑋�̇�𝑢𝑟 0 0 −𝑍�̇�𝑤𝑟 𝑌�̇�v𝑟 0 −𝑁�̇�𝑟 𝑀�̇�𝑞 𝑍�̇�𝑤𝑟 0 −𝑋�̇�𝑢𝑟 𝑁�̇�𝑟 0 −𝐾�̇�𝑝 −𝑌�̇�v𝑟 𝑋�̇�𝑢𝑟 0 −𝑀�̇�𝑞 𝐾�̇�𝑝 0 ] (3.19) Lực cản thủy động lực học: Vì trong thực tế rất khó để có thể xác định toàn bộ các hệ số để xác định các lực cản. Theo [28], xấp xỉ công thức như sau: 𝐷(𝑉𝑟) = −𝑑𝑖𝑎𝑔{𝑋𝑢 + 𝑋𝑢|𝑢||𝑢| , 𝑌v + 𝑌v|v||v| , 𝑍𝑤 + 𝑍𝑤|𝑤||𝑤| , 𝐾𝑝 + 𝐾𝑝|𝑝||𝑝| ,𝑀𝑞 + 𝑀𝑞|𝑞||𝑞| , 𝑁𝑟 + 𝑁𝑟|𝑟||𝑟|} (3.20) Với: 𝑋𝑢, 𝑌v, 𝑍𝑤 , 𝐾𝑝, 𝑀𝑞 , 𝑁𝑟: là thành phần tuyến tính của hệ số cản thủy động. 𝑋𝑢|𝑢|, 𝑌v|v|,, 𝑍𝑤|𝑤|, 𝐾𝑝|𝑝|, 𝑀𝑞|𝑞|, 𝑁𝑟|𝑟|: thành phần bậc hai của hệ số cản thủy động. Lực phục hồi: Gọi ∇ là thể tích của chất lỏng bị chiếm bởi AUV, g là gia tốc trọng trường, ρ là khối lượng riêng chất lỏng. Trọng lượng riêng W và lực đẩy Acsimet Archimet B là: 𝑊 = 𝑚𝑔 , 𝐵 = 𝜌𝑔∇ (3.21) Theo [5], công thức lực phục hồi được tính như sau: g(𝜂) = [ 𝑓𝑔 𝑏 + 𝑓𝑏 𝑏 𝑟𝑔 𝑏 × 𝑓𝑔 𝑏 + 𝑟𝑏 𝑏 × 𝑓𝑏 𝑏] = − [ 𝑅𝑏 𝑛(𝑓𝑔 𝑛 + 𝑓𝑏 𝑛) 𝑟𝑔 𝑏 × 𝑅𝑏 𝑛𝑓𝑔 𝑛 + 𝑟𝑏 𝑏 × 𝑅𝑏 𝑛𝑓𝑏 𝑛] (3.22) Trong đó: 𝑓𝑔 𝑛 = [ 0 0 𝑊 ] 𝑣à 𝑓𝑏 𝑛 = −[ 0 0 𝐵 ] (3.23) Suy ra được công thức: 46 g(𝜂) = [ (𝑊 − 𝐵)s𝜃 −(𝑊 − 𝐵)𝑐𝜃s𝜙 −(𝑊 − 𝐵)c𝜃c𝜙 −(𝑦𝑔𝑊 − 𝑦𝑏𝐵)c𝜃c𝜙 + (𝑧𝑔𝑊 − 𝑧𝑏𝐵)c𝜃s𝜙 (𝑧𝑔𝑊 − 𝑧𝑏𝐵)s𝜃 + (𝑥𝑔𝑊 − 𝑥𝑏𝐵)c𝜃c𝜙 −(𝑥𝑔𝑊 − 𝑥𝑏𝐵)c𝜃s𝜙 − (𝑦𝑔𝑊 − 𝑦𝑏𝐵)s𝜃 ] (3.24) Với (𝑥𝑏 , 𝑦𝑏 , 𝑧𝑏) là tọa độ của tâm lực đẩy Acsimet. Để đơn giản trong quá trình tính toán, chọn 𝑊 = 𝐵 nên: 𝐵𝐺̅̅ ̅̅ = ( 𝐵𝐺̅̅ ̅̅ 𝑥 , 𝐵𝐺̅̅ ̅̅ 𝑦 , 𝐵𝐺̅̅ ̅̅ 𝑧) 𝑇 = (𝑥𝑔 − 𝑥𝑏 , 𝑦𝑔 − 𝑦𝑏 , 𝑧𝑔 − 𝑧𝑏 ) 𝑇 (3.25) Suy ra: g(𝜂) = [ 0 0 0 −𝐵𝐺̅̅ ̅̅ 𝑦𝑊c𝜃c𝜙 + 𝐵𝐺̅̅ ̅̅ 𝑧𝑊c𝜃s𝜙 𝐵𝐺̅̅ ̅̅ 𝑧𝑊s𝜃 + 𝐵𝐺̅̅ ̅̅ 𝑥Wc𝜃c𝜙 −𝐵𝐺̅̅ ̅̅ 𝑥Wc𝜃s𝜙 − 𝐵𝐺̅̅ ̅̅ 𝑦Ws𝜃 ] (3.26) Trọng lực thêm vào: Đối với trọng lực được thêm để AUV ở trạng thái cân bằng theo ý muốn, theo [31] sẽ có công thức như sau: g0 = [ 0 0 −𝑍𝑏𝑎𝑙𝑙𝑎𝑠𝑡 −𝐾𝑏𝑎𝑙𝑙𝑎𝑠𝑡 −𝑀𝑏𝑎𝑙𝑙𝑎𝑠𝑡 0 ] (3.27) Mô hình điều động trong mặt phẳng độ sâu Trong đề tài nghiên cứu này, để tập trung vào việc điều khiển riêng độ sâu của AUV, tác giả chỉ quan tâm đến mô hình điều động trong mặt phẳng độ sâu. Do đó phương trình động lực mặt phẳng độ sâu sẽ được sử dụng như là hàm truyền mô tả hệ thống. Đối với mô hình điều động trong mặt phẳng độ sâu, góc pitch (𝜃) của AUV sẽ được điều khiển. Do đó, có thể bỏ qua các biến trạng thái 𝑦, 𝜙, 𝜓, 𝜐, 𝑝, 𝑟 trong mặt phẳng nằm ngang, vậy nên phương trình động lực học của hệ thống được rút gọn thành (3.28) với các hệ số được mô tả trong bảng 4.1. 47 [ 𝐼𝑦𝑦 − 𝑀�̇� 0 0 0 1 0 0 0 1 ] [ �̇� �̇� �̇� ] + [ −𝑀𝑞 0 −𝑀𝜃 0 0 𝑈 −1 0 0 ] [ 𝑞 𝑧 𝜃 ] = [ 𝑀𝛿𝑠 0 0 ] (3.28) trong đó: 𝐼𝑦𝑦 là moment quán tính quanh trục Y; 𝑀𝜃, 𝑀𝑞, 𝑀�̇� là các hệ số thủy động lực học được mô tả trong bảng 4.1. 3.2 Mạng nơ-ron thích nghi trong điều khiển Trong [3] tác giả đề xuất phương pháp điều khiển thích nghi với mạng nơ-ron bằng lý thuyết thích nghi tương tác. Theo nghiên cứu này, các nơ-ron trong mạng được xem như các hệ thống con gọi là các thiết bị trong một hệ thống phức tạp. Phương pháp này tương tự như thuật toán lan truyền ngược nhưng không cần đến mạng lan truyền ngược để truyền ngược tín hiệu sai số. Mạng nơ-ron điều khiển thích nghi của một số hệ thống dùng phương pháp này được mô phỏng trong [3] và ứng dụng trong [8], [9] để minh họa tính khả thi và hiệu quả của phương pháp. Phần 3.2.1 sẽ mô tả tóm tắt thuật toán thích nghi tương tác áp dụng cho mạng nơ-ron để tạo thành bộ điều khiển nơ-ron thích nghi tương tác (Adaptive Neural Network by Adaptive Interaction - ANNAI). 3.2.1 Bộ điều khiển nơ-ron thích nghi tương tác Tham khảo trong tài liệu [3] và sử dụng các ký hiệu dưới đây với Nji , iO tín hiệu ra của nơ-ron thứ i; iI tín hiệu vào của nơ-ron thứ i; i giá trị ngưỡng của nơ-ron thứ i; ijw trọng số của liên kết từ nơ-ron thứ i đến nơ-ron thứ j; )(xg hàm kích hoạt của một nơ-ron; d iO giá trị đầu ra mong muốn của nơ-ron thứ i (đối với nơ-ron lớp ra);  bước học, Mạng nơ-ron sẽ được mô tả như sau:   += Nj ijiji OwI  , (3.29) 48         +==  Nj ijijii OwgIgO )( . (3.30) Mục tiêu của mạng là cực tiểu hóa sai số sau đây   = Ni ieE 2 2 1 , (3.31) trong đó idii OOe −= nếu i là nơ-ron lớp ra. Thuật toán cập nhật trọng số cho mạng nơ-ron trong [3] được viết như sau iji Nk kiki i j iij eOIgww O O Igw )()( −=    , (3.32) trong đó ijw là số gia hay tốc độ thay đổi của trọng số, )( iIg là đạo hàm của )( iIg theo iI . Phương trình (3.32) thể hiện thuật toán Brandt-Lin để cập nhật trọng số của mạng nơ-ron. Sau đó trong nghiên cứu [3] một bộ điều khiển nơ-ron dựa vào thuật toán Brandt-Lin được đề xuất và các thí nghiệm mô phỏng được trình bày đã minh họa hiệu quả của bộ điều khiển. Hình 3.3 Cấu trúc bộ điều khiển NNC 3.2.2 Mô hình tổng quát của bộ điều khiển NNC huấn luyện trực tuyến Cấu trúc của bộ điều khiển NNC giới thiệu trong chương này được thể hiện trên hình 3.4. Sử dụng hàm mục tiêu dưới đây như trong tài liệu [3], [8], [9]: k T kk d k T k d kk uuXXPXXE +−−= 2 1 )()( 2 1 , (3.33) Trong đó Xkd và Xk lần lượt là các véc-tơ trạng thái mong muốn và trạng p j i iO jO pO ijw jpw ek ek-1 ek-p+1 Ii Ij 49 thái thực tế; ukc là véc-tơ lệnh điều khiển và uk là véc-tơ điều khiển thực tế tác động lên hệ thống; P là ma trận đối xứng dương phản ánh các trọng số của các biến của đối tượng được điều khiển; Λ là ma trận đối xứng dương của véc-tơ điều khiển. Hình 3.4 Cấu trúc bộ điều khiển NNC. Véc-tơ tín hiệu vào gồm sai số ek và các tín hiệu trễ của ek. Hàm mục tiêu Ek được xử lý bằng thuật toán Brandt- Lin nhằm cập nhật các trọng số sao cho giá trị của Ek được cực tiểu [3]. Hình 3.5 Sơ đồ giải thuật phương pháp huấn luyện lan truyền ngược “tăng cường” với n và bước học  cố định. NNC Cơ cấu tác động Đối tượng - + z-m Tác động bên ngoài ek Thuật toán Brandt-Lin Ek Đặt n và  ; Khởi tạo Ek = 0 ite = 1 Hiệu chỉnh trọng số (Thuật toán BP) ite = ite + 1 ite  n Tính tín hiệu ra của nơ- ron lớp ẩn và lớp ra k = k + 1 ĐÚNG Vòng lặp mới Chu trình mới Tính giá trị hàm mục tiêu Ek+1 Tính trọng số và tín hiệu điều khiển cho chu trình thứ k Quá trình lặp cập nhật trọng số Khởi tạo trọng số mạng SAI 50 Quá trình huấn luyện mạng nơ-ron được thực hiện trong mỗi chu trình điều khiển chỉ thị bởi đối số k với n là số lần huấn luyện trong một chu trình. Thuật toán thích nghi (3.32) được áp dụng để điều chỉnh trọng số của các kết nối trong mạng nơ-ron sao cho hàm mục tiêu Ek đạt được cực tiểu. Thông số đầu vào của bộ điều khiển nơ-ron bao gồm sai số k d kk XXe −= và các tín hiệu trễ của sai số. Nhiệm vụ của bộ điều khiển nơ-ron là tạo ra các tín hiệu điều khiển phù hợp trong chu trình điều khiển tiếp theo sau khi đã “học” được đặc tính của trạng thái mong muốn cũng như trạng thái thực tế của đối tượng được điều khiển thông qua sai số ek. 3.3 Thiết kế hệ thống điều khiển nơ-ron cho AUV 3.3.1 Điều khiển riêng biệt các chuyển động của AUV Harley và Marco trong nghiên cứu [26] đã giả thiết rằng một mô hình động học đầy đủ các bậc tự do có thể được chia ra 3 hệ thống con độc lập, gọi là điều khiển tốc độ theo chiều dọc, điều khiển hướng và điều khiển độ sâu [25-29]. Các phương trình họ đưa ra đều thu được từ phương trình chính (3.2), trong đó các thành phần không liên quan của các hệ thống con khác đều được bỏ qua. Điều khiển tốc độ theo chiều dọc: Hệ thống con này chủ yếu điều khiển tốc độ theo chiều dọc của AUV là giá trị u, có phương trình vi phân như sau [31]: (m − Xu̇)u̇ = Xu|u|u|u| + Xthruster (3.34) Trong đó, Xthruster là lực tạo bởi chân vịt của AUV. Lực này có thể tính được từ giá trị vận tốc điều khiển uc: Xthruster = -Xu|u|uC|uC| (3.35) Điều khiển hướng: Là hệ thống con điều khiển hướng làm nhiệm vụ điều khiển chuyển động xoay trên mặt phẳng ngang của AUV với các giá trị v, r, ψ. Phương trình vi phân của hệ thống con này được thể hiện như (3.36) [30], [31]: 51 [ m − Yv̇ mxG − Yṙ 0 mxG − Nv̇ Izz − Nṙ 0 0 0 1 ] [ v̇ ṙ ψ̇ ] + [ −Yv muref − Yr 0 −Nv mxG − Nr 0 0 −1 0 ] [ u v ψ ] = [ Yuuδruref 2 Nuuδruref 2 0 ]δr (3.36) Trong đó, uref là vận tốc mong muốn, δr là góc bẻ lái gắn trên thân AUV. Điều khiển độ sâu: Là hệ thống con điều khiển chuyển động của AUV theo chiều đứng với các giá trị w, , và z. Phương trình vi phân hệ thống con này được mô tả như sau (2.6): [ 𝑚 − 𝑍�̇� 𝑚𝑥𝐺 − 𝑍�̇� 0 0 𝑚𝑥𝐺 − 𝑀�̇� 𝐼𝑧𝑧 − 𝑀�̇� 0 0 0 0 1 0 0 0 0 1 ] [ �̇� �̇� �̇� �̇� ] + [ −𝑍𝑤 𝑚𝑢𝑟𝑒𝑓 − 𝑍𝑞 0 0 −𝑀𝑤 𝑚𝑥𝐺𝑢𝑟𝑒𝑓 − 𝑀𝑞 𝑧𝐺𝑊 0 0 −1 0 0 −1 0 𝑢𝑟𝑒𝑓 0] [ 𝑤 𝑞 𝜃 𝑧 ] = [ 𝑍𝑢𝑢𝛿𝑠𝑢𝑟𝑒𝑓 2 𝑀𝑢𝑢𝛿𝑠𝑢𝑟𝑒𝑓 2 0 0 ] 𝑠 (3.37) Trong đó, δs là góc của cánh chỉnh độ sâu gắn ở phần đuôi AUV. 3.3.2 Thiết kế bộ điều khiển nơ-ron cho các hệ thống con Trong phần này tác giả thiết kế 3 hệ thống điều khiển nơ-ron độc lập cho 3 hệ thống con nói trên. Các biến vào và ra của mỗi BĐK nơ-ron phụ thuộc vào phương trình vi phân mô tả ở (3.34), (3.36) và (3.37). a. Hệ thống điều khiển hướng Hình 3.6 Sơ đồ hệ thống điều khiển hướng AUV Dựa theo tài liệu [3], ta có thể sử dụng hàm mục tiêu cho bộ điều khiển dưới dạng: 52 ])([ 2 1 2 1 2 1 2 11 kRkk d kk rE  ++−= , (3.38) trong đó, Rk và kr lần lượt là góc bẻ lái và tốc độ đổi hướng phương tiện ngầm tại thời điểm k , các hằng số 1 , 1 , và 1 tương ứng là hệ số tỷ lệ, hệ số phản hồi góc bẻ lái và hệ số vi phân hướng đi. Bộ điều khiển nơ-ron được chọn là một mạng nơ-ron nhiều lớp truyền thẳng có một lớp ẩn. Mạng gồm bốn nơ-ron lớp vào, sáu nơ-ron lớp ẩn và một nơ-ron lớp ra tương tự như đã mô tả ở [3]. Trong đó, ijw là ký hiệu hàm trọng lượng của nơ-ron lớp ra, jpw là ký hiệu hàm trọng lượng nơ-ron lớp ẩn. Các chỉ số p, i và j tương ứng là số lượng nơ-ron lớp vào, lớp ra và lớp ẩn. Các tín hiệu vào của bộ điều khiển chỉ gồm sai số hướng đi của phương tiện ngầm và các giá trị trễ của sai số này. Ký hiệu dk là hướng đi mong muốn và k là hướng đi thực tế của phương tiện ngầm, nhiệm vụ của bộ điều khiển là tính toán góc bẻ lái phù hợp để hàm mục tiêu (3.38) đạt cực tiểu bằng luật cập nhật trọng số sau: )(]0)([ 11111111 jjpjjpjp IsigOIsigOw −=+−=  , (3.39) )()()( 1111111111111 kRkkjkRkkjij reOreIsigw  ++=++= . (3.40) Chỉ số 1 biểu thị BĐK nơ-ron thứ nhất dùng cho điều khiển hướng, trong đó k d kke  −=1 , và )exp(1 1 )( 1 11 j jj I IsigO −+ == , (3.41)  += p jpjpj OwI 1111 )(  , (3.42) ijijj ww 111 = . (3.43) b. Hệ thống điều khiển độ sâu Tương tự [9] ta chọn hàm mục tiêu cho BĐK độ sâu như sau: ])([ 2 1 2 2 2 2 2 2 2 22 kkSkk d kk wzzE  +++−= , (3.44) trong đó 2 , 2 , 2 , và 2 là hằng số; d kz , kz là độ sâu mong muốn và độ sâu 53 thực; Sk là góc bẻ của bánh lái độ sâu; kw là tốc độ theo phương đứng; và k là góc chúi của phương tiện ngầm (được thêm vào nhằm hạn chế góc chúi trong quá trình thay đổi độ sâu). Hình 3.7 Sơ đồ hệ thống điều khiển độ sâu AUV Luật cập nhật trọng số trong trường hợp này, áp dụng phương pháp biến đổi trong [3], được tính như sau: )(]0)([ 22222222 jjpjjpjp IsigOIsigOw −=+−=  , (3.45) )()( 22222222 kkSkkjij weIsigw  +++= . ).( 2222222 kkSkkj weO  +++= (3.46) Chỉ số 2 biểu thị BĐK nơ-ron thứ hai dùng cho điều khiển độ sâu, trong đó 𝑒2𝑘 = 𝑧𝑘 𝑑 − 𝑧𝑘. c. Hệ thống điều khiển tốc độ Hình 3.8 Sơ đồ hệ thống điều khiển tốc độ AUV 54 Để thực hiện nhiệm vụ điều khiển tốc độ, hàm mục tiêu của bộ điều khiển NNC được chỉnh với các thành phần như sau: 𝐸3𝑘 = 1 2 [𝜌3(𝑢𝑘 𝑑 − 𝑢𝑘) 2 + 𝜆3𝑛𝑘 2 + 𝜎3�̇�𝑘 2 + 𝜅3𝑍𝑘 2], (3.47) trong đó 3 , 3 , 3 , và 3 là các hằng số; d ku , ku là giá trị mong muốn và giá trị thực tế của tốc độ phương tiện; 𝑛𝑘 là tốc độ vòng quay của máy; ku là thành phần vi phân của tốc độ phương tiện; 𝑍𝑘 là tích phân của sai số tốc độ. Luật cập nhật trọng số trong trường hợp này, áp dụng phương pháp biến đổi trong [3], được tính như sau: �̇�3𝑗𝑝 = 𝑂3𝑝[𝜑3𝑗𝑠𝑖𝑔(−𝐼3𝑗) + 𝛾3 ⋅ 0] = 𝑂3𝑝𝜑3𝑗𝑠𝑖𝑔(−𝐼3𝑗), (3.48) �̇�3𝑖𝑗 = 𝛾3 ⋅ 𝑠𝑖𝑔(𝐼3𝑗) ⋅ (𝜌3𝑒3𝑘 + 𝜆3𝑛𝑘 + 𝜎3�̇�𝑘 + 𝜅3𝑍𝑘 = 𝛾3 ⋅ 𝑂3𝑗 ⋅ (𝜌3𝑒3𝑘 + 𝜆3𝑛𝑘 + 𝜎3�̇�𝑘 + 𝜅3𝑍𝑘). (3.49) Chỉ số 3 biểu thị BĐK nơ-ron thứ ba dùng cho điều khiển tốc độ, trong đó k d kk uue −=3 , và = dttetZ kk )()( 3 (3.50) 3.3.3 Điều khiển tổng hợp các chuyển động của AUV bằng phương pháp tách rời (decoupled control) Hình 3.9 Sơ đồ hệ thống dẫn đường và điều khiển AUV 55 Trong luận án này, ngoài việc điều khiển riêng từng chuyển động của AUV (hướng, độ sâu và tốc độ) tác giả nghiên cứu điều khiển cả 3 yếu tố này trong hoạt động của AUV một cách đồng thời. Sơ đồ hệ thống điều khiển AUV về hướng đi, độ sâu, tốc độ và điều khiển dẫn đường, thực hiện các nhiệm vụ làm việc dưới nước được thể hiện trên Hình 3.9. 3.4 Hệ thống điều khiển dẫn đường AUV và thực hiện các nhiệm vụ dưới nước 3.4.1 Điều khiển AUV theo quỹ đạo đặt trước Điều khiển AUV theo quỹ đạo đặt trước thường sử dụng trong trường hợp AUV khảo sát đáy biển, tìm kiếm cứu nạn, dò tìm hư hỏng trên đường ống ngầm Việc điều khiển này giả định tốc độ AUV không thay đổi, quỹ đạo theo mặt phẳng ngang được định trước bằng các điểm chuyển hướng tạo thành tuyến (route). Độ sâu có thể thay đổi theo lệnh hoặc cố định. Trong đề tài này, tác giả sử dụng luật dẫn đường LOS (Line-of-Sight) để điều khiển AUV theo tuyến. Giả sử AUV có tọa độ trong hệ trục tọa độ {n} di chuyển trong mặt phẳng nằm ngang và bám theo quỹ đạo mong muốn là một đoạn thẳng được tạo thành từ hai điểm chuyển hướng và như trong hình 3.10, vận tốc và hướng đi AUV sẽ được xác định như sau: (3.51) (3.52) Để xác định sai số bám quỹ đạo của con tàu e(t), ta tiến hành chuyển tọa độ của con tàu trong hệ trục tọa độ {n} sang hệ trục tọa độ tham chiếu với gốc đặt tại waypoint và hệ trục tọa độ tham chiếu này quay quanh trục zn của hệ trục tọa độ {n} một góc được xác định như sau: (3.53) (3.54) ( )x, y   Tn k k kp x , y=   Tn k 1 k 1 k 1p x , y+ + += ( ) ( ) ( ) 2 2 U t x t y t= + ( ) ( ) ( )( )  tan 2 , ,t a y t x t  =  − ( )x, y   Tn k k kp x , y= k ( )1 1tan 2 ,k k k k ka a y y x x+ += − − ( ) ( ) ( ) T n n p k kt R a p t p  = −  56 trong đó: . : là khoảng cách along-track. e(t): là sai số bám quỹ đạo. Theo tài liệu [31] thì giá trị ma trận được tính như sau: (3.55) Ta có thể xác định được sai số bám quỹ đạo của con tàu như sau: (3.56) Nhiệm vụ chính của hệ thống dẫn đường (Guidance) là tính toán các trạng thái mong muốn giúp cho AUV bám theo quỹ đạo được định trước, điều này cũng tương đương với việc hệ thống dẫn đường phải làm cho sai số bám quỹ đạo e(t) tiến về 0 ( ). Để thực hiện được điều này thì hệ thống dẫn đường LOS sử dụng nguyên lý Lookahead-based Steering để tính toán hướng đi mong muốn và từ đó tính ra góc mũi tàu mong muốn cung cấp cho hệ thống máy lái tự động. Hệ thống máy lái tự động sẽ sử dụng như là tín hiệu điều khiển đầu vào nhằm điều khiển con tàu bám theo quỹ đạo mong muốn và làm cho sai số bám quỹ đạo của con tàu giảm dần về 0. Hình 3.10 Luật điều hướng LOS   T (t) s(t),e(t) = s(t) T p kR ( ) ( ) cos sin sin cos T k k p k k k a a R a a a −  =     ( ) ( ) ( )sin cosk k k ke t x t x a y t y a= − − + −       t lime(t) 0 → = d d d 57 Phương pháp điều khiển tàu bằng nguyên lý Lookahead-based Steering sẽ làm cho sai số bám quỹ đạo e(t) tiến về 0 bằng cách hướng vector vận tốc của AUV đến điểm chuyển hướng kế tiếp trên quỹ đạo mà con tàu cần phải đi đến hay cũng chính là điểm chuyển hướng trên đoạn thẳng quỹ đạo mà con tàu đang bám theo như hình 3.10. Theo tài liệu [31] thì hướng đi mong muốn theo nguyên lý Lookahead-based Steering sẽ được tách thành hai thành phần như sau: (3.57) Trong đó là góc tiếp tuyến của đoạn thẳng quỹ đạo mong muốn còn là góc tương quan giữa vận tốc và quỹ đạo chuyển. Góc được thêm vào nhằm đảm bảo rằng vector vận tốc U của con tàu luôn hướng về điểm chuyển hướng . (3.58) 𝜒𝑟(𝑒) = 𝑎𝑟𝑐𝑡𝑎𝑛 (− 𝑒(𝑡) Δ ) (3.59) Trong đó là khoảng cách từ hình chiếu của điểm trên đoạn thẳng quỹ đạo mong muốn cho đến điểm chuyển hướng . Từ (3.57), (3.58) và (3.59) thì ta có thể tính được hướng đi mong muốn (desired heading) theo nguyên lý Lookahead-based Steering như sau: (3.60) Trong đó là góc trượt của con tàu. Tuy nhiên vì v  U nên ta có thể giả thiết như . Khi đó (3.60) được viết lại thành: (3.61) Khoảng cách từ vị trí AUV đến điểm chuyển hướng được tính như sau: (3.62) n k 1p + d ( )d p r e  = + p r r d n k 1p + p ka =  np (t) n k 1p + d d p r     = − = + − v arcsin U    =     0  ( )d p r e  = + ( ) ( ) 2 2 2 n n nx x t y y t R− + −        58 Đây là điều kiện để AUV chuyển sang điểm chuyển hướng tiếp theo. Trong trường hợp không gian 3 chiều (3D), độ sâu điểm chuyển hướng được tính đến: [𝑥𝑛 − 𝑥(𝑡)] 2 + [𝑦𝑛 − 𝑦(𝑡)] 2 + [𝑧𝑛 − 𝑧(𝑡)] 2 ≤ 𝑅𝑛 2 (3.63) Trong đề tài này, tác giả điều khiển AUV theo quỹ đạo vuông góc và zig-zag. Các kết quả mô phỏng đượ

Các file đính kèm theo tài liệu này:

luan_an_nghien_cuu_dieu_khien_thich_nghi_cho_robot_lan_tu_ha.pdf
CV gui LATS-NCS PVAnh-Cu CNTT-BGĐT.pdf
6.2 Trang thong tin nhung dong gop moi cua LATS-Pham Viet Anh-T.Viet.docx
6.1 Trang thong tin nhung dong gop moi cua LATS-Pham Viet Anh-T.Anh.docx
5.2 Trang thong tin nhung dong gop moi cua LATS-Pham Viet Anh-T.Viet.pdf
5.1 Trang thong tin nhung dong gop moi cua LATS-Pham Viet Anh-T.Anh.pdf
4.2 Thông tin Tóm tắt LUAN AN Tiếng việt - PHAM VIET ANH 270322.pdf
4.1 Thông tin Tóm tắt LUAN AN Tiếng Anh - PHAM VIET ANH 270322.pdf
3.2 Quyển tắt luận án tiếng việt - PHAM VIET ANH 270322.pdf
3.1 Quyển Tóm tắt LUAN AN Tiếng Anh - PHAM VIET ANH 270322.pdf
2. Danh mục công trình khoa học - PHAM VIET ANH 270322.pdf