LỜI CAM ĐOAN . i
LỜI CẢM ƠN . ii
MỤC LỤC . iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT . v
DANH MỤC CÁC BẢNG BIỂU . vii
DANH MỤC CÁC HÌNH VẼ . viii
MỞ ĐẦU . 1
1. Tính cấp thiết của đề tài luận án . 1
2. Phạm vi, đối tượng nghiên cứu và phương pháp nghiên cứu . 2
3. Mục tiêu của luận án . 2
4. Những đóng góp mới về lý luận và thực tiễn của luận án . 3
5. Bố cục của luận án . 3
CHƯƠNG 1 TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU 5
1.1. Giới thiệu tổng quan về hệ Teleoperation . 5
1.1.1. Khái niệm về hệ Teleoperation. 5
1.1.2. Tình hình nghiên cứu trên thế giới về hệ Teleoperation . 7
1.1.3. Tình hình nghiên cứu trong nước về hệ Teleoperation . 13
1.1.4. Các cấu trúc điều khiển hệ Teleoperation . 13
1.2. Tính chính xác và đồng nhất trong hệ Teleoperation (Transparency in
Teleoperation Systems) . 15
1.3. Các yếu tố ảnh hưởng đến tính ổn định và chất lượng hệ Teleoperation . 16
1.4. Tính đặc thù và những khó khăn khi tổng hợp hệ Teleoperation và đề xuất
hướng giải quyết trong luận án . 18
1.5. Kết luận Chương 1 . 22
CHƯƠNG 2 23
XÂY DỰNG CẤU TRÚC ĐIỀU KHIỂN CHO HỆ THỐNG THAO TÁC
TỪ XA (TELEOPERATION-SMSS) 23
2.1. Cơ sở lý thuyết điều khiển hiện đại 23
2.1.1 Khái niệm về ổn định tiệm cận đều và ổn định theo hàm mũ . 23
2.1.2 Khái niệm về ổn định ISS . 29iv
125 trang |
Chia sẻ: honganh20 | Ngày: 14/03/2022 | Lượt xem: 342 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Nghiên cứu về hệ thao tác từ xa nói chung và đi sâu vào hệ thống thao tác từ xa một chủ một tớ (Teleoperation-SMSS) với trễ trên kênh truyền thông là hằng số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
g nhanh).
- Hệ là ổn định đều theo nghĩa nếu có 1 2t t thì cũng có 1 2x t x t ,
khi giá trị ,W x t là đơn điệu giảm theo t .
Song những tiêu chuẩn đánh giá này, do dựa chủ yếu vào dạng hàm hợp
thức ,V x t được chọn, nên chỉ mang tính định tính và không thể được gọi là đã
đánh giá đúng chất lượng ổn định của hệ.
Mong muốn có những chuẩn đánh giá chất lượng ổn định của hệ phi tuyến
một cách thống nhất và chính xác, người ta đã so sánh với tính ổn định của hệ tuyến
tính, xác định xem quỹ đạo trạng thái tự do của hệ tuyến tính ổn định có những đặc
điểm gì để từ đó đặt ra các khái niệm về chất lượng ổn định cho hệ phi tuyến nói
chung.
28
Xét hệ tuyến tính ổn định tiệm cận với mô hình không bị kích thích
dx Ax
dt
, A là ma trận bền (có tất cả giá trị riêng nằm bên trái trục ảo). Khi đó
nghiệm 0Atx t e x với 0 0x x là trạng thái đầu sẽ có các tính chất sau:
- Luôn có 0x t x với và 0t ,
vì 0 0 0At Atx t e x e x a x , trong đó Ata e là số thực dương hữu
hạn (vì A bền).
- Nếu tất cả các giá trị riêng của A là những số thực thì sẽ có
0 ,x t x t với và 0t , vì khi 1 2t t thì 1 2At Ate e .
Tương ứng, trong hệ phi tuyến người ta cũng có các định nghĩa về chất
lượng quỹ đạo trạng thái tự do của một hệ phi tuyến ổn định như sau:
Định nghĩa 1(Trích: Định nghĩa 1.15 [4]): Xét hệ phi tuyến không dừng,
cân bằng tại gốc và có mô hình không bị kích thích (2.4). Khi đó hệ sẽ được gọi là:
- Ổn định đều tại 0t (uniformly stable) nếu tồn tại miền và để có
0x t x với mọi 0t t và 0 0=x t x
- Ổn định đều toàn cục tại 0t (global uniformly stable) nếu nó ổn định đều
với miền ổn định là toàn bộ không gian trạng thái và
- Ổn định tiệm cần đều tại 0t (uniformly asymtotically stable) nếu tồn tại
miền chứa gốc tọa độ (miền ổn định) và hàm để có:
0 0,x t x t t với mọi 0t t và 0 0=x t x
- Ổn định tiệm cận đều toàn cục tai 0t (global uniformly asymtotically
stabil) nếu nó ổn định tiệm cận đều với miền ổn định là toàn bộ không
gian trạng thái và
29
- Ổn định theo hàm mũ (exponentialy stable) tại 0t nếu nó ổn định tiệm cận
đều toàn cục và thỏa mãn 0( )0 0 0, b t tx t t a x e với a, b là hai số
dương và 0 0=x t x
- Ổn định toàn cục theo hàm mũ nếu nó ổn định theo hàm mũ, có là
toàn bộ không gian trạng thái.
2.1.2 Khái niệm về ổn định ISS
Tính ổn định tiệm cận Lyapunov cho thấy khi hệ cân bằng tại gốc:
,dx f x u
dt
với 0, 0 0f (2.7)
bị một tác động tức thời (tác động của xung dirac t ), đánh bật ra khỏi gốc 0 thì
sau đó hệ có khả năng tự quay về 0 và trong quá trình quay về gốc đó, quỹ đạo
trạng thái tự do x t của hệ bị chặn. Tuy nhiên tính ổn định đó chưa khẳng định
được tính bị chặn của quỹ đạo trạng thái cưỡng bức khi khi hệ được kích thích bởi
một tín hiệu u t cũng bị chặn ở đầu vào. Nói cách khác nó chưa khẳng định được
hệ ổn định Lyapunov cũng sẽ có ổn định ISS hay không [4].
Định nghĩa 1 [4]: Xét hệ phi tuyến (2.7), trong đó u t là véc tơ các tín
hiệu đầu vào và x t là véc tơ các biến trạng thái. Hệ sẽ được gọi là ổn định ISS
nếu khi bị kích thích bởi u t bị chặn, quỹ đạo trạng thái cưỡng bức của ,x t u
của hệ, tức là nghiệm của:
,dx f x u
dt
với 0 0x và với mọi u t tùy ý cho trước có u t ,
0t cũng sẽ bị chặn và tiến tiệm cận về một lân cận của gốc tọa độ.
Lân cận là vùng giới nội của gốc tọa độ 0 mà ở đó các quỹ đạo trạng
thái tự do của hệ ,x t u luôn có hướng tiến về đó và sau khi đi vào thì sẽ ở lại
trong đó, không ra khỏi nữa do vậy còn được họi là miền hấp dẫn (attractor)
như Hình 2.3.
30
Hình 2.3. Minh họa miền hấp dẫn và khái niệm ổn định ISS
2.1.3 Lý thuyết chung về điều khiển trượt (Sliding mode control)
Mặt trượt và điều kiện trượt cho hệ truyền ngược chặt dạng chuẩn:
Để đơn giản trước tiên xét hệ phi tuyến SISO bất định bị chặn, với u t là
tín hiệu vào và y t là tín hiệu ra theo phương trình sau:
1
1
, ,...,
n n
n n
d y dy d yf y u
dt dt dt
(2.8)
Với .f là hàm bất định (không biết trước). Dễ thấy khi ký hiệu các biến
trạng thái:
1
1
, 1,2,....,
k
kk
d y x k n
dt
thì hệ trên sẽ trở thành truyền ngược chặt
dạng chuẩn:
1, 1 1k k
n
dx x k n
dt
dx f x u
dt
với
1
n
x
x
x
và 1y x (2.9)
Có f x là hàm bất định thỏa mãn điều kiện bị chặn:
,f x x x hoặc sup
x
f f x (2.10)
Và do có điều kiện bị chặn (2.10) này nên ở đây khi có giá trị giới hạn
x hoặc tương đối nhỏ, ta cũng có thể xem lớp các đối tượng phi tuyến SISO
31
(2.9) là thuộc nhóm hệ có động học phi tuyến biến đổi chậm (có sự thay đổi giá trị
đạo hàm bậc cao nhỏ).
Có thể thấy ngay rằng nếu hệ (2.9) không phải là bất định, tức là nếu đã biết
hàm f x , thì nó sẽ có bậc tương đối r n và do đó cũng sẽ được điều khiển
tuyến tính hóa chính xác và ổn định tiệm cận toàn cục bằng bộ điều khiển phản hồi
trạng thái. Tuy nhiên nhiệm vụ điều khiển được đặt ra ở đây là khi hàm f x bất
định, ngoại trừ điều kiện bị chặn (2.10), ta vẫn phải thiết kế được bộ điều khiển
hoặc phản hồi trạng thái, hoặc phản hồi tín hiệu ra, sao cho hệ kín Hình 2.4. là ổn
định tiệm cận toàn cục tại gốc. Nói cách khác bộ điều khiển phải làm cho hệ kín
luôn có quỹ đạo trạng thái tự do x bị chặn khi 0t và 0x , tức là làm cho hệ
có tín hiệu sai lệch , 0e t y t t bị chặn, khả vi n lần và (do vì chỉ
xét tính ổn định):
10 lim lim lim , 0 1
k k
k k kt t t
d y d ex k n
dt dt
(2.11)
Bây giờ ta xét s e là một hàm trơn của sai lệch e cùng các đạo hàm của
nó:
1
1
, ,...,
n
n
de d es e s e
dt dt
(2.12)
có nghiệm e t của phương trình vi phân 0s e thỏa mãn điều kiện (2.11). Một
hàm s e như vậy gọi là mặt trượt. Mặt trượt thường được sử dụng nhiều nhất là
mặt trượt tuyến tính tham số hằng:
2 1
1 2 2 1
...
n n
o n n n
de d e d es e a e a a
dt dt dt
(2.13)
có các hệ số , 0 2ia i n là những hằng số thực. Từ lý thuyết phương trình vi
phân tuyến tính tham số hằng ta biết rằng để đảm bảo các nghiệm e t của phương
trình vi phân 0s e thỏa mãn điều kiện (2.11), đa thức đặc tính của nó:
2 11 2... n no np a a a (2.14)
phải là đa thức Hurwitz (có các nghiệm nằm bên trái trục ảo).
32
Khi đã có mặt trượt s e , nhiệm vụ thiết kế bộ điều khiển làm hệ ổn định
tiệm cận chỉ còn lại là phải tạo ra được 0s e . Chẳng hạn:
0dss
dt
hoặc sgn 0dss
dt
(2.15)
Nhiệm vụ (2.15) của việc thiết kế bộ điều khiển được gọi là điều kiện trượt .
Như vậy để có được bộ điều khiển trượt làm việc ổn định tiệm cận với đối tượng bất
định (2.9) ta phải tiến hành qua hai bước:
- Thiết kế mặt trượt s e , tức là thiết kế hàm trơn (2.12) có các nghiệm
e t của phương trình vi phân 0s e thỏa mãn điều kiện (2.11), hoặc
thiết kế hàm tuyến tính (2.13) có đa thức đặc tính (2.14) là đa thức
Hurwitz.
- Thiết kế bộ điều khiển trượt u e từ điều kiện trượt (2.15).
Hình 2.4. Nhiệm vụ của bài toán điều khiển trượt
Thiết kế bộ điều khiển trượt làm hệ ổn định bền vững:
Sử dụng mặt trượt (2.13), khi đó từ điều kiện trượt thứ nhất trong (2.15)
cũng như mô hình (2.9) của đối tượng và sự hiển nhiên e t y t (vì ), ta
có:
2 1
1 22 1
2 1
1 22 1
2 1 3 2
...
...
0 0
...
0 0
n n
o n n n
n n
o n n n
o n n
ds de d e d e d ea a a
dt dt dt dt dt
dy d y d y d ya a a
dt dt dt dt
khi s e
a x a x a x f x u
khi s e
Suy ra (điều kiện trượt)
Mặt trượt Bộ điều khiển trượt
Đối tượng
(2.9)
s(e) u e y = 0
(-)
33
2 1 3 2
2 1 3 2
... ( ) 0
... ( ) 0
o n n
o n n
a x a x a x f x khi s e
u
a x a x a x f x khi s e
(2.16)
Nói cách khác, mọi bộ điều khiển phản hồi ,u x e thỏa mãn điều kiện trượt
(2.16) sẽ làm ổn định tiệm cận bền vững cho đối tượng bất định (2.9).
Định lý 3 (Trích: Định lý 3.11 [4]): Nếu có điều kiện bị chặn (2.10) thì với
mọi hằng số 0k luôn tồn tại một khoảng thời gian T hữu hạn để bộ điều khiển
phản hồi trạng thái tĩnh:
, sgnu x e k x s e nếu có ,f x x x (2.17)
Hoặc phản hồi đầu ra Hình 2.5. Điều khiển trượt bằng phản hồi đầu ra
sgnu e k s e nếu có f (2.18)
thỏa mãn điều kiện trượt (2.16) khi t T . Hằng số k càng lớn, khoảng thời gian
T sẽ càng nhỏ (bài toán điều khiển bền vững).
Hình 2.5. Điều khiển trượt bằng phản hồi đầu ra
Bàn về chất lượng ổn định của hệ trượt :
Chất lượng được bàn đầu tiên ở đây là tốc độ tiến về gốc tọa độ 0 của quỹ
đạo trạng thái tự do ( )x t của hệ. Theo sự diễn giải ở trên thì hệ trượt Hình 2.4. gồm
đối tượng điều khiển (2.9) có thành phần bất định (x)f thỏa mãn (2.10) và bộ điều
khiển phản hồi tín hiệu ra (2.17), được xây dựng từ điều kiện trượt (2.15) là ổn định
tiệm cận toàn cục, trong đó bộ điều khiển có tác dụng đưa quỹ đạo trạng thái tự
do ( )x t về được mặt trượt tuyến tính ( )s e cho bởi (2.13), tức là tạo ra được ( ) 0s e ,
sau đó với tính chất (2.11) của nghiệm ( )e t của phương trình vi phân tuyến tính
tham số hằng ( ) 0s e thì nó sẽ tự trượt trên mặt trượt về gốc tọa độ. Như vậy tốc độ
s(e)
Đối tượng
(2.9)
s u e y
(-)
u
s
34
tiến về gốc tọa độ 0 của quỹ đạo trạng thái tự do ( )x t của hệ sẽ được quyết định bởi
2 yếu tố:
- Yếu tố thứ nhất là tốc độ tiến về mặt trượt: tốc độ tiến về mặt trượt của
quỹ đạo trạng thái tự do ( )x t của hệ được quyết định bởi hằng số k (k càng lớn thời
gian về mặt trượt càng nhanh).
- Yếu tố thứ hai là tốc độ ( )x t trượt trên mặt trượt (2.13) về gốc tọa độ: tốc
độ trượt này phụ thuộc vào vị trí các nghiệm , 1,2..., 1k k n của đa thức đặc tính
(2.14) trong mặt phẳng phức. Các nghiệm , 1,2..., 1k k n càng nằm xa trục ảo về
phía trái thì tốc độ trượt sẽ càng nhanh. Dạng trượt về gốc là tiệm cận theo hàm mũ.
Chất lượng ổn định thứ hai cần bàn là hiện tượng chattering khi quỹ đạo
trạng thái tự do ( )x t của hệ trượt trên mặt trượt về gốc tọa độ. Để giữ lại
được ( )x t trên mặt trượt, tức là để tạo ra được ( ) 0s e , khâu Relay hai vị trí trong
Hình 2.5. phải liên tục chuyển đổi giá trị từ -1 sang 1 và ngược lại với tần số rất lớn.
Điều này gây ra chuỗi tiếng động Bang-Bang khó chịu một cách liên tục trong hệ,
nên người ta gọi hiện tượng chattering này là hiện tượng Bang – Bang.
Hình 2.6. Hiện tượng rung và nguyên nhân của hiện tượng rung (chattering)
Nhằm hạn chế hiện tượng Bang – Bang khó chịu này, trong thực tế người ta
thường sử dụng khâu khuếch đại bão hòa thay cho khâu Relay hai vị trí có là
khoảng khuếch đại được chọn một cách thích hợp:
35
( ) ( )
( ) ( )
k sign s e khi s e
u k s e khi s e
Hình 2.7. Thay khâu Relay hai vị trí bằng khâu khuếch đại bão hòa để giảm
hiện tượng rung (chattering)
2.1.4 Điều khiển thích nghi ISS
Trước hết ta cần hiểu thế nào là điều khiển thích nghi: “Điều khiển thích
nghi là sự tổng hợp các kĩ thuật nhằm tự động chỉnh định các bộ điều chỉnh trong
mạch điều khiển nhằm thực hiện hay duy trì ở một mức độ nhất định chất lượng của
hệ khi thông số của quá trình được điều khiển không biết trước hay thay đổi theo
thời gian”. Như vậy hiểu theo nghĩa rộng có thể xem như các cấu trúc điều khiển có
khả năng linh hoạt với các yếu tố bất định của hệ thì đều được coi là điều khiển
thích nghi.
Để bổ sung vào các thuật toán điều khiển ổn định hệ có tham số bất định
phụ thuộc thời gian, một xu hướng thiết kế mới được xây dựng đó là điều khiển
thích nghi ISS [4].
Xét hệ bất định: , ,dx f x u d
dt
với d t là tín hiệu nhiễu (2.19)
Bài toán điều khiển thích nghi ISS (hay còn gọi là điều khiển ổn định thực
tế - Practical stabilization) được hiểu là bài toán thiết kế bộ điều khiển phản hồi
trạng thái u r x , sao cho với nó hệ kín bất định thu được:
ˆ, , ,dx f x d r x f x ddt có quỹ đạo trạng thái ,x t d là ổn định ISS
Khi hệ kín đã ổn định ISS thì mọi quỹ đạo trạng thái tự do ,x t d sẽ tiến
tiệm cận về miền hấp dẫn . Tất nhiên rằng chất lượng của bộ điều khiển sẽ được
36
đánh giá là càng tốt nếu như nó tạo ra được miền hấp dẫn càng nhỏ. Trong
trường hợp đặc biệt, khi miền tạo ra chỉ có một phần tử duy nhất là gốc tọa độ
0 , thì hiển nhiên bộ điều khiển đó sẽ chính là bộ điều khiển làm hệ ổn định tiệm
cận tại 0 .
+ Điều khiển ổn định thích nghi ISS (điều khiển bền vững):
Xét hệ Euler Lagrange (EL) với nhiễu tác động t :
2
2 ,
d q dq
D q C q z q u t
dt dt
trong đó
dq
z
dt
và nq (2.20)
Giả thiết rằng các tham số mô hình (2.20) là đã biết. Khi đó với bộ điều
khiển phản hồi trạng thái :
2
1 2 2 ,
dqde du D q v t K e K C q z q
dt dt dt
(2.21)
Trong đó v t được xem như thành phần bù nhiễu, e q là sai lệch giữa
tín hiệu chủ đạo momg muốn đặt trước t và quỹ đạo thực q t của hệ, 1 2,K K là
hai ma trận đối xứng xác định dương tùy chọn, hệ kín sẽ có mô hình sai lệch:
2 2 1
1 22 2
d q de dv t K e K D q t
dt dt dt
2 1
1 22
d e deK e K v t D q t
dt dt
p
2
2
1 2
Id x x p Ax Bp
K K Idt
BA
với
e
x de
dt
(2.22)
Từ mô hình sai lệch trên với ma trận A là bền (có tất cả giá trị riêng nằm
bên trái trục ảo, vì 1 2,K K là hai ma trận đối xứng xác định dương) ta dễ thấy rằng
nếu có 0p thì cũng có e t bị chặn và tiến tiệm cận về 0 , tức là hệ kín bao gồm
đối tượng điều khiển (2.20) và bộ điều khiển (2.21) sẽ có tín hiệu ra q t bám ổn
37
định theo tín hiệu đặt t cùng các đạo hàm bậc nhất của chúng. Vấn đề đặt ra tiếp
theo ở đây là khi 0p thì ta phải chọn hai ma trận xác định dương 1 2,K K cũng như
tín hiệu bù nhiễu v t như thế nào cho bộ điều khiển (2.21) để vẫn có tính bám ổn
định đó của hệ kín, hoặc ít nhất thì cũng có sai lệch e t bị chặn và tiến về một lân
cận mong muốn đủ nhỏ của gốc 0 .
Định lý 4 (Trích: Định lý 3.31 [4]): xét hệ sai lệch (2.22) có
1 1iK diag k và 2 2iK diag k , 1, 2,...,i n là hai ma trận đường chéo với các phần
tử thỏa mãn 22 1 0i ik k , 1, 2,...,i n . Ký hiệu 1 2,i i
i
max k k và
2 21 2 1,i i iimin k k k . Nếu thành phần bù nhiễu v t được chọn để có
,p t t thì hệ sai lệch (2.22) sẽ có miền hấp dẫn:
2nx x
(2.23)
Tức là mọi quỹ đạo x t của hệ sa lệch (2.22) cũng bị chặn và có hướng tiến về lân
cận miền .
2.2. Tổng hợp bộ điều khiển thích nghi bền vững cho hệ thống thao tác từ
xa (Teleoperation-SMSS)
Dưới đây đề xuất phương pháp mới để tổng hợp hệ thống thao tác từ xa,
đảm bảo tính bền vững và tính kháng nhiễu, đồng thời có chú ý đến tính phi tuyến
của Robot chủ và Robot tớ; hiệu ứng trễ do truyền thông gây ra và đặc biệt là ước
lượng tác động của môi trường lên Robot tớ và bù trừ ảnh hưởng của nó, trong khi
vẫn đảm bảo cho người thao tác cảm nhận được tác động này.
Đặt vấn đề
Theo [94] động học của hệ thao tác từ xa, bao gồm hai Robot là Robot chủ
(Master) và Robot tớ (Slave) được mô tả bằng hệ phương trình:
( ) ( , ) ( )m m m m m m m m m Nm op mq q q q q q τ τ τM C G (2.24)
( ) ( , ) ( )s s s s s s s s s Ns s eq q q q q q τ τ τM C G (2.25)
38
Trong đó: chỉ số “m” và “s” là các chỉ số chủ và tớ; ,m sq q , , ,
n
iq i m s là các
véc tơ góc (vị trí) tương ứng của chủ và tớ; , ,niτ i m s là các mô men đầu vào
tương ứng của Robot chủ và Robot tớ; nopτ là mô men do người thao tác tạo
nên; neτ là mô men do các lực tương tác của môi trường tác động lên Robot tớ;
x( ) , ,n ni iq i m sM là các ma trận đối xứng xác định dương, tương ứng là mô
men quán tính của Robot chủ và Robot tớ; x( , ) , ,n ni i iq q i m sC là các véc tơ
mô men Coriolis và hướng tâm. , ,nNiτ i m s là các thành phần nhiễu cộng
không đo được và khó mô hình hóa tác động lên Robot chủ và Robot tớ.
Các phương trình (2.24) và (2.25) mô tả động học của Robot chủ và Robot tớ. Các
tay máy (2.24) và (2.25) có các tính chất sau [26]:
Tính chất 1.
1 2 , ,i i i im q m i m sM (2.26)
Với 1im và 2im là các hằng số dương tương ứng với giá trị min và max của i iqM .
Tính chất 2.
, , , ni i i e i i iq q β q q qC (2.27)
Với eβ là hằng số dương, . là chuẩn Ơclid.
Tính chất 3. Thành phần mô men trọng trường bị chặn:
, , ,ni i b iq g q i m sG (2.28)
Với bg là hàm số dương của iq , biết trước.
Tính chất 4. Ma trận 2 ,i i i i iq q qM C là ma trận đối xứng lệch và thỏa mãn
đẳng thức:
2 , 0,T ni i i i ix q q q x xM C (2.29)
Vấn đề đặt ra là tổng hợp bộ điều khiển cho hệ thao tác từ xa, đảm bảo cho
hệ bám vị trí ổn định, đồng thời người thao tác cảm nhận được mức độ tác động của
môi trường lên Robot tớ. Trong đó yêu cầu đảm bảo tính ổn định và chất lượng cho
hệ hệ bám vị trí được đặt lên hàng đầu.
39
Để giải quyết vấn đề đặt ra, luận án đề xuất phương pháp tổng hợp bộ điều
khiển thích nghi bền vững trên cơ sở ước lượng nhiễu (bao gồm lực tương tác của
môi trường lên Robot tớ và các thành phần nhiễu không đo được; không mô hình
hóa được ảnh hưởng lên Robot tớ, tất cả các yêu tố đó gọi chung là tác động môi
trường lên Robot tớ) kết hợp sử dụng chế độ trượt cho phía Robot tớ và tổng hợp bộ
điều khiển ISS thích nghi kháng nhiễu cho Robot chủ.
2.2.1. Tổng hợp bộ điều khiển thích nghi bền vững sử dụng chế độ trượt cho
Robot tớ
2.2.1.1. Ước lượng nhiễu tác động lên Robot tớ
Động học của Robot Slave được mô tả bởi phương trình (2.25) trong đó
thành phần mô men các lực tác động của môi trường eτ và thành phần nhiễu bất
định Nsτ là đại lượng thay đổi trong dải rộng và không đo được. Như đã nêu ở phần
trên, đối với tác động bên ngoài như eτ và Nsτ chúng ta cần xây dựng phương pháp
ước lượng, từ đó sử dụng kết quả ước lượng để điều khiển, làm cho hệ thống có khả
năng thích nghi kháng nhiễu. Trong phần này đề xuất cấu trúc và thuật toán của
khâu ước lượng tác động của môi trường lên Robot tớ.
Trên Hình 2.8 là sơ đồ cấu trúc của bộ ước lượng tác động của môi trường
lên Robot tớ, trong đó có hai khối chính: khối mô hình Robot tớ MHRS và khối xử
lý nhiễu của Robot tớ XLNS. Động học của khối mô hình MHRS (khi không tính
đến nhiễu và được sử dụng trong bộ ước lượng nhiễu) được mô tả bằng phương
trình:
( ) ( , ) ( )s s s s s s s s s sq q q q q q τM C G (2.30)
( ) ( );
( , ) ( , );
( ) ( )
s s s s
s s s s s s
s s s s
q q
q q q q
q q
M M
C C
G G
(2.31)
Trong đó: , ,s s sq q q là các biến trạng thái tương ứng của mô hình MHRS.
Lấy hai vế của phương trình (2.30) trừ hai vế tương ứng của phương trình
(2.25), có chú ý đến (2.31), ta thu được:
40
*( ) ( , )s s s s s s s eq ε q q ε τM C (2.32)
với *; ; ;s s s s s s s s s e e NSε q q ε q q ε q q τ τ τ (2.33)
Các biểu thức (2.32), (2.33) có thể sử dụng để xác định thành phần *eτ .
Phương trình (2.32) cho ta thấy, để ước lượng được eτ cần phải có tín hiệu ( )ε t và
( )ε t . Các tín hiệu này hoàn toàn có thể xác định được trên cơ sở các tín hiệu
, , ,s s s sq q q q và dựa vào (2.33). Trong số các tín hiệu đó ,s sq q là các biến trạng
thái của mô hình nên hoàn toàn có được một cách dễ dàng, còn các tín hiệu ,s sq q là
các biến của Robot tớ có thể thu được nhờ các sensor đo tốc độ và gia tốc. Với sự
phát triển vượt bậc của công nghiệp vi cơ điện tử (MEM) và nano cơ điện tử
(NEM), các chủng loại sensor đó ngày càng được nâng cao và được ứng dụng rộng
rãi trong điều khiển Robot và đặc biệt là trong lĩnh vực dẫn đường và điều khiển các
thiết bị bay.
Kết quả ước lượng theo (2.32), (2.33) sẽ là véc tơ đánh giá tác động của
môi trường lên Robot tớ *ˆeτ , với sai số đánh giá e phụ thuộc vào độ chính xác của
các sensor nói trên: * *ˆe e eτ τ hay * *ˆe e eτ τ (2.34)
Véc tơ đánh giá *ˆeτ sẽ được sử dụng để tạo luật điều khiển bền vững cho Robot
tớ.
Hình 2.8. Sơ đồ cấu trúc của khâu ước lượng tác động của môi trường lên Robot tớ
SLAVE
MHRS
*
eτ
(-)
sτ
τ
, ,s s sq q q
XLNS
*ˆeτ
, ,s s sε ε ε
,s sq q
,s sq q
ULNS
41
2.2.1.2. Tổng hợp luật điều khiển cho cho Robot tớ
Robot tớ với phương trình động học (2.25) là một đối tượng phi tuyến mạnh
với những yếu tố bất định và chịu tác động của môi trường. Yêu cầu đặt ra đối với
bộ điều khiển cho Robot tớ là: đảm bảo để Robot tớ bám theo quỹ đạo của Robot
chủ, giảm thiểu ảnh hưởng tác động của môi trường. Bên cạnh mô men cản do môi
trường tác động còn có thể có những yếu tố bất định khác tác động lên Robot tớ mà
không mô hình hóa được. Vì vậy, dưới đây đề xuất phương pháp tổng hợp bộ điều
khiển trượt, vừa đáp ứng tốt các yêu cầu nêu trên, vừa tạo ra tính bền vững nhằm
khắc phục được các yếu tố bất định. Ý tưởng chủ đạo của phương pháp đề xuất là:
sử dụng đầu ra của bộ ước lượng nhiễu đề xuất ở phần trên nhằm làm cho hệ thống
có khả năng thích nghi kháng nhiễu và sử dụng phương pháp “tính mômen” bởi
phương pháp này cho phép chế ngự hiệu quả tính phi tuyến mạnh của Robot và
được áp dụng rất rộng rãi trong kỹ thuật Robot [57], sử dụng chế độ trượt nhằm chế
ngự các yếu tố bất định, làm cho hệ thống có tính bền vững tốt [19], [87], [91].
Thực hiện ý tưởng nêu trên, trước hết chúng ta áp dụng phương pháp “tính
mômen”, theo đó đầu vào của Robot tớ (2.25) được tạo ra theo luật dưới đây [57]:
( ) ( , ) ( )s s s s s s s s s s bτ q q q q q τM u C G (2.35)
Với su là biến điều khiển sẽ phải được xác định tiếp theo;
( , ) ( )s s s s s sq q q qC G là thành phần bù phi tuyến và bτ là thành phần bù nhiễu. Sử
dụng kết quả ước lượng nhiễu đã thu được ở phần trên, ta chọn *ˆb eτ τ . Khi đó,
thế (2.35) vào (2.25) và biến đổi ta thu được:
( ) ( )s s s s s s eq q qM M u (2.36)
Như vậy, với việc áp dụng luật (2.35) cho Robot tớ, phương trình động học
của Robot tớ đã trở nên đơn giản hơn. Tiếp theo, chúng ta phải xác định su nhằm
đáp ứng các yêu cầu đề ra, đảm bảo tính bền vững cho hệ thống. Điều khiển mode
trượt là lựa chọn thích hợp nhất cho đối tượng (2.36).
Đặt: (t) (t) (t)sd sq q e (2.37)
Trong đó (t)sdq là véc tơ đầu vào mong muốn của hệ thống điều khiển
Robot tớ, đồng thời chính là véc tơ đầu ra của Robot chủ sau khi đi qua đường
truyền với thời gian trễ T:
42
(t) (t T)msdq q (2.38)
Cần xác định thuật toán điều khiển mode trượt cho (2.36) đảm bảo đầu ra
của Robot tớ bám theo đầu vào mong muốn (2.37), nghĩa là làm cho:
lim (t) lim (t) (t) lim (t T) (t) 0
lim (t) lim (t) (t) lim (t T) (t) 0
st t t
t t t
s m ssd
s s m ssd
e q q q q
e q q q q
(2.39)
Chọn mặt trượt dạng:
t
p
o
s s s sIe e e dS (2.40)
Với nsS , p và I là các ma trận đường chéo xác định dương
1 2 ...p p pnp diag , 1 2 ...I I InI diag ; 0; 0, 1, 2, ...,pi Ii i n .
Việc lựa chọn mặt trượt sS chứa thêm thành phần tích phân so với với mặt
trượt đã sử dụng trong các công trình trước đây nhằm mục đích tích lũy tổng sai
lệch trong quá khứ và làm xuất hiện thêm thành phần đạo hàm của sai lệch trong
biểu thức tính thành phần tín hiệu điều khiển sequ được trình bày dưới đây.
Khi hệ thống ở trên mặt trượt, ta có 0sS , nghĩa là
0
t
o
s p s sIe e e d (2.41)
Ở chế độ trượt động học của hệ thống phụ thuộc chủ yếu vào các thông số
của mặt trượt p và I [19], [87]. Các thông số này được chọn sao cho nghiệm
phương trình đặc trưng của (2.40), tức là phương trình:
0Ips s
(2.42)
nằm bên trái trục ảo. Việc lựa chọn như vậy đảm bảo rằng mỗi khi trạng thái của hệ
thống được giữ trên mặt trượt (2.40) thì hệ thống sẽ chuyển động về gốc tọa độ,
nghĩa là 0, 0s se t e t . Mặt trượt với các tham số p và I được xác định
bằng cách này được gọi là mặt trượt.
Tiếp theo, ta phải xác định su trong (2.36) đảm bảo tồn tại chế độ trượt trên
mặt trượt sS cho hệ thống Robot tớ. Chọn su ở dạng:
43
s seq s s ssgnu u K S A S (2.43)
Trong đó sequ là điều khiển tương đương và các thành phần ,sK A được
Các file đính kèm theo tài liệu này:
- nghien_cuu_ve_he_thao_tac_tu_xa_noi_chung_va_di_sau_vao_he_t.pdf