Giải thuật thiết kế LQG
Bộ điều chỉnh toàn phương tuyến tính (LQR) và bộ lọc Kalman được sử
dụng với nhau để thiết kế bộ điều chỉnh động. Thủ tục này được gọi là thiết
kế bộ tuyến tính toàn phương Gaussian (LQG). Điều thuận lợi quan trọng
của việc thiết kế LQG là cấu trúc của bộ điều khiển được cho bởi thủ tục.
Điều này làm cho các bộ LQG được thiết kế rất có ích cho việc điều khiển
các hệ thống hiện đại (ví dụ như điều khiển không gian và hàng không ) khi
cấu trúc bộ điều khiển không biết trước được.Chương 3 : Điều khiển bền vững
Trang 31
Giả sử phương trình đo lường ngõ ra được cho bởi
x = Ax + Bu + γw (3.138)
y=Cx+v (3.139)
với x(t)∈R , u(t) là bộ điều khiển ngõ vào, w(t) là nhiễu quá trình, và v(t) là
nhiễu đo. Giả sử phương trình hồi tiếp trạng thái đầy đủ
u=-Kx+r (3.140)
đã được thiết kế, với r(t) là ngõ vào .Độ lợi trạng thái hồi tiếp là K được
chọn bởi một số kỹ thuật chẳng hạn như kỹ thuật LQR .Nếu phương trình
điều khiển (3.140) được thay vào (3.138) thì hệ thống điều khiển vòng kín
được tìm thấy như sau:
x = (A − BK)x + Br + γw (3.141)
Thiết kế hồi tiếp trạng thái đầy đủ rất được quan tâm nếu các điều kiện
được giử thì hệ thống vòng kín đảm bảo ổn định.Hơn nữa,sử dụng hồi tiếp
trạng thái tất cả các nghiệm cực của phương trình (A-BK) có thể đặt tuỳ ý
như mong muốn .Kết quả các phương trình thiết kế của hồi tiếp trạng thái
đơn giản hơn phương trình cho hồi tiếp ngõ ra . Tuy nhiên luật điều khiển
(3.138) không thể thực hiện khi tất cả các trạng thái không thể đo được.
Bây giờ bộ quan sát hoặc bộ lọc Kalman
xˆ = (A − LC)xˆ + Bu + Ly (3.142)
đã được thiết kế. Đó là độ lợi L của bộ lọc được tìm ra bằng những kĩ thuật
đã thảo luận cung cấp ước lượng trạng thái.Khi đó tất cả các trạng thái
không thể đo và điều khiển (3.138) không thể thực hiện trong thực tế, giả sử
rằng ước lượng hồi tiếp xˆ(t) thay thế các trạng thái thực x(t) luật điều khiển
hồi tiếp là
u = -K xˆ +r (3.143)
Nếu K được chọn sử dụng phương trình Riccati LQR và L được chọn bởi sử
dụng phưong trình Ricati của bộ lọc Kalman.Điều này được gọi là thiết kế
LQG
Điều quan trọng của các kết quả này là trạng thá
75 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 904 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Giáo trình Lý thuyết điều khiển hiện đại - Chương 3: Điều khiển bền vững, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
g sai của sai số ước lượng của x~ (t). Sử dụng (3.104) và sự tuyến
tính của phép toán mong muốn:
E{ } { } { } { }vLEwExEAx −+= γ~~ 0 (3.107)
Vì thế
dt
d E{ }x~ =A { }xE ~0 (3.108)
Do đó, E{ }x~ là lượng biến đổi theo thời gian tuân theo phương trình vi phân
với ma trận hệ thống A 0 .Nếu A 0 =A-LC là ổn định thì E{ }x~ luôn bền vững
tại giá tri tĩnh zero. Khi đó
{ } { } { } { } xxExExExE ˆˆ~ −=−= (3.109)
Theo trừơng hợp này ước lượng xˆ (t) tiến tới E{x(t)} .Như vậy ước lượng
này được cho là không lệch. Cũng như theo (3.109), giá trị trung bình của
PGS.TS Nguyễn Thị Phương Hà Trang 26
sai số ban đầu x~ (0) bằng với giá trị zero nếu như bộ quan sát (3.101) có giá
trị đầu xˆ (0)= 0x với 0x là giá trị trung bình của x(0)
Nếu như nhiễu quá trình w(t) hoặc nhiễu đo được v(t) có giá trị trung bình
không phải là zero thì theo (3.107) giá trị E{ }x~ của trạng thái tĩnh cũng
không bằng zero. Trong trường hợp này xˆ (t) không đến được ổn định tiệm
cận để đạt được trạng thái thật x(t), nhưng có được một khoảng offset bằng
giá trị hằng- E{ }x~ . Khi đó trạng thái ước lượng là bị lệch.
Để xác định P, chú ý rằng lời giải phương trình (3.104) được cho :
x(t)=e JA0 x(0)- 0 ( )
0
( )
t
A te Lv dτ τ τ−∫ + 0 ( )
0
( )
t
A te w dτ γ τ τ−∫ (3.110)
Tìm ma trận tương quan chéo R xv~ (t,t) và R xw~ (t,t) sử dụng (3.110) và giả sử
rằng x(0) (và cả x~ (0) ,w(t) và v(t) là trực giao).Do đó
R xv~ (t,t)=E{ })(~)( txtv T =- { } ττ τ deLvtvE tATt T T )(0 0)()( −∫ (3.111)
Chú ý rằng
R v (t, )τ =V )( τδ −t (3.112)
Nhưng tích phân (3.111) có giá trị giới hạn trên là t. Xung đơn vị có thể
được biểu hiện như sau
)(1lim)(
0 T
t
T
t
T
Π= →δ (3.113)
ở đây hàm xung vuông:
=Π )(1
T
t
T
1 ,
2
0 ,
2
Tt
Tt
⎧ <⎪⎪⎨⎪ ≥⎪⎩
(3.114)
được đặt tại trung tâm t = 0.
Vì vậy, ta chỉ xét một nửa vùng )( τδ −t tại bên tráiτ =t. Do đó từ (3.111)
được suy ra:
R Txv VLtt 2
1),(~ −= (3.115)
Chương 3 : Điều khiển bền vững
Trang 27
Tương tự,
{ })(~)(),(~ txtwEttR Txw =
= { } τγτ τ dewtwE tATt T T )(
0
0)()( −∫ hoặc
),(~ ttR xw =
TWγ
2
1 (3.116)
Phương trình đạo hàm cho P(t)=E{ }Txx~~
P (t)=E
⎭⎬
⎫
⎩⎨
⎧=⎭⎬
⎫
⎩⎨
⎧
dt
xdxEx
dt
xd TT ~~~~ (3.117)
Theo (3.104) , (3.115) và (3.116) ta có :
E TTT WLVLPLCAx
dt
xd γγ
2
1
2
1)(~
~
++−=⎭⎬
⎫
⎩⎨
⎧ (3.118)
E 1 1( )
2 2
T
T T Tdxx P A LC LVL W
dt
γ γ⎧ ⎫ = − + +⎨ ⎬⎩ ⎭
(3.119)
Từ (3.118) và (3.119)
2 TTT WLVLPAPAP γγ+++= 00 (3.120)
Cho bất kì L để (A-LC) là ổn định ,chúng ta giải (3.120) tìm P(t) sử dụng
điều kiện đầu là 0)0( PP = với 0P là hiệp phương sai của trạng thái đầu mà
nó tượng trưng cho tính không chắc chắn trong ước lượng đầu 0)0(ˆ xx =
Thực sự những độ lợi cho kết quả P(t) càng nhỏ thì càng tốt vì sai số x~ (t)
càng gần với trị trung bình bằng 0.Do đó P(t) là thước đo chất lượng của bộ
quan sát ,và ma trận hiệp phương sai càng nhỏ thì bộ quan sát càng tốt hơn
Chúng ta nói rằng P là thước đo sự không chắc chắn trong ước lượng .
P(t) tiến tới giá trị trạng thái bền vững P khi ∞→t ngay khi 0A là ổn định
tiệm cận.Tại trạng thái bền vững thì 0=P , (3.121) trở thành phương trình
đại số
0= TTT WLVLPAPA γγ+++ 00 (3.121)
PGS.TS Nguyễn Thị Phương Hà Trang 28
Hiệp phương sai của sai số trạng thái bền vững là ma trận bán xác định
dương được xác định từ (3.121). Để lấy độ lợi của bộ quan sát là hằng số, có
thể chọn lựa L để làm tối thiểu hoá hiệp phương sai của sai số P trạng thái
bền vững.
Ta có chỉ tiêu chất lượng (PI)
J= )(
2
1 Ptrace (3.122)
Do đó nếu P nhỏ thì J sẽ nhỏ. Để chọn L sao cho J đạt được tối thiểu phải
thỏa mãn phương trình (3.121), xác định phương trình Hamiltonian
H= )(
2
1)(
2
1 gStracePtrace + (3.123)
Trong đó
g =A 0 P+PA
T
0 +LVL
T +γ Wγ T (3.124)
Và S là ma trận n×n thừa số Lagrange không xác định
Để làm tối thiểu hoá J và thoả mãn g=0, điều này có thể làm tương đương là
tối thiểu H nhưng không cần điều kiện nào. Điều kiện cần thiết để tối thiểu
hóa được cho bởi
000 =+++=∂
∂ TTT WLVLPAPA
S
H γγ (3.125)
000 =++=∂
∂ ISASA
P
H T (3.126)
0
2
1 =−=∂
∂ TSPCSLV
P
H (3.127)
Nếu A 0 =A-LC là ổn định và S là xác định dương .Theo (3.127)
L=PC T V-1 (3.128)
Thay thế giá trị L vào phương trình (3.125)
TTTTT WCPVPCCVPCAPPCVPCA γγ++−+− −−− 111 )()( =0 (3.129)
hoặc
Chương 3 : Điều khiển bền vững
Trang 29
AP+PA T +γ Wγ T -PC T V CP1− = 0 (3.130)
Để xác định độ lợi bộ quan sát tối ưu L, chúng ta có thể giải phương trình
(3.130) tìm hiệp phương sai của sai số P và sau đó sử dụng (3.128) để tính
toán L. Phương trình ma trận toàn phương (3.130) được gọi là phương trình
Riccati đại số. Có nhiều cách giải (3.130) để tìm P.Độ lợi tối ưu L xác định
nhờ sử dụng (3.128) gọi là độ lợi Kalman và bộ quan sát được xây dựng gọi
là bộ lọc Kalman .Trạng thái bền vững ở đây chỉ đến một sự thật rằng mặc
dù độ lợi tối uu làm tối thiểu hoá P(t) là biến đổi theo thời gian, chúng ta đã
chọn lựa độ lợi tối ưu mà nó làm tổi thiểu sai số tương quan trạng thái bền
vững để đạt được độ lợi quan sát là hằng số
Bộ lọc Kalman với trạng thái bền vững là bộ ước lượng tốt nhất với các độ
lợi là hằng số. Nếu như nhiễu quá trình w(t) và nhiễu đo được v(t) là nhiễu
Gaussian nó cũng là bộ ước luợng trạng thái bền vững tối ưu cho bất kì hình
thức nào.
Ước lượng ngõ ra:
)(ˆ)()(ˆ)()(~ txCtytytyty −=−= (3.131)
Giả sử (C,A) là có thể quan sát được và (A,γ W ) là có thể tìm được .Khi
đó ARE tìm được ma trận xác định dương duy nhất P .Hơn nữa,sai số hệ
thống (3.104) sử dụng độ lợi kalman cho bởi (3.128) với P là ma trận xác
định dương duy nhất của ARE là ổn định tiệm cận.
Một cách chắc rằng nhiễu hệ thống sẽ giảm.Tuy nhiên vị trí thực sự rất xa
vời so với thực tế.
Tóm lại ,từ mô hình hệ thống:
BuAxx += (3.132)
y=Cx (3.133)
x(0)~(x 0 ,P 0 ) , w(t) ~(0,W), v(t) ~(0,V)
w(t) và v(t) là nhiễu trắng quá trình trực giao với nhau và với x(0)
Giá trị đầu
xˆ (0)= 0x (3.134)
Phương trình ARE của hiệp phương sai sai số
PGS.TS Nguyễn Thị Phương Hà Trang 30
AP +PA 01 =−+ − CPVPCW TTT γγ (3.135)
Độ lợi Kalman
L=PC 1−VT (3.136)
Đặc tính động học ước lượng:
)ˆ(ˆˆ xCyLBuxAx −++= (3.137)
Bộ lọc Kalman rất cần thiết giả sử rằng V>0 khi đó nhiễu đo sẽ làm sai lệch
tất cả tín hiệu đo. Nếu có một vài tín hiệu nhiễu tự do và bộ lọc phức tạp
được biết đến như bộ lọc Deyst được sử dụng để giải quyết vấn đề này.Hơn
nữa giả sử rằng (A, γ )W tìm được có nghĩa là nhiễu quá trình kích thích
tất cả các trạng thái
Trong matlab sử dụng lệnh Kalman tính khâu lọc kalman liên tục từ mô
hình sys của đối tượng:
[kest,L,P] = kalman(sys,W,V[,N,sensor,known])
W,V là các ma trận hiệp phương sai mô tả đặc điểm nhiễu hệ thống và nhiễu
đo lường.
N :mặc định bằng 0
Hai vector sensor,known :chứa chỉ số của các biến ra đo được và các đầu
vào ta biết.
Kết quả tính kest :chính là mô hình trạng thái của khâu lọc Kalman
Ma trận L :ma trận bộ lọc Kalman phản hồi sai lệch quan sát.
P :là ma trận hiệp phương sai của sai lệch tĩnh
3.2.3 Giải thuật thiết kế LQG
Bộ điều chỉnh toàn phương tuyến tính (LQR) và bộ lọc Kalman được sử
dụng với nhau để thiết kế bộ điều chỉnh động. Thủ tục này được gọi là thiết
kế bộ tuyến tính toàn phương Gaussian (LQG). Điều thuận lợi quan trọng
của việc thiết kế LQG là cấu trúc của bộ điều khiển được cho bởi thủ tục.
Điều này làm cho các bộ LQG được thiết kế rất có ích cho việc điều khiển
các hệ thống hiện đại (ví dụ như điều khiển không gian và hàng không ) khi
cấu trúc bộ điều khiển không biết trước được.
Chương 3 : Điều khiển bền vững
Trang 31
Giả sử phương trình đo lường ngõ ra được cho bởi
wBuAxx γ++= (3.138)
y=Cx+v (3.139)
với x(t)∈R , u(t) là bộ điều khiển ngõ vào, w(t) là nhiễu quá trình, và v(t) là
nhiễu đo. Giả sử phương trình hồi tiếp trạng thái đầy đủ
u=-Kx+r (3.140)
đã được thiết kế, với r(t) là ngõ vào .Độ lợi trạng thái hồi tiếp là K được
chọn bởi một số kỹ thuật chẳng hạn như kỹ thuật LQR .Nếu phương trình
điều khiển (3.140) được thay vào (3.138) thì hệ thống điều khiển vòng kín
được tìm thấy như sau:
wBrxBKAx γ++−= )( (3.141)
Thiết kế hồi tiếp trạng thái đầy đủ rất được quan tâm nếu các điều kiện
được giử thì hệ thống vòng kín đảm bảo ổn định.Hơn nữa,sử dụng hồi tiếp
trạng thái tất cả các nghiệm cực của phương trình (A-BK) có thể đặt tuỳ ý
như mong muốn .Kết quả các phương trình thiết kế của hồi tiếp trạng thái
đơn giản hơn phương trình cho hồi tiếp ngõ ra . Tuy nhiên luật điều khiển
(3.138) không thể thực hiện khi tất cả các trạng thái không thể đo được.
Bây giờ bộ quan sát hoặc bộ lọc Kalman
LyBuxLCAx ++−= ˆ)(ˆ (3.142)
đã được thiết kế. Đó là độ lợi L của bộ lọc được tìm ra bằng những kĩ thuật
đã thảo luận cung cấp ước lượng trạng thái.Khi đó tất cả các trạng thái
không thể đo và điều khiển (3.138) không thể thực hiện trong thực tế, giả sử
rằng ước lượng hồi tiếp )(ˆ tx thay thế các trạng thái thực x(t) luật điều khiển
hồi tiếp là
u = -K xˆ +r (3.143)
Nếu K được chọn sử dụng phương trình Riccati LQR và L được chọn bởi sử
dụng phưong trình Ricati của bộ lọc Kalman.Điều này được gọi là thiết kế
LQG
Điều quan trọng của các kết quả này là trạng thái hồi tiếp của K và độ lợi
của bộ quan sát L có thể được thiết kế riêng rẽ.
PGS.TS Nguyễn Thị Phương Hà Trang 32
3.2.4 Ví dụ:
Mô hình con lắc ngược:
Xét hệ thống con lắc ngược như hình sau.Con lắc ngược được gắn vào xe
kéo bởi động cơ điện.Chúng ta chỉ xét bài toán hai chiều,nghĩa là con lắc chỉ
di chuyển trong mặt phẳng.Con lắc ngược không ổn định vì nó luôn ngã
xuống trừ khi có lực tác động thích hợp.Giả sử khối lượng con lắc tập trung
ở đầu thanh như hình vẽ (khối lượng thanh không đáng kể).Lực điều khiển u
tác động vào xe.Yêu cầu của bài toán là điều khiển vị trí của xe và giữ cho
con lắc ngược luôn thẳng đứng. Bài toán điều khiển hệ con lắc ngược chính
là mô hình của bài toán điều khiển định hướng tàu vũ trụ khi được phóng
vào không gian.
lsinθx
θ
u
mg
m
lc
os
θ
l
M
y
x
Hình 3.11: Mô hình con lắc ngược
Chú thích :
M: trọng lượng xe (Kg)
l: chiều dài con lắc ngược (m)
g: Gia tốc trọng trường (m/s2)
θ : Góc giữa con lắc ngược và phương thẳng đứng (rad)
m: Trọng lượng con lắc ngược(Kg)
Chương 3 : Điều khiển bền vững
Trang 33
u: lực tác động vào xe (N)
x: vị trí xe (m)
Trước tiên ta hãy xây dựng mô hình toán học của hệ con lắc ngược
Gọi (xG,yG) là toạ độ của vật nặng ở đầu con lắc,ta có:
.sin
.cos
G
G
x x l
y l
θ
θ
= +
=
Áp dụng định luật II Newton cho chuyển động theo phương x,ta có:
u
dt
xdm
dt
xdM G =+ 2
2
2
2
Thay xG ở biểu thức trên ta có:
ulx
dt
dm
dt
xdM =++ )sin(2
2
2
2
θ
Khai triển các đạo hàm,rút gọn ta được:
umlmlxmM =+−+ ••••• θθθθ )(cos)(sin)(
2
Mặt khác, áp dụng định luật II Newton cho chuyển động quay của con lắc
quanh trục ta được:
θθθ sin)sin(cos. 2
2
2
2
mgll
dt
ydml
dt
xdm GG =−
Thay vào ta có:
θθθθθ sinsincoscos)sin( 2
2
2
2
mglll
dt
dmllx
dt
dm =⎥⎦
⎤⎢⎣
⎡−⎥⎦
⎤⎢⎣
⎡ +
Khia triển các đạo hàm ở biểu thức trên và rút gọn ta được:
lmMml
mlgmMu
mmM
mgmlux
mglmlxm
)()(cos
)sin(cos)(sin)(cos
)(cos
sincos)(sin
sincos
2
2
2
+−
++−=
−−
−+=⇒
=+
•
••
•
••
••••
θ
θθθθθθ
θ
θθθθ
θθθ
Chúng ta sẽ viết chương trình mô phỏng đặc tính động của đối tượng
Chúng ta thấy rằng hệ con lắc ngược là hệ phi tuyến , để có thể điều khiển
hệ con lắc ngược bằng phương pháp LQG chúng ta cần mô hình tuyến
PGS.TS Nguyễn Thị Phương Hà Trang 34
tính.Giả sử góc θ nhỏ để chúng ta có thể xấp xỉ sinθ bằng 0,cosθ bằng 1
và cũng giả sử θ nhỏ để 0
2
≈•θθ .Với các điều kiện trên,chúng ta có thể
tuyến tình hoá các phương trình phi tuyến:
θθ
θ
mgmlxm
umlxmM
=+
=++
••••
••••
)(
Đặt các biến trạng thái:
⎪⎪
⎪
⎩
⎪⎪
⎪
⎨
⎧
=
=
=
=
•
•
xx
xx
x
x
4
3
2
1
θ
θ
(3.144)
Kết hợp với hai phương trình trên ta suy ra hệ phương trình biến trạng thái
như sau:
⎪⎪
⎪⎪
⎩
⎪⎪
⎪⎪
⎨
⎧
+−=
=
−+=
=
•
•
•
•
u
M
gx
Ml
mx
xx
u
Ml
gx
Ml
mMx
xx
1
1
14
43
12
21
(3.145)
Viết lại dưới dạng ma trận
⎥⎥
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢⎢
⎢
⎣
⎡
−
+
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
⎥⎥
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢⎢
⎢
⎣
⎡
−
+
=
⎥⎥
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢⎢
⎢
⎣
⎡
•
•
•
M
Ml
x
x
x
x
g
M
m
g
Ml
mM
x
x
x
x
1
0
1
0
000
1000
000
0010
4
3
2
1
4
3
2
1
D
u (3.146)
Phương trình ở ngõ ra,chúng ta giả sử hai trường hợp:
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
=
4
3
2
1
1000
0100
0010
0001
x
x
x
x
y (3.147)
Chương 3 : Điều khiển bền vững
Trang 35
Nếu chỉ đo được hai biến trạng thái(vị trí x và góc lệch θ )thì :
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
⎥⎦
⎤⎢⎣
⎡=
4
3
2
1
0100
0001
x
x
x
x
y (3.148)
Chúng ta sẽ khảo sát hệ con lắc ngược có các thông số nhưsau:M=1kg,l=1m
Lấy giá trị gia tốc trọng trường g=9.8m/s2
Phương trình (3.146) trở thành:
u
x
x
x
x
x
x
x
x
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
−+
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
−
=
⎥⎥
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢⎢
⎢
⎣
⎡
•
•
•
•
1
0
1
0
00098.0
1000
00078.10
0010
4
3
2
1
4
3
2
1
(3.149)
Thiết kế LQG:
Lọc Kalman:
- Bộ quan sát:
Nếu không có đường phản hồi qua L thì x~ không tiệm cận về x được vì
vậy L được chọn sao cho x~¼x
Bộ quan sát được thiết kế theo giả thuyết
Giả sử ta có hệ thống:
⎪⎩
⎪⎨
⎧
+=
++=•
ν
γω
Cxy
BuAxx ω , :ν nhiễu (3.150)
,v ω là các nhiễu trắng có phân bố gaussian với { }{ } 0.
0.
>=
>=
WE
VE
T
T
ωω
νν
{ } ωνων ,0. ⇒=TE độc lập nhau
Bộ quan sát có phương trình trạng thái:
⎩⎨
⎧
=
−++=
xCy
yyLBuxAx
ˆˆ
)ˆ(ˆˆ (3.151)
PGS.TS Nguyễn Thị Phương Hà Trang 36
Hình 3.12 Bộ lọc Kalman
νγω
νγω
νγω
LxLCAx
xCLxAx
xCCxLxAxxxx
−+−=⇒
−−+=⇒
−+−+=⇒−=
~)(~
)~(~~
)ˆ(~~ˆ~
(3.152)
Lọc Kalman được xây dựng trên cơ sở:xác định L sao cho kỳ vọng toán { }xxE T cực tiểu.
1−=⇒ VPCL T (3.153)
Trong đó P là nghiệm của phương trình Riccati
}.{
}.{
01
T
T
TTT
vvEV
wwEW
CPVPCWAPPA
=
=
=−++ −γγ
(3.154)
Bộ điều khiển LQG (Linear Quard Gaussian):
Trong bộ điều khiển LQ ta hồi tiếp trạng thái tuy nhiên trong thực tế nhiều
khi ta phải quan sát để lấy được biến trạng thái ước lượng (do không đo
được) và hồi tiếp trạng thái ước lượng => LQG
B ∫
vDuCxy
Buxx
++=
++Α=• γω
C
A
L
+ +
-
+
+
∧
y
u y
Chương 3 : Điều khiển bền vững
Trang 37
Hình 3.13: Bộ điều khiển LQG
Điều khiển LQG là kết hợp điều khiển LQR với lọc Kalman .
Bước 1:Thiết kế điều khiển LQR=>KC
Bước 2:Thiết kế bộ lọc Kalman =>L
3.3 Điều khiển bền vững H∞
3.3.1 Biểu Đồ Bode Đa Biến (Multivariable Bode Plot)
Biên độ của ma trận hàm truyền toàn phương )H(jω tại bất kỳ một tần số
ωj nào, phụ thuộc vào hướng tín hiệu kích thích đầu vào.Biên độ của ma
trận hàm truyền H( ωj ) được bao phía trên bởi giá trị suy biến cực đại, kí
hiệu ))(( ωσ jH , phía dưới bởi giá trị suy biến cực tiểu của nó, kí hiệu
))(( ωσ jH . Chính vì vậy,chúng ta cần tính toán hai giá trị ràng buộc này.
Ví dụ: Biểu Đồ Bode Biên Độ Hệ MIMO:
Giả sử hệ thống đa biến:
-
∫
A
L
C
u y
+
++
+
-
B
Kc
Cxy
BuAxx
=
++=• γω
-
PGS.TS Nguyễn Thị Phương Hà Trang 38
(3.155)
Cxxy =⎥⎦
⎤⎢⎣
⎡=
0000
0001
,
có hàm truyền hệ MIMO 22× là:
)()()()( 11 sDsNBAsICsH −− =−=
Với: 165176908)( 234 ++++= sssssD
⎥⎦
⎤⎢⎣
⎡+⎥⎦
⎤⎢⎣
⎡+⎥⎦
⎤⎢⎣
⎡+⎥⎦
⎤⎢⎣
⎡=
150
073
150
079
50
07
10
01
)( 23 ssssN .
Hàm H(s) là ma trận 22× , nó có hai giá trị suy biến. Chú ý rằng giá trị suy
biến là liên tục, ngọai trừ gía trị suy biến cực đại và cực tiểu. Những giá trị
suy biến có thể giao nhau , được minh chứng bằng hình học.
Hình 3.14 Biểu Đồ Bode Biên độ hệ MIMO của giá trị suy biến trong
miền tần số
Trong Malab dùng hàm sigma(H)
buAxuxx +=
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
+
⎥⎥
⎥⎥
⎦
⎤
⎢ ⎢
⎢ ⎢
⎣
⎡
−
−−
−
−−
=
0 0
1 0
0 0
0 1
3800
8300
0012
0021
Chương 3 : Điều khiển bền vững
Trang 39
Để minh họa sự khác biệt giữa đồ thị trị suy biến hệ MIMO và giản đồ
Bode hệ SISO riêng biệt, xét hệ thống sau. Hàm truyền của hệ thống này là
ma trận vuông có hạng 2. Hàm truyền hệ SISO riêng biệt trong hệ thống
vòng hở 2 ngõ vào/2 ngõ ra là:
)2.20)(615.3)(0163.0(
8.14)(11 +++= sssssH
]063.3)4225.0)[(2.20)(615.3)(1)(0163.0(
]49.2)55.0)[(237.2(9.36)( 22
22
12 ++++++
+++−=
sssss
ssssH
]063.3)4225.0)[(2.20)(615.3)(0163.0(
)283.2)(573.2(65.2)( 2221 +++++
−+−=
sssss
ssssH
]063.3)4225.0)[(2.20)(615.3)(1)(0163.0(
]446.0)139.0[(79.0)( 22
22
22 ++++++
++−=
sssss
ssH
Hình 3.15: Biểu đồ Bode Biên Độ hệ thống SISO
Mặc khác, hình 3.14 là các giá trị trị suy biến của hệ đa biến. Chú ý rằng,
theo đồ thị này không thể dễ dàng bằng trực quan tức thời nhận thấy cách
liên kết hệ SISO .Những đường bao bảo đảm sự bền vững đựơc đưa ra trong
hệ thống hệ MIMO dưới dạng giá trị trị suy biến cực tiểu là lớn tại tần số
thấp ( cho chất lượng bền vững) và giá trị trị suy biến cực đại là nhỏ tại tần
số cao (cho ổn định bền vững )..
PGS.TS Nguyễn Thị Phương Hà Trang 40
Hình 3.16:Các giá trị trị suy biến của hệ thống
3.3.2 Hàm nhạy và hàm bù nhạy
Khảo sát đặc tính của hệ thống hồi tiếp điển hình, từ đó đưa ra ý tưởng thiết
kế thỏa hiệp giữa mục tiêu chất lượng và điều khiển bền vững nhằm thỏa
mãn các yêu cầu thiết kế.
Xét hệ thống hồi tiếp âm như hình 3.17, trong đó id là nhiễu đầu vào, d là
nhiễu đầu ra, n là nhiễu đo.
Hình 3.17: Sơ đồ hệ thống hồi tiếp âm
Lưu ý: Để liên hệ với phần lý thuyết điều khiển kinh điển, trong mục này ta
phân tích sơ đồ điều khiển hồi tiếp âm, với bộ điều khiển là Kˆ ( Kˆ = -K ở mô
hình hồi tiếp dương)
n
y Gu
u e
r
-
+ +
+
Kˆ
G
di d
Chương 3 : Điều khiển bền vững
Trang 41
Các quan hệ truyền đạt của hệ thống vòng kín được thể hiện qua các biểu
thức sau:
y = d
KG
d
KG
Gn
KG
KGr
KG
KG
i ˆ1
1
ˆ1ˆ1
ˆ
ˆ1
ˆ
+++++−+
u = d
KG
Kd
KG
KGn
KG
Kr
KG
K
i ˆ1
ˆ
ˆ1
ˆ
ˆ1
ˆ
ˆ1
ˆ
+−+−+−+
Gu = dKG
Kd
KG
n
KG
Kr
KG
K
i ˆ1
ˆ
ˆ1
1
ˆ1
ˆ
ˆ1
ˆ
+−+++−+
e = d
KG
d
KG
Gn
KG
r
KG i ˆ1
1
ˆ1ˆ1
1
ˆ1
1
+−+−+−+
Định nghĩa các hàm nhạy, hàm bù nhạy và độ lợi vòng như sau:
- Hàm nhạy :
KG
S ˆ1
1
+=
- Hàm bù nhạy :
KG
KGT ˆ1
ˆ
+=
- Độ lợi vòng: KGL ˆ=
Các đẳng thức trên được viết gọn lại:
SdGSdTnTry i ++−= (3.156)
SdKTdSnKSrKu i ˆˆˆ −−−= (3.157)
ˆ ˆ ˆG iu KSr KSn Sd KSd= − + − (3.158)
SdGSdSnSre i −−−= (3.159)
Từ (3.156) – (3.159), ta có thể rút ra các mục tiêu chất lượng của hệ thống
vòng kín.Từ phương trình (3.156) ta thấy rằng:
- Để giảm ảnh hưởng của nhiễu đầu ra d lên đầu ra y, hàm nhạy S cần phải
nhỏ.
PGS.TS Nguyễn Thị Phương Hà Trang 42
- Để giảm ảnh hưởng của nhiễu đo n lên đầu ra y, hàm bù nhạy T cần phải
nhỏ. Tương tự, từ phương trình (3.158), để làm giảm ảnh hưởng của nhiễu
đầu vào di, hàm nhạy S cần phải nhỏ.
Nhưng từ định nghĩa ,hàm nhạy và hàm bù nhạy có quan hệ ràng buộc như
sau:
S + T = 1 (3.160)
Do đó, S và T không thể đồng thời nhỏ. Để giải quyết mâu thuẫn này,
người ta dựa vào đặc tính tần số của các tín hiệu nhiễu. Nhiễu tải d, di tập
trung chủ yếu ở vùng tần số thấp, còn nhiễu đo n tập trung chủ yếu ở vùng
tần số cao.
Như vậy, để hệ ít bị ảnh hưởng bởi d, thì S và GS cần phải nhỏ trong
vùng tần số mà d tập trung, cụ thể là vùng tần số thấp. Tương tự, điều kiện
để hệ ít nhạy đối với nhiễu di là |S| và |ˆ| SK nhỏ trong vùng tần số mà di tập
trung, cụ thể là vùng tần số thấp.
Ta có:
1|ˆ||ˆ1|1|ˆ| +≤+≤− KGKGKG
Suy ra:
1|ˆ|
1
ˆ1
1
1|ˆ|
1
−≤+≤+ KGKGKG , nếu | KG
ˆ |>1
hay:
1
1
1
1
−≤≤+ LSL ,nếu L >1
Từ đó, ta thấy:
S >1
Hơn nữa, nếu L >> 1, thì:
Chương 3 : Điều khiển bền vững
Trang 43
GS
|ˆ|
1
ˆ1 KKG
G ≈+=
|ˆ| SK
GKG
K 1
ˆ1
ˆ ≈+=
Như vậy, đối với đầu ra y:
- Để giảm thiểu ảnh hưởng của d, độ lợi vòng L phải lớn (nghĩa là |L|>> 1)
trong vùng tần số mà d tập trung;
- Để giảm thiểu ảnh hưởng của di, biên độ bộ điều khiển phải đủ lớn Kˆ 1>>
trong vùng tần số mà di tập trung.
Tương tự, đối với đầu vào (u G )
- Để giảm thiểu ảnh hưởng của di, L phải lớn (nghĩa là |L|>> 1) trong vùng
tần số mà di tập trung.
- Để giảm thiểu ảnh hưởng của d, biên độ đối tượng (không thay đổi được
trong thiết kế điều khiển) phải đủ lớn (|G|>> 1) trong vùng tần số mà d tập
trung.
Tóm lại, một trong những mục tiêu thiết kế là độ lợi vòng (và cả độ lợi của
bộ điều khiển, nếu được) phải lớn trong vùng tần số mà d và di tập trung, cụ
thể là vùng tần số thấp.
Sau đây, ta xét ảnh hưởng của sai lệch mô hình lên hệ thống hồi tiếp. Giả
sử mô hình đối tượng có sai số nhân là (I + Δ )G, với Δ ổn định, và hệ
thống kín ổn định danh định (ổn định khi Δ=0). Hệ thống kín có sai số mô
hình sẽ ổn định nếu:
det ( ) KG ˆ1(1 Δ++ )=det
⎥⎥⎦
⎤
⎢⎢⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛
+
Δ++
KG
KGKG ˆ1
ˆ
1)ˆ1( =det(1+ KG ˆ )det(1+ )TΔ
không có nghiệm ở nửa phải mặt phẳng phức. Ta thấy rằng, điều này sẽ
được thỏa nếu như TΔ đủ nhỏ, hay |T| phải nhỏ ở vùng tần số mà Δ tập
trung, cụ thể là vùng tần số cao.
PGS.TS Nguyễn Thị Phương Hà Trang 44
Để ý rằng, nếu |L| rất lớn thì |T| ≈ 1 và |S| ≈0. Do đó, từ (3.156) ta thấy
nếu như ( )L jω lớn ở trong một dải tần số rộng, thì nhiễu đo n cũng sẽ
truyền qua hệ thống trong vùng tần số đó, nghĩa là:
y= SdGSdTnTr i ++− ≈ (r - n)
vì rằng nhiễu đo n tập trung chủ yếu ở vùng tần số cao. Hơn nữa, nếu độ lợi
vòng lớn ở ngoài vùng băng thông của G, nghĩa là ( )L jω >>1 trong khi
( )G jω <<1, thì có thể làm cho tín hiệu điều khiển quá lớn, gây bão hòa ở
cơ cấu chấp hành. Điều này có thể được lý giải từ (3.157) như sau:
u= ≈−−− iTddnrSK )(ˆ iddnrG −−− )(||
1
Phương trình trên cho thấy nhiễu tải và nhiễu đo sẽ được khuyếch đại lên
khi mà vùng tần số mà nó tập trung vượt ra ngoài phạm vi băng thông của
G, vì đối với dải tần số mà ( )G jω <<1 thì ( )ωjG
1 >>1.
Tương tự, biên độ của bộ điều khiển, | Kˆ |, không được quá lớn trong vùng
tần số mà độ lợi vòng nhỏ nhằm tránh làm bão hòa cơ cấu chấp hành. Vì lẽ
khi độ lợi vòng nhỏ ( ( )L jω <<1), thì
u= ii dTdnrSK −−− )(ˆ = ˆ ( )K r n d− −
Do đó, một điều cần lưu ý khi thiết kế là | Kˆ | không được lớn quá khi độ lợi
vòng nhỏ.
Từ những điều trình bày ở trên, ta tổng kết lại các ý tưởng thiết kế sau đây:
- Để đảm bảo mục tiêu chất lượng trong một vùng tần số nào đó, cụ thể là
vùng tần số thấp (0, lω ), hệ thống cần phải có:
1|ˆ| >>KG , |ˆ| K >>1
- Để đảm bảo tính bền vững và có khả năng triệt nhiễu đo tốt trong một
vùng tần số nào đó, cụ thể là vùng tần số cao ( ∞,hω ),hệ thống cần phải có :
1|ˆ| <<KG , ≤|ˆ| K M
Chương 3 : Điều khiển bền vững
Trang 45
trong đó M có trị số không quá lớn.
Những ý tưởng thiết kế này được minh họa trong hình 3.18. Những tần số
hl ωω , được xác định tùy thuộc vào từng ứng dụng cụ thể, và những thông
tin về đặc tính của nhiễu tải, nhiễu đo, sai lệch mô hình.
Hình 3.18: Độ lợi vòng và các ràng buộc tần số thấp và tần số cao.
Những điều phân tích trên đây là cơ sở cho một kỹ thuật thiết kế điều khiển:
đó là nắn dạng vòng (loop shaping). Mục tiêu nắn dạng vòng là tìm ra một
bộ điều khiển sao cho độ lợi vòng |L| tránh được các vùng giới hạn (xem
hình 3.18) chỉ định bởi các điều kiện về chất lượng và bền vững.
3.3.3 Thiết kế bền vững H∞
3.3.3.1 Mô tả không gian H∞ và RH∞
Không gian vector Hardy có chuẩn vô cùng, ký hiệu là H∞, là không gian
các hàm phức G(s) của biến phức s (s ∈C) mà trong nửa hở mặt phẳng phức
bên phải (miền có phần thực của biến s lớn hơn 0) thỏa mãn:
- là hàm giải tích (phân tích được thành chuỗi lũy thừa), và
- bị chặn, tức tồn tại giá trị M dương nào đó để ( )s M≤G có phần thực
dương.
lω hω c
ω
L
logω
PGS.TS Nguyễn Thị Phương Hà Trang 46
Tập con đặc biệt của H∞ mà trong điều khiển bền vững rất được quan tâm là
tập hợp gồm các hàm G(s) thực - hữu tỷ (real-rational) thuộc H∞, tức là các
hàm hữu tỷ phức G(s)∈ H∞ với các hệ số là những số thực dạng
0 1
1
( )
1
m
m
n
n
b b s b s
s
a s a s
+ + += + + +G
"
"
trong đó ai,bj ∈ R, ký hiệu là RH∞.
Trong lý thuyết hàm phức, người ta chỉ ra được rằng: một hàm thực – hữu tỷ
G(s) bất kỳ sẽ thuộc RH∞ khi và chỉ khi
- lim ( )
s
s→∞ < ∞G , hay ( )∞G bị chặn (khi m≤n),được gọi là hàm hợp thức và
- G(s) không có cực trên nửa kín mặt phẳng phức bên phải. Nói cách khác
G(s) không có điểm cực với Re(s) ≥ 0.Một hàm G(s) có tính chất như vậy
gọi là hàm bền.
Nếu hàm truyền hợp thức G(s) không những ở nửa hở bên phải mặt phẳng
phức bị chặn khi s ∞→ mà còn thỏa mãn (khi m<n)
0|)(|lim =∞→ sGs
Chuẩn H∞ của một hệ thống
Các file đính kèm theo tài liệu này:
- giao_trinh_ly_thuyet_dieu_khien_hien_dai_chuong_3_dieu_khien.pdf