Giáo trình Lý thuyết điều khiển hiện đại - Chương 3: Điều khiển bền vững

Giải thuật thiết kế LQG

Bộ điều chỉnh toàn phương tuyến tính (LQR) và bộ lọc Kalman được sử

dụng với nhau để thiết kế bộ điều chỉnh động. Thủ tục này được gọi là thiết

kế bộ tuyến tính toàn phương Gaussian (LQG). Điều thuận lợi quan trọng

của việc thiết kế LQG là cấu trúc của bộ điều khiển được cho bởi thủ tục.

Điều này làm cho các bộ LQG được thiết kế rất có ích cho việc điều khiển

các hệ thống hiện đại (ví dụ như điều khiển không gian và hàng không ) khi

cấu trúc bộ điều khiển không biết trước được.Chương 3 : Điều khiển bền vững

Trang 31

Giả sử phương trình đo lường ngõ ra được cho bởi

x = Ax + Bu + γw (3.138)

y=Cx+v (3.139)

với x(t)∈R , u(t) là bộ điều khiển ngõ vào, w(t) là nhiễu quá trình, và v(t) là

nhiễu đo. Giả sử phương trình hồi tiếp trạng thái đầy đủ

u=-Kx+r (3.140)

đã được thiết kế, với r(t) là ngõ vào .Độ lợi trạng thái hồi tiếp là K được

chọn bởi một số kỹ thuật chẳng hạn như kỹ thuật LQR .Nếu phương trình

điều khiển (3.140) được thay vào (3.138) thì hệ thống điều khiển vòng kín

được tìm thấy như sau:

x = (A − BK)x + Br + γw (3.141)

Thiết kế hồi tiếp trạng thái đầy đủ rất được quan tâm nếu các điều kiện

được giử thì hệ thống vòng kín đảm bảo ổn định.Hơn nữa,sử dụng hồi tiếp

trạng thái tất cả các nghiệm cực của phương trình (A-BK) có thể đặt tuỳ ý

như mong muốn .Kết quả các phương trình thiết kế của hồi tiếp trạng thái

đơn giản hơn phương trình cho hồi tiếp ngõ ra . Tuy nhiên luật điều khiển

(3.138) không thể thực hiện khi tất cả các trạng thái không thể đo được.

Bây giờ bộ quan sát hoặc bộ lọc Kalman

xˆ = (A − LC)xˆ + Bu + Ly (3.142)

đã được thiết kế. Đó là độ lợi L của bộ lọc được tìm ra bằng những kĩ thuật

đã thảo luận cung cấp ước lượng trạng thái.Khi đó tất cả các trạng thái

không thể đo và điều khiển (3.138) không thể thực hiện trong thực tế, giả sử

rằng ước lượng hồi tiếp xˆ(t) thay thế các trạng thái thực x(t) luật điều khiển

hồi tiếp là

u = -K xˆ +r (3.143)

Nếu K được chọn sử dụng phương trình Riccati LQR và L được chọn bởi sử

dụng phưong trình Ricati của bộ lọc Kalman.Điều này được gọi là thiết kế

LQG

Điều quan trọng của các kết quả này là trạng thá

75 trang | Chia sẻ: trungkhoi17 | Lượt xem: 687 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Giáo trình Lý thuyết điều khiển hiện đại - Chương 3: Điều khiển bền vững, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

g sai của sai số ước lượng của x~ (t). Sử dụng (3.104) và sự tuyến tính của phép toán mong muốn: E{ } { } { } { }vLEwExEAx −+= γ~~ 0 (3.107) Vì thế dt d E{ }x~ =A { }xE ~0 (3.108) Do đó, E{ }x~ là lượng biến đổi theo thời gian tuân theo phương trình vi phân với ma trận hệ thống A 0 .Nếu A 0 =A-LC là ổn định thì E{ }x~ luôn bền vững tại giá tri tĩnh zero. Khi đó { } { } { } { } xxExExExE ˆˆ~ −=−= (3.109) Theo trừơng hợp này ước lượng xˆ (t) tiến tới E{x(t)} .Như vậy ước lượng này được cho là không lệch. Cũng như theo (3.109), giá trị trung bình của PGS.TS Nguyễn Thị Phương Hà Trang 26 sai số ban đầu x~ (0) bằng với giá trị zero nếu như bộ quan sát (3.101) có giá trị đầu xˆ (0)= 0x với 0x là giá trị trung bình của x(0) Nếu như nhiễu quá trình w(t) hoặc nhiễu đo được v(t) có giá trị trung bình không phải là zero thì theo (3.107) giá trị E{ }x~ của trạng thái tĩnh cũng không bằng zero. Trong trường hợp này xˆ (t) không đến được ổn định tiệm cận để đạt được trạng thái thật x(t), nhưng có được một khoảng offset bằng giá trị hằng- E{ }x~ . Khi đó trạng thái ước lượng là bị lệch. Để xác định P, chú ý rằng lời giải phương trình (3.104) được cho : x(t)=e JA0 x(0)- 0 ( ) 0 ( ) t A te Lv dτ τ τ−∫ + 0 ( ) 0 ( ) t A te w dτ γ τ τ−∫ (3.110) Tìm ma trận tương quan chéo R xv~ (t,t) và R xw~ (t,t) sử dụng (3.110) và giả sử rằng x(0) (và cả x~ (0) ,w(t) và v(t) là trực giao).Do đó R xv~ (t,t)=E{ })(~)( txtv T =- { } ττ τ deLvtvE tATt T T )(0 0)()( −∫ (3.111) Chú ý rằng R v (t, )τ =V )( τδ −t (3.112) Nhưng tích phân (3.111) có giá trị giới hạn trên là t. Xung đơn vị có thể được biểu hiện như sau )(1lim)( 0 T t T t T Π= →δ (3.113) ở đây hàm xung vuông: =Π )(1 T t T 1 , 2 0 , 2 Tt Tt ⎧ <⎪⎪⎨⎪ ≥⎪⎩ (3.114) được đặt tại trung tâm t = 0. Vì vậy, ta chỉ xét một nửa vùng )( τδ −t tại bên tráiτ =t. Do đó từ (3.111) được suy ra: R Txv VLtt 2 1),(~ −= (3.115) Chương 3 : Điều khiển bền vững Trang 27 Tương tự, { })(~)(),(~ txtwEttR Txw = = { } τγτ τ dewtwE tATt T T )( 0 0)()( −∫ hoặc ),(~ ttR xw = TWγ 2 1 (3.116) Phương trình đạo hàm cho P(t)=E{ }Txx~~ P (t)=E ⎭⎬ ⎫ ⎩⎨ ⎧=⎭⎬ ⎫ ⎩⎨ ⎧ dt xdxEx dt xd TT ~~~~ (3.117) Theo (3.104) , (3.115) và (3.116) ta có : E TTT WLVLPLCAx dt xd γγ 2 1 2 1)(~ ~ ++−=⎭⎬ ⎫ ⎩⎨ ⎧ (3.118) E 1 1( ) 2 2 T T T Tdxx P A LC LVL W dt γ γ⎧ ⎫ = − + +⎨ ⎬⎩ ⎭ (3.119) Từ (3.118) và (3.119) 2 TTT WLVLPAPAP γγ+++= 00 (3.120) Cho bất kì L để (A-LC) là ổn định ,chúng ta giải (3.120) tìm P(t) sử dụng điều kiện đầu là 0)0( PP = với 0P là hiệp phương sai của trạng thái đầu mà nó tượng trưng cho tính không chắc chắn trong ước lượng đầu 0)0(ˆ xx = Thực sự những độ lợi cho kết quả P(t) càng nhỏ thì càng tốt vì sai số x~ (t) càng gần với trị trung bình bằng 0.Do đó P(t) là thước đo chất lượng của bộ quan sát ,và ma trận hiệp phương sai càng nhỏ thì bộ quan sát càng tốt hơn Chúng ta nói rằng P là thước đo sự không chắc chắn trong ước lượng . P(t) tiến tới giá trị trạng thái bền vững P khi ∞→t ngay khi 0A là ổn định tiệm cận.Tại trạng thái bền vững thì 0=P , (3.121) trở thành phương trình đại số 0= TTT WLVLPAPA γγ+++ 00 (3.121) PGS.TS Nguyễn Thị Phương Hà Trang 28 Hiệp phương sai của sai số trạng thái bền vững là ma trận bán xác định dương được xác định từ (3.121). Để lấy độ lợi của bộ quan sát là hằng số, có thể chọn lựa L để làm tối thiểu hoá hiệp phương sai của sai số P trạng thái bền vững. Ta có chỉ tiêu chất lượng (PI) J= )( 2 1 Ptrace (3.122) Do đó nếu P nhỏ thì J sẽ nhỏ. Để chọn L sao cho J đạt được tối thiểu phải thỏa mãn phương trình (3.121), xác định phương trình Hamiltonian H= )( 2 1)( 2 1 gStracePtrace + (3.123) Trong đó g =A 0 P+PA T 0 +LVL T +γ Wγ T (3.124) Và S là ma trận n×n thừa số Lagrange không xác định Để làm tối thiểu hoá J và thoả mãn g=0, điều này có thể làm tương đương là tối thiểu H nhưng không cần điều kiện nào. Điều kiện cần thiết để tối thiểu hóa được cho bởi 000 =+++=∂ ∂ TTT WLVLPAPA S H γγ (3.125) 000 =++=∂ ∂ ISASA P H T (3.126) 0 2 1 =−=∂ ∂ TSPCSLV P H (3.127) Nếu A 0 =A-LC là ổn định và S là xác định dương .Theo (3.127) L=PC T V-1 (3.128) Thay thế giá trị L vào phương trình (3.125) TTTTT WCPVPCCVPCAPPCVPCA γγ++−+− −−− 111 )()( =0 (3.129) hoặc Chương 3 : Điều khiển bền vững Trang 29 AP+PA T +γ Wγ T -PC T V CP1− = 0 (3.130) Để xác định độ lợi bộ quan sát tối ưu L, chúng ta có thể giải phương trình (3.130) tìm hiệp phương sai của sai số P và sau đó sử dụng (3.128) để tính toán L. Phương trình ma trận toàn phương (3.130) được gọi là phương trình Riccati đại số. Có nhiều cách giải (3.130) để tìm P.Độ lợi tối ưu L xác định nhờ sử dụng (3.128) gọi là độ lợi Kalman và bộ quan sát được xây dựng gọi là bộ lọc Kalman .Trạng thái bền vững ở đây chỉ đến một sự thật rằng mặc dù độ lợi tối uu làm tối thiểu hoá P(t) là biến đổi theo thời gian, chúng ta đã chọn lựa độ lợi tối ưu mà nó làm tổi thiểu sai số tương quan trạng thái bền vững để đạt được độ lợi quan sát là hằng số Bộ lọc Kalman với trạng thái bền vững là bộ ước lượng tốt nhất với các độ lợi là hằng số. Nếu như nhiễu quá trình w(t) và nhiễu đo được v(t) là nhiễu Gaussian nó cũng là bộ ước luợng trạng thái bền vững tối ưu cho bất kì hình thức nào. Ước lượng ngõ ra: )(ˆ)()(ˆ)()(~ txCtytytyty −=−= (3.131) Giả sử (C,A) là có thể quan sát được và (A,γ W ) là có thể tìm được .Khi đó ARE tìm được ma trận xác định dương duy nhất P .Hơn nữa,sai số hệ thống (3.104) sử dụng độ lợi kalman cho bởi (3.128) với P là ma trận xác định dương duy nhất của ARE là ổn định tiệm cận. Một cách chắc rằng nhiễu hệ thống sẽ giảm.Tuy nhiên vị trí thực sự rất xa vời so với thực tế. Tóm lại ,từ mô hình hệ thống: BuAxx += (3.132) y=Cx (3.133) x(0)~(x 0 ,P 0 ) , w(t) ~(0,W), v(t) ~(0,V) w(t) và v(t) là nhiễu trắng quá trình trực giao với nhau và với x(0) Giá trị đầu xˆ (0)= 0x (3.134) Phương trình ARE của hiệp phương sai sai số PGS.TS Nguyễn Thị Phương Hà Trang 30 AP +PA 01 =−+ − CPVPCW TTT γγ (3.135) Độ lợi Kalman L=PC 1−VT (3.136) Đặc tính động học ước lượng: )ˆ(ˆˆ xCyLBuxAx −++= (3.137) Bộ lọc Kalman rất cần thiết giả sử rằng V>0 khi đó nhiễu đo sẽ làm sai lệch tất cả tín hiệu đo. Nếu có một vài tín hiệu nhiễu tự do và bộ lọc phức tạp được biết đến như bộ lọc Deyst được sử dụng để giải quyết vấn đề này.Hơn nữa giả sử rằng (A, γ )W tìm được có nghĩa là nhiễu quá trình kích thích tất cả các trạng thái Trong matlab sử dụng lệnh Kalman tính khâu lọc kalman liên tục từ mô hình sys của đối tượng: [kest,L,P] = kalman(sys,W,V[,N,sensor,known]) W,V là các ma trận hiệp phương sai mô tả đặc điểm nhiễu hệ thống và nhiễu đo lường. N :mặc định bằng 0 Hai vector sensor,known :chứa chỉ số của các biến ra đo được và các đầu vào ta biết. Kết quả tính kest :chính là mô hình trạng thái của khâu lọc Kalman Ma trận L :ma trận bộ lọc Kalman phản hồi sai lệch quan sát. P :là ma trận hiệp phương sai của sai lệch tĩnh 3.2.3 Giải thuật thiết kế LQG Bộ điều chỉnh toàn phương tuyến tính (LQR) và bộ lọc Kalman được sử dụng với nhau để thiết kế bộ điều chỉnh động. Thủ tục này được gọi là thiết kế bộ tuyến tính toàn phương Gaussian (LQG). Điều thuận lợi quan trọng của việc thiết kế LQG là cấu trúc của bộ điều khiển được cho bởi thủ tục. Điều này làm cho các bộ LQG được thiết kế rất có ích cho việc điều khiển các hệ thống hiện đại (ví dụ như điều khiển không gian và hàng không ) khi cấu trúc bộ điều khiển không biết trước được. Chương 3 : Điều khiển bền vững Trang 31 Giả sử phương trình đo lường ngõ ra được cho bởi wBuAxx γ++= (3.138) y=Cx+v (3.139) với x(t)∈R , u(t) là bộ điều khiển ngõ vào, w(t) là nhiễu quá trình, và v(t) là nhiễu đo. Giả sử phương trình hồi tiếp trạng thái đầy đủ u=-Kx+r (3.140) đã được thiết kế, với r(t) là ngõ vào .Độ lợi trạng thái hồi tiếp là K được chọn bởi một số kỹ thuật chẳng hạn như kỹ thuật LQR .Nếu phương trình điều khiển (3.140) được thay vào (3.138) thì hệ thống điều khiển vòng kín được tìm thấy như sau: wBrxBKAx γ++−= )( (3.141) Thiết kế hồi tiếp trạng thái đầy đủ rất được quan tâm nếu các điều kiện được giử thì hệ thống vòng kín đảm bảo ổn định.Hơn nữa,sử dụng hồi tiếp trạng thái tất cả các nghiệm cực của phương trình (A-BK) có thể đặt tuỳ ý như mong muốn .Kết quả các phương trình thiết kế của hồi tiếp trạng thái đơn giản hơn phương trình cho hồi tiếp ngõ ra . Tuy nhiên luật điều khiển (3.138) không thể thực hiện khi tất cả các trạng thái không thể đo được. Bây giờ bộ quan sát hoặc bộ lọc Kalman LyBuxLCAx ++−= ˆ)(ˆ (3.142) đã được thiết kế. Đó là độ lợi L của bộ lọc được tìm ra bằng những kĩ thuật đã thảo luận cung cấp ước lượng trạng thái.Khi đó tất cả các trạng thái không thể đo và điều khiển (3.138) không thể thực hiện trong thực tế, giả sử rằng ước lượng hồi tiếp )(ˆ tx thay thế các trạng thái thực x(t) luật điều khiển hồi tiếp là u = -K xˆ +r (3.143) Nếu K được chọn sử dụng phương trình Riccati LQR và L được chọn bởi sử dụng phưong trình Ricati của bộ lọc Kalman.Điều này được gọi là thiết kế LQG Điều quan trọng của các kết quả này là trạng thái hồi tiếp của K và độ lợi của bộ quan sát L có thể được thiết kế riêng rẽ. PGS.TS Nguyễn Thị Phương Hà Trang 32 3.2.4 Ví dụ: Mô hình con lắc ngược: Xét hệ thống con lắc ngược như hình sau.Con lắc ngược được gắn vào xe kéo bởi động cơ điện.Chúng ta chỉ xét bài toán hai chiều,nghĩa là con lắc chỉ di chuyển trong mặt phẳng.Con lắc ngược không ổn định vì nó luôn ngã xuống trừ khi có lực tác động thích hợp.Giả sử khối lượng con lắc tập trung ở đầu thanh như hình vẽ (khối lượng thanh không đáng kể).Lực điều khiển u tác động vào xe.Yêu cầu của bài toán là điều khiển vị trí của xe và giữ cho con lắc ngược luôn thẳng đứng. Bài toán điều khiển hệ con lắc ngược chính là mô hình của bài toán điều khiển định hướng tàu vũ trụ khi được phóng vào không gian. lsinθx θ u mg m lc os θ l M y x Hình 3.11: Mô hình con lắc ngược Chú thích : M: trọng lượng xe (Kg) l: chiều dài con lắc ngược (m) g: Gia tốc trọng trường (m/s2) θ : Góc giữa con lắc ngược và phương thẳng đứng (rad) m: Trọng lượng con lắc ngược(Kg) Chương 3 : Điều khiển bền vững Trang 33 u: lực tác động vào xe (N) x: vị trí xe (m) Trước tiên ta hãy xây dựng mô hình toán học của hệ con lắc ngược Gọi (xG,yG) là toạ độ của vật nặng ở đầu con lắc,ta có: .sin .cos G G x x l y l θ θ = + = Áp dụng định luật II Newton cho chuyển động theo phương x,ta có: u dt xdm dt xdM G =+ 2 2 2 2 Thay xG ở biểu thức trên ta có: ulx dt dm dt xdM =++ )sin(2 2 2 2 θ Khai triển các đạo hàm,rút gọn ta được: umlmlxmM =+−+ ••••• θθθθ )(cos)(sin)( 2 Mặt khác, áp dụng định luật II Newton cho chuyển động quay của con lắc quanh trục ta được: θθθ sin)sin(cos. 2 2 2 2 mgll dt ydml dt xdm GG =− Thay vào ta có: θθθθθ sinsincoscos)sin( 2 2 2 2 mglll dt dmllx dt dm =⎥⎦ ⎤⎢⎣ ⎡−⎥⎦ ⎤⎢⎣ ⎡ + Khia triển các đạo hàm ở biểu thức trên và rút gọn ta được: lmMml mlgmMu mmM mgmlux mglmlxm )()(cos )sin(cos)(sin)(cos )(cos sincos)(sin sincos 2 2 2 +− ++−= −− −+=⇒ =+ • •• • •• •••• θ θθθθθθ θ θθθθ θθθ Chúng ta sẽ viết chương trình mô phỏng đặc tính động của đối tượng Chúng ta thấy rằng hệ con lắc ngược là hệ phi tuyến , để có thể điều khiển hệ con lắc ngược bằng phương pháp LQG chúng ta cần mô hình tuyến PGS.TS Nguyễn Thị Phương Hà Trang 34 tính.Giả sử góc θ nhỏ để chúng ta có thể xấp xỉ sinθ bằng 0,cosθ bằng 1 và cũng giả sử θ nhỏ để 0 2 ≈•θθ .Với các điều kiện trên,chúng ta có thể tuyến tình hoá các phương trình phi tuyến: θθ θ mgmlxm umlxmM =+ =++ •••• •••• )( Đặt các biến trạng thái: ⎪⎪ ⎪ ⎩ ⎪⎪ ⎪ ⎨ ⎧ = = = = • • xx xx x x 4 3 2 1 θ θ (3.144) Kết hợp với hai phương trình trên ta suy ra hệ phương trình biến trạng thái như sau: ⎪⎪ ⎪⎪ ⎩ ⎪⎪ ⎪⎪ ⎨ ⎧ +−= = −+= = • • • • u M gx Ml mx xx u Ml gx Ml mMx xx 1 1 14 43 12 21 (3.145) Viết lại dưới dạng ma trận ⎥⎥ ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ − + ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ ⎥⎥ ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ − + = ⎥⎥ ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ • • • M Ml x x x x g M m g Ml mM x x x x 1 0 1 0 000 1000 000 0010 4 3 2 1 4 3 2 1 D u (3.146) Phương trình ở ngõ ra,chúng ta giả sử hai trường hợp: ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ = 4 3 2 1 1000 0100 0010 0001 x x x x y (3.147) Chương 3 : Điều khiển bền vững Trang 35 Nếu chỉ đo được hai biến trạng thái(vị trí x và góc lệch θ )thì : ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ ⎥⎦ ⎤⎢⎣ ⎡= 4 3 2 1 0100 0001 x x x x y (3.148) Chúng ta sẽ khảo sát hệ con lắc ngược có các thông số nhưsau:M=1kg,l=1m Lấy giá trị gia tốc trọng trường g=9.8m/s2 Phương trình (3.146) trở thành: u x x x x x x x x ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ −+ ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ − = ⎥⎥ ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ • • • • 1 0 1 0 00098.0 1000 00078.10 0010 4 3 2 1 4 3 2 1 (3.149) Thiết kế LQG: Lọc Kalman: - Bộ quan sát: Nếu không có đường phản hồi qua L thì x~ không tiệm cận về x được vì vậy L được chọn sao cho x~¼x Bộ quan sát được thiết kế theo giả thuyết Giả sử ta có hệ thống: ⎪⎩ ⎪⎨ ⎧ += ++=• ν γω Cxy BuAxx ω , :ν nhiễu (3.150) ,v ω là các nhiễu trắng có phân bố gaussian với { }{ } 0. 0. >= >= WE VE T T ωω νν { } ωνων ,0. ⇒=TE độc lập nhau Bộ quan sát có phương trình trạng thái: ⎩⎨ ⎧ = −++= xCy yyLBuxAx ˆˆ )ˆ(ˆˆ (3.151) PGS.TS Nguyễn Thị Phương Hà Trang 36 Hình 3.12 Bộ lọc Kalman νγω νγω νγω LxLCAx xCLxAx xCCxLxAxxxx −+−=⇒ −−+=⇒ −+−+=⇒−= ~)(~ )~(~~ )ˆ(~~ˆ~ (3.152) Lọc Kalman được xây dựng trên cơ sở:xác định L sao cho kỳ vọng toán { }xxE T cực tiểu. 1−=⇒ VPCL T (3.153) Trong đó P là nghiệm của phương trình Riccati }.{ }.{ 01 T T TTT vvEV wwEW CPVPCWAPPA = = =−++ −γγ (3.154) Bộ điều khiển LQG (Linear Quard Gaussian): Trong bộ điều khiển LQ ta hồi tiếp trạng thái tuy nhiên trong thực tế nhiều khi ta phải quan sát để lấy được biến trạng thái ước lượng (do không đo được) và hồi tiếp trạng thái ước lượng => LQG B ∫ vDuCxy Buxx ++= ++Α=• γω C A L + + - + + ∧ y u y Chương 3 : Điều khiển bền vững Trang 37 Hình 3.13: Bộ điều khiển LQG Điều khiển LQG là kết hợp điều khiển LQR với lọc Kalman . Bước 1:Thiết kế điều khiển LQR=>KC Bước 2:Thiết kế bộ lọc Kalman =>L 3.3 Điều khiển bền vững H∞ 3.3.1 Biểu Đồ Bode Đa Biến (Multivariable Bode Plot) Biên độ của ma trận hàm truyền toàn phương )H(jω tại bất kỳ một tần số ωj nào, phụ thuộc vào hướng tín hiệu kích thích đầu vào.Biên độ của ma trận hàm truyền H( ωj ) được bao phía trên bởi giá trị suy biến cực đại, kí hiệu ))(( ωσ jH , phía dưới bởi giá trị suy biến cực tiểu của nó, kí hiệu ))(( ωσ jH . Chính vì vậy,chúng ta cần tính toán hai giá trị ràng buộc này. Ví dụ: Biểu Đồ Bode Biên Độ Hệ MIMO: Giả sử hệ thống đa biến: - ∫ A L C u y + ++ + - B Kc Cxy BuAxx = ++=• γω - PGS.TS Nguyễn Thị Phương Hà Trang 38 (3.155) Cxxy =⎥⎦ ⎤⎢⎣ ⎡= 0000 0001 , có hàm truyền hệ MIMO 22× là: )()()()( 11 sDsNBAsICsH −− =−= Với: 165176908)( 234 ++++= sssssD ⎥⎦ ⎤⎢⎣ ⎡+⎥⎦ ⎤⎢⎣ ⎡+⎥⎦ ⎤⎢⎣ ⎡+⎥⎦ ⎤⎢⎣ ⎡= 150 073 150 079 50 07 10 01 )( 23 ssssN . Hàm H(s) là ma trận 22× , nó có hai giá trị suy biến. Chú ý rằng giá trị suy biến là liên tục, ngọai trừ gía trị suy biến cực đại và cực tiểu. Những giá trị suy biến có thể giao nhau , được minh chứng bằng hình học. Hình 3.14 Biểu Đồ Bode Biên độ hệ MIMO của giá trị suy biến trong miền tần số Trong Malab dùng hàm sigma(H) buAxuxx += ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ + ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − −− − −− = 0 0 1 0 0 0 0 1 3800 8300 0012 0021 Chương 3 : Điều khiển bền vững Trang 39 Để minh họa sự khác biệt giữa đồ thị trị suy biến hệ MIMO và giản đồ Bode hệ SISO riêng biệt, xét hệ thống sau. Hàm truyền của hệ thống này là ma trận vuông có hạng 2. Hàm truyền hệ SISO riêng biệt trong hệ thống vòng hở 2 ngõ vào/2 ngõ ra là: )2.20)(615.3)(0163.0( 8.14)(11 +++= sssssH ]063.3)4225.0)[(2.20)(615.3)(1)(0163.0( ]49.2)55.0)[(237.2(9.36)( 22 22 12 ++++++ +++−= sssss ssssH ]063.3)4225.0)[(2.20)(615.3)(0163.0( )283.2)(573.2(65.2)( 2221 +++++ −+−= sssss ssssH ]063.3)4225.0)[(2.20)(615.3)(1)(0163.0( ]446.0)139.0[(79.0)( 22 22 22 ++++++ ++−= sssss ssH Hình 3.15: Biểu đồ Bode Biên Độ hệ thống SISO Mặc khác, hình 3.14 là các giá trị trị suy biến của hệ đa biến. Chú ý rằng, theo đồ thị này không thể dễ dàng bằng trực quan tức thời nhận thấy cách liên kết hệ SISO .Những đường bao bảo đảm sự bền vững đựơc đưa ra trong hệ thống hệ MIMO dưới dạng giá trị trị suy biến cực tiểu là lớn tại tần số thấp ( cho chất lượng bền vững) và giá trị trị suy biến cực đại là nhỏ tại tần số cao (cho ổn định bền vững ).. PGS.TS Nguyễn Thị Phương Hà Trang 40 Hình 3.16:Các giá trị trị suy biến của hệ thống 3.3.2 Hàm nhạy và hàm bù nhạy Khảo sát đặc tính của hệ thống hồi tiếp điển hình, từ đó đưa ra ý tưởng thiết kế thỏa hiệp giữa mục tiêu chất lượng và điều khiển bền vững nhằm thỏa mãn các yêu cầu thiết kế. Xét hệ thống hồi tiếp âm như hình 3.17, trong đó id là nhiễu đầu vào, d là nhiễu đầu ra, n là nhiễu đo. Hình 3.17: Sơ đồ hệ thống hồi tiếp âm Lưu ý: Để liên hệ với phần lý thuyết điều khiển kinh điển, trong mục này ta phân tích sơ đồ điều khiển hồi tiếp âm, với bộ điều khiển là Kˆ ( Kˆ = -K ở mô hình hồi tiếp dương) n y Gu u e r - + + + Kˆ G di d Chương 3 : Điều khiển bền vững Trang 41 Các quan hệ truyền đạt của hệ thống vòng kín được thể hiện qua các biểu thức sau: y = d KG d KG Gn KG KGr KG KG i ˆ1 1 ˆ1ˆ1 ˆ ˆ1 ˆ +++++−+ u = d KG Kd KG KGn KG Kr KG K i ˆ1 ˆ ˆ1 ˆ ˆ1 ˆ ˆ1 ˆ +−+−+−+ Gu = dKG Kd KG n KG Kr KG K i ˆ1 ˆ ˆ1 1 ˆ1 ˆ ˆ1 ˆ +−+++−+ e = d KG d KG Gn KG r KG i ˆ1 1 ˆ1ˆ1 1 ˆ1 1 +−+−+−+ Định nghĩa các hàm nhạy, hàm bù nhạy và độ lợi vòng như sau: - Hàm nhạy : KG S ˆ1 1 += - Hàm bù nhạy : KG KGT ˆ1 ˆ += - Độ lợi vòng: KGL ˆ= Các đẳng thức trên được viết gọn lại: SdGSdTnTry i ++−= (3.156) SdKTdSnKSrKu i ˆˆˆ −−−= (3.157) ˆ ˆ ˆG iu KSr KSn Sd KSd= − + − (3.158) SdGSdSnSre i −−−= (3.159) Từ (3.156) – (3.159), ta có thể rút ra các mục tiêu chất lượng của hệ thống vòng kín.Từ phương trình (3.156) ta thấy rằng: - Để giảm ảnh hưởng của nhiễu đầu ra d lên đầu ra y, hàm nhạy S cần phải nhỏ. PGS.TS Nguyễn Thị Phương Hà Trang 42 - Để giảm ảnh hưởng của nhiễu đo n lên đầu ra y, hàm bù nhạy T cần phải nhỏ. Tương tự, từ phương trình (3.158), để làm giảm ảnh hưởng của nhiễu đầu vào di, hàm nhạy S cần phải nhỏ. Nhưng từ định nghĩa ,hàm nhạy và hàm bù nhạy có quan hệ ràng buộc như sau: S + T = 1 (3.160) Do đó, S và T không thể đồng thời nhỏ. Để giải quyết mâu thuẫn này, người ta dựa vào đặc tính tần số của các tín hiệu nhiễu. Nhiễu tải d, di tập trung chủ yếu ở vùng tần số thấp, còn nhiễu đo n tập trung chủ yếu ở vùng tần số cao. Như vậy, để hệ ít bị ảnh hưởng bởi d, thì S và GS cần phải nhỏ trong vùng tần số mà d tập trung, cụ thể là vùng tần số thấp. Tương tự, điều kiện để hệ ít nhạy đối với nhiễu di là |S| và |ˆ| SK nhỏ trong vùng tần số mà di tập trung, cụ thể là vùng tần số thấp. Ta có: 1|ˆ||ˆ1|1|ˆ| +≤+≤− KGKGKG Suy ra: 1|ˆ| 1 ˆ1 1 1|ˆ| 1 −≤+≤+ KGKGKG , nếu | KG ˆ |>1 hay: 1 1 1 1 −≤≤+ LSL ,nếu L >1 Từ đó, ta thấy: S >1 Hơn nữa, nếu L >> 1, thì: Chương 3 : Điều khiển bền vững Trang 43 GS |ˆ| 1 ˆ1 KKG G ≈+= |ˆ| SK GKG K 1 ˆ1 ˆ ≈+= Như vậy, đối với đầu ra y: - Để giảm thiểu ảnh hưởng của d, độ lợi vòng L phải lớn (nghĩa là |L|>> 1) trong vùng tần số mà d tập trung; - Để giảm thiểu ảnh hưởng của di, biên độ bộ điều khiển phải đủ lớn Kˆ 1>> trong vùng tần số mà di tập trung. Tương tự, đối với đầu vào (u G ) - Để giảm thiểu ảnh hưởng của di, L phải lớn (nghĩa là |L|>> 1) trong vùng tần số mà di tập trung. - Để giảm thiểu ảnh hưởng của d, biên độ đối tượng (không thay đổi được trong thiết kế điều khiển) phải đủ lớn (|G|>> 1) trong vùng tần số mà d tập trung. Tóm lại, một trong những mục tiêu thiết kế là độ lợi vòng (và cả độ lợi của bộ điều khiển, nếu được) phải lớn trong vùng tần số mà d và di tập trung, cụ thể là vùng tần số thấp. Sau đây, ta xét ảnh hưởng của sai lệch mô hình lên hệ thống hồi tiếp. Giả sử mô hình đối tượng có sai số nhân là (I + Δ )G, với Δ ổn định, và hệ thống kín ổn định danh định (ổn định khi Δ=0). Hệ thống kín có sai số mô hình sẽ ổn định nếu: det ( ) KG ˆ1(1 Δ++ )=det ⎥⎥⎦ ⎤ ⎢⎢⎣ ⎡ ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ + Δ++ KG KGKG ˆ1 ˆ 1)ˆ1( =det(1+ KG ˆ )det(1+ )TΔ không có nghiệm ở nửa phải mặt phẳng phức. Ta thấy rằng, điều này sẽ được thỏa nếu như TΔ đủ nhỏ, hay |T| phải nhỏ ở vùng tần số mà Δ tập trung, cụ thể là vùng tần số cao. PGS.TS Nguyễn Thị Phương Hà Trang 44 Để ý rằng, nếu |L| rất lớn thì |T| ≈ 1 và |S| ≈0. Do đó, từ (3.156) ta thấy nếu như ( )L jω lớn ở trong một dải tần số rộng, thì nhiễu đo n cũng sẽ truyền qua hệ thống trong vùng tần số đó, nghĩa là: y= SdGSdTnTr i ++− ≈ (r - n) vì rằng nhiễu đo n tập trung chủ yếu ở vùng tần số cao. Hơn nữa, nếu độ lợi vòng lớn ở ngoài vùng băng thông của G, nghĩa là ( )L jω >>1 trong khi ( )G jω <<1, thì có thể làm cho tín hiệu điều khiển quá lớn, gây bão hòa ở cơ cấu chấp hành. Điều này có thể được lý giải từ (3.157) như sau: u= ≈−−− iTddnrSK )(ˆ iddnrG −−− )(|| 1 Phương trình trên cho thấy nhiễu tải và nhiễu đo sẽ được khuyếch đại lên khi mà vùng tần số mà nó tập trung vượt ra ngoài phạm vi băng thông của G, vì đối với dải tần số mà ( )G jω <<1 thì ( )ωjG 1 >>1. Tương tự, biên độ của bộ điều khiển, | Kˆ |, không được quá lớn trong vùng tần số mà độ lợi vòng nhỏ nhằm tránh làm bão hòa cơ cấu chấp hành. Vì lẽ khi độ lợi vòng nhỏ ( ( )L jω <<1), thì u= ii dTdnrSK −−− )(ˆ = ˆ ( )K r n d− − Do đó, một điều cần lưu ý khi thiết kế là | Kˆ | không được lớn quá khi độ lợi vòng nhỏ. Từ những điều trình bày ở trên, ta tổng kết lại các ý tưởng thiết kế sau đây: - Để đảm bảo mục tiêu chất lượng trong một vùng tần số nào đó, cụ thể là vùng tần số thấp (0, lω ), hệ thống cần phải có: 1|ˆ| >>KG , |ˆ| K >>1 - Để đảm bảo tính bền vững và có khả năng triệt nhiễu đo tốt trong một vùng tần số nào đó, cụ thể là vùng tần số cao ( ∞,hω ),hệ thống cần phải có : 1|ˆ| <<KG , ≤|ˆ| K M Chương 3 : Điều khiển bền vững Trang 45 trong đó M có trị số không quá lớn. Những ý tưởng thiết kế này được minh họa trong hình 3.18. Những tần số hl ωω , được xác định tùy thuộc vào từng ứng dụng cụ thể, và những thông tin về đặc tính của nhiễu tải, nhiễu đo, sai lệch mô hình. Hình 3.18: Độ lợi vòng và các ràng buộc tần số thấp và tần số cao. Những điều phân tích trên đây là cơ sở cho một kỹ thuật thiết kế điều khiển: đó là nắn dạng vòng (loop shaping). Mục tiêu nắn dạng vòng là tìm ra một bộ điều khiển sao cho độ lợi vòng |L| tránh được các vùng giới hạn (xem hình 3.18) chỉ định bởi các điều kiện về chất lượng và bền vững. 3.3.3 Thiết kế bền vững H∞ 3.3.3.1 Mô tả không gian H∞ và RH∞ Không gian vector Hardy có chuẩn vô cùng, ký hiệu là H∞, là không gian các hàm phức G(s) của biến phức s (s ∈C) mà trong nửa hở mặt phẳng phức bên phải (miền có phần thực của biến s lớn hơn 0) thỏa mãn: - là hàm giải tích (phân tích được thành chuỗi lũy thừa), và - bị chặn, tức tồn tại giá trị M dương nào đó để ( )s M≤G có phần thực dương. lω hω c ω L logω PGS.TS Nguyễn Thị Phương Hà Trang 46 Tập con đặc biệt của H∞ mà trong điều khiển bền vững rất được quan tâm là tập hợp gồm các hàm G(s) thực - hữu tỷ (real-rational) thuộc H∞, tức là các hàm hữu tỷ phức G(s)∈ H∞ với các hệ số là những số thực dạng 0 1 1 ( ) 1 m m n n b b s b s s a s a s + + += + + +G " " trong đó ai,bj ∈ R, ký hiệu là RH∞. Trong lý thuyết hàm phức, người ta chỉ ra được rằng: một hàm thực – hữu tỷ G(s) bất kỳ sẽ thuộc RH∞ khi và chỉ khi - lim ( ) s s→∞ < ∞G , hay ( )∞G bị chặn (khi m≤n),được gọi là hàm hợp thức và - G(s) không có cực trên nửa kín mặt phẳng phức bên phải. Nói cách khác G(s) không có điểm cực với Re(s) ≥ 0.Một hàm G(s) có tính chất như vậy gọi là hàm bền. Nếu hàm truyền hợp thức G(s) không những ở nửa hở bên phải mặt phẳng phức bị chặn khi s ∞→ mà còn thỏa mãn (khi m<n) 0|)(|lim =∞→ sGs Chuẩn H∞ của một hệ thống

Các file đính kèm theo tài liệu này:

giao_trinh_ly_thuyet_dieu_khien_hien_dai_chuong_3_dieu_khien.pdf