Đề tài Về một phương pháp tổng hợp hệ điều khiển mờ dùng mạng nơron ứng dụng trong công nghiệp

CHƯƠNG 1: TỔNG QUAN . 1

1.1. Đặt vấn đề . 1

1.2. Mục tiêu và nhiệm vụ nghiên cứu . 9

 

CHƯƠNG 2: ĐIỀU KHIỂN ỔN ĐỊNH CÁC HỆ THỐNG KHẢ TUYẾN

TÍNH HÓA PHẢN HỒI BẰNG PHƢƠNG PHÁP THAY

THẾ ƯỚC LƯỢNG HÀM TRẠNG THÁI . 11

2.1. Giới thiệu chung . 11

2.1.1. Đặt vấn đề . 11

2.1.2. Biểu diễn các hệ thống khả tuyến tính hóa phản hồi . 12

2.1.3. Vấn đề trong điều khiển ổn định các hệ khả tuyến tính hóa

phản hồi trạng thái . 15

2.2. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi

trạng thái bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái . 21

2.2.1. Cơ sở toán học của phương pháp . 21

2.2.2. Tính bền vững của hệ vòng kín trong phương pháp . 31

2.3. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi vào-

ra bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái . 44

2.3.1. Bài toán điều khiển và cơ sở toán học . 44

2.3.2. Điều khiển ổn định bằng phương pháp thay thế ước lượng hàm

trạng thái. 47

2.3.3. Tính bền vững của hệ vòng kín đối với thành phần không rõ

trong phương trình động học . 51

2.4. Tổng hợp thiết kế bộ điều khiển tĩnh ổn định . 55

2.5. Kết luận . 56

CHƯƠNG 3: PHƢƠNG PHÁP THAY THẾ ƯỚC LƯỢNG HÀM

TRẠNG THÁI DÙNG BỘ XẤP XỈ MỜ NƠRON . 58

3.1. Đặt vấn đề và cơ sở lý thuyết xây dựng phương pháp . 58

3.1.1. Giới thiệu chung. 58

3.1.2. Bộ xấp xỉ vạn năng. 59

3.1.3. Cơ sở toán học xây dựng các bộ xấp xỉ dùng hệ mờ và mạng

nơron . 60

3.2. Thay thế ước lượng hàm trạng thái . 69

3.2.1. Cơ sở toán học của phương pháp . 69

3.2.2. Xác định tham số bộ điều khiển . 74

3.2.3. Mô phỏng điều khiển tay rôbốt . 79

3.3. Thay thế ước lượng hàm trạng thái mở rộng trong điều khiển ổn

định các hệ khả tuyến tính hóa phản hồi chặt. 84

3.3.1. Phương pháp cuốn chiếu . 84

3.3.2. Phương pháp thay thế ước lượng hàm trạng thái khi hệ chứa

các thành phần không rõ . 85

3.4. Tổng hợp và kết luận . 93

CHƯƠNG 4: ĐIỀU KHIỂN THÍCH NGHI TRỰC TIẾP DÙNG HỆ MỜ

NƠRON TRONG PHƯƠNG PHÁP THAY THẾ ƢỚC

LƯỢNG HÀM TRẠNG THÁI . 96

4.1. Giới thiệu chung . 96

4.1.1. Sự cần thiết phát triển bộ điều khiển thích nghi . 96

4.1.2. Vấn đề và cơ sở toán học xây dựng bộ điều khiển thích nghi

trực tiếp . 98

4.2. Điều khiển mờ nơron thích nghi trực tiếp các hệ thống khả tuyến

tính hóa phản hồi . 101

4.2.1. Hệ khả tuyến tính hóa phản hồi trạng thái . 101

4.2.2. Hệ khả tuyến tính hóa phản hồi vào-ra . 108

4.3. Tổng hợp thiết kế bộ điều khiển thích nghi trực tiếp ổn định . 110

4.4. Mô hình điều khiển thích nghi trên hệ thống điều khiển công

nghiệp . 111

4.4.1. Giới thiệu chung. 111

4.4.2. Mô hình phần mềm ứng dụng và khả năng áp dụng trên hệ

thống điều khiển công nghiệp . 113

4.5. Kết luận . 121

KẾT LUẬN VÀ KIẾN NGHỊ . 122

CÁC CÔNG TRÌNH CÔNG BỐ LIÊN QUAN CỦA TÁC GIẢ. 124

TÀI LIỆU THAM KHẢO . 125

PHỤ LỤC

5.1. Một số thuật ngữ tiếng Anh . 134

5.2. Bổ đề 1 trang 23. 136

5.3. Bổ đề 3 trang 40 và kết quả (2-64) . 139

5.4. Tuyến tính hóa phƣơng trình động lực học (3-23) . 143

5.5. Chương trình mô phỏng ví dụ điều khiển tay rôbốt trang 79 . 145

5.6. Bổ đề 6 trang 100. 152

5.7. Một số môđun phần mềm trong mô hình phần mềm ứng dụng . 155

 

doc205 trang | Chia sẻ: lethao | Lượt xem: 2079 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Đề tài Về một phương pháp tổng hợp hệ điều khiển mờ dùng mạng nơron ứng dụng trong công nghiệp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
2 ), ký hiệu là oi, j với i = 1.. p -1, j = 1..Li và đầu ra của mạng yr với r = 1..m là:giải mờ COG và được dùng làm bộ xấp xỉ mờ F (x, θ) với θ = éë ûù . c1,K, c p ì1..Li 1 £ i < p î1..m i = p , k =í ì1..Li 1 £ i < p j =í - 65 - ï è k =1 ø æ Li -1 î è k =1 ø  ï x + q i = 1  ì n 1 1 ïs =1 î s =1  o + q p  p = 1 p ³ 2 Lớp đầu vào (Lớp 0)  Lớp ẩn (Lớp 1)  Lớp đầu ra (Lớp 2) x1 x2 xn  1 2 n  1 1 w11n w1L1 w1L2 w1Ln  1 L q11 q L1  2 w12L wm2 1 2  q12 1 m qm2  y1 ym n đầu vào L nút ẩn s i : Hàm kích hoạt nút mạng m đầu ra thứ i trong lớp ẩn 1 Hình 7 : Mạng nơron 2 lớp Hình 7 biểu diễn mạng nơron truyền thẳng 2 lớp ( p = 2 ) có n đầu vào, m đầu ra tuyến tính và L nút ẩn. Mô hình của mạng được viết như sau: yi =  L j =1  n 2 1 è k =1 ø  (3-3) với i = 1..m . Trường hợp mạng chỉ có một đầu ra ( m = 1) với hàm kích hoạt xíchma sig( x) =  1 1 + e -2 x  trong lớp ẩn thì có thể dùng mạng làm bộ xấp xỉ vạn n ì 1 æ n 1 1 ö oij = í ïs i i oi -1 + q i ö 1 < i £ p - 1 å ï j ç w jk k j ÷ ï å wrs s r x + q , yr = í L ï å wrs s r ï p -1 p p -1 w11 w12 w11 wmL å æ ö wij j ç å w jk k j1 ÷ + qi2 năng các hàm liên tục vô hướng f (x) :  ®  hay: - 66 - F (x, θ) = y1 =  L j =1  n è k =1 ø  1  (3-4) v Bộ xấp xỉ mờ nơron Có nhiều kết quả nghiên cứu nhằm kết hợp được các ưu điểm của hệ mờ và mạng nơron trong xây dựng cấu trúc bộ xấp xỉ ([86]). Một trong những kết quả nghiên cứu khả quan là hệ suy diễn mờ dựa trên mạng thích nghi ANFIS (Adaptive-Network-based Fuzzy Inference System) do Jang đề xuất ([64], [65], [66], [86]). Đây là một cấu trúc mạng nơron lai dựa trên mô hình hệ mờ Takagi- Sugeno có luật mờ được cho dưới dạng mô tả mờ sau: Ri : ( A11i ´ A22i ´K´ Anni ) Þ gi (x) Mạng ANFIS sử dụng hàm tuyến tính gi (x) =  n j =1 vào hình chuông và đã được chứng minh là một bộ xấp xỉ vạn năng các hàm phi tuyến. v Biểu diễn toán học các bộ xấp xỉ tuyến tính và phi tuyến đối với tham số Các bộ xấp xỉ (mờ nơron) có thể biểu diễn dưới dạng tuyến tính hoặc phi tuyến đối với tham số. Bộ xấp xỉ được gọi là tuyến tính đối với tham số nếu biểu diễn được dưới dạng: T ¶F (x, θ) ¶θ  = φT (x)  (3-5) trong đó φ(x) là véctơ hàm của x và θ là véctơ tham số đầu vào biểu diễn tuyến tính trong hàm số của bộ xấp xỉ. Ví dụ bộ xấp xỉ mờ nơron tuyến tính đối với tham số như hệ mờ theo công thức (3-2) và mạng nơron RBN (Radial Basis NN). Trường hợp bộ xấp xỉ dùng hệ mờ theo (3-2) nếu θ = éëc1,K, c p ùû  T  thìå æ ö w12j sig ç å w jk k j1 ÷ + q12 x + q j j j å aij x j , hàm liên thuộc đầu F (x, θ) = θ φ(x) hay - 67 - ¶F (x, θ) ¶θ  = φT (x) = éëj1(x),K,j p (x)ùû với ji (x) =  ò mCi (x, z)dz z p å ò mCi (x, z)dz i =1 z  nên có thể T Trường hợp  ¶F (x, θ ) ¶θ  = φT (x, θ) hay ö(x, è) có chứa véctơ tham số θ như trường hợp bộ xấp xỉ dựa trên mạng nơron đa lớp biểu diễn trong (3-4), bộ xấp xỉ được gọi là phi tuyến đối với tham số do F (x, θ) là hàm phi tuyến của tham số θ : T  (3-6) v Tuyến tính hóa các bộ xấp xỉ Các bộ xấp xỉ phi tuyến đối với tham số thường đơn giản hơn (về kích cỡ và số lượng tham số) so với các bộ xấp xỉ tuyến tính để đạt được độ chính xác xấp xỉ tương đương nhau. Đối với luật điều khiển phản hồi tĩnh trong phương pháp thay thế ước lượng hàm trạng thái, vấn đề sử dụng bộ xấp xỉ tuyến tính hay phi tuyến đối với tham số không được đặt ra do chỉ cần bộ xấp xỉ đảm bảo sai số cần thiết trong miền hợp lệ. Tuy nhiên để chỉnh định tham số của bộ xấp xỉ trong luật điều khiển phản hồi động, việc sử dụng bộ xấp xỉ tuyến tính hay phi tuyến đối với tham số có ý nghĩa quan trọng. Mặc dù các kết quả nghiên cứu của luận án trong chương sau cho phép áp dụng một trong hai dạng bộ xấp xỉ, tuy nhiên cũng có thể tuyến tính hóa bộ xấp xỉ phi tuyến đối với tham số tùy theo mỗi ứng dụng. Vấn đề tuyến tính hóa bộ xấp xỉ được trình bày trong [57]. Kết quả này cho biết nếu bộ xấp xỉ là liên tục Lipschitz đối với tham số chỉnh định (không kể là biểu diễn được ở dạng tuyến tính hay phi tuyến) thì đều có thể viết như sau: D F (x, θ) = F (x, θ* ) - F (x, θ) = - ¶F (x, θ) ¶θ  Δθ + d (x, θ, θ*)  (3-7)biểu diễn F (x, θ) = θ φ(x) là dạng tuyến tính đối với tham số. F (x, θ) = θ φ(x, θ) . - 68 - æ ö ÷ x tối ưu, Δθ = θ - θ* , d (x, θ, θ* ) = -s ( Δθ ) với  lim Δθ ®0 s ( Δθ ) Δθ  = 0 . Ngoài ra d (x, θ, θ*) bị chặn bởi d (x, θ, θ* ) £ L Δθ 2 với L là hằng số Lipschitz, do vậy nếu tìm được luật chỉnh định θ để giảm được Δθ  2  thì θ có xu hướng tiến về θ* và F (x, θ) sẽ tiến đến F (x, θ* ) . Như vậy nếu Δθ  2  bị chặn thì sai số xấp xỉ cũng bị chặn. Đây chính là cơ sở để xây dựng luật chỉnh định tham số trong chương tiếp theo. v Tối ƣu hóa các bộ xấp xỉ mờ nơron Vấn đề tối ưu hóa các bộ xấp xỉ mờ nơron nói chung là tìm cách tối thiểu 2 xÎWx véctơ của p tham số chỉnh định được của hệ mờ hoặc mạng nơron hay cần tìm tham số chỉnh định tối ưu θ* Î Wθ từ số liệu đo để θ* = arg min J (θ) . θÎWθ Như vậy để sai số xấp xỉ nhỏ theo yêu cầu, số liệu đo phải đủ lớn và bao phủ được toàn bộ miền hợp lệ W x . Tuy nhiên trong thực tế đa phần không thể lựa chọn được cách phân bố số liệu đo trong W x cũng như không thể thay đổi số liệu đo để cải thiện độ chính xác mà chỉ có thể sử dụng trực tiếp số lượng hữu hạn các số liệu đo có được. Đây thực sự là vấn đề phức tạp và trong nhiều trường hợp phương pháp tối ưu hóa không đảm bảo đáp ứng được yêu cầu về sai số xấp xỉ. Thông thường để tìm véctơ tham số chỉnh định tối ưu θ* Î Wθ từ các số liệu đo có được có thể áp dụng thuật toán bình phương nhỏ nhất (Least Squares) tuyến tính (batch, recursive) hoặc phi tuyến (gradient, conjugate gradient, line search, Levenberg-Marquardt) được trình bày trong các tài liệu [57], [58], [66], [68], [76], [86], [91].θÎWθ ç xÎW trong đó θ là tham số hiện thời, θ* = arg min ç sup F (x, θ) - f (x) ÷ là tham số è ø hóa hàm giá trị (cost function) J (θ) = sup f (x) - F (x, θ) với θ Î Wθ Í Â p là - 69 - 3.2.  Thay thế ƣớc lƣợng hàm trạng thái 3.2.1. Cơ sở toán học của phương pháp v Trƣờng hợp hệ khả tuyến tính hóa phản hồi trạng thái Trước tiên xét trường hợp hệ khả tuyến tính hóa phản hồi trạng thái. Khi đó phương pháp thay thế ước lượng hàm trạng thái trong luận án sử dụng bộ xấp xỉ vạn năng để thay thế thành phần chưa biết trong phương trình trạng thái của hệ phi tuyến sao cho sai số xấp xỉ x& n của hệ thỏa mãn yêu cầu Ddxn £ W trong miền hợp lệ của x Î Wx , u Î Wu và với W > 0 cho trước để E bị chặn theo (2-26) hay E £ max ( E0 , E¥ ) với E0 = E(0) và E¥ =  W h  . Xuất phát từ thực tế trong nhiều trường hợp dạng của f (x) , g(x) đã biết (ví dụ như f (x) = f1(x) + f2 (x) , g(x) = cg1(x) với f1(x) , g1(x) là các hàm liên tục đã biết; f2 (x) và c là hàm số và hằng số chưa biết) hoặc có thể ước lượng được nên phương pháp xây dựng theo hướng thay thế f (x) , g(x) tương ứng bởi các hàm liên tục %f (x) và g%(x) > 0 bị chặn đã biết và tìm cách bù sai lệch do phép thay thế gây nên để kết quả cuối cùng sai số E bị chặn theo (2-26). Giả sử phép thay thế trên dẫn đến điều kiện xấp xỉ không thỏa mãn hay: Ddxn (x, u%) = %f (x) - f (x) + ( g%(x) - g(x) ) u% £ W%  (3-8) với W% > W trong miền x Î Wx , u% Î Wu và u% là luật điều khiển phản hồi theo (2-28). Khi đó như đã phân tích trong mục 2.2.2 trang 31, nếu ta xác định được n +1 u% Î Wu thì có thể bù được ảnh hưởng của sai số xấp xỉ D dxn bằng cách sử dụng luật điều khiển phản hồi u = u% + uc theo (2-39) hoặc (2-42) để E bị chặn theo (2-26).hàm Φ(x, u%) :  ® Â+ thỏa mãn điều kiện Ddxn £ F(x, u%) với "x Î Wx , - 70 - Điều này cũng có nghĩa là nếu xấp xỉ được D dxn trong miền hợp lệ của x và n+1 p số chỉnh định được của bộ xấp xỉ và tìm được véctơ tham số θ% thỏa mãn: FD (x, u%, θ%) - Ddxn (x, u%) £ WD  (3-9) với WD > 0 thì vấn đề sai số xấp xỉ x& n nêu trên cũng sẽ được giải quyết bằng cách thay thế Φ(x, u%) bằng FD (x, u%, θ%) trong luật điều khiển phản hồi (2-39) hoặc (2-42) hay với thành phần bù: uc = - FD (x, u%, θ%) g%(x)  sign(E ) hoặc uc = - FD (x, u%, θ%) g%(x)  bsig(k , E )  (3-10) có thể giảm trừ được ảnh hưởng của sai số trong phép thay thế như đã phân tích trong Chương 2. Như vậy vấn đề xấp xỉ x& n với sai số W lại trở thành vấn đề xấp xỉ D dxn với sai số WD trong phương pháp. Do x& n có thể tính được từ các số liệu đo nên với giả thiết số liệu đo đầy đủ, D dxn theo công thức (3-8) luôn xấp xỉ được bởi bộ xấp xỉ vạn năng FD (x, u%, θ) các hàm liên tục vô hướng thuộc lớp hàm Zc (n + 1, Wx,u ) trong miền đóng Wx,u Ì Ân +1 với sai số bất kỳ. Lưu ý là D dxn còn có thể viết như sau: Ddxn (x, u) = %(x) + g(x)u - xn  (3-11) Tuy nhiên do FD (x, u%, θ%) không liên tục nên với thành phần bù (3-10), tín hiệu điều khiển cũng không liên tục. Để giải quyết vấn đề này tác giả đề xuất sử dụng thành phần bù liên tục có dạng: uc = - FD (x, u%, θ%) r g%(x)  bsig (k , EFD (x, u%, θ%))  (3-12) với 0 0 và u% định nghĩa như (2-28) khi đó tín hiệu điều khiển phản hồi được tính như sau:u% bởi bộ xấp xỉ vạn năng FD (x, u%, θ) :  ´  ®  với θ Πp là véctơ tham % f % % & - 71 - u = u% + uc æ T 1 ö (3-13) è r ø Phát biểu của Định lý 3 dưới đây giải quyết vấn đề còn tồn tại của phương pháp trong trường hợp g%(x) > 0 và %f (x) thay thế không thỏa mãn điều kiện (2-34) và được gọi là Định lý 1 mở rộng trong trường hợp điều kiện (2-34) không được đáp ứng. Định lý 3 : (Định lý 1 mở rộng) Điều kiện để phương trình động học hệ sai số (2-20) với luật điều khiển phản hồi tĩnh (3-13) có nghiệm bị chặn tới hạn đều n+1 p sai số WD bị chặn bởi: 0 < WD £ W 2 -  2h r  μ E _ max (r ,k )  (3-14) trong miền hợp lệ của x Î Wx và u% Î Wu , trong đó μ E _ max (r ,k ) tính theo công thức (2-63) và W là sai số thiết kế theo (2-34). v Chứng minh Để chứng minh Định lý 3 ta cần chỉ ra rằng bằng luật điều khiển phản hồi (3-13) chứa đại lượng bù (3-12) thì đạo hàm của hàm Lyapunov cũng thỏa mãn (2-23). Ký hiệu FD = FD (x, u, θ) và FD = FD (x, u, è) thì từ phương trình động học của hệ sai số E = -h E + g (x)uc -Ddxn (x, u) suy ra: V = -h E 2 + Eg(x)uc - EDdxn (x, u) £ -h E 2 - £ -h E 2 + 1 r 1 r EFD bsig(k , EFD ) + E Ddxn E ( r Ddxn - FD sign(E ) bsig(k , EF%D ))FD D (x, u%, θ%)) ÷ (x, u%, θ%) bsig (k , EF = g%-1(x) ç r(n) - η e - %f (x) - theo (2-26) là bộ xấp xỉ vạn năng FD (x, u%, θ%) :  ´  ®  xấp xỉ (3-11) với % % % % & % % & % % % % - 72 - Do sign(E)sign(FD ) = sign(EFD ) và  Ddxn - FD £ FD - Ddxn £ WD hay Ddxn £ FD + WD nên: 1 r = -h E 2 + E WD + 1 r EFD ( r - sign( EFD ) bsig(k , EFD )) = -hV + - 2h  1 2h  1 (3-15) £ -hV +  +  μ E _ max (r ,k ) với μ E (r ,k , E ) được định nghĩa như (2-61) và μ E (r ,k , E ) £ μ E _ max (r ,k ) với mọi r thỏa mãn 0 0 và E Î Â theo Bổ đề 3 trang 40. Rõ ràng để E £ max ( E0 , E¥ )  như (2-26), cần có V& £ -hV +  2 2h  như (2-23) nên từ (3-15) suy ra sai số của bộ xấp xỉ vạn năng FD - Ddxn £ WD cũng như k phải đáp ứng điều kiện: 2  2h r  μ E _ max (r ,k ) , μ E _ max (r ,k ) <  rW 2 2h nên Định lý 3 được chứng minh. Lưu ý trường hợp r = 1, ta có μ E _ max (1,k ) = μ E (1,k , ±  1.2785 k  ) »  0.5569 k nên điều kiện trên trở thành: 0 < WD £ W 2 -  1.1138h k  , k >  1.1138h W 2 ▲% % % % V& £ -h E 2 + E WD D ( r - sign( E )sign( F%D D )) E F% ) bsig(k , EF% + % % % % WD2 (WD -h E )2 + r μ E (k , EF%D ) WD 1 2h r W 0 < WD £ W - - 73 - v Trƣờng hợp hệ khả tuyến tính hóa phản hồi vào-ra Tương tự như trên, xét trường hợp hệ là khả tuyến tính hóa phản hồi vào-ra dạng (2-4) có hệ con phi tuyến là ISS và thỏa mãn Giả thiết 2. Nếu %f (x, q) , g%(x, q) > 0 là các hàm số thay thế liên tục bị chặn cho trước không thỏa mãn điều kiện (2-85) nhưng thỏa mãn: Ddxn (x, q, u%) = %f (x, q) - f (x, q) + ( g%(x, q) - g(x, q) ) u% £ W% với W% > W trong miền (x, q) Î Wx,q Ì Ân +d , u Î Wu và u% là luật điều khiển phản hồi theo (2-84) thì có thể sử dụng thành phần bù: uc = - FD (x, q, u%, θ%) r g%(x, q)  bsig (k , EFD (x, q, u%, θ%))  (3-16) với 0 0 để với luật điều khiển phản hồi tĩnh u = u% + uc hay: u = u% + uc =  T 1 r FD (x, q, u%, θ%) bsig (k , EFD (x, q, u%, θ%)) g%(x, q)  (3-17) ta có x , q bị chặn đều theo Định lý 6.1 ([57]) tương tự như đã trình bày ở trên. Lưu ý là trong trường hợp này Ddxn (x, q, u) được xấp xỉ bởi bộ xấp xỉ vạn n+d +1 p Zc (n + d + 1, Wx,q,u ) trong miền đóng Wx,q,u Î Ân +d +1 với θ Πp là véctơ tham số chỉnh định được và θ% là véctơ tham số cần tìm thỏa mãn: FD (x, q, u%, θ%) - Ddxn (x, q, u%) £ WD với WD là sai số cần đạt thỏa mãn (3-14).  (3-18)r(n) - η e - %f (x, q) - năng FD (x, q, u, θ) :  ´  ®  các hàm liên tục vô hướng thuộc lớp hàm - 74 - 3.2.2. Xác định tham số bộ điều khiển Các kết quả trong phần trước đã đề cập đến việc chọn tham số điều khiển trong một số trường hợp tuy nhiên từ trước đến giờ ta luôn giả thiết rằng từ các số liệu đo và dữ liệu đã biết về hệ thống đủ để thiết kế được bộ xấp xỉ đảm bảo sai số xấp xỉ theo yêu cầu trong miền hợp lệ của x Î Wx Ì Ân và u Î Wu . Tuy nhiên trong thực tế miền hợp lệ W x , Wu ở đây thực chất là miền mà bộ xấp xỉ tìm được phải đảm bảo được sai số xấp xỉ theo yêu cầu và do vậy cần thiết kế bộ điều khiển sao cho x và u không vượt ra ngoài W x và Wu . Nhằm xác định tham số điều khiển và các điều kiện cần trong phương pháp đảm bảo các yêu cầu bị chặn trong miền hợp lệ của không gian trạng thái và tín hiệu điều khiển, sau đây trình bày phương pháp tính toán. Để đơn giản các phương pháp chỉ phân tích áp dụng cho trường hợp hệ khả tuyến tính hóa phản hồi trạng thái. Trường hợp hệ khả tuyến tính hóa phản hồi vào-ra có thể áp dụng các bước tính toán tương tự. v Xác định tham số điều khiển để quỹ đạo trạng thái bị chặn Giả thiết rằng bằng phương pháp thay thế ước lượng như trên, luật điều khiển phản hồi (2-28) đảm bảo sai số Ddxn £ W chỉ trong miền x Î Wx , u Î Wu và Wx = {x Î Ân : x £ xM , xM > 0} là siêu cầu chứa gốc tọa độ. Bài toán đặt ra T kiện giới hạn khác để quỹ đạo trạng thái của hệ luôn nằm trong W x hay x £ xM , xM > 0 cho trước với mọi t ³ 0 . Khi đó cần xác định được W E sao cho khi E Î W E thì x Î Wx . Định lý 1 (trang 29) cho biết nếu điều kiện sai số được đảm bảo trong miền hợp lệ của x Î Wx , u Î Wu thì hệ sai số có nghiệm bị chặn bởi (2-26). Như vậy nếu định nghĩa W E = {E Î Â : E £ max ( E0 , E¥ )} thì W E chính là miền chứalà cần xác định tham số điều khiển [ ]1 1 2 1, , , nk k k kh h h-= + +η K và các điều - 75 - toàn bộ quỹ đạo của hệ sai số E hay E Î W E với "t ³ 0 . Do E luôn nằm trong W E nên không cần thiết phải có V& £ 0 khi E không nằm trong W E hay khi E Î Â - W E . Mặt khác do hệ sai số được lập thỏa mãn Giả thiết 1 (Bổ đề 1 trang 23) nên từ kết quả chứng minh trong mục 5.2 trang 136 phần Phụ lục, suy ra x bị chặn bởi: n-1 è i =1 ø với y d E (t, E ) = p1e  -p2t  t 0 thỏa mãn eAkt £ p1e-p2t . Nếu chọn E0 = 0 thì từ (2-26) suy ra E £ E¥ và: t 0  p1 W p1 W p2 h p2 h W è i =1 Do vậy để x £ xM cần thiết chọn các tham số điều khiển thỏa mãn: h ³  n -1 p2 + p1 ç1 + å ki è i =1 p2  ö ÷ ø  W ( xM - rM )  (3-19) v Xác định tham số điều khiển để tín hiệu đầu vào điều khiển bị chặn Sau đây xét bài toán điều khiển với điều kiện đầu vào (3-13) cần giữ trong miền Wu = {u Π: u £ uM }, uM > 0 hay u £ uM cần đảm bảo với "t ³ 0 . Ngoài ra cũng giả thiết rằng 0 < g L £ g%(x) .æ ö x £ rM + E + ç1 + å ki ÷ y d E (t, E ) d E (0) + ò p1e-p2 (t -t ) E (t ) dt và p1 , p2 được chọn ( ) 1 - e - p2t £ æ ö p1 W n -1 x £ rM + + ç1 + å ki ÷ æ - 76 - Dựa theo phương pháp tính toán trình bày trong [48] áp dụng trong trường hợp này, bổ đề sau cho biết điều kiện và cũng là cách xác định tham số điều khiển trong phương pháp thay thế ước lượng hàm trạng thái để luật điều khiển phản hồi trong Định lý 3 bị chặn. Bổ đề 5 : (Tính bị chặn của luật điều khiển) Luật điều khiển phản hồi (3-13) đảm bảo u Î Wu với Wu = {u Π: u £ uM } nếu uM > W% + WD r gL  và điều kiện (3-22) được thỏa mãn. v Chứng minh Nếu %f (x) , g%(x) là các hàm liên tục Lipschitz cục bộ thì có thể xác định được các hằng số K f , K g để: %(x) - %(x) £ K f x - x g%(x) - g%(x%) £ K g x - x% với "x, x% Î Wx . Mặt khác từ (3-13) và do x = e + r nên có thể phân tích: u =  T  1 r  FD (x, u, θ) bsig (k , EFD (x, u, θ)) g%(x) =  T  g%(r)  F% bsig(k , EF% ) r g%(r)  g%(r) g%(e + r) Với giả thiết 0 < g L £ g%(x) tiếp tục biến đổi được như sau:f f % % r(n) - η e - %f (x) - % % % % r(n) - η e - %f (e + r) + %f (r) - %f (r) - D D - 77 - ç g(r)  T + + + D D g(r) g(r) r g(r)  ö ÷ ø ´ 1 - g%(e + r) - g%(r) g%(e + r) ç g(r) g(r) g(r) r g(r) ÷ g(e + r) è do FD - Ddxn £ FD - Ddxn £ WD Þ FD £ W + WD và W > W là sai số xấp xỉ thực x& n do phép thay thế gây nên theo (3-8). Ø Như vậy để u £ uM cần thiết: r(n) - %f (r) g%(r)  £  uM 1 + K g  e g L  - ( η + K f  e L  - W% + WD r g L  = u  (3-20) Từ  (2-26)  ta  có  T  nên e(t) £ K max ( E0 , E¥ ) = eM , eM > 0 . Khi đó định nghĩa: M =  uM  e g L  - ( η + K f  L L %  (3-21) thì M £ u và nếu M > 0 thì điều kiện (3-20) luôn thỏa mãn. Để M > 0 cần có: æ e öæ è g L ø è  )  + Û K g ( η + K f  ) 2  è L ø è r gæ r(n) - %f (r) u £ ç è %(r) - %(e + r) F bsig(k , EF ) η e ÷ % % %% æ r(n) - %(r) K f e ηe FD öæ K g e ö £ ç + + + ÷ç1 + ÷ è ø è ø ( ) æ r(n) - %(r) e W + WD ö æ e ö g L ÷ø ç ÷è £ ç + η + K f + ÷ ç1 + K g g L L ø g(r) r g % %% % % % % % % % ) g E = k e £ max ( E0 , E¥ ) 1 + K g M ) egM - Wr+gWD ( uM > ç1 + K g M ÷ ç η + K f eM W + WD ö gL L ÷ø W% + WD ö eM W% + WD æ eM ö æ ç g ÷ ÷ g + ç η + K f + K g + - uM < 0 - 78 - là dạng bất phương trình bậc hai Az2 + Bz + C 0 , B = η + K f + Kg W% + WD r gL  r gL g L  > 0 , C = - uM và z = > 0 . Gọi z1 < z2 là hai nghiệm của đa thức bậc hai nêu trên thì bất phương trình có nghiệm z1 < z < z2 . Do nếu C ³ 0 thì đa thức bậc hai trên có hai nghiệm thực không dương nên cần thiết C W% + WD r gL  để đa thức có một nghiệm dương. Khi đó: 0 < z =  K gL  max ( E0 , E¥ ) < z2 =  -B + B2 - 4 AC 2 A và như vậy để M > 0 cần chọn: max ( E0 , E¥ ) <  - B + B2 - 4 AC g L 2 A K  và  r(n) - %f (r) g%(r)  £ M  (3-22) để tín hiệu điều khiển luôn nằm trong Wu hay u £ uM . Kết quả trên chứng minh cho phát biểu của Bổ đề 5. Lưu ý là Bổ đề 5 không chỉ cho phép tính toán tham số của bộ điều khiển (nếu tồn tại) để tín hiệu điều khiển bị chặn trong Wu mà còn là cơ sở để kết luận có thể điều khiển bám theo tín hiệu mẫu cho trước với sai số thiết kế và các điều kiện ban đầu được chọn của hệ sai số hay không. ▲W + WD eM - 79 - 3.2.3. Mô phỏng điều khiển tay rôbốt Để minh họa sau đây là một ví dụ áp dụng phương pháp trong điều khiển tay rôbốt theo quỹ đạo định trước. Để đơn giản, xét mô hình đơn thanh nối (flexible single-link) có phương trình động lực học như sau ([50]): Iq&&1 + MgL sin q1 + k (q1 - q2 ) = 0 Jq2 - k (q1 - q2 ) = u  (3-23) với q1 , q2 tương ứng là vị trí góc quay của thanh nối và trục động cơ; I , J là mômen quán tính của thanh nối và trục động cơ; k là hệ số đàn hồi; g là gia tốc trọng trường; M là khối lượng thanh nối; L là khoảng cách từ trục tới trọng tâm của thanh nối và u là lực quay đầu vào của motor. Các số liệu cho trước 2 . Bài toán đặt ra là cần điều khiển vị trí góc quay q1 hay y = q1 theo quỹ đạo r định trước. Phương trình động lực học (3-23) và đầu ra có thể chuyển về dạng tuyến tính hóa phản hồi trạng thái sau (xem chi tiết trong mục 5.4 trang 143 phần Phụ lục): x1 = x2 x2 = x3 x3 = x4  x4 = a ( x2 - c) sin x1 - (a cos x1 + b + c ) x3 + bdu (3-24) y = x1 MgL k k 1 I I J J 2 Sau đây giả thiết rằng các trạng thái của hệ (3-24) đo được, trong khi f (x) , g(x) chưa biết đầy đủ. Ta cần điều khiển vị trí góc quay của thanh nối theo quỹ đạo định trước r(t ) = p 3  sin(0.5t) cos(0.1t) với trạng thái ban đầu x(0) = 0 .&& gồm: I = J = 0.04Nms /rad , k = 0.8Nm/rad , L = 0.1m , M = 6kg , g = 9.8m/s2 & & & & với a = , b = , c = , d = chính là dạng quen thuộc (2-6) với f (x) = a ( x2 - c) sin x1 - (a cos x1 + b + c ) x3 và g(x) = bd . - 80 - Để mô phỏng phương pháp đề xuất, sau đây thay thế các hàm trạng thái chưa biết bằng các hàm số %(x) = -a2c2 sin x1 - a2 (b2 + c2 ) x3 và g(x) = b2d2 với a2 = a , b2 = 0.9b , c2 = 1.1c , d2 = 1.3d . Phép thay thế trên dẫn đến sai số lớn trong điều khiển bám theo tín hiệu mẫu như kết quả mô phỏng trên Hình 8. Các đồ thị trên Hình 8 này, theo thứ tự biểu diễn đồ thị theo thời gian sai lệch của phép thay thế D f = %(x) - f (x) , D g = g (x) - g(x) ; tín hiệu đầu vào điều khiển u% (khi không có thành phần bù); tín hiệu mẫu r(t) và đáp ứng đầu ra. Để thiết kế thành phần bù trong phương pháp, mô phỏng sử dụng bộ xấp xỉ mờ nơron ANFIS với 5 đầu vào (bao gồm véctơ trạng thái x và đầu vào điều khiển u% ). Như vậy cùng với giả thiết số liệu đo là đầy đủ, bộ xấp xỉ mờ nơron ANFIS luôn xấp xỉ được D dxn với sai số nhỏ tùy ý. Tuy nhiên để kích cỡ bộ xấp xỉ không quá lớn và tốc độ mô phỏng nhanh hơn, ta có thể chấp nhận sai số xấp xỉ lớn hơn bằng cách mỗi đầu vào ANFIS chỉ sử dụng 2 hàm liên thuộc dạng hình chuông (hàm gbellmf trong MATLAB V6.5) để xấp xỉ Ddxn (x, u%) và sẽ chọn các tham số k và r để chất lượng điều khiển đáp ứng được yêu cầu thiết kế. Hình 9 và Hình 10 tương ứng biểu diễn kết quả mô phỏng điều khiển khi sử dụng thành phần bù là bộ xấp xỉ mờ nơron ANFIS đã luyện nêu trên trong luật điều khiển phản hồi tĩnh (3-13) với k = 1, r = 1.0 và k = 1, r = 0.8 . Tương tự như trường hợp mô phỏng không có thành phần bù, các đồ thị trong Hình 9 và Hình 10 theo thứ tự biểu diễn đồ thị thời gian của sai lệch do phép thay thế gây ra; tín hiệu đầu vào điều khiển u = u% + uc có chứa thành phần bù; tín hiệu mẫu r(t) và đáp ứng đầu ra trong mỗi trường hợp. Chất lượng điều khiển tốt hơn trong trường hợp r = 0.8 so với trường hợp r = 1.0 minh họa cho việc sử dụng hàm μ E _ max (r ,k ) để phân tích giới hạn bị chặn của hệ sai số trong phương pháp. Có thể tham khảo toàn bộ mã code chương trình mô phỏng viết trên Matlab V6.5 trong mục 5.4 trang 143 phần Phụ lục.f % f % - 81 - 300 200 100 0 -100 -200  ¬Df(x)  ¯Dg(x)  k =0 -300  0  5  10  15  20  25  30  35  40  45  50 t [s] 2 1.5 1 0.5 0 -0.5 -1 -1.5  k =0 -2  0  5  10  15  20  25  30  35  40  45  50 t [s] k =0 1 ¬Reference signal 0.8 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1 ¬Plant's output 0  5  10  15  20  25  30  35  40  45  50 t [s] Hình 8 : Mô phỏng trong trường hợp không sử dụng thành phần bù Df(x), Dg(x) u r, y - 82 - 300 200 100 0 -100 -200  ¬Df(x)  ¯Dg(x)  k = 1, r = 1.0 -300  0  5  10  15  20  25  30  35  40  45  50 t [s] 5 4 3 2 1 0 -1 -2  k = 1, r = 1.0 -3  0  5  10  15  20  25  30  35  40  45  50 t [s] k = 1, r = 1.0 1 ¬Reference signal 0.8 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1 ¬Plant's output 0  5  10  15  20  25  30  35  40  45  50 t [s] Hình 9 : Mô phỏng sử dụng thành phần bù tĩnh với  k = 1 và r = 1.0 Df(x), Dg(x) u r, y - 83 - 300 200 100 0 -100 -200  ¬Df(x)  ¯Dg(x)  k = 1, r = 0.8 -300  0  5  10  15  20  25  30  35  40  45  50 t [s] 7 6 5 4 3 2 1 0 -1 -2  k = 1, r = 0.8 -3  0  5  10  15  20  25  30  35  40  45  50 t [s] k = 1, r = 0.8 1 ¬Reference signal 0.8 0.6 ¬Plant's output 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1 0  5  10  15  20  25  30  35  40  45  50 t [s] Hình 10 : Mô phỏng sử dụng thành phần bù tĩnh với  k = 1 và r = 0.8 Df(x), Dg(x) u r, y - 84 - 3.3.  Thay thế ƣớc lƣợng hàm trạng thái mở rộng trong điều khiển ổn định các hệ khả tuyến tính hóa phản hồi chặt 3.3.1. Phương pháp cuốn chiếu Phương pháp thay thế ước lượng hàm trạng thái có thể áp dụng trong trường hợp hệ khả tuyến tính hóa phản hồi chặt (strict-feedback system) có phương trình động học và đầu ra ở dạng: ì x1 = f1( x1 ) + g1( x1 ) x2 í xn-1 = fn-1( x1,K, xn-1 ) + gn-1( x1,K, xn-1 ) xn ï n n n ïî y = x1  (3-25) trong đó xT = [ x1,K, xn ] là các trạng thái đo được của hệ; fi , gi ( i = 1..n ) là các hàm trơn liên tục bị chặn và gi ¹ 0 với "x Î Wx . Dạng biểu diễn phản hồi chặt có thể gặp trong phân tích phần lớn các hệ chuyển động hỗn loạn (chaotic

Các file đính kèm theo tài liệu này:

  • doc236..com.doc
Tài liệu liên quan