CHƯƠNG 1: TỔNG QUAN . 1
1.1. Đặt vấn đề . 1
1.2. Mục tiêu và nhiệm vụ nghiên cứu . 9
CHƯƠNG 2: ĐIỀU KHIỂN ỔN ĐỊNH CÁC HỆ THỐNG KHẢ TUYẾN
TÍNH HÓA PHẢN HỒI BẰNG PHƢƠNG PHÁP THAY
THẾ ƯỚC LƯỢNG HÀM TRẠNG THÁI . 11
2.1. Giới thiệu chung . 11
2.1.1. Đặt vấn đề . 11
2.1.2. Biểu diễn các hệ thống khả tuyến tính hóa phản hồi . 12
2.1.3. Vấn đề trong điều khiển ổn định các hệ khả tuyến tính hóa
phản hồi trạng thái . 15
2.2. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi
trạng thái bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái . 21
2.2.1. Cơ sở toán học của phương pháp . 21
2.2.2. Tính bền vững của hệ vòng kín trong phương pháp . 31
2.3. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi vào-
ra bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái . 44
2.3.1. Bài toán điều khiển và cơ sở toán học . 44
2.3.2. Điều khiển ổn định bằng phương pháp thay thế ước lượng hàm
trạng thái. 47
2.3.3. Tính bền vững của hệ vòng kín đối với thành phần không rõ
trong phương trình động học . 51
2.4. Tổng hợp thiết kế bộ điều khiển tĩnh ổn định . 55
2.5. Kết luận . 56
CHƯƠNG 3: PHƢƠNG PHÁP THAY THẾ ƯỚC LƯỢNG HÀM
TRẠNG THÁI DÙNG BỘ XẤP XỈ MỜ NƠRON . 58
3.1. Đặt vấn đề và cơ sở lý thuyết xây dựng phương pháp . 58
3.1.1. Giới thiệu chung. 58
3.1.2. Bộ xấp xỉ vạn năng. 59
3.1.3. Cơ sở toán học xây dựng các bộ xấp xỉ dùng hệ mờ và mạng
nơron . 60
3.2. Thay thế ước lượng hàm trạng thái . 69
3.2.1. Cơ sở toán học của phương pháp . 69
3.2.2. Xác định tham số bộ điều khiển . 74
3.2.3. Mô phỏng điều khiển tay rôbốt . 79
3.3. Thay thế ước lượng hàm trạng thái mở rộng trong điều khiển ổn
định các hệ khả tuyến tính hóa phản hồi chặt. 84
3.3.1. Phương pháp cuốn chiếu . 84
3.3.2. Phương pháp thay thế ước lượng hàm trạng thái khi hệ chứa
các thành phần không rõ . 85
3.4. Tổng hợp và kết luận . 93
CHƯƠNG 4: ĐIỀU KHIỂN THÍCH NGHI TRỰC TIẾP DÙNG HỆ MỜ
NƠRON TRONG PHƯƠNG PHÁP THAY THẾ ƢỚC
LƯỢNG HÀM TRẠNG THÁI . 96
4.1. Giới thiệu chung . 96
4.1.1. Sự cần thiết phát triển bộ điều khiển thích nghi . 96
4.1.2. Vấn đề và cơ sở toán học xây dựng bộ điều khiển thích nghi
trực tiếp . 98
4.2. Điều khiển mờ nơron thích nghi trực tiếp các hệ thống khả tuyến
tính hóa phản hồi . 101
4.2.1. Hệ khả tuyến tính hóa phản hồi trạng thái . 101
4.2.2. Hệ khả tuyến tính hóa phản hồi vào-ra . 108
4.3. Tổng hợp thiết kế bộ điều khiển thích nghi trực tiếp ổn định . 110
4.4. Mô hình điều khiển thích nghi trên hệ thống điều khiển công
nghiệp . 111
4.4.1. Giới thiệu chung. 111
4.4.2. Mô hình phần mềm ứng dụng và khả năng áp dụng trên hệ
thống điều khiển công nghiệp . 113
4.5. Kết luận . 121
KẾT LUẬN VÀ KIẾN NGHỊ . 122
CÁC CÔNG TRÌNH CÔNG BỐ LIÊN QUAN CỦA TÁC GIẢ. 124
TÀI LIỆU THAM KHẢO . 125
PHỤ LỤC
5.1. Một số thuật ngữ tiếng Anh . 134
5.2. Bổ đề 1 trang 23. 136
5.3. Bổ đề 3 trang 40 và kết quả (2-64) . 139
5.4. Tuyến tính hóa phƣơng trình động lực học (3-23) . 143
5.5. Chương trình mô phỏng ví dụ điều khiển tay rôbốt trang 79 . 145
5.6. Bổ đề 6 trang 100. 152
5.7. Một số môđun phần mềm trong mô hình phần mềm ứng dụng . 155
205 trang |
Chia sẻ: lethao | Lượt xem: 2089 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Về một phương pháp tổng hợp hệ điều khiển mờ dùng mạng nơron ứng dụng trong công nghiệp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
2 ), ký hiệu là oi, j với
i = 1.. p -1, j = 1..Li và đầu ra của mạng yr với r = 1..m là:giải mờ COG và được dùng làm bộ xấp xỉ mờ F (x, θ) với θ = éë ûù .
c1,K, c p
ì1..Li 1 £ i < p
î1..m i = p
, k =í
ì1..Li 1 £ i < p
j =í
- 65 -
ï è k =1 ø
æ Li -1
î è k =1 ø
ï x + q i = 1
ì n 1 1
ïs =1
î s =1
o + q p
p = 1
p ³ 2
Lớp đầu vào
(Lớp 0)
Lớp ẩn
(Lớp 1)
Lớp đầu ra
(Lớp 2)
x1
x2
xn
1
2
n
1
1
w11n
w1L1
w1L2
w1Ln
1
L
q11
q L1
2
w12L
wm2 1
2
q12
1
m
qm2
y1
ym
n đầu vào
L nút ẩn
s i : Hàm kích hoạt nút mạng
m đầu ra
thứ
i
trong lớp ẩn 1
Hình 7 : Mạng nơron 2 lớp
Hình 7 biểu diễn mạng nơron truyền thẳng 2 lớp ( p = 2 ) có n đầu vào, m
đầu ra tuyến tính và L nút ẩn. Mô hình của mạng được viết như sau:
yi =
L
j =1
n
2 1
è k =1 ø
(3-3)
với i = 1..m . Trường hợp mạng chỉ có một đầu ra ( m = 1) với hàm kích hoạt
xíchma sig( x) =
1
1 + e -2 x
trong lớp ẩn thì có thể dùng mạng làm bộ xấp xỉ vạn
n
ì 1 æ n 1 1 ö
oij = í
ïs i i oi -1 + q i ö 1 < i £ p - 1
å
ï j ç w jk k j ÷
ï å wrs s r
x + q
, yr = í L
ï å wrs s r
ï p -1 p p -1
w11
w12
w11
wmL
å
æ ö
wij j ç å w jk k j1 ÷ + qi2
năng các hàm liên tục vô hướng f (x) : Â ® Â hay:
- 66 -
F (x, θ) = y1 =
L
j =1
n
è k =1 ø
1
(3-4)
v Bộ xấp xỉ mờ nơron
Có nhiều kết quả nghiên cứu nhằm kết hợp được các ưu điểm của hệ mờ và
mạng nơron trong xây dựng cấu trúc bộ xấp xỉ ([86]). Một trong những kết quả
nghiên cứu khả quan là hệ suy diễn mờ dựa trên mạng thích nghi ANFIS
(Adaptive-Network-based Fuzzy Inference System) do Jang đề xuất ([64], [65],
[66], [86]). Đây là một cấu trúc mạng nơron lai dựa trên mô hình hệ mờ Takagi-
Sugeno có luật mờ được cho dưới dạng mô tả mờ sau:
Ri :
( A11i
´ A22i ´K´ Anni ) Þ gi (x)
Mạng ANFIS sử dụng hàm tuyến tính gi (x) =
n
j =1
vào hình chuông và đã được chứng minh là một bộ xấp xỉ vạn năng các hàm phi
tuyến.
v Biểu diễn toán học các bộ xấp xỉ tuyến tính và phi tuyến đối với tham số
Các bộ xấp xỉ (mờ nơron) có thể biểu diễn dưới dạng tuyến tính hoặc phi
tuyến đối với tham số. Bộ xấp xỉ được gọi là tuyến tính đối với tham số nếu
biểu diễn được dưới dạng:
T
¶F (x, θ)
¶θ
= φT (x)
(3-5)
trong đó φ(x) là véctơ hàm của x và θ là véctơ tham số đầu vào biểu diễn
tuyến tính trong hàm số của bộ xấp xỉ. Ví dụ bộ xấp xỉ mờ nơron tuyến tính đối
với tham số như hệ mờ theo công thức (3-2) và mạng nơron RBN (Radial Basis
NN). Trường hợp bộ xấp xỉ dùng hệ mờ theo (3-2) nếu θ = éëc1,K, c p ùû
T
thìå
æ ö
w12j sig ç å w jk k j1 ÷ + q12
x + q
j
j j
å aij x j , hàm liên thuộc đầu
F (x, θ) = θ φ(x) hay
- 67 -
¶F (x, θ)
¶θ
= φT (x) = éëj1(x),K,j p (x)ùû với ji (x) =
ò mCi (x, z)dz
z
p
å ò mCi (x, z)dz
i =1 z
nên có thể
T
Trường hợp
¶F (x, θ )
¶θ
= φT (x, θ) hay ö(x, è) có chứa véctơ tham số θ như
trường hợp bộ xấp xỉ dựa trên mạng nơron đa lớp biểu diễn trong (3-4), bộ xấp
xỉ được gọi là phi tuyến đối với tham số do F (x, θ) là hàm phi tuyến của tham
số θ :
T
(3-6)
v Tuyến tính hóa các bộ xấp xỉ
Các bộ xấp xỉ phi tuyến đối với tham số thường đơn giản hơn (về kích cỡ và
số lượng tham số) so với các bộ xấp xỉ tuyến tính để đạt được độ chính xác xấp
xỉ tương đương nhau. Đối với luật điều khiển phản hồi tĩnh trong phương pháp
thay thế ước lượng hàm trạng thái, vấn đề sử dụng bộ xấp xỉ tuyến tính hay phi
tuyến đối với tham số không được đặt ra do chỉ cần bộ xấp xỉ đảm bảo sai số
cần thiết trong miền hợp lệ. Tuy nhiên để chỉnh định tham số của bộ xấp xỉ
trong luật điều khiển phản hồi động, việc sử dụng bộ xấp xỉ tuyến tính hay phi
tuyến đối với tham số có ý nghĩa quan trọng. Mặc dù các kết quả nghiên cứu
của luận án trong chương sau cho phép áp dụng một trong hai dạng bộ xấp xỉ,
tuy nhiên cũng có thể tuyến tính hóa bộ xấp xỉ phi tuyến đối với tham số tùy
theo mỗi ứng dụng.
Vấn đề tuyến tính hóa bộ xấp xỉ được trình bày trong [57]. Kết quả này cho
biết nếu bộ xấp xỉ là liên tục Lipschitz đối với tham số chỉnh định (không kể là
biểu diễn được ở dạng tuyến tính hay phi tuyến) thì đều có thể viết như sau:
D F (x, θ) = F (x, θ* ) - F (x, θ) = -
¶F (x, θ)
¶θ
Δθ + d (x, θ, θ*)
(3-7)biểu diễn F (x, θ) = θ φ(x) là dạng tuyến tính đối với tham số.
F (x, θ) = θ φ(x, θ) .
- 68 -
æ ö
÷
x
tối ưu, Δθ = θ - θ* , d (x, θ, θ* ) = -s ( Δθ ) với
lim
Δθ ®0
s ( Δθ )
Δθ
= 0 . Ngoài ra
d (x, θ, θ*) bị chặn bởi d (x, θ, θ* ) £ L Δθ 2 với L là hằng số Lipschitz, do vậy
nếu tìm được luật chỉnh định θ để giảm được Δθ
2
thì θ có xu hướng tiến về
θ* và F (x, θ) sẽ tiến đến F (x, θ* ) . Như vậy nếu Δθ
2
bị chặn thì sai số xấp xỉ
cũng bị chặn. Đây chính là cơ sở để xây dựng luật chỉnh định tham số trong
chương tiếp theo.
v Tối ƣu hóa các bộ xấp xỉ mờ nơron
Vấn đề tối ưu hóa các bộ xấp xỉ mờ nơron nói chung là tìm cách tối thiểu
2
xÎWx
véctơ của p tham số chỉnh định được của hệ mờ hoặc mạng nơron hay cần tìm
tham số chỉnh định tối ưu θ* Î Wθ từ số liệu đo để θ* = arg min J (θ) .
θÎWθ
Như vậy để sai số xấp xỉ nhỏ theo yêu cầu, số liệu đo phải đủ lớn và bao phủ
được toàn bộ miền hợp lệ W x . Tuy nhiên trong thực tế đa phần không thể lựa
chọn được cách phân bố số liệu đo trong W x cũng như không thể thay đổi số
liệu đo để cải thiện độ chính xác mà chỉ có thể sử dụng trực tiếp số lượng hữu
hạn các số liệu đo có được. Đây thực sự là vấn đề phức tạp và trong nhiều
trường hợp phương pháp tối ưu hóa không đảm bảo đáp ứng được yêu cầu về
sai số xấp xỉ. Thông thường để tìm véctơ tham số chỉnh định tối ưu θ* Î Wθ từ
các số liệu đo có được có thể áp dụng thuật toán bình phương nhỏ nhất (Least
Squares) tuyến tính (batch, recursive) hoặc phi tuyến (gradient, conjugate
gradient, line search, Levenberg-Marquardt) được trình bày trong các tài liệu
[57], [58], [66], [68], [76], [86], [91].θÎWθ ç xÎW
trong đó θ là tham số hiện thời, θ* = arg min ç sup F (x, θ) - f (x) ÷ là tham số
è
ø
hóa hàm giá trị (cost function) J (θ) = sup f (x) - F (x, θ) với θ Î Wθ Í Â p là
- 69 -
3.2.
Thay thế ƣớc lƣợng hàm trạng thái
3.2.1. Cơ sở toán học của phương pháp
v Trƣờng hợp hệ khả tuyến tính hóa phản hồi trạng thái
Trước tiên xét trường hợp hệ khả tuyến tính hóa phản hồi trạng thái. Khi đó
phương pháp thay thế ước lượng hàm trạng thái trong luận án sử dụng bộ xấp xỉ
vạn năng để thay thế thành phần chưa biết trong phương trình trạng thái của hệ
phi tuyến sao cho sai số xấp xỉ x& n của hệ thỏa mãn yêu cầu Ddxn £ W trong
miền hợp lệ của x Î Wx , u Î Wu và với W > 0 cho trước để E bị chặn theo
(2-26) hay E £ max ( E0 , E¥ ) với E0 = E(0) và E¥ =
W
h
.
Xuất phát từ thực tế trong nhiều trường hợp dạng của f (x) , g(x) đã biết (ví
dụ như f (x) = f1(x) + f2 (x) , g(x) = cg1(x) với f1(x) , g1(x) là các hàm liên
tục đã biết; f2 (x) và c là hàm số và hằng số chưa biết) hoặc có thể ước lượng
được nên phương pháp xây dựng theo hướng thay thế f (x) , g(x) tương ứng
bởi các hàm liên tục %f (x) và g%(x) > 0 bị chặn đã biết và tìm cách bù sai lệch
do phép thay thế gây nên để kết quả cuối cùng sai số E bị chặn theo (2-26).
Giả sử phép thay thế trên dẫn đến điều kiện xấp xỉ không thỏa mãn hay:
Ddxn (x, u%) = %f (x) - f (x) + ( g%(x) - g(x) ) u% £ W%
(3-8)
với W% > W trong miền x Î Wx , u% Î Wu và u% là luật điều khiển phản hồi theo
(2-28). Khi đó như đã phân tích trong mục 2.2.2 trang 31, nếu ta xác định được
n +1
u% Î Wu thì có thể bù được ảnh hưởng của sai số xấp xỉ D dxn bằng cách sử dụng
luật điều khiển phản hồi u = u% + uc theo (2-39) hoặc (2-42) để E bị chặn theo
(2-26).hàm Φ(x, u%) : Â ® Â+ thỏa mãn điều kiện Ddxn £ F(x, u%) với "x Î Wx ,
- 70 -
Điều này cũng có nghĩa là nếu xấp xỉ được D dxn trong miền hợp lệ của x và
n+1 p
số chỉnh định được của bộ xấp xỉ và tìm được véctơ tham số θ% thỏa mãn:
FD (x, u%, θ%) - Ddxn (x, u%) £ WD
(3-9)
với WD > 0 thì vấn đề sai số xấp xỉ x& n nêu trên cũng sẽ được giải quyết bằng
cách thay thế Φ(x, u%) bằng FD (x, u%, θ%) trong luật điều khiển phản hồi (2-39)
hoặc (2-42) hay với thành phần bù:
uc = -
FD (x, u%, θ%)
g%(x)
sign(E ) hoặc uc = -
FD (x, u%, θ%)
g%(x)
bsig(k , E )
(3-10)
có thể giảm trừ được ảnh hưởng của sai số trong phép thay thế như đã phân tích
trong Chương 2.
Như vậy vấn đề xấp xỉ x& n với sai số W lại trở thành vấn đề xấp xỉ D dxn với
sai số WD trong phương pháp. Do x& n có thể tính được từ các số liệu đo nên với
giả thiết số liệu đo đầy đủ, D dxn theo công thức (3-8) luôn xấp xỉ được bởi bộ
xấp xỉ vạn năng FD (x, u%, θ) các hàm liên tục vô hướng thuộc lớp hàm
Zc (n + 1, Wx,u ) trong miền đóng Wx,u Ì Ân +1 với sai số bất kỳ. Lưu ý là D dxn
còn có thể viết như sau:
Ddxn (x, u) = %(x) + g(x)u - xn
(3-11)
Tuy nhiên do FD (x, u%, θ%) không liên tục nên với thành phần bù (3-10), tín
hiệu điều khiển cũng không liên tục. Để giải quyết vấn đề này tác giả đề xuất sử
dụng thành phần bù liên tục có dạng:
uc = -
FD (x, u%, θ%)
r g%(x)
bsig (k , EFD (x, u%, θ%))
(3-12)
với 0 0 và u% định nghĩa như (2-28) khi đó tín hiệu điều khiển phản
hồi được tính như sau:u% bởi bộ xấp xỉ vạn năng FD (x, u%, θ) : Â ´ Â ® Â với θ ÎÂ p là véctơ tham
% f % % &
- 71 -
u = u% + uc
æ T 1 ö (3-13)
è r ø
Phát biểu của Định lý 3 dưới đây giải quyết vấn đề còn tồn tại của phương
pháp trong trường hợp g%(x) > 0 và %f (x) thay thế không thỏa mãn điều kiện
(2-34) và được gọi là Định lý 1 mở rộng trong trường hợp điều kiện (2-34)
không được đáp ứng.
Định lý 3 : (Định lý 1 mở rộng) Điều kiện để phương trình động học hệ sai số
(2-20) với luật điều khiển phản hồi tĩnh (3-13) có nghiệm bị chặn tới hạn đều
n+1 p
sai số WD bị chặn bởi:
0 < WD £ W 2 -
2h
r
μ E _ max (r ,k )
(3-14)
trong miền hợp lệ của x Î Wx và u% Î Wu , trong đó μ E _ max (r ,k ) tính theo
công thức (2-63) và W là sai số thiết kế theo (2-34).
v Chứng minh
Để chứng minh Định lý 3 ta cần chỉ ra rằng bằng luật điều khiển phản hồi
(3-13) chứa đại lượng bù (3-12) thì đạo hàm của hàm Lyapunov cũng thỏa mãn
(2-23).
Ký hiệu FD = FD (x, u, θ) và FD = FD (x, u, è) thì từ phương trình động học
của hệ sai số E = -h E + g (x)uc -Ddxn (x, u) suy ra:
V = -h E 2 + Eg(x)uc - EDdxn (x, u)
£ -h E 2 -
£ -h E 2 +
1
r
1
r
EFD bsig(k , EFD ) + E Ddxn
E ( r Ddxn - FD sign(E ) bsig(k , EF%D ))FD D (x, u%, θ%)) ÷
(x, u%, θ%) bsig (k , EF
= g%-1(x) ç r(n) - η e - %f (x) -
theo (2-26) là bộ xấp xỉ vạn năng FD (x, u%, θ%) : Â ´ Â ® Â xấp xỉ (3-11) với
% % % %
& % %
& % %
% %
- 72 -
Do sign(E)sign(FD ) = sign(EFD ) và
Ddxn - FD £ FD - Ddxn £ WD hay
Ddxn £ FD + WD nên:
1
r
= -h E 2 + E WD +
1
r
EFD ( r - sign( EFD ) bsig(k , EFD ))
= -hV + -
2h
1
2h
1
(3-15)
£ -hV +
+
μ E _ max (r ,k )
với μ E (r ,k , E ) được định nghĩa như (2-61) và μ E (r ,k , E ) £ μ E _ max (r ,k ) với
mọi r thỏa mãn 0 0 và E Î Â theo Bổ đề 3 trang 40.
Rõ ràng để E £ max ( E0 , E¥ )
như (2-26), cần có V& £ -hV +
2
2h
như
(2-23) nên từ (3-15) suy ra sai số của bộ xấp xỉ vạn năng FD - Ddxn £ WD cũng
như k phải đáp ứng điều kiện:
2
2h
r
μ E _ max (r ,k ) , μ E _ max (r ,k ) <
rW 2
2h
nên Định lý 3 được chứng minh.
Lưu ý trường hợp r = 1, ta có μ E _ max (1,k ) = μ E (1,k , ±
1.2785
k
) »
0.5569
k
nên điều kiện trên trở thành:
0 < WD £ W 2 -
1.1138h
k
, k >
1.1138h
W 2
▲% %
% %
V& £ -h E 2 + E WD D ( r - sign( E )sign( F%D D ))
E F%
) bsig(k , EF%
+
%
% % %
WD2
(WD -h E )2 + r μ E (k , EF%D )
WD 1
2h r
W
0 < WD £ W -
- 73 -
v Trƣờng hợp hệ khả tuyến tính hóa phản hồi vào-ra
Tương tự như trên, xét trường hợp hệ là khả tuyến tính hóa phản hồi vào-ra
dạng (2-4) có hệ con phi tuyến là ISS và thỏa mãn Giả thiết 2. Nếu %f (x, q) ,
g%(x, q) > 0 là các hàm số thay thế liên tục bị chặn cho trước không thỏa mãn
điều kiện (2-85) nhưng thỏa mãn:
Ddxn (x, q, u%) = %f (x, q) - f (x, q) + ( g%(x, q) - g(x, q) ) u% £ W%
với W% > W trong miền (x, q) Î Wx,q Ì Ân +d , u Î Wu và u% là luật điều khiển
phản hồi theo (2-84) thì có thể sử dụng thành phần bù:
uc = -
FD (x, q, u%, θ%)
r g%(x, q)
bsig (k , EFD (x, q, u%, θ%))
(3-16)
với 0 0 để với luật điều khiển phản hồi tĩnh u = u% + uc hay:
u = u% + uc
=
T
1
r
FD (x, q, u%, θ%) bsig (k , EFD (x, q, u%, θ%))
g%(x, q)
(3-17)
ta có x , q bị chặn đều theo Định lý 6.1 ([57]) tương tự như đã trình bày ở trên.
Lưu ý là trong trường hợp này Ddxn (x, q, u) được xấp xỉ bởi bộ xấp xỉ vạn
n+d +1 p
Zc (n + d + 1, Wx,q,u ) trong miền đóng Wx,q,u Î Ân +d +1 với θ ÎÂ p là véctơ
tham số chỉnh định được và θ% là véctơ tham số cần tìm thỏa mãn:
FD (x, q, u%, θ%) - Ddxn (x, q, u%) £ WD
với WD là sai số cần đạt thỏa mãn (3-14).
(3-18)r(n) - η e - %f (x, q) -
năng FD (x, q, u, θ) : Â ´ Â ® Â các hàm liên tục vô hướng thuộc lớp hàm
- 74 -
3.2.2. Xác định tham số bộ điều khiển
Các kết quả trong phần trước đã đề cập đến việc chọn tham số điều khiển
trong một số trường hợp tuy nhiên từ trước đến giờ ta luôn giả thiết rằng từ các
số liệu đo và dữ liệu đã biết về hệ thống đủ để thiết kế được bộ xấp xỉ đảm bảo
sai số xấp xỉ theo yêu cầu trong miền hợp lệ của x Î Wx Ì Ân và u Î Wu . Tuy
nhiên trong thực tế miền hợp lệ W x , Wu ở đây thực chất là miền mà bộ xấp xỉ
tìm được phải đảm bảo được sai số xấp xỉ theo yêu cầu và do vậy cần thiết kế
bộ điều khiển sao cho x và u không vượt ra ngoài W x và Wu .
Nhằm xác định tham số điều khiển và các điều kiện cần trong phương pháp
đảm bảo các yêu cầu bị chặn trong miền hợp lệ của không gian trạng thái và tín
hiệu điều khiển, sau đây trình bày phương pháp tính toán. Để đơn giản các
phương pháp chỉ phân tích áp dụng cho trường hợp hệ khả tuyến tính hóa phản
hồi trạng thái. Trường hợp hệ khả tuyến tính hóa phản hồi vào-ra có thể áp dụng
các bước tính toán tương tự.
v Xác định tham số điều khiển để quỹ đạo trạng thái bị chặn
Giả thiết rằng bằng phương pháp thay thế ước lượng như trên, luật điều
khiển phản hồi (2-28) đảm bảo sai số Ddxn £ W chỉ trong miền x Î Wx , u Î Wu
và Wx = {x Î Ân : x £ xM , xM > 0} là siêu cầu chứa gốc tọa độ. Bài toán đặt ra
T
kiện giới hạn khác để quỹ đạo trạng thái của hệ luôn nằm trong W x hay x £ xM
, xM > 0 cho trước với mọi t ³ 0 . Khi đó cần xác định được W E sao cho khi
E Î W E thì x Î Wx .
Định lý 1 (trang 29) cho biết nếu điều kiện sai số được đảm bảo trong miền
hợp lệ của x Î Wx , u Î Wu thì hệ sai số có nghiệm bị chặn bởi (2-26). Như vậy
nếu định nghĩa W E = {E Î Â : E £ max ( E0 , E¥ )} thì W E chính là miền chứalà cần xác định tham số điều khiển [ ]1 1 2 1, , , nk k k kh h h-= + +η K và các điều
- 75 -
toàn bộ quỹ đạo của hệ sai số E hay E Î W E với "t ³ 0 . Do E luôn nằm trong
W E nên không cần thiết phải có V& £ 0 khi E không nằm trong W E hay khi
E Î Â - W E .
Mặt khác do hệ sai số được lập thỏa mãn Giả thiết 1 (Bổ đề 1 trang 23) nên
từ kết quả chứng minh trong mục 5.2 trang 136 phần Phụ lục, suy ra x bị chặn
bởi:
n-1
è i =1 ø
với y d E (t, E ) = p1e
-p2t
t
0
thỏa mãn eAkt £ p1e-p2t .
Nếu chọn E0 = 0 thì từ (2-26) suy ra E £ E¥ và:
t
0
p1 W p1 W
p2 h p2 h
W
è i =1
Do vậy để x £ xM cần thiết chọn các tham số điều khiển thỏa mãn:
h ³
n -1
p2 + p1 ç1 + å ki
è i =1
p2
ö
÷
ø
W
( xM - rM )
(3-19)
v Xác định tham số điều khiển để tín hiệu đầu vào điều khiển bị chặn
Sau đây xét bài toán điều khiển với điều kiện đầu vào (3-13) cần giữ trong
miền Wu = {u ÎÂ : u £ uM }, uM > 0 hay u £ uM cần đảm bảo với "t ³ 0 .
Ngoài ra cũng giả thiết rằng 0 < g L £ g%(x) .æ ö
x £ rM + E + ç1 + å ki ÷ y d E (t, E )
d E (0) + ò p1e-p2 (t -t ) E (t ) dt và p1 , p2 được chọn
( )
1 - e - p2t
£
æ ö p1 W
n -1
x £ rM + + ç1 + å ki ÷
æ
- 76 -
Dựa theo phương pháp tính toán trình bày trong [48] áp dụng trong trường
hợp này, bổ đề sau cho biết điều kiện và cũng là cách xác định tham số điều
khiển trong phương pháp thay thế ước lượng hàm trạng thái để luật điều khiển
phản hồi trong Định lý 3 bị chặn.
Bổ đề 5 : (Tính bị chặn của luật điều khiển) Luật điều khiển phản hồi (3-13)
đảm bảo u Î Wu với Wu = {u ÎÂ : u £ uM } nếu uM >
W% + WD
r gL
và điều kiện
(3-22) được thỏa mãn.
v Chứng minh
Nếu %f (x) , g%(x) là các hàm liên tục Lipschitz cục bộ thì có thể xác định
được các hằng số K f , K g để:
%(x) - %(x) £ K f x - x
g%(x) - g%(x%) £ K g x - x%
với "x, x% Î Wx . Mặt khác từ (3-13) và do x = e + r nên có thể phân tích:
u =
T
1
r
FD (x, u, θ) bsig (k , EFD (x, u, θ))
g%(x)
=
T
g%(r)
F% bsig(k , EF% )
r g%(r)
g%(r)
g%(e + r)
Với giả thiết 0 < g L £ g%(x) tiếp tục biến đổi được như sau:f f % %
r(n) - η e - %f (x) -
% % % %
r(n) - η e - %f (e + r) + %f (r) - %f (r)
- D D
- 77 -
ç g(r)
T
+ + + D D
g(r) g(r) r g(r)
ö
÷
ø
´ 1 -
g%(e + r) - g%(r)
g%(e + r)
ç g(r) g(r) g(r) r g(r) ÷ g(e + r)
è
do FD - Ddxn £ FD - Ddxn £ WD Þ FD £ W + WD và W > W là sai số xấp xỉ
thực x& n do phép thay thế gây nên theo (3-8).
Ø Như vậy để u £ uM cần thiết:
r(n) - %f (r)
g%(r)
£
uM
1 + K g
e
g L
- ( η + K f
e
L
-
W% + WD
r g L
= u
(3-20)
Từ
(2-26)
ta
có
T
nên
e(t) £ K max ( E0 , E¥ ) = eM , eM > 0 . Khi đó định nghĩa:
M =
uM
e
g L
- ( η + K f
L L
%
(3-21)
thì M £ u và nếu M > 0 thì điều kiện (3-20) luôn thỏa mãn. Để M > 0 cần có:
æ e öæ
è g L ø è
)
+
Û K g ( η + K f
)
2
è L ø è r gæ r(n) - %f (r)
u £ ç
è
%(r) - %(e + r) F bsig(k , EF )
η e
÷
%
% %%
æ r(n) - %(r) K f e ηe FD öæ K g e ö
£ ç + + + ÷ç1 + ÷
è ø è ø
(
)
æ r(n) - %(r) e W + WD ö æ e ö
g L ÷ø
ç ÷è
£ ç + η + K f + ÷ ç1 + K g
g L L ø
g(r) r g
% %% % %
% % % % %
) g
E = k e £ max ( E0 , E¥ )
1 + K g M
) egM - Wr+gWD
(
uM > ç1 + K g M ÷ ç η + K f
eM W + WD ö
gL L ÷ø
W% + WD ö eM
W% + WD
æ eM ö æ
ç g ÷ ÷ g
+ ç η + K f + K g + - uM < 0
- 78 -
là dạng bất phương trình bậc hai Az2 + Bz + C 0 ,
B = η + K f + Kg
W% + WD
r gL
r gL g L
> 0 , C = - uM và z = > 0 . Gọi z1 < z2 là
hai nghiệm của đa thức bậc hai nêu trên thì bất phương trình có nghiệm
z1 < z < z2 .
Do nếu C ³ 0 thì đa thức bậc hai trên có hai nghiệm thực không dương nên
cần thiết C
W% + WD
r gL
để đa thức có một nghiệm dương. Khi đó:
0 < z =
K
gL
max ( E0 , E¥ ) < z2 =
-B + B2 - 4 AC
2 A
và như vậy để M > 0 cần chọn:
max ( E0 , E¥ ) <
- B + B2 - 4 AC g L
2 A K
và
r(n) - %f (r)
g%(r)
£ M
(3-22)
để tín hiệu điều khiển luôn nằm trong Wu hay u £ uM .
Kết quả trên chứng minh cho phát biểu của Bổ đề 5. Lưu ý là Bổ đề 5 không
chỉ cho phép tính toán tham số của bộ điều khiển (nếu tồn tại) để tín hiệu điều
khiển bị chặn trong Wu mà còn là cơ sở để kết luận có thể điều khiển bám theo
tín hiệu mẫu cho trước với sai số thiết kế và các điều kiện ban đầu được chọn
của hệ sai số hay không.
▲W + WD eM
- 79 -
3.2.3. Mô phỏng điều khiển tay rôbốt
Để minh họa sau đây là một ví dụ áp dụng phương pháp trong điều khiển tay
rôbốt theo quỹ đạo định trước. Để đơn giản, xét mô hình đơn thanh nối (flexible
single-link) có phương trình động lực học như sau ([50]):
Iq&&1 + MgL sin q1 + k (q1 - q2 ) = 0
Jq2 - k (q1 - q2 ) = u
(3-23)
với q1 , q2 tương ứng là vị trí góc quay của thanh nối và trục động cơ; I , J là
mômen quán tính của thanh nối và trục động cơ; k là hệ số đàn hồi; g là gia tốc
trọng trường; M là khối lượng thanh nối; L là khoảng cách từ trục tới trọng
tâm của thanh nối và u là lực quay đầu vào của motor. Các số liệu cho trước
2
. Bài toán đặt ra là cần điều khiển vị trí góc quay q1 hay y = q1 theo quỹ đạo r
định trước.
Phương trình động lực học (3-23) và đầu ra có thể chuyển về dạng tuyến tính
hóa phản hồi trạng thái sau (xem chi tiết trong mục 5.4 trang 143 phần Phụ lục):
x1 = x2
x2 = x3
x3 = x4
x4 = a ( x2 - c) sin x1 - (a cos x1 + b + c ) x3 + bdu
(3-24)
y = x1
MgL k k 1
I I J J
2
Sau đây giả thiết rằng các trạng thái của hệ (3-24) đo được, trong khi f (x) ,
g(x) chưa biết đầy đủ. Ta cần điều khiển vị trí góc quay của thanh nối theo quỹ
đạo định trước r(t ) =
p
3
sin(0.5t) cos(0.1t) với trạng thái ban đầu x(0) = 0 .&&
gồm: I = J = 0.04Nms /rad , k = 0.8Nm/rad , L = 0.1m , M = 6kg , g = 9.8m/s2
&
&
&
&
với a =
, b =
, c =
, d =
chính là dạng quen thuộc (2-6) với
f (x) = a ( x2 - c) sin x1 - (a cos x1 + b + c ) x3 và g(x) = bd .
- 80 -
Để mô phỏng phương pháp đề xuất, sau đây thay thế các hàm trạng thái chưa
biết bằng các hàm số %(x) = -a2c2 sin x1 - a2 (b2 + c2 ) x3 và g(x) = b2d2 với
a2 = a , b2 = 0.9b , c2 = 1.1c , d2 = 1.3d . Phép thay thế trên dẫn đến sai số lớn
trong điều khiển bám theo tín hiệu mẫu như kết quả mô phỏng trên Hình 8. Các
đồ thị trên Hình 8 này, theo thứ tự biểu diễn đồ thị theo thời gian sai lệch của
phép thay thế D f = %(x) - f (x) , D g = g (x) - g(x) ; tín hiệu đầu vào điều khiển
u% (khi không có thành phần bù); tín hiệu mẫu r(t) và đáp ứng đầu ra.
Để thiết kế thành phần bù trong phương pháp, mô phỏng sử dụng bộ xấp xỉ
mờ nơron ANFIS với 5 đầu vào (bao gồm véctơ trạng thái x và đầu vào điều
khiển u% ). Như vậy cùng với giả thiết số liệu đo là đầy đủ, bộ xấp xỉ mờ nơron
ANFIS luôn xấp xỉ được D dxn với sai số nhỏ tùy ý. Tuy nhiên để kích cỡ bộ xấp
xỉ không quá lớn và tốc độ mô phỏng nhanh hơn, ta có thể chấp nhận sai số xấp
xỉ lớn hơn bằng cách mỗi đầu vào ANFIS chỉ sử dụng 2 hàm liên thuộc dạng
hình chuông (hàm gbellmf trong MATLAB V6.5) để xấp xỉ Ddxn (x, u%) và sẽ
chọn các tham số k và r để chất lượng điều khiển đáp ứng được yêu cầu thiết
kế.
Hình 9 và Hình 10 tương ứng biểu diễn kết quả mô phỏng điều khiển khi sử
dụng thành phần bù là bộ xấp xỉ mờ nơron ANFIS đã luyện nêu trên trong luật
điều khiển phản hồi tĩnh (3-13) với k = 1, r = 1.0 và k = 1, r = 0.8 . Tương tự
như trường hợp mô phỏng không có thành phần bù, các đồ thị trong Hình 9 và
Hình 10 theo thứ tự biểu diễn đồ thị thời gian của sai lệch do phép thay thế gây
ra; tín hiệu đầu vào điều khiển u = u% + uc có chứa thành phần bù; tín hiệu mẫu
r(t) và đáp ứng đầu ra trong mỗi trường hợp. Chất lượng điều khiển tốt hơn
trong trường hợp r = 0.8 so với trường hợp r = 1.0 minh họa cho việc sử dụng
hàm μ E _ max (r ,k ) để phân tích giới hạn bị chặn của hệ sai số trong phương
pháp.
Có thể tham khảo toàn bộ mã code chương trình mô phỏng viết trên Matlab
V6.5 trong mục 5.4 trang 143 phần Phụ lục.f %
f %
- 81 -
300
200
100
0
-100
-200
¬Df(x)
¯Dg(x)
k =0
-300
0
5
10
15
20
25
30
35
40
45
50
t [s]
2
1.5
1
0.5
0
-0.5
-1
-1.5
k =0
-2
0
5
10
15
20
25
30
35
40
45
50
t [s]
k =0
1
¬Reference signal
0.8
0.6
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
-1
¬Plant's output
0
5
10
15
20
25
30
35
40
45
50
t [s]
Hình 8 : Mô phỏng trong trường hợp không sử dụng thành phần bù
Df(x), Dg(x)
u
r, y
- 82 -
300
200
100
0
-100
-200
¬Df(x)
¯Dg(x)
k = 1, r = 1.0
-300
0
5
10
15
20
25
30
35
40
45
50
t [s]
5
4
3
2
1
0
-1
-2
k = 1, r = 1.0
-3
0
5
10
15
20
25
30
35
40
45
50
t [s]
k = 1, r = 1.0
1
¬Reference signal
0.8
0.6
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
-1
¬Plant's output
0
5
10
15
20
25
30
35
40
45
50
t [s]
Hình 9 : Mô phỏng sử dụng thành phần bù tĩnh với
k = 1 và r = 1.0
Df(x), Dg(x)
u
r, y
- 83 -
300
200
100
0
-100
-200
¬Df(x)
¯Dg(x)
k = 1, r = 0.8
-300
0
5
10
15
20
25
30
35
40
45
50
t [s]
7
6
5
4
3
2
1
0
-1
-2
k = 1, r = 0.8
-3
0
5
10
15
20
25
30
35
40
45
50
t [s]
k = 1, r = 0.8
1
¬Reference signal
0.8
0.6
¬Plant's output
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
-1
0
5
10
15
20
25
30
35
40
45
50
t [s]
Hình 10 : Mô phỏng sử dụng thành phần bù tĩnh với
k = 1 và r = 0.8
Df(x), Dg(x)
u
r, y
- 84 -
3.3.
Thay thế ƣớc lƣợng hàm trạng thái mở rộng trong điều khiển ổn
định các hệ khả tuyến tính hóa phản hồi chặt
3.3.1. Phương pháp cuốn chiếu
Phương pháp thay thế ước lượng hàm trạng thái có thể áp dụng trong trường
hợp hệ khả tuyến tính hóa phản hồi chặt (strict-feedback system) có phương
trình động học và đầu ra ở dạng:
ì x1 = f1( x1 ) + g1( x1 ) x2
í xn-1 = fn-1( x1,K, xn-1 ) + gn-1( x1,K, xn-1 ) xn
ï n n n
ïî y = x1
(3-25)
trong đó xT = [ x1,K, xn ] là các trạng thái đo được của hệ; fi , gi ( i = 1..n ) là
các hàm trơn liên tục bị chặn và gi ¹ 0 với "x Î Wx .
Dạng biểu diễn phản hồi chặt có thể gặp trong phân tích phần lớn các hệ
chuyển động hỗn loạn (chaotic
Các file đính kèm theo tài liệu này:
- 236..com.doc