Trình tự thiết kế bộ điều khiển thích nghi:
Viết biểu thức mô tả động học sai số bám.
Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và
sai số thông số).
Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu
khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ
thuộc vào sai s thông s của mô hình)
Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo
đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai s V& < 0 ) khi sai số
cấu trúc nằm trong giới hạn định trước
61 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 478 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Hệ thống điều khiển thông minh - Chương 5: Điều khiển thích nghi và điều khiển học - Huỳnh Thái Hoàng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Moân hoïc
HEÄ THOÁNG ÑIEÀU KHIEÅN THOÂNG MINH
Giaûng vieân: TS. Huyønh Thaùi Hoaøng
B ä â Ñi à Khi å Tö Ñ äo mon eu en ï ong
Khoa Ñieän – Ñieän Töû
Ñaïi hoïc Baùch Khoa TP.HCM
Email: hthoang@hcmut edu vn . .
Homepage:
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 1
Chöông 5
ĐIỀU KHIỂN THÍCH NGHI
À Ề ỂV ĐI U KHI N HỌC
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 2
Điề khiể hí h hi
Noäi dung chöông 4
u n t c ng
Điều khiển học
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 3
ĐIỀU KHIỂN THÍCH NGHI
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 4
Sơ đồ khối hệ thống điều khiển thích nghi
Hệ thố điề khiể t đó thô ố ( à ấ t ú ) ủ bộ điềng u n rong ng s v c u r c c a u
khiển thay đổi trong quá trình vận hành nhằm đảm bảo chất lượng
điều khiển khi có sự hiện diện của các yếu tố bất định hoặc biến đổi
không biết trước gọi là hệ thống điều khiển thích nghi.
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 5
Phân loại hệ thống điều khiển thích nghi
Đối t ượng:
Tuyến tính hoặc phi tuyến
SISO hoặc MIMO (vuông, không vuông)
Hệ có bậc tương đối tổng quát
Có nhiễu hệ thống, nhiễu đo lường
ồ Thông tin phản h i:
Trạng thái
Ngõ ra
Cơ sở của thuật toán điều khiển thích nghi:
Điều khiển hồi tiếp tuyến tính hóa
Điều khiển trượt
Thuật toán thích nghi:
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 6
Liên tục hoặc rời rạc
Đặt bài toán
Đối t hệ hi t ế SISO ô tả bởi h t ì h i hâ ượng: p uy n m p ương r n v p n:
⎨⎧ += )()( xgxfx u&⎩ = )(xhy
Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt
ym(t)
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 7
Đối tượng điều khiển
Nế đối t ó bậ t đối bằ đối t ó thể đ ô tảu ượng c c ương ng r, ượng c ược m
bằng phương trình sau:
ubay r )()()( xx +=
Trong đó: )()( xx hLa rf=
1 0)()( ≠= − xx hLLb rfg
⎤⎡
với:
[ ]Tn
n
f ffxx
L )(),()(,,)()(.)()( 1
1
xxxxxf
x
xx KK ⎥⎦⎢⎣ ∂
∂
∂
∂=∂
∂= φφφφ
)(1∂ − φkL
)(.)( xf
x
x
x ∂=φ
fk
fL
)(x∂ φkfL
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 8
)(.)( xg
x
x ∂=φ
k
fg LL
Luật điều khiển hồi tiếp tuyến tính hóa
L ật điề khiể hồi tiế t ế tí h hóu u n p uy n n a:
[ ])()(
)(
1)(* tva
b
u +−= x
x
x
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 9
Các giả thiết
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 10
Tính ổn định của luật điều khiển hồi tiếp tuyến tính hóa
ố 0 Đặc tính động học của sai s bám: =+ ss ee η&
Ch hà L 21V ọn m yapunov:
2 s
e=
Dễ dàng thấy ràng:
02 ≤−== eeeV η&&
0≥V
sss
⇒ Hệ thống ổn định
⇒ khi
⇒ khi
ố ằ
0)( →tes ∞→t
0)( →teo ∞→t
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 11
⇒ y(t) bám theo ym(t) với sai s xác lập b ng 0
Ý tưởng điều khiển thích nghi
Điề khiể hí h hi ê ở ấ ỉ l ậ điề khiể hồi iế ế u n t c ng tr n cơ s x p x u t u n t p tuy n
tính hóa :
[ ])()(1)(* tvau += xx
Lý do:
)(b
−
x
hàm a(x) và b(x) chưa biết
hoặc hàm a(x) và b(x) đã biết nhưng thay đổi trong quá trình vận
hành
Hai phương pháp điều khiển thích nghi:
Điều khiển thích nghi gián tiếp
Điều khiển thích nghi trực tiếp
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 12
Điều khiển thích nghi gián tiếp
Nhậ d ế ( ) à b( ) dù ô hì h à)(ˆ )(bˆ n ạng trực tuy n a x v x ng m n v , sau
đó tính tín hiệu điều khiển theo nguyên lý chắc chắn tương đương.
xa x
[ ])()(ˆ
)(ˆ
1)( tva
b
uce +−= xxx
Mô hình và có thể là mô hình mờ, mạng thần kinh hoặc mô
hình hộp đen phi tuyến tổng quát.
)(ˆ xa )(ˆ xb
)()(ˆ xx a
T
aa ξθ=
)()(ˆ xx b
T
bb ξθ=
Các vector và là vector thông số của mô hình.aθ bθ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 13
Điều khiển thích nghi gián tiếp (tt)
ố ế ể Các vector thông s và được cập nhật trực tuy n đ tiệm cận
tiến tới giá trị tối ưu:
aθ bθ
⎬⎫⎨⎧ )()(supminarg* xx bTξθθ
⎬⎫⎨⎧ −= )()(supminarg* xx aTξθθ
⎭⎩ −= ∈Ω∈ xSx bbb bbθ
G i à là i ố iữ ô hì h ối à đặ í h độ h)(δ )(δ
⎭⎩ ∈Ω∈ xSx aaa aaθ
ọ v sa s g a m n t ưu v c t n ng ọc
chính xác của đối tượng. Mô hình đúng của đối tượng có thể biểu diễn
như sau:
xa xb
)()()( * xxx aa
T
aa δ+= ξθ
)()()( * xxx bb
T
bb δ+= ξθ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 14
Điều khiển thích nghi gián tiếp (tt)
ố Sai lệch giữa mô hình nhận dạng được và mô hình đúng của hệ th ng:
)()()(~)()(ˆ xxxx aa
T
a taa δ−=− ξθ
)()()(~)()(ˆ xxxx bb
T
b tbb δ−=− ξθ
*)()(~ aaa tt θθθ −=trong đó:
Sai số mô hình luôn tồn tại trong các ứng dụng thực tế. Để đảm bảo
*)()(~ bbb tt θθθ −=
hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usi.
Tín hiệu điều khiển là tổng gồm 2 thành phần:
uce điều khiển hệ thống bám quỹ đạo chuẩn
usi đảm bảo hệ thống ổn định
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 15
sice uuu +=
Các giả thiết cần để thiết kế bộ điều khiển thích nghi gián tiếp
bị chặn:
∞<≤≤< )()()(0 xxx bbb
)(xb
Quỹ đạo chuẩn mong muốn khả vi liên tục bị chặn đến bậc r)(tym
và các đạo hàm ,..., có thể đo được.)(tym& )()( ty rm
Sai số cấu trúc giữa mô hình và đặc tính chính xác của đối tượng bị
chặn bởi các cận biết trước:
∞∈≤ L)()( xx aa δδ
∞∈≤ L)()( xx bb δδ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 16
Trình tự thiết kế bộ điều khiển thích nghi:
Viế biể hứ ô ả độ h i ố bá t u t c m t ng ọc sa s m.
Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và
sai số thông số).
Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu
khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ
ố ố
V&
thuộc vào sai s thông s của mô hình)
Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo
đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số0<V&
cấu trúc nằm trong giới hạn định trước.
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 17
Thiết kế bộ điều khiển thích nghi gián tiếp
Biểu thức mô tả động học sai số bám
TT ~~1~~11 2
sicess ububbaaee )())()(ˆ())()(ˆ( xxxxx −−+−=+η&
Hàm Lyapunov: bbbaaaseV θθθθ 222 QQ ++=
)(~)(~)(2 cesbbbTbsaaaTacebasssis ueeueebueV ξθθξθθ ++++−−+−−= &&& QQδδη⇒
Luật thích nghi thông số: saaa eξθ 1−−= Q&
euξθ 1−−= Q& scebbb
Thành phần điều khiển chế độ trượt: ( ) )sgn(1 scebasi eubu δδ +=
[ ] 012 ≤+⎟⎠⎞⎜⎝⎛ −−−≤ cebass ueb
beV δδη&⇒
ố ổ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 18
⇒ Hệ th ng n định
Sơ đồ khối hệ thống điều khiển thích nghi gián tiếp
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 19
Thí dụ: Điều khiển thích nghi gián tiếp hệ bồn kép dùng mô hình mờ
Đặc tính động học của hệ thống mô tả bởi các phương trình sau:
( )1 |)()(|2))()(sgn()(
)(
)( 21121
11
1 ththgaCththtkuhA
th D −−−=&
( ))(|)()(|))()((1)( hhhhhh& 22sgn
)( 222112122
2 tgaCttgaCtthA
t DD −−−=
i
minmax)( AhAAhA iii +−=
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 20
m n
maxh
Điều khiển thích nghi trực tiếp
L ậ điề khiể hồi iế ế í h hó lý ở u t u n t p tuy n t n a tư ng:
[ ])()(
)(
1)(* tva
b
u +−= x
x
x
Dùng mô hình phi tuyến để nhận dạng trực tiếp u*(x):
)()(ˆ xx Tu ξθ=
Mô hình có thể là mô hình mờ, mạng thần kinh hoặc mô hình
hộp đen phi tuyến tổng quát
)(ˆ xu
uu
.
là vector độ đúng của mệnh đề điều kiện của mô hình mờ,
vector ngõ ra lớp ẩn của mạng thần kinh, hoặc vector hàm cơ sở
)(xuξ
phi tuyến tổng quát.
là vector thông số của mô hình.uθ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 21
Điều khiển thích nghi trực tiếp (tt)
ố ế ể ế Vector thông s được cập nhật trực tuy n đ tiệm cận ti n tới giá
trị tối ưu:
uθ
⎫⎧ ** T
⎭⎬⎩⎨ −= ∈Θ∈ )(supminarg uuuSu xu xx ξθθ θ
G i là i ố iữ ô hì h ối à l ậ điề khiể hồi iế)(δ ọ sa s g a m n t ưu v u t u n t p
tuyến tính hóa lý tưởng. Luật điều khiển tuyến tính hóa có thể biểu
diễn như sau:
xu
)()()( ** xxx uu
T
uu δ+= ξθ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 22
Điều khiển thích nghi trực tiếp (tt)
S i lệ h iữ l ật điề khiể hậ d đ à l ật điề khiể hồia c g a u u n n n ạng ược v u u n
tiếp tuyến tính hóa:
)()(~)()(ˆ * xxxx Tuu δ−=− ξθ
*)()(~ uuu tt θθθ −=trong đó:
uuu
Sai số mô hình luôn tồn tại trong các ứng dụng thực tế. Để đảm bảo
hệ thống ổn định sử dụng thêm thành phần điều khiển trượt u d s .
Tín hiệu điều khiển là tổng gồm 2 thành phần:
û xấp xỉ luật điều khiển hồi tiếp tuyến tính hóa lý tưởng
usd đảm bảo hệ thống ổn định
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 23
sduuu += ˆ
Các giả thiết cần để thiết kế bộ điều khiển thích nghi trực tiếp
bị hặ)(b c n:
∞<≤≤< )()()(0 xxx bbb
x
Đạo hàm theo thời gian của b(x) bị chặn bởi cận biết trước
)(|)(| xx bDb ≤&
Quỹ đạo chuẩn mong muốn khả vi liên tục bị chặn đến bậc r
ể
)(tym
)(
ố ấ ề ể ề ể ồ
và các đạo hàm ,..., có th đo được.)(tym& )(ty rm
Sai s c u trúc giữa luật đi u khi n nhận dạng và luật đi u khi n h i
tiếp tuyến tính hóa bị chặn bởi cận biết trước:
)()( δδ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 24
∞∈≤ Lxx uu
Trình tự thiết kế bộ điều khiển thích nghi:
Viế biể hứ ô ả độ h i ố bá t u t c m t ng ọc sa s m.
Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và
sai số thông số).
Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu
khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ
ố ố
V&
thuộc vào sai s thông s của mô hình)
Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo
đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số0<V&
cấu trúc nằm trong giới hạn định trước.
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 25
Thiết kế bộ điều khiển thích nghi trực tiếp
Biểu thức mô tả động học sai số bám
sduu
T
uss bubbee −+−=+ δη ξθ~&
~~11 Hàm Lyapunov: uuTuseb
V θθ
22
2 Q+=
⇒ 22 )(~Tds ebeeueeV
&&& −−++−−= ξθθ Qδη 22 ssuuuuusss bb
Luật thích nghi thông số: suuu eξθ 1−=Q&
Thành phần điều khiển chế độ trượt: )sgn(
2 2 ss
b
usd eeb
Du ⎟⎟⎠
⎞
⎜⎜⎝
⎛ += δ
ố ổ
⇒ 0
2
≤−≤
b
eV sη&
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 26
⇒ Hệ th ng n định
Sơ đồ khối hệ thống điều khiển thích nghi trực tiếp
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 27
Thí dụ điều khiển thích nghi trực tiếp cánh tay máy
( ) á độ lê ủ á h áu t : moment t c ng n trục quay c a c n tay m y
φ(t): góc quay (vị trí) của cánh tay máy,
J: moment quán tính của cánh tay máy (J = 0.05 kg.m2)
M: khối lượng của cánh tay máy (M = 1 0kg).
m: khối lượng vật nặng (m = 0.1 kg)
l: chiều dài cánh tay máy (l = 0.4 m)
lC : khoảng cách từ trọng tâm cánh tay máy đến trục
quay (lC = 0.15 m)
B: hệ số ma sát nhớt (B = 0.2 kg.m2/s)
g: gia tốc trọng trường (g = 9 81 m/s2).
Phương trình vi phân mô tả cánh tay máy 1 bậc tự do:
)()(sin)()()()( 2 tutgMlmltBtmlJ C =++++ φφφ &&&
Giả sử trong quá trình vận hành, thông số cánh tay máy (thí dụ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 28
như trọng lượng tải) thay đổi.
Phương trình ngõ ra cánh tay máy
Phương trình vi phân mô tả cánh tay máy 1 bậc tự do:
)()(sin)()()()( 2 tutgMlmltBtmlJ C =++++ φφφ &&&
Đặt: )()( tty φ=
TT tttxtxt )](),([)](),([)( 21 φφ &==x
Phương trình ngõ ra cánh tay máy:
ubay )()( xx +=&&
)(
)(cos)()()( 2
12
mlJ
txgMlmltBxa C+
+−−=x
1)(b x
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 29
)( 2mlJ +=
Sơ đồ mô phỏng hệ thống điều khiển thích nghi trực tiếp cánh tay máy
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 30
Thiết kế bộ điều khiển thích nghi trực tiếp
Sử d thầụng mạng n
kinh RBF với 9 hàm
cơ sở ở lớp ẩn để
xấp xỉ trực tiếp tín
hiệu điều khiển hồi
tiếp tuyến tính hóa lý
tưởng:
)()(ˆ xx u
T
uu ξθ=
[ ]T)()()()( xxxx ξξξ=ξ
[ ]Tuuu 921 θθθ K=θ
uuuu 921 K
2
2
22
2
11 ])()[(
)( i
ii xx
i e
σ
μμ
ξ
−+−−
=x )6.0( =iσ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 31
u
Vị trí tâm các hàm cơ sở
ĐIỀU KHIỂN HỌC
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 32
Khái niệm điều khiển học
Hệ thố điề khiể h là hệ thố điề khiể ó khả ă ảing u n ọc ng u n c n ng c
thiện chất lượng điều khiển trong tương lai, dựa vào thông tin kinh
nghiệm mà hệ thống thu thập được trong quá khứ, thông qua tương
tác vòng kín với đối tượng và môi trường.
Đặc điểm của hệ thống điều khiển học:
Hệ thống điều khiển học có khả năng tự chủ (autonomy), vì nó
có thể cải thiện chất lượng của chính nó.
Hệ thống điều khiển học có bộ nhớ vì thông tin quá khứ là yếu tố
then chốt để cải thiện chất lượng tương lai.
Để ải thiệ hất l hệ thố điề khiể h hải hậ thôc n c ượng, ng u n ọc p n n ng
tin phải hồi chất lượng dựa trên một hàm mục tiêu mà hệ thống
tìm cực trị.
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 33
So sánh điều khiển học và điều khiển thích nghi
Giống nhau:
Cả hệ thống điều khiển thích nghi và điều khiển học đều có thể
thực thi bằng cách sử dụng các thuật toán chỉnh định thông số
Hai phương pháp điều khiển đều sử dụng thông tin phản hồi chất
lượng thu thập được qua tương tác vòng kín với đối tượng và
môi trường.
Khác nhau:
Khác biệt cơ bản giữa điều khiển thích nghi và điều khiển học là
khả năng sử dụng thông tin kinh nghiệm trong quá khứ.
Hệ thống điều khiển thích nghi không có bộ nhớ nên phải chỉnh
ố ốđịnh lại thông s khi ngay cả khi tình hu ng cũ lặp lại.
Hệ thống điều khiển học có bộ nhớ lưu trữ các cấu trúc và thông
số điều khiển đã học trong quá khứ -> không cần quá trình thích
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 34
nghi khi tình huống thay đổi lặp lại tình huống trong quá khứ.
Sơ đồ khối hệ thống điều khiển học
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 35
Thực thi hệ thống điều khiển học
Tra bảng:
Phân chia không gian tín hiệu vào thành các miền rời nhau sao
cho tín hiệu ra có thể được xác định bằng cách "tra bảng" tương
ềứng với mi n tín hiệu vào.
Rất nhiều hệ thống điều khiển học được thực hiện theo cách này.
Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu
vào tăng lên khi không gian trạng thái tăng lên hoặc số miền
phân chia mỗi chiều không gian trạng thái tăng lên.
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 36
Thực thi hệ thống điều khiển học
Xấp xỉ hàm:
Các hệ thống điều khiển học cao cấp hơn có thể phát triển dựa
trên cấu trúc toán học có thể xấp xỉ một họ các hàm liên tục; cấu
ể ố ế ổ ề ốtrúc này có th c định hay bi n đ i và có nhi u thông s tự do.
Thực thi hệ thống điều khiển học bằng cách xấp xỉ hàm có một
số ưu điểm hơn so với các tra bảng:
Thứ nhất, các hàm liên tục nói chung được mô tả một cách
hiệu quả hơn thông qua các thông số tự do, và do đó, cách
ấ ầ ể ể ễx p xỉ hàm c n ít bộ nhớ hơn đ bi u di n một hàm liên tục
so với cách tra bảng.
Thứ hai cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức,
là nội suy giữa những điểm tín hiệu vào).
Các cấu trúc xấp xỉ hàm được sử dụng phổ biến: mạng thần kinh
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 37
(MLP, RBF) và mô hình mờ (Mamdani, Takagi - Sugeno)
Thí dụ điều khiển học dùng mạng RBF
Đối tượng mô tả bởi mô hình toán học:
⎩⎨
⎧
=
+=+
)()(
)()()()()1(
kky
kuvkvk
Cx
BxAx
⎥⎦
⎤⎢⎣
⎡ −−=
0.00.1
95.0)2(665.0
)(
vv
vA
⎥⎥
⎤
⎢⎢
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +−=
−
1.113.0)( v
e
v
v
B
⎥⎦⎢⎣ 0.0
[ ]01=C
Trong đó v là biến hoạch định điểm làm việc, giả sử v thay đổi theo
qui luật sau: )(1.0)(9.0)1( kkvkv μ+=+
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 38
])1 ,0([)( randk =μ
Thí dụ điều khiển học dùng mạng RBF (tt)
Giả thiết hú t hỉ biết bậ ủ hệ thố (bậ 2) à khô biếtc ng a c c c a ng c m ng
ảnh hưởng của điểm làm việc đến đặc tính động học của hệ thống
như thế nào (tức là không biết cụ thể A(v) và B(v) phụ thuộc vào v
ếnhư th nào)
Mục tiêu điều khiển là bám theo tín hiệu vào với đáp ứng quá độ
cho trước.
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 39
Thí dụ điều khiển học dùng mạng RBF (tt)
S đồ khối hệ thố điề khiể h t tiếơ ng u n ọc rực p:
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 40
Thí dụ điều khiển học dùng mạng RBF (tt)
Mô hình chuẩn:
1625080
0025.0)( =sGm
Luật điều khiển hồi tiếp trạng thái:
)()()()( 32211 krKkxKkxKku +−−=
.. ++ ss
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 41
K1, K2: độ lợi hồi tiếp trạng thái, K3: độ lợi đầu vào
Thí dụ điều khiển học dùng mạng RBF (tt)
Mục đích của HT ĐK học là nhận dạng và lưu trữ vector thông số
của bộ điều khiển như là hàm của biến hoạch định điểm làm việc.
Mạng RBF: 1 ngõ vào v, 3 ngõ ra K1, K2, K3
31 tế bào thần kinh ở lớp ẩn phân bố đều trong đoạn
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 42
]0357.1 ,0357.0[−
Thí dụ điều khiển học dùng mạng RBF (tt)
ỗ ể ấ ẫ ố Quá trình học: Tại m i thời đi m l y m u hệ th ng học thực hiện
các tác vụ sau:
Đo lường biến hoạch định điểm làm việc
Đọc độ lợi điều khiển từ ngõ ra mạng RBF:
[ ]TkvKkvKkvKkv ))(())(())(())(( 321=K
Tính tín hiệu điều khiển hồi tiếp trạng thái
)()()()( 32211 krKkxKkxKku +−−=
Xuất tín hiệu điều khiển tác động vào đối tượng
Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra mong muốn
của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 43
Thí dụ điều khiển học dùng mạng RBF (tt)
Th ậ á ậ hậ ố RBF u t to n c p n t trọng s mạng :
Bước 1: giá trị hiệu chỉnh độ lợi điều khiển ở ngõ ra của mạng
RBF được tính dựa vào sai số giữa tín hiệu ra của mô hình chuẩn
và tín hiệu ra của hệ thống theo công thức:
)()())(( kkekvK φαδ =
Trong đó: α là hệ số dương nhỏ
)()()( kykyke ref −=
[ ] Tkkkk )()()()(φ rxx 21=
Bước 2: các trọng số lớp ra của mạng RBF được cập nhật bằng
th ật t á iả độ dốu o n suy g m c:
Trong đó: z là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn
))(()()1( kvKzww ji
l
ij
l
ij δη−=+ )3..1;31..1( == ji
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 44
i .
Thí dụ điều khiển học dùng mạng RBF (tt)
Mô hỏ kế ả p ng t qu :
Cứ 60 chu kỳ lấy mẫu giá trị μ(k) thay đổi một lần
Ba giá trị đầu tiên của μ(k) được gán bằng 0 1; 0 3; 0 6 . . .
Các giá trị sau đó được gán ngẫu nhiên trong đoạn [0,1]
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 45
Thí dụ điều khiển học dùng mạng RBF (tt)
Kế ả h l ậ điề khiể Độ l i hồi iế hái K ( ) t qu ọc u t u n: ợ t p trạng t 1 v
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 46
Thí dụ điều khiển học dùng mạng RBF (tt)
Kế ả h l ậ điề khiể Độ l i hồi iế hái K ( ) t qu ọc u t u n: ợ t p trạng t 2 v
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 47
Thí dụ điều khiển học dùng mạng RBF (tt)
Kế ả h l ậ điề khiể Độ l i hồi iế hái K ( ) t qu ọc u t u n: ợ t p trạng t 3 v
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 48
Thí dụ điều khiển học mờ
Đối tượng: tên lửa một tầng có mô hình toán học đơn giản cho bởi
phương trình:
⎟⎞⎜⎛−⎟⎟⎞⎜⎜⎛−⎟⎠
⎞⎜⎝
⎛= ACtvRgmtutdv daρ)(5.0)()( 20 ⎠⎝ −⎠⎝ +− mtMtyRmtMdt )(
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 49
Bài toán đặt ra là điều khiển vận tốc của tên lửa theo tín hiệu đặt
Thí dụ điều khiển học mờ (tt)
S đồ khối hệ thố điề khiể h ờơ ng u n ọc m :
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 50
Thí dụ điều khiển học mờ (tt)
Cơ chế học của hệ thống như sau:
Quan sát dữ liệu vào ra của hệ thống điều khiển mờ.
Đánh giá chất lượng của hệ thống điều khiển.
Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng
mong muốn (chất lượng mong muốn xác định bởi mô hình chuẩn
trong sơ đồ điều khiển) .
Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ.
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 51
Thí dụ điều khiển học mờ (tt)
Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ
gồm các qui tắc Sugeno với mệnh đề kết luận là hằng số.
Tín hiệu vào của bộ điều khiển PD mờ là:
sai số
biến thiên sai số:
ề ể ố ẩ
)()()( kykrke −=
Tkekeke /)]1()([)( −−=Δ
Tín hiệu ra của bộ đi u khi n là u(k). Các hệ s chu n hóa ở ngõ
và ngõ ra của bộ điều khiển là KE, KD, và KU được chọn như sau:
1 1
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 52
4000
=EK 2000=DK 10000=UK
Thí dụ điều khiển học mờ (tt)
Hà liê th ộ ủ á tậ ờ đị h hĩ h biế à (k) à Δ (k)m n u c c a c c p m n ng a c o n v o e v e :
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 53
Thí dụ điều khiển học mờ (tt)
Cá i tắ điề khiể ó dc qu c u n c ạng:
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 54
Thí dụ điều khiển học mờ (tt)
Mô hình chuẩn:
2.0
2.0
)(
)(
+= ssR
sYm
Chất lượng của hệ thống được tính bằng sai lệch giữa tín hiệu ra của
mô hình chuẩn và tín hiệu ra của đối tượng:
)()()( kykyke mm −=
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 55
Thí dụ điều khiển học mờ (tt)
Cơ chế học:
Nếu chất lượng mong muốn được thỏa mãn (em(k)≈0) thì cơ chế
học sẽ không điều chỉnh bộ điều khiển mờ.
Ngược lại, nếu chất lượng mong muốn không thỏa mãn (em(k)
lớn) thì cơ chế học sẽ điều chỉnh bộ điều khiển mờ
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 56
Thí dụ điều khiển học mờ (tt)
Mô hình ngược mờ:
Mô hình ngược mờ mô tả định tính đặc tính động học ngược của
đối tượng điều khiển.
Mô hình ngược được dùng để xác định sự thay đổi ở ngõ vào của
đối tượng làm cho ngõ ra của đối tượng giống như ngõ ra của mô
hình chuẩn .
Tín hiệu vào mô hình ngược là: em(k) và Δem(k)
Tín hiệu ra mô hình ngược là: p(k)
Các hệ số chuẩn hóa:
1=EK 1=K 10000=K4000m 2000Dm P
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 57
Thí dụ điều khiển học mờ (tt)
Hệ qui tắc mô tả mô hình ngược mờ:
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 58
Thí dụ điều khiển học mờ (tt)
Khối điều chỉnh cơ sở tri thức:
Điều chỉnh bộ điều khiển mờ để hệ thống đạt được chất lượng
điều khiển tốt hơn.
Cho thông tin về thay đổi cần thiết ở ngõ vào của đối tượng là
p(k), bộ điều chỉnh cơ sở tri thức sẽ cập nhật cơ sở tri thức của bộ
điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao
cho tác động điều khiển trước đó (tức u(k−1)) sẽ được thay đổi
một lượng là p(k).
M ốn đạt được điề nà ngõ ra của các q i tắc mờ tác động ở
)()1()1(* kpkuku +−=−
u u y u
thời điểm lấy mẫu thứ (k−1) phải được thay đổi một lượng là:
)()1()( kpkk +αα kpk )()(
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 59
ii −=
UK
p =
Thí dụ điều khiển học mờ (tt)
Kết quả điều khiển:
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 60
Thí dụ điều khiển học mờ (tt)
Sai số điều khiển:
10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 61
Các file đính kèm theo tài liệu này:
- bai_giang_he_thong_dieu_khien_thong_minh_chuong_5_dieu_khien.pdf