LỜI CAM ĐOAN. i
LỜI CẢM ƠN. ii
MỤC LỤC . iii
DANH MỤC CÁC KÝ HIỆU VIẾT TẮT . v
DANH MỤC CÁC HÌNH VẼ. vi
LỜI NÓI ĐẦU. 7
CHƢƠNG I: TỔNG QUAN VỀ TWIN ROTOR MIMO SYSTEM. 8
I.1 Giới thiệu về máy bay trực thăng và Twin Rotor MIMO System . 8
I.2 Cấu tạo của TRMS. 10
I.3 Các đặc điểm của bộ điều khiển TRMS . 11
I.3.1. Tính phi tuyến và hiện tƣợng xen kênh . 12
I.3.2. Tính bất định mô hình. 12
I.4 Tổng quan các nghiên cứu trong và ngoài nƣớc về TRMS . 12
I.4.1 Nhận dạng hệ thống . 12
I.4.2 Chiến lƣợc điều khiển của các các nghiên cứu trƣớc đây về TRMS . 13
I.5 Định hƣớng nghiên cứu và mục tiêu của đề tài . 14
I.5.1 Định hƣớng nghiên cứu . 14
I.5.2 Mục tiêu của đề tài. 15
KẾT LUẬN CHƢƠNG I. 15
CHƢƠNG II: MÔ HÌNH TOÁN HỌC CỦA TWIN ROTOR MIMO SYSTEM . 16
II.1 Giới thiệu chung . 16
II.2 Mô hình toán học của TRMS xây dựng dựa theo Euler – Lagrange . 16
KẾT LUẬN CHƢƠNG II. 24
CHƢƠNG III: THIẾT KẾ VÀ MÔ PHỎNG BỘ ĐIỀU KHIỂN CHO HỆ THỐNG 25
III.1 Chiến lƣợc điều khiển. 25
III.2 Lý thuyết về tối ƣu hóa bộ điều khiển PID bằng giải thuật di truyền GA. 26
III.2.1 Tổng quan về giải thuật di truyền GA. 26
III.2.2 Tối ƣu hóa bộ điều khiển PID bằng giải thuật di truyền GA . 27
III.3 Lý thuyết về bộ điều khiển LFFC trên cơ sở MRAS. 28
III.3.1 Điều khiển học (Learning Control - LC). 28
III.3.2 Bộ điều khiển thích nghi theo mô hình mẫu (MRAS) . 32
III.3.3 Bộ điều khiển LFFC trên cơ sở MRAS. 44
74 trang |
Chia sẻ: honganh20 | Ngày: 26/02/2022 | Lượt xem: 426 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Nâng cao chất lượng điều khiển cho hệ thống Twin Rotor MIMO System, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
c, hàm
mục tiêu của giải thuật GA là: min {J1, J2, J3}.
Ta có thể khái quát quá trình tìm bộ tham số tối ƣu của bộ điều khiển PID sử
dụng giải thuật di truyền GA bằng lƣu đồ thuật toán sau:
Hình 3.2: Lƣu đồ thuật toán tối ƣu hóa bộ điều khiển PID
Hiện nay giải thuật di truyền GA đã đƣợc hỗ trợ bởi phần mềm MATLAB với
công cụ Genetic Algorithm hoặc gọi các chức năng giải thuật toán di truyền từ
Command Line. Trong quá trình mô phỏng ta sẽ sử dụng công cụ này để tối ƣu hóa
bộ điều khiển PID từ đó thiết kế bộ điều khiển cho toàn hệ thống.
III.3 Lý thuyết về bộ điều khiển LFFC trên cơ sở MRAS
Trong phần này của luận văn, giới thiệu về bộ điều khiển LFFC trên cơ sở
MRAS, nhƣng trƣớc tiên cần tìm hiểu một số khái niệm mới:
III.3.1 Điều khiển học (Learning Control - LC) [18]
Các bộ điều khiển học LC thƣờng đƣợc hình dung giống nhƣ là một hệ thống
điều khiển của con ngƣời và do đó nó có các thuộc tính giống với con ngƣời. Trong
Đúng
Bắt đầu
Khởi tạo quần thể ngẫu nhiên
cho bộ thông số Kp, Ki, Kd
Thiết lập PID và mô phỏng hệ
thống kín để tìm sai lệch e(t)
Hội tụ
Các thủ tục của GA:
Chọn lọc
Lai ghép
Đột biến
Sản sinh thể hệ mới
Lƣu bộ thông số
𝐾𝑝
∗, 𝐾𝑖
∗, 𝐾𝑑
∗ tối ƣu
Kết thúc
Xác định giá trị
Hàm mục tiêu Ji(i=1,2,3)
Sai
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 29 - Học viên: Nguyễn Thị Tuyết Hoa
luận văn này không nghiên cứu bộ LC theo quan điểm sinh học nhƣng dựa trên một
số định nghĩa sau:
Định nghĩa 1.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đó một
hàm xấp xỉ các ánh xạ đầu vào – đầu ra tƣơng ứng trong suốt quá trình điều khiển
sao cho hoạt động mong muốn của hệ thống điều khiển đạt đƣợc.
Định nghĩa 1.2: Một bộ xấp xỉ hàm (function approximator) là một ánh xạ
vào/ra đƣợc xác định bởi một hàm đƣợc lựa chọn .,F , với các véc tơ thông số
đƣợc lựa chọn để hàm .F đƣợc xấp xỉ tốt nhất.
Nhƣ vậy, một bộ LC sẽ bao gồm một bộ xấp xỉ hàm cho một đối tƣợng có
nhiều hàm mục tiêu. Các bộ xấp xỉ hàm có thể đƣợc sử dụng theo 2 cách:
- Trƣớc hết, bộ xấp xỉ hàm có thể đƣợc sử dụng để tạo (một phần) tín hiệu điều
khiển. Việc học đƣợc tổ chức bằng cách thích nghi véc tơ thông số của bộ xấp
xỉ hàm theo cách cực tiểu một số hàm chi phí. Bộ điều khiển này đƣợc gọi là
LC trực tiếp.
- Thứ hai, bộ xấp xỉ hàm có thể đƣợc sử dụng để học một mô hình đối tƣợng.
Dựa trên cơ sở của mô hình đã đƣợc học, bộ điều khiển đƣợc xây dựng, bộ
điều khiển này đƣợc gọi là LC gián tiếp.
Để bộ xấp xỉ hàm phù hợp cho việc điều khiển cần thỏa mãn những điểu kiện
sau:
- Cần sử dụng dung lƣợng nhớ nhỏ. Dung lƣợng bộ nhớ là có hạn, do đó số
lƣợng các thông số của bộ xấp xỉ hàm mà yêu cầu phải xấp xỉ tín hiệu điều khiển
không thể quá rộng.
- Việc tính toán đầu ra của hàm xấp xỉ và sự tƣơng thích của quan hệ vào/ra
phải đƣợc thực hiện một cách nhanh chóng. Trong môi trƣờng thời gian thực, trong
một khoảng thời gian lấy mẫu, các thông số của hàm xấp xỉ phải tƣơng ứng và đầu
ra tính đƣợc. Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ
và cho phép thời gian tính toán là rất ít. Các hàm xấp xỉ mà bao gồm một lƣợng lớn
các tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển.
- Cơ chế học cần hội tụ nhanh. Để giữ đƣợc lƣợng thời gian trong đó quá trình
vận hành của hệ thống đƣợc điều khiển tối ƣu từng phần, tiến tới mức cực tiểu, cơ
chế học cần hội tụ nhanh.
- Cơ chế học không nên bị cực tiểu cục bộ, khi bị lƣu giữ trong mức cực tiểu
cục bộ, thì cơ chế học cho rằng các giá trị đạt đƣợc của các thông số của hàm xấp
xỉ, đƣợc biểu thị bởi ωloc, sinh ra sai số xấp xỉ cực tiểu, đƣợc biểu thị bởi E(ωloc ).
ωglob ≠ ωloc làm cho E(ωglob) ≠ E(ωloc)
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 30 - Học viên: Nguyễn Thị Tuyết Hoa
Hình 3.3: Cực tiểu cục bộ và cực tiểu toàn bộ trong kỹ thuật học
- Hàm xấp xỉ có khả năng tự khái quát hoá tốt. Khả năng tự khái quát hoá là
khả năng tạo ra một đầu ra nhạy cho một đầu vào không đƣợc thể hiện trong quá
trình huấn luyện nhƣng nó tƣơng tự nhƣ các huấn luyện mẫu. Khi hàm xấp xỉ có
khả năng khái quát hoá tốt, bộ LC cũng sẽ thu đƣợc một hiệu quả bám cao cho các
chuyển động tƣơng tự các chuyển động đƣợc huấn luyện. Vì vậy nó đủ để huấn
luyện LC với một lƣợng nhỏ các đặc tính chuyển động huấn luyện. Khi bộ xấp xỉ
không có khả năng tự khái quát hoá tốt, bộ LC phải đƣợc huấn luyện cho mỗi
chuyển động quan trọng, nó tạo ra một quá trình huấn luyện mở rộng .
- Sự mềm mại của giá trị xấp xỉ cần điều khiển đƣợc. Bộ LC không chỉ thu
đƣợc sai số bằng không đối với một vài tần số, khi tín hiệu điều khiển có tần số cao
sẽ không thỏa mãn theo mong muốn. Ngƣời sử dụng phải có khả năng quyết định
tần số lớn nhất của đầu ra của hàm xấp xỉ.
- Đáp ứng ngắn hạn là học tốt. Đáp ứng ngắn hạn của bộ LC nên là loại đáp
ứng mà có sai số bám dần hội tụ về giá trị mong muốn. Việc tăng sai số bám trong
pha trung gian của quá trình học có thể làm hỏng đối tƣợng, hơn thế nữa, đây là
trƣờng hợp quá trình làm việc tối thiểu có thể không còn đƣợc bảo đảm khi bộ điều
khiển đƣợc sử dụng nhƣ một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn.
- Sự ổn định lâu dài cần phải đƣợc bảo đảm. Việc tự học có thể đƣợc thực hiện
một cách liên tục hoặc đƣợc thực hiện trƣớc khi vận hành. Việc học liên tục đƣợc
yêu cầu khi các thông số của đối tƣợng thay đổi trong suốt quá trình vận hành.
Cấu trúc điều khiển của bộ điểu khiển học LC:
Cực tiểu cục bộ
Cực tiểu toàn bộ
E
loc glob loc
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 31 - Học viên: Nguyễn Thị Tuyết Hoa
Hình 3. 4: Cấu trúc bộ điều khiển học LC
Bộ điều khiển học LC bao gồm 2 phần:
- Bộ điều khiển truyền thẳng (Feed – forward controller): Đƣợc biểu thị bằng
F, nghĩa là 1 hàm/ánh xạ uF = F(r). Một bộ điều khiển Feed – forward thông thƣờng
có thể đƣợc sử dụng để bù thêm cho các hệ thống động học và theo cách này sẽ thu
đƣợc độ bám chính xác cao. Khi bộ điều khiển feed – forward bằng với nghịch đảo
của đối tƣợng 1 PF , thì đầu ra của đối tƣợng y sẽ bằng tín hiệu đặt r. Đối tƣợng
P , luôn chịu sự tác động của nhiễu. Các loại nhiễu bao gồm cả nhiễu ngẫu nhiên và
nhiễu có bản chất chu kỳ. Những nhiễu chu kỳ tái diễn giống nhau khi một chuyển
động cụ thể đƣợc lặp lại. Điều này có nghĩa rằng chúng có thể đƣợc xem xét nhƣ
một hàm trạng thái của đối tƣợng x và có thể lƣờng trƣớc.
- Bộ điều khiển phản phản hồi (Feedback controller): Bộ điều khiển phản
hồi (C) cung cấp các tín hiệu học cho bộ điều khiển feed – forward, nó xác định quá
trình bám cực tiểu tại thời điểm bắt đầu học và đồng thời có tác dụng bù các nhiễu
ngẫu nhiên.
Từ thực nghiệm cho thấy cấu trúc của bộ điều khiển LC nhƣ hình 3.4 đã cải
thiện một cách rõ rệt chất lƣợng điều khiển so với bộ điều khiển phản hồi đơn, nếu
cách học tốt thì bộ điều khiển LC có khả năng đáp ứng rất tốt. Tuy nhiên với cấu
trúc này, bộ điều khiển LC vẫn còn tồn tại một số hạn chế (Cơ chế học hội tụ chậm
và trải qua vùng giá trị cực tiểu cục bộ). Để khắc phục nhƣợc điểm này thì sơ đồ
cấu trúc hình 3.5 đƣợc đề xuất:
Hình 3.5: Cấu trúc bộ điều khiển học LC kết hợp feed forward và feedback
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 32 - Học viên: Nguyễn Thị Tuyết Hoa
Lúc này tín hiệu sai lệch e đƣợc đƣa thêm vào đầu vào của bộ xấp xỉ hàm, nhƣ
vậy từ một bộ điều khiển học thuần túy (pure – learning controller) ta sẽ có đƣợc bộ
điều khiển học kết hợp điều khiển truyền thẳng (feed forward) và điều khiển phản
hồi (feedback).
Cấu trúc bộ điều khiển học LC nhƣ hình 3.4 và hình 3.5 còn có tên gọi là bộ
điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL). Trong
cấu trúc này, vòng điều khiển truyền thẳng sử dụng bộ xấp xỉ hàm theo mạng nơron
(Multi Layer Perceptron – MLP) hoặc mạng Cerebellar Model Articulation
Controller (CMAC) [18].
Bộ điều khiển học truyền thẳng (Learning Feed Forward Controller – LFFC)
có cấu trúc tƣơng tự nhƣ bộ điều khiển FEL tuy nhiên thay vì sử dụng bộ xấp xỉ
hàm là MLP hay CMAC thì bộ điều này sử dụng bộ xấp xỉ hàm là B-spline network
(BSN) hoặc bộ thích nghi theo mô hình mẫu MRAS.
Trong phạm vi nghiên cứu của luận văn ta sẽ sử dụng bộ điều khiển học
truyền thẳng LFFC dựa trên cơ sở MRAS.
III.3.2 Bộ điều khiển thích nghi theo mô hình mẫu (MRAS)
Điều khiển thích nghi (ĐKTN) ra đời năm 1958 để đáp ứng yêu cầu của thực
tế mà các hệ điều khiển truyền thống không thoả mãn đƣợc. Trong các hệ điều
khiển truyền thống, các xử lý điều khiển thƣờng dùng những mạch phản hồi là
chính. Vì vậy, chất lƣợng ra của hệ bị thay đổi khi có nhiễu tác động hoặc tham số
của hệ thay đổi. Trong hệ ĐKTN cấu trúc và tham số của bộ điều khiển có thể thay
đổi đƣợc vì vậy chất lƣợng ra của hệ đƣợc đảm bảo theo các chỉ tiêu đã định.
Hệ ĐKTN có mô hình mẫu MRAS (Moded Reference Adaptive System) đã
đƣợc Whitaker đề xuất khi giải quyết vấn đề điều khiển lái tự động máy bay năm
1958. Phƣơng pháp độ nhậy và luật MIT đã đƣợc dùng để thiết kế luật thích nghi
với mục đích đánh giá các thông số không biết trƣớc trong sơ đồ MRAS.
Thập kỷ 60 là thời kỳ quan trọng nhất trong việc phát triển các lý thuyết tự
động, đặc biệt là lý thuyết ĐKTN. Kỹ thuật không gian trạng thái và lý thuyết ổn
định dựa theo luật Liapunov đã đƣợc phát triển. Một loạt các thuyết nhƣ: Điều
khiển đối ngẫu, điều khiển ngẫu nhiên, nhận dạng hệ thống, đánh giá thông sốra
đời cho phép tiếp tục (nghiên cứu lại) phát triển và hoàn thiện lý thuyết ĐKTN. Vào
năm 1966 Park và các đồng nghiệp đã tìm đƣợc phƣơng pháp mới để tính toán lại
luật thích nghi sử dụng luật MIT ứng dụng vào các sơ đồ MRAC của những năm 50
bằng cách ứng dụng lý thuyết của Liapunov.
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 33 - Học viên: Nguyễn Thị Tuyết Hoa
Những năm 80 nhiều thiết kế đã đƣợc cải tiến, dẫn đến ra đời lý thuyết ĐKTN
bền vững. Một hệ ĐKTN đƣợc gọi là bền vững nếu nhƣ nó đảm bảo chất lƣợng ra
cho một lớp đối tƣợng trong đó có đối tƣợng đang xét. Nội dung của bài toán bễn
vững trong ĐKTN là điều khiển những đối tƣợng có thông số không biết trƣớc và
biến đổi theo thời gian. Cuối thập kỷ 80 có các công trình nghiên cứu về hệ thống
ĐKTN bền vững, đặc biệt là MRAS cho các đối tƣợng có thông số biến thiên theo
thời gian.
Các nghiên cứu của những năm 90 đến nay tập trung vào đánh giá kết quả của
nghiên cứu những năm 80 và nghiên cứu các lớp đối tƣợng phi tuyến có tham số bất
định. Những cố gắng này đã đƣa ra một lớp sơ đồ MRAS xuất phát từ lý thuyết hệ
thống phi tuyến.
Một hệ thống thích nghi có thể đƣợc định nghĩa nhƣ sau:
“Một hệ thống thích nghi là một hệ thống mà trong bản thân nó đã bổ sung
vào cấu trúc (phản hồi) cơ bản, kết quả đo chính xác đƣợc đƣa vào để bù lại một
cách tự động đối với những thay đổi trong mọi điều kiện hoạt động, với những thay
đổi trong những quá trình động học, hoặc với những biến đổi do nhiễu hệ thống,
nhằm để duy trì một quá trình thực hiện tối ƣu cho hệ thống”.
Hệ thống điều khiển thích nghi có thể đƣợc phân loại theo một vài cách khác
nhau. Một khả năng tạo ra sự phân biệt giữa chúng là: Điều khiển thích nghi trực
tiếp và điều khiển thích nghi gián tiếp
- Hệ thống với sự chỉnh định trực trực tiếp các tham số điều khiển mà không
nhận dạng rõ các tham số của đối tƣợng (điều khiển thích nghi trực tiếp).
- Hệ thống với sự điều chỉnh gián tiếp các tham số điều khiển với việc nhận
dạng rõ các tham số của đối tƣợng (điều khiển thích nghi gián tiếp).
Hệ thống điều khiển thích nghi mô hình tham chiếu (mô hình mẫu), hầu hết
đƣợc gọi là MRAC hay MRAS, chủ yếu áp dụng điều khiển thích nghi trực tiếp.
Triết lý cơ bản đằng sau việc áp dụng MRAC đó là đặc trƣng mong muốn của hệ
thống đƣợc đƣa ra bởi một mô hình toán học, hay còn gọi là mô hình mẫu. Khi hành
vi của đối tƣợng khác với hành vi “lý tƣởng” mà hành vi này đƣợc xác định bởi mô
hình mẫu, đối tƣợng sẽ đƣợc sửa đổi theo 2 cách, hoặc bằng cách chỉnh định các
thông số của bộ điều khiển (Hình 3.6a), hoặc bằng cách tạo ra tín hiệu bổ xung đầu
vào cho đối tƣợng này (Hình 3.6b) [20]. Điều này có thể đƣợc chuyển thành bài
toán tối ƣu hoá, ví dụ tối thiểu hoá các tiêu chuẩn:
T
2
0
C = e dt
(3.2)
Tại đó: e = ym – yp (3.3)
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 34 - Học viên: Nguyễn Thị Tuyết Hoa
Ngoài việc tối thiểu hoá sai lệch giữa những tín hiệu đầu ra của đối tƣợng và
mô hình mẫu, thì tất cả các biến trạng thái của đối tƣợng và mô hình mẫu còn đƣợc
đƣa vào tính toán. Khi các biến trạng thái của đối tƣợng đƣợc ký hiệu là (xp) và các
biến trạng thái của mô hình mẫu ký hiệu là (xm), véc tơ sai lệch e đƣợc định nghĩa
là:
e = xm – xp (3.4)
Trong trƣờng hợp này, bài toán tối ƣu hoá có thể đƣợc chuyển thành tối thiểu
hoá tiêu chuẩn:
T
T
0
C = e Pedt
(3.5)
Trong đó P là một ma trận xác định dƣơng.
Hình 3.6: Hệ thích nghi tham số
Hình 3.7: Hệ thích nghi tín hiệu
Đối tƣợng
Bộ điều khiển
Thích nghi
Mô hình mẫu
Bộ điều khiển
u +
- y
+
-
+
-
Đối tƣợng
Bộ điều khiển
Thích nghi
Mô hình mẫu
Bộ điều khiển
u +
-
y
+
-
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 35 - Học viên: Nguyễn Thị Tuyết Hoa
Sự nhân trong bộ điều khiển thích nghi luôn luôn dẫn đến một hệ thống phi
tuyến. Điều này có thể đƣợc giải thích rằng việc điều khiển thích nghi là phản hồi
phi tuyến nhiều hơn.
Những xem xét sau đây đóng một vai trò nhất định trong việc lựa chọn giữa
thích nghi tham số và thích nghi tín hiệu. Một tính chất quan trọng của hệ thống với
việc thích nghi tham số đó là vì hệ thống có nhớ. Ngay khi các tham số của đối
tƣợng đã đƣợc điều chỉnh đúng với giá trị của chúng và những tham số này không
thay đổi nữa, vòng lặp thích nghi trong thực tế không còn cần thiết: đối tƣợng thực
và mô hình mẫu hiển thị các trạng thái nhƣ nhau. Sự nhớ nói chung là không đƣợc
thể hiện trong hệ thống cùng với thích nghi tín hiệu. Do đó, vòng lặp thích nghi vẫn
còn cần thiết trong mọi trƣờng hợp, để nhằm liên tục tạo ra những tín hiệu phù hợp
ở đầu vào. Do vậy, các hệ thống thích nghi tín hiệu cần phải phản ứng nhanh hơn
hẳn đối với những thay đổi động học của đối tƣợng so với các hệ thống thích nghi
tham số vì hệ thích nghi tín hiệu không sử dụng thông tin từ quá khứ. Trong những
hệ thống mà các thông số liên tục thay đổi trong một phạm vi rộng, sự có mặt của
tính chất nhớ là rất có lợi. Tuy nhiên, trong một môi trƣờng ngẫu nhiên, ví dụ nhƣ
trong các hệ thống với rất nhiều nhiễu, điều này lại là bất lợi. Hệ số cao trong vòng
thích nghi có thể gây nhiễu đƣa tới đầu vào của đối tƣợng.
Khi các tham số của đối tƣợng thay đổi chậm hoặc chỉ thời gian ngắn ngay sau
đó và ngay lúc đó, những hệ thống với sự thích nghi tham số đƣa ra một cách thực
hiện tốt hơn vì chúng có nhớ. Cũng có một vài thuật toán thích nghi mà kết hợp
những ƣu điểm của cả hai phƣơng pháp trên. Các vòng điều khiển phản hồi tiêu
chuẩn đƣợc xem nhƣ là một hệ thống điều khiển sơ cấp phản ứng nhanh, chính xác
mà nó buộc phải loại ra nhiễu “thông thƣờng”. Những biến thiên lớn trong các tham
số hoặc là nhiễu lớn đƣợc xử lý bởi hệ thống điều khiển thích nghi thứ hai (phụ) tác
động chậm hơn (Hình 3.7).
Hình 3. 8: Điều khiển ở cấp 1 và cấp 2
Đối tƣợng
Bộ điều khiển
Thích nghi
Mô hình mẫu
Bộ điều khiển
u + - y
+
-
Bộ điều khiển thứ nhất của hệ
Bộ điều khiển thứ hai của hệ
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 36 - Học viên: Nguyễn Thị Tuyết Hoa
Cơ chế thích nghi – thiết kế bộ điều khiển thích nghi dựa vào luật MIT
[20]
Trong lĩnh vực điều khiển nâng cao, một vài phƣơng pháp đã đƣợc mô tả để
thiết kế hệ thống thích nghi. Nhƣng chúng ta có thể có đƣợc cái nhìn sâu sắc hơn
với phƣơng pháp này bằng cách tƣ duy làm cách nào tự tìm đựơc các thuật toán cho
mình. Điều này giúp ta thực sự hiểu đƣợc những gì đang diễn ra. Do đó, trong lúc
này ta sẽ hoãn lại việc xem xét những hàm toán học và xem xét các ý tƣởng cơ bản
của MRAS với một ví dụ đơn giản. Khi chúng ta cố gắng thiết kế một bộ điều khiển
thích nghi cho hệ thống đơn giản này, chúng ta sẽ gặp phải những vấn đề mà cần
đến nền lý thuyết cơ bản hơn. Những tính chất nói chung với những phƣơng pháp
thiết kế khác nhau và là sự khác biệt giữa các phƣơng pháp này sẽ trở lên rõ ràng.
Tất nhiên việc “điều khiển” với tham số Ka và Kb không phải là một bộ điều khiển
thực tế. Trong thực tế, chúng tôi giả thiết ở phần này là các thông số đối tƣợng có
thể đƣợc chỉnh định trực tiếp.
Ví dụ ta có đối tƣợng (tuyến tính) đƣợc mô tả bằng hàm truyền:
p
2
p
b
s +a s +1
và
mô hình hoá bởi:
m
2
m
b
s + a s +1
hoặc
2
n
2 2
n n
Kω
s + 2ξω s + ω
Sự biến đổi trong tham số ap đƣợc bù lại bằng cách hiệu chỉnh Ka và những
biến đổi trong tham số bp đƣợc chỉnh định bằng cách điều chỉnh Kb. Điều này tuân
theo 1 cách trực tiếp từ hàm truyền của đối tƣợng cộng với bộ điều khiển trong
Hình 3.9:
b p
2
p a
K + b
s +(a + K )s +1
Mô hình tham chiếu (tuyến tính) đã có bậc giống với đối tƣợng. Giá trị tính
toán sau đƣợc lựa chọn:
n p pω =1; z = 0,7; a =1,4; b = 0,5
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 37 - Học viên: Nguyễn Thị Tuyết Hoa
Vì e = ym – yp và p m
1
y = y
2
, trong truờng hợp này sai lệch e bằng yp. Để nhận
đƣợc 2 đáp ứng giống nhau, các tham số Kb cần đƣợc hiệu chỉnh tăng lên. Sự lựa
chọn hợp lý cho việc chỉnh định Kb là: b bK (t) = K (0) +β edt (3.6a)
Hình 3. 9: Mô hình đối tƣợng và mô hình mẫu
Với “ hệ số thích nghi” β tốc độ chỉnh định có thể đƣợc đặt lại. Các chức
năng nhớ yêu cầu đƣợc thực hiện bằng cách lấy tích phân mà cũng phải đảm bảo
rằng một hằng số khác nhau giữa (Kb + bp) và bm, sai lệch e hội tụ về 0. Tuy nhiên
khi tín hiệu đầu vào u bị đảo dấu việc chỉnh định của Kb sẽ đi sai hƣớng, vì e mang
dấu âm. Kết quả là hệ thống lại mất ổn định. Giải pháp cho vấn đề này đƣợc đƣa ra
đó là : dấu của tín hiệu vào đƣợc đƣa vào tính toán, ví dụ bằng cách nhân e và u, kết
quả của việc chỉnh định thông số lại phù hợp. Điều này nhận đƣợc luật điều chỉnh
đƣợc gọi là luật MIT:
b bK (t) = K (0) +β (eu)dt (3.6b)
ym
yp
aP
bP
Kb
?
Ka
2
2 22
n
n ns s
Đối tƣợng
Mô hình mẫu
u _ +
+
+
_
+
_
_
+
e
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 38 - Học viên: Nguyễn Thị Tuyết Hoa
Đối với bài toán thích nghi MRAS thƣờng gặp phải 2 vấn đề sau:
1 – Loại „tốc độ động thích nghi‟ cần thiết để nhận ra là mỗi tham số chỉ đƣợc
chỉnh định khi kết quả sai lệch là nhạy cảm với sự thay đổi của tham số đó.
2 – Vấn đề ổn định còn tồn tại khi hệ số thích nghi đƣợc tăng lên đòi hỏi tăng
tốc độ thích nghi. Vấn đề ổn định này không thể dễ dàng đƣợc giải quyết bằng
phƣơng pháp phân tích tuyến tính bởi vì sự thích nghi tạo ra hệ thống phi tuyến.
Để giải quyết hai vấn đề này thì hai phƣơng pháp sẽ đƣợc bàn luận chi tiết hơn
trong phần sau:
- Phương pháp độ nhạy. Phƣơng pháp này nhấn mạnh sự xác định „ tốc độ
động của sự thích nghi‟ với sự trợ giúp của hệ số nhạy.
- Phương pháp ổn định. Phƣơng pháp này nhấn mạnh đến vấn đề ổn định. Bởi
vì đặc tính phi tuyến của một hệ thích nghi. Lúc này cần tiết phải dử dụng lý thuyết
ổn định của hệ phi tuyến. Điều này cho thấy cùng với một chứng minh về tính ổn
định, những luật thích nghi hữu ích có thể đƣợc tìm ra.
Phương pháp độ nhạy
Bƣớc đầu tiên trong phƣơng pháp độ nhạy là chuyển vấn đề thích nghi thành
bài toán tối ƣu bằng việc đƣa ra tiêu chuẩn:
t
2
0
1
C = e dτ
2 (3.7)
Để tối thiểu hoá C, những tham số chỉnh định Ki đƣợc thay đổi. Hƣớng của
những thay đổi này đƣợc xác định bởi đạo hàm riêng iC/ K , vì vậy:
i i
i
C
K = -α
K
(3.8)
Bằng cách lấy vi phân công thức (3.8) theo t, luật thích nghi tƣơng tự có thể
đƣợc tìm ra:
i
i
i
dK d C
= -α
dt dt K
(3.9)
Từ công thức (3.7) và (3.9) ta đƣợc:
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 39 - Học viên: Nguyễn Thị Tuyết Hoa
2i
i
i
dK 1
= -α
dt K 2
e
(3.10)
Hay:
i
i
i
dK e
= -α
dt K
e
(3.11)
Trong công thức (3.10) sai lệch đƣợc định nghĩa là:
e =ym - yP (3.12)
bởi vì / 0m iy K , theo công thức (3.10) và (3.11) thì:
i
i
i
dK
= α
dt K
Pye
(3.13)
Hƣớng chỉnh định và lƣợng chỉnh định quan hệ với các tham số khác bây giờ
đƣợc xác định bởi sai lệch e và hệ số độ nhạy /P iy K . Sau đó đƣợc xác định bởi
phƣơng pháp mô hình độ nhạy. Hệ số độ nhạy đƣợc nhận thấy rõ rằng việc hiệu
chỉnh Ki chỉ đƣợc thực hiện khi sai lệch giữa đối tƣợng và mô hình mẫu là nhạy
cảm với sự thay đổi của những tham số điển hình này.
Ví dụ:
Đối tƣợng trong Hình 1.6 có thể đƣợc mô tả bởi phƣơng trình vi phân:
( ) ( )P P a P P b Py a K y y K b u (3.14)
Ở đó y ký hiệu cho dy/dt và 2 2/y d y dt
Sau đó tham số KV đƣợc đƣa vào công thức (3.14) có thể đƣợc viết lại thành
công thức (3.15).
KV = aP + Ka (3.15)
( )P V P P b Py K y y K b u (3.16)
Đạo hàm công thức này theo KV mang lại:
P P P
V P
V V V
y y y
K y
K K K
(3.17)
Phƣơng trình vi phân (3.17)tƣơng đƣơng với phƣơng trình (3.14), ngoại trừ
đối với tín hiệu vào. Phƣơng trình (3.17) đƣợc gọi là mô hình độ nhạy. Khi 1 ƣớc
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 40 - Học viên: Nguyễn Thị Tuyết Hoa
lƣợng đƣợc tạo ra với giá trị của KV, ví dụ bằng việc lựa chọn nó bằng với giá trị
mong muốn am, hệ số độ nhạy /P iy K có thể đo đƣợc. Từ phƣơng trình (3.14) dẫn
đến:
dK
= α
dt K
V P
V
y
e
(3.18)
Giả sử rằng tham số đối tƣợng aP thay đổi chậm hơn so với tham số chỉnh định
Ka do sự thích nghi, sau đó từ biểu thức (3.15) thấy rằng:
dK
dt
V adK
dt
và
K
P P
V a
y y
K
(3.19)
Kết quả hệ thống thích nghi đƣợc đƣa ra trong Hình 3.10
Hình 3. 10: Hệ thống điều khiển thích nghi dựa trên mô hình độ nhậy.
Ka đƣợc chỉnh định để bù cho sự thay đổi trong ap. Phƣơng pháp độ nhạy có
ƣu điểm là đơn giản và không phức tạp. Bất lợi chính đó là sự ổn định có thể chỉ
đƣợc chứng minh bằng mô phỏng hoặc kiểm nghiệm thực tế. Một chứng minh toán
học giải thích về sự ổn định không đƣợc đƣa ra rõ ràng.
Phương pháp ổn định của Liapunov
Việc thiết kế các hệ thống thích nghi dựa trên lý thuyết ổn định đƣợc bắt
nguồn từ những bài toán về ổn định trong thiết kế ví dụ nhƣ những bài toán dựa trên
các mô hình độ nhạy. Phƣơng pháp thứ 2 của Liapunov là phƣơng pháp phổ biến
nhất. Một phƣơng pháp khác có liên quan dựa trên lý thuyết “siêu ổn định”. Cả hai
phƣơng pháp có thể mang đến kết quả giống nhau, đến nỗi mà không có một sự
thích trực tiếp nào đối với một trong hai về các thuật toán kết quả.
aP
b
P
K
b
K
a
Đối tƣợng
u y
b
m
a
m
_ + +
+
+
+
+
_
_
_
Mô hình độ nhạy
Đ
ố
i
t
ƣ
ợ
n
g
Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS
GVHD: PGS.TS Nguyễn Duy Cương - 41 - Học viên: Nguyễn Thị Tuyết Hoa
Việc sử dụng lý thuyết ổn định Liapunov cho thiết kế các hệ thống thích nghi
đƣợc đƣa ra bởi Park năm 1966. Nguồn gốc luật thích nghi đƣợc thực hiện dễ dàng
nhất khi đối tƣợng và mô hình mẫu đƣợc mô tả dƣới dạng mô hình không gian trang
thái. Đối tƣợng có thể đƣợc mô tả:
p p p px A x B u (3.20)
với
'
p p aA A K (3.21)
và
'
p p bB B K (3.22)
ở đó
'
pA và
'
pB là tham số đối tƣợng thay đổi mà có thể đƣợc bù bởi các
tham số bộ điều khiển Ka, Kb. Mô tả mô hình mẫu có thể đƣợc mô tả
m m m mx A x B u (3.23)
Trừ biểu thức (3.23) cho biểu thức (3.20), sau đó định nghĩa e:
m pe x x (3.24)
m pe A e Ax Bu (3.25)
Với:
m pA A A (3.26)
m pB B B (3.27)
Việc điều chỉnh A và B đòi hỏi phải có các luật thích nghi phi tuyến. Để đảm
bảo rằng khi t thì e = 0, điều kiện cần và đủ đó là chứng minh rằng e = 0 là
một giải pháp cân bằng ổn định. Theo lý thuyết ổn định Liapunov điều này có thể
thực hiện đƣợc khi chúng ta có thể tìm đƣợc một hàm (vô hƣớng) Liapunov V(e)
với tính chất sau:
V(e) xác định dƣơng (nghĩa là V > 0 với 0e , và V= 0 khi e = 0).
V(e) xác định âm (nghĩa là V < 0 với 0e , và V = 0 khi e = 0).
Các file đính kèm theo tài liệu này:
- luan_van_nang_cao_chat_luong_dieu_khien_cho_he_thong_twin_ro.pdf