Luận văn Nâng cao chất lượng điều khiển cho hệ thống Twin Rotor MIMO System

LỜI CAM ĐOAN. i

LỜI CẢM ƠN. ii

MỤC LỤC . iii

DANH MỤC CÁC KÝ HIỆU VIẾT TẮT . v

DANH MỤC CÁC HÌNH VẼ. vi

LỜI NÓI ĐẦU. 7

CHƢƠNG I: TỔNG QUAN VỀ TWIN ROTOR MIMO SYSTEM. 8

I.1 Giới thiệu về máy bay trực thăng và Twin Rotor MIMO System . 8

I.2 Cấu tạo của TRMS. 10

I.3 Các đặc điểm của bộ điều khiển TRMS . 11

I.3.1. Tính phi tuyến và hiện tƣợng xen kênh . 12

I.3.2. Tính bất định mô hình. 12

I.4 Tổng quan các nghiên cứu trong và ngoài nƣớc về TRMS . 12

I.4.1 Nhận dạng hệ thống . 12

I.4.2 Chiến lƣợc điều khiển của các các nghiên cứu trƣớc đây về TRMS . 13

I.5 Định hƣớng nghiên cứu và mục tiêu của đề tài . 14

I.5.1 Định hƣớng nghiên cứu . 14

I.5.2 Mục tiêu của đề tài. 15

KẾT LUẬN CHƢƠNG I. 15

CHƢƠNG II: MÔ HÌNH TOÁN HỌC CỦA TWIN ROTOR MIMO SYSTEM . 16

II.1 Giới thiệu chung . 16

II.2 Mô hình toán học của TRMS xây dựng dựa theo Euler – Lagrange . 16

KẾT LUẬN CHƢƠNG II. 24

CHƢƠNG III: THIẾT KẾ VÀ MÔ PHỎNG BỘ ĐIỀU KHIỂN CHO HỆ THỐNG 25

III.1 Chiến lƣợc điều khiển. 25

III.2 Lý thuyết về tối ƣu hóa bộ điều khiển PID bằng giải thuật di truyền GA. 26

III.2.1 Tổng quan về giải thuật di truyền GA. 26

III.2.2 Tối ƣu hóa bộ điều khiển PID bằng giải thuật di truyền GA . 27

III.3 Lý thuyết về bộ điều khiển LFFC trên cơ sở MRAS. 28

III.3.1 Điều khiển học (Learning Control - LC). 28

III.3.2 Bộ điều khiển thích nghi theo mô hình mẫu (MRAS) . 32

III.3.3 Bộ điều khiển LFFC trên cơ sở MRAS. 44

pdf74 trang | Chia sẻ: honganh20 | Ngày: 26/02/2022 | Lượt xem: 297 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Nâng cao chất lượng điều khiển cho hệ thống Twin Rotor MIMO System, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
c, hàm mục tiêu của giải thuật GA là: min {J1, J2, J3}. Ta có thể khái quát quá trình tìm bộ tham số tối ƣu của bộ điều khiển PID sử dụng giải thuật di truyền GA bằng lƣu đồ thuật toán sau: Hình 3.2: Lƣu đồ thuật toán tối ƣu hóa bộ điều khiển PID Hiện nay giải thuật di truyền GA đã đƣợc hỗ trợ bởi phần mềm MATLAB với công cụ Genetic Algorithm hoặc gọi các chức năng giải thuật toán di truyền từ Command Line. Trong quá trình mô phỏng ta sẽ sử dụng công cụ này để tối ƣu hóa bộ điều khiển PID từ đó thiết kế bộ điều khiển cho toàn hệ thống. III.3 Lý thuyết về bộ điều khiển LFFC trên cơ sở MRAS Trong phần này của luận văn, giới thiệu về bộ điều khiển LFFC trên cơ sở MRAS, nhƣng trƣớc tiên cần tìm hiểu một số khái niệm mới: III.3.1 Điều khiển học (Learning Control - LC) [18] Các bộ điều khiển học LC thƣờng đƣợc hình dung giống nhƣ là một hệ thống điều khiển của con ngƣời và do đó nó có các thuộc tính giống với con ngƣời. Trong Đúng Bắt đầu Khởi tạo quần thể ngẫu nhiên cho bộ thông số Kp, Ki, Kd Thiết lập PID và mô phỏng hệ thống kín để tìm sai lệch e(t) Hội tụ Các thủ tục của GA:  Chọn lọc  Lai ghép  Đột biến  Sản sinh thể hệ mới Lƣu bộ thông số 𝐾𝑝 ∗, 𝐾𝑖 ∗, 𝐾𝑑 ∗ tối ƣu Kết thúc Xác định giá trị Hàm mục tiêu Ji(i=1,2,3) Sai Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 29 - Học viên: Nguyễn Thị Tuyết Hoa luận văn này không nghiên cứu bộ LC theo quan điểm sinh học nhƣng dựa trên một số định nghĩa sau: Định nghĩa 1.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đó một hàm xấp xỉ các ánh xạ đầu vào – đầu ra tƣơng ứng trong suốt quá trình điều khiển sao cho hoạt động mong muốn của hệ thống điều khiển đạt đƣợc. Định nghĩa 1.2: Một bộ xấp xỉ hàm (function approximator) là một ánh xạ vào/ra đƣợc xác định bởi một hàm đƣợc lựa chọn  .,F , với các véc tơ thông số  đƣợc lựa chọn để hàm  .F đƣợc xấp xỉ tốt nhất. Nhƣ vậy, một bộ LC sẽ bao gồm một bộ xấp xỉ hàm cho một đối tƣợng có nhiều hàm mục tiêu. Các bộ xấp xỉ hàm có thể đƣợc sử dụng theo 2 cách: - Trƣớc hết, bộ xấp xỉ hàm có thể đƣợc sử dụng để tạo (một phần) tín hiệu điều khiển. Việc học đƣợc tổ chức bằng cách thích nghi véc tơ thông số của bộ xấp xỉ hàm theo cách cực tiểu một số hàm chi phí. Bộ điều khiển này đƣợc gọi là LC trực tiếp. - Thứ hai, bộ xấp xỉ hàm có thể đƣợc sử dụng để học một mô hình đối tƣợng. Dựa trên cơ sở của mô hình đã đƣợc học, bộ điều khiển đƣợc xây dựng, bộ điều khiển này đƣợc gọi là LC gián tiếp. Để bộ xấp xỉ hàm phù hợp cho việc điều khiển cần thỏa mãn những điểu kiện sau: - Cần sử dụng dung lƣợng nhớ nhỏ. Dung lƣợng bộ nhớ là có hạn, do đó số lƣợng các thông số của bộ xấp xỉ hàm mà yêu cầu phải xấp xỉ tín hiệu điều khiển không thể quá rộng. - Việc tính toán đầu ra của hàm xấp xỉ và sự tƣơng thích của quan hệ vào/ra phải đƣợc thực hiện một cách nhanh chóng. Trong môi trƣờng thời gian thực, trong một khoảng thời gian lấy mẫu, các thông số của hàm xấp xỉ phải tƣơng ứng và đầu ra tính đƣợc. Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ và cho phép thời gian tính toán là rất ít. Các hàm xấp xỉ mà bao gồm một lƣợng lớn các tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển. - Cơ chế học cần hội tụ nhanh. Để giữ đƣợc lƣợng thời gian trong đó quá trình vận hành của hệ thống đƣợc điều khiển tối ƣu từng phần, tiến tới mức cực tiểu, cơ chế học cần hội tụ nhanh. - Cơ chế học không nên bị cực tiểu cục bộ, khi bị lƣu giữ trong mức cực tiểu cục bộ, thì cơ chế học cho rằng các giá trị đạt đƣợc của các thông số của hàm xấp xỉ, đƣợc biểu thị bởi ωloc, sinh ra sai số xấp xỉ cực tiểu, đƣợc biểu thị bởi E(ωloc ). ωglob ≠ ωloc làm cho E(ωglob) ≠ E(ωloc) Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 30 - Học viên: Nguyễn Thị Tuyết Hoa Hình 3.3: Cực tiểu cục bộ và cực tiểu toàn bộ trong kỹ thuật học - Hàm xấp xỉ có khả năng tự khái quát hoá tốt. Khả năng tự khái quát hoá là khả năng tạo ra một đầu ra nhạy cho một đầu vào không đƣợc thể hiện trong quá trình huấn luyện nhƣng nó tƣơng tự nhƣ các huấn luyện mẫu. Khi hàm xấp xỉ có khả năng khái quát hoá tốt, bộ LC cũng sẽ thu đƣợc một hiệu quả bám cao cho các chuyển động tƣơng tự các chuyển động đƣợc huấn luyện. Vì vậy nó đủ để huấn luyện LC với một lƣợng nhỏ các đặc tính chuyển động huấn luyện. Khi bộ xấp xỉ không có khả năng tự khái quát hoá tốt, bộ LC phải đƣợc huấn luyện cho mỗi chuyển động quan trọng, nó tạo ra một quá trình huấn luyện mở rộng . - Sự mềm mại của giá trị xấp xỉ cần điều khiển đƣợc. Bộ LC không chỉ thu đƣợc sai số bằng không đối với một vài tần số, khi tín hiệu điều khiển có tần số cao sẽ không thỏa mãn theo mong muốn. Ngƣời sử dụng phải có khả năng quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ. - Đáp ứng ngắn hạn là học tốt. Đáp ứng ngắn hạn của bộ LC nên là loại đáp ứng mà có sai số bám dần hội tụ về giá trị mong muốn. Việc tăng sai số bám trong pha trung gian của quá trình học có thể làm hỏng đối tƣợng, hơn thế nữa, đây là trƣờng hợp quá trình làm việc tối thiểu có thể không còn đƣợc bảo đảm khi bộ điều khiển đƣợc sử dụng nhƣ một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn. - Sự ổn định lâu dài cần phải đƣợc bảo đảm. Việc tự học có thể đƣợc thực hiện một cách liên tục hoặc đƣợc thực hiện trƣớc khi vận hành. Việc học liên tục đƣợc yêu cầu khi các thông số của đối tƣợng thay đổi trong suốt quá trình vận hành. Cấu trúc điều khiển của bộ điểu khiển học LC: Cực tiểu cục bộ Cực tiểu toàn bộ  E loc glob loc Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 31 - Học viên: Nguyễn Thị Tuyết Hoa Hình 3. 4: Cấu trúc bộ điều khiển học LC Bộ điều khiển học LC bao gồm 2 phần: - Bộ điều khiển truyền thẳng (Feed – forward controller): Đƣợc biểu thị bằng F, nghĩa là 1 hàm/ánh xạ uF = F(r). Một bộ điều khiển Feed – forward thông thƣờng có thể đƣợc sử dụng để bù thêm cho các hệ thống động học và theo cách này sẽ thu đƣợc độ bám chính xác cao. Khi bộ điều khiển feed – forward bằng với nghịch đảo của đối tƣợng 1 PF , thì đầu ra của đối tƣợng y sẽ bằng tín hiệu đặt r. Đối tƣợng P , luôn chịu sự tác động của nhiễu. Các loại nhiễu bao gồm cả nhiễu ngẫu nhiên và nhiễu có bản chất chu kỳ. Những nhiễu chu kỳ tái diễn giống nhau khi một chuyển động cụ thể đƣợc lặp lại. Điều này có nghĩa rằng chúng có thể đƣợc xem xét nhƣ một hàm trạng thái của đối tƣợng x và có thể lƣờng trƣớc. - Bộ điều khiển phản phản hồi (Feedback controller): Bộ điều khiển phản hồi (C) cung cấp các tín hiệu học cho bộ điều khiển feed – forward, nó xác định quá trình bám cực tiểu tại thời điểm bắt đầu học và đồng thời có tác dụng bù các nhiễu ngẫu nhiên. Từ thực nghiệm cho thấy cấu trúc của bộ điều khiển LC nhƣ hình 3.4 đã cải thiện một cách rõ rệt chất lƣợng điều khiển so với bộ điều khiển phản hồi đơn, nếu cách học tốt thì bộ điều khiển LC có khả năng đáp ứng rất tốt. Tuy nhiên với cấu trúc này, bộ điều khiển LC vẫn còn tồn tại một số hạn chế (Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ). Để khắc phục nhƣợc điểm này thì sơ đồ cấu trúc hình 3.5 đƣợc đề xuất: Hình 3.5: Cấu trúc bộ điều khiển học LC kết hợp feed forward và feedback Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 32 - Học viên: Nguyễn Thị Tuyết Hoa Lúc này tín hiệu sai lệch e đƣợc đƣa thêm vào đầu vào của bộ xấp xỉ hàm, nhƣ vậy từ một bộ điều khiển học thuần túy (pure – learning controller) ta sẽ có đƣợc bộ điều khiển học kết hợp điều khiển truyền thẳng (feed forward) và điều khiển phản hồi (feedback). Cấu trúc bộ điều khiển học LC nhƣ hình 3.4 và hình 3.5 còn có tên gọi là bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL). Trong cấu trúc này, vòng điều khiển truyền thẳng sử dụng bộ xấp xỉ hàm theo mạng nơron (Multi Layer Perceptron – MLP) hoặc mạng Cerebellar Model Articulation Controller (CMAC) [18]. Bộ điều khiển học truyền thẳng (Learning Feed Forward Controller – LFFC) có cấu trúc tƣơng tự nhƣ bộ điều khiển FEL tuy nhiên thay vì sử dụng bộ xấp xỉ hàm là MLP hay CMAC thì bộ điều này sử dụng bộ xấp xỉ hàm là B-spline network (BSN) hoặc bộ thích nghi theo mô hình mẫu MRAS. Trong phạm vi nghiên cứu của luận văn ta sẽ sử dụng bộ điều khiển học truyền thẳng LFFC dựa trên cơ sở MRAS. III.3.2 Bộ điều khiển thích nghi theo mô hình mẫu (MRAS) Điều khiển thích nghi (ĐKTN) ra đời năm 1958 để đáp ứng yêu cầu của thực tế mà các hệ điều khiển truyền thống không thoả mãn đƣợc. Trong các hệ điều khiển truyền thống, các xử lý điều khiển thƣờng dùng những mạch phản hồi là chính. Vì vậy, chất lƣợng ra của hệ bị thay đổi khi có nhiễu tác động hoặc tham số của hệ thay đổi. Trong hệ ĐKTN cấu trúc và tham số của bộ điều khiển có thể thay đổi đƣợc vì vậy chất lƣợng ra của hệ đƣợc đảm bảo theo các chỉ tiêu đã định. Hệ ĐKTN có mô hình mẫu MRAS (Moded Reference Adaptive System) đã đƣợc Whitaker đề xuất khi giải quyết vấn đề điều khiển lái tự động máy bay năm 1958. Phƣơng pháp độ nhậy và luật MIT đã đƣợc dùng để thiết kế luật thích nghi với mục đích đánh giá các thông số không biết trƣớc trong sơ đồ MRAS. Thập kỷ 60 là thời kỳ quan trọng nhất trong việc phát triển các lý thuyết tự động, đặc biệt là lý thuyết ĐKTN. Kỹ thuật không gian trạng thái và lý thuyết ổn định dựa theo luật Liapunov đã đƣợc phát triển. Một loạt các thuyết nhƣ: Điều khiển đối ngẫu, điều khiển ngẫu nhiên, nhận dạng hệ thống, đánh giá thông sốra đời cho phép tiếp tục (nghiên cứu lại) phát triển và hoàn thiện lý thuyết ĐKTN. Vào năm 1966 Park và các đồng nghiệp đã tìm đƣợc phƣơng pháp mới để tính toán lại luật thích nghi sử dụng luật MIT ứng dụng vào các sơ đồ MRAC của những năm 50 bằng cách ứng dụng lý thuyết của Liapunov. Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 33 - Học viên: Nguyễn Thị Tuyết Hoa Những năm 80 nhiều thiết kế đã đƣợc cải tiến, dẫn đến ra đời lý thuyết ĐKTN bền vững. Một hệ ĐKTN đƣợc gọi là bền vững nếu nhƣ nó đảm bảo chất lƣợng ra cho một lớp đối tƣợng trong đó có đối tƣợng đang xét. Nội dung của bài toán bễn vững trong ĐKTN là điều khiển những đối tƣợng có thông số không biết trƣớc và biến đổi theo thời gian. Cuối thập kỷ 80 có các công trình nghiên cứu về hệ thống ĐKTN bền vững, đặc biệt là MRAS cho các đối tƣợng có thông số biến thiên theo thời gian. Các nghiên cứu của những năm 90 đến nay tập trung vào đánh giá kết quả của nghiên cứu những năm 80 và nghiên cứu các lớp đối tƣợng phi tuyến có tham số bất định. Những cố gắng này đã đƣa ra một lớp sơ đồ MRAS xuất phát từ lý thuyết hệ thống phi tuyến. Một hệ thống thích nghi có thể đƣợc định nghĩa nhƣ sau: “Một hệ thống thích nghi là một hệ thống mà trong bản thân nó đã bổ sung vào cấu trúc (phản hồi) cơ bản, kết quả đo chính xác đƣợc đƣa vào để bù lại một cách tự động đối với những thay đổi trong mọi điều kiện hoạt động, với những thay đổi trong những quá trình động học, hoặc với những biến đổi do nhiễu hệ thống, nhằm để duy trì một quá trình thực hiện tối ƣu cho hệ thống”. Hệ thống điều khiển thích nghi có thể đƣợc phân loại theo một vài cách khác nhau. Một khả năng tạo ra sự phân biệt giữa chúng là: Điều khiển thích nghi trực tiếp và điều khiển thích nghi gián tiếp - Hệ thống với sự chỉnh định trực trực tiếp các tham số điều khiển mà không nhận dạng rõ các tham số của đối tƣợng (điều khiển thích nghi trực tiếp). - Hệ thống với sự điều chỉnh gián tiếp các tham số điều khiển với việc nhận dạng rõ các tham số của đối tƣợng (điều khiển thích nghi gián tiếp). Hệ thống điều khiển thích nghi mô hình tham chiếu (mô hình mẫu), hầu hết đƣợc gọi là MRAC hay MRAS, chủ yếu áp dụng điều khiển thích nghi trực tiếp. Triết lý cơ bản đằng sau việc áp dụng MRAC đó là đặc trƣng mong muốn của hệ thống đƣợc đƣa ra bởi một mô hình toán học, hay còn gọi là mô hình mẫu. Khi hành vi của đối tƣợng khác với hành vi “lý tƣởng” mà hành vi này đƣợc xác định bởi mô hình mẫu, đối tƣợng sẽ đƣợc sửa đổi theo 2 cách, hoặc bằng cách chỉnh định các thông số của bộ điều khiển (Hình 3.6a), hoặc bằng cách tạo ra tín hiệu bổ xung đầu vào cho đối tƣợng này (Hình 3.6b) [20]. Điều này có thể đƣợc chuyển thành bài toán tối ƣu hoá, ví dụ tối thiểu hoá các tiêu chuẩn: T 2 0 C = e dt (3.2) Tại đó: e = ym – yp (3.3) Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 34 - Học viên: Nguyễn Thị Tuyết Hoa Ngoài việc tối thiểu hoá sai lệch giữa những tín hiệu đầu ra của đối tƣợng và mô hình mẫu, thì tất cả các biến trạng thái của đối tƣợng và mô hình mẫu còn đƣợc đƣa vào tính toán. Khi các biến trạng thái của đối tƣợng đƣợc ký hiệu là (xp) và các biến trạng thái của mô hình mẫu ký hiệu là (xm), véc tơ sai lệch e đƣợc định nghĩa là: e = xm – xp (3.4) Trong trƣờng hợp này, bài toán tối ƣu hoá có thể đƣợc chuyển thành tối thiểu hoá tiêu chuẩn: T T 0 C = e Pedt (3.5) Trong đó P là một ma trận xác định dƣơng. Hình 3.6: Hệ thích nghi tham số Hình 3.7: Hệ thích nghi tín hiệu Đối tƣợng Bộ điều khiển Thích nghi Mô hình mẫu Bộ điều khiển u + - y + - + - Đối tƣợng Bộ điều khiển Thích nghi Mô hình mẫu Bộ điều khiển u + - y + - Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 35 - Học viên: Nguyễn Thị Tuyết Hoa Sự nhân trong bộ điều khiển thích nghi luôn luôn dẫn đến một hệ thống phi tuyến. Điều này có thể đƣợc giải thích rằng việc điều khiển thích nghi là phản hồi phi tuyến nhiều hơn. Những xem xét sau đây đóng một vai trò nhất định trong việc lựa chọn giữa thích nghi tham số và thích nghi tín hiệu. Một tính chất quan trọng của hệ thống với việc thích nghi tham số đó là vì hệ thống có nhớ. Ngay khi các tham số của đối tƣợng đã đƣợc điều chỉnh đúng với giá trị của chúng và những tham số này không thay đổi nữa, vòng lặp thích nghi trong thực tế không còn cần thiết: đối tƣợng thực và mô hình mẫu hiển thị các trạng thái nhƣ nhau. Sự nhớ nói chung là không đƣợc thể hiện trong hệ thống cùng với thích nghi tín hiệu. Do đó, vòng lặp thích nghi vẫn còn cần thiết trong mọi trƣờng hợp, để nhằm liên tục tạo ra những tín hiệu phù hợp ở đầu vào. Do vậy, các hệ thống thích nghi tín hiệu cần phải phản ứng nhanh hơn hẳn đối với những thay đổi động học của đối tƣợng so với các hệ thống thích nghi tham số vì hệ thích nghi tín hiệu không sử dụng thông tin từ quá khứ. Trong những hệ thống mà các thông số liên tục thay đổi trong một phạm vi rộng, sự có mặt của tính chất nhớ là rất có lợi. Tuy nhiên, trong một môi trƣờng ngẫu nhiên, ví dụ nhƣ trong các hệ thống với rất nhiều nhiễu, điều này lại là bất lợi. Hệ số cao trong vòng thích nghi có thể gây nhiễu đƣa tới đầu vào của đối tƣợng. Khi các tham số của đối tƣợng thay đổi chậm hoặc chỉ thời gian ngắn ngay sau đó và ngay lúc đó, những hệ thống với sự thích nghi tham số đƣa ra một cách thực hiện tốt hơn vì chúng có nhớ. Cũng có một vài thuật toán thích nghi mà kết hợp những ƣu điểm của cả hai phƣơng pháp trên. Các vòng điều khiển phản hồi tiêu chuẩn đƣợc xem nhƣ là một hệ thống điều khiển sơ cấp phản ứng nhanh, chính xác mà nó buộc phải loại ra nhiễu “thông thƣờng”. Những biến thiên lớn trong các tham số hoặc là nhiễu lớn đƣợc xử lý bởi hệ thống điều khiển thích nghi thứ hai (phụ) tác động chậm hơn (Hình 3.7). Hình 3. 8: Điều khiển ở cấp 1 và cấp 2 Đối tƣợng Bộ điều khiển Thích nghi Mô hình mẫu Bộ điều khiển u + - y + - Bộ điều khiển thứ nhất của hệ Bộ điều khiển thứ hai của hệ Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 36 - Học viên: Nguyễn Thị Tuyết Hoa  Cơ chế thích nghi – thiết kế bộ điều khiển thích nghi dựa vào luật MIT [20] Trong lĩnh vực điều khiển nâng cao, một vài phƣơng pháp đã đƣợc mô tả để thiết kế hệ thống thích nghi. Nhƣng chúng ta có thể có đƣợc cái nhìn sâu sắc hơn với phƣơng pháp này bằng cách tƣ duy làm cách nào tự tìm đựơc các thuật toán cho mình. Điều này giúp ta thực sự hiểu đƣợc những gì đang diễn ra. Do đó, trong lúc này ta sẽ hoãn lại việc xem xét những hàm toán học và xem xét các ý tƣởng cơ bản của MRAS với một ví dụ đơn giản. Khi chúng ta cố gắng thiết kế một bộ điều khiển thích nghi cho hệ thống đơn giản này, chúng ta sẽ gặp phải những vấn đề mà cần đến nền lý thuyết cơ bản hơn. Những tính chất nói chung với những phƣơng pháp thiết kế khác nhau và là sự khác biệt giữa các phƣơng pháp này sẽ trở lên rõ ràng. Tất nhiên việc “điều khiển” với tham số Ka và Kb không phải là một bộ điều khiển thực tế. Trong thực tế, chúng tôi giả thiết ở phần này là các thông số đối tƣợng có thể đƣợc chỉnh định trực tiếp. Ví dụ ta có đối tƣợng (tuyến tính) đƣợc mô tả bằng hàm truyền: p 2 p b s +a s +1 và mô hình hoá bởi: m 2 m b s + a s +1 hoặc 2 n 2 2 n n Kω s + 2ξω s + ω Sự biến đổi trong tham số ap đƣợc bù lại bằng cách hiệu chỉnh Ka và những biến đổi trong tham số bp đƣợc chỉnh định bằng cách điều chỉnh Kb. Điều này tuân theo 1 cách trực tiếp từ hàm truyền của đối tƣợng cộng với bộ điều khiển trong Hình 3.9: b p 2 p a K + b s +(a + K )s +1 Mô hình tham chiếu (tuyến tính) đã có bậc giống với đối tƣợng. Giá trị tính toán sau đƣợc lựa chọn: n p pω =1; z = 0,7; a =1,4; b = 0,5 Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 37 - Học viên: Nguyễn Thị Tuyết Hoa Vì e = ym – yp và p m 1 y = y 2 , trong truờng hợp này sai lệch e bằng yp. Để nhận đƣợc 2 đáp ứng giống nhau, các tham số Kb cần đƣợc hiệu chỉnh tăng lên. Sự lựa chọn hợp lý cho việc chỉnh định Kb là: b bK (t) = K (0) +β edt (3.6a) Hình 3. 9: Mô hình đối tƣợng và mô hình mẫu Với “ hệ số thích nghi” β tốc độ chỉnh định có thể đƣợc đặt lại. Các chức năng nhớ yêu cầu đƣợc thực hiện bằng cách lấy tích phân mà cũng phải đảm bảo rằng một hằng số khác nhau giữa (Kb + bp) và bm, sai lệch e hội tụ về 0. Tuy nhiên khi tín hiệu đầu vào u bị đảo dấu việc chỉnh định của Kb sẽ đi sai hƣớng, vì e mang dấu âm. Kết quả là hệ thống lại mất ổn định. Giải pháp cho vấn đề này đƣợc đƣa ra đó là : dấu của tín hiệu vào đƣợc đƣa vào tính toán, ví dụ bằng cách nhân e và u, kết quả của việc chỉnh định thông số lại phù hợp. Điều này nhận đƣợc luật điều chỉnh đƣợc gọi là luật MIT: b bK (t) = K (0) +β (eu)dt (3.6b) ym yp aP   bP Kb ? Ka 2 2 22 n n ns s     Đối tƣợng Mô hình mẫu u _ + + + _ + _ _ + e Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 38 - Học viên: Nguyễn Thị Tuyết Hoa Đối với bài toán thích nghi MRAS thƣờng gặp phải 2 vấn đề sau: 1 – Loại „tốc độ động thích nghi‟ cần thiết để nhận ra là mỗi tham số chỉ đƣợc chỉnh định khi kết quả sai lệch là nhạy cảm với sự thay đổi của tham số đó. 2 – Vấn đề ổn định còn tồn tại khi hệ số thích nghi đƣợc tăng lên đòi hỏi tăng tốc độ thích nghi. Vấn đề ổn định này không thể dễ dàng đƣợc giải quyết bằng phƣơng pháp phân tích tuyến tính bởi vì sự thích nghi tạo ra hệ thống phi tuyến. Để giải quyết hai vấn đề này thì hai phƣơng pháp sẽ đƣợc bàn luận chi tiết hơn trong phần sau: - Phương pháp độ nhạy. Phƣơng pháp này nhấn mạnh sự xác định „ tốc độ động của sự thích nghi‟ với sự trợ giúp của hệ số nhạy. - Phương pháp ổn định. Phƣơng pháp này nhấn mạnh đến vấn đề ổn định. Bởi vì đặc tính phi tuyến của một hệ thích nghi. Lúc này cần tiết phải dử dụng lý thuyết ổn định của hệ phi tuyến. Điều này cho thấy cùng với một chứng minh về tính ổn định, những luật thích nghi hữu ích có thể đƣợc tìm ra.  Phương pháp độ nhạy Bƣớc đầu tiên trong phƣơng pháp độ nhạy là chuyển vấn đề thích nghi thành bài toán tối ƣu bằng việc đƣa ra tiêu chuẩn: t 2 0 1 C = e dτ 2  (3.7) Để tối thiểu hoá C, những tham số chỉnh định Ki đƣợc thay đổi. Hƣớng của những thay đổi này đƣợc xác định bởi đạo hàm riêng iC/ K  , vì vậy: i i i C K = -α K    (3.8) Bằng cách lấy vi phân công thức (3.8) theo t, luật thích nghi tƣơng tự có thể đƣợc tìm ra: i i i dK d C = -α dt dt K   (3.9) Từ công thức (3.7) và (3.9) ta đƣợc: Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 39 - Học viên: Nguyễn Thị Tuyết Hoa 2i i i dK 1 = -α dt K 2 e         (3.10) Hay: i i i dK e = -α dt K e   (3.11) Trong công thức (3.10) sai lệch đƣợc định nghĩa là: e =ym - yP (3.12) bởi vì / 0m iy K   , theo công thức (3.10) và (3.11) thì: i i i dK = α dt K Pye   (3.13) Hƣớng chỉnh định và lƣợng chỉnh định quan hệ với các tham số khác bây giờ đƣợc xác định bởi sai lệch e và hệ số độ nhạy /P iy K  . Sau đó đƣợc xác định bởi phƣơng pháp mô hình độ nhạy. Hệ số độ nhạy đƣợc nhận thấy rõ rằng việc hiệu chỉnh Ki chỉ đƣợc thực hiện khi sai lệch giữa đối tƣợng và mô hình mẫu là nhạy cảm với sự thay đổi của những tham số điển hình này. Ví dụ: Đối tƣợng trong Hình 1.6 có thể đƣợc mô tả bởi phƣơng trình vi phân: ( ) ( )P P a P P b Py a K y y K b u      (3.14) Ở đó y ký hiệu cho dy/dt và 2 2/y d y dt Sau đó tham số KV đƣợc đƣa vào công thức (3.14) có thể đƣợc viết lại thành công thức (3.15). KV = aP + Ka (3.15) ( )P V P P b Py K y y K b u     (3.16) Đạo hàm công thức này theo KV mang lại: P P P V P V V V y y y K y K K K              (3.17) Phƣơng trình vi phân (3.17)tƣơng đƣơng với phƣơng trình (3.14), ngoại trừ đối với tín hiệu vào. Phƣơng trình (3.17) đƣợc gọi là mô hình độ nhạy. Khi 1 ƣớc Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 40 - Học viên: Nguyễn Thị Tuyết Hoa lƣợng đƣợc tạo ra với giá trị của KV, ví dụ bằng việc lựa chọn nó bằng với giá trị mong muốn am, hệ số độ nhạy /P iy K  có thể đo đƣợc. Từ phƣơng trình (3.14) dẫn đến: dK = α dt K V P V y e   (3.18) Giả sử rằng tham số đối tƣợng aP thay đổi chậm hơn so với tham số chỉnh định Ka do sự thích nghi, sau đó từ biểu thức (3.15) thấy rằng: dK dt V adK dt  và K P P V a y y K      (3.19) Kết quả hệ thống thích nghi đƣợc đƣa ra trong Hình 3.10 Hình 3. 10: Hệ thống điều khiển thích nghi dựa trên mô hình độ nhậy. Ka đƣợc chỉnh định để bù cho sự thay đổi trong ap. Phƣơng pháp độ nhạy có ƣu điểm là đơn giản và không phức tạp. Bất lợi chính đó là sự ổn định có thể chỉ đƣợc chứng minh bằng mô phỏng hoặc kiểm nghiệm thực tế. Một chứng minh toán học giải thích về sự ổn định không đƣợc đƣa ra rõ ràng.  Phương pháp ổn định của Liapunov Việc thiết kế các hệ thống thích nghi dựa trên lý thuyết ổn định đƣợc bắt nguồn từ những bài toán về ổn định trong thiết kế ví dụ nhƣ những bài toán dựa trên các mô hình độ nhạy. Phƣơng pháp thứ 2 của Liapunov là phƣơng pháp phổ biến nhất. Một phƣơng pháp khác có liên quan dựa trên lý thuyết “siêu ổn định”. Cả hai phƣơng pháp có thể mang đến kết quả giống nhau, đến nỗi mà không có một sự thích trực tiếp nào đối với một trong hai về các thuật toán kết quả. aP   b P K b K a Đối tƣợng u y b m   a m _ + + + + + + _ _ _ Mô hình độ nhạy Đ ố i t ƣ ợ n g Luận Văn Thạc Sỹ Kỹ Thuật Nâng cao chất lượng điều khiển cho TRMS GVHD: PGS.TS Nguyễn Duy Cương - 41 - Học viên: Nguyễn Thị Tuyết Hoa Việc sử dụng lý thuyết ổn định Liapunov cho thiết kế các hệ thống thích nghi đƣợc đƣa ra bởi Park năm 1966. Nguồn gốc luật thích nghi đƣợc thực hiện dễ dàng nhất khi đối tƣợng và mô hình mẫu đƣợc mô tả dƣới dạng mô hình không gian trang thái. Đối tƣợng có thể đƣợc mô tả: p p p px A x B u  (3.20) với ' p p aA A K  (3.21) và ' p p bB B K  (3.22) ở đó ' pA và ' pB là tham số đối tƣợng thay đổi mà có thể đƣợc bù bởi các tham số bộ điều khiển Ka, Kb. Mô tả mô hình mẫu có thể đƣợc mô tả m m m mx A x B u  (3.23) Trừ biểu thức (3.23) cho biểu thức (3.20), sau đó định nghĩa e: m pe x x  (3.24) m pe A e Ax Bu   (3.25) Với: m pA A A  (3.26) m pB B B  (3.27) Việc điều chỉnh A và B đòi hỏi phải có các luật thích nghi phi tuyến. Để đảm bảo rằng khi t  thì e = 0, điều kiện cần và đủ đó là chứng minh rằng e = 0 là một giải pháp cân bằng ổn định. Theo lý thuyết ổn định Liapunov điều này có thể thực hiện đƣợc khi chúng ta có thể tìm đƣợc một hàm (vô hƣớng) Liapunov V(e) với tính chất sau: V(e) xác định dƣơng (nghĩa là V > 0 với 0e  , và V= 0 khi e = 0). V(e) xác định âm (nghĩa là V < 0 với 0e  , và V = 0 khi e = 0).

Các file đính kèm theo tài liệu này:

  • pdfluan_van_nang_cao_chat_luong_dieu_khien_cho_he_thong_twin_ro.pdf
Tài liệu liên quan