LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
DANH MỤC CÁC KÝ HIỆU VÀ VIẾT TẮT vi
DANH MỤC CÁC HÌNH VẼ VÀ BẢNG BIỂU ix
MỞ ĐẦU 1
I. Đặt vấn đề nghiên cứu 1
II. Phân tích và luận chứng về vấn đề nghiên cứu 3
1. Tổng quan về tình hình nghiên cứu trên thế giới: 3
2. Các nghiên cứu trong nước 4
3. Một số luận giải cho hướng nghiên cứu 5
III. Phạm vi, nội dung và phương pháp nghiên cứu 6
1. Phạm vi và nội dung nghiên cứu: 6
2. Phương pháp nghiên cứu: 8
IV. Cơ sở lý thuyết và thực tế phục vụ nghiên cứu 9
1. Cơ sở lý thuyết: 9
2. Cơ sở thực tế của luận án: 10
V. Mục đích, ý nghĩa và những đóng góp mới của luận án 10
1. Mục đích nghiên cứu: 10
2. Ý nghĩa khoa học và thực tiễn: 10
3. Những đóng góp mới về khoa học: 11
CHƯƠNG 1. PHÂN TÍCH ĐÁNH GIÁ CÁC PHƯƠNG PHÁP DẪN TỪ XA TÊN LỬA PHÒNG KHÔNG VÀ ĐẶT VẤN ĐỀ NGHIÊN CỨU 12
1.1. Hệ thống điều khiển từ xa tên lửa phòng không theo lệnh vô tuyến 12
1.2. Những đặc trưng cơ bản của vòng điều khiển kín từ xa TLPK 15
1.2.1. Quá tải pháp tuyến 16
1.2.2. Độ cong quỹ đạo 17
138 trang |
Chia sẻ: honganh20 | Ngày: 16/03/2022 | Lượt xem: 472 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Nâng cao khả năng cơ động của tên lửa bằng cách bổ sung cho tên lửa phương pháp tạo lực và mômen điều khiển mới như phương pháp điều khiển gaz - Động, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hợp mục tiêu, ở giai đoạn đầu (trước điểm Hmax), PPD “CV” luôn thực hiện việc nâng độ cao tên lửa nằm trên đường ngắm ĐĐK-MT, quỹ đạo tên lửa tương đối thẳng, không đòi hỏi phải tạo quá tải (gia tốc) lớn.
Việc nâng quỹ đạo tên lửa ở giai đoạn đầu với yêu cầu quá tải nhỏ là một yêu cầu bắt buộc để hình thành nên quỹ đạo dạng đạn đạo và là tiền đề quan trọng để duy trì động năng tên lửa ở giai đoạn bay tiếp theo. Ưu điểm này có thể lựa chọn để tổng hợp PPD mới.
2.3 Tổng hợp luật dẫn hai điểm tối ưu
2.3.1 Mô hình dẫn tối ưu dạng toàn phương tuyến tính bằng phương pháp trượt (Sweep method, [48])
Phương trình trạng thái và các điều kiện biên của hệ tuyến tính có dạng:
(2.11)
Trong đó: x - vector trạng thái kích thước (m1 x 1) ; - đạo hàm của x; x0 - giá trị ban đầu của x ở thời điểm t0; - giá trị xác định thứ i của x ở thời điểm cuối tf ; u - vector điều khiển kích thước m2 (m2 = 1, 2,...); A - ma trận trạng thái kích thước (m1 x m1) và B là ma trận điều khiển kích thước (m1 x m2). Không mất tính tổng quát, ta giả sử rằng .
Hệ thống được mô tả bởi (2.11) được giả sử là điều khiển được hoàn toàn với u không bị chặn. Xét bài toán điều khiển tối ưu dưới đây.
Tìm u để cực tiểu hàm chỉ tiêu J:
(2.12)
Trong đó: Q - ma trận bán xác định dương, kích thước (m1 x m1); R - ma trận xác định dương kích thước (m2 x m2).
Các điều kiện ràng buộc ở (2.11) liên hệ với hàm mục tiêu (2.12) bằng các nhân tử như sau:
(2.13)
Trong đó: vi (i= 1 2, ...,p) là các nhân tử thực dương của các trạng thái cuối xi(tf).
Các phương trình Euler-Lagrange cho bài toán tối ưu trên có dạng [16, 48]:
(2.14)
Trong đó: λ là vector nhân tử Lagrange, là đạo hàm của λ.
Từ (2.14) và (2.11), ta nhận được bài toán hai điểm biên:
(2.15)
Trong phương trình (2.15), các điều kiện biên x0 và xi(tf) của x là giống như trong (2.11). Các giá trị cuối λj(tf) có thể biểu diễn lại như sau:
(2.16)
Bài toán hai điểm biên trên có thể giải được bằng phương pháp trượt [48]. Giả sử giá trị là hàm tuyến tính của x và (v1,...,vp) như sau:
(2.17)
Trong đó: U là ma trận kích thước (p x m1), G là ma trận kích thước (p x p) và
(2.18)
Từ các phương trình (2.11), (2.15) và (2.16) ta thấy rằng λ là một hàm tuyến tính của x và v. Do đó có thể biểu diễn như sau:
(2.19)
Trong đó: S là ma trận kích thước (m1 x m1) và F là ma trận kích thước (m1 x p).
Các phương trình (2.17) và (2.19) phải thỏa mãn ở thời điểm cuối khi t=tf, do đó ta có:
(2.20)
Trong đó: Uji(tf) và Fji(tf) tương ứng với các giá trị thứ ji của ma trận U và F tại thời điểm tf.
Qua các phép biến đổi toán học, chúng ta có thể nhận được tín hiệu điều khiển tối ưu [48]:
(2.21)
Trong biểu thức (2.16) ta nhận thấy rằng: Nếu v = 0, thì biểu thức (2.13) tương ứng với bài toán tối ưu không ràng buộc. Giá trị của ψ khi v = 0, được xác định như sau [48]:
(2.22)
Tức là, là giá trị dự báo của ψ nếu tối thiểu hàm không ràng buộc. Biểu thức (2.21) được biểu diễn lại như sau:
(2.23)
Trong trường hợp nếu Q = 0 và v = 0 thì hàm là tổng năng lượng của tín hiệu điều khiển:
(2.24)
Từ phương trình Riccati [48], ta thấy rằng nếu Q = 0 thì ta nhận được S = 0. Do đó ta có [48]:
(2.25)
Tín hiệu điều khiển tối ưu (2.23), trong trường hợp này được biểu diễn lại như sau:
(2.26)
2.3.2 Luật dẫn tên lửa tối ưu theo các điều kiện ràng buộc
Trong quá trình dẫn TLPK, hệ thống thực hiện việc điều khiển định hướng vector vận tốc tên lửa trên cơ sở thông tin về mục tiêu. Rõ ràng là định hướng tốt nhất là trục dọc tên lửa và vector vận tốc đều hướng thẳng vào điểm gặp mục tiêu, tức là góc tấn công α và góc trượt β bằng 0 hay cực tiểu, để đảm bảo cho quỹ đạo tên lửa là một đường thẳng. Do đó luật dẫn tối ưu cần phải được hình thành dựa trên khả năng tiên lượng chuyển động của mục tiêu và xác định trước điểm gặp. Các điều kiện ràng buộc đối với luật dẫn tối ưu cần tổng hợp có thể là độ trượt hoặc góc tiếp cận tại điểm gặp và tốt nhất là cả hai.
Trước tiên ta xét tương quan động hình học TL-MT trong mặt phẳng đứng như trên hình 2.6.
Hình 2.6. Động hình học TL-MT trong mặt phẳng đứng
Để thuận lợi trong những biến đổi toán học sau này, ta ký hiệu và quy ước trong mặt phẳng thẳng đứng, độ cao tương đối giữa TL-MT .
Xét trong hệ tọa độ của ĐĐK ta có:
(2.27)
Sơ đồ khối mô tả quá trình dẫn TL-MT được thể hiện trên hình 2.7.
ac
Tên lửa
Luật dẫn
+
-
Hình 2.7. Sơ đồ khối quá trình dẫn tên lửa
Để đơn giản hóa bài toán, ta giả sử tên lửa là một khâu lý tưởng và . Trong đó ac là gia tốc lệnh của tên lửa.
Đặt các biến trạng thái: , ta có và biến điều khiển .
Xét trong trường hợp mục tiêu không cơ động theo góc (), khi đó phương trình (2.27) biểu diễn trong không gian trạng thái có dạng:
(2.28)
Biểu thức (2.28) được biểu diễn dưới dạng ma trận trạng thái:
(2.29)
Trong đó: A là ma trận (2x2) và B là vector (2x1)
;
Ma trận điều khiển của hệ thống (2.29) có dạng:
; ma trận này có hạng = 2, do đó hệ thống (2.29) là điều khiển được hoàn toàn.
Hàm mục tiêu là tổng năng lượng điều khiển với R=1 có dạng:
(2.30)
Bài toán dẫn tối ưu được phát biểu như sau: Tìm biến điều khiển u(t) để hình thành nên quỹ đạo tên lửa bắt đầu từ trạng thái t0 sao cho hàm mục tiêu (2.30) là nhỏ nhất theo các điều kiện ràng buộc khác nhau.
2.3.2.1 Luật dẫn hai điểm tối ưu theo độ trượt tại điểm gặp
Điều kiện độ trượt tại điểm gặp nhỏ nhất, tức là: =0, hoặc biểu diễn dưới dạng ma trận:
(2.31)
Trong đó:
(2.32)
Ma trận F có dạng:
(2.33)
Thay các giá trị từ các biểu thức (2.33), (2.32), (2.29) vào (2.25) ta có:
(2.34)
(2.35)
Giải phương trình (2.34) theo điều kiện (2.35) ta nhận được:
(2.36)
Trong đó: tgo = tf – t là thời gian bay còn lại.
Thay ma trận F từ (2.36) và B từ (2.29) vào (2.25) ta có:
(2.37)
Tích phân (2.37) theo thời gian, ta nhận được:
(2.38)
Thay giá trị của các ma trận B, F, G, ψ, x vào (2.26), ta nhận được tín hiệu điều khiển tối ưu theo điều kiện độ trượt tại điểm gặp bằng không có dạng:
(2.39)
Giả sử rằng ở lân cận điểm gặp vận tốc tiếp cận TL-MT (Vtc) là không đổi, góc quay đường ngắm σ là nhỏ. Sử dụng quan hệ động hình học (H.2.6) ta có:
(2.40)
Đạo hàm biểu thức (2.40) theo thời gian ta được:
(2.41)
Thay (2.40) và (2.41) vào (2.39) ta được:
(2.42)
Biểu thức (2.42) còn được gọi là luật dẫn tiếp cận tỉ lệ, hoàn toàn giống như kết quả mà các công trình [10,38] đã chỉ ra.
Khi tính tới yếu tố cơ động của mục tiêu (), thành phần gia tốc mục tiêu sau khi được ước lượng, đánh giá sẽ được sử dụng để tạo lượng đón (bù) do sự cơ động của mục tiêu gây ra.
Xuất phát từ biểu thức (2.42), luật dẫn tiếp cận tỉ lệ có tính tới sự cơ động của mục tiêu có dạng [10, 38]:
(2.43)
Các giải pháp để hiện thực hóa luật dẫn (2.43) dưới ĐĐK đã được [9] chỉ ra, phương pháp dẫn này còn được gọi là PPD hai điểm và ký hiệu là 2D.
2.3.2.2. Luật dẫn hai điểm tối ưu theo độ trượt tại điểm gặp có tính góc tiếp cận.
Giá trị độ trượt và tốc độ thay đổi độ trượt tại điểm gặp là:
(2.44)
Trong đó - góc tiếp cận TL-MT tại điểm gặp.
Phương trình (2.44) thể hiện dưới dạng ma trận là:
(2.45)
Ma trận F có dạng:
(2.46)
Thay (2.45), (2.46) vào (2.25) ta có:
(2.47)
Giải phương trình (2.47) ta được:
(2.48)
Thay ma trận F từ (2.48) và B từ (2.29) vào (2.25) để tìm và G-1 ta nhận được kết quả như sau:
(2.49)
Từ (2.48), (2.49) và (2.29) ta có:
(2.50)
Thay (2.50) và các giá trị ψ, x vào (2.26) ta nhận được tín hiệu điều khiển tối ưu:
(2.51)
Sử dụng các quan hệ động hình học như ở mục 2.3.2.1 và giá trị ở (2.44) thay vào (2.51) ta nhận được:
(2.52)
Nhân cả tử và mẫu thành phần thứ hai trong biểu thức (2.52) với Vtc ta nhận được liên hệ của tín hiệu điều khiển với cự ly tương đối (∆r) giữa tên lửa và mục tiêu mà ĐĐK từ xa đo được. Biểu thức (2.52) có dạng mới:
(2.53)
Biểu thức (2.53) về bản chất vẫn có dạng như (2.42), nhưng có thêm một thành phần tính tới hướng tiếp cận theo đường ngắm TL-MT.
Khi tính tới yếu tố cơ động của mục tiêu thì biểu thức (2.53) trở thành [57]:
(2.54)
PPD có biểu thức như (2.54) gọi là phương pháp hai điểm có tính góc tiếp cận và được ký hiệu là 2DGOC.
Một số nhận xét rút ra từ mô hình PPD tối ưu “2DGOC”:
Nhận xét 1: Phương trình PPD (2.54) bao gồm 3 thành phần: thành phần thứ nhất đặc trưng cho luật dẫn tiếp cận tỉ lệ; thành phần thứ hai - bù góc đường ngắm tiếp cận; thành phần thứ ba – bù sự cơ động của mục tiêu khi thay đổi gia tốc. Hệ số tỉ lệ trong (2.54) là 4, trong khi ở biểu thức (2.43) hệ số này là 3.
Nhận xét 2: Các giải pháp để hiện thực hóa luật dẫn 2D từ xa trên cơ sở những thông tin mà ĐĐK đo được đã được [9] chỉ ra. Trong đó thành phần tốc độ quay đường ngắm được tính thông qua các tọa độ góc (εtl, βtl, εmt, βmt), tọa độ cự ly (rtl, rmt) của tên lửa, mục tiêu và các đạo hàm tương ứng của chúng.
Thành phần gia tốc mục tiêu có thể ước lượng, đánh giá bằng bộ lọc Kalman và đưa vào luật dẫn (2.43) hay (2.54). Thành phần này có tác dụng nâng cao độ chính xác dẫn đối với sự cơ động của mục tiêu.
Giá trị của góc tiếp cận được cho trước và đưa vào biểu thức lập lệnh, nó phụ thuộc vào đặc điểm và tính chất chuyển động của mục tiêu. Do đó luật dẫn 2DGOC (2.54) hoàn toàn có thể hiện thực hóa trong ĐĐK từ xa.
2.4. Tổng hợp phương pháp dẫn kết hợp
Ý tưởng tổng hợp một PPD mới dạng kết hợp các PPD đã được hiện thực hóa có trong điều khiển từ xa đã đưa ra ở cuối chương 1, theo đó ta cần có một PPD bảo đảm đồng thời hai tiêu chí là độ chính xác tiêu diệt mục tiêu và duy trì đủ động năng điều khiển tên lửa trong thời gian bay thụ động.
Cụ thể hơn là cần tổng hợp một PPD mới có QĐĐ dạng đạn đạo, đảm bảo hai tiêu chí: duy trì vận tốc tên lửa trong giai đoạn bay thụ động nhằm tăng cự ly xa của VTD và nâng cao độ chính xác dẫn đối với các loại mục tiêu.
PPD kết hợp mà luận án đang xây dựng có QĐĐ trong mặt phẳng đứng như mô tả trên hình 2.8.
Hình 2.8. Quỹ đạo TL-MT trong mặt phẳng đứng
Trên hình 2.8, XqOYq là hệ tọa độ của ĐĐK, quá trình dẫn được chia ra làm hai giai đoạn: (1) là giai đoạn nâng quỹ đạo tên lửa; (2) là giai đoạn dẫn tối ưu với độ chính xác cao kết hợp việc chuyển thế năng của tên lửa thành động năng để duy trì vận tốc trong thời gian bay thụ động của tên lửa. Thời điểm t* là thời điểm chuyển giữa giai đoạn (1) và giai đoạn (2) của quá trình dẫn.
Như đã nhận xét kết quả khảo sát PPD “CV” ở mục 2.2, ta nhận thấy rằng PPD “CV” chỉ có ưu điểm khi bắn các lớp mục tiêu bay thấp (dưới 3000m) với tốc độ chậm, hoặc cố định trên mặt đất. Khi độ cao bay, hay vận tốc của mục tiêu tăng thì hiệu quả của PPD “CV” giảm rõ rệt, đặc biệt là khi mục tiêu cơ động. Tuy nhiên PPD “CV” có ưu điểm là có thể tạo ra QĐĐ dạng đạn đạo một cách đơn giản nhất về thuật toán, đó là vấn đề cơ bản mà ta lựa chọn cho giai đoạn (1) của PPD kết hợp mà ta định tổng hợp như hình 2.8.
Giai đoạn (1), tên lửa được phóng thẳng từ bệ phóng với góc nghiêng quỹ đạo cố định đến thời điểm chuyển t*. Yêu cầu điều khiển ở giai đoạn này là ổn định góc nghiêng quỹ đạo θtl.
Giai đoạn (2) của PPD kết hợp là giai đoạn đảm bảo độ chính xác dẫn và duy trì vận tốc tên lửa khi bắn các loại mục tiêu khác nhau, kể cả mục tiêu cơ động. Như đã dẫn ra, trong các phương trình PPD “2D” từ xa (2.43) và “2DGOC” từ xa (2.54) đều là các PPD tối ưu, có thành phần bù sự cơ động của mục tiêu trong biểu thức lập lệnh. Có nghĩa là cả hai PPD này đều có thể bảo đảm độ chính xác dẫn mong muốn kể cả khi mục tiêu cơ động [9,53]. Do đó, về lý thuyết, có thể sử dụng PPD “2D” từ xa hoặc PPD “2DGOC” từ xa trong giai đoạn (2) để tổng hợp PPD mới.
Từ những biện luận trên, biểu thức của PPD kết hợp “CV” với “2D” (ký hiệu là “CV-2D”) trong mặt phẳng đứng được viết như sau:
(2.55)
Trong đó: t* - thời điểm chuyển từ giai đoạn (1) sang giai đoạn (2); Ka,[1/s2] – độ dốc của đặc trưng hình thành GTPT trong VĐK tên lửa.
Biểu thức của PPD kết hợp “CV” với “2DGOC” (ký hiệu “CV-2DGOC”) trong mặt phẳng đứng được viết như sau:
(2.56)
Theo các giải pháp hiện thực hóa PPD hai điểm từ xa mà tài liệu [9] đã chỉ ra thì các tham số: Vtc , , , đều có thể xác định được thông qua các tham số mà ĐĐK dưới mặt đất đo được, còn thành phần gia tốc cơ động của mục tiêu (Wmt) có thể đánh giá bằng bộ lọc Kalman [10,17,23]. Do đó PPD kết hợp “CV-2D” hoặc “CV-2DGOC” tương ứng với các biểu thức (2.55) và (2.56) hoàn toàn có thể hiện thực hóa được trong các hệ điều khiển TLPK từ xa.
2.5. Mô phỏng kiểm chứng
Để sơ bộ đánh giá tác dụng và hiệu quả kết hợp giữa PPD “CV” với hai PPD “2D” và “2DGOC”, cũng như đánh giá so sánh giữa hai phương án kết hợp “CV-2D” và “CV-2DGOC” ta cần có sự khảo sát cụ thể.
Cơ sở để khảo sát hai PPD kết hợp như đã đề xuất vẫn là cấu trúc động học VĐK kín từ xa (hình 1.3) với bộ tham số các khâu cơ bản như bảng 1.1 trong khảo sát ở mục 1.4 chương 1. Riêng khâu lập lệnh ta sử dụng các thuật toán (2.55) và (2.56) tương ứng với từng phương án kết hợp.
Với mục đích khảo sát hai tiêu chí cơ bản như đã xác định, trong mục này phương án mục tiêu sẽ là mục tiêu cơ động theo các dạng điển hình, như dẫn ra trong bảng 2.3 dưới đây.
Để có đủ cơ sở đánh giá ưu, nhược điểm của hai PPD kết hợp “CV-2D” và “CV-2DGOC”, điều kiện khảo sát, tham số VĐK kín, các phương án mục tiêu đầu vào và thời điểm chuyển t* là như nhau.
Bảng 2.3. Các phương án mục tiêu dùng cho khảo sát
Phương án mục tiêu
Tham số mục tiêu
D0mt,[m]
H0mt,[m]
Vmt,[m/s]
nmt,[g]
PA1 – MT không cơ động
35.000
5.000
300
0
PA2 – MT cơ động 1 phía
35.000
5.000
300
6g (t*<tcđ≤18)
PA3 – MT cơ động kiểu
“Con rắn”
35.000
5.000
300
5gcosωmtt (t*<tcđ≤18)
Thời điểm chuyển t* tạm xác định khi thỏa mãn điều kiện Htl=H0mt, với H0mt là độ cao ban đầu của mục tiêu.
Độ trượt tại điểm gặp, theo [8], được tính bằng công thức sau:
(2.57)
Trong đó: , , - tương ứng với khoảng cách tương đối; vận tốc tiếp cận; tốc độ xoay đường ngắm TL-MT.
Kết quả mô phỏng:
a. Phương án 1 – Mục tiêu không cơ động
Hình 2.9. Đồ thị quỹ đạo TL-MT trong mặt phẳng đứng
Hình 2.10. Đồ thị GTPT TL-MT trong mặt phẳng đứng
Hình 2.11. Đồ thị tọa độ góc TL-MT trong mặt phẳng đứng
Hình 2.12. Đồ thị vận tốc TL-MT theo thời gian
b. Phương án 2 – Mục tiêu cơ động một phía
Phương trình GTPT của mục tiêu khi cơ động một phía trong mặt phẳng đứng được cho dưới dạng:
(2.58)
Trong đó: tcd – thời điểm bắt đầu cơ động; tkt – thời điểm kết thúc cơ động;
(tkt - tcd)=18s.
Hình 2.13. Đồ thị quỹ đạo TL-MT trong mặt phẳng đứng
Hình 2.14. Đồ thị GTPT của tên lửa và mục tiêu trong mặt phẳng đứng
Hình 2.15. Đồ thị tọa độ góc TL-MT trong mặt phẳng đứng
Hình 2.16. Đồ thị vận tốc TL-MT theo thời gian
c. Phương án 3 - Mục tiêu cơ động kiểu “Con rắn”
Phương trình GTPT của mục tiêu khi cơ động kiểu “Con rắn” trong mặt phẳng đứng có dạng như sau:
(2.59)
Tần số cơ động ωmt liên hệ với chu kỳ cơ động thông qua biểu thức:
(2.60)
Điều kiện khảo sát: ωmt=0,5rad/s; tcd=18s; tkt=26s; nmt=5.
Hình 2.17. Đồ thị quỹ đạo TL-MT trong mặt phẳng đứng
Hình 2.18. Đồ thị GTPT TL-MT trong mặt phẳng đứng
Hình 2.19. Đồ thị tọa độ góc TL-MT trong mặt phẳng đứng
Hình 2.20. Đồ thị vận tốc TL-MT theo thời gian
Các tham số đặc trưng cho GTPT và sai số dẫn (độ trượt) tại điểm gặp của hai PPD “CV-2D” và “CV-2DGOC” trong ba phương án mục tiêu đã khảo sát được tổng hợp trong bảng 2.4.
Bảng 2.4. Tham số tên lửa và VĐK kín tại điểm gặp theo PPD kết hợp
Phương án mục tiêu
GTPT Wtl,(m/s2)
Sai số dẫn h,(m)
CV-2D
CV-2DGOC
CV-2D
CV-2DGOC
PA1 – MT không cơ động
-7,73
2,05
0,59
0,2
PA2 – MT cơ động một phía
43,75
-5,58
5,95
0,74
PA3 – MT cơ động “Con rắn”
-27,21
15,89
2,98
1,78
Nhận xét:
- Đối với cả ba phương án mục tiêu PPD “CV-2DGOC” luôn hình thành quỹ đạo dạng đạn đạo, tiếp cận mục tiêu từ trên xuống, điều mà ta không nhận được ở PPD “CV-2D” khi mục tiêu cơ động một phía, tăng độ cao so với độ cao ban đầu (hình 2.13). Vì vậy mà PPD “CV-2DGOC” có khả năng duy trì vận tốc tốt hơn so với PPD “CV-2D” trong mọi trường hợp như các kết quả trên hình 2.12, 2.16 và 2.20.
- Nếu so sánh với hai PPD truyền thống là “T/T” và “ПС” thì cả hai PPD kết hợp là “CV-2D” và “CV-2DGOC” đều có độ chính xác dẫn cao hơn đáng kể, đặc biệt là khi bắn mục tiêu cơ động. Điều này hoàn toàn hợp lý khi cả hai PPD đều là tối ưu và có thành phần bù sai số cơ động của mục tiêu;
- Trong cả ba phương án mục tiêu (bảng 2.4) giá trị GTPT tại điểm gặp của PPD “CV-2DGOC” luôn nhỏ hơn GTPT của PPD “CV-2D”;
Đánh giá:
Từ những nhận xét trên có thể đánh giá là PPD từ xa “CV-2DGOC” có độ chính xác cao trong mọi phương án mục tiêu và duy trì động năng (vận tốc) cho tên lửa tốt hơn các PPD khác. Đây chính là cơ sở để lựa chọn PPD từ xa “CV-2DGOC” bổ sung cho hệ lập lệnh các ĐĐK thế hệ cũ nhằm mở rộng VTD, nâng cao hiệu quả của tổ hợp trong điều kiện chiến tranh hiện đại.
2.6. Kết luận chương
Nội dung chính của chương 2 là tập trung giải hai bài toán (thứ nhất và thứ hai) đã xác định ở cuối chương 1. Đó là phân tích, biện luận, lựa chọn và kết hợp các PPD, hình thành PPD mới cho phép tạo ra QĐĐ dạng đạn đạo ở giai đoạn cuối và có độ chính xác cao đối với mọi loại mục tiêu.
Bắt đầu từ cơ sở toán học của PPD “CV”, qua phân tích, biện luận về mô hình và kết quả mô phỏng, ta thấy PPD này đáp ứng được tiêu chí thứ nhất là tạo cho tên lửa một thế năng ban đầu cao (để chuyển thành động năng ở giai đoạn cuối) mà năng lượng dành cho điều khiển là tối thiểu (Wy≈0, khi t≤t*). Đây cũng là cơ sở lựa chọn để tổng hợp giai đoạn đầu của PPD mới mà luận án đang tìm kiếm.
Tiếp theo là đã phân tích nguyên lý hình thành và mô hình toán học của hai PPD tối ưu trên cơ sở của PPD hai điểm từ xa là PPD “2D” và “2DGOC”. Về bản chất thì hai PPD đêu là tối ưu theo sai số dẫn và theo cơ động của mục tiêu. Tuy nhiên qua phân tích mô hình, ta nhận thấy PPD “2DGOC” có sai số tại điểm gặp mục tiêu nhỏ hơn PPD “2D”, đặc điểm này có thể là một gợi ý tốt cho sự lựa chọn phương án kết hợp.
Nội dung còn lại trong chương 2 là tổng hợp hai PPD kết hợp là “CV-2D” và “CV-2DGOC” từ ba PPD “CV”, “2D” và “2DGOC”. Kết quả tổng hợp được thể hiện qua hai biểu thức mô tả GTPT yêu cầu là (2.55) và (2.56). Kết quả mô phỏng trong cùng điều kiện cho thấy PPD “CV-2DGOC” có đáp ứng tốt hơn “CV-2D”.
Tuy nhiên do cả hai PPD nêu trên đều là kết hợp với PPD “CV” để hình thành giai đoạn đầu của QĐĐ, mà thời điểm chuyển PPD (t*) còn mang tính mặc định, nên chưa phải là tối ưu và chưa thể kết luận là PPD nào tốt hơn. Vấn đề lựa chọn PPD kết hợp tiếp tục được giải quyết sau khi ta giải được bài toán tối ưu hóa thời điểm chuyển giai đoạn dẫn sẽ trình bày ở chương 3.
CHƯƠNG 3
ỨNG DỤNG THUẬT TOÁN TỐI ƯU QUẦN THỂ (PSO) TÌM THỜI ĐIỂM CHUYỂN CHO PHƯƠNG PHÁP DẪN KẾT HỢP
3.1. Đặt vấn đề
PPD kết hợp “CV-2D” và “CV-2DGOC” đã tổng hợp, như đã nêu trong kết luận chương 2, tuy đã đáp ứng cơ bản hai tiêu chí về động năng và độ chính xác trong giai đoạn cuối quá trình dẫn, nhưng vẫn còn một hạn chế là chưa tối ưu hóa thời điểm chuyển giai đoạn (t*). Thời điểm chuyển t* có ý nghĩa rất quan trọng đối với hai tiêu chí đã đặt ra cho PPD mới.
Trong những năm gần đây, có rất nhiều phương pháp tối ưu được nghiên cứu và phát triển để giải các bài toán tối ưu khác nhau. Các phương pháp tối ưu hiện đại (có thể gọi là phương pháp tối ưu phi truyền thống) đang trở thành công cụ mạnh và phổ biến để giải các bài toán kỹ thuật phức tạp. Các phương pháp này thường sử dụng thuật toán tối ưu quần thể (PSO), mạng nơron, giải thuật di truyền, hệ thống miễn dịch nhân tạo và tối ưu mờ [44].
Thuật toán PSO [49] đã được ứng dụng rộng rãi khi giải các bài toán tối ưu, nó có ưu điểm về tính ổn định, độ chính xác và tính tác động nhanh [52]. Khi so sánh với các phương pháp tối ưu khác, nó nhanh hơn, rẻ hơn và hiệu quả hơn. Ngoài ra, chỉ có một số ít tham số cần điều chỉnh trong PSO. Vì thế PSO là kỹ thuật lý tưởng để giải bài toán tối ưu. PSO được áp dụng hiệu quả để giải các bài toán phi tuyến, không lồi, liên tục, gián đoạn [44]. Trong lĩnh vực dẫn đường tên lửa, thuật toán PSO đã được sử dụng để tổng hợp luật dẫn tên lửa như [50,51,52] đã đề cập. Đó chính là lý do mà luận án đề xuất sử dụng thuật toán PSO để tìm thời điểm chuyển t* cho phương pháp dẫn kết hợp.
Nội dung chương 3 sẽ trình bày những vấn đề sau: giới thiệu tổng quan về thuật toán PSO; ứng dụng thuật toán PSO để tìm thời điểm chuyển cho PPD kết hợp; khảo sát, đánh giá và lựa chọn một trong hai PPD kết hợp “CV-2D” và “CV-2DGOC” theo tiêu chí mở rộng VTD và nâng cao độ chính xác dẫn.
3.2. Tổng quan về thuật toán tối ưu quần thể (PSO)
3.2.1. Mở đầu
Thuật toán Particle Swarm Optimization (PSO) được Eberhat và Kennedy đề xuất lần đầu tiên năm 1995. Đây là thuật toán tiến hóa mới, khác với các kỹ thuật tính toán tiến hóa trước đây ở chỗ nó dựa trên mô phỏng cách ứng xử trong xã hội. Thật vậy, trong PSO, người ta mô phỏng phản ứng của một đàn chim về việc chia sẻ thông tin mà chúng nhận được từ sự khám phá và kinh nghiệm trước đó của tất cả các cá thể khi tìm kiếm thức ăn. Mỗi cá thể (con chim) trong quần thể được gọi là một Particle, cả quần thể (đàn chim) gọi là Swarm, được giả sử là phải bay trong không gian tìm kiếm thức ăn. Ví dụ, trong trường hợp cực đoan, các vùng không gian tìm kiếm có giá trị hàm số tìm kiếm thấp hơn các vùng đã thăm dò trước đó. Với kịch bản này, mỗi cá thể được xem như một điểm trong không gian D-chiều điều chỉnh hướng bay của mình theo kinh nghiệm trước đó cũng như của các cá thể khác.
Trong một hệ thống PSO, mỗi phần tử trong quần thể sẽ thay đổi vị trí bằng cách di chuyển theo nhiều hướng khác nhau trong không gian tìm kiếm, cho đến khi tìm được vị trí tốt nhất.
Tiến trình thay đổi những điểm tìm kiếm của thuật toán PSO được biểu diễn như trên hình 3.1:
O
Hình 3.1. Quá trình cập nhật vị trí của mỗi cá thể trong quần thể
Trong đó:
* - vị trí cá thể thứ i tại thế hệ thứ k;
* - vị trí cá thể thứ i tại thế hệ thứ k+1;
* - vận tốc cá thể thứ i tại thế hệ thứ k;
* - vận tốc cá thể thứ i tại thế hệ thứ k+1;
* - vận tốc theo Pbest;
* - vận tốc theo Gbest;
* - vị trí tốt nhất của cá thể thứ i;
* - vị trí tốt nhất của cá thể trong quần thể.
Để cho dễ hiểu tư tưởng của thuật toán PSO, chúng ta xét ví dụ sau:
Giả sử có một đàn chim đang tìm kiếm thức ăn trong một vùng không gian nào đó. Tất cả các cá thể chim không biết thức ăn ở đâu. Tuy nhiên, chúng biết là thức ăn ở cách xa bao nhiêu sau mỗi lần bay đi bay về. Câu hỏi đặt ra là cách tốt nhất để tìm đến nơi có thức ăn là thế nào? Câu trả lời đơn giản là, hãy bay theo sau những con chim ở gần chỗ có thức ăn nhất. PSO phỏng theo kịch bản này và sử dụng nó để giải các bài toán tối ưu.
Trong PSO, mỗi giải pháp đơn, trong ví dụ trên là mỗi con chim được gọi là Particle. Mỗi Particle có một giá trị tương ứng (fitness value), được đánh giá bằng hàm fitness function và một vận tốc để định hướng tới vị trí tìm kiếm thức ăn. Các Particle sẽ duyệt không gian bài toán bằng cách bám theo các Particle có điều kiện tốt nhất (tức là fitness value) hiện tại.
PSO được khởi tạo bởi một nhóm ngẫu nhiên các Particle, sau đó tìm kiếm giải pháp tối ưu bằng việc cập nhật các thế hệ. Trong mỗi thế hệ, mỗi Particle được cập nhật theo hai giá trị: thứ nhất là Pbest (là nghiệm tốt nhất đạt được cho tới thời điểm hiện tại), nó chính là giá trị fitness của Particle tốt nhất trong thế hệ hiện tại; thứ hai là Gbest (là nghiệm tốt nhất của cá thể lân cận cá thể này đạt được cho tới thời điểm hiện tại), là giá trị fitness của Particle tốt nhất trong tất cả các thế hệ từ trước đến thời điểm hiện tại.
Nói cách khác, mỗi cá thể trong quần thể sau một thế hệ cập nhật vị trí tốt nhất của nó theo vị trí tốt nhất của các cá thể khác trong quần thể tính tới thời điểm hiện tại. Quá trình cập nhật của Particle dựa trên hai biểu thức sau:
(3.1)
(3.2)
Trong đó: N - số phần tử trong quần thể; D - Kích thước quần thể; k - số lần lặp lại (chỉ số thế hệ); - vận tốc của cá thể thứ i tại thế hệ thứ k; w - hệ số quán tính; c1, c2 - hệ số gia tốc; rand() - hàm tạo giá trị ngẫu nhiên trong khoảng (0,1); - vị trí cá thể thứ i tại thế hệ thứ k; - vị trí tốt nhất của cá thể thứ i.
Nhận xét [46]:
- PSO là kỹ thuật không sử dụng đạo hàm, giống như các kỹ thuật tối ưu khám phá (Heuristic) khác;
- PSO là một kỹ thuật dễ tiếp cận và triển khai ứng dụng hơn so với các kỹ thuật tối ưu khám phá khác;
- PSO là kỹ thuật ít nhạy cảm đối với bản chất tự nhiên (dạng, biểu thức cụ thể ...) của hàm mục tiêu so với các phương pháp toán học thông thường và các phương pháp tối ưu khám phá khác;
- PSO có số lượng tham số ít, chỉ bao gồm hệ số trọng số quán tính và hai hệ số gia tốc. Ngoài ra, sự thay đổi của các tham số này ít ảnh hưởng tới lời giải hơn so với các thuật toán khám phá khác;
- PSO được xem là ít phụ thuộc vào điểm tìm kiếm xuất phát so với các phương pháp tiến hóa khác, tức là thuật toán có tính hội tụ cao;
- Kỹ thuật PSO có thể cho lời giải chính xác và đặc tính hội tụ ổn định trong khoảng thời gian tính toán ngắn hơn so với các phương pháp ngẫu nhiên khác;
- PSO không yêu cầu thông tin về Gradient của hàm mục tiêu và chỉ sử dụng các toán tử toán học cơ bản (cộng, trừ, nhân, chia).
3.2.2. Thuật toán tối ưu quần thể PSO
Tập hợp các cá thể ban đầu (Swarm) có số lượng
Các file đính kèm theo tài liệu này:
- nang_cao_kha_nang_co_dong_cua_ten_lua_bang_cach_bo_sung_cho.docx