Mục lục
Lời nói đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Chương 1 Kiến thức chuẩn bị 6
1.1. Tạo các phân bố đều . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.1. Khái niệm phân bố đều . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.2. Tạo phân bố đều trên hộp . . . . . . . . . . . . . . . . . . . . . . 7
1.1.3. Tạo phân bố đều trong đơn hình . . . . . . . . . . . . . . . . . . 7
1.1.4. Tạo phân bố đều trên mặt đơn hình . . . . . . . . . . . . . . . . . 8
1.1.5. Phương pháp loại trừ Von Neuman trên miền bất kỳ giới nội . . . 9
1.2. Phương pháp dò tìm ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.1. Phương pháp dò tìm ngẫu nhiên đơn giản . . . . . . . . . . . . . 9
1.2.2. Phương pháp dò tìm ngẫu nhiên tổng quát . . . . . . . . . . . . . 10
Chương 2 Một loại bài toán điều khiển ngẫu nhiên tổng hợp và chuyển nó
về bài toán điều khiển theo chương trình 12
2.1. Thiết lập bài toán . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2. Thiết lập các điều khiển chấp nhận được tham số hoá . . . . . . . . . . . 19
Chương 3 Cơ sở của phương pháp bắn ngẫu nhiên định hướng 28
3.1. Xấp xỉ hệ động lực . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2. Thuật toán bắn ngẫu nhiên định hướng đối với xấp xỉ vế phải của hệ động
lực . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
60 trang |
Chia sẻ: netpro | Lượt xem: 1493 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Chuyên đề Phương pháp bắn ngẫu nhiên định hướng giải một loại bài toán điều khiển ngẫu nhiên tổng hợp và ứng dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
thuộc wi(T4), xác định theo các công thức (2.2.1) và (2.2.3);
N (j) (j = 0÷ 3) - là các tích phân tính theo các công thức (2.2.5) - (2.2.8).
Định nghĩa 2.2.4.
Tập hợp Dε gồm tất cả các bộ tham số điều khiển ε - chấp nhận được theo nghĩa
trên:
Dε :=
{
X ∈ R3×n : (2.2.31)− (2.2.36)
}
(2.2.38)
được gọi là tập hợp các bộ tham số điều khiển ε - chấp nhận được đối với hệ động lực
(2.2.17).
Chú ý 2.2.4. Ta biết (xem [4]) rằng: Nếu các điều kiện ε - chấp nhận được nói trên
(đối với mỗi bộ tham số X) được thoả mãn thì các điều kiện chấp nhận được nêu trong
định nghĩa (2.2.3) cũng sẽ được thoả mãn, nghĩa là
Dε ⊂D. (2.2.39)
Ngoài ra ta còn có
lim
ε→0
mes
(
Dε) = mes
(
D). (2.2.40)
Vì vậy, ta có thể sử dụng chú ý (2.2.3) (với việc xấp xỷ tập hợp D bởi tập hơp Dε)
để xác định tất cả các QTVHHLKT có thể lập được trong tương lai đối với mỗi dự án
thiết kế của HTTĐ 3 - bậc thang trên sông Đà.
Với ý nghĩa trên, ta sẽ xét trong chương 3 dưới đây việc lựa chọn một cách ngẫu
nhiên bộ tham số điều khiển ε - chấp nhận được X ∈Dε
Trong việc giải số bài toán giảm thiểu độ rủi ro vỡ đập cho công trình thuỷ điện Sơn
la, ta biết rằng (xem [7]): đây là một loại bài toán điều khiển ngẫu nhiên tổng hợp [7],
− 25 −
nên khi giải nó (bằng phương pháp Monte Carlo), ta cần phải lựa chọn một cách ngẫu
nhiên ma trận X ∈Dε, sao cho (xem (1.2.3) - (1.2.12)):
P{X ∈ A} > 0 (∀A ⊂Dε : mes(A) > 0). (2.2.41)
Phần mềm VSAM-3A của hội UDTH Việt Nam đã được soạn thảo để chỉ ra sự tồn
tại của miền D
′
ε, sao cho
D
′
ε ⊂Dε , mesD
′
ε > 0; (2.2.42)
đồng thời đề ra thuật toán lựa chọn một cách ngẫu nhiên các tham số điều khiển ε-chấp
nhận được X ∼ U(D′ε) (có phân bố đều trên D′ε). Mặc dầu VSAM-3A đã đưa ra những
quy trình VHHLKT khá tốt về mặt sản xuất điện và phân bổ dung tích phòng lũ. Nhưng
nó chưa thể sử dụng để giải bài toán giảm thiểu độ rủi ro lũ lụt cho công trình thuỷ
điện Sơn La, vì rằng điều kiện (2.2.41) chưa được bảo đảm. Điều này dẫn tới yêu cầu
cần phải cải tiến chương trình VSAM-3A nói trên.
Về mặt nguyên tắc, ta có thể thực hiện điều này thông qua việc tạo VTNN với 3n-
chiều X ∼ U(Dε), với các thành phần xki ∼ U([ui, x¯i]) thoả mãn các điều kiện tương
ứng (nêu trong (2.2.31)). Những điều kiện còn lại trong (2.2.32) - (2.2.36) sẽ được kiểm
tra bằng phương pháp loại trừ Von Neumann đã trình bày ở chương 1.
Tuy nhiên, do thể tích của siêu hộp 3n-chiều quá lớn so với thể tích miền Dε:
mes
( 3⊗
i=1
k4⊗
k=k1+1
[0, x¯i]
)
>> mes
(
Dε
)
,
nên hiệu quả của thuật toán loại trừ Von Neumann quá thấp. Điều này làm cho thời
gian tính toán lâu, tới mức không sử dụng được trong thực tế.
Nhằm khắc phục khó khăn nói trên, ta sẽ sử dụng thuật toán loại trừ Von Neumann
với hiệu quả cao hơn để thu được bộ tham số điều khiển X ∈ Dε thoả mãn điều kiện
(2.2.41).
Thuật toán "bắn ngẫu nhiên" cùng với phần mềm VISAM-3 đã giải quyết được bài
toán trên. Trong luận văn này, ta sẽ cải tiến thuật toán bắn ngẫu nhiên nói trên dưới
dạng thuật toán "bắn ngẫu nhiên định hướng" sẽ được trình bày ở chương 3 dưới đây.
Ý tưởng của thuật toán này là: các trạng thái wi(tk) thoả mãn điều kiện (2.2.32) với
k = k1 + 1 ÷ k3 sẽ thu được bằng cách tạo phân bố đều trong đơn hình (xem chương
1), với k = k3 + 1÷ k4 − 1 sẽ thu được bằng cách tạo phân bố đều trên đơn hình (xem
chương 1). Điểm cuối wi(T4) của quỹ đạo nói trên sẽ thu được bằng phương pháp bắn
ngẫu nhiên vào miền xác định bởi các điều kiện (2.2.33) - (2.2.34).
− 26 −
Bằng cách làm này ta thu được một miền đủ nhỏ chứa Dε, khi đó có thể sử dụng
phương pháp loại trừ Von Neumann với "hiệu quả cao" để kiểm tra sự thoả mãn điều
kiện (2.2.31) và các điều kiện (2.2.35) - (2.2.36).
− 27 −
Chương 3
Cơ sở của phương pháp bắn ngẫu
nhiên định hướng
3.1. Xấp xỉ hệ động lực
Từ định lý (2.2.1) ta nhận thấy rằng hệ động lực (2.1.21) trong bài toán (2.1.19) -
(2.1.28) có thể thay bởi dạng thu hẹp (2.2.17) của nó trên khoảng [T1, T4].
Với ý nghĩa đó, ta xét hệ phương trình vi phân (2.2.17) trên đoạn [T1, T4]w˙i(t) = −p(t)wi(t) +
(
q
′
i(t) + qo − xi(t)
)
10−6 (T1 ≤ t ≤ T4)
wi(0) = woi (i = 1÷ 3),
Đặt:
fi(t, ωi(t), x(t)) = −p(t)wi(t) +
(
q
′
i(t) + qo − xi(t)
)
10−6 (T1 ≤ t ≤ T4)
fˆi(t, x(t)) = −pi + σ
[
q
′
i(t)− xi(t)
]
(T1 ≤ t ≤ T4)
trong đó các hằng số σ, pi chọn theo công thức:
σ = 10−6
pi =
1
4
(p + p)(woi + wi)− σqo =
(
0, 0036(woi + wi)− 16, 9
)
10−6 (3.1.1)
(i = 1÷ 3)
Ta xét:
∆i(t) := |fi(t, ωi(t), x(t)) − fˆi(t, x(t))| (T1 ≤ t ≤ T4, i = 1÷ 3)
Ta có:
∆i(t) := |
p + p¯
2
x
wi + woi
2
− p(t)wi(t)| (1)
− 28 −
Ta xấp xỉ gần đúng
p + p¯
2
≈ p(t) và wi + woi
2
≈ wi(t) ta được:
∆i(t) :=
p + p¯
2
∆wi(t) +
wi + woi
2
∆p(t) (2)
trong đó:
∆p(t) := |p(t) − p + p¯
2
| , ∆wi(t) = |wi(t) − wi + woi
2
|
Từ công thức (2.2.30) ta có:
p ≤ p(t) ≤ p¯ ⇒ ∆p(t) ≤ p + p¯
2
= 7.2 x 10−9 (T1 ≤ t ≤ T4) (3)
Tương tự, từ điều kiện chấp nhận (2.2.22) ta còn có:
wi ≤ wi(t) ≤ wi ⇒ ∆wi(t) ≤ w¯i − wi (T1 ≤ t ≤ T4) (4)
Kết hợp (2), (3) và (4) ta thu đươc:
∆i(t) ≤ 7,2 x 10−9 x (wi + woi − wi
2
) := ∆i (T1 ≤ t ≤ T4, i = 1÷ 3) (5)
Dựa vào các số liệu ban đầu woi, wi, wi ta dễ dàng đánh giá sai số của ∆i nhỏ hơn
nhiều lần so với sai số của số liệu ban đầu (có thể bỏ qua chúng khi tính toán), nên ta
có thể xấp xỉ vế phải của hệ phương trình (2.2.17) bởi vế phải của hệ phương trình sau
đây: w˙i(t) = −pi + σ
[
q
′
i(t)− xi(t)
]
(T1 < t ≤ T4)
wi(T1) = woi (i = 1÷ 3).
(3.1.2)
Tương tự, ta có thể xấp xỉ hệ phương trình (2.1.21) bởi hệ phương trình sau:w˙i(t) = −pi + σ
[
q
′
i(t)− xi(t)
]
(0 < t ≤ T )
wi(0) = woi (i = 1÷ 3).
(3.1.3)
Trong trường hợp này điều khiển tổng hợp được xác định như sau:
Bổ đề 3.1.1. Nếu hệ phương trình (2.2.17) được xấp xỷ bởi hệ (3.1.2), thì công thức
(2.2.3) (để xác định điều khiển tổng hợp (2.2.2)) sẽ trở thành:
xi(t) = xˆi(t) := qˆ
′
i(t)− σ−1pi (∀t ∈ [0, T1) ∪ (T4, T5] , i = 3÷ 1) (3.1.4)
xi(t) = xˆi(t) := qˆ
′
i(t)−
wi(T4)− woi − pi(T − T5)
σ(T − T5) (∀t ∈ (T5, T ] , i = 3÷ 1), (3.1.5)
trong đó wi(T4) (i = 1÷ 3) là nghiệm của hệ (3.1.2) tại t = T4 và
qˆ
′
i(t) :=
q3(t) (khi i = 3)qi(t) + xˆi+1(t) (khi i = 2÷ 1). (3.1.5*)
− 29 −
Chứng minh:
Với t ∈ [0, T1) ∪ (T4, T5], từ (2.1.22) và (2.1.23) ta suy ra w˙i(t) ≡ 0.
Do đó, từ hệ phương trình (3.1.3) ta có: 0 = −pi + σ[qˆ′i(t)− xi(t)].
Khi đó ta trực tiếp thu được (3.1.4), trong đó (2.1.30) có dạng (3.1.5*).
Trong trường hợp T5 < t ≤ T , từ (2.1.24) ta có: w˙i(t) =
woi − wi(T4)
T − T5 .
Do đó, từ (3.1.3) ta còn có:
woi − wi(T4)
T − T5 = −pi + σ[qˆ
′
i(t)− xi(t)] (i = 1÷ 3).
Trên cơ sở này ta suy ra:
woi − wi(T4)
σ(T − T5) = −
pi
σ
+ qˆ
′
i(t)− xi(t) =⇒ xi(t) =
wi(T4)− woi
σ(T − T5) −
pi
σ
+ qˆ
′
i(t).
Khi đó ta thu được (3.1.5).
Bây giờ ta đặt:
ξki := σ
∫ tk+1
tk
xi(t)dt (k = k1 ÷ k4 − 1 , i = 3÷ 1). (3.1.6)
n1 := k3 − k1 ; n2 := k4 − k3. (3.1.7)
Khi đó ta có:
Bổ đề 3.1.2. Nếu hệ phương trình (2.2.17) được xấp xỷ bởi hệ (3.1.2) , thì các nghiệm
wi(tk) (k = k1 + 1÷ k4 , i = 3÷ 1) của chúng được xác định từ các biến điều khiển mới
ξki (k = k1 ÷ k4 − 1) theo các công thức sau:
wi(tk1+j) = woi − pi(tk1+j − T1) + σ
∫ tk1+j
T1
q
′
i(t)dt−
k1+j−1∑
k=k1
ξki (3.1.8)
(j = 1÷ n1 , i = 3÷ 1)
wi(tk3+j) = wi(T3)− pi(tk3+j − T3) + σ
∫ tk3+j
T3
q
′
i(t)dt−
k3+j−1∑
k=k3
ξki (3.1.9)
(j = 1÷ n2 , i = 3÷ 1).
Ngoài ra, các tham số điều khiển (2.2.27) cũng được xác định từ các biến điều khiển mới
theo các công thức truy hồi sau:
xk+1i =
2ξki
σ|∆k| − x
k
i (k = k1 ÷ k4 − 1 , i = 3÷ 1), (3.1.10)
− 30 −
trong đó:
xk1i =
q3(T1)− σ−1p3 (i = 3)qi(T1)− σ−1pi + xk1i+1 (i = 2÷ 1). (3.1.10*)
Chứng minh:
Với mỗi i = 3 ÷ 1, khi tích phân 2 vế của (3.1.2) trên các khoảng [T1, tk1+j] và
[T3, tk3+j] ta lần lượt thu được:
wi(tk1+j) = woi − pi(tk1+j − T1) + σ
∫ tk1+j
T1
q
′
i(t)dt− σ
∫ tk1+j
T1
xi(t)dt (j = 1÷ n1). (1)
wi(tk3+j) = wi(T3)−pi(tk3+j−T3)+σ
∫ tk3+j
T3
q
′
i(t)dt−σ
∫ tk3+j
T3
xi(t)dt (j = 1÷n2). (2)
Từ (2.2.24) và (3.1.6) ta có
σ
∫ tk1+j
T1
xi(t)dt =
k1+j−1∑
k=k1
σ
∫ tk+1
tk
xi(t)dt =
k1+j−1∑
k=k1
ξki (j = 1÷ n1). (3)
σ
∫ tk3+j
T3
xi(t)dt =
k3+j−1∑
k=k3
σ
∫ tk+1
tk
xi(t)dt =
k3+j−1∑
k=k3
ξki (j = 1÷ n2). (4)
Do đó, khi thay (3) vào (1) ta thu được (3.1.8) và khi thay (4) vào (2) ta thu được
(3.1.9).
Mặt khác, từ (3.1.6) và (2.2.26), (2.2.24*) ta có:
ξki = σ
∫ tk+1
tk
(
xki +
xk+1i − xki
tk+1 − tk
(
t−tk
))
dt =
σ|∆k|
2
(
xki +x
k+1
i
)
(k = k1÷k4−1 , i = 3÷1).
Trên cơ sở này ta thu được (3.1.8).
Cuối cùng, để chứng minh (3.1.10*) ta chú ý đến điều kiện (2.1.6) về tính liên tục tại
t = T1 của hàm điều khiển (2.2.2), để từ (2.2.26) và (3.1.4) suy ra:
xk1i = xi(tk1) = xi(T1) = lim
t→T1−0
xˆi(t) = lim
t→T1−0
(
qˆ
′
i(t)− σ−1pi
)
(i = 3÷ 1). (5)
Ngoài ra, từ (3.1.5*) và giả thiết về tính liên tục của các hàm qi ∈ C(0, T ) tại t = T1 ta
còn có:
lim
t→T1−0
qˆ
′
i(t) =
q3(T1) (i = 3)qi(T1) + xk1i+1 (i = 2÷ 1).
Kết hợp điều này với (5) và tính liên tục tại t = T1 của hàm p(t) (xem (2.1.2)) ta thu được
(3.1.10*).
− 31 −
Để xét các dấu hiệu có thể giảm bớt các điều kiện ε - chấp nhận được (2.2.31) -
(2.2.36), ta ký hiệu:
P¯i =
p3 + σu3 (i = 3)pi + σ(ui − x¯i+1) (i = 2÷ 1) P i =
p3 + σx3 (i = 3)pi + σ(x¯i − ui+i) (i = 2÷ 1) (3.1.11)
Bổ đề 3.1.3. Với các điều kiện của bổ đề (3.1.1) và giả sử điều kiện (2.2.31) được thoả
mãn. Khi đó ta có các kết luận sau:
1- Nếu tồn tại số tự nhiên k, sao cho:
σ
∫ tk
T1
qi(t)dt ≤ P¯i(tk − T1) (k = k1 + 1÷ k3 , i = 1÷ 3), (3.1.12)
thì trạng thái wi(tk) tương ứng thoả mãn điều kiện:
wi(tk) ≤ woi (∀i = 1÷ 3). (3.1.12*)
2- Nếu tồn tại số tự nhiên k, sao cho:
σ
∫ tk
T3
qi(t)dt ≥ P i(tk − T3) (k = k3 + 1÷ k4 , i = 1÷ 3), (3.1.13)
thì trạng thái wi(tk) tương ứng thoả mãn điều kiện:
wi(tk) ≥ wi(T3) (∀i = 1÷ 3). (3.1.13*)
Chứng minh:
Từ (3.1.10) ta có:
ξki =
σ|∆k|
2
(
xki + x
k+1
i
)
(k = k1 ÷ k4 − 1 , i = 1÷ 3).
Do đó, từ (2.2.31) ta suy ra:
σui|∆k| ≤ ξki ≤ σ|∆k|x¯i (k = k1 ÷ k4 − 1 , i = 1÷ 3). (1)
Mặt khác, từ (3.1.8), (3.1.9) và (3.1.7) ta còn có:
wi(tk) = woi − pi(tk − T1) + σ
∫ tk
T1
q
′
i(t)dt−
k−1∑
j=k1
ξji (k = k1 + 1÷ k3 , i = 3÷ 1). (2)
wi(tk) = wi(T3)− pi(tk−T3)+σ
∫ tk
T3
q
′
i(t)dt−
k−1∑
j=k3
ξji (k = k3 +1÷k4 , i = 3÷ 1). (3)
Với i = 1÷ 2, từ (3.1.6) và (1) ta thu được
σ
∫ tk
T1
xi+1(t)dt =
k−1∑
j=k1
σ
∫ tj+1
tj
xi+1(t)dt =
k−1∑
j=k1
ξji+1 ≤ σx¯i+1
k−1∑
j=k1
|∆j|.
− 32 −
Hay là (xem (2.2.24*)):
σ
∫ tk
T1
xi+1(t)dt ≤ σx¯i+1(tk − T1) (k = k1 + 1÷ k3 , i = 2÷ 1).
Khi đó, từ (2.1.30) ta suy ra
σ
∫ tk
T1
q
′
i(t)dt = σ
∫ tk
T1
qi(t)dt + σ
∫ tk
T1
xi+1(t)dt ≤ σ
∫ tk
T1
qi(t)dt + σx¯i+1(tk − T1).
Kết hợp điều này với (3.1.11) và (1) ta có
−pi(tk − T1) + σ
∫ tk
T1
q
′
i(t)dt−
k−1∑
j=k1
ξji ≤ −P¯i(tk − T1) + σ
∫ tk
T1
qi(t)dt (i = 2÷ 1). (4)
Trong trường hợp i = 3, từ (3.1.11) và (2.1.30), (1) ta trực tiếp suy ra:
−p3(tk−T1)+σ
∫ tk
T1
q
′
3(t)dt−
k−1∑
j=k1
ξji ≤ −P¯3(tk−T1)+σ
∫ tk
T1
q3(t)dt (k = k1+1÷k3). (4*)
Dựa vào (2) và (4), (4*) ta có:
wi(tk) ≤ woi − P¯i(tk − T1) + σ
∫ tk
T1
qi(t)dt (k = k1 + 1÷ k3 , i = 3÷ 1).
Do đó từ (3.1.12) ta thu được (3.1.12*).
Để chứng minh (3.1.13*), trước hết ta dựa vào (3.1.6) và (1) để suy ra rằng
σ
∫ tk
T3
xi+1(t)dt =
∑k−1
j=k3
σ
∫ tj+1
tj
xi+1(t)dt =
∑k−1
j=k3
ξji+1 ≥ σui+1(tk − T3)
(k = k3 + 1÷ k4 , i = 2÷ 1).
Khi đó, từ (2.1.30) ta có:
σ
∫ tk
T3
q
′
i(t)dt ≥ σ
∫ tk
T3
qi(t)dt + σui+1(tk − T3) (k = k3 + 1÷ k4 , i = 2÷ 1). (5)
Ngoài ra, từ (1) ta còn có:
k−1∑
j=k3
ξji ≤ σx¯i
k−1∑
j=k3
|∆j| = σx¯i(tk − T3) (k = k3 + 1÷ k4 , i = 3÷ 1). (6)
Kết hợp điều này với (3), (5) và (3.1.11) ta suy ra
wi(tk) ≥ wi(T3)−
(
pi − σui+1 + σx¯i
)
(tk − T3) + σ
∫ tk
T3
qi(t)dt =
= wi(T3)− P i(tk − T3) + σ
∫ tk
T3
qi(t)dt (k = k3 + 1÷ k4 , i = 2÷ 1). (7)
− 33 −
Tương tự, từ (3), (6) và (3.1.11) ta còn có:
w3(tk) ≥ w3(T3) + σ
∫ tk
T3
q3(t)dt− P 3(tk − T3) (k = k3 + 1÷ k4).
Kết hợp điều này với (7) ta thu được
wi(tk) ≥ wi(T3) + σ
∫ tk
T3
qi(t)dt− P i(tk − T3) (k = k3 + 1÷ k4 , i = 3÷ 1).
Khi đó, từ (3.1.13) ta suy ra (3.1.13*).
Chú ý 3.1.1. Khi đối chiếu với các số liệu của các hàm qi(t) (t ∈ [T1, T4] , i = 1÷ 3)
(cho trong [7]) và với các bộ tham số thiết kế khác nhau về x¯i, woi, wi, w¯i (cho trong [11]),
ta nhận thấy rằng: các điều kiện (3.1.12) đều được thoả mãn ∀k = k1 + 1÷ k3; các điều
kiện (3.1.13) đều được thoả mãn ∀k = k3 + 1÷ k4. Bởi vậy ta có thể dựa vào (3.1.12*)
và (3.1.13*) để thu hẹp các điều kiện ε-chấp nhận được (2.2.32), dưới dạng:
wi ≤ wi(tk) ≤ woi (∀k = k1 + 1÷ k3 , i = 1÷ 3)
wi(T3) ≤ wi(tk) ≤ wi (∀k3 + 1÷ k4 , i = 1÷ 3). (3.1.14)
Chú ý 3.1.2. Tương tự, từ các số liệu của các hàm qi(t) (t ∈ [0, T1]∪ [T4, T5] , i = 1÷3)
và với các bộ tham số thiết kế khác nhau về x¯i, woi, wi, w¯i (cho trong [11]), ta có thể dựa
vào công thức (3.1.4) để nhận thấy rằng: các điều kiện (2.2.34) đều được thoả mãn
∀k = 0÷ k1 , k = k4 + 1÷ k5.
Do đó có thể thu hẹp các điều kiện này dưới dạng sau đây:
ui ≤ xˆki ≤ xi (∀k = k5 + 1÷K ; i = 1÷ 3) . (3.1.15)
Dựa vào các chú ý (3.1.1) và (3.1.2), nếu đặt:
xk1 :=
q(hl) (k = k1 + 1÷ k2)u1 (k = k2 + 1÷ k3) ; xk1 := u1 (k = k1 + 1÷ k3) (3.1.16)
xki := ui ; x
k
i := ui (k = k1 + 1÷ k3 , i = 2÷ 3) (3.1.16*)
Ta có thể phát biểu lại các điều kiện (2.2.31) - (2.2.36) dưới dạng các điều kiện ε-chấp
nhận được thu hẹp sau đây:xki ≤ xki ≤ xki (∀k = k1 + 1÷ k3 ; i = 3÷ 1)wi(ε) ≤ wi(tk) ≤ woi (∀k = k1 + 1÷ k3 , i = 3÷ 1). (3.1.17)ui ≤ xki ≤ xi (∀k = k3 + 1÷ k4 − 1 ; i = 3÷ 1)wi(T3) ≤ wi(tk) ≤ wi(ε) (∀k = k3 + 1÷ k4 − 1 , i = 3÷ 1). (3.1.18)
− 34 −
ui ≤ x
k4
i ≤ xi , ui ≤ xˆki ≤ xi (∀k = k5 + 1÷K),
wi(T3) ≤ wi(T4) ≤ wi(ε) (i = 3÷ 1) ;
∑3
i=1
[
wi − wi(T4)
]≥ V . (3.1.19)
N ≤ 24[N (o)(x,w) + N (1)(xˆ) + N (2)(xˆ, w(T4)) + N (3)(xˆ, w(T4))] (3.1.20)
3∑
i=1
[
wi(tk)− wi
]≥ V (ε) (k = k1 + 1÷ k3). (3.1.21)
Nhằm thiết lập thuật toán bắn ngẫu nhiên để xác định các tham số điều khiển
X ∈Dε :=
{
X ∈ R3×n : (3.1.17)− (3.1.21)
}
, (3.1.22)
trước hết ta dựa vào (2.1.30) để suy ra rằng:
Qki = Q
k
i (x
k
i+1, x
k+1
i+1 ) :=
∫ tk+1
tk
q
′
i(t)dt
=
∫ tk+1
tk
qi(t)dt + 1{1,2}(i)
|∆k|
2
(xki+1 + x
k+1
i+1 ), (3.1.22*)
trong đó (xem (2.1.18)):
1{ 1 , 2 }(i) =
1 nếu i = 30 nếu i = 1÷ 2.
Cùng với hàm Qki (theo các tham số điều khiển x
k
i+1, x
k+1
i+1 ), ta còn đưa ra các hàm
wk+1i , w
k+1
i (theo trạng thái wi(tk) và các tham số điều khiển x
k
i+1, x
k+1
i+1 , x
k
i ) dưới đây:
wk+1i := max
{
wi(ε) , wi(tk) + σQ
k
i (x
k
i+1, x
k+1
i+1 )− |∆k|
[
pi +
σ
2
(xki + x
k+1
i )
]}
wk+1i := min
{
woi , wi(tk) + σQ
k
i (x
k
i+1, x
k+1
i+1 )− |∆k|
[
pi +
σ
2
(xki + x
k+1
i )
]}
(i = 3÷ 1 ; k = k1 ÷ k3 − 1),
(3.1.23)
wk+1i := max
{
wi(T3) , wi(tk) + σQ
k
i (x
k
i+1, x
k+1
i+1 )− |∆k|
[
pi +
σ
2
(xki + xi)
]}
wk+1i := min
{
wi(ε) , wi(tk) + σQ
k
i (x
k
i+1, x
k+1
i+1 )− |∆k|
[
pi +
σ
2
(xki + ui)
]}
(i = 3÷ 1 ; k = k3 ÷ k4 − 2),
(3.1.24)
wk4i := max
{
wi(T3) , wi(tk4−1) + σQ
k4−1
i (x
k4−1
i+1 , x
k4
i+1)− |∆k4−1|
[
pi +
σ
2
(xk4−1i + xi)
]
,
woi + σ(T − T5)
[
ui − qˆ
′
i(max) + σ
−1pi
]}
; (3.1.25)
− 35 −
qˆ
′
i(max) := maxk5≤k≤K
{
qˆ
′
i(tk)
}
(i = 3÷ 1)
wk4i := min
{
wi(ε) , wi(tk4−1) + σQ
k4−1
i (x
k4−1
i+1 , x
k4
i+1)− |∆k4−1|
[
pi +
σ
2
(xk4−1i + ui)
]
,
woi + σ(T − T5)
[
xi − qˆ′i(min) + σ−1pi
]}
; (3.1.25*)
qˆ
′
i(min) := mink5≤k≤K
{
qˆ
′
i(tk)
}
(i = 3÷ 1).
Khi đó ta có:
Bổ đề 3.1.4. Nếu hệ động lực có dạng (3.1.2) thì ta có thể xác định các tham số điều
khiển theo công thức truy hồi:
xk+1i =
2
[
wi(tk)− wi(tk+1)
]
σ|∆k| +
2
|∆k|Q
k
i (x
k
i+1, x
k+1
i+1 )−
(2pi
σ
+ xki
)
(i = 3÷ 1 ; k = k1 + 1÷ k4), (3.1.26)
với xk1i (i = 3÷ 1) xác định theo (3.1.10*) và thu được các kết luận sau:
1- Các điều kiện (3.1.17) tương đương với các điều kiện:
wki ≤ wi(tk) ≤ wki (∀k = k1 + 1÷ k3 , i = 3÷ 1). (3.1.27)
2- Các điều kiện (3.1.18) tương đương với các điều kiện:
wki ≤ wi(tk) ≤ wki (∀k = k3 + 1÷ k4 − 1 , i = 3÷ 1). (3.1.28)
3- Các điều kiện (3.1.19) tương đương với các điều kiện:
wk4i ≤ wi(T4) ≤ wk4i (∀i = 3÷ 1) ;
3∑
i=1
wi(T4) ≤
3∑
i=1
wi − V . (3.1.29)
Chứng minh:
Khi tích phân phương trình (3.1.2) trên ∆k = [tk, tk+1) và dựa trên (3.1.6), ta có
wi(tk+1) = wi(tk)− pi|∆k|+ σ
∫ tk+1
tk
q
′
i(t)dt− ξki (k = k1 + 1÷ k4 , i = 3÷ 1).
Hay là (xem (3.1.10))
wi(tk+1) = wi(tk)−pi|∆k|+σ
∫ tk+1
tk
q
′
i(t)dt−
σ|∆k|
2
(xki +x
k+1
i ) (k = k1+1÷k4, i = 3÷1).
(1)
− 36 −
Khi đó từ (3.1.22*) ta thu được (3.1.26).
Hiển nhiên là các điều kiện (3.1.17) có thể lần lượt biểu diễn dưới dạng:
xk+1i ≤ xk+1i ≤ xk+1i (∀k = k1 ÷ k3 − 1, i = 3÷ 1). (2)
wi(ε) ≤ wi(tk+1) ≤ woi (∀k = k1 ÷ k3 − 1, i = 3÷ 1). (3)
Dựa trên (1) ta dễ dàng nhận thấy rằng: các điều kiện (2) tương đương với các điều kiện
(2*) dưới đây:
wi(tk) + σ
∫ tk+1
tk
q
′
i(t)dt− |∆k|
[
pi +
σ
2
(xki + x
k+1
i )
]≤ wi(tk+1) ≤
≤ wi(tk)− |∆k|+ σ
∫ tk+1
tk
q
′
i(t)dt− |∆k|
[
pi +
σ
2
(xki + x
k+1
i )
]
(2*)
(∀k = k1 ÷ k3 − 1, i = 3÷ 1)
Từ (3.1.22*) và (3.1.23) ta lại thu được sự tương đương giữa các điều kiện (2*), (3) với
điều kiện dạng (3.1.27) dưới đây:
wk+1i ≤ wi(tk+1) ≤ wk+1i (∀k = k1 ÷ k3 − 1 , i = 3÷ 1).
Khi đó, kết luận 1 được chứng minh.
Tương tự như khi chứng minh sự tương đương giữa các điều kiện (2) và (2*), bằng cách
dựa vào (1) ta dễ dàng thu được:
ui ≤ xk+1i ≤ xi ⇐⇒ wi(tk) + σ
∫ tk+1
tk
q
′
i(t)dt− |∆k|
[
pi +
σ
2
(xki + xi)
]≤ wi(tk+1) ≤
≤ wi(tk) + σ
∫ tk+1
tk
q
′
i(t)dt− |∆k|
[
pi +
σ
2
(xki + ui)
]
(∀k = k3 ÷ k4 − 1, i = 3÷ 1)
Khi đó từ (3.1.22*) và (3.1.24) ta cũng chứng minh được kết luận 2 bằng cách tương tự
như trường hợp trên.
Nhằm chứng minh kết luận 3, trước hết ta dựa vào (1) (với k = k4 − 1) để thu được:
ui ≤ xk4i ≤ xi ⇐⇒ wi(tk4−1) + σ
∫ T4
tk4−1
q
′
i(t)dt− |∆k4−1|
[
pi +
σ
2
(xk4−1i + xi)
]≤
≤ wi(T4) ≤ wi(tk4−1) + σ
∫ T4
tk4−1
q
′
i(t)dt− |∆k4−1|
[
pi +
σ
2
(xk4−1i + ui)
]
(4)
(∀i = 3÷ 1)
− 37 −
Mặt khác, từ (3.1.5) ta còn có:
wi(T4) = woi + σ(T − T5)
[
xˆki + σ
−1pi − qˆ′i(tk)
]
(∀k = k5 + 1÷K , i = 3÷ 1).
Do đó:
ui ≤ xˆki ≤ xi ⇐⇒ woi + σ(T − T5)
[
ui + σ
−1pi − qˆ′i(tk)
]≤ wi(T4) ≤
≤ woi + σ(T − T5)
[
xi + σ
−1pi − qˆ′i(tk)
]
, (∀k = k5 ÷K, i = 3÷ 1) (5)
Vì
qˆ
′
i(min) := min
k5≤k≤K
{
qˆ
′
i(tk)
}
; qˆ
′
i(max) := max
k5≤k≤K
{
qˆ
′
i(tk)
}
(i = 3÷ 1)
(xem (3.1.25), (3.1.25*)), nên:
qˆ
′
i(min) ≤ qˆ
′
i(tk) ≤ qˆ
′
i(max) (∀k = k5 ÷K , i = 3÷ 1).
Khi đó, từ (5) ta suy ra:
ui ≤ xˆki ≤ xi (∀k = k5 ÷K) ⇐⇒ woi + σ(T − T5)
[
ui + σ
−1pi − qˆ′i(max)
]≤
≤ wi(T4) ≤ woi + σ(T − T5)
[
xi + σ
−1pi − qˆ′i(min)
]
, (i = 3÷ 1)
Khi đó, từ (4), (3.1.22*) và (3.1.25), (3.1.25*) ta thu được
ui ≤ xk4i ≤ xi ; ui ≤ xˆki ≤ xi (∀k = k5 ÷K) ; wi(T3) ≤ wi(T4) ≤ wi(ε)
⇐⇒ wk4i ≤ wi(T4) ≤ wk4i (∀i = 3÷ 1).
Nghĩa là kết luận 3 được chứng minh.
Dựa vào các kết quả trên, ta xây dựng phương pháp bắn ngẫu nhiên định hướng để giải
bài toán QTVHHLKT hệ thống thuỷ điện 3 bậc thang trên sông Đà.
3.2. Thuật toán bắn ngẫu nhiên định hướng đối với xấp xỉ vế
phải của hệ động lực
Để xây dựng thuật toán, trước hết ta ký hiệu:
Ski :=
{
(ξk1i , ..., ξ
k3−1
i ) : a
k−1
i ≤ ξk−1i ≤ ak−1i , bki ≤
k−1∑
j=k1
ξji ≤ cki
}
(k = k1+1÷k3), (3.2.1)
∆
(1)
i :=
{
(ξk1i , ..., ξ
k3−1
i ) :
k3−1∑
k=k1
(ξki − aki ) ≤ d(1)i ; ξki ≥ aki (k = k1 ÷ k3 − 1)
}
(3.2.2)
(i = 1÷ 3)
− 38 −
d
(1)
i := c
k3
i −
k3−1∑
k=k1
aki ; c
k
i := woi − wi(ε) + bki ; bki := −pi(tk − T1) +
k−1∑
j=k1
qji (3.2.3)
(k = k1 + 1÷ k3 , i = 1÷ 3)
aki :=
σ|∆k|
2
(xki + x
k+1
i ) ; a
k
i :=
σ|∆k|
2
(xki + x
k+1
i ) ; a
k
i :=
σ|∆k|
2
(xki + x
k+1
i ) (3.2.3*)
(k = k1 ÷ k3 − 1 , i = 1÷ 3)
qki :=
σ
∫ tk+1
tk
q3(t)dt (i = 3)
σ
∫ tk+1
tk
qi(t)dt + ξ
k
i+1 (i = 2÷ 1)
(k = k1 ÷ k4 − 1). (3.2.4)
Khi đó ta có:
Bổ đề 3.2.1. Nếu hệ động lực có dạng (3.1.2) và nếu với mỗi i = 3 ÷ 1, các hàm
aki = a
k
i (x
k
i ) ; a
k
i = a
k
i (x
k
i ) (k = k1 + 1 ÷ k3) xác định trong (3.2.3*) theo các tham số
điều khiển xki (trong đó x
k
i được xác định theo các biến điều khiển mới ξ
k−1
i từ công thức
truy hồi (3.1.10)), thì các điều kiện (3.1.17) tương đương với các điều kiện (3.2.5) sau
đây:
(ξk1i , ..., ξ
k3−1
i ) ∈ S(1)i (ε) :=
k3⋂
k=k1+1
Ski ⊂ ∆(1)i (i = 3÷ 1). (3.2.5)
Trong đó điều kiện wi(ε) ≤ wi(tk3) = wi(T3) trong (3.1.17), nếu được hiểu theo nghĩa
chặt hơn: wi(ε) < wi(T3)) thì ta có d
(1)
i > 0.
Chứng minh:
Từ (3.1.10) ta suy ra:
ξk−1i =
σ|∆k−1|
2
(xk−1i + x
k
i ) (k = k1 + 1÷ k4 , i = 3÷ 1). (3.2.5*)
Khi đó từ (3.2.3*) ta có:
xki ≤ xki ≤ xki ⇐⇒ ak−1i =
σ|∆k−1|
2
(xk−1i + x
k
i ) ≤ ξk−1i ≤
σ|∆k−1|
2
(xk−1i + x
k
i ) = a
k−1
i
(∀k = k1 + 1÷ k3 ; i = 3÷ 1). (1)
Mặt khác, khi sử dụng (3.1.8) với j = k − k1 ta có:
wi(tk) = woi−pi(tk−T1)+
k−1∑
j=k1
σ
∫ tj+1
tj
q
′
i(t)dt−
k−1∑
j=k1
ξji (k = k1+1÷k3 , i = 3÷1). (2)
− 39 −
Từ (2.1.30) ta còn có:
σ
∫ tj+1
tj
q
′
i(t)dt =
σ
∫ tj+1
tj
q3(t)dt (i = 3)
σ
∫ tj+1
tj
qi(t)dt + σ
∫ tj+1
tj
xi+1(t)dt (i = 2÷ 1)
(j = k1 + 1÷ k4).
Bởi vậy, từ (3.1.6) và (3.2.4) ta suy ra:
σ
∫ tj+1
tj
q
′
i(t)dt = q
j
i (j = k1 + 1÷ k4 , i = 1÷ 3). (3.2.6)
Kết hợp điều này với (3.2.3) ta có thể biểu diễn (2) dưới dạng:
wi(tk) = woi + b
k
i −
k−1∑
j=k1
ξji (k = k1 + 1÷ k3 , i = 3÷ 1). (3)
Khi đó, do cki := woi − wi(ε) + bki (xem (3.2.3)) nên ta có:
wi(ε) ≤ wi(tk) ≤ woi ⇐⇒ bki ≤
k−1∑
j=k1
ξji ≤ cki (∀k = k1 + 1÷ k3 ; i = 3÷ 1). (4)
Từ (1), (4) và (3.2.1) ta suy ra rằng:
Các điều kiện (3.1.17) ⇐⇒ (ξk1i , ..., ξk3−1i ) ∈
k3⋂
k=k1+1
Ski (i = 3÷ 1). (5)
Vì d
(1)
i − ck3i = −
∑k3−1
k=k1
aki (xem (3.2.3)), nên:
k3−1∑
k=k1
ξki ≤ ck3i =⇒
k3−1∑
k=k1
(ξki − aki ) ≤ ck3i + (d(1)i − ck3i ) = d(1)i (i = 1÷ 3). (6)
Ngoài ra, do
ak−1i =
σ|∆k−1|
2
(xk−1i + x
k
i ) ≥ ak−1i :=
σ|∆k−1|
2
(xk−1i + x
k
i ) (∀xk−1i ≥ xk−1i )
(xem (3.2.3*)), nên
ak−1i ≤ ξk−1i (∀k = k1 + 1÷ k3) =⇒ ξki ≥ aki (∀k = k1 ÷ k3 − 1).
Khi đó, từ (6) và (3.2.1), (3.2.2) ta dễ dàng suy ra:
k3⋂
k=k1+1
Ski =
{
(ξk1i , ..., ξ
k3−1
i ) : a
k−1
i ≤ ξk−1i ≤ ak−1i , bki ≤
k−1∑
j=k1
ξji ≤ cki (k = k1+1÷k3)
}
⊂
{
(ξk1i , ..., ξ
k3−1
i ) :
k3−1∑
k=k1
(ξki −aki ) ≤ d(1)i ; ξki ≥ aki (k = k1÷k3−1)
}
= ∆
(1)
i (i = 1÷3).
− 40 −
Kết hợp điều này với (5) ta thu được sự tương đương giữa các điều kiện (3.1.17) và
(3.2.5).
Cuối cùng, từ (3.2.3) ta dễ dàng nhận thấy rằng:
d
(1)
i = woi − wi(ε)− pi(tk3 − T1) +
k3−1∑
j=k1
qji −
k3−1∑
j=k1
aji = woi − wi(ε) + bk3i −
k3−1∑
j=k1
aji .
Khi đó, do xk+1i ≥ xk+1i , xki ≥ xki (xem (3.1.17)), nên từ (3.2.3*) và (3.2.5*) ta có:
d
(1)
i = woi − wi(ε) + bk3i −
σ
2
k3−1∑
k=k1
|∆k|(xk+1i + xki ) ≥
≥ woi − wi(ε) + bk3i −
σ
2
k3−1∑
k=k1
|∆k|(xk+1i + xki ) = woi − wi(ε) + bk3i −
k3−1∑
k=k1
ξki .
Kết hợp điều này với (3) và giả thiết wi(tk3) > wi(ε) ta suy ra d
(1)
i ≥ wi(tk3)−wi(ε) > 0.
Chú ý 3.2.1. Từ (3.2.6) và công thức (2) trong chứng minh bổ đề trên, ta dễ dàng suy
ra rằng:
wi(tk) = f
k
i (woi; ξ
k1
i , ..., ξ
k3−1
i ) := woi − pi(tk − T1) +
k−1∑
j=k1
qji −
k−1∑
j=k1
ξji (3.2.6*)
(k = k1 + 1÷ k3 , i = 3÷ 1)
Chú ý 3.2.2. Trong số các điều kiện ε-chấp nhận được (3.1.17) - (3.1.21), để xét các
dạng tương đương của các điều kiện (3.1.18) - (3.1.19) ta có thể biểu diễn chúng dưới
dạng (3.2.7) - (3.2.8) dưới đây:ui ≤ xki ≤ xi (∀k = k3 + 1÷ k4 ; i = 3÷ 1)wi(T3) ≤ wi(tk) ≤ wi(ε) (∀k = k3 + 1÷ k4 − 1 , i = 3÷ 1). (3.2.7)ui ≤ xˆki ≤ xi (∀k = k5 + 1÷K),wi(T3) ≤ wi(T4) ≤ wi(ε) (i = 3÷ 1) ; ∑3i=1 wi(T4) ≤∑3i=1 wi − V . (3.2.8)
Trong trường hợp các trạng thái wi(T3), wi(T4) (i = 1÷ 3) đã cho, để biểu diễn các
điều kiện (3.2.7) theo các biến điều khiển ξki (k = k3 ÷ k4 − 1) ta đặt:
Ski :=
{
(ξk3i , ..., ξ
k4−1
i ) : a
k−1
i ≤ ξk−1i ≤ ak−1i , bki ≤
k−1∑
j=k3
ξji ≤ cki
}
(3.2.9)
(k = k3 + 1÷ k4 − 1)
− 41 −
Sk4i :=
{
(ξk3i , ..., ξ
k4−1
i ) : a
k4−1
i ≤ ξk4−1i ≤ ak4−1i ,
k4−1∑
j=k3
ξji = c
k4
i
}
, (3.2.9*)
∆
(2)
i :=
{
(ξk3i , ..., ξ
k4−1
i ) :
k4−1∑
k=k3
(ξki − aki ) = d(2)i ; ξki ≥ aki (k = k3 ÷ k4 − 1)
}
(3.2.10)
(i = 1÷ 3)
d
(2)
i := c
k4
i −
∑k4−1
k=k3
aki ;
ck4i := wi(T3)− wi(T4)− pi(T4 − T3) +
∑k4−1
j=k3
qji ;
cki := −pi(tk − T3) +
∑k−1
j=k3
qji ; b
k
i := wi(T3)− wi(ε) + cki
(3.2.11)
(k = k3 + 1÷ k4 − 1 , i = 1÷ 3)
aki := σ|∆k| ui ; aki :=
σ|∆k|
2
(xki + xi) ; a
k
i :=
σ|∆k|
2
(xki + ui) (3.2.11*)
(k = k3 ÷ k4 − 1 , i = 1÷ 3)
Bổ đề 3.2.2. Nếu các trạng thái wi(T3) (i = 1÷ 3) xác định theo công thức:
wi(T3) = f
k3
i (woi; ξ
k1
i , ..., ξ
k3−
Các file đính kèm theo tài liệu này:
- Phương pháp bắn ngẫu nhiên định hướng giải một loại bài toán điều khiển ngẫu nhiên tổng hợp và ứng dụng.pdf