Lời cảm ơn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Bảng kí hiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Mở đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1 Hiệu chỉnh đa tham số - sự hội tụ và tốc độ hội tụ 7
1.1 Đặt bài toán . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Các kết quả về tính ổn định . . . . . . . . . . . . . . . . . . 8
1.3 Tốc độ hội tụ . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Hiệu chỉnh đa tham số trong không gian Hilbert . . . . . . . 16
1.5 Mối liên hệ giữa phương pháp nhân tử Lagrange và phương pháp hiệu chỉnh
2 Phương pháp hiệu chỉnh đa tham số Tikhonov 22
2.1 Nhắc lại bài toán . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Một số kết quả . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3 Ví dụ minh họa . . . . . . . . . . . . . . . . . . . . . . . . 34
3 Phương pháp chỉnh lặp song song dạng Gauss - Newton 37
3.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Sự hội tụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3 Ví dụ minh họa . . . . . . . . . . . . . . . . . . . . . . . . 46
Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
57 trang |
Chia sẻ: mimhthuy20 | Lượt xem: 502 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận văn Một số phương pháp hiệu chỉnh giải hệ phương trình toán tử, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
j
∥∥∥G j(x− x†)∥∥∥
Yj
,1≤ j ≤ l
với C j < 1 thì điều kiện (A6) nghiệm đúng với γ = 0 và β j =
∥∥w j∥∥Y ∗j (1−
C j)−1,1≤ j ≤ l.
Chứng minh. Ta có r j(x,x†) := Fj(x)−Fj(x†)−G j(x− x†).
Suy ra∥∥∥G(x− x†)∥∥∥−∥∥∥r j(x,x†)∥∥∥≤ ∥∥∥Fj(x)−Fj(x†)∥∥∥≤ ∥∥∥G(x− x†)∥∥∥+∥∥∥r j(x,x†)∥∥∥ .
Do đó
(1−C j)
∥∥∥G(x− x†)∥∥∥≤ ∥∥∥Fj(x)−Fj(x†)∥∥∥≤ (1+C j)∥∥∥G(x− x†)∥∥∥ .
Theo cách chứng minh của hệ quả (1.3.1) ta có
〈
J′(x†),x− x†〉X∗,X ≤ l∑j=1∥∥w j∥∥Y ∗j .∥∥G j(x− x†)∥∥Yj
≤
l
∑
j=1
‖w j‖Y∗j
1−C j
∥∥Fj(x)−Fj(x†)∥∥
Từ đó suy ra điều phải chứng minh.⊠
15
1.4 Hiệu chỉnh đa tham số trong không gian Hilbert
Ta xét bài toán (1.1.3) với X ,Yj là các không gian Hilbert.
Giả sử J(x) := ‖P(x)‖2 trong đó P : X → Z là toán tử phi tuyến. Ta sử dụng
phương pháp nhân tử Lagrange giải bài toán (1.1.3).
Xét hàm Lagrange
L(x,λ ) := J(x)+
l
∑
j=1
λ j(
∥∥∥Fj(x)− yδj ∥∥∥2Yj −δ 2j ), (1.4.1)
hoặc hàm Tikhonov
T̂λ (x) := J(x)+
l
∑
j=1
λ j
∥∥∥Fj(x)− yδj ∥∥∥2Yj . (1.4.2)
Ta có thuật toán tìm nghiệm của bài toán (1.1.3) như sau [16]
Thuật toán 1
1. Cho xδ0 ∈ X ,λ (0) = (λ (0)1 , ...,λ (0)l )≥ 0;k := 0.
2. Tìm nghiệm xδk+1 của bài toán T̂λ (k)(x)→ min.
3. Đặt
λ (k+1)j := λ
(k)
j max
∥∥∥Fj(xδk+1)− yδj∥∥∥ν
δ νj
,ε
,( j = 1, ..., l)(0 < ε << 1) ,
(1.4.3)
với ν > 0 cố định bất kì.
4. Nếu
∥∥∥λ (k+1)−λ (k)∥∥∥< TOL thì dừng thuật toán, ngược lại đặt k := k+1
và quay lại bước 2.
Định lý 1.4.1. Nếu λ (k)→ λ và xδk → xδ ∈D⊂ X khi k→∞ thì (xδ ,λ ) ∈
X ×Rl là điểm yên ngựa của hàm Lagrange (1.4.1) và do đó xδ là nghiệm
của (1.1.3).
Trước khi đi vào chứng minh định lý 1.4.1 ta có bổ đề sau
16
Bổ đề 1.4.2. Cặp (xδ ,λ ) ∈ D×Rl+ là điểm yên ngựa của hàm Lagrange
(1.4.1) ứng với bài toán (1.1.3) nếu x = xδ làm cực tiểu phiếm hàm Tikhonov
(1.4.2) ứng với tham số hiệu chỉnh λ = λ và thỏa mãn
λ j(
∥∥∥Fj(xδ )− yδj ∥∥∥2−δ 2j ) = 0 j = 1, ..., l, (1.4.4)
và thêm điều kiện∥∥∥Fj(xδ )− yδj ∥∥∥2 ≤ δ 2j nếu λ j = 0 j = 1, ..., l. (1.4.5)
Chứng minh. Theo định nghĩa điểm yên ngựa ta có
L(xδ ,λ )≤ L(xδ ,λ )≤ L(x,λ ) ∀x ∈ D, ∀λ ∈ Rl+.
Bất đẳng thức thứ hai tương với
J
(
xδ
)
+
l
∑
j=1
λ j
(∥∥∥Fj(xδ )− yδj ∥∥∥2−δ 2j)≤ J (x)+ l∑
j=1
λ j
(∥∥∥Fj(x)− yδj ∥∥∥2−δ 2j),
hay T̂λ
(
xδ
)
≤ T̂λ (x) ∀x ∈ D . Điều này đúng theo giả thiết xδ làm cực tiểu
phiếm hàm Tikhonov (1.4.2).
Bất đẳng thức thứ nhất tương đương với
l
∑
j=1
(
λ j−λ j
)(∥∥∥Fj(xδ )− yδj ∥∥∥2−δ 2j)≥ 0 ∀λ ∈ Rl+.
Do giả thiết (1.4.4) và (1.4.5) nên bất đẳng thức cuối này luôn đúng. Vậy Bổ
đề 1.4.2 được chứng minh. ⊠
Bây giờ ta đi chứng minh Định lý 1.4.1. Ta kiểm tra các giả thiết của Bổ
đề 1.4.2.
Theo cách xây dựng các dãy {λ k} và {xδk } thì các giới hạn λ và xδ của phép
lặp (1.4.3) thỏa mãn T̂λ
(
xδ
)
≤ T̂λ (x) với mọi x ∈ D, tức là xδ làm cực tiểu
phiếm hàm Tikhonov (1.4.2) ứng với λ = λ . Hơn nữa cặp (xδ ,λ ) thỏa mãn
λ j = λ jmax
∥∥∥Fj(xδ)− yδj∥∥∥ν
δ νj
,ε
,1≤ j ≤ l. (1.4.6)
17
Do 0< ε ≪ 1, nên từ (1.4.6) suy ra hoặc λ j = 0 hoặc
∥∥∥Fj(xδ)− yδj ∥∥∥2 = δ 2j .
Điều này suy ra giả thiết (1.4.4) của Bổ đề 1.4.2.
Tiếp tục kiểm tra giả thiết (1.4.5). Giả sử có chỉ số j nào đó sao cho∥∥∥Fj(xδ)− yδj ∥∥∥2 > δ 2j và λ j = 0,
tức là
∥∥∥Fj(xδ)− yδj ∥∥∥ν > δ νj và λ j = 0. Khi đó tồn tại k0 = k0( j) sao cho∥∥∥Fj(xδk)− yδj ∥∥∥ν > δ νj với mọi k ≥ k0 (do Fj liên tục và tính liên tục của
chuẩn). Do đó
max
∥∥∥Fj(xδk)− yδj∥∥∥ν
δ νj
,ε
> 1.
Theo (1.4.3), suy ra λ k+1j > λ kj > 0 với mọi k ≥ k0. Cho k → ∞, suy ra
λ j = limk→∞ λ
k
j > λ k0j > 0. Điều này vô lý vì λ j = 0. Vậy giả thiết (1.4.5) thỏa
mãn. Áp dụng Bổ đề 1.4.2, Định lý 1.4.1 được chứng minh. ⊠
Nhược điểm của thuật toán 1
1. Phải giải bài toán tối ưu phi tuyến trên mỗi bước lặp.
2. Do phép lặp (1.4.3) hội tụ chậm nên cần thực hiện nhiều bước lặp.
Sau đây ta trình bày thuật toán lặp Gauss - Newton để tìm nghiệm xấp xỉ
của bài toán (1.1.3).
Xét bài toán J(x) = ‖P(x)‖
2
Z →min
x∈D∥∥∥Fj(x)− yδj ∥∥∥≤ δ j, j = 1, ..., l.
Ta dựng hàm Tikhonov
T̂λ (x) := J(x)+
l
∑
j=1
λ j
∥∥∥Fj(x)− yδj ∥∥∥2Yj .
Giả thiết Fj(x) và P(x) là các hàm khả vi Fréchet với các đạo hàm F
′
j(x)
và P′(x). Giả sử đã biết xδk , ta đi tìm x
δ
k+1 = x
δ
k +∆x bằng cách tuyến tính hóa
18
Fj
(
xδk +∆x
)
≈ Fj
(
xδk
)
+F
′
j
(
xδk
)
∆x
P
(
xδk +∆x
)
≈ P
(
xδk
)
+P′
(
xδk
)
∆x.
Ta đưa về bài toán tìm cực tiểu của dạng toàn phương
T̂λ (k)(x
δ
k +∆x)≈Φ(∆x)→ min∆x
trong đó
Φ(∆x) =
∥∥∥P′(xδk )∆x+P(xδk )∥∥∥2Z + l∑j=1λ (k)j
∥∥∥F ′j(xδk )∆x−(yδj −Fj(xδk ))∥∥∥2Yj .
Tìm ∆x là nghiệm của phương trình ∂Φ∂∆x = 0, tức là
∂Φ
∂∆x = 2P
′∗(xδk )P
′(xδk )∆x+2P
′∗(xδk )P(x
δ
k )
+2
l
∑
j=1
λ (k)j
[
F
′∗
j (x
δ
k )F
′
j(x
δ
k )∆x+F
′∗
j (x
δ
k )
(
yδj −Fj(xδk )
)]
= 0
điều này tương đương với[
P
′∗(xδk )P
′(xδk )+
l
∑
j=1
λ (k)j F
′∗
j (x
δ
k )F
′
j(x
δ
k )
]
∆x
=
l
∑
j=1
λ (k)j F
′∗
j (x
δ
k )
(
yδj −Fj(xδk )
)
−P′∗(xδk )P(xδk ). (1.4.7)
Khi đó ta có thuật toán 2
1. Cho xδ0 ∈ X ,λ (0) = (λ (0)1 , ...,λ
(0)
l )≥ 0;k := 0
2. Giải (1.4.4) tìm ∆x. Đặt xδk+1 = x
δ
k +∆x.
3. Tìm λ (k+1) = (λ (k+1)1 , ...,λ
(k+1)
l ) theo công thức (1.4.3).
4. Nếu
∥∥∥λ (k+1)−λ (k)∥∥∥ < TOL1 và ‖∆x‖X < TOL2 thì dừng thuật toán,
ngược lại, đặt k := k+1 và quay lại bước 2.
19
Sự hội tụ của phương pháp chỉnh lặp Gauss - Newton được nghiên cứu trong
[7, 8, 9, 10]. Trong chương 3, sẽ trình bày kĩ hơn về phương pháp chỉnh lặp
song song Gauss - Newton [1].
1.5 Mối liên hệ giữa phương pháp nhân tử La-
grange và phương pháp hiệu chỉnh đa tham
số
Ta sẽ chỉ ra rằng Thuật toán 1 liên quan mật thiết với phương pháp nhân tử
Lagrange cho bài toán tối ưu với ràng buộc bất đẳng thức. Cho X là không
gian Banach, ta xét bài toán J(x)→ ming j(x)≤ 0, j = 1, ..., l, (1.5.1)
với hàm mục tiêu J : X → R và các hàm ràng buộc g j : X → R, j = 1, ..., l. Với
mỗi nhân tử Lagrange λ = (λ1, ...,λl)T ∈ Rl,(λ j ≥ 0) và hằng số c > 0, đặt
M(x,λ ,c) := J(x)+ 1
2c
l
∑
j=1
(
max
{
0,λ j + cg j(x)
}2−λ 2j ). (1.5.2)
Sau đây là phương pháp nhân tử Lagrange. Cho λ k ≥ 0;ck > 0. Ta tìm
nghiệm xk của bài toán
M(x,λ k,ck)→min,x ∈ X . (1.5.3)
Và cập nhật nhân tử Lagrange
λ k+1j := max{0;λ (k)j + ckg j(xk)}, j = 1, ..., l. (1.5.4)
Với ck được chọn theo một quy tắc nào đó (thông thường ta chọn là dãy tăng:
ck+1 ≥ ck).
Ta có một số thay đổi nhỏ so với bài toán trên là thay tham số đơn c ∈ R
bằng véctơ tham số c = (c1, ...,cl)T ∈ Rl với c j > 0 và thay hàm (1.5.2) bởi
M(x,λ ,c) := J(x)+
l
∑
j=1
1
2c j
(
max
{
0,λ j + c jg j(x)
}2−λ 2j ). (1.5.5)
20
Cho ν > 0, đặt
g j(x) := 2δ νj
(∥∥∥Fj(x)− yδj ∥∥∥νYj −δ νj
)
; c j :=
λ j
2δ 2νj
.
Do đó
M(x,λ ,c) := J(x)+
l
∑
j=1
1
2c j
max{0,λ j + λ jδ νj
(∥∥∥Fj(x)− yδj ∥∥∥νYj −δ νj
)}2
−λ 2j
= J(x)+
l
∑
j=1
δ 2νj
λ j
max{0,λ j + λ jδ νj
(∥∥∥Fj(x)− yδj ∥∥∥νYj −δ νj
)}2
−λ 2j
= J(x)+
l
∑
j=1
δ 2νj λ j
max{0,1+ 1δ νj
(∥∥∥Fj(x)− yδj ∥∥∥νYj −δ νj
)}2
−1
= J(x)+
l
∑
j=1
δ 2νj λ j
max
0,
∥∥∥Fj(x)− yδj ∥∥∥νYj
δ νj
2
−1
= J(x)+
l
∑
j=1
λ j
(∥∥∥Fj(x)− yδj ∥∥∥2νYj −δ 2νj
)
Kết quả này trùng với hàm Lagrange trong (1.4.1) với ν = 1. Hơn nữa ta
cập nhật (1.5.4) và đi đến
λ (k+1)j := max
{
0,λ (k)j +2c
(k)
j δ νj
(∥∥∥Fj(x)− yδj ∥∥∥νYj −δ νj
)}
= max
0,λ (k)j + λ
(k)
j
δ νj
(∥∥∥Fj(x)− yδj ∥∥∥νYj −δ νj
)
= λ (k)j max
0,
∥∥∥Fj(x)− yδj ∥∥∥νYj
δ νj
.
Kết quả này trùng với (1.4.3) khi ε = 0.
21
Chương 2
Phương pháp hiệu chỉnh đa
tham số Tikhonov
Trong chương này, chúng tôi đề cập tới phương pháp hiệu chỉnh đa tham
số Tikhonov dựa trên việc cực tiểu phiếm hàm làm trơn Tikhonov, trong đó
phiếm hàm có chứa tham số α và các tham số - λ j, ( j = 1, ..., l). Phần này tôi
phát triển dựa theo cách tiếp cận tổng quát của Torsten [2] để mở rộng các kết
quả đã biết của Nguyễn Bường và Nguyễn Đình Dũng [3], bao gồm các định
lý: Định lý 2.2.1, Định lý 2.2.2, Định lý 2.2.3, Mệnh đề 2.2.4 về sự tồn tại và
tính ổn định của nghiệm. Cuối chương là hai định lý: Định lý 2.2.5, Định lý
2.2.6 về tốc độ hội tụ của nghiệm.
2.1 Nhắc lại bài toán
Cho X ,Yj,( j = 1,2, . . . , l) là các không gian Banach phản xạ, Fj : D(Fj) ⊂
X → Yj là các toán tử (phi tuyến), D :=
l⋂
j=1
D(Fj) 6=∅. Ta cần giải hệ sau
Fj(x) = y j,x ∈ D,( j = 1,2, . . . , l). (2.1.1)
Trong trường hợp dữ liệu có nhiễu, yδj :
∥∥∥yδj − y j∥∥∥≤ δ j,( j = 1,2, . . . , l) ta có
hệ mới
Fj(x) = yδj ,x ∈ D,( j = 1,2, . . . , l). (2.1.2)
22
Phương pháp hiệu chỉnh đa tham số Tikhonov
Xét bài toán cực tiểu hóa phiếm hàm làm trơn Tikhonov
Tα(x) =
l
∑
j=1
λ j
∥∥∥Fj(x)− yδj ∥∥∥2Yj +αJ(x)→minx∈D , (2.1.3)
trong đó α > 0;λ = (λ1, ...,λl)T ,λ j > 0,‖λ‖∞ = 1, phiếm hàm ổn định
J : D⊂ X → R và véctơ hiệu chỉnh α = (α1, ...,αl)T ;α j = αλ j , j = 1,2, . . . , l.
Định nghĩa. x† được gọi là nghiệm J−min của bài toán (2.1.1) nếu x†
thỏa mãn (2.1.1) và
J(x†) = min{J(x) : x ∈ S}
trong đó S := {x ∈ D : Fj(x) = y j, j = 1,2, . . . , l}.
Mục tiêu của chương này là thiết lập tính đặt chỉnh của bài toán (2.1.3)
với các điều kiện (A1)-(A5), tức là chứng minh bài toán (2.1.3) luôn có duy
nhất nghiệm xδα phụ thuộc liên tục vào dữ liệu đã cho. Ngoài ra thêm một vài
điều kiện bổ sung về hàm Fj(x) và J(x) ta sẽ có đánh giá tốc độ hội tụ của
phương pháp theo khoảng cách Bregman.
2.2 Một số kết quả
Sau đây là một số kết quả chính thu được cho phương pháp hiệu chỉnh Tikhonov.
Định lý 2.2.1. Với các điều kiện (A1)− (A4) thì bài toán (2.1.3) luôn có
ít nhất một nghiệm xδα .
Chứng minh. Đặt d = inf
x∈D
Tα(x). Khi đó tồn tại dãy cực tiểu {xn} ⊂D, sao
cho d = lim
n→∞ Tα(xn). Nói riêng dãy {Tα(xn)} là dãy bị chặn, nghĩa là, tồn tại
R > 0 sao cho 0≤ Tα(xn)≤ R ∀n ∈ N. Điều này tương đương với
l
∑
j=1
λ j
∥∥∥Fj(xn)− yδj ∥∥∥2+αJ(xn)≤ R ∀n ∈ N.
23
Do đó {Fj(xn)}n,{J(xn)}n là bị chặn. Suy ra tồn tại C ≥ 0 sao cho J(xn)+
l
∑
j=1
∥∥Fj(xn)∥∥≤C, ∀n. Mà theo (A4) tập
A(C) =
{
x : J(x)+
l
∑
j=1
∥∥Fj(x)∥∥≤C}
là bị chặn.
Từ đó suy ra dãy {xn,F1(xn), ...,Fl(xn)} là bị chặn trong không gian Ba-
nach phản xạ X ×Y1× ...×Yl. Do vậy nó là tập compac tương đối yếu, hay
tồn tại dãy con {xnk} ⊂ {xn} sao cho xnk ⇀ x0Fj(xnk)⇀ y j( j = 1,2, . . . , l).
Theo giả thiết (A2) thì x0 ∈D và Fj(x0) = y j,( j = 1,2, . . . , l). Do tính nửa
liên tục dưới yếu của chuẩn và của J(x), ta có
∥∥∥Fj(x0)− yδj ∥∥∥= ∥∥∥y j− yδj ∥∥∥≤ limk→∞ inf∥∥∥Fj(xnk)− yδj ∥∥∥ , j = 1,2, . . . , l
J(x0)≤ limk→∞ infJ(xnk).
Từ đây suy ra
d ≤ Tα(x0)≤ limk→∞ infTα(xnk)≤ limk→∞ supTα(xnk) = limk→∞ Tα(xnk) = d,
do đó d = Tα(x0), hay x0 là nghiệm của bài toán (2.1.3).⊠
Định lý 2.2.2. Cho các giả thiết (A1)− (A5), α > 0, và yδnj → yδj (n →
∞), j = 1,2, . . . , l. Gọi xn là nghiệm của bài toán (2.1.3) ứng với yδj thay
bằng yδnj
Khi đó
1. Tồn tại một dãy con hội tụ của dãy xn.
2. Mỗi giới hạn của dãy con là nghiệm của bài toán (2.1.3).
24
Chứng minh. Lập luận tương tự như trong định lý 2.2.1 ta có xnk ⇀ x0 ∈ DFj(xnk)⇀ y j
và Fj(x0) = y j,( j = 1, . . . , l). Vì xnk là nghiệm của (2.1.3) và y
δnk
j → yδj nên
ta có
Tα(x0)≤ limk inf
l
∑
j=1
λ j
∥∥∥Fj(xnk)− yδnkj ∥∥∥2+αlimk infJ(xnk)
≤ lim
k
{
sup
l
∑
j=1
λ j
∥∥∥Fj(xnk)− yδnkj ∥∥∥2 +α supJ(xnk)
}
≤ lim
k
{
l
∑
j=1
λ j
∥∥∥Fj(x)− yδnkj ∥∥∥2+αJ(x)
}
=
l
∑
j=1
λ j
∥∥∥Fj(x)− yδj ∥∥∥2 +αJ(x) = Tα(x) ∀x ∈ D. (2.2.1)
Vậy Tα(x0)≤ Tα(x) ∀x ∈ D từ đây suy ra
x0 ∈ Argmin
x∈D
Tα(x). (2.2.2)
Bây giờ ta chứng minh xnk → x0. Từ (2.2.1) ta có
lim
k→∞
{
l
∑
j=1
λ j
∥∥∥Fj(xnk)− yδnkj ∥∥∥2+αJ(xnk)
}
=
l
∑
j=1
λ j
∥∥∥Fj(x0)− yδj ∥∥∥2+αJ(x0)
(2.2.3)
Ta kết luận J(xnk) → J(x0). Thật vậy giả sử ngược lại J(xnk)9 J(x0). Vì
J(x0)≤ limk infJ(xnk) nên nếu đặt C := limk supJ(xnk) thì C > J(x0).
Ngoài ra, tồn tại dãy con {xm}m ⊂ {xnk}k sao cho
lim
m→∞ J(xm) =C.
Chú ý rằng xm ⇀ x0,Fj(xm)⇀ y j = Fj(x0) nên từ (2.2.3) ta có
lim
m
l
∑
j=1
λ j
∥∥∥Fj(xm)− yδmj ∥∥∥2 = l∑j=1λ j
∥∥∥Fj(x0)− yδj ∥∥∥2 +α [J(x0)−C]
25
<
l
∑
j=1
λ j
∥∥∥Fj(x0)− yδj ∥∥∥2.
Điều này là vô lý vì theo tính nửa liên tục dưới yếu của chuẩn thì∥∥∥Fj(x0)− yδj ∥∥∥≤ lim
m
inf
∥∥∥Fj(xm)− yδmj ∥∥∥ ,( j = 1,2, . . . , l) .
Vậy J(xnk)→ J(x0). Kết hợp với xnk ⇀ x0 và giả thiết (A5) ta có điều phải
chứng minh.⊠
Định lý 2.2.3. Cho các giả thiết (A1)− (A5), α(δ )→ 0 và ‖δ‖
2
α(δ ) → 0
khi δ → 0. Giả sử {δ k}k mà δ k → 0. Gọi {xδkαk} là dãy nghiệm của bài toán
(2.1.3) ứng với δ k và αk = α(δ k).
Khi đó
1. {xδkαk} chứa dãy con hội tụ.
2. Mỗi giới hạn của dãy con là một nghiệm J−min của (2.1.1).
3. Nếu nghiệm J−min x† của (2.1.1) là duy nhất thì
lim
δ→0
xδα(δ ) = x
†.
Chứng minh. 1. Đặt
S :=
{
x ∈ D : Fj(x) = y j, j = 1, . . . , l
}
(2.2.4)
Vì S⊂ D và xδα là nghiệm cực tiểu của (2.1.3) nên với mọi x ∈ S, ta có
l
∑
j=1
λ j
∥∥∥Fj(xδα)− yδj ∥∥∥2+αJ(xδα)≤ l∑
j=1
λ j
∥∥∥Fj(x)− yδj ∥∥∥2+αJ(x)
=
l
∑
j=1
λ j
∥∥∥y j− yδj ∥∥∥2+αJ(x)≤ l∑
j=1
λ jδ 2j +αJ(x)
≤ ‖λ‖
∞
‖δ‖2+αJ(x) = ‖δ‖2 +αJ(x). (2.2.5)
26
Từ (2.2.5) ta suy ra
J(xδα)≤
‖δ‖2
α
+ J(x), (2.2.6)
λ j
∥∥∥Fj(xδα)− yδj∥∥∥2 ≤ ‖δ‖2+αJ(x), (2.2.7)∥∥∥Fj(xδα)∥∥∥ - bị chặn. (2.2.8)
Từ (2.2.6),(2.2.8) và giả thiết (A4) ta có
{
xδα ,F1(xδα), ...,Fl(xδα)
}
là dãy bị
chặn trong không gian Banach phản xạ X ×Y1× ...×Yl.
Do đó dãy
{
x
δk
αk,F1(x
δk
αk), ...,Fl(x
δk
αk)
}
cũng bị chặn. Vậy nó là tập compắc
tương đối yếu. Suy ra tồn tại dãy con
{
x
δm
αm
}
⊂
{
x
δk
αk
}
hội tụ yếu, tức là
xδmαm ⇀ x0,Fj(x
δm
αm)⇀ y
0
j . (2.2.9)
Theo giả thiết (A2) suy ra x0 ∈ D và y0j = Fj(x0).
Từ (2.2.7) và chú ý tính nửa liên tục dưới yếu của chuẩn, ta có
∥∥Fj(x0)− y j∥∥≤ lim
m
inf
∥∥∥Fj(xδmαm)− y j∥∥∥
≤ lim
m
inf
{∥∥∥Fj(xδmαm)− yδmj ∥∥∥+∥∥∥yδmj − y j∥∥∥}
≤ lim
m
[
1√
λ j
(
‖δ m‖2+αmJ(x)
)1/2
+δ jm
]
= 0.
Từ đó suy ra Fj(x0) = y j, ∀ j = 1, ..., l. Chứng tỏ x0 ∈ S.
Mặt khác, theo (2.2.6), giả thiết và tính nửa liên tục dưới yếu của J(x) thì
với mọi x ∈ S, ta có
J(x0)≤ lim
m
infJ(xδmαm)≤ limm supJ(x
δm
αm)≤ J(x). (2.2.10)
Đặc biệt cho x = x0 ta suy ra
lim
m→∞ J(x
δm
αm) = J(x0). (2.2.11)
Từ (2.2.11), xδmαm ⇀ x0 và giả thiết (A5) ta suy ra x
δm
αm → x0.
2. Theo (2.2.10) ta có x0 ∈ S , J(x0)≤ J(x), ∀x ∈ S, suy ra x0 là một nghiệm
27
J−min của (2.1.3). Tất nhiên nếu có một giới hạn x′0 của một dãy con thì nó
cũng là nghiệm J−min của bài toán (2.1.1).
3. Nếu nghiệm J−min x† của (2.1.1) là duy nhất thì theo phần 1.,2., mọi dãy
con đều hội tụ về x†. Do đó
lim
δ→0
xδα(δ ) = x
†.
Định lý được chứng minh. ⊠
Trước khi đi vào đánh giá tốc độ hội tụ của nghiệm xδα tới nghiệm x† của
(2.1.1), ta xét trường hợp giả tối ưu, tức là có xδ ,ηα sao cho
Tα(xδ ,ηα )≤ Tα(xδα)+η (2.2.12)
với η ≥ 0 cho trước.
Mệnh đề 2.2.4. Giả sử (A1)− (A5) thỏa mãn, và yδj ∈ Yj,(
∥∥∥y j− yδj ∥∥∥ ≤
δ j),δ := (δ1, ...,δl)T ,α := α(δ ,η) thỏa mãn
α(δ ,η)→ 0; ‖δ‖
2
2
α(δ ,η) → 0;
η
α(δ ,η) → 0
khi δ → 0;η → 0.
Khi đó
1. Mọi dãy
{
x
δk,ηk
αk
}
k
với δ k → 0;ηk → 0,αk =α(δ k,ηk) thỏa mãn (2.2.12)
có một dãy con hội tụ.
2. Mỗi giới hạn x̂ của dãy con là nghiệm J−min của (2.1.1). Hơn nữa nếu
thêm điều kiện nghiệm x† của (2.1.1) là duy nhất thì
lim
k→∞
x
δk,ηk
αk = x
†.
Chứng minh. Đặt xk = x
δk,ηk
αk . Khi đó ta có
28
l
∑
j=1
λ j
∥∥∥Fj(xk)− yδ j,kj ∥∥∥2Yj +αkJ(xk)≤
≤
l
∑
j=1
λ j
∥∥∥Fj(x†)− yδ j,kj ∥∥∥2Yj +αkJ(x†)+ηk
≤ ‖δ k‖22+αkJ(x†)+ηk.
Cho k → ∞ ta suy ra Fj(xk)→ y j (k → ∞) và
J(xk)≤
‖δ k‖22
αk
+
ηk
αk
+ J(x†). (2.2.13)
Do đó theo giả thiết {J(xk),F1(xk), ...,Fl(xk)} bị chặn, suy ra tồn tại một dãy
con hội tụ yếu xki ⇀ x̂ ∈ D. Ngoài ra x̂ là nghiệm của (2.1.1).
Hơn nữa trong (2.2.13) thay x† bằng x̂ ta thu được
J(x̂)≤ lim
i→∞
infJ(xki)≤ limi→∞ supJ(xki)≤ limi→∞
{
‖δ k‖22
αk
+
ηk
αk
+ J(x̂)
}
= J(x̂)
Từ đây suy ra lim
i→∞
J(xki) = J(x̂), và do đó xki → x̂ (theo giả thiết A5).
Lại theo (2.2.13) ta có
J(x̂)≤ lim
i→∞
supJ(xki)≤ J(x†)≤ J(x̂).
Suy ra x̂ là nghiệm J−min của (2.1.1). Nếu nghiệm J−min x† là duy nhất,
tức là x̂ = x† thì xki → x†. Mệnh đề 2.2.4 được chứng minh. ⊠
Định lý 2.2.5. (Tốc độ hội tụ của xδα(δ )→ x† khi δ → 0)
Cho các giả thiết (A1)− (A5) và các điều kiện sau
1. F1(x),J(x) khả vi Fréchet trong lân cận x†.
2. ∃L > 0 sao cho ∥∥r1(x,x†)∥∥ ≤ L.D(x,x†) với mọi x trong lân cận của x†,
trong đó
r1(x,x
†) := F1(x)−F1(x†)−F
′
1(x
†)(x− x†).
29
3. ∃w ∈ Y ∗1 : J
′
(x†) = F ′1(x
†)∗w.
4. L.‖w‖Y ∗1 < 1 .
Khi đó. Nếu chọn α ∼ ‖δ‖p,(0 < p < 2) thì
D(xδα(δ ),x
†) = O
(‖δ‖µ)
trong đó µ = min{p,2− p}
Chứng minh. Quy ước ‖.‖ là chuẩn trong không gian tương ứng.
Từ (2.2.5) cho x = x† ta có
l
∑
j=1
λ j
∥∥∥Fj(xδα)− yδj ∥∥∥2+αJ(xδα)≤ ‖δ‖2+αJ(x†).
Vì D(xδα ,x†) = J(xδα)− J(x†)−
〈
J′(x†),xδα − x†
〉
cùng với các giả thiết 2., 3.
nên ta có
l
∑
j=1
λ j
∥∥∥Fj(xδα)− yδj ∥∥∥2+αD(xδα ,x†)≤ ‖δ‖2+α 〈J′(x†),x†− xδα〉
= ‖δ‖2+α
〈
w,F
′
1(x
†)(x†− xδα)
〉
= ‖δ‖2+α
〈
w,r1(xδα ,x
†)+F1(x†)−F1(xδα)
〉
≤ ‖δ‖2+α ‖w‖
[∥∥∥r1(xδα ,x†)∥∥∥+∥∥∥y1− yδ1∥∥∥+∥∥∥yδ1 −F1(xδα)∥∥∥]
≤ ‖δ‖2+α ‖w‖LD(xδα ,x†)+α ‖w‖δ1+α ‖w‖
∥∥∥yδ1 −F1(xδα)∥∥∥ . (2.2.14)
Do đó
l
∑
j=1
λ j
∥∥∥Fj(xδα)− yδj ∥∥∥2+α(1−L‖w‖)D(xδα ,x†)≤ ‖δ‖2+α ‖w‖‖δ‖
+α ‖w‖
∥∥∥yδ1 −F1(xδα)∥∥∥ . (2.2.15)
Từ (2.2.15) suy ra∥∥∥F1(xδα)− yδ1∥∥∥2︸ ︷︷ ︸
a2
≤ 1λ1
(
‖δ‖2+α ‖w‖‖δ‖
)
︸ ︷︷ ︸
c2
+
α ‖w‖
λ1︸ ︷︷ ︸
b
∥∥∥yδ1 −F1(xδα)∥∥∥︸ ︷︷ ︸
a
.
(2.2.16)
30
Chú ý rằng
(
a,b,c > 0;a2 ≤ c2+ab)⇒ (a≤ b+ c), suy ra
∥∥∥F1(xδα)− yδ1∥∥∥≤
(
‖δ‖2+α ‖w‖‖δ‖
)1/2√
λ1
+
α ‖w‖
λ1
. (2.2.17)
Từ (2.2.15) suy ra
D(xδα ,x
†)≤
‖δ‖2 +α ‖w‖‖δ‖+α ‖w‖
∥∥∥yδ1 −F1(xδα)∥∥∥
α(1−L‖w‖) . (2.2.18)
Chọn α ∼ ‖δ‖p.
Nếu 0 < p < 1 thì từ (2.2.17) ta có∥∥∥F1(xδα)− yδ1∥∥∥= O(‖δ‖p) .
Kết hợp với (2.2.18) ta có
D(xδα ,x
†) = O(‖δ‖p) .
Nếu 1≤ p < 2 thì từ (2.2.17) ta có∥∥∥F1(xδα)− yδ1∥∥∥= O(‖δ‖) .
Kết hợp với (2.2.18) ta có
D(xδα ,x
†) = O
(
‖δ‖2−p
)
.
Từ đó nếu đặt µ = min{p,2− p} thì Định lý 2.2.5 được chứng minh. ⊠
Nhận xét. Khi chọn J(x) = ‖x− x∗‖2, ta có
1. D(x˜,x) = ‖x˜− x‖2, do đó theo định lý 2.2.5. ta có∥∥∥xδα − x†∥∥∥= O(‖δ‖ µ2) (2.2.19)
31
2. Điều kiện 2. trong định lý 2.2.5. là∥∥∥F1(x)−F1(x†)−F ′1(x†)(x− x†)∥∥∥≤ L∥∥∥x− x†∥∥∥2.
Điều này có thể đạt được nếu ta giả thiết tính Lipschitz của F ′1, tức là∥∥∥F ′1(x)−F ′1(x†)∥∥∥≤ 2L∥∥∥x− x†∥∥∥ , ∀x ∈U(x†).
Thật vậy theo công thức giá trị trung bình
∥∥∥F1(x)−F1(x†)−F ′1(x†)(x− x†)∥∥∥=
=
∥∥∥∥ 1∫
0
(
F ′1(x
† + t(x− x†))−F ′1(x†)
)
(x− x†)dt
∥∥∥∥
≤
1∫
0
2Lt
∥∥x− x†∥∥2dt = L∥∥x− x†∥∥2 .
Bây giờ ta tổng quát hóa định lý 2.2.5 bằng cách sử dụng điều kiện A6.
Định lý 2.2.6. (Tốc độ hội tụ của xδα(δ )→ x† khi δ → 0)
Cho các giả thiết (A1)− (A6). Khi đó ta có đánh giá
D
(
xδα ,x
†
)
≤ 1
1− γ
[
‖δ‖2
α
+
∥∥∥β∥∥∥‖δ‖+α l∑
j=1
β 2j
4λ j
]
(2.2.20)
Hơn nữa nếu chọn α ∼ ‖δ‖p,(0 < p < 2) thì
D(xδα(δ ),x
†) = O
(‖δ‖µ) (2.2.21)
trong đó µ = min{p,2− p}
Chứng minh.
Ta có Tα(xδα)≤ Tα(x†) và D(xδα ,x†) = J(xδα)−J(x†)−
〈
J′(x†),xδα − x†
〉
, nên
suy ra
l
∑
j=1
λ j
∥∥∥Fj(xδα)− yδj ∥∥∥2 +αD(xδα ,x†)≤
32
≤
l
∑
j=1
λ j
∥∥∥Fj(x†)− yδj ∥∥∥2+α〈J′(x†),xδα − x†〉X∗,X
≤
l
∑
j=1
λ jδ 2j +αγD(xδα ,x†)+α
l
∑
j=1
β j
∥∥∥Fj(xδα)−Fj(x†)∥∥∥
≤
l
∑
j=1
λ jδ 2j +αγD(xδα ,x†)+α
l
∑
j=1
β j
{∥∥∥Fj(xδα)− yδj ∥∥∥+∥∥∥yδj − y j∥∥∥}
≤
l
∑
j=1
λ jδ 2j +αγD(xδα ,x†)+α
l
∑
j=1
β j
{∥∥∥Fj(xδα)− yδj ∥∥∥+δ j}
≤ αγD(xδα ,x†)+
l
∑
j=1
{
λ jδ 2j +αβ jδ j + α
2β 2j
4λ j +λ j
∥∥∥Fj(xδα)− yδj ∥∥∥2} (theo
bất đẳng thức Cauchy).
Do đó
D
(
xδα ,x
†
)
≤ 1
1− γ
l
∑
j=1
λ jδ 2j
α
+
l
∑
j=1
β jδ j +α
l
∑
j=1
β 2j
4λ j
. (2.2.22)
Mặt khác
l
∑
j=1
λ jδ 2j ≤ ‖λ‖∞
l
∑
j=1
δ 2j =
l
∑
j=1
δ 2j ;
l
∑
j=1
β jδ j ≤
∥∥∥β∥∥∥
2
.‖δ‖2
Kết hợp điều này với bất đẳng thức (2.2.22) ta thu được đánh giá (2.2.20).
Nếu chọn α := C‖δ‖p và đặt µ = min{p.2− p} thì từ (2.2.20) ta thu được
(2.2.21).Định lý 2.2.6 được chứng minh. ⊠
Nhận xét. Từ (2.2.22) ta có đánh giá
D(xδα ,x
†)≤ 1
1− γ
l
∑
j=1
(
λ jδ 2j
α
+β jδ j +
αβ 2j
4λ j
)
=
1
1− γ
l
∑
j=1
(√
λ jδ j√
α
+
√
α
β j
2
√
λ j
)2
Vế phải của bất đẳng thức trên nhỏ nhất khi hai số bằng nhau, khi đó đặt
α−1j =
λ j
α
:=
β j
2δ j
,( j = 1, ..., l) ,
33
và bất đẳng thức trên trở thành
D(xδα ,x†)≤
2
1− γ
∥∥∥β∥∥∥
2
‖δ‖2.
Đánh giá này trùng với đánh giá trong định lý (1.3.1) của chương 1. Do
đó giải (1.1.3) bằng phương pháp Lagrange ta thu được các nhân tử Lagrange
λ1, ...,λl , với sai số tối ưu cho D(xδα ,x†) dưới các giả thiết đã cho.
Mặt khác tham số hiệu chỉnh "tối ưu" α j =
α
λ j
không chỉ phụ thuộc vào
mức độ nhiễu δ j mà còn phụ thuộc vào tỷ lệ
δ j
β j . Do đó rất khó để tìm λ
tối ưu tiên nghiệm cho (2.1.3) với λ và α cố định. Do vậy mà thuật toán 1
(chương 1) được minh họa như phương pháp hiệu chỉnh đa tham số Tikhonov
kết hợp với chiến lược chọn tham số tiên nghiệm. Chiến lược chọn tham số
được nghiên cứu một cách tổng quát bởi Morozov. Trong chương 3, tham số
hiệu chỉnh n = n(δ ) được chọn theo nguyên lý Morozov cải biên.
2.3 Ví dụ minh họa
Giải hệ phương trình
Fi(x1, . . . ,xm) = yi, i = 1,2, . . . ,N. (2.3.1)
với m ẩn số x1, . . . ,xm và N phương trình m >> N. Giả sử các phiếm hàm
Fi : Rm → R khả vi Fréchet trong lân cận nghiệm x† của hệ (2.3.1). Ta viết lại
dưới dạng véctơ
F(x) = y. (2.3.2)
trong đó F : Rm → RN , F = (F1, . . . ,FN), x = (x1, . . . ,xm)T , y = (y1, . . . ,yN)T .
Cụ thể với N = 4 và Fj(x) có dạng
F1 (x) = k2x1+ x22+ ...+ x2m = xT A1x+ k2xT b
F2 (x) = x1x2+ x2x3 + ...+ xm−1xm = xT A2x
F3 (x) = x1x3+ x2x4 + ...+ xm−2xm = xT A3x
F4 (x) = x1x4+ x2x5 + ...+ xm−3xm = xT A4x
34
trong đó k 6= 0 cho trước, b = (1,0,0, ...,0)T và Al = (ali j)m×m, l = 1,2,3,4
với
a1i j =
0 nếu i = j = 1 hoặc i 6= j1 nếu i = j 6= 1,
và
ali j =
1
2
nếu |i− j|= l−1
0 nếu |i− j| 6= l−1, l = 2,3,4.
Bây giờ ta đi kiểm tra các giả thiết A1− A5. Rõ ràng các không gian
X = Rm,Yj = R, j = 1,2,3,4 là các không gian Hilbert và J(x) = ‖x‖2.
A1. Với dữ liệu chính xác y = (k2,0,0,0)T thì hệ có nghiệm chính xác là
x† = (1,0, . . . ,0)T .
A2. Dễ thấy các hàm Fi(x), j = 1, ...,4 liên tục. Vì trong không gian hữu hạn
chiều hội tụ mạnh và hội tụ yếu trùng nhau, nên nếu xn ⇀ x;Fi(xn)⇀ yi thì
xn → x;Fi(xn)→ yi, từ tính liên tục của Fi(x) suy ra Fi(x) = yi và x∈D j = Rm.
A3. J(x) = ‖x‖2 là hàm không âm và nửa liên tục dưới yếu (do tính nửa liên
tục dưới yếu của chuẩn).
A4. Hiển nhiên với mọi C ≥ 0 thì tập
A(C) = {x ∈ Rm : ‖x‖2+
4
∑
j=1
∥∥Fj(x)∥∥≤C}
là tập bị chặn (do ‖x‖ ≤ √C).
A5. Nếu xn ⇀ x và ‖xn‖→ ‖x‖ thì ‖xn− x‖2 = ‖xn‖2−2+‖x‖2 →
‖x‖2−2 +‖x‖2 = 0. Do đó xn → x.
Để thu được đánh giá tốc độ hội tụ của nghiệm xδα(δ ) về nghiệm x
†, ta cần
kiểm tra các giả thiết của định lý 2.2.5. Theo định lý thì chỉ cần kiểm tra giả
thiết đó với một hàm, chẳng hạn với F1(x).
1. Dễ thấy F1(x) và J(x) là các hàm đa thức nên chúng đều khả vi Fréchet
trong lân cận x†.
2. D(x,x†) =
∥∥x− x†∥∥2 và F ′1(x†) = 2A1x† + k2b,F”1 (x) = 2A1.
Do đó
∥∥F”1 (x)∥∥= ‖2A1‖= 2. Ta có
35
∥∥r1(x,x†)∥∥= ∥∥∥F1(x)−F1(x†)−F ′1(x†)(x− x†)∥∥∥=
=
∥∥∥∥ 1∫
0
(
F ′1(x
† + t(x− x†))−F ′1(x†)
)
(x− x†)dt
∥∥∥∥
≤
1∫
0
2t
∥∥x− x†∥∥2dt = ∥∥x− x†∥∥2 = D(x,x†).
Vậy giả thiết 2. của định lý 2.2.5 thỏa mãn với L = 1.
3. Ta có F ′1(x
†) = 2A1x†+ k2b = k2b và J
′
(x†) = 2x†. Do vậy chọn w = 2k2 ,
khi đó w ∈ Y ∗2 và J
′
(x†) = F ′1(x†)∗w.
4. Cuối cùng L.‖w‖Y ∗2 =
2
k2 . Để có L.‖w‖Y ∗2
√
2.
Vậy ta có thể sử dụng phương pháp hiệu chỉnh đa tham số Tikhonov để giải
bài toán trên.
36
Chương 3
Phương pháp chỉnh lặp song
song dạng Gauss - Newton
Trong chương này, chúng tôi đề cập tới phương pháp chỉnh lặp song song dạng
Gauss - Newton giải hệ phương trình toán tử. Nội dung chính của chương này
dựa trên công trình của Phạm Kỳ Anh và Vũ Tiến Dũng [1].
3.1 Giới thiệu
Nhiều bài toán nhận dạng dẫn đến việc giải hệ phương trình toán tử sau
Fi(x) = yi, 1≤ i≤ N, (3.1.1)
trong đó Fi : X → Yi (toán tử phi tuyến), X ,Yi là các không gian Hilbert.
Trong trường hợp dữ liệu có nhiễu, tức là chỉ biết yδi sao cho
∥∥∥yδi − yi∥∥∥≤
δ , ta có hệ
Fi(x) = yδi 1≤ i≤ N, (3.1.2)
Viết lại hệ (3.1.1) và (3.1.2) dưới dạng sau
F(x) = y, (3.1.3)
và
F(x) = yδ , (3.1.4)
37
trong đó F : X →Y :=Y1×Y2× ...×YN , F(x) = (F1(x),F2(x), ...,FN(x)),y =
(y1, ...,yN) ∈ Y và yδ = (yδ1 , ...,yδN) ∈ Y .
TrongY ta xét tính vô hướng và chuẩn tương ứng như sau: ∀u=(u1, ...,uN)∈
Y và v = (v1, ...,vN) ∈ Y
Y=
N
∑
i=1
Yi,
‖u‖Y = (
N
∑
i=1
‖ui‖2Yi)1/2.
Một trong những phương pháp hiệu chỉnh hiệu quả cho bài toán đặt không
chỉnh phi tuyến là phương pháp chỉnh lặp Gauss-Newton IRGNM (Iteratively
regularized Gauss - Newton mehtod), do Bakushinskii đề xuất vào năm 1992
[6]. Sự hội tụ của phương pháp IRGNM được nghiên cứu bởi Blaschke [7],
Hohage [9], Deuflhard [8], Jin Qin nia [10] và một số tác giả khác [11, 12
Các file đính kèm theo tài liệu này:
- luanvanthacsi_chuaphanloai_276_7528_1870168.pdf