Luận văn Thuật toán dưới gradient và phương pháp chỉnh lặp song song

Mục lục

Mở đầu 1

1. Một số kiến thức chuẩn bị 3

1.1. ánh xạ không giãn . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2. ánh xạ hút và dãy đơn điệu Fejer . . . . . . . . . . . . . . . . . 6

1.3. Mô tả thuật toán tổng quát . . . . . . . . . . . . . . . . . . . . . . 14

1.4. Một số tính chất cơ bản . . . . . . . . . . . . . . . . . . . . . . . 15

2. Một số thuật toán chiếu 24

2.1. Xây dựng thuật toán . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.2. Một số kết quả hội tụ . . . . . . . . . . . . . . . . . . . . . . . . 27

2.3. Một số điều kiện đảm bảo sự hội tụ theo chuẩn và hội tụ tuyến tính 34

2.4. Một vài ví dụ về tính chính quy tuyến tính (bị chặn) . . . . . . . . 39

3. Thuật toán dưới gradient và phương pháp chỉnh lặp song song 41

3.1. Thuật toán dưới gradient . . . . . . . . . . . . . . . . . . . . . . . 41

3.1.1. Cơ sở . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.1.2. Các kết quả hội tụ . . . . . . . . . . . . . . . . . . . . . . 47

3.2. Phương pháp chỉnh lặp song song . . . . . . . . . . . . . . . . . . 50

3.2.1. Một số kết quả bổ trợ . . . . . . . . . . . . . . . . . . . . . 50

3.2.2. Một số ví dụ minh hoạ . . . . . . . . . . . . . . . . . . . . 51

3.3. Một vài thử nghiệm số . . . . . . . . . . . . . . . . . . . . . . . . 55

3.3.1. Bài toán với Ci

là hình cầu . . . . . . . . . . . . . . . . . . 55

3.3.2. Bài toán với Ci

là tập mức dưới của một hàm lồi . . . . . . 57

3.3.3. Phương pháp chỉnh lặp trong không gian vô hạn chiều . . . 61

Kết luận 62

Tài liệu tham khảo 63

Phụ lục 65

A Một số điểm lưu ý khi tính dưới vi phân 65

1.1. Một vài tính chất của dưới vi phân . . . . . . . . . . . . . . . . . 65

1.2. Một số ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

71 trang | Chia sẻ: maiphuongdc | Lượt xem: 1927 | Lượt tải: 2

Bạn đang xem trước 20 trang tài liệu Luận văn Thuật toán dưới gradient và phương pháp chỉnh lặp song song, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

Nếu (snk) là một dãy hội tụ yếu với snk ∈ Snk với mọi k, thì giới hạn yếu của nó nằm trong S. (iii) Nếu (xnk) là một dãy hội tụ yếu với xnk − PSnkxnk −→ 0 thì giới hạn yếu của nó nằm trong S. Hơn nữa, nếu một trong các điều kiện trên được thỏa mãn thì S = ⋂ n Sn. Định lý 4 (Dạng thứ nhất của một thuật toán chiếu tụ). Nếu (P (n) i ) hội tụ từng điểm tới Pi với mọi chỉ số i, thì thuật toán chiếu là tụ và Ci = ⋂ n:n thiết thực cho i C (n) i với mọi chỉ số i. Chứng minh: Với mỗi i, áp dụng bổ đề 3 cho dãy tập (C (n) i )n:n thiết thực cho i. Ơ Ví dụ 8. Giả sử rằngCi = ⋂ n C (n) i và dãy tập (C (n) i ) là dãy giảm. Khi đó thuật toán chiếu là tụ. Nếu thêm giả thiết thuật toán chiếu là lặp đoạn và lim inf n:n thiết thực cho i àni > 0 với mọi chỉ số i thì dãy (x(n)) là chính quy tiệm cận và hội tụ yếu tới một điểm thuộc C. Chứng minh: Mosco đã chứng minh rằng dãy giảm các tập lồi đóng thì hội tụ theo nghĩa Mosco tới giao của dãy tập ấy. Theo định lý và bổ đề vừa nêu trên, thuật toán chiếu là tụ. Kết quả được suy ra từ định lý 3(i). Ơ Ví dụ 9 (Về phép chiếu ngẫu nhiên). Giả sử rằng thuật toán chiếu là suy biến, không nới lỏng và có các tập hằng. Nếu với một chỉ số j nào đó tập Cj compact bị chặn (tức là giao của nó với mọi tập bị chặn là tập compact) thì dãy (x(n)) hội tụ theo chuẩn tới một điểm thuộc C. Nói riêng, điều này đúng nếu X là không gian hữu hạn chiều. Chứng minh: Ví dụ trên chỉ ra rằng thuật toán là tụ. Đồng thời, à (n) i ≡ 1 với mọi n ≥ 0 và mọi chỉ số i thiết thực tại n. Dãy (x(n))n:n thiết thực cho j bị chặn và nằm trong Cj do đó có một điểm dính theo chuẩn. Theo định lý 2, toàn bộ dãy (x (n)) hội tụ theo chuẩn tới một điểm thuộc C. Ơ 25 Để có thể đưa ra dạng thứ hai của một thuật toán chiếu tụ cũng như các kết quả hội tụ và hội tụ tuyến tính trong các mục tiếp sau, ta cần định nghĩa sau. Định nghĩa 12. Ta nói một thuật toán chiếu là tụ tuyến tính nếu tồn tại một số β > 0 sao cho: βd(x(n), Ci) ≤ d(x(n), C(n)i ) với mọi n đủ lớn và mọi chỉ số i thiết thực tại n . Ta nói thuật toán là tụ mạnh nếu x(nk) ⇀ x d(x(nk), C (nk) i ) → 0 i thiết thực tại nk ⇒ d(x (nk), Ci) = ‖x(nk) − Pix(nk)‖ → 0 với mọi chỉ số i và mọi dãy con x(nk) của x(n). Từ định nghĩa về tính tụ và tính nửa liên tục dưới của hàm khoảng cách d(., Ci) ta suy ra tụ tuyến tính⇒ tụ mạnh⇒ tụ Từ nhận xét trên ta dễ dàng suy ra bổ đề sau đây. Hệ quả 10 (Dạng thứ hai của một thuật toán chiếu tụ). Mọi thuật toán chiếu tụ tuyến tính đều tụ. Hệ quả 11 (Dạng của một thuật toán chiếu tụ tuyến tính). Nếu thuật toán chiếu có các tập hằng thì nó tụ tuyến tính. Hệ quả 12 (Dạng của một thuật toán chiếu tụ mạnh). Giả sử thuật toán chiếu là tụ. Nếu dãy (x(n)) là một tập compact tương đối thì thuật toán là tụ mạnh. Nói riêng, điều này đúng khi X là không gian hữu hạn chiều hoặc phần trong của tập C khác rỗng. Chứng minh: Giả sử ngược lại, tồn tại một số ε > 0, phần tử x ∈ X , một chỉ số i và một dãy con (x(nk))k với x (nk) → x, x(nk)−P (nk)i x(nk) → 0, i thiết thực tại nk, nhưng ‖x(nk) − Pix(nk)‖ ≥ ε. Do thuật toán là tụ ta có x ∈ Ci. Chuyển qua dãy 26 con nếu cần thiết, ta có thể giả sử (do tính compact tương đối) rằng x(nk) −→ x. Nhưng khi đó x(nk)−Pix(nk) → x−Pix = 0, vô lý. Do đó, thuật toán chiếu là tụ mạnh. Nếu X là hữu hạn chiều, dãy (x(n)) là tập compact tương đối vì dãy (x(nk)) bị chặn (bổ đề 2(iv)). Cuối cùng, nếu intC 6= ∅ thì dãy (x(n)) hội tụ theo chuẩn (theo hệ quả 4(i)). Ơ Chú ý 3. Hai dạng của thuật toán chiếu tụ (định lý 4 và hệ quả 10) không có liên hệ gì với nhau. Hai ví dụ sau đây chỉ ra điều này. Ví dụ 10. Giả sử rằng X := R, N = 1, C := C1 = {0}, C(n)1 := [0, 1/(n+1)] và x(0) = 2. Khi đó thuật toán chiếu là tụ mạnh và dãy giảm các tập lồi compact C (n) 1 hội tụ tới C1 theo nghĩa Mosco. Tuy nhiên thuật toán chiếu là không tụ tuyến tính. Thật vậy, với n ≥ 1 x(n) = 1 n ; d(x(n), C (n) 1 ) d(x(n), C1) = 1 n+ 1 → 0. Ví dụ 11. Giả sử rằng X := R; N := 1; C := C1 = {0}, C(n)1 := (−1)n[0, 1] và x(0) ∈ X tùy ý. Khi đó thuật toán là tụ mạnh vì x(n) ≡ 0 ∈ C với mọi n ≥ 2. Tuy nhiên, dãy tập compact lồi C (n) 1 không hội tụ về C theo nghĩa Mosco. 2.2. Một số kết quả hội tụ Định lý 5 (Định lý loại trừ II). Giả sử rằng thuật toán chiếu là tụ tuyến tính và tồn tại một số ε > 0 sao cho ε ≤ α(n)i ≤ 2 − ε với mọi n đủ lớn và mọi chỉ số i thiết thực tại n. Khi đó, dãy x(n) hoặc hội tụ theo chuẩn hoặc không có điểm dính theo chuẩn nào. Chứng minh: Giả sử ngược lại, (x(n)) có ít nhất hai điểm dính theo chuẩn là y và z. Do tính tụ tuyến tính, ta có thể chọn được số β > 0 sao cho βd(x(n), Ci) ≤ d(x(n), C (n) i ) với mọi l đủ lớn và mọi chỉ số i thiết thực tại l. Cố định c ∈ C. Do 27 y 6∈ C(vì nếu y ∈ C thì dãy (x(n)) sẽ hội tụ theo chuẩn theo bổ đề 4), tập các chỉ số I = {i ∈ {1, . . . , N} : y 6∈ Ci} là khác rỗng. Ta đặt B := y + rBX trong đó r := 12 min({‖y − z‖} ∪ {d(y, Ci) : i ∈ I}). Khẳng định I. Tồn tại số γ1 > 0 để với l đủ lớn, x (l) ∈ B suy ra ‖x(l) − c‖ − ‖x(l+1) − c‖ ≥ γ1 ∑ i∈I λ (l) i . Thật vậy, từ bổ đề 2(ii), định nghĩa số β, và ‖y−x(l)‖ ≥ d(y, Ci)−d(x(l), Ci)(ánh xạ khoảng cách là không giãn), ta có ‖x(l) − c‖2 − ‖x(l+1) − c‖2 ≥ ∑ i∈I à (l) i d 2(x(l), C (l) i ) ≥ ∑ i∈I λ (l) i ε 2β2d2(x(l), Ci) ≥ ε2β2r2 ∑ i∈I λ (l) i Mặt khác, ‖x(l)−c‖2−‖x(l+1)−c‖2 = (‖x(l)−c‖−‖x(l+1)−c‖)ì(‖x(l)−c‖+‖x(l+1)−c‖) và chuẩn của nhân tử phía sau lớn nhất chỉ là 2(r+‖y− c‖). Như vậy, số γ1 trong khẳng định có thể chọn là ε2β2r2 2(r + ‖y − c‖) . Khẳng định I được chứng minh. Khẳng định II. Tồn tại số γ2 > 0 để với l đủ lớn, x (l) ∈ B suy ra ‖x(l+1) − c‖ − ‖x(l) − c‖ ≤ γ2 ∑ i∈I λ (l) i . Thật vậy, với mọi chỉ số i ∈ {1, . . . , N} \ I , điểm y bất động qua ánh xạ R(l)i . Do 28 đó ta có đánh giá: ‖x(l+1) − y‖ = ∥∥∥∥∥∥ ∑ i∈{1,...,N}\I λ (l) i (R (l) i x (l) − y) + ∑ i∈I λ (l) i (R (l) i x (l) − y) ∥∥∥∥∥∥ ≤ ∑ i∈{1,...,N}\I λ (l) i ‖x(l) − y‖+ ∑ i∈I λ (l) i ‖R(l)i x(l) − y‖ ≤ ‖x(l) − y‖+ ∑ i∈I λ (l) i {‖R(l)i x(l) − x(l)‖+ ‖x(l)− y‖} ≤ ‖x(l) − y‖+ ∑ i∈I λ (l) i {α(l)i ‖x(l) − P (l)i x(l)‖+ ‖x(l)− y‖} ≤ ‖x(l) − y‖+ ∑ i∈I λ (l) i {2d(x(l), Ci) + r} ≤ ‖x(l) − y‖+ ∑ i∈I λ (l) i {2d(y, Ci) + ‖x(l) − y‖+ r} Do đó, có thể chọn γ2 = 2max{d(y, Ci) : i ∈ I}+3r. Khẳng định II được chứng minh. Đặt δ := r γ1 γ1 + γ2 (< r). và chọn số n đủ lớn sao cho ‖x(n) − y‖ < δ; khi đó x(n) ∈ B. Do z là một điểm dính theo chuẩn khác của dãy (x(n)) và có khoảng cách tới B là dương, do đó tồn tại một số m > n bé nhất để x(m) 6∈ B. Do tính đơn điệu Fejer của (x(n)) và khẳng định I, ta có ‖y − c‖ ≤ ‖x(m) − c‖ ≤ ‖x(n) − c‖ − γ1 m−1∑ l=n ∑ i∈I λ (l) i < δ + ‖y − c‖ − γ1 m−1∑ l=n ∑ i∈I λ (l) i Do đó m−1∑ l=n ∑ i∈I λ (l) i < δ γ1 . 29 Từ khẳng định II, lại có ‖x(m) − y‖ ≤ ‖x(n) − y‖+ γ2 m−1∑ l=n ∑ i∈I λ (l) i < δ + γ2 γ1 δ = r, từ đó suy ra x(m) ∈ B, mâu thuẫn. Định lý chứng minh xong. Ơ Hệ quả 13. Giả sử thuật toán chiếu là tụ tuyến tính và tồn tại một số ε > 0 sao cho ε ≤ α(n)i ≤ 2 − ε với mọi n đủ lớn và mọi chỉ số i thiết thực tại n. Giả sử thêm rằng X là không gian hữu hạn chiều hoặc phần trong của C khác rỗng. Khi đó dãy (x(n)) hội tụ theo chuẩn tới một điểm x nào đó. Nếu ∑ n à (n) i = +∞ với một chỉ số i nào đó thì x ∈ Ci. Do đó nếu ∑ n à (n) i = +∞ với mọi chỉ số i thì x ∈ C. Chứng minh: Nếu int C 6= ∅ thì dãy (x(n)) hội tụ theo chuẩn theo hệ quả 4(i). Nếu X là không gian hữu hạn chiều thì (x(n)) có một điểm dính theo chuẩn; do đó theo định lý trên, (x(n)) cũng hội tụ theo chuẩn. Phần còn lại của hệ quả được suy từ định lý 3(iii). Ơ Ta có hai ví dụ quan trọng sau: Ví dụ 12 (Flâm và Zowe). Giả sử rằng X là không gian hữu hạn chiều, thuật toán chiếu là tụ tuyến tính, và tồn tại một số ε > 0 sao cho ε ≤ α(n)i ≤ 2− ε với mọi n đủ lớn và mọi chỉ số i thiết thực tại n. Khi đó dãy (x(n)) hội tụ theo chuẩn tới một điểm x. (i) Nếu lim inf n:n thiết thực cho i à (n) i > 0 ∀i thì x ∈ C. (ii) Nếu int C 6= ∅ và∑ n à (n) i = +∞ ∀i thì x ∈ C. Ví dụ 13 (Aharoni và Censor). Giả sử X là hữu hạn chiều, thuật toán chiếu có các tập hằng (do đó là tụ tuyến tính), và tồn tại số ε > 0 sao cho ε ≤ α(n)i ≡ α(n) ≤ 2 − ε với mọi n đủ lớn và mọi chỉ số i thiết thực tại n. Khi đó, dãy 30 (x(n)) hội tụ theo chuẩn và giới hạn của nó nằm trong ⋂ i∈I∗ Ci trong đó I ∗ := {i ∈ {1, . . . , N} : ∑ n à (n) i = +∞}. Chú ý 4. • Với các giả thiết về tham số nới lỏng α(n)i như trong hai ví dụ trên, điều kiện lim inf n:n thiết thực cho i à (n) i > 0 tương đương với lim inf n:n thiết thực cho i λ (n) i > 0 còn điều kiện ∑ n à (n) i = +∞ tương đương với ∑ n λ (n) i = +∞ • Nếu ta bỏ giả thiết∑ n à (n) i = +∞ trong ví dụ 12 thì có thể giới hạn của dãy (x(n)) không nằm trong Ci. Ví dụ sau cho ta thấy điều này. Ví dụ 14. Cho X := R, N := 2, C1 := C(n)1 :≡ (−∞, 0], C2 := C(n)2 :≡ [0,+∞). Giả sử x(0) > 0, α(n)1 :≡ α(n)2 :≡ 3/2 và λ(n)1 < 2/3 ∀n. Khi đó x(n) = ( 1− 3 2 λ (n−1) 1 ) ã ã ã ( 1− 3 2 λ (0) 1 ) x(0) và do đó, lim n x(n) ∈ C1 ⇐⇒ lim n x(n) = 0 ⇐⇒ ∑ n à (n) 1 = +∞ Định lý 6. Cho trước một thuật toán chiếu, giả sử rằng (P (n) i ) hội tụ từng điểm tới Pi với mọi chỉ số i. Giả sử thêm rằng tồn tại một dãy con (n ′) của (n) sao cho với mọi chỉ số i ta có α (n′) i −→ αi, λ(n ′) i −→ λi với αi nào đó thuộc (0, 2] và λi nào đó thuộc (0, 1]. Nếu phần trong của C khác rỗng, thì dãy (x(n)) hội tụ theo chuẩn tới một điểm thuộc C. Chứng minh: Theo hệ quả 4(i), dãy (x(n)) hội tụ theo chuẩn tới một điểm x. Ta phải chỉ ra rằng x ∈ C. Ta sẽ chứng minh P (n′) i x (n′) −→ Pix ∀i. Thật vậy, vì tính không giãn của phép chiếu, ta có ‖P (n′)i x(n ′) − P (n′)i x‖ ≤ ‖x(n ′) − x‖. Mặt khác, ta có P (n′) i x (n′) − P (n′)i x −→ 0. Do λ(n ′) i −→ λi > 0, ta thấy rằng i là thiết thực tại n′ với mọi n′ đủ lớn. Từ giả thiết cho P (n ′) i suy ra rằng P (n′) i x (n′) −→ 31 Pix. Bây giờ ta có x(n ′+1) = N∑ i=1 λ (n′) i ( (1− α(n′)i )x(n ′) + α (n′) i P (n′) i x (n′)) Bằng cách lấy giới hạn theo dãy con (x(n ′)) và từ chứng minh trên ta có x = N∑ i=1 λi ( (1− αi)x+ αiPix ) hay x = N∑ i=1 ( λiαi∑N j=1 λjαj ) Pix Từ đẳng thức trên, áp dụng mệnh đề 5(ii) ta suy ra x ∈ N⋂ i=1 Ci = C. Định lý chứng minh xong. Ơ Ví dụ sau đây minh họa kết quả của định lý vừa nêu. Ví dụ 15 (Butnariu và Censor). Giả sử X là hữu hạn chiều, thuật toán chiếu có các tập hằng, và các tham số nới lỏng chỉ phụ thuộc n, tức là α (n) i ≡ α(n) với mọi chỉ số i và mọi n. Giả sử thêm rằng tồn tại một dãy con nào đó (n′) của (n) sao cho với mọi chỉ số i, λ (n′) i −→ λi với một số λi > 0 nào đó. (i) Nếu tồn tại số ε sao cho ε ≤ α(n) ≤ 2 − ε với mọi n đủ lớn, khi đó dãy (x(n)) hội tụ theo chuẩn tới một điểm thuộc C. (ii) Nếu phần trong của C khác rỗng và tồn tại một dãy con (n′′) của (n′) sao cho α(n ′′) −→ 2 thì dãy (x(n)) hội tụ theo chuẩn tới một điểm nào đó thuộc C. Chứng minh: (i): Giả thiết về các trọng suy ra ∑ n à (n) i = +∞ với mọi chỉ số i. Do đó (i) suy ra từ ví dụ 12. (ii): Suy trực tiếp từ định lý 6 Ơ 32 Định nghĩa 13 (Điều khiển). Ta nói thuật toán chiếu là xét tập xa nhất nếu với mọi n, ít nhất một chỉ số xa nhất được xét; tức là I(n)rem := {i : d(x(n), Ci) = max{d(x(n), Cj) : j = 1, . . . , N}} ∩ I(n) 6= ∅. Theo cách gọi của Censor, ta nói điều khiển tập xa nhất nếu thuật toán chiếu là suy biến và xét tập xa nhất. Tương tự như phần thuật toán tổng quát, tới đây ta có thể phát biểu và chứng minh một kết quả cơ bản trong tôpô yếu. Định lý 7 (Các kết quả trong tôpô yếu). Giả sử rằng thuật toán chiếu là tụ mạnh và xét tập xa nhất. Giả sử thêm rằng (i(n)) một dãy các chỉ số xa nhất; tức là i(n) ∈ I(n)rem ∀n. (i) Nếu ∑ n à (n) i(n) = +∞, khi đó tồn tại một dãy con (x(nk))k của x(n) sao cho max{d(x(nk), Cj) : j = 1, . . . , N} −→ 0. và (x(nk))k hội tụ yếu tới điểm dính yếu duy nhất của (x (n)) trong C. (ii) Nếu lim inf n à (n) i(n) > 0 thì (x(n)) hội tụ yếu tới một điểm thuộc C và max{d(x(n), Cj) : j = 1, . . . , N} −→ 0. Chứng minh: (i): Từ bổ đề 2(iv), chuỗi ∑ n à (n) i(n) d2(x(n), C (n) i(n) ) hội tụ. Do đó, lim inf n d(x(n), C (n) i(n) ) = 0. Do đó ta có thể trích ra một dãy con (x(nk))k và cố định một chỉ số i sao cho d(x(n), C (n) i(n) ) −→ 0; i(nk) ≡ i,và dãy (x(nk))k hội tụ yếu. Do thuật toán là tụ mạnh và xét chỉ số xa nhất, ta đi tới kết luận là max{d(x(nk), Cj) : j = 1, . . . , N} −→ 0. Do tính nửa liên tục dưới yếu của d(ã, Cj) với mọi chỉ số j, giới hạn yếu của (x(nk))k nằm trong C. Theo định lý 1(ii), (x (n)) có nhiều nhất một điểm dính yếu trong C; do đó, (i) chứng minh xong. (ii): Chứng minh tương tự (i). Ơ 33 2.3. Một số điều kiện đảm bảo sự hội tụ theo chuẩn và hội tụ tuyến tính Để đảm bảo sự hội tụ theo chuẩn cũng như hội tụ tuyến tính, ta cần đến khái niệm sau đây. Định nghĩa 14. Ta nói bộ N tập lồi đóng (C1, . . . , CN) là chính quy nếu ∀ε > 0 ∃δ > 0∀x ∈ X : max{d(x,Cj) : j = 1 . . . N} ≤ δ ⇒ d(x,C) ≤ ε Nếu điều này chỉ đúng trên các tập bị chặn, tức là: ∀S ⊆ X bị chặn ∀ε > 0 ∃δ > 0 ∀x ∈ S : max{d(x,Cj) : j = 1 . . . N} ≤ δ ⇒ d(x,C) ≤ ε thì ta nói bộ N tập trên là chính quy bị chặn. ý nghĩa hình học của định nghĩa này rất rõ ràng: Nếu một phần tử x đã ở gần tất cả các tập Ci thì nó cũng không thể ở xa giao C của tất cả các tập ấy. Với khái niệm vừa nêu ta có một số kết quả sau. Định lý 8. Giả sử rằng thuật toán là tụ mạnh và p−lặp đoạn với số nguyên dương p nào đó. Giả sử thêm rằng bộ N tập (C1, . . . , CN) là chính quy bị chặn. Đặt νn = min{à(l)i : np ≤ l ≤ (n+ 1)p− 1 i thiết thực tại l} ∀n ≥ 0. Nếu ∑ n νn = +∞, thì dãy (x(n)) hội tụ theo chuẩn tới một điểm nằm trong C. Nói riêng, điều này đúng nếu lim inf n:n thiết thực cho i à (n) i > 0 ∀i. Chứng minh: Từ định lý 3, ta nhận được một dãy con (x(nkp))k sao cho (x (nkp))k hội tụ yếu tới điểm dính yếu duy nhất của (x(n)) trong C, giả sử đó là x, ngoài ra ta còn có (nk+1)p−1∑ l=nkp ∑ i∈I(l) d(x(l), C (l) i ) −→ 0 (3.1) 34 x(nkp+rk) − x(nkp) −→ 0 (3.2) với mọi dãy (rk) nằm trong {0, . . . , p − 1}. Cố định một chỉ số i. Do thuật toán chiếu là lặp đoạn, ta có một dãy (rk) nằm trong {0, . . . , p−1} sao cho i ∈ I(nkp+rk) với mọi k. Khi đó, do (3.1), d(x(nkp+rk), C (nkp+rk) i ) −→ 0. Do dãy (x(nkp+rk))k cũng hội tụ tới x (do (3.2))và thuật toán chiếu là tụ mạnh, ta suy ra rằng d(x(nkp+rk), Ci) −→ 0. Do đó, từ (3.2), d(x(nkp), Ci) −→ 0. Do chỉ số i chọn bất kỳ nên ta có max{d(x(nkp), Cj) : j = 1 . . . N} −→ 0. Mặt khác, bộ (C1, . . . , CN) là chính quy bị chặn và dãy (x (nkp)) bị chặn. Từ đó suy ra d(x(nkp), C) −→ 0. áp dụng hệ quả 4(ii) dãy x(n) hội tụ theo chuẩn tới x. Ơ Định lý 9. Giả sử thuật toán chiếu là tụ mạnh và xét tập xa nhất. Giả sử thêm rằng bộ N tập (C1, . . . , CN) là chính quy bị chặn và (i (n)) là một dãy các chỉ số xa nhất. Nếu ∑ n à (n) i(n) = +∞ thì dãy (x(n)) hội tụ theo chuẩn tới một điểm thuộc C. Nói riêng, điều này đúng khi lim inf n à (n) i(n) > 0. Chứng minh:Từ định lý 7(i), tồn tại một dãy con hội tụ yếu (x(nkp))k của (x (n)) với max{d(x(nkp), Cj) : j = 1, . . . , N} −→ 0. Do bộ (C1, . . . , CN) chính quy bị chặn nên d(x(nkp), C) −→ 0. áp dụng hệ quả 4(ii) ta có điều phải chứng minh. Ơ Để có thể sử dụng được các định lý nêu trên, ta cần có những điều kiện đủ đơn giản để kiểm tra khi nào một bộ N tập là chính quy bị chặn. Mệnh đề 7. Cho một bộ N tập lồi đóng. (i) Nếu có một tập Ci nào đó là compact bị chặn thì bộ N tập (C1, . . . , CN) là chính quy bị chặn. (ii) Nếu bộ N tập là chính quy bị chặn và một tập Ci nào đó là bị chặn thì bộ N tập là chính quy. 35 (iii) Nếu X là không gian hữu hạn chiều thì mọi bộ N tập là chính quy bị chặn. Định nghĩa sau đây cho phép ta đánh giá tốc độ hội tụ của thuật toán. Định nghĩa 15. Ta nói bộ N tập lồi đóng (C1, . . . , CN) là chính quy tuyến tính nếu ∃κ > 0 ∀x ∈ X d(x,C) ≤ κmax{d(x,Cj) : j = 1, . . . , N} Nếu điều này chỉ đúng với các tập bị chặn ∀X ⊇ S bị chặn ∃κS > 0 ∀x ∈ X d(x,C) ≤ κmax{d(x,Cj) : j = 1, . . . , N} thì ta nói bộ N tập là chính quy tuyến tính bị chặn. Với định nghĩa trên ta có kết quả sau: Định lý 10. Giả sử thuật toán chiếu là tụ tuyến tính và lặp đoạn. Giả sử thêm rằng bộ N tập là chính quy tuyến tính bị chặn và tồn tại một số ε > 0 sao cho ε ≤ α(n)i ≤ 2− ε với mọi n đủ lớn và i thiết thực tại n. Khi đó, dãy (x(n)) hội tụ tuyến tính tới một điểm thuộc C và tốc độ hội tụ không phụ thuộc vào điểm xuất phát nếu bộ N tập là chính quy tuyến tính. Chứng minh: Giả sử thuật toán chiếu là p−lặp đoạn. Cố định một chỉ số i. Khi đó, với mọi k ≥ 0, ta có mk với kp ≤ mk ≤ (k + 1)p − 1 sao cho i ∈ I(mk). Theo định nghĩa phép lặp, ta có x(mk) = A(mk−1) . . . A(kp)x(kp) và từ bổ đề 1(iv) và mệnh đề 5(i), A(n) là min{2− α (n) j α (n) j : j thiết thực tại n} − hút tương ứng với C∀n ≥ 0. Do đó, từ giả thiết về các tham số nới lỏng, A(n) là ε/2-hút tương ứng với C với mọi n đủ lớn. Do đó, theo mệnh đề 5(i) A(mk−1) . . . A(kp) là ε 2p−1 − hút đối với C với mọi k đủ lớn. 36 Do thuật toán là tụ tuyến tính nên tồn tại một số β > 0 sao cho βd(x(n), Cj) ≤ d(x(n), C (n) j ) với mọi n đủ lớn và mọi chỉ số j thiết thực tại n. Ta có d2(x(kp), Ci) ≤ (‖x(kp) − x(mk)‖+ d(x(mk), Ci))2 ≤ 2‖x(kp) − x(mk)‖2 + 2d2(x(mk), Ci) Cố định một điểm bất kỳ c ∈ C. Ta có với k đủ lớn, ‖x(kp) − x(mk)‖2 = ‖A(mk−1) . . . A(kp)x(kp) − x(kp)‖ ≤ 2 p−1 ε (‖x(kp) − c‖2 − ‖x(mk) − c‖2) ≤ 2 p−1 ε (‖x(kp) − c‖2 − ‖x((k+1)p) − c‖2) Mặt khác, từ giả thiết về β, các tham số nới lỏng, các trọng và bổ đề 2 và chú ý 1, ta có đánh giá sau khi k đủ lớn. d2(x(mk), Ci) ≤ 1 β2 d2(x(mk), C (mk) i ) = 1 β2 ‖x(mk) − P (mk)i x(mk)‖2 ≤ 1 β2à (mk) i (‖x(mk) − c‖2 − ‖x(mk+1) − c‖2) ≤ 1 β2ε3 (‖x(mk) − c‖2 − ‖x(mk+1) − c‖2) ≤ 1 β2ε3 (‖x(kp) − c‖2 − ‖x((k+1)p) − c‖2) Kết hợp lại ta được: d2(x(kp), Ci) ≤ (2p ε + 2 β2ε3 )(‖x(kp) − c‖2 − ‖x((k+1)p) − c‖2). Chọn c = PCx (kp) ta được d2(x(kp), Ci) ≤ (2p ε + 2 β2ε3 )( d2(x(kp), C)− d2(x((k+1)p), C)). Do chỉ số i chọn tùy ý nên với k đủ lớn, đánh giá trên đúng cho mọi i. Do bộ (C1, . . . , CN) là chính quy tuyến tính bị chặn, với S := {x(n) : n ≥ 0} ta có một số κS sao cho d(x(n), C) ≤ κS max{d(x(n), Cj) : j = 1, . . . , N} ∀n ≥ 0. 37 Nhận xét rằng nếu bộ (C1, . . . , CN) là chính quy tuyến tính, thì hằng số κS có thể chọn được độc lập với S. Kết hợp lại ta được d(x(kp), C) ≤ κ2S (2p ε + 2 β2ε3 )( d2(x(kp), C)− d2(x((k+1)p), C)). Từ đó, áp dụng định lý 1(iv) cho dãy con x(kp), dãy này hội tụ tuyến tính tới một điểm x thuộc C. Từ định lý 1(i) và mệnh đề 4 toàn bộ dãy (x(n)) hội tụ tuyến tính về x và tốc độ hội tụ không phụ thuộc cách chọn điểm xuất phát nếu bộ (C1, . . . , CN) là chính quy tuyến tính. Ơ Định lý 11. Giả sử thuật toán là tụ tuyến tính và xét tập xa nhất. Giả sử thêm rằng bộ N tập (C1, . . . , CN) là chính quy tuyến tính bị chặn và (i (n)) là dãy các chỉ số xa nhất. Nếu lim inf n à (n) i(n) > 0 thì dãy x(n) hội tụ tuyến tính tới một điểm thuộc C; tốc độ hội tụ không phụ thuộc điểm xuất phát nếu bộ (C1, . . . , CN) là chính quy tuyến tính. Chứng minh: Trước hết, do thuật toán chiếu là tụ tuyến tính, ta có β > 0 sao cho βd(x(n), Ci) ≤ d(x(n), C(n)i ) với mọi n đủ lớn và i thiết thực tại n. Tiếp theo, do bộ (C1, . . . , CN) là chính quy tuyến tính bị chặn, với tập S := {x(n) : n ≥ 0} tồn tại một hằng số κS > 0 sao cho d(x(n), C) ≤ κS max{d(x(n), Cj) : j = 1 . . . N} với mọi n ≥ 0. Dễ thấy hằng số κS có thể chọn độc lập với tập S nếu bộ (C1, . . . , CN) là chính quy tuyến tính. Tiếp theo, tồn tại một số ε > 0 sao cho à (n) i(n) ≥ ε với mọi n đủ lớn. Kết hợp lại và sử dụng bổ đề 2(ii) ta có đánh giá sau: d2(x(n), C) ≤ κ2S max{d2(x(n), Cj) : j = 1 . . . N} = κ2Sd 2(x(n), Ci(n)) ≤ (κS β )2 ‖x(n) − P (n) i(n) ‖2 ≤ (κS β )2 1 à (n) i(n) (‖x(n) − PCx(n)‖2 − ‖x(n+1) − PCx(n)‖2) ≤ (κS β )21 ε ( d2(x(n), C)− d2(x(n+1), C)). 38 Do đó, theo định lý 1(vi), dãy x(n) hội tụ tuyến tính tới một điểm thuộc C. Ơ Tính chất chính quy tuyến tính (bị chặn) cho phép ta đưa ra nhiều kết quả, ta sẽ nghiên cứu kỹ hơn khái niệm này và đưa ra một vài điều kiện đủ cho tính chất này. 2.4. Một vài ví dụ về tính chính quy tuyến tính (bị chặn) Mệnh đề 8. Nếu mỗi tập Ci là một nón lồi đóng thì các điều kiện sau tương đương: (i) Bộ (C1, . . . , CN) là chính quy. (ii) Bộ (C1, . . . , CN) là chính quy tuyến tính. (iii) Bộ (C1, . . . , CN) là chính quy tuyến tính bị chặn. Định lý 12 (Tính chính quy tuyến tính (bị chặn) đưa về từng cặp). Nếu mỗi cặp trong N − 1 cặp: (C1, C2), (C1 ∩ C2, C3), . . . (C1 ∩ C2 ∩ . . . ∩ CN−2, CN−1), (C1 ∩ C2 ∩ . . . ∩ CN−2 ∩ CN−1, CN) là chính quy tuyến tính (bị chặn) thì bộ N tập (C1, C2, . . . , CN) cũng là chính quy tuyến tính (bị chặn). Như vậy tính chất chính quy tuyến tính (bị chặn) ta đưa về tính chính quy theo từng cặp. Với tính chính quy tuyến tính (bị chặn) theo cặp, ta công nhận điều kiện đủ sau đây Bổ đề 4. Giả sử E,F là hai tập lồi đóng. Nếu 0 ∈ icr(E −F )(icr(S) = intaff S S là nhân trong của S), thì cặp (E,F ) là chính quy tuyến tính bị chặn. Nói riêng, điều này đúng nếu 39 (i) 0 ∈ int(E − F ). (ii) E − F là không gian con đóng. Kết hợp định lý và bổ đề vừa nêu ta có hệ quả sau: Hệ quả 14. Nếu 0 ∈ icr(C1 − C2) ∩ icr((C1 − C2)− C3) ∩ . . . icr((C1 ∩ . . . CN−1)− CN) thì bộ N -tập là chính quy tuyến tính bị chặn. Hệ quả 15. Nếu CN ∩ int(C1 ∩ . . . CN−1) 6= ∅ thì bộ N -tập là chính quy tuyến tính bị chặn. Tiếp theo ta xét tính chính quy tuyến tính (bị chặn) của một số bộ tập đặc biệt. Ta có một số kết quả sau đây. Mệnh đề 9. Bộ N -tập (C1, . . . , CN) là chính quy tuyến tính nếu (i) Mỗi tập Ci là một siêu phẳng. (ii) Mỗi tập Ci là một đa diện. (iii) Mỗi tập Ci là một nửa không gian. (iv) Mỗi tập Ci là một không gian con đóng và ít nhất một không gian con là hữu hạn chiều hoặc tất cả các không gian con (có thể ngoại trừ một không gian con) có đối chiều hữu hạn. 40 Chương 3. Thuật toán dưới gradient và phương pháp chỉnh lặp song song Trong chương này ta xét trường hợp tổng quát khi các tập Ci có dạng Ci = {x ∈ X : fi(x) ≤ 0} trong đó fi là một hàm lồi. Như vậy Ci là tập mức dưới của một hàm lồi. Chú ý rằng ánh xạ khoảng cách d(ã, C) khi C là tập lồi cũng là một hàm lồi và tập lồi C bất kỳ đều có thể xem như tập mức dưới của hàm f(ã) = d(ã, C). 3.1. Thuật toán dưới gradient 3.1.1. Cơ sở Định nghĩa 16 (Dưới vi phân). Giả sử f : X −→ X là một hàm lồi. Cho trước một điểm x0 ∈ X , tập hợp {x∗ ∈ X : 〈x∗, x− x0〉 ≤ f(x)− f(x0) ∀x ∈ X} được gọi là dưới vi phân của f tại x0 và ký hiệu là ∂f(x0) Bổ đề 5. Giả sử rằng f : X −→ X là một hàm lồi và x0 ∈ X . Khi đó (i) f liên tục tại x0 và ∂f(x0) chỉ có một phần tử nếu và chỉ nếu f là nửa liên 41 tục dưới và khả vi Gâteaux tại x0. Trong trường hợp này, dưới vi phân duy nhất của f tại x0 chính là đạo hàm Gâteaux của f tại x0. (ii) Nếu f liên tục tại x0 thì f khả dưới vi phân tại x0. (iii) Nếu X hữu hạn chiều thì f liên tục và khả dưới vi phân tại mọi điểm. Bổ đề 6. Giả sử f : X −→ X là một hàm lồi, x0 ∈ X và f khả dưới vi phân tại x0. Giả sử thêm rằng tập S := {x ∈ X : f(x) ≤ 0} 6= ∅. Với mọi g(x0) ∈ ∂f(x0), định nghĩa tập lồi đóng H bởi: H := H(f, x0, g(x0)) := {x ∈ X : f(x0) + 〈g(x0), x− x0〉 ≤ 0}. Khi đó (i) H ⊇ S. Nếu g(x0) 6= 0 thì H là một nửa không gian; ngược lại thì H = X . (ii) PHx0 = x0 − f(x0) ‖g(x0)‖2 g(x0) nếu f(x0) > 0 x0 ngược lại (iii) d(x0, H) =  f(x0) ‖g(x0)‖ nếu f(x0) > 0 0 ngược lại Chú ý 5. Nửa không gian trong bổ đề vừa định nghĩa được sử dụng với ý tưởng sau. Giả sử ta cần tìm một phần tử của tập S = {x ∈ X : f(x) ≤ 0}. Xuất phát từ điểm x0, nếu f(x0) ≤ 0 thì ta tìm được x0 ∈ S; ngược lại f(x0) > 0, ta đi tìm nghiệm của phương trình f(x) = 0. Tuy nhiên do điều này khó thực hiện nên ta thay f(x) bởi xấp xỉ bậc 1 của nó tức là f(x) ≈ f˜(x) := f(x0) + 〈g(x0), x− x0〉 với g(x0) ∈ ∂f(x0), và giải phương trình f˜(x0) = 0. Phương trình này có một nghiệm là PH(x0) = x0 − f(x0)‖g(x0)‖2 g(x0). Ta đưa ra định nghĩa chính xác của thuật toán dưới gradient. 42 Định nghĩa 17. Giả sử với một chỉ số i ∈ {1, 2, . . . , N} nào đó và mọi chỉ số n, các tập C (n) i của thuật toán chiếu có dạng C (n) i = H (n) i = {x ∈ X : fi(xn) + 〈gi(x(n)), x− xn〉 ≤ 0} với mỗi hàm lồi fi : X −→ R, trong đó fi khả dưới vi phân tại mọi điểm x(n) và gi(x (n)) ∈ ∂fi(x(n)). Giả sử thêm rằng Ci = {x ∈ X : fi(x) ≤ 0}. Khi đó ta gọi thuật toán chiếu này là thuật toán dưới gradient. Mỗi chỉ số i được gọi là chỉ số dưới gradient. Chú ý rằng không phải mọi chỉ số i đều là chỉ số dưới gradient. Nhận xét 1. Thuật toán chiếu và thuật toán dưới gradient có mối liên hệ mật thiết theo nghĩa

Các file đính kèm theo tài liệu này:

a1 (4).PDF