MỤC LỤC
LỜI CẢM ƠN . 1
MỤC LỤC . 2
CÁC KÝ HIỆU . 3
LỜI MỞ ĐẦU . 4
CHƯƠNG 1: KIẾN THỨC CHUẨN BỊ . 5
1.1. Một số kiến thức về giải tích điều hòa trên , 2 và (3) .5
1.1.1. Các phép toán trên .5
1.1.2. Một số kiến thức về độ đo.5
1.1.3. Tích vô hướng Hermit trên không gian vectơ.8
1.1.4. Một số chuẩn đặc biệt.9
1.1.5. Các biến đổi Fourier trên .10
1.1.6. Các yếu tố của giải tích điều hòa trên (3) và 2 .15
1.2. Một số kiến thức về xác suất thống kê .18
1.2.1. Khái niệm hàm phân phối, hàm mật độ .18
1.2.2. Các giá trị đặc trưng của biến ngẫu nhiên X.19
CHƯƠNG 2: GIẢI CHẬP TRÊN BẰNG PHƯƠNG PHÁP DỰA TRÊN
CÁC HÀM WAVELET . 23
2.1. Giới thiệu bài toán nhân chập trên .23
2.2. Giải bài toán nhân chập trên bằng phương pháp dựa trên các hàm wavelet24
2.2.1. Cơ sở lý thuyết .24
2.2.2. Thuật toán giải chập dựa trên các wavelet .34
CHƯƠNG 3: GIẢI CHẬP CẦU BẰNG PHƯƠNG PHÁP TIẾP CẬN BỘ HÀM
. 35
3.1. Giới thiệu bài toán nhân chập cầu .35
3.2. Giải bài toán chập cầu bằng phương pháp tiếp cận bộ hàm .36
3.2.1. Cơ sở lý thuyết .36
3.2.2. Thuật toán cực tiểu hóa ước lượng Lasso .58
KẾT LUẬN VÀ KIẾN NGHỊ. 59
TÀI LIỆU THAM KHẢO . 60
62 trang |
Chia sẻ: mimhthuy20 | Lượt xem: 595 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận văn Bài toán giải chập trong thống kê phi tham số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ay ( )V X
( ) ( )( )
( )( )
( )( ) ( )
=
∈
− = − = −
∑
∫
N
2
i i
2 i 1
2
x
x E X p , X rêi r¹c
Var X EX E X
x E X f x dx , X liªn tôc
Ý nghĩa: ( )X E X− là độ lệch giữa giá trị của X so với trung bình của nó, do đó
phương sai chính là trung bình của bình phương độ lệch đó. Nó đặc trưng cho độ phân tán
của biến ngẫu nhiên quanh giá trị trung bình.
Ta có các tính chất:
o ( )V C 0= , C là hằng số.
o ( ) ( )2V CX C .V X= .
21
o ( ) ( ) ( )( )22V X E X E X= − .
o Nếu X, Y độc lập thì ( ) ( ) ( )V X Y V X V Y± = + ,
( ) ( )V X C V X+ = .
Ước lượng không chệch:
Thống kê θˆ được gọi là ước lượng không chệch của θ nếu
( )ˆE θ θ= .
Ý nghĩa: Từ định nghĩa ta có: ( )ˆE 0θ θ− = , tức là, trung bình của độ lệch (sai số)
giữa ước lượng với giá trị thật bằng 0. Sai số trung bình bằng 0 được gọi là sai số ngẫu
nhiên, ngược lại gọi là sai số hệ thống. Như vậy, θˆ là ước lượng không chệch của θˆ khi sai
số ước lượng là sai số ngẫu nhiên.
Mệnh đề 1.2 (Bất đẳng thức Bernstein)
Cho 1X ,, NX là các biến ngẫu nhiên độc lập, có giá trị thực. Giả sử tồn tại các số v
và c sao cho
N
2
i
i 1
E X v
=
≤ ∑ .
Và với mọi k∈ , k 3≥ sao cho
( )
N
k k 2
i
i 1
k!E X vc
2
−
+
=
≤ ∑ .
Khi đó, với mọi x 0> , [ ]( )
N
i i
i 1
S X E X
=
= −∑ , ta có
xS 2vx cx e− ≥ + ≤ .
Hay
[ ] ( )
2x
2 v cxS x e
−
+≥ ≤ .
Chứng minh: Xem [7].
Hệ quả 1.2
Cho các biến ngẫu nhiên độc lập 1 NX ,...,X thỏa mãn
iX b≤ , i 1, N= .
22
Đặt
bc
3
= ,
N
2
i
i 1
v E X
=
= ∑ , [ ]( )
N
i i
i 1
S X E X
=
= −∑ .
Khi đó, với mọi x 0> , ta có
xS 2vx cx 2e− ≥ + ≤ .
Hay
( )
2x
2 v cxS x 2e
−
+ ≥ ≤ .
23
CHƯƠNG 2: GIẢI CHẬP TRÊN BẰNG PHƯƠNG PHÁP DỰA
TRÊN CÁC HÀM WAVELET
2.1. Giới thiệu bài toán nhân chập trên
Trong thống kê, bài toán giải chập được mô tả một cách tổng quát như sau:
Tìm ước lượng của f từ các quan sát thực nghiệm được cho bởi
( )h f *G f (x y)dG y= = −∫ (2.1)
trong đó ∗ là tích chập hàm mật độ f với hàm phân phối xác suất tương ứng G, với các biến
ngẫu nhiên độc lập 1 nX ,...,X được quan sát, trong đó mỗi jX đều có hàm phân phối G. Các
biến ngẫu nhiên này được xem như dữ liệu. Trong nhiều tình huống thực tế, các dữ liệu này
không thể có được trực tiếp, do sai số trong đo lường. Do đó, chúng ta có thể quan sát các
dữ liệu bị nhiễu 1 nY ,...,Y thay vì các dữ liệu thật 1 nX ,...,X . Mô hình cơ bản của dữ liệu bị
nhiễu 1 nY ,...,Y là cộng thêm sai số đo lường, tức là, bất kì một quan sát thực nghiệm đều
được giới hạn bởi các dữ liệu
j j jY X ε= + , { }j 1,...,n∈
thay cho các 1 nX ,...,X . Các biến ngẫu nhiên độc lập 1 n,...,ε ε đại diện cho sai số hoặc sự bị
nhiễu của dữ liệu, hàm mật độ của mỗi jε được gọi là hàm mật độ sai số, kí hiệu là g .
Ngoài ra, ta giả sử jX và jε có giá trị thực và độc lập với nhau. Kết quả cơ bản của lí thuyết
xác suất cho hàm mật độ của tổng của hai biến ngẫu nhiên độc lập bằng với tích chập của
hai hàm mật độ của chúng, do đó
( ) ( )h f *g x f (x y)g y dy= = −∫ (2.1*)
trong đó h là hàm mật độ của quan sát Y . Vì bất kì truy cập thực nghiệm trực tiếp đều bị
giới hạn bởi h nên (2.1*) cũng chính là bài toán (2.1).
Hàm f được tìm lại từ một quan sát thực nghiệm h bất kì. Do đó ta chỉ có thể ước
lượng f từ các quan sát một cách gián tiếp. Trước hết ta đưa ra một phương án thực nghiệm
hˆ , gọi là ước lượng của h . Sau đó, áp dụng phương pháp giải chập đối với hˆ để ước lượng
f . Mục đích của ta là tìm ước lượng fˆ sao cho xấp xỉ với f , sai số này càng nhỏ càng tốt.
24
Do đó, ước lượng hˆ ban đầu phải được lựa chọn phù hợp với các phép thử của thống kê cụ
thể, đồng thời phải đảm bảo tính “đủ tốt”. Để giải được bài toán này, trước hết ta phải giả sử
rằng hàm phân phối g đã biết. Tuy nhiên, trong thực tế việc xác định g có thể chỉ tương đối
vì nó phụ thuộc nhiều yếu tố, như các điều kiện bị hạn chế trên f hoặc bổ sung thêm dự
liệu, hoặc các phép thử lặp đi lặp lại, .
Có nhiều phương pháp giải bài toán này. Ở đây, ta đưa ra một phương pháp khá phổ
biến để giải bài toán trong thống kê phi tham số. Đó là phương pháp dựa trên các hàm
wavelet (được định nghĩa trong phần tiếp theo), cụ thể là sử dụng tính trực giao của chúng.
2.2. Giải bài toán nhân chập trên bằng phương pháp dựa trên các hàm
wavelet
2.2.1. Cơ sở lý thuyết
Với { }p 1,2∈ , ta xét các không gian tuyến tính
( ) ( ){ }pp f : : f x dx = → < ∞∫ (2.2)
và các khái niệm sau.
Hàm thực nghiệm đặc trưng
Trong phần giới thiệu tổng quát bài toán giải chập, trước hết ta phải ước lượng được
hàm mật độ h từ các quan sát jY . Vì thế ta phải đối mặt với vấn đề ước lượng trực tiếp hàm
mật độ h. Mặc dù có nhiều phương pháp khác nhau nhưng mục đích chính của bước này là
làm cho biến đổi Fourier fth có thể ước lượng được. Vì hàm đặc trưng của biến ngẫu nhiên
Y chính là biến đổi Fourier của hàm mật độ của Y nên ta có
( ) ( ) ( ) ( ) ( )
1
ft
1 Yh t exp itx h x dx E exp itY tψ= = = ∫ .
Như một phương pháp thống kê phổ biến, ta thu được ước lượng của fth bằng cách
thay kì vọng bởi lấy trung bình các biến ngẫu nhiên độc lập ( )exp itY . Khi đó, hàm thực
nghiệm đặc trưng được xác định bởi
( ) ( )
1
n
Y j
j 1
1ˆ t exp itY
n
ψ
=
= ∑ .
Vì 1X và 1ε độc lập nên ( )1exp itX và ( )1exp itε cũng độc lập, và
25
( ) ( ) ( )( )
1
ft
Y 1 1h t t E exp it Xψ ε = = +
( ) ( )1 1 E exp itX E exp itε=
( ) ( )
1 1X
t tεψ ψ=
( ) ( )ft ft f t .g t= .
Do đó,
( ) ( ) ( ) ( )
1
n
ft ft
X j
j 1
1 ˆˆ t exp itY / g t f t
n
ψ
=
= =∑ (2.3)
là một ước lượng của ( )ftf t , với điều kiện ( )ftg t 0≠ , t∀ .
Wavelet
Wavelet (mẹ) là một hàm ( )2ψ ∈ thỏa mãn:
i. Có trị trung bình triệt tiêu: ( )t dt 0ψ
+∞
−∞
=∫ .
ii. Được chuẩn hóa:
2
1ψ = .
iii. Có tâm trong vùng lân cận của t = 0.
Khi co giãn hàm wavelet ψ bởi hệ số s và tịnh tiến nó bởi hệ số u thì ta tạo ra một họ
các hàm wavelet (con)
( )s,u
1 t ut
ss
ψ ψ − =
với s +∈ , u∈ .
Và các hàm này cũng được chuẩn hóa: s,u 2 1ψ = .
Các hàm wavelet nhận được sự quan tâm đáng kể trong giải tích số, lý thuyết xấp xỉ
cũng như khoa học thống kê suốt thời gian cuối thập kỷ qua, xem [9].
Theo định nghĩa, hàm mật độ bất kì có thể nằm trong ( )1 , không nhất thiết thuộc
( )2 . Tuy nhiên, các giả thuyết dưới đây xem như tính bị chặn của hàm mật độ, chúng ta
có thể xác định thuộc tính của nó trong ( )2 .
Bổ đề 2.1
Một hàm mật độ f bất kì bị chặn đều thuộc không gian ( )2 .
Chứng minh:
26
Vì f đo được, f 0≥ và ( )f x dx 1=∫
nên ( )1f ∈ . Giả sử tồn tại M 0≥ sao cho
( )f x M≤ , x∀ ∈ .
Khi đó,
( ) ( ) ( )2f x M f x g x≤ = .
Ta có ( )1g∈ , theo định lý hội tụ bị chặn thì ( )
2
1f ∈ . Vậy ( )2f ∈ .
Với p 1≥ , ( )p là không gian Banach, với chuẩn
( )( )1/pppf f x dx= ∫ .
Riêng ( )2 là không gian Hilbert với chuẩn 2f f ,f= ứng với tích vô hướng
( ) ( )f ,g f x g x dx= ∫ với f , ( )2g∈ .
Lưu ý rằng:
• Hai hàm ( )2f , g∈ được gọi là trực giao nếu f ,g 0= .
Hệ { }jf , j Z∈ được gọi là cơ sở trực chuẩn của ( )2 nếu
j k j,k
1
f ,f
0
δ
= =
,
,
j k
j k.
=
≠
• ( )2f∀ ∈ , ta có
J
j j j
j J 2
inf f f : , j J,J 0µ µ →∞
≤
− ∈ = − →
∑ .
Điều này cho thấy sự khác biệt của ( )2 . Tính chất thứ hai nghĩa là bất kì f thuộc
( )2 đều có thể được xấp xỉ với cơ sở trực chuẩn.
Với J hữu hạn, infimum được thay thế bởi minimum, các hệ số j jf ,fµ = được tính
một cách chính xác. Chiếu trực giao f xuống bao tuyến tính của { }jf : j J≤ ta được các hệ
số j jf ,fµ = . Thật vậy, ta có
j j k
j J
f f ,f f ,f
≤
−∑ =
j,k
k j j k
j J
f ,f f ,f f ,f
δ
≤
=
− ⋅∑
= 0 , { }k J,..., J∈ −
27
nên j jj Jf f ,f f≤−∑ trực giao với ( )k k kk J f ,f fµ≤ −∑ . Do đó, với mọi J J,...,µ µ− ∈ ,
ta có
2
j j
j J 2
f fµ
≤
−∑ =
2
j j j j j j
j J j J j J 2
f f ,f f f ,f f fµ
≤ ≤ ≤
− + −∑ ∑ ∑
= ( )
2 2
j j j j j
j J j J2 2
f f ,f f f ,f fµ
≤ ≤
− + −∑ ∑
≥
2
j j
j J 2
f f ,f f
≤
−∑ .
Suy ra j jj J f ,f f≤∑ cực tiểu hóa khoảng cách giữa f với jf bất kì thuộc bao tuyến tính
{ }jf : j J≤ trong ( )2 . Điều này giúp chúng ta tìm ra ước lượng của các hệ số
j jf ,fµ = . Áp dụng đẳng cự Plancherel và công thức giải chập, ta có
ft ftj j j
1 f ,f f ,f
2
µ
π
= =
( ) ( )ft ftj
1 f t f t dt
2π
= ∫
( ) ( )
( )
ft
jft
ft
f t1 h t dt
2 g tπ
= ∫ .
Ta biết h f *g= là hàm mật độ của mỗi jY . Do đó, một ước lượng đối với jµ thu được
bằng cách thay ( )fth t bởi hàm thực nghiệm đặc trưng
( ) ( )
1
n
Y j
j 1
1ˆ t exp itY
n
ψ
=
= ∑ .
Kết quả ước lượng
( ) ( )
( )
ftn
j
j j ftj 1
f t1ˆ exp itY dt
2 n g t
µ
π =
= ∑∫ (2.4)
xác định tốt, nghĩa là tích phân trên tồn tại, mọi ( )ftg t đều khác 0 và ftjf có giá compact.
Đây là điều giúp chúng ta xác định được ước lượng hàm mật độ
28
( ) ( )
n
j j
j J
ˆ ˆf x f xµ
≤
= ∑ (2.5)
trong đó tham số làm trơn nJ và cơ sở trực chuẩn đặc trưng vẫn được chọn.
Trong trường hợp bất kì, chúng ta nên tổng quát ước lượng (2.5) để thứ tự của các hàm
cơ sở jf có thể thay đổi. Do đó, ta định nghĩa tập hữu hạn các số nguyên
{ }n n n nJ , J 1,..., Jζ = − − + nào đó, và ta có
( ) ( )
n
j j
j
ˆ ˆf x f x
ζ
µ
∈
= ∑ . (2.6)
Tất nhiên, ước lượng (2.6) cũng gồm cả (2.5).
Cơ sở trực chuẩn phổ biến của không gian ( )2 có thể lấy từ dãy con các hàm
wavelet. Các wavelet được xem xét với biến đổi Fourier của nó có giá compact đặc biệt hợp
lí. Cơ sở wavelet này là tập
{ } { } { }m,k j,kf : k : k , j m,m 1,...ϕ ψ∈ = ∈ ∪ ∈ = + (2.7)
trong đó
( ) ( )m/2 mm,k x 2 2 x kϕ ϕ= − , ( ) ( )j/2 jj,k x 2 2 x kψ ψ= − (2.8)
và m là số nguyên tùy ý được cố định. Hàm tỉ lệ ϕ và hàm wavelet ψ được xác định thông
qua biến đổi Fourier của chúng.
Đặt
( ) [ ]( ) 1/2ft t P t , t ,ϕ π π = − +
( ) ( ) ( )
1/2
ft t exp it / 2 P t / 2 , t = − − − ψ π π
với P là độ đo xác suất tập trung trên khoảng ,
3 3
π π −
. Từ đó, suy ra các hàm ft ,ϕ ftψ
lần lượt có giá trên các tập
4 4,
3 3
π π −
và
8 2 2 8, ,
3 3 3 3
π π π π − − ∪
. Hơn nữa, ta có
( )ft t 1ϕ = , với mọi 2t
3
π
≤ .
Bây giờ, ta sẽ thu hẹp sự quan sát trên không gian con tuyến tính của ( )2 sinh bởi
các hàm m,kϕ , k∈ . Cụ thể, ta xét không gian
29
{ }nn m ,k n : k Kζ ϕ= ≤ (2.9)
với các dãy số ( )n nK , ( )n nm ⊂ và ( )n nK ↑∞ .
Kết quả ước lượng này được gọi là ước lượng wavelet tuyến tính. Chúng ta chú ý rằng
hệ { }nm ,k : kϕ ∈ không là cơ sở trực chuẩn của ( )2 nhưng nó là cơ sở trực chuẩn của
không gian con của không gian ( )2 , xem mệnh đề sau.
Mệnh đề 2.1
Với các hàm
nm ,k
ϕ được định nghĩa trong (2.8), ta có hệ { }nm ,k : kϕ ∈ là cơ sở trực
chuẩn của không gian
( ) ( ){n ft2 2 f : fω = ∈ có giá trên [ ]}n n,ω ω− , với
nm
n
4 2
3
πω = .
Chứng minh:
Trước hết cần chứng tỏ các hàm ( )n
nm ,k 2
ωϕ ∈ , tức là, các biến đổi Fourier
n
ft
m ,kϕ có
giá trên [ ]n n,ω ω− .
Sử dụng Bổ đề 1.1, ta có
( ) ( ) ( )
n
ft m/2 m ft m
m ,k t 2 exp ikt / 2 t / 2ϕ ϕ
−= ,
( ) ( ) ( )ft j/2 j ft jj,k t 2 exp ikt / 2 t / 2ψ ψ−= .
Từ đó, ta có các hàm
n
ft
m ,kϕ có giá trên [ ]n n,ω ω− .
Hơn nữa, ta có ( )n2ω tự nó cũng là không gian Hilbert. Tính tuyến tính dễ thấy, còn
tính đóng có thể thấy như sau.
Giả sử dãy ( ) ( )nn 2nf
ω⊆ , ( )n 2f f→ ∈ ứng với chuẩn trong ( )2 . Sử dụng
đẳng thức Parseval, ta có
( ) ( ) ( ) ( )
n n n
2 2 2ft ft ft ft
n nt t t
0
f t dt 2 f t f t dt 2 f t dt
ω ω ω> > >
=
≤ − +∫ ∫ ∫
≤
2ft ft
n 2
2 f f− 2 nn 2 4 f f 0π
→∞= − → ,
nên ( )ftf t 0= hầu khắp nơi trên nt ω> theo Lebesgue, và do đó
ftf 0= trên [ ]n n\ ,ω ω− .
30
Điều này chứng tỏ ftf có giá trên [ ]n n,ω ω− , hay ( )n2f ω∈ . Vậy ( )n2ω là không
gian con đóng trong không gian Hilbert ( )2 nên nó cũng là không gian Hilbert.
Bây giờ, chúng ta sẽ chỉ ra tính trực chuẩn của hệ { }j jf ∈ .
Sử dụng đẳng thức Parseval ta có
( ) ( )ft ftm,k m,k ' m,k m,k
1, t t dt
2
ϕ ϕ ϕ ϕ
π ′
= ∫
( )( ) ( ) 2m ft mm 1
1 exp it k k / 2 t / 2 dt
2
ϕ
π+
′= −∫
( )( ) ( ) 2ft1 exp it k k t dt
2
ϕ
π
′= −∫
( )( ) [ ]( )1 exp it k k P t , t dt
2
π π
π
′= − − +∫
( )( ) [ ] ( ) ( ),
1 exp it k k x t dP x dt
2 π π
χ
π −
′= − −∫ ∫
( )( ) ( ) ( )( )
k ,k2
1 exp iy k k dP y exp it k k dt
2
π
π
πδ
π
′
−
=
′ ′= − −∫ ∫
k,k δ ′= .
Hơn nữa, tính đầy đủ của hệ { }m,k : kϕ ∈ được chỉ ra sau đây.
Với bất kì ( )n2f ω∈ , do bổ đề 1.2 nên ta có f có thể được xấp xỉ với cơ sở này ứng
với chuẩn trong ( )2
km,k 2f 0ϕ
→∞− → .
Ta có biến đổi Fourier là tự đẳng cấu từ ( )2 vào ( )2 , tức là, biến đổi Fourier bị
chặn trên (theo chuẩn) bởi hệ số tỉ lệ không đổi s 2π= .
Mặt khác, ta dễ dàng thấy rằng các đa thức lượng giác ( ) ( )1/ 2 exp ik.π , k∈ , là
một cơ sở trực chuẩn của [ ]( )2 ,π π− , vì
( ) ( ) j,k
1 1exp ik. , exp ij.
2 2
δ
π π
= .
31
Điều này tương đương với hệ { }m,k : kϕ ∈ đầy đủ.
Để đánh giá chất lượng trung bình của một ước lượng của hàm mật độ trên toàn ,
chúng ta xem xét MISE (Mean Intergrated Squared Error), trung bình tích phân của bình
phương độ lệch giữa ước lượng và giá trị thật của f , xác định như sau
( ) ( ) ( ) 2ˆ ˆMISE f ,f E f x f x dx= −∫ (2.10)
MISE (như định nghĩa trong (2.10)) của ước lượng wavelet tuyến tính được nghiên cứu
trong mệnh đề sau.
Mệnh đề 2.2
Xét ước lượng wavelet tuyến tính của bài toán giải chập
( ) ( )
n
n
k m ,k
k K
ˆ ˆf x xµ ϕ
≤
= ∑
trong đó ta thay jf bằng nm ,kϕ trong (2.4) để xác định ước lượng kµˆ .
Giả sử ( )2f ∈ và ( )ftg t 0≠ , t∀ ∈ . Khi đó, ta có
( ) ( )
n
mm nnn
n
1m2 22 2ft ft
m ,k t 4 2 /32 t 4 2 /3 k K
4 2 1fˆ f min g t f , f t dt
3 n 2 ππ
ϕ
π
−
>≤ >
Ε − ≤ ⋅ + +
∑ ∫
(2.11)
Chứng minh:
Sử dụng đẳng thức Parseval, ta có
2
2
fˆ fΕ − = ( )mnn n n
n
2
2ft
k m ,k m ,k m ,k t 4 2 /3
k K k 2
1ˆ f , f t dt
2 π
µ ϕ ϕ ϕ
π >≤
Ε − +∑ ∑ ∫
( )mnn n
n n
2 2 2ft
k m ,k m ,k t 4 2 /3
k K k K
1ˆ f , f , f t dt
2 π
µ ϕ ϕ
π >≤ >
= Ε − + +∑ ∑ ∫
( )mnn
n n
2 2ft
k k m ,k t 4 2 /3
k K k K
1ˆ ˆ var f , f t dt
2 π
µ µ ϕ
π >≤ ≤
= + Ε − +∑ ∑ ∫
n
n
2
m ,k
k K
f ,ϕ
>
+ ∑ .
Ta luôn có sự phân tích sau
n ,rnf f f ωω= +
32
với
nm
n
4 2
3
πω = , nf ω là hình chiếu vuông góc của f lên không gian ( )n2ω . Do đó ta có
( ) ( ) ( )n ft ftf t f tω = , với [ ]n nt ,ω ω∈ − . Khi đó, n ,rf ω là phần bù trực giao của nf ω , biến đổi
Fourier của nó có giá trên [ ]n n\ ,ω ω− . Ngoài ra, ta áp dụng { }nm ,k : kϕ ∈ là cơ sở trực
chuẩn của ( )n2ω .
Chúng ta xem xét kỳ vọng và phương sai của kµˆ bởi đẳng cự Plancherel, đẳng thức
Parseval và tính độc lập của dữ liệu ứng với phương sai.
( )kˆE µ ( )
( )
( )
n
ft
m ,k
1 ft
t1 exp itY dt
2 g t
ϕ
π
= Ε
∫
( ) ( )
n
ft ft
m ,k
1 f t t dt
2
ϕ
π
= ∫
nm ,k
f ,ϕ= ,
( )
( ) ( )( )
n
2
ft
m ,k
k 12 ft
t1ˆVar exp itY dt
g t2 n
ϕ
µ
π
≤ Ε ∫
( )
( ) ( ) ( ) [ ]( )
n
2
ft ft
m ,k2
1 exp ity t / g t dt f *g y dy
2 n
ϕ
π
= Ε∫ ∫
( )
( ) [ ]( )
nn , n ,
2
ft ft
m ,k2
1 exp iy / g , f *g y dy
2 n ω ω
χ ϕ
π −
= ∫ .
Do đó, ứng với phương sai, ta có
( )
( ) [ ]( )
nn , n
n n
2
ft ft
k m ,k2
k K k K
1ˆvar exp iy / g , f *g y dy
2 n ω ω
µ χ ϕ
π − ≤ ≤
≤∑ ∑∫
( ) ( ) ( ) [ ]( )
n , n
2
ft1 t exp ity / g t dt f *g y dy
2 n ω ω
χ
π −
≤ ∫ ∫
( )
n
n
1m 2 2ft
t
2 1 min g t
3 n ω
−+
≤
≤ ⋅ ⋅
.
Và do hệ { }nm ,k : kϕ ∈ là cơ sở trực chuẩn của ( )n2ω nên ta có
33
n
n
2
m ,k
k K
f ,ϕ
≤
∑ ≤ 22f , ( )n2f ω∈ .
Sử dụng các kết quả này ta được giới hạn (2.11).
Từ mệnh đề 2.2 ta thấy tham số nK không cần xác định đặc biệt. Chúng ta có thể chọn
một số lớn hơn nK và nhỏ hơn cận trên của MISE. Nếu chọn nK = ∞ thì ta không thể tính
được. Mặt khác, khi tham số nm tăng lên thì một số lượng hàm của cận trên bị giảm xuống.
Do đó, việc chọn nm phải được tối ưu hóa.
Trong thực tế, sự lựa chọn tối ưu của nm phụ thuộc vào độ trơn của f , thúc đẩy người
ta xem xét ước lượng giải chập bằng các hàm wavelet không tuyến tính, cái mà sử dụng
phần còn lại của cơ sở wavelet (2.7). Ước lượng này được đề cập trong [9]. Nó dựa trên
phép phân tích đa phân giải đối với các wavelet, được cho bởi
m,k m,k j,k j,k
k k j m
f ,f ,fϕ ϕ ψ ψ
∞
=
= +∑ ∑∑ , ( )2f∀ ∈ .
Đổi kí hiệu và phương pháp tiếp cận, ước lượng của giải chập bằng các wavelet có dạng
( ) ( ) ( ) ( )
n
2n j,n
n n n n
m r 2
nl k m ,k j,k j,k j,k,
k K j m k L k L
ˆ ˆ ˆˆf x x b x b
δ
µ ϕ ψ χ
+
∞
≤ = ≤ ≤
= +
∑ ∑ ∑ ∑
trong đó
( ) ( )( )
n
j.k
j,k l ft
l 1
t1bˆ exp itY dt
2 n g t
ψ
π =
= ∑
và các tham số dương n n j,n nK , L , , m , rδ vẫn được chọn. Tuy nhiên, sự lựa chọn chúng
không cần biết độ trơn của f, do số hạng ( )2 nj,n
2
j,kk L,
bˆ
δ
χ
≤∞
∑ , ước lượng của hệ số j,kbˆ ,
n nj m ,m r= + , bị ngắt bỏ một cách tự động khi j quá lớn. Trong trường hợp này, các hệ số
ước lượng đều bằng 0. Do đó, phần không tuyến tính của ước lượng có thể xem như một
phương tiện kiểm tra việc lựa chọn tham số nm , thường dùng cho ước lượng tuyến tính.
Ước lượng wavelet được thiết lập chủ yếu để xem xét ứng với MISE của nó, vì nó được xây
dựng dựa trên cơ sở trực chuẩn.
34
2.2.2. Thuật toán giải chập dựa trên các wavelet
Việc nghiên cứu các lí thuyết trên tạo cơ sở cho phương pháp giải bài toán chập (2.1)
qua các bước như sau:
1. Ước lượng fth dựa trên các dữ liệu trực tiếp, kí kiệu các phương án thực nghiệm của
fth là fthˆ .
2. Tính ( )fthˆ t và chia nó cho ( )ftG t , suy ra ước lượng ( )ftfˆ t .
Lưu ý rằng ftG luôn tính được khi biết G (có thể trên lí thuyết).
3. Chỉnh hóa ftfˆ để tồn tại nghịch đảo của nó. Từ đó ta được ước lượng fˆ của f .
35
CHƯƠNG 3: GIẢI CHẬP CẦU BẰNG PHƯƠNG PHÁP TIẾP CẬN
BỘ HÀM
3.1. Giới thiệu bài toán nhân chập cầu
Giống như mô hình nhân chập trên , chúng ta xét bài toán nhân chập trên quả cầu
2 . Với bất kì một quan sát thực nghiệm, các dữ liệu bị nhiễu được cho bởi
i i iZ Xε= , { }i 1,..., N∈ (3.1)
trong đó 1 N,...,ε ε là các biến ngẫu nhiên, độc lập và có cùng phân phối trên ( )3 , nhóm
quay trong 3 ; 1 NX ,...,X là các biến ngẫu nhiên, độc lập và có cùng phân phối trên quả
cầu đơn vị 2 trong 3 . Giả sử rằng iε và iX độc lập.
Gọi Zf và f lần lượt là hàm mật độ của Z và X , fε là hàm phân phối của ε . Giả sử
Zf , f liên tục tuyệt đối với độ đo thông thường trên
2 , fε liên tục tuyệt đối với độ đo Haar
trên ( )3 và xem như fε đã biết.
Khi đó, từ mô hình (3.1) ta có
Zf f fε= ∗ (3.2)
trong đó ∗ ký hiệu cho tích chập đã được định nghĩa trong chương 1.
Nói chung, mỗi quan sát iX bị làm nhiễu bởi một phép quay nhỏ ngẫu nhiên iε , mục
đích của chúng ta là tìm lại hàm mật độ chưa biết f từ các quan sát bị nhiễu iZ đó. Mặc dù
bài toán giải chập được giải quyết nhiều trên nhưng trên quả cầu thì rất ít, do hình học
cầu có những đặc trưng riêng của nó, bao gồm các công cụ giải tích phức tạp hơn.
Các tác giả đầu tiên giải quyết bài toán này là Healy, Hendriks và Kim. Họ đưa ra một
phương pháp dựa vào tính trực giao của cơ sở Fourier của ( )22 , đó là các hàm điều hòa
cầu, và đánh giá sự thực hiện của phương pháp này về lý thuyết bằng cách đưa ra tiêu chuẩn
hội tụ đều theo Sobolev. Hơn nữa, các hàm điều hòa cầu tạo thành cơ sở phân tích giá trị kỳ
dị (Singular Value Decomposition, viết tắt là SVD) trong việc giải chập cầu và do đó ta luôn
tìm được nghịch đảo toán tử nhân chập fε . Sau đó, các tác giả Kim và Koo đã chứng minh
rằng tiêu chuẩn hội tụ đó là tối ưu và hoàn chỉnh các kết quả này bằng cách thêm một điều
kiện siêu trơn (super-smooth condition) vào hàm phân phối fε (xem [5]). Phương pháp
36
SVD được thu hút bởi vì việc lấy nghịch đảo toán tử fε nhanh và đơn giản, nhưng nó ít có
tính năng địa phương. Thật vậy, các hàm điều hòa cầu phết (tản ra) khắp hình cầu nên có thể
là nhược điểm khi chúng ta muốn làm nổi bật một số tính năng địa phương của hàm mật độ
cần xem xét. Đây là trường hợp mỗi khi ai đó tập trung vào chuẩn vô cực hoặc muốn thích
ứng với sự trơn không đồng đều đều bắt gặp. Để giải quyết vấn đề này, Kerkyacharian,
Phạm Ngọc và Picard đã xét đến một phương pháp ngưỡng dựa trên các needlet (xem [6]).
Theo Narcowich, Petrushev và Ward, needlet có tính chất khoanh vùng rất tốt. Tuy nhiên,
phương pháp này chỉ quan sát trên một vùng nhỏ của quả cầu, không mở rộng trên toàn thể.
Do đó, thay vì giải bài toán với một cơ sở, hoặc các hàm điều hòa cầu, hoặc các
needlet, ta có thể kết hợp để xem xét một bộ hàm ( )1 K,...,ϕ ϕ hoàn chỉnh hơn, với K có thể
lớn hơn kích thước N của không gian mẫu, ngược lại với phương pháp ngưỡng (K≤N).
Với mục đích này, chúng ta muốn xây dựng ước lượng của f như một tổ hợp tuyến tính
của các hàm của bộ hàm ( )1 K,...,ϕ ϕ với ( )2k 2ϕ ∈ , k 1,K∀ = . Gọi fλ là tổ hợp tuyến
tính đó, ta có
( ) ( )
K
k k
k 1
f x xλ λ ϕ
=
= ∑ với 2x∈ , ( ) K1,..., Kλ λ λ= ∈ .
Chúng ta mong muốn ước lượng của f là ma trận thưa thớt, nghĩa là hầu hết các tọa độ
của λˆ đều bằng 0, với λˆ là ước lượng của λ . Một câu hỏi đặt ra là làm sao tìm được cấu
trúc thưa thớt của λˆ ? Bằng cách xem xét một bộ hàm tổng quát, chúng ta sẽ tìm ra ma trận
thưa thớt đó. Nói cách khác, phương pháp tiếp cận bộ hàm có khả năng tìm lại hàm mật độ
f trong (3.2).
3.2. Giải bài toán chập cầu bằng phương pháp tiếp cận bộ hàm
3.2.1. Cơ sở lý thuyết
Trong phần này, chúng ta đưa ra khái niệm ước lượng Lasso của hàm mật độ f và thiết
lập bất đẳng thức oracle.
3.2.1.1. Ước lượng Lasso của hàm mật độ f
Trước hết, ta có ước lượng của f là tổ hợp của các hàm của bộ hàm ( )1 K,...,ϕ ϕϒ = .
Với mọi ( ) K1 K,...,λ λ λ= ∈ , ta đặt
37
K
k k
k 1
f λ λ ϕ
=
= ∑ .
Giả sử k 2 1ϕ = , k 1,K∀ = , ta đặt
( ) ( )2k k x f x dxβ ϕ= ∫ .
Với mỗi kϕ , ta có biến đổi Fourier của kϕ
( ) ( ) ( )2*k k m k mm ,Y x Y x dxϕ ϕ ϕ= = ∫
.
Đẳng thức Parseval cho ta
( ) ( )*k k m m
0 m
fβ ϕ
∞
∗
= =−
= ∑ ∑
.
Phương pháp SVD cho ta ước lượng không chệch của ( )
m
f ∗ là
( ) ( ) ( )
N 1* *
n imnm i 1 n
fˆ f Y Zε
−
= =−
= ∑∑
trong đó ( ) 1
mn
fε
−∗ là biến đổi Fourier ngược của fε . Thật vậy, ta xét ( )mnf fε ε
∗ ∗ =
là ma
trận cấp ( ) ( )2 1 2 1+ × + , được lấy từ dòng thứ m và cột thứ n bởi biến đổi Fourier
( )
mn
fε
∗ . Sau đó ta nghịch đảo ma trận này ta được ma trận ( ) 1
mn
fε
−∗ .
Khi đó,
( ) ( ) ( )
N 1
k k n im mn
i 1 0 m n
1ˆ f Y Z
N ε
β ϕ
∞ −∗ ∗
= = =− =−
= ∑∑ ∑ ∑
là một ước lượng không lệch của kβ .
Đặc biệt, nếu đặt
( ) ( ) ( ) ( )1k k nm mn
0 m n
x f Y xεφ ϕ
∞ −∗ ∗
= =− =−
= ∑ ∑ ∑
, x∀ ∈2
thì
( )k k i
i 1
1ˆ β φ
Ν
=
= Ζ
Ν∑ .
Bây giờ ta giới thiệu ước lượng Lasso Lfˆ của hàm mật độ f.
Định nghĩa
38
Ước lượng Lasso của hàm mật độ f là ( ){ }LL ˆfˆ max f ,0λ= ℜ với Lλˆ là nghiệm của
bài toán cực tiểu sau
( ) ( ) ( )( )
K
K
L
1,k k 2,k k
k 1
ˆ arg min C 2
λ
λ λ η λ η λ
∈ =
= + ℜ + ℑ
∑
(3.3)
trong đó
( )
K
2
k k2
k 1
ˆC f 2λλ λ β
=
= − ℜ
∑
và ( )1,k k 1,K ,η = ( )2,k k 1,Kη = là các dãy số dương được chọn trong (3.10), (3.11) ở phần sau.
Mệnh đề sau cho thấy rằng Lλˆ thu được bằng cách cực tiểu hóa chuẩn 1 theo cách
ngược lại.
Mệnh đề 3.1
Cho bất kỳ K∈λ , ta có
( ) 2 222E C f f fλλ = − − .
Chứng minh:
Với ( )
K
2
k k2
k 1
ˆC f 2λλ λ β
=
= − ℜ
∑ , ( )k kˆE β β= , ta có
( )E C λ ( )
2
2K K K
k k k k k k
k 1 k 1 k 1
x dx λ ϕ λ β λ β
= = =
= − −∑ ∑ ∑∫
( ) ( ) ( ) ( ) ( )
2 2 2
2K K K
k k k k k k
k 1 k 1 k 1
x dx f x x dx f x x dxλ ϕ λ ϕ λ ϕ
= = =
= − −∑ ∑ ∑∫ ∫ ∫
( ) ( ) ( ) ( ) ( )
2 2 2
2K K K
k k k k k k
k 1 k 1 k 1
x dx f x x dx f x x dxλ ϕ λ ϕ λ ϕ
= = =
= − −∑ ∑ ∑∫ ∫ ∫
( ) ( ) ( ) ( )( )
2 2
2K K
k k k k k k
k 1 k 1
x dx f x x x dxλ ϕ λ ϕ λ ϕ
= =
= − +∑ ∑∫ ∫
.
Mặt khác,
2
2
f fλ −
2K
k k
k 1 2
fλ ϕ
=
= −∑
39
( ) ( ) ( ) ( )
2
K K
k k k k
k 1 k 1
x f x x f x dxλ ϕ λ ϕ
= =
= − −
∑ ∑∫
( ) ( ) ( ) ( ) ( ) ( )
2
2K K K
2
k k k k k k
k 1 k 1 k 1
x f x f x x f
Các file đính kèm theo tài liệu này:
- tvefile_2014_05_28_3484657858_9488_1871463.pdf