MỤC LỤC
LỜI CẢM ƠN .3
LỜI MỞ ĐẦU .4
CHƯƠNG 1: ĐẠI CƯƠNG VỀ CHUỖI THỜI GIAN VÀ DỰ BÁO 5
1.1. Đại cương về chuỗi thời gian 5
1.1.1. Khái niệm chuỗi thời gian 5
1.1.2. Quá trình ngẫu nhiên 5
1.1.3. Tách xu thế phát triển và các yếu tố mùa .6
1.1.4. Mô hình hóa chuỗi thời gian 7
1.2. Dự báo .7
1.2.1. Phương pháp dự báo giản đơn 8
1.2.2. Phương pháp trung bình .12
1.2.3. Phương pháp tự hồi qui .14
CHƯƠNG 2: MÔ HÌNH DỰ BÁO THEO CHUỖI THỜI GIAN 15
2.1. Quá trình dừng . .15
2.1.1. Không gian L2( ,F,P) .15
2.1.2. Phép xấp xỉ tuyến tính trong L2 . .19
2.1.3. Phương trình dự đoán .20
2.1.4. Quá trình ngẫu nhiên dừng .20
2.1.5. Dự đoán tuyến tính tối ưu 21
2.1.6. Kỳ vọng có điều kiện và dự đoán tốt nhất trong L2 . .22
2.1.7. Kỳ vọng có điều kiện và dự đoán tuyến tính tốt nhất .25
2.2. Quá trình ARMA .26
2.2.1. Quá trình tự hồi quy 26
2.2.2. Quá trình Trung Bình Trượt .27
2.2.3. Quá trình tự hồi quy-trung bình trượt ARMA(p,q) .28
2.2.4. Quá trình hợp nhất tự hồi-quy trung bình trượt .29
2.3. Nhận dạng mô hình .30
2.3.1. Ý tưởng của việc nhận dạng mô hình 30
2.3.2. Dừng hay không dừng .31
2.3.3. Ước lượng cấp của mô hình .33
2.3.4. Ước lượng thô tham số cho mô hình ARMA 34
2.3.5. Kiểm tra sự phù hợp của mô hình .35
2.3.6. Ước lượng các giá trị xuất phát x và .38
2.3.7. Điều chỉnh các ước lượng thô của các tham số a, b .39
2.3.8. Dự báo tuyến tính theo mô hình ARMA . .42
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM .45
3.1. Bài toán .45
3.2. Một số hình ảnh của chương trình 45
KẾT LUẬN 54
TÀI LIỆU THAM KHẢO . 55
55 trang |
Chia sẻ: lynhelie | Lượt xem: 2291 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Đồ án Chuỗi thời gian và ứng dụng trong bài toán quản lý, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ô hình tự hồi qui bậc 2
Xt= β + Φ1Xt-1 + Φ2Xt-2 + at
C. Mô hình tự hồi qui bậc p
Xt= β + Φ1Xt-1 + Φ2Xt-2 ++ ΦpXt-p + at
CHƯƠNG 2: MÔ HÌNH DỰ BÁO THEO CHUỖI THỜI GIAN
2.1. Qúa trình dừng
2.1.1. Không gian L2(,F,P)
Xét một không gian xác suất (,F,P) và lớp C gồm mọi biến ngẫu nhiên X được định nghĩa trên và khả điều kiện:
E X2 = X2()P(d) < (2.1.1)
Khi đó rõ ràng là:
E(ax)2 = a2Ex2 với C
Ngoài ra vì:
(X + Y)2 2X2 + 2Y2
nên cũng có:
(X + Y)2 2X2 + 2Y2 < với X,Y C.
Phần tử 0 của C chính là biến ngẫu nhiên đồng nhất bằng không trên và có thể dễ dàng kiểm tra thấy rằng C thỏa mãn các tính chất của một không gian vectơ.
Bây giờ, với hai phần tử X,Y C, ta định nghĩa bởi hệ thức:
= E(XY) (2.1.2)
Dễ dàng thấy rằng thỏa mãn tính chất của một vô hướng trừ tính chất triệt tiêu.
Thật vậy, nếu = 0 thì không nhất thiết X() =0(biến ngẫu nhiên 0), mà chỉ có P(X() = 0) = 1. Để vượt qua khó khăn này ta nói rằng hai biến ngẫu nhiên X và Y là tương đương nếu P(X() = Y()) = 1. Quan hệ tương đương này đã phân hoạch C thành những lớp các biến ngẫu nhiên tương đương, trong đó hai biến ngẫu nhiên thuộc cùng một lớp là bằng nhau với xác suất 1. Không gian L2(,F,P) là tập các lớp tương đương với vô hướng được xác định theo (2.1.2) hơn nữa, vì mỗi lớp tương đương được xác định duy nhất bằng cách lấy một phầ tử bất kỳ nào đó của lớp làm đại diện nên ta vẫn dùng ký hiệu X,Y để chỉ các phần tử của L2 và vẫn gọi đó là các biế ngẫu nhiên miễn là nhớ rằng khi nói X thì hiểu rằng X là đại diện cho cả một lớp các biến ngẫu nhiên tương đương với X.
Định nghĩa 2.1.1
Sự hội tụ trong L2 là sự hội tụ trung bình phương(meansquare), viết tắt là Xn X, nghĩa là dãy các phần tử {Xn}; Xn L2 được gọi là hội tụ đến X khi và chỉ khi:
||Xm- Xn||2 = E|Xn – X|2 0 khi n .
Để chứng tỏ L2 là không gian Hilbert ta còn phải xây dựng tính đầy của L2 nghĩa là nếu ||Xm- Xn||2 0 khi m,n thì tồn tại X L2 sao cho Xn X.
Trước hết ta xét mệnh đề:
Mệnh đề 1:
Nếu Xn L2 và ||Xn+1- Xn||2 < 2-n ; n = 1,2,3,... Thì tồn tại một biến ngẫu nhiên X trên (,F,P) sao cho Xn X với xác suất 1.
Chứng minh
Chọn X0 = 0, rồi đặt Xn = (Xj – Xj-1), khi đó theo bất đẳng thức Cauchy-Schwarz ta có:
|| ||X||.||Y||
E(|Xj – Xj-1|) = E|Xj – Xj-1| ||Xj – Xj-1|| ||X1|| + 2-j <
Từ đó suy ra tồn tại |Xj – Xj-1| và giới hạn đó hữu hạn với xác suất 1. Như vậy |Xj – Xj-1| = Xn tồn tại và hữu hạn với xác suất 1.
Định lý 2.1.2(định lý về phép chiếu trong không gian Hilbert)
Nếu M là một không gian con đóng của không gian Hilbert H và x ÎH thì:
Tồn tại duy nhất một phần tử M sao cho ||x - ||= ||x - y||
M và ||x-|| = ||x-y|| khi và chỉ khi M và (x-) M
được gọi là chiếu (trực giao) của x lên M viết là = PMx và định lý này được gọi là định lý về phép chiếu trực giao.
Chứng minh
Nếu d = || x – y||2 thì tồn tại một dãy {yn}; yn M sao cho ||yn – x||2 ® d.
Hơn nữa, như đã biết, với u, v bất kỳ thuộc không gian Hilbert, theo quy tắc đường chéo hình bình hành ta có:
||u – v||2 + ||u + v||2 = 2 ( ||u||2 + ||v||2)
Do đó ta xét:
ym – x M ; yn – x M;
Ta có:
||(ym – x) + (yn – x)||2 + ||(ym – x) – (yn – x)||2 = 2(||ym – x)||2 + || yn – x||2) ;
Tức là:
||(ym + yn) – 2x||2 + ||ym – yn||2 = 2(||ym – x)||2 + || yn – x||2);
Mặt khác vì:
(ym + yn)/2 M ;
Suy ra:
0 £ ||ym – yn||2 = -4||(ym + yn)/2 – x||2 + 2(||ym – x)||2 + || yn – x||2)
£ -4d + 2(||ym – x||2 + || yn – x||2) ® 0 khi m, n ®
Từ đó theo chuẩn Cauchy, tồn tại H sao cho ||yn - || ® 0. Và vì M đóng nên M và vì tính liên tục của tích vô hướng nên:
|| x - ||2 = ||x - yn||2 = d
Bây giờ để chứng minh tính duy nhất của ta giả sử có M sao cho:
||x - ||2 = ||x - ||2 = d
Thì dùng tính chất hình bình hành ta được:
0 £ || - ||2 = -4||( - )/2 - x||2 + 2(||- x ||2 + || - x||2) £ -4d + 4d
Suy ra:
=
Nếu M và (x-) M thì là phần tử duy nhất của M được định nghĩa trong phần 1 vì với bất kỳ y M ta có:
||x-y||2 = = || x- ||2 + || -y ||2 ³ || x- ||2
Dấu bằng xảy ra khi và chỉ khi y = .
Ngược lại nếu M và (x-) Ï M thì x không phải là phần tử của M gần x nhất. Thật vậy:
Xét phầ tử = - ay/||y||2.
Với a =
Khi đó ta có:
||x - ||2 =
= ||x - ||2 + || - ||2 + 2
= ||x - ||2 + |a|2/||y||2 -2|a|2/||y||2
=||x - ||2 - |a|2/||y||2 < ||x - ||2
Vậy ||x - ||2 < ||x - ||2
Þ đpcm
2.1.2. Phép xấp xỉ tuyến tính trong L2
Giả sử X1 ,X2 và Y là những biến ngẫu nhiên trong không gian L2, nếu chỉ có thể quan sát được X1, X2 mà ta muốn biết đựoc giá trị của Y bằng cách dùng tổ hợp tuyến tính có dạng = X1 +X2, trong đó ,R sao cho sai sót S dưới đây có trung bình phương đạt giá trị nhỏ nhất, nghĩa là sao cho:
S = E|Y-|2 = E|Y-X1 -X2|2 = || Y-X1 +X2||2 đạt min. Muốn thế ta có thể viết:
S = EY2 + EX12 + EX22 – 2E(YX1) - 2E(YX2) +2E(X1X2)
Lấy đạo hàm riêng của S lần lượt đối với và và cho các đạo hàm đó
triệt tiêu, dẫn đến hệ phương trình cho nghiệm tối ưu và
(2.1.3)
Tuy nhiên có một cách tiếp cận khác, dùng định lí chiếu trong không gian Hilbert L2 cũng đạt được kết quả trên, thật vậy ta đặt vấn đề tìm phần tử trong tập M:
M = {XL2| X = a1x1 +a2x2 với a1, a2 R}
Sao cho “khoảng cách” ||Y - ||2 là nhỏ nhất, nói cách khác, tìm M sao cho ||Y - || = ||X-Y|| như thế theo định lí chiếu trong không gian Hilbert M và thỏa mãn điều kiện trên khi và chỉ khi Y- M và do đó dẫn đến:
=0
Tức là:
Từ tính chất vô hướng đã định nghĩa ở (2.1.2) ta suy ra hệ thức (2.1.3).
2.1.3. Phương trình dự đoán
Cho không gian Hilbert L2, cho một tập con đóng M L2 và một phần tử X L2, khi đó, định lý chiếu trong không gian Hilbert khẳng định rằng tồn tại duy nhất một phần tử M sao cho:
= 0, Y M (2.1.4)
Phương trình (2.1.4) được gọi là phương trình dự đoán và phần tử = PMX là dự đoán tốt nhất của X trong M. Nói khác đi dự đoán tốt nhất của X trong M là chiếu của X trong M.
2.1.4. Quá trình ngẫu nhiên dừng
Khi xét một số hữu hạn các biến ngẫu nhiên ta phải tính ma trận hiệp phương sai để nghiên cứu tính phụ thuộc lẫn nhau của các biến ngẫu nhiên với một chuỗi thời gian {Xt, t T} thì chúng ta cần mở rộng khái niệm ma trận hiệp phương sai đối với một tập vô hạn các biến ngẫu nhiên và muốn thế chúng ta đưa ra các khái niệm hàm tự hiệp phương sai.
Định nghĩa 2.1.4(hàm tự hiệp phương sai)
Nếu {Xt, t T} là một quá trình có Var(Xt) < với mỗi t T thì hàm tự hiệp phương sai của {Xt} được định nghĩa bởi:
= Cov(Xr, Xs) = E[(Xr – Exr) (Xs – Exs)]; r,s T
Định nghĩa 2.1.4 (quá trình ngẫu nhiên dừng)
Chuỗi thời gian {Xt, t Z} được gọi là dừng nếu ba điều kiện duới đây được thỏa mãn:
- E|Xt|2 < , tZ
- Ext = m, tZ
- = t, r, z Z
Chú ý 1:
Quá trình dừng theo nghĩa trên còn được gọi là dừng theo nghĩa rộng. Trong luận văn này nếu không nói gì thêm về quá trình dừng thì ta hiểu dừng theo nghĩa trên.
Chý ý 2:
Dễ thấy rằng nếu {Xt, t T} dừng thì:
, r, z Z
Chính vì vậy với một quá trình dừng thì có thể định nghĩa lại hàm hiệp phương sai bằng cách chỉ định nghĩa thông qua một hàm một biến. Nói khác đi, với quá trình {Xt, t T} dừng thì:
= = Cov(Xt+h, Xt) h,t Z
Hàm số được gọi là hàm tự hiệp phương sai của của {xt} và là giá trị của nó tại trễ h. Hàm tự tương quan của {Xt}, được định nghĩa tại trễ h là:
= Corr(Xt+h, Xt) h,t Z
2.1.5. Dự đoán tuyến tính tối ưu
Cho Xt; t Z là một quá trình dừng có kỳ vọng không và hàm tự hiệp phương sai :
= Cov(Xt+h,Xt) h Z
Ta đặt vấn đề tìm một tổ hợp tuyến tính các X1, X1,, Xn để xấp xỉ tốt nhất Xn+1 hiểu với nghĩa, nếu tổ hợp tuyến tính phải tìm là , nghĩa là = thì E|Xn+1 -|2 đạt min cũng tức là E|Xn+1-| đạt min.
Muốn thế xét tập M: M = {| ,, R}. Dĩ nhiên M là một tập đóng, M L2 hơn nữa việc cực tiểu hóa bình phương chuẩn E| Xn+1 -|2 tương đương với việc cực tiểu hóa bình phương chuẩn || Xn+1 -||2 trong L2 do đó theo định lý chiếu (2.1.1) và theo phương trình dự báo (2.1.4) ta có:
= PMXn+1
Trong trường hợp này phương trình dự báo (2.1.1) cho
= 0 Y M
Và vì Y có dạng Y = nên theo tính tuyến tính của vô hướng ta suy ra:
= 0 ; k = 1, 2, , n
Lại nhớ rằng vô hướng trong L2 = E(XY) ta suy ra
(2.1.5)
Trong đó:
, ,
Định lý chiếu khẳng định phương trình (2.1.5 ) có ít nhất một nghiệm, trường hợp det() = 0 thì có thể có vô số nghiệm nhưng giá trị dự đoán tối ưu luôn duy nhất
2.1.6. Kỳ vọng có điều kiện và dự đoán tốt nhất trong L2
Ở trên chúng ta đã nói, nếu Xn L2 ; X L2 thì Xn X khi và chỉ khi
||Xn- X||2 = E|Xn – X|2 0 khi n .
Dưới đây sẽ nêu một số tính chất hiển nhiên của sự hội tụ trung bình bình phương
Mệnh đề 2.1.6
1, Xn hội tụ theo trung bình bình phương khi và chỉ khi E|Xm- Xn|2 0 khi m,n .
2, nếu Xn X thì khi n . Ta có:
- EXn = = EX
- E|X|2 = = EX2
- E(Xn,Yn) = = E(XY)
Định nghĩa 2.1.6 (dự đoán trung bình phương tốt nhất của Y)
Nếu M là một không gian con đóng của L2 thì dự đoán trung bình bình phương tốt nhất của Y trong M được định nghĩa là phần tử M sao cho:
Định lý chiếu khẳng định sự tồn tại duy nhất của dự đoán bình phương tốt nhất của Y trong M và phần tử đó chính là PMY nói khác đi = PMY
Bây giờ bổ xung thêm một ít cấu trúc của M ta sẽ xây dựng được khái niệm kỳ vọng có điều kiện và khái niệm dự đoán tuyến tính tố nhất:
Định nghĩa 2.1.6(Kỳ vọng có điều kiện EMX)
Nếu M là một không gian con đóng trong L2 và chứa các hàm hằng, nếu X L2 thì ta định nghĩa kỳ vọng có điều kiện của X với M cho trước là phép chiếu:
EMX = PMX
Dùng định nghĩa vô hướng trong L2 và dùng phương trình dự đoán (2.1.4) ta có thể suy ra rằng EMX là phần tử duy nhất của M thỏa mãn:
E(WEMX) = (EWX) W M
Ngoài ra vì toán tử EM là toán tử chiếu trên L2 nên dĩ nhiên EM có tất cả các tính chất của phép chiếu, đặc biệt có:
EM(ax + by) = aEmx + bEmy, a,b R (2.1.6)
EmXn EMX nếu XnX (2.1.7)
Và:
EM1(EM2X) = EM1X nếu M1 = M2 (2.1.8)
Chúng ta cũng lưu ý rằng:
EM1 = 1 (2.1.9)
Và nếu M0 là không gian con đóng của L2 gồm mọi hàm hằng thì dùng phương trình dự đoán suy ra:
EMox = EX (2.1.10)
Định nghĩa 2.1.6(kỳ vọng có điều kiện E(X|Z))
Nếu Z là một biến ngẫu nhiên trên (W, F, P) và X Î L2(W, f, P) thì kỳ vọng có điều kiện của X với Z cho trước được định nghĩa theo hệ thức dưới đây:
E(X|Z) = EM(Z) X (2.1.11)
Trong đó M(Z) là không gian con đóng của L2 gồm mọi biến ngẫu nhiên trong L2 có thể viết dưới dạng một hàm Borel f(Z) nào đó f: R ®R
Toán tử EM(Z) có mọi tính chất từ (2.1.6) đến (2.1.9) ngoài ra:
EM(Z)X ³ 0 nếu X ³ 0;
Có thể mở rộng định nghĩa kỳ vọng có điều kiện E(X| Z) sang trường hợp nếu Z1, Z2, Zn là những biến ngẫu nhiên trong (W, F, P) và X Î L2(W, F P) thì ta định nghĩa:
E(X| Z1, Z2, Zn) = EM(Z1, Z2, Zn) X (2.1.12)
Trong đó M(Z1, Z2, Zn)là không gian con đóng của L2, gồm mọi biến ngẫu nhiên trong L2 có dạng f( Z1, Z2, Zn) với f là một hàm Borel f: Rn ®R khi đó các tính chất của E(X|Z) cũng đúng với E(X| Z1, Z2, Zn).
2.1.7. Kỳ vọng có điều kiện và dự đoán tuyến tính tốt nhất
Theo định lý chiếu, kỳ vọng có điều kiện EM(Z1, Z2, Zn) X là toán tử dự đoán có trung bình phương tốt nhất của X trên M(Z1, Z2, Zn) nghĩa là một hàm số tố nhất của Z1, Z2, Zn để dự đoán X. Tuy nhiên thông thường việc xác định chiếu trên M(Z1, Z2, Zn) rất khó khăn vì bản chất phức tạp của phương trình (2.12)
Mặt khác nếu Z1, Z2, Zn Î L2(W, F, P) thì để tìm chiếu của X trên span{ Z1, Z2, Zn } Í M(Z1, Z2, Zn) và khi đó ta có thể viết:
Pspan{1, Z1,,Zn}X = aiZi ; Z0 = 1 (2.1.13)
Trong đó a0, a1, an thỏa mãn:
= với j = 0,1,2,n
Hay một cách tương đương:
aiE(Zi , Zi) = E(XZi) với j = 0,1,2,,n (2.1.14)
Định lý chiếu đảm bảo (2.1.14) luôn có nghiêm (a0, a1, an) và khi thay bất kỳ một nghiệm nào của (2.1.14) vào (2.1.13) thì cũng cho một phép chiếu và vì thế đó là toán tử dự đoán tuyến tính tốt nhất của Z theo các phần tử 1, Z1, Z2, Zn và cũng là một chiếu của X lên một không gian con của M(Z1, Z2, Zn) nên không thể có trung bình phương của phương sai nhỏ hơn EM(Z1, Z2, Zn) X.
Tuy vậy, phép chiếu đó lại rất quan trọng vì các lý do sau đây:
Phép chiếu đó rễ tính hơn EM(Z1, Z2, Zn) X
Phép chiếu đó chỉ phụ thuộc vào các mô men cập một EX, EZj và cấp hai E(ZiZj) và E(XZj) của phân phối đồng thời của (X, Z1,, Zn) ;
Nếu (X, Z1,, Zn) có phân phối chính quy nhiều chiều thì có thể chứng minh rằng[3]
Pspan{1, Z1,,Zn}X = EM(Z1, Z2, Zn) X
2.2. Qúa trình ARMA
Chương này giới thiệu quá trình tự hồi qui AR (Auto Regressive), quá trình trung bình trượt AM(Moving Average). Và quá trình tổng quát ARMA (Auto Regressive Moving Average).
2.2.1. Quá trình tự hồi quy
Trong quá trình tự hồi quy cấp p (ký hiệu tắt AR(p)), các số liệu của chuỗi thời gian sẽ liên hệ với nhau theo biểu thức:
Xt = a1Xt-1 + a2Xt-2 + + ap Xt-p + Zt (2.2.1)
Trong đó a1, a2,, ap là các hệ số của phương trình còn Zt là ồn trắng WN(0,s2). Ta gọi chuỗi số liệu Xt là tự hồi quy vì giá trị hiện tại của nó được tính truy hồi qua các giá trị Xt-1 ,Xt-2 , ,Xt-p đứng trước nó. Cuối cùng ồn trắng Zt (còn gọi là sai số) biểu thị các yếu tố ngẫu nhiên tham gia vào quá trình mà không thể giải thích được bằng mô hình.
Các giá trị a1, a2,, ap là các hệ số bằng số mô tả môi quan hệ giữa các giá trị thực tại với các giá trị trước nó. Số p được gọi là cấp tự hồi quy của mô hình. Nó chỉ số các giá trị quá khứ cần phải lấy để tính truy hồi.
Giá trị chính xác của p được sử dụng sẽ làm cho sai số dự báo của mô hình là nhỏ nhất và làm cho các số dư có phân phối ngẫu nhiên. Thường thì chúng ta nhận dạng giá trị p như là cấp của quá trình AR(p) bằng cách phân tích hệ số tự tương quan riêng của chuỗi thời gian. Các hệ số tự tương quan riêng a(k) = akk được tính từ phương trình:
Người ta chứng minh được quá trình AR(p) là một quá trình tuyến tính.và hệ số tương quan riêng của quá trình AR(p) thỏa mãn điều kiện a(k) = 0 khi n > p. Từ đó ta có quy tắc sau:
Quy tắc:
Nếu {Xt} là thể hiện của chuỗi thời gian AR(p) thì các hệ số tự tương quan riêng mẫu a(k) chỉ khác không thực sự khi k £ p. Vậy cấp của quá trình hồi quy AR chính là giá trị p ngăn cách các hệ số tự tương quan riêng khác không với các hệ số tự tương quan riêng bằng không.
Tuy vậy mô hình AR là chưa đủ để mô tả chuỗi thời gian. Vì vậy ta cần đề cập đến mô hình các quá trình trung bình trượt sau:
2.2.2. Qúa trình Trung Bình Trượt
Quá trình Xt được gọi là qúa trình trung bình trượt (ký hiệu là MA(q)) nếu nó có dạng:
Xt = et + b1et-1 + + bqet-q (2.2.2)
Trong đó :
q là cấp của mô hình trung bình trượt
et » WN(0,s2)
b1, b2, ,bn là các hệ số chỉ mối liên hệ của các giá trị Xt và các gía trị của nhiễu cho đến thời điểm t.
Phương trình (2.2.2) tương tự như dạng phương trình (2.2.1) chỉ khác ở chỗ là Xt được tính thông qua các giá trị của các nhiễu et, et-1, , et-q đứng trước thời điểm t chứ không phải là các giá trị đứng trước thời điểm t của chuỗi.
Ta có thể tính hàm tự tương quan của Xt như sau:
Vì vậy ta nhận được quy tắc sau:
Quy tắc:
Với một quá trình trung bình trượt thì cấp của nó có thể được xác định bằng cách phân tích các hệ số tự tương quan của quá trình. Thông thường q(cấp của mô hình) sẽ được chọn sao cho các hệ số tương quan từ 1 cho đến q là khác 0 thực sự, còn những số sau đó xấp xỉ 0.
2.2.3. Quá trình tự hồi quy-trung bình trượt ARMA(p,q)
Với hai mô hình đã được xét ở trên đó là mô hình tự hồi quy và mô hình trung bình trượt dường như chúng ta đã có đủ công cụ để phân tích chuỗi thời gian. Tuy vậy khi phân tích chuỗi thời gian đặc biệt là các chuỗi kinh tế người ta thường chú ý hơn tơi mô hình ARMA. Đây là mô hình hỗn hợp của cả hai mô hình đã xét. Dạng của mô hình này là:
Xt = a1Xt-1 + a2Xt-2 + + apxt-p + et + b1et-1 + + bqet-q (2.2.3)
Với et » WN(0,s2)
Trong phương trình (2.2.3) có hai thành phần, trong cách viết người ta thường viết thành phần tự hồi quy lên trước. Quá trình Xt thỏa mãn (2.2.3) gọi là quá trình tự hồi quy cấp p và trung bình trượt cấp q thường được ký hiệu tắt là ARMA(p,q). Như vậy:
Mô hình ARMA(p,0) chính là mô hình tự hồi quy AR(p)
Mô hình ARMA(0,q) chính là mô hình trung bình trượt AM(q).
Từ phương trình (2.2.3) chúng ta thấy rằng mô hình ARMA sử dụng sự kết hợp của các gía trị quá khứ của chuỗi thời gian cùng với các nhiễu ở trong quá khứ nhờ các tham số của hai mô hình tự hồi quy và trung bình trượt. Vì vậy lẽ tự nhiên là nó phải tốt hơn khi sử dụng từng mô hình riêng lẻ.
Lợi thế của mô hình ARMA là chúng ta có thể nghiên cứu lần lượt từng quá trình AR và MA. Trước hết chúng ta xác định mô hình tự hồi quy AR sau đó sử dụng các sại số tính toán được từ mô hình tự hồi quy vào phương trình trung bình trượt MA để cải tiến hơn nữa việc dự báo. Điều đó có nghĩa rằng ta có thể thực hiện một cách tuần tự: trước hết là sử dụng một mô hình AR để tạo ra một dự báo – từ đó cũng tính được các sai số dự báo. Sau đó sử dụng quá trình MA vào các sai số dự báo vừa tính được để giảm bớt các sai số. Bằng cách này ta hi vọng sai số còn lại sẽ phân bổ một cách ngẫu nhiên và mô hình trở nên chính xác hơn.
2.2.4. Quá trình hợp nhất tự hồi quy trung bình trượt
Phần lớn các chuỗi kinh tế giả thiết dừng không còn đúng nữa, khi đó theo sáng kiến của Box và Jenkins người ta xét quá trình Yt = Xt – Xt-1 với hy vọng Yt là môt qúa trình dừng. Trường hợp khi Yt cũng chưa thỏa tính dừng thì lại xét quá trình Zt = Yt – Yt-1 tức là xét:
Zt = (Xt – Xt-1 )– (Xt-1 – Xt-2 ) = Xt – 2Xt-1 – Xt-2 = (1-B)2Xt
Trong đó B là toán tử lùi.
Một cách tổng quát nếu X chưa phải là một quá trình dừng thì người ta xét quá trình (1-B)dXt, trong dó d là một số nguyên không âm với hy vọng quá trình (1-B)dXt sẽ thỏa tính dừng.
Định nghĩa 2.2.4
Quá trình Xt, tÎ Z được gọi là một quá trình hợp nhất tự hồi quy trung bình trượt, ký hiệu Xt ~ ARIMA(p,d,q) nếu qúa trình (1-B)dXt là dừng và thỏa mãn:
a(B)(1-B)dXt = b(B)et tÎ Z.
Trong đó et là một ồn trắng, a(B) lần lượt là các đa thức hồi quy và trung bình trượt bậc p, q tương ứng, d là một số nguyên không âm và được gọi là bậc sai phân.
Chú ý 1:
Nếu đặt Ut = (1 - B)dXt thì hiển nhiên Ut ~ ARMA(p,q)
Chú ý 2:
Trên thực tế người ta thường chọn d ≤ 3; nếu d > 3 mà vẫn chưa thỏa tính dừng thì có thể kết luận quá trình nghiên cứu không phù hợp với quá trình ARMA.
2.3. Nhận dạng mô hình
Mục đích của phần này là từ chuỗi quan sát Xt ={xt| t = 1,2,..,n} xây dựng các công thức, thủ tục để nhận dạng mô hình ARIMA(p,d,q)
A(B)(B-1)dxt = b(B)et
Tức là ước lượng lấy bậc sai phân d của chuỗi, bậc hồi quy p của đa thức hồi quy a(z) và bậc trung bình trượt q của các đa thức trung bình trượt b(z). Cuối cùng ước lượng hệ số a, b của các đa thức đó.
2.3.1. Ý tưởng của việc nhận dạng mô hình
Do toàn bộ hiểu biết của chúng ta về chuỗi thời gian quan tâm Xt, tÎ Z chỉ được gói gọn trong chuỗi quan sát X = {xt| t = 1,2,,n } nên cách tiếp cận hợp lý có lẽ là cách tận dụng các công cụ tính toán, xây dựng các thủ tục đối thoại, các test kiểm tra, tạo nên một chu trình lặp thích hợp để có được một bộ 3 (p,d,q) có thể chấp nhận được. Khi đã có mọi tham số của mô hình thì chuyến sang kiểm tra tính phù hợp của mô hình: nếu mô hình phù hợp thì vòng lặp kết thúc và ta nói rằng đã hoàn tất giai đoạn nhận dạng thô mô hình từ đó có thể chuyển sang ước lượng chính xác các tham số a,b của các đa thức a(z) và b(z). Nếu các test kiểm tra cho ta biết mô hình đã chọn không phù hợp với kết quả quan sát của chuỗi X thì thực hiện vòng lặp để điều chỉnh các tham số p, d, q, a, b đã chọn ở bước trước. Quá trình này có thể được lặp lại nhiều nhưng trong thực tế thường người ta chỉ giới hạn d không vượt quá 3. Nếu đã thực hiện trên ba vòng lặp mà vẫn chưa có được một mô hình phù hợp thì kết luận là chuỗi quan sát không phù hợp với mô hình ARIMA.
Bắt đầu
Xử lý thô
Ước lượng thô
Kiểm tra sự phù hợp
2.3.2. Dừng hay không dừng
Giả thiết dừng là giả thiết bản chất trong việc khảo sát các quá trình ARMA; như ta đã biết, một quá trình Xt, t Î Z được gọi là dừng theo nghĩa rộng (được sử dụng trong luận văn này) là một quá trình có kỳ vọng, phương sai là hằng và có tự hiệp phương sai không phụ thuộc vào thời điểm khảo sát cụ thể mà chỉ phụ thuộc vào khoảng cách giữa hai thời điểm, nghĩa là:
EXt = m
VarXt = s2
Cov(Xt, Xt+k) = g(k) (chỉ phụ thuộc vào k)
Tuy các công thức trên là đơn giản và rõ ràng nhưng rất tiếc trên thực tế chúng ta chỉ có thông tin về quá trình Xt, t Î Z qua chuỗi quan sát X = {xt| t = 1,2,,n } vì thế nếu cứ dùng nguyên xi các đặc trưng mẫu (trung bình mẫu, tự hiệp phương sai mẫu,) thì khó có thể kết luận nghiêm túc về tính dừng hay không dừng của Xt. Để khắc phục khó khăn đó, Box và Jenkins đã nhận xét đúng đắn rằng quá trình đã lấy sai phân Yt = (1-B)dxt có nhiều khả năng dừng hơn bản thân quá trình Xt, do đó đã đề nghị xét quá trình Yt là quá trình dừng, dù rằng quá trình nguyên thủy Xt có thể không dừng. Bây giờ bằng cách viết Y1 = X1 – X0; Yt = Xt – Xt-1 và cộng vế với vế ta suy ra:
Xt = X0 + Yj ; tÎ Z (2.3.1)
Mặt khác ta có :
Ck = n-1(Xj - )(Xj+k - ) (2.3.2)
Từ biểu diễn (2.3.1) tự hiệp phương sai mẫu của Yt là:
= n-1ytyt-k
= n-1(xt – xt-1)(xt – xt+k-1)
= n-1{[(xt - ) – (xt-1 - )][(xt+k - ) – (xt+k-1 - )]}
= n-1{(xt - ) (xt+k - ) + ((xt-1 - )(xt+k-1 - ))
– (xt - ) (xt+k-1 - ) - (xt-1 - )(xt+k-1 - )}
Và từ (2.3.2) suy ra :
n-1ytyt-k =2 Ck – Ck-1 – Ck+1 (2.3.3)
Người ta đã chứng minh được nếu quá trình Yt dừng thì các tự hiệp phương sai g(k) ® 0 khi k ®µ, do vậy biểu thức ở vế trái của (2.3.3) dần tới 0 khi k ®µ; nói khác đi, với k tương đối lớn, thường là k từ 10 trở đi, ta có biểu thức xấp xỉ:
2Ck » Ck-1 + Ck+1 (2.3.4)
Từ (2.3.4) ta suy ra rằng nếu quá trình Yt dừng thì các tự hiệp phương sai mẫu và do đó các tự tương quan mẫu rk (của quá trình nguyên thủy Xt) không triệt tiêu nhanh chóng với những k lớn. Đó chính là dấu hiệu để từ chuỗi quan sát c nếu các tự tương quan mẫu rk triệt tiêu nhanh chóng với k khá lớn thì gợi ý rằng cần phải lấy sai phân, xét quá trình Xt – Xt-1 tức là lấy d = 1 để hy vọng có một quá trình mới gần với quá trình dừng hơn. Có thể tiếp tục thủ tục này nhưng nói chung, d £ 3, nếu d = 3 mà vẫn chưa có một quá trình dừng thì kết luận là quá trình nguyên thủy Xt không phù hợp với mô hình ARMA. Phát triển ý tưởng của Box-Jenkins, Dickey-Fuller và Miller đề nghị xây dựng mô hình hồi quy:
Yt = axt-1 + b1Yt-1 + b2Yt-2 + + bpyt-p
Và thường chọn p = 3. Khi đó nếu cần phải lấy sai phân (tức là chọn d = 1) chuỗi nguyên thủy Xt thì hệ số a tìm được phải rất gần không còn nếu bản thân Xt đã là một quá trình dừng thì a thường lấy giá trị âm.
2.3.3. Ước lượng cấp của mô hình
Chúng ta có thể nhận dạng mô hình dựa trên quy tắc sau:
Nếu Yt ~ AR(p) thì dãy các tự tương quan giảm nhanh theo quy luật mũ hoặc sin còn dãy các tự tương quan riêng bằng 0 với mọi k > p.
Nếu Yt ~ MA(q) thì dãy các tự tương quan bằng 0 với mọi k > q và dãy các tự tương quan riêng giảm nhanh theo quy luật mũ hoặc sin.
Nếu Yt ~ ARMA(q,q) thì dãy các tự tương quan giảm nhanh theo quy luật mũ sau trễ (q - p) nếu (q > p) và dãy các tự tương quan riêng giảm nhanh theo quy luật mũ hoặc sin sau trễ thứ (p –q ) nếu p >q.
Dẫu vậy thì cho đến ngày hôm nay vẫn chưa có một thuật toán nào tỏ ra hiệu quả trong việc nhận dạng cấp của mô hình. Việc xác định các tham số p, q đôi khi đòi hỏi sự đánh giá của các chuyên gia nhiều kinh nghiệm. Trong luận văn này, dựa vào những kết quả thu được từ việc phân tích, tìm hiểu chuỗi thời gian tôi đã xây dựng một chương trình đối thoại cho phép chúng ta có một cái nhìn trực quan hơn trong việc đánh giá, ước lượng các tham số của mô hình. Mỗi khi lựa chon bậc sai phần và các tham sô của mô hình. Chương trình sẽ tính toán ước lượng các tham số a, b theo mô hình đã lựa chọn và thực hiện các tính toán kiểm tra mô hình. Việc quyết định lựa chọn mô hình nào có thể hoàn toàn do sự đánh giá chuyên gia.
2.3.4. Ước lượng thô tham số cho mô hình ARMA
Đối với mô hình AR ta có thể dùng phương pháp bình phương tối thiểu để xác định các tham số của quá trình này. Tuy nhiên nếu áp dụng trực tiếp phương pháp này cho quá trình ARMA thì sẽ gặp khó khăn bởi vì ta hồi quy Xt không chỉ theo Xt-1, Xt-2, Xt-p mà còn theo cả nhiễu không quan sát được et-1, et-2,, et-q, để khắc phục nhược điểm này chúng ta tiến hành một thủ tục nhận dạng như sau:
Bước 1: chọn m > max{p,q} rồi xem chuỗi thời gian là quá trình AR(m). Sử dụng phương pháp bình phương tối thiểu để ước lượng các tham số am,1,am,2,,am,m. Sau đó sử dụng các tham số này để tính các sai số:
et = Xt – am,1Xt-1 - am,2Xt-2 - - am,mxt-m
Với t = m + 1, m + 2, , n.
Bước 2:
Sau khi đã tính được et từ bước 1 ta tìm vectơ b = (at, bt)làm cực tiểu tổng
S(b) = ( Xt – a1Xt-1 – a2Xt-2 - - apxt-m – bt-1et-1 – bt-2et-2 - - bqet)2
Từ đây ta có thể tính được b bằng cách giải hệ phương trình Gauss-Markov:
b = (ztz)-1ztxn
Trong đó Z là ma trận cấp (n – m - q)x(p + q)
Z=
Ước lượng trên cho phương sai của ồn trắng là:
s2 =
Người ta chứng minh được rằng nếu cỡ mẫu của chuỗi thời gian ARMA(p,q) khá lớn thì:
b » N(b, n-1V(b)) .
Trong đó V(b) là phương sai của b.
2.3.5. Kiểm tra sự phù hợp của mô hình.
Bây giờ giả sử đã ước lượng được p, q và các tham số a,b để phân biệt ta ký hiệu , là các giá trị ước lượng thô của các tham sô a, b; nghĩa là từ c
Các file đính kèm theo tài liệu này:
- ly thuyet.doc
- Nguyen Lua_CT801.ppt