MỤC LỤC
Trang
LỜI MỞ ĐẦU 1
Chương 1: Lý luận chung dự đoán thống kê. 2
I- Dự đoán thống kê và ý nghĩa của dự đoán thống kê: 2
1. Dự đoán thống kê: 2
1.1. Dự đoán và phương pháp dự đoán: 2
1.2. Dự đoán thống kê: 3
2. Ý nghĩa thực tiễn: 4
II- Các phương pháp dự đoán thống kê: 5
1. Dự đoán dựa vào lượng tăng (hoặc giảm) tuyệt đối bình quân: 5
2.Dự đoán dựa vào tốc độ phát triển bình quân: 6
3. Dự đoán dựa vào ngoại suy hàm xu thế: 7
4. Dự đoán dựa vào hàm xu thế và biến động thời vụ : 11
4.1 Dự đoán dựa vào hàm xu thế kết hợp cộng với biến động thời vụ : 12
4.2 Dự đoán dựa vào hàm xu thế kết hợp nhân với biến động thời vụ : 13
5. Dự đoán theo phương pháp san bằng mũ: 14
5.1 Mô hình đơn giản: 15
5.2 Mô hình xu thế tuyến tính và không có biến động thời vụ: 16
5.3 Mô hình xu thế tuyến tính và biến động thời vụ : 17
6. Dự đoán bằng mô hình tuyến tính ngẫu nhiên(phương pháp Box-Jenkins): 18
6.1. Một số mô hình tuyến tính ngẫu nhiên : 18
6.1.1 Một số khái niệm khái quát về quá trình ngẫu nhiên: 18
6.1.2. Một số mô hình tuyến tính không dừng: 21
6.2. Phương pháp Box-Jenkins: 22
Chương 2: Vận dụng một số phương pháp dự đoán để dự đoán GDP Việt Nam đến năm 2010. 27
I. Nguồn số liệu: 27
II- Vận dụng một số phương pháp dự đoán GDP Việt Nam đến năm 2010: 27
1. Dự đoán dựa vào tốc độ tăng ( hoặc giảm) tuyệt đối bình quân: 28
2. Dự đoán dựa vào tốc độ phát triển bình quân: 29
3. Dự đoán dựa vào hàm xu thế: 31
3.1. Hàm xu thế tuyến tính: 32
3.2. Hàm xu thế parabol: 33
3.3. Hàm xu thế là hàm bậc 3: 35
3.4. Hàm xu thế dạng hàm mũ: 36
4. Dự đoán theo phương pháp san bằng mũ: 38
4.1. Mô hình xu thế tuyến tính và không có biến động thời vụ. 38
4.2. Mô hình tuyến tính không dừng. 39
Chương III: Nhận xét và kiến nghị 42
1. Xem xét trong các phương pháp và mô hình trên mô hình và phương pháp nào có thể mang lại dự đoán kết quả chính xác nhất, tốt nhất. 42
2. Kiến nghị. 42
KẾT LUẬN 44
Danh mục tài liệu tham khảo 45
47 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2232 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Đề án Dự đoán GDP của Việt Nam đến năm 2010, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
dãy số.
k: hệ số của hàm xu thế.
Bước 2: Đi tìm giá trị cụ thể của các hệ số hàm xu thế( , i= 0,1,2,….). Dùng phương pháp bình phương nhỏ nhất : SSE = = min
Một số dạng hàm xu thế thường sử dụng:
Hàm xu thế tuyến tính:
Hàm xu thế tuyến tính được sử dụng khi các lượng tăng(hoặc giảm) tuyệt đối liên hoàn xấp xỉ nhau.
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị của các hệ số và :
Hoặc có thể tính và theo các công thức sau đây:
Đồ thị biểu diễn phương trình đường thẳng ( ) có dạng:
y
t
0
b1 > 0
y
0
b1 < 0
t
Hàm xu thế parabol :
Hàm xu thế parabol được sử dụng trong trường hợp của dãy số tăng dần theo thời gian, đạt cực đại, sau đó lại giảm dần theo thời gian; hoặc giảm dần theo thời gian, đạt cực tiểu, sau đó lại tăng dần theo thời gian. Dạng tổng quát của hàm xu thế parabol như sau:
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị của các hệ số , và :
+
+
Đồ thị biểu diễn phương trình đường bậc 2 () có dạng:
0
t
y
y
0
t
Hàm bậc 3:
= b0 + b1t + b2t2 + b3t3
Các tham số b0, b1, b2 và b3 của phương trình bậc ba được xác định theo hệ phương trình chuẩn tắc sau:
Đồ thị biểu diễn phương trình đường bậc ba có dạng:
y
0
t
0
t
y
Hàm xu thế hàm mũ:
Hàm xu thế hàm mũ được sử dụng khi các tốc độ phát triển liên hoàn xấp xỉ nhau
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hẹ phương trình sau đây để tìm giá trị của các hệ số , :
Giải hệ phương trình trên sẽ được ln, ; tra đối ln sẽ được , .
Để xác định đúng đắn dạng cụ thể của hàm xu thế, đòi hỏi phải phân tích đặc điểm biến động của hiện tượng qua thời gian, dựa vào đồ thị và một số tiêu chuẩn khác như sai số chuẩn của mô hình- ký hiệu SE:
SE=
Đồ thị biểu diễn phương trình hàm số mũ có dạng:
y
0
t
Hàm xu thế hyperbol:
Hàm xu thế hyperbol được sử dụng khi các mức độ của hiện tượng giảm dần theo thời gian. Dạng tổng quát của hàm xu thế hyperbol như sau:
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị của các hệ số , :
Nếu trên đồ thị biểu hiện các mức độ thực tế của hiện tượng qua thời gian có thể xây dựng một số hàm xu thế thì chọn hàm xu thế nào có sai số chuẩn của mô hình nhỏ nhất.
4. Dự đoán dựa vào hàm xu thế và biến động thời vụ :
Biến động thời vụ là sự biến động của hiện tượng có tính chất lặp đi lặp lại trong từng thời gian nhất định của năm. Ví dụ: Sản xuất nông nghiệp phụ thuộc vào thời xụ. Trong các nghành khác như công nghiệp, giao thông vận tải, xây dựng, du lịch, dịch vụ .v.v...ít nhiều có biến động thời vụ.
Nguyên nhân gây ra biến động thời vụ là do ảnh hưởng của điều kiện tự nhiên và phong tục, tập quán sinh hoạt.
Biến động thời vụ làm cho hiện tượng lúc thì mở rộng, khẩn trương, khi thì thu hẹp, nhàn rỗi.
Nghiên cứu biến động thời vụ nhằm đề ra những biện pháp phù hợp, kịp thời hạn chế ảnh hưởng của biến động thời vụ đối với sản xuất và sinh hoạt của xã hội.
Phương pháp thường được sử dụng để biểu hiện biến động thời vụ là tính các chỉ số thời vụ. Tài liệu được sử dụng để tính các chỉ số thời vụ thường là tài liệu hàng tháng hoặc hàng quý của ít nhất ba năm.
Các mức độ của dãy số thời gian có thể được phân chia ra ba thành phần sau:
Xu thế, ký hiệu , phản ánh xu hướng phát triển cơ bản của hiện tượng kéo dài theo thời gian.
Thời vụ, ký hiệu , sự biến động có tính chất lặp đi lặp lại trong những khoảng thời gian nhất định của năm.
Ngẫu nhiên, ký hiệu , sự biến động do các yếu tố ngẫu nhiên xảy ra ở những thời gian khác nhau.
Ba thành phần trên có thể kết hợp được với nhau theo một trong hai dạng sau đây:
Kết hợp cộng:
Kết hợp nhân:
4.1 Dự đoán dựa vào hàm xu thế kết hợp cộng với biến động thời vụ :
Trường hợp đơn giản được giả thiết rằng xu thế là hàm tuyến tính:
( với t= 1,2,3,…. Là thứ tự thời gian trong dãy số)
Khi đó việc xác định xu thế và biến động thời vụ được dựa vào bảng Buys_Ballot.
Quý (j)
Năm (i)
1
2
….
j
…
m
Tổng năm Ti
i
1
2
3
…
i
…
n
T1
T2
T3
…
Ti
Tn
T1
2T2
3T3
…
iTi…
nTn
Tổng chung
T=
S=
Trong đó: Ti =
Chú ý: kết hợp cộng đơn vị tính là của yt
- Tìm b0, b1:
st với j=1,2,3,4.
Từ đó có thể dự đoán được các mức độ dựa vào hàm xu thế kết hợp cộng với biến động thời vụ.
Mô hình dự đoán:
4.2 Dự đoán dựa vào hàm xu thế kết hợp nhân với biến động thời vụ :
Để phân tích các thành phàn của dãy số thời gian yt theo kết hợp nhân, trước hết cần loại trừ thành phần thời vụ và thành phần ngẫu nhiên bằng cách xây dựng dãy số bình quân trượt , tính .
Từ đó, xác định thành phần thời vụ bằng cách tính số bình quân . Sau đó, tính hệ số hiệu chỉnh H: H=
- Với m= 4 đối với tài liệu quý, m= 12 đối với tài liệu tháng.
Từ đó tính:
- Sau khi đã xác định được st thì xác định dãy số y’t là dãy số đã loại bỏ thành phần thời vụ như sau: y’t=. Từ dãy số y’t đi xây dựng hàm xu thế.
-Từ đó có mô hình dự đoán là:
Trên đây đã trình bày các thành phần dãy số theo kết hợp cộng và kết hợp nhân. Vấn đề đặt ra là : Đối với dãy số thời gian như thế nào thì phân tích theo kết hợp cộng hoặc kết hợp nhân? Nhiều sự nghiên cứu cho thấy : nếu đồ thị biểu hiện sự biến động của hiện tượng qua thời gian có biên độ giao động thay đổi ít thì có thể phân tích theo kết hợp cộng, nếu có biên độ dao động thay đổi nhiều thì có thể phân tích theo kết hợp nhân.
5. Dự đoán theo phương pháp san bằng mũ:
Ở phần trên đã đề cập tới một số phương pháp dự đoán thống kê mà khi xây dựng các mô hình dự đoán thì các mức độ của dãy số thời gian được xem là như nhau, nghĩa là có cùng quyền số trong khi xây dựng mô hình.
Nhưng ở những thời gian khác nhau thì hiện tượng nghiên cứu chịu sự tác động của những nhân tố khác nhau và cường độ không giống nhau. Có những nhân tố mất đi và có những nhân tố mới xuất hiện; có những nhân tố yếu đi và cũng có nhân tố mạnh lên.
Vì vậy, để phản ánh sự biến động này, đòi hỏi khi xây dựng mô hình dự đoán các mức độ của dãy số thời gian phải được chú ý một cách khác nhau. Các mức độ càng mới( ở cuối dãy số thời gian) càng cần phải được chú ý nhiều hơn so với các mức độ càng cũ ( ở đầu dãy số). Như vậy mô hình dự đoán có khả năng thích nghi với sự biến động của hiện tượng qua thời gian. Một trong những phương pháp để xây dựng mô hình dự đoán như vậy là phương pháp san bằng mũ. Sau đây sẽ đề cập đến một số mô hình san bằng mũ.
5.1 Mô hình đơn giản:
Mô hình giản đơn được sử dụng đối với dãy số thời gian không có xu thế và không có biến động thời vụ rõ rệt. Giả sử ở thời gian t, có mức độ thực tế là yt và mức độ dự đoán là . Mức độ dự đoán của hiện tượng ở thời gian t+1 có thể viết
(1)
Đặt (1-= ta có:
(2)
được gọi là các tham số san bằng với và nhận giá trị trong khoảng [0;1]. Như vậy, mức độ dự đoán là trung bình cộng gia quyền của yt và .
Mức độ dự đoán của hiện tượng ở thời gian t là:
, thay vào (2) ta có:
Bằng cách này tiếp tục thay các mức độ dự đoán … vào công thức trên, sẽ có:
(3)
Vì <1 nên khi i thì và 1
Khi đó:
Như vậy: Mức độ dự đoán là tổng tất cả các mức độ của dãy số thời gian được tính theo quyền số mà trong đó các quyền số giảm dần theo dạng mũ tùy thuộc vào mức độ cũ của dãy số. Cũng chính vì vậy mà phương pháp này được gọi là phương pháp san bằng mũ.
Công thức (1) có thể viết:
Nếu đặt là sai số dự đoán ở thời gian t thì:
Từ các công thức trên cho ta thấy có hai vấn đề quan trọng trong phương pháp sang bằng mũ.
Thứ nhất, là việc lựa chọn , được ràng buộc với điều kiện 0và . Nếu được chọn càng lớn thì các mức độ càng mới sẽ càng được chú ý, ngược lại nếu được chọn càng nhỏ thì các mức độ cũ được chú ý một cáh thỏa đáng. Do đó, để lựa chọn đòi hỏi phải dựa vào đặc điểm biến động của hiện tượng qua thời gian và kinh nghiệm nghiên cứu. Nói chung giá trị tốt nhất là giá trị làm cho tổng bình phương sai số dự đoán nhỏ nhất.
Thứ hai, là san bằng mũ được thực hiện theo phép đệ quy, tức là để tính thù phải có , để có thì phải có …Do đó để tính toán cần phải xác định giá trị ban đầu ( điều kiện ban đầu)- ký hiệu yo. Có nhiều phương pháp khác nhau để xác định giá trị ban đầu như có thể lấy mức độ đầu tiên của dãy số, hoặc số trung bình của một số các mức độ đầu tiên của dãy số, …
Trên đây đã trình bày nội dung của phương pháp dự đoán bằng san bằng mũ với mô hình đơn giản. Mô hình này có thể viết:
Với a0(t)=
5.2 Mô hình xu thế tuyến tính và không có biến động thời vụ:
Trong trường hợp biến động của hiện tượng qua thời gian cso xu thế là tuyến tính và không có biến động thời vụ để dự đoán, ta sử dụng mô hình sau:
Trong đó:
là các tham số san bằng và nhận giá trị trong khoảng [0; 1]. Giá trị được chọn tốt nhất là các giá trị làm cho tổng bình phương của sai số dự đoán là bé nhất. Việc lựa chọn các giá trị ban đầu có thể được tiến hành như sau:
(0) có thể là mức độ đầu tiên trong dãy số.
(0) có thể là lượng tăng ( giảm) tuyệt đối trung bình.
(0) =
5.3 Mô hình xu thế tuyến tính và biến động thời vụ :
Mô hình này được sử dụng đối với dãy số thời gian mà các mức độ của nó là tài liệu tháng hoặc quý của một số năm- tức là sau một khoảng thời gian k( với k=4, đối với tài liệu quý, k=12 đối với tài liệu năm). Việc dự đoán có thể được thực hiện theo một trong hai mô hình sau đây:
+ Mô hình cộng:
Trong đó:
+ Mô hình nhân:
Trong đó:
Với là các tham số nhận giá trị trong khoảng [0;1]
Dự đoán bằng phương pháp san bằng mũ sẽ trở nên thuận tiện hơn khi sử dụng chương trình SPSS. Trong chương trình này sẽ cho phép lựa chọn các tham số san bằng, các giá trị ban đầu một cách tốt nhất và việc thực hiện dự đoán một cách thuận tiện.
6. Dự đoán bằng mô hình tuyến tính ngẫu nhiên(phương pháp Box-Jenkins):
Trong phương pháp này, dãy số thời gian xem như được sinh ra từ một quá trình ngẫu nhiên. Trên cơ sở đó, một số mô hình quan trọng được xây dựng tiến hành dự đoán.
6.1. Một số mô hình tuyến tính ngẫu nhiên :
6.1.1 Một số khái niệm khái quát về quá trình ngẫu nhiên:
+ Quá trình ngẫu nhiên : là một tập hợp các giá trị của biến ngẫu nhiên xuất hiện qua thời gian và tuân theo một quy luật phân phối xác suất nào đó.
+Quá trình ngẫu nhiên dừng: một quá trình ngẫu nghiên zt được gọi là dừng nếu như quy luật phân phối xác suất của cũng đồng thời là quy luật phân phối xác suất .
Trong quá trình ngẫu nhiên dừng không có xu thế và không có biến động thời vụ (k: độ trễ)
Kỳ vọng của quá trình dừng : E(Yt)=
Tự hiệp phương sai giữa zt và zt-k
Tự tương quan giữa zt , zt-k
với k=0,1,2…; và -1
là hàm số đối với các giá trị của k.
Gọi là : - Hàm tự hiệp phương sai
- Hàm tự tương quan.
- Trong thực tế có dãy số thời gian Yt, do đó sẽ được ước lượng qua ck và rk
Với
b với
Với
+ Các toán tử được dùng để xác định mô hình:
Toán tử lùi: kí hiệu: B
BYt= Yt-1
Toán tử sai phân: kí hiệu :
Sai phân bậc 1 của Yt :
Sai phân bậc d của Yt:
Quá trình tự hồi qui:
Dãy {Yt} được gọi là tuân theo quá trình tự hồi qui bậc p. Ký hiệu AR(p) nếu:
Trong đó:
là các tham số.
at là một quá trình đặc biệt đơn giản và được gọi là quá trình thuần khiết hay tạp âm trắng với:
E[at]= 0
Var[at]=
Cov[at,at-k] = 0
Biểu diễn qua toán tử B:
Hay:
Hàm tự tương quan:
Với k
Một vài quá trình AR đơn giản:
Quá trình bậc 1: AR(1)
Hàm tương tự quan:
Quá trình bậc 1: AR(2)
Hàm tự tương quan:
Với :
Quá trình bình quân trượt :
Dãy {Yt} được gọi là tuân theo quá trình bình quân trượt bậc q. Ký hiệu MA(q) nếu:
Trong đó: là các tham số.
Biểu diễn qua toán tử B:
Hay
Hàm tự tương quan :
Với
Một vài quá trình MA đơn giản :
Quá trình bậc 1: MA (1)
Hàm tự tương quan :
Với
Quá trình bậc 2: MA(2)
Hàm tự tương quan:
=0 với k
Quá trình tự hồi qui trung bình trượt bậc p,q. Ký hiệu ARMA(p,q)
Đó là sự kết hợp giữa AR(p) và MA(q) :
Hay
Hàm tự tương quan:
với k q+1
Trong thực tế, quá trình ARMA(1,1) thường được sử dụng:
6.1.2. Một số mô hình tuyến tính không dừng:
Mô hình tổng hợp tự hồi quy- bình quân trượt :
Trong thực tế, phần lớn các quá trình ngẫu nhiên là không dừng, để thích ứng với các quá trình ngẫu dừng thì cần phải chuyển quá trình không dừng thành quá trình dừng bằng cách sử dụng toán tử sai phân .
Từ quá trình ARMA(p,q) nếu thay Yt bằng ta sẽ có :
=
Quá trình bình quân trên được gọi là quá trình tổng hợp tự hồi qui- bình quân trượt. Ký hiệu ARIMA(p,d,q) trong đó:
p là bậc của tóan tử tự hồi qui;
d là bậc của toán tử sai phân;
q là bậc của toán tử bình quân trượt;
Một số mô hình ARIMA thường được sử dụng:
ARIMA(0,1,1):
ARIMA(0,2,2):
ARIMA(1,1,1):
Mô hình biến động thời vụ:
Trong thự tế, nhiều dãy số thời gian mà các mức độ của nó được lặp lại sau khoảng thời gian k (ví dụ : k= 12 đối với tài liệu tháng, k=4 đối với tài liệu quý). Khi đó phải khử biến động thời vụ bằng toán tử ( 1- rồi mới áp dụng các mô hình đã trình bày ở trên.
Mô hình biến động thời vụ ký hiệu là SARIMA(p,d,q)
Để đưa Yt về dãy dừng cần:
- Khử biến động thời vụ : dùng toán tử tử ( 1-
- Khử xu thế mà sử dụng toán tử sai phân. (Với d=1 xu thế tuyến tính; d=2 xu thế bậc 2; d=3 xu thế bậc 3)
Ví dụ : Xây dựng mô hình SARIMA(1,1,1) cho Yt trên cơ sở ARIMA(1,1,1) và ARMA(1,1)
6.2. Phương pháp Box-Jenkins:
E.R.Box và G.M.Jenkín đã đề ra phương pháp dự đoán dựa vào mô hình ngẫu nhiên mà nội dung gồm bốn bước chính sau đây:
Bước 1: Đi tìm mô hình ARIMA nó phù hợp với dãy số thời gian được nghiên cứu.
Bước này cho phép nhận biết trong họ tất cả các mô hình ARIMA thì mô hình nào có khả năng thích hợp nhất với dãy số thời gian được nghiên cứu.
Trong thực tế, nhiều dãy số thời gian có biến động thời vụ và xu thế . Do đó, phải khử biến động thời cụ và bậc của xu thế. Toán tử ( 1- được sử dụng để khử biến động thời vụ , toán tử ( d=1 đối với xu thế tuyến tính, d=2 đối với xu thế parabol…) được sử dụng để khử xu thế.
Sau khi đã khử biến động thời vụ và xu thế , dãy số thời gian trở thành dãy số dừng. Từ đó, đi xác định bậc p,q của mô hình ARMA có thể dựa vào đồ thị của hàm tự tương quan và hàm tự tương quan riêng phần:
Nếu đồ thị của hàm tự tương quan giảm từ từ và đồ thị của hàm tự tương quan riêng phần có p giá trị đầu tiên khác 0(p=3 là lớn nhất) thì có thể có một AR(p)
Nếu đồ thị của hàm tự tương quan chỉ có q giá trị đầu tiên khác 0( q=3 là lớn nhất ) và đồ thị của hàm tự tương quan riêng phần giảm từ từ thì có thể có một MA(q)
Nếu đồ thị của hàm tự tương quan và hàm tự tương quan riêng phần không có sự cắt ngắn như hai trường hợp trên thì sẽ có một ARMA.
Về phương diện thực hành, nếu áp dụng phần mềm thống kê, ví dụ SPSS, ta có thể cho p,q những giá trị khác nhau . Mô hình ARMA được lựa chọn để dự đoán là mô hình có sai số nhỏ nhất.
Bước 2: Ước lượng các tham số của mô hình:
Việc ước lượng các tham số của mô hình có thể được tiến hành bằng những phương pháp khác nhau. Phương pháp tương đối đơn giản là dựa vào hàm tự tương quan bằng cách thay bằng rk. Ví dụ:
Đối với AR: Nếu gọi là ước lượng của ta sẽ có :
Với AR(1) : vùng cho phép
Với AR(2):
Vùng cho phép:
Đối với MA: Nếu gọi là ước lượng của ,sẽ có :
Với MA(1) : vùng cho phép -1<
Với MA(2):
Vùng cho phép : :
Đối với ARMA(1,1):
Vùng cho phép :
Việc ước lượng các tham số như trên là ước lượng sơ bộ. Trên cơ sở đó, bằng phương pháp lặp- tức là cho hoặc những giá trị lhác nhau trong vùng cho phép, từ đó đi đến ước lượng tốt nhất, đó là giá trị của các tham số của mô hình làm cho sai số của mô hình đạt cực tiểu.
6.2.3. Bước 3: Kiểm tra xem mô hình có thích hợp không:
Sau khi các tham số của mô hình đã được xác định, cần kiểm tra xem mô hình có được chấp nhận hay không?
+ Các tham số của mô hình phải khác 0 . Nếu có tham số nào khổng thỏa mãn thì loại khỏi mô hình.
+ Phân tích phần dư là ước lượng của at.
Trung bình cộng triệt tiêu, trong trường hợp ngược lại thì nên thêm mọt hằng số vào mô hình. Việc thêm hằng số không ảnh hưởng đến tính chất ngẫu nhiên của quá trình.
Các phần dư là một tạp âm trắng. Có thể dùng tiêu chuẩn sau đây để kiểm định :
Q=n
Với là tự tương quan bậc k của các phần dư.
Q tuân theo gần như một phân phối với bậc tự do (k-p-q). Với mức ý nghĩa kiểm định , tra bảng . Nếu Q thì giả thiết H0 bị bác bỏ và như vậy mô hình được lựa chọn là không thích hợp, khi đó phải trở lại bước một.
Bước 4 : Dự đoán và nghiên cứu:
Nếu mô hình được chọn là thích hợp thì dựa vào nó để tiến hành dự đoán.
Gọi
Tức là dự đoán là kỳ vọng các mức độ đã biết.
Ví dụ : Có dãy số thời gian Yt(với t=1,2,…., T) là số liệu của T năm. Giả sử tồn tại xu thế tuyến tính và mô hình thích hợp là ARIMA(1,1,1):
Hay :
Ở thời gian t= T+1 thì mô hình ARIMA(1,1,1) sẽ là:
Lấy kỳ vọng hai vế, sẽ được :
Hay:
Các kỳ vọng ở hai vế phải được tính theo nguyên tắc sau đây:
[YT-j]=YT-j với j=0,1,2,…., (T-1)
Các mức độ của YT-j đến thời gian T đã biết. Đó chính là các mức độ của dãy số thời gian Yt
[YT+j]=với j=1.2.3…
Tức là các mức độ YT+j chưa biết sẽ được thay bằng các giá trị dự đoán
[aT-j]=aT-j= YT-j với j=1,2,3…., (T-1)
[aT+j]=0 với j =1,2….
Theo nguyên tắc trên,sẽ có:
Với l=1:
Với l=2:
v.v…
Nhiều sự nghiên cứ đã khẳng định rằng phương pháp dự đoán dựa vòa mô hình tuyến tính ngẫu nhiên cho kết quả với mức chính xác cao. Đây là phương pháp rất tổng quát. Để vận dụng phương pháp này có hiệu quả, đòi hỏi phải sử dụng các chương trình tính toán, ví dụ chương trình SPSS.
Trên đây đã trình bày một số phương pháp chủ yếu thường được sử dụng trong dự đoán thống kê. Tùy thuộc vào trình độ của cán bộ mà sử dụng các phương pháp đó. Nói chung, phương pháp nào đòi hỏi khối lượng tính toán càng lớn( và cần thiết phải sử dụng máy tính) thì thường cho kết quả dự đoán tốt hơn.
Chương 2: Vận dụng một số phương pháp dự đoán để dự đoán GDP Việt Nam đến năm 2010.
I. Nguồn số liệu:
Năm
1990
1991
1992
1993
1994
1995
1996
1997
1998
GDP(tỉ đồng)
131968
139634
151782
164043
178534
195567
213833
231264
244596
Năm
1999
2000
2001
2002
2003
2004
2005
2006
GDP(tỉ đồng)
256272
273666
292535
313247
336242
362435
393031
425135
Nguồn số liệu lấy từ trang web của tổng cục thống kê ( trong mục số liệu thống kê của phần tài khoản quốc gia. Hoặc là lấy từ niên giám thống kê năm 2006 của tổng cục thống kê Việt Nam.
Nguồn số liệu theo năm vì vậy có những đặc điểm như sau:
Không có biến động thời vụ.
Có biến động thành phần ngẫu nhiên
Có xu thế.
II- Vận dụng một số phương pháp dự đoán GDP Việt Nam đến năm 2010:
Lựa chọn phương pháp dự đoán:
Không thể sử dụng các phương pháp dự đoán có biến động thời vụ như:
Dự đoán dựa vào hàm xu thế có biến động thời vụ.
Mô hình san bằng mũ giản đơn( simple). Vì áp dụng cho những dãy số không có xu thế, không có biến động thời vụ.
Mô hình tuyến tính ngẫu nhiên có biến động thời vụ.
Các mô hình được lựa chọn:
Mô hình dự đoán dựa vào lượng tăng giảm tuyệt đối bình quân.
Mô hình dự đoán dựa vào tốc độ phát triển bình quân.
- Mô hình dự đoán dựa vào hàm xu thế.
Mô hình san bằng mũ có xu thế và không có biến động thời vụ (phương pháp Holt)
Mô hình tuyến tính không dừng.
Tiêu chuẩn để lựa chọn mô hình là SE min hoặc SSE min
Kết hợp với hệ số xác định R gần 1 nhất sẽ được lựa chọn.
1. Dự đoán dựa vào tốc độ tăng ( hoặc giảm) tuyệt đối bình quân:
Dựa vào nguồn số liệu ta có:
==17245.118 tỷ đồng.
Dự đoán GDP của các năm 2007,2008,2009,2010:
Năm
GDP (tỷ đồng)
2007
442380.118
2008
459625.236
2009
476870.354
2010
494115.472
Tiêu chuẩn lựa chọn mô hình:
Năm
yt
l
1990
131968
-16
2276228867
297393887.9
1991
139634
-15
2408429942
719539315.1
1992
151782
-14
2617923635
1018972458
1993
164043
-13
2829366027
1362013421
1994
178534
-12
3079265032
1572882603
1995
195567
-11
3373001127
1589752620
1996
213833
-10
3688000452
1509386215
1997
231264
-9
3988600104
1494977431
1998
244596
-8
4218512017
1812890853
1999
256272
-7
4419866015
2318150364
2000
273666
-6
4719827598
2303836035
2001
292535
-5
5045225729
2150585903
2002
313247
-4
5402406613
1841055959
2003
336242
-3
5798958102
1380690656
2004
362435
-2
6250659477
795790784.9
2005
393031
-1
6778291108
220786374.3
2006
425135
0
7331928376
0
SSE
1
22388704880
SE
38633.93
SE==38633.93
2. Dự đoán dựa vào tốc độ phát triển bình quân:
==1.076
Dự đoán GDP của các năm 2007,2008,2009,2010
Năm
GDP(tỷ đồng)
2007
457445.26
2008
492211.0998
2009
529619.1433
2010
569870.1982
Tiêu chuẩn lựa chọn mô hình:
Năm
yt
l
(
1990
131968
-16
131683.2447
81085.55916
1991
139634
-15
141691.1713
4231953.915
1992
151782
-14
152459.7004
459277.7779
1993
164043
-13
164046.6376
13.23204128
1994
178534
-12
176514.182
4079664.576
1995
195567
-11
189929.2599
31784113.67
1996
213833
-10
204363.8836
89664164.83
1997
231264
-9
219895.5388
129241910.4
1998
244596
-8
236607.5997
63814538.81
1999
256272
-7
254589.7773
2829873.167
2000
273666
-6
273938.6004
74310.97224
2001
292535
-5
294757.934
4941435.652
2002
313247
-4
317159.537
15307945.81
2003
336242
-3
341263.6618
25217087.4
2004
362435
-2
367199.7001
22702367.18
2005
393031
-1
395106.8773
4309266.662
2006
425135
0
425135
0
SSE
398739009.6
SE
5155.831712
SE==5155.831712
3. Dự đoán dựa vào hàm xu thế:
Dùng phần mềm SPSS để xác định đúng đắn hàm xu thế, từ đó có thể dựa vào đó để dự đoán các mức độ của hiện tượng trong tương lai.
Trước hết, ta sẽ thăm dò dạng hàm xu thế bằng đồ thị :
Đồ thị trên gợi ý cho ta xây dựng hàm xu thế tuyến tính, hàm parabol, hàm bậc 3, hàm mũ, trên cơ sở đó tiến hành dự đoán cho một số năm tiếp theo.
3.1. Hàm xu thế tuyến tính:
Dependent variable.. Y Method.. LINEAR
Listwise Deletion of Missing Data
Multiple R .98981
R Square .97972
Adjusted R Square .97837
Standard Error 13274.58281
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 1 127711117396.5 127711117396.5
Residuals 15 2643218230.6 176214548.7
F = 724.74786 Signif F = .0000
-------------------- Variables in the Equation ------
Variable B SE B Beta T Sig T
Time 17692.299020 657.189778 .989809 26.921 .0000
(Constant) 93933.073529 6734 .191294 13.949 .0000
Từ kết quả trên cho ta thấy hàm tuyến tính có dạng
93933.073529 +17692.299020 t
+ Dự đoán về GDP của các năm 2007, 2008, 2009, 2010.có kết quả như sau :
Năm
Dự đoán điểm
(tỷ đồng)
Dự đoán khoảng
(tỷ đồng)
Cận dưới(lcl)
Cận trên(ucl)
2007
412394.4559
380667.7824
444121.129
2008
430086.7549
397777.8921
462395.618
2009
447779.0539
414838.6878
480719.42
2010
465471.3529
431852.9485
499089.757
Ở đây cho kết quả của hai loại dự đoán:
- Dự đoán điểm: ký hiệu fit_1
- Dự đoán khoảng : Cận dưới, ký hiệu lcl_1; Cận trên, ký hiệu ucl_1.Ví dụ: Dự đoán GDP năm 2007 đạt 412394.4559 tỷ đồng.
Ví dụ: Với khoảng tin cậy 95% thì GDP năm 2007 ở trong khoảng 380667.7824 tỷ đồng đến 444121.129 tỷ đồng.
Hàm xu thế tuyến tính này có một số kết quả thông kê như sau :
Hệ số tương quan là 0,98981.
Hệ số xác định là 0,97972.
Hệ số hợp chuẩn là 0.97837.
Sai số chuẩn SE =13274.58281.
3.2. Hàm xu thế parabol:
Dependent variable.. Y Method.. QUADRATI
Listwise Deletion of Missing Data
Multiple R .99851
R Square .99703
Adjusted R Square .99661
Standard Error 5256.80520
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 2 129967459614.7 64983729807.3
Residuals 14 386876012.4 27634000.9
F = 2351.58601 Signif F = .0000
-------------------- Variables in the Equation ---
Variable B SE B Beta T Sig T
Time 7981.206140 1105.763020 .446515 7.218 .0000
Time**2 539.505160 59.705591 .558998 9.036 .0000
(Constant) 124684 .867647 4323.608312 28.838 .0000
Từ kết quả của phần trên cho ta thấy hàm xu thế có dạng :
=124684.867647+7981.206140 t+ 7981.206140
+ Dự đoán về GDP của các năm 2007, 2008, 2009, 2010.có kết quả như sau :
Năm
Dự đoán điểm
(tỷ đồng)
Dự đoán khoảng(tỷ đồng)
Cận dưới (lcl)
Cận trên (ucl)
2007
443146.25
428547.8937
457744.606
2008
471089.1471
454950.057
487228.237
2009
500111.0544
482039.3063
518182.803
2010
530211.9721
509825.7531
550598.191
Ở đây cho kết quả của hai loại dự đoán:
- Dự đoán điểm: ký hiệu fit_1
- Dự đoán khoảng : Cận dưới, ký hiệu lcl_1; Cận trên, ký hiệu ucl_1.Ví dụ: Dự đoán GDP năm 2007 đạt 443146.25 tỷ đồng.
Ví dụ: Với khoảng tin cậy 95% thì GDP năm 2007 ở trong khoảng 428547.8937 tỷ đồng đến 457744.606 tỷ đồng.
Hàm xu thế dạng parabol này có một số kết quả thông kê như sau :
Hệ số tương quan là 0,99851
Hệ số xác định là 0,99703.
Hệ số hợp chuẩn là 0,9961.
Sai số chuẩn SE = 5256,80520.
3.3. Hàm xu thế là hàm bậc 3:
Dependent variable.. Y Method.. CUBIC
Listwise Deletion of Missing Data
Multiple R .99932
R Square .99863
Adjusted R Square .99831
Standard Error 3705.39974
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 3 130175845793.3 43391948597.8
Residuals 13 178489833.8 13729987.2
F = 3160.37793 Signif F = .0000
-------------------- Variables in the Equation -----
Variable B SE B Beta T Sig T
Time 15710.1707
Các file đính kèm theo tài liệu này:
- 36091.doc