Một số vấn đề liên quan đến dự báo
● 14.2.1.1 Thời đoạn DB
● Là tần suất thời gian mà DL phục vụ dự báo được
thu thập, như ngày, tuần, tháng, quý, năm.
● 14.2.1.2 Tầm xa DB
● DB tức thì: dưới 1 tháng
● DB ngắn hạn: từ 1 đến 3 tháng
● DB trung hạn: từ 3 tháng đến hơn 1 năm.
● DB dài hạn: từ 2 năm trở lên
Dự báo bằng phương pháp trung bình trượt
(Moving Average Method)
● Phạm vi áp dụng và ý nghĩa:
● Chuỗi số liệu có thành phần xu hướng (tăng/giảm
tuyến tính) và có thành phần bất thường (nhiễu loạn)
● Số điểm lấy TB:
● m = 2k+1 hoặc m = 2k
● Nếu m lẻ, không phải trung tâm hoá
● Nếu m chẵn, phải trung tâm hoá
● Chọn m bằng bao nhiêu?
● Dãy số có mức độ biến động ít, chọn m nhỏ (TD, m=3)
● Dãy số có mức độ biến động nhiều, chọn m lớn hơn (m = 5, 7
.)
● Phương pháp “Trial-and-error”: thử các giá trị m khác nhau,
phương pháp nào có MSE nhỏ nhất thì chọn.
● m càng lớn, đường dự báo càng trơn
30 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 545 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Giới thiệu học phần thống kê ứng dụng trong kinh doanh - Chương 14: Dự báo dựa trên dữ liệu chuỗi thời gian - Nguyễn Tiến Dũng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 14
DỰ BÁO DỰA TRÊN
DỮ LIỆU CHUỖI THỜI GIAN
Ths. Nguyễn Tiến Dũng
Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội
Email: dung.nguyentien3@hust.edu.vn
MỤC TIÊU CỦA CHƯƠNG
●Sau khi học xong chương này, người học sẽ
● Phát biểu được chuỗi thời gian là gì
● Phân biệt được các khái niệm và các cách tiếp cận
trong dự báo
● Thực hiện được các phương pháp dự báo dựa
trên chuỗi thời gian: lượng tăng giảm tuyệt đối, tốc
độ phát triển bình quân
● Thực hiện được một số phương pháp dự báo theo
mô hình nhân
© Nguyễn Tiến Dũng 2Thống kê ứng dụng
CÁC NỘI DUNG CHÍNH
14.1 Chuỗi thời gian
14.2 Các phương pháp dự báo dựa trên chuỗi
thời gian
14.3 Dự báo bằng mô hình nhân
© Nguyễn Tiến Dũng 3Thống kê ứng dụng
14.1 CHUỖI THỜI GIAN
●14.1.1 Khái niệm
●14.1.2 Các đại lượng mô tả chuỗi thời gian
© Nguyễn Tiến Dũng 4Thống kê ứng dụng
14.1.1 Khái niệm
● Time-series data
●Chuỗi các giá trị của một chỉ tiêu NC (đại
lượng) được sắp xếp theo thứ tự thời gian
● Y = {Y1, Y2, Y3, ... Yn}
●Chuỗi số thời kỳ:
● DL thu thập trong kỳ
● Có tính cộng: cộng các thời kỳ khác nhau với nhau được
● TD
●Chuỗi số thời điểm
● DL thu thập tại một thời điểm
● Không cộng lại với nhau để đưa ra con số tích luỹ được
● TD
© Nguyễn Tiến Dũng 5Thống kê ứng dụng
Phân biệt DL thời kỳ và DL thời điểm
●DL thời kỳ: có tính
cộng
● Lượng bán, Doanh
thu
● Chi phí SXKD, Lợi
nhuận = Doanh thu –
Chi phí
● GDP, thu nhập
● Chi tiêu sinh hoạt
© Nguyễn Tiến Dũng 6
● DL thời điểm: không có
tính cộng
● Số lao động của một
doanh nghiệp
● Giá bán
● Tài sản, vốn chủ sở hữu,
nợ phải trả
● CPI – Chỉ số giá tiêu
dùng
● Điểm TB học tập của
từng học kỳ (GPA học kỳ)
● Mức độ hài lòng của
khách hàng – khảo sát
theo quý.
Thống kê ứng dụng
14.1.2 Các đại lượng mô tả chuỗi thời gian
●14.1.2.1 Giá trị TB
● Chuỗi thời kỳ
● Chuỗi thời điểm
● Nếu khoảng cách giữa
các thời điểm bằng
nhau
● Nếu khoảng cách giữa
các thời điểm không
bằng nhau, nhưng thời
gian NC là liên tục
© Nguyễn Tiến Dũng 7
1
1 n
i
i
Y Y
n
1 2 3 1
1
(0,5 ... 0,5 )
1
n n
Y Y Y Y Y Y
n
1
1
n
i i
i
n
i
i
Y t
Y
t
Thống kê ứng dụng
14.1.2.2 Lượng tăng giảm tuyệt đối (so sánh tuyệt đối)
● Lượng tăng giảm tuyệt đối
liên hoàn
● Lượng tăng giảm tuyệt đối
định gốc
● Lượng tăng giảm tuyệt đối TB
© Nguyễn Tiến Dũng 8
1
) (i=2,n
i i i
Y Y
1
) (i=2,n
i i
Y Y
2
n
n i
i
2
1
1 1
n
i
i
in n
Thống kê ứng dụng
14.1.2.3 Tốc độ phát triển
● Tốc độ phát triển liên
hoàn
● Tốc độ phát triển định
gốc
● Liên hệ giữa tốc độ phát
triển liên hoàn và tốc độ
phát triển định gốc
● Tốc độ phát triển TB
© Nguyễn Tiến Dũng 9
1
i
i
i
Y
t
Y
1
i
i
Y
T
Y
21
n
n
n i
i
Y
T t
Y
11
2
n
nn
i n
i
t t T
Thống kê ứng dụng
14.1.2.4 Tốc độ tăng trưởng
●Tốc độ tăng trưởng liên hoàn
●Tốc độ tăng trưởng định gốc
●Tốc độ tăng trưởng TB
© Nguyễn Tiến Dũng 10
1
1
1i i
i i
i
Y Y
a t
Y
1
1 1
1i i
i i
Y Y
A T
Y Y
1a t
Thống kê ứng dụng
14.2 DỰ BÁO DỰA TRÊN CHUỖI THỜI GIAN
●Hoạch định tốt Thành công cao
●Dự báo hoạch định (lập kế hoạch)
●Các cách tiếp cận trong DB
● Cách tiếp cận định tính: phỏng vấn sâu, thảo luận
nhóm đối với chuyên gia và khách hàng
● Cách tiếp cận định lượng:
● Sử dụng X để dự báo Y: PT tương quan và hồi quy
● Sử dụng các GT quá khứ của Y để dự báo các GT tương lai
của Y
● Các điều kiện và giả định để DB định lượng
● Có sẵn DL quá khứ
● Có thể lượng hoá DL quá khứ
● Các quy luật quá khứ sẽ tiếp diễn trong tương lai
© Nguyễn Tiến Dũng 11Thống kê ứng dụng
14.2.1 Một số vấn đề liên quan đến dự báo
●14.2.1.1 Thời đoạn DB
● Là tần suất thời gian mà DL phục vụ dự báo được
thu thập, như ngày, tuần, tháng, quý, năm.
●14.2.1.2 Tầm xa DB
● DB tức thì: dưới 1 tháng
● DB ngắn hạn: từ 1 đến 3 tháng
● DB trung hạn: từ 3 tháng đến hơn 1 năm.
● DB dài hạn: từ 2 năm trở lên
© Nguyễn Tiến Dũng 12Thống kê ứng dụng
14.2.1.3 Các chỉ tiêu đánh giá mức độ phù hợp của mô
hình dự báo
●Sai số tuyệt đối TB – MAE
(Mean Absolute Error)
© Nguyễn Tiến Dũng 13
● Sai số phần trăm tuyệt đối TB – MAPE
(Mean Absolute Percent Error)
1
| | /
n
i i
i
e Y
MPAE
n
1
| |
n
i
i
e
MAE
n
1 2
1 2
; ;...,
; ;...,
-
{ }
{ }
n
n
i i i
Y Y Y Y
F F F F
e Y F
Thống kê ứng dụng
● Sai số bình phương TB – MSE (Mean Square Error)
và Căn bậc hai của sai số bình phương TB
© Nguyễn Tiến Dũng 14
2
1
n
i
i
e
MSE
n
2
1
S
n
i
i
e
RMSE M E
n
● Chỉ số U
RMSE cuûa moâ hình döï baùo ñang söû duïng
RMSE cuûa moâ hình döï baùo ngaây thô (naive)
U
Thống kê ứng dụng
14.2.2 Các phương pháp DB đơn giản
●14.2.2.1 Dự báo dựa vào lượng tăng trưởng
tuyệt đối TB
●14.2.2.2 Dự báo dựa vào tốc độ phát triển TB
●14.2.2.3 Dự báo bằng phương pháp TB trượt
(moving average)
© Nguyễn Tiến Dũng 15Thống kê ứng dụng
14.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối
TB
● L: tầm xa dự báo (L = 1,2,3, ...)
● Ft+L: giá trị dự báo ở thời gian t+L
● 𝛿: lượng tăng trưởng tuyệt đối TB
● TD
© Nguyễn Tiến Dũng 16
.
n L n
F Y L
t 1 2 3 4
Y 100 118 121 ?
delta - 18 3
4 3 1 3
1
(18 3) 10,5
2
1. 121 10,5 131,5F F Y
Thống kê ứng dụng
14.2.2.2 Dự báo dựa vào tốc độ phát triển trung bình
t 1 2 3 4
Y 100 118 121 ?
Tốc độ PT
liên hoàn
- 118/100 =
1,18
121/118 =
1,025
© Nguyễn Tiến Dũng 17
3 1
4 3 1 3
.( )
/ 121 /100 1,1
(1,18).(1,025) 1,099
. 121 1,1 133,1
L
n L n
F Y t
t Y Y
F F Y t
Thống kê ứng dụng
14.2.2.3 Dự báo bằng phương pháp trung bình trượt
(Moving Average Method)
●Phạm vi áp dụng và ý nghĩa:
● Chuỗi số liệu có thành phần xu hướng (tăng/giảm
tuyến tính) và có thành phần bất thường (nhiễu loạn)
●Số điểm lấy TB:
● m = 2k+1 hoặc m = 2k
● Nếu m lẻ, không phải trung tâm hoá
● Nếu m chẵn, phải trung tâm hoá
● Chọn m bằng bao nhiêu?
● Dãy số có mức độ biến động ít, chọn m nhỏ (TD, m=3)
● Dãy số có mức độ biến động nhiều, chọn m lớn hơn (m = 5, 7
...)
● Phương pháp “Trial-and-error”: thử các giá trị m khác nhau,
phương pháp nào có MSE nhỏ nhất thì chọn.
● m càng lớn, đường dự báo càng trơn
© Nguyễn Tiến Dũng 18Thống kê ứng dụng
14.2.2.4 Mô hình ngoại suy xu thế
●Sử dụng các mô hình hồi
quy tuyến tính đơn biến và
đa biến để dự báo
© Nguyễn Tiến Dũng 19
0 1
Yˆ b b X
Thống kê ứng dụng
14.3 DỰ BÁO BẰNG MÔ HÌNH NHÂN
●Mô hình nhân (Multiplication Model)
●Chuỗi số liệu theo thời gian: Y = {Y1, Y2, ..., Yn}
●Các thành phần có thể có mặt:
● TP xu thế (Trend) Ti
● TP chu kỳ dài hạn (Cyclical) Ci
● TP mùa vụ (Seasonal) Si
● TP bất thường (Erratic) Ei
●Mô hình nhân: Yi=Ti.Ci.Si.Ei
●Quy trình dự báo theo mô hình nhân
● Nhận diện các thành phần của chuỗi
● Tách riêng các thành phần
● Lắp ghép chúng lại để có giá trị dự báo mong muốn
© Nguyễn Tiến Dũng 20Thống kê ứng dụng
Quy trình dự báo theo PP Holt-Winter
Bước 10: Nhân trả lại thành phần mùa để có dãy dữ liệu dự báo có thành phần mùa
Bước 9: Xác định các giá trị của dãy dữ liệu dự báo chưa có thành phần mùa
Bước 8: Sử dụng hồi quy tuyến tính xác định phương trình hồi quy của dãy dữ liệu dự báo
Bước 7: Loại bỏ yếu tố mùa khỏi chuỗi dữ liệu gốc
Bước 6: Xác định các chỉ số mùa ở những điểm dữ liệu còn thiếu
Bước 5: Hiệu chỉnh chỉ số mùa (St*)
Bước 4: Kiểm tra chỉ số mùa
Bước 3: Lọc yếu tố bất thường Et
Bước 2: Tính chỉ số mùa St
Bước 1: Tính TB di động và trung tâm hoá
© Nguyễn Tiến Dũng 21Thống kê ứng dụng
●B1: Tách thành phần mùa
vụ và bất thường ra khỏi
chuỗi dữ liệu bằng phương
pháp trung bình trượt trung
tâm hoá (Centered
Moving Average)
● Nếu DL theo quý, chọn số
điểm lấy TB trượt là m = 4,
rồi trung tâm hoá
● MA: Moving Average
● CMA: Centered Moving
Average
© Nguyễn Tiến Dũng 22
2 1 1
0,5
1 1 2
0,5
0,5 0,5
4
4
3
t t t t
t
t t t t
t
t t t
Y Y Y Y
MA
Y Y Y Y
MA
CMA MA MA
t
Thống kê ứng dụng
●Nếu dữ liệu thu thập theo tháng, chọn số
điểm lấy TB trượt là 12, rồi trung tâm hoá
© Nguyễn Tiến Dũng 23
6 5 4 3 2 1 1 2 3 4 5
0,5
5 4 3 2 1 1 2 3 4 5 6
0,5
0,5 0,5
12
12
7
t t t t t t t t t t t t
t
t t t t t t t t t t t t
t
t t t
Y Y Y Y Y Y Y Y Y Y Y Y
MA
Y Y Y Y Y Y Y Y Y Y Y Y
MA
CMA MA MA
t
Thống kê ứng dụng
TD: Tính TB trượt trung tâm hoá CMA 4 điểm
TT Yt MAt CMAt
1 Y1 -
2 Y2 MA2,5
-
3 Y3 MA3,5
CMA3
4 Y4 MA4,5
CMA4
5 Y5 MA5,5
CMA5
6 Y6 MA6,5
CMA6
7 Y7 MA7,5
CMA7
8 Y8 MA8,5
CMA8
9 Y9 MA9,5
CMA9
10 Y10 MA10,5
CMA10
11 Y11 -
12 Y12 -
© Nguyễn Tiến Dũng 24Thống kê ứng dụng
Lọc thành phần mùa vụ St và bất thường Et
●St.Et = Yt/CMAt
© Nguyễn Tiến Dũng 25Thống kê ứng dụng
14.4 DỰ BÁO BẰNG HÀM TĂNG TRƯỞNG MŨ
●Chuỗi thời gian có tốc độ tăng
trưởng hầu như không đổi qua
các giai đoạn
●TD:
● Quy hoạch điện quốc gia
● Chuỗi nhà hàng Western
Steakhouses 1978-1992 – Trang 444
© Nguyễn Tiến Dũng 26
.
bt
t
Y a e
Thống kê ứng dụng
14.5 DỰ BÁO BẰNG SAN BẰNG HÀM SỐ MŨ
●14.5.1 San bằng hàm mũ đơn giản
●14.5.2 Phương pháp Holt
●14.5.3 Phương pháp Holt-Winter
© Nguyễn Tiến Dũng 27Thống kê ứng dụng
14.5.1 Phương pháp san bằng mũ đơn giản
●Exponential Smoothing Method
© Nguyễn Tiến Dũng 28
● Ft+1 là giá trị dự báo ở giai đoạn t+1
● Yt là giá trị thực tế ở giai đoạn t, t = 1,2,3,..., n
● α là hệ số làm trơn, 0 < α < 1.
● Giá trị dự báo: Fn+1 = αYn + (1- α)Fn.
● Tư tưởng: GT dự báo là TB có trọng số của các GT
trước đó, các quan sát càng gần hiện tại có trọng số
càng lớn.
● Phạm vi áp dụng
● Dãy DL không có thành phần xu hướng và mùa vụ
1
(1 )
t t t
F Y F
Thống kê ứng dụng
14.5.2 Phương pháp Holt
● Áp dụng: dãy DL có thành phần xu hướng, không có
thành phần mùa vụ
© Nguyễn Tiến Dũng 29
1 1
1 2 1
1 1
1 1
(1 )( )
( ) (1 ).
.
t t t t
t t t t
t m t t
L Y
b Y Y
L Y L b
b L L b
F L m b
Thống kê ứng dụng
14.5.3 Phương pháp Holt-Winter
● Phạm vi áp dụng: Dãy DL có tính xu hướng và mùa vụ
● Các công thức tính
© Nguyễn Tiến Dũng 30
● s là số giai đoạn trong một vòng thời vụ (đối với DL quý thì s=4; với DL
tháng thì s=12)
● Lt là đại điện cho mức độ của chuỗi thời gian
● bt là thành phần đại diện cho xu hướng
● St là thành phần mùa vụ
● Ft+m là giá trị dự báo cho m thời đoạn về sau
1 1
1 1
( / ) (1 )( )
( ) (1 )
( / ) (1 )
( . ).
t t t s t t
t t t t
t t t t s
t m t t t s m
L Y S L b
b L L b
S Y L S
F L m b S
Thống kê ứng dụng
Các file đính kèm theo tài liệu này:
- bai_giang_gioi_thieu_hoc_phan_thong_ke_ung_dung_trong_kinh_d.pdf