Bài giảng Giới thiệu học phần thống kê ứng dụng trong kinh doanh - Chương 14: Dự báo dựa trên dữ liệu chuỗi thời gian - Nguyễn Tiến Dũng

Một số vấn đề liên quan đến dự báo

● 14.2.1.1 Thời đoạn DB

● Là tần suất thời gian mà DL phục vụ dự báo được

thu thập, như ngày, tuần, tháng, quý, năm.

● 14.2.1.2 Tầm xa DB

● DB tức thì: dưới 1 tháng

● DB ngắn hạn: từ 1 đến 3 tháng

● DB trung hạn: từ 3 tháng đến hơn 1 năm.

● DB dài hạn: từ 2 năm trở lên

Dự báo bằng phương pháp trung bình trượt

(Moving Average Method)

● Phạm vi áp dụng và ý nghĩa:

● Chuỗi số liệu có thành phần xu hướng (tăng/giảm

tuyến tính) và có thành phần bất thường (nhiễu loạn)

● Số điểm lấy TB:

● m = 2k+1 hoặc m = 2k

● Nếu m lẻ, không phải trung tâm hoá

● Nếu m chẵn, phải trung tâm hoá

● Chọn m bằng bao nhiêu?

● Dãy số có mức độ biến động ít, chọn m nhỏ (TD, m=3)

● Dãy số có mức độ biến động nhiều, chọn m lớn hơn (m = 5, 7

.)

● Phương pháp “Trial-and-error”: thử các giá trị m khác nhau,

phương pháp nào có MSE nhỏ nhất thì chọn.

● m càng lớn, đường dự báo càng trơn

pdf30 trang | Chia sẻ: trungkhoi17 | Lượt xem: 552 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Giới thiệu học phần thống kê ứng dụng trong kinh doanh - Chương 14: Dự báo dựa trên dữ liệu chuỗi thời gian - Nguyễn Tiến Dũng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 14 DỰ BÁO DỰA TRÊN DỮ LIỆU CHUỖI THỜI GIAN Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn MỤC TIÊU CỦA CHƯƠNG ●Sau khi học xong chương này, người học sẽ ● Phát biểu được chuỗi thời gian là gì ● Phân biệt được các khái niệm và các cách tiếp cận trong dự báo ● Thực hiện được các phương pháp dự báo dựa trên chuỗi thời gian: lượng tăng giảm tuyệt đối, tốc độ phát triển bình quân ● Thực hiện được một số phương pháp dự báo theo mô hình nhân © Nguyễn Tiến Dũng 2Thống kê ứng dụng CÁC NỘI DUNG CHÍNH 14.1 Chuỗi thời gian 14.2 Các phương pháp dự báo dựa trên chuỗi thời gian 14.3 Dự báo bằng mô hình nhân © Nguyễn Tiến Dũng 3Thống kê ứng dụng 14.1 CHUỖI THỜI GIAN ●14.1.1 Khái niệm ●14.1.2 Các đại lượng mô tả chuỗi thời gian © Nguyễn Tiến Dũng 4Thống kê ứng dụng 14.1.1 Khái niệm ● Time-series data ●Chuỗi các giá trị của một chỉ tiêu NC (đại lượng) được sắp xếp theo thứ tự thời gian ● Y = {Y1, Y2, Y3, ... Yn} ●Chuỗi số thời kỳ: ● DL thu thập trong kỳ ● Có tính cộng: cộng các thời kỳ khác nhau với nhau được ● TD ●Chuỗi số thời điểm ● DL thu thập tại một thời điểm ● Không cộng lại với nhau để đưa ra con số tích luỹ được ● TD © Nguyễn Tiến Dũng 5Thống kê ứng dụng Phân biệt DL thời kỳ và DL thời điểm ●DL thời kỳ: có tính cộng ● Lượng bán, Doanh thu ● Chi phí SXKD, Lợi nhuận = Doanh thu – Chi phí ● GDP, thu nhập ● Chi tiêu sinh hoạt © Nguyễn Tiến Dũng 6 ● DL thời điểm: không có tính cộng ● Số lao động của một doanh nghiệp ● Giá bán ● Tài sản, vốn chủ sở hữu, nợ phải trả ● CPI – Chỉ số giá tiêu dùng ● Điểm TB học tập của từng học kỳ (GPA học kỳ) ● Mức độ hài lòng của khách hàng – khảo sát theo quý. Thống kê ứng dụng 14.1.2 Các đại lượng mô tả chuỗi thời gian ●14.1.2.1 Giá trị TB ● Chuỗi thời kỳ ● Chuỗi thời điểm ● Nếu khoảng cách giữa các thời điểm bằng nhau ● Nếu khoảng cách giữa các thời điểm không bằng nhau, nhưng thời gian NC là liên tục © Nguyễn Tiến Dũng 7 1 1 n i i Y Y n    1 2 3 1 1 (0,5 ... 0,5 ) 1 n n Y Y Y Y Y Y n        1 1 n i i i n i i Y t Y t      Thống kê ứng dụng 14.1.2.2 Lượng tăng giảm tuyệt đối (so sánh tuyệt đối) ● Lượng tăng giảm tuyệt đối liên hoàn ● Lượng tăng giảm tuyệt đối định gốc ● Lượng tăng giảm tuyệt đối TB © Nguyễn Tiến Dũng 8 1 ) (i=2,n i i i Y Y   1 ) (i=2,n i i Y Y   2 n n i i     2 1 1 1 n i i in n          Thống kê ứng dụng 14.1.2.3 Tốc độ phát triển ● Tốc độ phát triển liên hoàn ● Tốc độ phát triển định gốc ● Liên hệ giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gốc ● Tốc độ phát triển TB © Nguyễn Tiến Dũng 9 1 i i i Y t Y   1 i i Y T Y  21 n n n i i Y T t Y    11 2 n nn i n i t t T    Thống kê ứng dụng 14.1.2.4 Tốc độ tăng trưởng ●Tốc độ tăng trưởng liên hoàn ●Tốc độ tăng trưởng định gốc ●Tốc độ tăng trưởng TB © Nguyễn Tiến Dũng 10 1 1 1i i i i i Y Y a t Y       1 1 1 1i i i i Y Y A T Y Y       1a t  Thống kê ứng dụng 14.2 DỰ BÁO DỰA TRÊN CHUỖI THỜI GIAN ●Hoạch định tốt  Thành công cao ●Dự báo  hoạch định (lập kế hoạch) ●Các cách tiếp cận trong DB ● Cách tiếp cận định tính: phỏng vấn sâu, thảo luận nhóm đối với chuyên gia và khách hàng ● Cách tiếp cận định lượng: ● Sử dụng X để dự báo Y: PT tương quan và hồi quy ● Sử dụng các GT quá khứ của Y để dự báo các GT tương lai của Y ● Các điều kiện và giả định để DB định lượng ● Có sẵn DL quá khứ ● Có thể lượng hoá DL quá khứ ● Các quy luật quá khứ sẽ tiếp diễn trong tương lai © Nguyễn Tiến Dũng 11Thống kê ứng dụng 14.2.1 Một số vấn đề liên quan đến dự báo ●14.2.1.1 Thời đoạn DB ● Là tần suất thời gian mà DL phục vụ dự báo được thu thập, như ngày, tuần, tháng, quý, năm. ●14.2.1.2 Tầm xa DB ● DB tức thì: dưới 1 tháng ● DB ngắn hạn: từ 1 đến 3 tháng ● DB trung hạn: từ 3 tháng đến hơn 1 năm. ● DB dài hạn: từ 2 năm trở lên © Nguyễn Tiến Dũng 12Thống kê ứng dụng 14.2.1.3 Các chỉ tiêu đánh giá mức độ phù hợp của mô hình dự báo ●Sai số tuyệt đối TB – MAE (Mean Absolute Error) © Nguyễn Tiến Dũng 13 ● Sai số phần trăm tuyệt đối TB – MAPE (Mean Absolute Percent Error) 1 | | / n i i i e Y MPAE n   1 | | n i i e MAE n   1 2 1 2 ; ;..., ; ;..., - { } { } n n i i i Y Y Y Y F F F F e Y F    Thống kê ứng dụng ● Sai số bình phương TB – MSE (Mean Square Error) và Căn bậc hai của sai số bình phương TB © Nguyễn Tiến Dũng 14 2 1 n i i e MSE n   2 1 S n i i e RMSE M E n    ● Chỉ số U RMSE cuûa moâ hình döï baùo ñang söû duïng RMSE cuûa moâ hình döï baùo ngaây thô (naive) U  Thống kê ứng dụng 14.2.2 Các phương pháp DB đơn giản ●14.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB ●14.2.2.2 Dự báo dựa vào tốc độ phát triển TB ●14.2.2.3 Dự báo bằng phương pháp TB trượt (moving average) © Nguyễn Tiến Dũng 15Thống kê ứng dụng 14.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB ● L: tầm xa dự báo (L = 1,2,3, ...) ● Ft+L: giá trị dự báo ở thời gian t+L ● 𝛿: lượng tăng trưởng tuyệt đối TB ● TD © Nguyễn Tiến Dũng 16 . n L n F Y L   t 1 2 3 4 Y 100 118 121 ? delta - 18 3 4 3 1 3 1 (18 3) 10,5 2 1. 121 10,5 131,5F F Y            Thống kê ứng dụng 14.2.2.2 Dự báo dựa vào tốc độ phát triển trung bình t 1 2 3 4 Y 100 118 121 ? Tốc độ PT liên hoàn - 118/100 = 1,18 121/118 = 1,025 © Nguyễn Tiến Dũng 17 3 1 4 3 1 3 .( ) / 121 /100 1,1 (1,18).(1,025) 1,099 . 121 1,1 133,1 L n L n F Y t t Y Y F F Y t              Thống kê ứng dụng 14.2.2.3 Dự báo bằng phương pháp trung bình trượt (Moving Average Method) ●Phạm vi áp dụng và ý nghĩa: ● Chuỗi số liệu có thành phần xu hướng (tăng/giảm tuyến tính) và có thành phần bất thường (nhiễu loạn) ●Số điểm lấy TB: ● m = 2k+1 hoặc m = 2k ● Nếu m lẻ, không phải trung tâm hoá ● Nếu m chẵn, phải trung tâm hoá ● Chọn m bằng bao nhiêu? ● Dãy số có mức độ biến động ít, chọn m nhỏ (TD, m=3) ● Dãy số có mức độ biến động nhiều, chọn m lớn hơn (m = 5, 7 ...) ● Phương pháp “Trial-and-error”: thử các giá trị m khác nhau, phương pháp nào có MSE nhỏ nhất thì chọn. ● m càng lớn, đường dự báo càng trơn © Nguyễn Tiến Dũng 18Thống kê ứng dụng 14.2.2.4 Mô hình ngoại suy xu thế ●Sử dụng các mô hình hồi quy tuyến tính đơn biến và đa biến để dự báo © Nguyễn Tiến Dũng 19 0 1 Yˆ b b X  Thống kê ứng dụng 14.3 DỰ BÁO BẰNG MÔ HÌNH NHÂN ●Mô hình nhân (Multiplication Model) ●Chuỗi số liệu theo thời gian: Y = {Y1, Y2, ..., Yn} ●Các thành phần có thể có mặt: ● TP xu thế (Trend) Ti ● TP chu kỳ dài hạn (Cyclical) Ci ● TP mùa vụ (Seasonal) Si ● TP bất thường (Erratic) Ei ●Mô hình nhân: Yi=Ti.Ci.Si.Ei ●Quy trình dự báo theo mô hình nhân ● Nhận diện các thành phần của chuỗi ● Tách riêng các thành phần ● Lắp ghép chúng lại để có giá trị dự báo mong muốn © Nguyễn Tiến Dũng 20Thống kê ứng dụng Quy trình dự báo theo PP Holt-Winter Bước 10: Nhân trả lại thành phần mùa để có dãy dữ liệu dự báo có thành phần mùa Bước 9: Xác định các giá trị của dãy dữ liệu dự báo chưa có thành phần mùa Bước 8: Sử dụng hồi quy tuyến tính xác định phương trình hồi quy của dãy dữ liệu dự báo Bước 7: Loại bỏ yếu tố mùa khỏi chuỗi dữ liệu gốc Bước 6: Xác định các chỉ số mùa ở những điểm dữ liệu còn thiếu Bước 5: Hiệu chỉnh chỉ số mùa (St*) Bước 4: Kiểm tra chỉ số mùa Bước 3: Lọc yếu tố bất thường Et Bước 2: Tính chỉ số mùa St Bước 1: Tính TB di động và trung tâm hoá © Nguyễn Tiến Dũng 21Thống kê ứng dụng ●B1: Tách thành phần mùa vụ và bất thường ra khỏi chuỗi dữ liệu bằng phương pháp trung bình trượt trung tâm hoá (Centered Moving Average) ● Nếu DL theo quý, chọn số điểm lấy TB trượt là m = 4, rồi trung tâm hoá ● MA: Moving Average ● CMA: Centered Moving Average © Nguyễn Tiến Dũng 22 2 1 1 0,5 1 1 2 0,5 0,5 0,5 4 4 3 t t t t t t t t t t t t t Y Y Y Y MA Y Y Y Y MA CMA MA MA t                      Thống kê ứng dụng ●Nếu dữ liệu thu thập theo tháng, chọn số điểm lấy TB trượt là 12, rồi trung tâm hoá © Nguyễn Tiến Dũng 23 6 5 4 3 2 1 1 2 3 4 5 0,5 5 4 3 2 1 1 2 3 4 5 6 0,5 0,5 0,5 12 12 7 t t t t t t t t t t t t t t t t t t t t t t t t t t t t t Y Y Y Y Y Y Y Y Y Y Y Y MA Y Y Y Y Y Y Y Y Y Y Y Y MA CMA MA MA t                                                      Thống kê ứng dụng TD: Tính TB trượt trung tâm hoá CMA 4 điểm TT Yt MAt CMAt 1 Y1 - 2 Y2 MA2,5 - 3 Y3 MA3,5 CMA3 4 Y4 MA4,5 CMA4 5 Y5 MA5,5 CMA5 6 Y6 MA6,5 CMA6 7 Y7 MA7,5 CMA7 8 Y8 MA8,5 CMA8 9 Y9 MA9,5 CMA9 10 Y10 MA10,5 CMA10 11 Y11 - 12 Y12 - © Nguyễn Tiến Dũng 24Thống kê ứng dụng Lọc thành phần mùa vụ St và bất thường Et ●St.Et = Yt/CMAt © Nguyễn Tiến Dũng 25Thống kê ứng dụng 14.4 DỰ BÁO BẰNG HÀM TĂNG TRƯỞNG MŨ ●Chuỗi thời gian có tốc độ tăng trưởng hầu như không đổi qua các giai đoạn ●TD: ● Quy hoạch điện quốc gia ● Chuỗi nhà hàng Western Steakhouses 1978-1992 – Trang 444 © Nguyễn Tiến Dũng 26 . bt t Y a e Thống kê ứng dụng 14.5 DỰ BÁO BẰNG SAN BẰNG HÀM SỐ MŨ ●14.5.1 San bằng hàm mũ đơn giản ●14.5.2 Phương pháp Holt ●14.5.3 Phương pháp Holt-Winter © Nguyễn Tiến Dũng 27Thống kê ứng dụng 14.5.1 Phương pháp san bằng mũ đơn giản ●Exponential Smoothing Method © Nguyễn Tiến Dũng 28 ● Ft+1 là giá trị dự báo ở giai đoạn t+1 ● Yt là giá trị thực tế ở giai đoạn t, t = 1,2,3,..., n ● α là hệ số làm trơn, 0 < α < 1. ● Giá trị dự báo: Fn+1 = αYn + (1- α)Fn. ● Tư tưởng: GT dự báo là TB có trọng số của các GT trước đó, các quan sát càng gần hiện tại có trọng số càng lớn. ● Phạm vi áp dụng ● Dãy DL không có thành phần xu hướng và mùa vụ 1 (1 ) t t t F Y F     Thống kê ứng dụng 14.5.2 Phương pháp Holt ● Áp dụng: dãy DL có thành phần xu hướng, không có thành phần mùa vụ © Nguyễn Tiến Dũng 29 1 1 1 2 1 1 1 1 1 (1 )( ) ( ) (1 ). . t t t t t t t t t m t t L Y b Y Y L Y L b b L L b F L m b                       Thống kê ứng dụng 14.5.3 Phương pháp Holt-Winter ● Phạm vi áp dụng: Dãy DL có tính xu hướng và mùa vụ ● Các công thức tính © Nguyễn Tiến Dũng 30 ● s là số giai đoạn trong một vòng thời vụ (đối với DL quý thì s=4; với DL tháng thì s=12) ● Lt là đại điện cho mức độ của chuỗi thời gian ● bt là thành phần đại diện cho xu hướng ● St là thành phần mùa vụ ● Ft+m là giá trị dự báo cho m thời đoạn về sau 1 1 1 1 ( / ) (1 )( ) ( ) (1 ) ( / ) (1 ) ( . ). t t t s t t t t t t t t t t s t m t t t s m L Y S L b b L L b S Y L S F L m b S                             Thống kê ứng dụng

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_gioi_thieu_hoc_phan_thong_ke_ung_dung_trong_kinh_d.pdf