Luận án Ứng dụng mô hình mạng thần kinh nhân tạo trong dự báo kinh tế - Trường hợp thị trường chứng khoán Việt Nam

Mô h ình mạng ANN được đ ưa ra và ứng dụng lần đầu tiê n trong lĩnh vực khoa họ c

nhận th ức và tích hợp trí tu ệ nhân tạo vào kỹ thuật. Qua thời gian, ANN đã được sử

dụng rộng rã i trong nhiều l ĩnh vực khoa học, trong đó có dự báo kinh tế. Trải qua

nhiều ngh iên cứu thực nghiệm, ANN tỏ ra là một phương pháp có t ính linh hoạ t vượt

trộ i so với các ph ương ph áp đã từng được sử dụng trong quá khứ. Trong những năm

gần đây, các ứng dụng của ANN trong lĩnh vực tà i chính như nhận diện mẫu hìn h,

phân loại, và d ự bá o theo chuỗi th ời gian ngày càng gia tăng nhanh chóng và nhận

được nhiều sự quan tâm của cả giới nghiên cứu hàn lâm cũng nh ư thực nghiệm.

Thực tế đã cho thấy, các tổ chức cu ng cấp dịch vụ tài chính đ ang trở thành nhà tà i

trợ lớn thứ hai cung cấp nguồn lực hỗ trợ cho công tác ngh iên cứu các ứng dụng của

ANN. Nh ững ứng dụng phổ biến của ANN trong lĩnh vực tài chính bao gồm xếp hạng

rủ i ro trong thẩm định các khoản cho vay thế chấp cũng như trong cá c khoản đầu tư

vào chứng khoán nợ, xâ y d ựng chỉ số , mô ph ỏng hành vi th ị trường, lựa chọn và đa

dạng h óa danh mục đầ u tư, nhận d iện cơ chế tác động của cá c biến giả i th ích kinh t ế

cũng như dự báo cá c chuỗi dữ liệu g iá chứng khoán theo th ời g ian.

179 trang | Chia sẻ: maiphuongdc | Lượt xem: 3384 | Lượt tải: 2

Bạn đang xem trước 20 trang tài liệu Luận án Ứng dụng mô hình mạng thần kinh nhân tạo trong dự báo kinh tế - Trường hợp thị trường chứng khoán Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

đây có nhiều nhà nghiên cứu đưa ra số lượng PE phù hợp khác nhau. Baily và Thompson (1990) cho rằng, số lượng PE phù hợp được sử dụng nên xấp xỉ 75% số lượng neuron đầu vào. Katz (1992) cũng đã cho ra nhận định rằng, số lượng PE của lớp ẩn phù hợp nên nằm trong khoảng từ ½ đến gấp 3 lần số lượng neuron đầu vào. Tuy nhiên, Kaastra và M. Boyd (1996) đưa ra nguyên tắc cơ bản trong lựa chọn số lượng PE của lớp ẩn. Theo đó, đối với một hệ thống ANN bao gồm n neuron đầu vào và m neuron đầu ra, số lượng PE của lớp ẩn phù hợp nên sử dụng xấp xỉ căn bậc hai của tích số n x m. Số lượng neuron được sử dụng có thể nằm trong khoảng từ ½ đến 2 lần kết quả vừa nêu tùy thuộc vào mức độ phức tạp của vấn đề nghiên cứu. Do đó lựa chọn của luận án cũng phù hợp với các nghiên cứu trên. · Axon thứ ba là BiasAxon cho ra giá trị đầu ra của cả mô hình, có chứa một PE và cho ra giá trị VNI dự báo. Axon này chứa một hàm tuyến tính, hàm tuyến 77 tính này giải quyết vấn đề giới hạn trong dữ liệu đầu vào và đảm bảo mức độ tổng quát hóa của đầu ra dự báo. Mô hình có hai hệ thống đường liên kết đầy đủ, hệ thống đầu tiên nối lớp đầu vào với lớp ẩn, hệ thống thứ hai nối lớp ẩn với lớp đầu ra. Mỗi hệ thống là tập hợp những trọng số, những trọng số này sẽ kết hợp với đầu ra của lớp phía trước hệ thống tạo thành đầu vào cho lớp phía sau hệ thống. Các liên kết này được kết hợp thông qua một hàm truyền được đề cập ở trên. Ngoài ra, mô hình sử dụng thuật toán BackPropagation kết hợp với Momentum để điều chỉnh trọng số của mô hình và giảm thiểu sai số nhằm tìm được mô hình tối ưu. Bởi vì, mô hình ANN học hỏi mối quan hệ của đầu vào và đầu ra thông qua các lớp ẩn. Do đó, sự tác động của mỗi biến đầu vào với đầu ra là không rõ ràng. Mặt khác, các biến đầu vào trong mô hình còn tác động lẫn nhau càng làm cho việc nhận ra những biến nào tác động thật sự đến đầu ra của mô hình vô cùng khó khăn. Mô hình ANN không giống mô hình tuyến tính, mô hình tuyến tính xem tác động của các biến đầu vào với đầu ra là tác động cộng gộp, trong khi đó ANN học hỏi các quan hệ phi tuyến. Do những lý do trên nên luận án sử dụng cách xem xét tác động của đầu vào đến đầu ra bằng cách xem xét tác động gộp của từng nhóm biến lên đầu ra mong muốn. 2.1.6. Tiêu chuẩn đánh giá tính phù hợp kết quả dự báo của ANN Tương tự như trong hồi quy truyền thống, ANN cũng so sánh kết quả dự báo mà nó đưa ra với những kết quả thu được trong quá khứ, tính toán bình phương các sai số. Quá trình dữ liệu được đưa từ neuron đầu vào, qua lớp neuron ẩn đến neuron đầu ra để trả ra kết quả dự báo ban đầu được gọi bằng thuật ngữ Feedforward – tức dữ liệu được đẩy lần lượt từ đầu vào đến đầu ra. Tiếp theo đó, bình phương các sai số sẽ được tính toán và ANN sẽ đọc trên các sai số này, phản ánh sai số ngược lại vào hệ thống của nó, từ đó điều chỉnh các tham số theo hướng tối thiểu hóa tổng bình phương các sai số này. Bước phản hồi ngược sai số trở vào hệ thống của ANN để điều chỉnh trọng số gọi là Backpropagation. Đây cũng chính là cơ chế hoạt động của ANN theo kiểu Backpropagation được trình bày ở chương 2. Trong một quá trình huấn luyện, MSE sẽ liên tục được cập nhật và ANN sẽ liên tục điều chỉnh các tham số theo hướng cực tiểu hóa tổng bình phương này. Do dữ liệu đã được chuyển về dạng dừng và có giá trị giao động xung quanh giá trị 0, do đó MSE của mô hình phải nhỏ hơn 1% thì mới có thể xem là mô hình đã được huấn luyện tốt. Mặc khác, quá trình đánh giá tính phù hợp của mô hình dự báo ngoài tiêu chuẩn MSE, ANN còn có một tiêu chuẩn khác là mức độ giải thích của mô hình, chỉ số r – Square. Đây là hệ số tương quan giữa giá trị dự báo ngoài mẫu của mô hình ANN với giá trị thực tế có được từ tập hợp dữ liệu xác nhận tính hiệu quả. Hệ số tương quan này càng lớn nói 78 lên tính dự báo là có thể và cấu trúc ANN được sử dụng trong quá trình huấn luyện là phù hợp cho công việc dự báo tương lai. 2.1.7. Huấn luyện hệ thống ANN Quá trình huấn luyện ANN chủ yếu là để ANN đọc những dữ liệu trong quá khứ nhiều lần. Trải qua quá trình huấn luyện, ANN có thể nhận ra mẫu hình tổng quát đang tồn tại trong mối quan hệ giữa các biến đầu vào. Để huấn luyện ANN, trước tiên cần xác định số lần Epoch 3 được ANN đọc lại trong huấn luyện. Quá trình chạy mô hình để tìm ra những nhóm biến nào tác động mạnh nhất đến VNI, đồng thời tìm ra mô hình thích hợp cho từng nhóm biến, đòi hỏi phải huấn luyện nhiều lần trên mỗi mô hình – trung bình Epoch từ 3.000 đến 10.000 lần. Mỗi 1.000 lần huấn luyện, luận án lại dừng lại để kiểm tra xem mô hình đã tối ưu chưa và có bị quá khít hay không. Nếu mô hình chưa đạt tối ưu và không bị khít thì luận án tiếp tục cho huấn luyện tiếp cho đến khi nào mô hình đạt tối ưu – MSE < 1% và MSE của mẫu xác nhận bắt đầu tăng. Nếu mô hình chưa đạt tối ưu và bị khít thì dừng quá trình huấn luyện và làm lại từ đầu. Sau mỗi lần chạy phân loại biến như trên, chúng ta luôn có giá trị MSE và ghi chú lại trường hợp bị khít. Sau đó, ứng với mỗi nhóm biến chọn ra mô hình có MSE thấp nhất. Cuối cùng, luận án đã tìm ra hai nhóm biến trong số 7 biến kinh tế vĩ mô có khả năng dự báo tốt cho VNI nhất thỏa mãn tiêu chí đánh giá mô hình. Phụ lục “Quá trình phân lại biến theo mô hình mạng ANN” cho ra kết quả của quá trình chạy mô hình theo phân loại biến trên. 2.1.8. Kết quả sử dụng mô hình mạng ANN để dự báo VNIndex Thực hiện các bước xử lý đã được trình bày ở các bước trên, luận án đã đưa ra hai cấu trúc mạng ANN để phân tích và dự báo giá chứng khoán VNI với cách thức phân loại biến với MSE nhỏ nhất như bảng 2.3. Bảng 2.3: Hai cấu trúc mạng ANN cho ra kết quả dự báo tốt nhất Mô hình INPUT Số PE MSE (Training) MSE (CV) R Square Mô hình 1 CPIIPM2CR 3 0,013783 0,131202 5,51% Mô hình 2 LRIPTBCR 3 0,019331 0,073505 25,46% 3 Trong khoa học về ứng dụng ANN, một tập hợp gồm toàn bộ các mẫu dữ liệu được gọi bằng thuật ngữ Epoch. Mỗi mẫu trong bộ dữ liệu được gọi bằng tên Exemplar. 79 Điều đáng chú ý là MSE được thực hiện trong quá trình huấn luyện dữ liệu cho ra kết quả thấp nhất cho các biến đưa vào mô hình trong quá trình phân loại biến. Kết quả mô hình 1 có MSE thấp hơn mô hình 2. Nói cách khác, việc giải thích cho sự thay đổi trong VNI thời gian qua trên TTCK VN do tác động của các biến: lạm phát, sản lượng công nghiệp, cung tiền M2 và tăng trưởng tín dụng của nền kinh tế. Tuy nhiên, khi sử dụng mô hình đã được huấn luyện để tiến hành dự báo ngoài mẫu từ dữ liệu kiểm tra thì mô hình 1 có sai số lớn hơn mô hình 2. Điều quan trọng mô hình 2 cho ra hệ số tương quan (rSquare.) cao hơn giữa giá trị dự báo và giá trị thực tế của VNI. Nói cách khác mô hình 2: tác động của lãi suất, sản lượng công nghiệp, cán cân thương mại và tăng trưởng tín dụng sẽ là những biến có thể dự báo tốt nhất cho VNI. Mối quan hệ giữa giá trị dự báo và giá trị thực tế dù chỉ ở mức độ giải thích thấp 25,46% nhưng đã nói lên khả năng dự báo chiều hướng của VNI. Hình 2.2 cho thấy kết quả quá trình dự báo ngoài mẫu của VNI. Hình 2.2: Kết quả dự báo theo mô hình ANN và thực tế của VNI trong mô hình 1 và mô hình 2 Như vậy, có thể thấy rằng khi đưa các biến kinh tế vĩ mô vào để phân tích và dự báo giá chứng khoán của TTCK VN thì mức độ giải thích và khả năng dự báo của mô hình còn nhiều hạn chế, giá trị dự báo chưa cao. Một vấn đề đặt ra là phải chăng cấu trúc mạng ANN trên chưa giải thích được tác động của các biến đầu vào này lên sự thay đổi của VNI trong thời gian qua? Hoặc mô hình ANN không hiệu quả hơn mô hình hồi quy tuyến tính truyền thống? Phần tiếp theo, luận án tiếp tục thay đổi cấu trúc mạng ANN và so sánh với mô hình hồi quy tuyến tính. Mô hình 1 Mô hình 2 80 2.2. Sử dụng mạng thần kinh nhân tạo được khái quát hóa và mạng truyền thẳng để dự báo giá chứng khoán với nhóm biến kinh tế vĩ mô 2.2.1. Dự báo giá chứng khoán bằng cấu trúc mạng thần kinh nhân tạo được khái quát hóa Với bộ cơ sở dữ liệu được thu thập và xử lý như trên, phần tiếp theo sẽ đi vào quá trình xây dựng cấu trúc mạng ANN cụ thể khác. Trong nghiên cứu của Reza G. Ahagar và Mahmood Yahyazadehfar (2010), các tác giả đã sử dụng cấu trúc mạng thần kinh nhân tạo được khái quát hóa (GRNN Generalized Regression Neural Network) để dự báo giá chứng khoán. Cấu trúc này có phần khác so với cấu trúc mạng truyền thẳng đa lớp mà trong chương 1 luận án đã trình bày, GRNN vốn được sử dụng phổ biến trong các nghiên cứu về mạng thần kinh ở chổ các neuron của mỗi lớp trong hệ thống không chỉ kết nối với neuron của lớp ngay trước và sau nó mà còn được kết nối với các neuron của những lớp ẩn khác. Về cấu trúc của mô hình mạng thì bài nghiên cứu trên chỉ xây dựng cấu trúc mạng một lớp ẩn duy nhất với 14 neuron và sử dụng thuật toán LevenbergMarquardt (LM) để tiến hành điều chỉnh các trọng số trong quá trình huấn luyện nhằm đạt đến mục tiêu tối thiểu hóa MSE giữa giá trị dự báo của mô hình với giá trị thực tế. Thuật toán này là một trong những công cụ được sử dụng nhiều nhất đối với các bài toán tối ưu hóa phi tuyến. Đây được xem là sự kết hợp giữa phương pháp GaussNewton với phương pháp Gradient thông thường (Manolis, 2005). Luận án ký hiệu cho mô hình trên là GNN14PE. Vấn đề tiếp theo trước khi đi vào huấn luyện cho cấu trúc mạng ANN này là cần phải phân chia bộ dữ liệu thành ba phần: tập hợp các quan sát dùng để huấn luyện hệ thống ANN, tập hợp các quan sát để xác nhận và cuối cùng là tập hợp các quan sát sử dụng để kiểm tra lại (kiểm định ngoài mẫu). Phần nghiên cứu này sẽ sử dụng tỷ lệ của ba tập hợp này lần lượt là 70%, 20% và 10%. Thực tế là không có nguyên tắc chung nào cho sự phân chia này và tỷ lệ trên là gợi ý trong nghiên cứu của Jing Tao (2000). Tuy nhiên, với số lượng mẫu quan sát quá ít sẽ là một cảnh báo cho giá trị mô hình dự báo. Kết quả của quá trình huấn luyện ANN theo cấu trúc mạng GNN14PE được cho ở bảng 2.4: Bảng 2.4: Kết quả huấn luyện hệ thống mạng GNN14PE Network Training Cross Validation Minimum MSE 7,79431E31 0,142506795 Final MSE 7,79431E31 0,439504113 81 Tiếp đến luận án tiến hành kiểm định ngoài mẫu đối với mô hình dự báo trên sau khi trải qua quá trình huấn luyện. Hình 2.3 và bảng 2.5 thể hiện kết quả dự báo ngoài mẫu trong bộ dữ liệu kiểm tra. Desired Output and Actual Network Output -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 1 2 3 4 5 6 7 8 9 10 Exemplar O ut pu t VNI VNI Output Hình 2.3: VNI dự báo từ mô hình GNN14PE so với VNI thực tế Bảng 2.5: Kết quả kiểm định ngoài mẫu của mô hình GNN14PE Performance VNI MSE 0,028785546 NMSE 14,62732889 MAE 0,121311251 Min Abs Error 0,010482329 Max Abs Error 0,42990126 R 0,271785126 Với những kết quả trên, ta thấy rằng, cấu trúc mạng GRNN với cấu trúc một lớp ẩn và 14 neuron ẩn đã cho kết quả rất tốt trong quá trình huấn luyện khi giá trị MSE cuối cùng đạt đến 7,7943E31, một giá trị lý tưởng cho sự chênh lệch giữa giá trị dự báo và thực tế. Tuy nhiên, khi tiến hành kiểm định ngoài mẫu đối với mô hình trên, kết quả cho thấy sự hạn chế lớn của mô hình trong việc dự báo giá trị VNI. Đặc biệt là chỉ số tương quan r, đặc trưng cho mối tương quan tuyến tính giữa chuỗi giá trị VNI dự báo và thực tế là giá trị âm. Qua đó, có thể kết luận rằng, mô hình trên đã rơi vào tình trạng “quá khít” trong khi huấn luyện, nhưng lại thiếu khả năng khái quát hóa để phản ánh đầy đủ mối tương quan phi tuyến giữa các biến số. Một vấn đề khác là số biến đưa vào mô hình cũng được xem xét tính trễ như trên đã đề cập. Phần tiếp theo sau, luận án sẽ không khảo sát các biến được làm trễ, chỉ khảo sát 7 biến như đã đề cập trong bảng 2.1. Tuy nhiên, số lượng PE trong lớp ẩn cũng giảm đi nhiều. 82 Hình 2.4: Mô tả mạng GRNN với 4 neuron trong lớp ẩn GNN4PE Để khắc phục tình trạng “quá khít” trong cấu trúc mạng GNN14PE, luận án đã tiến hành điều chỉnh cấu trúc mạng, vẫn giữ nguyên các yếu tố khác nhưng số lượng neuron ẩn sẽ lần lượt là 4 và 5, ký hiệu cho hai cấu trúc mạng này là GNN4PE (minh họa trong hình 2.4 cho mạng GRNN) và GNN5PE, kết quả kiểm định ngoài mẫu đối với 2 cấu trúc mạng trên lần lượt là: Bảng 2.6: Kết quả kiểm định ngoài mẫu của cấu trúc GNN4PE và GNN5PE Performance GNN4PE GNN5PE MSE 0,03126959 0,024987342 NMSE 15,88959147 12,69727722 MAE 0,136603321 0,096066336 Min Abs Error 0,018306627 0,000908091 Max Abs Error 0,404865279 0,432749842 r 0,391779615 0,189219915 LR USD IP TB M2 CPI CR PE1 PE2 PE3 PE4 VNI 83 Hình 2.5: Giá trị VNI dự báo từ GNN4PE và GNN5PE với giá trị VNI thực tế So sánh kết quả của cấu trúc GNN14PE với GNN4PE và GNN5PE rõ ràng là đã có sự gia tăng trong hiệu quả dự báo, chủ yếu được thể hiện qua chỉ tiêu tương quan tuyến tính giữa VNI thực tế và giá trị VNI dự báo của cấu trúc mạng, lần lượt ở mức 39,17% và 18,92%. Tuy nhiên, nếu so với mô hình ANN được trình bày trong phần 2.1 thì hiệu quả của cấu trúc mạng GNN4PE cho dự báo tốt hơn. Tuy nhiên, mức độ giải thích của mạng vẫn chưa cao chỉ mới đạt 39,17%. Chính vì vậy, luận án tiếp tục thay đổi cấu trúc mạng ANN khác để phân tích và dự báo sự tác động của các biến kinh tế vĩ mô đến VNI. 2.2.2. Dự báo giá chứng khoán dựa trên phân tích tác động của các biến kinh tế vĩ mô theo cấu trúc mạng truyền thẳng Trong phần này luận án tiến hành thử nghiệm với cấu trúc mạng thần kinh khác để kiểm tra tính hiệu quả của mô hình dự báo. Bên cạnh mạng thần kinh được khái quát hóa như trên thì cấu trúc mạng được sử dụng phổ biến nhất vẫn là mạng ANN truyền thẳng với một lớp ẩn. Lần lượt tiến hành huấn luyện mạng với cùng một cấu trúc dữ liệu như trên nhưng thay đổi số neuron của lớp ẩn. Mạng ANN truyền thẳng, một lớp ẩn với số neuron ẩn lần lượt là 2, 3, 4, 5 được ký hiệu: MFF2PE, MFF3PE, MFF 4PE, MFF5PE. GNN4PE GNN5PE 84 Bảng 2.7: Kết quả dự báo ngoài mẫu theo cấu trúc mạng ANN truyền thẳng MFF2PE, MFF3PE, MFF4PE, MFF5PE Mô hình MFF2PE MFF3PE MFF4PE MFF5PE MSE 0,009396214 0,003751625 0,005980783 0,00241921 MAE 0,065259439 0,042116996 0,057105411 0,038226213 r 0,316865644 0,370211421 0,433968335 0,653517847 Qua những kết quả trên, cấu trúc mạng truyền thẳng một lớp ẩn có khả năng dự báo VNI tương đối tốt hơn so với cấu trúc mạng GRNN trên TTCK VN, đặc biệt là nếu xét đến chỉ báo tương quan tuyến tính giữa giá trị VNI dự báo với VNI thực tế đạt đến mức 65,35% trong trường hợp cấu trúc MFF5PE, chỉ tiêu MSE = 0,0024 và MAE = 0,038 ở mức rất thấp. Kết luận: Trong cấu trúc mạng ANN truyền thẳng một lớp ẩn với 5PE đã cho ra giá trị dự báo VNI tốt nhất, và tốt hơn cả cấu trúc mạng GRNN. Đồng thời, cấu trúc mạng ANN được thiết lập như mục 2.1 đã cho ra kết quả dự báo không tốt bằng cấu trúc mạng truyền thẳng một lớp ẩn với 5PE. Nói cách khác, cấu trúc mạng truyền thẳng sẽ thích hợp cho quá trình dự báo VNI. Tuy nhiên, vấn đề thứ tiếp theo là liệu rằng mô hình mạng ANN dự báo tốt hơn so với mô hình hồi quy tuyến tính? Phần tiếp theo, luận án sẽ đi vào chứng minh điều này. 2.2.3. So sánh khả năng dự báo giá chứng khoán của mô hình mạng thần kinh nhân tạo với mô hình hồi quy tuyến tính · Sử dụng mô hình mạng ANN không có lớp ẩn và hàm truyền tuyến tính Trong phần này luận án sẽ tiến hành xây dựng mô hình tuyến tính (thể hiện mối quan hệ giữa các biến) để có cơ sở so sánh giữa hai loại mô hình với nhau. Về bản chất, mô hình tuyến tính là một trường hợp đặc biệt của mô hình mạng ANN khi hệ thống mạng này không tồn tại lớp ẩn nào. Hàm truyền là một hàm tuyến tính thể hiện mối quan hệ giữa các biến đầu vào với biến đầu ra. Với các dữ liệu đầu vào đã sử dụng ở bảng 2.2, luận án tiến hành xây dựng mô hình tuyến tính bằng cách sử dụng hàm truyền là hàm tuyến tính và không có lớp ẩn trong mô hình của mạng ANN. Mô hình chỉ có một biến đầu ra là VNI và các biến đầu vào được đề cập ở bảng 2.2. Kết quả 85 của quá trình huấn luyện mô hình ANN này được thể hiện trong hình 2.6 và bảng 2.8. 86 Desired Output and Actual Network Output -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2 3 4 5 6 7 8 9 10 Exemplar O ut pu t VNI VNI Output Hình 2.6: VNI thực tế và dự báo của cấu trúc mạng ANN tuyến tính Bảng 2.8: Kết quả kiểm định ngoài mẫu của cấu trúc mạng ANN tuyến tính Performance VNI MSE 0,056213737 NMSE 28,56491985 MAE 0,142268143 Min Abs Error 0,00979236 Max Abs Error 0,672613418 r 0,026795475 Tổng hợp kết quả của các mô hình cho phép chúng ta đi đến kết luận rằng, khi sử dụng các biến kinh tế vĩ mô để phân tích và dự báo giá chứng khoán trên TTCK VN, cụ thể là chỉ số VNI, thì mô hình phi tuyến thật sự tỏ ra hiệu quả hơn so với mô hình tuyến tính. Trước hết, so về chỉ tiêu MSE, giá trị của mô hình tuyến tính là 0,056, cao hơn hẳn so với trường hợp các mô hình mạng ANN phi tuyến khi chỉ tiêu này nằm trong khoảng từ 0,02 đến 0,09. Đặc biệt là nếu so với cấu trúc mạng MFF5PE, thì chỉ tiêu MSE của mô hình tuyến tính đã cao hơn gấp đôi. Điều này đã cho thấy tập hợp các giá trị sai số trong dự báo và thực tế của mô hình tuyến tính lớn hơn nhiều so với mô hình mạng ANN nhất là mạng MFF5PE. Sự vượt trội của mô hình phi tuyến còn thể hiện rõ hơn khi ta xem xét chỉ tiêu tương quan giữa VNI thực tế và dự báo của mỗi mô hình. Chỉ tiêu này là 2,6% đối với mô hình tuyến tính, điều này có nghĩa là giá trị VNI được dự báo của mô hình dường như đi ngược lại với giá trị VNI thực tế. Trong khi đó, chỉ tiêu này đạt đến mức 65,35% ở trường hợp MFF5PE. Tuy chưa thật sự là cao nhưng cũng đã đủ để chứng tỏ tính hạn chế trong phân tích và dự báo của các mô hình tuyến tính. 87 Nếu như mạng MFF5PE cho ra kết quả dự báo ngoài mẫu tốt nhất, giá trị dự báo của mạng và kết quả thực tế cho ra mối tương quan dương và tương quan khá cao, lên đến 65,35% trong khi đó giá trị tương quan này trong mô hình tuyến tính là giá trị âm. Nói cách khác, khi sử dụng mô hình tuyến tính để dự báo giá chứng khoán trên TTCK VN sẽ không thể giải thích sự biến động này khi dựa trên những dữ liệu kinh tế vĩ mô. Giá trị tương quan dự báo ngoài mẫu của mô hình tuyến tính đã cho thấy kết quả của chiều hướng dự báo và giá trị thực tế dịch chuyển ngược nhau. Như vậy phải chăng các biến kinh tế vĩ mô không thể tác động lên giá chứng khoán trên TTCK VN nếu dựa trên mô hình hồi quy tuyến tính?. Có thể nói rằng, nếu thay đổi mô hình thì mức độ biến động giá chứng khoán trên TTCK VN sẽ được giải thích bằng các biến kinh tế vĩ mô. · Sử dụng mô hình hồi quy tuyến tính truyền thống Một phần của phụ lục 3 “Xây dựng mô hình hồi quy tuyến tính truyền thống để phân tích và dự báo VNIndex” đã cho ra kết quả của việc sử dụng phương pháp hồi quy tuyến tính trong việc dự báo VNI như sau: Thứ nhất: Nếu tuân thủ yêu cầu giả định của phương pháp hồi quy tuyến tính truyền thống thì các biến đưa vào mô hình phải tuân theo quy luật phân phối chuẩn, các biến kinh tế vĩ mô khảo sát ở bảng 2.1 được đưa vào mô hình không đạt được điều kiện này. Bảng 3 của phụ lục 3 đã minh chứng kết quả này. Tuy nhiên, kết quả này có thể chấp nhận được khi chúng ta giả định những quan sát được trong tương lai sẽ đủ để các biến số này tuân theo quy luật phân phối chuẩn. Phương pháp thống kê chấp nhận giả định này để xây dựng mô hình. Thứ hai: Trong phần xây dựng mô hình hồi quy tuyến tính truyền thống và kiểm định của phụ lục 3 đã cho ra kết quả: 1. Khi sử dụng hồi quy đơn biến để giải thích cho sự thay đổi trong VNI thì không có mô hình hồi quy đơn biến nào có ý nghĩa thống kê. Nói cách khác, không một biến kinh tế vĩ mô nào đưa vào mô hình có thể giải thích cho sự thay đổi của VNI trong thời gian qua. Tuy nhiên, nếu chúng ta điều chỉnh dữ liệu mang tính độ trễ một kỳ thì biến cung tiền – M2 lại có thể giải thích cho sự thay đổi của VNI. Kết quả giải thích của biến M2 rất thấp, chỉ là 2,83%. 2. Khi sử dụng hồi quy đa biến thì mô hình không có ý nghĩa thống kê, nói cách khác, các hệ số hồi quy các nhân tố bằng không, không thể xây 88 dựng được mô hình hồi quy tuyến tính đa nhân tố từ các biến kinh tế vĩ mô để giải thích cho sự thay đổi của VNI. Tuy nhiên, ngay cả khi sử dụng các biến có độ trễ, phụ lục 3 cũng đã cho ra kết quả không thể xây dựng mô hình hồi quy tuyến tính dựa trên bộ dữ liệu các biến kinh tế vĩ mô đã điều chỉnh độ trễ. Tóm lại, kết quả nghiên cứu này đã góp phần chứng minh được ưu thế vượt trội của mô hình mạng ANN phi tuyến trong việc phân tích và dự báo giá chứng khoán trên TTCK VN so với mô hình tuyến tính truyền thống trong trường hợp sử dụng các biến số kinh tế vĩ mô làm nhập lượng đầu vào. Tuy nhiên, kết quả từ các mô hình mạng ANN còn có một số hạn chế trong mức độ dự báo. Điều này một phần là do số lượng quan sát được sử dụng để huấn luyện quá ít, trong tương lai, theo thời gian thì số lượng quan sát sẽ nhiều và quá trình huấn luyện mạng ANN tốt lên và khả năng dự báo càng chuẩn xác. Hoặc tính chất của các biến chưa đủ để giải thích sự biến động của giá chứng khoán; hoặc thậm chí do sự thiếu vắng thông tin trên TTCK; hoặc tác động của yếu tố tâm lý, hành vi của nhà đầu tư tham gia trên thị trường chi phối đến các quyết định đầu tư của các nhà đầu tư trên TTCK VN thời gian qua?... Phần tiếp theo của luận án sẽ khảo sát các nhóm biến khác được đưa vào mô hình mạng ANN và so sánh chúng với mô hình hồi quy tuyến tính. 2.3. Sự vượt trội của mô hình mạng thần kinh nhân tạo so với mô hình hồi quy tuyến tính khi sử dụng các biến số tài chính Bên cạnh các biến kinh tế vĩ mô thì các biến phản ánh tình hình tài chính của các doanh nghiệp niêm yết cũng thường được sử dụng làm nhập lượng đầu vào cho các mô hình dự báo tỷ suất sinh lợi của các tài sản tài chính trên TTCK. Nghiên cứu của Fama và French (1992) dựa trên các chứng khoán sàn giao dịch New York trong giai đoạn từ 1963 đến 1990 đã đưa ra kết luận về sự tồn tại mối tương quan giữa tỷ suất sinh lợi chứng khoán với các tỷ số tài chính như: tỷ số giá/giá trị sổ sách (P/B), tỷ số giá/thu nhập mỗi cổ phần (P/E)… Trong những năm sau đó, nhiều nghiên cứu sử dụng những phương pháp kiểm định khác nhau đã đi đến kết luận về sự hạn chế trong khả năng dự báo của các tỷ số này. Tuy nhiên, John Y. Campbell và Motohiro Yogo (2003) đã đưa ra một phương pháp kiểm định mới, củng cố cho kết luận về khả năng dự báo của các tỷ số tài chính: cổ tức/giá và giá/thu nhập mỗi cổ phần. Bên cạnh các biến số đầu vào thì loại mô hình được sử dụng cũng sẽ ảnh hưởng đến kết quả cuối cùng của quá trình phân tích và dự báo. Mặc dù phần lớn các nghiên cứu trước đây đều chỉ ra mối quan hệ tuyến tính giữa các tỷ số tài chính và tỷ suất sinh 89 lợi của chứng khoán. Tuy nhiên, thực tế là các mô hình phi tuyến sẽ có khả năng mô tả chính xác hơn mối tương quan giữa hai yếu tố này. Nghiên cứu của Mohammed Omran (2002), dựa trên mẫu dữ liệu từ năm 1996 đến 2000 của 46 doanh nghiệp trên thị trường Ai Cập đã góp phần minh chứng cho kết luận này. Tương tự, nghiên cứu của Reza Gharoie Ahangar (2010) sử dụng mô hình phi tuyến cũng đã cho kết quả dự báo tốt hơn so với mô hình tuyến tính thông thường. Bài nghiên cứu sử dụng mẫu dữ liệu của các công ty niêm yết trên sàn giao dịch Tehran và mô hình phi tuyến được lựa chọn là mô hình mạng ANN. Dựa trên nền tảng đó, phần nghiên cứu này của luận án sẽ thiết lập hai loại mô hình dự báo khác nhau sử dụng các tỷ số tài chính làm nhập lượng đầu vào để phân tích và dự báo tỷ suất sinh lợi của chỉ số VNIndex trên TTCK VN. Trước hết, mô hình tuyến tính truyền thống sẽ được sử dụng như một mô hình chuẩn. Sau đó, các cấu trúc mạng ANN phi tuyến khác nhau được xây dựng và kết quả dự báo của những cấu trúc mạng này sẽ được so sánh với mô hình tuyến tính đã được thiết lập. Nhập lượng đầu vào bao gồm các biến tỷ số tài chính lần lượt là: tỷ suất sinh lợi trên vốn cổ phần ROE, tỷ suất sinh lợi trên tổng tài sản ROA, tỷ số giá trên thu nhập mỗi cổ phần PE, tỷ số giá trên giá trị sổ sách mỗi cổ phần PB, giá trị vốn hóa của thị trường – CM, dòng tiền mỗi cổ phần – CF, thu nhập mỗi cổ phần – EPS, lợi nhuận biên – PM, và tỷ lệ nợ trên vốn cổ phần – D/E. Bộ dữ liệu theo tháng được thu thập từ Sở giao dịch chứng khoán Tp.HCM và Bloomberg

Các file đính kèm theo tài liệu này:

NV887427.pdf