Mô h ình mạng ANN được đ ưa ra và ứng dụng lần đầu tiê n trong lĩnh vực khoa họ c
nhận th ức và tích hợp trí tu ệ nhân tạo vào kỹ thuật. Qua thời gian, ANN đã được sử
dụng rộng rã i trong nhiều l ĩnh vực khoa học, trong đó có dự báo kinh tế. Trải qua
nhiều ngh iên cứu thực nghiệm, ANN tỏ ra là một phương pháp có t ính linh hoạ t vượt
trộ i so với các ph ương ph áp đã từng được sử dụng trong quá khứ. Trong những năm
gần đây, các ứng dụng của ANN trong lĩnh vực tà i chính như nhận diện mẫu hìn h,
phân loại, và d ự bá o theo chuỗi th ời gian ngày càng gia tăng nhanh chóng và nhận
được nhiều sự quan tâm của cả giới nghiên cứu hàn lâm cũng nh ư thực nghiệm.
Thực tế đã cho thấy, các tổ chức cu ng cấp dịch vụ tài chính đ ang trở thành nhà tà i
trợ lớn thứ hai cung cấp nguồn lực hỗ trợ cho công tác ngh iên cứu các ứng dụng của
ANN. Nh ững ứng dụng phổ biến của ANN trong lĩnh vực tài chính bao gồm xếp hạng
rủ i ro trong thẩm định các khoản cho vay thế chấp cũng như trong cá c khoản đầu tư
vào chứng khoán nợ, xâ y d ựng chỉ số , mô ph ỏng hành vi th ị trường, lựa chọn và đa
dạng h óa danh mục đầ u tư, nhận d iện cơ chế tác động của cá c biến giả i th ích kinh t ế
cũng như dự báo cá c chuỗi dữ liệu g iá chứng khoán theo th ời g ian.
179 trang |
Chia sẻ: maiphuongdc | Lượt xem: 3480 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận án Ứng dụng mô hình mạng thần kinh nhân tạo trong dự báo kinh tế - Trường hợp thị trường chứng khoán Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
đây có nhiều nhà nghiên cứu đưa ra số lượng PE phù hợp khác
nhau. Baily và Thompson (1990) cho rằng, số lượng PE phù hợp được sử dụng nên
xấp xỉ 75% số lượng neuron đầu vào. Katz (1992) cũng đã cho ra nhận định rằng, số
lượng PE của lớp ẩn phù hợp nên nằm trong khoảng từ ½ đến gấp 3 lần số lượng
neuron đầu vào. Tuy nhiên, Kaastra và M. Boyd (1996) đưa ra nguyên tắc cơ bản
trong lựa chọn số lượng PE của lớp ẩn. Theo đó, đối với một hệ thống ANN bao gồm
n neuron đầu vào và m neuron đầu ra, số lượng PE của lớp ẩn phù hợp nên sử dụng
xấp xỉ căn bậc hai của tích số n x m. Số lượng neuron được sử dụng có thể nằm trong
khoảng từ ½ đến 2 lần kết quả vừa nêu tùy thuộc vào mức độ phức tạp của vấn đề
nghiên cứu. Do đó lựa chọn của luận án cũng phù hợp với các nghiên cứu trên.
· Axon thứ ba là BiasAxon cho ra giá trị đầu ra của cả mô hình, có chứa một PE
và cho ra giá trị VNI dự báo. Axon này chứa một hàm tuyến tính, hàm tuyến
77
tính này giải quyết vấn đề giới hạn trong dữ liệu đầu vào và đảm bảo mức độ
tổng quát hóa của đầu ra dự báo.
Mô hình có hai hệ thống đường liên kết đầy đủ, hệ thống đầu tiên nối lớp đầu vào với
lớp ẩn, hệ thống thứ hai nối lớp ẩn với lớp đầu ra. Mỗi hệ thống là tập hợp những
trọng số, những trọng số này sẽ kết hợp với đầu ra của lớp phía trước hệ thống tạo
thành đầu vào cho lớp phía sau hệ thống. Các liên kết này được kết hợp thông qua
một hàm truyền được đề cập ở trên. Ngoài ra, mô hình sử dụng thuật toán
BackPropagation kết hợp với Momentum để điều chỉnh trọng số của mô hình và
giảm thiểu sai số nhằm tìm được mô hình tối ưu.
Bởi vì, mô hình ANN học hỏi mối quan hệ của đầu vào và đầu ra thông qua các lớp ẩn.
Do đó, sự tác động của mỗi biến đầu vào với đầu ra là không rõ ràng. Mặt khác, các
biến đầu vào trong mô hình còn tác động lẫn nhau càng làm cho việc nhận ra những
biến nào tác động thật sự đến đầu ra của mô hình vô cùng khó khăn. Mô hình ANN
không giống mô hình tuyến tính, mô hình tuyến tính xem tác động của các biến đầu
vào với đầu ra là tác động cộng gộp, trong khi đó ANN học hỏi các quan hệ phi tuyến.
Do những lý do trên nên luận án sử dụng cách xem xét tác động của đầu vào đến đầu
ra bằng cách xem xét tác động gộp của từng nhóm biến lên đầu ra mong muốn.
2.1.6. Tiêu chuẩn đánh giá tính phù hợp kết quả dự báo của ANN
Tương tự như trong hồi quy truyền thống, ANN cũng so sánh kết quả dự báo mà nó
đưa ra với những kết quả thu được trong quá khứ, tính toán bình phương các sai số.
Quá trình dữ liệu được đưa từ neuron đầu vào, qua lớp neuron ẩn đến neuron đầu ra
để trả ra kết quả dự báo ban đầu được gọi bằng thuật ngữ Feedforward – tức dữ liệu
được đẩy lần lượt từ đầu vào đến đầu ra. Tiếp theo đó, bình phương các sai số sẽ
được tính toán và ANN sẽ đọc trên các sai số này, phản ánh sai số ngược lại vào hệ
thống của nó, từ đó điều chỉnh các tham số theo hướng tối thiểu hóa tổng bình
phương các sai số này. Bước phản hồi ngược sai số trở vào hệ thống của ANN để
điều chỉnh trọng số gọi là Backpropagation. Đây cũng chính là cơ chế hoạt động của
ANN theo kiểu Backpropagation được trình bày ở chương 2. Trong một quá trình
huấn luyện, MSE sẽ liên tục được cập nhật và ANN sẽ liên tục điều chỉnh các tham
số theo hướng cực tiểu hóa tổng bình phương này. Do dữ liệu đã được chuyển về
dạng dừng và có giá trị giao động xung quanh giá trị 0, do đó MSE của mô hình phải
nhỏ hơn 1% thì mới có thể xem là mô hình đã được huấn luyện tốt. Mặc khác, quá
trình đánh giá tính phù hợp của mô hình dự báo ngoài tiêu chuẩn MSE, ANN còn có
một tiêu chuẩn khác là mức độ giải thích của mô hình, chỉ số r – Square. Đây là hệ số
tương quan giữa giá trị dự báo ngoài mẫu của mô hình ANN với giá trị thực tế có
được từ tập hợp dữ liệu xác nhận tính hiệu quả. Hệ số tương quan này càng lớn nói
78
lên tính dự báo là có thể và cấu trúc ANN được sử dụng trong quá trình huấn luyện là
phù hợp cho công việc dự báo tương lai.
2.1.7. Huấn luyện hệ thống ANN
Quá trình huấn luyện ANN chủ yếu là để ANN đọc những dữ liệu trong quá khứ
nhiều lần. Trải qua quá trình huấn luyện, ANN có thể nhận ra mẫu hình tổng quát
đang tồn tại trong mối quan hệ giữa các biến đầu vào. Để huấn luyện ANN, trước
tiên cần xác định số lần Epoch 3 được ANN đọc lại trong huấn luyện.
Quá trình chạy mô hình để tìm ra những nhóm biến nào tác động mạnh nhất đến
VNI, đồng thời tìm ra mô hình thích hợp cho từng nhóm biến, đòi hỏi phải huấn
luyện nhiều lần trên mỗi mô hình – trung bình Epoch từ 3.000 đến 10.000 lần. Mỗi
1.000 lần huấn luyện, luận án lại dừng lại để kiểm tra xem mô hình đã tối ưu chưa và
có bị quá khít hay không. Nếu mô hình chưa đạt tối ưu và không bị khít thì luận án
tiếp tục cho huấn luyện tiếp cho đến khi nào mô hình đạt tối ưu – MSE < 1% và MSE
của mẫu xác nhận bắt đầu tăng. Nếu mô hình chưa đạt tối ưu và bị khít thì dừng quá
trình huấn luyện và làm lại từ đầu.
Sau mỗi lần chạy phân loại biến như trên, chúng ta luôn có giá trị MSE và ghi chú lại
trường hợp bị khít. Sau đó, ứng với mỗi nhóm biến chọn ra mô hình có MSE thấp
nhất. Cuối cùng, luận án đã tìm ra hai nhóm biến trong số 7 biến kinh tế vĩ mô có khả
năng dự báo tốt cho VNI nhất thỏa mãn tiêu chí đánh giá mô hình. Phụ lục “Quá trình
phân lại biến theo mô hình mạng ANN” cho ra kết quả của quá trình chạy mô hình
theo phân loại biến trên.
2.1.8. Kết quả sử dụng mô hình mạng ANN để dự báo VNIndex
Thực hiện các bước xử lý đã được trình bày ở các bước trên, luận án đã đưa ra hai
cấu trúc mạng ANN để phân tích và dự báo giá chứng khoán VNI với cách thức phân
loại biến với MSE nhỏ nhất như bảng 2.3.
Bảng 2.3: Hai cấu trúc mạng ANN cho ra kết quả dự báo tốt nhất
Mô hình INPUT Số PE
MSE
(Training)
MSE (CV) R Square
Mô hình 1 CPIIPM2CR 3 0,013783 0,131202 5,51%
Mô hình 2 LRIPTBCR 3 0,019331 0,073505 25,46%
3 Trong khoa học về ứng dụng ANN, một tập hợp gồm toàn bộ các mẫu dữ liệu được gọi bằng thuật
ngữ Epoch. Mỗi mẫu trong bộ dữ liệu được gọi bằng tên Exemplar.
79
Điều đáng chú ý là MSE được thực hiện trong quá trình huấn luyện dữ liệu cho ra kết
quả thấp nhất cho các biến đưa vào mô hình trong quá trình phân loại biến. Kết quả
mô hình 1 có MSE thấp hơn mô hình 2. Nói cách khác, việc giải thích cho sự thay
đổi trong VNI thời gian qua trên TTCK VN do tác động của các biến: lạm phát, sản
lượng công nghiệp, cung tiền M2 và tăng trưởng tín dụng của nền kinh tế. Tuy nhiên,
khi sử dụng mô hình đã được huấn luyện để tiến hành dự báo ngoài mẫu từ dữ liệu
kiểm tra thì mô hình 1 có sai số lớn hơn mô hình 2. Điều quan trọng mô hình 2 cho
ra hệ số tương quan (rSquare.) cao hơn giữa giá trị dự báo và giá trị thực tế của VNI.
Nói cách khác mô hình 2: tác động của lãi suất, sản lượng công nghiệp, cán cân
thương mại và tăng trưởng tín dụng sẽ là những biến có thể dự báo tốt nhất cho VNI.
Mối quan hệ giữa giá trị dự báo và giá trị thực tế dù chỉ ở mức độ giải thích thấp
25,46% nhưng đã nói lên khả năng dự báo chiều hướng của VNI. Hình 2.2 cho thấy
kết quả quá trình dự báo ngoài mẫu của VNI.
Hình 2.2: Kết quả dự báo theo mô hình ANN và thực tế của VNI trong mô hình
1 và mô hình 2
Như vậy, có thể thấy rằng khi đưa các biến kinh tế vĩ mô vào để phân tích và dự báo
giá chứng khoán của TTCK VN thì mức độ giải thích và khả năng dự báo của mô
hình còn nhiều hạn chế, giá trị dự báo chưa cao. Một vấn đề đặt ra là phải chăng cấu
trúc mạng ANN trên chưa giải thích được tác động của các biến đầu vào này lên sự
thay đổi của VNI trong thời gian qua? Hoặc mô hình ANN không hiệu quả hơn mô
hình hồi quy tuyến tính truyền thống? Phần tiếp theo, luận án tiếp tục thay đổi cấu
trúc mạng ANN và so sánh với mô hình hồi quy tuyến tính.
Mô hình 1 Mô hình 2
80
2.2. Sử dụng mạng thần kinh nhân tạo được khái quát hóa và mạng truyền
thẳng để dự báo giá chứng khoán với nhóm biến kinh tế vĩ mô
2.2.1. Dự báo giá chứng khoán bằng cấu trúc mạng thần kinh nhân tạo được
khái quát hóa
Với bộ cơ sở dữ liệu được thu thập và xử lý như trên, phần tiếp theo sẽ đi vào quá
trình xây dựng cấu trúc mạng ANN cụ thể khác. Trong nghiên cứu của Reza G.
Ahagar và Mahmood Yahyazadehfar (2010), các tác giả đã sử dụng cấu trúc mạng
thần kinh nhân tạo được khái quát hóa (GRNN Generalized Regression Neural
Network) để dự báo giá chứng khoán. Cấu trúc này có phần khác so với cấu trúc
mạng truyền thẳng đa lớp mà trong chương 1 luận án đã trình bày, GRNN vốn được
sử dụng phổ biến trong các nghiên cứu về mạng thần kinh ở chổ các neuron của mỗi
lớp trong hệ thống không chỉ kết nối với neuron của lớp ngay trước và sau nó mà còn
được kết nối với các neuron của những lớp ẩn khác.
Về cấu trúc của mô hình mạng thì bài nghiên cứu trên chỉ xây dựng cấu trúc mạng
một lớp ẩn duy nhất với 14 neuron và sử dụng thuật toán LevenbergMarquardt (LM)
để tiến hành điều chỉnh các trọng số trong quá trình huấn luyện nhằm đạt đến mục
tiêu tối thiểu hóa MSE giữa giá trị dự báo của mô hình với giá trị thực tế. Thuật toán
này là một trong những công cụ được sử dụng nhiều nhất đối với các bài toán tối ưu
hóa phi tuyến. Đây được xem là sự kết hợp giữa phương pháp GaussNewton với
phương pháp Gradient thông thường (Manolis, 2005).
Luận án ký hiệu cho mô hình trên là GNN14PE. Vấn đề tiếp theo trước khi đi vào
huấn luyện cho cấu trúc mạng ANN này là cần phải phân chia bộ dữ liệu thành ba
phần: tập hợp các quan sát dùng để huấn luyện hệ thống ANN, tập hợp các quan sát
để xác nhận và cuối cùng là tập hợp các quan sát sử dụng để kiểm tra lại (kiểm định
ngoài mẫu). Phần nghiên cứu này sẽ sử dụng tỷ lệ của ba tập hợp này lần lượt là
70%, 20% và 10%. Thực tế là không có nguyên tắc chung nào cho sự phân chia này
và tỷ lệ trên là gợi ý trong nghiên cứu của Jing Tao (2000). Tuy nhiên, với số lượng
mẫu quan sát quá ít sẽ là một cảnh báo cho giá trị mô hình dự báo. Kết quả của quá
trình huấn luyện ANN theo cấu trúc mạng GNN14PE được cho ở bảng 2.4:
Bảng 2.4: Kết quả huấn luyện hệ thống mạng GNN14PE
Network Training Cross Validation
Minimum MSE 7,79431E31 0,142506795
Final MSE 7,79431E31 0,439504113
81
Tiếp đến luận án tiến hành kiểm định ngoài mẫu đối với mô hình dự báo trên sau khi
trải qua quá trình huấn luyện. Hình 2.3 và bảng 2.5 thể hiện kết quả dự báo ngoài
mẫu trong bộ dữ liệu kiểm tra.
Desired Output and Actual Network Output
-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
1 2 3 4 5 6 7 8 9 10
Exemplar
O
ut
pu
t
VNI
VNI Output
Hình 2.3: VNI dự báo từ mô hình GNN14PE so với VNI thực tế
Bảng 2.5: Kết quả kiểm định ngoài mẫu của mô hình GNN14PE
Performance VNI
MSE 0,028785546
NMSE 14,62732889
MAE 0,121311251
Min Abs Error 0,010482329
Max Abs Error 0,42990126
R 0,271785126
Với những kết quả trên, ta thấy rằng, cấu trúc mạng GRNN với cấu trúc một lớp ẩn
và 14 neuron ẩn đã cho kết quả rất tốt trong quá trình huấn luyện khi giá trị MSE
cuối cùng đạt đến 7,7943E31, một giá trị lý tưởng cho sự chênh lệch giữa giá trị dự
báo và thực tế. Tuy nhiên, khi tiến hành kiểm định ngoài mẫu đối với mô hình trên,
kết quả cho thấy sự hạn chế lớn của mô hình trong việc dự báo giá trị VNI. Đặc biệt
là chỉ số tương quan r, đặc trưng cho mối tương quan tuyến tính giữa chuỗi giá trị
VNI dự báo và thực tế là giá trị âm. Qua đó, có thể kết luận rằng, mô hình trên đã rơi
vào tình trạng “quá khít” trong khi huấn luyện, nhưng lại thiếu khả năng khái quát
hóa để phản ánh đầy đủ mối tương quan phi tuyến giữa các biến số.
Một vấn đề khác là số biến đưa vào mô hình cũng được xem xét tính trễ như trên đã
đề cập. Phần tiếp theo sau, luận án sẽ không khảo sát các biến được làm trễ, chỉ khảo
sát 7 biến như đã đề cập trong bảng 2.1. Tuy nhiên, số lượng PE trong lớp ẩn cũng
giảm đi nhiều.
82
Hình 2.4: Mô tả mạng GRNN với 4 neuron trong lớp ẩn GNN4PE
Để khắc phục tình trạng “quá khít” trong cấu trúc mạng GNN14PE, luận án đã tiến
hành điều chỉnh cấu trúc mạng, vẫn giữ nguyên các yếu tố khác nhưng số lượng
neuron ẩn sẽ lần lượt là 4 và 5, ký hiệu cho hai cấu trúc mạng này là GNN4PE
(minh họa trong hình 2.4 cho mạng GRNN) và GNN5PE, kết quả kiểm định ngoài
mẫu đối với 2 cấu trúc mạng trên lần lượt là:
Bảng 2.6: Kết quả kiểm định ngoài mẫu của cấu trúc GNN4PE và GNN5PE
Performance GNN4PE GNN5PE
MSE 0,03126959 0,024987342
NMSE 15,88959147 12,69727722
MAE 0,136603321 0,096066336
Min Abs Error 0,018306627 0,000908091
Max Abs Error 0,404865279 0,432749842
r 0,391779615 0,189219915
LR
USD
IP
TB
M2
CPI
CR
PE1
PE2
PE3
PE4
VNI
83
Hình 2.5: Giá trị VNI dự báo từ GNN4PE và GNN5PE với giá trị VNI thực tế
So sánh kết quả của cấu trúc GNN14PE với GNN4PE và GNN5PE rõ ràng là đã
có sự gia tăng trong hiệu quả dự báo, chủ yếu được thể hiện qua chỉ tiêu tương quan
tuyến tính giữa VNI thực tế và giá trị VNI dự báo của cấu trúc mạng, lần lượt ở mức
39,17% và 18,92%. Tuy nhiên, nếu so với mô hình ANN được trình bày trong phần
2.1 thì hiệu quả của cấu trúc mạng GNN4PE cho dự báo tốt hơn. Tuy nhiên, mức độ
giải thích của mạng vẫn chưa cao chỉ mới đạt 39,17%. Chính vì vậy, luận án tiếp tục
thay đổi cấu trúc mạng ANN khác để phân tích và dự báo sự tác động của các biến
kinh tế vĩ mô đến VNI.
2.2.2. Dự báo giá chứng khoán dựa trên phân tích tác động của các biến kinh tế
vĩ mô theo cấu trúc mạng truyền thẳng
Trong phần này luận án tiến hành thử nghiệm với cấu trúc mạng thần kinh khác để
kiểm tra tính hiệu quả của mô hình dự báo. Bên cạnh mạng thần kinh được khái quát
hóa như trên thì cấu trúc mạng được sử dụng phổ biến nhất vẫn là mạng ANN truyền
thẳng với một lớp ẩn. Lần lượt tiến hành huấn luyện mạng với cùng một cấu trúc dữ
liệu như trên nhưng thay đổi số neuron của lớp ẩn. Mạng ANN truyền thẳng, một lớp
ẩn với số neuron ẩn lần lượt là 2, 3, 4, 5 được ký hiệu: MFF2PE, MFF3PE, MFF
4PE, MFF5PE.
GNN4PE GNN5PE
84
Bảng 2.7: Kết quả dự báo ngoài mẫu theo cấu trúc mạng ANN truyền thẳng
MFF2PE, MFF3PE, MFF4PE, MFF5PE
Mô hình MFF2PE MFF3PE MFF4PE MFF5PE
MSE 0,009396214 0,003751625 0,005980783 0,00241921
MAE 0,065259439 0,042116996 0,057105411 0,038226213
r 0,316865644 0,370211421 0,433968335 0,653517847
Qua những kết quả trên, cấu trúc mạng truyền thẳng một lớp ẩn có khả năng dự báo
VNI tương đối tốt hơn so với cấu trúc mạng GRNN trên TTCK VN, đặc biệt là nếu
xét đến chỉ báo tương quan tuyến tính giữa giá trị VNI dự báo với VNI thực tế đạt
đến mức 65,35% trong trường hợp cấu trúc MFF5PE, chỉ tiêu MSE = 0,0024 và
MAE = 0,038 ở mức rất thấp.
Kết luận: Trong cấu trúc mạng ANN truyền thẳng một lớp ẩn với 5PE đã cho ra giá
trị dự báo VNI tốt nhất, và tốt hơn cả cấu trúc mạng GRNN. Đồng thời, cấu trúc
mạng ANN được thiết lập như mục 2.1 đã cho ra kết quả dự báo không tốt bằng cấu
trúc mạng truyền thẳng một lớp ẩn với 5PE. Nói cách khác, cấu trúc mạng truyền
thẳng sẽ thích hợp cho quá trình dự báo VNI. Tuy nhiên, vấn đề thứ tiếp theo là liệu
rằng mô hình mạng ANN dự báo tốt hơn so với mô hình hồi quy tuyến tính? Phần
tiếp theo, luận án sẽ đi vào chứng minh điều này.
2.2.3. So sánh khả năng dự báo giá chứng khoán của mô hình mạng thần kinh
nhân tạo với mô hình hồi quy tuyến tính
· Sử dụng mô hình mạng ANN không có lớp ẩn và hàm truyền tuyến tính
Trong phần này luận án sẽ tiến hành xây dựng mô hình tuyến tính (thể hiện mối quan
hệ giữa các biến) để có cơ sở so sánh giữa hai loại mô hình với nhau. Về bản chất,
mô hình tuyến tính là một trường hợp đặc biệt của mô hình mạng ANN khi hệ thống
mạng này không tồn tại lớp ẩn nào. Hàm truyền là một hàm tuyến tính thể hiện mối
quan hệ giữa các biến đầu vào với biến đầu ra. Với các dữ liệu đầu vào đã sử dụng ở
bảng 2.2, luận án tiến hành xây dựng mô hình tuyến tính bằng cách sử dụng hàm
truyền là hàm tuyến tính và không có lớp ẩn trong mô hình của mạng ANN. Mô hình
chỉ có một biến đầu ra là VNI và các biến đầu vào được đề cập ở bảng 2.2. Kết quả
85
của quá trình huấn luyện mô hình ANN này được thể hiện trong hình 2.6 và bảng
2.8.
86
Desired Output and Actual Network Output
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1 2 3 4 5 6 7 8 9 10
Exemplar
O
ut
pu
t
VNI
VNI Output
Hình 2.6: VNI thực tế và dự báo của cấu trúc mạng ANN tuyến tính
Bảng 2.8: Kết quả kiểm định ngoài mẫu của cấu trúc mạng ANN tuyến tính
Performance VNI
MSE 0,056213737
NMSE 28,56491985
MAE 0,142268143
Min Abs Error 0,00979236
Max Abs Error 0,672613418
r 0,026795475
Tổng hợp kết quả của các mô hình cho phép chúng ta đi đến kết luận rằng, khi sử
dụng các biến kinh tế vĩ mô để phân tích và dự báo giá chứng khoán trên TTCK VN,
cụ thể là chỉ số VNI, thì mô hình phi tuyến thật sự tỏ ra hiệu quả hơn so với mô hình
tuyến tính. Trước hết, so về chỉ tiêu MSE, giá trị của mô hình tuyến tính là 0,056, cao
hơn hẳn so với trường hợp các mô hình mạng ANN phi tuyến khi chỉ tiêu này nằm
trong khoảng từ 0,02 đến 0,09. Đặc biệt là nếu so với cấu trúc mạng MFF5PE, thì
chỉ tiêu MSE của mô hình tuyến tính đã cao hơn gấp đôi. Điều này đã cho thấy tập
hợp các giá trị sai số trong dự báo và thực tế của mô hình tuyến tính lớn hơn nhiều so
với mô hình mạng ANN nhất là mạng MFF5PE.
Sự vượt trội của mô hình phi tuyến còn thể hiện rõ hơn khi ta xem xét chỉ tiêu tương
quan giữa VNI thực tế và dự báo của mỗi mô hình. Chỉ tiêu này là 2,6% đối với mô
hình tuyến tính, điều này có nghĩa là giá trị VNI được dự báo của mô hình dường như
đi ngược lại với giá trị VNI thực tế. Trong khi đó, chỉ tiêu này đạt đến mức 65,35% ở
trường hợp MFF5PE. Tuy chưa thật sự là cao nhưng cũng đã đủ để chứng tỏ tính hạn
chế trong phân tích và dự báo của các mô hình tuyến tính.
87
Nếu như mạng MFF5PE cho ra kết quả dự báo ngoài mẫu tốt nhất, giá trị dự báo của
mạng và kết quả thực tế cho ra mối tương quan dương và tương quan khá cao, lên
đến 65,35% trong khi đó giá trị tương quan này trong mô hình tuyến tính là giá trị
âm. Nói cách khác, khi sử dụng mô hình tuyến tính để dự báo giá chứng khoán trên
TTCK VN sẽ không thể giải thích sự biến động này khi dựa trên những dữ liệu kinh
tế vĩ mô. Giá trị tương quan dự báo ngoài mẫu của mô hình tuyến tính đã cho thấy
kết quả của chiều hướng dự báo và giá trị thực tế dịch chuyển ngược nhau. Như vậy
phải chăng các biến kinh tế vĩ mô không thể tác động lên giá chứng khoán trên
TTCK VN nếu dựa trên mô hình hồi quy tuyến tính?. Có thể nói rằng, nếu thay đổi
mô hình thì mức độ biến động giá chứng khoán trên TTCK VN sẽ được giải thích
bằng các biến kinh tế vĩ mô.
· Sử dụng mô hình hồi quy tuyến tính truyền thống
Một phần của phụ lục 3 “Xây dựng mô hình hồi quy tuyến tính truyền thống để phân
tích và dự báo VNIndex” đã cho ra kết quả của việc sử dụng phương pháp hồi quy
tuyến tính trong việc dự báo VNI như sau:
Thứ nhất: Nếu tuân thủ yêu cầu giả định của phương pháp hồi quy tuyến tính
truyền thống thì các biến đưa vào mô hình phải tuân theo quy luật phân phối
chuẩn, các biến kinh tế vĩ mô khảo sát ở bảng 2.1 được đưa vào mô hình
không đạt được điều kiện này. Bảng 3 của phụ lục 3 đã minh chứng kết quả
này. Tuy nhiên, kết quả này có thể chấp nhận được khi chúng ta giả định
những quan sát được trong tương lai sẽ đủ để các biến số này tuân theo quy
luật phân phối chuẩn. Phương pháp thống kê chấp nhận giả định này để xây
dựng mô hình.
Thứ hai: Trong phần xây dựng mô hình hồi quy tuyến tính truyền thống và
kiểm định của phụ lục 3 đã cho ra kết quả:
1. Khi sử dụng hồi quy đơn biến để giải thích cho sự thay đổi trong VNI
thì không có mô hình hồi quy đơn biến nào có ý nghĩa thống kê. Nói
cách khác, không một biến kinh tế vĩ mô nào đưa vào mô hình có thể
giải thích cho sự thay đổi của VNI trong thời gian qua. Tuy nhiên, nếu
chúng ta điều chỉnh dữ liệu mang tính độ trễ một kỳ thì biến cung tiền –
M2 lại có thể giải thích cho sự thay đổi của VNI. Kết quả giải thích của
biến M2 rất thấp, chỉ là 2,83%.
2. Khi sử dụng hồi quy đa biến thì mô hình không có ý nghĩa thống kê, nói
cách khác, các hệ số hồi quy các nhân tố bằng không, không thể xây
88
dựng được mô hình hồi quy tuyến tính đa nhân tố từ các biến kinh tế vĩ
mô để giải thích cho sự thay đổi của VNI. Tuy nhiên, ngay cả khi sử
dụng các biến có độ trễ, phụ lục 3 cũng đã cho ra kết quả không thể xây
dựng mô hình hồi quy tuyến tính dựa trên bộ dữ liệu các biến kinh tế vĩ
mô đã điều chỉnh độ trễ.
Tóm lại, kết quả nghiên cứu này đã góp phần chứng minh được ưu thế vượt trội của
mô hình mạng ANN phi tuyến trong việc phân tích và dự báo giá chứng khoán trên
TTCK VN so với mô hình tuyến tính truyền thống trong trường hợp sử dụng các biến
số kinh tế vĩ mô làm nhập lượng đầu vào. Tuy nhiên, kết quả từ các mô hình mạng
ANN còn có một số hạn chế trong mức độ dự báo. Điều này một phần là do số lượng
quan sát được sử dụng để huấn luyện quá ít, trong tương lai, theo thời gian thì số
lượng quan sát sẽ nhiều và quá trình huấn luyện mạng ANN tốt lên và khả năng dự
báo càng chuẩn xác. Hoặc tính chất của các biến chưa đủ để giải thích sự biến động
của giá chứng khoán; hoặc thậm chí do sự thiếu vắng thông tin trên TTCK; hoặc tác
động của yếu tố tâm lý, hành vi của nhà đầu tư tham gia trên thị trường chi phối đến
các quyết định đầu tư của các nhà đầu tư trên TTCK VN thời gian qua?... Phần tiếp
theo của luận án sẽ khảo sát các nhóm biến khác được đưa vào mô hình mạng ANN
và so sánh chúng với mô hình hồi quy tuyến tính.
2.3. Sự vượt trội của mô hình mạng thần kinh nhân tạo so với mô hình hồi
quy tuyến tính khi sử dụng các biến số tài chính
Bên cạnh các biến kinh tế vĩ mô thì các biến phản ánh tình hình tài chính của các
doanh nghiệp niêm yết cũng thường được sử dụng làm nhập lượng đầu vào cho các
mô hình dự báo tỷ suất sinh lợi của các tài sản tài chính trên TTCK. Nghiên cứu của
Fama và French (1992) dựa trên các chứng khoán sàn giao dịch New York trong giai
đoạn từ 1963 đến 1990 đã đưa ra kết luận về sự tồn tại mối tương quan giữa tỷ suất
sinh lợi chứng khoán với các tỷ số tài chính như: tỷ số giá/giá trị sổ sách (P/B), tỷ số
giá/thu nhập mỗi cổ phần (P/E)… Trong những năm sau đó, nhiều nghiên cứu sử
dụng những phương pháp kiểm định khác nhau đã đi đến kết luận về sự hạn chế
trong khả năng dự báo của các tỷ số này. Tuy nhiên, John Y. Campbell và Motohiro
Yogo (2003) đã đưa ra một phương pháp kiểm định mới, củng cố cho kết luận về khả
năng dự báo của các tỷ số tài chính: cổ tức/giá và giá/thu nhập mỗi cổ phần.
Bên cạnh các biến số đầu vào thì loại mô hình được sử dụng cũng sẽ ảnh hưởng đến
kết quả cuối cùng của quá trình phân tích và dự báo. Mặc dù phần lớn các nghiên cứu
trước đây đều chỉ ra mối quan hệ tuyến tính giữa các tỷ số tài chính và tỷ suất sinh
89
lợi của chứng khoán. Tuy nhiên, thực tế là các mô hình phi tuyến sẽ có khả năng mô
tả chính xác hơn mối tương quan giữa hai yếu tố này. Nghiên cứu của Mohammed
Omran (2002), dựa trên mẫu dữ liệu từ năm 1996 đến 2000 của 46 doanh nghiệp trên
thị trường Ai Cập đã góp phần minh chứng cho kết luận này. Tương tự, nghiên cứu
của Reza Gharoie Ahangar (2010) sử dụng mô hình phi tuyến cũng đã cho kết quả dự
báo tốt hơn so với mô hình tuyến tính thông thường. Bài nghiên cứu sử dụng mẫu dữ
liệu của các công ty niêm yết trên sàn giao dịch Tehran và mô hình phi tuyến được
lựa chọn là mô hình mạng ANN.
Dựa trên nền tảng đó, phần nghiên cứu này của luận án sẽ thiết lập hai loại mô hình
dự báo khác nhau sử dụng các tỷ số tài chính làm nhập lượng đầu vào để phân tích và
dự báo tỷ suất sinh lợi của chỉ số VNIndex trên TTCK VN. Trước hết, mô hình
tuyến tính truyền thống sẽ được sử dụng như một mô hình chuẩn. Sau đó, các cấu
trúc mạng ANN phi tuyến khác nhau được xây dựng và kết quả dự báo của những
cấu trúc mạng này sẽ được so sánh với mô hình tuyến tính đã được thiết lập.
Nhập lượng đầu vào bao gồm các biến tỷ số tài chính lần lượt là: tỷ suất sinh lợi trên
vốn cổ phần ROE, tỷ suất sinh lợi trên tổng tài sản ROA, tỷ số giá trên thu nhập
mỗi cổ phần PE, tỷ số giá trên giá trị sổ sách mỗi cổ phần PB, giá trị vốn hóa của
thị trường – CM, dòng tiền mỗi cổ phần – CF, thu nhập mỗi cổ phần – EPS, lợi
nhuận biên – PM, và tỷ lệ nợ trên vốn cổ phần – D/E. Bộ dữ liệu theo tháng được thu
thập từ Sở giao dịch chứng khoán Tp.HCM và Bloomberg
Các file đính kèm theo tài liệu này:
- NV887427.pdf