Luận án Ứng dụng mô hình mạng thần kinh nhân tạo trong dự báo kinh tế - Trường hợp thị trường chứng khoán Việt Nam

Mô  h ình  mạng  ANN  được  đ ưa  ra  và  ứng  dụng   lần   đầu  tiê n  trong  lĩnh  vực  khoa  họ c 

nhận  th ức  và  tích  hợp   trí  tu ệ nhân  tạo  vào  kỹ thuật.  Qua  thời  gian,  ANN  đã  được  sử 

dụng  rộng  rã i  trong   nhiều   l ĩnh  vực  khoa  học,  trong   đó  có  dự  báo   kinh  tế.  Trải  qua 

nhiều ngh iên  cứu thực nghiệm, ANN tỏ   ra  là  một  phương  pháp có t ính  linh hoạ t vượt 

trộ i  so  với các ph ương ph áp đã từng được sử dụng   trong  quá khứ.  Trong những năm 

gần   đây,  các  ứng  dụng   của  ANN  trong  lĩnh   vực  tà i  chính   như  nhận  diện  mẫu  hìn h, 

phân  loại,  và  d ự  bá o  theo  chuỗi  th ời  gian  ngày  càng   gia  tăng   nhanh   chóng   và  nhận 

được  nhiều  sự  quan  tâm  của  cả   giới  nghiên  cứu  hàn  lâm  cũng  nh ư  thực  nghiệm. 

Thực  tế  đã  cho  thấy,  các  tổ   chức  cu ng  cấp   dịch  vụ  tài   chính   đ ang   trở  thành  nhà  tà i 

trợ lớn  thứ hai  cung cấp  nguồn  lực hỗ  trợ cho công tác ngh iên cứu các ứng dụng  của 

ANN. Nh ững ứng  dụng phổ  biến của  ANN trong  lĩnh vực tài chính bao gồm xếp hạng 

rủ i  ro  trong  thẩm định các  khoản   cho vay  thế chấp   cũng  như  trong   cá c  khoản  đầu   tư 

vào   chứng  khoán   nợ,  xâ y d ựng  chỉ   số ,  mô ph ỏng  hành  vi  th ị  trường,  lựa   chọn  và  đa 

dạng h óa danh mục đầ u tư,  nhận d iện  cơ chế tác động của  cá c biến giả i th ích  kinh t ế 

cũng như dự báo  cá c chuỗi dữ liệu g iá chứng khoán  theo th ời g ian. 

pdf179 trang | Chia sẻ: maiphuongdc | Lượt xem: 3470 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Luận án Ứng dụng mô hình mạng thần kinh nhân tạo trong dự báo kinh tế - Trường hợp thị trường chứng khoán Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
đây có nhiều nhà nghiên cứu đưa ra số lượng PE phù hợp khác  nhau. Baily và Thompson (1990) cho rằng, số lượng PE phù hợp được sử dụng nên  xấp xỉ 75% số lượng neuron đầu vào. Katz (1992) cũng đã cho ra nhận định rằng, số  lượng PE của  lớp ẩn phù hợp nên nằm  trong khoảng  từ ½ đến gấp 3  lần  số  lượng  neuron đầu vào. Tuy nhiên, Kaastra  và M. Boyd  (1996)  đưa  ra nguyên  tắc  cơ  bản  trong lựa chọn số lượng PE của lớp ẩn. Theo đó, đối với một hệ thống ANN bao gồm  n neuron đầu vào và m neuron đầu ra, số lượng PE của lớp ẩn phù hợp nên sử dụng  xấp xỉ căn bậc hai của tích số n x m. Số lượng neuron được sử dụng có thể nằm trong  khoảng từ ½ đến 2 lần kết quả vừa nêu tùy thuộc vào mức độ phức tạp của vấn đề  nghiên cứu. Do đó lựa chọn của luận án cũng phù hợp với các nghiên cứu trên. ·  Axon thứ ba là BiasAxon cho ra giá trị đầu ra của cả mô hình, có chứa một PE  và cho ra giá trị VNI dự báo. Axon này chứa một hàm tuyến tính, hàm tuyến 77  tính này giải quyết vấn đề giới hạn trong dữ liệu đầu vào và đảm bảo mức độ  tổng quát hóa của đầu ra dự báo.  Mô hình có hai hệ thống đường liên kết đầy đủ, hệ thống đầu tiên nối lớp đầu vào với  lớp ẩn, hệ  thống thứ hai nối  lớp ẩn với  lớp đầu ra. Mỗi hệ thống là  tập hợp những  trọng số, những trọng số này sẽ kết hợp với đầu ra của lớp phía trước hệ thống tạo  thành đầu vào cho lớp phía sau hệ thống. Các liên kết này được kết hợp thông qua  một  hàm  truyền  được  đề  cập  ở  trên.  Ngoài  ra,  mô  hình  sử  dụng  thuật  toán  BackPropagation  kết  hợp  với Momentum  để  điều  chỉnh  trọng  số  của mô hình  và  giảm thiểu sai số nhằm tìm được mô hình tối ưu.  Bởi vì, mô hình ANN học hỏi mối quan hệ của đầu vào và đầu ra thông qua các lớp ẩn.  Do đó, sự tác động của mỗi biến đầu vào với đầu ra là không rõ ràng. Mặt khác, các  biến đầu vào trong mô hình còn tác động lẫn nhau càng làm cho việc nhận ra những  biến nào tác động thật sự đến đầu ra của mô hình vô cùng khó khăn. Mô hình ANN  không giống mô hình tuyến tính, mô hình tuyến tính xem tác động của các biến đầu  vào với đầu ra là tác động cộng gộp, trong khi đó ANN học hỏi các quan hệ phi tuyến.  Do những lý do trên nên luận án sử dụng cách xem xét tác động của đầu vào đến đầu  ra bằng cách xem xét tác động gộp của từng nhóm biến lên đầu ra mong muốn.  2.1.6.  Tiêu chuẩn đánh giá tính phù hợp kết quả dự báo của ANN  Tương tự như trong hồi quy truyền thống, ANN cũng so sánh kết quả dự báo mà nó  đưa ra với những kết quả thu được trong quá khứ, tính toán bình phương các sai số.  Quá trình dữ liệu được đưa từ neuron đầu vào, qua lớp neuron ẩn đến neuron đầu ra  để trả ra kết quả dự báo ban đầu được gọi bằng thuật ngữ Feedforward – tức dữ liệu  được đẩy  lần  lượt  từ đầu  vào đến đầu  ra. Tiếp  theo đó, bình phương  các  sai  số  sẽ  được tính toán và ANN sẽ đọc trên các sai số này, phản ánh sai số ngược lại vào hệ  thống  của  nó,  từ  đó  điều  chỉnh  các  tham  số  theo  hướng  tối  thiểu  hóa  tổng  bình  phương các  sai  số này. Bước phản hồi ngược sai  số trở vào hệ  thống của ANN để  điều chỉnh trọng số gọi là Backpropagation. Đây cũng chính là cơ chế hoạt động của  ANN theo kiểu Backpropagation  được  trình  bày ở chương 2. Trong một  quá  trình  huấn luyện, MSE sẽ liên tục được cập nhật và ANN sẽ liên tục điều chỉnh các tham  số  theo hướng  cực  tiểu hóa  tổng bình phương này. Do dữ  liệu  đã được  chuyển  về  dạng dừng và có giá trị giao động xung quanh giá trị 0, do đó MSE của mô hình phải  nhỏ hơn 1% thì mới có thể xem là mô hình đã được huấn luyện tốt. Mặc khác, quá  trình đánh giá tính phù hợp của mô hình dự báo ngoài tiêu chuẩn MSE, ANN còn có  một tiêu chuẩn khác là mức độ giải thích của mô hình, chỉ số r – Square. Đây là hệ số  tương quan giữa giá  trị dự báo ngoài mẫu của mô hình ANN với giá trị  thực  tế có  được từ tập hợp dữ liệu xác nhận tính hiệu quả. Hệ số tương quan này càng lớn nói 78  lên tính dự báo là có thể và cấu trúc ANN được sử dụng trong quá trình huấn luyện là  phù hợp cho công việc dự báo tương lai.  2.1.7.  Huấn luyện hệ thống ANN  Quá  trình huấn  luyện ANN chủ yếu  là  để ANN đọc những dữ  liệu  trong  quá khứ  nhiều  lần. Trải qua quá  trình huấn  luyện, ANN có  thể nhận  ra mẫu hình  tổng quát  đang  tồn  tại  trong mối quan hệ giữa các biến đầu vào. Để huấn luyện ANN,  trước  tiên cần xác định số lần Epoch 3 được ANN đọc lại trong huấn luyện.  Quá  trình  chạy mô  hình  để  tìm  ra  những nhóm biến  nào  tác  động mạnh nhất  đến  VNI,  đồng  thời  tìm  ra mô hình  thích  hợp  cho  từng nhóm biến,  đòi  hỏi phải huấn  luyện nhiều lần trên mỗi mô hình – trung bình Epoch từ 3.000 đến 10.000 lần. Mỗi  1.000 lần huấn luyện, luận án lại dừng lại để kiểm tra xem mô hình đã tối ưu chưa và  có bị quá khít hay không. Nếu mô hình chưa đạt tối ưu và không bị khít thì luận án  tiếp tục cho huấn luyện tiếp cho đến khi nào mô hình đạt tối ưu – MSE < 1% và MSE  của mẫu xác nhận bắt đầu tăng. Nếu mô hình chưa đạt tối ưu và bị khít thì dừng quá  trình huấn luyện và làm lại từ đầu.  Sau mỗi lần chạy phân loại biến như trên, chúng ta luôn có giá trị MSE và ghi chú lại  trường hợp bị khít.  Sau đó, ứng  với mỗi nhóm biến  chọn  ra mô hình  có MSE  thấp  nhất. Cuối cùng, luận án đã tìm ra hai nhóm biến trong số 7 biến kinh tế vĩ mô có khả  năng dự báo tốt cho VNI nhất thỏa mãn tiêu chí đánh giá mô hình. Phụ lục “Quá trình  phân  lại biến theo mô hình mạng ANN” cho ra kết quả của quá  trình chạy mô hình  theo phân loại biến trên.  2.1.8.  Kết quả sử dụng mô hình mạng ANN để dự báo VN­Index  Thực hiện các bước xử lý đã được trình bày ở các bước trên,  luận án đã đưa ra hai  cấu trúc mạng ANN để phân tích và dự báo giá chứng khoán VNI với cách thức phân  loại biến với MSE nhỏ nhất như bảng 2.3.  Bảng 2.3: Hai cấu trúc mạng ANN cho ra kết quả dự báo tốt nhất  Mô hình  INPUT  Số PE  MSE  (Training)  MSE (CV)  R ­ Square  Mô hình 1  CPI­IP­M2­CR  3  0,013783  0,131202  5,51%  Mô hình 2  LR­IP­TB­CR  3  0,019331  0,073505  25,46%  3  Trong khoa học về ứng dụng ANN, một tập hợp gồm  toàn bộ các mẫu dữ liệu được gọi bằng thuật  ngữ Epoch. Mỗi mẫu trong bộ dữ liệu được gọi bằng tên Exemplar. 79  Điều đáng chú ý là MSE được thực hiện trong quá trình huấn luyện dữ liệu cho ra kết  quả thấp nhất cho các biến đưa vào mô hình trong quá trình phân loại biến. Kết quả  mô hình 1 có MSE thấp hơn mô hình 2. Nói cách khác, việc giải  thích cho sự thay  đổi trong VNI thời gian qua trên TTCK VN do tác động của các biến: lạm phát, sản  lượng công nghiệp, cung tiền M2 và tăng trưởng tín dụng của nền kinh tế. Tuy nhiên,  khi sử dụng mô hình đã được huấn luyện để tiến hành dự báo ngoài mẫu từ dữ liệu  kiểm tra thì mô hình 1 có sai số lớn hơn mô hình 2. Điều quan trọng mô hình 2 cho  ra hệ số tương quan (r­Square.) cao hơn giữa giá trị dự báo và giá trị thực tế của VNI.  Nói  cách  khác mô  hình  2:  tác  động  của  lãi  suất,  sản  lượng  công nghiệp,  cán  cân  thương mại và tăng trưởng tín dụng sẽ là những biến có thể dự báo tốt nhất cho VNI.  Mối quan hệ giữa giá  trị dự báo và giá  trị  thực  tế dù chỉ ở mức độ giải  thích  thấp  25,46% nhưng đã nói lên khả năng dự báo chiều hướng của VNI. Hình 2.2 cho thấy  kết quả quá trình dự báo ngoài mẫu của VNI.  Hình 2.2: Kết quả dự báo theo mô hình ANN và thực tế của VNI trong mô hình  1 và mô hình 2  Như vậy, có thể thấy rằng khi đưa các biến kinh tế vĩ mô vào để phân tích và dự báo  giá chứng khoán của TTCK VN thì mức độ giải  thích và khả năng dự báo của mô  hình còn nhiều hạn chế, giá trị dự báo chưa cao. Một vấn đề đặt ra là phải chăng cấu  trúc mạng ANN trên chưa giải thích được tác động của các biến đầu vào này lên sự  thay đổi của VNI trong thời gian qua? Hoặc mô hình ANN không hiệu quả hơn mô  hình hồi quy tuyến tính truyền thống? Phần tiếp theo,  luận án tiếp tục thay đổi cấu  trúc mạng ANN và so sánh với mô hình hồi quy tuyến tính.  Mô hình 1  Mô hình 2 80  2.2.  Sử dụng mạng thần kinh nhân  tạo được khái quát hóa và mạng  truyền  thẳng để dự báo giá chứng khoán với nhóm biến kinh tế vĩ mô  2.2.1.  Dự báo giá chứng khoán bằng  cấu  trúc mạng  thần kinh nhân  tạo được  khái quát hóa  Với bộ cơ sở dữ liệu được thu thập và xử lý như trên, phần tiếp theo sẽ đi vào quá  trình  xây  dựng  cấu  trúc mạng  ANN  cụ  thể  khác.  Trong  nghiên  cứu  của  Reza  G.  Ahagar và Mahmood Yahyazadehfar (2010), các  tác giả đã sử dụng cấu  trúc mạng  thần  kinh  nhân  tạo  được  khái  quát  hóa  (GRNN  ­  Generalized  Regression  Neural  Network)  để  dự  báo  giá  chứng khoán. Cấu  trúc  này  có phần  khác  so  với  cấu  trúc  mạng truyền thẳng đa lớp mà trong chương 1 luận án đã trình bày, GRNN vốn được  sử dụng phổ biến trong các nghiên cứu về mạng thần kinh ở chổ các neuron của mỗi  lớp trong hệ thống không chỉ kết nối với neuron của lớp ngay trước và sau nó mà còn  được kết nối với các neuron của những lớp ẩn khác.  Về cấu trúc của mô hình mạng thì bài nghiên cứu trên chỉ xây dựng cấu trúc mạng  một lớp ẩn duy nhất với 14 neuron và sử dụng thuật toán Levenberg­Marquardt (LM)  để tiến hành điều chỉnh các trọng số trong quá trình huấn luyện nhằm đạt đến mục  tiêu tối thiểu hóa MSE giữa giá trị dự báo của mô hình với giá trị thực tế. Thuật toán  này là một trong những công cụ được sử dụng nhiều nhất đối với các bài toán tối ưu  hóa  phi  tuyến. Đây được  xem  là  sự  kết  hợp giữa  phương pháp Gauss­Newton với  phương pháp Gradient thông thường (Manolis, 2005).  Luận án ký hiệu cho mô hình trên là GNN­14PE. Vấn đề tiếp theo trước khi đi vào  huấn luyện cho cấu trúc mạng ANN này là cần phải phân chia bộ dữ liệu thành ba  phần: tập hợp các quan sát dùng để huấn luyện hệ thống ANN, tập hợp các quan sát  để xác nhận và cuối cùng là tập hợp các quan sát sử dụng để kiểm tra lại (kiểm định  ngoài mẫu). Phần nghiên  cứu này  sẽ  sử  dụng  tỷ  lệ  của  ba  tập hợp này  lần  lượt  là  70%, 20% và 10%. Thực tế là không có nguyên tắc chung nào cho sự phân chia này  và tỷ lệ trên là gợi ý trong nghiên cứu của Jing Tao (2000). Tuy nhiên, với số lượng  mẫu quan sát quá ít sẽ là một cảnh báo cho giá trị mô hình dự báo. Kết quả của quá  trình huấn luyện ANN theo cấu trúc mạng GNN­14PE được cho ở bảng 2.4:  Bảng 2.4: Kết quả huấn luyện hệ thống mạng GNN­14PE  Network  Training  Cross Validation  Minimum MSE  7,79431E­31  0,142506795  Final MSE  7,79431E­31  0,439504113 81  Tiếp đến luận án tiến hành kiểm định ngoài mẫu đối với mô hình dự báo trên sau khi  trải qua quá  trình huấn  luyện. Hình  2.3 và bảng 2.5  thể hiện kết quả dự báo ngoài  mẫu trong bộ dữ liệu kiểm tra. Desired Output and Actual Network Output -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 1 2 3 4 5 6 7 8 9 10 Exemplar O ut pu t VNI VNI Output  Hình 2.3: VNI dự báo từ mô hình GNN­14PE so với VNI thực tế  Bảng 2.5: Kết quả kiểm định ngoài mẫu của mô hình GNN­14PE  Performance  VNI  MSE  0,028785546  NMSE  14,62732889  MAE  0,121311251  Min Abs Error  0,010482329  Max Abs Error  0,42990126  R  ­0,271785126  Với những kết quả trên, ta thấy rằng, cấu trúc mạng GRNN với cấu trúc một lớp ẩn  và 14 neuron  ẩn đã cho kết quả rất  tốt  trong quá  trình huấn  luyện khi giá  trị MSE  cuối cùng đạt đến 7,7943E­31, một giá trị lý tưởng cho sự chênh lệch giữa giá trị dự  báo và thực tế. Tuy nhiên, khi tiến hành kiểm định ngoài mẫu đối với mô hình trên,  kết quả cho thấy sự hạn chế lớn của mô hình trong việc dự báo giá trị VNI. Đặc biệt  là chỉ số tương quan ­ r, đặc trưng cho mối tương quan tuyến tính giữa chuỗi giá trị  VNI dự báo và thực tế là giá trị âm. Qua đó, có thể kết luận rằng, mô hình trên đã rơi  vào  tình trạng “quá khít”  trong khi huấn  luyện, nhưng  lại  thiếu khả năng khái quát  hóa để phản ánh đầy đủ mối tương quan phi tuyến giữa các biến số.  Một vấn đề khác là số biến đưa vào mô hình cũng được xem xét tính trễ như trên đã  đề cập. Phần tiếp theo sau, luận án sẽ không khảo sát các biến được làm trễ, chỉ khảo  sát 7 biến như đã đề cập trong bảng 2.1. Tuy nhiên, số lượng PE trong lớp ẩn cũng  giảm đi nhiều. 82  Hình 2.4: Mô tả mạng GRNN với 4 neuron trong lớp ẩn GNN­4PE  Để khắc phục tình trạng “quá khít” trong cấu trúc mạng GNN­14PE, luận án đã tiến  hành  điều  chỉnh  cấu  trúc mạng,  vẫn  giữ  nguyên  các  yếu  tố  khác  nhưng  số  lượng  neuron  ẩn  sẽ  lần  lượt  là  4  và  5,  ký  hiệu  cho  hai  cấu  trúc mạng này  là GNN­4PE  (minh họa trong hình 2.4 cho mạng GRNN) và GNN­5PE, kết quả kiểm định ngoài  mẫu đối với 2 cấu trúc mạng trên lần lượt là:  Bảng 2.6: Kết quả kiểm định ngoài mẫu của cấu trúc GNN­4PE và GNN­5PE  Performance  GNN­4PE  GNN­5PE  MSE  0,03126959  0,024987342  NMSE  15,88959147  12,69727722  MAE  0,136603321  0,096066336  Min Abs Error  0,018306627  0,000908091  Max Abs Error  0,404865279  0,432749842  r  0,391779615  0,189219915  LR  USD  IP  TB  M2  CPI  CR  PE1  PE2  PE3  PE4  VNI 83  Hình 2.5: Giá trị VNI dự báo từ GNN­4PE và GNN­5PE với giá trị VNI thực tế  So sánh kết quả của cấu trúc GNN­14PE với GNN­4PE và GNN­5PE rõ ràng là đã  có sự gia tăng trong hiệu quả dự báo, chủ yếu được thể hiện qua chỉ tiêu tương quan  tuyến tính giữa VNI thực tế và giá trị VNI dự báo của cấu trúc mạng, lần lượt ở mức  39,17% và 18,92%. Tuy nhiên, nếu so với mô hình ANN được trình bày trong phần  2.1 thì hiệu quả của cấu trúc mạng GNN­4PE cho dự báo tốt hơn. Tuy nhiên, mức độ  giải thích của mạng vẫn chưa cao chỉ mới đạt 39,17%. Chính vì vậy, luận án tiếp tục  thay đổi cấu trúc mạng ANN khác để phân tích và dự báo sự tác động của các biến  kinh tế vĩ mô đến VNI.  2.2.2.  Dự báo giá chứng khoán dựa trên phân tích tác động của các biến kinh tế  vĩ mô theo cấu trúc mạng truyền thẳng  Trong phần này luận án tiến hành thử nghiệm với cấu trúc mạng thần kinh khác để  kiểm tra tính hiệu quả của mô hình dự báo. Bên cạnh mạng thần kinh được khái quát  hóa như trên thì cấu trúc mạng được sử dụng phổ biến nhất vẫn là mạng ANN truyền  thẳng với một lớp ẩn. Lần lượt tiến hành huấn luyện mạng với cùng một cấu trúc dữ  liệu như trên nhưng thay đổi số neuron của lớp ẩn. Mạng ANN truyền thẳng, một lớp  ẩn với số neuron ẩn lần lượt là 2, 3, 4, 5 được ký hiệu: MFF­2PE, MFF­3PE, MFF­  4PE, MFF­5PE.  GNN­4PE  GNN­5PE 84  Bảng  2.7: Kết quả  dự  báo ngoài mẫu  theo  cấu  trúc mạng ANN  truyền  thẳng  MFF­2PE, MFF­3PE, MFF­4PE, MFF­5PE  Mô hình  MFF­2PE  MFF­3PE  MFF­4PE  MFF­5PE  MSE  0,009396214  0,003751625  0,005980783  0,00241921  MAE  0,065259439  0,042116996  0,057105411  0,038226213  r  0,316865644  0,370211421  0,433968335  0,653517847  Qua những kết quả trên, cấu trúc mạng truyền thẳng một lớp ẩn có khả năng dự báo  VNI tương đối tốt hơn so với cấu trúc mạng GRNN trên TTCK VN, đặc biệt là nếu  xét đến chỉ báo tương quan tuyến tính giữa giá trị VNI dự báo với VNI thực tế đạt  đến mức 65,35%  trong  trường hợp  cấu  trúc MFF­5PE,  chỉ  tiêu MSE = 0,0024  và  MAE = 0,038 ở mức rất thấp.  Kết luận: Trong cấu trúc mạng ANN truyền thẳng một lớp ẩn với 5PE đã cho ra giá  trị dự  báo VNI  tốt  nhất,  và  tốt  hơn cả  cấu  trúc mạng GRNN. Đồng  thời,  cấu  trúc  mạng ANN được thiết lập như mục 2.1 đã cho ra kết quả dự báo không tốt bằng cấu  trúc mạng  truyền  thẳng một  lớp  ẩn  với 5PE. Nói  cách  khác,  cấu  trúc mạng  truyền  thẳng sẽ thích hợp cho quá trình dự báo VNI. Tuy nhiên, vấn đề thứ tiếp theo là liệu  rằng mô hình mạng ANN dự báo tốt hơn so với mô hình hồi quy tuyến tính? Phần  tiếp theo, luận án sẽ đi vào chứng minh điều này.  2.2.3.  So sánh khả năng dự báo giá chứng khoán của mô hình mạng thần kinh  nhân tạo với mô hình hồi quy tuyến tính ·  Sử dụng mô hình mạng ANN không có lớp ẩn và hàm truyền tuyến tính  Trong phần này luận án sẽ tiến hành xây dựng mô hình tuyến tính (thể hiện mối quan  hệ giữa các biến) để có cơ sở so sánh giữa hai loại mô hình với nhau. Về bản chất,  mô hình tuyến tính là một trường hợp đặc biệt của mô hình mạng ANN khi hệ thống  mạng này không tồn tại lớp ẩn nào. Hàm truyền là một hàm tuyến tính thể hiện mối  quan hệ giữa các biến đầu vào với biến đầu ra. Với các dữ liệu đầu vào đã sử dụng ở  bảng 2.2,  luận  án  tiến hành  xây dựng mô hình  tuyến  tính bằng  cách  sử dụng hàm  truyền là hàm tuyến tính và không có lớp ẩn trong mô hình của mạng ANN. Mô hình  chỉ có một biến đầu ra là VNI và các biến đầu vào được đề cập ở bảng 2.2. Kết quả 85  của quá  trình huấn  luyện mô hình ANN này được  thể hiện  trong hình 2.6 và bảng  2.8. 86  Desired Output and Actual Network Output -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2 3 4 5 6 7 8 9 10 Exemplar O ut pu t VNI VNI Output  Hình 2.6: VNI thực tế và dự báo của cấu trúc mạng ANN tuyến tính  Bảng 2.8: Kết quả kiểm định ngoài mẫu của cấu trúc mạng ANN tuyến tính  Performance  VNI  MSE  0,056213737  NMSE  28,56491985  MAE  0,142268143  Min Abs Error  0,00979236  Max Abs Error  0,672613418  r  ­0,026795475  Tổng hợp kết quả của các mô hình cho phép chúng  ta đi đến kết  luận  rằng, khi  sử  dụng các biến kinh tế vĩ mô để phân tích và dự báo giá chứng khoán trên TTCK VN,  cụ thể là chỉ số VNI, thì mô hình phi tuyến thật sự tỏ ra hiệu quả hơn so với mô hình  tuyến tính. Trước hết, so về chỉ tiêu MSE, giá trị của mô hình tuyến tính là 0,056, cao  hơn hẳn so với trường hợp các mô hình mạng ANN phi tuyến khi chỉ tiêu này nằm  trong khoảng từ 0,02 đến 0,09. Đặc biệt  là nếu so với cấu trúc mạng MFF­5PE, thì  chỉ tiêu MSE của mô hình tuyến tính đã cao hơn gấp đôi. Điều này đã cho thấy tập  hợp các giá trị sai số trong dự báo và thực tế của mô hình tuyến tính lớn hơn nhiều so  với mô hình mạng ANN nhất là mạng MFF­5PE.  Sự vượt trội của mô hình phi tuyến còn thể hiện rõ hơn khi ta xem xét chỉ tiêu tương  quan giữa VNI thực tế và dự báo của mỗi mô hình. Chỉ tiêu này là ­2,6% đối với mô  hình tuyến tính, điều này có nghĩa là giá trị VNI được dự báo của mô hình dường như  đi ngược lại với giá trị VNI thực tế. Trong khi đó, chỉ tiêu này đạt đến mức 65,35% ở  trường hợp MFF­5PE. Tuy chưa thật sự là cao nhưng cũng đã đủ để chứng tỏ tính hạn  chế trong phân tích và dự báo của các mô hình tuyến tính. 87  Nếu như mạng MFF­5PE cho ra kết quả dự báo ngoài mẫu tốt nhất, giá trị dự báo của  mạng và kết quả thực tế cho ra mối  tương quan dương và tương quan khá cao,  lên  đến 65,35% trong khi đó giá trị  tương quan này trong mô hình tuyến tính là giá trị  âm. Nói cách khác, khi sử dụng mô hình tuyến tính để dự báo giá chứng khoán trên  TTCK VN sẽ không thể giải thích sự biến động này khi dựa trên những dữ liệu kinh  tế vĩ mô. Giá trị  tương quan dự báo ngoài mẫu của mô hình tuyến tính đã cho thấy  kết quả của chiều hướng dự báo và giá trị thực tế dịch chuyển ngược nhau. Như vậy  phải  chăng  các  biến  kinh  tế  vĩ  mô  không  thể  tác  động  lên  giá  chứng  khoán  trên  TTCK VN nếu dựa trên mô hình hồi quy tuyến tính?. Có thể nói rằng, nếu thay đổi  mô hình  thì mức độ biến động giá chứng khoán  trên TTCK VN sẽ được giải  thích  bằng các biến kinh tế vĩ mô. ·  Sử dụng mô hình hồi quy tuyến tính truyền thống  Một phần của phụ lục 3 “Xây dựng mô hình hồi quy tuyến tính truyền thống để phân  tích và dự báo VN­Index” đã cho ra kết quả của việc sử dụng phương pháp hồi quy  tuyến tính trong việc dự báo VNI như sau:  ­  Thứ nhất: Nếu tuân thủ yêu cầu giả định của phương pháp hồi quy tuyến tính  truyền thống thì các biến đưa vào mô hình phải tuân theo quy luật phân phối  chuẩn,  các  biến  kinh  tế  vĩ mô  khảo  sát  ở  bảng  2.1  được  đưa  vào mô  hình  không đạt được điều kiện này. Bảng 3 của phụ lục 3 đã minh chứng kết quả  này.  Tuy  nhiên,  kết  quả  này  có  thể  chấp  nhận  được  khi  chúng  ta  giả  định  những quan sát được trong tương lai sẽ đủ để các biến số này tuân theo quy  luật phân phối chuẩn. Phương pháp thống kê chấp nhận giả định này để xây  dựng mô hình.  ­  Thứ hai: Trong phần  xây dựng mô hình hồi quy  tuyến  tính  truyền  thống và  kiểm định của phụ lục 3 đã cho ra kết quả:  1.  Khi sử dụng hồi quy đơn biến để giải  thích cho sự thay đổi  trong VNI  thì không  có mô hình hồi quy  đơn biến nào có ý nghĩa  thống kê. Nói  cách khác, không một biến kinh  tế vĩ mô nào đưa vào mô hình có  thể  giải thích cho sự thay đổi của VNI trong thời gian qua. Tuy nhiên, nếu  chúng ta điều chỉnh dữ liệu mang tính độ trễ một kỳ thì biến cung tiền –  M2 lại có thể giải thích cho sự thay đổi của VNI. Kết quả giải thích của  biến M2 rất thấp, chỉ là 2,83%.  2.  Khi sử dụng hồi quy đa biến thì mô hình không có ý nghĩa thống kê, nói  cách  khác,  các  hệ  số  hồi  quy  các  nhân  tố  bằng  không,  không  thể  xây 88  dựng được mô hình hồi quy tuyến tính đa nhân tố từ các biến kinh tế vĩ  mô để giải  thích  cho  sự  thay  đổi của VNI. Tuy nhiên, ngay  cả  khi  sử  dụng các biến có độ trễ, phụ lục 3 cũng đã cho ra kết quả không thể xây  dựng mô hình hồi quy tuyến tính dựa trên bộ dữ liệu các biến kinh tế vĩ  mô đã điều chỉnh độ trễ.  Tóm lại, kết quả nghiên cứu này đã góp phần chứng minh được ưu thế vượt trội của  mô hình mạng ANN phi tuyến trong việc phân tích và dự báo giá chứng khoán trên  TTCK VN so với mô hình tuyến tính truyền thống trong trường hợp sử dụng các biến  số kinh tế vĩ mô làm nhập lượng đầu vào. Tuy nhiên, kết quả từ các mô hình mạng  ANN còn có một số hạn chế trong mức độ dự báo. Điều này một phần là do số lượng  quan  sát được sử dụng để  huấn  luyện quá  ít,  trong  tương  lai,  theo  thời gian  thì  số  lượng quan sát sẽ nhiều và quá trình huấn luyện mạng ANN tốt lên và khả năng dự  báo càng chuẩn xác. Hoặc tính chất của các biến chưa đủ để giải thích sự biến động  của giá chứng khoán; hoặc thậm chí do sự thiếu vắng thông tin trên TTCK; hoặc tác  động của yếu tố tâm lý, hành vi của nhà đầu tư tham gia trên thị trường chi phối đến  các quyết định đầu tư của các nhà đầu tư trên TTCK VN thời gian qua?... Phần tiếp  theo của luận án sẽ khảo sát các nhóm biến khác được đưa vào mô hình mạng ANN  và so sánh chúng với mô hình hồi quy tuyến tính.  2.3.  Sự vượt  trội  của mô hình mạng  thần kinh nhân  tạo  so  với mô hình hồi  quy tuyến tính khi sử dụng các biến số tài chính  Bên cạnh các biến kinh  tế vĩ mô  thì  các biến phản ánh  tình hình  tài  chính của các  doanh nghiệp niêm yết cũng thường được sử dụng làm nhập lượng đầu vào cho các  mô hình dự báo tỷ suất sinh lợi của các tài sản tài chính trên TTCK. Nghiên cứu của  Fama và French (1992) dựa trên các chứng khoán sàn giao dịch New York trong giai  đoạn từ 1963 đến 1990 đã đưa ra kết luận về sự tồn tại mối tương quan giữa tỷ suất  sinh lợi chứng khoán với các tỷ số tài chính như: tỷ số giá/giá trị sổ sách (P/B), tỷ số  giá/thu  nhập mỗi  cổ  phần  (P/E)… Trong những năm  sau  đó,  nhiều nghiên  cứu  sử  dụng  những  phương pháp  kiểm định  khác nhau  đã đi đến  kết  luận  về  sự  hạn  chế  trong khả năng dự báo của các tỷ số này. Tuy nhiên, John Y. Campbell và Motohiro  Yogo (2003) đã đưa ra một phương pháp kiểm định mới, củng cố cho kết luận về khả  năng dự báo của các tỷ số tài chính: cổ tức/giá và giá/thu nhập mỗi cổ phần.  Bên cạnh các biến số đầu vào thì loại mô hình được sử dụng cũng sẽ ảnh hưởng đến  kết quả cuối cùng của quá trình phân tích và dự báo. Mặc dù phần lớn các nghiên cứu  trước đây đều chỉ ra mối quan hệ tuyến tính giữa các tỷ số tài chính và tỷ suất sinh 89  lợi của chứng khoán. Tuy nhiên, thực tế là các mô hình phi tuyến sẽ có khả năng mô  tả chính xác hơn mối  tương quan giữa hai yếu tố này. Nghiên cứu của Mohammed  Omran (2002), dựa trên mẫu dữ liệu từ năm 1996 đến 2000 của 46 doanh nghiệp trên  thị trường Ai Cập đã góp phần minh chứng cho kết luận này. Tương tự, nghiên cứu  của Reza Gharoie Ahangar (2010) sử dụng mô hình phi tuyến cũng đã cho kết quả dự  báo tốt hơn so với mô hình tuyến tính thông thường. Bài nghiên cứu sử dụng mẫu dữ  liệu của các công ty niêm yết  trên sàn giao dịch Tehran và mô hình phi tuyến được  lựa chọn là mô hình mạng ANN.  Dựa trên nền tảng đó, phần nghiên cứu này của luận án sẽ thiết lập hai loại mô hình  dự báo khác nhau sử dụng các tỷ số tài chính làm nhập lượng đầu vào để phân tích và  dự  báo  tỷ  suất  sinh  lợi  của  chỉ  số VN­Index  trên  TTCK VN.  Trước  hết, mô hình  tuyến  tính  truyền  thống sẽ được sử dụng như một mô hình chuẩn. Sau đó, các cấu  trúc mạng ANN phi  tuyến khác nhau được xây dựng và kết quả dự báo của những  cấu trúc mạng này sẽ được so sánh với mô hình tuyến tính đã được thiết lập.  Nhập lượng đầu vào bao gồm các biến tỷ số tài chính lần lượt là: tỷ suất sinh lợi trên  vốn cổ phần ­ ROE, tỷ suất sinh lợi trên tổng tài sản  ­ ROA, tỷ số giá trên thu nhập  mỗi cổ phần ­ PE, tỷ số giá trên giá trị sổ sách mỗi cổ phần ­ PB, giá trị vốn hóa của  thị  trường –  CM,  dòng  tiền mỗi  cổ  phần  –  CF,  thu  nhập mỗi  cổ  phần  –  EPS,  lợi  nhuận biên – PM, và tỷ lệ nợ trên vốn cổ phần – D/E. Bộ dữ liệu theo tháng được thu  thập từ Sở giao dịch chứng khoán Tp.HCM và Bloomberg

Các file đính kèm theo tài liệu này:

  • pdfNV887427.pdf
Tài liệu liên quan