Bài thuyết trình Dự báo thị trường chứng khoán dựa trên khai phá dữ liệu Tweeter - Phạm Huyền Trang

Phân tích mối quan hệ nhân quả giữa tâm trạng và giá DJIA (cont.)

Ý nghĩa:

Đo độ trễ cảm xúc so với chứng khoán, tức là nên đo cảm xúc của ngày thứ bao nhiêu ( i – n) để dự đoán giá chứng khoán ngày i (tác giả chọn giá trị này là 3 ngày))

Giá trị p-values < 0.05

=> Bác bỏ giả thuyết null: chuỗi tâm trạng của người dùng không thể dự đoán được giá trị DJIA

Dự đoán thị trường chứng khoán

Sử dụng mô hình Self-organizing Fuzzy neural Network(SOFNN) để dự đoán giá trị DJIA trên 2 tập đầu vào:

Giá trị DJIA 3 ngày trước

Các hoán vị khác nhau của chuỗi cảm xúc

Để dự đoán giá trị DJIA ngày t, đầu vào cho SOFNN gồm:

Các giá trị DJIA

Các giá trị đo tâm trạng của n ngày trước

 

ppt31 trang | Chia sẻ: trungkhoi17 | Lượt xem: 540 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài thuyết trình Dự báo thị trường chứng khoán dựa trên khai phá dữ liệu Tweeter - Phạm Huyền Trang, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Học viên: Phạm Huyền TrangGV hướng dẫn: PGS. TS Hà Quang ThụyDự báo thị trường chứng khoán dựa trên khai phá dữ liệu TweeterSeptember 8, 20211Nội dung chínhGiới thiệu Các nghiên cứu liên quanNghiên cứu của J.Bollen về Dự báo thị trường chứng khoán dựa trên TweeterKết luậnĐịnh hướng nghiên cứuSeptember 8, 20212INTRODUCTIONBài toán dự báo thị trường chứng khoánBài toán dự báo thị trường chứng khoán dựa trên TweeterSeptember 8, 20213Nguyên lý Bước đi ngẫu nhiên (Walk random) và giả thuyết Thị trường hiệu quả (Efficient Market)Không thể dự đoán thị trường chứng khoánLý thuyết phân tích cổ phiếu (Chartist theory)- Có thể dự đoán được dựa vào quá khứCó thực sự dự đoán được thị trường chứng khoán?September 8, 20214Các nghiên cứu liên quan2005, Gruhl và cộng sự đã nghiên cứu cách làm thế nào để hoạt động chat online có thể dự đoán được việc bán sách2006, Mishne và Rijke sử dụng các đánh giá của các quan điểm được thể hiện trên blog để dự đoán việc bán phim2007, Liu và cộng sự dự đoán việc bán các sản phẩm sử dụng mô hình phân tích ngữ nghĩa ẩn xác suất (PLSA) để trích xuất các chỉ sổ của quan điểm từ các blog.2009, Schumaker và Chen điều tra mối quan hệ giữa các tin tức về công ty phá sản với sự thay đổi về giá cả trong thị trường 2010, Asur và Huberman chỉ ra rằng những quan điểm liên quan đến các phim được thể hiện công khai trên Tweeter thực sự có thể dự đoán được doanh thu phòng véGần đây, 2011, Johan Bollen và công sự đã có nghiên cứu chỉ ra rằng có thể dự đoán thị trường chứng khoán dựa trên các Tweet của các công ty trong thị trường chứng khoán, với độ chính xác lên đến > 85%September 8, 20215Dự báo thị trường chứng khoán September 8, 20216Kinh tế học hành vi chỉ ra rằng: Cảm xúc có thể ảnh hưởng đến các hành vi của cá nhân và trong việc đưa ra 1 quyết định nào đóCác quyết định tài chính được thúc đẩy bởi cảm xúc và tâm trạng của con ngườiGiả thuyết: Tâm trạng, cảm xúc có thể ảnh hưởng đến giá trị chứng khoán tương đương với việc các tin tức ảnh hưởng đến thị trường chứng khoánBài toán dự báo thị trường chứng khoán chia thành 2 loại:Dự báo chỉ số chứng khoán sẽ tăng hay giảmDự báo chỉ số chứng khoán sẽ tăng lên bao nhiêu hoặc giảm xuống bao nhiêuÝ nghĩa của bài toán:Giúp các nhà đầu tư đưa ra được các quyết định đầu tư tức thời => đem lại lợi nhuận cao cho các nhà đầu tưDự báo thị trường chứng khoán dựa trên TweeterCộng đồng sử dụng và chia sẻ trạng thái của mình trên Twitter cho biết họ đang cảm thấy như thế nào về ngày hôm đó dẫn dắt các quyết định mua bán trên thị trường ảnh hưởng đến giá cả trong thị trường chứng khoánCó thể dự đoán được chỉ số chứng khoán dựa trên TweeterSeptember 8, 20217Tại sao chọn Tweeter?September 8, 20218Có thể trích xuất các nội dung tweet để đánh giá được tâm trạng của công chúng trực tiếp, theo thời gian thực một cách nhanh chóng và tiết kiệm => Phù hợp đáp ứng cho sự biến động, tăng giảm của chỉ số chứng khoánTweeter là 1 trong các mạng xã hội được sử dụng phổ biến nhất trên thế giới => Là 1 nguồn cấp dữ liệu có quy mô rất lớnPhương pháp dự báo thị trường chứng khoán dựa trên Tweeter của Johan Bollen và cộng sựCác bướcƯu và nhược điểmSeptember 8, 20219Dữ liệuNguồn dữ liệu:9.83.498 Tweet trên trang Tweeter, được post bởi gần 2.7 triệu người dùng trong các công ty trong thị trường DJIACác thông tin trích xuất trong mỗi tweet gồm:Thông tin xác định tweetNgày submitKiểu submitNội dung (không quá 140 ký tự)Thời gian: 28/2/2008 – 19/12/2008Các bước chuẩn bị dữ liệu:Loại bỏ từ dừng, dấu chấm câuNhóm các tweet được submit trên cùng ngày vào 1 nhómChú ý:Chỉ quan tâm những tweet chứa tâm trạng rõ ràng của tác giảSeptember 8, 202110Các bướcPhân tích cảm xúc người dùngĐo độ trễ cảm xúcDự đoán giá cổ phiếuSeptember 8, 202111Bước 1: Sinh chuỗi thời gian cảm xúc (OF và GPOMS)OpinionFinder: Phân tích quan điểm ở mức câuĐo cảm xúc của người dùng: tích cực hay tiêu cựcXác định tỉ lệ tweet tích cực so với tweet tiêu cực mỗi ngàyGPOMS:Đo cảm xúc của người dùng trên 6 chiều khác nhau: Calm, Alert, Sure, Vital, Kind, Happy Đo cảm xúc người dùng thành 7 chiềuSeptember 8, 202112Bước 2: Đánh giá OF và GPOMSSeptember 8, 202113Bước 2: Đánh giá OF và GPOMS – hồi quy đa biếnSeptember 8, 202114September 8, 202115 Vây, các sự kiện văn hóa, xã hội có tác động lên cảm xúc, tâm trạng của cộng đồng. Có thể đoán được cảm xúc của cộng đồng thông qua các tweet của mỗi cá nhân trên TweeterCâu hỏi đặt ra: Những tâm trạng, cảm xúc đó liên quan gì đến sự thay đổi trong thị trường chứng khoán, cụ thể là chỉ số DJIA?Bước 3: Phân tích mối quan hệ nhân quả giữa tâm trạng và giá DJIASeptember 8, 202116Giả thuyết: Nếu 1 biến X gây ra Y thì những thay đổi trong X sẽ xuất hiện 1 cách hệ thống trước những thay đổi trong Y.=> Các giá trị trễ của X biểu hiện 1 mối tương quan có ý nghĩa thống kê đối với YÁp dụng:Tâm trạng chung của cộng đồng trên Twitter có sự tương đồng với thị trường chứng khoán, nhưng chúng phản ánh trước diễn biến từ 3-4 ngày chứ không phải là một kết quả trong việc tăng giảm của thị trường.Nếu người dùng có cảm nhận tích cực về mã chứng khoán của 1 công ty thì trong 1 ngày nào đó trong tương lai, giá cổ phiếu của công ty đó sẽ tăng, và ngược lạiBước 3: Phân tích mối quan hệ nhân quả giữa tâm trạng và giá DJIA (cont.)September 8, 202117Bước 3: Phân tích mối quan hệ nhân quả giữa tâm trạng và giá DJIA (cont.)September 8, 202118Ý nghĩa:Đo độ trễ cảm xúc so với chứng khoán, tức là nên đo cảm xúc của ngày thứ bao nhiêu ( i – n) để dự đoán giá chứng khoán ngày i (tác giả chọn giá trị này là 3 ngày))Giá trị p-values Bác bỏ giả thuyết null: chuỗi tâm trạng của người dùng không thể dự đoán được giá trị DJIABước 4: Dự đoán thị trường chứng khoán Sử dụng mô hình Self-organizing Fuzzy neural Network(SOFNN) để dự đoán giá trị DJIA trên 2 tập đầu vào:Giá trị DJIA 3 ngày trướcCác hoán vị khác nhau của chuỗi cảm xúcĐể dự đoán giá trị DJIA ngày t, đầu vào cho SOFNN gồm:Các giá trị DJIACác giá trị đo tâm trạng của n ngày trướcSeptember 8, 202119Bước 4: Dự đoán thị trường chứng khoán (cont.)September 8, 202120Tác giả thử 7 hoán vị của các biến đầu vào đối với mô hình SOFNN: IOF = {DJIAt-3, 2,1 , XOF, t-3,2,1}Trong đó:DJIA t-3,2,1: giá trị DJIA và X1,t-3,2,1: giá trị chiều 1 của tâm trạng được đo bởi GPOMS tại thời điểm t-3, t-2, t-1I1,3; I1,4; I1,5; I1,6: kết hợp giữa giá trị DJIA trong quá khớ với chiều 3, 4, 5 , 6 tại thời giẩm t-3, t-2, t-1Bước 4: Dự đoán thị trường chứng khoán (cont.)September 8, 202121Kết quả:Kết luận:Cảm xúc được đo bởi OF là không hiệu quảNgoài Calm, tác giả tìm thấy độ chính xác cao nhất với I1Happy không có mối quan hệ nhân quả Granger tốt nhưng khi kết hợp với Caml thì dự đoán chính xác hơnƯu và nhược điểmƯu điểm:Độ chính xác khá caoNhược điểm:Chỉ dự đoán được sự tăng, giảm của thị trường chứng khoánChưa giới hạn được vùng địa lý và ngôn ngữVới những sự kiện xảy ra đột ngột (Ví dụ Steve Job mất ,) thì độ trễ 3 ngày là quá lớn để dự đoán chứng khoánSeptember 8, 202122Phương pháp đề xuấtMô hìnhPhân lớp SVM-kNNDự báo thị trường chứng khoánSeptember 8, 202123Mô hìnhĐiểm khác biệtTập từ POMS:J.Bollen: Mở rộng dựa trên n-gram theo Google Đề xuất: Kết hợp mở rộng dựa trên n-gram theo Google và tập các từ đồng nghĩa.Dự đoán chỉ số DJIA: J.Bollen: dùng Mạng noron mờ tự tổ chức (SOFNN) Đề xuất: Áp dụng phương pháp phân lớp bán giám sát SVM-kNN hoặc EM hoặc Dự đoán xu hướngInput: n: số ngày cảm xúc trễCác chỉ số đóng DJIA của n ngày trước đóChuỗi tâm trạng theo thời gian của công chúng trong n ngày trước đó tính theo 6 chiều.Output: Xu hướng của chứng khoán ngày tTăng so với ngày t-1Giảm so với ngảy t-1Bằng ngày t-1Dự đoán xu hướng (cont.)Vector thể hiện đặc trưng: Vit = vit : vector thể hiện đặc trưng của cảm xúc theo chiều Idt : giá trị chỉ số DJIA ngày tXi, t : giá trị cảm xúc chiều i trong ngày t. n: số ngày cảm xúc trễGán nhãn: dựa trên chỉ số đóng DJIA mỗi ngày+1: chỉ số ngày t > ngày t-1-1: chỉ số ngày t < ngày t-10: chỉ số ngày t = ngày t-1Kết luậnBáo cáo đã:Giới thiệu về bài toán dự đoán thị trường chứng khoán dựa trên khai phá quan điểm từ dữ liệu TweeterTìm hiểu về chứng minh giả thuyết “Tâm trạng có thể dự đoán được thị trường chứng khoán” của J.Bollen.Đề xuất 1 hướng giải quyết nhằm cải tiến kết quảĐịnh hướng nghiên cứuCài đặt và thử nghiệm cho mô hình đã đề xuấtNghiên cứu các mô hình bán giám sát khác và áp dụng với bài toán dự báo thị trường chứng khoán trên tweeterNghiên cứu hướng dự đoán chứng khoán sẽ tăng lên bao nhiêu hoặc giảm xuống bao nhiêuSeptember 8, 202129Tài liệu tham khảo2008. Eugene F.Fama. The behavior of Stock- Market Prices2010. X. Zhang, H. Fuehres, P.A. Gloor, Predicting Stock Market Indicators Through Twitter I Hope It is Not as Bad as I Fear, Collaborative Innovation Networks (COINs), Savannah, GA, 2011. Johan Bollen và công sự, Twitter mood predicts the stock marketSeptember 8, 202130Thank you for your listening!

Các file đính kèm theo tài liệu này:

  • pptbai_thuyet_trinh_du_bao_thi_truong_chung_khoan_dua_tren_khai.ppt