Đồ án Ứng dụng thuật giải di truyền và lập danh mục đầu tư

MỤC LỤC

PHỤBÌA . ii

NHIỆM VỤ ĐỒÁN TỐT NGHIỆP . iii

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN .v

NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN . vi

LỜI CẢM ƠN . vii

TÓM TẮT ĐỒÁN . viii

MỤC LỤC. 1

DANH MỤC BẢNG BIỂU. 3

DANH SÁCH HÌNH VẼ. 4

DANH SÁCH CÔNG THỨC. 5

Chương 1. TỔNG QUAN. 7

1.1. Đặt vấn đề. 7

1.2. Ý nghĩa khoa học và thực tiễn. 8

1.3. Mục tiêu của nghiên cứu. 9

1.4. Bốcục.10

Chương 2. TỔNG QUAN VỀQUẢN TRNDANH MỤC ĐẦU TƯ.11

2.1. Giới thiệu vềquản trịdanh mục đầu tư.11

2.2. Nội dung quản trịdanh mục đầu tư.11

2.1.1. Những giả định nền tảng.11

2.1.2. Lý thuyết danh mục Markowitz.12

2.1.3. Các khái niệm liên quan tới lý thuyết danh mục.13

Chương 3. TỔNG QUAN VỀTHUẬT GIẢI DI TRUYỀN.20

3.1. Giới thiệu vềquá trình tiến hóa tựnhiên.20

3.2. Giới thiệu vềthuật giải di truyền.20

3.3. Các quá trình chính trong thuật giải di truyền.21

3.3.1. Tiến trình Chọn lọc.21

3.3.2. Quá trình Lai ghép.22

3.3.3. Quá trình Đột biến.23

3.3.4. Hàm Thích nghi.23

3.3.5. Điều kiện kết thúc lặp của GAs.23

3.3.6. Thuật giải di truyền.24

Chương 4. PHƯƠNG PHÁP NGHIÊN CỨU.25

4.1. Mô tảbài toán.25

4.1.1. Xửlý dữliệu.25

4.1.2. Phát biểu bài toán.25

4.1.3. Mã hóa bài toán.26

4.1.4. Khởi tạo quần thể.26

4.1.5. Hàm lượng giá.27

4.1.6. Các tham số.27

4.2. Phân tích và thiết kếhệthống.28

4.2.1. Use Case Diagrams.28

4.2.2. Tổchức các gói (Packages Definitions).30

4.2.3. Sơ đồlớp (Class Diagrams).32

4.2.4. Sơ đồtuần tự(Sequence Diagrams).38

4.2.5. Lược đồcơsởdữliệu.40

Chương 5. KẾT QUẢTHỰC NGHIỆM.41

5.1. Phương pháp thực nghiệm.41

5.2. Kết quảchương trình.41

5.3. Đối chiếu thực tế.42

Chương 6. KẾT LUẬN CHUNG.45

TÀI LIỆU THAM KHẢO.47

PHỤLỤC. P1

Phụlục A: Giới thiệu vềSàn Giao dịch Chứng khoán HOSE. P1

Phụlục B: Khái quát vềtình hình thịtrường chứng khoán Việt Nam. P2

Phụlục C: Các chứng khoán niêm yết trên sàn HOSE (đến ngày 19/11/2008). P3

47 trang | Chia sẻ: netpro | Lượt xem: 2204 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Đồ án Ứng dụng thuật giải di truyền và lập danh mục đầu tư, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

c đó sẽ đáp ứng những mục tiêu đầu tư của chúng ta. Điều quan trọng là sự thừa nhận trong việc thiết lập danh mục đã được giải thích trong lý thuyết đa dạng hóa danh mục đầu tư. 2.2. Nội dung của quản trị danh mục đầu tư 2.2.1. Những giả định nền tảng Trước khi trình bày lý thuyết danh mục, chúng ta cần làm rõ một vài giả định chung của lý thuyết. Điều này không chỉ bao gồm một danh mục đầu tư tối ưu mà còn có nghĩa là rủi ro và thái độ rủi ro. - Một giả định cơ bản của lý thuyết danh mục đó là, một nhà đầu tư mong muốn tối đa hóa tỷ suất sinh lợi từ việc đầu tư của mình, với mộ mức độ rủi ro cho phép. Để giải quyết một cách thích đáng giả định này, chắc chắn những quy tắc nền tảng phải được trình bày. Đầu tiên, danh mục của bạn nên bao gồm tất cả những tài sản và các khoản nợ phải trả, không chỉ đơn thuần là cổ phiếu và trái phiếu, mà còn có các khoản mục như xe hơi, nhà cửa, và những khoản đầu tư có tính thanh khoản thấp như: tem, đồ cổ, đồ nội thất… 12 Tuy nhiên trong phạm vi đề tài, chúng ta cũng giả định rằng, danh mục đầu tư của chúng ta chỉ bao gồm các loại chứng khoán cổ phiếu. Tuy nhiên, cục diện đầu tư cũng cần phải được xem xét lại vì tỷ suất sinh lợi từ hầu hết các loại chứng khoán này tác động qua lại lẫn nhau, và mối quan hệ giữa những tỷ suất sinh lợi đối với các tài sản trong danh mục đầu tư là rất quan trọng. Vì một danh mục đầu tư tốt, không đơn giản chỉ là một bộ sưu tập các khoản mục đầu tư tốt cá thể. - Một giả định nữa của lý thuyết danh mục đầu tư, về cơ bản, những nhà đầu tư luôn từ chối rủi ro. Bằng chứng là, hầu hết các nhà đầu tư không thích rủi ro, thì họ luôn theo đuổi những hình thức bảo hiểm khác nhau như bảo hiểm nhân thọ, y tế… nhằm đề phòng những biến cố không chắc chắn trong tương lai. Và dĩ nhiên, sự lựa chọn giữa hai cổ phiếu có cùng tỷ suất sinh lợi, nhà đầu tư sẽ chọn tài sản có mức rủi ro thấp hơn. Tuy nhiên, điều này không ám chỉ rằng mọi người đều từ chối rủi ro. Sự thật là không ai mua bảo hiểm cho tất cả mọi thứ xung quanh cả. Thậm chí, có người còn không mua bất kỳ loại bảo hiểm nào, đó có thể là một sự lựa chọn, hoặc là họ không có khả năng theo đuổi nó. Thêm nữa, một số cá nhân, bên cạnh việc mua các loại bảo hiểm như tai nạn ô tô, bênh tật… họ đồng thời cũng mua vé số, đánh bạc… vốn được biết đến như những khoản sinh lợi tiêu cực. Điều này đồng nghĩa với việc luôn tồn tại những cá nhân sẵn lòng chấp nhận rủi ro. Trong khi có nhiều thái độ ứng xử khác nhau về rủi ro, thì giả định cơ bản của chúng ta cho rằng, hầu hết các nhà đầu tư đều chuyển một khoản tiền lớn để phát triển danh mục đầu tư mà vẫn từ chối rủi ro. Vì vậy, chúng ta mong đợi một mối quan hệ đồng thuận giữa tỷ suất sinh lợi mong đợi và rủi ro mong đợi. Đặc biệt, đây cũng là điều mà nhìn chung, chúng ta luôn tìm kiếm trong tương lai. 2.2.2. Lý thuyết danh mục Markowitz 13 Vào đầu những năm 1960, những nhà đầu tư đã nói về rủi ro, nhưng không có những ước lượng cụ thể cho từng khoản mục. Tuy nhiên, để xây dựng một mô hình danh mục đầu tư, các nhà đầu tư phải xác định lượng rủi ro có thể có. Mô hình danh mục đầu tư cơ bản được Harry Markowitz phát triển. Ông là người đoạt giải Nobel kinh tế sau khi phát minh ra thuyết danh mục hiện đại năm 1952. Học thuyết này nhấn mạnh tầm quan trọng của danh mục đầu tư, các rủi ro và sự tương quan giữa các cổ phiếu với việc đa dạng hóa danh mục đầu tư. Điều này đã thay đổi cách thức mà các nhà đầu tư đang thực hiện. Cụ thể, Markowitz đã phát hiện, tỷ suất sinh lợi mong đợi đối với một danh mục của các tài sản, và một ước lượng rủi ro mong đợi. Markowitz chỉ ra rằng, phương sai của tỷ suất sinh lợi là một ước lượng có ý nghĩa của rủi ro danh mục với một tập hợp những giả định, và ông đã tìm ra công thức để tính toán phương sai của danh mục. Công thức tính toán phương sai danh mục này, đã chỉ ra sự quan trọng của việc đa dạng hóa đầu tư để giảm thiểu rủi ro tổng thể và cũng chỉ ra cách đa dạng hóa đầu tư hiệu quả. 2.2.3. Các khái niệm liên quan tới lý thuyết danh mục 2.2.3.1. Tỷ suất lợi nhuận (Rate of Return) Chúng ta định nghĩa tỷ suất sinh lợi qua một thời kỳ t, với thời gian là ∆, sẽ là tỷ suất sinh lợi được thực hiện từ thời điểm t đến thời điểm + ∆. Nếu giá của chứng khoán ở thời điểm t là P(t) , ở thời điểm + ∆ là P( + ∆, và thu nhập của chứng khoán trong suốt thời kỳ là d(t). Vậy tổng tỷ suất sinh lợi của chứng khoán sẽ là: = + ∆ + 2.1 Do đó tỷ lệ sinh lợi của chứng khoán sẽ là 00 = − 1 Ví dụ: Giá đóng cửa của cổ phiếu A tháng 10/2008 là 40$ và tháng 11/2008 là 50$. Chi phí phải trả cho giao dịch là 4$ khi mua và bán cổ 14 phiếu, cổ tức nhận được là 2$. Vậy tổng tỷ suất sinh lợi của chứng khoán sẽ là: = 50$ + 2$ − 4$40$ = 1,2 *à 00 = 0,2 = 20% 2.2.3.2. Tỷ suất lợi nhuận mong đợi (Expected Rate of Return) Tỷ suất lợi nhuận mong đợi đối với một tài sản được tính như trong bảng 2.1. Tỷ suất sinh lợi mong đợi đối với một tài sản rủi ro cụ thể với tập hợp tỷ suất sinh lợi tiềm năng, và một giả định các khả năng xảy ra các mức tỷ suất sinh lợi dự kiến. Bảng 2.1. Ví dụ về cách tính tỷ suất mong đợi Khả năng Tỷ suất sinh lợi (%) Tỷ suất sinh lợi mong đợi 0,20 8,0 1,60 0,30 10,0 3,00 0,20 12,0 2,40 0,30 14,0 4,20 E(R)= 11,20 Tỷ suất sinh lợi mong đợi của tài sản rủi ro: ER = . 2.2 Trong đó: - Rj là tỷ suất sinh lợi của tài sản rủi ro trong tình huống j. 15 - Pj là khả năng xảy ra mức tỷ suất sinh lợi Rj Tỷ suất sinh lợi mong đợi đối với một danh mục của những khoản đầu tư, đơn giản là giá trị trung bình theo tỷ trọng của tỷ suất sinh lợi mong đợi đối với những khoản đầu tư cụ thể trong danh mục. Tỷ trọng này là sự cân đối tổng giá trị đối với các khoản đầu tư. Tỷ suất sinh lợi mong đợi đối với một danh mục đầu tư được tính theo công thức sau: = . 2.3 Trong đó: - wi : Tỷ trọng đầu tư tài sản i trong danh mục. - E(Ri): Tỷ suất sinh lợi mong đợi của tài sản i. 2.2.3.3. Phương sai (độ lệch chuNn) của tỷ suất sinh lợi đối với một khoản đầu tư cụ thể (Variance or Standard Deviation). Phương sai hay độ lệch chuNn, là một phương pháp ước lượng chênh lệch của những mức tỷ suất sinh lợi có thể có Ri, so với tỷ suất sinh lợi mong đợi [E(Ri)] sau đây. Phương sai: = [ − ]. 2.4 Trong đó: - pi là khả năng xảy ra tỷ suất sinh lợi. - Độ lệch chuNn: = √ 2.5 Tuy nhiên, khi tính toán độ lệch chuNn của các giá trị tỷ suất sinh lợi thực nghiệm, chúng ta có thể lấy tổng bình phương các khoảng chênh lệch và chia cho N. Với N là số mẫu thực nghiệm. 16 = 1%&[ − ]' 2.6 Việc tính toán phương sai và độ lệch chuNn của tỷ suất sinh lợi mong đợi đối với tài sản rủi ro trong bảng 2.1 được tính lại trong bảng 2.2. Bảng 2.2. Tính toán Phương sai tỷ suất sinh lợi mong đợi đối với một tài sản cụ thể. Ri [Ri – E(Ri) {Ri – E(Ri)}2 Pi {Ri – E(Ri)}2pi 8,0 -3,20 10,24 0,20 2,048 10,0 -1,20 1,44 0,30 0,432 12,0 0,80 0,64 0,20 0,128 14,0 2,80 7,84 0,30 2,235 4,960 Khi đó = 4,960 và độ lệch chuNn = 2,227% 2.2.3.4. Hiệp phương sai của những tỷ suất sinh lợi (Covariance) Trong phần này, chúng ta trình bày về hiệp phương sai của tỷ suất sinh lợi được dự định để ước lượng, đưa ra công thức để tính toán nó. Phân tích danh mục, chúng ta thường quan tâm tới hiệp phương sai của tỷ suất sinh lợi hơn là sự thay đổi giá cả và một vài thứ khác. Hiệp phương sai là một ước lượng để hai mức độ ưu tiên khác nhau “tiến lại gần nhau” nhằm tạo ra một giá trị có ý nghĩa. Một giá trị hiệp phương sai dương, có nghĩa là tỷ suất sinh lợi đối với hai khoản đầu tư có khuynh hướng dịch chuyển về một hướng, so với mức trung bình của chúng trong suốt một khoảng thời gian. Ngược lại, 17 một giá trị hiệp phương sai âm, chỉ ra tỷ suất sinh lợi đối với hai khoản đầu tư có khuynh hướng dịch chuyển về hai hướng khác nhau, liên quan đến mức trung bình vào từng thời điểm cụ thể trong một khoảng thời gian. Độ lớn của hiệp phương sai phụ thuộc vào phương sai của những chuỗi tỷ suất sinh lợi cụ thể, cũng như mối quan hệ giữa những chuỗi tỷ suất sinh lợi. Đối với hai tài sản A và B, hiệp phương sai của tỷ suất sinh lợi được định nghĩa là: ()*+, = -.á 0ị 1ỳ *ọ345[+ − +][, − ,]6 = +, 2.6.1 Trong trường hợp tỷ suất sinh lợi của hai tài sản A và B được tính dự vào thực nghiệm thì hiệp phương sai của chúng được xác định như sau: ()*+, = 1%+ − +. , − ,' 2.6.2 2.2.3.5. Hệ số tương quan của những tỷ suất sinh lợi (Corelation) Hiệp phương sai bị ảnh hưởng bởi biến thiên của hai chuỗi tỷ suất sinh lợi riêng lẻ. Vì vậy, một con số hiệp phương sai chỉ có thể nhấn mạnh một mối quan hệ mờ nhạt, nếu hai chuỗi tỷ suất sinh lợi riêng lẻ không ổn định nhưng lại phản ánh mối quan hệ bền vững nếu hai chuỗi này rất ổn định. Hiển nhiên, chúng ta muốn “chuNn hóa” ước lượng hiệp phương sai này để đưa vào xem xét tính biến thiên của hai chuỗi tỷ suất sinh lợi riêng lẻ như công thức sau: 8+, = ()*+,+, 2.7 Trong đó: - 8+, : Hệ số tương quan của những tỷ suất sinh lợi. - + : Độ lệch chuNn của RiA 18 - , : Độ lệch chuNn của RiB Như vậy hệ số tương quan là sự “chuNn hóa” ước lượng hiệp phương sai. Bằng cách chuNn hóa hiệp phương sai bởi những độ lệch chuNn riêng lẻ sẽ mang lại hệ số tương quan 8+,), hệ số tương quan này chỉ có thể thay đổi trong khoảng từ -1 đến +1. Giá trị +1 có thể nhấn mạnh mối quan hệ tuyến tính xác định giữa RA và RB, nghĩa là, tỷ suất sinh lợi đối với hai cổ phiếu cùng thay đổi trong một kiểu tuyến tính xác định hoàn toàn. Giá trị -1 có thể nhấn mạnh mối quan hệ phủ định hoàn toàn giữa hai chuỗi tỷ suất sinh lợi, như khi tỷ suất sinh lợi của một cổ phiếu cao hơn mức trung bình, tỷ suất sinh lợi của những cổ phiếu khác sẽ thấp hơn mức trung bình bằng một số lượng lớn. Để tính toán ước lượng chuNn này, cần tính toán được độ lệch chuNn đối với hai chuỗi tỷ suất riêng lẻ. Chúng ta đã có những giá trị RiA - E(RA) và RiB – E(RB). 2.2.3.6. Độ lệch chuNn của một danh mục đầu tư Như đã biết, một tương quan +1,0 có thể nhấn mạnh tương quan xác định hoàn toàn, và một giá trị -1,0 có nghĩa là tỷ suất sinh lợi đã thay đổi theo hướng hoàn toàn ngược lại. Một giá trị 0 có nghĩa là tỷ suất sinh lợi không có mối quan hệ tuyến tính – tương quan độc lập, qua thống kê chúng không có tương quan với nhau. Nhưng không có nghĩa là chúng độc lập với nhau. Một giá trị như 8+, = 0,108 là rất thấp. Liên quan đến hệ số tương quan thấp này không khác thường đối với những cổ phiếu trong những ngành khác nhau (ngành giải khát và ngành xây dựng). Sự tương quan giữa những cổ phiếu của những công ty trong phạm vi một vài ngành gần bằng 0,85. Bây giờ, chúng ta thảo luận về các khái niệm của hiệp phương sai và hệ số tương quan, chúng ta có thể xem công thức tính toán độ lệch chuNn của tỷ suất sinh lợi đối với một danh mục những tài sản, phương 19 pháp ước lượng rủi ro của chúng ta đối với một danh mục. Như đã được ghi nhận, Harry Markowitz tìm thấy công thức để tính toán độ lệch chuNn của danh mục đầu tư. = & + ()* : 2.8 Trong đó: - : Độ lệch chuNn của danh mục đầu tư. - wi : Tỷ trọng đầu tư của tài sản riêng lẻ trong danh mục, tỷ trọng này được xác định bởi tỷ lệ của giá trị trong danh mục đầu tư. - σQ : Phương sai của tỷ suất sinh lợi đối với tài sản i. - ()* : Hiệp phương sai giữa tỷ suất sinh lợi đối với tài sản i và tài sản j, với Covij = . Công thức này cho thấy độ lệch chuNn của danh mục đầu tư là một phần giá trị trung bình của những phương sai riêng lẻ (trong đó tỷ trọng là bình phương), cộng với tỷ trọng hiệp phương sai giữa những tài sản trong danh mục. Độ lệch chuNn đối với danh mục của những tài sản bao gồm, không chỉ phương sai của những tài sản riêng lẻ mà còn bao gồm hiệp phương sai giữa những cặp tài sản riêng lẻ trong danh mục. Công thức (2.8) chính là cơ sở để chúng ta giải quyết bài toán đã đặt ra bằng thuật giải di truyền, sẽ được trình bày ở chương kế tiếp. 20 CHƯƠNG 3. TỔNG QUAN VỀ THUẬT GIẢI DI TRUYỀN 3.1. Giới thiệu về quá trình tiến hóa tự nhiên Như chúng ta đều biết rằng, quá trình tiến hóa tự nhiên là quá trình hoàn hảo nhất, hợp lý nhất và đặc biệt là, tự nó đã mang tính tối ưu. Dù rằng không được chứng minh, song nó vô cùng phù hợp với hiện thực khách quan. Thực tế cho thấy, quá trình tiến hóa thể hiện tính tối ưu ở chỗ, thế hệ sau bao giờ cũng tốt hơn thế hệ trước. Tiến hóa tự nhiên được duy trì nhờ hai quá trình cơ bản: sinh sản và chọn lọc tự nhiên. Xuyên suốt quá trình này, các thế hệ mới luôn được sinh ra để bổ sung và thay thế cho thế hệ cũ. Cá thể nào phát triển hơn, thích ứng hơn đối với môi trường sẽ tồn tại. Ngược lại, cá thể nào không thích ứng được sẽ bị đào thải. Các cá thể mới sinh ra trong quá trình tiến hóa nhờ sự lai ghép ở thế hệ cha – mẹ. Một cá thể mới có thể mang những tính trạng của cha – mẹ (gọi là cơ chế di truyền), cũng có thể mang những tính trạng hoàn toàn mới (gọi là cơ chế đột biến). Chính hai cơ chế này giữ vai trò chủ đạo trong tiến trình tiến hóa và có mức độ quan trọng như nhau. Dù rằng, xác suất xảy ra của hiện tượng đột biến thấp hơn rất nhiều so với hiện tượng di truyền. 3.2. Giới thiệu về thuật giải di truyền Thuật giải di truyền (Genetic Algorithms – GAs), do John Holland (1975) và Goldberg (1989) đề xuất và phát triển. Cũng như những thuật toán tiến hóa khác nói chung, thuật giải di truyền dựa trên việc mô phỏng quá trình tiến hóa sinh học. Chính vì vậy, nguyên lý hoạt động của thuật giải sử dụng các nguyên lý di truyền về sự thích nghi và sự sống của các cá thể thích nghi nhất trong tự nhiên. Nhìn chung, các thuật toán tiến hóa tuy có có những điểm khác biệt, song về cơ bản, đều mô phỏng ba quá trình cơ bản: lai ghép, đột biến, và chọn lọc tự nhiên. Tập hợp tất cả các lời giải trong không gian tìm kiếm gọi là kiểu hình. Các kiểu hình này khi mã hóa gọi là kiểu gen. Toán tử di truyền sẽ được thực thi trên đối 21 tượng này. Một ánh xạ từ kiểu hình sang kiểu gen gọi là quá trình mã hóa. Mỗi cá thể trong kiểu gen có nhiều nhiễm sắc thể. Trong mỗi nhiễm sắc thể có chứa nhiều gen. Mỗi đặc trưng di truyền cụ thể được quy định bởi giá trị và vị trí của gen trong nhiễm sắc thể. Độ thích nghi là thước đo khả năng sống sót và phát triển của cá thể trong môi trường. Toán tử xác định cá thể trong thế hệ hiện tại được giữ lại trong thế hệ tiếp theo, được gọi là chọn lọc. Toán tử kết hợp ngẫu nhiên hai cá thể được chọn là lai ghép. Toán tử thay đổi ngẫu nhiên cấu trúc cá thể, tức làm thay đổi giá trị của gen gọi là đột biến. 3.3. Các quá trình chính trong thuật giải di truyền 3.3.1. Tiến trình Chọn lọc Đối với tiến trình chọn lọc (chọn quần thể mới thỏa phân bố xác suất dựa trên các độ thích nghi), ta dùng bánh xe Ru-lét với các rãnh được định kích thước theo độ thích nghi. Bánh xe Ru-lét được xây dựng như sau: - Tính độ thích nghi R*ST* của mỗi nhiễm sắc thể *. = 1…)_W.XR với pop_size là kích thước quần thể. - Tính tổng giá trị thích nghi toàn quần thể: Y = R*ST*Z_[\] 3.1 - Tính xác suất chọn pQ cho mỗi nhiễm sắc thể vQi = 1…pop_size: = R*ST*Y 3.2 - Tính vị trí xác xuất qQ của mỗi nhiễm sắc thể vQi = 1…pop_size d = 3.3 22 Tiến trình chọn lọc được thực hiện bằng cách quay bánh xe Ru-lét pop_size lần; mỗi lần chọn một nhiễm sắc thể từ quần thể hiện hành vào quần thể mới theo cách sau: - Phát sinh ngẫu nhiên một số r trong đoạn [0..1] - Nếu r < qQ thì chọn nhiễm sắc thể đầu tiên vQ; ngược lại thì chọn nhiễm sắc thể thứ i là vQ 2 ≤ i ≤ pop_size sao cho qQ: < 0 ≤ qQ 3.3.2. Quá trình Lai ghép Phép lai là quá trình hình thành nhiễm sắc thể mới, trên cơ sở các nhiễm sắc thể cha – mẹ, bằng cách ghép một hay nhiều đoạn gen của hai (hay nhiều) nhiễm sắc thể cha – mẹ với nhau. Phép lai xảy ra với xác xuất pc, có 3 dạng lai ghép cơ bản: lai một vị trí (lai đơn), lai nhiều vị trí (lai bội) và lai đều. Đồ án chỉ trình bày kiểu lai đơn. Quá trình lai đơn có thể mô phỏng như sau: Đối với mỗi nhiễm sắc thể trong quần thể: - Phát sinh một số ngẫu nhiên r trong đoạn [0,1]. - Nếu r < pg thì chọn nhiễm sắc thể đó để lai ghép. Bây giờ, ta ghép đôi các nhiễm sắc thể đã được chọn một cách ngẫu nhiên: đối với mỗi cặp nhiễm sắc thể được ghép đôi, ta phát sinh ngẫu nhiên một số )W trong đoạn [1,h − 1] với h là chiều dài của mỗi nhiễm sắc thể. Số )W cho biết vị trí của điểm lai. Hai nhiễm sắc thể: ii…iZ[iZ[j…ik*à ll…lZ[lZ[j…lk sẽ được thay bằng cặp con của nó là ii…iZ[lZ[j…lk *à ll…lZ[iZ[j…ik. 23 3.3.3. Quá trình Đột biến Đột biến là hiện tượng cá thể con mang một (số) tính trạng không có trong mã di truyền của cha – mẹ. Phép đột biến xảy ra với xác suất pm, nhỏ hơn rất nhiều so với xác suất lai pc. Phép đột biến có thể được mô phỏng như sau: Đối với mỗi nhiễm sắc thể trong quần thể hiện hành (nghĩa là sau khi lai) và đối với mỗi bit trong nhiễm sắc thể: - Phát sinh một số r trong đoạn [0,1]; - Nếu r < pm, đột biến bit đó (từ 1 thành 0 hoặc từ 0 thành 1) 3.3.4. Hàm Thích nghi Sau quá trình chọn lọc, lai ghép và đột biến, quần thể mới cần phải được lượng giá. Việc lượng giá này được dùng để xây dựng phân bố xác suất (cho quá trình chọn lọc kế tiếp). Vì hàm thích nghi phải nhận giá trị không âm, do đó phải xây dựng ánh xạ hàm mục tiêu đang xét sang hàm thích nghi, thông qua một hay nhiều ánh xạ. Nếu bài toán tối ưu là cực tiểu một hàm mục tiêu 4n thì việc chuyển 4n này sang hàm thích nghi on trong GAs như sau: on = (kpq − 4n 1ℎ. 4n < (kpq; %4ượl Tạ. on = 0; Trong đó, (kpq là tham số đầu vào. Có thể lấy (kpq là giá trị 4n lớn nhất trong quần thể hiện tại, hoặc lớn nhất sau 1 vòng lặp. 3.3.5. Điều kiện kết thúc lặp của GAs Để kết thúc vòng lặp GAs, thường có thể chỉ định trước số thế hệ cần tạo ra, sau đó kiểm tra độ thích nghi những phần tử tốt nhất bằng cách so sánh với bài toán ban đầu. 24 3.3.6. Thuật giải di truyền Tóm lại, một thuật giải di truyền, giải một bài toán được cho phải có năm thành phần sau: - Một cấu trúc dữ liệu z biểu diễn không gian lời giải của bài toán. - Phương pháp khởi tạo quần thể ban đầu 0. - Hàm định nghĩa độ thích nghi R*ST , đóng vai trò môi trường. - Các phép toán di truyền như đã mô phỏng ở trên. - Các tham số thuật giải di truyền sử dụng (kích thước quần thể, xác suất lai, đột biến…) Thuật toán GAs có thể được biểu diễn dưới dạng lưu đồ thuật giải (xem Hình 3.1) như sau: Hình 3.1: Lưu đồ thuật giải di truyền 25 CHƯƠNG 4. PHƯƠNG PHÁP NGHIÊN CỨU Trở lại với nhiệm vụ của đồ án, chúng ta sẽ sử dụng thuật giải di truyền để thiết lập một danh mục đầu tư bao gồm các cổ phiếu hiện đang giao dịch trên sàn HOSE. 4.1. Mô tả bài toán 4.1.1. Xử lý dữ liệu Dữ liệu được sử dụng là lịch sử giao dịch của các mã chứng khoán được niêm yết trên sàn HOSE, gồm có 168 mã cổ phiếu các loại (xem phụ lục A). Dữ liệu giao dịch này có khoảng 100,000 dòng dữ liệu, bắt đầu từ khi mã chứng khoán đó được giao dịch cho tới ngày 19 tháng 11 năm 2008. Các thông tin cần có trong file dữ liệu là Mã Chứng khoán, Ngày Giao dịch, Giá Đóng cửa. Thông thường các file dữ liệu này được cung cấp miễn phí trên các website Hoặc trên các diễn đàn như 4.1.2. Phát biểu bài toán Từ một danh sách có 3 chứng khoán thuộc các lĩnh vực, được niêm yết trên sàn HOSE, chúng ta cần thiết lập một danh mục đầu tư hiệu quả có h h < 3 chứng khoán. Chúng ta cũng giả định tỷ trọng giữa các chứng khoán là như nhau. Sao cho, danh mục kết quả có độ lệch chuNn (đã được giới thiệu trong chương 2) là nhỏ nhất hoặc thỏa mãn yêu cầu của nhà đầu tư. Dĩ nhiên, người đầu tư mong muốn tìm được một danh mục ưng ý nhất, tuy nhiên việc đưa ra một lời giải duy nhất trong trường hợp này sẽ không phù hợp và thiếu sự linh động. Do đó, kết quả bài toán sẽ là một tập các danh mục hiệu quả thỏa mãn yêu cầu về mức rủi ro mà nhà đầu tư có thể chấp nhận. 26 4.1.3. Mã hóa bài toán Mặc dù chúng ta chỉ cần 8 bit ( 28 = 256), là hoàn toàn có thể biểu diễn cho tất cả các chứng khoán đang được niêm yết trên sàn HOSE, tuy nhiên, điều này sẽ gây ra bất tiện, đó là khi có những chuỗi nhị phân không biểu diễn cho một loại chứng khoán nào. Do vậy, chúng ta sẽ sử dụng một chuỗi nhị phân (gồm các bit 1 và 0) có chiều dài n-bit (với n là số lượng chứng khoán được niêm yết trên sàn HOSE) làm nhiễm sắc thể để biểu diễn một danh mục gồm 3 mã chứng khoán đang được giao dịch trên sàn HOSE. Mỗi bit sẽ biểu diễn cho sự xuất hiện hoặc không xuất hiện của một mã chứng khoán. Thứ tự các các bit này (tương ứng với mỗi mã chứng khoán) được quy định theo thứ tự bảng chữ cái. 4.1.4. Khởi tạo quần thể Tiến trình khởi tạo quần thể khá đơn giản. Chúng ta cần tạo ra một quần thể các nhiễm sắc thể. Trong đó mỗi nhiễm sắc thể là một vector nhị phân dài n-bit, tất cả n-bit này đều được khởi tạo ngẫu nhiên. Để thực hiện việc khởi tạo ngẫu nhiên này, chúng ta cần có thêm một tham số, đó là ước lượng về số lượng chứng khoán sẽ xuất hiện trong các danh mục kết quả. Bởi chúng ta không không mong muốn một danh mục có số lượng cổ phiếu quá lớn, thậm chí là có tất cả các cổ phiếu hiện đang giao dịch trên thị trường. Khi đó, sự xuất hiện của mỗi loại chứng khoán trong danh mục sẽ phụ thuộc vào xác suất xuất hiện Z: {ál W|ấ n|ấ ℎ.ệ3 Z = h3 Trong đó: - h : ước lượng số lượng chứng khoán có trong danh mục kết quả. - 3: Số lượng chứng khoán được chọn. Khi đó, quá trình khởi tạo được mô tả như sau: 27 - Tại mỗi bit của chuỗi nhị phân của mỗi nhiễm sắc thể trong quần thể, chúng ta phát sinh một số thực r ngẫu nhiên trong đoạn [0, 1]. - Nếu r < p} thì loại chứng khoán đó sẽ xuất hiện trong danh mục, tức là giá trị của bit bằng 1. Ngược lại bit bằng 0, loại chứng khoán đó sẽ không xuất hiện trong danh mục. 4.1.5. Hàm lượng giá Chúng ta sẽ sử dụng công thức tính độ lệch chuNn của danh mục (được trình bày trong chương 2) như một hàm mục tiêu của bài toán, tuy nhiên, mục tiêu chúng ta là cần tối thiểu hàm này, do đó hàm thích nghi R*ST của các vector nhị phân cần được điều chỉnh thành: R*ST* = on = (m~ − trong đó = & + ()* : (kpq = 100 Lý do chúng ta chọn Cm~ = 100 chính là chúng ta không mong muốn một danh mục có độ lệch chuNn quá lớn. 4.1.6. Các tham số Một vấn đề cũng khá quan trọng trong việc giải bài toán sử dụng thuật toán di truyền đó là việc chọn các tham số cho bài toán. Một số tham số cần lưu ý đó là kích thước quần thể _size, xác suất lai tạo _pc, xác xuất đột biến _pm, số thế hệ _tours. Trong bài toán, chúng ta sẽ sử dụng các giá trị mặc định sau _size = số lượng cổ phiếu được chọn, _pc = 0.8, _pm = 0.01, _tours = 30. 28 Một tham số cũng khá quan trọng đó là _po chỉ ra xác xuất xuất hiện của bit 1, tức là liên quan tới số lượng cổ phiếu trong danh mục kết quả. Dĩ nhiên, để cho linh động và phù hợp với tài nguyên của máy, các tham số này hoàn toàn có thể được thay đổi trong chương trình. 4.2. Phân tích và thiết kế hệ thống 4.2.1. Use Case Diagrams Hình 4.1.Lược đồ Use Case cho hệ thống 4.2.1.1. Đặc tả UC001: Choose Candidate Securities - Mô tả chức năng: o Cho phép người dùng chọn danh sách chứng khoán ứng viên có thể xuất hiện trong danh mục kết quả. - Dòng sự kiện: o Dòng dự kiện chính: Hệ thống hiển thị danh sách tất cả các Chứng khoán vào Hộp danh sách (listbox) chứng khoán. 29 Người dùng chọn một (số) chứng khoán từ Hộp danh sách chứng khoán và đưa vào Hộp danh sách chứng khoán được chọn. Nhấn nút “Tiếp tục” - Yêu cầu đặc biệt: Không - Tình trạng trước: Không - Tình trạng sau: Một danh sách các chứng khoán được chọn. 4.2.1.2. Đặc tả UC002: Generate Efficient Porfolio - Mô tả chức năng: o Cho phép người dùng thiết lập các tham số và xuất ra kết quả là tập hợp các danh mục đầu tư hiệu quả. - Dòng sự kiện: o Dòng sự kiện chính: Người dùng thiết lập (hoặc để mặc định) các tham số. Người dùng nhấn nút “Thiết lập Danh mục”. Hệ thống hiển thị tập hợp các danh mục hiệu quả. Người dùng nhấn vào mỗi danh mục trong Hộp danh sách Danh mục để xem chi tiết các chứng khoán có trong danh mục đó. o Dòng sự kiện phụ: Người dùng nhấn nút “Quay lại” để trở lại phần chọn danh sách chứng khoán. - Điều kiện đặc biệt: Không 30 - Tình trạng trước: Một danh sách các chứng khoán đã được chọn. - Tình trạng sau: Tập hợp các danh mục hiệu quả. 4.2.2. Tổ chức các gói (Packages Definitions) Hình 4.2. Tổ chức các gói và

Các file đính kèm theo tài liệu này:

Ứng dụng thuật giải di truyền và lập danh mục đầu tư.pdf