Luận văn Ứng dụng mạng nơron nhân tạo vào việc dự báo lưu lượng nước đến hồ Hoà Bình

Mục lục

Lời cảm ơn. i

Mục lục . 4

Danh sách hình vẽ. 7

Danh sách bảng biểu . 9

MỞ ĐẦU . 10

CHƯƠNG 1 - MẠNG NƠ-RON NHÂN TẠO TRUYỀN THẲNG NHIỀU

LỚP. 13

1.1 Giới thiệu vềmạng nơ-ron nhân tạo. 13

1.1.1 Khái niệm cơbản. 13

1.1.2 Mô hình mạng nơ-ron nhân tạo . 15

1.1.3 Khảnăng ứng dụng của mạng nơ-ron nhân tạo . 18

1.2 Mạng nơ-ron lan truyền thẳng nhiều lớp. 19

1.2.1 Mạng perceptron một lớp . 19

1.2.2 Mạng perceptron nhiều lớp . 22

1.2.3 Một sốvấn đềcần chú ý khi sửdụng mạng MLP . 30

Kết luận chương . 33

CHƯƠNG 2 - KẾT HỢP GIẢI THUẬT DI TRUYỀN VỚI GIẢI THUẬT

LAN TRUYỀN NGƯỢC SAI SỐ ĐỂTỐI ƯU HOÁ TRỌNG SỐ

MẠNG NƠ-RON NHÂN TẠO . 34

2.1 Giới thiệu giải thuật di truyền . 34

2.1.1 Giới thiệu. 34

2.1.2 Tưtưởng chính của giải thuật di truyền . 35

2.1.3 Giải thuật di truyền đơn giản. 37

2.1 Ứng dụng giải thuật di truyền vào bài toán tối ưu hoá trọng sốcủa mạng

nơ-ron nhân tạo . 41

2.2.1 Xây dựng hàm giá . 42

2.2.2 Mã hoá nhiễm sắc thể. 42

2.2.3 Lai ghép . 43

2.2.4 Đột biến . 44

2.2.5 Thửnghiệm . 45

2.2.6 Giải thuật đềxuất . 49

2.3 Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số đểtối ưu

hoá trọng sốmạng nơ-ron nhân tạo . 51

2.3.1 Đặt vấn đề. 51

2.3.2 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số. 53

Kết luận chương . 55

CHƯƠNG 3 - ỨNG DỤNG MẠNG NƠRON NHÂN TẠO VÀO VIỆC DỰ

BÁO LƯU LƯỢNG NƯỚC ĐẾN HỒHOÀ BÌNH . 57

3.1 Điều kiện địa lý, tựnhiên, khí tượng thuỷvăn lưu vực sông Đà . 57

3.1.1 Vịtrí địa lý. 57

3.1.2 Địa hình . 58

3.1.3 Điều kiện địa chất. 58

3.1.4 Điều kiện thổnhưỡng . 58

3.1.5 Đặc điểm khí hậu. 58

3.1.6 Đặc điểm chế độthuỷvăn . 59

3.1.7 Thống kê dữliệu thu thập được. 63

3.2 Các phương pháp dựbáo. 64

3.2.1 Dựa trên mô hình vật lý. 64

3.2.2 Dựa trên mô hình toán. 66

3.2.3 Hướng tiếp cận mới . 67

3.3 Một sốchỉtiêu đánh giá kết quảdựbáo. 67

3.4 Dựbáo lưu lượng đến hồHoà Bình trước 10 ngày . 68

3.4.1 Phần mềm xây dựng . 68

3.4.2 Sốliệu sửdụng . 69

3.4.3 Các tham số. 70

3.4.4 Các phương án dựbáo. 70

Kết luận chương . 75

KẾT LUẬN .

94 trang | Chia sẻ: maiphuongdc | Lượt xem: 2417 | Lượt tải: 5

Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng mạng nơron nhân tạo vào việc dự báo lưu lượng nước đến hồ Hoà Bình, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

t đột biến: 0.1 - Ngưỡng dừng lặp: 0.05 Việc thử nghiệm được tiến hành với 100 lần chạy mỗi phương án. Dưới đây là bảng thống kê các lần chạy và số thế hệ cần thiết để đạt được yêu cầu về sai số. (1) – phương án ‘đột biến trọng số BIASED’ (2) – phương án ‘đột biến nút’ Bảng 2.2 So sánh các phương pháp đột biến STT (1) (2) STT (1) (2) STT (1) (2) 1 61 100 36 134 50 71 59 151 2 227 21 37 143 35 72 133 157 3 152 33 38 59 151 73 40 43 4 97 15 39 35 231 74 66 85 5 27 33 40 188 37 75 112 20 6 60 170 41 522 97 76 87 85 7 164 593 42 38 48 77 163 32 8 181 152 43 39 514 78 794 55 9 31 104 44 487 76 79 55 167 10 57 116 45 205 163 80 260 139 11 167 101 46 99 37 81 141 101 12 146 91 47 75 72 82 674 63 13 780 647 48 153 44 83 67 91 14 342 56 49 26 40 84 102 108 15 100 377 50 62 58 85 52 43 16 235 515 51 146 59 86 235 155 17 138 42 52 152 105 87 85 58 18 44 54 53 80 18 88 100 29 46 19 71 118 54 63 67 89 27 80 20 316 161 55 905 43 90 49 58 21 37 153 56 66 298 91 48 22 22 70 96 57 71 369 92 276 48 23 80 45 58 134 158 93 443 565 24 68 100 59 36 163 94 32 144 25 249 20 60 523 28 95 56 130 26 123 82 61 22 56 96 246 67 27 55 41 62 39 69 97 66 146 28 89 33 63 82 58 98 341 105 29 39 24 64 8 129 99 215 44 30 77 43 65 219 60 100 72 329 31 247 150 66 128 37 32 159 60 67 35 15 33 73 11 68 84 35 34 130 40 69 55 22 35 67 5 70 99 101 Trung bình 152.67 112.65 Nhận xét: Kết quả trung bình sau 112.65 thế hệ phương pháp ‘đột biến nút’ đã đạt yêu cầu, nhỏ hơn nhiều so với phương pháp ‘đột biến trọng số BIASED’ là 152.67 thế hệ. b. Thử nghiệm giải thuật di truyền với các phương pháp lai ghép khác nhau So sánh hai phương pháp lai ghép là ‘lai ghép trọng số’ và ‘lai ghép nút’ cả hai phương pháp này đều sử dụng phương pháp ‘đột biến nút’. Các tham số giống nhau với cả hai phương án: - Số lượng quần thể: 100 - Xác suất lai: 0.3 - Xác suất đột biến: 0.1 - Ngưỡng dừng lặp: 0.05 Việc thử nghiệm được tiến hành với 100 lần chạy mỗi phương án. Dưới đây là bảng thống kê số thế hệ cần thiết trong từng lần chạy để đạt được yêu cầu về sai số là 0.05. (1) – phương án ‘lai ghép nút’ (2) – phương án ‘lai ghép trọng số’ Bảng 2.3 So sánh các phương pháp lai ghép STT (1) (2) STT (1) (2) STT (1) (2) 1 294 100 36 176 50 71 183 151 2 202 21 37 32 35 72 113 157 3 21 33 38 50 151 73 120 43 47 4 42 15 39 114 231 74 42 85 5 50 33 40 29 37 75 42 20 6 43 170 41 18 97 76 57 85 7 73 593 42 179 48 77 155 32 8 108 152 43 46 514 78 69 55 9 127 104 44 114 76 79 488 167 10 31 116 45 21 163 80 203 139 11 46 101 46 139 37 81 39 101 12 54 91 47 79 72 82 25 63 13 48 647 48 82 44 83 182 91 14 68 56 49 74 40 84 55 108 15 59 377 50 55 58 85 32 43 16 130 515 51 35 59 86 35 155 17 61 42 52 186 105 87 56 58 18 135 54 53 88 18 88 145 29 19 70 118 54 32 67 89 172 80 20 77 161 55 147 43 90 36 58 21 83 153 56 59 298 91 32 22 22 12 96 57 131 369 92 50 48 23 66 45 58 1268 158 93 277 565 24 44 100 59 122 163 94 23 144 25 24 20 60 65 28 95 44 130 26 150 82 61 211 56 96 20 67 27 187 41 62 25 69 97 56 146 28 60 33 63 26 58 98 25 105 29 30 24 64 50 129 99 184 44 30 67 43 65 66 60 100 26 329 31 28 150 66 124 37 32 47 60 67 10 15 33 178 11 68 44 35 34 39 40 69 8 22 35 159 5 70 109 101 Trung bình 99.13 112.65 Nhận xét: Kết quả trung bình sau 99.13 thế hệ phương pháp ‘lai ghép nút’ đã đạt yêu cầu thấp hơn một chút so với phương pháp ‘lai ghép trọng số’ là 112.65 thế hệ. c. Thử nghiệm so sánh giải thuật di truyền và giải thuật lan truyền ngược sai số Thử nghiệm hai phương pháp với bài toán nổi tiếng XOR. Có 4 mẫu học như sau: X1 X2 Y 0 0 0 0 1 1 1 0 1 1 1 0 Tham số chung cho cả hai phương pháp: 48 - Mạng nơ-ron sử dụng là mạng có một lớp ẩn - Số nơ-ron trong lớp ẩn: 2 - Ngưỡng sai số dừng lặp: 0.05 hoặc quá 10000 vòng lặp Tham số của giải thuật lan truyền ngược sai số: - Hằng số học: 0.3 Tham số của giải thuật di truyền: - Số lượng quần thể: 100 - Xác suất lai: 0.3 - Xác suất đột biến: 0.1 - Sử dụng phương pháp lai ghép nút và đột biến nút Sau đây là bảng thống kê số bước lặp để mạng hội tụ với mỗi phương án trong 100 lần thử nghiệm khác nhau. GA: giải thuật di truyền BP: giải thuật lan truyền ngược sai số - : mạng không hội tụ (số lần lặp lớn hơn 10000) Bảng 2.4 Kết quả thử nghiệm so sánh GA và BP với ngưỡng sai số 0.0005 STT GA BP STT GA BP STT GA BP 1 1075 1515 36 283 - 71 1936 - 2 613 1005 37 - 1417 72 2004 3827 3 4629 1613 38 692 2863 73 2550 1594 4 372 1121 39 703 - 74 628 - 5 - - 40 - 1827 75 298 1754 6 678 1770 41 - 1930 76 612 2665 7 777 - 42 254 1848 77 461 - 8 704 - 43 - - 78 812 911 9 - 1666 44 527 - 79 1088 - 10 2198 1618 45 - 4613 80 206 - 11 1392 3397 46 2307 - 81 1051 - 12 - - 47 285 1591 82 - 1323 13 5645 5569 48 - 1612 83 - 2319 14 - 2822 49 1663 - 84 479 2495 15 2330 - 50 - 1457 85 - - 16 - 2935 51 1067 - 86 1931 - 17 426 1373 52 - 2462 87 566 4041 18 844 2023 53 793 - 88 730 1833 19 875 - 54 261 2710 89 594 - 20 - 3320 55 5262 - 90 - - 49 21 790 2397 56 - - 91 - 1555 22 - 1176 57 - 1325 92 1986 1493 23 1542 - 58 635 1279 93 252 1850 24 714 - 59 326 - 94 243 1195 25 629 2018 60 929 - 95 739 - 26 550 - 61 3106 1572 96 - - 27 566 - 62 6286 3351 97 903 1238 28 1462 - 63 692 - 98 - - 29 1238 1751 64 - - 99 2149 - 30 844 - 65 - 2879 100 760 3040 31 - - 66 487 1729 32 791 1150 67 209 1347 33 1153 1604 68 910 - Số lần mạng hội tụ 70 58 34 - 7368 69 - 2083 35 - 1558 70 2505 1050 Trung bình 1228.59 2152.53 Kết quả trong 100 lần chạy : - Giải thuật di truyền chạy thành công được 70 lần trung bình 1228.59 vòng lặp một lần chạy. - Giải thuật lan truyền ngược sai số chạy thành công được 58 lần trung bình 2152.53 vòng lặp. Ta có thể thấy rằng giải thuật di truyền có khả năng đạt được yêu cầu về hội tụ (sai số ≤ 0.05) tức tìm vùng chứa cực trị toàn cục dễ dàng hơn so với giải thuật lan truyền ngược sai số. Hay nói cách khác giải thuật lan truyền ngược sai số dễ rơi vào vùng chứa cực tiểu cục bộ hơn giải thuật di truyền. Trong 100 lần chạy, GA chỉ có 30 lần không tìm được cực trị toàn cục trong khi đó BP là 42 lần. 2.2.6 Giải thuật đề xuất Trong thử nghiệm so sánh GA với BP ở trên ta thấy: tuy GA có khả năng đưa mạng vùng chứa cực tiểu toàn cục dễ dàng hơn so với BP tuy nhiên vẫn còn nhiều trường hợp GA không làm mạng hội tụ được (trong thử nghiệm trên 30/100 lần mạng không hội tụ với GA). Nguyên nhân nào đã làm cho mạng rơi vào cực tiểu địa phương mà không thoát ra được? Sau nhiều lần thử nghiệm, chúng tôi nhận thấy rất nhiều trường hợp mạng không thể hội tụ vì một số giá trị trọng số của mạng đã quá lớn. Có thể giải thích điều này là do phương pháp đột biến sử dụng là chỉ đột biến kiểu BIASED (phần 2.2.4). Phương pháp đột biến này sẽ cộng vào trọng số được đột biến một giá trị ngẫu nhiên xung quanh 0. Như Montana D. và Davis L. [16] đã thử nghiệm và nhận xét rằng phương pháp đột biến này là hiệu quả hơn UNBIASED (trọng số được đột biến sẽ được thay thế bằng một giá trị ngẫu nhiên xung quanh 0) do kế thừa được tính "tốt" của thế hệ trước. Tuy nhiên một số trường hợp đột biến kiểu BIASED sẽ đẩy một số trọng số ngày càng rời xa gốc 0 và có thể mạng sẽ rơi 50 vào cực tiểu cục bộ mà không thoát ra được. Làm sao có thể tận dụng được những ưu điểm của đột biến dạng BIASED nhưng lại giúp mạng không rơi vào cực tiểu cục bộ chúng tôi đề xuất một phương pháp đột biến như sau: Kết hợp đột biến BIASED với đột biến UNBIASED trong đó đột biến BIASED sẽ đóng vai trò chủ đạo (xác suất đột biến lớn hơn). Đột biến UNBIASED được đưa thêm vào với mục đích giúp cho các trọng số có giá trị quá lớn chuyển về các giá trị nhỏ (giá trị ngẫu nhiên xung quanh 0). Do đó, có thể giúp mạng thoát khỏi cực tiểu cục bộ. Việc thử nghiệm giải thuật cải tiến được tiến hành với các tham số giống như thuật toán GA trong thử nghiệm 2.3.5 nhưng có kết hợp thêm đột biến UNBIASED với xác suất đột biến nhỏ: 0.03. Sau đây là số lần lặp để mạng hội tụ với phương pháp đột biến đề xuất : Bảng 2.5 Kết quả thử nghiệm với giải thuật đề xuất STT Số lần lặp STT Số lần lặp STT Số lần lặp 1 8510 36 277 71 1538 2 1052 37 1339 72 654 3 404 38 457 73 2986 4 215 39 - 74 190 5 912 40 2153 75 568 6 - 41 3177 76 169 7 7322 42 7414 77 201 8 873 43 627 78 - 9 4701 44 4248 79 6371 10 1014 45 1076 80 - 11 - 46 272 81 292 12 825 47 219 82 - 13 840 48 - 83 838 14 2835 49 6985 84 9910 15 157 50 2552 85 1207 16 216 51 473 86 4587 17 8552 52 8128 87 418 18 976 53 - 88 326 19 258 54 809 89 - 20 1151 55 4745 90 5244 21 481 56 - 91 216 22 4024 57 9084 92 514 23 835 58 1133 93 516 24 839 59 5617 94 1047 25 305 60 164 95 728 26 729 61 186 96 896 27 2935 62 525 97 900 28 614 63 8968 98 813 51 29 890 64 334 99 565 30 1020 65 1522 100 4819 31 1816 66 461 32 6075 67 5859 33 223 68 323 Số lần mạng hội tụ 89 34 - 69 533 35 1667 70 630 Trung bình 2135.61 Có thể rút ra một số nhận xét sau thử nghiệm này: - Số lần mạng hội tụ tăng lên rất nhiều so với đột biến chỉ dùng phương pháp BIASED (89 so với 70). - Số lần lặp để mạng hội tụ của phương pháp cải tiến cao hơn nhiều so với đột biến chỉ dùng phương pháp BIASED (2135.61 so với 1228.59). Có nghĩa là phương pháp cải tiến có nhiều khả năng đưa mạng về trạng thái hội tụ tuy nhiên thời gian hội tụ trung bình dài hơn so với phương pháp đột biến chỉ dùng BIASED. 2.3 Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số để tối ưu hoá trọng số mạng nơ-ron nhân tạo 2.3.1 Đặt vấn đề Mặc dù GA có khả năng đạt tới cực trị toàn cục cho quá trình tìm kiếm nhưng do có kết hợp những yếu tố ngẫu nhiên nên tốc độ tìm kiếm nói chung là rất chậm. Mặt khác nó không thể hoàn toàn đạt được tới cực trị toàn cục mà chỉ cho những kết quả xung quanh đó. Đối lập với GA, giải thuật lan truyền ngược sai số (BP) lại cho phép đạt được những cực trị nếu như điểm xuất phát của quá trình tìm kiếm nằm trong vùng cực trị toàn cục. Để chứng minh nhận xét này chúng ta sẽ xem xét thử nghiệm sau: Thử nghiệm được tiến hành với bài toán XOR có các tham số như trong thử nghiệm 2.2.5c. Riêng giá trị sai số dừng lặp giảm đi 100 lần là: 0.0005. Khi đạt được giá trị sai số rất nhỏ như vậy có thể coi mạng đã đạt được gần chính xác vị trí cực tiểu toàn cục. Thử nghiệm so sánh hai giải thuật: GA’ - giải thuật di truyền sử dụng phương pháp đột biến đề xuất (2.2.6) BP - giải thuật lan truyền ngược sai số Sau đây là bảng thống kê số bước lặp để mạng hội tụ với mỗi phương án trong 100 lần thử nghiệm khác nhau. 52 Bảng 2.6 Kết quả thử nghiệm so sánh GA’ và BP với ngưỡng sai số 0.0005 STT GA’ BP STT GA’ BP STT GA’ BP 1 - 4329 36 - 3150 71 - - 2 - - 37 2216 - 72 - 3811 3 - 7599 38 - 6215 73 - - 4 - 5122 39 - 3299 74 - 5214 5 - 5741 40 - - 75 - - 6 1791 - 41 - 4142 76 - 5388 7 - 6796 42 - - 77 - 3458 8 - - 43 - 9778 78 - - 9 2882 - 44 - - 79 - - 10 - 6960 45 - 6099 80 - - 11 - - 46 - 4066 81 6291 - 12 - 3792 47 - 3420 82 - - 13 - 2905 48 - 3974 83 - 4567 14 3860 - 49 - - 84 - - 15 - 6098 50 - - 85 - - 16 - - 51 - 3424 86 - 5535 17 - 5307 52 - 7975 87 - 5532 18 - 5935 53 - - 88 - 4443 19 - - 54 - 4838 89 - - 20 - 4014 55 - 6510 90 - - 21 - - 56 - 3979 91 - - 22 - 4710 57 - - 92 - 3523 23 - - 58 - 5583 93 - - 24 - 4314 59 - 3207 94 - - 25 - - 60 - 4802 95 - 6073 26 - 3798 61 - 5154 96 - 5708 27 - 3735 62 - 4030 97 - 4090 28 - 7098 63 - 5222 98 - - 29 - - 64 - - 99 - - 30 - - 65 - 3916 100 - - 31 - - 66 - 3940 32 - 8349 67 - - 33 - - 68 - 6560 Số lần mạng hội tụ 6 57 34 - 2987 69 - 3149 35 874 5030 70 - 4121 Trung bình 2985.67 4956.39 Qua thử nghiệm này có thể dễ dàng nhận thấy rằng chỉ rất ít trường hợp GA’ đạt được giá trị sai số mong muốn. Kết hợp với kết quả trong bảng 2.4 và 2.5 ta có thể tóm tắt khả năng hội tụ của mạng với hai phương pháp học: giải thuật di truyền và giải thuật lan truyền ngược sai số khi ngưỡng sai số dừng lặp khác nhau. 53 Bảng 2.7 So sánh khả năng hội tụ của mạng khi sử dụng hai phương pháp học GA’ và BP với sai số dừng lặp khác nhau Số lần hội tụ trong 100 lần thử nghiệm Sai số dừng lặp GA’ BP 0.05 89 58 0.0005 6 57 Từ bảng 2.7 ta có nhận xét: GA có thể đạt đến vùng chứa cực tiểu toàn cục (sai số 0.05) dễ dàng hơn so với BP (89 lần so với 58 lần). Tuy nhiên, để đạt đến chính xác vị trí cực tiểu toàn cục (sai số 0.0005) thì GA lại rất kém (chỉ có 6 lần). Trong khi đó, hầu hết các trường hợp BP khi đã đưa mạng đến được vùng chứa cực tiểu toàn cục (sai số 0.05) thì BP sẽ đưa mạng đến chính xác cực tiểu toàn cục (sai số 0.0005). Do đó, việc kết hợp GA và BP có nhiều cơ hội đưa mạng đến được chính xác cực tiểu toàn cục. 2.3.2 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số Có thể kết hợp cả GA và BP nhằm đạt tới một kết quả trọn vẹn của bài toán tối ưu trọng số mạng nơ-ron nhân tạo. Trong giải thuật kết hợp này, GA được sử dụng như một bộ khởi tạo cho BP. Tập trọng số được mã hoá thành các nhiễm sắc thể và được tiến hoá nhờ GA. Kết thúc quá trình tiến hoá, bộ trọng số tốt nhất tương ứng với cá thể ưu việt nhất trong quần thể được lựa chọn làm những trọng số khởi tạo cho giải thuật BP. Nó chính là bộ tham số cho phép xác định điểm gần cực trị nhất của hàm giá. Với sự kết hợp này, giải thuật BP sẽ cần phải được thay đổi một vài yếu tố : - Giải thuật không tự khởi tạo trọng số mà nhận các trọng số từ GA. - Thành phần quán tính được loại bỏ để làm tăng tốc độ của quá trình hội tụ và loại bỏ dao động. 54 Hình 2.6 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số Việc thử nghiệm giải thuật kết hợp này được tiến hành với bài toán XOR ngưỡng sai số mong muốn là 0.0005. Giải thuật di truyền sử dụng phương pháp đột biến đề xuất (2.2.6). Các tham số cũng như các phần trước. Giải thuật gồm hai bước chính : - (1) GA sẽ đưa mạng đạt đến sai số 0.05 - (2) BP sẽ nhận bộ trọng số tốt nhất của GA đóng vai trò là trọng số khởi tạo (có sai số 0.05) để đưa mạng đến sai số mong muốn 0.0005. Bảng 2.8 Kết quả thử nghiệm giải thuật kết hợp GA’ và BP với ngưỡng sai sô 0.0005 STT (1) (2) STT (1) (2) STT (1) (2) 1 352 1366 36 4273 - 71 434 1793 2 924 2354 37 396 3428 72 - - 3 2520 1853 38 2636 - 73 320 1325 4 591 1260 39 509 1858 74 - - 5 362 1511 40 - - 75 751 1436 6 6949 1750 41 336 1988 76 876 1420 7 604 1768 42 568 922 77 - - 8 695 1730 43 4159 3411 78 1138 4423 9 348 2058 44 4235 1436 79 6986 1736 10 304 2372 45 265 2013 80 439 2724 11 2108 3171 46 2929 1548 81 640 3496 12 6109 1406 47 257 2692 82 472 2014 13 2615 1328 48 674 327 83 - - Khởi tạo tập trọng số Giải thuật di truyền Giữ lại nhiễm sắc thể tốt nhất Tập các trọng số Học bằng giải thuật lan truyền ngược sai số có thay đổi 55 14 653 3173 49 2370 5923 84 5173 1530 15 416 1265 50 242 2906 85 520 2769 16 2702 1783 51 594 1948 86 - - 17 535 2177 52 4925 861 87 3675 881 18 2856 1426 53 127 1248 88 373 2266 19 347 814 54 622 2006 89 632 1244 20 2800 1474 55 784 536 90 851 1331 21 1281 1184 56 272 6247 91 3852 1901 22 - - 57 8297 2247 92 3728 2300 23 3090 1399 58 7299 1356 93 1700 2806 24 426 2177 59 634 1434 94 - - 25 1685 1961 60 442 6227 95 3448 1020 26 1373 3254 61 220 1978 96 772 1850 27 1249 1993 62 3227 4801 97 332 4244 28 165 941 63 1177 - 98 1253 1826 29 605 1439 64 - - 99 764 1480 30 895 2082 65 704 4860 100 952 1499 31 708 2301 66 3922 1161 32 6097 2084 67 460 958 33 260 3072 68 613 1305 Số lần mạng hội tụ 90 87 34 8761 1914 69 - - 35 308 2376 70 164 1850 Trung bình 1778.956 2103.506 Nhận xét: - Cũng giống như lần thử nghiệm trước giải thuật di truyền sử dụng đột biến kết hợp (2.2.6), kết quả mạng hội tụ với sai số 0.05 rất cao (90/100). - Trong 90 lần nhận trọng số khởi tạo từ GA, BP có 87 lần đưa mạng từ sai số 0.05 về sai số 0.0005. Chỉ có 3 lần BP không đưa mạng đến yêu cầu sai số mong muốn (lần thử nghiệm thứ 36, 38, 63). - So sánh với việc sử dụng GA và BP riêng rẽ thì giải thuật kết hợp này cho kết quả tốt hơn rất nhiều. Kết luận chương Trong chương này chúng ta đã nghiên cứu các khái niệm và khả năng ứng dụng của giải thuật di truyền cũng như cách thức để tiến hành thực hiện một bài toán bằng giải thuật di truyền. Giải thuật di truyền được biết đến như một giải thuật tìm kiếm dựa trên học thuyết về chọn lọc tự nhiên và nó cho phép ta đạt được tới cực trị toàn cục. Do đó, áp dụng giải thuật di truyền vào bài toán tối ưu hoá trọng số mạng nơ- ron nhân tạo là một cách tiếp cận tiềm năng. Trong chương này chúng tôi đã nghiên cứu và thử nghiệm một số phương án và đưa ra một số cải tiến về phương pháp đột biến giúp cho quá trình học của mạng nơ-ron được tốt hơn. Ngoài ra chúng tôi cũng kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số nhằm đạt tới một kết 56 quả trọn vẹn của bài toán tối ưu trọng số mạng nơ-ron nhân tạo. Trong chương tiếp theo chúng ta sẽ nghiên cứu việc ứng dụng mạng nơ-ron nhân tạo với các phương pháp học kết hợp đã đề cập trong chương này vào việc dự báo lưu lượng nước đến hồ Hoà Bình. 57 CHƯƠNG 3 - ỨNG DỤNG MẠNG NƠ RON NHÂN TẠO VÀO VIỆC DỰ BÁO LƯU LƯỢNG NƯỚC ĐẾN HỒ HOÀ BÌNH Luận văn đề cập tới bài toán dự báo lưu lượng dòng chảy đến hồ Hoà Bình phục vụ tốt mục tiêu điều tiết vận hành hồ. Nguồn nước chính cung cấp cho hồ Hoà Bình là nguồn nước từ sông Đà. Dọc theo hệ thống sông Đà có các trạm đo quan trắc khí tượng và thuỷ văn bắt đầu hoạt động từ năm 1902. Trạm đo thuỷ văn gần hồ Hoà Bình nhất là trạm đo Tà Bú. Dự báo nước đến hồ Hoà Bình thực chất là dự báo lưu lượng nước tại trạm Tà Bú. Trong chương này, luận văn trình bày một số nội dung liên quan đến bài toán dự báo và một số thử nghiệm sử dụng những nghiên cứu trong chương 2 để dự báo nước đến hồ Hoà Bình trước 10 ngày. 3.1 Điều kiện địa lý, tự nhiên, khí tượng thuỷ văn lưu vực sông Đà Sông Đà là chi lưu lớn nhất của sông Hồng bắt nguồn từ dãy Ngụy Sơn thuộc tỉnh Vân Nam Trung Quốc chảy vào Việt Nam theo hướng Tây Bắc – Đông Nam ở độ cao trên 1500m sau đó ngoặt sang hướng Đông ở Pa Vinh, khi tới thị xã Hòa Bình thì sông chảy theo hướng Bắc đổ vào sông Hồng ở Trung Hà. Sông Đà có diện tích lưu vực 52.900 km2 trong đó 50.6% thuộc phần lãnh thổ Việt Nam, bao gồm phần trung và hạ lưu sông và chiếm 37% diện tích tập trung nước của sông Hồng. Sông Đà có chiều dài dòng chính là 980km (phần thuộc lãnh thổ Việt Nam dài 540 km). Lưu vực sông Đà có dạng hình thuôn dài chạy dọc theo hướng Tây Bắc – Đông Nam, kéo dài từ 20o40’ đến 25o00’ độ vĩ Bắc và từ 100o22’ đến 105o24’ độ kinh Đông với chiều dài lưu vực 690km (phần thuộc lãnh thổ Việt Nam là 380 km) và chiều rộng bình quân lưu vực 76km (phần trong nước là 80 km). Chiều rộng lưu vực lớn nhất là 165 km thuộc tỉnh Lai Châu còn phần hẹp nhất 25km, thuộc tỉnh Hòa Bình. Độ dốc bình quân lòng sông trung bình 0.41‰, trong đó độ dốc lòng sông thuộc lãnh thổ Trung Quốc là 2,54‰. 3.1.1 Vị trí địa lý Lưu vực sông Đà nằm giữa các dãy núi cao và trung bình chạy dài theo hướng Tây Bắc - Đông Nam. Đặc điểm nổi bật của lưu vực sông Đà là các dạng địa hình núi cao và cao nguyên đều cao và bị chia cắt theo chiều thẳng đứng rất mạnh. Điều nhận thấy rõ rệt là địa hình núi và cao nguyên ở đây có sự sắp xếp song song có ảnh hưởng lớn đến khí hậu của vùng. Có thể nói lưu vực sông Đà chia làm 3 nhóm địa hình: Nhóm kiểu địa hình núi, nhóm kiểu địa hình cao nguyên, nhóm kiểu địa hình thung lũng. 58 3.1.2 Địa hình Địa hình lưu vực sông Đà thuộc vùng Tây Bắc nước ta từ biên giới Việt - Trung, Việt - Lào tới Lai Châu, Mường Lay chủ yếu là các dãy núi ở độ cao trên 1000 m. Địa hình có hình dáng đường sống núi hẹp, có đỉnh cao nhất đạt tới 3076 m, chủ yếu cấu tạo bởi granit, ven rìa xen đá phiến và đá vôi. 3.1.3 Điều kiện địa chất Về cấu trúc địa chất, sông Đà là vùng có cấu trúc địa chất phức tạp và chưa ổn định. Toàn bộ lưu vực phân bố rộng trên nền đá vôi, tạo nên cấu trúc Karst phức tạp, có nhiều đứt gãy ngang. Ba đới đứt gãy chính là đứt gãy sông Hồng, đứt gãy Điện Biên – Lai Châu và đứt gãy sông Mã. Về các hoạt động địa chấn, do lưu vực có địa hình núi chia cắt nên có nhiều quá trình ngoại sinh huỷ hoại, quá trình xói mòn đất, kết hợp với cấu trúc địa chất kém ổn định thường diễn ra các hoạt động địa chấn như động đất. Ngoài ra trong vùng còn thường xuyên có động đất kích thích xảy ra như nứt, trượt, sạt lở đất đặc biệt ở các vùng dốc cao, do tổng hợp của nhiều nguyên nhân khác nhau gây ra: do tác động của trọng lực, do hoạt hoá trở lại của các đứt gãy kiến tạo, vv ... các quá trình địa chất này chủ yếu xảy ra trong giai đoạn đầu khi các hồ chứa tích nước. Các kết quả nghiên cứu trong nhiều năm qua cho thấy cùng với sự tích nước của hồ chứa, các hoạt động địa chất đã tăng lên, hiện tượng động đất kích thích xảy ra mạnh mẽ nhất ở khu vực xung quanh đập thuộc địa phận Thị xã Hoà Bình. 3.1.4 Điều kiện thổ nhưỡng Tây Bắc là vùng rừng núi cao, có độ chia cắt mạnh nhất Việt Nam; riêng với lưu vực sông Đà, thổ nhưỡng có đặc điểm chủ yếu là trên nền đá vôi và đất phong hoá trên nền đá vôi. Tuy nhiên, do địa hình chia cắt mạnh và diễn biến khác biệt về chế độ khí hậu, thuỷ văn giữa các tiểu vùng sinh thái nên loại hình phân bố thổ nhưỡng của lưu vực sông Đà rất đa dạng và phong phú. 3.1.5 Đặc điểm khí hậu Có thể nói rằng khí hậu vùng lưu vực sông Đà là khí hậu nhiệt đới, gió mùa vùng núi với hai mùa rõ rệt. Mùa đông lạnh, suốt mùa đông duy trì một tình trạng hanh khô điển hình, có sương muối và ít mưa (mùa khô) trùng với mùa gió Đông Bắc, kéo dài từ tháng Mười Một năm trước tới tháng Ba năm sau. Mùa hè trùng với mùa gió Tây Nam, nóng có gió tây khô nóng và nhiều mưa (mùa mưa), kéo dài từ tháng Năm tới tháng Chín hàng năm. Giữa hai mùa (tháng Tư, tháng Mười) là thời kỳ chuyển tiếp, nền nhiệt ẩm và có tính ôn hoà. 59 Về cơ bản, mùa mưa gần như trùng với mùa nóng và mùa khô trùng với mùa lạnh. Mưa đá cũng thường xảy ra trong thời kỳ quá độ từ mùa lạnh sang mùa nóng. Lượng mưa ở vùng lưu vực sông Đà phân bố rất không đều phụ thuộc vào đặc điểm của địa hình, giá trị trung bình năm biến đổi khá mạnh mẽ từ 1300-3200mm. Vùng mưa lớn Hoàng Liên – Sa Pa đạt tới trên 2000mm, trong khi vùng mưa ít Nam Sơn La chỉ đạt 1200 - 1600mm. Tương ứng với vùng mưa lớn cũng là vùng có lượng ẩm phong phú quanh năm, đồng thời vùng mưa ít cũng là vùng thiếu ẩm, chủ yếu là trong mùa Đông. Lưu vực sông Đà có độ ẩm cao và ít thay đổi. Độ ẩm tuyệt đối dao động trong phạm vi từ 11 - 32mb và độ ẩm tương đối khá cao, trung bình năm trong toàn vùng lưu vực sông Đà dao động trong khoảng từ 80 – 85% và không chênh lệch nhiều giữa các vùng (mùa nóng độ ẩm không khí trung bình khoảng 84 – 87%, mùa lạnh có khí hậu khô lạnh, độ ẩm không khí chỉ có 72 – 75%). Lượng bốc hơi lớn nhất (đo bằng ống Piche) dao động trong phạm vi khá rộng, từ 666 đến 1052 mm/năm. Thời kỳ giữa mùa khô đến đầu mùa mưa (II-V) có lượng bốc hơi lớn nhất, đạt 70-150mm/tháng. Vào thời kỳ còn lại, lượng bốc hơi dao động trong khoảng 40-70mm/tháng. Toàn lưu vực sông Đà chịu tác động của cơ chế gió mùa Đông Nam Á với hai mùa gió: gió mùa đông và gió mùa hạ. Gió mùa đông bị chi phối bởi không khí cực đới lục địa và không khí nhiệt đới biển Đông đã biến tính. Gió mùa hạ bị chi phối bởi ba khối không khí: không khí nhiệt đới biển Bắc Ấn Độ Dương (gió Tây Nam), không khí xích đạo (gió Nam) và không khí biển Thái Bình Dương. Cơ chế gió mùa và sự thay đổi điều kiện bức xạ theo chu kỳ năm tạo nên biến đổi tuần hoàn năm của hầu hết các yếu tố khí hậu, nổi bật nhất là sự hình thành và diễn biến của các mùa. 3.1.6 Đặc điểm chế độ thuỷ văn a. Mạng lưới sông ngòi Sông ngòi trong lưu vực sông Đà có những đặc điểm khác so với những vùng Đông Bắc. Dòng chính của sông Đà có hướng trùng kiến tạo của khu Tây Bắc. Sông suối trong lưu vực sông Đà thuộc loại sông trẻ, thung lũng sông hẹp, nhiều đoạn có dạng hẻm vực sâu, chứng tỏ địa hình mới được nâng lên rất mạnh. Phần lớn lòng sông cao hơn mặt biển từ 100 - 500m. Do đó sông đang đào lòng mạnh, trắc diện hẹp, bồi tụ ít và lắm thác ghềnh. Thượng lưu sông Đà kể từ nguồn tới Pắc Ma, dòng sông chảy theo hướng Tây Bắc - Đông Nam. Lòng sông đoạn này hẹp, mùa cạn rộng, trung bình 40 - 60m. Độ 60 dốc lớn chỉ tính từ biên giới Việt Trung tới Lai Châu dài khoảng 125km, đạt độ dốc bình quân tới 160cm/km. Trung lưu sông Đà từ Pắc Ma tới Suối Rút, sông vẫn chảy theo hướng Tây Bắc - Đông Nam. Dòng sông chảy giữa hai bờ núi rất cao. Độ dốc đáy sông giảm xuống rõ rệt, còn khoảng 38 - 40

Các file đính kèm theo tài liệu này:

MSc07_Pham_Thi_Hoang_Nhung_Thesis.pdf