Mục lục
Lời cảm ơn. i
Mục lục . 4
Danh sách hình vẽ. 7
Danh sách bảng biểu . 9
MỞ ĐẦU . 10
CHƯƠNG 1 - MẠNG NƠ-RON NHÂN TẠO TRUYỀN THẲNG NHIỀU
LỚP. 13
1.1 Giới thiệu vềmạng nơ-ron nhân tạo. 13
1.1.1 Khái niệm cơbản. 13
1.1.2 Mô hình mạng nơ-ron nhân tạo . 15
1.1.3 Khảnăng ứng dụng của mạng nơ-ron nhân tạo . 18
1.2 Mạng nơ-ron lan truyền thẳng nhiều lớp. 19
1.2.1 Mạng perceptron một lớp . 19
1.2.2 Mạng perceptron nhiều lớp . 22
1.2.3 Một sốvấn đềcần chú ý khi sửdụng mạng MLP . 30
Kết luận chương . 33
CHƯƠNG 2 - KẾT HỢP GIẢI THUẬT DI TRUYỀN VỚI GIẢI THUẬT
LAN TRUYỀN NGƯỢC SAI SỐ ĐỂTỐI ƯU HOÁ TRỌNG SỐ
MẠNG NƠ-RON NHÂN TẠO . 34
2.1 Giới thiệu giải thuật di truyền . 34
2.1.1 Giới thiệu. 34
2.1.2 Tưtưởng chính của giải thuật di truyền . 35
2.1.3 Giải thuật di truyền đơn giản. 37
2.1 Ứng dụng giải thuật di truyền vào bài toán tối ưu hoá trọng sốcủa mạng
nơ-ron nhân tạo . 41
2.2.1 Xây dựng hàm giá . 42
2.2.2 Mã hoá nhiễm sắc thể. 42
2.2.3 Lai ghép . 43
2.2.4 Đột biến . 44
2.2.5 Thửnghiệm . 45
2.2.6 Giải thuật đềxuất . 49
2.3 Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số đểtối ưu
hoá trọng sốmạng nơ-ron nhân tạo . 51
2.3.1 Đặt vấn đề. 51
2.3.2 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số. 53
Kết luận chương . 55
CHƯƠNG 3 - ỨNG DỤNG MẠNG NƠRON NHÂN TẠO VÀO VIỆC DỰ
BÁO LƯU LƯỢNG NƯỚC ĐẾN HỒHOÀ BÌNH . 57
3.1 Điều kiện địa lý, tựnhiên, khí tượng thuỷvăn lưu vực sông Đà . 57
3.1.1 Vịtrí địa lý. 57
3.1.2 Địa hình . 58
3.1.3 Điều kiện địa chất. 58
3.1.4 Điều kiện thổnhưỡng . 58
3.1.5 Đặc điểm khí hậu. 58
3.1.6 Đặc điểm chế độthuỷvăn . 59
3.1.7 Thống kê dữliệu thu thập được. 63
3.2 Các phương pháp dựbáo. 64
3.2.1 Dựa trên mô hình vật lý. 64
3.2.2 Dựa trên mô hình toán. 66
3.2.3 Hướng tiếp cận mới . 67
3.3 Một sốchỉtiêu đánh giá kết quảdựbáo. 67
3.4 Dựbáo lưu lượng đến hồHoà Bình trước 10 ngày . 68
3.4.1 Phần mềm xây dựng . 68
3.4.2 Sốliệu sửdụng . 69
3.4.3 Các tham số. 70
3.4.4 Các phương án dựbáo. 70
Kết luận chương . 75
KẾT LUẬN .
94 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2305 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng mạng nơron nhân tạo vào việc dự báo lưu lượng nước đến hồ Hoà Bình, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
t đột biến: 0.1
- Ngưỡng dừng lặp: 0.05
Việc thử nghiệm được tiến hành với 100 lần chạy mỗi phương án. Dưới đây là
bảng thống kê các lần chạy và số thế hệ cần thiết để đạt được yêu cầu về sai số.
(1) – phương án ‘đột biến trọng số BIASED’
(2) – phương án ‘đột biến nút’
Bảng 2.2 So sánh các phương pháp đột biến
STT (1) (2) STT (1) (2) STT (1) (2)
1 61 100 36 134 50 71 59 151
2 227 21 37 143 35 72 133 157
3 152 33 38 59 151 73 40 43
4 97 15 39 35 231 74 66 85
5 27 33 40 188 37 75 112 20
6 60 170 41 522 97 76 87 85
7 164 593 42 38 48 77 163 32
8 181 152 43 39 514 78 794 55
9 31 104 44 487 76 79 55 167
10 57 116 45 205 163 80 260 139
11 167 101 46 99 37 81 141 101
12 146 91 47 75 72 82 674 63
13 780 647 48 153 44 83 67 91
14 342 56 49 26 40 84 102 108
15 100 377 50 62 58 85 52 43
16 235 515 51 146 59 86 235 155
17 138 42 52 152 105 87 85 58
18 44 54 53 80 18 88 100 29
46
19 71 118 54 63 67 89 27 80
20 316 161 55 905 43 90 49 58
21 37 153 56 66 298 91 48 22
22 70 96 57 71 369 92 276 48
23 80 45 58 134 158 93 443 565
24 68 100 59 36 163 94 32 144
25 249 20 60 523 28 95 56 130
26 123 82 61 22 56 96 246 67
27 55 41 62 39 69 97 66 146
28 89 33 63 82 58 98 341 105
29 39 24 64 8 129 99 215 44
30 77 43 65 219 60 100 72 329
31 247 150 66 128 37
32 159 60 67 35 15
33 73 11 68 84 35
34 130 40 69 55 22
35 67 5 70 99 101
Trung bình
152.67
112.65
Nhận xét: Kết quả trung bình sau 112.65 thế hệ phương pháp ‘đột biến nút’ đã
đạt yêu cầu, nhỏ hơn nhiều so với phương pháp ‘đột biến trọng số BIASED’ là
152.67 thế hệ.
b. Thử nghiệm giải thuật di truyền với các phương pháp lai ghép khác nhau
So sánh hai phương pháp lai ghép là ‘lai ghép trọng số’ và ‘lai ghép nút’ cả hai
phương pháp này đều sử dụng phương pháp ‘đột biến nút’. Các tham số giống nhau
với cả hai phương án:
- Số lượng quần thể: 100
- Xác suất lai: 0.3
- Xác suất đột biến: 0.1
- Ngưỡng dừng lặp: 0.05
Việc thử nghiệm được tiến hành với 100 lần chạy mỗi phương án. Dưới đây là
bảng thống kê số thế hệ cần thiết trong từng lần chạy để đạt được yêu cầu về sai số là
0.05.
(1) – phương án ‘lai ghép nút’
(2) – phương án ‘lai ghép trọng số’
Bảng 2.3 So sánh các phương pháp lai ghép
STT (1) (2) STT (1) (2) STT (1) (2)
1 294 100 36 176 50 71 183 151
2 202 21 37 32 35 72 113 157
3 21 33 38 50 151 73 120 43
47
4 42 15 39 114 231 74 42 85
5 50 33 40 29 37 75 42 20
6 43 170 41 18 97 76 57 85
7 73 593 42 179 48 77 155 32
8 108 152 43 46 514 78 69 55
9 127 104 44 114 76 79 488 167
10 31 116 45 21 163 80 203 139
11 46 101 46 139 37 81 39 101
12 54 91 47 79 72 82 25 63
13 48 647 48 82 44 83 182 91
14 68 56 49 74 40 84 55 108
15 59 377 50 55 58 85 32 43
16 130 515 51 35 59 86 35 155
17 61 42 52 186 105 87 56 58
18 135 54 53 88 18 88 145 29
19 70 118 54 32 67 89 172 80
20 77 161 55 147 43 90 36 58
21 83 153 56 59 298 91 32 22
22 12 96 57 131 369 92 50 48
23 66 45 58 1268 158 93 277 565
24 44 100 59 122 163 94 23 144
25 24 20 60 65 28 95 44 130
26 150 82 61 211 56 96 20 67
27 187 41 62 25 69 97 56 146
28 60 33 63 26 58 98 25 105
29 30 24 64 50 129 99 184 44
30 67 43 65 66 60 100 26 329
31 28 150 66 124 37
32 47 60 67 10 15
33 178 11 68 44 35
34 39 40 69 8 22
35 159 5 70 109 101
Trung bình
99.13
112.65
Nhận xét: Kết quả trung bình sau 99.13 thế hệ phương pháp ‘lai ghép nút’ đã đạt
yêu cầu thấp hơn một chút so với phương pháp ‘lai ghép trọng số’ là 112.65 thế hệ.
c. Thử nghiệm so sánh giải thuật di truyền và giải thuật lan truyền ngược sai số
Thử nghiệm hai phương pháp với bài toán nổi tiếng XOR. Có 4 mẫu học như
sau:
X1 X2 Y
0 0 0
0 1 1
1 0 1
1 1 0
Tham số chung cho cả hai phương pháp:
48
- Mạng nơ-ron sử dụng là mạng có một lớp ẩn
- Số nơ-ron trong lớp ẩn: 2
- Ngưỡng sai số dừng lặp: 0.05 hoặc quá 10000 vòng lặp
Tham số của giải thuật lan truyền ngược sai số:
- Hằng số học: 0.3
Tham số của giải thuật di truyền:
- Số lượng quần thể: 100
- Xác suất lai: 0.3
- Xác suất đột biến: 0.1
- Sử dụng phương pháp lai ghép nút và đột biến nút
Sau đây là bảng thống kê số bước lặp để mạng hội tụ với mỗi phương án trong
100 lần thử nghiệm khác nhau.
GA: giải thuật di truyền
BP: giải thuật lan truyền ngược sai số
- : mạng không hội tụ (số lần lặp lớn hơn 10000)
Bảng 2.4 Kết quả thử nghiệm so sánh GA và BP với ngưỡng sai số 0.0005
STT GA BP STT GA BP STT GA BP
1 1075 1515 36 283 - 71 1936 -
2 613 1005 37 - 1417 72 2004 3827
3 4629 1613 38 692 2863 73 2550 1594
4 372 1121 39 703 - 74 628 -
5 - - 40 - 1827 75 298 1754
6 678 1770 41 - 1930 76 612 2665
7 777 - 42 254 1848 77 461 -
8 704 - 43 - - 78 812 911
9 - 1666 44 527 - 79 1088 -
10 2198 1618 45 - 4613 80 206 -
11 1392 3397 46 2307 - 81 1051 -
12 - - 47 285 1591 82 - 1323
13 5645 5569 48 - 1612 83 - 2319
14 - 2822 49 1663 - 84 479 2495
15 2330 - 50 - 1457 85 - -
16 - 2935 51 1067 - 86 1931 -
17 426 1373 52 - 2462 87 566 4041
18 844 2023 53 793 - 88 730 1833
19 875 - 54 261 2710 89 594 -
20 - 3320 55 5262 - 90 - -
49
21 790 2397 56 - - 91 - 1555
22 - 1176 57 - 1325 92 1986 1493
23 1542 - 58 635 1279 93 252 1850
24 714 - 59 326 - 94 243 1195
25 629 2018 60 929 - 95 739 -
26 550 - 61 3106 1572 96 - -
27 566 - 62 6286 3351 97 903 1238
28 1462 - 63 692 - 98 - -
29 1238 1751 64 - - 99 2149 -
30 844 - 65 - 2879 100 760 3040
31 - - 66 487 1729
32 791 1150 67 209 1347
33 1153 1604 68 910 -
Số lần mạng
hội tụ
70
58
34 - 7368 69 - 2083
35 - 1558 70 2505 1050
Trung bình
1228.59
2152.53
Kết quả trong 100 lần chạy :
- Giải thuật di truyền chạy thành công được 70 lần trung bình 1228.59
vòng lặp một lần chạy.
- Giải thuật lan truyền ngược sai số chạy thành công được 58 lần trung
bình 2152.53 vòng lặp.
Ta có thể thấy rằng giải thuật di truyền có khả năng đạt được yêu cầu về hội tụ
(sai số ≤ 0.05) tức tìm vùng chứa cực trị toàn cục dễ dàng hơn so với giải thuật lan
truyền ngược sai số. Hay nói cách khác giải thuật lan truyền ngược sai số dễ rơi vào
vùng chứa cực tiểu cục bộ hơn giải thuật di truyền. Trong 100 lần chạy, GA chỉ có
30 lần không tìm được cực trị toàn cục trong khi đó BP là 42 lần.
2.2.6 Giải thuật đề xuất
Trong thử nghiệm so sánh GA với BP ở trên ta thấy: tuy GA có khả năng đưa
mạng vùng chứa cực tiểu toàn cục dễ dàng hơn so với BP tuy nhiên vẫn còn nhiều
trường hợp GA không làm mạng hội tụ được (trong thử nghiệm trên 30/100 lần
mạng không hội tụ với GA). Nguyên nhân nào đã làm cho mạng rơi vào cực tiểu địa
phương mà không thoát ra được? Sau nhiều lần thử nghiệm, chúng tôi nhận thấy rất
nhiều trường hợp mạng không thể hội tụ vì một số giá trị trọng số của mạng đã quá
lớn. Có thể giải thích điều này là do phương pháp đột biến sử dụng là chỉ đột biến
kiểu BIASED (phần 2.2.4). Phương pháp đột biến này sẽ cộng vào trọng số được đột
biến một giá trị ngẫu nhiên xung quanh 0. Như Montana D. và Davis L. [16] đã thử
nghiệm và nhận xét rằng phương pháp đột biến này là hiệu quả hơn UNBIASED
(trọng số được đột biến sẽ được thay thế bằng một giá trị ngẫu nhiên xung quanh 0)
do kế thừa được tính "tốt" của thế hệ trước. Tuy nhiên một số trường hợp đột biến
kiểu BIASED sẽ đẩy một số trọng số ngày càng rời xa gốc 0 và có thể mạng sẽ rơi
50
vào cực tiểu cục bộ mà không thoát ra được. Làm sao có thể tận dụng được những
ưu điểm của đột biến dạng BIASED nhưng lại giúp mạng không rơi vào cực tiểu cục
bộ chúng tôi đề xuất một phương pháp đột biến như sau:
Kết hợp đột biến BIASED với đột biến UNBIASED trong đó đột biến
BIASED sẽ đóng vai trò chủ đạo (xác suất đột biến lớn hơn). Đột biến
UNBIASED được đưa thêm vào với mục đích giúp cho các trọng số có giá trị
quá lớn chuyển về các giá trị nhỏ (giá trị ngẫu nhiên xung quanh 0). Do đó,
có thể giúp mạng thoát khỏi cực tiểu cục bộ.
Việc thử nghiệm giải thuật cải tiến được tiến hành với các tham số giống như
thuật toán GA trong thử nghiệm 2.3.5 nhưng có kết hợp thêm đột biến UNBIASED
với xác suất đột biến nhỏ: 0.03. Sau đây là số lần lặp để mạng hội tụ với phương
pháp đột biến đề xuất :
Bảng 2.5 Kết quả thử nghiệm với giải thuật đề xuất
STT Số lần lặp STT Số lần lặp STT Số lần lặp
1 8510 36 277 71 1538
2 1052 37 1339 72 654
3 404 38 457 73 2986
4 215 39 - 74 190
5 912 40 2153 75 568
6 - 41 3177 76 169
7 7322 42 7414 77 201
8 873 43 627 78 -
9 4701 44 4248 79 6371
10 1014 45 1076 80 -
11 - 46 272 81 292
12 825 47 219 82 -
13 840 48 - 83 838
14 2835 49 6985 84 9910
15 157 50 2552 85 1207
16 216 51 473 86 4587
17 8552 52 8128 87 418
18 976 53 - 88 326
19 258 54 809 89 -
20 1151 55 4745 90 5244
21 481 56 - 91 216
22 4024 57 9084 92 514
23 835 58 1133 93 516
24 839 59 5617 94 1047
25 305 60 164 95 728
26 729 61 186 96 896
27 2935 62 525 97 900
28 614 63 8968 98 813
51
29 890 64 334 99 565
30 1020 65 1522 100 4819
31 1816 66 461
32 6075 67 5859
33 223 68 323
Số lần mạng
hội tụ
89
34 - 69 533
35 1667 70 630
Trung bình
2135.61
Có thể rút ra một số nhận xét sau thử nghiệm này:
- Số lần mạng hội tụ tăng lên rất nhiều so với đột biến chỉ dùng phương
pháp BIASED (89 so với 70).
- Số lần lặp để mạng hội tụ của phương pháp cải tiến cao hơn nhiều so với
đột biến chỉ dùng phương pháp BIASED (2135.61 so với 1228.59).
Có nghĩa là phương pháp cải tiến có nhiều khả năng đưa mạng về trạng thái hội
tụ tuy nhiên thời gian hội tụ trung bình dài hơn so với phương pháp đột biến chỉ
dùng BIASED.
2.3 Kết hợp giải thuật di truyền với giải thuật lan truyền
ngược sai số để tối ưu hoá trọng số mạng nơ-ron nhân
tạo
2.3.1 Đặt vấn đề
Mặc dù GA có khả năng đạt tới cực trị toàn cục cho quá trình tìm kiếm nhưng do
có kết hợp những yếu tố ngẫu nhiên nên tốc độ tìm kiếm nói chung là rất chậm. Mặt
khác nó không thể hoàn toàn đạt được tới cực trị toàn cục mà chỉ cho những kết quả
xung quanh đó. Đối lập với GA, giải thuật lan truyền ngược sai số (BP) lại cho phép
đạt được những cực trị nếu như điểm xuất phát của quá trình tìm kiếm nằm trong
vùng cực trị toàn cục. Để chứng minh nhận xét này chúng ta sẽ xem xét thử nghiệm
sau:
Thử nghiệm được tiến hành với bài toán XOR có các tham số như trong thử
nghiệm 2.2.5c. Riêng giá trị sai số dừng lặp giảm đi 100 lần là: 0.0005. Khi đạt được
giá trị sai số rất nhỏ như vậy có thể coi mạng đã đạt được gần chính xác vị trí cực
tiểu toàn cục. Thử nghiệm so sánh hai giải thuật:
GA’ - giải thuật di truyền sử dụng phương pháp đột biến đề xuất (2.2.6)
BP - giải thuật lan truyền ngược sai số
Sau đây là bảng thống kê số bước lặp để mạng hội tụ với mỗi phương án trong
100 lần thử nghiệm khác nhau.
52
Bảng 2.6 Kết quả thử nghiệm so sánh GA’ và BP với ngưỡng sai số 0.0005
STT GA’ BP STT GA’ BP STT GA’ BP
1 - 4329 36 - 3150 71 - -
2 - - 37 2216 - 72 - 3811
3 - 7599 38 - 6215 73 - -
4 - 5122 39 - 3299 74 - 5214
5 - 5741 40 - - 75 - -
6 1791 - 41 - 4142 76 - 5388
7 - 6796 42 - - 77 - 3458
8 - - 43 - 9778 78 - -
9 2882 - 44 - - 79 - -
10 - 6960 45 - 6099 80 - -
11 - - 46 - 4066 81 6291 -
12 - 3792 47 - 3420 82 - -
13 - 2905 48 - 3974 83 - 4567
14 3860 - 49 - - 84 - -
15 - 6098 50 - - 85 - -
16 - - 51 - 3424 86 - 5535
17 - 5307 52 - 7975 87 - 5532
18 - 5935 53 - - 88 - 4443
19 - - 54 - 4838 89 - -
20 - 4014 55 - 6510 90 - -
21 - - 56 - 3979 91 - -
22 - 4710 57 - - 92 - 3523
23 - - 58 - 5583 93 - -
24 - 4314 59 - 3207 94 - -
25 - - 60 - 4802 95 - 6073
26 - 3798 61 - 5154 96 - 5708
27 - 3735 62 - 4030 97 - 4090
28 - 7098 63 - 5222 98 - -
29 - - 64 - - 99 - -
30 - - 65 - 3916 100 - -
31 - - 66 - 3940
32 - 8349 67 - -
33 - - 68 - 6560
Số lần mạng
hội tụ 6
57
34 - 2987 69 - 3149
35 874 5030 70 - 4121
Trung bình
2985.67
4956.39
Qua thử nghiệm này có thể dễ dàng nhận thấy rằng chỉ rất ít trường hợp GA’ đạt
được giá trị sai số mong muốn. Kết hợp với kết quả trong bảng 2.4 và 2.5 ta có thể
tóm tắt khả năng hội tụ của mạng với hai phương pháp học: giải thuật di truyền và
giải thuật lan truyền ngược sai số khi ngưỡng sai số dừng lặp khác nhau.
53
Bảng 2.7 So sánh khả năng hội tụ của mạng khi sử dụng hai phương pháp học GA’
và BP với sai số dừng lặp khác nhau
Số lần hội tụ trong 100 lần thử nghiệm
Sai số dừng lặp GA’ BP
0.05 89 58
0.0005 6 57
Từ bảng 2.7 ta có nhận xét: GA có thể đạt đến vùng chứa cực tiểu toàn cục (sai
số 0.05) dễ dàng hơn so với BP (89 lần so với 58 lần). Tuy nhiên, để đạt đến chính
xác vị trí cực tiểu toàn cục (sai số 0.0005) thì GA lại rất kém (chỉ có 6 lần). Trong
khi đó, hầu hết các trường hợp BP khi đã đưa mạng đến được vùng chứa cực tiểu
toàn cục (sai số 0.05) thì BP sẽ đưa mạng đến chính xác cực tiểu toàn cục (sai số
0.0005). Do đó, việc kết hợp GA và BP có nhiều cơ hội đưa mạng đến được chính
xác cực tiểu toàn cục.
2.3.2 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số
Có thể kết hợp cả GA và BP nhằm đạt tới một kết quả trọn vẹn của bài toán tối
ưu trọng số mạng nơ-ron nhân tạo. Trong giải thuật kết hợp này, GA được sử dụng
như một bộ khởi tạo cho BP. Tập trọng số được mã hoá thành các nhiễm sắc thể và
được tiến hoá nhờ GA. Kết thúc quá trình tiến hoá, bộ trọng số tốt nhất tương ứng
với cá thể ưu việt nhất trong quần thể được lựa chọn làm những trọng số khởi tạo
cho giải thuật BP. Nó chính là bộ tham số cho phép xác định điểm gần cực trị nhất
của hàm giá.
Với sự kết hợp này, giải thuật BP sẽ cần phải được thay đổi một vài yếu tố :
- Giải thuật không tự khởi tạo trọng số mà nhận các trọng số từ GA.
- Thành phần quán tính được loại bỏ để làm tăng tốc độ của quá trình
hội tụ và loại bỏ dao động.
54
Hình 2.6 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số
Việc thử nghiệm giải thuật kết hợp này được tiến hành với bài toán XOR
ngưỡng sai số mong muốn là 0.0005. Giải thuật di truyền sử dụng phương pháp đột
biến đề xuất (2.2.6). Các tham số cũng như các phần trước. Giải thuật gồm hai bước
chính :
- (1) GA sẽ đưa mạng đạt đến sai số 0.05
- (2) BP sẽ nhận bộ trọng số tốt nhất của GA đóng vai trò là trọng số khởi
tạo (có sai số 0.05) để đưa mạng đến sai số mong muốn 0.0005.
Bảng 2.8 Kết quả thử nghiệm giải thuật kết hợp GA’ và BP với ngưỡng sai sô 0.0005
STT (1) (2) STT (1) (2) STT (1) (2)
1 352 1366 36 4273 - 71 434 1793
2 924 2354 37 396 3428 72 - -
3 2520 1853 38 2636 - 73 320 1325
4 591 1260 39 509 1858 74 - -
5 362 1511 40 - - 75 751 1436
6 6949 1750 41 336 1988 76 876 1420
7 604 1768 42 568 922 77 - -
8 695 1730 43 4159 3411 78 1138 4423
9 348 2058 44 4235 1436 79 6986 1736
10 304 2372 45 265 2013 80 439 2724
11 2108 3171 46 2929 1548 81 640 3496
12 6109 1406 47 257 2692 82 472 2014
13 2615 1328 48 674 327 83 - -
Khởi tạo tập
trọng số
Giải thuật di
truyền
Giữ lại nhiễm sắc
thể tốt nhất
Tập các trọng số
Học bằng giải thuật
lan truyền ngược
sai số có thay đổi
55
14 653 3173 49 2370 5923 84 5173 1530
15 416 1265 50 242 2906 85 520 2769
16 2702 1783 51 594 1948 86 - -
17 535 2177 52 4925 861 87 3675 881
18 2856 1426 53 127 1248 88 373 2266
19 347 814 54 622 2006 89 632 1244
20 2800 1474 55 784 536 90 851 1331
21 1281 1184 56 272 6247 91 3852 1901
22 - - 57 8297 2247 92 3728 2300
23 3090 1399 58 7299 1356 93 1700 2806
24 426 2177 59 634 1434 94 - -
25 1685 1961 60 442 6227 95 3448 1020
26 1373 3254 61 220 1978 96 772 1850
27 1249 1993 62 3227 4801 97 332 4244
28 165 941 63 1177 - 98 1253 1826
29 605 1439 64 - - 99 764 1480
30 895 2082 65 704 4860 100 952 1499
31 708 2301 66 3922 1161
32 6097 2084 67 460 958
33 260 3072 68 613 1305
Số lần mạng
hội tụ 90 87
34 8761 1914 69 - -
35 308 2376 70 164 1850
Trung bình
1778.956 2103.506
Nhận xét:
- Cũng giống như lần thử nghiệm trước giải thuật di truyền sử dụng đột biến
kết hợp (2.2.6), kết quả mạng hội tụ với sai số 0.05 rất cao (90/100).
- Trong 90 lần nhận trọng số khởi tạo từ GA, BP có 87 lần đưa mạng từ sai
số 0.05 về sai số 0.0005. Chỉ có 3 lần BP không đưa mạng đến yêu cầu sai
số mong muốn (lần thử nghiệm thứ 36, 38, 63).
- So sánh với việc sử dụng GA và BP riêng rẽ thì giải thuật kết hợp này cho
kết quả tốt hơn rất nhiều.
Kết luận chương
Trong chương này chúng ta đã nghiên cứu các khái niệm và khả năng ứng dụng
của giải thuật di truyền cũng như cách thức để tiến hành thực hiện một bài toán bằng
giải thuật di truyền. Giải thuật di truyền được biết đến như một giải thuật tìm kiếm
dựa trên học thuyết về chọn lọc tự nhiên và nó cho phép ta đạt được tới cực trị toàn
cục. Do đó, áp dụng giải thuật di truyền vào bài toán tối ưu hoá trọng số mạng nơ-
ron nhân tạo là một cách tiếp cận tiềm năng. Trong chương này chúng tôi đã nghiên
cứu và thử nghiệm một số phương án và đưa ra một số cải tiến về phương pháp đột
biến giúp cho quá trình học của mạng nơ-ron được tốt hơn. Ngoài ra chúng tôi cũng
kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số nhằm đạt tới một kết
56
quả trọn vẹn của bài toán tối ưu trọng số mạng nơ-ron nhân tạo. Trong chương tiếp
theo chúng ta sẽ nghiên cứu việc ứng dụng mạng nơ-ron nhân tạo với các phương
pháp học kết hợp đã đề cập trong chương này vào việc dự báo lưu lượng nước đến
hồ Hoà Bình.
57
CHƯƠNG 3 - ỨNG DỤNG MẠNG NƠ RON NHÂN
TẠO VÀO VIỆC DỰ BÁO LƯU LƯỢNG NƯỚC ĐẾN
HỒ HOÀ BÌNH
Luận văn đề cập tới bài toán dự báo lưu lượng dòng chảy đến hồ Hoà Bình phục
vụ tốt mục tiêu điều tiết vận hành hồ. Nguồn nước chính cung cấp cho hồ Hoà Bình
là nguồn nước từ sông Đà. Dọc theo hệ thống sông Đà có các trạm đo quan trắc khí
tượng và thuỷ văn bắt đầu hoạt động từ năm 1902. Trạm đo thuỷ văn gần hồ Hoà
Bình nhất là trạm đo Tà Bú. Dự báo nước đến hồ Hoà Bình thực chất là dự báo lưu
lượng nước tại trạm Tà Bú. Trong chương này, luận văn trình bày một số nội dung
liên quan đến bài toán dự báo và một số thử nghiệm sử dụng những nghiên cứu trong
chương 2 để dự báo nước đến hồ Hoà Bình trước 10 ngày.
3.1 Điều kiện địa lý, tự nhiên, khí tượng thuỷ văn lưu vực
sông Đà
Sông Đà là chi lưu lớn nhất của sông Hồng bắt nguồn từ dãy Ngụy Sơn thuộc
tỉnh Vân Nam Trung Quốc chảy vào Việt Nam theo hướng Tây Bắc – Đông Nam ở
độ cao trên 1500m sau đó ngoặt sang hướng Đông ở Pa Vinh, khi tới thị xã Hòa
Bình thì sông chảy theo hướng Bắc đổ vào sông Hồng ở Trung Hà. Sông Đà có diện
tích lưu vực 52.900 km2 trong đó 50.6% thuộc phần lãnh thổ Việt Nam, bao gồm
phần trung và hạ lưu sông và chiếm 37% diện tích tập trung nước của sông Hồng.
Sông Đà có chiều dài dòng chính là 980km (phần thuộc lãnh thổ Việt Nam dài 540
km). Lưu vực sông Đà có dạng hình thuôn dài chạy dọc theo hướng Tây Bắc – Đông
Nam, kéo dài từ 20o40’ đến 25o00’ độ vĩ Bắc và từ 100o22’ đến 105o24’ độ kinh
Đông với chiều dài lưu vực 690km (phần thuộc lãnh thổ Việt Nam là 380 km) và
chiều rộng bình quân lưu vực 76km (phần trong nước là 80 km). Chiều rộng lưu vực
lớn nhất là 165 km thuộc tỉnh Lai Châu còn phần hẹp nhất 25km, thuộc tỉnh Hòa
Bình. Độ dốc bình quân lòng sông trung bình 0.41‰, trong đó độ dốc lòng sông
thuộc lãnh thổ Trung Quốc là 2,54‰.
3.1.1 Vị trí địa lý
Lưu vực sông Đà nằm giữa các dãy núi cao và trung bình chạy dài theo hướng
Tây Bắc - Đông Nam. Đặc điểm nổi bật của lưu vực sông Đà là các dạng địa hình
núi cao và cao nguyên đều cao và bị chia cắt theo chiều thẳng đứng rất mạnh. Điều
nhận thấy rõ rệt là địa hình núi và cao nguyên ở đây có sự sắp xếp song song có ảnh
hưởng lớn đến khí hậu của vùng. Có thể nói lưu vực sông Đà chia làm 3 nhóm địa
hình: Nhóm kiểu địa hình núi, nhóm kiểu địa hình cao nguyên, nhóm kiểu địa hình
thung lũng.
58
3.1.2 Địa hình
Địa hình lưu vực sông Đà thuộc vùng Tây Bắc nước ta từ biên giới Việt - Trung,
Việt - Lào tới Lai Châu, Mường Lay chủ yếu là các dãy núi ở độ cao trên 1000 m.
Địa hình có hình dáng đường sống núi hẹp, có đỉnh cao nhất đạt tới 3076 m, chủ yếu
cấu tạo bởi granit, ven rìa xen đá phiến và đá vôi.
3.1.3 Điều kiện địa chất
Về cấu trúc địa chất, sông Đà là vùng có cấu trúc địa chất phức tạp và chưa ổn
định. Toàn bộ lưu vực phân bố rộng trên nền đá vôi, tạo nên cấu trúc Karst phức tạp,
có nhiều đứt gãy ngang. Ba đới đứt gãy chính là đứt gãy sông Hồng, đứt gãy Điện
Biên – Lai Châu và đứt gãy sông Mã. Về các hoạt động địa chấn, do lưu vực có địa
hình núi chia cắt nên có nhiều quá trình ngoại sinh huỷ hoại, quá trình xói mòn đất,
kết hợp với cấu trúc địa chất kém ổn định thường diễn ra các hoạt động địa chấn như
động đất.
Ngoài ra trong vùng còn thường xuyên có động đất kích thích xảy ra như nứt,
trượt, sạt lở đất đặc biệt ở các vùng dốc cao, do tổng hợp của nhiều nguyên nhân
khác nhau gây ra: do tác động của trọng lực, do hoạt hoá trở lại của các đứt gãy kiến
tạo, vv ... các quá trình địa chất này chủ yếu xảy ra trong giai đoạn đầu khi các hồ
chứa tích nước. Các kết quả nghiên cứu trong nhiều năm qua cho thấy cùng với sự
tích nước của hồ chứa, các hoạt động địa chất đã tăng lên, hiện tượng động đất kích
thích xảy ra mạnh mẽ nhất ở khu vực xung quanh đập thuộc địa phận Thị xã Hoà
Bình.
3.1.4 Điều kiện thổ nhưỡng
Tây Bắc là vùng rừng núi cao, có độ chia cắt mạnh nhất Việt Nam; riêng với lưu
vực sông Đà, thổ nhưỡng có đặc điểm chủ yếu là trên nền đá vôi và đất phong hoá
trên nền đá vôi. Tuy nhiên, do địa hình chia cắt mạnh và diễn biến khác biệt về chế
độ khí hậu, thuỷ văn giữa các tiểu vùng sinh thái nên loại hình phân bố thổ nhưỡng
của lưu vực sông Đà rất đa dạng và phong phú.
3.1.5 Đặc điểm khí hậu
Có thể nói rằng khí hậu vùng lưu vực sông Đà là khí hậu nhiệt đới, gió mùa
vùng núi với hai mùa rõ rệt. Mùa đông lạnh, suốt mùa đông duy trì một tình trạng
hanh khô điển hình, có sương muối và ít mưa (mùa khô) trùng với mùa gió Đông
Bắc, kéo dài từ tháng Mười Một năm trước tới tháng Ba năm sau. Mùa hè trùng với
mùa gió Tây Nam, nóng có gió tây khô nóng và nhiều mưa (mùa mưa), kéo dài từ
tháng Năm tới tháng Chín hàng năm. Giữa hai mùa (tháng Tư, tháng Mười) là thời
kỳ chuyển tiếp, nền nhiệt ẩm và có tính ôn hoà.
59
Về cơ bản, mùa mưa gần như trùng với mùa nóng và mùa khô trùng với mùa
lạnh. Mưa đá cũng thường xảy ra trong thời kỳ quá độ từ mùa lạnh sang mùa nóng.
Lượng mưa ở vùng lưu vực sông Đà phân bố rất không đều phụ thuộc vào đặc
điểm của địa hình, giá trị trung bình năm biến đổi khá mạnh mẽ từ 1300-3200mm.
Vùng mưa lớn Hoàng Liên – Sa Pa đạt tới trên 2000mm, trong khi vùng mưa ít Nam
Sơn La chỉ đạt 1200 - 1600mm.
Tương ứng với vùng mưa lớn cũng là vùng có lượng ẩm phong phú quanh năm,
đồng thời vùng mưa ít cũng là vùng thiếu ẩm, chủ yếu là trong mùa Đông.
Lưu vực sông Đà có độ ẩm cao và ít thay đổi. Độ ẩm tuyệt đối dao động trong
phạm vi từ 11 - 32mb và độ ẩm tương đối khá cao, trung bình năm trong toàn vùng
lưu vực sông Đà dao động trong khoảng từ 80 – 85% và không chênh lệch nhiều
giữa các vùng (mùa nóng độ ẩm không khí trung bình khoảng 84 – 87%, mùa lạnh
có khí hậu khô lạnh, độ ẩm không khí chỉ có 72 – 75%).
Lượng bốc hơi lớn nhất (đo bằng ống Piche) dao động trong phạm vi khá rộng,
từ 666 đến 1052 mm/năm. Thời kỳ giữa mùa khô đến đầu mùa mưa (II-V) có lượng
bốc hơi lớn nhất, đạt 70-150mm/tháng. Vào thời kỳ còn lại, lượng bốc hơi dao động
trong khoảng 40-70mm/tháng.
Toàn lưu vực sông Đà chịu tác động của cơ chế gió mùa Đông Nam Á với hai
mùa gió: gió mùa đông và gió mùa hạ. Gió mùa đông bị chi phối bởi không khí cực
đới lục địa và không khí nhiệt đới biển Đông đã biến tính. Gió mùa hạ bị chi phối
bởi ba khối không khí: không khí nhiệt đới biển Bắc Ấn Độ Dương (gió Tây Nam),
không khí xích đạo (gió Nam) và không khí biển Thái Bình Dương.
Cơ chế gió mùa và sự thay đổi điều kiện bức xạ theo chu kỳ năm tạo nên biến
đổi tuần hoàn năm của hầu hết các yếu tố khí hậu, nổi bật nhất là sự hình thành và
diễn biến của các mùa.
3.1.6 Đặc điểm chế độ thuỷ văn
a. Mạng lưới sông ngòi
Sông ngòi trong lưu vực sông Đà có những đặc điểm khác so với những vùng
Đông Bắc. Dòng chính của sông Đà có hướng trùng kiến tạo của khu Tây Bắc. Sông
suối trong lưu vực sông Đà thuộc loại sông trẻ, thung lũng sông hẹp, nhiều đoạn có
dạng hẻm vực sâu, chứng tỏ địa hình mới được nâng lên rất mạnh. Phần lớn lòng
sông cao hơn mặt biển từ 100 - 500m. Do đó sông đang đào lòng mạnh, trắc diện
hẹp, bồi tụ ít và lắm thác ghềnh.
Thượng lưu sông Đà kể từ nguồn tới Pắc Ma, dòng sông chảy theo hướng Tây
Bắc - Đông Nam. Lòng sông đoạn này hẹp, mùa cạn rộng, trung bình 40 - 60m. Độ
60
dốc lớn chỉ tính từ biên giới Việt Trung tới Lai Châu dài khoảng 125km, đạt độ dốc
bình quân tới 160cm/km. Trung lưu sông Đà từ Pắc Ma tới Suối Rút, sông vẫn chảy
theo hướng Tây Bắc - Đông Nam. Dòng sông chảy giữa hai bờ núi rất cao. Độ dốc
đáy sông giảm xuống rõ rệt, còn khoảng 38 - 40
Các file đính kèm theo tài liệu này:
- MSc07_Pham_Thi_Hoang_Nhung_Thesis.pdf