MỤC LỤC Trang
Mở đầu ii
Chương 1 Dựbáo đỉnh và đáy biểu đồphụtải ngày dùng mạng neuron
nhiều lớp MLP
1.1. Giới thiệu 1.1
1.2. Thuật toán chung dựbáo biểu đồphụtải ngày 1.1
1.3. Dựbáo đỉnh biểu đồphụtải ngày trên cơsởmạng MLP 1.4
1.4. Tóm lược 1.15
Chương 2. Dựbáo biểu đồphụtải ngày dùng phương pháp đỉnh-đáy-dạng 2.1
2.1. Giới thiệu 2.1
2.2. Dựbáo biểu đồphụtải ngày bằng phương pháp đỉnh-đáy-dạng 2.1
2.3. Tóm lược chương 2 2.9
Chương 3. Dựbáo biểu đồphụtải ngày dùng mạng neuron MLP 24 đầu ra 3.1
3.1. Giới thiệu 3.1
3.2. Dựbáo biểu đồphụtải ngày dùng mạng neuron MLP-31xNx24 3.1
3.3. Dựbáo biểu đồphụtải ngày dùng mạng 24 neuron đầu ra MLP-(24L+5W+4D)xNx24
3.4. Dựbáo biểu đồphụtải ngày dùng mạng 24 neuron đầu ra mã hoá dạng ngày
dùng 8 neuron đầu vào MLP-(24L+5W+8D)xNx24
3.5. Một sốgiải pháp tăng hiệu quảdựbáo biểu đồphụtải ngày 3.8
3.6. Tóm lược chương 3 3.11
Chương 4. Phân loại dạng biểu đồphụtải ngày 4.1
4.1. Giới thiệu 4.1
4.2. Xây dựng mạng ánh xạ đặc trưng tựtổchức Kohonen (K-SOFM) phân loại
dạng biểu đồphụtải ngày
4.3. Kết quảvà phân tích 4.8
4.4. Tóm lược chương 4 4.23
Kết luận a
Tài liệu tham khảo b
Phụlục
71 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2477 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Đề tài Nghiên cứu ứng dụng mạng nơron nhân tạo trong dự báo ngắn hạn phụ tải điện (giai đoạn 2), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
0375 0.01416 0.00287iii 0.00589 0.00362
Bảng 3.2 So sánh sai số MAPE giữa phương pháp 24 đầu ra và phương pháp đỉnh-đáy
dạng biểu đổ phụ tải
MAPE
Kỳ dự báo
MLP-31x17x24-trainrp Peak-Valley-ProfileType-K=4
Ngày đầu 2.60% 2.49%
Tuần đầu 3.00% 3.67%
Tháng đầu 3.30% 3.51%
Total 5.90% -
xxxiv
Từ các bảng trên có thể thấy rằng:
- Luật học trainrp hứa hẹn cho sai số MAPE thấp hơn các luật học còn lại,
xếp thứ hai là luật học traingda. (Riêng luật học trainlm đòi hỏi thời gian tính toán
lâu hơn).
- Phương pháp dự báo biểu đồ phụ tải ngày trên cơ sở mạng MLP 24 neuron
đầu ra cho kết quả cơ bản tương đương với phương pháp kết hợp dự báo đỉnh, đáy và
dạng biểu đồ phụ tải ngày và có thể đạt mức MAPE dưới 2,5% cho ngày đầu tiên
(xem hình 3.1), MAPE cho tuần đầu tiên và tháng đầu tiên đạt mức dưới 4%.
Forecast and Actual Load Profiles of the
1st day
0
100
200
300
400
500
600
700
1 3 5 7 9 11 13 15 17 19 21 23
Hours
Lo
ad
, M
W
Actual LP Forecast LP
Hình 3.1 Biểu đồ phụ tải ngày thực tế và dự báo
(Mạng MLP-31x17x24-trainrp)
3.3 Dự báo biểu đồ phụ tải ngày dùng mạng 24 neuron đầu ra MLP-
(24L+5W+4D)xNx24
Để so sánh ta xem xét mạng có thêm đầu vào về nhiệt độ lớn nhất và nhỏ nhất
ngày dự báo.
Cấu trúc mạng MLP-(24L+5W+4D)xNx24 :
Đầu vào (24L+3W+4D): Bao gồm
-Phụ tải giờ thứ 1, 2,.., 24 của ngày thứ i-1 P(i-1,1)....P(i-1,24)
-Nhiệt độ lớn nhất ngày thứ i-1: Tmax(i-1)
xxxv
-Nhiệt độ nhỏ nhất ngày thứ i-1: Tmin(i-1)
-Nhiệt độ trung bình ngày thứ i-1: Ttb(i-1)
-Nhiệt độ lớn nhất ngày thứ i: Tmax(i)
-Nhiệt độ nhỏ nhất ngày thứ i: Tmin(i)
-Mã dạng ngày thứ i dưới dạng 4 bit (ví dụ 1000): d1d2d3d4
Đầu ra (24L):
Phụ tải giờ thứ 1... 24 của ngày thứ i P(i,1)...P(i,24)
Kết quả tiêu biểu như sau:
MLP Architecture
Number of input neurons 33
Number of hidden neurons 17
Number of output neurons 24
Training Function trainrp
Test Data
Number of total data vectors 730
Number of training vectors 438
Number of validation vectors 146
Number of test vectors 146
Training and Performance
Number of maximum epochs 5000
Number of actual epochs 5000
Training Performance 0.00656
Error
1st day APE 2.99%
1st week MAPE 3.11%
1st month MAPE 3.01%
Total MAPE 6.91%
xxxvi
Forecast and Actual Load Profiles of the
1st day
0
100
200
300
400
500
600
1 3 5 7 9 11 13 15 17 19 21 23
Hours
Lo
ad
, M
W
Actual LP Forecast LP
Hình 3.2 Biểu đồ phụ tải ngày thực tế và dự báo
(mạng MLP-33x17x24-trainrp)
3.4. Dự báo biểu đồ phụ tải ngày dùng mạng 24 neuron đầu ra mã hoá
dạng ngày dùng 8 neuron đầu vào MLP-(24L+5W+8D)xNx24
Cấu trúc mạng MLP-(24L+5W+8D)xNx24 :
Đầu vào (24L+3W+8D): Bao gồm
-Phụ tải giờ thứ 1, 2,.., 24 của ngày thứ i-1 P(i-1,1)....P(i-1,24)
-Nhiệt độ lớn nhất ngày thứ i-1: Tmax(i-1)
-Nhiệt độ nhỏ nhất ngày thứ i-1: Tmin(i-1)
-Nhiệt độ trung bình ngày thứ i-1: Ttb(i-1)
-Nhiệt độ lớn nhất ngày thứ i: Tmax(i)
-Nhiệt độ nhỏ nhất ngày thứ i: Tmin(i)
-Mã dạng ngày thứ i dưới dạng 8 bit (ví dụ 10000000): d1d2d3d4d5d6d7d8
Đầu ra (24L):
Phụ tải giờ thứ 1... 24 của ngày thứ i P(i,1)...P(i,24)
Kết quả tiêu biểu như bảng và đồ thị sau :
xxxvii
MLP Architecture
Number of input neurons 37
Number of hidden neurons 17
Number of output neurons 24
Training Function trainrp
Test Data
Number of total data vectors 730
Number of training vectors 438
Number of validation vectors 146
Number of test vectors 146
Training and Performance
Number of maximum epochs 5000
Number of actual epochs 5000
Training Performance 0.00682
Error
1st day APE 3.14%
1st week MAPE 2.97%
1st month MAPE 3.02%
All days MAPE 7.44%
Forecast and Actual Load Profiles of the
1st day
0
100
200
300
400
500
600
1 3 5 7 9 11 13 15 17 19 21 23
Hours
Lo
ad
, M
W
Actual LP Forecast LP
Hình 3.3 Biểu đồ phụ tải ngày thực tế và dự báo (mạng MLP-37x17x24-trainrp)
xxxviii
Như vậy, có thể nói rằng các cách mã hoá dạng ngày khác nhau ở đây không
làm thay đổi cơ bản mức sai số dự báo MAPE.
3.5. Một số giải pháp tăng hiệu quả dự báo biểu đồ phụ tải ngày:
Mặc dù sai số MAPE đạt được trong dự báo biểu đồ phụ tải ngày nói trên đạt
mức ngang và thậm chí còn thấp hơn một số giá trị công bố (Ví dụ, [Pauli M.] công
bố mức 4%,...), trong chương này cũng xem xét thêm một số giải pháp giảm sai số dự
báo biểu đồ phụ tải ngày.
a. Loại ngày nghỉ cuối tuần ra khỏi tập dữ liệu đầu vào
Biểu đồ phụ tải các ngày nghỉ cuối tuần thường khác biệt so với ngày thường
cả về giá trị đỉnh và đáy lẫn dạng biểu đồ
Sự khác biệt này là một trong những nguyên nhân làm tăng sai số dự báo biểu
đồ phụ tải ngày. Vì vậy, ta xem xét phương án dự báo dùng tập dữ liệu không có các
ngày thứ Bảy và Chủ nhật. Mạng neuron tương tự như trên. Vì bớt 2 neuron đầu vào
để mã hoá ngày Chủ Nhật và thứ Bảy nên cấu trúc mạng thay vì MLP-37xNx24 sẽ là
MLP-35xNx24. Số vector mẫu học cũng giảm xuống còn 317 so với 438 trước đây.
Kết quả như sau:
Forecast and Actual Load Profiles of the
1st day
0
100
200
300
400
500
600
1 3 5 7 9 11 13 15 17 19 21 23
Hours
Lo
ad
, M
W
Series1 Series2
Hình 3.4 Biểu đồ phụ tải ngày thực tế và dự báo (thí nghiệm 1)
(loại ngày nghỉ ra khỏi tập huấn luyện, mạng MLP-35x17x24-trainrp
xxxix
MLP Architecture
Number of input neurons 35
Number of hidden neurons 17
Number of output neurons 24
Training Function trainrp
Test Data
Number of total data vectors 529
Number of training vectors 317
Number of validation vectors 106
Number of test vectors 106
Training and Performance
Number of maximum epochs 10000
Number of actual epochs 10000
Training Performance 0.00513
Validation Performance
Test Performance
General Performance 0.03626
Correlation Coeff R
Error
1st day APE 1.87%
1st week MAPE 3.89%
1st month MAPE 3.52%
Total MAPE 10.21%
Max MAPE 33.0%
Min MAPE 1.9%
Qua kết quả tính toán có thể thấy rằng sai số MAPE ngày đầu tiên có thể đạt
được ở mức thấp 1,87%, thấp hơn trường hợp dùng phương pháp Đỉnh-Đáy-Dạng
BĐPT (với MAPE=2,49%) và phương pháp MLP-(24+7)xNx24 với tập dữ liệu đầu
vào bao gồm cả ngày nghỉ cuối tuần (MAPE=2,63%); MAPE tuần đầu tiên và MAPE
tháng đầu tiên cũng đạt được mức dưới 4%iv
xl
Như vậy, có thể kết luận rằng việc loại số liệu các ngày nghỉ ra khỏi tập huấn
luyện mang lại kết quả dự báo cao hơn nhiều so với sử dụng cả tập dữ liệu ban đầu.
Tuy nhiên, sai số dự báo thấp chỉ đạt được ở ngày hoặc một vài ngày đầu tiên. Để
khắc phục hạn chế này, cần cập nhật mạng hàng ngày như đã thực hiện trong chương
2 khi dự báo đỉnh và đáy biểu đồ phụ tải.
b. Mạng được huấn luyện cập nhật hàng ngày theo giá trị phụ tải và thời tiết
của ngày mới nhất. Nói cách khác, thời đoạn dự báo của mạng chỉ là 1 ngày, phụ tải
và các thông số thời tiết thực tế của ngày được dự báo sẽ được lan truyền ngược để
cập nhật trọng số của mạng MLPv
d. Dùng mô hình dự báo từng giờ để dự báo phụ tải 24 giờ tới.
Vì mô hình dự báo từng giờ một mặt có ý nghĩa độc lập, mặt khác có khá
nhiều cách xây dựng mô hình này nên giải pháp này sẽ được xem xét ở một phần
riêng.
So sánh mức sai số dự báo ngày đầu tiên với các mô hình mạng khác nhau
tổng hợp trong bảng sau đây.
Bảng 3.3. Mức sai số dự báo biểu đồ phụ tải ngày đầu tiên của các mô hình khác nhau
Mô hình mạng
Đỉnh-
đáy-
dạng
BĐPT
MLP31x17x24 MLP33x17x24 MLP35x17x24 MLP35x17x24-
Không có ngày
nghỉ cuối tuần
Sai số 2,49% 2,60% 2,99% 3,14% 1,87%
xli
3.6. Tóm lược chương 3
Qua xây dựng và thử nghiệm một số mô hình mạng neuron nhiều lớp MLP với
24 đầu ra sử dụng để dự báo biểu đồ phụ tải ngày, ta thấy rằng:
- Vì mạng có 24 đầu ra là mạng có số thông số khá lớn, thuật toán huấn luyện
Lavenberg- Marquardt không phù hợp về tốc độ tính toán. Đã tiến hành so sánh hiệu
quả dự báo mạng 24 đầu ra với các thuật toán huấn luyện khác nhau. Thuật toán cho
kết quả dự báo tốt nhất là thuật toán truyền ngược co giãn (resilient backpropagation
- hàm trainrp) , xếp thứ hai là thuật toán có tốc độ học thích nghi (adaptive learning
rate - hàm traingda). Hầu hết các thí nghiệm trong chương này đều dùng thuật toán
truyền ngược co giãn và cho kết quả huấn luyện khá tốt.
- Mô hình mạng MLP 24 đầu ra có thể cho sai số dự báo đạt mức tương đương
với mô hình MLP một đầu ra trên cơ sở phương pháp đỉnh-đáy-dạng BĐPT. Ví dụ
cùng số thông tin đầu vào (phụ tải quá khứ, nhiệt độ quá khứ, nhiệt độ ngày dự báo,
mã ngày trong tuần) các mạng MLP-31xNx24, MLP-33xNx24, MLP-37xNx24 cho
sai số dự báo BĐPT ngày đầu tiên ở mức 2,60%; 2,99%; 3,14% tương đương với mô
hình đỉnh-đáy-dạng BĐPT (ở mức 2,60%).
- Giảm sai số dự báo hoặc giữ ổn định mức sai số dự báo như đạt được trong
mô hình đỉnh-đáy-dạng BĐPT và mô hình 24 đầu ra MLP-MxNx24 có thể đạt được
bằng 2 cách:
a. Cập nhật on-line hàng ngày thông số mạng (huấn luyện mạng on-line) trên
cơ sở số liệu thực tế về phụ tải và thời tiết của ngày mới nhất. Việc cập nhật này được
thực hiện trên cơ sở huấn luyện lại toàn bộ mạng với tập dữ liệu mới. Kết quả dự báo
ngày kế tiếp dùng phưong pháp cập nhật mạng này cho sai số dự báo thấp hơn so với
trường hợp dự báo một số ngày liên tiếp mà không cập nhật thông số mạng. Vì thời
gian huấn luyện lại mạng trong trường hợp xem xét là chấp nhận được, mạng được
cập nhật trên toàn bộ bộ số liệu mới hàng ngày. Nếu bộ số liệu là lớn hoặc năng lực
tính toán là có hạn có thể xem xét cập nhật bộ trọng số mạng với một tập con số liệu
các ngày mới nhất.
b. Loại các ngày nghỉ cuối tuần và các ngày đặc biệt ra khỏi tập huấn luyện.
Kết quả thí nghiệm cho thấy loại các ngày nghỉ cuối tuần ra khỏi tập dữ liệu huấn
luyện cho kết quả dự báo biểu đồ phụ tải ngày đầu tiên giảm đến mức 1,89%. Như
vậy, xử lý sơ bộ số liệu đầu vào, đặc biệt là số liệu về phụ tải quá khứ trước khi huấn
luyện mạng là một công đoạn đóng vai trò khá quan trọng để đạt được hiệu quả dự
báo cao. Các giải pháp nâng cao chất lượng mẫu học (như phân tích principal - gộp
một số đầu vào tương quan thành một, phân tích tương quan, bổ sung thông tin về
mùa,…) cũng cần được xem xét kỹ lưỡng trong các nghiên cứu tiếp theo.
xlii
CHƯƠNG 4
PHÂN LOẠI DẠNG BIỂU ĐỒ PHỤ TẢI NGÀY
4.1 Giới thiệu
Kinh nghiệm chuyên gia vận hành hệ thống điện cho thấy các biểu đồ phụ tải
ngày của một khu vực nào đó có thể phân thành một số nhóm nhất định. Ví dụ, các
ngày nghỉ cuối tuần có biểu đồ phụ tải có thể gộp thành 1 nhóm, các ngày trước và
sau ngày nghỉ như thứ Sáu và thứ Hai cũng có thể thuộc cùng 1 nhóm, từ thứ Ba-thứ
Năm lại thuộc một nhóm khác; ngoài ra các ngày lễ-tết hoặc các ngày có sự kiện văn
hoá thể thao đặc biệt ảnh hưởng đến nhu cầu điện lại có biểu đồ phụ tải dạng khác hẳn
các ngày bình thường trong tuần.
Việc phân các biểu đồ phụ tải thành các nhóm có 2 ý nghĩa quan trọng. Trước
hết, nếu dự báo biểu đồ phụ tải bằng phương pháp dự báo đỉnh-đáy-dạng BĐPT thì
việc phân loại này tạo cơ sở dữ liệu dạng biểu đồ phụ tải để xây dựng biểu đồ phụ tải
cuối cùng của ngày dự báo sau khi xác định đỉnh và đáy phụ tải ngày. Thứ hai, nếu dự
báo biểu đồ phụ tải ngày hoặc dự báo phụ tải từng giờ thì thông tin về các dạng biểu
đồ phụ tải ngày nếu đưa vào mô hình sẽ giúp giảm sai số dự báo. Trong trường hợp
này, sau khi phân loại các biểu đồ phụ tải quá khứ để đánh giá có bao nhiêu dạng
ngày, thông tin về các dạng ngày đưa vào mô hình theo 2 cách: a) mã hoá các dạng
ngày này và đưa vào đầu vào của mạng; b) nếu có N kiểu ngày thì xây dựng N mạng
mỗi mạng dự báo cho một kiểu ngày.
Mặt khác, các nhóm biểu đồ phụ tải được phân loại thường không vạn năng
đối với mọi hệ thống. Nói cách khác, sự phân loại nào đó có thể đúng với hệ thống
này nhưng lại không phù hợp với hệ thống khác (tính phụ thuộc vào hệ thống).
Chính vì vậy, một hệ thống dự báo phụ tải điện nhất thiết phải có chức năng phân loại
biểu đồ phụ tải ngày, dùng công cụ này hay công cụ khác.
Về phương pháp, phân loại dạng biểu đồ phụ tải ngày – tương tự các bài toán
nhận dạng mẫu khác – có thể được thực hiện bằng 2 cách: a)dùng các phương pháp
xliii
thống kê truyền thống và b)dùng các phương pháp trí tuệ nhân tạo, đặc biệt là mạng
neuron nhân tạo.
Trong số các loại mạng neuron nhân tạo, mạng ánh xạ đặc trưng tự tổ chức
SOFM là loại mạng có nhiều tính năng ưu việt từ góc độ huấn luyện mạng không có
tín hiệu giám sát, tức là quá trình phân loại không biết trước có bao nhiêu và những
loại nhóm nào cần được phân loại. Vì vậy, trong chương này sẽ nghiên cứu ứng dụng
loại mạng này để phân loại các biểu đồ phụ tải ngày trong hệ thống điện Việt Nam
với bộ dữ liệu đại diện thu thập từ Công ty Điện lực Hà Nội.
4.2. Xây dựng mạng ánh xạ đặc trưng tự tổ chức Kohonen (K-SOFM)
phân loại dạng biểu đồ phụ tải ngày
Các thông tin ngắn gọn về mạng SOFM đã được trình bày ở giai đoạn I nghiên
cứu này. Dưới đây trình bày các vấn đề có tính ứng dụng SOFM để xây dựng bộ phân
loại biểu đồ phụ tải ngày và một số kết quả thử nghiệm.
Mô tả bộ số liệu đầu vào
Bộ dữ liệu đầu vào thu thập từ Công ty Điện lực Hà Nội có thể tổ chức dưới
dạng ma trận R(731, 24). Từ đó ta có 731 biểu đồ phụ tải ngày (ứng với 2 năm 2003-
2004), mỗi biểu đồ phụ tải ngày có thể xem như một vector đầu vào P(i) dưới dạng
P(i) = [P(i, 1) P(i,2) ... P(i, 24)]
Vector P(i) có 24 phần tử P(i,j), j=1..24, mỗi phần tử là phụ tải của giờ thứ j
của ngày thứ i.
Biểu đồ phụ tải 7 ngày trong tuần đặc trưng của khu vực Hà Nội có dạng như
trên hình 4.1
xliv
Hình 4.1 Biểu đồ phụ tải 7 ngày tháng 11/2004 Hà Nội
0
100
200
300
400
500
600
700
800
1 4 7 10 13 16 19 22
h
M
W
Saturday, 06
November 2004
Sunday, 07
November 2004
Monday, 08
November 2004
Tuesday, 09
November 2004
Wednesday, 10
November 2004
Thursday, 11
November 2004
Friday, 12 November
2004
Chuẩn hoá số liệu đầu vào
Biểu đồ phụ tải ngày được chuẩn hoá theo các cách khác nhau. Ở đây sử dụng
phương pháp chuẩn hoá dùng các giá trị min, max. Phân tích cho thấy cũng có 2 cách
chuẩn hoá theo phương pháp này: theo giá trị min max của từng vector và theo giá trị
min, max của cả bộ dữ liệu.
Công thức chuẩn hoá theo 2 cách tương ứng như sau
)()(
)(),(
),(
minmax
max
iPiP
iPjiP
jipn −
−= (4.1)
minmax
max),(),(
PP
PjiP
jipn −
−= (4.2)
với Pmax(i) và Pmin(i) là đỉnh và đáy phụ tải ngày thứ i,
còn Pmax và Pmin là đỉnh và đáy phụ tải của cả tập dữ liệu.
xlv
Để đảm bảo phân loại được các biểu đồ phụ tải có mức phụ tải khác nhau
("giống nhau" theo trục thời gian nhưng khác nhau theo trục công suất) đề xuất sử
dụng giá trị min, max của cả bộ dữ liệu, như vậy sẽ bảo tồn dạng theo trục công suất.
Mẫu đầu vào của mạng sẽ bao gồm các tổ hợp khác nhau của các vector biểu
đồ phụ tải trong tập số liệu ban đầu này.
Cấu trúc mạng
Để khởi tạo mạng SOFM cần xác định các thông số sau: số phần tử đầu vào,
lưới phân bố neuron trong lớp, hàm tính khoảng cách giữa các neuron, số bước của
pha xếp thứ tự neuron (ordering phase steps), vận tốc học pha xếp thứ tự neuron, vận
tốc học pha chỉnh tinh, bán kính các neuron láng giềng pha chỉnh tinh. Ta lần lượt
xem xét từng thông số này.
- Số đầu vào:
Vì vector biểu đồ phụ tải gồm 24 phần tử, số đầu vào của mạng sẽ là 24.
- Lưới phân bố neuron:
Mạng SOFM-Kohonen thuộc vào nhóm mạng một lớp, các nơron được phân
bố trong không gian một chiều (đường thẳng) hoặc trong không gian hai chiều (mặt
phẳng) theo kiểu lưới vuông (xem hình 4.2), lưới lục giác (xem hình 4.3) hay lưới
ngẫu nhiên (hình 4.4). Lưới đường thẳng, lưới vuông và lưới lục giác thỏa mãn yêu
cầu mỗi nơron có cùng số nơron trong từng lớp láng giềng. Số neuron trong từng lớp
láng giềng của lưới ngẫu nhiên cũng là một số ngẫu nhiên.
Matlab chứa 3 hàm để khởi tạo lưới vuông, lưới lục giác và lưới ngẫu nhiên là:
gridtop(nx, ny), hextop(nx, ny) và randtop(nx, ny) tương ứng.
xlvi
Hình 4.2
Hình 4.3
xlvii
Hình 4.4
Để đơn giản, ta chọn lưới chữ nhật 18x18 neuron để phân loại vector đầu vào
P(24).
-Hàm khoảng cách giữa các neuron:
Có 4 cách phổ biến để tính khoảng cách từ neuron xem xét đến neuron láng
giềng:
khoảng cách euclide (hàm dist)
khoảng cách hộp (hàm boxdist)
khoảng cách đường nối (hàm linkdist) – bằng số bước cần thực hiện để
đi từ neuron xem xét đến neuron láng giềng.
khoảng cách manhattan (hàm mandist), tính bằng công thức:
∑ −= yxd
Để khởi đầu ta chọn khoảng cách 'linkdist' để tạo mạng SOFM ( 'linkdist' là
hàm mặc định của NNToolbox).
- Bán kính láng giềng giai đoạn chỉnh tinh:
xlviii
Chọn bán kính láng giềng là 1 (giá trị mặc định).
- Số bước của pha xếp thứ tự neuron ( OSTEPS):
Mặc định số bước của pha xếp thứ tự neuron lấy bằng 1000. Theo khuyến cáo
của chính Kohonen, số bước này càng nhiều thì hiệu quả huấn luyện càng cao và tối
thiểu phải bằng 500 lần số neuron của mạng. Vì vậy, ta chọn số bước của pha xếp thứ
tự neuron bằng 500x18x18.
- Vận tốc học pha xếp thứ tự neuron và vận tốc học pha chỉnh tinh chọn giá trị
mặc định theo NNToolbox tương ứng là 0,9 và 0,02.
Tóm lại, để khởi tạo mạng SOFM với các thông số chọn như trên ta dùng lệnh
SOMFnet=newsom([minp maxp],[18 18],'gridtop','linkdist', 0.9,500*18*18,0.02,2)
Huấn luyện mạng
Quá trình huấn luyện diễn ra như sau [NNTool Guidelines]:
- Mạng tìm neuron thắng cuộc cho mỗi vector đầu vào
- Ứng với mỗi neuron thắng cuộc, sau khi xác định tất cả các vector đầu vào
kích thích nó hoặc kích thích các neuron láng giềng của nó, vector trọng số của
neuron thắng cuộc này sẽ chuyển đến vị trí trung bình của tập các vector đầu vào đó.
- Khoảng cách trên cơ sở đó xác định bán kính láng giềng thay đổi trong quá
trình huấn luyện qua 2 pha:
Pha sắp xếp neuron: pha này kéo dài OSTEPS bước, tức
500x18x18 trong trường hợp này, bán kính láng giềng sẽ giảm
từ giá trị ban đầu xuống đến giá trị bán kính láng giềng của pha
chỉnh tinh (ND=1). Theo chiều giảm bán kính láng giềng các
neuron sẽ tự sắp xếp lại trong không gian đầu vào (cũng tức là
các vector trọng số của neuron sắp xếp lại).
Pha chỉnh tinh: bán kính láng giềng giữ giá trị tối thiểu (ND=1),
vector trọng số điều chỉnh tinh nhưng vẫn giữ vị trí đã sắp xếp ở
pha đầu. Vận tốc học tiếp tục giảm chậm từ giá trị vận tốc học
xlix
của pha chỉnh tinh ban đầu (ở đây là 0,02). Số chu kỳ huấn
luyện ở pha này cần lớn hơn nhiều so với số bước của pha đầu.
Mạng được huấn luyện như trên nhờ lệnh sau của Matlab
SOFMnet = train(SOFMnet, pn);
Nhận dạng các vector đầu vào
Các vector đầu vào được xác định thuộc nhóm nào thông qua quá trình mô
phỏng dùng mạng đã huấn luyện với lệnh sim và vec2index
a = sim(SOFMnet, pn)
ac=vec2index(a)
4.3 Kết quả và phân tích
4.3.1 Phân loại toàn bộ các vector phụ tải trong năm 2004
Dùng mạng SOFM-18x18 nói trên để phân loại toàn bộ vector phụ tải trong
năm 2004. Kết quả phân loại đưa ra trong bảng 4.1 sau.
Bảng 4.1 Mã số các neuron kích hoạt bởi các vector phụ tải ngày tương ứng
I-II II-III
III-
IV
IV-
V V-VI
VI-
VII
VII-
VIII
VIII-
IX
IX-
X
X-
XI
XI-
XII XII
Mon 35 17 16 16 27 24 56 40 2 5 26 7 11
Tue 17 34 50 16 45 23 74 60 1 4 7 6 11
Wed 17 33 32 14 26 22 73 43 20 3 6 6 11
Thu 17 32 32 31 44 42 74 44 38 3 7 6 10
Fri 14 15 16 33 88 22 74 44 38 3 25 6 11
Sat 35 15 52 52 88 43 76 63 58 77 45 44 12
Sun 72 53 54 71 87 82 83 85 79 80 64 64 68
Mon 17 16 33 16 63 66 23 23 19 24 6 28 11
Tue 33 50 50 31 84 47 20 21 37 5 6 11 10
Wed 14 32 50 29 49 26 37 20 55 2 25 12 10
Thu 17 32 32 33 48 23 73 20 55 3 8 12 10
Fri 35 50 32 51 48 22 73 39 55 2 7 12 28
Sat 54 52 51 52 67 61 74 62 78 61 64 68 30
Sun 72 54 54 88 86 82 75 83 82 81 86 70 68
Mon 72 16 15 31 26 42 73 23 24 2 9 13 10
Tue 90 14 31 47 24 23 57 21 25 41 8 12 10
Wed 89 18 31 47 4 22 37 1 42 4 9 11 10
Thu 90 16 49 31 41 40 19 20 85 3 9 11 9
Fri 90 16 49 34 42 41 39 39 23 3 8 13 9
l
I-II II-III
III-
IV
IV-
V V-VI
VI-
VII
VII-
VIII
VIII-
IX
IX-
X
X-
XI
XI-
XII XII
Sat 90 18 52 52 43 62 61 61 61 64 46 50 12
Sun 90 54 54 70 84 83 83 81 80 87 86 69 68
Mon 90 17 15 49 48 42 43 38 37 27 27 12 11
Tue 54 15 15 47 46 23 23 37 1 8 7 12 10
Wed 36 34 33 47 66 41 42 55 40 25 7 10 10
Thu 36 15 33 47 48 39 21 56 25 45 7 11 10
Fri 18 51 51 27 47 38 21 76 24 60 8 10 30
Sat 36 52 52 65 65 76 59 59 62 64 46 30
Sun 54 71 71 87 85 79 80 80 82 86 86 69
Phân tích phân bố các neuron được kích hoạt bởi các ngày cùng thứ trong tuần
trên lưới, ví dụ, các ngày Chủ nhật (bảng 4.2a,b,c), các ngày thứ Hai (bảng 4.3 a,b,c)
và các ngày thứ Ba (bảng 4.4 a,b,c), ta thấy rằng cùng là ngày Chủ nhật nhưng rơi vào
các nhóm mùa khác nhau (mùa 1: tháng 1 đến tháng 4; mùa 2: tháng 5-8; mùa 3:
tháng 9-12) thì kích hoạt các nhóm neuron khác nhau. Vì vậy không thể nhóm các
ngày cùng thứ trong tuần với nhau lại mà không tính đến yếu tố mùa. Nói cách khác,
thông tin về mùa là thiết yếu trong đầu vào của mạng neuron dự báo phụ tải ngắn hạn.
Hình 4.5 minh hoạ sự khác biệt đặc trưng của biểu đồ phụ tải các tháng khác nhau
trong năm.
Bảng 4.2 a)Chủ nhật (mùa đầu năm)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54
55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72
73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108
109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126
127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144
145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162
163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180
181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198
199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216
217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234
235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252
253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270
271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288
289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306
307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324
li
Bảng 4.2 b)Chủ nhật (mùa giữa năm)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54
55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72
73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108
109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126
127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144
145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162
163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180
181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198
199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216
217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234
235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252
253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270
271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288
289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306
307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324
Bảng 4.2 c)Chủ nhật (mùa cuối năm)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54
55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72
73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108
109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126
127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144
145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162
163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180
181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198
199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216
217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234
235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252
253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270
271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288
289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306
307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324
lii
Bảng 4.2 d)Chủ nhật (cả năm)
1 2 3 4 5 6 7 8 9 10 11 12
Các file đính kèm theo tài liệu này:
- 7178R.pdf