LỜI CAM ĐOAN iv
LỜI CÁM ƠN v
TÓM TẮT vi
ABSTRACT viii
GIẤY XÁC NHẬN CỦA TỔNG CÔNG TY ĐIỆN LỰC TP.HCM x
CÁC CÔNG TRÌNH NGHIÊN CỨU ĐÃ CÔNG BỐ xii
DANH MỤC CÁC HÌNH VẼ xiv
DANH MỤC CÁC BẢNG BIỂU xix
DANH MỤC CÁC TỪ VIẾT TẮT xxi
DANH MỤC CÁC KÝ HIỆU xxiv
CHƯƠNG I: TỔNG QUAN 1
1.1. Tổng quan về vấn đề nghiên cứu 1
1.2. Tổng quan tình hình nghiên cứu trong nước và nước ngoài liên
quan đến đề tài 3
1.3. Các yếu tố tác động đến các mô hình dự báo phụ tải ngắn hạn 8
1.4. Mục tiêu của luận án 9
1.5. Nhiệm vụ và giới hạn của luận án 10
1.6. Phương pháp nghiên cứu 11
1.7. Đóng góp của luận án 12
1.8. Ý nghĩa thực tiễn của luận án 12
1.9. Bố cục của luận án 13
CHƯƠNG II: GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP DỰ BÁO THỊ
TRƯỜNG VÀ CÁC KỸ THUẬT XỬ LÝ CHUỖI DỮ LIỆU 16
2.1. CÁC PHƯƠNG PHÁP DỰ BÁO THỊ TRƯỜNG 16
2.1.1. Các phương pháp thống kê 16
2.1.2. Phương pháp chuyên gia 26
2.1.3. Trí tuệ nhân tạo, học máy 29
194 trang |
Chia sẻ: honganh20 | Ngày: 23/02/2022 | Lượt xem: 328 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận án Kỹ thuật dự báo trong vận hành thị trường điện Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
pháp chính để xác định phần tử ngoại lai bao gồm:
❖ Xác định phần tử ngoại lai theo khoảng cách (Distance-Based):
Theo hướng tiếp cận này cần phải xác định một hàm đo khoảng cách (metric)
giữa các phần tử trong tập dữ liệu. Các phần tử ngoại lai là những phần tử nằm khá
xa với tập các phần tử còn lại.
❖ Xác định theo thống kê (Statistical-Based):
Hướng nghiên cứu này dựa trên việc xác định các mô hình phân phối thống
kê mà các phần tử phải tuân theo (phân phối chuẩn, phân phối X2...). Phần tử ngoại
lai là những phần tử không tuân theo các luật này.
❖ Xác định theo độ khác hiệt (Deviation-Based):
Hướng nghiên cứu này dựa trên việc xác định những đặc trưng cơ bản của
các phần tử trong một tập các phần tử. Các phần tử có những đặc trưng khác biệt
quá lớn so với các phần tử còn lại thì là các phần tử ngoại lai.
46
2.2.4 Dữ liệu thiếu trong nghiên cứu phụ tải điện
Nghiên cứu phụ tải là hoạt động phân tích biểu đồ phụ tải hệ thống điện
nhằm chia thành biểu đồ của các thành phần phụ tải, phân nhóm phụ tải, các khách
hàng sử dụng điện cuối cùng và các công nghệ sử dụng điện, để đưa ra các thông tin
quan trọng như: Công suất và thời gian xuất hiện phụ tải đỉnh; Xu hướng tăng
trưởng của Phụ tải đỉnh và Hệ số phụ tải; Chênh lệch phụ tải cao/thấp điểm của hệ
thống; Lập kế hoạch, thiết kế và triển khai các chương trình DSM; Nâng cao độ
chính xác của dự báo phụ tải ngắn hạn;....
Đây là một hoạt động chuyên sâu về phân tích số liệu, trong đó dữ liệu được
thu thập thường là rất lớn, thông qua các hình thức thu thập tự động hoặc thủ công.
Do đó dữ liệu bị lỗi là rất khó tránh khỏi, bởi có rất nhiều nguyên nhân như: sự cố
đường truyền, sự cố thiết bị đo đếm, sự cố thiết bị lưu trữ hay do việc xữ lý dữ liệu
thủ công không đúng phương pháp, ...
Dữ liệu đo đếm của phụ tải là số liệu công suất, điện năng tiêu thụ của phụ tải
theo chu kỳ đo quy định (30 phút hoặc 60 phút), thông số vận hành, biểu đồ phụ tải
(load profile). Các Tổng công ty điện lực có trách nhiệm thực hiện cài đặt công tơ để
truyền dữ liệu tự động về Kho dữ liệu.
Trong quá trình vận hành, thu thập dữ liệu đã xuất hiện nhiều sự cố làm gián
đoạn việc ghi nhận các dữ liệu đo đếm như: sự cố truyền dẫn tín hiệu từ công tơ đo
đếm về Kho dữ liệu làm mất gói dữ liệu truyền về; lỗi tại thiết bị đo đếm; lỗi do mất
nguồn điện; lỗi do cài đặt thiết bị đo đếm không đúng; lỗi do xử lý dữ liệu bằng
phương pháp thủ công; hoặc do việc thu thập dữ liệu bằng thủ công,... dẫn đến dữ
liệu ghi nhận được không phù hợp như: dữ liệu có có giá trị bằng 0 (Fasse Zero);
trùng lặp dữ liệu (Inconsistent/Duplicate); thiếu chuỗi dữ liệu (Missing Data); dữ
liệu thiếu chính xác; hoặc một số dữ liệu ngoại lai không logic cao quá hoặc thấp
bất thường (Too High/Too Low).
47
0
5
10
15
20
25
30
1
5
/0
1
/2
0
0
6
8
:0
0
15
/0
1/
20
06
1
2:
00
1
5
/0
1
/2
0
0
6
1
6
:0
0
1
5
/0
1
/2
0
0
6
2
0
:0
0
16
/0
1/
20
06
0
:0
0
1
6
/0
1
/2
0
0
6
4
:0
0
16
/0
1/
20
06
8
:0
0
16
/0
1/
20
06
1
2:
00
1
6
/0
1
/2
0
0
6
1
6
:0
0
16
/0
1/
20
06
2
0:
00
1
7
/0
1
/2
0
0
6
0
:0
0
1
7
/0
1
/2
0
0
6
4
:0
0
17
/0
1/
20
06
8
:0
0
1
7
/0
1
/2
0
0
6
1
2
:0
0
1
7
/0
1
/2
0
0
6
1
6
:0
0
17
/0
1/
20
06
2
0:
00
1
8
/0
1
/2
0
0
6
0
:0
0
18
/0
1/
20
06
4
:0
0
1
8
/0
1
/2
0
0
6
8
:0
0
1
8
/0
1
/2
0
0
6
1
2
:0
0
23
/0
1/
20
06
1
6:
00
2
3
/0
1
/2
0
0
6
2
0
:0
0
2
4
/0
1
/2
0
0
6
0
:0
0
24
/0
1/
20
06
4
:0
0
2
4
/0
1
/2
0
0
6
8
:0
0
24
/0
1/
20
06
1
2:
00
2
4
/0
1
/2
0
0
6
1
6
:0
0
2
4
/0
1
/2
0
0
6
2
0
:0
0
25
/0
1/
20
06
0
:0
0
2
5
/0
1
/2
0
0
6
4
:0
0
2
5
/0
1
/2
0
0
6
8
:0
0
25
/0
1/
20
06
1
2:
00
2
5
/0
1
/2
0
0
6
1
6
:0
0
25
/0
1/
20
06
2
0:
00
2
6
/0
1
/2
0
0
6
0
:0
0
2
6
/0
1
/2
0
0
6
4
:0
0
26
/0
1/
20
06
8
:0
0
2
6
/0
1
/2
0
0
6
1
2
:0
0
2
6
/0
1
/2
0
0
6
1
6
:0
0
26
/0
1/
20
06
2
0:
00
2
7
/0
1
/2
0
0
6
0
:0
0
27
/0
1/
20
06
4
:0
0
2
7
/0
1
/2
0
0
6
8
:0
0
2
7
/0
1
/2
0
0
6
1
2
:0
0
27
/0
1/
20
06
1
6:
00
2
7
/0
1
/2
0
0
6
2
0
:0
0
Missing Data
Too
Low
Too
High
Inconsistent/
Duplicate? False Zeroes
Hình 2.7 – Các lỗi thường gặp trong ghi nhận dữ liệu điện
2.2.5 Các phương pháp nghiên cứu xử lý dữ liệu thiếu
Cho đến nay vẫn chưa có một phương pháp nào chuyên dụng được khuyên
sử dụng riêng cho việc xử lý dữ liệu thiếu trong các ứng dụng khai thác dữ liệu. Đặc
biệt là làm thế nào để có thể xử lý giá trị thiếu trong một CSDL dữ liệu khổng lồ.
Một số phương pháp xử lý dữ liệu thiếu đã được nghiên cứu [79] – [82]:
a) Phương pháp loại bỏ
Nếu xảy ra trường hợp thiếu dữ liệu cho một biến bất kỳ nào đó, giải pháp
đơn giản là loại bỏ thuộc tính bị thiếu của dữ liệu ra khỏi qua quá trình phân tích
đánh giá của chuỗi dữ liệu. Phương pháp này chỉ được áp dụng khi dữ liệu bị mất là
hoàn toàn ngẫu nhiên (MCAR), vốn rất hiếm khi xảy ra trong thực tế.
Phương pháp loại bỏ các bộ dữ liệu có chứa giá trị thiếu có ưu điểm là đơn
giản, ít tốn thời gian hơn bất kỳ phương pháp nào khác. Nhưng nó lại có có hai
điểm hạn chế quan trọng:
i) thứ nhất là nếu chúng ta áp dụng vào trong thực tế có thể gây mất mát
nhiều dữ liệu.
ii) thứ hai là nếu phân bố dữ liệu thiếu trong tập dữ liệu không thuộc trường
hợp (MCAR) thì việc loại bỏ tất cả các bộ dữ liệu có giá trị thiếu sẽ làm
sai lệch nghiêm trọng kết quả.
48
b) Phương pháp gán ghép
Phương pháp này thay thế các giá trị bị thiếu bằng một giá trị dự đoán được
xem là hợp lý và sau đó thực hiện các phân tích cho chuỗi dữ liệu đã được bổ sung.
Gán ghép trung bình: Tính giá trị trung bình dữ liệu của X bằng cách sử dụng các
giá trị không bị mất và sử dụng nó để gán ghép cho giá trị thiếu của X.
c) Phương pháp hồi qui tuyến tính
Khi hai thuộc tính định lượng nào đó có mối quan hệ tuyến tính với nhau,
chúng ta có thể xây dựng một phương trình hồi quy tuyến tính, trong đó thuộc tính
có giá trị thiếu là biến phụ thuộc, biến còn lại là biến độc lập và sử dụng phương
trình hồi quy cho việc dự đoán các giá trị thiếu của biến phụ thuộc thông qua các
giá trị đã biết của biến độc lập.
Phương pháp hồi quy tuyến tính thường gặp phải hai vấn đề:
i) thứ nhất, mô hình quan hệ giữa các thuộc tính có phải tuyến tính không.
Nếu mối quan hệ này là không tuyến tính, các giá trị thiếu ước lượng
được có thể bị sai lệch lớn so với các giá trị thực.
ii) thứ hai, thường thì trong cùng một bộ dữ liệu, các thuộc tính có quan hệ
chặt với thuộc tính có giá trị thiếu cũng có giá trị thiếu.
2.2.6 Phương pháp xử lý dữ liệu thiếu trong nghiên cứu phụ tải điện
Một số phương pháp ước lượng số liệu đo đếm của các phụ tải điện bị lỗi
trong quá trình thu thập dữ liệu của các Công ty điện lực thường được sử dụng như
sau [83]:
- Nội suy tuyến tính: nội suy từ đường đặc tính xu thế tiêu thụ điện.
- Ngày tương đồng: sử dụng dữ liệu ngày tương đồng của tuần hiện tại
hoặc tuần trước.
- Tự động ước lượng: sử dụng trong trường hợp dữ liệu bị thiếu không quá
bảy (07) ngày.
49
- Kiểm tra trực quan đồ thị: để biết được dữ liệu bị sai và quyết định về dữ
liệu được ước lượng.
- Hiệu chỉnh ước lượng số liệu thủ công: được sử dụng khi dữ liệu bị thiếu
nhiều hơn bảy (07) ngày.
- Hiệu chỉnh ước lượng giá trị trung bình các tuần của ngày tham chiếu:
dựa vào dữ liệu của bốn (04) tuần gần nhất.
Tuy nhiên, các cách làm này đều thực hiện một cách thủ công và phụ thuộc
rất nhiều vào năng lực kinh nghiệm của chuyên gia thực hiện ước lượng.
Dữ liệu đo đếm của phụ tải gồm: số liệu công suất (Pmax), điện năng tiêu thụ
(Atổng) và nhiệt độ (t0) có mối quan hệ ràng buộc với nhau. Qua quan sát các dữ
liệu thống kê chúng ta thấy được mối quan hệ tuyến tính giữa chúng, chẳng hạn
như: những ngày nhiệt độ tăng cao thì điện năng sẽ được tiêu thụ nhiều hơn do
người dân sử dụng nhiều thiết bị làm mát như máy điều hòa, quạt máy,... dẫn đến
công suất Pmax sẽ tăng cao đột biến và sản lượng điện thương phẩm Atổng cũng vì
thế tăng theo lên.
Ngược lại, những ngày thời tiết có nhiệt thấp (trời mát hay có mưa) thì công
suất Pmax và sản lượng điện thương phẩm Atổng sẽ không tăng cao mà hạ xuống
thấp, đó là do nhu cầu sử dụng điện để giải nhiệt của người dân không còn nữa. Với
phân tích trên, ta thấy mối quan hệ ràng buộc của ba thành phần số liệu công suất
(Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0). Như vậy, việc sử dụng phương
trình hồi quy cho việc dự đoán các giá trị thiếu trong quá trình nghiên cứu phụ tải
điện là hoàn toàn phù hợp.
Luận án xin đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây
dựng các xây dựng các mô hình hồi quy tối ưu hóa các thông số tự động thông qua
quá trình huấn luyện học máy Support Vector Regression (SVR), từ đó ước lượng
lại các dữ liệu đã mất hoặc không ghi nhận được trong quá trình đo đếm.
50
2.3. KẾT QUẢ NGHIÊN CỨU
2.3.1. Dữ liệu đầu vào
Dữ liệu đo đếm của phụ tải sử dụng trong việc xây dựng thuật toán gồm: số
liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0) theo từng giờ,
từng ngày trong tháng của các phụ tải tại Tổng công ty Điện lực TP.HCM.
Để phục vụ nghiên cứu, tác giả đã sử dụng một chuỗi dữ liệu đo đếm tại
Tổng công ty Điện lực TP.HCM trong khoảng thời gian từ ngày 01/01/2014 đến
28/02/2016 (dữ liệu hoàn chỉnh không bị lỗi, bị thiếu), theo đó: chủ động thay đổi
một số dữ liệu (tăng, giảm, xoá, hoặc sửa đổi một số số liệu) nhằm tạo ra các kịch
bản dữ liệu thiếu hoặc dữ liệu ngoại lai, từ đó đưa vào giải thuật để khôi phục lại và
so sánh độ chính xác với dữ liệu gốc.
Ta xét dữ liệu đo đếm từ tháng 01/2014 đến tháng 02/2016, ta thấy có 04 số
liệu điện năng (ngày 10 13/01/2015) bị lỗi ghi nhận bằng 0 – không đo đếm được;
03 số liệu điện năng (ngày 12 14/02/2015) bị lỗi ghi nhận bằng rỗng – không lưu
trữ được và 03 số liệu điện năng (ngày 05 07/03/2015) bị lỗi ghi cao bất thường.
Hình 2.8 – Đồ thị biểu diễn tương quan Pmax, Atổng và nhiệt độ
51
Bảng 2.1 – Các giá trị bị lỗi (bằng không, rỗng và cao bất thường)
Ngày Atổng (106 x kWh)
10-01-15 0
11-01-15 0
12-01-15 0
13-01-15 0
12-02-15
13-02-15
14-02-15
05-03-15 156,44
06-03-15 157,81
07-03-15 155,21
Hình 2.9 – Dữ liệu bị thiếu và lỗi
2.3.2. Xây dựng mô hình hồi quy cho việc dự đoán các giá trị thiếu
Đặc điểm của SVR là cho ta một giải pháp thưa (sparse solution); nghĩa là để
xây dựng được hàm hồi qui, ta không cần phải sử dụng hết tất cả các điểm dữ liệu
trong bộ huấn luyện, những điểm có đóng góp vào việc xây dựng hàm hồi qui được
gọi là những Support Vector (việc phân lớp cho một điểm dữ liệu mới sẽ chỉ phụ
thuộc vào các support vector).
52
Dựa trên mối quan hệ tuyến tính của ba thành phần số liệu công suất (Pmax),
điện năng tiêu thụ (Atổng) và nhiệt độ (t0), luận án đề xuất giải thuật xây dựng mô
hình hồi qui dự đoán các giá trị thiếu cho chuỗi dữ liệu điện năng tiêu thụ (Atổng),
trên cơ sở ràng buộc của bộ dữ liệu huấn luyện là thành phần số liệu công suất
(Pmax) và nhiệt độ (t0).
Yêu cầu đặt ra là thực hiện việc xử lý các dữ liệu điện năng tiêu thụ bị lỗi
trong quá trình đo đếm theo từng giờ trong ngày hoặc tổng điện năng tiêu thụ tổng
từng ngày theo tháng. Trong đó, dựa trên mối quan hệ ràng buộc giữa sản lượng
điện năng tiêu thụ với công suất và nhiệt độ tại thời điểm đo để xây dựng đường
cong hồi qui bằng giải thuật huấn luyện SVR (Support Vector Regression), từ đó
ước lượng các giá trị dữ liệu đã bị lỗi. Lưu đồ giải thuật như sau:
Hình 2.10 – Giải thuật xử lý dữ liệu thiếu
2.3.3. Kết quả xử lý dữ liệu thiếu
• Phương pháp thông thường: sử dụng giá trị trung bình trong cùng thời
gian cho 4 tuần trước đó của chuổi dữ liệu đang xét, ta có kết quả
Khi sử dụng phương pháp này sẽ xảy một vấn đề đó là: sẽ có trường hợp dữ
liệu của 4 tuần trước đó bị rớt vào vùng dữ liệu bị thiếu. Chẳng hạn như xét việc
tính toán cho dữ liệu thay thế cho các ngày 05 07/03/2015, cụ thể như sau:
53
Athay thế (05/03) = (A 26/02 + A 19/02 + A 12/02 + A 05/02) / 4;
Athay thế (06/03) = (A 27/02 + A 20/02 + A 13/02 + A 06/02) / 4;
Athay thế (07/03) = (A 28/02 + A 21/02 + A 14/02 + A 07/02) / 4;
Tuy nhiên, các giá trị A12/02, A13/02 và A14/02 lại là dữ liệu bị thiếu mà ta đang
xét, do đó kết quả tính toán chắc chắn sẽ không chính xác do các giá trị này đều bằng
0. Như vậy, có thể kết luận phương pháp sử dụng giá trị trung bình trong cùng thời
gian cho 4 tuần trước đó của dữ liệu đang xét là chưa thực sự phù hợp trong trường
hợp này.
Bảng 2.2 – Kết quả ước lượng theo phương pháp thông thường
Ngày Athay thế
10-01-15 53,71
11-01-15 46,47
12-01-15 55,20
13-01-15 55,58
12-02-15 53,49
13-02-15 52,81
14-02-15 50,79
05-03-15 31,35
06-03-15 32,24
07-03-15 31,99
• Phương pháp xây dựng đường cong hồi qui bằng giải thuật SVR
(Support Vector Regression)
Xây dựng bộ huấn luyện SVR sử dụng hàm lỗi ε-insensitive và hàm nhân
Gaussian ta có ba tham số cần tìm: hệ số chuẩn hóa C, tham số của hàm nhân
Gaussian và độ rộng của ống ε [96 - 97]. Dùng ngôn ngữ lập trình Matlab version
R2015 [98] để xây dựng chương trình ước lượng, với x1, x2 là 02 vector dữ liệu
công suất và nhiệt độ ghi nhận theo ngày từ 01/01/2014 đến ngày 29/02/2016; Y là
vector dữ liệu điện năng tiêu thụ ghi nhận theo ngày từ 01/01/2014 đến ngày
29/02/2016 (có chứa các số liệu bị lỗi) cần được mô hình hóa.
+ Xét mô hình SVM Regression, với các thông số:
54
Bảng 2.3 – Bảng thông số mô hình SVR
C - BoxConstraint KernelScale ε - Epsilon
6.9088 0.4469 0.10
➢ Kiểm tra sai số mô hình: để đánh giá mô hình hồi qui SVR vừa xây dựng, ta
có thể đánh giá sai số giữa dữ liệu có được từ mô hình với dữ liệu gốc từ
ngày 15/03/2015 đến ngày 15/04/2015, cụ thể:
Bảng 2.4 – Đánh giá kết quả test của mô hình SVR
Ngày Atổng ASVR Sai số
15-03-15 48,48 48,40 0,18%
16-03-15 57,43 59,07 2,87%
17-03-15 58,61 58,69 0,13%
18-03-15 57,86 58,03 0,29%
19-03-15 58,98 59,76 1,32%
20-03-15 59,01 59,11 0,17%
21-03-15 56,08 55,48 1,08%
22-03-15 47,98 47,76 0,46%
23-03-15 58,19 59,85 2,86%
24-03-15 61,79 61,21 0,95%
25-03-15 60,92 61,84 1,52%
26-03-15 63,99 62,04 3,04%
27-03-15 62,29 59,25 4,88%
28-03-15 60,42 58,04 3,95%
29-03-15 51,90 52,76 1,64%
30-03-15 60,91 61,34 0,70%
31-03-15 62,51 61,27 1,99%
01-04-15 60,95 61,27 0,53%
02-04-15 62,50 61,80 1,11%
03-04-15 63,23 62,93 0,47%
04-04-15 61,05 60,15 1,47%
05-04-15 51,23 51,35 0,22%
06-04-15 60,99 61,96 1,58%
07-04-15 63,34 62,86 0,76%
08-04-15 63,38 63,26 0,20%
09-04-15 63,66 63,51 0,23%
10-04-15 64,20 63,66 0,84%
55
Ngày Atổng ASVR Sai số
11-04-15 61,86 61,20 1,07%
12-04-15 51,32 49,35 3,83%
13-04-15 57,87 58,55 1,18%
14-04-15 60,17 60,57 0,66%
15-04-15 61,25 62,15 1,47%
❖ Sai số phần trăm tuyệt đối trung bình (MAPE)
%36,1
1
*100 =
−
=
t
SVR
tt
A
AA
n
MAPE
Như vậy, cho thấy độ tin cậy của mô hình hồi qui là rất cao, mô hình có thể
được sử dụng để ước lượng các số liệu bị lỗi nêu trên.
Hình 2.11 – Mô phỏng lại đường cong tải bị thiếu dữ liệu
❖ Kết quả ước lượng các giá trị thiếu, lỗi
56
Hình 2.12 – Kết quả ước lượng dữ liệu thiếu bằng SVR
Bảng 2.5 – Kết quả ước lượng dữ liệu thiếu bằng SVR
Ngày Athay thế Aước lượng(SVR)
10-01-15 53,71 52,92
11-01-15 46,47 44,91
12-01-15 55,20 54,96
13-01-15 55,58 55,45
12-02-15 53,49 49,28
13-02-15 52,81 51,11
14-02-15 50,79 42,86
05-03-15 31,35 56,80
06-03-15 32,24 58,04
07-03-15 31,99 56,12
• Phương pháp xây dựng đường cong hồi qui bằng mạng Neural Network
+ Xét mô hình Neural Netwok
Dữ liệu đầu vào để huấn luyện xây dựng hàm hồi qui gồm (từ ngày
01/01/2014 đến ngày 29/02/2016):
- Biến độc lập (biến dự báo) Y là vector dữ liệu điện năng tiêu thụ ghi nhận
theo ngày từ 01/01/2014 đến ngày 29/02/2016 (có chứa các số liệu bị lỗi)
cần được mô hình hóa.
57
- Biến phụ thuộc (các giá trị đáp ứng quan sát) gồm: 02 vector dữ liệu công
suất và nhiệt độ ghi nhận theo ngày từ 01/01/2014 đến ngày 29/02/2016
(x1 và x2).
Hình 2.13 – Mô hình mạng Neural Network
❖ Kiểm tra sai số mô hình: để đánh giá mô hình hồi qui NN vừa xây dựng, ta
có thể đánh giá sai số giữa dữ liệu có được từ mô hình với dữ liệu gốc từ
ngày 15/03/2015 đến ngày 15/04/2015, cụ thể:
Bảng 2.6 – Đánh giá kết quả test của mô hình NN
Ngày Atổng ANN Sai số
15-03-15 48,48 46,81 3,45%
16-03-15 57,43 59,96 4,42%
17-03-15 58,61 59,56 1,62%
18-03-15 57,86 58,84 1,70%
19-03-15 58,98 61,15 3,68%
20-03-15 59,01 59,43 0,70%
21-03-15 56,08 56,23 0,27%
22-03-15 47,98 47,17 1,67%
23-03-15 58,19 60,80 4,49%
24-03-15 61,79 62,11 0,51%
25-03-15 60,92 63,66 4,49%
26-03-15 63,99 63,79 0,31%
27-03-15 62,29 63,64 2,17%
28-03-15 60,42 60,64 0,35%
29-03-15 51,90 51,97 0,13%
30-03-15 60,91 63,21 3,77%
31-03-15 62,51 62,20 0,50%
01-04-15 60,95 62,20 2,06%
58
Ngày Atổng ANN Sai số
02-04-15 62,50 62,72 0,36%
03-04-15 63,23 63,50 0,43%
04-04-15 61,05 61,41 0,60%
05-04-15 51,23 47,62 7,05%
06-04-15 60,99 62,87 3,07%
07-04-15 63,34 64,26 1,45%
08-04-15 63,38 64,47 1,72%
09-04-15 63,66 64,59 1,47%
10-04-15 64,20 64,65 0,69%
11-04-15 61,86 62,10 0,39%
12-04-15 51,32 48,36 5,76%
13-04-15 57,87 59,42 2,68%
14-04-15 60,17 61,69 2,52%
15-04-15 61,25 62,79 2,51%
❖ Sai số phần trăm tuyệt đối trung bình (MAPE)
%09,2
1
*100 =
−
=
t
SVR
tt
A
AA
n
MAPE
Như vậy, cho thấy độ tin cậy của mô hình hồi qui là khá tốt (nhưng không tốt
bằng mô hình SVR 2), mô hình có thể được sử dụng để ước lượng các số liệu bị lỗi
nêu trên.
Hình 2.14 – Mô phỏng lại đường cong tải bị thiếu dữ liệu
59
Hình 2.15 – Kết quả ước lượng các giá trị thiếu, lỗi
Bảng 2.7 – Kết quả ước lượng của mô hình NN
Ngày Athay thế Aước lượng(NN)
10-01-15 53,71 54,45
11-01-15 46,47 42,70
12-01-15 55,20 55,05
13-01-15 55,58 55,49
12-02-15 53,49 50,61
13-02-15 52,81 47,10
14-02-15 50,79 39,60
05-03-15 31,35 57,51
06-03-15 32,24 59,72
07-03-15 31,99 56,18
❖ Kết quả ước lượng các số liệu bị lỗi bằng SVR và NN
60
Hình 2.16 – Mô phỏng lại đường cong tải bị thiếu dữ liệu
Hình 2.17 – Kết quả ước lượng các giá trị thiếu, lỗi
Bảng 2.8 – Kết quả ước lượng các số liệu bị lỗi bằng SVR và NN
Ngày Athay thế Aước lượng(SVR1) Aước lượng(SVR2) Aước lượng(NN)
10-01-15 53,71 54,17 52,92 54,45
11-01-15 46,47 42,15 44,91 42,70
12-01-15 55,20 55,26 54,96 55,05
13-01-15 55,58 55,49 55,45 55,49
12-02-15 53,49 49,42 49,28 50,61
13-02-15 52,81 45,97 51,11 47,10
14-02-15 50,79 39,32 42,86 39,60
61
05-03-15 31,35 57,06 56,80 57,51
06-03-15 32,24 58,92 58,04 59,72
07-03-15 31,99 55,54 56,12 56,18
2.4. TỔNG KẾT CHƯƠNG II
Qua khảo sát mô hình bộ huấn luyện SVR sử dụng hàm lỗi ε-insensitive và
hàm nhân Gaussian đã cho kết quả: giải quyết tốt yêu cầu xử lý các dữ liệu điện
năng tiêu thụ bị lỗi trong quá trình đo đếm dựa trên mối quan hệ ràng buộc của các
dữ liệu thống kê công suất và nhiệt độ ghi nhận theo ngày tương ứng với lượng điện
năng tiêu thụ.
Mô hình SVR cho kết quả mô phỏng lại đường cong đặc tuyến tải tốt hơn mô
hình mạng Neural Network và các mô hình đều có giá trị MAPE rất tốt (< 2,2%).
Qua đó, chúng ta đã xây dựng được công cụ tự động ước lượng các dữ liệu bị lỗi mà
trước đây phải thực hiện thực một cách thủ công, nâng cao độ tin cậy trong việc
phân tích, xử lý dữ liệu trong quá trình nghiên cứu phụ tải.
Việc xây dựng mô hình SVR và NN để mô phỏng lại đường cong đặc tuyến
tải đã giải quyết rất tốt nhiệm vụ của luận án đặt ra, đó là xây dựng được một công
cụ để ước lượng, xử lý các vấn đề thiếu, sai sót dữ liệu trong quá trình nghiên cứu,
dự báo phụ tải điện.
Hướng phát triển tiếp theo là sử dụng mô hình bộ huấn luyện SVR kết hợp
mô hình Box-Jenkin, Neural Networks, Random Forest để triển khai công tác dự
báo phụ tải điện ngắn hạn theo 24 chu kỳ/ ngày (chu kỳ 60 phút); ngày/tuần trên bộ
cơ sở dữ liệu của Tổng công ty Điện lực thành phố Hồ Chí Minh có xét đến các
ràng buộc về nhiệt độ, tạo tiền đề để áp dụng trong dự báo thị trường điện phân phối
và bán lẻ cạnh tranh sắp tới.
62
CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN HÓA
ĐƠN VỊ
3.1. CÁC YẾU TỐ TÁC ĐỘNG ĐẾN PHỤ TẢI ĐIỆN
3.1.1. Các yếu tố về kinh tế
- Thông thường có sự tương quan mạnh mẽ giữa tăng trưởng kinh tế và nhu
cầu điện. Qua phân tích biểu đồ tương quan giữa GRDP và Điện năng, thì
mức độ tương quan về sự tăng trưởng là rất cao (R2 = 97,67%)
- Không nhất thiết là mối quan hệ đơn giản theo tỷ lệ 1 và 1
- Tiêu thụ điện năng thường tăng theo tăng trưởng GRDP (triệu đồng)
Hình 3.1 – Tăng trưởng của GRDP và Điện năng qua các năm (triệu kWh)
Hình 3.2 – Biểu đồ tương quan giữa GRDP và Điện năng (triệu kWh)
63
3.1.2. Giá điện
- Giá điện và nhiên liệu
- Cơ cấu giá (giá theo thời điểm):
Cơ chế giá điện là giải pháp có tác dụng lớn nhất trong việc điều hòa biểu đồ
của hệ thống, cũng như giá phản ánh được giá trị sử dụng và các yếu tố giá điện liên
quan đến khách hàng tiêu thụ. Việc thiết kế cơ chế giá phù hợp sẽ mang lại lợi ích
không chỉ cho phía nhà cung cấp, khách hàng sử dụng điện mà còn mang lại lợi ích
kinh tế cho toàn xã hội.
Trong thời gian qua, áp dụng biểu giá TOU (Time of Use: thời gian sử dụng)
đã làm thay đổi biểu đồ phụ tải theo hướng tích cực, nhất là các phụ tải công
nghiệp, sản xuất. Các nhà quản lý đã dịch chuyển thời gian, dây chuyền sản xuất
vào những biểu giá điện thấp điểm để tận dụng nguồn điện giá rẻ, đồng thời sẽ có
tác dụng kép là giảm tải đỉnh tại các thời điểm cao điểm của hệ thống.
3.1.3. Thành phần phụ tải (được kết nối vật lý)
- Thành phần cơ bản của khách hàng
Hình 3.3 – 5 thành phần phụ tải sử dụng điện (hộ sử dụng điện)
64
Hình 3.4 – Đồ thị phụ tải của tòa nhà Green Power (EVNHCMC)
- Các thiết bị / công nghệ của các ngành
Hình 3.5 – Phụ tải Nhà máy thép (kWh)
Hình 3.6 – Phụ tải Nhà máy Xi măng (kWh)
- Kết nối những máy phát điện quy mô nhỏ (ví dụ như mặt trời áp mái)
3.1.4. Các yếu tố ngoại sinh
- Điều kiện khí hậu và thời tiết (theo mùa): Yếu tố khí hậu có thể ảnh hưởng
đến nhu cầu điện trên các khoảng thời gian khác nhau: trong năm có tác động
65
“theo mùa” và dài hạn tác động bởi các chu kỳ khác nhau (La-Nina & El-
Nino,)
Hình 3.7 – Sự thay đổi theo nhiệt độ trong năm (tháng 5 – mùa hè)
- Thói quen khách hàng (thông thường được tổng hợp)
Hình 3.8 – Sự thay đổi theo các ngày lễ trong năm
- Sự kiện về thời tiết, các sự kiện bất thường:
Hình 3.9 – Dao động mạnh giữa El Nino và La Nina
66
3.1.5. Quản lý nhu cầu phụ tải
- Hiệu quả năng lượng (EE): % tổng năng lượng đầu vào cho một máy hoặc
thiết bị được tiêu thụ trong công việc hữu ích và không lãng phí như nhiệt vô
ích.
- Điều chỉnh nhu cầu (DR): khi một khách hàng giảm nhu cầu phụ tải trong
một khoảng thời gian ngắn đáp lại được mức giá điện ưu đãi (hay hình thức
khác) từ nhà vận hành lưới điện. Ví dụ: giảm sử dụng điều hòa, lò hơi, giảm
bớt chiếu sáng
- Quản lý nhu cầu phụ tải (DSM): Các chương trình khuyến khích người dùng
sử dụng năng lượng hiệu quả hơn. Các biện pháp DSM có thể bao gồm cải
tạo ánh sáng, nâng cấp tự động hóa tòa nhà, cải tiến HVAC, thiết bị biến
tần,
Hình 3.10 – DR cắt giảm được tải đỉnh
3.2. ĐẶC TÍNH PHỤ TẢI
3.2.1. Đặc tính tải ngày – tuần (week day)
Nhu cầu tải thay đổi từ ngày này sang ngày khác trong tuần. Hình dưới cho
thấy nhu cầu phụ tải qua các năm trong quá khứ. Qua đó, ta thấy nhu cầu phụ tải
vào cuối tuần ít hơn so với ngày thường và phụ tải các tuần trong ngày Tết (tháng 2)
sụt giảm rất nhiều so với các tuần thường ngày khác, cũng như các tháng còn lại
trong năm.
67
Hình 3.11 – Đặc tính tải thay đổi theo ngày
Quan sát đồ thị phụ tải 07 ngày trong một tuần của khu vực thành phố Hồ
Chí Minh ta thấy sự biến đổi giữa các ngày thường (từ thứ 2 đến thứ 6) không có
nhiều biến động và có cùng một kiểu bổ đồ phụ tải. Đối với đồ thị phụ tải ngày thứ
7 thì có sự biến đổi nhưng không nhiều so với ngày thường, chủ yếu nhu cầu phụ tải
suy giảm vào buổi chiều tối. Riêng đối với đồ thị phụ tải ngày Chủ nhật thì hoàn
toàn khác với các ngày thường (nhu cầu sử dụng điện xuống thấp).
Hình 3.12 – Đặc tính tải thay đổi theo giờ - tuần
3.2.2. Đặc tính tải giờ – ngày (hour day)
Tải thay đổi trong ngày từ giờ sang giờ khác. Các hình dưới cho biết đồ thị
phụ tải điển hình của tháng 12 trong năm. Có thể nhận thấy rằng tải đỉnh xảy ra hai
lần một ngày, một là khoảng 10:00 AM đến 12:00 AM và
Các file đính kèm theo tài liệu này:
- luan_an_ky_thuat_du_bao_trong_van_hanh_thi_truong_dien_viet.pdf