MỤC LỤC.1
ANH MỤC C C THU T NG .4
ANH S CH ẢNG .5
ANH S CH H NH V .6
M ĐẦU .8
CHưƠNG 1. TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU . 14
1.1. MẠNG CẢM I N KH NG DÂY . 14
1.1.1. Lịch s phát triển. 14
1.1.2. Kiến trúc mạng cảm biến và một số cách ph n loại. 17
1.1.2.1. Kiến trúc . 17
1.1.2.2. Các thành phần chính của WSNs . 17
1.1.2.3. Một số cách phân loại mạng. 18
1.2. CÁC VẤN ĐỀ CẦN GIẢI QUY T. 20
1.2.1. Vấn đề tiêu thụ năng lượng . 20
1.2.2. Thiết ế no mạng cảm iến . 22
1.2.3. Tổ chức mạng và định tuyến. 22
1.2.4. Truyền và x l ữ liệu. 22
1.2.5. Tổng hợp dữ liệu . 23
1.2.6. X lý vấn đề ữ liệu ư thừa. 24
1.3. CÔNG CỤ MÔ PHỎNG MẠNG CẢM BI N . 25
1.3.1. Bộ mô phỏng NS-2. 25
1.3.2. NS-2 và phần mở rộng mô phỏng WSNs của MIT. 26
1.4. MÔ HÌNH TỔNG HỢP D LIỆU VÀ BÀI TOÁN THÀNH PHẦN . 26
1.4.1. Mô hình tổng hợp dữ liệu . 27
1.4.2. Theo dõi mục tiêu và lựa chọn dữ liệu . 28
1.4.2.1. Theo dõi mục tiêu dựa vào vị trí của nút . 29
1.4.2.2. Theo dõi mục tiêu dựa vào thời gian . 30
1.4.2.3. Lựa chọn dữ liệu và truyền đến CH . 33
1.4.3. Tổng hợp dữ liệu tại CH. 34
1.4.3.1. Định tuyến phân cụm thích ứng với năng lượng thấp . 34
1.4.3.2. Tổng hợp dữ liệu tại nút cụm trưởng . 36
1.5. LÝ THUY T T P THÔ. 38
1.5.1. Các khái niệm về lý thuyết tập thô được s dụng . 39
1.5.1.1. Hệ thống thông tin. 39
142 trang |
Chia sẻ: honganh20 | Lượt xem: 398 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận án Tổng hợp dữ liệu nhằm tiết kiệm năng lượng trong mạng cảm biến không dây, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hì việc đo lƣờng của nút bắt đầu diễn ra
thực sự, giá trị đo lƣờng đó đƣợc ghi nhận để g i đến CH. Thông thƣờng,
biểu diễn sự thay đổi của mục tiêu và của nút có thể hình dáng (hàm số)
Thay đổi
của mục tiêu
Threshold
Value
Time
f(x)
Tbefore Tpoint Tmeasure
Vbefore
Vpoint
Vmeasure
ΔT
ΔV
Hình 2.8. Các mốc thời gian và trạng thái làm việc của nút
-61-
không hoàn toàn giống nhau bởi vì thực tế, thiết bị điện t khó có thể biểu
diễn đƣợc hoàn toàn sự biến động của mục tiêu. Khi biến động của mục tiêu
làm cho giá trị đo của nút ƣới ngƣỡng thì nút vẫn ở trạng thái hông đo
lƣờng (là idle hoặc sleep). Giải pháp đề xuất s dụng giá trị ngƣỡng đo lƣờng
(threshold) của nút, ký hiệu là δ và giả thiết là đã iết trƣớc.
2.2.2.4. Trạng thái ổn ịnh o lường
Đo lƣờng mục tiêu của nút dựa trên việc điện t hóa các đại lƣợng không
có tính chất điện thành các đại lƣợng có thể đo và x l đƣợc bằng tín hiệu
điện t . Các kích thích của mục tiêu sẽ tác động đến bộ phận cảm nhận của
nút, bộ phận này là linh kiện điện t vì vậy có độ trễ (response time) nhất định
Δstart để có thể đạt trạng thái ổn định đo lường (steady state) nhƣ Hình 2.10.
Hình 2.10. Mô hình chuyển trạng thái của nút cảm biến
2.2.2.5. Dự o n
Giả s độ trễ đó là Δstart. Giải pháp ATTS- F hƣớng đến mối quan hệ
giữa ΔT (thời gian đo th ch ứng) và Δstart . T nh th ch ứng (adaptive) của giải
pháp này đạt l tƣởng hi ΔT = Δstart nghĩa là thời gian đo thích ứng vừa đúng
với thời gian nút khởi động để đạt trạng thái ổn định đo lường. Các trƣờng
hợp hác ΔT ≠ Δstart , đặt ΔAdap = | ΔT - Δstart |. Với δ là giá trị ngƣỡng đo lƣờng,
hi đó f(Tmeasure)=Vmeasure = δ. Vấn đề cần giải quyết là ự đoán giá trị f(Tmeasure)
sao cho trong hoảng ΔT thì f(t) tăng (theo giả thiết) và f(Tmeasure) ≥ δ đồng
time
Status
of
sensor
(value)
Δstart steady state
Idle or sleep
-62-
thời ΔT = Δstart . Trạng thái thích ứng có nghĩa là nút hởi động và đạt trạng
thái ổn ịnh o lường úng lúc mục tiêu biến ộng vư t ngưỡng o buộc nút
phải đo lƣờng (xem Hình 2.11).
Hình 2.11. Mô hình trạng thái thích ứng của giải pháp ATTS-DF
Gọi Smovalue là độ mịn đo lƣờng của nút cảm iến, Smovalue = l có nghĩa là
nút cảm iến có thể đo đƣợc l mức đo (V1, V2, . Vl) và V1 < V2 < .< Vl , l
càng lớn thì hả năng đo lƣờng của nút cảm iến càng mịn (smooth). Gọi
Smofreq là độ nhạy đo lƣờng hay tần số đo trong 1 gi y (s) của nút cảm iến ở
trạng thái ổn định đo lƣờng, đặt Smofreq = k. Đặt m là số lần đo mục tiêu của
nút cảm iến trong thời gian ΔT ơn vị tính là s), m = k * ΔT nghĩa là trong
hoảng thời gian ΔT , f(t) có thể nhận m giá trị đo từ l giá trị có thể đo đƣợc
của nút cảm iến. Gọi f(t)mi là giá trị f(t) tại lần đo thứ i trong khoảng thời
gian ΔT . Th ụ Hình 2.8, m = 7, vì f(t) đơn điệu tăng trong hoảng ΔT , do
vậy f(Tpoint) = f(t)m1 < f(t)m2 < f(t)m3 < .....< f(t)m7 = f(Tmeasure).
Trƣờng hợp tổng quát có thể áp dụng xác suất xảy ra trƣờng hợp
f(Tmeasure) ≥ δ. Gọi Prm(Vtt) là xác suất xuất hiện giá trị đo Vtt của lần đo thứ m,
với Vtt {V1,V2...Vl-1,Vl } hi đó f(t) = Vtt với xác suất đúng Prm(Vtt) và tổng
∑ ( )
. Nghĩa là tại lần đo thứ m, Vtt có thể nhận đƣợc 1 trong l
giá trị Vtt {V1,V2...Vl-1,Vl } với xác suất nhận các giá trị đó có thể khác nhau
Δstart
ΔT
Time
Time
f(t)
Threshold
State of sensor
-63-
nhƣng luôn tồn tại xác suất lớn nhất để Vtt nhận một giá trị nào đó. Giá trị có
xác suất lớn nhất có thể nhận đƣợc này gọi là giá trị dự đoán của tín hiệu đo
và đƣợc s dụng trong quyết định đo lƣờng khi so sánh với δ (ngƣỡng).
2.2.3. T uật t á
Đầu vào của thuật toán gồm: ngƣỡng đo lƣờng δ, theo yêu cầu của ứng
dụng để chọn δ phù hợp; thời gian Δstart để nút có thể đạt trạng thái ổn định đo
lƣờng; l mức giá trị có thể đo đƣợc của nút cảm biến; tần số đo k trong 1s của
nút cảm iến; dạng/hàm số tín hiệu (giả thiết biết trƣớc). Dựa vào hàm tín
hiệu và tần số đo để xác định số lƣợng phép đo trong khoảng thời gian nút
khởi động. Giả thiết với mỗi phép đo có thể biết đƣợc xác suất nhận 1 trong l
giá trị và luôn tồn tại giá trị có xác suất nhận đƣợc cao nhất (Giá trị này đƣợc
so sánh với ngƣỡng và s dụng kết quả này để ra quyết định việc chuyển
trạng thái của nút. Trƣờng hợp l tƣởng, thời gian đo th ch ứng vừa đúng với
thời gian nút khởi động để đạt trạng thái ổn định đo lƣờng. Trong trƣờng hợp
nút khởi động chậm hơn so với thời gian tín hiệu vƣợt ngƣỡng thì việc đo
lƣờng sẽ trễ một khoảng thời gian. Giả mã thuật toán nhƣ sau:
1. Input δ, Δstart , l, k, f(t)
2. Xác định giá trị m = * Δstart
3. If f(Tpoint) là hàm đơn điệu tăng then
4. For i = 1..m do xác định f(ti)
5. For tt = 1 to l do xác định Pri (Vt t)
Bảng 2.3. Phân bố xác suất trong m lần đo
Lầ đ
t ứ J
G á tr đ c t đ được
∑ ( )
V1 V2 . Vl
1 Pr1(V1) Pr1(V2) . Pr1(Vl) 1
2 Pr2(V1) Pr2(V2) . Pr2(Vl) 1
. . . . . .....
m Prm(V1) Prm(V2) . Prm(Vl) 1
-64-
6. If Pri(Vt t) = Max {(Pri(Vt t)} then
7. f(ti) = Vt t
# X l trƣờng hợp f(t) tăng, nút chuyển sang trạng thái "steady state"
# Nếu thời gian thích ứng vừa đúng với thời gian nút khởi động
8. If (f(t1)< f(t2)<...< f(tm)) and f(tm) ≥ δ then
9. Chuyển trạng thái của nút sang "steady state"
10. If f(Tpoint) = f(t1) )< f(t1+i) and f(t1+i) ≥ δ then
11. Thời gian chờ = (Tpoint + Δstart - t1+i )
12. Chuyển trạng thái của nút sang "steady state"
13. Return trạng thái của nút là "steady state"
14. End.
Giải thích: D ng 1, nhập đầu vào là ngƣỡng δ, thời gian khởi động của
nút (response time) Δstart , số mức đo l, tần số đo ; dòng 2, tính số lần đo m
trong khoảng Δstart bởi công thức: m = k * Δstart; dòng 3, nếu tại điểm Tpoint , f(t)
có xu hƣớng tăng thì khởi động hệ thống tính toán; Dòng 4, lặp để tính m giá
trị f(t): f(t1), f(t2)... f(tm); dòng 5, lặp để tính xác suất f(ti) có thể nhận 1 trong l
giá trị nút có thể đo đƣợc, nghĩa là f(ti) {V1,V2...Vl-1,Vl }; dòng 6, 7, gán f(ti)
giá trị có xác suất xuất hiện lớn nhất.
Thuật toán này, áp dụng đối với f(t) đơn điệu tăng và nút chuyển từ trạng
thái idle (hoặc sleep) sang active ở chế độ đo steady state. Trong trƣờng hợp
f(t) đơn điệu giảm thì thuật toán tƣơng tự. Dòng 8, nếu m giá trị đo của f(t)
đồng biến và tại điểm tm , sensor kết thúc thời gian Δstart cho việc khởi động,
nghĩa là ΔT = Δstart; dòng 9, sensor chuyển sang trạng thái hoạt động ổn định;
dòng 10, nếu nút khởi động chậm hơn so với thời gian tín hiệu vƣợt ngƣỡng
nghĩa là ΔT < Δstart tại ti bất kỳ i = 2..m; dòng 11 xác định thời gian chờ hay
độ trễ đo lƣờng là khoảng (ti ... tm] đến hết thời gian Δstart; dòng 12, 13, nút
chuyển trạng thái và trả về kết quả thuật toán là trạng thái của nút; kết thúc.
Đối với trƣờng hợp x lý việc nút chuyển trạng thái từ active ở chế độ đo
steady state về trạng thái idle (hoặc sleep), đ y là ài toán ngƣợc của giải
pháp đã đề xuất trong trƣờng hợp f(t) đơn điệu giảm.
-65-
Vấn đề x lý dữ liệu trong trƣờng hợp trễ đo lƣờng khi thời gian khởi
động của nút nhanh hơn thời gian để tín hiệu vƣợt ngƣỡng và khi nút khởi
động chậm hơn hi đó nút cảm biến sẽ hông đo đƣợc dữ liệu trong khoảng
(ti ... tm] là các vấn đề khoa học mà chúng tôi sẽ nghiên cứu giải quyết trong
tƣơng lai.
2.2.4. M p ỏ v p tíc t quả
Trên cơ sở các mã nguồn mô phỏng MIT đối với LEACH [30], thi hành
trên phần mềm mô phỏng NS-2 phiên bản 2.34 cài đặt trên hệ điều hành
U untu 12.04 để sinh ra các tệp vết về năng lƣợng, dữ liệu, khoảng cách...
Tác giả luận án áp dụng giải pháp ATTS- F đối với bộ dữ liệu đã tạo lập để
phân tích hiệu quả áp dụng so với LEACH.
Bảng 2.4. Các tham số chính của mô phỏng
Tham số Giá trị
Số nút c m biến tham gia mô phỏng 100
Tọa ộ nút trong miền 100m x 100m Ngẫu nhiên
Tọa ộ mục tiêu (tag) trong miền 100m x 100m Ngẫu nhiên
Số cụm tối thiểu, tối a 1 10
Số cụm mong muốn (desired) 5
Năng lư ng pin khởi tạo của nút c m biến 2 J
Năng lư ng nh n 1 bít 5 nJ
Năng lư ng (sóng vô tuyến) ể gửi 1 bít 50 nJ
Hệ số khuếch ại khi truyền sóng 10pJ/bit/m2
Công suất lúc chờ (Idle), lúc ngủ (Sleep) 0 W
Tốc ộ truyền sóng 1 Mbps
ch thước header (hdr_size) 25 Byte
ch thước dữ liệu c m nh n (sig_size) 500 Byte
Thời gian mỗi vòng (T)/data fusion (T) 10 s (option)
Số nút trong cụm mỗi (n) Ngẫu nhiên
Số mức o của nút c m biến (l) 100
Ngưỡng o δ) 26 (Option)
Tần số o trong 1 giây (k) 6
Thời gian ạt trạng th i o steady state Δstart) 2s
-66-
Mô phỏng với giao thức truy cập mạng ở tầng MAC là CSMA/CA, các
nút trong cụm truy cập đƣờng truyền theo giao thức TDMA. Ph n t ch đối với
100 nút cảm biến trong thời gian mô phỏng là 480 giây, thời gian thay đổi cấu
hình theo vòng 10s, mỗi vòng có 3 đến 8 cụm, các nút trong cụm phân bố
ngẫu nhiên, nghĩa là có hoảng 200 cấu hình mô phỏng. Hình 2.12 là số nút
tham gia khảo sát của mỗi vòng T = 10s trong thời gian 420s. Trong thời gian
mô phỏng, một số nút hết năng lƣợng (trạng thái "die") sẽ không tham gia
mạng. Từ giây thứ 180, bắt đầu xuất hiện nút bị "die", số lƣợng nút "die" sẽ
tăng hi thời gian s dụng éo ài là xu hƣớng tất yếu.
Giá trị o ư c
Time (x10s)
threshold
Giá trị o ư c
đođooƣợcNum
Time 100 sensor node
Hình 2.13. Truyền ữ liệu của các nút
cảm iến trong thời gian mô phỏng
Hình 2.14. Đồ thị truyền ữ liệu của
nút số 16 giải của LEACH
Hình 2.12. Số nút cảm iến tham gia mô phỏng ATTS-DF
Số nút còn hoạt động
đođooƣợcNumber of
Thời gian (t x10s)
Số nút cảm bi n trong thời gian mô phỏng
-67-
Đối với thuật toán LEACH, nút cảm biến truyền dữ liệu đến CH theo
chu kỳ T = 10s. Trong mỗi chu kỳ, mỗi nút sẽ thuộc 1 cụm, 2 nút thuộc 1 cụm
trong chu kỳ này có thể không cùng thuộc 1 cụm trong 1 chu kỳ khác. Tuy
vậy, có thể tính tổng t ch lũy số sig_size (500 Byte/sig_size) mà nút cảm biến
đã truyền trong mỗi chu kỳ và trong cả giai đoạn mô phỏng. Hình 2.13 là diễn
biến việc truyền dữ liệu của 100 nút trong thời gian 480s.
Đối với mỗi nút, việc truyền nhận dữ liệu có thể đột biến tăng hoặc giảm.
Tại các đỉnh của đồ thị có sự đột biến gói tin – đồng nghĩa với việc tại thời
điểm đó mục tiêu có thay đổi vƣợt ngƣỡng, cần phải đo, có thể đặt ngƣỡng là
số lƣợng các gói tin, đồng thời giả thiết số lƣợng (hay ung lƣợng) dữ liệu
bằng nhau nếu chúng cùng có lƣợng thông tin nhƣ nhau, sự tăng các gói tin
đồng nghĩa với việc tăng t nh cấp thiết phải đo lƣờng.
Ví dụ, xét giá trị đo của nút số 16 trong thời gian mô phỏng 460s của
LEACH và δ = 26 sig_size để áp dụng giải pháp ATTS-DF, đồ thị truyền dữ
liệu ở Hình 2.14. Giả s xét thời điểm giây thứ 120 đến giây thứ 130, là
khoảng thời gian tín hiệu đo của nút 16 có độ đo vƣợt ngƣỡng δ. Tại giây thứ
120, dữ liệu đo có xu hƣớng tăng. Với k = 6 (có thể đo 6 lần trong 1 giây),
trong khoảng dữ liệu tăng từ 19 đến δ = 26, số lần có thể đo đƣợc là 7s * 6 =
42 lần và m = 2*k = 12 lần.
Hình 2.15. Hiệu quả việc giảm ữ liệu truyền của ATTS- F so với LEACH
-68-
Áp dụng với 2 trƣờng hợp: thứ nhất, ΔT = Δstart = 2s tức là nút sẽ mất 2s
để khởi động và mục tiêu cũng sẽ mất 2s (tính từ điểm đo iến động) để vƣợt
ngƣỡng; thứ hai, Δstart > ΔT (ví dụ ΔT = 1s) nghĩa là thời gian nút khởi động
để đạt trạng thái steady state l u hơn thời gian tín hiệu đo vƣợt ngƣỡng (ví dụ
là 1s). Tƣơng tự xét 2 trƣờng hợp trên đối với khoảng 180s-190s và 400s-410s.
Hình 2.15 cho thấy hiệu quả đối với nút thứ 16 trong 02 trƣờng hợp trên ở chỗ
giải pháp này nút sẽ hông hao ph năng lƣợng để phát tín hiệu trong thời gian
Δstart (Hình 2.15a) hoặc thời gian Δstart – ΔT (Hình 2.15b) so với việc thu phát
liên tục theo chu kỳ của LEACH trong cùng khoảng thời gian xem xét.
Kết quả mô phỏng cho thấy, với δ = 26, thuật toán ATTS-DF có thể áp
dụng đƣợc ở một số nút có giá trị đo lƣờng vƣợt ngƣỡng. Việc giảm δ có thể
tăng số lƣợng nút tham gia thuật toán ATTS-DF. Ví dụ, khảo sát đối với 100
nút trong thời gian 480s với 48 vòng (số nút "sống" để tham gia quá trình
khảo sát ở Hình 2.12), δ = 26 khi áp dụng thuật toán ATTS-DF sẽ có 55 nút
áp dụng với số lƣợng 1 lần, 14 nút áp dụng 2 lần, 3 nút áp dụng 3 lần.
Hình 2.16. So sánh mức tiêu thụ năng lƣợng của các nút giữa ATTS-DF và LEACH
Hiệu quả tiết kiệm năng lƣợng đối với 55 nút ở trên khi áp dụng ATTS-
DF và việc s dụng năng lƣợng của các nút đó hi áp ụng LEACH, kết quả
cho thấy: ATTS-DF tiết kiệm đƣợc từ 13,3% đến 20% năng lƣợng của nút
dsfdNă ượng tiêu thụ của các nút trong thời gian mô phỏng
-69-
tƣơng ứng khi áp dụng LEACH. Biểu đồ tiêu thụ năng lƣợng của các nút áp
dụng thuật toán ATTS-DF và LEACH ở Hình 2.16.
2.2.5. K t uậ về ả p áp ATTS-DF
Giải pháp ATTS- F đề xuất đƣợc một phƣơng pháp th o i mục tiêu
th o thời gian, th ch nghi với iến động của mục tiêu; đề xuất đƣợc hái
niệm: Điểm đo iến động, trạng thái ổn định đo lƣờng, thời gian đo th ch ứng
và phƣơng pháp ự đoán giá trị đo mục tiêu th o xác suất (đã iết trƣớc).
Hiệu quả của ATTS-DF so với LEACH gồm: thứ nhất, đo lƣờng mục tiêu
hông th o chu ỳ cố định mà có điều chỉnh th o mục tiêu đã hạn chế đƣợc
ung lƣợng dữ liệu đo lƣờng giống nhau và tiết kiệm đƣợc năng lƣợng do
không g i dữ liệu ƣ thừa (vì có cùng thông tin) này đến CH, BS; thứ hai, đề
xuất việc chuyển trạng thái đo lƣờng của nút cảm iến từ idle (hoặc sleep)
sang active đúng vào thời điểm nút cảm biến có thể đo lƣờng ở trạng thái bình
thƣờng, điều này đã hạn chế tối đa thời gian nút cảm biến đƣợc bật khi chƣa
đạt trạng thái đo đƣợc tốt nhất g y tổn hao năng lƣợng vô ch.
Giải thuật của ATTS-DF gồm các phép đơn giản, phù hợp với khả năng
tính toán của nút cảm biến nên chỉ độ phức tạp tuyến tính O(n). Ngoài ra, giải
pháp có xu hƣớng tối ƣu hóa về độ trễ và đảm bảo độ hội tụ về thời gian (đáp
ứng đo lƣờng càng nhanh càng tốt).
Kết quả nghiên cứu này đã đƣợc công bố với Công trình số 7: "ATTS-
DF: Adaptive tracking solution to the target for data fusion in wireless sensor
networks”, Hội nghị ICSSE 2017 tại Thành phố Hồ Chí Minh, Việt Nam,
tháng 7 năm 2017; đƣợc lựa chọn vào cơ sở dữ liệu Scopus, IEEE Xplore.
Trong tƣơng lai, có thể nghiên cứu thêm mối quan hệ giữa năng lƣợng
của nút, giá trị đo lƣờng và ngƣỡng δ, tình huống mục tiêu thay đổi đột ngột
dẫn đến kết quả đo vƣợt ngƣỡng trƣớc lúc nút đạt trạng thái ổn định.
-70-
C ươ 3. TI T KIỆM NĂNG LƯỢNG CỤM NÚT CẢM BI N
BẰNG ỨNG DỤNG L THUY T TẬP THÔ
L ý thuyết tập thô - RST (Rough Set Theory) đƣợc Z zisaw Pawla đề
xuất năm 1982 [64] là công cụ toán học hữu hiệu có thể phân tích dữ liệu mơ
hồ hoặc không chắc chắn để hỗ trợ quyết định bằng cách có thể bỏ qua sự
hông ch nh xác đó ở mức độ chấp nhận đƣợc. Các ứng dụng bởi lý thuyết
tập thô chủ yếu dựa trên việc phân bổ dữ liệu bằng cách xấp xỉ giới hạn trên
và giới hạn ƣới. an đầu, lý thuyết tập thô chủ yếu đƣợc s dụng trong quá
trình khai phá dữ liệu, bao gồm tiền x lý số liệu, x lý số liệu.
Đầu vào cho việc ứng dụng RST là mạng cảm biến đƣợc hệ thống hóa
thông tin thành một bảng, mỗi hàng là một đối tƣợng, mỗi cột là một thuộc
tính. Tùy theo yêu cầu đầu ra cho mỗi loại ứng dụng để lựa chọn giải pháp
phù hợp, hƣớng đến việc cân bằng giữa độ phức tạp phƣơng pháp đó và khả
năng x lý của nút cảm biến, tài nguyên của mạng.
Nhƣ ph n t ch ở Mục 1.5, hƣớng nghiên cứu ứng dụng RST để tổng hợp
dữ liệu chủ yếu kết hợp với trí tuệ nhân tạo (nhƣ mạng nơ-ron) để huấn luyện
dữ liệu một bộ dữ liệu đầu vào th o tiêu ch ƣới dạng quy tắc/luật nào đó của
phƣơng pháp đề xuất 82, 84, 85, 96, 97, 99 . Hƣớng nghiên cứu tiền x lý dữ
liệu cũng ết hợp với mạng nơ-ron để xác định và x lý lỗi [83, 86, 87]. Các
đề xuất nêu trên phần lớn phù hợp với các ứng dụng đặc thù với số lƣợng ít
nút cảm biến cũng nhƣ năng lƣợng dự trữ của nút khá lớn để đáp ứng nhu cầu
t nh toán độ phức tạp lớn. Thực tế, các đề xuất nêu trên hông đánh giá độ
phức tạp tính toán của giải pháp đã đề xuất.
Chƣơng 3, nội dung luận án th o hai hƣớng nghiên cứu nêu trên
nhƣng tiếp cận theo chiều thuận, tối ƣu hóa độ phức tạp tính toán bằng cách
s dụng tối đa các phép t nh toán cổ điển của RST. an đầu, mạng cảm biến
-71-
đƣợc hệ thống hóa thành bảng thông tin có số hàng là số nút cảm biến, số cột
là các thuộc t nh điều kiện theo thực tế của mạng và yêu cầu của ứng dụng.
Quy trình ứng dụng RTS để tổng hợp dữ liệu với đầu ra là tập luật để CH đƣa
ra quyết định về dữ liệu đƣợc trình bày ở Mục 3.1. Quy trình ứng dụng RST
để tiền x lý dữ liệu thô mà nút trong cụm thu đƣợc để tạo bộ dữ liệu đầu vào
CH thực hiện tổng hợp, nội ung này đƣợc trình bày ở Mục 3.2.
3.1. Ứ ụ L t u t tập t tạ CH đ t ợp u
Sự phù h p ể chọn RST làm gi i pháp tổng h p dữ liệu nhiều c m biến
thể hiện ở những quan iểm sau:
Tính chất rời rạc và liên tục của dữ liệu đo lƣờng của nút cảm biến:
Giao thức IEEE 802.15.4 khi áp dụng cho mạng WSN sẽ điều khiển việc lấy
dữ liệu theo chu kỳ thức-ngủ (active-sleep) nên dữ liệu CH thu đƣợc từ nút
cảm biến sẽ rời rạc. Khi nút cảm biến ở trạng thái thức (active), dữ liệu đo là
liên tục (nằm trong khoảng giá trị đo của nhà sản xuất), việc x lý và truyền
dữ liệu đó đến nút cảm biến tiếp theo trên tuyến thì dữ liệu đó là liên tục.
Hỗ trợ để x lý mô tả không chắc chắn: Khi sensor cảm nhận về đối
tƣợng, tín hiệu có thể bị nhiễu dẫn đến tính đúng đắn của dữ liệu truyền đi
hông đƣợc bảo toàn. Dựa trên dữ liệu thuộc tính, CH có thể xác định lại sự
đúng đắn của dữ liệu cảm nhận bằng cách loại bỏ thông tin nhiễu, giữ lại
thông tin hữu ích, ít bị nhiễu phục vụ tổng hợp dữ liệu.
Hỗ trợ x lý vấn đề mất dữ liệu: Dữ liệu thu thập đƣợc từ các nút cảm
biến khi truyền đến CH có thể hông đầy đủ, nghĩa là CH không nhận đủ dữ
liệu từ một hoặc nhiều nút trong nhóm để làm dữ kiện cho quá trình DF. Tình
huống để mất dữ liệu có thể là: Lúc cần cảm nhận thì nút cảm biến đang trạng
thái ngủ, lúc đang truyền dữ liệu đến CH thì nút cảm biến hết năng lƣợng,
đang truyền thì đến chu kỳ ngủ của nút cảm biến, gói tin bị lỗi
-72-
Hỗ trợ để x lý vấn đề ƣ thừa dữ liệu: Đ y là một vấn đề rất quan
trọng trong bài toán tổng hợp dữ liệu. Khi các nút cảm biến cùng cảm nhận về
một đối tƣợng và cùng truyền một loại thông tin đó trực tiếp đến BS hoặc qua
nút cảm biến trung gian (là CH nếu mạng có phân cụm) để truyền đến BS thì
việc loại bỏ các dữ liệu ƣ thừa này là điều rất cần thiết.
RST hỗ trợ tổng hợp dữ liệu đƣợc ch nh xác hơn thông qua ngữ nghĩa,
"tri thức" của thông tin chứ không thông qua x lý trực tiếp toàn bộ dữ liệu
"kiến thức" của thông tin. Trên thực thế, rất hó để có thể tổng hợp đƣợc dữ
liệu đúng tuyệt đối (100%) với tình huống diễn ra ở thực địa o đặc tính phần
cứng của s nsor hó định lƣợng chính xác giá trị của đại lƣợng đặc trƣng cho
sự kiện cần giám sát. o đó, đôi hi phải t nh định lƣợng thông qua ngữ nghĩa
của dữ liệu thay vì định lƣợng giá trị đo của từng loại tham số cụ thể.
Tóm lại, s dụng tổng hợp dữ liệu để tăng độ chính xác của kết luận
đồng thời đạt hiệu quả về năng lƣợng. Thực tế trong điều kiện l tƣởng, chỉ
cần một nút cảm biến là đủ để có kết luận chính xác nhất, tuy nhiên điều này
bị ràng buộc bởi các công nghệ phần cứng, t nh năng đƣợc tích hợp vào nút
cảm biến của nhà sản xuất. Tổng hợp dữ liệu có nghĩa trong trƣờng hợp
muốn tăng độ ch nh xác hơn hi suy đoán hông chắc chắn và ứng dụng RST
trong vấn đề tổng hợp dữ liệu của WSNs là một lựa chọn phù hợp.
3.1.1. M tả t á DF ều út cả
Các nút cảm biến (S0, S1,... S7) theo dõi sự kiện diễn ra ở mục tiêu (target)
và truyền dữ liệu cảm nhận sự kiện đó đến một nút cụm trƣởng - CH có trách
nhiệm DF. Nút CH áp dụng thuật toán tiền x lý (data preprocessing) để giao
tiếp, tách các thuộc tính của dữ liệu (feature extraction), sau đó áp ụng RST
để tổng hợp dữ liệu (data fusion) và quyết định. Nhƣ vậy, đầu vào của CH là
dữ liệu cảm biến về mục tiêu và thông tin của các nút cảm biến trong nhóm;
-73-
đầu ra là quyết định lựa chọn nút cảm biến và nội dung dữ liệu cảm biến để
truyền tiếp. ài toán đƣợc mô tả ở Hình 3.1.
3.1.2. Qu tr ứ ụ RST đ t ợp u
Với WSNs, nhiều lớp ài toán đã đƣợc đặt ra nhƣ: điều khiển chu kỳ
cảm nhận dữ liệu, lấy mẫu cảm biến, phân nhóm, chọn nút cụm trƣởng, định
tuyến, tổng hợp... Không mất tính tổng quát có thể giả s những ài toán đó
đã đƣợc giải quyết. Riêng bài toán tổng hợp dữ liệu, mục tiêu chính chỉ tập
trung vào vấn đề (điều khiển) tính toán trên nút CH. Nhƣ vậy, ứng dụng lý
thuyết tập thô để tổng hợp dữ liệu nhiều cảm biến sẽ đƣợc thực hiện ở Lớp 3.
Hình 3.1. Mô tả bài toán tổng hợp ữ liệu có s dụng RST.
Đề xuất quy trình ứng dụng RST để tổng hợp dữ liệu nhƣ sau:
ƣớc 1: Tiền x lý, tách thuộc tính từng nút cảm biến (của dữ liệu cảm
nhận và của nút cảm biến), giả s đƣợc m thuộc tính;
ƣớc 2: Lập bảng, nếu có n nút cảm biến thì bảng sẽ có n hàng, (m + 1) cột;
ƣớc 3: Tìm lớp con tƣơng đƣơng th o giá trị thuộc tính quyết định;
ƣớc 4: Tìm tập các lớp con tƣơng đƣơng của các tập con thuộc t nh điều kiện;
ƣớc 5: Tìm tập các tập thuộc tính rút gọn;
Multi - Sensor
Target (mục tiêu)
Tiền x lý
Tách thuộc tính
CH
Tổng hợp dữ liệu
Quyết định
S1 S2 S3
S4
S5
S6
S7
S0
Công đoạn ứng dụng
RST để tổng hợp dữ
liệu nhiều cảm biến
tại nút CH
Lớp 2
Lớp 1
Lớp 3
-74-
ƣớc 6: Tìm tập thuộc tính lõi;
ƣớc 7: Xác định các luật quyết định, độ chắc chắn của mỗi luật để làm cơ sở tri thức;
ƣớc 8: Quyết định.
Đề xuất mô hình xử lý dữ liệu tại CH nhƣ sau (x m Hình 3.2):
Hình 3.2. Mô hình x lý, tổng hợp dữ liệu tại nút CH
Giải thích:
+ Tiếp nh n dữ liệu c m biến: Nút CH nhận dữ liệu cảm biến của tất cả
các nút trong cụm g i về.
+ Tách thuộc tính từng nút c m biến: Tín hiệu cảm nhận và thông tin về
nút sẽ đƣợc lƣợng hóa thành các mức giá trị. Các thuộc tính này phù hợp với
mục đ ch, phƣơng pháp đề xuất của từng ài toán và đƣợc định nghĩa trƣớc.
+ Ghi dữ liệu thuộc tính vào b ng: Nếu nhóm có n nút cảm biến, dữ liệu
mỗi nút cảm biến có m thuộc t nh điều kiện thì bảng thông tin (hay hệ quyết
định) này có dạng ma trận ch thƣớc n hàng, (m+1) cột (vì thêm 1 cột thuộc
tính quyết định), lập bảng theo công thức CT 1.2. Thuộc tính quyết định sẽ
đƣợc định nghĩa trƣớc theo thuộc t nh điều kiện.
+ Tìm lớp con tương ương: Áp dụng công thức CT 1.3 để phân hoạch
bảng thông tin thành các lớp con tƣơng đƣơng (của m thuộc tính) theo giá trị
Tiếp nhận
tất cả dữ
liệu cảm
biến
Tách
thuộc
tính từng
sensor
Tìm lớp
con
tƣơng
đƣơng.
Ghi dữ
liệu thuộc
tính vào
bảng.
Tìm tập các lớp
con tƣơng đƣơng
của các tập con
thuộc t nh điều
kiện
Tìm các
tập thuộc
tính rút
gọn.
Tìm tập
thuộc
tính
lõi
Xác định các luật
quyết định
Độ chắc chắn của
luật quyết định
Cơ
sở
tri
thức
Quyết định
Dữ liệu
các
Sensor
g i về
nút CH
Nút CH
-75-
của thuộc tính quyết định. Với bài toán tổng hợp dữ liệu, giá trị thuộc tính
quyết định có thể là "Có"/"Không" (nếu nút cảm biến đó đƣợc/ hông đƣợc
CH chọn để tổng hợp). Tập con tƣơng đƣơng với thuộc tính quyết định giá trị
"Có" sẽ đƣợc s dụng làm đầu vào cho việc áp dụng RST.
+ Tìm t p các lớp con tương ương của các t p con thuộc t nh iều kiện:
S dụng công thức CT 1.3 để tiếp tục phân hoạch các lớp con tƣơng đƣơng
(đã có ở ƣớc trƣớc đó) thành các lớp con tƣơng đƣơng nhỏ hơn gồm các nút
cảm biến có cùng giá trị thuộc t nh điều kiện.
+ Tìm các t p thuộc tính rút gọn: Đƣợc tính theo công thức CT 1.7. Việc
tìm tập thuộc tính rút gọn có nghĩa quyết định đối với vấn đề ứng dụng RST
để DF. Tối ƣu hóa các cột trong bảng thông tin là một ài toán hó, có độ
phức tạp hàm mũ của thuộc t nh điều kiện. Do vậy, tùy trƣờng hợp cụ thể để
chọn phƣơng pháp rút gọn phù hợp, tốt nhất. Thực tế, hông đòi hỏi tìm tất cả
các tập thuộc tính rút gọn mà chỉ cần tìm tập rút gọn tốt nhất theo một nghĩa
nào đó o ngƣời đề xuất phƣơng pháp rút gọn đó đề ra.
Để xác định độ "tốt nhất" này, cần phải định nghĩa đƣợc hai khái niệm:
"Tập rút gọn" và "Độ quan trọng của thuộc tính" của phƣơng pháp đó. Hiện
nay, hầu hết các nghiên cứu (quốc tế và Việt Nam) đã đƣa ra 5 cơ sở (phƣơng
pháp) để rút gọn thuộc t nh nhƣ sau 5 :
* Dựa trên miền ƣơng;
* S dụng các phép toán trong đại số quan hệ;
* S dụng ma trận phân biệt;
* S dụng các độ đo trong t nh toán hạt;
* S dụng entropy thông tin.
+ Tìm t p thuộc tính lõi: Áp dụng công thức CT 1.5, CT 1.6. Có thể có
nhiều hơn một tập rút gọn trong bảng thông tin. Tập thuộc tính lõi là tập hợp
-76-
các phần t giao nhau của các tập thuộc tính rút gọn. Thuộc tính lõi không thể
bỏ đƣợc đối với quá trình suy luận.
+ X c ịnh các lu t quyết ịnh: Theo công thức CT 1.11, CT 1.12.
+ X c ịnh ộ chắc chắn của lu t quyết ịnh: Theo công thức CT 1.13.
+ Cơ sở tri thức: Dựa vào các luật quyết định và độ chắc chắn của các
luật quyết định đó để lọc "kiến thức" thành "tri thức", hỗ trợ quyế
Các file đính kèm theo tài liệu này:
- luan_an_tong_hop_du_lieu_nham_tiet_kiem_nang_luong_trong_man.pdf