Luận án Tổng hợp dữ liệu nhằm tiết kiệm năng lượng trong mạng cảm biến không dây

MỤC LỤC.1

ANH MỤC C C THU T NG .4

ANH S CH ẢNG .5

ANH S CH H NH V .6

M ĐẦU .8

CHưƠNG 1. TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU . 14

1.1. MẠNG CẢM I N KH NG DÂY . 14

1.1.1. Lịch s phát triển. 14

1.1.2. Kiến trúc mạng cảm biến và một số cách ph n loại. 17

1.1.2.1. Kiến trúc . 17

1.1.2.2. Các thành phần chính của WSNs . 17

1.1.2.3. Một số cách phân loại mạng. 18

1.2. CÁC VẤN ĐỀ CẦN GIẢI QUY T. 20

1.2.1. Vấn đề tiêu thụ năng lượng . 20

1.2.2. Thiết ế no mạng cảm iến . 22

1.2.3. Tổ chức mạng và định tuyến. 22

1.2.4. Truyền và x l ữ liệu. 22

1.2.5. Tổng hợp dữ liệu . 23

1.2.6. X lý vấn đề ữ liệu ư thừa. 24

1.3. CÔNG CỤ MÔ PHỎNG MẠNG CẢM BI N . 25

1.3.1. Bộ mô phỏng NS-2. 25

1.3.2. NS-2 và phần mở rộng mô phỏng WSNs của MIT. 26

1.4. MÔ HÌNH TỔNG HỢP D LIỆU VÀ BÀI TOÁN THÀNH PHẦN . 26

1.4.1. Mô hình tổng hợp dữ liệu . 27

1.4.2. Theo dõi mục tiêu và lựa chọn dữ liệu . 28

1.4.2.1. Theo dõi mục tiêu dựa vào vị trí của nút . 29

1.4.2.2. Theo dõi mục tiêu dựa vào thời gian . 30

1.4.2.3. Lựa chọn dữ liệu và truyền đến CH . 33

1.4.3. Tổng hợp dữ liệu tại CH. 34

1.4.3.1. Định tuyến phân cụm thích ứng với năng lượng thấp . 34

1.4.3.2. Tổng hợp dữ liệu tại nút cụm trưởng . 36

1.5. LÝ THUY T T P THÔ. 38

1.5.1. Các khái niệm về lý thuyết tập thô được s dụng . 39

1.5.1.1. Hệ thống thông tin. 39

142 trang | Chia sẻ: honganh20 | Lượt xem: 489 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Luận án Tổng hợp dữ liệu nhằm tiết kiệm năng lượng trong mạng cảm biến không dây, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

hì việc đo lƣờng của nút bắt đầu diễn ra thực sự, giá trị đo lƣờng đó đƣợc ghi nhận để g i đến CH. Thông thƣờng, biểu diễn sự thay đổi của mục tiêu và của nút có thể hình dáng (hàm số) Thay đổi của mục tiêu Threshold Value Time f(x) Tbefore Tpoint Tmeasure Vbefore Vpoint Vmeasure ΔT ΔV Hình 2.8. Các mốc thời gian và trạng thái làm việc của nút -61- không hoàn toàn giống nhau bởi vì thực tế, thiết bị điện t khó có thể biểu diễn đƣợc hoàn toàn sự biến động của mục tiêu. Khi biến động của mục tiêu làm cho giá trị đo của nút ƣới ngƣỡng thì nút vẫn ở trạng thái hông đo lƣờng (là idle hoặc sleep). Giải pháp đề xuất s dụng giá trị ngƣỡng đo lƣờng (threshold) của nút, ký hiệu là δ và giả thiết là đã iết trƣớc. 2.2.2.4. Trạng thái ổn ịnh o lường Đo lƣờng mục tiêu của nút dựa trên việc điện t hóa các đại lƣợng không có tính chất điện thành các đại lƣợng có thể đo và x l đƣợc bằng tín hiệu điện t . Các kích thích của mục tiêu sẽ tác động đến bộ phận cảm nhận của nút, bộ phận này là linh kiện điện t vì vậy có độ trễ (response time) nhất định Δstart để có thể đạt trạng thái ổn định đo lường (steady state) nhƣ Hình 2.10. Hình 2.10. Mô hình chuyển trạng thái của nút cảm biến 2.2.2.5. Dự o n Giả s độ trễ đó là Δstart. Giải pháp ATTS- F hƣớng đến mối quan hệ giữa ΔT (thời gian đo th ch ứng) và Δstart . T nh th ch ứng (adaptive) của giải pháp này đạt l tƣởng hi ΔT = Δstart nghĩa là thời gian đo thích ứng vừa đúng với thời gian nút khởi động để đạt trạng thái ổn định đo lường. Các trƣờng hợp hác ΔT ≠ Δstart , đặt ΔAdap = | ΔT - Δstart |. Với δ là giá trị ngƣỡng đo lƣờng, hi đó f(Tmeasure)=Vmeasure = δ. Vấn đề cần giải quyết là ự đoán giá trị f(Tmeasure) sao cho trong hoảng ΔT thì f(t) tăng (theo giả thiết) và f(Tmeasure) ≥ δ đồng time Status of sensor (value) Δstart steady state Idle or sleep -62- thời ΔT = Δstart . Trạng thái thích ứng có nghĩa là nút hởi động và đạt trạng thái ổn ịnh o lường úng lúc mục tiêu biến ộng vư t ngưỡng o buộc nút phải đo lƣờng (xem Hình 2.11). Hình 2.11. Mô hình trạng thái thích ứng của giải pháp ATTS-DF Gọi Smovalue là độ mịn đo lƣờng của nút cảm iến, Smovalue = l có nghĩa là nút cảm iến có thể đo đƣợc l mức đo (V1, V2, . Vl) và V1 < V2 < .< Vl , l càng lớn thì hả năng đo lƣờng của nút cảm iến càng mịn (smooth). Gọi Smofreq là độ nhạy đo lƣờng hay tần số đo trong 1 gi y (s) của nút cảm iến ở trạng thái ổn định đo lƣờng, đặt Smofreq = k. Đặt m là số lần đo mục tiêu của nút cảm iến trong thời gian ΔT ơn vị tính là s), m = k * ΔT nghĩa là trong hoảng thời gian ΔT , f(t) có thể nhận m giá trị đo từ l giá trị có thể đo đƣợc của nút cảm iến. Gọi f(t)mi là giá trị f(t) tại lần đo thứ i trong khoảng thời gian ΔT . Th ụ Hình 2.8, m = 7, vì f(t) đơn điệu tăng trong hoảng ΔT , do vậy f(Tpoint) = f(t)m1 < f(t)m2 < f(t)m3 < .....< f(t)m7 = f(Tmeasure). Trƣờng hợp tổng quát có thể áp dụng xác suất xảy ra trƣờng hợp f(Tmeasure) ≥ δ. Gọi Prm(Vtt) là xác suất xuất hiện giá trị đo Vtt của lần đo thứ m, với Vtt  {V1,V2...Vl-1,Vl } hi đó f(t) = Vtt với xác suất đúng Prm(Vtt) và tổng ∑ ( ) . Nghĩa là tại lần đo thứ m, Vtt có thể nhận đƣợc 1 trong l giá trị Vtt  {V1,V2...Vl-1,Vl } với xác suất nhận các giá trị đó có thể khác nhau Δstart ΔT Time Time f(t) Threshold State of sensor -63- nhƣng luôn tồn tại xác suất lớn nhất để Vtt nhận một giá trị nào đó. Giá trị có xác suất lớn nhất có thể nhận đƣợc này gọi là giá trị dự đoán của tín hiệu đo và đƣợc s dụng trong quyết định đo lƣờng khi so sánh với δ (ngƣỡng). 2.2.3. T uật t á Đầu vào của thuật toán gồm: ngƣỡng đo lƣờng δ, theo yêu cầu của ứng dụng để chọn δ phù hợp; thời gian Δstart để nút có thể đạt trạng thái ổn định đo lƣờng; l mức giá trị có thể đo đƣợc của nút cảm biến; tần số đo k trong 1s của nút cảm iến; dạng/hàm số tín hiệu (giả thiết biết trƣớc). Dựa vào hàm tín hiệu và tần số đo để xác định số lƣợng phép đo trong khoảng thời gian nút khởi động. Giả thiết với mỗi phép đo có thể biết đƣợc xác suất nhận 1 trong l giá trị và luôn tồn tại giá trị có xác suất nhận đƣợc cao nhất (Giá trị này đƣợc so sánh với ngƣỡng và s dụng kết quả này để ra quyết định việc chuyển trạng thái của nút. Trƣờng hợp l tƣởng, thời gian đo th ch ứng vừa đúng với thời gian nút khởi động để đạt trạng thái ổn định đo lƣờng. Trong trƣờng hợp nút khởi động chậm hơn so với thời gian tín hiệu vƣợt ngƣỡng thì việc đo lƣờng sẽ trễ một khoảng thời gian. Giả mã thuật toán nhƣ sau: 1. Input δ, Δstart , l, k, f(t) 2. Xác định giá trị m = * Δstart 3. If f(Tpoint) là hàm đơn điệu tăng then 4. For i = 1..m do xác định f(ti) 5. For tt = 1 to l do xác định Pri (Vt t) Bảng 2.3. Phân bố xác suất trong m lần đo Lầ đ t ứ J G á tr đ c t đ được ∑ ( ) V1 V2 . Vl 1 Pr1(V1) Pr1(V2) . Pr1(Vl) 1 2 Pr2(V1) Pr2(V2) . Pr2(Vl) 1 . . . . . ..... m Prm(V1) Prm(V2) . Prm(Vl) 1 -64- 6. If Pri(Vt t) = Max {(Pri(Vt t)} then 7. f(ti) = Vt t # X l trƣờng hợp f(t) tăng, nút chuyển sang trạng thái "steady state" # Nếu thời gian thích ứng vừa đúng với thời gian nút khởi động 8. If (f(t1)< f(t2)<...< f(tm)) and f(tm) ≥ δ then 9. Chuyển trạng thái của nút sang "steady state" 10. If f(Tpoint) = f(t1) )< f(t1+i) and f(t1+i) ≥ δ then 11. Thời gian chờ = (Tpoint + Δstart - t1+i ) 12. Chuyển trạng thái của nút sang "steady state" 13. Return trạng thái của nút là "steady state" 14. End. Giải thích: D ng 1, nhập đầu vào là ngƣỡng δ, thời gian khởi động của nút (response time) Δstart , số mức đo l, tần số đo ; dòng 2, tính số lần đo m trong khoảng Δstart bởi công thức: m = k * Δstart; dòng 3, nếu tại điểm Tpoint , f(t) có xu hƣớng tăng thì khởi động hệ thống tính toán; Dòng 4, lặp để tính m giá trị f(t): f(t1), f(t2)... f(tm); dòng 5, lặp để tính xác suất f(ti) có thể nhận 1 trong l giá trị nút có thể đo đƣợc, nghĩa là f(ti) {V1,V2...Vl-1,Vl }; dòng 6, 7, gán f(ti) giá trị có xác suất xuất hiện lớn nhất. Thuật toán này, áp dụng đối với f(t) đơn điệu tăng và nút chuyển từ trạng thái idle (hoặc sleep) sang active ở chế độ đo steady state. Trong trƣờng hợp f(t) đơn điệu giảm thì thuật toán tƣơng tự. Dòng 8, nếu m giá trị đo của f(t) đồng biến và tại điểm tm , sensor kết thúc thời gian Δstart cho việc khởi động, nghĩa là ΔT = Δstart; dòng 9, sensor chuyển sang trạng thái hoạt động ổn định; dòng 10, nếu nút khởi động chậm hơn so với thời gian tín hiệu vƣợt ngƣỡng nghĩa là ΔT < Δstart tại ti bất kỳ i = 2..m; dòng 11 xác định thời gian chờ hay độ trễ đo lƣờng là khoảng (ti ... tm] đến hết thời gian Δstart; dòng 12, 13, nút chuyển trạng thái và trả về kết quả thuật toán là trạng thái của nút; kết thúc. Đối với trƣờng hợp x lý việc nút chuyển trạng thái từ active ở chế độ đo steady state về trạng thái idle (hoặc sleep), đ y là ài toán ngƣợc của giải pháp đã đề xuất trong trƣờng hợp f(t) đơn điệu giảm. -65- Vấn đề x lý dữ liệu trong trƣờng hợp trễ đo lƣờng khi thời gian khởi động của nút nhanh hơn thời gian để tín hiệu vƣợt ngƣỡng và khi nút khởi động chậm hơn hi đó nút cảm biến sẽ hông đo đƣợc dữ liệu trong khoảng (ti ... tm] là các vấn đề khoa học mà chúng tôi sẽ nghiên cứu giải quyết trong tƣơng lai. 2.2.4. M p ỏ v p tíc t quả Trên cơ sở các mã nguồn mô phỏng MIT đối với LEACH [30], thi hành trên phần mềm mô phỏng NS-2 phiên bản 2.34 cài đặt trên hệ điều hành U untu 12.04 để sinh ra các tệp vết về năng lƣợng, dữ liệu, khoảng cách... Tác giả luận án áp dụng giải pháp ATTS- F đối với bộ dữ liệu đã tạo lập để phân tích hiệu quả áp dụng so với LEACH. Bảng 2.4. Các tham số chính của mô phỏng Tham số Giá trị Số nút c m biến tham gia mô phỏng 100 Tọa ộ nút trong miền 100m x 100m Ngẫu nhiên Tọa ộ mục tiêu (tag) trong miền 100m x 100m Ngẫu nhiên Số cụm tối thiểu, tối a 1  10 Số cụm mong muốn (desired) 5 Năng lư ng pin khởi tạo của nút c m biến 2 J Năng lư ng nh n 1 bít 5 nJ Năng lư ng (sóng vô tuyến) ể gửi 1 bít 50 nJ Hệ số khuếch ại khi truyền sóng 10pJ/bit/m2 Công suất lúc chờ (Idle), lúc ngủ (Sleep) 0 W Tốc ộ truyền sóng 1 Mbps ch thước header (hdr_size) 25 Byte ch thước dữ liệu c m nh n (sig_size) 500 Byte Thời gian mỗi vòng (T)/data fusion (T) 10 s (option) Số nút trong cụm mỗi (n) Ngẫu nhiên Số mức o của nút c m biến (l) 100 Ngưỡng o δ) 26 (Option) Tần số o trong 1 giây (k) 6 Thời gian ạt trạng th i o steady state Δstart) 2s -66- Mô phỏng với giao thức truy cập mạng ở tầng MAC là CSMA/CA, các nút trong cụm truy cập đƣờng truyền theo giao thức TDMA. Ph n t ch đối với 100 nút cảm biến trong thời gian mô phỏng là 480 giây, thời gian thay đổi cấu hình theo vòng 10s, mỗi vòng có 3 đến 8 cụm, các nút trong cụm phân bố ngẫu nhiên, nghĩa là có hoảng 200 cấu hình mô phỏng. Hình 2.12 là số nút tham gia khảo sát của mỗi vòng T = 10s trong thời gian 420s. Trong thời gian mô phỏng, một số nút hết năng lƣợng (trạng thái "die") sẽ không tham gia mạng. Từ giây thứ 180, bắt đầu xuất hiện nút bị "die", số lƣợng nút "die" sẽ tăng hi thời gian s dụng éo ài là xu hƣớng tất yếu. Giá trị o ư c Time (x10s) threshold Giá trị o ư c đođooƣợcNum Time 100 sensor node Hình 2.13. Truyền ữ liệu của các nút cảm iến trong thời gian mô phỏng Hình 2.14. Đồ thị truyền ữ liệu của nút số 16 giải của LEACH Hình 2.12. Số nút cảm iến tham gia mô phỏng ATTS-DF Số nút còn hoạt động đođooƣợcNumber of Thời gian (t x10s) Số nút cảm bi n trong thời gian mô phỏng -67- Đối với thuật toán LEACH, nút cảm biến truyền dữ liệu đến CH theo chu kỳ T = 10s. Trong mỗi chu kỳ, mỗi nút sẽ thuộc 1 cụm, 2 nút thuộc 1 cụm trong chu kỳ này có thể không cùng thuộc 1 cụm trong 1 chu kỳ khác. Tuy vậy, có thể tính tổng t ch lũy số sig_size (500 Byte/sig_size) mà nút cảm biến đã truyền trong mỗi chu kỳ và trong cả giai đoạn mô phỏng. Hình 2.13 là diễn biến việc truyền dữ liệu của 100 nút trong thời gian 480s. Đối với mỗi nút, việc truyền nhận dữ liệu có thể đột biến tăng hoặc giảm. Tại các đỉnh của đồ thị có sự đột biến gói tin – đồng nghĩa với việc tại thời điểm đó mục tiêu có thay đổi vƣợt ngƣỡng, cần phải đo, có thể đặt ngƣỡng là số lƣợng các gói tin, đồng thời giả thiết số lƣợng (hay ung lƣợng) dữ liệu bằng nhau nếu chúng cùng có lƣợng thông tin nhƣ nhau, sự tăng các gói tin đồng nghĩa với việc tăng t nh cấp thiết phải đo lƣờng. Ví dụ, xét giá trị đo của nút số 16 trong thời gian mô phỏng 460s của LEACH và δ = 26 sig_size để áp dụng giải pháp ATTS-DF, đồ thị truyền dữ liệu ở Hình 2.14. Giả s xét thời điểm giây thứ 120 đến giây thứ 130, là khoảng thời gian tín hiệu đo của nút 16 có độ đo vƣợt ngƣỡng δ. Tại giây thứ 120, dữ liệu đo có xu hƣớng tăng. Với k = 6 (có thể đo 6 lần trong 1 giây), trong khoảng dữ liệu tăng từ 19 đến δ = 26, số lần có thể đo đƣợc là 7s * 6 = 42 lần và m = 2*k = 12 lần. Hình 2.15. Hiệu quả việc giảm ữ liệu truyền của ATTS- F so với LEACH -68- Áp dụng với 2 trƣờng hợp: thứ nhất, ΔT = Δstart = 2s tức là nút sẽ mất 2s để khởi động và mục tiêu cũng sẽ mất 2s (tính từ điểm đo iến động) để vƣợt ngƣỡng; thứ hai, Δstart > ΔT (ví dụ ΔT = 1s) nghĩa là thời gian nút khởi động để đạt trạng thái steady state l u hơn thời gian tín hiệu đo vƣợt ngƣỡng (ví dụ là 1s). Tƣơng tự xét 2 trƣờng hợp trên đối với khoảng 180s-190s và 400s-410s. Hình 2.15 cho thấy hiệu quả đối với nút thứ 16 trong 02 trƣờng hợp trên ở chỗ giải pháp này nút sẽ hông hao ph năng lƣợng để phát tín hiệu trong thời gian Δstart (Hình 2.15a) hoặc thời gian Δstart – ΔT (Hình 2.15b) so với việc thu phát liên tục theo chu kỳ của LEACH trong cùng khoảng thời gian xem xét. Kết quả mô phỏng cho thấy, với δ = 26, thuật toán ATTS-DF có thể áp dụng đƣợc ở một số nút có giá trị đo lƣờng vƣợt ngƣỡng. Việc giảm δ có thể tăng số lƣợng nút tham gia thuật toán ATTS-DF. Ví dụ, khảo sát đối với 100 nút trong thời gian 480s với 48 vòng (số nút "sống" để tham gia quá trình khảo sát ở Hình 2.12), δ = 26 khi áp dụng thuật toán ATTS-DF sẽ có 55 nút áp dụng với số lƣợng 1 lần, 14 nút áp dụng 2 lần, 3 nút áp dụng 3 lần. Hình 2.16. So sánh mức tiêu thụ năng lƣợng của các nút giữa ATTS-DF và LEACH Hiệu quả tiết kiệm năng lƣợng đối với 55 nút ở trên khi áp dụng ATTS- DF và việc s dụng năng lƣợng của các nút đó hi áp ụng LEACH, kết quả cho thấy: ATTS-DF tiết kiệm đƣợc từ 13,3% đến 20% năng lƣợng của nút dsfdNă ượng tiêu thụ của các nút trong thời gian mô phỏng -69- tƣơng ứng khi áp dụng LEACH. Biểu đồ tiêu thụ năng lƣợng của các nút áp dụng thuật toán ATTS-DF và LEACH ở Hình 2.16. 2.2.5. K t uậ về ả p áp ATTS-DF Giải pháp ATTS- F đề xuất đƣợc một phƣơng pháp th o i mục tiêu th o thời gian, th ch nghi với iến động của mục tiêu; đề xuất đƣợc hái niệm: Điểm đo iến động, trạng thái ổn định đo lƣờng, thời gian đo th ch ứng và phƣơng pháp ự đoán giá trị đo mục tiêu th o xác suất (đã iết trƣớc). Hiệu quả của ATTS-DF so với LEACH gồm: thứ nhất, đo lƣờng mục tiêu hông th o chu ỳ cố định mà có điều chỉnh th o mục tiêu đã hạn chế đƣợc ung lƣợng dữ liệu đo lƣờng giống nhau và tiết kiệm đƣợc năng lƣợng do không g i dữ liệu ƣ thừa (vì có cùng thông tin) này đến CH, BS; thứ hai, đề xuất việc chuyển trạng thái đo lƣờng của nút cảm iến từ idle (hoặc sleep) sang active đúng vào thời điểm nút cảm biến có thể đo lƣờng ở trạng thái bình thƣờng, điều này đã hạn chế tối đa thời gian nút cảm biến đƣợc bật khi chƣa đạt trạng thái đo đƣợc tốt nhất g y tổn hao năng lƣợng vô ch. Giải thuật của ATTS-DF gồm các phép đơn giản, phù hợp với khả năng tính toán của nút cảm biến nên chỉ độ phức tạp tuyến tính O(n). Ngoài ra, giải pháp có xu hƣớng tối ƣu hóa về độ trễ và đảm bảo độ hội tụ về thời gian (đáp ứng đo lƣờng càng nhanh càng tốt). Kết quả nghiên cứu này đã đƣợc công bố với Công trình số 7: "ATTS- DF: Adaptive tracking solution to the target for data fusion in wireless sensor networks”, Hội nghị ICSSE 2017 tại Thành phố Hồ Chí Minh, Việt Nam, tháng 7 năm 2017; đƣợc lựa chọn vào cơ sở dữ liệu Scopus, IEEE Xplore. Trong tƣơng lai, có thể nghiên cứu thêm mối quan hệ giữa năng lƣợng của nút, giá trị đo lƣờng và ngƣỡng δ, tình huống mục tiêu thay đổi đột ngột dẫn đến kết quả đo vƣợt ngƣỡng trƣớc lúc nút đạt trạng thái ổn định. -70- C ươ 3. TI T KIỆM NĂNG LƯỢNG CỤM NÚT CẢM BI N BẰNG ỨNG DỤNG L THUY T TẬP THÔ L ý thuyết tập thô - RST (Rough Set Theory) đƣợc Z zisaw Pawla đề xuất năm 1982 [64] là công cụ toán học hữu hiệu có thể phân tích dữ liệu mơ hồ hoặc không chắc chắn để hỗ trợ quyết định bằng cách có thể bỏ qua sự hông ch nh xác đó ở mức độ chấp nhận đƣợc. Các ứng dụng bởi lý thuyết tập thô chủ yếu dựa trên việc phân bổ dữ liệu bằng cách xấp xỉ giới hạn trên và giới hạn ƣới. an đầu, lý thuyết tập thô chủ yếu đƣợc s dụng trong quá trình khai phá dữ liệu, bao gồm tiền x lý số liệu, x lý số liệu. Đầu vào cho việc ứng dụng RST là mạng cảm biến đƣợc hệ thống hóa thông tin thành một bảng, mỗi hàng là một đối tƣợng, mỗi cột là một thuộc tính. Tùy theo yêu cầu đầu ra cho mỗi loại ứng dụng để lựa chọn giải pháp phù hợp, hƣớng đến việc cân bằng giữa độ phức tạp phƣơng pháp đó và khả năng x lý của nút cảm biến, tài nguyên của mạng. Nhƣ ph n t ch ở Mục 1.5, hƣớng nghiên cứu ứng dụng RST để tổng hợp dữ liệu chủ yếu kết hợp với trí tuệ nhân tạo (nhƣ mạng nơ-ron) để huấn luyện dữ liệu một bộ dữ liệu đầu vào th o tiêu ch ƣới dạng quy tắc/luật nào đó của phƣơng pháp đề xuất 82, 84, 85, 96, 97, 99 . Hƣớng nghiên cứu tiền x lý dữ liệu cũng ết hợp với mạng nơ-ron để xác định và x lý lỗi [83, 86, 87]. Các đề xuất nêu trên phần lớn phù hợp với các ứng dụng đặc thù với số lƣợng ít nút cảm biến cũng nhƣ năng lƣợng dự trữ của nút khá lớn để đáp ứng nhu cầu t nh toán độ phức tạp lớn. Thực tế, các đề xuất nêu trên hông đánh giá độ phức tạp tính toán của giải pháp đã đề xuất. Chƣơng 3, nội dung luận án th o hai hƣớng nghiên cứu nêu trên nhƣng tiếp cận theo chiều thuận, tối ƣu hóa độ phức tạp tính toán bằng cách s dụng tối đa các phép t nh toán cổ điển của RST. an đầu, mạng cảm biến -71- đƣợc hệ thống hóa thành bảng thông tin có số hàng là số nút cảm biến, số cột là các thuộc t nh điều kiện theo thực tế của mạng và yêu cầu của ứng dụng. Quy trình ứng dụng RTS để tổng hợp dữ liệu với đầu ra là tập luật để CH đƣa ra quyết định về dữ liệu đƣợc trình bày ở Mục 3.1. Quy trình ứng dụng RST để tiền x lý dữ liệu thô mà nút trong cụm thu đƣợc để tạo bộ dữ liệu đầu vào CH thực hiện tổng hợp, nội ung này đƣợc trình bày ở Mục 3.2. 3.1. Ứ ụ L t u t tập t tạ CH đ t ợp u Sự phù h p ể chọn RST làm gi i pháp tổng h p dữ liệu nhiều c m biến thể hiện ở những quan iểm sau:  Tính chất rời rạc và liên tục của dữ liệu đo lƣờng của nút cảm biến: Giao thức IEEE 802.15.4 khi áp dụng cho mạng WSN sẽ điều khiển việc lấy dữ liệu theo chu kỳ thức-ngủ (active-sleep) nên dữ liệu CH thu đƣợc từ nút cảm biến sẽ rời rạc. Khi nút cảm biến ở trạng thái thức (active), dữ liệu đo là liên tục (nằm trong khoảng giá trị đo của nhà sản xuất), việc x lý và truyền dữ liệu đó đến nút cảm biến tiếp theo trên tuyến thì dữ liệu đó là liên tục.  Hỗ trợ để x lý mô tả không chắc chắn: Khi sensor cảm nhận về đối tƣợng, tín hiệu có thể bị nhiễu dẫn đến tính đúng đắn của dữ liệu truyền đi hông đƣợc bảo toàn. Dựa trên dữ liệu thuộc tính, CH có thể xác định lại sự đúng đắn của dữ liệu cảm nhận bằng cách loại bỏ thông tin nhiễu, giữ lại thông tin hữu ích, ít bị nhiễu phục vụ tổng hợp dữ liệu.  Hỗ trợ x lý vấn đề mất dữ liệu: Dữ liệu thu thập đƣợc từ các nút cảm biến khi truyền đến CH có thể hông đầy đủ, nghĩa là CH không nhận đủ dữ liệu từ một hoặc nhiều nút trong nhóm để làm dữ kiện cho quá trình DF. Tình huống để mất dữ liệu có thể là: Lúc cần cảm nhận thì nút cảm biến đang trạng thái ngủ, lúc đang truyền dữ liệu đến CH thì nút cảm biến hết năng lƣợng, đang truyền thì đến chu kỳ ngủ của nút cảm biến, gói tin bị lỗi -72-  Hỗ trợ để x lý vấn đề ƣ thừa dữ liệu: Đ y là một vấn đề rất quan trọng trong bài toán tổng hợp dữ liệu. Khi các nút cảm biến cùng cảm nhận về một đối tƣợng và cùng truyền một loại thông tin đó trực tiếp đến BS hoặc qua nút cảm biến trung gian (là CH nếu mạng có phân cụm) để truyền đến BS thì việc loại bỏ các dữ liệu ƣ thừa này là điều rất cần thiết.  RST hỗ trợ tổng hợp dữ liệu đƣợc ch nh xác hơn thông qua ngữ nghĩa, "tri thức" của thông tin chứ không thông qua x lý trực tiếp toàn bộ dữ liệu "kiến thức" của thông tin. Trên thực thế, rất hó để có thể tổng hợp đƣợc dữ liệu đúng tuyệt đối (100%) với tình huống diễn ra ở thực địa o đặc tính phần cứng của s nsor hó định lƣợng chính xác giá trị của đại lƣợng đặc trƣng cho sự kiện cần giám sát. o đó, đôi hi phải t nh định lƣợng thông qua ngữ nghĩa của dữ liệu thay vì định lƣợng giá trị đo của từng loại tham số cụ thể. Tóm lại, s dụng tổng hợp dữ liệu để tăng độ chính xác của kết luận đồng thời đạt hiệu quả về năng lƣợng. Thực tế trong điều kiện l tƣởng, chỉ cần một nút cảm biến là đủ để có kết luận chính xác nhất, tuy nhiên điều này bị ràng buộc bởi các công nghệ phần cứng, t nh năng đƣợc tích hợp vào nút cảm biến của nhà sản xuất. Tổng hợp dữ liệu có nghĩa trong trƣờng hợp muốn tăng độ ch nh xác hơn hi suy đoán hông chắc chắn và ứng dụng RST trong vấn đề tổng hợp dữ liệu của WSNs là một lựa chọn phù hợp. 3.1.1. M tả t á DF ều út cả Các nút cảm biến (S0, S1,... S7) theo dõi sự kiện diễn ra ở mục tiêu (target) và truyền dữ liệu cảm nhận sự kiện đó đến một nút cụm trƣởng - CH có trách nhiệm DF. Nút CH áp dụng thuật toán tiền x lý (data preprocessing) để giao tiếp, tách các thuộc tính của dữ liệu (feature extraction), sau đó áp ụng RST để tổng hợp dữ liệu (data fusion) và quyết định. Nhƣ vậy, đầu vào của CH là dữ liệu cảm biến về mục tiêu và thông tin của các nút cảm biến trong nhóm; -73- đầu ra là quyết định lựa chọn nút cảm biến và nội dung dữ liệu cảm biến để truyền tiếp. ài toán đƣợc mô tả ở Hình 3.1. 3.1.2. Qu tr ứ ụ RST đ t ợp u Với WSNs, nhiều lớp ài toán đã đƣợc đặt ra nhƣ: điều khiển chu kỳ cảm nhận dữ liệu, lấy mẫu cảm biến, phân nhóm, chọn nút cụm trƣởng, định tuyến, tổng hợp... Không mất tính tổng quát có thể giả s những ài toán đó đã đƣợc giải quyết. Riêng bài toán tổng hợp dữ liệu, mục tiêu chính chỉ tập trung vào vấn đề (điều khiển) tính toán trên nút CH. Nhƣ vậy, ứng dụng lý thuyết tập thô để tổng hợp dữ liệu nhiều cảm biến sẽ đƣợc thực hiện ở Lớp 3. Hình 3.1. Mô tả bài toán tổng hợp ữ liệu có s dụng RST. Đề xuất quy trình ứng dụng RST để tổng hợp dữ liệu nhƣ sau: ƣớc 1: Tiền x lý, tách thuộc tính từng nút cảm biến (của dữ liệu cảm nhận và của nút cảm biến), giả s đƣợc m thuộc tính; ƣớc 2: Lập bảng, nếu có n nút cảm biến thì bảng sẽ có n hàng, (m + 1) cột; ƣớc 3: Tìm lớp con tƣơng đƣơng th o giá trị thuộc tính quyết định; ƣớc 4: Tìm tập các lớp con tƣơng đƣơng của các tập con thuộc t nh điều kiện; ƣớc 5: Tìm tập các tập thuộc tính rút gọn; Multi - Sensor Target (mục tiêu) Tiền x lý Tách thuộc tính CH Tổng hợp dữ liệu Quyết định S1 S2 S3 S4 S5 S6 S7 S0 Công đoạn ứng dụng RST để tổng hợp dữ liệu nhiều cảm biến tại nút CH Lớp 2 Lớp 1 Lớp 3 -74- ƣớc 6: Tìm tập thuộc tính lõi; ƣớc 7: Xác định các luật quyết định, độ chắc chắn của mỗi luật để làm cơ sở tri thức; ƣớc 8: Quyết định. Đề xuất mô hình xử lý dữ liệu tại CH nhƣ sau (x m Hình 3.2): Hình 3.2. Mô hình x lý, tổng hợp dữ liệu tại nút CH Giải thích: + Tiếp nh n dữ liệu c m biến: Nút CH nhận dữ liệu cảm biến của tất cả các nút trong cụm g i về. + Tách thuộc tính từng nút c m biến: Tín hiệu cảm nhận và thông tin về nút sẽ đƣợc lƣợng hóa thành các mức giá trị. Các thuộc tính này phù hợp với mục đ ch, phƣơng pháp đề xuất của từng ài toán và đƣợc định nghĩa trƣớc. + Ghi dữ liệu thuộc tính vào b ng: Nếu nhóm có n nút cảm biến, dữ liệu mỗi nút cảm biến có m thuộc t nh điều kiện thì bảng thông tin (hay hệ quyết định) này có dạng ma trận ch thƣớc n hàng, (m+1) cột (vì thêm 1 cột thuộc tính quyết định), lập bảng theo công thức CT 1.2. Thuộc tính quyết định sẽ đƣợc định nghĩa trƣớc theo thuộc t nh điều kiện. + Tìm lớp con tương ương: Áp dụng công thức CT 1.3 để phân hoạch bảng thông tin thành các lớp con tƣơng đƣơng (của m thuộc tính) theo giá trị Tiếp nhận tất cả dữ liệu cảm biến Tách thuộc tính từng sensor Tìm lớp con tƣơng đƣơng. Ghi dữ liệu thuộc tính vào bảng. Tìm tập các lớp con tƣơng đƣơng của các tập con thuộc t nh điều kiện Tìm các tập thuộc tính rút gọn. Tìm tập thuộc tính lõi Xác định các luật quyết định Độ chắc chắn của luật quyết định Cơ sở tri thức Quyết định Dữ liệu các Sensor g i về nút CH Nút CH -75- của thuộc tính quyết định. Với bài toán tổng hợp dữ liệu, giá trị thuộc tính quyết định có thể là "Có"/"Không" (nếu nút cảm biến đó đƣợc/ hông đƣợc CH chọn để tổng hợp). Tập con tƣơng đƣơng với thuộc tính quyết định giá trị "Có" sẽ đƣợc s dụng làm đầu vào cho việc áp dụng RST. + Tìm t p các lớp con tương ương của các t p con thuộc t nh iều kiện: S dụng công thức CT 1.3 để tiếp tục phân hoạch các lớp con tƣơng đƣơng (đã có ở ƣớc trƣớc đó) thành các lớp con tƣơng đƣơng nhỏ hơn gồm các nút cảm biến có cùng giá trị thuộc t nh điều kiện. + Tìm các t p thuộc tính rút gọn: Đƣợc tính theo công thức CT 1.7. Việc tìm tập thuộc tính rút gọn có nghĩa quyết định đối với vấn đề ứng dụng RST để DF. Tối ƣu hóa các cột trong bảng thông tin là một ài toán hó, có độ phức tạp hàm mũ của thuộc t nh điều kiện. Do vậy, tùy trƣờng hợp cụ thể để chọn phƣơng pháp rút gọn phù hợp, tốt nhất. Thực tế, hông đòi hỏi tìm tất cả các tập thuộc tính rút gọn mà chỉ cần tìm tập rút gọn tốt nhất theo một nghĩa nào đó o ngƣời đề xuất phƣơng pháp rút gọn đó đề ra. Để xác định độ "tốt nhất" này, cần phải định nghĩa đƣợc hai khái niệm: "Tập rút gọn" và "Độ quan trọng của thuộc tính" của phƣơng pháp đó. Hiện nay, hầu hết các nghiên cứu (quốc tế và Việt Nam) đã đƣa ra 5 cơ sở (phƣơng pháp) để rút gọn thuộc t nh nhƣ sau 5 : * Dựa trên miền ƣơng; * S dụng các phép toán trong đại số quan hệ; * S dụng ma trận phân biệt; * S dụng các độ đo trong t nh toán hạt; * S dụng entropy thông tin. + Tìm t p thuộc tính lõi: Áp dụng công thức CT 1.5, CT 1.6. Có thể có nhiều hơn một tập rút gọn trong bảng thông tin. Tập thuộc tính lõi là tập hợp -76- các phần t giao nhau của các tập thuộc tính rút gọn. Thuộc tính lõi không thể bỏ đƣợc đối với quá trình suy luận. + X c ịnh các lu t quyết ịnh: Theo công thức CT 1.11, CT 1.12. + X c ịnh ộ chắc chắn của lu t quyết ịnh: Theo công thức CT 1.13. + Cơ sở tri thức: Dựa vào các luật quyết định và độ chắc chắn của các luật quyết định đó để lọc "kiến thức" thành "tri thức", hỗ trợ quyế

Các file đính kèm theo tài liệu này:

luan_an_tong_hop_du_lieu_nham_tiet_kiem_nang_luong_trong_man.pdf