MỤC LỤC
LỜI CẢM ƠN . i
TÓM TẮT . ii
ABSTRACT . . . iii
MỤC LỤC . iv
BẢNG CÁC KÝ HIỆU VIẾT TẮT . vi
DANH MỤC HÌNH VẼ. vii
DANH MỤC BẢNG BIỂU . viii
Chương 1. Đặt vấn đề . . 2
1.1 Lý do chọn đề tài . 2
1.2 Phạm vi nghiên cứu và hướng tiếp cận . 4
1.2.1 Nhận diện đối tượng trong ảnh số thu được từ camera . 5
1.2.2 Điều khiển các thiết bị trong gia đình từ máy tính . 5
1.3 Nội dung và cấu trúc khóa luận . . 6
Chương 2. Các cơ sở lý thuyết. . 7
2.1 Tính toán khắp nơi và các ứng dụng . . 7
2.1.1 “Tính toán khắp nơi” là gì? . . . 7
2.1.2 Vị trí của “Tính toán kh ắp nơi” . . 7
2.2 Tổng quan về nhà thông minh . 8
2.2.1 Định nghĩa nhà thông minh . . . 8
2.2.2 Các ưu điểm của nhà thông minh. 8
2.3 Một số khái niệm trong xử lý ảnh và bài toán nhận diện đối tượng trong ảnh 9
2.3.1 Không gian màu HSV . 9
2.3.2 Các cách tiếp cận bài toán nhận diện đối tượng trong ảnh. 15
2.4 Các giao thức và mô hình kết nối. 16
2.4.1 Giao thức Bluetooth . 16
2.4.2 Giao thức wireless chuẩn B/G . 17
Chương 3. Mô hình hệ thống giám sát và điều khiển nhà thông minh . 21
3.1 Bài toán và mô hình chung của hệ thống . . 21
3.1.1 Hệ thống giám sát và điều khiển nhà thông minh. . 21
3.1.2 Mô hình đề xuất . 21
3.2 Các thành phần của hệ thống và các giải pháp . 22
3.2.1 Bài toán nhận diện đối tượng trong ảnh số . 22
3.2.2 Kết nối và tương tác với PPC . 28
3.2.3 Điều khiển các thiết bị điện điện tử từ máy tính . 31
Chương 4. Thực nghiệm và chương trình demo . 32
4.1 Cấu trúc của chương trình demo . . . 32
4.2 Các thành phần chính và thực nghiệm trong chương trình demo . 33
4.2.1 Mô đun nhận và xử lý ảnh từ camera . 33
4.2.2 Mô đun kết nối và tương tác với PPC . 38
4.2.3 Mô đun điều khiển các thiết bị điện, điện tử từ máy tính . 38
4.3 Một số hình ảnh và mô tả về chương trình demo . . 39
4.4 Kết quả và đánh giá . . . 44
Chương 5. Kết luận và hướng phát triển . 45
5.1 Kết luận . . 45
5.2 Hướng phát triển của đề tài . 45
TÀI LIỆU THAM KHẢO. 47
58 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2030 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Khóa luận Xây dựng hệ thống giám sát và điều khiển nhà thông minh: nhận diện và điều khiển trạng thái vật thể qua IP camera, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
gian. Ý
tưởng của công nghệ này khẳng định tính toán sẽ trở nên một công cụ hết sức tự nhiên,
mạnh mẽ và có ích với tất cả những ai sử dụng nó.
2.1.2 Vị trí của “Tính toán khắp nơi”
Với ý nghĩa và tiềm năng to lớn của nó, tính toán khắp nơi đang được nghiên cứu
và phát triển cùng với rất nhiều những lĩnh vực của công nghệ thông tin như tính toán
phân tán (distributed computing), tính toán di động (mobile computing), tương tác
người máy (human-computer interaction), trí tuệ nhân tạo (artifacial intelligence).
Nhận diện và điều khiển trạng thái vật thể qua IP camera
8
2.2 Tổng quan về nhà thông minh
2.2.1 Định nghĩa nhà thông minh
Nhà thông minh (tiếng Anh: smart-home hoặc intelli-home, home automation) là
kiểu nhà được lắp đặt các thiết bị điện, điện tử có tác dụng tự động hoá hoàn toàn hoặc
bán tự động, nó thay thế con người trong việc thực hiện một số thao tác quản lý, điều
khiển…
Trong căn nhà thông minh, đồ dùng trong nhà như các thiết bị phòng ngủ, phòng
khách đến toilet đều gắn các bộ điều khiển điện tử có thể kết nối với internet và điện
thoại di động, cho phép chủ nhân điều khiển từ xa hoặc lập trình cho chúng hoạt động
theo lịch. Thêm vào đó, các đồ gia dụng có thể hiểu được ngôn ngữ của nhau và có
khả năng tương tác với nhau… (Wikipedia [8]).
Một ngôi nhà thông minh đầy đủ, thường bao gồm các tính năng:
Phân phối đa phương tiện, là một rạp hát gia đình.
Điều khiển việc chiếu sáng, mành, rèm.
Giám sát, điều khiển môi trưởng (nhiệt độ, độ ẩm…).
Có khả năng liên lạc giữa các phòng.
Giám sát, điều khiển camera an ninh.
Giám sát và điều khiển từ xa.
2.2.2 Các ưu điểm của nhà thông minh
Nhà thông minh sử dụng các thiết bị và công nghệ tự động hóa, thông minh hóa,
giúp cho con người nhàn hạ hơn trong sinh hoạt hằng ngày. Nói cách khác, đây là hệ
thống giúp chủ nhân tận hưởng sự tiện nghi của cuộc sống và dễ dàng quản lý tổng
quát đối với cả tòa nhà. Chỉ với một chiếc điều khiển từ xa, chúng ta có thể điều khiển
tất cả, dù đang ở bất kỳ nơi nào. Chúng ta có thể tưởng tượng ra hiệu quả mà nhà
thông minh mang lại thông qua những hoạt động rất gần gũi, chẳng hạn như nằm trên
giường để mở cổng; sẽ không còn chuyện bị ngã do không nhìn thấy đường bởi đèn
cầu thang sẽ tự sáng lên khi có người; hệ thống đèn trong phòng, bếp, bình nước
nóng... sẽ hoạt động đúng giờ đã định; toàn bộ hệ thống đèn sẽ tự tắt sau khi không
Xây dựng hệ thống giám sát và điều khiển nhà thông minh
9
cần thiết; khống chế nhiệt độ chênh lệch giữa bên ngoài và trong nhà và còn rất nhiều
tiện ích khác.
Không chỉ điều khiển được trong phạm vi ngôi nhà, công nghệ này còn cho phép
tích hợp điều khiển qua điện thoại (cố định hoặc di động), internet hay PDA. Vì vậy,
mọi sinh hoạt có thể được kiểm soát dù chúng ta đang ở công sở hay ngoài đường...
Không chỉ riêng các ngôi nhà nhỏ, chúng ta hoàn toàn có thể thông minh hóa bất kỳ
một không gian sống nào, kể cả trụ sở văn phòng, siêu thị, trung tâm thương mại,
khách sạn, nhà hàng, nhà xưởng sản xuất, ngân hàng, bệnh viện hay các khu phức hợp
khác... nếu lựa chọn công nghệ phù hợp.
2.3 Một số khái niệm trong xử lý ảnh và bài toán nhận diện đối tượng
trong ảnh
2.3.1 Không gian màu HSV
Màu sắc là một phần rất quan trọng các công nghệ xử lý ảnh. Để biểu diễn màu
sắc trên máy tính cũng có rất nhiều dạng khác nhau tùy thuộc theo yêu cầu cần sử
dụng. Phần này sẽ giới thiệu sơ bộ về không gian màu cơ bản RGB và không gian màu
HSV [9].
2.3.1.1 Không gian màu RGB
Do cấu tạo của các thiết bị phần cứng nên các điểm ảnh thường được đặc trưng
bởi ba thành phần màu cơ bản đó là Red, Green và Blue. Một thành phần thường được
định nghĩa bới 1 byte(tức là có 256 giá trị từ 0 đến 255). Sự kết hợp của 3 thành phần
này sẽ cho ta màu sắc của 1 điểm ảnh bất kì.
Ví dụ: R=G=255, B=0 ta có màu vàng.
R=G=B=0 ta có màu đen.
R=G=B=255 ta có mày trắng.
2.3.1.2 Không gian màu HSV
Hue (H): độ đo màu được tổng hợp từ 3 thành phần màu Đỏ(Red), Xanh lam
(blue), xanh lá cây (Green) của một điểm ảnh.
Saturation (S): chỉ độ xám của điểm ảnh. VD: Cùng là một màu nhưng có màu
xám và có màu trong.
Value (V): Chỉ độ sáng của điểm ảnh.
Nhận diện và điều khiển trạng thái vật thể qua IP camera
10
Mối quan hệ giữa hệ màu RGB và hệ màu HSV:
Giả sử ta cần một dải màu biểu diễn độ xám (grayscale), đơn giản ta sẽ có 1
chuỗi điểm liên tục mà tại mỗi điểm các chỉ sổ R = G= B và tăng dần từ 0->255: ta sẽ
có một dải từ đen-> trắng (như hình 2.1).
Hình 2.1: Dải mầu xám
Nếu coi hệ màu RGB tương đương với 1 hệ trục tọa độ đề các (R=x, G=y, B=z)
thì có thể thấy Graysclale chính là 1 đường thẳng nối 1 điểm (0,0,0) với (255, 255,
255). Ta sẽ coi đây là một tia tạm gọi là tia phân giác.
Hình 2.2: Hệ trục tọa độ Đề Các với các hệ mầu RGB
Độ sáng: Độ sáng của một điểm ảnh được tính theo tổng giá trị của 3 thành phần
màu RGB, theo đó một điểm ảnh có chỉ số R+G+B lớn hơn thì sẽ sáng hơn. Để ý thấy
phương trình x+y+z =V chính là phương trình của một mặt phẳng(xem hình 2.3).
Xây dựng hệ thống giám sát và điều khiển nhà thông minh
11
Hình 2.3: Mặt phẳng màu ứng với một độ sáng
Nếu di chuyển các mặt phẳng dọc từ (0,0,0) đến (255,255,255) chỉ có độ sáng
của điểm ảnh thay đổi còn các thành phần màu không đổi: đỏ vẫn đỏ, xanh vẫn xanh...
(xem hình 2.4).
Hình 2.4: Sự thay đổi độ sáng theo tia phân giác
Chính vì vậy, ta sẽ định nghĩa tia phân giác chính là độ đo độ sáng V (Value)
trong hệ màu HSV của điểm ảnh. Giá trị tứ 0 đến 1.
Xét một mặt phẳng ta sẽ thấy, các điểm có độ sáng như nhau. Điểm màu xám sẽ
là điểm chính giữa nơi mặt phẳng này cắt tia phân giác. (hình 2.5)
Nhận diện và điều khiển trạng thái vật thể qua IP camera
12
Hình 2.5: Mặt phẳng phân bố màu
Nếu vẽ một vành màu với tâm là điểm màu xám nằm trên tia phân giác ta sẽ thấy
sự khác nhau giữa các màu sắc sẽ được đánh giá theo phần mà nó nằm trên khuyên
tròn. Nếu quy ước là Red ứng với 0 độ, Green 120 độ, và Blue là 240 độ. Với quy ước
này ta sẽ có màu đỏ ứng với 0 độ, vàng ứng với góc 60 độ, màu cam sẽ ở khoảng góc
30 độ. Giá trị này sẽ ứng với độ đo màu sắc H (Hue)trong hệ màu HSV.
Thành phần còn lại của hệ màu HSV là S (Saturation), độ đo độ xám của điểm
ảnh.
Xây dựng hệ thống giám sát và điều khiển nhà thông minh
13
Hình 2.6: Phân bố độ xám
Từ hình vẽ (hình 2.6) ta thấy khoảng cách từ điểm xám (tâm) tới điểm đỏ nhất
(pure red) sẽ quyết định độ xám của điểm ảnh.
Ví dụ: Nếu muốn mô tả một điểm có màu sắc nằm giữa màu đỏ và màu xám
(H=0), và có cũng độ sáng là V trong hệ tọa độ đề các ứng với hệ màu RGB ở trên thì
ta sẽ có:
Điểm đỏ nhất (pure red) là (V, 0, 0)
Điểm màu xám với cùng độ sáng sẽ là (V/3, V/3, V/3)
Điểm nửa đỏ nửa xám sẽ là (V*2/3, V/6, V/6)
Nhận diện và điều khiển trạng thái vật thể qua IP camera
14
Hình 2.7: Mô tả độ xám
Dễ thấy tất cả các điểm “nửa đỏ nửa xám” sẽ cùng nằm trên một đường thẳng có
PT tham số x=V*2/3, y=V/6, z = V/6.
Do đó, ta có thể định nghĩa độ xám của một điểm chính là tỉ khoảng cách giữa
điểm đó tới điểm xám(gray) so với khoảng cách giữa điểm đó tới điểm trong nhất
(pure).
Tổng kết: Tóm lại ta có thể thay thể hệ màu RGB với bằng một hệ màu mới với
hệ tọa độ là một hình nón. Các màu sắc theo đó sẽ được mô tả như sau:
Độ sáng: V trong khoảng 0(đen)-100(trắng)
Độ xám hay độ sắc nét của màu: S với 0 là xám
Màu sắc: được xác định thông qua góc H (0 ứng với màu đỏ, 60 với vàng,
120 xanh lá, 240 xanh lam...)
Xây dựng hệ thống giám sát và điều khiển nhà thông minh
15
Hình 2.8: Hệ màu HSV
2.3.2 Các cách tiếp cận bài toán nhận diện đối tượng trong ảnh
Đã có rất nhiều những nhà nghiên cứu, tổ chức quan tâm nghiên cứu và đưa ra
các cách tiếp cận khác nhau để giải quyết bài toán này. Trong đó có một vài cách tiếp
cận phổ biến như: thu thập một lượng dữ liệu về hình ảnh lớn chứ đối tượng và thực
hiện việc huấn luyện thông qua học máy. Ví dụ nghiên cứu của: H. Schneiderman và
T. Kanade. A Statistical Method for 3D object detection applied to faces and cars. In
Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,
năm 2000 [4]; hay H. Rowley, S. Baluja, T. Kanade. Rotation Invariant Neural
Network-Based Face Detection. In Proceedings of the IEEE Conference on Computer
Vision and Pattern Recognition, 1998 [3]...) Tuy nhiên cách này đòi hỏi việc phải thu
thập một lượng lớn dữ liệu thực tế của một đối tượng, điều này là thực sự khó khăn
nếu ta tiến hành trên một nhóm các loại đối tượng khác nhau. Hơn nữa việc đưa ra
những phương pháp học máy cũng đòi hỏi không ít thời gian và công sức. Do đó có
một cách tiếp cận khác đó là đưa ra một bộ luật cho những đặc điểm của đối tượng,
cách này sử dụng tri thức của người phát triển nhiều hơn so với sức mạnh của máy
tính. Tuy nhiên, để đưa ra được những bộ luật như vậy cần rất nhiều hiểu biết cũng
như những nghiên cứu chính xác đặc điểm của loại đối tượng cần nhận diện. Một kết
quả nhận diện tốt phụ thuộc rất nhiều vào bộ luật cho từng loại đối tượng. Ví dụ như
nghiên cứu của Crandall David J và Luo Jiebo đưa ra một cách tiếp cận để nhận diện
các đối tượng có sự kết hợp của các màu sắc một cách cố định như các loại cờ, nhân
vật hoạt hình, đồng phục hay logo. [2]
Cách tiếp cận thứ hai như đã nói phụ thuộc rất nhiều vào bộ luật đưa ra cho mỗi
loại đồ vật. Và để giải quyết vấn đề này trong các bài toán mà loại đồ vật cần nhận
diện đã được chỉ định trước, người ta đã đưa ra một phương pháp tương đối hiệu quả
đó đánh dấu vật cần tìm, theo đó ảnh chụp vật cần tìm sẽ chứ những điểm đặc biệt,
Nhận diện và điều khiển trạng thái vật thể qua IP camera
16
giúp cho việc nhận diện bằng máy tính là dễ dàng hơn. Ví dụ về một phương pháp sử
dụng cách này là nhiên cứu của nhóm tác giả J. Coughlan, R. Manduchi*, M.
Mutsuzaki* và H. Shen. Rapid and Robust Algorithms for Detecting Colour Targets
trong AIC Colour 05 - 10th Congress of the International Colour Association [11]. Nó
đưa ra một phương thức được triển khai trên các thiết bị di động có camera cho phép
tìm kiếm điểm màu đã được đánh dấu trong khoảng cách gần. Phương pháp này đạt
được độ chính xác tương đối cao 95 % với một vài loại thiết bị đã được thực nghiệm
với thời gian tính toán từ 0,12 đến 0,9 giây cho một bức ảnh.
2.4 Các giao thức và mô hình kết nối
Do hệ thống phải kết nối tới PPC, nên việc lựa chọn, sử dụng giao thức kết nối và
truyền tín hiện với PPC là việc rất quan trọng. Trong phạm vi đề tài này, chúng tôi
nghiên cứu, đánh giá hai giao thức kết nối chính là Wirless B/G và Bluetooth, từ đó
chọn ra một giao thức kết nối và truyền tín hiệu sử dụng cho chương trình.
2.4.1 Giao thức Bluetooth
2.4.1.1 Giới thiệu giao thức Bluetooth
Bluetooth là một đặc tả công nghiệp cho truyền thông không dây tầm gần giữa
các thiết bị điện tử. Công nghệ này hỗ trợ việc truyền dữ liệu qua các khoảng cách
ngắn giữa các thiết bị di động và cố định, tạo nên các mạng cá nhân không dây
(Wireless Personal Area Network-PANs).
Bluetooth có thể đạt được tốc độ truyền dữ liệu 1Mb/s. Bluetooth hỗ trợ tốc độ
truyền tải dữ liệu lên tới 720 Kbps trong phạm vi 10 m–100 m. Khác với kết nối hồng
ngoại (IrDA), kết nối Bluetooth là vô hướng và sử dụng giải tần 2,4 GHz.
Đặc tả Bluetooth được phát triển đầu tiên bởi Ericsson (hiện nay là Sony
Ericsson và Ericsson Mobile Platforms), và sau đó được chuẩn hoá bởi Bluetooth
Special Interest Group (SIG).
2.4.1.2 Giao thức nền OBEX
OBEX (OBject EXchange) là giao thức trao đổi dữ liệu giữa các thiết bị dùng
cổng hồng ngoại được hiệp hội IrDA (Infrared Data Association) đưa ra lần đầu tiên
năm 1997.
Xây dựng hệ thống giám sát và điều khiển nhà thông minh
17
Ban đầu, giao thức này chỉ giới hạn cho các thiết bị sử dụng môi trường ánh sáng
hồng ngoại, nhưng rất nhanh sau đó nó được tổ chức Bluetooth SIG (Bluetooth Special
Interest Group) đưa vào hầu hết các thiết bị Bluetooth của mình.
Cũng giống như các giao thức khác, giao thức OBEX được xây dựng trên nền mô
hình OSI (Open Systems Interconnection) (hình 2.9) bao gồm hai thành phần chính:
OBEX session protocol (giao thức phiên OBEX): mô tả cấu trúc gói tin
trong phiên làm việc giữa hai thiết bị.
OBEX application framework: tập các dịch vụ OBEX cung cấp cho các
ứng dụng đầu cuối như truyền file, in ảnh...
Hình 2.9: Giao thức Obex
2.4.2 Giao thức wireless chuẩn B/G
2.4.2.1 Giới thiệu giao thức wireless chuẩn B/G
WLAN là một loại mạng máy tính nhưng việc kết nối giữa các thành phần trong
mạng không sử dụng các loại cáp như một mạng thông thường, môi trường truyền
thông của các thành phần trong mạng là không khí. Các thành phần trong mạng sử
dụng sóng điện từ để truyền thông với nhau.
Nhận diện và điều khiển trạng thái vật thể qua IP camera
18
Công nghệ WLAN lần đầu tiên xuất hiện vào cuối năm 1990, khi những nhà sản
xuất giới thiệu những sản phẩm hoạt động trong băng tần 900Mhz. Những giải pháp
này (không được thống nhất giữa các nhà sản xuất) cung cấp tốc độ truyền dữ liệu
1Mbps, thấp hơn nhiều so với tốc độ 10Mbps của hầu hết các mạng sử dụng cáp hiện
thời.
Năm 2003, IEEE công bố thêm một sự cải tiến là chuẩn 802.11g mà có thể
truyền nhận thông tin ở cả hai dãy tần 2.4Ghz và 5Ghz và có thể nâng tốc độ truyền dữ
liệu lên đến 54Mbps. Thêm vào đó, những sản phẩm áp dụng 802.11g cũng có thể
tương thích ngược với các thiết bị chuẩn 802.11b. Hiện nay chuẩn 802.11g đã đạt đến
tốc độ 108Mbps-300Mbps.
2.4.2.2 Mô hình kết nối cơ sở (Basic service sets (BSSs))
Bao gồm các điểm truy nhập AP (Access Point) gắn với mạng đường trục hữu
tuyến và giao tiếp với các thiết bị di động trong vùng phủ sóng của một cell. AP đóng
vai trò điều khiển cell và điều khiển lưu lượng tới mạng. Các thiết bị di động không
giao tiếp trực tiếp với nhau mà giao tiếp với các AP.Các cell có thể chồng lấn lên nhau
khoảng 10-15 % cho phép các trạm di động có thể di chuyển mà không bị mất kết nối
vô tuyến và cung cấp vùng phủ sóng với chi phí thấp nhất. Các trạm di động sẽ chọn
AP tốt nhất để kết nối. Một điểm truy nhập nằm ở trung tâm có thể điều khiển và phân
phối truy nhập cho các nút tranh chấp, cung cấp truy nhập phù hợp với mạng đường
trục, ấn định các địa chỉ và các mức ưu tiên, giám sát lưu lượng mạng, quản lý chuyển
đi các gói và duy trì theo dõi cấu hình mạng. Tuy nhiên giao thức đa truy nhập tập
trung không cho phép các nút di động truyền trực tiếp tới nút khác nằm trong cùng
vùng với điểm truy nhập như trong cấu hình mạng WLAN độc lập. Trong trường hợp
này, mỗi gói sẽ phải được phát đi 2 lần (từ nút phát gốc và sau đó là điểm truy nhập)
trước khi nó tới nút đích, quá trình này sẽ làm giảm hiệu quả truyền dẫn và tăng trễ
truyền dẫn.
Xây dựng hệ thống giám sát và điều khiển nhà thông minh
19
Hình 2.10: Mô hình mạng cơ sở
2.4.2.3 Mô hình kết nối Ad-hoc (Independent Basic Service sets (BSSs))
Các nút di động(máy tính có hỗ trợ card mạng không dây) tập trung lại trong một
không gian nhỏ để hình thành nên kết nối ngang cấp (peer-to-peer) giữa chúng. Các
nút di động có card mạng wireless là chúng có thể trao đổi thông tin trực tiếp với nhau,
không cần phải quản trị mạng. Vì các mạng ad-hoc này có thể thực hiện nhanh và dễ
dàng nên chúng thường được thiết lập mà không cần một công cụ hay kỹ năng đặc biệt
nào vì vậy nó rất thích hợp để sử dụng trong các hội nghị thương mại hoặc trong các
nhóm làm việc tạm thời. Tuy nhiên chúng có thể có những nhược điểm về vùng phủ
sóng bị giới hạn, mọi người sử dụng đều phải nghe được lẫn nhau.
Nhận diện và điều khiển trạng thái vật thể qua IP camera
20
Hình 2.11: Mô hình mạng Ad-hoc
Xây dựng hệ thống giám sát và điều khiển nhà thông minh
21
Chương 3. Mô hình hệ thống giám sát và điều khiển nhà
thông minh
3.1 Bài toán và mô hình chung của hệ thống
3.1.1 Hệ thống giám sát và điều khiển nhà thông minh
Như đã trình bày ở trên, bài toán đặt ra trong đề tài này là xây dựng hệ thống
giám sát và điều khiển nhà thông minh sử dụng camera và PPC. Hệ thống này cho
phép ghi lại các hình ảnh trong một căn phòng được thu từ camera, sau đó hình ảnh
này sẽ được truyền tới thiết bị di động PPC thông qua mạng không dây wireless. Tại
đây người dùng sẽ nhìn thấy hình ảnh, trạng thái của các đồ vật trong phòng của mình,
vị trí các đồ vật cũng đã được xác định và đánh dấu trên hình ảnh. Người dùng có thể
lựa chọn những đồ vật cần điều khiển và điều khiển chúng thông qua các tính năng mà
hệ thống hỗ trợ. Những tín hiệu điều khiển này sau đó sẽ được truyền về server, tại đây
server sẽ xử lý và truyền tín hiệu điều khiển vừa rồi đến đúng thiết bị được chỉ định.
3.1.2 Mô hình đề xuất
Với bài toán đã đề ra, chúng tôi xin đưa ra một mô hình đề xuất như sau:
Hình 3.1: Mô hình hệ thống giám sát và điều khiển nhà thông minh
Nhận diện và điều khiển trạng thái vật thể qua IP camera
22
Hệ thống sẽ bao gồm ba thành phần chính là phần xử lý ảnh từ camera, phần
tương tác giữa người dùng với hệ thống trên PPC và phần điều khiển các thiết bị từ
máy tính. Ảnh (IMAGE) sau khi thi được từ camera(ứng với kí hiệu CAMERA trên
mô hình) sẽ được xử lý tại mô đun xử lý ảnh (IMAGE PROCESSING) đặt trên máy
tính, nhận diện các đồ vật có trong đó, đánh dấu lại và truyền cho PPC. Tại đây
(POCKET PC), PPC sẽ tái hiện hình ảnh vừa nhận được lên màn hình cảm ứng và cho
phép người dùng tương tác với hệ thống, đưa ra các lệnh điều khiển (CONTROL
SIGNAL) các thiết bị được lựa chọn.Các lệnh điều khiển của người dùng sẽ truyền vế
máy tính và được xử lý tại mô đun quản lý thiết bị (DEVICE MANAGER), và thực
hiện điều khiển trực tiếp các thiết bị thực tế (DEVICE 1, DEVICE 2, DEVICE 3...)
3.2 Các thành phần của hệ thống và các giải pháp
Mô hình chung và các thành phần chính của hệ thống đã được trình bày tổng quát
ở trên. Tại phần này sẽ trình bày một cách chi tiết các vấn đề cũng như giải pháp cho
những bài toán nhỏ ứng với từng thành phần của mô hình lớn trên.
3.2.1 Bài toán nhận diện đối tượng trong ảnh số
Như đã giới thiệu ở chương đầu của khóa luận. Trong phạm vi nghiêu cứu của
khóa luận này, bài toán đề ra sẽ là nhận diện các các đối tượng là các đồ vật thiết bị
điện, điện tử trong gia đình trong ảnh số thu được từ camera giám sát.
3.2.1.1 Các đặc điểm và phương pháp đề xuất
Từ các nghiên cứu thực tế và các cơ sở lý thuyết đã có, bài toán đặt ra là nhận
diện đối tượng trong ảnh số thu được từ camera, sau đó ảnh này sẽ được truyền trực
tiếp tới PPC. Do đó, chúng ta cần phải có một thuật toán nhận diện đồ vật chính xác,
và được biệt là thời gian xử lý nhanh để giảm thiểu tối đa độ trễ giữa hình ảnh thật và
hình ảnh được truyền tới người dùng. Vậy với bài toán này chúng tôi đã chọn cách tiếp
cận theo hướng sẽ đánh dấu các thiết bị, đồ vật cần nhận diện bằng những kí hiệu đặc
biệt, để từ đó kết hợp với một bộ luật tương ứng để xác định được chính xác vị trí của
đồ vật trong ảnh. Về cơ bản, các kí hiệu đánh dấu sẽ được xây dựng từ sự kết hợp giữa
các màu cơ bản theo một quy luật nhất định, quy luật này sẽ khác nhau với các kí hiệu
khác nhau, nhằm đảm bảo ta có thể nhận được nhiều đối tượng khác nhau trong cùng
một hình.Với cách tiếp cận này, chúng ta cố một số khó khăn gặp phải như sau:
(1) Do cấu tạo của các thiết bị phần cứng (camera, màn hình máy tính...) ảnh
màu luôn được biểu diễn dưới dạng lưới các điểm ảnh (pixel) mà mỗi điểm ảnh lại
được biểu diễn bởi 3 thành phần màu cơ bản đó là đỏ-xanh lá cây- xanh lam (RGB:
Xây dựng hệ thống giám sát và điều khiển nhà thông minh
23
Red- Green - Blue). Đây là cách biểu diễn phù hợp với máy tính tuy nhiên nó lại
không thực sự phù hợp với mắt của con người. Người dùng thường khó tưởng tượng
được một chút đỏ cộng một chút xanh thì ra màu gì.
(2) Cũng từ cách biểu diễn như trên, với một ví dụ đơn giản, có 2 điểm ảnh có
cùng màu đỏ song độ sáng khác nhau, mắt người nhìn có thể đưa ra nhận xét luôn là 2
điểm đó cùng màu tuy nhiên với 2 thành phần RGB thì máy tính sẽ cho 2 điểm đó
hoàn toàn khác nhau không có điểm chung gì cả. Đặc biệt là hình ảnh được thu từ
camera nên khả năng bức ảnh thay đổi độ sáng vì các yếu tố tự nhiên con người là rất
cao.
(3) Việc sử dụng camera để chụp ảnh còn cho ta những sai số về màu sắc nhất
định. Trong thực tế bên ngoài nó là màu đỏ nhưng sau khi camera chụp lại nó không
còn thực sự là màu đỏ nữa. Điều này là do cấu tạo phần cứng của camera, mỗi một
camera khác nhau lại làm cho màu sắc thay đổi theo những chiều hướng khác nhau.,
điều này ảnh hưởng không nhở đến kết quả nhận diện.
(4) Màu sắc thường thay đổi khi ghi lại bằng camera và khả năng xuất hiện các
vùng màu giống trong khung hình cũng dễ xảy ra. Điều này sẽ gây ra nhiều sai số
trong quá trình nhận diện.
Để giải quyết một số vấn đề được để cập trên, chúng tôi xin đề xuất hướng giải
quyết như sau:
Để giải quyết vấn đề 1) và 2), ta nên sử dụng không gian màu HSV thay vì
không gian màu RGB vì một số ưu điểm của nó như sau:
o Thành phần dự liệu về màu sắc của điểm ảnh được tập trung vào giá trị H
chứ không còn phụ thuộc vào cả 3 thành phần RGB nên các giá trị và sự so sánh về
màu sẽ chính xác hơn.
o Thành phần dự liệu về độ sáng cũng được tập trung vào giá trị V nên khi
so sánh ta có thẻ loại đi được phần nào sự ảnh hưởng của việc độ sáng của ảnh thay
đối, sai khác do cái yếu tố tự nhiên hay con người gây ra trong quá trình ghi lại hình
ảnh của camera.
Để giải quyết vấn đề 3) đòi hỏi chúng ta phải thực hiện những tính toán thực tế
trên thiết bị để qua đó tìm ra sự sai khác giữa sự màu sắc thực tế và màu sắc sau khi
thu được từ camera, hay nói cách khác chúng ta sẽ có những màu chuẩn trong thực tế
Nhận diện và điều khiển trạng thái vật thể qua IP camera
24
mà tìm phổ của màu này sau khi được ghi lại bằng camera. Và việc nhận diện sẽ được
thực hiện dựa trên phổ màu này.
Để giải quyết vấn đề 4) ta cần có những kí hiệu đánh dấu đặc biệt, xác suất có
kí hiệu giống như thế là thấp. Tuy nhiên vẫn cần đảm bảo tính đơn giản, dễ làm nên có
một cách tương đối tốt là sử dụng kí hiệu đánh dấu là các hình có sự kết hợp bởi các
màu khác nhau theo một quy luật nhất định. Khi đó việc nhận diện không chỉ sử dụng
màu và còn sử dụng mối quan hệ giữa các cùng màu trong vật được đánh dấu.
3.2.1.2 Thuật toán đề xuất
Từ những nhận xét trên, chúng tôi xin đưa ra mô hình thuật toán nhận diện đối
tượng trong ảnh số như sau:
Hình 3.2: Mô hinh thuật toán nhận diện đối tượng trong ảnh số
Các thành phần trong mô hình trên:
RGB IMAGE: ảnh thu được từ camera được biểu diện trong hệ màu RGB.
Xây dựng hệ thống giám sát và điều khiển nhà thông minh
25
CONVERT TO HSV: mô đun tính toán và chuyển dự liệu của ảnh từ không
gian màu RGB sang không gian màu HSV.
HSV IMAGE: ảnh được biểu diễn bới hệ màu HSV.
COLOR HISTOGRAMS: phổ của những màu mẫu ứng với camera sử dụng.
TARGET OBJECT: màu đại diện cho đối tượng cần nhận diện.
TARGET RULES: luật kết hợp giữa các màu trong kí hiệu đánh dấu.
COLOR OBJECT DETECTION: mô đun nhận diện đối tượng sử dụng bộ luật
dựa trên màu đặc trưng của nó .
OUTPUT IMAGE: Ảnh sau khi được xử lý, đã xác định được vị trí của đồi
tượng cần nhận diện.
Mô tả chi tiết các bước của thuật toán như sau:
Bước 1:
Input: RGB IMAGE
Output: HSV IMAGE
Mô tả: Ảnh đưa vào dưới dạng RGB sẽ được chuyển qua thành dạng HSV,
theo đó tại mỗi điểm ảnh sẽ có 3 thành phần dữ liệu đó là chỉ số H là chỉ số về màu (từ
0 tới 180 tương ứng với các màu từ đỏ tới tím), S là độ xám (từ 0 tới 255 tương ứng
với 0 tới 100%), V là độ sáng (cũng từ 0 tới 255 tương ứng với từ đen tới trắng).
Bước 2:
Input: HSV IMAGE, TARGET COLOR, TARGET RULES, COLOR
HISTOGRAMS
Output: OUTPUT IMAGE
Mô tả: Tại bước này, chương trình sẽ dựa vào đối tượng cần tìm (TARGET
OBJECT) cùng bộ luật tương ứng với đối tượng đó (TARGET RULES) kết hợp với
phổ màu thực tế của camera (COLOR HISTOGRAMS) để tìm ra chính xác bị trí của
đối tượng.
Nhận diện và điều khiển trạng thái vật thể qua IP camera
26
Một số bộ luật được đề xuất:
Cách 1: Các kí hiệu đánh dấu sẽ là một hình vuông kết hợp bởi 4 hình vuông nhỏ
với các màu sắc khác nhau được sắp xếp có thứ tự(ví dụ: hình 3.3 a)
(a) (b)
Hình 3.3: Một mẫu kí hiệu đánh dấu
Theo đó nhiệm vụ của chúng ta sẽ là tìm ra tọa độ của các điểm nằm trong vùng
kí hiệu trên. Việc tìm kiếm sẽ tập trung tìm kiếm vào điểm O là điểm ở chính giữa
vùng kí hiệu này. Việc tìm kiếm sẽ được thực hiện theo phương pháp sau:
Ta sẽ duyệt từng điểm trên ảnh, tại mỗi điểm ta sẽ kiểm tra 4 điểm xung quanh
nó theo thứ tự sẽ nằm về 4 góc theo phương của các đường phân giác của các góc ở
tâm (ví dụ điểm O có 4 điểm xung quanh là P1, P2, P3, P4 trên hình 11 b). Điều kiện
kiểm tra 4 điểm này sẽ là chúng phải thuộc 4
Các file đính kèm theo tài liệu này:
- Nguyen Dinh Anh Cuong_K50CNPM_Khoa luan tot nghioep dai hoc.pdf