Khóa luận Xây dựng hệ thống giám sát và điều khiển nhà thông minh: nhận diện và điều khiển trạng thái vật thể qua IP camera

MỤC LỤC

LỜI CẢM ƠN . i

TÓM TẮT . ii

ABSTRACT . . . iii

MỤC LỤC . iv

BẢNG CÁC KÝ HIỆU VIẾT TẮT . vi

DANH MỤC HÌNH VẼ. vii

DANH MỤC BẢNG BIỂU . viii

Chương 1. Đặt vấn đề . . 2

1.1 Lý do chọn đề tài . 2

1.2 Phạm vi nghiên cứu và hướng tiếp cận . 4

1.2.1 Nhận diện đối tượng trong ảnh số thu được từ camera . 5

1.2.2 Điều khiển các thiết bị trong gia đình từ máy tính . 5

1.3 Nội dung và cấu trúc khóa luận . . 6

Chương 2. Các cơ sở lý thuyết. . 7

2.1 Tính toán khắp nơi và các ứng dụng . . 7

2.1.1 “Tính toán khắp nơi” là gì? . . . 7

2.1.2 Vị trí của “Tính toán kh ắp nơi” . . 7

2.2 Tổng quan về nhà thông minh . 8

2.2.1 Định nghĩa nhà thông minh . . . 8

2.2.2 Các ưu điểm của nhà thông minh. 8

2.3 Một số khái niệm trong xử lý ảnh và bài toán nhận diện đối tượng trong ảnh 9

2.3.1 Không gian màu HSV . 9

2.3.2 Các cách tiếp cận bài toán nhận diện đối tượng trong ảnh. 15

2.4 Các giao thức và mô hình kết nối. 16

2.4.1 Giao thức Bluetooth . 16

2.4.2 Giao thức wireless chuẩn B/G . 17

Chương 3. Mô hình hệ thống giám sát và điều khiển nhà thông minh . 21

3.1 Bài toán và mô hình chung của hệ thống . . 21

3.1.1 Hệ thống giám sát và điều khiển nhà thông minh. . 21

3.1.2 Mô hình đề xuất . 21

3.2 Các thành phần của hệ thống và các giải pháp . 22

3.2.1 Bài toán nhận diện đối tượng trong ảnh số . 22

3.2.2 Kết nối và tương tác với PPC . 28

3.2.3 Điều khiển các thiết bị điện điện tử từ máy tính . 31

Chương 4. Thực nghiệm và chương trình demo . 32

4.1 Cấu trúc của chương trình demo . . . 32

4.2 Các thành phần chính và thực nghiệm trong chương trình demo . 33

4.2.1 Mô đun nhận và xử lý ảnh từ camera . 33

4.2.2 Mô đun kết nối và tương tác với PPC . 38

4.2.3 Mô đun điều khiển các thiết bị điện, điện tử từ máy tính . 38

4.3 Một số hình ảnh và mô tả về chương trình demo . . 39

4.4 Kết quả và đánh giá . . . 44

Chương 5. Kết luận và hướng phát triển . 45

5.1 Kết luận . . 45

5.2 Hướng phát triển của đề tài . 45

TÀI LIỆU THAM KHẢO. 47

58 trang | Chia sẻ: maiphuongdc | Lượt xem: 2124 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Khóa luận Xây dựng hệ thống giám sát và điều khiển nhà thông minh: nhận diện và điều khiển trạng thái vật thể qua IP camera, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

gian. Ý tưởng của công nghệ này khẳng định tính toán sẽ trở nên một công cụ hết sức tự nhiên, mạnh mẽ và có ích với tất cả những ai sử dụng nó. 2.1.2 Vị trí của “Tính toán khắp nơi” Với ý nghĩa và tiềm năng to lớn của nó, tính toán khắp nơi đang được nghiên cứu và phát triển cùng với rất nhiều những lĩnh vực của công nghệ thông tin như tính toán phân tán (distributed computing), tính toán di động (mobile computing), tương tác người máy (human-computer interaction), trí tuệ nhân tạo (artifacial intelligence). Nhận diện và điều khiển trạng thái vật thể qua IP camera 8 2.2 Tổng quan về nhà thông minh 2.2.1 Định nghĩa nhà thông minh Nhà thông minh (tiếng Anh: smart-home hoặc intelli-home, home automation) là kiểu nhà được lắp đặt các thiết bị điện, điện tử có tác dụng tự động hoá hoàn toàn hoặc bán tự động, nó thay thế con người trong việc thực hiện một số thao tác quản lý, điều khiển… Trong căn nhà thông minh, đồ dùng trong nhà như các thiết bị phòng ngủ, phòng khách đến toilet đều gắn các bộ điều khiển điện tử có thể kết nối với internet và điện thoại di động, cho phép chủ nhân điều khiển từ xa hoặc lập trình cho chúng hoạt động theo lịch. Thêm vào đó, các đồ gia dụng có thể hiểu được ngôn ngữ của nhau và có khả năng tương tác với nhau… (Wikipedia [8]). Một ngôi nhà thông minh đầy đủ, thường bao gồm các tính năng:  Phân phối đa phương tiện, là một rạp hát gia đình.  Điều khiển việc chiếu sáng, mành, rèm.  Giám sát, điều khiển môi trưởng (nhiệt độ, độ ẩm…).  Có khả năng liên lạc giữa các phòng.  Giám sát, điều khiển camera an ninh.  Giám sát và điều khiển từ xa. 2.2.2 Các ưu điểm của nhà thông minh Nhà thông minh sử dụng các thiết bị và công nghệ tự động hóa, thông minh hóa, giúp cho con người nhàn hạ hơn trong sinh hoạt hằng ngày. Nói cách khác, đây là hệ thống giúp chủ nhân tận hưởng sự tiện nghi của cuộc sống và dễ dàng quản lý tổng quát đối với cả tòa nhà. Chỉ với một chiếc điều khiển từ xa, chúng ta có thể điều khiển tất cả, dù đang ở bất kỳ nơi nào. Chúng ta có thể tưởng tượng ra hiệu quả mà nhà thông minh mang lại thông qua những hoạt động rất gần gũi, chẳng hạn như nằm trên giường để mở cổng; sẽ không còn chuyện bị ngã do không nhìn thấy đường bởi đèn cầu thang sẽ tự sáng lên khi có người; hệ thống đèn trong phòng, bếp, bình nước nóng... sẽ hoạt động đúng giờ đã định; toàn bộ hệ thống đèn sẽ tự tắt sau khi không Xây dựng hệ thống giám sát và điều khiển nhà thông minh 9 cần thiết; khống chế nhiệt độ chênh lệch giữa bên ngoài và trong nhà và còn rất nhiều tiện ích khác. Không chỉ điều khiển được trong phạm vi ngôi nhà, công nghệ này còn cho phép tích hợp điều khiển qua điện thoại (cố định hoặc di động), internet hay PDA. Vì vậy, mọi sinh hoạt có thể được kiểm soát dù chúng ta đang ở công sở hay ngoài đường... Không chỉ riêng các ngôi nhà nhỏ, chúng ta hoàn toàn có thể thông minh hóa bất kỳ một không gian sống nào, kể cả trụ sở văn phòng, siêu thị, trung tâm thương mại, khách sạn, nhà hàng, nhà xưởng sản xuất, ngân hàng, bệnh viện hay các khu phức hợp khác... nếu lựa chọn công nghệ phù hợp. 2.3 Một số khái niệm trong xử lý ảnh và bài toán nhận diện đối tượng trong ảnh 2.3.1 Không gian màu HSV Màu sắc là một phần rất quan trọng các công nghệ xử lý ảnh. Để biểu diễn màu sắc trên máy tính cũng có rất nhiều dạng khác nhau tùy thuộc theo yêu cầu cần sử dụng. Phần này sẽ giới thiệu sơ bộ về không gian màu cơ bản RGB và không gian màu HSV [9]. 2.3.1.1 Không gian màu RGB Do cấu tạo của các thiết bị phần cứng nên các điểm ảnh thường được đặc trưng bởi ba thành phần màu cơ bản đó là Red, Green và Blue. Một thành phần thường được định nghĩa bới 1 byte(tức là có 256 giá trị từ 0 đến 255). Sự kết hợp của 3 thành phần này sẽ cho ta màu sắc của 1 điểm ảnh bất kì. Ví dụ: R=G=255, B=0 ta có màu vàng. R=G=B=0 ta có màu đen. R=G=B=255 ta có mày trắng. 2.3.1.2 Không gian màu HSV  Hue (H): độ đo màu được tổng hợp từ 3 thành phần màu Đỏ(Red), Xanh lam (blue), xanh lá cây (Green) của một điểm ảnh.  Saturation (S): chỉ độ xám của điểm ảnh. VD: Cùng là một màu nhưng có màu xám và có màu trong.  Value (V): Chỉ độ sáng của điểm ảnh. Nhận diện và điều khiển trạng thái vật thể qua IP camera 10 Mối quan hệ giữa hệ màu RGB và hệ màu HSV: Giả sử ta cần một dải màu biểu diễn độ xám (grayscale), đơn giản ta sẽ có 1 chuỗi điểm liên tục mà tại mỗi điểm các chỉ sổ R = G= B và tăng dần từ 0->255: ta sẽ có một dải từ đen-> trắng (như hình 2.1). Hình 2.1: Dải mầu xám Nếu coi hệ màu RGB tương đương với 1 hệ trục tọa độ đề các (R=x, G=y, B=z) thì có thể thấy Graysclale chính là 1 đường thẳng nối 1 điểm (0,0,0) với (255, 255, 255). Ta sẽ coi đây là một tia tạm gọi là tia phân giác. Hình 2.2: Hệ trục tọa độ Đề Các với các hệ mầu RGB Độ sáng: Độ sáng của một điểm ảnh được tính theo tổng giá trị của 3 thành phần màu RGB, theo đó một điểm ảnh có chỉ số R+G+B lớn hơn thì sẽ sáng hơn. Để ý thấy phương trình x+y+z =V chính là phương trình của một mặt phẳng(xem hình 2.3). Xây dựng hệ thống giám sát và điều khiển nhà thông minh 11 Hình 2.3: Mặt phẳng màu ứng với một độ sáng Nếu di chuyển các mặt phẳng dọc từ (0,0,0) đến (255,255,255) chỉ có độ sáng của điểm ảnh thay đổi còn các thành phần màu không đổi: đỏ vẫn đỏ, xanh vẫn xanh... (xem hình 2.4). Hình 2.4: Sự thay đổi độ sáng theo tia phân giác Chính vì vậy, ta sẽ định nghĩa tia phân giác chính là độ đo độ sáng V (Value) trong hệ màu HSV của điểm ảnh. Giá trị tứ 0 đến 1. Xét một mặt phẳng ta sẽ thấy, các điểm có độ sáng như nhau. Điểm màu xám sẽ là điểm chính giữa nơi mặt phẳng này cắt tia phân giác. (hình 2.5) Nhận diện và điều khiển trạng thái vật thể qua IP camera 12 Hình 2.5: Mặt phẳng phân bố màu Nếu vẽ một vành màu với tâm là điểm màu xám nằm trên tia phân giác ta sẽ thấy sự khác nhau giữa các màu sắc sẽ được đánh giá theo phần mà nó nằm trên khuyên tròn. Nếu quy ước là Red ứng với 0 độ, Green 120 độ, và Blue là 240 độ. Với quy ước này ta sẽ có màu đỏ ứng với 0 độ, vàng ứng với góc 60 độ, màu cam sẽ ở khoảng góc 30 độ. Giá trị này sẽ ứng với độ đo màu sắc H (Hue)trong hệ màu HSV. Thành phần còn lại của hệ màu HSV là S (Saturation), độ đo độ xám của điểm ảnh. Xây dựng hệ thống giám sát và điều khiển nhà thông minh 13 Hình 2.6: Phân bố độ xám Từ hình vẽ (hình 2.6) ta thấy khoảng cách từ điểm xám (tâm) tới điểm đỏ nhất (pure red) sẽ quyết định độ xám của điểm ảnh. Ví dụ: Nếu muốn mô tả một điểm có màu sắc nằm giữa màu đỏ và màu xám (H=0), và có cũng độ sáng là V trong hệ tọa độ đề các ứng với hệ màu RGB ở trên thì ta sẽ có:  Điểm đỏ nhất (pure red) là (V, 0, 0)  Điểm màu xám với cùng độ sáng sẽ là (V/3, V/3, V/3)  Điểm nửa đỏ nửa xám sẽ là (V*2/3, V/6, V/6) Nhận diện và điều khiển trạng thái vật thể qua IP camera 14 Hình 2.7: Mô tả độ xám Dễ thấy tất cả các điểm “nửa đỏ nửa xám” sẽ cùng nằm trên một đường thẳng có PT tham số x=V*2/3, y=V/6, z = V/6. Do đó, ta có thể định nghĩa độ xám của một điểm chính là tỉ khoảng cách giữa điểm đó tới điểm xám(gray) so với khoảng cách giữa điểm đó tới điểm trong nhất (pure). Tổng kết: Tóm lại ta có thể thay thể hệ màu RGB với bằng một hệ màu mới với hệ tọa độ là một hình nón. Các màu sắc theo đó sẽ được mô tả như sau:  Độ sáng: V trong khoảng 0(đen)-100(trắng)  Độ xám hay độ sắc nét của màu: S với 0 là xám  Màu sắc: được xác định thông qua góc H (0 ứng với màu đỏ, 60 với vàng, 120 xanh lá, 240 xanh lam...) Xây dựng hệ thống giám sát và điều khiển nhà thông minh 15 Hình 2.8: Hệ màu HSV 2.3.2 Các cách tiếp cận bài toán nhận diện đối tượng trong ảnh Đã có rất nhiều những nhà nghiên cứu, tổ chức quan tâm nghiên cứu và đưa ra các cách tiếp cận khác nhau để giải quyết bài toán này. Trong đó có một vài cách tiếp cận phổ biến như: thu thập một lượng dữ liệu về hình ảnh lớn chứ đối tượng và thực hiện việc huấn luyện thông qua học máy. Ví dụ nghiên cứu của: H. Schneiderman và T. Kanade. A Statistical Method for 3D object detection applied to faces and cars. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, năm 2000 [4]; hay H. Rowley, S. Baluja, T. Kanade. Rotation Invariant Neural Network-Based Face Detection. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 1998 [3]...) Tuy nhiên cách này đòi hỏi việc phải thu thập một lượng lớn dữ liệu thực tế của một đối tượng, điều này là thực sự khó khăn nếu ta tiến hành trên một nhóm các loại đối tượng khác nhau. Hơn nữa việc đưa ra những phương pháp học máy cũng đòi hỏi không ít thời gian và công sức. Do đó có một cách tiếp cận khác đó là đưa ra một bộ luật cho những đặc điểm của đối tượng, cách này sử dụng tri thức của người phát triển nhiều hơn so với sức mạnh của máy tính. Tuy nhiên, để đưa ra được những bộ luật như vậy cần rất nhiều hiểu biết cũng như những nghiên cứu chính xác đặc điểm của loại đối tượng cần nhận diện. Một kết quả nhận diện tốt phụ thuộc rất nhiều vào bộ luật cho từng loại đối tượng. Ví dụ như nghiên cứu của Crandall David J và Luo Jiebo đưa ra một cách tiếp cận để nhận diện các đối tượng có sự kết hợp của các màu sắc một cách cố định như các loại cờ, nhân vật hoạt hình, đồng phục hay logo. [2] Cách tiếp cận thứ hai như đã nói phụ thuộc rất nhiều vào bộ luật đưa ra cho mỗi loại đồ vật. Và để giải quyết vấn đề này trong các bài toán mà loại đồ vật cần nhận diện đã được chỉ định trước, người ta đã đưa ra một phương pháp tương đối hiệu quả đó đánh dấu vật cần tìm, theo đó ảnh chụp vật cần tìm sẽ chứ những điểm đặc biệt, Nhận diện và điều khiển trạng thái vật thể qua IP camera 16 giúp cho việc nhận diện bằng máy tính là dễ dàng hơn. Ví dụ về một phương pháp sử dụng cách này là nhiên cứu của nhóm tác giả J. Coughlan, R. Manduchi*, M. Mutsuzaki* và H. Shen. Rapid and Robust Algorithms for Detecting Colour Targets trong AIC Colour 05 - 10th Congress of the International Colour Association [11]. Nó đưa ra một phương thức được triển khai trên các thiết bị di động có camera cho phép tìm kiếm điểm màu đã được đánh dấu trong khoảng cách gần. Phương pháp này đạt được độ chính xác tương đối cao 95 % với một vài loại thiết bị đã được thực nghiệm với thời gian tính toán từ 0,12 đến 0,9 giây cho một bức ảnh. 2.4 Các giao thức và mô hình kết nối Do hệ thống phải kết nối tới PPC, nên việc lựa chọn, sử dụng giao thức kết nối và truyền tín hiện với PPC là việc rất quan trọng. Trong phạm vi đề tài này, chúng tôi nghiên cứu, đánh giá hai giao thức kết nối chính là Wirless B/G và Bluetooth, từ đó chọn ra một giao thức kết nối và truyền tín hiệu sử dụng cho chương trình. 2.4.1 Giao thức Bluetooth 2.4.1.1 Giới thiệu giao thức Bluetooth Bluetooth là một đặc tả công nghiệp cho truyền thông không dây tầm gần giữa các thiết bị điện tử. Công nghệ này hỗ trợ việc truyền dữ liệu qua các khoảng cách ngắn giữa các thiết bị di động và cố định, tạo nên các mạng cá nhân không dây (Wireless Personal Area Network-PANs). Bluetooth có thể đạt được tốc độ truyền dữ liệu 1Mb/s. Bluetooth hỗ trợ tốc độ truyền tải dữ liệu lên tới 720 Kbps trong phạm vi 10 m–100 m. Khác với kết nối hồng ngoại (IrDA), kết nối Bluetooth là vô hướng và sử dụng giải tần 2,4 GHz. Đặc tả Bluetooth được phát triển đầu tiên bởi Ericsson (hiện nay là Sony Ericsson và Ericsson Mobile Platforms), và sau đó được chuẩn hoá bởi Bluetooth Special Interest Group (SIG). 2.4.1.2 Giao thức nền OBEX OBEX (OBject EXchange) là giao thức trao đổi dữ liệu giữa các thiết bị dùng cổng hồng ngoại được hiệp hội IrDA (Infrared Data Association) đưa ra lần đầu tiên năm 1997. Xây dựng hệ thống giám sát và điều khiển nhà thông minh 17 Ban đầu, giao thức này chỉ giới hạn cho các thiết bị sử dụng môi trường ánh sáng hồng ngoại, nhưng rất nhanh sau đó nó được tổ chức Bluetooth SIG (Bluetooth Special Interest Group) đưa vào hầu hết các thiết bị Bluetooth của mình. Cũng giống như các giao thức khác, giao thức OBEX được xây dựng trên nền mô hình OSI (Open Systems Interconnection) (hình 2.9) bao gồm hai thành phần chính:  OBEX session protocol (giao thức phiên OBEX): mô tả cấu trúc gói tin trong phiên làm việc giữa hai thiết bị.  OBEX application framework: tập các dịch vụ OBEX cung cấp cho các ứng dụng đầu cuối như truyền file, in ảnh... Hình 2.9: Giao thức Obex 2.4.2 Giao thức wireless chuẩn B/G 2.4.2.1 Giới thiệu giao thức wireless chuẩn B/G WLAN là một loại mạng máy tính nhưng việc kết nối giữa các thành phần trong mạng không sử dụng các loại cáp như một mạng thông thường, môi trường truyền thông của các thành phần trong mạng là không khí. Các thành phần trong mạng sử dụng sóng điện từ để truyền thông với nhau. Nhận diện và điều khiển trạng thái vật thể qua IP camera 18 Công nghệ WLAN lần đầu tiên xuất hiện vào cuối năm 1990, khi những nhà sản xuất giới thiệu những sản phẩm hoạt động trong băng tần 900Mhz. Những giải pháp này (không được thống nhất giữa các nhà sản xuất) cung cấp tốc độ truyền dữ liệu 1Mbps, thấp hơn nhiều so với tốc độ 10Mbps của hầu hết các mạng sử dụng cáp hiện thời. Năm 2003, IEEE công bố thêm một sự cải tiến là chuẩn 802.11g mà có thể truyền nhận thông tin ở cả hai dãy tần 2.4Ghz và 5Ghz và có thể nâng tốc độ truyền dữ liệu lên đến 54Mbps. Thêm vào đó, những sản phẩm áp dụng 802.11g cũng có thể tương thích ngược với các thiết bị chuẩn 802.11b. Hiện nay chuẩn 802.11g đã đạt đến tốc độ 108Mbps-300Mbps. 2.4.2.2 Mô hình kết nối cơ sở (Basic service sets (BSSs)) Bao gồm các điểm truy nhập AP (Access Point) gắn với mạng đường trục hữu tuyến và giao tiếp với các thiết bị di động trong vùng phủ sóng của một cell. AP đóng vai trò điều khiển cell và điều khiển lưu lượng tới mạng. Các thiết bị di động không giao tiếp trực tiếp với nhau mà giao tiếp với các AP.Các cell có thể chồng lấn lên nhau khoảng 10-15 % cho phép các trạm di động có thể di chuyển mà không bị mất kết nối vô tuyến và cung cấp vùng phủ sóng với chi phí thấp nhất. Các trạm di động sẽ chọn AP tốt nhất để kết nối. Một điểm truy nhập nằm ở trung tâm có thể điều khiển và phân phối truy nhập cho các nút tranh chấp, cung cấp truy nhập phù hợp với mạng đường trục, ấn định các địa chỉ và các mức ưu tiên, giám sát lưu lượng mạng, quản lý chuyển đi các gói và duy trì theo dõi cấu hình mạng. Tuy nhiên giao thức đa truy nhập tập trung không cho phép các nút di động truyền trực tiếp tới nút khác nằm trong cùng vùng với điểm truy nhập như trong cấu hình mạng WLAN độc lập. Trong trường hợp này, mỗi gói sẽ phải được phát đi 2 lần (từ nút phát gốc và sau đó là điểm truy nhập) trước khi nó tới nút đích, quá trình này sẽ làm giảm hiệu quả truyền dẫn và tăng trễ truyền dẫn. Xây dựng hệ thống giám sát và điều khiển nhà thông minh 19 Hình 2.10: Mô hình mạng cơ sở 2.4.2.3 Mô hình kết nối Ad-hoc (Independent Basic Service sets (BSSs)) Các nút di động(máy tính có hỗ trợ card mạng không dây) tập trung lại trong một không gian nhỏ để hình thành nên kết nối ngang cấp (peer-to-peer) giữa chúng. Các nút di động có card mạng wireless là chúng có thể trao đổi thông tin trực tiếp với nhau, không cần phải quản trị mạng. Vì các mạng ad-hoc này có thể thực hiện nhanh và dễ dàng nên chúng thường được thiết lập mà không cần một công cụ hay kỹ năng đặc biệt nào vì vậy nó rất thích hợp để sử dụng trong các hội nghị thương mại hoặc trong các nhóm làm việc tạm thời. Tuy nhiên chúng có thể có những nhược điểm về vùng phủ sóng bị giới hạn, mọi người sử dụng đều phải nghe được lẫn nhau. Nhận diện và điều khiển trạng thái vật thể qua IP camera 20 Hình 2.11: Mô hình mạng Ad-hoc Xây dựng hệ thống giám sát và điều khiển nhà thông minh 21 Chương 3. Mô hình hệ thống giám sát và điều khiển nhà thông minh 3.1 Bài toán và mô hình chung của hệ thống 3.1.1 Hệ thống giám sát và điều khiển nhà thông minh Như đã trình bày ở trên, bài toán đặt ra trong đề tài này là xây dựng hệ thống giám sát và điều khiển nhà thông minh sử dụng camera và PPC. Hệ thống này cho phép ghi lại các hình ảnh trong một căn phòng được thu từ camera, sau đó hình ảnh này sẽ được truyền tới thiết bị di động PPC thông qua mạng không dây wireless. Tại đây người dùng sẽ nhìn thấy hình ảnh, trạng thái của các đồ vật trong phòng của mình, vị trí các đồ vật cũng đã được xác định và đánh dấu trên hình ảnh. Người dùng có thể lựa chọn những đồ vật cần điều khiển và điều khiển chúng thông qua các tính năng mà hệ thống hỗ trợ. Những tín hiệu điều khiển này sau đó sẽ được truyền về server, tại đây server sẽ xử lý và truyền tín hiệu điều khiển vừa rồi đến đúng thiết bị được chỉ định. 3.1.2 Mô hình đề xuất Với bài toán đã đề ra, chúng tôi xin đưa ra một mô hình đề xuất như sau: Hình 3.1: Mô hình hệ thống giám sát và điều khiển nhà thông minh Nhận diện và điều khiển trạng thái vật thể qua IP camera 22 Hệ thống sẽ bao gồm ba thành phần chính là phần xử lý ảnh từ camera, phần tương tác giữa người dùng với hệ thống trên PPC và phần điều khiển các thiết bị từ máy tính. Ảnh (IMAGE) sau khi thi được từ camera(ứng với kí hiệu CAMERA trên mô hình) sẽ được xử lý tại mô đun xử lý ảnh (IMAGE PROCESSING) đặt trên máy tính, nhận diện các đồ vật có trong đó, đánh dấu lại và truyền cho PPC. Tại đây (POCKET PC), PPC sẽ tái hiện hình ảnh vừa nhận được lên màn hình cảm ứng và cho phép người dùng tương tác với hệ thống, đưa ra các lệnh điều khiển (CONTROL SIGNAL) các thiết bị được lựa chọn.Các lệnh điều khiển của người dùng sẽ truyền vế máy tính và được xử lý tại mô đun quản lý thiết bị (DEVICE MANAGER), và thực hiện điều khiển trực tiếp các thiết bị thực tế (DEVICE 1, DEVICE 2, DEVICE 3...) 3.2 Các thành phần của hệ thống và các giải pháp Mô hình chung và các thành phần chính của hệ thống đã được trình bày tổng quát ở trên. Tại phần này sẽ trình bày một cách chi tiết các vấn đề cũng như giải pháp cho những bài toán nhỏ ứng với từng thành phần của mô hình lớn trên. 3.2.1 Bài toán nhận diện đối tượng trong ảnh số Như đã giới thiệu ở chương đầu của khóa luận. Trong phạm vi nghiêu cứu của khóa luận này, bài toán đề ra sẽ là nhận diện các các đối tượng là các đồ vật thiết bị điện, điện tử trong gia đình trong ảnh số thu được từ camera giám sát. 3.2.1.1 Các đặc điểm và phương pháp đề xuất Từ các nghiên cứu thực tế và các cơ sở lý thuyết đã có, bài toán đặt ra là nhận diện đối tượng trong ảnh số thu được từ camera, sau đó ảnh này sẽ được truyền trực tiếp tới PPC. Do đó, chúng ta cần phải có một thuật toán nhận diện đồ vật chính xác, và được biệt là thời gian xử lý nhanh để giảm thiểu tối đa độ trễ giữa hình ảnh thật và hình ảnh được truyền tới người dùng. Vậy với bài toán này chúng tôi đã chọn cách tiếp cận theo hướng sẽ đánh dấu các thiết bị, đồ vật cần nhận diện bằng những kí hiệu đặc biệt, để từ đó kết hợp với một bộ luật tương ứng để xác định được chính xác vị trí của đồ vật trong ảnh. Về cơ bản, các kí hiệu đánh dấu sẽ được xây dựng từ sự kết hợp giữa các màu cơ bản theo một quy luật nhất định, quy luật này sẽ khác nhau với các kí hiệu khác nhau, nhằm đảm bảo ta có thể nhận được nhiều đối tượng khác nhau trong cùng một hình.Với cách tiếp cận này, chúng ta cố một số khó khăn gặp phải như sau: (1) Do cấu tạo của các thiết bị phần cứng (camera, màn hình máy tính...) ảnh màu luôn được biểu diễn dưới dạng lưới các điểm ảnh (pixel) mà mỗi điểm ảnh lại được biểu diễn bởi 3 thành phần màu cơ bản đó là đỏ-xanh lá cây- xanh lam (RGB: Xây dựng hệ thống giám sát và điều khiển nhà thông minh 23 Red- Green - Blue). Đây là cách biểu diễn phù hợp với máy tính tuy nhiên nó lại không thực sự phù hợp với mắt của con người. Người dùng thường khó tưởng tượng được một chút đỏ cộng một chút xanh thì ra màu gì. (2) Cũng từ cách biểu diễn như trên, với một ví dụ đơn giản, có 2 điểm ảnh có cùng màu đỏ song độ sáng khác nhau, mắt người nhìn có thể đưa ra nhận xét luôn là 2 điểm đó cùng màu tuy nhiên với 2 thành phần RGB thì máy tính sẽ cho 2 điểm đó hoàn toàn khác nhau không có điểm chung gì cả. Đặc biệt là hình ảnh được thu từ camera nên khả năng bức ảnh thay đổi độ sáng vì các yếu tố tự nhiên con người là rất cao. (3) Việc sử dụng camera để chụp ảnh còn cho ta những sai số về màu sắc nhất định. Trong thực tế bên ngoài nó là màu đỏ nhưng sau khi camera chụp lại nó không còn thực sự là màu đỏ nữa. Điều này là do cấu tạo phần cứng của camera, mỗi một camera khác nhau lại làm cho màu sắc thay đổi theo những chiều hướng khác nhau., điều này ảnh hưởng không nhở đến kết quả nhận diện. (4) Màu sắc thường thay đổi khi ghi lại bằng camera và khả năng xuất hiện các vùng màu giống trong khung hình cũng dễ xảy ra. Điều này sẽ gây ra nhiều sai số trong quá trình nhận diện. Để giải quyết một số vấn đề được để cập trên, chúng tôi xin đề xuất hướng giải quyết như sau:  Để giải quyết vấn đề 1) và 2), ta nên sử dụng không gian màu HSV thay vì không gian màu RGB vì một số ưu điểm của nó như sau: o Thành phần dự liệu về màu sắc của điểm ảnh được tập trung vào giá trị H chứ không còn phụ thuộc vào cả 3 thành phần RGB nên các giá trị và sự so sánh về màu sẽ chính xác hơn. o Thành phần dự liệu về độ sáng cũng được tập trung vào giá trị V nên khi so sánh ta có thẻ loại đi được phần nào sự ảnh hưởng của việc độ sáng của ảnh thay đối, sai khác do cái yếu tố tự nhiên hay con người gây ra trong quá trình ghi lại hình ảnh của camera.  Để giải quyết vấn đề 3) đòi hỏi chúng ta phải thực hiện những tính toán thực tế trên thiết bị để qua đó tìm ra sự sai khác giữa sự màu sắc thực tế và màu sắc sau khi thu được từ camera, hay nói cách khác chúng ta sẽ có những màu chuẩn trong thực tế Nhận diện và điều khiển trạng thái vật thể qua IP camera 24 mà tìm phổ của màu này sau khi được ghi lại bằng camera. Và việc nhận diện sẽ được thực hiện dựa trên phổ màu này.  Để giải quyết vấn đề 4) ta cần có những kí hiệu đánh dấu đặc biệt, xác suất có kí hiệu giống như thế là thấp. Tuy nhiên vẫn cần đảm bảo tính đơn giản, dễ làm nên có một cách tương đối tốt là sử dụng kí hiệu đánh dấu là các hình có sự kết hợp bởi các màu khác nhau theo một quy luật nhất định. Khi đó việc nhận diện không chỉ sử dụng màu và còn sử dụng mối quan hệ giữa các cùng màu trong vật được đánh dấu. 3.2.1.2 Thuật toán đề xuất Từ những nhận xét trên, chúng tôi xin đưa ra mô hình thuật toán nhận diện đối tượng trong ảnh số như sau: Hình 3.2: Mô hinh thuật toán nhận diện đối tượng trong ảnh số Các thành phần trong mô hình trên:  RGB IMAGE: ảnh thu được từ camera được biểu diện trong hệ màu RGB. Xây dựng hệ thống giám sát và điều khiển nhà thông minh 25  CONVERT TO HSV: mô đun tính toán và chuyển dự liệu của ảnh từ không gian màu RGB sang không gian màu HSV.  HSV IMAGE: ảnh được biểu diễn bới hệ màu HSV.  COLOR HISTOGRAMS: phổ của những màu mẫu ứng với camera sử dụng.  TARGET OBJECT: màu đại diện cho đối tượng cần nhận diện.  TARGET RULES: luật kết hợp giữa các màu trong kí hiệu đánh dấu.  COLOR OBJECT DETECTION: mô đun nhận diện đối tượng sử dụng bộ luật dựa trên màu đặc trưng của nó .  OUTPUT IMAGE: Ảnh sau khi được xử lý, đã xác định được vị trí của đồi tượng cần nhận diện. Mô tả chi tiết các bước của thuật toán như sau:  Bước 1:  Input: RGB IMAGE  Output: HSV IMAGE  Mô tả: Ảnh đưa vào dưới dạng RGB sẽ được chuyển qua thành dạng HSV, theo đó tại mỗi điểm ảnh sẽ có 3 thành phần dữ liệu đó là chỉ số H là chỉ số về màu (từ 0 tới 180 tương ứng với các màu từ đỏ tới tím), S là độ xám (từ 0 tới 255 tương ứng với 0 tới 100%), V là độ sáng (cũng từ 0 tới 255 tương ứng với từ đen tới trắng).  Bước 2:  Input: HSV IMAGE, TARGET COLOR, TARGET RULES, COLOR HISTOGRAMS  Output: OUTPUT IMAGE  Mô tả: Tại bước này, chương trình sẽ dựa vào đối tượng cần tìm (TARGET OBJECT) cùng bộ luật tương ứng với đối tượng đó (TARGET RULES) kết hợp với phổ màu thực tế của camera (COLOR HISTOGRAMS) để tìm ra chính xác bị trí của đối tượng. Nhận diện và điều khiển trạng thái vật thể qua IP camera 26 Một số bộ luật được đề xuất: Cách 1: Các kí hiệu đánh dấu sẽ là một hình vuông kết hợp bởi 4 hình vuông nhỏ với các màu sắc khác nhau được sắp xếp có thứ tự(ví dụ: hình 3.3 a) (a) (b) Hình 3.3: Một mẫu kí hiệu đánh dấu Theo đó nhiệm vụ của chúng ta sẽ là tìm ra tọa độ của các điểm nằm trong vùng kí hiệu trên. Việc tìm kiếm sẽ tập trung tìm kiếm vào điểm O là điểm ở chính giữa vùng kí hiệu này. Việc tìm kiếm sẽ được thực hiện theo phương pháp sau: Ta sẽ duyệt từng điểm trên ảnh, tại mỗi điểm ta sẽ kiểm tra 4 điểm xung quanh nó theo thứ tự sẽ nằm về 4 góc theo phương của các đường phân giác của các góc ở tâm (ví dụ điểm O có 4 điểm xung quanh là P1, P2, P3, P4 trên hình 11 b). Điều kiện kiểm tra 4 điểm này sẽ là chúng phải thuộc 4

Các file đính kèm theo tài liệu này:

Nguyen Dinh Anh Cuong_K50CNPM_Khoa luan tot nghioep dai hoc.pdf