Cơ sở dữ liệu đầu vào cho bài toán nhận dạng ảnh gồm: Lấy tập mẫu của mạng Nơron trong nhận dạng ảnh thực chất là tập ảnh các loại tàu (tàu hàng, tàu chiến, tàu sân bay.)với tất cả các hướng của tàu (mũi tàu, thân tàu, góc nghiêng trái, nghiêng phải.)
- Chuẩn hoá dữ liệu:
+ Dữ liệu vào ban đầu là các ảnh hồng ngoại.
+ Sử dụng các bộ lọc giảm thiểu nhiễu trong ảnh hoặc tiền xử lý.
+ Tạo ngưỡng cho ảnh thành ảnh đen trắng.
+ Đưa về các dạng tàu chuẩn theo mẫu.
- Số hoá dữ liệu vào: Để số hoá dữ liệu, chúng ta chia ảnh ra thành 20x10 ô. Ảnh trước khi được đưa vào nhận dạng được xử lý qua bước lọc và tạo ngưỡng để giảm thiểu các nhiễu và ảnh sẽ chỉ là ảnh đen trắng với giá trị điểm ảnh là (0,1). Giá trị của mỗi ô bằng số điểm ảnh đen/tổng số điểm ảnh.
6 trang |
Chia sẻ: maiphuongdc | Lượt xem: 3069 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Chuyên đề Áp dụng mạng Nơron xây dựng thuật toán nhận dạng để phân loại tàu trên biển dựa trên ảnh số, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA TP.HCM
CHƯƠNG TRÌNH ĐÀO TẠO THẠC SỸ CNTTQM
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
------------- o0o--------------
Hà Nội,ngày10 tháng 10 năm 2008
BÁO CÁO CHUYÊN ĐỀ
SEMINAR CÔNG NGHỆ TRI THỨC
Học viên thực hiện: Phạm Quang Trung
Mã số học viên: CH0602043
Hà Nội – 10/2008
Hà Nội - 09/2008
A. PHẦN TÊU ĐỀ
1. Học viên thực hiện: Phạm Quang Trung
Mã số học viên: CH0602043
2. Tên chuyên đề: Áp dụng mạng Nơron xây dựng thuật toán nhận dạng để phân loại tàu trên biển dựa trên ảnh số
Thuộc chuyên đề Công nghệ tri thức
3. Tên đề tài luận văn cao học: Áp dụng mạng Nơron xây dựng chương trình nhận dạng để phân loại tàu trên biển dựa trên ảnh số
Giảng viên hướng dẫn: TS. Lê Quốc Định
B. PHẦN NỘI DUNG
1. Tổng quan tình hình nghiên cứu chuyên đề ở trong và ngoài nước
Bộ não của con người là sản phẩm hoàn hảo nhất của tạo hoá, nó có khả năng nhớ, tư duy và sáng tạo. Việc nghiên cứu những mô hình mà nguyên lý tổ chức và hoạt động của chúng phỏng theo hoạt động của bộ não người đang là hướng nghiên cứu mang tính thời sự của khoa học và công nghệ. Cũng từ đây, đã xuất hiện thuật ngữ “mạng Nơron nhân tạo”(Artificial neural networks - ANN). Mạng ANN này rất phù hợp với việc giải các bài toán xấp xỉ hàm, xử lý thông tin, xử lý ảnh và nhận dạng ảnh…
Ở các nước phát triển người ta đã ứng dụng ANN vào thực tế đời sống, đã cho ra đời hàng loạt các thiết bị sử dụng cấu trúc mạng Nơron để xử lý ảnh và xây dựng ảnh ba chiều từ các ảnh mặt chiếu phục vụ trong chẩn đoán hình ảnh y khoa, các thiết bị nhận dạng để đọc biểu đồ điện tim, điện não, nhận dạng vân tay, chữ viết, giọng nói…Lý do khách quan là do ANN có tốc độ xử lý cao nhờ cấu trúc xử lý song song và các liên kết mềm dẻo. Mạng có thể đưa ra các quyết định cần thiết thông qua các quá trình huấn luyện hoặc tự học, khả năng giải quyết vấn đề của mạng rất đa dạng và đạt độ chính xác cao.
Ở Việt Nam, những nghiên cứu mang tính thực nghiệm cũng đang được định hướng và thu được một số kết quả ban đầu tuy còn hạn chế. Vì vậy, việc cập nhật kiến thức và tiếp cận một lĩnh vực mũi nhọn của khoa học công nghệ trong việc giải quyết một bài toán cụ thể là rất cần thiết.
2. Mục tiêu nghiên cứu chuyên đề:
- Áp dụng mạng Nơron thực hiện các thuật toán xử lý ảnh và nhận dạng để phân loại ảnh tàu trên biển.
- Phát triển chương trình thành một hệ tự động xử lý, nhận dạng ảnh hồng ngoại dùng mạng Nơron.
3. Phương pháp thực hiện:
3.1. Cơ sở dữ liệu.
Cơ sở dữ liệu đầu vào cho bài toán nhận dạng ảnh gồm: Lấy tập mẫu của mạng Nơron trong nhận dạng ảnh thực chất là tập ảnh các loại tàu (tàu hàng, tàu chiến, tàu sân bay...)với tất cả các hướng của tàu (mũi tàu, thân tàu, góc nghiêng trái, nghiêng phải...)
- Chuẩn hoá dữ liệu:
+ Dữ liệu vào ban đầu là các ảnh hồng ngoại.
+ Sử dụng các bộ lọc giảm thiểu nhiễu trong ảnh hoặc tiền xử lý.
+ Tạo ngưỡng cho ảnh thành ảnh đen trắng.
+ Đưa về các dạng tàu chuẩn theo mẫu.
- Số hoá dữ liệu vào: Để số hoá dữ liệu, chúng ta chia ảnh ra thành 20x10 ô. Ảnh trước khi được đưa vào nhận dạng được xử lý qua bước lọc và tạo ngưỡng để giảm thiểu các nhiễu và ảnh sẽ chỉ là ảnh đen trắng với giá trị điểm ảnh là (0,1). Giá trị của mỗi ô bằng số điểm ảnh đen/tổng số điểm ảnh.
- Thống kê các cách số hoá: Ảnh có kích thước càng lớn thì khả năng nhận dạng càng cao.
- Chọn số nút vào: Theo cách phân chia 20x10 như trên thì số nút vào sẽ là 20x10 = 200 nút, và các nút này nhận giá trị trong khoảng [0,1).
- Chọn số nút ra: Số nút ra của mạng sẽ là số tập mẫu K.
- Chọn số lớp: Phương pháp và ứng dụng thường chọn mạng có 3 lớp (có một lớp ẩn).
- Chọn số nút ẩn: Ứng với từng bài toán cụ thể mà người ta chọn số nút ẩn cần thiết cho từng lớp ẩn. Trong bài toán nhận dạng ảnh này, chúng ta sẽ chỉ xét mạng nơron với một lớp ẩn. Theo một thống kê trong cuốn sách trên, người ta chứng minh được rằng mạng một lớp ẩn với ba hoặc bốn nút ẩn sẽ cho kết quả tương đối khả quan và chính xác.
3.2. Phương pháp nhận dạng
Xác định ra các thuộc tính đặc trưng của ảnh, xem ảnh vào là thuộc mẫu ảnh nào trong tập mẫu.
Trước hết, cho ảnh vào qua các bước tiền xử lý (xử lý sơ bộ) rồi đưa qua chương trình nhận dạng. Qua mạng Nơron nhân tạo, ta được một ma trận đầu ra. Đem so sánh với tập mẫu đã được học để tính được bình phương sai số. Các bình phương sai số này sẽ được lưu lại và lời giải bài toán sẽ là tổng bình phương sai số nhỏ nhất.
w i2
Các liên kết đầu vào
P1
P2
….
….
Trọng số liên kết
w i1
w iR
a i
(Đầu ra)
å
Thu nhận ảnh
Phân tích ảnh
Tiền xử lý ảnh
Mạng Nơron
nhận dạng ảnh
Hậu xử lý dữ liệu
Hình: 3.b. Minh hoạ mô hình một nơron nhân tạo có nhiều đầu vào và một đầu ra (MISO – Many Inputs Single Output).
Hình: 3a.Các bước trong nhận dạng ảnh dùng mạng Nơron
3.2.1. Thu nhận ảnh
Ảnh văn bản, tài liệu có thể được thu nhận bằng máy quét scanner, webcam, hoặc các thiết bị thu nhận ảnh thông dụng khác. Chuyển đổi sang dạng ảnh nhị phân.
3.2.2. Phân tích ảnh để tìm ảnh
Quá trình phân tích ảnh gồm các bước sau:
+ Nhận dạng theo tham số.
+ Nhận dạng theo cấu trúc.
3.2.3. Tiền xử lý ảnh
Quá trình tiền xử lý ảnh giải quyết vần đề ánh xạ giá trị pixel ảnh vào ma trận 10x15 và tuyến tính hóa ma trận thành 150 giá trị đưa vào 150 nơron ở lớp vào của mạng.
3.2.4. Mạng nơron nhận dạng ảnh
Hiện nay, các loại mạng nơron thông dụng gồm có: Mạng truyền thẳng (feel-forward), Mạng Perceptron nhiều lớp MLP (MultiLayer Perceptron),…
Ø Mạng truyền thẳng feed-forward bao gồm nhiều lớp các đơn vị xử lý phi tuyến (non-linear processing unit). Một vector đầu vào sẽ được đưa vào lớp vào của mạng và sau đó các tính toán được thực hiện lan truyền thẳng từ lớp vào sang các lớp ẩn và kết thúc ở lớp ra.
Ø Mạng Perceptron nhiều lớp MLP (MultiLayer Perceptron) là một trong những loại mạng truyền thẳng điển hình, được sử dụng rộng rói trong các hệ thống nhận dạng như nhận dạng ký tự quang, chữ viết tay, nhận dạng tiếng nói…
Với bài toán nhận dạng ảnh, ta thiết kế một mạng MLP(xác định bằng phương pháp thử -sai (Trial-and-errors)).
Quá trình huấn luyện mạng
Trước hết ta xét một mạng có 3 lớp: q = 1, 2, 3. Mạng có n nút vào và m nút ra. Dùng i_wij , o_wjk để lần lượt chỉ trọng số liên kết giữa nút thứ i của lớp vào đến nút j của lớp ẩn và trọng số liên kết giữa nút thứ j của lớp ẩn đến nút k của lớp xuất.
BEGIN
+ Khởi tạo: Chọn Emax (lỗi lớn nhất có thể). Khởi tạo các giá trị của trọng số với giá trị ngẫu nhiên nhỏ. Đặt E = 0 và mẫu vào thứ p = 1.
+ Áp dụng mẫu vào thứ p cho lớp vào xip "i.
+ Cho lan truyền tín hiệu về phía trước thông qua mạng sử dụng.
uj = a0j +wijxi ( a0j là trọng ngưỡng của nút ẩn thứ j)
vk =b0k +wjkzj ( b0k là trọng ngưỡng của nút ẩn thứ k)
và trong đó zj = g(uj); yk = g(vk) với g là hàm truyền.
+ Tính toán giá trị lỗi và tín hiệu lỗi cho lớp xuất.
Ek = [y(k) - ỹ(k)] = [yj(k) - ỹj(k)] 2
E = Ek = [yj(k) - ỹj(k)] 2
+ Cho lan truyền các lỗi ngược trở lại để cập nhật các trọng số và tính toán tín hiệu lỗi cho từng lớp đó.
+ Kiểm tra xem toàn bộ tập dữ liệu huấn luyện đã được sử dụng hết một lượt chưa. Nếu p < q thì p = p+1 và quay lại bước 1; ngược lại thì thực hiện bước sau.
+ Kiểm tra xem lỗi tổng có chấp nhận được không. Nếu E < Emax thì kết thúc quá trình luyện tập và đưa ra các trọng số cuối cùng. Ngược lại cho E = 0 và p =1 bắt đầu quá trình luyện mới bằng cách quay về bước 1.
Đúng
Sai
Lưu
å bpss
Lan truyền tiến
å bpss
Lưu MTĐR
Lấy Min
Ra quyết định
End
So sánh các åbpss
Mẫu < å số mẫu
Mẫu ++
Xử lý sơ bộ
Begin
Mẫu = 1
Ảnh cần nhận dạng
Số hóa
END.
“Hình:3c. Sơ đồ khối của thuật toán nhận dạng ảnh”
4. Kết quả đạt được:
- Xây dựng được thuật toán xử lý, nhận dạng và phân loại ảnh.
- Trên cơ sở đó xây dựng chương trình nhận dạng để phân loại tàu trên biển dựa trên ảnh số.
5. Danh mục tài liệu tham khảo:
- Nhập môn xử lý ảnh số tác giả Lương Mạnh Bá & Nguyễn Thanh Thuỷ Nhà xuất bản khoa học và kỹ thuật 1999.
- Trí tuệ nhân tạo - Mạng Nơron phương pháp và ứng dụng tác giả Nguyễn Đình Thúc - Nhà xuất bản giáo dục 2000.
- Hệ mờ - Mạng nơron và ứng dụng tác giả Bùi Công Cường & Nguyễn Doãn Phước Nhà xuất bản khoa học và kỹ thuật 1999.
- Digital Image Procesing - R.C.Gonzalez & P.Wintz,Addision - Wesley 1987.
- Digital Image Procesing Algorithams- Loannis Pitas, British Library Cataloguing in Publication Data 1993.
- Trí tuệ nhân tạo và hệ chuyên gia.
- Tài liệu kỹ thuật điều khiển - Viện kỹ thuật Hải Quân.
C. KẾT QUẢ, KHUYẾN NGHỊ CỦA TÁC GIẢ QUA NGHIÊN CỨU CHUYÊN ĐỀ
Với kết quả thu được trong quá trình nghiên cứu nhận thấy mạng Nơron có ứng dụng hiệu quả cao trong quá trình xây dựng các thuâth toán xử lý. Để thu được kết quả nhận dạng với độ chính xác cao hơn cần tối ưu hơn nữa cấu trúc và các thông số mạng, điều này đòi hỏi thời gian thử nghiệm và huấn luyện mạng lâu hơn.
Đề chuyên đề này nghiên cứu cơ sở lý thuyết và các ứng dụng chính của kỹ thuật "xử lý, nhận dạng và phân loại ảnh theo nội dung", trên cơ sở đó xây dựng một chương trình phần mềm nhận dạng để phân loại tàu trên biển.
Các file đính kèm theo tài liệu này:
- Seminar_CNTT_PhamQuangTrung_CH0602043.doc