Hệthống xửlý ảnh văn bản thường phải giải quyết bài toán phát hiện góc
nghiêng nhưmột bước đầu tiên và tất yếu. Dựa vào tính chất mỗi đối tượng ảnh có
duy nhất một chu tuyến ngoài và quan niệm con người nhận ra độnghiêng của văn
bản dựa vào cỡchữchiếm chủ đạo trong văn bản. Việc xác định góc nghiêng văn bản
được xác định nhờphép biến đổi Hough cho những điểm giữa đáy của hình chữnhật
nhỏnhất bao quanh đối tượng ảnh cho các đối tượng ảnh có kích thước chủ đạo.
14 trang |
Chia sẻ: netpro | Lượt xem: 2123 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Luận án Phát triển kỹ thuật dò biên, phát hiện biên và ứng dụng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương 3: Ứng dụng
3.1. TÌM XƯƠNG DỰA TRÊN LÀM MẢNH
Thực chất của quá trình làm mảnh là việc xoá dần các biên theo một thứ tự và
một điều kiện xoá nào đó để thu được xương của đối tượng.
Hình 3.1: Minh hoạ quá trình làm mảnh
Thuật toán làm mảnh tổng quát bao gồm các bước cơ bản sau:
Bước 1: Dò biên theo thuật toán dò biên cải tiến trên.
Bước 2: Với mỗi đường biên. Kiểm tra điểm biên nếu thỏa mãn điều kiện xoá
thì xóa đi.
Bước 3: Nếu không còn điểm biên nào được đánh dấu xoá thì dừng, ngược lại
thì quay lại bước 1.
a) Ảnh gốc b) Ảnh xương (sau làm mảnh)
Hình 3.2: Một số đặc tính không mong muốn của xương
Sự khác biệt của thuật toán chính là điều kiện xóa, với điều kiện xóa khác nhau
sẽ cho ta các thuật toán làm mảnh khác nhau. Hình 3.2 minh họa ảnh xương khá tốt
nhưng vẫn có một số đặc điểm không mong muốn khi sử dụng một thuật toán cụ thể.
Trên cơ sở nghiên cứu một số ngoại lệ của các thuật toán làm mảnh với mục
đích sử dụng được những ưu điểm của thuật toán làm mảnh cụ thể nào đó và khắc
phục những nhược điểm của nó. Chúng tôi đề nghị bổ sung thêm phần thông tin khai
báo trước cho mỗi thuật toán cần đảm bảo và bổ sung thêm điều kiện xóa cho thuật
toán khi cài đặt. Thuật toán làm mảnh gồm các bước sau:
Bước 1: Dò biên theo thuật toán dò biên đã được cải tiến trong mục 2.1 nhằm
phát hiện tất cả các đường biên của đối tượng.
Bước 2: Với mỗi đường biên. Kiểm tra tính thỏa mãn của điểm biên theo các
thông tin khai báo trước và kiểm tra điều kiện xoá của thuật toán nếu thỏa mãn thì
điểm biên được xóa đi.
Bước 3: Nếu không còn điểm biên nào được đánh dấu xoá thì dừng, ngược lại
thì quay lại Bước 1.
*Một số thông tin khai báo trước cơ bản
a) Điều kiện đảm bảo tính liên thông
Ta đã biết một điểm ảnh là điểm liên thông khi ít nhất 2 điểm nền không gần
nhau trong 8-láng giềng.
Hình 3.3: Điểm đảm bảo liên thông
Thuật toán gặp phải một ngoại lệ đó là khi độ dầy của đối tượng là 2 trên một
đường biên. Khi đó, điều kiện liên thông bị phá vỡ, 2 điểm biên sẽ bị xoá, làm cho
đối tượng không còn liên thông nữa. Để giải quyết ngoại lệ này cần kiểm tra khi nào
đối tượng có độ dầy 2 thì xoá luôn điểm đang xét.
a) Độ dầy 2 phải-trái b) Độ dầy 2 trên-dưới
Hình 3.4: Độ đầy 2 của đối tượng
b) Điều kiện đảm bảo xương có dạng mảnh
Một điểm biên được gọi là điểm xương dạng mảnh nếu thoả mãn:
• Điểm cuối góc là điểm cuối và chỉ có 1 láng giềng 8.
• Điểm cô lập là điểm không có láng giềng nào.
;
• Điểm cuối của đường thẳng là điểm cuối và chỉ có 1 láng giềng 4.
• Điểm liên kết là điểm mà khi ta bỏ nó đi thì mất tính liên thông.
1
Áp dụng tiêu chuẩn này kết hợp với thuật toán tìm xương dựa trên làm mảnh
theo điều kiện xoá của các thuật toán đã biết để thu được xương có dạng mảnh mà
vẫn đảm bảo tính liên thông. Kết quả thực nghiệm cho thấy chất lượng làm mảnh tốt,
đặc biệt là không bỏ đi những đối tượng có kính thước đều, thông thường sẽ bị làm
mảnh thành một điểm và bị xóa đi.
a) Ảnh gốc
b) Làm mảnh không có thông tin khai báo trước c) Làm mảnh với thông tin khai báo trước
Hình 3.5: Xương dạng mảnh đảm bảo một số tiêu chuẩn đề ra
Hình 3.5a là ảnh gốc. Hình 3.5b là ảnh làm mảnh thông thường, các đường
chấm nét bị làm mảnh thành một điểm và bị xóa đi. Hình 3.5c là ảnh kết quả thực
hiện việc làm mảnh với thông tin khai báo ràng buộc trước, các đường nét chấm được
làm mảnh và vẫn giữ được các chấm điểm.
3.2. PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN DỰA VÀO CHU TUYẾN
Hệ thống xử lý ảnh văn bản thường phải giải quyết bài toán phát hiện góc
nghiêng như một bước đầu tiên và tất yếu. Dựa vào tính chất mỗi đối tượng ảnh có
duy nhất một chu tuyến ngoài và quan niệm con người nhận ra độ nghiêng của văn
bản dựa vào cỡ chữ chiếm chủ đạo trong văn bản. Việc xác định góc nghiêng văn bản
được xác định nhờ phép biến đổi Hough cho những điểm giữa đáy của hình chữ nhật
nhỏ nhất bao quanh đối tượng ảnh cho các đối tượng ảnh có kích thước chủ đạo.
3.2.1. Tính toán kích thước chủ đạo của các đối tượng ảnh
Áp dụng biến đổi Hough cho những điểm giữa đáy của các hình chữ nhật ngoại
tiếp các đối tượng có kích thước chủ đạo trong ảnh. Xác định được các hình chữ nhật
ngoại tiếp các đối tượng hay nói cách khác là xác định biên các đối tượng.
2
Hình 3.6: Các hình chữ nhật ngoại tiếp đối tượng ảnh
Ở đây, ta dùng thuật toán dò biên đã được cải tiến trong chương 2 để xác định
biên cho các đối tượng trong ảnh văn bản. Hình chữ nhật ngoại tiếp đối tượng sẽ
được xác định ngay sau khi dò được biên cho đối tượng đó.
Dùng biến đổi Hough áp dụng lên đáy của các hình chữ nhật ngoại tiếp các đối
tượng này và ước lượng góc nghiêng cho văn bản sau khi đã loại bớt đi một số đối
tượng bằng các ngưỡng kích thước.
3
y
x.cosϕ+y.sinϕ = r1
ϕ
Hough[ϕ][r1] = 3
x
0
x.cosϕ+y.sinϕ = r2
Hough[ϕ][r1] = 4
Hình 3.7:
Ví dụ về một ảnh văn bản
nghiêng với nhiều loại đối
tượng
3.2.2. Biến đổi Hough và phát hiện góc nghiêng văn bản
3.2.2.1. Đường thẳng Hough trong tọa độ cực
Trong tọa độ cực, mỗi điểm (x,y) trong mặt phẳng được biểu diễn bởi cặp (r,ϕ),
và mỗi đường thẳng trong mặt phẳng cách gốc tọa độ r và tạo với hoành độ góc ϕ
được đặc trưng bởi một cặp (r,ϕ).
Hình 3.8: Đường thẳng Hough trong toạ độ cực
3.2.2.2. Áp dụng biến đổi Hough trong phát hiện góc nghiêng văn bản
Áp dụng biến đổi Hough trong phát hiện góc nghiêng văn bản bằng cách dùng
một mảng tích luỹ đếm số điểm ảnh nằm trên một đường thẳng trong không gian ảnh.
Sau đó tính tổng số điểm ảnh nằm trên những đường thẳng song song nhau theo các
góc lệch thay đổi. Góc nghiêng văn bản tương ứng với góc có tổng giá trị mảng tích
luỹ cực đại.
Hình 3.9. Biến đổi Hough phát hiện góc nghiêng
ϕ
y
0
H
x
x.cosr ϕ+y.sinϕ=r
3.2.2.3. Thuật toán phát hiện và hiệu chỉnh góc nghiêng văn bản
a) Xử lý ngoại lệ
Sau giai đoạn tiền xử lý ảnh ta thu được ảnh trung gian TempImage. Thuật toán
phát hiện góc nghiêng sẽ làm việc với ảnh trung gian này để tìm ra góc nghiêng cho
văn bản và sau đó dùng thuật toán quay ảnh để quay ảnh ban đầu với góc nghiêng
vừa tìm được.
Ảnh có quá ít ký tự
Hình 3.10: Ví dụ về một ảnh nghiêng có ít ký tự chữ cái
Các đối tượng bao nhau
Phải nhận ra được sự bao hàm giữa các đối tượng và tách, lấy được các đối
tượng ký tự bị bao bởi các đối tượng lớn hơn.
Hình 3.11: Ví dụ về văn bản nghiêng có các đối tượng chứa nhau
b) Thuật toán phát hiện góc nghiêng văn bản dựa vào biên
Giả sử ảnh đầu vào là ảnh màu Image. Thuật toán phát hiện và chỉnh sửa góc
nghiêng văn bản được thực hiện theo các bước chính sau:
Bước 1: Tiền xử lý ảnh màu Image được ảnh trung gian TempImage
Bước 2: Xác định chu tuyến ngoài cho các đối tượng:
Bước 3: Dùng mảng Rec[N] xác định các giá trị ngưỡng trung bình WidAvr,
HeiAvr và PrmAvr.
Bước 4: Ápdụng biến đổi Hough
Bước 5: Dùng mảng kết quả Hough[360][Dis] ước lượng góc nghiêng ϕ.
Bước 6: Quay lại ảnh Image với góc lệch ϕ vừa xác định được từ bước 5.
Kết quả thử nghiệm đã chứng minh tính chính xác của thuật toán và khả năng
làm việc với nhiều loại văn bản khác nhau có các góc lệch khác nhau.
4
a) Một ảnh văn bản nhiều màu và có góc
nghiêng và ảnh kết quả sau khi sửa nghiêng
b) Một ảnh bản đồ có ít ký tự nghiêng góc
và ảnh kết quả sau khi sửa nghiêng
Hình 3.12: Một số loại ảnh màu mà thuật toán thực hiện hiệu chỉnh
3.3. MỘT THUẬT TOÁN CẮT CHỮ IN DÍNH Ở MỨC TỪ DỰA VÀO
CHU TUYẾN
3.3.1. Đặt vấn đề
Điểm mấu chốt của vấn đề nhận dạng chữ in nói chung và chữ Việt in nói riêng
là phải cô lập được chúng. Việc cô lập các chữ được tiến hành sau khi tiến hành phân
tích trang để tách các khối, từ các khối tách ra các dòng, từ các dòng tách ra các từ và
các từ tách ra các ký tự.
Hình 3.13: Ví dụ về chữ Việt in bị dính và bị chèn
Hình trên là một số ví dụ về kí tự chữ Việt in bị dính và bị chèn mà phần mềm
VnDOCR(*) phiên bản 2.0 sử dụng phép cắt theo VPP nên phép cắt không chính xác.
Nguyên do, vì đối với những chữ chất lượng xấu như thế này, những chỗ dính có diện
tích tiếp xúc còn lớn hơn cả diện tích tiếp xúc của các phần của một chữ.
Xuất phát từ hoàn cảnh đó trong mục này trình bày một kỹ thuật cắt chữ Việt in
dính nhờ việc sử dụng các tính chất của chu tuyến và vị trí tương hỗ giữa chúng với
đối tượng trực tiếp là các chữ in dính mà phần mềm VnDOCR2.0 sau khi sử dụng
phương pháp cắt chữ VPP không cắt được.
3.3.2. Một số khái niệm cơ bản
Cặp điểm thắt: Là cặp điểm nằm trên chu tuyến ngoài của một từ hay một cụm
chữ dính mà khoảng cách giữa chúng nhỏ hơn nhiều so với khoảng cách dọc theo chu
tuyến giữa chúng.
(*) Phần mềm đoạt giải nhất “Sáng tạo khoa học kỹ thuật Việt Nam” (giải VIFOTECH trước đây) năm 1999.
5
Ng ng th t (L): Là t s kho ng cách t i a gi a 2 i m d c theo chu tuy n
và kho ng cách gi a chúng trong c p i m thu c chu tuy n ang xét coi là c p
i m th t.
Ng ng quét (S): Là s i m cách i m ang xét v hai phía trên ng i
ang xét.
M t c t (M): Là kho ng cách t ng i gi a 2 c p i m th t li n nhau v 2
phía. Trong m t t có th có nhi u i m th t và các i m th t ó có th r t g n nhau
(cách nhau kho ng 1,2,3,5,6 pixel) i u này làm cho nét c t s không m nh vì v y
c n ph i có kho ng cách gi a các i m th t. Ví d : Khi M = 0 thì ch ng trình s
nh n ra 1 lo t các i m th t và a ra các quy t nh c t nh trong hình 3.14.b Khi
M= 5 thì ch ng trình a ra quy t nh c t nh trong hình 3.14.c
c)
a) M=5
ng c t
M=0
T p ng c t
b)
Hình 3.14: Ví d v ng c t và m t c t
3.3.3. Thu t toán c t ch in dính d a vào chu tuy n
3.3.3.1. Phân tích bài toán
Ý t ng chính v vi c c t ch in dính là “g n nhà, xa ngõ”, d a vào các c
i m c a các c p i m th t ra quy t nh c t.
V i m i m t t hay m t c m ch dính, tr c tiên ta ti n hành tách ra các chu
tuy n, sau ó d a vào chu tuy n ngoài, tìm ra các c p i m th t. Trong các nghiên
c u tr c các tác gi ã ch ra r ng m i i t ng nh, ây là m t t hay m t c m
ch dính, t n t i duy nh t m t chu tuy n ngoài.
Ch tr c khi dò biên Ch sau khi dò biên
Chu tuy n trong
Chu tuy n ngoài
Quá trình tìm c p i m th t
i m ang xét
i m phân n a trên và n a d i
chu tuy n ngoài
Hình 3. 15. Quá trình tìm chu tuy n và c p i m xét duy t
a) C m ch dính b) Các c p i m th t tìm c c) Các c p i m c t sau khi tính t i v trí
t ng h c a chu tuy n trong
Hình 3.16. Th c hi n c t ch in dính có tính n v trí t ng h c a chu tuy n trong
N a chu tuy n d i
N a chu tuy n trên
6
3.3.3.2. Thuật toán cắt chữ dính dựa vào chu tuyến
Thuật toán cắt chữ in dính dựa vào chu tuyến được đặc tả bằng ngôn ngữ
RAISE.
Trong số gần 90 cụm từ mà VnDOCR không cắt được, chúng tôi đã cho áp dụng
kỹ thuật cắt chữ này và đã cắt được hơn 80 cụm chữ dính. Điều đó mở ra khả năng
tích hợp của kỹ thuật với các phương pháp VPP và VH truyền thống.
3.4. PHÁT HIỆN ĐỐI TƯỢNG CHUYỂN ĐỘNG
3.4.1. Phát hiện đối tượng chuyển động dựa theo hướng tiếp cận trừ khung
hình liên kề
Các khung hình được lấy từ tệp ảnh động video có dạng RGB 24 bit, và được
chuyển sang ảnh cấp sáng 256 màu (8 bit). Chúng ta gọi khung hình hiện thời là Ic,
khung hình liền trước Ip. Khung hình Igc, Igp cùng là ảnh xám 256 màu. Tiếp theo,
Igc, Igp được trừ theo từng điểm ảnh, và được so sánh với ngưỡng. Nếu giá trị tuyệt
đối nhỏ hơn giá trị ngưỡng thì coi là điểm giống nhau, ngược lại coi là khác nhau.
Iwb là ảnh đen trắng thể hiện vùng khác nhau giữa 2 khung hình, những điểm
khác nhau sẽ có màu trắng, ngược lại có màu đen.
Các hình 3.17, hình 3.18, và hình 3.19 minh họa của kỹ thuật trừ ảnh liền kề với
ngưỡng được đặt là 20, với những khung hình sai khác nhau ít sẽ làm cho ảnh Iwb có
màu đen (Ic, Ip có độ giống nhau lớn), còn với những khung hình có độ khác nhau
đáng kể, thì ngoài những đối tượng chuyển động, còn có nhiễu (do sự tương phản,
thời tiết...). Vì vậy, với kỹ thuật trừ khung hình liền kề có thể làm cho quá trình bám
đối tượng chuyển động bị mất đi (vì có thể có 2 khung hình có độ khác nhau không
đáng kể). Với kỹ thuật trừ khung hình liền kề chúng ta có được nhận xét sau:
• Chưa tối ưu được quá trình xử lý, vì phải xử lý tất cả khung hình có trong
đoạn video mặc dù chúng không có sự thay đổi (các đối tượng không chuyển
động).
• Thu được những thay đổi nhỏ đối với những đối tượng có chuyển động chậm
và có thể là không phân biệt được vì thay đổi ít, vì vậy mà khó có thể lấy
được toàn bộ đối tượng chuyển động.
• Chứa nhiều nhiễu, do thời tiết, độ tương phản, độ bóng làm thay đổi giá trị
màu ở những vùng không chuyển động.
Vì vậy, chúng ta sẽ không thực hiện trừ khung hình liền kề để phát hiện đối
tượng. Dưới đây chúng ta sẽ xem xét một hướng tiếp cận kết hợp: kỹ thuật trừ khung
hình, đo độ thay đổi, xét vị trí và kỹ thuật dò biên ảnh đa cấp xám để nâng cao hiệu
quả phát hiện đối tượng chuyển động.
3.4.2. Phát hiện đối tượng chuyển động theo hướng tiếp cận kết hợp
Đây cũng là một hướng tiếp cận dựa trên kỹ thuật trừ ảnh, độ đo tương tự, xét vị
trí tương đối giữa các vùng thay đổi giá trị màu ở các khung hình, phát hiện biên ảnh
đa cấp xám.
7
Dưới đây là bước thực hiện của thuật toán phát hiện đối tượng chuyển động theo
hướng tiếp cận kết hợp.
Bước 1 : Trừ ảnh và đánh dấu Iwb
Bước 2 : Lọc nhiễu trên ảnh Iwb, phát hiện độ dịch chuyển
Bước 3 : Phát hiện biên Igc
Bước 4 : Kết hợp Igc với Iwb
3.4.2.1. Trừ ảnh và đánh dấu Iwb
Đây là bước phát hiện vùng khác biệt dựa trên kỹ thuật trừ điểm ảnh, giá trị
ngưỡng đặt bằng 20. Tiến hành trừ từng điểm ảnh của Igc với Igp.
3.4.2.2. Lọc nhiễu và phát hiện độ dịch chuyển
Đây là bước để hạn chế được các vùng đốm dựa theo cửa sổ lọc nhiễu được
chọn là 5x5, 3x3 và vị trí thay đổi của vùng ảnh. Một tập Iwb được xử lý để lấy được
vị trí của vùng sáng. Nếu vị trí của vùng sáng thay đổi nhỏ hơn một giá trị ngưỡng thì
được coi là nhiễu, và lập tức được dập tắt. Kết quả chúng ta có được ảnh đen trắng
Iwb được lọc. Vùng sáng có độ lớn 1 điểm ảnh sẽ được dập tắt bởi cửa sổ 3x3.
c) Ảnh chưa lọc nhiễu d) Ảnh đã lọc
ễ
a) Ip b) Ic
Hình 3.20: a), b) là 2 khung hình có độ sai khác thỏa mãn ngưỡng,
c) Ảnh Iwb chưa lọc nhiễu, d) là ảnh Iwb sau khi lọc nhiễu
3.4.2.3. Phát hiện biên ảnh cấp xám Igc
Trong quá trình này, ảnh Igc được phát hiện biên dựa theo kỹ thuật phát hiện
biên trình bày trong mục 2.2.
8
a) Ic b) Igc
c) Iec
Hình 3.21: a) Ảnh gốc, b) Ảnh cấp
xám, c) Ảnh biên
3.4.2.4. Kết hợp ảnh Igc với Iwb
Ảnh sau khi đã được phát hiện biên Iec được xếp chồng với ảnh đen trắng Iwb.
Vùng đen trắng kết hợp với điểm biên sẽ cho ta được tập hợp các điểm bao quanh
vùng chuyển động. Những điểm biên của Iec gần với vùng trắng của Iwb được đánh
dấu lại trên Igc.
Những điểm được lưu lại sẽ được xử lý để lấy được hình bao quanh đối tượng
chuyển động đó. Và quá trình phát hiện được vùng biên của đối tượng chuyển động
kết thúc.
3.3.3. Thử nghiệm
Trong phần này, trình bày một số hình ảnh kết quả đạt theo hướng tiếp cận kết
hợp. Đoạn băng video có dạng avi, được quay tại ngã ba Bắc Nam thành phố Thái
Nguyên. Đoạn băng có độ lớn 14,01 MB. Dưới đây là một số hình ảnh thu được.
3.5. KẾT LUẬN VÀ VẤN ĐỀ NGHIÊN CỨU
Chương này đã trình bày một số ứng dụng cơ bản dựa trên các thuật toán phát
hiện biên được trình bày trong chương 2, cụ thể:
• Trình bày một cách tiếp cận trong việc cài đặt thuật toán làm mảnh dựa theo biên
thông qua việc bổ sung phần thông tin khai báo trước cho mỗi thuật toán. Nhờ đó
có thể phát huy được những ưu điểm của các thuật toán đã có và hạn chế được
những nhược điểm của nó.
• Đề xuất thuật toán phát hiện góc nghiêng văn bản một cách thông minh thông qua
việc tính toán kích thước chủ đạo của các đối tượng ảnh trong văn bản thông qua
kỹ thuật tính biểu đồ tần xuất kích thước hình chữ nhật nhỏ nhất bao quanh đối
tượng ảnh được xác định trong quá trình dò biên.
• Đề xuất một thuật toán cắt chữ Việt in dính nhờ việc sử dụng tính chất của đường
biên và vị trí tương hỗ giữa chúng. Việc sử dụng tính chất của chu tuyến, vị trí
tương hỗ giữa chúng và một số tính chất khác liên quan trong việc cắt chữ dính tỏ
ra khá hiệu quả đối lớp các chữ Việt in dính đã được áp dụng các phương pháp
truyền thống.
• Đưa ra hướng tiếp cận kết hợp dựa hai kỹ thuật chủ yếu là: kỹ thuật trừ ảnh và kỹ
thuật phát hiện biên để giải quyết bài toán phát hiện đối tượng chuyển động.
9
Phần kết luận
Luận án gồm 108 trang được viết dựa trên 9 bài báo đã tập trung nghiên cứu một
số phương pháp phát hiện biên, các kỹ thuật để nâng cao chất lượng biểu diễn biên và
ứng dụng của biên trong xử lý ảnh với các kết quả đạt được như sau:
1. Đề xuất một cải tiến cho thuật toán dò biên trên cơ sở nghiên cứu các ngoại lệ và
tìm cách khắc phục. Dựa vào cải tiến này, luận án đã trình một đề xuất xử lý các
thuật toán làm mảnh dựa vào biên.
2. Đưa ra một mối liên hệ mới của phép toán giãn nở trên cơ sở đó chứng minh một
cách chặt chẽ về mặt toán học cho các tính chất của các phép toán hình thái. Các
phép toán có nhiều ứng dụng trong nhận dạng và xử lý ảnh. Trên cơ sở đó đề xuất
một thuật toán phát hiện biên mới dựa vào các phép toán hình thái.
3. Đề xuất một thuật toán phát hiện biên dựa vào trung bình cục bộ. Thuật toán vừa
có tính chất của thuật toán phát hiện biên gián tiếp lại vừa có tính chất của phát
hiện biên trực tiếp. Do đó, về mặt nào đó đã phát huy được cả 2 ưu điểm của các
phương pháp phát hiện biên truyền thống.
4. Đề xuất thuật toán phát hiện góc nghiêng văn bản một cách thông minh thông qua
việc tính toán kích thước chủ đạo của các đối tượng ảnh trong văn bản thông qua
kỹ thuật tính biểu đồ tần xuất kích thước hình chữ nhật nhỏ nhất bao quanh đối
tượng ảnh được xác định trong quá trình dò biên.
5. Đề xuất một thuật toán cắt chữ Việt in dính nhờ việc sử dụng tính chất của đường
biên và vị trí tương hỗ giữa chúng. Việc sử dụng tính chất của chu tuyến, vị trí
tương hỗ giữa chúng và một số tính chất khác liên quan trong việc cắt chữ dính tỏ
ra khá hiệu quả hơn đối với lớp các chữ Việt in dính đã được áp dụng các phương
pháp truyền thống.
6. Đưa ra hướng tiếp cận kết hợp dựa trên kỹ thuật trừ ảnh và kỹ thuật phát hiện biên
để giải quyết bài toán phát hiện đối tượng chuyển động.
Vấn đề có thể nghiên cứu tiếp tục:
• Nghiên cứu sự chồng lấn giữa các đối tượng nhằm phát hiện ra các đường
biên bị che khuất hoặc tiếp giáp.
• Nghiên cứu phát hiện chuyển động của đối tượng dẫn đến hiểu hành vi của
đối tượng làm cơ sở trong bài toán giám sát tự động.
• Nghiên cứu ứng dụng xử lý biên trong y học như: đếm số hồng cầu trong
máu, phân loại ảnh X-quang v.v..
10
Danh mục công trình công bố
1- Phạm Việt Bình (2006), “Một tiếp cận mới trong phát hiện biên dựa vào các phép
toán hình thái”, Kỷ yếu Hội thảo Quốc gia lần thứ 8 - Một số vấn đề chọn lọc của
Công nghệ Thông tin và Truyền thông, Hải Phòng 25-27/08 /2005, Nxb KH&KT,
Hà Nội 2006, 82-91.
2- Phạm Việt Bình, Cao Lê Mạnh Hà, Đỗ Năng Toàn (2006), “Một cách tiếp cận mới
trong phát hiện biên của ảnh đa cấp xám”, Kỷ yếu Hội thảo Quốc gia lần thứ 8 -
Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông, Hải Phòng 25-
27/08 /2005, Nxb KH&KT, Hà Nội 2006, 92-102
3- Phạm Việt Bình, Ngô Mạnh Hùng, Đỗ Năng Toàn (2006), “Một cải tiến thuật toán
dò biên và ứng dụng trong làm mảnh đối tượng”, Kỷ yếu Hội thảo Khoa học Quốc
gia lần thứ 2 - nghiên cứu cơ bản và ứng dụng Công nghệ Thông tin-FAIR’05, TP
Hồ Chí Minh 23-24/09/2005, Nxb KH&KT, Hà Nội 2006, 474-482.
4- Đỗ Năng Toàn, Phạm Việt Bình, Vũ Thành Vinh (2005), “Kỹ thuật cắt chữ in dính
ở mức từ thông qua thực nghiệm”, Kỷ yếu Hội thảo Quốc gia lần thứ 6 - Một số
vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông, Thái Nguyên 29-
31/08/2003, Nxb KH&KT, Hà Nội 2005, 48-55.
5- Đỗ Năng Toàn, Phạm Văn Dũng, Phạm Việt Bình (2005), “Ứng dụng chu tuyến
trong phát hiện góc nghiêng văn bản”, Kỷ yếu Hội thảo Quốc gia lần thứ 7 - Một
số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông, Đà Nẵng 18-20/08
/2004, Nxb KH&KT, Hà Nội 2005, 432-441.
6- Đỗ Năng Toàn, Phạm Việt Bình (2004), “Một thuật toán cắt chữ in dính ở mức từ
dựa vào chu tuyến”, chuyên san Các công trình nghiên cứu và triển khai Công
nghệ Thông tin và Viễn thông, Tạp chí Bưu chính Viễn thông & Công nghệ Thông
tin, số 12 tháng 8/2004, 50-56.
7- Ngô Quốc Tạo, Phạm Việt Bình (2002), “Simplification of The Contours of
Houses”, Tạp chí Tin học và Điều Khiển học, Tập 18, Số 3, 2002, 262-267.
8- Phạm Việt Bình (2006), “Một số tính chất của phép toán hình thái và Ứng dụng
trong phát hiện biên”, Tạp chí Tin học và Điều khiển học, Tập 22, số 2, 2006,
155-163.
9- Phạm Việt Bình (2006), “Phát hiện biên dựa trên lọc trung bình và trung vị cục
bộ”, Tạp chí Tin học và Điều khiển học, Tập 22, số 3, 2006, 257-266.
11
Công trình được hoàn thành tại:
Viện Công nghệ thông tin
Người hướng dẫn khoa học: GS. TSKH. Bạch Hưng Khang
PGS. TS. Ngô Quốc Tạo
Phản biện 1: GS.TS Đặng Huy Ruận
Phản biện 2: PGS.TS Nguyễn Quang Hoan
Phản biện 3: PGS.TS Hồ Sỹ Đàm
Luận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp Nhà
nước họp tại: Hội trường Viện Công nghệ thông tin, Viện Khoa
học và Công nghệ Việt Nam.
Vào hồi 16 giờ 00 ngày 25 tháng 5 năm 2007
Có thể tìm hiểu luận án tại : Thư viện Quốc gia
Thư viện Viện Công nghệ Thông tin
12
13
Các file đính kèm theo tài liệu này:
- chuong_3.pdf
- chuong_1_va_2.pdf