Tóm tắt Luận án Bảo mật dữ liệu bằng kỹ thuật giấu tin trong audio

Chương 2 CÁC PHƯƠNG PHÁP GIẤU TIN TRONG ÂM THANH

2.1 Các kỹ thuật bổ trợ cho giấu tin

2.1.1 Các phép biến đổi từ miền thời gian sang miền tần số

2.1.1.1 Phép biến đổi Fourier rời rạc (DFT)

2.1.1.2 Phép biến đổi wavlet (DWT)

2.1.2 Xáo trộn dữ liệu

Mục đích của việc xáo trộn dữ liệu là gây khó khăn cho người thám tin,

làm cho họ khó khôi phục lại tin mật nếu biết thuật toán rút trích tin.

2.1.2.1 Xáo trộn dữ liệu theo chuỗi hoán vị

2.1.2.2 Xáo trộn dữ liệu bằng phép biến đổi Arnold

2.1.3 Kỹ thuật sinh chuỗi giả ngẫu nhiên

Các phương pháp giấu tin thường dùng kết hợp với các chuỗi ngẫu

nhiên để thực hiện giấu tin. Chẳng hạn như kỹ thuật trải phổ.

2.1.3.1 Bộ sinh đồng dư (congruential generator)

2.1.3.2 Bộ sinh Fibonacci

2.1.3.2 Bộ sinh số Mersenne Twister

2.2 Đánh giá các phương pháp giấu tin trong audio

pdf27 trang | Chia sẻ: lavie11 | Lượt xem: 640 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Bảo mật dữ liệu bằng kỹ thuật giấu tin trong audio, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ình 1.1. Sơ đồ trao đổi thông tin có dùng mã hoá. Mã hóa hoặc mật mã hóa dữ liệu là cơ chế chuyển đổi dữ liệu từ bản rõ sang một định dạng khác không thể đọc được gọi là bản mã để có thể ngăn cản những truy cập bất hợp pháp khi dữ liệu trao đổi thông tin. Có hai loại mã hóa chính là mã hóa khóa đối xứng và mã hóa khoá công khai. 1.2.1 Mã hóa khóa đối xứng 1.2.2 Mã hóa khoá công khai 1.3. Giấu thông tin Giấu thông tin là một kỹ thuật nhúng (giấu) một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác. Giấu thông tin nhằm hai mục đích, một là bảo mật cho dữ liệu được đem giấu, hai là bảo mật cho chính đối tượng được dùng để giấu tin. 4 1.3.1 Các thành phần của Hệ giấu tin Một hệ giấu tin gồm có các thành phần chính sau đây: + Thông điệp mật (secret message). + Dữ liệu chứa hay môi trường sẽ chứa tin mật (host signal). + Khoá viết mật K, tham gia vào quá trình giấu tin để tăng tính bảo mật. + Dữ liệu chứa tin mật hay môi trường đã chứa tin mật (stego signal). Sơ đồ của một hệ giấu tin như sau : Hình 1.5. Sơ đồ của hệ giấu tin số. 1.3.2 Phân loại giấu tin Các kỹ thuật giấu thông tin được phân biệt nhau bởi những đặc trưng, tính chất và ứng dụng. Ví dụ ta có thể phân loại các kỹ thuật giấu tin theo miền xử lý, kiểu tài liệu và theo khả năng tri giác của con người. 1.3.3 Các tính chất hệ giấu tin. 1.3.3.1 Tính “vô hình” (Tính bí mật) 1.3.3.2 Khả năng chống giả mạo (Tính toàn vẹn) 1.3.3.3 Tính bền vững 1.3.3.4 Dung lượng tin giấu 1.3.3.5 Độ phức tạp tính toán 1.3.4 Tấn công hệ thống giấu tin. Tấn công một hệ giấu tin là các phương pháp để phát hiện, phá huỷ, trích rút hay sửa đổi tin mật. Sau đây là một số dạng tấn công. 1.3.4.1 Phân tích file chứa tin Quá trình Giấu tin Quá trình Giải tin Khoá K Khoá K Host Signal Stego Signal Network Secret message Host Signal Secret message 5 1.3.4.2 Đối sánh với dữ liệu gốc 1.3.4.3 Định dạng lại 1.3.4.4 Tấn công theo kiểu nén 1.3.5 Các ứng dụng của giấu tin 1.3.5.1 Liên lạc bí mật 1.3.5.2 Bảo vệ bản quyền (copyright protection) 1.3.5.3 Nhận thực hay phát hiện xuyên tạc thông tin (authentication and tamper detection) 1.3.5.4 Giấu vân tay hay dán nhãn (fingerprinting and labeling) 1.3.5.5 Điều khiển sao chép (copy control) 1.4 Giấu tin trong audio Giấu tin trên audio tập trung khai thác khả năng cảm nhận của hệ thính giác người (Human Auditory System). Hình 1.9. Hệ thống thính giác của con người. 1.4.1 Ngưỡng nghe Phạm vi nghe của tai người trong khoảng từ 20Hz đến 20 kHz nhưng nghe rõ nhất đối với âm thanh trong phạm vi từ 1kHz đến 4kHz. 1.4.2 Hiện tượng masking Hiện tượng che khuất tín hiệu âm thanh (auditory masking) xảy ra khi một âm thanh này ảnh hưởng đến sự cảm nhận của âm thanh khác. Âm thanh bị che gọi là maskee, âm thanh che là masker. Hiện tượng masking xảy ra trên cả miền thời gian lẫn miền tần số. 6 1.5 Biểu diễn âm thanh trên máy tính 1.5.1 Biểu diễn âm thanh số Để lưu trữ, xử lý âm thanh bằng máy tính, các tín hiệu âm thanh cần phải được chuyển từ dạng tương tự sang dạng số. Hình 1.17 thể hiện quá trình lấy mẫu, lượng tử hoá khi chuyển tín hiệu ở dạng tương tự sang dạng số. Hình 1.17. Lượng tử hoá và biểu diễn dạng số tín hiệu tương tự 1.5.2 Các định dạng âm thanh phổ biến trên các nền tảng máy tính Các phương pháp giấu tin phụ thuộc vào định dạng âm thanh, kiểu âm thanh trên các nền tảng khác nhau. Ngoài ra tỉ lệ dữ liệu giấu cũng phụ thuộc vào file âm thanh ở dạng nén hay ở dạng thô. 1.6 Một số chương trình giấu tin trên audio. Có nhiều chương trình cho phép giấu tin trong audio như MP3Stego, OpenPuff. Tổng kết chương 1 Trong chương 1 trình bày tổng quan về an toàn thông tin và các khái niệm liên quan bài toán giấu tin, phân loại giấu tin và các ứng dụng của giấu tin. Trong chương này cũng trình bày về đặc tính của hệ thống thính giác của con người, cách biểu diễn âm thanh trên máy tính, các định dạng âm thanh và một số phần mềm giấu tin vào dữ liệu audio đã triển khai trong thực tế. 7 Chương 2 CÁC PHƯƠNG PHÁP GIẤU TIN TRONG ÂM THANH 2.1 Các kỹ thuật bổ trợ cho giấu tin 2.1.1 Các phép biến đổi từ miền thời gian sang miền tần số 2.1.1.1 Phép biến đổi Fourier rời rạc (DFT) 2.1.1.2 Phép biến đổi wavlet (DWT) 2.1.2 Xáo trộn dữ liệu Mục đích của việc xáo trộn dữ liệu là gây khó khăn cho người thám tin, làm cho họ khó khôi phục lại tin mật nếu biết thuật toán rút trích tin. 2.1.2.1 Xáo trộn dữ liệu theo chuỗi hoán vị 2.1.2.2 Xáo trộn dữ liệu bằng phép biến đổi Arnold 2.1.3 Kỹ thuật sinh chuỗi giả ngẫu nhiên Các phương pháp giấu tin thường dùng kết hợp với các chuỗi ngẫu nhiên để thực hiện giấu tin. Chẳng hạn như kỹ thuật trải phổ. 2.1.3.1 Bộ sinh đồng dư (congruential generator) 2.1.3.2 Bộ sinh Fibonacci 2.1.3.2 Bộ sinh số Mersenne Twister 2.2 Đánh giá các phương pháp giấu tin trong audio 2.2.1 Đánh giá bằng các độ đo 2.2.1.1 Độ đo SNR Giá trị của SNR chỉ số lượng thay đổi trên dữ liệu chứa do chèn dữ liệu mật vào và được tính theo thang độ decibel. (2.5) 2.2.1.2 Độ đo MSE (Mean Squared Error) MSE dùng để đo độ méo (distortion) của âm thanh. Nó được tính theo (2.6), trong đó x(n) là âm thanh gốc và y(n) là âm thanh chứa tin giấu. (2.6) 8 2.2.1.3 Khoảng cách Czenakowski (Czenakowski Distance) 2.2.2 Đánh giá bằng các phần mềm phát hiện tin 2.2.3 Đánh giá bằng bảng đánh giá ODG (Object Difference Grade) 2.3. Một số phương pháp giấu tin trong âm thanh 2.3.1 Phương pháp điều chỉnh bit ít quan trọng nhất (LSB coding) Ý tưởng chính của kỹ thuật này là thay thế các bit cuối cùng của mẫu dữ liệu bằng các bit cần giấu để giấu tin. 0 1 0 1 1 1 1 0 Sau khi giấu bit 1 sẽ như sau: 0 1 0 1 1 1 1 1 Hình 0.1. Điều chỉnh bit thấp nhất của mẫu để giấu bit 1. 2.3.2 Phương pháp chẵn lẻ (parity coding) Phương pháp chẵn lẻ cũng tương tự như phương pháp mã hoá LSB nhưng thay vì dùng một mẫu dữ liệu sẽ một nhóm các mẫu. 2.3.3 Phương pháp mã hoá pha (phase coding) Phương pháp mã hoá pha giấu tin thông qua việc thay thế pha của một segment audio ban đầu bằng một pha tham chiếu thể hiện dữ liệu. Hình 2.9 Sự dịch chuyển pha của tín hiệu 2.3.4 Phương pháp mã hoá tiếng vọng (Echo coding) Phương pháp mã hoá tiếng vọng nhúng tin vào một tín hiệu âm thanh gốc bằng cách thêm tiếng vọng vào tín hiệu gốc. Ta có công thức giấu như sau: (2.9) 2.3.5 Phương pháp trải phổ 2.3.6 Phương pháp điều chỉnh biên độ Trong phương pháp này, thông tin được nhúng bằng cách thay đổi năng lượng của 2 hay 3 khối (block). 9 2.3.7 Phương pháp lượng tử hoá (Quantization) Phương pháp lượng tử hoá sẽ thay thế giá trị một mẫu x thành y để giấu tin. Công thức điều chỉnh x thành y như sau: (2.16) 2.3.8 Điều chế tỉ lệ thời gian Ý tưởng cơ bản của phương pháp này là thay đổi tỉ lệ thời gian giữa hai cực đang xét để giấu tin. 2.3.9 Phương pháp giấu dựa vào Patchwork 2.3.10 Phương pháp dựa vào các đặc trưng nổi bật Tổng kết chương 2 Chương hai của luận án đã trình bày về các kỹ thuật bổ trợ cho giấu tin trong audio, các kỹ thuật xáo trộn dữ liệu nhằm mục đích thay đổi thứ tự các bit dữ liệu mật khi giấu vào tín hiệu âm thanh, các kỹ thuật sinh số ngẫu nhiên, các phương pháp giấu và các tiêu chí đánh giá các thuật toán giấu tin. Chương 3 MỘT SỐ THUẬT TOÁN GIẤU TIN TRÊN MIỀN THỜI GIAN 3.1 Phương pháp giấu tin kết hợp mã Hamming Kỹ thuật giấu tin được kết hợp với các kỹ thuật mã hoá Hamming như là một cải tiến nhằm giúp cho người nhận tin hạn chế khả năng nhận tin sai. 3.1.1 Mã Hamming hỗ trợ xác thực Với mỗi nhóm 4 bit dữ liệu, mã Hamming thêm 3 bit kiểm tra. Thuật toán (7,4) của Hamming có thể sửa chữa bất cứ một bit lỗi nào, và phát hiện tất cả lỗi của 1 bit, và các lỗi của 2 bit gây ra [75]. Mã Hamming dùng hai ma trận G và H để mã hoá và kiểm tra lỗi. 3.1.2 Quá trình giấu tin Đầu vào: - File âm thanh gốc C - Chuỗi bit M cần giấu có độ dài L (L là bội số của 8) Đầu ra: - File âm thanh chứa tin giấu C’. 10 Bước 1) Mã hóa Bước 2) Giấu tin - Đọc file chứa C, trích phần header và phần dữ liệu. - Kiểm tra file chứa có đủ để giấu chuỗi bit M’ không. Nếu không đủ thì thì dừng và báo không giấu được. Ngược lại sẽ ghi header của vào C’ sau đó thực hiện giấu từng bit của chuỗi M’ vào phần dữ liệu của C để ghi ra C’ như sau : + Trích tuần tự 3 mẫu dữ liệu của C và tính tổng. Nếu bit đang xét của M’ là 1 mà tổng lẻ thì không phải phải làm gì, ngược lại điều chỉnh mẫu số 2 của 3 mẫu đang xét để cho tổng là số lẻ. Nếu bit đang xét của M’ là 0 mà tổng chẵn thì không phải phải làm gì, ngược lại điều chỉnh mẫu thứ 3 (hoặc mẫu thứ 1) của 3 mẫu đang xét để cho tổng là số chẵn. + Ghi 3 mẫu đang xét ra file C’. - Lặp lại hai bước con trên bước trên cho đến khi toàn bộ các bit của chuỗi M’ đã được giấu. - Ghi các mẫu còn lại từ C vào C’ và kết thúc. 3.1.3 Quá trình giải tin xác thực tin giấu Đầu vào: - File âm thanh chứa tin giấu C’, độ dài chuỗi bit cần lấy. Đầu ra: - Chuỗi bit M cần lấy, hoặc kết luận không lấy tin. Bước 1) Trích thông tin Dựa vào khóa k, kỹ thuật giấu và số bit giấu đã được biết trước, ta tiến hành trích chuỗi bit từ dữ liệu C’’, kết quả ta thu được M’. Bước 2) Xác thực Chia M’ thành các đoạn có độ dài 7, tiến hành nhân từng đoạn này với H để kiểm tra có lỗi hay không. Nếu không có lỗi hoặc lỗi có thể sửa được thì trích các bit trong mỗi đoạn, ngược lại không thì không lấy tin. 11 Hình 3.3 dưới đây là thử nghiệm giấu 100 byte dữ liệu vào file âm thanh file WindowsLogOn.wav, hình minh hoạ cho đoạn đầu gồm 10000 mẫu. Hình 3.3 Dữ liệu âm thanh gốc (trên) và dữ liệu có chứa tin mật (dưới) 3.1 Phương pháp giấu điều chỉnh giá trị nhóm bit Quá trình giấu tin cũng gồm 2 giai đoạn. Giai đoạn 1 sẽ dùng khoá mật K để sinh ra chuỗi ngẫu nhiên gồm L số, trong đó L là chiều dài chuỗi bit mật. Giai đoạn 2 sẽ giấu lần lượt từng bit của chuỗi tin mật vào trong file âm thanh dựa vào chuỗi ngẫu nhiên đã sinh. Việc giấu tin dựa vào chuỗi ngẫu nhiên nhằm mục đích tăng cường tính mật cho tin giấu trong dữ liệu audio. 3.2.1 Sinh chuỗi ngẫu nhiên Khoá K gồm ba số (x, y, N) sẽ được dùng như số mồi và hệ số trong công thức sinh để sinh chuỗi S, chuỗi ngẫu nhiên gồm L số. Công thức (3.3) dùng để sinh dãy SRN: (3.3) 3.2.2 Điều chỉnh độ lệch bit Nếu đổi bit ở vị trí 3 từ 0 thành 1, ta sẽ đổi các bit ở vị trí 2 và ở vị trí 1 thành 0 và nếu đổi bit ở vị trí 3 từ 1 thành 0 ta sẽ đổi các bit ở vị trí 2 và ở vị trí 1 thành 1. Tương tự, nếu đổi bit ở vị trí 2 từ 0 thành 1, ta sẽ đổi bit ở vị trí 1 thành 0 và nếu đổi bit ở vị trí 2 từ 1 thành 0 ta sẽ đổi bit ở vị trí 1 thành 1. 3.2.3 Thuật toán giấu tin Đầu vào: - File âm thanh A, chuỗi M có độ dài L, khoá K gồm ba số (x, y, N). 12 Đầu ra: - File âm thanh A’ có chứa chuỗi bit M. Bước 1) Chuẩn bị: Dựa vào khoá (x, y, N) sinh ra mảng S[] cho biết mẫu dữ liệu được chọn để giấu tin và mảng V[] cho biết vị trí bit sẽ được giấu trong mỗi mẫu. Bước 2) Giấu tin - Đọc file dữ liệu âm thanh, dựa vào mảng S[] để chọn mẫu cần giấu. - Dựa vào mảng V[] để biết vị trị bit giấu. - Nếu bit thứ Vi của mẫu chọn thứ i khác với Mi thì thực hiện DIEUCHINH(Vi, Mi) Sau khi giấu xong, ta dùng các ký hiệu đánh dấu kết thúc tin giấu nhằm phục vụ cho quá trình giải tin. 3.2.3.1 Sinh mảng S[] (3.4) 3.2.3.2 Sinh mảng V[] (3.5) 3.2.4 Quá trình giải tin Đầu vào: File âm thanh A’ chứa tin giấu, khoá K gồm ba số (x, y, N), độ dài L của chuỗi bit cần lấy. Đầu ra: Chuỗi bit M được giấu. Bước 1) Chuẩn bị: Sinh mảng V[] và S[] Bước 2) Giải tin Đọc file dữ liệu âm thanh A’, dựa vào mảng S[] để chọn mẫu có chứa bit thông tin giấu, dựa vào mảng V[] để lấy bit thứ i của mẫu tin giấu. 3.2.5 So sánh với phương pháp LSB nguyên thuỷ 3.2.5.1 Chi phí thời gian giấu tin và giải tin So với kỹ thuật LSB, phương pháp này cần phải tốn thời gian cho việc sinh chuỗi giả ngẫu nhiên, chuỗi S[] và chuỗi V[] và phải tốn chi phí thời gian cho việc điều chỉnh bit để giảm độ chênh lệch giá trị trước và sau khi giấu. 13 3.2.5.2 Tỉ lệ dữ liệu giấu So với phương pháp LSB nguyên thuỷ này có tỉ lệ dữ liệu giấu chỉ bằng ¼. 3.2.5.3 Độ mật của kỹ thuật 3.3. Phương pháp điều chỉnh 2 mẫu trong một đoạn khối 25 mẫu 3.3.1 Xáo trộn dữ liệu Để xáo trộn dữ liệu, luận án đề xuất cách sử dụng phép biến đổi Arnold. 3.3.2 Thuật toán giấu 4 bit trong khối 25 mẫu dữ liệu Đầu vào: - Khối dữ liệu chứa F có kích thước 5*5, 4 bit mật b1b2b3b4 cần giấu. Đầu ra: - Khối dữ liệu chứa tin mật F’. Bước 1) Xây dựng ma trận A từ các LSB của khối F, A[i][j] = LSB(F[i][j]) Bước 2) Lấy 4 dòng đầu của A, mỗi dòng thực hiện phép exclusive-or tất cả các phần tử trong dòng, ta có r1r2r3r4. Bước 3) Lấy 4 cột đầu tiên của A, mỗi cột thực hiện exclusive-or tất cả các phần tử của mỗi cột để được c1c2c3c4. Bước 4) Thực hiện exclusive-or kết quả trong bước 2 và bước 3 để có s1s2s3s4 trong đó s1=r1 XOR c1, s2=r2 XOR c2 và tương tự như vậy. Bước 5) So sánh kết quả của bước 4 với 4 bit cần giấu b1b2b3b4. Nếu không có sự khác nhau thì không cần phải điều chỉnh trên khối bit A. Ngược lại, cần xét các trường hợp sau: • Nếu có khác nhau 1 bit bi tại vị trí i thì A[i][5] được điều chỉnh lật. • Nếu có khác nhau trên 2 bit bi và bj tại vị trí i và j thì A[i][j] được lật. • Nếu có khác nhau trên 3 bit bi, bj và bk tại 3 vị trí i, j, k thì A[i][j] được lật và A[k][5] được lật. • Nếu có khác nhau trên cả 4 bit bi, bj, bk và bm tại 4 vị trí i, j, k, m thì thực hiện lật A[i][j] và A[k][m] Bước 6) Đặt các bit LSB của khối F[i][j] giống A[i][j] ta được khối F’. 14 Ví dụ ta có đoạn audio gồm 25 mẫu có giá trị như hình 3.10 (tương ứng với ma trận F và ma trận A) Hình 3.10 Ma trận F và A tương ứng từ các mẫu dữ liệu Ta tính các vector r, c, s như các hình sau: Hình 3.11 Kết quả XOR 4 cột đầu tiên của từng hàng Hình 3.12 Kết quả XOR 4 dòng đầu tiên của từng cột Hình 3.13. Kết quả XOR của chuỗi C và chuỗi R Nếu ta cần giấu bốn bit 1100, có 3 bit khác nhau với S ở vị trí 1, 2 và 3, vì thế ta lật giá trị ô A[1][2] A[3][5]. Kết quả điều chỉnh như trong hình 3.16. Hình 3.14. Kết quả giấu 4 bit 1100 trong khối F. 3.3.3 Thuật toán giấu tin Đầu vào: - File âm thanh gốc F, khoá mật K, thông điệp mật M. Đầu ra: - File âm thanh chứa tin mật F’. 18 39 65526 8 65526 20 27 40 50 18 37 42 4 78 65519 46 65514 29 65508 31 65500 5 65486 0 65482 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 0 r1 r2 r3 r4 1 1 0 0 c1 c2 c3 c4 1 1 1 0 s1 s2 s3 s4 0 0 1 0 18 38 65526 8 65526 20 27 40 50 19 37 42 4 78 65518 46 65514 29 65508 31 65500 5 65486 0 65482 0 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 1 0 1 0 1 0 0 0 15 Bước 1) Xáo trộn chuỗi M Bước 2) Chia dữ liệu file âm thanh thành các segment gồm 25 mẫu, sau đó chuyển sang các khối vuông Fi kích thước 5*5. Bước 3) Thực hiện bước sau cho đến khi toàn bộ thông điệp M’ được giấu vào trong các khối: Lấy lần lượt 4 bit của M’ giấu vào mỗi khối Fi, sử dụng sơ đồ giấu MCPT trên. Bước 4) Chuyển tất cả các khối Fi sang lại dạng vector và ghi ra file F’. Ghi các mẫu còn lại từ F vào F’. 3.3.4 Thuật toán giải tin Thuật toán giải tin gồm hai bước. Đó là tách các bit trong khối rồi thực hiện việc khôi phục lại chuỗi bit. 3.3.5 Kết quả thử nghiệm và đánh giá Kết quả thử nghiệm cho thấy file chứa tin và file gốc có cùng ảnh hưởng đến hệ thống thính giác con người, không thể phân biệt được sự khác nhau. 3.4. Phương pháp điều chỉnh 1 bit để giấu 8 bit dữ liệu 3.4.1 Xáo trộn dữ liệu bằng phương pháp hoán vị 3.4.2 Tính tổng XOR của đoạn Giá trị này được đặt tên là HD_sum. Đầu vào: Đoạn S gồm 256 mẫu chứa giá trị nguyên, Đầu ra: Một số nguyên được gọi là HD_sum của đoạn S. Bước 1) Từ mảng S ta xác định mảng Q có cùng kích thước với S, trong đó Q[i] = S[i]%2. Bước 2) h=0; Bước 3) Lặp i từ 0 đến 255: Nếu (Q[i]!=0) thì h = XOR(h,i); Bước 4) Trả về h; Ở đây XOR là phép toán XOR (exclusive-or). 3.4.3. Thuật toán giấu một byte dữ liệu vào trong khối 256 mẫu. Đầu vào: - Đoạn dữ liệu chứa 256 mẫu (S[0..255]) và byte cần giấu p. 16 Đầu ra: - Đoạn chứa tin (stego - segment) S[0..255]. Bước 1) Tính HD_sum của đoạn S: h=HD_sum(S); Bước 2) Tìm vị trí của mẫu cần thay đổi để giấu tin: pos= XOR (h, p); Bước 3) Lật một bit của mẫu tại vị trí pos để giấu byte p: Nếu giá pos =0 thì không cần phải điều chỉnh mẫu nào trong đoạn S. Nếu giá trị pos > 0 thì cần phải điều chỉnh mẫu tại vị trí pos tham gia trong quá trình tính HD_sum hoặc không : Q[pos] = 1 - Q[pos]; Bước 4) Điều chỉnh giá trị mẫu tại ví trí pos để giấu tin nếu pos>0 Nếu Q[pos] = 0 thì S[pos]= S[pos] +1, ngược lại S[pos]= S[pos] - 1. Thuật toán giấu tin trong file: Giấu lần lượt từng byte vào các khối. Thuật toán giải tin Đầu vào: - File chứa tin mật, khoá (k, d) và q là số byte cần lấy. Đầu ra: - Thông điệp mật M. Bước 1) Lấy h=   ddq */ đoạn từ file chứa tin mật, mỗi đoạn chứa 256 mẫu. Bước 2) Lặp thao tác dưới đây h lần để lấy h byte từ các đoạn, mỗi byte trong mỗi đoạn, byte thứ i được gán cho M’[i]. M’[i] =HD_sum(Si). Bước 3) Đối với mỗi đoạn gồm d byte của chuỗi M’, dùng phép biến đổi khôi phục lại chuỗi tin M như thuật toán đã trình bày ở mục 3.4.1. 3.5. Phương pháp điều chỉnh tiếng vọng 3.5.1 Sơ đồ giấu của Rios Chavez 3.5.2 Đánh giá kỹ thuật đề xuất bởi Rios Chavez Có thể nhận tin sai và thời gian tính toán lớn, có thể giảm xuống. 3.5.3. Kỹ thuật điều chỉnh tiếng vọng 3.5.3.1. Thêm tiếng vọng dựa vào số ngẫu nhiên Công thức để thêm tiếng vọng Để thêm tiếng vọng vào trong đoạn, ta sử dụng công thức (3.11) như sau: 17 (3.11) 3.5.3.2 Thuật toán giấu Đầu vào: - File audio gốc C, chuỗi bit W có độ dài L, khoá (a, b) và số N Đầu ra: - File chứa tin giấu S. Các bước của thuật toán giấu như sau: Bước 1) Sinh ra chuỗi R dựa vào khoá theo công thức (3.9), (3.10). Bước 2) Chia dữ liệu trên file gốc C thành các đoạn (frame) Ci có kích thước bằng nhau. Nếu số frame < độ dài chuỗi bit (L) cần giấu thì dừng. Bước 3) Gán giá trị các đoạn Si bằng Ci Dựa vào giá trị của Ri và giá trị bit cần giấu Wi, dùng công thức (3.11) để thêm tiếng vọng vào cho các đoạn Si. Bước 4) Ghi các đoạn Si ra file S và chép các mẫu còn lại từ C sang S. 3.5.3.3 Thuật toán giải tin Đầu vào: - File chứa tin S, file gốc C, khoá (a, b) và số N, số bit cần lấy L. Đầu ra: - Chuỗi bit W có độ dài L. Bước 1) Sinh ra chuỗi R dựa vào khoá theo công thức (3.9), (3.10). Bước 2) Chia dữ liệu file chứa tin giấu S và file gốc C thành các đoạn (frame) Si, Ci có kích thước bằng nhau. Bước 3) So sánh cepstrum của đoạn Ci với Si và dựa vào giá trị của Ri để trích bit 0 hoặc bit 1. Lặp bước 3 tuần tự cho các đoạn dữ liệu Ci ,Si cho đến khi lấy đủ L bit. 3.5.4. Kết quả thử nghiệm và đánh giá Kết quả đánh giá mức độ nhận biết cho thấy kỹ thuật này không gây ra bất kỳ hiệu ứng nào khi nghe giữa file trước và sau khi giấu tin. 18 Tổng kết chương 3 Trong chương 3 đã trình bày các thuật toán giấu tin trong file âm thanh. Đây là các thuật toán giấu trên miền thời gian. Các thuật toán đề xuất cách kết hợp với mã Hamming nhằm mục đích giảm thiểu nhận tin sai nếu file chứa tin bị tấn công, cách điều chỉnh bit nếu như giấu ở các bit cao chứ không phải LSB. Ngoài ra chương này cũng đề xuất cách giấu dựa vào đặc tính của đoạn dữ liệu, cải tiến cách giấu dùng phương pháp điều chỉnh tiếng vọng. Chương 4 MỘT SỐ THUẬT TOÁN GIẤU TIN TRÊN MIỀN BIẾN ĐỔI 4.1 Phương pháp điều chỉnh các hệ số trên miền biến đổi FFT 4.1.1 Điều chỉnh giá trị trong miền tần số Mỗi một đoạn Y có kích thước gồm fw mẫu sẽ được thực hiện phép biến đổi FFT. Phép biến đổi Fourier đã được trình bày ở chương 2. )(YFFTFY  (4.1) Sau khi thực hiện phép biến đổi FFT, giá trị FY nhận được là dãy các số phức. Số phức có thể thể biểu diễn lại trong hệ toạ độ cực bằng công thức sau: )sin(cos  irz  (4.2) Nếu thay đổi r thành r’ thì   sin'' cos'' ry rx   (4.5)  sin'*cos'' rirz  (4.6) 4.1.2 Thuật toán điều chỉnh mẫu để giấu một bit Đầu vào: Số phức z, bit thông tin mật cần giấu Mj, giá trị d. Đầu ra: Số phức z’. Bước 1) Tính biên độ và pha của z: amp = abs(z); phase= angle(z); Bước 2) Điều chỉnh giá trị r để giấu Mj Nếu Mj==1 Nếu mod (amp, d) < d/2 thì amp = amp + d/2; Ngược lại Nếu mod (amp, d)> =d/2 thì amp = amp + d/2; Bước 3) Tạo số phức mới và trả về: 19 r’=complex(amp*cos(phase),amp*sin(phase)); return r’; 4.1.3 Thuật toán giấu Đầu vào: Vector Y chứa các mẫu, chuỗi bit M có độ dài q, giá trị d, k, fw. Đầu vào: Vector Y’ chứa tin mật. Bước 1) Chia Y thành các đoạn có kích thước bằng nhau, chứa fw (frame width) mẫu trên mỗi đoạn. Thực hiện phép biến đổi FFT trên mỗi đoạn để chuyển từ miền thời gian sang miền tần số. Tính FYk = FFT (Yk). Bước 3) Đối với mỗi đoạn FYk, tính biên độ và kiểm tra xem đoạn có thoả điều kiện để giấu các bit không. Nếu thoả điều kiện giấu thì giấu. Bước 4) Thực hiện IFFT trên mỗi đoạn FY để chuyển FY từ miền tần số về lại miền thời gian lưu vào Y’ Bước 5) Trả về Y’. 4.1.4 Thuật toán lấy 1 bit mật từ 1 mẫu. Đầu vào: Số phức z, số d. Đầu ra: Số nhị phân Mi. Bước 1) Tính biên độ (amplitude) của z: amp = abs(z); Bước 2) Lấy bit Mi dựa vào Ri Nếu mod(amp,d)>d/2 thì Mi =1 Ngược lại Mi =0 Bước 3) return Mi Thuật toán giải tin Đầu vào: Vector Y’ chứa tin mật, độ dài chuỗi bit cần lấy q, số d, k, fw. Đầu ra: Chuỗi bit mật M. Bước 1) Chia Y’ thành các đoạn có cùng số mẫu là fw. Bước 2) Thực hiện FFT trên các đoạn Y để chuyển sang miền tần số: FYk = FFT (Yk). Tính biên độ cho đoạn và gán số bit đã nhận được h=0; 20 Bước 3) Đối với mỗi đoạn FYk, kiểm tra đoạn có chứa tin hay không dựa vào cách tính như trong quá trình giải tin. Nếu đoạn có chứa tin thì chọn 8 đỉnh đầu tiên trong đoạn để rút trích tin. M(h) = Getbit( FYk(i), d ); Bước 4) return M. Kết quả thử nghiệm và đánh giá Các kết quả thử nghiệm cho thấy quá trình giấu và rút trích thông tin hoàn toàn chính xác, không phân biệt được khi nghe file âm thanh gốc và file chứa tin. So với phương pháp giấu trên miền thời gian, phương pháp này có thể chịu được tấn công thêm nhiễu trắng. Nếu tỉ lệ gây nhiễu lớn hơn 90 thì không ảnh hưởng đến tin mật trong quá trình giải tin. 4.2 Phương pháp giấu tin trên miền biến đổi wavelet 4.2.1 Thuật toán giấu 1 bit Đầu vào: - Dãy D gồm fw phần tử D[1..fw], bit cần giấu b, số thực d. Đầu ra: - Dãy D đã được điều chỉnh để chứa bit mật b. Bước 1) Tính giá trị trung bình của nửa đoạn trước và nữa đoạn sau của D. (4.7) Bước 2) Tính giá trị lệch giá trị trung bình giữa hai đoạn, theo modulo d: Bước 3) Điều chỉnh giá trị để giấu bit b: Nếu b=1 và k> d/2 hoặc b=0 và k<= d/2 thì return; Ngược lại: Nếu b=1 thì cộng d/2 cho nữa đoạn trước: D[i]= D[i] + d/2, với i= 1 đến fw/2 Ngược lại thì cộng d/2 cho nữa đoạn sau D[i]= D[i] + d/2, với i= fw +1 đến fw 21 4.2.2. Thuật toán trích 1 bit Đầu vào: - Dãy D gồm fw phần tử D[1..fw], số thực d. Đầu ra: - Bit mật b. Bước 1) Tính giá trị trung bình của nửa đoạn trước và nữa đoạn sau của D theo công thức (4.7) Bước 2) Tính giá trị lệch giá trị trung bình giữa hai đoạn, theo modulo d: Bước 3) Trích bit b: Nếu k> d/2 thì b=1 ngược lại b=0 4.2.3 Thuật toán giấu tin Đầu vào: - Khoá K, file gốc H, chuỗi bit mật M. Đầu ra: - File chứa tin mật S. Phương pháp: Bước 1) Dùng khoá K để sinh ra chuỗi nhị phân ngẫu nhiên R. Bước 2) Biến đổi chuỗi bit mật M thành M’ dựa vào R, trong đó: (4.8) Bước 3) Đọc dữ liệu các mẫu từ file audio H vào mảng y. Thực hiện biến đổi wavelet cho dãy y. Bước 4) Chia dãy D thành các đoạn có cùng kích thước fw và điều chỉnh các đoạn giấu lần lượt từng phần tử vào các đoạn , ta được . Bước 5) Biến đổi wavelet ngược [A, D’] để có được y’ và ghi y’ ra file S. 4.2.4 Thuật toán trích tin Đầu vào: - Khoá K, file chứa tin S. Đầu ra: - Chuỗi bit mật M. Bước 1) Đọc dữ liệu các mẫu từ file audio S vào mảng y. Thực hiện biến đổi wavelet cho dãy y. 22 Bước 2) Chia dãy D thành các đoạn có cùng kích thước fw và lấy lần lượt từng phần tử từ các đoạn theo thuật toán trích bit. Bước 3) Dùng khoá K để sinh ra chuỗi nhị phân ngẫu nhiên R. Bước 4) Biến đổi chuỗi M’ thành M dựa vào R theo công thức 4.8 và trả về. 4.2.5 Kết quả thử nghiệm Trong phần thử nghiệm, chúng tôi chọn các file âm thanh mono 16 bit, giá trị d là 0.1. Chúng tôi thực hiện tấn công thêm nhiễu và thay đổi số bit biểu diễn tín hiệu (16 bit xuống 8 bit) để kiểm tra tính bền vững của kỹ thuật đề xuất. Kết quả thử nghiệm cho thấy tấn công thay đổi số bit biểu diễu mẫu không ảnh hưởng đến tin giấu trong khi phép thê

Các file đính kèm theo tài liệu này:

  • pdftt_bao_mat_du_lieu_bang_ky_thuat_giau_tin_trong_audio_1287_1920315.pdf
Tài liệu liên quan