Tăng cường mức độ ổn định của thủy vân dựa trên mô hình ảnh đa tầng và các điểm đặc trưng ảnh
Tóm tắt. Bài bào trình bày một giải pháp nhằm tăng cường mức độ ổn định của thủy
vân khi nhúng vào ảnh dựa trên việc xử lí ảnh trong không gian tỉ lệ DoG (Difference of
Gaussian). Ý tưởng chính của thuật toán là việc phân tách ảnh thành các lớp trong không
gian tỉ lệ DoG và nhúng thủy vân vào dần các lớp ảnh này sử dụng mô hình JND đa tầng
(Just Noticeable Difference). Dựa trên mô hình này, một lược đồ nhúng thủy vân đảm bảo
tính trong suốt nhưng ổn định được đề xuất. Để tăng cường hơn nữa mức độ ổn định của
thủy vân trong việc chống lại các cuộc tấn công không đồng bộ, chúng tôi sử dụng các
điểm đặc trưng ảnh SIFT (Scale Invariant Feature Tranform). Việc phát hiện các điểm đặc
trưng và tính toán mặt nạ JND được thực hiện ngay trong từng tầng của không gian tỉ lệ
DoG nhằm làm giảm độ phức tạp của thuật toán. Một loạt các kết quả thí nghiệm được thực
hiện và đã chứng minh tính đúng đắn của thuật toán đề xuất. Thủy vân được nhúng hầu
như không được phát hiện bởi mắt thường và ổn định đối với một loạt các phép tấn công
không đồng bộ hóa như Print-Scan và Camorder.
Tóm tắt nội dung tài liệu: Tăng cường mức độ ổn định của thủy vân dựa trên mô hình ảnh đa tầng và các điểm đặc trưng ảnh
JOURNAL OF SCIENCE OF HNUE DOI: 10.18173/2354-1075.2015-0064 Educational Sci., 2015, Vol. 60, No. 7A, pp. 169-179 This paper is available online at TĂNG CƯỜNGMỨC ĐỘ ỔN ĐỊNH CỦA THỦY VÂN DỰA TRÊN MÔ HÌNH ẢNH ĐA TẦNG VÀ CÁC ĐIỂM ĐẶC TRƯNG ẢNH Phan Đăng Khuyên1, Nguyễn Phi Bằng2, Đặng Thành Trung3 1Trường THPT Phan Bội Châu, Thành phố Pleiku, Gia Lai 2Research Engineer, Engineering Human-Computer Interaction Research Group, LIG, Grenoble INP 3Khoa Công nghệ Thông tin, Trường Đại học Sư phạm Hà Nội Tóm tắt. Bài bào trình bày một giải pháp nhằm tăng cường mức độ ổn định của thủy vân khi nhúng vào ảnh dựa trên việc xử lí ảnh trong không gian tỉ lệ DoG (Difference of Gaussian). Ý tưởng chính của thuật toán là việc phân tách ảnh thành các lớp trong không gian tỉ lệ DoG và nhúng thủy vân vào dần các lớp ảnh này sử dụng mô hình JND đa tầng (Just Noticeable Difference). Dựa trên mô hình này, một lược đồ nhúng thủy vân đảm bảo tính trong suốt nhưng ổn định được đề xuất. Để tăng cường hơn nữa mức độ ổn định của thủy vân trong việc chống lại các cuộc tấn công không đồng bộ, chúng tôi sử dụng các điểm đặc trưng ảnh SIFT (Scale Invariant Feature Tranform). Việc phát hiện các điểm đặc trưng và tính toán mặt nạ JND được thực hiện ngay trong từng tầng của không gian tỉ lệ DoG nhằm làm giảm độ phức tạp của thuật toán. Một loạt các kết quả thí nghiệm được thực hiện và đã chứng minh tính đúng đắn của thuật toán đề xuất. Thủy vân được nhúng hầu như không được phát hiện bởi mắt thường và ổn định đối với một loạt các phép tấn công không đồng bộ hóa như Print-Scan và Camorder. Từ khóa: Thủy vân ảnh, đặc trưng ảnh SIFT, mô hình JND, không gian gian sai khác DoG, tấn công không đồng bộ. 1. Mở đầu Trong thời đại bùng nổ thông tin, ngoài các giải pháp bảo mật thông tin được sử dụng phố biến như hệ mật mã thì kĩ thuật thủy vân đã quan tâm rất lớn vì đây là một phương pháp khá hiệu quả. Khó khăn chính của thủy vân là nhằm giải quyết sự cân bằng giữa tính ổn định và tính trong suốt của thủy vân (không thể phát hiện bằng mắt thường). Đối với vấn đề đầu tiên, hầu hết các phương pháp thủy vân đã được đề xuất khả năng chống lại các cuộc tấn công cổ điển chẳng hạn như lọc, nén,... Tuy nhiên, tấn công không đồng bộ luôn luôn là một vấn đề khó khăn cho hệ thống thủy vân. Gần đây, có nhiều phương pháp đã được đề xuất nhằm đối phó với các kiểu tấn công này. Nói chung, chúng có thể được phân thành ba loại như sau: Loại đầu tiên bao gồm việc nhúng một Ngày nhận bài: 10/7/2015. Ngày nhận đăng: 15/11/2015. Liên hệ: Phan Đăng Khuyên, e-mail: admin@thpt-pbcgialai.edu.vn. 169 Phan Đăng Khuyên, Nguyễn Phi Bằng, Đặng Thành Trung mẫu cùng với thủy vân để xác định biến đổi hình học cho ảnh sau khi nhúng và sau đó áp dụng biến đổi nghịch đảo [1]. Phương pháp này sẽ làm giảm độ trung thực của hình ảnh và dung lượng của thủy vân vì phải nhúng thêm mẫu. Một phương pháp là sử dụng thủy vân như tài liệu tham khảo bằng cách nhúng nó liên tục tại các vị trí không gian khác nhau. Khi tính toán sự tương quan của hình ảnh thủy vân với bất kì phép biến đổi affine, thì sự suy biến affine có thể được mô tả thông qua sự thay đổi kết quả trong các mẫu tương ứng với vị trí nhúng [2]. Loại thứ hai là các phương pháp nhúng trong một miền bất biến hình học. O’Ruanaidh và Pun [3] đã đề xuất việc chuyển đổi hình ảnh vào miền tần số Fourier-Mellin, được biết đến là bất biến với các phép xoay, co giãn và tịnh tiến (RST). Trong [4], Đông và cộng sự đã đề xuất một phương pháp để chống lại các phép biến đổi affine bằng cách sử dụng các chuẩn ảnh. Tuy nhiên, một nhược điểm của các phương pháp này là chúng chỉ chịu được các phép biến đổi tổng thể ảnh chứ không chịu được các phép biến đổi cục bộ. Để khắc phục vấn đề này, các thuật toán gần đây được lấy cảm hứng từ cách tiếp cận của KUTTER và cộng sự [5], được xem như là tiền đề của "thế hệ thứ hai" cho các phương pháp thủy vân. Ý tưởng của phương pháp này là nhằm tìm kiếm các điểm đặc trưng ảnh và sử dụng chúng để phân chia ảnh thành các vùng khác nhau. Tiếp đó, thủy vân được đưa vào các khu vực cục bộ. Trong [6], Bas và cộng sự sử dụng bộ dò góc Harris để khai thác điểm đặc trưng trong ảnh và thực hiện tạo lưới tam giác trên tập hợp các điểm ảnh này. Sau đó sử dụng phương pháp nhúng thủy vân lặp đi lặp lại vào trong mỗi tam giác. Một nhược điểm của phương pháp này là bộ dò góc Harris rất nhạy cảm với phép co giãn ảnh cũng như các cuộc tấn công xử lí tín hiệu. Thêm vào đó, một sự thay đổi nhỏ trong tập hợp các điểm đặc trưng sẽ dẫn đến một sự thay đổi đáng kể trong lưới tam giác và do đó làm giảm khả năng phát hiện. Để khắc phục vấn đề này, một phương pháp đã được đề xuất trong [7]. Trong bài báo này, các tác giả đã sử dụng các điểm đặc trưng ảnh SIFT thay cho Harris và phân ảnh thành các vùng hình tròn bao quanh các điểm đặc trưng. Thủy vân được đặt trong các hình tròn này và được biến đổi để bất biến đối với các phép quay trước khi được nhúng vào trong ảnh. Kĩ thuật này có vẻ ổn định hơn so với việc tạo lưới tam giác là bởi vì chúng ta luôn có thể phục hồi thủy vân với chỉ một hình tròn mặc dù còn nhiều điểm đặc trưng khác chưa được phát hiện. Trong bài báo này, chúng tôi đề xuất một phương pháp nhằm tăng cường mức ổn định của thủy vân khi nhúng vào ảnh dựa trên điểm đặc trưng ảnh và hầu như không được phát hiện bởi mắt thường. Trên thực tế, chúng tôi sử dụng các đặc trưng SIFT được biết đến là ổn định với quy mô hình ảnh, xoay và phạm vi rộng lớn của phép biến đổi affine. Tuy nhiên, trái ngược với tất cả các phương pháp trích dẫn, chúng tôi nhúng thủy vân vào ảnh trong không gian tỉ lệ DoG để tăng mức ổn định. Việc phát hiện các đặc trưng SIFT và tính toán mặt nạ JND được thực hiện ngay trong từng tầng của không gian tỉ lệ DoG nhằm giảm sự phức tạp của thuật toán [7]. Để đảm bảo tính khách quan, tính toán mặt nạ JND được thực hiện để xác định mức độ tối ưu cho sự ổn định của thủy vân, tức là mức độ tối đa của thủy vân có thể đạt được không làm ảnh hưởng đến tính khách quan. Giá trị tính toán mặt nạ JND cho mỗi điểm ảnh trong từng tầng của không gian tỉ lệ DoG bằng sự kết hợp bởi hệ thống thị giác con người (HVS) như độ tương phản, độ nhạy cảm [8], độ sáng [9] và độ tương phản mặt nạ [10]. Do đó, mô hình này không cần bất kì yếu tố khác như nhận thức mặt nạ của Bas [6] hoặc các đặc điểm nhiễu tầm nhìn (NVF) được giới thiệu bởi Voloshynovskiy [11] và được sử dụng [7] để kiểm soát sự ổn định của thủy vân. Hai mô hình này được dựa trên một số đặc điểm thống kê cục bộ của tín hiệu để thích ứng với sự ổn định của thủy 170 Tăng cường mức độ ổn định của thủy vân dựa trên mô hình ảnh đa tầng và các điểm đặc trưng ảnh vân. Có ý kiến cho rằng các khu vực hoạt động cao (kết cấu, cạnh) cho phép nhúng thủy vân vào ảnh ổn định hơn các khu vực bằng phẳng, vì nó ít nhạy cảm với thị giác của con người HVS. Một nhược điểm của phương pháp này là nó không cung cấp một mức tối ưu cho sự ổn định của thủy vân. Hơn nữa, các yếu tố được sử dụng trong thực nghiệm và do đó làm thay đổi ảnh từ một ảnh khác. Bài viết này được tổ chức như sau: trong phần 2.1, chúng tôi trình bày các bước chính trong lược đồ nhúng thủy vân. Lược đồ phát hiện thủy vân trong ảnh đã nhúng được trình bày trong phần 2.2. Các kết quả thí nghiệm được trình bày trong phần 2.3 và kết thúc bởi một số nhận xét trong phần kết luận. 2. Nội dung nghiên cứu 2.1. Lược đồ nhúng thủy vân Hình 1 mô tả tổng quan các bước chính trong quá trình nhúng thủy vân. Trong lược đồ này, tỉ lệ phân tách được chọn là một phần tám để giảm độ phức tạp của thuật toán nhưng vẫn đảm bảo thu được một lượng lớn các điểm đặc trưng ổn định SIFT. Hình 1. Lược đồ nhúng thủy vân 2.1.1. Phân tách không gian tỉ lệ Sự phân tách không gian đã được chứng minh là một công cụ mạnh mẽ trong việc phân tách hình ảnh với sự biến đổi đa tầng. Trên thực tế, Gaussian được chứng minh là nhân duy nhất để sinh ra một không gian tỉ lệ tuyến tính [12]. Như đã mô tả trong [13], không gian tỉ lệ Gaussian ở tầng thứ s được định nghĩa như sau: Gs(x, y) = gσs ∗ I(x, y) (2.1) Trong đó gσs là biến tỉ lệ Gaussian với độ lệnh chuẩn σsđược tính là: σs = σ0.2 s/S , trong đó σ0là mức tỉ lệ cơ sở và s = 0 → S, S là tầng lớn nhất (ở đây S = 5) và I(x, y) là ảnh đầu vào. Kết quả là hàm không gian tỉ lệ Gaussian biểu diễn thông tin của ảnh ở các tầng khác nhau trong không gian tỉ lệ, trong đó hai tầng cạnh nhau được phân biệt bởi một hệ số nhân k (k = 21/S ). 171 Phan Đăng Khuyên, Nguyễn Phi Bằng, Đặng Thành Trung Không gian tỉ lệ DoG ở lớp s là DoGs(x, y), được tính bởi sự sai khác giữa hai tầng liền kề của không gian tỉ lệ Gaussian [13] theo công thức: DoGs(x, y) = Gs+1(x, y)−Gs(x, y) ≈ (k − 1)σ20∆2G (2.2) Những hình ảnh trong không gian tỉ lệ DoG có thể được coi là một tập hình ảnh tựa dải tần với tần số cao f0/σ0, . . . , f0/σS trong đó f0 là tần số cao không gian tỉ lệ của hình ảnh ban đầu. Ở đây, chúng tôi cố định f0 = 32 cpd (vòng / độ) bằng cách bắt nguồn từ khoảng cách hiển thị, kích thước hình ảnh và độ phân giải màn hình. 2.1.2. Phát hiện điểm đặc trưng Các lớp không gian tỉ lệ DoG được xác định bởi các hằng số như phương trình (2.2) cung cấp một xấp xỉ gần với đạo hàm của không gian tỉ lệ các tầng Gaussian σ20∆ 2G. Bài báo [13] đã chứng minh rằng cực đại và cực tiểu của σ20∆ 2Glà các điểm đặc trưng ảnh ổn định nhất so với các hàm ảnh khác như Hessian hay Harris. Vì vậy, đối với mỗi tầng DoG, các điểm cực trị cục bộ được phát hiện bằng cách so sánh mỗi điểm ảnh với 8 điểm lân cận trong tầng hiện tại và 9 điểm lân cận (trong cửa sổ 3x3) của tầng liền trên và dưới. Để tăng tính ổn định, tất cả các điểm cực trị mà sự tương phản của nó thấp hơn một ngưỡng cho trước và các điểm cực trị gần các cạnh sẽ bị loại bỏ vì sự không ổn định của nó. Vị trí của các điểm cực trị được lựa chọn sẽ sinh ra một tập các điểm đặc trưng. Cuối cùng, một bộ mô tả các điểm đặc trưng được tạo ra bằng việc thống kê cục bộ độ lớn và hướng gradient trong một miền lân cận xung quanh điểm đặc trưng. Các vector đặc trưng này được lưu trữ vào một tệp để sử dụng sau này. 2.1.3. Mô hình JND đa tầng Trong phần này, một mô hình JND đa tầng được đề xuất để đánh trọng số mức độ nhận thức của người nhìn đối với thủy vân. Mô hình xem xét ba yêu tố chính liên quan đến hệ thống thị giác của con người (HVS): độ nhạy cảm tương phản, ma trận độ sáng và ma trận độ tương phản. Mô hình JND này tương tự như mô hình kim tự tháp Laplacian [14] nhưng được phát triển riêng cho ngữ cảnh bài báo này. Tuy nhiên, cần phải chú ý rằng, sự phân tách không gian tỉ lệ DoG như trình bày trong phần 2.1.1 không thể biến đổi nghịch đảo nhằm tái cấu trúc thủy vân nên chúng tôi thay thế không gian tỉ lệ Gaussian bởi ảnh gốc ban đầu trước khi tính toán cho các tầng trong không gian tỉ lệ DoG (xem hình 2). Sự thay đổi này cho phép ảnh có thể khôi phục một cách hoàn hảo như trong hình 2 bởi phương trình (2.6) như trong phần 2.1.4. * Kết hợp sự nhạy cảm độ tương phản và ma trận độ sáng Các nhà tâm sinh lí học đã đề xuất được hàm đánh giá độ nhạy cảm của mắt người đối với mức độ tương phản trong ảnh CSF (Contrast Sensitivity Function) được xem như là một hàm số của tần số không gian (đơn vị cpd) và vì vậy có thể áp dụng cho miền tần số. Để thích ứng hiện tượng này cho miền không gian, chúng tôi áp dụng cách tiếp cận trong [14]. Trên thực tế, các giai đoạn hình ảnh đầu tiên của HVS làm việc như một máy phân tích đa kênh và hàm CSF được đo bởi các thí nghiệm tâm sinh lí. Trong bài báo này, chúng tôi sử dụng hàm CSF của Barten [8] do tính linh hoạt và sự đơn giản của nó. Hàm CSF của Barten được mô tả như sau: 172 Tăng cường mức độ ổn định của thủy vân dựa trên mô hình ảnh đa tầng và các điểm đặc trưng ảnh Hình 2. Biến đổi không gian tỉ lệ CSF (f) = a.f. exp(−b.f). √ 1 + c. exp(b.f) (2.3) a = 540(1 + 0.7/L)−0.2 1 + 12w(1+f/3) b = 0.3(1 + 100/L)0.15 c = 0.06 trong đó w là kích thước hình ảnh gốc, L là độ sáng tổng thể đơn vị cd/m2. Các nghiên cứu trước đây xem xét độ nhạy cảm tương phản và sự thích ứng độ sáng một cách phân biệt bằng cách tính hàm CSF tại một mức sáng cố định được theo sau bởi một ma trận độ sáng. Tuy nhiên, từ phương trình (2.3) có thể thấy hàm CSF biểu diễn một sự phụ thuộc không thể tách rời giữa tần số không gian và mức sáng. * Mặt nạ độ tương phản Mặt nạ tương phản biểu diễn khả năng hiển thị của một tín hiệu bị sụt giảm bởi sự xuất hiện của một tín hiệu khác. Ở đây, chúng tôi sử dụng mô hình tính độ tương phản được đề xuất bởi Legge-Foley [10] nhưng các giá trị điểm ảnh trong không gian tỉ lệ DoG được sử dụng thay cho các giá trị tương phản: JNDs(x, y) = { Ts(x, y) nếu |DoGs(x, y)| ≤ Ts(x, y) Ts(x, y). ( |DoGs(x,y)| Ts(x,y) )ε ngược lại (2.4) Trong đó DoGs(x, y) là sự phản hồi kênh thứ sth trong không gian tỉ lệ DoG tại điểm (x, y), ε là hệ số mô tả mức độ của mặt nạ, 0.6 ≤ ε ≤ 1 [10]. Hình vẽ 3 minh họa hình ảnh mặt nạ JND ở ba mức trong không gian tỉ lệ DoG. 2.1.4. Nguyên tắc nhúng Với mỗi ảnh trong không gian tỉ lệ DoG, một lưới tam giác được tạo ra dựa trên tập các điểm đặc trưng được phát hiện và cho phép phân tách ảnh đầu vào thành các tam giác: Tr = Tri. Lưới tam giác này có một số đặc trưng hữu ích: - Tính duy nhất: Lưới tam giác là duy nhất đối với mỗi tập hợp các điểm đầu vào. Thậm chí nếu các điểm đầu vào này di chuyển bên trong một khu vực (gọi là khu vực ổn định) thì lưới này vẫn không thay đổi. 173 Phan Đăng Khuyên, Nguyễn Phi Bằng, Đặng Thành Trung Hình 3. Không gian Gausian (trên), Quy mô không gian DoG (giữa) và các mô hình JND tương ứng (dưới) của hình ảnh “Ô tô” 0, 2, 4 - Cục bộ: Nếu một đỉnh biến mất, lưới tam giác chỉ bị chỉnh sửa đối với hình tam giác liên kết với đỉnh đó. Một thủy vân kích thước 64x64 với các phần tử nằm trong tập hợp {−1, 1} được sinh ngẫu nhiên với phương sai và trung bình bằng không (hình 4a). Thủy vân được biến đổi và nhúng vào các tam giác vuông cân Trw (hình 4b). a b Hình 4. Ảnh (a) là thủy vân gốc (64x64); Ảnh (b) là thủy vân được biến đổi nhúng vào vùng đặc trưng. Các thủy vân Trw sau đó được đóng gói vào trong hình dạng của mỗi tam giác Tri bằng cách áp dụng phép biến đổi affine. Độ lớn của các góc được sắp xếp để thu được một phép biến 174 Tăng cường mức độ ổn định của thủy vân dựa trên mô hình ảnh đa tầng và các điểm đặc trưng ảnh đổi duy nhất [6]. Thủy vân Trw được thêm vào mỗi tam giác ở từng mức trong không gian tỉ lệ DoG sau khi đánh trọng số tương ứng với các giá trị JND: Triw = Tri + JNDTri .T rw (2.5) Ảnh đã nhúng thủy vân sau đó được xây dựng lại bằng công thức: Iw(x, y) = S−1∑ s=0 DoGsw(x, y) +GS(x, y) (2.6) 2.2. Lược đồ phát hiện Lược đồ quá trình phát hiện thủy vân được hiển thị trong hình 5. Trước hết, các điểm đặc trưng sẽ được phát hiện. Tiếp đến, tập hợp các điểm đặc trưng này sẽ được so sánh với các điểm đặc trưng được lấy từ tệp lưu trữ. Chỉ các điểm đặc trưng nào trùng khớp với nhau mới được sử dụng cho việc phát hiện thủy vân. Tại mỗi tầng thứ s của không gian tỉ lệ DoG, một lưới tam giác được tính toán dựa trên tập hợp các điểm đặc trưng được lựa chọn. Hình 5. Lược đồ phát hiện thủy vân Mỗi tam giác Tria sau đó được phân tách và bị biến dạng thành hình dạng của Trw (tam giác cân góc bên phải). Sau đó, tất cả các tam giác được cộng gộp lại và mối tương quan tuyến tính với Trw được tính như sau: Cors = 1 L ∑ (x,y) Trsum(x, y)Trw(x, y) (2.7) Trong đó L là kích thước trình tự của thủy vân (64x64) và Trsum là tổng hợp của tất cả các tam giác Tria. Tiếp đến giá trị tương quan này được so sánh với một ngưỡng quyết định Th để quyết định xem thủy vân có tồn tại hay không. Lưu ý rằng Cors>Th chỉ cần thực hiện trên một cấp là đủ để xác định thủy vân trong hình ảnh được thử nghiệm hay không. Theo tiêu chuẩn Neyman-Pearson, ngưỡng này được tính bằng cách sửa chữa các ngưỡng quyết định. Cho đến nay, phát hiện tối ưu chỉ phát triển cho kênh AWGN (được mô hình hóa bởi một số luật phân phối đơn giản trong trường hợp không có tấn công hoặc tấn công phân phối Gaussian). Do đó, chúng tôi chỉ xem xét các ngưỡng quyết định của thủy vân 175 Phan Đăng Khuyên, Nguyễn Phi Bằng, Đặng Thành Trung ngẫu nhiên. Trong trường hợp này, đầu ra phát hiện sau một luật phân phối Gaussian. Do đó, các ngưỡng quyết định được tính như sau: Pfa = P (Cors > Th|H0) = 1 2 erfc ( Th√ 2σH0 ) (2.8) Trong thực nghiệm, chúng tôi chọnTh = 3.9 √ 2σH0 cho ngưỡng để đánh giá là 10 −8. σH0ước tính trực tiếp trên ảnh không sử dụng thủy vân là 10000 trình tự khác nhau. Bảng 1. Đánh giá tính vô hình của thủy vân Hình ảnh Khỉ đầu chó Thuyền Ô tô Lena Hồ tiêu Máy bay DSIS 5 4.8 4.9 4.2 4.6 4.1 Komparator 527.56 263.68 229.33 368.18 327.26 244.97 PSNRwav 15.96 19.96 21.62 21.99 23.04 22.59 Chú ý rằng Komparator cho thấy mức độ biến dạng trong khi PSNRwav cho thấy độ trung thực giữa ảnh gốc và ảnh thủy vân. 2.3. Các kết quả thực nghiệm Mặc dù chúng tôi chứng minh các kết quả cho ảnh màu. Trên thực tế, chỉ độ sáng của ảnh được sử dụng để thực hiện tính toán vì đây là thành phần quan trọng nhất của ảnh. Hình ảnh đầu tiên chuyển đổi thành không gian màu YCbCr và sau đó chỉ có các thành phần độ sáng Y được sử dụng để nhúng thủy vân. Như hình 6, ảnh gốc và ảnh thủy vân về mặt nhận thức là phân biệt được. Các thí nghiệm khác cũng được thực hiện trên một loạt các hình ảnh tự nhiên để xác nhận việc thực hiện các phương pháp của chúng tôi về sự ổn định và khó phát hiện bằng mắt thường. Do không gian hạn chế và để tạo điều kiện cho việc so sánh, chúng tôi chỉ đánh giá kết quả cho một bộ 6 hình ảnh. Hình 6. Ảnh gốc (trái), ảnh đã nhúng thủy vân (giữa) và ảnh sai khác (phải) 2.3.1. Đánh giá tính vô hình của thủy vân Để đánh giá tính vô hình của thủy vân, các thử nghiệm chủ quan DSIS (Double Stimuli Impair Scale) được thực hiện trên 5 người quan sát với điều kiện kiểm tra như trong [15]. Có 5 mức độ đánh giá bao gồm 5-không thể cảm nhận, 4-chấp nhận được, 3-hơi có nhiễu, 2-có nhiễu, 1-không chấp nhận được. Bên cạnh đó, đánh giá khách quan cũng được thực hiện bằng hai chỉ số Komparator [16] và PSNRwav [17]. Các chỉ số này được lựa chọn sau khi so sánh và đánh giá 176 Tăng cường mức độ ổn định của thủy vân dựa trên mô hình ảnh đa tầng và các điểm đặc trưng ảnh trong tổng số 16 chỉ số tương quan và chỉ số chủ quan MOS. Theo thử nghiệm, hai chỉ số đo độ tương quan Komparator và PSNRwav cao hơn so với chỉ số đo độ chủ quan MOS. Các kết quả đánh giá mức độ vô hình của phương pháp đề xuất so với ảnh gốc được thể hiện trong Bảng 1. Các giá trị này cho thấy tính vô hình của thuật toán đề xuất là rất tốt. Tuy nhiên, các chỉ số là chưa khả quan đối với một số hình ảnh như: khỉ đầu chó, máy bay. Điều này chủ yếu là do cấu trúc hình ảnh có xu hướng tạo thuận lợi cho hình ảnh mặt nạ ngay cả đối với một mức độ biến dạng cao được đo bằng các chỉ số. 2.3.2. Đánh giá sự ổn định Để đánh giá sự ổn định của phương pháp đề xuất, một loạt các thí nghiệm đã được áp dụng dụng cho ảnh thủy vân bao gồm các kĩ thuật tấn công cơ bản trong xử lí tín hiệu cũng như các kĩ thuật tấn công không đồng bộ. Do hạn chế về công cụ và thời gian, chúng tôi chỉ xem xét ba kĩ thuật tấn công cơ bản bao gồm: ảnh trên máy quay, ảnh trên máy in và máy quét, ảnh bị tấn công bởi các phép toán tấn công không đồng bộ trong [18]. - Tấn công bằng "Máy quay": tấn công này được thực hiện bằng cách chụp hình ảnh trên màn hình máy tính với máy ảnh Canon IXUS 125HS. - Tấn công bằng "máy in và máy quét": tấn công này bao gồm in các hình ảnh ở mức độ đen trắng trên một tờ giấy A4 bằng máy in laser shot LBP-1120 và quét nó ở độ phân giải 600dpi. - Tấn công không đồng bộ (Desynchornization Attacks): các cuộc tấn công không đồng bộ là một phần mở rộng của các cuộc tấn công hình học cổ điển của Barni và các đề xuất của cộng sự [18]. Họ đã chứng minh được đó là ổn định và ít bị tấn công hơn so với các cuộc tấn công Stirmark. Các kết quả thực nghiệm được trình bày trong Bảng 2. Dựa trên các giá trị này, chúng ta có thể thấy rất rõ rằng phương pháp đề xuất tốt hơn phương pháp của Bas và Digimarc cho hầu hết các cuộc tấn công. Đặc biệt, thủy vân vẫn tồn tại qua nhiều cuộc tấn công nghiêm trọng như: máy quay, máy in và máy quét mà phương pháp của Digimarc không thể thực hiện. Tuy nhiên, phương pháp đề xuất và phương pháp của Bas không hiệu quả đối với các kĩ thuật tấn công thuộc nhóm "xử lí tín hiệu" giống như ảnh nén, ảnh bị làm nhiễu, v.v so với phương pháp của Digimarc. Bảng 2. Đánh giá sự ổn định Tấn công Phương pháp Khỉ đầu chó Thuyền Ô tô Lena Hồ tiêu Máy bay In-Scan Đề xuất Ok Ok Ok Ok Ok Ok Bas Failed Ok Ok Ok Ok Ok Digimarc Failed Failed Failed Failed Failed Failed Nén Jpeg Đề xuất 35% 40% 20% 45% 40% 30% Bas 50% 50% 50% 50% 50% 50% Digimarc 18% 30% 25% 30% 30% 30% Xoay Đề xuất 250 250 300 300 250 350 Bas 100 100 100 100 100 100 Digimarc All All All All All All Jpeg2000 (bpp) Đề xuất 0,6 0,3 0,3 0,3 0,3 0,2 Digimarc 0,3 0,4 0,3 0,3 0,3 0,3 Lọc Gaussian Đề xuất Ok Ok Ok Ok Ok Ok Digimarc Ok Ok Ok Ok Ok Ok 177 Phan Đăng Khuyên, Nguyễn Phi Bằng, Đặng Thành Trung 2.4. Kết luận Bài báo trình bày một cách tiếp cận mới cho việc nhúng thủy vân ảnh trong không gian tỉ lệ DoG nhằm tăng mức độ ổn định để chống lại các cuộc tấn công không đồng bộ. Việc dùng mô hình JND đa tầng rất đơn giản và hiệu quả bằng cách khai thác đặc trưng cơ bản của HVS. Thứ nhất, độ nhạy tương phản và độ sáng thích nghi được kết hợp thông qua hàm CSF của Barten. Thứ hai, một mô hình mặt nạ tương phản mới được tích hợp từ việc biến đổi mô hình cơ sở của Legge và Foley cho không gian tỉ lệ. Các kết quả thực nghiệm cho thấy phương pháp đề xuất có hiệu suất tốt hơn về sự ổn định và tính vô hình của thủy vân. Trong tương lại, một nghiên cứu xa hơn cho việc nhúng thủy vân vào video sẽ được tiến hành. TÀI LIỆU THAM KHẢO [1] Madeira SC, Oliveira AL. Biclustering Algorithms for Biological Data Analysis: A Sur Pereira, S. and Pun, T.Fast robust template matching for affine resistant image watermarks. In Proc. of 3rd Int. Information Hiding Workshop, pp. 207-218 (1999). [2] Kutter, M. Watermarking resisting to translation, rotation and scaling In Proc. of SPIE: Multimedia Systems and Applications, vol. 3528, pp. 423-431 (1998). [3] O’Ruanaidh, J. J. K. and Pun, T. Rotation, scale and translation invariant digital image watermarking. In Signal Processing, vol. 66, No. 3, pp. 303-317 (1998). [4] Dong, P., Brankov, J. G., Galatsanos, N. P., Yang, Y. and Davoine, F. Digital watermarking robust to geometric distortions. In IEEE Transactions on Image Processing, vol. 14, pp. 2140-2150 (2003). [5] Kutter, M., Bhattacharjee, S. K., Ebrahimi, T. Towards second generation watermarking schemes. In International Conference on Image Processing, vol. 1, pp. 320-323 (1999). [6] Bas, P., Chassery, J. M. and Macq, B. Geometrically invariant watermarking using feature points. In IEEE Trans. on Image Processing, vol. 11, No. 9, pp. 1014-1028, (2002). [7] Lee, H. Y., Kim, H. and Lee, H. K., 2006. Robust Image Watermarking using local Invariant Features. In SPIE Journal of Optical Engineering, 45(3), pp. 1-11. [8] Barten, P. G. J., 1990. Evaluation of Subjective Image Quality with the Square-Root Integral Method. In Journal of the Optical Society of America A: Optics, Image Science, and Vision, vol. 7, issue 10, pp. 2024-2031. [9] Chou, C. H. and Li, Y. C., 1995. A perceptually Tuned Subband Image Coder Based on the Measure of Just-Noticeable-Distortion Profile. In IEEE Transaction on Circuits and Systems for Video Technology 5, vol. 6, pp. 467-476. [10] Legge, G. E. and Foley, J. M., 1980. Contrast Masking in Human Vision. In Journal of the Optical Society of America 70, pp. 1458-1471. [11] Voloshynovskiy, S., Herrigel, A., Baumga¨rtner, N., Pun, T., 2000. A stochastic approach to content adaptive digital image watermarking. LNCS, vol. 1768, pp. 211-236, Springer, Heidelberg. 178 Tăng cường mức độ ổn định của thủy vân dựa trên mô hình ảnh đa tầng và các điểm đặc trưng ảnh [12] Lindeberg, T., 1994. Scale-Space Theory in Computer Vision. Kluwer Academic Publishers. [13] Lowe, D. G., 2004. Distinctive image features from scale-invariant keypoints. In International Journal of Computer Vision, 60(2), pp. 91-110. [14] Nguyen, P. B., Beghdadi, A. and Luong, M., 2008. Perceptual watermarking using pyramidal JND maps. In Proc. of 10th IEEE International Symposium on Multimedia, pp. 418-423, Berkeley, CA, USA. [15] Iternational Telecommunication Union, 2012. Methodology for the Subjective Assessment of the Quality of Television Pictures. Https://www.itu.int/rec/R-REC-BT.500-13-201201-I/en. [16] Barba, D. and Le Callet, P., 2003.A robust quality metric for color image quality assessment. In Proc. of IEEE International Conference on Image Processing, pp.437-440. [17] Beghdadi, A. and Pesquet-Popescu, B., 2003, A New Image Distortion Measure Based on Wavelet Decomposition. In Proc. of 7th IEEE ISSPA, vol. 2, pp. 485-488, Paris, France. [18] Barni, M., D’Angelo, A. and Merhav, N., 2007. Expanding the class of watermark de synchronization attacks. In Proc. of 9th ACM Workshop on Multimedia and Security, pp. 195-204, Dallas, USA. [19] Phi Bang Nguyen, Azeddine Beghdadi, and Marie Luong, 2009. Robust Watermarking in DoG Scale Space Using a Multi-scale JND Model. L2TI ABSTRACT Enhance robustness for watermarking based on keypoint features In this paper, an improvement is presented to enhance the robustness of watermarking based on a DoG scale space and a multiscale JND model. The object of our propsal is to decompose an image into DoG space and insert a watermark into these sub-images using a multiscale JND. Based on this model, an invisible and robust watermarking scheme is proposed. In order to overcome de-synchronization attacks, we make use of SIFT features (Scale Invariant Feature Tranformation). Both keypoint detection and JND masking are implemented in the DoG scale space to reduce complexity. Several experiments were completed and the results obtained show outstanding performance of our method. The watermark is transparent and able to resist attacks such as print-scan and camorder. Keywords: Watermarking, SIFT, JND, DoG, De-synchronization Attack. 179
File đính kèm:
- tang_cuong_muc_do_on_dinh_cua_thuy_van_dua_tren_mo_hinh_anh.pdf