Bài giảng Xử lý ảnh - Chương 13: Biến đổi ảnh rời rạc
13.1. GIỚI THIỆU
Biến đổi Fourier rời rạc (DFT), đã giới thiệu trong chương 10, là một trong những
phép biến đổi tuyến tính rời rạc hữu ích trong xử lý ảnh số. Trong chương này, chúng
ta sẽ nghiên cứu chủ đề tổng quát hơn, trình bày một vài biến đổi khác và một vài
tính chất cũng như các ứng dụng của chúng.
Ảnh mà chúng ta quan tâm thường ở dạng liên tục và cũng phải được cảm nhận ở
dạng này. Bởi vì chúng ta bắt buộc phải làm việc với sự biểu diễn rời rạc của ảnh liên
tục, nên nhiều quá trình xử lý ảnh số đòi hỏi chúng ta tuân thủ những nguyên tắc lấy
mẫu và nội suy trong khi xử lý dữ liệu rời rạc. Tuy nhiên, một vài ứng dụng cho phép
chúng ta xem xét ảnh số như một thực thể rời rạc mà không đề cập chi tiết đến lịch
sử nguồn gốc của ảnh hay đối với ảnh liên tục cơ bản.
Tóm tắt nội dung tài liệu: Bài giảng Xử lý ảnh - Chương 13: Biến đổi ảnh rời rạc
227 Ch¬ng 13 BIẾN ĐỔI ẢNH RỜI RẠC 13.1. GIỚI THIỆU Biến đổi Fourier rời rạc (DFT), đã giới thiệu trong chương 10, là một trong những phép biến đổi tuyến tính rời rạc hữu ích trong xử lý ảnh số. Trong chương này, chúng ta sẽ nghiên cứu chủ đề tổng quát hơn, trình bày một vài biến đổi khác và một vài tính chất cũng như các ứng dụng của chúng. Ảnh mà chúng ta quan tâm thường ở dạng liên tục và cũng phải được cảm nhận ở dạng này. Bởi vì chúng ta bắt buộc phải làm việc với sự biểu diễn rời rạc của ảnh liên tục, nên nhiều quá trình xử lý ảnh số đòi hỏi chúng ta tuân thủ những nguyên tắc lấy mẫu và nội suy trong khi xử lý dữ liệu rời rạc. Tuy nhiên, một vài ứng dụng cho phép chúng ta xem xét ảnh số như một thực thể rời rạc mà không đề cập chi tiết đến lịch sử nguồn gốc của ảnh hay đối với ảnh liên tục cơ bản. Một ứng dụng điển hình là nén ảnh. Ở đây, người ta muốn mã hoá một ảnh thành một dạng dữ liệu nhỏ gọn hơn, mà không làm mất mát hay chỉ mất mát thông tin không cần thiết. Bình thường, vì lẽ quang học, lấy mẫu và nội suy đối với sự số hoá và hiển thị ảnh là không liên quan trực tiếp và ảnh số có thể xem xét đơn thuần như một tệp dữ liệu. Biểu diễn một ảnh là một biểu hiện đặc biệt của dữ liệu ảnh. Đây là một sự thể hiện dữ liệu ảnh theo một dạng hay một khuôn dạng đặc biệt. Một ảnh số có thể được biểu diễn như một ma trận hay như một vec tơ hàng. 13.2. BIẾN ĐỔI TUYẾN TÍNH 13.2.1. Biến đổi tuyến tính rời rạc một chiều Định nghĩa. Nếu x là vec tơ N 1 và T là ma trận N N, thì Txyxty N j jjii hay 1 0 , (1) trong đó i = 0, ..., N-1 là biến đổi Fourier của vec tơ x. Ma trận T cũng được gọi là ma trận hạt nhân (kernel matrix) của phép biến đổi. Lưu ý rằng cách sử dụng từ hạt nhân khác với cách sử dụng thuật ngữ hạt nhân tích chập đã đề cập trong phần 9.3.4. Kết quả của phép biến đổi làmột vec tơ y, N 1 khác. Phép biến đổi là tuyến tính bởi vì y được thực hiện bằng một phép tổng bậc nhất của các phần tử đầu vào. Mỗi phần tử yi là tích của vec tơ đầu vào x với hàng thứ i của ma trận T. Ví dụ. Một ví dụ đơn giản của phép biến đổi tuyến tính là phép quay một vec tơ trong hệ thống toạ độ hai chiều. (Xem chương 8) Ở đây, 2 1 2 1 cossin sincosy x x y (2) Quay vec tơ x quanh gốc toạ độ một góc . Phép nghịch đảo. Sau phép biến đổi, vec tơ ban đầu có thể được khôi phục bằng phép biến đổi ngược. xTy 1 (3) 228 Chứng tỏ rằng T không duy nhất. Như trên, mỗi phần tử của x lại là một tích, đây là tích giữa y và một hàng của T-1. Với ví dụ trước đây, thì điều này chẳng khác gì một phép quay cùng một góc theo chiều ngược lại. 13.2.1.1. Biến đổi đơn vị Đối với vec tơ chiều dài N đã cho, có rất nhiều ma trận biến đổi có thể được sử dụng. Tuy nhiên, những ma trận hữu ích hơn liên quan đến một lớp các thuộc tính nào đó. Nếu T là ma trận đơn vị, thì ITTTT tt **vµ TT *t-1 (4) Trong đó * ký hiệu liên hợp phức cho mỗi phần tử của T và t ký hiệu phép chuyển vị. Nếu T là ma trận đơn vị và chỉ có các thành phần thực thì nó là ma trận trực giao, và được biểu diễn như sau ITTTT tt vµ TT t1- (5) Chú ý rằng phần tử i, j của TTt chính là tích các hàng i và j của T. Biểu thức (5) chứng tỏ rằng các phần tử đều là 0, trừ phần tử i = j, trong trường hợp nó là đơn vị. Vì thế, các hàng của T là tập các vec tơ trực giao. Ví dụ: DFT một chiều. DFT là một ví dụ về biến đổi đơn vị, vì hay 1 0 2exp1 N i ik N ikjf N F F = Wf (6) Trong đó W là ma trận đơn vị (nhưng không trực giao) với các phần tử (phức) N ikj N i ki 2exp 1 , (7) Nội suy. Bình thường, ma trận biến đổi T không đơn nhất (chẳng hạn, rank(T) = N), để có thể đảo ngược biến đổi, như biểu thức (3). Các hàng của T tạo thành một cơ sở trực giao (một tập các vec tơ cơ sở trực giao hay các vec tơ đơn vị) đối với không gian vec tơ N chiều của tất cả các vec tơ N 1. Điều này có nghĩa là một chuỗi N 1 bất kỳ có thể xem như biểu diễn một vec tơ ban đầu thành một điểm trong không gian N chiều. Hơn nữa, một biến đổi dạng biểu thức (1) bất kỳ có thể xem như là một biến đổi toạ độ, quay vec tơ trong không gian N chiều mà không thay đổi độ dài của vec tơ. Theo giả thiết thì một biến đổi tuyến tính đơn vị sinh ra vec tơ y, vec tơ N hệ số biến đổi, mỗi một hệ số được tính như là một tích của vec tơ vào x với một hàng của ma trận biến đổi T. Biến đổi ngược được tính toán tương tự, giống như một tập các tích thành phần của vec tơ hệ số biến đổi với các hàng của ma trận biến đổi ngược. Biến đổi tiến nói chung được coi là một quá trình phân tích, việc phá vỡ vec tơ tín hiệu ra thành các thành phần cơ bản. Các thành phần cơ bản này thường thấy ở dạng các vec tơ cơ sở. Các hệ số biến đổi chỉ rõ có thể tìm thấy bao nhiêu vec tơ trong mỗi thành phần được thể hiện trong tập những vec tơ riêng biệt được phân tích. Biến đổi ngược, nói cách khác, thường được coi là một quá trình tổng hợp (synthesis), tập hợp thành vec tơ ban đầu từ các thành phần của nó theo phép tổng. Ở đây, các hệ số biến đổi chỉ rõ khối lượng chính xác mỗi vec tơ cơ sở phải được thêm vào tập hợp để tái tạo lại vec tơ đầu vào đầy đủ và chính xác. Mấu chốt của quá trình này là nguyên tắc mà bất kỳ một vec tơ nào cũng có thể được phân tích duy nhất thành một tập các vec tơ biên độ cơ bản thích hợp và sau đó khôi phục lại bằng cách thêm các thành phần này lại với nhau để tái tạo vec tơ ban đầu. Điều này có ý nghĩa rằng số các hệ số biến đổi bằng với số các phần tử trong 229 vec tơ. Vì thế, số bậc tự do trước và sau biến đổi là như nhau và quá trình cũng không tạo ra hay phá huỷ thông tin. Một vec tơ được biến đổi là một sự biểu diễn của vec tơ ban đầu. Vì nó chứa cùng một số lượng các phân tử (và vì thế có cùng số bậc tự do) như vec tơ gốc và vì vec tơ gốc có thể khôi phục từ nó mà không sai sót, nên nó có thể được coi là một dạng lựa chọn của việc biểu diễn vec tơ ban đầu. Chương này xem xét một vài phương pháp lựa chọn cho việc biểu diễn tín hiệu và ảnh số, và lợi ích của mối phương pháp. 13.2.2. Biến đổi tuyến tính rời rạc hai chiều Biến đổi tuyến tính hai chiều nói chung là biến đổi ma trận F, N N thành ma trận được biến đổi G (cũng là N N) là nmkiFG N i N k kim,n ,,, 1 0 1 0 , (8) trong đó i, k, m và n là các biến rời rạc nằmg trong khoảng từ 0 đến N - 1 và (i,k,m,n) là hàm hạt nhân của phép biến đổi. Có thể xem (i,k,m,n) như là một ma trận khối N2 N2 có N hàng, mỗi hàng có N khối, mỗi khối lại là một ma trận N N. Các khối được đánh chỉ số m, n và những phần tử của từng ma trận con N N được đánh chỉ số i, k (Xem hình 13-1). Nếu có thể tách (i,k,m,n) ra thành tích các hàm thành phần hàng và cột-tức là, nếu nkTmiTi,k,m,n cr ,, (9) Thì biến đổi được gọi là tách được (separable). Nghĩa là nó có thể tiến hành trong hai bước-một phép toán theo hàng tiếp theo là một phép toán theo cột (hay ngược lại): miTnkTFG r N i N k kinm ,, 1 0 1 0 ,, (10) Hơn nữa, nếu hai hàm thành phần giống nhau thì biến đổi cũng được gọi là đối xứng (không được nhầm lẫn vpí ma trận đối xứng). Và nkTmiTi,k,m,n ,, (11) Và biểu thức (8) có thể viết lại như sau TFTGnkTFmiTG N k cki N i nm hay 1 0 , 1 0 , ,, (12) Trong đó T là ma trận đơn vị, gọi là ma trận hạt nhân của biến đổi. Chúng ta sẽ sử dụng ký hiệu cho toàn bộ chương này, để biểu thị cho biến đổi đơn vị đối xứng, tách được và tổng quát. Biến đổi ngược là ttGTTGTTF **11 (13) và nó khôi phục lại F một cách chính xác. Ví dụ: DFT hai chiều. DFT hai chiều là biến đổi đơn vị dc và tách được. Trong trường hợp này, T trong biểu thức (12) trở thành ma trận W do biểu thức (7). DFT ngược sử dụng W-1, là chuyển vị liên hợp của W. Cặp biến đổi Fourier rời rạc được biểu diễn như sau G = WFW và F = W*tGW*t (14) 230 HÌNH 13-1 Hình 13-1 Ma trận hạt nhân 13.2.2.1. Phép biến đổi trực giao Không giống như biến đổi Fourier, nhiều biến đổi chỉ có các thành phần thực trong ma trận hạt nhân T của chúng. Một ma trận đơn vị với các thành phần thực là trực giao và phép biến đổi ngược trở nên đơn giản là ttGTTF (15) Nếu T là ma trận đối xứng, như thường gặp, thì biến đổi xuôi và ngược đều như nhau, để cho TGTFTFTG vµ (16) 13.3. HÀM VÀ ẢNH CƠ SỞ Khác nhau cơ bản giữa hai biến đổi đơn vị bất kỳ là sự lựa chọn các hàm cơ sở, tức là, các hàng của ma trận T. Ở đây, chúng ta sẽ xem xét các hàm cơ sở chi tiết hơn. 13.3.1. Hàm cơ sở Các hàng của ma trận hạt nhân tạo thành một tập các vec tơ cơ sở đối với không gian vec tơ N chiều. Các hàng là trực chuẩn; tức là kj N i ikij t TTITT , 1 0 ,, * * hay (17) Trong đó j,k là del ta Kronecker. Trong khi một tập các vec tơ trực chuẩn bất kỳ sẽ có lợi cho biến đổi tuyến tính, bình thường thì toàn bộ tập xuất phát từ cùng một dạng hàm cơ sở. Ví dụ, biến đổi Fourier sử dụng thành phần mũ phức như hàm cơ sở nguyên mẫu. Các hàm cơ sở riêng lẻ chỉ khác nhau về tần số. Một vec tơ không gian bất kỳ có thể được biểu diễn như tổng trọng số các vec tơ đơn vị cơ sở. Một biến đổi đơn vị một chiều (N 1) tương ứng với phép quay vec tơ trong không gian vec tơ N chiều. Hơn nữa, vì một ma trận ảnh N N có thể sắp xếp để tạo thành vec tơ N2 1, một biến đổi hai chiều, đối xứng, tách được bất kỳ tương ứng với một phép quay vec tơ trong không gian N2 chiều. 13.3.2. Ảnh cơ sở Biến đổi hai chiều ngược có thể được coi như quá trình tái tạo ảnh bằng cách cộng tập các ảnh cơ sở thích hợp. Mỗi phần tử trong ma trận biến đổi G là một hệ số, được nhân với ảnh cơ sở tương ứng trong phép cộng. Một ảnh cơ sở có thể được tạo ra bằng biến đổi ngược một ma trận các hệ số chỉ chứa một phần tử khác 0, thường đặt bằng 1. Có N2 ma trận như vậy và chúng tạo ra N2 ảnh cơ sở. Đặt một ma trận hệ số là 231 qjpiqpG ,, (18) Trong đó i và j là chỉ số hàng và cột, p và q là các số nguyên xác định vị trí phần tử khác 0. Biến đổi ngược [biểu thức (13)] là nqTmpTnkTmiTF N i N k qkpinm ,,,, 1 0 1 0 ,, (19) Vì thế, đối với biến đổi đơn vị tách được, mỗi ảnh cơ sở là một tích hai hàng của ma trận biến đổi. Giống như đối với các tín hiệu một chiều, có thể coi các ảnh cơ sở như tập các thành phần cơ sở để phân tích một ảnh bất kỳ. Chúng cũng tạo nên những khối để tái tạo một ảnh bất kỳ. Biến đổi xuôi thực hiện sự phân tích bằng cách xác định các hệ số. Biến đổi ngược thực hiện sự khôi phục lại bằng cách cộng các ảnh cơ sở,căn cứ trên các hệ số đó. Bởi vì tồn tại rất nhiều tập ảnh cơ sở, cũng như tồn tại rất nhiều phép biến đổi. Vì vậy, một tập các ảnh cơ sở đặc trưng chỉ quan trọng trong ngữ cảnh của một biến đổi đặc biệt. 13.4. BIẾN ĐỔI ĐIỀU HOÀ Với những nguyên nhân đã đề cập đến trong chương 10, biến đổi Fourier đã nổi lên như một biến đổi đơn quan trọng nhất trong xử lý ảnh số. Tuy nhiên, nó có vài quan hệ cũng sử dụng các hàm cơ sở điều hoà. Chúng sẽ được đưa ra trong phần này, sau một bài thảo luận ngắn gọn về biến đổi Fourier. 13.4.1. Biến đổi Fourier rời rạc Đã được giới thiệu trong chương 10, DFT lại được xem xét ở đây, trong nội dung các biến đổi đơn vị tách biệt, cho phép chúng ta nêu ra những so sánh giữa nó và những biến đổi khác của cùng một kiểu. Ma trận hạt nhân đối với DFT (biểu thức (6) và (7)) là W 1,10,1 1,00,0 NNN N ww ww (20) Trong đó N ikj ki eN w 2 , 1 (21) Bởi vì tính tuần hoàn của thành phần mũ phức, W bằng 1. Các DFT xuôi và ngược một chiều là F = Wf và f = W*t F (22) Trong đó f và F là các vec tơ tín hiệu và phổ. Nếu f là thực, thì nói chung, F sẽ có các thành phần phức. Chỉ nếu f đối xứng hoàn toàn thì F mới là thực. 13.4.1.1. Vec tơ phổ Hình 13-2 cho thấy nơi mà các thành phần tần sóoo khác nhau xuất hiện trong vec tơ phổ F, khi f là thực. Thành phần tần số 0 và thành phần tần số cao nhất (tương ứng với tần số Nyquist) xuất hiện chỉ một lần. Những thành phần còn lại được nhân đôi như các liên hợp phức. (Nhắc lại rằng phổ của một hàm thực là một hàm Hermite.) Nếu coi F như một vec tơ hàng, thì N/2 + 1 phần tử đầu tiên là nửa bên phải của phổ, 232 còn lại N/2 - 1 phần tử sau thuộc nửa bên trái. Tần số tương ứng với phần tử thứ i của F là 112/2 2/02 NiNf N iN Nif N i s N N i (23) Trong đó fN là tần số Nyquist (tần số cơ bản, bằng nửa tần số lấy mẫu). Nếu N/2 - 1 phần tử sau của f tạo thành một ảnh sao chép lại của các phần tử từ 1 đến N/2 - 1, thì F là chẵn và sẽ có giá trị thực. HÌNH 13-2 Hình 13-2 Vị trí các thành phần tần số khác nhau trong vec tơ phổ Ta có thể quay các phần tử của F đi một lượng N/2, sử dụng phép toán dịch phải (hay trái) vòng tròn, để tạo ra một vec tơ thích hợp cho việc vẽ phổ. Trong trường hợp đó, phần tử tần số 0 được định vị tại N/2, và tần số tăng theo cả hai chiều. Phần tử tần số Nyquist chỉ xuất hiện tại F0. Lý thuyết dịch của biến đổi Fourier (Xem phần 10.2.3) cung cấp một cách khác cũng đạt đến kết quả như vậy. Việc áp dụng lý thuyết dịch trong miền tần số cho ta xfxfxjxf N uxjuuFxfuF x1exp2exp 00 (24) Trong đó lượng dịch là u0 = N/2. Nghĩa là chúng ta chỉ đổi dấu của các phần tử đánh số lẻ của f(x) trước khi thực hiện DFT. 13.4.1.2. DFT hai chiều Các DFT hai chiều xuôi và ngược là G = WFW và F = W*tGW*t (25) Trong đó F là ảnh dạng ma trận và G là ma trận phổ của nó. Hình 13-3 cho thấy vị trí mà các thành phần tần số không gian khác nhau được định vị trong ma trận phổ G. sự sắp xếp lại bốn góc phần tư, cho trong hình, khiến cho việc hiển thị phổ thuận tiện hơn. Theo cách đó, tần số 0 nằm tại tâm của ma trận, và từ đây tần số tăng dần ra. Biểu thức (24) được tổng quát hoá cho trường hợp hai chiều thành yxfNvNuFyxfvuF yx ,12/,2/,, (26) Và lại đổi dấu một nửa số phần tử trong ma trận ảnh F để có được phép dịch mong muốn. Nếu F đối xứng như trong hình 13-3(a) thì G sẽ có giá trị thực. 233 13.4.2. Biến đổi cosin rời rạc Biến đổi cosin rời rạc (Discrete Cosin Transform-DFT) hai chiều được định nghĩa như sau 1 0 1 0 2 12cos 2 12cos,, N i N k c N nk N mikignmnmG (27) Và biến đổi ngược của nó là 1 0 1 0 2 12cos 2 12cos,, N m N n c N nk N minmGnmkig (28) Trong đó các hệ số là Nm N m N 1210 i víµ v (29) Giống như DFT, DCT có thể được biểu diễn như một phép toán ma trận đơn vi dưới dạng CgCG c (30) Trong đó ma trận hạt nhân có các phần tử N mimCi,m 1 12 cos (31) Cũng giống như DFT, DCT có thể được tính bằng một thuật giải nhanh. Khác với DFT, DCT là thực. Nó được sử dụng rộng rãi trong nén ảnh. 13.4.3. Biến đổi sin Jain đã đưa ra định nghĩa biến đổi sin rời rạc như sau 1 0 1 0 2 11sin 2 11sin, 1 2, N i N k s N nk N mikig N nmG (32) Và 1 0 1 0 2 11sin 2 11sin, 1 2, N m N n s N nk N minmG N kig (33) DST có các phần tử ma trận hạt nhân 1 11sin 1 2 , N ki N T ki (34) Không giống các biến đổi điều hoà khác, DST được tính toán tiện lợi ... tỷ lệ lẫn vị trí. Điều này khiến cho bản chất cặp tỷ lệ-vị trí là hiển nhiên trong các hàm cơ bản của nó (hình 13-5). Đặc tính nêu trên phân biệt biến đổi Haar với các biến đổi khác đã đề cập trước đây và thiết lập điểm xuất phát cho các biến đổi sóng con, sẽ trình bày ở chương tiếp theo. Liên hệ hàm cơ sở. Bởi vì các hàm Haar thay đổi theo hai hướng (tỷ lệ và vị trí) nên chúng phải được xác định rõ bằng một cặp giản đồ liên hệ. Các hàm Haar được định nghĩa trên đoạn [0, 1] như dưới đây. Cho số nguyên 10 Nk được xác định (duy nhất) bằng hai số nguyên khác, p và q, như sau k = 2p + q - 1 (47) Chú ý rằng với cấu trúc này, không chỉ k là hàm của p và q, mà p và q cũng là hàm của k. Với giá trị k > 0 bất kỳ, 2p là luỹ thừa 2 lớn nhất sao cho 2p k và q-1 là số dư. Hàm Haar được định nghĩa bởi N xh 1)(0 (482) và l¹i cßn hîp trêng c¸c 0 22 2 1 2 2 2 1 2 12 1)( 2/ 2/ pp p pp p k qx q q xq N xh (49) Nếu chúng ta đặt x = i/N với i = 0, 1,..., N-1, thì biểu thức này tạo ra một tập các hàm cơ bản, mỗi hàm là một cặp xung vuông lẻ, ngoại trừ k = 0, như trong trường hợp nhiều biến đổi khác được đề cập ỏ đây, là hằng số. Hơn nữa, các hàm cơ bản thay đổi theo cả tỷ lệ (chiều rộng) lẫn vị trí. Chỉ số p xác định vị trí, còn q xác định độ dịch. Trong khi các biến đổi đã đề cập từ trước cho đến giờ sử dụng các hàm cơ sở có chiều rộng đầy đủ, thì các hàm Haar đều là cặp xung chữ nhật lẻ được lấy tỷ lệ, các phiên bản của một hàm “đơn nguyên” đã dịch. Tính chất này có hai chủ yếu. Thứ nhất, mặc dù các hàm cơ sở được nhận biết bằng chỉ số đơn k, nhưng chúng có tính chất tỷ lệ-vị trí đối ngẫu đượ xác định rõ bởi các chỉ số p và q. Vì thế, nó không được sáng tỏ cho lắm khi vẽ các hệ số biến đổi trên trục k so với vẽ trên, ví dụ, phổ tần số thông thường nhận được bằng biến đổi Fourier. Thứ hai, cho trước một tính chất đặc thù, ví dụ như cạnh, được thên vào tín hiệu tại một vài vị trí dọc theo trục x. Biến đổi Fourier, sẽ mã hoá vị trí này thành phổ pha phù hợp với lý thuyết dịch (Xem phần 10.2.3). Trong khi đặc tính vị trí được xác định duy nhất và có thể khôi phục một cách chính xác nhờ biến đổi Fourier ngược, thì có thể không nhìn thấy nó trong một thể hiện thích hợp nào đó của phổ. (Chú ý: nếu một đặc tính đơn làm tín hiệu nổi bật, thì đồ thị pha sẽ tuyến tính, với độ dốc liên quan đến đặc tính vị trí (như trong lý thuyết dịch) và có thể sử dụng điều này để định 238 vị đặc tính. Tuy nhiên, vô số các đặc trưng hay hiện diện của nhiễu thường khiến cho đồ thị pha phức tạp đến nỗi không thể hiểu được.) Ma trận hạt nhân đơn vị đối với biến đổi Haar 8 8 là 22000000 00220000 00002200 00000022 22220000 00002222 11111111 11111111 8 1Hr (50) HÌNH 13-6 Hình 13-6 Ảnh cơ sở biến đổi haar với N = 8 13.6. BIẾN ĐỔI CĂN CỨ VÀO EIGEN VEC TƠ Hai biến đổi quan trọng sử dụng các hàm cơ sở xuất phát từ eigenanalysis. 13.6.1. Phân tích sinh (Eigenanalysis) Nhắc lại rằng đối với một ma trận A, N N, có N hệ số tỷ lệ, k, k = 0, 1, ..., N -1, sao cho 0 IA k (51) Các k được gọi là các giá trị sinh (eigenvalue) của ma trận. Hơn nữa, tập các vec tơ vk sao cho kkk vAv (52) được gọi là các vec tơ sinh (eigenvector) của A. chúng là N 1 và mỗi vec tơ tương ứng với một trong những giá trị sinh. Các vec tơ sinh tạo thành tập cơ sở trực chuẩn. 13.6.2. Phân tích thành phần chính Hotelling đã phát triển một phép biến đổi tuyến tính, cho phép loại bỏ tương quan giữa các phần tử của vec tơ ngẫu nhiên và được gọi là “thứ tự các thành phần chính”. 239 Sau đó Karhunen và Loeve đã phát triển một phép biến đổi tín hiệu liên tục tương tự như vậy. Tiếp cận này dẫn đến khái niệm biến đổi ảnh rời rạc. Giả sử x là vec tơ ngẫu nhiên N 1; tức là, mỗi phần tử xi của x là một biến ngẫu nhiên. Vec tơ trung bình của x có thể được ước lượng từ một mẫu L của các vec tơ trên bằng công thức L l lx xL m 1 1 (53) Và ma trận hiệp biến là L l xxll t xxx mmxxL mxmxC 1 ''1 (54) Ma trận hiệp biến là ma trận N 1, thực và đối xứng. Các phần tử trên đường chéo là các biến trạng của các biến ngẫu nhiên riêng biệt, trong khi các phần tử ngoài đường chéo là các hiệp biến của chúng. Bây giờ để ma trận A định nghĩa một phép biến đổi tuyến tính, tạo ra một vec tơ y mới từ một vec tơ x bất kỳ bởi xmxAy (55) Trong đó A được xây dựng sao cho các hàng của nó là các vec tơ sinh của Cx. Để thuận tiên, chúng ta sắp xếp các hàng theo thứ tự độ lớn các giá trị sinh giảm dần. Vec tơ biến đổi y là vec tơ ngẫu nhiên với trung bình 0. Ma trận hiệp biến của nó liên quan đến ma trận hiệp biến của x bởi txy AACC (56) Vì các hàng của A là các vec tơ sinh của Cx, nên Cy là một ma trận đường chéo mà các giá trị sinh của Cx nằm trên đường chéo của nó. (Đây là kết quả của biểu thức (52)). Vì thế, N yC 0 01 (57) Và k cũng là các giá trị sinh của Cy. Bởi vì các phần tử nằm ngoài đường chéo của Cy bằng 0, nên các phần tử của y là không tương quan. Vì vậy, biến đổi tuyến tính A sẽ loại bỏ sự tương quan giữa các biến. Hơn nữa, mỗi biến k lại là biến trạng của yk, biến biến đổi thứ k. Lưu ý rằng biến đổi của biểu thức (55) có thể đảo ngược; tức là, chúng ta có thể tái tạo một vec tơ x từ vec tơ biến đổi y của nó theo myAmyAx t 1 (58) Đẳng thức sau đúng vì A là đơn vị, thực, và trực giao. 13.6.2.1. Sự giảm chiều Chúng ta có thể giảm số chiều của các vec tơ y bằng cách bỏ qua một hay nhiều eigenvecter mang giá trị sinh nhỏ. Đặt B là ma trận M N (M < N) có được từ A do bỏ đi các hàng thấp hơn, và giả sử rằng m = 0. Thì các vec tơ biến đổi sẽ nhỏ hơn (chảng hạn M 1) và được cho bởi Bxy (59) 240 Nhưng x cũng có thể tái tạo (gần đúng) lại bằng yBx t (60) Sai số bình phương trung bình của xấp xỉ này là N Mk kMSE 1 (61) Tức là, tổng tuyệt đối các giá trị sinh tương ứng với các vec tơ sinh bị loại bỏ. Thường thì các giá trị sinh biên độ thay đổi một cách đáng kể và có thể bỏ qua các giá trị nhỏ hơn mà không gặp phải sai số đáng kể. 13.6.3. Biến đổi Karhunen-Loeve Biểu thức (55) định nghĩa một biến đổi rời rạc (một chiều). Nó được gọi là biến đổi Karhunen-Loeve (hay K-L), biến đổi Hotelling, biến đổi vec tơ sinh hay phương pháp thành phần chính, tuỳ theo từng trường hợp. Chúng ta sẽ bám vào thực tiễn phổ biến của biến đổi Karhunen-Loeve. Khả năng giảm chiều của biến đổi Karhunen-Loeve khiến cho nó rất hữu ích đối với kỹ thuật nén ảnh. Ví dụ, các ảnh đa phổ có nhiều giá trị mức xám tại từng điểm ảnh, mỗi mức xám tương ứng với một dải phổ khác nhau. Vì vậy, ảnh đa phổ 1000 1000, kênh 24 có thể được xem như tập một triệu vec tơ phần tử 24 ngẫu nhiên (chẳng hạn các điểm ảnh). Có thể áp dụng kỹ thuật giảm chiều Karhunen-Loeve vào tập các vec tơ này. vì sự tương quan giữa các dải phỏ khác nhau của mọt ảnh đa phổ thường khá cao, nên nhiều giá trị sinh 24 sẽ nhỏ. Nghĩa là ngăn xếp các ảnh dơn sắc 24 có thể được biểu diễn với sai số nhỏ chỉ nhờ vào một vài ảnh thành phần chính. Mỗi ảnh thành phần được tính như tổng trọng số 24 ban đầu. Hơn nữa, mỗi ảnh trong tạp ban đầu có thể được khôi phục, một cách xấp xỉ, như một phép kết hợp tuyến tính của một vài ảnh thành phần chính. Ví dụ, việc này làm đơn giản hoá việc lưu trữ và phân loại các ảnh nhận được từ vệ tinh Trái đất. Nói chung, các ảnh cơ sở của biến đổi Karhunen-Loeve hai chiều phụ thuộc vào tính chất thống kê của ảnh đặc trưng biến đổi và không thể viết ra một cách rõ ràng. Tuy nhiên, nếu ảnh là quá trình Markov bậc nhất, nơi mà tương quan giữa các điểm ảnh giảm tuyến tính theo khoảng cách tách biệt giữa chúng, thì các ảnh cơ sở đối với biến đổi K-L có thể được viết rõ ràng. Giả thiết Markov thường khớp các ảnh hay gặp rất tốt. Hơn nữa, khi tương quan giữa các điểm ảnh kiền kề nhau được tiếp cận theo cách duy nhất, thì các hàm K-L cơ sở tiếp cận những theo biến đổi cosin rời rạc. Vì thế, DCT, tính toán dễ dàng, xấp xỉ với biến đổi K-L đối với các ảnh thường hay gặp. 13.6.4. Biến đổi SVD Một ma trận A N N bất kỳ có thể biểu diễn như sau tVUA (62) Trong đó các cột của U và V là các vec tơ sinh của AA', và A'A và là ma trận đường chéo N N chứa các giá trị đơn nhất của A trên đường chéo của nó. Vì U và V là trực giao, AVU t (63) Biểu thức (63) vì thế là xuôi và biểu thức (62) là ngược, của cặp biến đổi đơn vị. Biến đổi này được gọi là biến đổi phân tích giá trị đơn nhất (SVD). Nếu A đối xứng thì U = V. 241 Chú ý rằng, không giống những biến đổi đã đề cập trong những phần trước đây, các ma trận hạt nhân U và V phụ thuộc vào ảnh A đã biến đổi. Nói chung, ta phải tính các vec tơ sinh của AA' và A'A cho từng ảnh qua quá trình biến đổi. Cũng cần lưu ý là do là ma trận đường chéo, nên các phần tử của nó hầu như là khác 0. Vì thế, chúng ta có nén không mất mát theo hệ số N, và nó sẽ lớn hơn nếu A có vài giá trị 0 (hay không đáng kể) đơn nhất. Do đó, sự tính toán thêm sẽ làm nén dữ liệu trong nó một cách đáng kể. Bình thường, vài giá trị đơn nhất đủ nhỏ để có thể bỏ qua với sai số nhỏ. Vì thế nén “mất mát” được thực hiện nhờ bỏ qua các giá trị i,j nhỏ hơn. Sai số bình phương trung bình do quá trình cắt bớt đơn giản là tổng các giá trị đơn nhất bị bỏ qua. Nhìn bên ngoài khả năng nén kỳ diệu của biến đổi SVD có phần không đúng. Mặc dù toàn bộ ảnh có thể được nén thành các phần tử đường chéo , nhưng các ma trận hạt nhân U và V là ma trận đơn vị đối với ảnh được nén. Những ma trận này sẽ được truyền, theo ảnh, trước khi xảy ra sự tái tạo tại bên nhận. Tuy nhiên, có lẽ một cặp ma trận hạt nhân có thể đáp ứng (gần đúng) cho một nhóm các ảnh như nhau. Ví dụ cụ thể. Biến đổi SVD được minh hoạ trong hình 13-7, sử dụng một ảnh 5 5 đối xứng. HÌNH 13-7 Hình 13-7 Biến đổi SVD của một ảnh 5 5 đối xứng 13.7. LỌC TRONG MIỀN BIẾN ĐỔI Trong chương 10, chúng ta đã thấy rằng lọc tuyến tính-hoạt động của một hệ thống tuyến tính bất biến dịch-có thể được mô phỏng như phép nhân phổ Fourier của một ảnh với một hàm truyền đạt định nghĩa trong miên tần số (chẳng hạn biến đổi). Trong khi kết quả quan trọng này chỉ đúng đối với biến đổi Fourier, thì các phép toán lọc ảnh giống nhau cũng có thể được mô phỏng bằng các biến đổi khác. Giống như biến đổi Fourier, biến đổi đơn vị tổng quát mở rộng một ảnh như một tổng trọng số các ảnh cơ sở. Quá trình biến đổi xuôi xác định các hệ số trọng số, trong khi quá trình biến đổi ngược tập hợp ảnh từ sự khai triển các ảnh cơ sở. Lọc trong miền biến đổi bao hàm sự thay dổi các hệ số trọng số trước khi tái tạo ảnh thông qua biến đổi ngược. Đối với lọc tuyến tính, biến đổi là biến đổi Fourier, và sự thay đổi được thực hiện bằng cách nhân phổ với một hàm truyền đạt. Trong trường hợp lọc tổng quát hơn, ma trận hệ số bị thay đổi (bằng phép nhân hay phép toán khác) và biến đổi ngược sẽ tọ ra ảnh lọc. Rõ ràng, đó là tính chất của các vec tơ cơ sở (và của các ảnh cơ sở thu được) nhằm thực hiện các hành động khác nhau của các biến đổi khác nhau. Ví dụ, sự phá huỷ của nhiễu điều hoà xuất hiện rất dày đặc trong miền biến đổi của một biến đổi 242 điều hoà và vì thế dễ dàng loại bỏ bằng cách thiết lập các hệ số tương ứng về 0. Các biến đổi sóng chữ nhật không phù hợp cho lắm đối với vấn đề loại bỏ nhiễu này, vì sự nhiễu tạp sẽ không thể phân biệt với tín hiệu trong miền biến đổi của chúng. Nói chung, nếu các thành phần tín hiệu (mong muốn) hay các thành phần nhiễu (không mong muốn) của ảnh tập trung trên một hay một vài ảnh cơ sở của một biến đổi riêng biệt, thì biến đổi sẽ hữu ích trong việc tách rời ra làm hai. Đó là do các thành phần nói trên được thể hiện dày đặc trong miền biến đổi. Sự trình bày tổng quát cũng được áp dụng vào những vấn đề loại bỏ nhiễu và phát hiện tín hiệu. 13.7.1. Phát hiện biên, dòng và điểm Hình 13-8 minh hoạ khả năng phát hiện biên của biến đổi Haar trên một ảnh 8 8. Vì biến đổi có khả năng tách được nên một tính chất của ảnh là dòng ngang hay dọc hay biên tạo ra các phần tử khác 0 chỉ trên hàng đầu tiên và cột đầu tiên của ảnh biến đổi. HÌNH 13-8 Hình 13-8 Phát hiện biên trên ảnh 8 8 Trong biến đổi Haar, đặc trưng tạo ra gần N/2 phần tử khác 0. Vị trí của đặc trưng xác định phần tử nào (và bao nhiêu) khác 0. Trong các biến đổi khác, tất cả N phần tử của hàng đầu tiên và cột đầu tiên nói chung là khác 0. Hình 13-9 trình bày vài biến đổi khác nhau của một ảnh chứa một xung nhọn. Tất cả N2 phần tử của các biến đổi này đều khác 0, ngoại trừ những phần tử của biến đổi Haar chỉ có 2N phần tử khác 0. Ngoài ra, vị trí của các phần tử khác 0 được xác định bằng vị trí của xung nhọn. HÌNH 13-9 Hình 13-9 Các biến đổi trên ảnh chứa một xung: (a) DST; (b) DCT; (c) Hadamard; (d) Haar. Đầu vào là ma trận 8 8, mọi vị trí đều là 0 ngoại trừ phần tử 243 trên bên trái 13.7.2. Thiết kế bộ lọc Bởi vì nó có mối liên quan gần với các hệ thống tuyến tính bất biến dịch, nên biến đổi Fourier có một nền tảng phát triển vững chắc để sử dụng trong các ứng dụng lọc ảnh. Lý thuyết về các biến đổi khác không được hỗ trợ nhiều lắm và chúng được sử dụng chủ yếu dựa trên thực nghiệm. Hiểu rõ sự giống và khác nhau giữa các biến đổi này sẽ giúp ta tìm kiếm các giải pháp mang tính khả thi. 13.8. TỔNG KẾT NHỮNG ĐIỂM QUAN TRỌNG 1. Các hàng của một ma trận biến đổi N N là tập các vec tơ trực chuẩn. 2. Một biến đổi tuyến tính đơn vị sẽ tạo ra một vec tơ N hệ số biến đổi, mỗi hệ số lại là một tích bên trong của vec tơ đầu vào với một trong các hàng của ma trận biến đổi. 3. Biến đổi ngược được thực hiện tương tự, bằng các tích bên trong của vec tơ hệ số biến đổi với các hàng của ma trận biến đổi ngược. 4. Cũng có thể coi biến đổi ngược như việc tạo thành tổng trọng số các vec tơ cơ sở, trong đó các hệ số là các trọng số. 5. Đối với biến đổi đơn vị tách được, đối xứng hai chiều, các ảnh cơ sở là tích bên ngoài của các hàng trong ma trận biến đổi. BÀI TẬP 1. Các giá trị sinh của một ảnh đa phổ kênh 8 là [6.1 168 0.08 13 64 214 1.2 0.2]. Sai số RMS sẽ là bao nhiêu nếu bạn phân tích thành phần chung với tỷ lệ nén dữ liệu là 2:1. 2. Thiết kế một mặt nạ lọc biến đổi Haar 8 8 để loại bỏ các cạnh ngang nhỏ ra khỏi ảnh. DỰ ÁN 1. Phát triển một chương trình thực hiện biến đổi cosin rời rạc và sử dụng chương trình để chứng minh quá trình lọc thông cao đối với tăng cường ảnh. 2. Phát triển một chương trình thực hiện biến đổi Hartley rời rạc và sử dụng chương trình để chứng minh quá trình lọc thông thấp đối với việc giảm nhiễu. 3. Phát triển một chương trình phân tích thành phần chính để giảm ảnh màu 24 24 xuống thành ảnh trắng đen 16 16. Trình bày các ảnh chứng minh và giải thích trên kết quả suy giảm. 4. Phát triển một chương trình thực hiện biến đổi nghiêng và sử dụng chương trình để chứng tỏ cho sự loại bỏ sắc thái tuyến tính. 5. Phát triển một chương trình thực hiện biến đổi Haar và sử dụng chương trình để đưa ra các biên của một ảnh.
File đính kèm:
- bai_giang_xu_ly_anh_chuong_13_bien_doi_anh_roi_rac.pdf