Bài giảng Xử lý ảnh - Chương 13: Biến đổi ảnh rời rạc

13.1. GIỚI THIỆU

Biến đổi Fourier rời rạc (DFT), đã giới thiệu trong chương 10, là một trong những

phép biến đổi tuyến tính rời rạc hữu ích trong xử lý ảnh số. Trong chương này, chúng

ta sẽ nghiên cứu chủ đề tổng quát hơn, trình bày một vài biến đổi khác và một vài

tính chất cũng như các ứng dụng của chúng.

Ảnh mà chúng ta quan tâm thường ở dạng liên tục và cũng phải được cảm nhận ở

dạng này. Bởi vì chúng ta bắt buộc phải làm việc với sự biểu diễn rời rạc của ảnh liên

tục, nên nhiều quá trình xử lý ảnh số đòi hỏi chúng ta tuân thủ những nguyên tắc lấy

mẫu và nội suy trong khi xử lý dữ liệu rời rạc. Tuy nhiên, một vài ứng dụng cho phép

chúng ta xem xét ảnh số như một thực thể rời rạc mà không đề cập chi tiết đến lịch

sử nguồn gốc của ảnh hay đối với ảnh liên tục cơ bản.

pdf 17 trang phuongnguyen 8560
Bạn đang xem tài liệu "Bài giảng Xử lý ảnh - Chương 13: Biến đổi ảnh rời rạc", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Xử lý ảnh - Chương 13: Biến đổi ảnh rời rạc

Bài giảng Xử lý ảnh - Chương 13: Biến đổi ảnh rời rạc
 227 
Ch­¬ng 13 
BIẾN ĐỔI ẢNH RỜI RẠC 
13.1. GIỚI THIỆU 
Biến đổi Fourier rời rạc (DFT), đã giới thiệu trong chương 10, là một trong những 
phép biến đổi tuyến tính rời rạc hữu ích trong xử lý ảnh số. Trong chương này, chúng 
ta sẽ nghiên cứu chủ đề tổng quát hơn, trình bày một vài biến đổi khác và một vài 
tính chất cũng như các ứng dụng của chúng. 
Ảnh mà chúng ta quan tâm thường ở dạng liên tục và cũng phải được cảm nhận ở 
dạng này. Bởi vì chúng ta bắt buộc phải làm việc với sự biểu diễn rời rạc của ảnh liên 
tục, nên nhiều quá trình xử lý ảnh số đòi hỏi chúng ta tuân thủ những nguyên tắc lấy 
mẫu và nội suy trong khi xử lý dữ liệu rời rạc. Tuy nhiên, một vài ứng dụng cho phép 
chúng ta xem xét ảnh số như một thực thể rời rạc mà không đề cập chi tiết đến lịch 
sử nguồn gốc của ảnh hay đối với ảnh liên tục cơ bản. 
Một ứng dụng điển hình là nén ảnh. Ở đây, người ta muốn mã hoá một ảnh thành 
một dạng dữ liệu nhỏ gọn hơn, mà không làm mất mát hay chỉ mất mát thông tin 
không cần thiết. Bình thường, vì lẽ quang học, lấy mẫu và nội suy đối với sự số hoá 
và hiển thị ảnh là không liên quan trực tiếp và ảnh số có thể xem xét đơn thuần như 
một tệp dữ liệu. 
Biểu diễn một ảnh là một biểu hiện đặc biệt của dữ liệu ảnh. Đây là một sự thể 
hiện dữ liệu ảnh theo một dạng hay một khuôn dạng đặc biệt. Một ảnh số có thể được 
biểu diễn như một ma trận hay như một vec tơ hàng. 
13.2. BIẾN ĐỔI TUYẾN TÍNH 
13.2.1. Biến đổi tuyến tính rời rạc một chiều 
Định nghĩa. Nếu x là vec tơ N 1 và T là ma trận N N, thì 
 Txyxty
N
j
jjii 
hay 
1
0
, (1) 
trong đó i = 0, ..., N-1 là biến đổi Fourier của vec tơ x. Ma trận T cũng được gọi là 
ma trận hạt nhân (kernel matrix) của phép biến đổi. Lưu ý rằng cách sử dụng từ hạt 
nhân khác với cách sử dụng thuật ngữ hạt nhân tích chập đã đề cập trong phần 9.3.4. 
Kết quả của phép biến đổi làmột vec tơ y, N 1 khác. Phép biến đổi là tuyến tính 
bởi vì y được thực hiện bằng một phép tổng bậc nhất của các phần tử đầu vào. Mỗi 
phần tử yi là tích của vec tơ đầu vào x với hàng thứ i của ma trận T. 
Ví dụ. Một ví dụ đơn giản của phép biến đổi tuyến tính là phép quay một vec tơ 
trong hệ thống toạ độ hai chiều. (Xem chương 8) Ở đây, 
2
1
2
1
cossin
sincosy
x
x
y 

 (2) 
Quay vec tơ x quanh gốc toạ độ một góc . 
Phép nghịch đảo. Sau phép biến đổi, vec tơ ban đầu có thể được khôi phục bằng 
phép biến đổi ngược. 
 xTy 1 (3) 
 228 
Chứng tỏ rằng T không duy nhất. Như trên, mỗi phần tử của x lại là một tích, đây 
là tích giữa y và một hàng của T-1. Với ví dụ trước đây, thì điều này chẳng khác gì 
một phép quay cùng một góc theo chiều ngược lại. 
13.2.1.1. Biến đổi đơn vị 
Đối với vec tơ chiều dài N đã cho, có rất nhiều ma trận biến đổi có thể được sử 
dụng. Tuy nhiên, những ma trận hữu ích hơn liên quan đến một lớp các thuộc tính 
nào đó. 
Nếu T là ma trận đơn vị, thì 
 ITTTT tt **vµ TT *t-1 (4) 
Trong đó * ký hiệu liên hợp phức cho mỗi phần tử của T và t ký hiệu phép chuyển 
vị. Nếu T là ma trận đơn vị và chỉ có các thành phần thực thì nó là ma trận trực giao, 
và được biểu diễn như sau 
 ITTTT tt vµ TT t1- (5) 
Chú ý rằng phần tử i, j của TTt chính là tích các hàng i và j của T. Biểu thức (5) 
chứng tỏ rằng các phần tử đều là 0, trừ phần tử i = j, trong trường hợp nó là đơn vị. 
Vì thế, các hàng của T là tập các vec tơ trực giao. 
Ví dụ: DFT một chiều. DFT là một ví dụ về biến đổi đơn vị, vì 
 hay 
1
0
2exp1
N
i
ik N
ikjf
N
F F = Wf (6) 
Trong đó W là ma trận đơn vị (nhưng không trực giao) với các phần tử (phức) 
N
ikj
N i
ki  2exp
1
, (7) 
Nội suy. Bình thường, ma trận biến đổi T không đơn nhất (chẳng hạn, rank(T) = 
N), để có thể đảo ngược biến đổi, như biểu thức (3). Các hàng của T tạo thành một cơ 
sở trực giao (một tập các vec tơ cơ sở trực giao hay các vec tơ đơn vị) đối với không 
gian vec tơ N chiều của tất cả các vec tơ N 1. Điều này có nghĩa là một chuỗi N 1 
bất kỳ có thể xem như biểu diễn một vec tơ ban đầu thành một điểm trong không 
gian N chiều. Hơn nữa, một biến đổi dạng biểu thức (1) bất kỳ có thể xem như là một 
biến đổi toạ độ, quay vec tơ trong không gian N chiều mà không thay đổi độ dài của 
vec tơ. 
Theo giả thiết thì một biến đổi tuyến tính đơn vị sinh ra vec tơ y, vec tơ N hệ số 
biến đổi, mỗi một hệ số được tính như là một tích của vec tơ vào x với một hàng của 
ma trận biến đổi T. Biến đổi ngược được tính toán tương tự, giống như một tập các 
tích thành phần của vec tơ hệ số biến đổi với các hàng của ma trận biến đổi ngược. 
Biến đổi tiến nói chung được coi là một quá trình phân tích, việc phá vỡ vec tơ tín 
hiệu ra thành các thành phần cơ bản. Các thành phần cơ bản này thường thấy ở dạng 
các vec tơ cơ sở. Các hệ số biến đổi chỉ rõ có thể tìm thấy bao nhiêu vec tơ trong mỗi 
thành phần được thể hiện trong tập những vec tơ riêng biệt được phân tích. 
Biến đổi ngược, nói cách khác, thường được coi là một quá trình tổng hợp 
(synthesis), tập hợp thành vec tơ ban đầu từ các thành phần của nó theo phép tổng. Ở 
đây, các hệ số biến đổi chỉ rõ khối lượng chính xác mỗi vec tơ cơ sở phải được thêm 
vào tập hợp để tái tạo lại vec tơ đầu vào đầy đủ và chính xác. 
Mấu chốt của quá trình này là nguyên tắc mà bất kỳ một vec tơ nào cũng có thể 
được phân tích duy nhất thành một tập các vec tơ biên độ cơ bản thích hợp và sau đó 
khôi phục lại bằng cách thêm các thành phần này lại với nhau để tái tạo vec tơ ban 
đầu. Điều này có ý nghĩa rằng số các hệ số biến đổi bằng với số các phần tử trong 
 229 
vec tơ. Vì thế, số bậc tự do trước và sau biến đổi là như nhau và quá trình cũng 
không tạo ra hay phá huỷ thông tin. 
Một vec tơ được biến đổi là một sự biểu diễn của vec tơ ban đầu. Vì nó chứa cùng 
một số lượng các phân tử (và vì thế có cùng số bậc tự do) như vec tơ gốc và vì vec tơ 
gốc có thể khôi phục từ nó mà không sai sót, nên nó có thể được coi là một dạng lựa 
chọn của việc biểu diễn vec tơ ban đầu. Chương này xem xét một vài phương pháp 
lựa chọn cho việc biểu diễn tín hiệu và ảnh số, và lợi ích của mối phương pháp. 
13.2.2. Biến đổi tuyến tính rời rạc hai chiều 
Biến đổi tuyến tính hai chiều nói chung là biến đổi ma trận F, N N thành ma trận 
được biến đổi G (cũng là N N) là 
 nmkiFG
N
i
N
k
kim,n ,,,
1
0
1
0
,
 (8) 
trong đó i, k, m và n là các biến rời rạc nằmg trong khoảng từ 0 đến N - 1 và 
(i,k,m,n) là hàm hạt nhân của phép biến đổi. 
Có thể xem (i,k,m,n) như là một ma trận khối N2 N2 có N hàng, mỗi hàng có N 
khối, mỗi khối lại là một ma trận N N. Các khối được đánh chỉ số m, n và những 
phần tử của từng ma trận con N N được đánh chỉ số i, k (Xem hình 13-1). 
Nếu có thể tách (i,k,m,n) ra thành tích các hàm thành phần hàng và cột-tức là, 
nếu 
 nkTmiTi,k,m,n cr ,,  (9) 
Thì biến đổi được gọi là tách được (separable). Nghĩa là nó có thể tiến hành trong 
hai bước-một phép toán theo hàng tiếp theo là một phép toán theo cột (hay ngược 
lại): 
 miTnkTFG r
N
i
N
k
kinm ,,
1
0
1
0
,,  
 (10) 
Hơn nữa, nếu hai hàm thành phần giống nhau thì biến đổi cũng được gọi là đối 
xứng (không được nhầm lẫn vpí ma trận đối xứng). Và 
 nkTmiTi,k,m,n ,,  (11) 
Và biểu thức (8) có thể viết lại như sau 
 TFTGnkTFmiTG
N
k
cki
N
i
nm 
 
 hay 
1
0
,
1
0
, ,, (12) 
Trong đó T là ma trận đơn vị, gọi là ma trận hạt nhân của biến đổi. Chúng ta sẽ sử 
dụng ký hiệu cho toàn bộ chương này, để biểu thị cho biến đổi đơn vị đối xứng, tách 
được và tổng quát. 
Biến đổi ngược là 
 ttGTTGTTF **11 (13) 
và nó khôi phục lại F một cách chính xác. 
Ví dụ: DFT hai chiều. DFT hai chiều là biến đổi đơn vị dc và tách được. Trong 
trường hợp này, T trong biểu thức (12) trở thành ma trận W do biểu thức (7). 
DFT ngược sử dụng W-1, là chuyển vị liên hợp của W. Cặp biến đổi Fourier rời 
rạc được biểu diễn như sau 
 G = WFW và F = W*tGW*t (14) 
 230 
HÌNH 13-1 
Hình 13-1 Ma trận hạt nhân 
13.2.2.1. Phép biến đổi trực giao 
Không giống như biến đổi Fourier, nhiều biến đổi chỉ có các thành phần thực 
trong ma trận hạt nhân T của chúng. Một ma trận đơn vị với các thành phần thực là 
trực giao và phép biến đổi ngược trở nên đơn giản là 
 ttGTTF (15) 
Nếu T là ma trận đối xứng, như thường gặp, thì biến đổi xuôi và ngược đều như 
nhau, để cho 
 TGTFTFTG vµ (16) 
13.3. HÀM VÀ ẢNH CƠ SỞ 
Khác nhau cơ bản giữa hai biến đổi đơn vị bất kỳ là sự lựa chọn các hàm cơ sở, 
tức là, các hàng của ma trận T. Ở đây, chúng ta sẽ xem xét các hàm cơ sở chi tiết 
hơn. 
13.3.1. Hàm cơ sở 
Các hàng của ma trận hạt nhân tạo thành một tập các vec tơ cơ sở đối với không 
gian vec tơ N chiều. Các hàng là trực chuẩn; tức là 
 kj
N
i
ikij
t TTITT ,
1
0
,,
* *  
 hay (17) 
Trong đó j,k là del ta Kronecker. 
Trong khi một tập các vec tơ trực chuẩn bất kỳ sẽ có lợi cho biến đổi tuyến tính, 
bình thường thì toàn bộ tập xuất phát từ cùng một dạng hàm cơ sở. Ví dụ, biến đổi 
Fourier sử dụng thành phần mũ phức như hàm cơ sở nguyên mẫu. Các hàm cơ sở 
riêng lẻ chỉ khác nhau về tần số. 
Một vec tơ không gian bất kỳ có thể được biểu diễn như tổng trọng số các vec tơ 
đơn vị cơ sở. Một biến đổi đơn vị một chiều (N 1) tương ứng với phép quay vec tơ 
trong không gian vec tơ N chiều. Hơn nữa, vì một ma trận ảnh N N có thể sắp xếp 
để tạo thành vec tơ N2 1, một biến đổi hai chiều, đối xứng, tách được bất kỳ tương 
ứng với một phép quay vec tơ trong không gian N2 chiều. 
13.3.2. Ảnh cơ sở 
Biến đổi hai chiều ngược có thể được coi như quá trình tái tạo ảnh bằng cách cộng 
tập các ảnh cơ sở thích hợp. Mỗi phần tử trong ma trận biến đổi G là một hệ số, được 
nhân với ảnh cơ sở tương ứng trong phép cộng. 
Một ảnh cơ sở có thể được tạo ra bằng biến đổi ngược một ma trận các hệ số chỉ 
chứa một phần tử khác 0, thường đặt bằng 1. Có N2 ma trận như vậy và chúng tạo ra 
N2 ảnh cơ sở. Đặt một ma trận hệ số là 
 231 
 qjpiqpG ,,  (18) 
Trong đó i và j là chỉ số hàng và cột, p và q là các số nguyên xác định vị trí phần 
tử khác 0. Biến đổi ngược [biểu thức (13)] là 
 nqTmpTnkTmiTF
N
i
N
k
qkpinm ,,,,
1
0
1
0
,, 
  
  (19) 
Vì thế, đối với biến đổi đơn vị tách được, mỗi ảnh cơ sở là một tích hai hàng của 
ma trận biến đổi. 
Giống như đối với các tín hiệu một chiều, có thể coi các ảnh cơ sở như tập các 
thành phần cơ sở để phân tích một ảnh bất kỳ. Chúng cũng tạo nên những khối để tái 
tạo một ảnh bất kỳ. Biến đổi xuôi thực hiện sự phân tích bằng cách xác định các hệ 
số. Biến đổi ngược thực hiện sự khôi phục lại bằng cách cộng các ảnh cơ sở,căn cứ 
trên các hệ số đó. 
Bởi vì tồn tại rất nhiều tập ảnh cơ sở, cũng như tồn tại rất nhiều phép biến đổi. Vì 
vậy, một tập các ảnh cơ sở đặc trưng chỉ quan trọng trong ngữ cảnh của một biến đổi 
đặc biệt. 
13.4. BIẾN ĐỔI ĐIỀU HOÀ 
Với những nguyên nhân đã đề cập đến trong chương 10, biến đổi Fourier đã nổi 
lên như một biến đổi đơn quan trọng nhất trong xử lý ảnh số. Tuy nhiên, nó có vài 
quan hệ cũng sử dụng các hàm cơ sở điều hoà. Chúng sẽ được đưa ra trong phần này, 
sau một bài thảo luận ngắn gọn về biến đổi Fourier. 
13.4.1. Biến đổi Fourier rời rạc 
Đã được giới thiệu trong chương 10, DFT lại được xem xét ở đây, trong nội dung 
các biến đổi đơn vị tách biệt, cho phép chúng ta nêu ra những so sánh giữa nó và 
những biến đổi khác của cùng một kiểu. 
Ma trận hạt nhân đối với DFT (biểu thức (6) và (7)) là 
 W
1,10,1
1,00,0
NNN
N
ww
ww



 (20) 
Trong đó 
 N
ikj
ki eN
w
 2
,
1 
 (21) 
Bởi vì tính tuần hoàn của thành phần mũ phức, W bằng 1. 
Các DFT xuôi và ngược một chiều là 
 F = Wf và f = W*t F (22) 
Trong đó f và F là các vec tơ tín hiệu và phổ. Nếu f là thực, thì nói chung, F sẽ có 
các thành phần phức. Chỉ nếu f đối xứng hoàn toàn thì F mới là thực. 
13.4.1.1. Vec tơ phổ 
Hình 13-2 cho thấy nơi mà các thành phần tần sóoo khác nhau xuất hiện trong vec 
tơ phổ F, khi f là thực. Thành phần tần số 0 và thành phần tần số cao nhất (tương ứng 
với tần số Nyquist) xuất hiện chỉ một lần. Những thành phần còn lại được nhân đôi 
như các liên hợp phức. (Nhắc lại rằng phổ của một hàm thực là một hàm Hermite.) 
Nếu coi F như một vec tơ hàng, thì N/2 + 1 phần tử đầu tiên là nửa bên phải của phổ, 
 232 
còn lại N/2 - 1 phần tử sau thuộc nửa bên trái. Tần số tương ứng với phần tử thứ i của 
F là 
112/2
2/02
NiNf
N
iN
Nif
N
i
s
N
N
i
 (23) 
Trong đó fN là tần số Nyquist (tần số cơ bản, bằng nửa tần số lấy mẫu). Nếu N/2 - 
1 phần tử sau của f tạo thành một ảnh sao chép lại của các phần tử từ 1 đến N/2 - 1, 
thì F là chẵn và sẽ có giá trị thực. 
HÌNH 13-2 
Hình 13-2 Vị trí các thành phần tần số khác nhau trong vec tơ phổ 
Ta có thể quay các phần tử của F đi một lượng N/2, sử dụng phép toán dịch phải 
(hay trái) vòng tròn, để tạo ra một vec tơ thích hợp cho việc vẽ phổ. Trong trường 
hợp đó, phần tử tần số 0 được định vị tại N/2, và tần số tăng theo cả hai chiều. Phần 
tử tần số Nyquist chỉ xuất hiện tại F0. 
Lý thuyết dịch của biến đổi Fourier (Xem phần 10.2.3) cung cấp một cách khác 
cũng đạt đến kết quả như vậy. Việc áp dụng lý thuyết dịch trong miền tần số cho ta 
 xfxfxjxf
N
uxjuuFxfuF x1exp2exp 00 
 (24) 
Trong đó lượng dịch là u0 = N/2. Nghĩa là chúng ta chỉ đổi dấu của các phần tử 
đánh số lẻ của f(x) trước khi thực hiện DFT. 
13.4.1.2. DFT hai chiều 
Các DFT hai chiều xuôi và ngược là 
 G = WFW và F = W*tGW*t (25) 
Trong đó F là ảnh dạng ma trận và G là ma trận phổ của nó. 
Hình 13-3 cho thấy vị trí mà các thành phần tần số không gian khác nhau được 
định vị trong ma trận phổ G. sự sắp xếp lại bốn góc phần tư, cho trong hình, khiến 
cho việc hiển thị phổ thuận tiện hơn. Theo cách đó, tần số 0 nằm tại tâm của ma trận, 
và từ đây tần số tăng dần ra. Biểu thức (24) được tổng quát hoá cho trường hợp hai 
chiều thành 
 yxfNvNuFyxfvuF yx ,12/,2/,, (26) 
Và lại đổi dấu một nửa số phần tử trong ma trận ảnh F để có được phép dịch 
mong muốn. Nếu F đối xứng như trong hình 13-3(a) thì G sẽ có giá trị thực. 
 233 
13.4.2. Biến đổi cosin rời rạc 
Biến đổi cosin rời rạc (Discrete Cosin Transform-DFT) hai chiều được định nghĩa 
như sau 
 
1
0
1
0 2
12cos
2
12cos,,
N
i
N
k
c N
nk
N
mikignmnmG (27) 
Và biến đổi ngược của nó là 
 
1
0
1
0 2
12cos
2
12cos,,
N
m
N
n
c N
nk
N
minmGnmkig (28) 
Trong đó các hệ số là 
 Nm
N
m
N
 1210 i víµ v (29) 
Giống như DFT, DCT có thể được biểu diễn như một phép toán ma trận đơn vi 
dưới dạng 
 CgCG c (30) 
Trong đó ma trận hạt nhân có các phần tử 
N
mimCi,m 1
12 
 cos (31) 
Cũng giống như DFT, DCT có thể được tính bằng một thuật giải nhanh. Khác với 
DFT, DCT là thực. Nó được sử dụng rộng rãi trong nén ảnh. 
13.4.3. Biến đổi sin 
Jain đã đưa ra định nghĩa biến đổi sin rời rạc như sau 
 
1
0
1
0 2
11sin
2
11sin,
1
2,
N
i
N
k
s N
nk
N
mikig
N
nmG (32) 
Và 
 
1
0
1
0 2
11sin
2
11sin,
1
2,
N
m
N
n
s N
nk
N
minmG
N
kig (33) 
DST có các phần tử ma trận hạt nhân 
1
11sin
1
2
, N
ki
N
T ki
 (34) 
Không giống các biến đổi điều hoà khác, DST được tính toán tiện lợi  ...  tỷ lệ lẫn vị trí. Điều này khiến cho bản chất cặp tỷ lệ-vị trí là hiển 
nhiên trong các hàm cơ bản của nó (hình 13-5). Đặc tính nêu trên phân biệt biến đổi 
Haar với các biến đổi khác đã đề cập trước đây và thiết lập điểm xuất phát cho các 
biến đổi sóng con, sẽ trình bày ở chương tiếp theo. 
Liên hệ hàm cơ sở. Bởi vì các hàm Haar thay đổi theo hai hướng (tỷ lệ và vị trí) 
nên chúng phải được xác định rõ bằng một cặp giản đồ liên hệ. Các hàm Haar được 
định nghĩa trên đoạn [0, 1] như dưới đây. Cho số nguyên 10 Nk được xác 
định (duy nhất) bằng hai số nguyên khác, p và q, như sau 
 k = 2p + q - 1 (47) 
Chú ý rằng với cấu trúc này, không chỉ k là hàm của p và q, mà p và q cũng là 
hàm của k. Với giá trị k > 0 bất kỳ, 2p là luỹ thừa 2 lớn nhất sao cho 2p k và q-1 là 
số dư. 
Hàm Haar được định nghĩa bởi 
N
xh 1)(0 
 (482) 
và 
l¹i cßn hîp tr­êng c¸c 
0
22
2
1
2
2
2
1
2
12
1)( 2/
2/
pp
p
pp
p
k
qx
q
q
xq
N
xh (49) 
Nếu chúng ta đặt x = i/N với i = 0, 1,..., N-1, thì biểu thức này tạo ra một tập các 
hàm cơ bản, mỗi hàm là một cặp xung vuông lẻ, ngoại trừ k = 0, như trong trường 
hợp nhiều biến đổi khác được đề cập ỏ đây, là hằng số. Hơn nữa, các hàm cơ bản 
thay đổi theo cả tỷ lệ (chiều rộng) lẫn vị trí. Chỉ số p xác định vị trí, còn q xác định 
độ dịch. 
Trong khi các biến đổi đã đề cập từ trước cho đến giờ sử dụng các hàm cơ sở có 
chiều rộng đầy đủ, thì các hàm Haar đều là cặp xung chữ nhật lẻ được lấy tỷ lệ, các 
phiên bản của một hàm “đơn nguyên” đã dịch. Tính chất này có hai chủ yếu. 
Thứ nhất, mặc dù các hàm cơ sở được nhận biết bằng chỉ số đơn k, nhưng chúng 
có tính chất tỷ lệ-vị trí đối ngẫu đượ xác định rõ bởi các chỉ số p và q. Vì thế, nó 
không được sáng tỏ cho lắm khi vẽ các hệ số biến đổi trên trục k so với vẽ trên, ví dụ, 
phổ tần số thông thường nhận được bằng biến đổi Fourier. 
Thứ hai, cho trước một tính chất đặc thù, ví dụ như cạnh, được thên vào tín hiệu 
tại một vài vị trí dọc theo trục x. Biến đổi Fourier, sẽ mã hoá vị trí này thành phổ pha 
phù hợp với lý thuyết dịch (Xem phần 10.2.3). Trong khi đặc tính vị trí được xác 
định duy nhất và có thể khôi phục một cách chính xác nhờ biến đổi Fourier ngược, 
thì có thể không nhìn thấy nó trong một thể hiện thích hợp nào đó của phổ. (Chú ý: 
nếu một đặc tính đơn làm tín hiệu nổi bật, thì đồ thị pha sẽ tuyến tính, với độ dốc liên 
quan đến đặc tính vị trí (như trong lý thuyết dịch) và có thể sử dụng điều này để định 
 238 
vị đặc tính. Tuy nhiên, vô số các đặc trưng hay hiện diện của nhiễu thường khiến cho 
đồ thị pha phức tạp đến nỗi không thể hiểu được.) 
Ma trận hạt nhân đơn vị đối với biến đổi Haar 8 8 là 
22000000
00220000
00002200
00000022
22220000
00002222
11111111
11111111
8
1Hr (50) 
HÌNH 13-6 
Hình 13-6 Ảnh cơ sở biến đổi haar với N = 8 
13.6. BIẾN ĐỔI CĂN CỨ VÀO EIGEN VEC TƠ 
Hai biến đổi quan trọng sử dụng các hàm cơ sở xuất phát từ eigenanalysis. 
13.6.1. Phân tích sinh (Eigenanalysis) 
Nhắc lại rằng đối với một ma trận A, N N, có N hệ số tỷ lệ, k, k = 0, 1, ..., N -1, 
sao cho 
 0 IA k (51) 
Các k được gọi là các giá trị sinh (eigenvalue) của ma trận. Hơn nữa, tập các vec 
tơ vk sao cho 
 kkk vAv  (52) 
được gọi là các vec tơ sinh (eigenvector) của A. chúng là N 1 và mỗi vec tơ 
tương ứng với một trong những giá trị sinh. Các vec tơ sinh tạo thành tập cơ sở trực 
chuẩn. 
13.6.2. Phân tích thành phần chính 
Hotelling đã phát triển một phép biến đổi tuyến tính, cho phép loại bỏ tương quan 
giữa các phần tử của vec tơ ngẫu nhiên và được gọi là “thứ tự các thành phần chính”. 
 239 
Sau đó Karhunen và Loeve đã phát triển một phép biến đổi tín hiệu liên tục tương tự 
như vậy. Tiếp cận này dẫn đến khái niệm biến đổi ảnh rời rạc. 
Giả sử x là vec tơ ngẫu nhiên N 1; tức là, mỗi phần tử xi của x là một biến ngẫu 
nhiên. Vec tơ trung bình của x có thể được ước lượng từ một mẫu L của các vec tơ 
trên bằng công thức 
 
L
l
lx xL
m
1
1 (53) 
Và ma trận hiệp biến là 
  
L
l
xxll
t
xxx mmxxL
mxmxC
1
''1 (54) 
Ma trận hiệp biến là ma trận N 1, thực và đối xứng. Các phần tử trên đường 
chéo là các biến trạng của các biến ngẫu nhiên riêng biệt, trong khi các phần tử ngoài 
đường chéo là các hiệp biến của chúng. 
Bây giờ để ma trận A định nghĩa một phép biến đổi tuyến tính, tạo ra một vec tơ y 
mới từ một vec tơ x bất kỳ bởi 
 xmxAy (55) 
Trong đó A được xây dựng sao cho các hàng của nó là các vec tơ sinh của Cx. Để 
thuận tiên, chúng ta sắp xếp các hàng theo thứ tự độ lớn các giá trị sinh giảm dần. 
Vec tơ biến đổi y là vec tơ ngẫu nhiên với trung bình 0. Ma trận hiệp biến của nó 
liên quan đến ma trận hiệp biến của x bởi 
 txy AACC (56) 
Vì các hàng của A là các vec tơ sinh của Cx, nên Cy là một ma trận đường chéo mà 
các giá trị sinh của Cx nằm trên đường chéo của nó. (Đây là kết quả của biểu thức 
(52)). Vì thế, 
N
yC


0
01
 (57) 
Và k cũng là các giá trị sinh của Cy. 
Bởi vì các phần tử nằm ngoài đường chéo của Cy bằng 0, nên các phần tử của y là 
không tương quan. Vì vậy, biến đổi tuyến tính A sẽ loại bỏ sự tương quan giữa các 
biến. Hơn nữa, mỗi biến k lại là biến trạng của yk, biến biến đổi thứ k. 
Lưu ý rằng biến đổi của biểu thức (55) có thể đảo ngược; tức là, chúng ta có thể 
tái tạo một vec tơ x từ vec tơ biến đổi y của nó theo 
 myAmyAx t 1 (58) 
Đẳng thức sau đúng vì A là đơn vị, thực, và trực giao. 
13.6.2.1. Sự giảm chiều 
Chúng ta có thể giảm số chiều của các vec tơ y bằng cách bỏ qua một hay nhiều 
eigenvecter mang giá trị sinh nhỏ. Đặt B là ma trận M N (M < N) có được từ A do 
bỏ đi các hàng thấp hơn, và giả sử rằng m = 0. Thì các vec tơ biến đổi sẽ nhỏ hơn 
(chảng hạn M 1) và được cho bởi 
 Bxy 

 (59) 
 240 
Nhưng x cũng có thể tái tạo (gần đúng) lại bằng 

 yBx t (60) 
Sai số bình phương trung bình của xấp xỉ này là 
 
N
Mk
kMSE
1
 (61) 
Tức là, tổng tuyệt đối các giá trị sinh tương ứng với các vec tơ sinh bị loại bỏ. 
Thường thì các giá trị sinh biên độ thay đổi một cách đáng kể và có thể bỏ qua các 
giá trị nhỏ hơn mà không gặp phải sai số đáng kể. 
13.6.3. Biến đổi Karhunen-Loeve 
Biểu thức (55) định nghĩa một biến đổi rời rạc (một chiều). Nó được gọi là biến 
đổi Karhunen-Loeve (hay K-L), biến đổi Hotelling, biến đổi vec tơ sinh hay phương 
pháp thành phần chính, tuỳ theo từng trường hợp. Chúng ta sẽ bám vào thực tiễn phổ 
biến của biến đổi Karhunen-Loeve. 
Khả năng giảm chiều của biến đổi Karhunen-Loeve khiến cho nó rất hữu ích đối 
với kỹ thuật nén ảnh. Ví dụ, các ảnh đa phổ có nhiều giá trị mức xám tại từng điểm 
ảnh, mỗi mức xám tương ứng với một dải phổ khác nhau. Vì vậy, ảnh đa phổ 1000 
1000, kênh 24 có thể được xem như tập một triệu vec tơ phần tử 24 ngẫu nhiên 
(chẳng hạn các điểm ảnh). 
Có thể áp dụng kỹ thuật giảm chiều Karhunen-Loeve vào tập các vec tơ này. vì sự 
tương quan giữa các dải phỏ khác nhau của mọt ảnh đa phổ thường khá cao, nên 
nhiều giá trị sinh 24 sẽ nhỏ. Nghĩa là ngăn xếp các ảnh dơn sắc 24 có thể được biểu 
diễn với sai số nhỏ chỉ nhờ vào một vài ảnh thành phần chính. Mỗi ảnh thành phần 
được tính như tổng trọng số 24 ban đầu. Hơn nữa, mỗi ảnh trong tạp ban đầu có thể 
được khôi phục, một cách xấp xỉ, như một phép kết hợp tuyến tính của một vài ảnh 
thành phần chính. Ví dụ, việc này làm đơn giản hoá việc lưu trữ và phân loại các ảnh 
nhận được từ vệ tinh Trái đất. 
Nói chung, các ảnh cơ sở của biến đổi Karhunen-Loeve hai chiều phụ thuộc vào 
tính chất thống kê của ảnh đặc trưng biến đổi và không thể viết ra một cách rõ ràng. 
Tuy nhiên, nếu ảnh là quá trình Markov bậc nhất, nơi mà tương quan giữa các điểm 
ảnh giảm tuyến tính theo khoảng cách tách biệt giữa chúng, thì các ảnh cơ sở đối với 
biến đổi K-L có thể được viết rõ ràng. Giả thiết Markov thường khớp các ảnh hay 
gặp rất tốt. Hơn nữa, khi tương quan giữa các điểm ảnh kiền kề nhau được tiếp cận 
theo cách duy nhất, thì các hàm K-L cơ sở tiếp cận những theo biến đổi cosin rời rạc. 
Vì thế, DCT, tính toán dễ dàng, xấp xỉ với biến đổi K-L đối với các ảnh thường hay 
gặp. 
13.6.4. Biến đổi SVD 
Một ma trận A N N bất kỳ có thể biểu diễn như sau 
 tVUA  (62) 
Trong đó các cột của U và V là các vec tơ sinh của AA', và A'A và  là ma trận 
đường chéo N N chứa các giá trị đơn nhất của A trên đường chéo của nó. Vì U và 
V là trực giao, 
 AVU t  (63) 
Biểu thức (63) vì thế là xuôi và biểu thức (62) là ngược, của cặp biến đổi đơn vị. 
Biến đổi này được gọi là biến đổi phân tích giá trị đơn nhất (SVD). Nếu A đối xứng 
thì U = V. 
 241 
Chú ý rằng, không giống những biến đổi đã đề cập trong những phần trước đây, 
các ma trận hạt nhân U và V phụ thuộc vào ảnh A đã biến đổi. Nói chung, ta phải 
tính các vec tơ sinh của AA' và A'A cho từng ảnh qua quá trình biến đổi. 
Cũng cần lưu ý là do  là ma trận đường chéo, nên các phần tử của nó hầu như là 
khác 0. Vì thế, chúng ta có nén không mất mát theo hệ số N, và nó sẽ lớn hơn nếu A 
có vài giá trị 0 (hay không đáng kể) đơn nhất. Do đó, sự tính toán thêm sẽ làm nén 
dữ liệu trong nó một cách đáng kể. 
Bình thường, vài giá trị đơn nhất đủ nhỏ để có thể bỏ qua với sai số nhỏ. Vì thế 
nén “mất mát” được thực hiện nhờ bỏ qua các giá trị i,j nhỏ hơn. Sai số bình 
phương trung bình do quá trình cắt bớt đơn giản là tổng các giá trị đơn nhất bị bỏ 
qua. 
Nhìn bên ngoài khả năng nén kỳ diệu của biến đổi SVD có phần không đúng. Mặc 
dù toàn bộ ảnh có thể được nén thành các phần tử đường chéo , nhưng các ma trận 
hạt nhân U và V là ma trận đơn vị đối với ảnh được nén. Những ma trận này sẽ được 
truyền, theo ảnh, trước khi xảy ra sự tái tạo tại bên nhận. Tuy nhiên, có lẽ một cặp 
ma trận hạt nhân có thể đáp ứng (gần đúng) cho một nhóm các ảnh như nhau. 
Ví dụ cụ thể. Biến đổi SVD được minh hoạ trong hình 13-7, sử dụng một ảnh 5 
5 đối xứng. 
HÌNH 13-7 
Hình 13-7 Biến đổi SVD của một ảnh 5 5 đối xứng 
13.7. LỌC TRONG MIỀN BIẾN ĐỔI 
Trong chương 10, chúng ta đã thấy rằng lọc tuyến tính-hoạt động của một hệ 
thống tuyến tính bất biến dịch-có thể được mô phỏng như phép nhân phổ Fourier của 
một ảnh với một hàm truyền đạt định nghĩa trong miên tần số (chẳng hạn biến đổi). 
Trong khi kết quả quan trọng này chỉ đúng đối với biến đổi Fourier, thì các phép toán 
lọc ảnh giống nhau cũng có thể được mô phỏng bằng các biến đổi khác. 
Giống như biến đổi Fourier, biến đổi đơn vị tổng quát mở rộng một ảnh như một 
tổng trọng số các ảnh cơ sở. Quá trình biến đổi xuôi xác định các hệ số trọng số, 
trong khi quá trình biến đổi ngược tập hợp ảnh từ sự khai triển các ảnh cơ sở. 
Lọc trong miền biến đổi bao hàm sự thay dổi các hệ số trọng số trước khi tái tạo 
ảnh thông qua biến đổi ngược. Đối với lọc tuyến tính, biến đổi là biến đổi Fourier, và 
sự thay đổi được thực hiện bằng cách nhân phổ với một hàm truyền đạt. Trong 
trường hợp lọc tổng quát hơn, ma trận hệ số bị thay đổi (bằng phép nhân hay phép 
toán khác) và biến đổi ngược sẽ tọ ra ảnh lọc. 
Rõ ràng, đó là tính chất của các vec tơ cơ sở (và của các ảnh cơ sở thu được) 
nhằm thực hiện các hành động khác nhau của các biến đổi khác nhau. Ví dụ, sự phá 
huỷ của nhiễu điều hoà xuất hiện rất dày đặc trong miền biến đổi của một biến đổi 
 242 
điều hoà và vì thế dễ dàng loại bỏ bằng cách thiết lập các hệ số tương ứng về 0. Các 
biến đổi sóng chữ nhật không phù hợp cho lắm đối với vấn đề loại bỏ nhiễu này, vì 
sự nhiễu tạp sẽ không thể phân biệt với tín hiệu trong miền biến đổi của chúng. 
Nói chung, nếu các thành phần tín hiệu (mong muốn) hay các thành phần nhiễu 
(không mong muốn) của ảnh tập trung trên một hay một vài ảnh cơ sở của một biến 
đổi riêng biệt, thì biến đổi sẽ hữu ích trong việc tách rời ra làm hai. Đó là do các 
thành phần nói trên được thể hiện dày đặc trong miền biến đổi. Sự trình bày tổng 
quát cũng được áp dụng vào những vấn đề loại bỏ nhiễu và phát hiện tín hiệu. 
13.7.1. Phát hiện biên, dòng và điểm 
Hình 13-8 minh hoạ khả năng phát hiện biên của biến đổi Haar trên một ảnh 8 
8. Vì biến đổi có khả năng tách được nên một tính chất của ảnh là dòng ngang hay 
dọc hay biên tạo ra các phần tử khác 0 chỉ trên hàng đầu tiên và cột đầu tiên của ảnh 
biến đổi. 
HÌNH 13-8 
Hình 13-8 Phát hiện biên trên ảnh 8 8 
Trong biến đổi Haar, đặc trưng tạo ra gần N/2 phần tử khác 0. Vị trí của đặc trưng 
xác định phần tử nào (và bao nhiêu) khác 0. Trong các biến đổi khác, tất cả N phần 
tử của hàng đầu tiên và cột đầu tiên nói chung là khác 0. 
Hình 13-9 trình bày vài biến đổi khác nhau của một ảnh chứa một xung nhọn. Tất 
cả N2 phần tử của các biến đổi này đều khác 0, ngoại trừ những phần tử của biến đổi 
Haar chỉ có 2N phần tử khác 0. Ngoài ra, vị trí của các phần tử khác 0 được xác định 
bằng vị trí của xung nhọn. 
HÌNH 13-9 
Hình 13-9 Các biến đổi trên ảnh chứa một xung: (a) DST; (b) DCT; (c) 
Hadamard; (d) Haar. Đầu vào là ma trận 8 8, mọi vị trí đều là 0 ngoại trừ phần tử 
 243 
trên bên trái 
13.7.2. Thiết kế bộ lọc 
Bởi vì nó có mối liên quan gần với các hệ thống tuyến tính bất biến dịch, nên biến 
đổi Fourier có một nền tảng phát triển vững chắc để sử dụng trong các ứng dụng lọc 
ảnh. Lý thuyết về các biến đổi khác không được hỗ trợ nhiều lắm và chúng được sử 
dụng chủ yếu dựa trên thực nghiệm. Hiểu rõ sự giống và khác nhau giữa các biến đổi 
này sẽ giúp ta tìm kiếm các giải pháp mang tính khả thi. 
13.8. TỔNG KẾT NHỮNG ĐIỂM QUAN TRỌNG 
1. Các hàng của một ma trận biến đổi N N là tập các vec tơ trực chuẩn. 
2. Một biến đổi tuyến tính đơn vị sẽ tạo ra một vec tơ N hệ số biến đổi, mỗi hệ số 
lại là một tích bên trong của vec tơ đầu vào với một trong các hàng của ma 
trận biến đổi. 
3. Biến đổi ngược được thực hiện tương tự, bằng các tích bên trong của vec tơ hệ 
số biến đổi với các hàng của ma trận biến đổi ngược. 
4. Cũng có thể coi biến đổi ngược như việc tạo thành tổng trọng số các vec tơ cơ 
sở, trong đó các hệ số là các trọng số. 
5. Đối với biến đổi đơn vị tách được, đối xứng hai chiều, các ảnh cơ sở là tích 
bên ngoài của các hàng trong ma trận biến đổi. 
BÀI TẬP 
1. Các giá trị sinh của một ảnh đa phổ kênh 8 là [6.1 168 0.08 13 64 214 1.2 0.2]. 
Sai số RMS sẽ là bao nhiêu nếu bạn phân tích thành phần chung với tỷ lệ nén 
dữ liệu là 2:1. 
2. Thiết kế một mặt nạ lọc biến đổi Haar 8 8 để loại bỏ các cạnh ngang nhỏ ra 
khỏi ảnh. 
DỰ ÁN 
1. Phát triển một chương trình thực hiện biến đổi cosin rời rạc và sử dụng 
chương trình để chứng minh quá trình lọc thông cao đối với tăng cường ảnh. 
2. Phát triển một chương trình thực hiện biến đổi Hartley rời rạc và sử dụng 
chương trình để chứng minh quá trình lọc thông thấp đối với việc giảm nhiễu. 
3. Phát triển một chương trình phân tích thành phần chính để giảm ảnh màu 24 
24 xuống thành ảnh trắng đen 16 16. Trình bày các ảnh chứng minh và giải 
thích trên kết quả suy giảm. 
4. Phát triển một chương trình thực hiện biến đổi nghiêng và sử dụng chương 
trình để chứng tỏ cho sự loại bỏ sắc thái tuyến tính. 
5. Phát triển một chương trình thực hiện biến đổi Haar và sử dụng chương trình 
để đưa ra các biên của một ảnh. 

File đính kèm:

  • pdfbai_giang_xu_ly_anh_chuong_13_bien_doi_anh_roi_rac.pdf