Nhận dạng mống mắt dùng phương pháp mạng neuron nhân tạo và phân tích thành phần độc lập

Tóm Tắt

Bài viết trình bày một hệ thống nhận dạng sử dụng mẫu sinh trắc học mống mắt dựa trên các phương

pháp Thresholding, biến đổi Hough, cân bằng Histogram ảnh mắt đầu vào để cho ảnh chuẩn hóa đầu ra

có kích thước 100x100. Mỗi ảnh sau khi được xử lý sẽ lại được chia thành 4 khối nhỏ với kích thước

50x50. Sau đó, trích xuất các đặc trưng của mống mắt sử dụng giải thuật ICA, và cuối cùng đưa vào mô

hình mạng neuron nhân tạo (ANN) để huấn luyện và kiểm tra. Bài viết cũng nghiên cứu so sánh hiệu

suất của các giải thuật ANN và kiểm tra với các cấu trúc mạng neuron khác nhau để chọn ra mô hình

cho kết quả nhận dạng tốt nhất. Ngoài ra, nghiên cứu còn thực hiện so sánh hiệu suất nhận dạng mống

mắt của mô hình hệ thống được đưa ra với các phương pháp nhận dạng mống mắt của nhiều tác giả,

công trình nghiên cứu trước đó.

pdf 12 trang phuongnguyen 2540
Bạn đang xem tài liệu "Nhận dạng mống mắt dùng phương pháp mạng neuron nhân tạo và phân tích thành phần độc lập", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Nhận dạng mống mắt dùng phương pháp mạng neuron nhân tạo và phân tích thành phần độc lập

Nhận dạng mống mắt dùng phương pháp mạng neuron nhân tạo và phân tích thành phần độc lập
TRƯỜNG ĐẠI HỌC SÀI GÒN SAIGON UNIVERSITY 
 TẠP CHÍ KHOA HỌC SCIENTIFIC JOURNAL 
 ĐẠI HỌC SÀI GÒN OF SAIGON UNIVERSITY 
 Số 61 (01/2019) No. 61 (01/2019) 
Email: tcdhsg@sgu.edu.vn ; Website: https://tapchikhoahoc.sgu.edu.vn 
3 
NHẬN DẠNG MỐNG MẮT DÙNG PHƯƠNG PHÁP MẠNG NEURON 
NHÂN TẠO VÀ PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP 
Iris recognition by using artificial neural network 
and independent component analysis 
GS.TS. Lê Tiến Thường(1), Nguyễn Duy Phú(2), Lê Bá Lộc(3), ThS. Phan Xuân Hạnh(4) 
(1),(2),(3),(4)Trường Đại học Bách khoa TP.HCM 
Tóm Tắt 
Bài viết trình bày một hệ thống nhận dạng sử dụng mẫu sinh trắc học mống mắt dựa trên các phương 
pháp Thresholding, biến đổi Hough, cân bằng Histogram ảnh mắt đầu vào để cho ảnh chuẩn hóa đầu ra 
có kích thước 100x100. Mỗi ảnh sau khi được xử lý sẽ lại được chia thành 4 khối nhỏ với kích thước 
50x50. Sau đó, trích xuất các đặc trưng của mống mắt sử dụng giải thuật ICA, và cuối cùng đưa vào mô 
hình mạng neuron nhân tạo (ANN) để huấn luyện và kiểm tra. Bài viết cũng nghiên cứu so sánh hiệu 
suất của các giải thuật ANN và kiểm tra với các cấu trúc mạng neuron khác nhau để chọn ra mô hình 
cho kết quả nhận dạng tốt nhất. Ngoài ra, nghiên cứu còn thực hiện so sánh hiệu suất nhận dạng mống 
mắt của mô hình hệ thống được đưa ra với các phương pháp nhận dạng mống mắt của nhiều tác giả, 
công trình nghiên cứu trước đó. 
Từ khóa: biến đổi Hough, mạng neuron nhân tạo (ANN), nhận dạng mống mắt, phân tích thành phần 
độc lập (ICA), sinh trắc học. 
Abstract 
This paper will present an iris biometric identification system comprising Threshold method, the Hough 
transform, Histogram equalization of input eye image in order to create a transformed image with 
dimensions 100x100. Next, each image is divided into 4 sub-block images (each block has dimensions 
50x50). Then, the features of each sub-block are extracted by using Independent Component Analysis 
(ICA) algorithm. Finally, they are included in the Artificial Neural Network (ANN) model for training 
and testing. The paper performs a comparison of the performance of different ANN algorithms, on 
different neural network structures, in order to select the best performing model for identification. In 
addition, the study also compared the iris recognition performance of the system model with the iris 
identification methods of many previous authors and studies. 
Keywords: Hough transform, artificial neural network (ANN), iris recognition, independent component 
analysis (ICA), biometrics. 
Email: thuongle@hcmut.edu.vn 
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 
4 
1. Giới thiệu 
1.1. Sinh trắc học mống mắt 
Mỗi người đều mang trên mình những 
điểm sinh trắc học duy nhất (bao gồm 
khuôn mặt, giọng nói, vân tay,). Trong 
nhiều trường hợp, những đặc điểm, tính 
chất của các mẫu sinh trắc có thể được sử 
dụng để phân biệt người này với người 
khác. Mỗi mẫu sinh trắc có những ưu 
điểm và khuyết điểm riêng, nhưng hệ 
thống nhận diện người dựa trên mẫu sinh 
trắc học mống mắt được xem là hệ thống 
nhận dạng có hiệu suất cao (các nghiên 
cứu đều đạt hiệu suất trên 90%) và đã 
được áp dụng nhiều vào thực tế. Những 
cấu trúc đặc biệt duy nhất của mống mắt 
gần như là ổn định trong suốt một đời 
người và thậm chí còn độc lập nhau giữa 
mắt trái và mắt phải của cùng một người, 
do đó đây là một trong những mẫu sinh 
trắc hiệu quả để thực hiện trong các hệ 
thống nhận dạng [2]. 
Hình 1. Mống mắt của con người 
1.2. Mạng neuron nhân tạo 
Một cấu trúc mạng neural nhân tạo 
(ANN) là một mô hình máy học hoạt động 
tương tự như chức năng của bộ não con 
người mà tại đó, hệ thống học hỏi thông 
qua quá trình huấn luyện từ những dữ liệu 
đã biết để đưa ra những quyết định, dự 
đoán về những dữ liệu chưa biết [6]. Đây là 
một mô hình có mối quan hệ phức tạp và 
phi tuyến giữa dữ liệu đầu ra với đầu vào 
thông qua một lượng lớn neuron. Trong bài 
viết, cấu trúc Feed Forward Back 
Propagation của mạng neuron được sử 
dụng vì tính đơn giản và phổ biến của nó. 
W1,1
.
.
.
.
.
.
`
.
.
.
.
.
.
. . .
Lớp đầu vào Lớp ẩn Lớp đầu ra
Đầu vào 
. . .
. . .
Đầu ra
W2,1
Wn,1 Wn,2
W2,2
W1,2 W1,k
W2,k
Wn,k Wn,k+1
W2,k+1
W1,k+1
Hình 2. Cấu trúc mạng neuron nhân tạo 
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 
5 
Cấu trúc mạng neuron sẽ có nhiều lớp, 
bao gồm một lớp đầu vào, một lớp đầu ra 
và giữa chúng sẽ có một hoặc nhiều hơn 
các lớp ẩn. Mô hình được huấn luyện dựa 
trên giải thuật Back Propagation (BP) dựa 
trên các phương trình: 
 𝑈𝑘(𝑡) = ∑ 𝑤𝑗𝑘(𝑡). 𝑥𝑗(𝑡) + 𝑏𝑘(𝑡)
𝑛
𝑗=1
 (1) 
 𝑌𝑘(𝑡) = 𝜑(𝑈𝑘(𝑡)) (2) 
Trong đó, xj(t) là giá trị đầu vào của j 
tại thời gian t, wjk(t) là trọng số của neuron 
k tại đầu vào là neuron thứ j ở thời điểm t, 
φ là hàm kích hoạt phi tuyến, bk(t) là giá trị 
bias của neuron thứ k tại thời điểm t, và 
yk(t) là đầu ra của neuron k tại thời điểm t. 
Quá trình học được lặp lại nhiều lần để 
điều chỉnh giá trị trọng số của mạng 
neuroncho đến khi đạt được sai số giữa giá 
trị đầu ra mong muốn với giá trị đầu ra tính 
toán được là nhỏ nhất. Phương trình điều 
chỉnh trọng số có dạng: 
 𝑤𝑗𝑘(𝑡 + 1) = 𝑤𝑗𝑘(𝑡) + 𝜂𝛿𝑘𝑦𝑘 + 𝛼(𝑤𝑗𝑘(𝑡) − 𝑤𝑗𝑘(𝑡 − 1)) (3) 
Trong đó, 𝛿𝑘 là sai số ở lớp đầu ra, 𝜂 
là tốc độ học, 𝛼 là hệ số momentum. Hai 
tham số 𝛿𝑘 và 𝜂 được sử dụng để quyết 
định đến giải thuật điều chỉnh giá trị trọng 
số của hệ thống mạng neuron. Ngoài ra, 
còn có 2 nhân tố khác ảnh hưởng đến quá 
trình huấn luyện của một mạng neuron 
nhân tạo, đó là số lớp ẩn và số neuron của 
mỗi lớp ẩn trong mạng neuron nhân tạo đó. 
2. Hệ thống được đề xuất 
Hệ thống nhận dạng mống mắt mà bài 
viết đưa ra sẽ bao gồm các bước chính: 
phân đoạn mống mắt, trích xuất đặc trưng, 
hình thành mẫu sinh trắc, huấn luyện mạng 
neuron và kiểm tra kết quả (được minh họa 
trong Hình 4). Đầu vào của hệ thống sử 
dụng cơ sở dữ liệu ảnh mắt CASIA có kích 
thước 320x280 đơn vị pixel [3]. Ảnh đầu 
vào sẽ được phân đoạn đối với vùng mống 
mắt sử dụng giải thuật thresholding để ước 
lượng vùng pixel của con ngươi;, dựa vào 
vùng pixel này để xác định tâm thô của con 
ngươi (ta giả định con ngươi của mắt xem 
như là hình tròn); sau đó lần lượt xác định 
tâm và bán kính của biên trong và biên 
ngoài của vùng mống mắt sử dụng biến đổi 
Hough [13]. Từ kết quả phân đoạn, hệ 
thống cho hình ảnh chuẩn hóa đầu ra có 
kích thước 100x100 đơn vị pixel sau khi đã 
loại bỏ những vùng thông tin không cần 
thiết. Ảnh chuẩn hóa sẽ được sử dụng giải 
thuật ICA để trích xuất thông tin đặc trưng 
của mống mắt, cuối cùng các thông tin đặc 
trưng này sẽ được đưa vào mạng neuron 
(dưới dạng ma trận) để huấn luyện và kiểm 
tra hiệu suất của hệ thống. 
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 
6 
Ảnh mống mắt
Phân đoạn mống mắt
Chuẩn hóa
Trích xuất đặc trưng bằng ICA
Learning ?
Kiểm tra bằng 
mạng neuron
Vector đầu ra
 Huấn luyện mạng 
neuron
Cơ sở dữ liệu
So sánh với ngưỡng
Thỏa mãn điều 
kiện so sánh
Cho kết quả 
nhận dạng 
Không nhận 
dạng được
NO
YES
YES
NO
Hình 3. Lưu đồ giải thuật của hệ thống để xuất 
2.1. Phân đoạn mống mắt 
2.1.1. Xác định vùng con ngươi 
Trước khi sử dụng giải thuật dựa trên 
biến đổi Hough để xác định tâm và bán 
kính của con ngươi (được xem như là hình 
tròn), giải thuật thresholding được dùng để 
ước lượng vùng pixel dựa trên các giá trị 
mức xám thấp, từ đó xác định tâm thô của 
nó [4]. Kết quả được minh họa trong Hình 
4a,b. Dựa trên vùng con ngươi vừa xác 
định được, có thể ước lượng vị trí tâm thô 
của con ngươi theo công thức [10]: 
 𝑥 =
1
𝑁
∑ 𝑥𝑖
𝑁
𝑖=1
; 𝑦 =
1
𝑁
∑ 𝑦𝑖
𝑁
𝑖=1
 (4) 
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 
7 
Trong đó, (xi, yi) thể hiện vị trí của giá 
trị mức xám 0 trong ảnh nhị phân là ảnh kết 
quả sau khi sử dụng thuật toán thresholding 
lên ảnh mắt để tách các pixel thành hai 
phần: phần thuộc vật thể (màu đen) và phần 
thuộc môi trường (màu trắng). 
Hình 4. a. Ảnh mống mắt; b. Kết quả phân đoạn vùng con ngươi dùng giải thuật 
thresholding. Kết quả xác định biên trong biên ngoài của vùng mống mắt: 
c. Không sử dụng cân bằng histogram; d. Sử dụng cân bằng histogram 
Sau khi ước lượng vị trí của con 
ngươi, hệ thống sử dụng giải thuật dựa trên 
biến đổi Hough để tìm ra tâm và bán kính 
thực của con ngươi [10]. 
2.1.2. Xác định biên của mống mắt 
Sau khi tìm được tâm thô của con 
ngươi, vì tâm của các đường biên trong và 
biên ngoài của vùng mống mắt gần như là 
trùng nhau (trùng với tâm của con ngươi), 
nên việc ước lượng tâm cũng như bán kính 
của hai đường biên này sẽ tương đối giống 
nhau về nguyên lý thực hiện. Mặc dù sẽ có 
một số bước tiền xử lý trước khi xác định 
biên ngoài của mống mắt để cải thiện mức 
độ tương phản giữa các pixel của vùng 
mống mắt với những pixel không thuộc 
vùng mống mắt, sau đó mới áp dụng biến 
đổi Hough để cho kết quả xử lý tốt hơn. 
Khác với biên ngoài, biên trong của mống 
mắt có sự thay đổi về các giá trị mức xám 
của vùng mống mắt và con ngươi là dễ 
dàng nhận ra hơn nên khi áp dụng các bộ 
lọc tìm đường biên như bộ lọc Canny ta dễ 
dàng tìm được các đường biên này chính 
xác. Ngược lại ranh giới này ở đường biên 
ngoài của mống mắt khó nhận biết hơn nên 
cần phải sử dụng cân bằng histogram trước 
khi áp dụng bộ lọc đường biên cho ảnh [4]. 
Kết quả xử lý và so sánh giữa hai trường 
hợp xác định biên trong biên ngoài của 
mống mắt được minh họa trong Hình 4c,d. 
Tóm tắt các bước phân đoạn mống mắt 
● Ước lượng vị trí của con ngươi 
dùng giải thuật thresholding. 
● Ước lượng tâm và bán kính của con 
ngươi (biên trong mống mắt) dùng lọc 
Canny và biến đổi Hough. 
● Cân bằng Histogram, ước lượng 
tâm, bán kính của con ngươi dùng bộ lọc 
Canny và biến đổi Hough. 
2.2. Chuẩn hóa 
Sau khi đã xác định được vùng mống 
mắt từ bước phân đoạn, các pixel trong 
vùng mống mắt sẽ được chuẩn hóa để cho 
một ảnh pixel đầu ra. Ngoài mục đích đưa 
các pixel của vùng mống mắt về một ma 
trận pixel có kích thước chuẩn, công việc 
này còn làm giảm đáng kể lượng thông tin 
dữ liệu dư thừa, để qua đó giúp giảm thời 
gian xử lý của hệ thống. Thông thường, 
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 
8 
quá trình chuẩn hóa có các bước loại bỏ 
các nhiễu do chân mày, lông mi và những 
đốm sáng phản xạ nằm trên vùng mống 
mắt, để không làm ảnh hưởng đến hiệu 
suất nhận diện của hệ thống cũng như độ 
chính xác của việc xử lý. Trong bài viết 
này, vùng mống mắt ở phía trên và phía 
dưới của con ngươi sẽ được lược bỏ, vì đây 
là những vùng pixel thường hay có nhiễu 
do lông mi và chân mày. Phần còn lại của 
mống mắt sẽ được hệ thống lấy mẫu để cho 
ma trận ảnh đầu ra có kích thước 100x100 
đơn vị pixel. Vùng pixel của mống mắt để 
xử lý chuẩn hóa được minh họa trong Hình 
5a. 
Bằng cách này, các nhiễu do chân mày 
và lông mi sẽ được loại bỏ, ma trận ảnh 
đầu ra không cần phải sử dụng các phương 
pháp loại bỏ nhiễu, từ đó giảm được thời 
gian xử lý của hệ thống [14]. Tuy nhiên, 
đánh đổi cho nó, lại là việc mất đi thông tin 
mống mắt nằm trong những phần trên và 
phần dưới của con ngươi so với các 
phương pháp truyền thống. Kết quả đầu ra 
của bước chuẩn hóa được minh họa trong 
Hình 5b,c. 
Hình 5. a. Vùng mống mắt được dùng để xử lý chuẩn hóa; b. Ảnh trước khi chuẩn hóa; 
c. Ảnh sau khi chuẩn hóa 
2.3. Trích xuất đặc trưng với ICA 
Sau quá trình chuẩn hóa, ảnh thu được 
có kích thước là 100x100 tạo thành một 
không gian với số chiều quá lớn [14]. Tuy 
nhiên, kích thước nội tại của không gian 
mống mắt là nhỏ hơn nhiều. Kỹ thuật 
không gian được sử dụng nhằm mục đích 
làm giảm số chiều quá lớn của dữ liệu 
được quét. Trong khía cạnh này, các công 
cụ phân tích không gian được sử dụng 
rộng rãi nhất như Singular Value 
Decomposition (SVD) [14], phân tích 
thành phần chính (PCA), Kernel PCA [11], 
phân tích thành phần độc lập (Independent 
Component Analysis - ICA) [18]. Để trích 
xuất đặc trưng mống mắt, thuật toán ICA 
đã được áp dụng, vì trong ICA áp dụng các 
phép biến đổi tuyến tính. Trong bài viết 
này, một chương trình MATLAB được đưa 
ra bởi Gävert, Hurri, Särelä, and Hyvärinen 
[15] nhằm áp dụng để thực hiện thuật 
toán FastICA. 
Mô hình tuyến tính không nhiễu của 
ICA có thể được biểu diễn bằng: 
 𝑥 = 𝐴𝑠 (1) 
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 
9 
Trong đó, 𝑥 = (𝑥1, 𝑥2,  , 𝑥𝑁)
𝑇 là 
vector của tín hiệu quan sát được với kích 
thước là N, 𝑠 = (𝑠1, 𝑠2,  , 𝑠𝑀)
𝑇 với kích 
thước M là số thành phần độc lập và A là 
ma trận trộn chưa biết. Trong giải thuật 
ICA sẽ áp dụng thuật toán điểm cố định để 
ước lượng ma trận A và thành phần độc lập 
s dựa vào vector x. 
Giả sử 𝑥′ = (𝑥1
′ , 𝑥2
′ ,  , 𝑥𝑁
′ )𝑇 là một 
ảnh mống mắt sau quá trình chuẩn hóa với 
N biến ngẫu nhiên và giả định rằng sự kết 
hợp tuyến tính của M thành phần độc lập 
chưa biết được ký hiệu là 𝑠′ =
(𝑠1
′ , 𝑠2
′ ,  , 𝑠𝑀
′ )𝑇, với tất cả i, i = 1,2,..,N, ảnh 
𝑥𝑖
′ và thành phần độc lập 𝑠𝑖
′ được chuyển 
đổi lần lượt thành 𝑥𝑖 và 𝑠𝑖 bằng cách nối 
hàng và được ký hiệu tương ứng là 𝑥 =
(𝑥1, 𝑥2,  , 𝑥𝑁)
𝑇 và 𝑠 = (𝑠1, 𝑠2,  , 𝑠𝑀)
𝑇. Từ 
đó, hình ảnh mống mắt được đại diện bởi 
một sự kết hợp tuyến tính của 𝑠1, 𝑠2,  , 𝑠𝑀 
với các trọng số 𝑎𝑖1, 𝑎𝑖2,  , 𝑎𝑖𝑀. Vì thế, ma 
trận A đại diện cho không gian của tất cả 
các ảnh mống mắt. 
2.4. Cấu trúc mạng neuron nhân tạo 
2.4.1. Lớp đầu vào 
Lớp đầu vào đại diện cho hình ảnh 
mống mắt như là đầu vào của hệ thống. 
Kích thước của vector đặc trưng sau khi áp 
dụng thuật toán ICA xác định số lượng 
neuron ở lớp đầu vào và nó bằng chính giá 
trị M của ma trận trộn A. 
2.4.2. Lớp ẩn 
Lớp ẩn bao gồm nhiều neuron nhận dữ 
liệu đầu vào từ các neuron lớp trước và 
chuyển đổi các giá trị đầu vào này sang các 
lớp xử lý tiếp theo. Trong quá trình đào 
tạo, số lượng lớp ẩn cũng như số neuron 
trong mỗi lớp ẩn được thay đổi để đạt mô 
hình tối ưu. 
2.4.3. Lớp đầu ra 
Số lượng neuron của lớp đầu ra phụ 
thuộc vào số lượng người sử dụng để huấn 
luyện. 
2.4.4. Các thuật toán huấn luyện 
Các thuật toán huấn luyện cần điều 
chỉnh trọng số của ANN để giảm thiểu sai 
số càng nhiều càng tốt. Ở đây, hàm Mean 
square error (MSE) được sử dụng như một 
hàm hiệu suất cho hệ thống nhận dạng 
mống mắt và nó được giảm thiểu trong quá 
trình huấn luyện Feed Forward Back 
Propagation (FFBPNN). MSE thể hiện 
khác biệt giữa mô hình ANN mong muốn 
và mô hình thực tế theo phương trình sau: 
 𝑀𝑆𝐸 = ∑
(𝑇𝑖 − 𝑦𝑖)
2
𝑛
𝑛
𝑖=1
 (2) 
Trong đó, Ti và yi lần lượt là các giá trị 
mong muốn và thực tế thứ i của mô hình. 
Ở đây, 10 thuật toán ANN tối ưu được 
sử dụng để huấn luyện các mô hình ANN 
và xác định mô hình tốt nhất cho hệ thống 
nhận dạng mống mắt: 
● Levenberg-Marquardt (TRAINLM) 
● Broyden Fletcher Goldfarb 
Shanno (TRAINBFG) 
● Bayesian regularization algorithm 
(TRAINBR) 
● Conjugate gradient back-
propagation with Fletcher-Reeves updates 
(TRAINCGF) 
● Gradient descent - (TRAINGD) 
● Gradient descent with momentum 
(TRAINGDM) 
● Gradient descent with adaptive 
learning rate - (TRAINGDA) 
● Gradient descent momentum and an 
adaptive learning rate (TRAINGDX) 
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 
10 
● One-step secant - (TRAINOSS) 
● Resilient back-propagation (TRAINRP) 
Các thuật ngữ (LM, BFG, BR, CGF, 
GD, GDM, GDA, GDX, OSS và RP) được 
sử dụng trong các bảng được mô tả trong 
phần kết quả đại diện cho 10 thuật toán 
tương ứng. 
3. Kết quả thực hiện 
Hệ thống thực hiện trên máy tính có 
cấu hình Intel Core i3 với tốc độ 2.4 GHz 
và RAM 4 GB với bộ dữ liệu CASIA Iris 
Interval [3]. Các mô hình ANN khác nhau 
đã được xây dựng cho hệ thống nhận dạng 
mống mắt. Mỗi mô hình được huấn luyện 
với 10 thuật toán như đã nêu ở trên. Đối với 
mỗi mô hình, số lớp ẩn được thay đổi để 
đánh giá hiệu quả. MATLAB được sử dụng 
để viết các chương trình liên quan đến việc 
huấn luyện các mô hình ANN khác nhau 
cũng như các chương trình để kiểm tra tỷ lệ 
chính xác của chúng xác định cấu trúc mô 
hình ANN tối ưu. Để đánh giá hiệu suất của 
mô hình đã xây dựng, hai thông số được 
tính toán là tỷ lệ nhận dạng và thời gian hội 
tụ. Hiệu quả của các thuật toán huấn luyện 
khác nhau cũng được đánh giá. 
Các kết quả trong Bảng 1 và Bảng 2 
khi mô hình có 20 người, mỗi người có 5 
ảnh (trong đó 3 ảnh để huấn luyện và 2 ảnh 
để kiểm tra). Mỗi ảnh sau khi chuẩn hóa có 
kích thước 100x100 và được chia thành 4 
khối nhỏ, mỗi khối có kích thước 50x50. 
Sau đó dùng giải thuật ICA với M = 50, 
mô hình đầu tiên được xây dựng với ba lớp 
(lớp đầu vào, 1 lớp ẩn và lớp đầu ra). Bảng 
1 cho thấy kết quả khi mô hình có ba lớp 
(lớp đầu vào, 1 lớp ẩn và lớp đầu ra) được 
huấn luyện với 10 thuật toán khác nhau. 
Bảng 1 cho thấy tỷ lệ nhận dạng chính 
xác nhất khi sử dụng thuật toán GDA 
(Gradient Descent with Adaptive learning 
rate). Ngoài ra, thuật toán này hội tụ rất 
nhanh. Tuy nhiên, các thuật toán như LM, 
BFG, BR, CGF cần thời gian hội tụ lớn 
nhưng tỷ lệ nhận dạng thấp. Để kiểm tra ảnh 
hưởng của số lớp ẩn đến kết quả nhận dạng, 
mô hình thứ hai đã được thực hiện với 5 lớp 
(lớp đầu vào, 3 lớp ẩn và lớp đầu ra). Kết 
quả được thể hiện trong Bảng 2. 
Bảng 1. Kết quả của mô hình ANN có 1 lớp ẩn 
Hàm huấn luyện Tỷ lệ nhận dạng Thời gian hội tụ 
LM 7.5 % 1800 s 
BFG 25 % 1200 s 
BR 10 % 1500 s 
CGF 12.5 % 1608 s 
GD 87.5 % 240 s 
GDM 87.5 % 233 s 
GDA 92.5 % 10 s 
GDX 90 % 10 s 
OSS 40 % 18 s 
RP 87.5 % 10 s 
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 
11 
Bảng 2. Kết quả của mô hình ANN có 3 lớp ẩn 
Hàm huấn luyện Tỷ lệ nhận dạng Thời gian hội tụ 
LM 7.5 % 2375 s 
BFG 25 % 1620 s 
BR 10 % 1724 s 
CGF 12.5 % 1801 s 
GD 87.5 % 320 s 
GDM 87.5 % 286 s 
GDA 97.5 % 18 s 
GDX 90 % 25 s 
OSS 47.5 % 37 s 
RP 90 % 16 s 
Dễ thấy rằng, với mô hình có 3 lớp ẩn, 
thời gian hội tụ tương đối lớn nhưng hiệu 
suất đã được cải thiện, thuật toán cho hiệu 
quả tốt nhất vẫn là GDA (97,5%). Việc cần 
thêm thời gian cho các thuật toán hội tụ là 
điều dễ hiểu vì càng nhiều lớp ẩn đòi hỏi 
phải thực hiện nhiều phép tính toán hơn. 
Nhưng với công nghệ và sự phát triển của 
máy tính ngày nay, vấn đề này sẽ được 
khắc phục. Dựa vào các kết quả trên, mô 
hình ANN tối ưu được lựa chọn cho hệ 
thống nhận dạng mống mắt là mô hình 
ANN với 5 lớp (lớp đầu vào, 3 lớp ẩn và 
lớp đầu ra) và sử dụng thuật toán GDA. 
Bảng 3. Kết quả khi ảnh không được chia khối 
Không 
chia khối 
Giá trị M của ma trân A Không chia 
khối 
Giá trị M của ma trân A 
10 30 50 100 10 30 50 100 
Số 
người 
5 
432 
Số 
người 
5 100% 
 20 
10 
366 246 
10 100% 100% 
 14 6 
20 
238 249 258 
20 
90% 
(9/10) 
100% 90% (9/10) 
28 15 27 
40 
251 261 273 247 
40 
95% 
(19/20) 
100% 100% 100% 
37 28 17 16 
60 
268 257 261 242 
60 100% 100% 100% 100% 
46 29 31 40 
90 
405 458 523 298 
90 
10.56% 
(19/180) 
96.11% 
(173/180) 
98.89% 
(178/180) 
97.22% 
(175 /180) 49 51 41 26 
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 
12 
Bảng 4. Kết quả khi ảnh được chia thành 4 khối 
Chia 4 
khối 
Số dimension 
Chia 4 khối 
Số dimension 
10 30 50 100 10 30 50 100 
Số 
người 
5 
5 4 4 
Số 
người 
5 100% 100% 
90% 
(8/10) 
16 4 3 
10 
5 5 5 5 
10 100% 100% 
95% 
(19/20) 
87.5% 
(16/20) 25 17 14 5 
20 
6 5 6 6 
20 
92.5% 
(37/40) 
95% 
(38/40) 
97.5% 
(39/40) 
87.5% 
(35/40) 61 27 26 15 
40 
8 8 8 11 
40 
15% 
(12/80) 
93.75% 
(75/80) 
91.25% 
(73/80) 
88.75% 
(71/80) 17 78 76 51 
60 
12 15 13 20 
60 
12.5% 
(15/120) 
93.33% 
(112/120) 
92.5% 
(111/120) 
89.16% 
(107/120) 22 178 149 120 
90 
19 19 19 23 
90 
6.67% 
(12/180) 
8.33% 
(15/180) 
89.44% 
(161/180) 
83.89% 
(151/180) 
34 24 273 248 
Theo kết quả trong các Bảng 3 và 
Bảng 4, khi ảnh không được chia thành các 
khối nhỏ thì hiệu suất nhận dạng rất cao 
nhưng thời gian tính toán giải thuật ICA và 
thời gian thuật toán huấn luyện trong mạng 
ANN là rất lớn, không phù hợp cho các ứng 
dụng trong thời gian thực. Khi ảnh được 
chia thành 4 khối, mỗi khối có kích thước 
là 50x50 thì hiệu suất nhận dạng không tốt 
như khi không chia khối, nhưng thời gian 
tính toán ICA và thời gian thuật toán huấn 
luyện hội tụ được giảm đáng kể. Kết quả 
nhận dạng đạt được tốt nhất khi giải thuật 
ICA với số chiều là 50. Bảng 5 cho thấy sự 
so sánh ngắn gọn về hiệu quả dựa trên tỷ lệ 
nhận dạng giữa phương pháp đề xuất của 
chúng tôi và một số phương pháp khác 
nhau trong các bài báo đã công bố. Các 
phương pháp này bao gồm Daugman [9], 
Tisse [5], Li Ma [12] và Chirchi [18]. 
Bảng 5. Bảng so sánh với các phương pháp khác 
Phương pháp Tỷ lệ nhận dạng (%) 
Daugman [9] 99.37 
Tisse [5] 96.61 
Li Ma [12] 94.33 
Chirchi [18] 99.75 
Phương pháp đề xuất 97.5 
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 
13 
Từ kết quả, phương pháp của 
Daugman có hiệu suất tốt nhất, trong khi 
hệ thống đề xuất cho kết quả tốt hơn khi so 
sánh với các phương pháp của Tisse, Li 
Ma. Vì vậy, hệ thống đề xuất chứng minh 
hiệu quả khi so sánh các phương pháp tiếp 
cận khác. Trong nghiên cứu gần đây [18], 
không có đề cập đến thời gian xử lý của 
phương pháp cũng như số lượng người 
nhận diện để có thể so sánh thời gian xử lý 
giữa hai phương pháp. Mặc dù hiệu quả 
nhận dạng không cao lắm so với phương 
pháp trong tài liệu [18] nhưng hiệu suất của 
phương pháp nhận dạng mống mắt dùng 
ANN và ICA vẫn chấp nhận được với thời 
gian xử lý nhanh và có thể được kết hợp 
vào ứng dụng thời gian thực. 
4. Kết luận 
Bài nghiên cứu đã đưa ra một phương 
pháp hiệu quả cho hệ thống nhận dạng 
mống mắt. Sau quá trình chuẩn hóa, hình 
ảnh với kích thước 100x100 được chia 
thành 4 khối hình ảnh nhỏ trước khi trích 
xuất đặc trưng. Mỗi khối nhỏ được trích 
xuất đặc trưng bằng cách sử dụng thuật 
toán ICA. Bằng cách chia hình ảnh thành 
các khối nhỏ, thời gian tính toán ICA được 
giảm xuống đáng kể. Các thành phần độc 
lập này phản ánh thông tin chi tiết của 
mống mắt (như tàn nhang, dải, rãnh,) 
thay đổi, phân bố của nó cho thấy sự khác 
biệt cá nhân của mống mắt đối với mỗi 
người. Sau đó, các đặc trưng mống mắt này 
đã được phân loại và nhận dạng theo mô 
hình mạng neuron nhân tạo (ANN). Các 
mô hình ANN khác nhau được xây dựng 
và được huấn luyện với 10 thuật toán khác 
nhau để đạt được mô hình ANN tối ưu. Kết 
quả đạt được khi thực hiện với cơ sở dữ 
liệu CASIA. Tỷ lệ nhận dạng của phương 
pháp này là 97,5%. Đặc biệt, so sánh giữa 
hệ thống đề xuất và các phương pháp của 
Tisse, Li Ma, Boles đã được làm để chứng 
minh hiệu quả của phương pháp nhận dạng 
mống mắt dùng ANN và ICA đề xuất. 
Trong tương lai, hệ thống nhận dạng mống 
mắt cần phải được phát triển để thực hiện 
trên phần cứng và trong thời gian thực để 
trở thành một ứng dụng phổ biến. 
LỜI CẢM ƠN 
Các tác giả cảm ơn khoa Điện-Điện tử 
trường Đại học Bách Khoa TP.Hồ Chí Minh đã 
hỗ trợ tài chính và hướng dẫn để hoàn thành 
thành công nghiên cứu này. 
TÀI LIỆU THAM KHẢO 
1. A. Albadarneh, J. Alquatawna, Iris 
recognition System for Secure 
Authentication Based on Texture and Shape 
Features Pro.IEEE Jordan Conf. Applied 
Electrical Engineering and Computer 
Technologies (2015). 
2. Anil K.Jain, R. Bolle, S.Pankanti, 
Biometrics Personal Identification in 
Networked Society, Kluwer Academic 
Publishers (2002), New York, Boston, 
Dordrecht, London, Moscow, ISBN 0-306-
47044-6.G. 
3. CASIA Iris database - 
ser.do?id= 
4. Cherabit, F.Z.Chelali, A.Djeradi, Circular 
Hough Transform for Iris localization, 
Science and Technology (2012), 2(5): 114-
121, DOI: 10.5923/j.scit.20120205.02. 
5. Christel-Loic Tisse, Lionel Torres, Michel 
Robert Personal Identification Technique 
Using Human Iris Recognition, Proceeding 
of the 15th International Conference on 
Vision interface (2002). 
6. Ethem Alpaydin, Introduction to Machine 
Learning, The MIT Press, Cambridge, 
Massachusetts, London, England (2004), 
ISBN 0-262-01211-1. 
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 
14 
7. G. Supriya, S. Halvi, N. T. Deshpande, 
Efficient Iris Recognition by Fusion of 
Matching Scores obtained by Lifting DWT 
and Log-Gabor methods of Feature 
Extraction, International Journal of Applied 
Research (2015). 
8. H. Zang, V. M. Patel, M. E. Fathy and R. 
Chellapa, Touch Gesture Based Active 
User Authentication Using Dictionaries, 
Proc. IEEE Winter Conf. Applications of 
Computer Vision, (2015, pp 207-214). 
9. J.Daugman, Statistical richness of visual 
phase information: Update on recognizing 
persons by iris patterns, International 
Journal of Computer Vision, (Vol 45, No. 
1, pp. 25-38, 2001). 
10. J.Yang, L.Nanni, State of the Art in 
Biometrics, Published by InTech (2011), 
ISBN 978-953-307-307-489-4. 
11. K.I.Kim, K.Jung, H.J.Kim, Face recognition 
using kernel principal component analysis. 
IEEE Signal Process Letters, (Vol. 9, No. 2, 
pp. 40-42, Feb. 2002). 
12. L.Ma, Y.H.Wang, T.N.Tan, Iris recognition 
based on multichannel Gabor filtering. 
Proceedings of the Fifth Asian Conference 
on Computer Vision (ACCV2002), 
Australia (pp. 279-283, Jan. 2002). 
13. P.Daniel Rana, G. Neelima Image 
Segmentation by using Histogram 
Thresholding, IJSET (|January 2012| Vol 2, 
Issue 1, 776- 779), ISSN: 2231-0711. 
14. Roman Swiniarski, Experiment on 
human iris recoginition using error 
backpropagation artificial neural network, 
San Diego State University, April 2004M. 
Young, The Technical Writer’s Handbook. 
Mill Valley, CA: University Science, 
(1989). 
15. R. Swiniarski, Independent Component 
Analysis, CS553 Class Notes, San Diego 
State University, (2004). 
16. Shinyoung Lim, Kwanyong Lee, Okhwan 
Byeon, and Taiyun Kim, Efficient Iris 
Recognition through Improvement of 
Feature Vector and Classifier, ETRI 
Journal, Volume 23, Number 2, June 2001. 
17. Sushikumar S.Salve, S.P.Narote, Iris 
Recognition Using SVM and ANN, (IEEE 
WISPNET 2016 conference), ISBN 978-1-
4673-9338-6/16/S31.00 
18. V.R.E. Chirchi, L.M. Waghmare, 
Enhanced Isocentric Segmentor and 
Wavelet Rectangular Coder to Iris 
Segmentation and Recognition, 
International Journal of Intelligent 
Engineering and Systems, (Vol. 10, No. 3, 
pp. 1-10, 2017). 
19. Yong Wang, Jiu-Qiang Han, Iris 
Recognition Using Independent Component 
Analysis, Proceedings of the Fourth 
International Conference on Machine 
Learning and Cybernetics, Guangzhou, 
(18-21 August 2005). 
Ngày nhận bài: 01/08/2018 Biên tập xong: 15/12/2018 Duyệt đăng: 20/01/2019 

File đính kèm:

  • pdfnhan_dang_mong_mat_dung_phuong_phap_mang_neuron_nhan_tao_va.pdf