Nhận dạng mống mắt dùng phương pháp mạng neuron nhân tạo và phân tích thành phần độc lập

Tóm Tắt

Bài viết trình bày một hệ thống nhận dạng sử dụng mẫu sinh trắc học mống mắt dựa trên các phương

pháp Thresholding, biến đổi Hough, cân bằng Histogram ảnh mắt đầu vào để cho ảnh chuẩn hóa đầu ra

có kích thước 100x100. Mỗi ảnh sau khi được xử lý sẽ lại được chia thành 4 khối nhỏ với kích thước

50x50. Sau đó, trích xuất các đặc trưng của mống mắt sử dụng giải thuật ICA, và cuối cùng đưa vào mô

hình mạng neuron nhân tạo (ANN) để huấn luyện và kiểm tra. Bài viết cũng nghiên cứu so sánh hiệu

suất của các giải thuật ANN và kiểm tra với các cấu trúc mạng neuron khác nhau để chọn ra mô hình

cho kết quả nhận dạng tốt nhất. Ngoài ra, nghiên cứu còn thực hiện so sánh hiệu suất nhận dạng mống

mắt của mô hình hệ thống được đưa ra với các phương pháp nhận dạng mống mắt của nhiều tác giả,

công trình nghiên cứu trước đó.

12 trang phuongnguyen 11920

Download

Bạn đang xem tài liệu "Nhận dạng mống mắt dùng phương pháp mạng neuron nhân tạo và phân tích thành phần độc lập", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Nhận dạng mống mắt dùng phương pháp mạng neuron nhân tạo và phân tích thành phần độc lập

TRƯỜNG ĐẠI HỌC SÀI GÒN SAIGON UNIVERSITY
TẠP CHÍ KHOA HỌC SCIENTIFIC JOURNAL
ĐẠI HỌC SÀI GÒN OF SAIGON UNIVERSITY
Số 61 (01/2019) No. 61 (01/2019)
Email: [email protected] ; Website: https://tapchikhoahoc.sgu.edu.vn
3
NHẬN DẠNG MỐNG MẮT DÙNG PHƯƠNG PHÁP MẠNG NEURON
NHÂN TẠO VÀ PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP
Iris recognition by using artificial neural network
and independent component analysis
GS.TS. Lê Tiến Thường(1), Nguyễn Duy Phú(2), Lê Bá Lộc(3), ThS. Phan Xuân Hạnh(4)
(1),(2),(3),(4)Trường Đại học Bách khoa TP.HCM
Tóm Tắt
Bài viết trình bày một hệ thống nhận dạng sử dụng mẫu sinh trắc học mống mắt dựa trên các phương
pháp Thresholding, biến đổi Hough, cân bằng Histogram ảnh mắt đầu vào để cho ảnh chuẩn hóa đầu ra
có kích thước 100x100. Mỗi ảnh sau khi được xử lý sẽ lại được chia thành 4 khối nhỏ với kích thước
50x50. Sau đó, trích xuất các đặc trưng của mống mắt sử dụng giải thuật ICA, và cuối cùng đưa vào mô
hình mạng neuron nhân tạo (ANN) để huấn luyện và kiểm tra. Bài viết cũng nghiên cứu so sánh hiệu
suất của các giải thuật ANN và kiểm tra với các cấu trúc mạng neuron khác nhau để chọn ra mô hình
cho kết quả nhận dạng tốt nhất. Ngoài ra, nghiên cứu còn thực hiện so sánh hiệu suất nhận dạng mống
mắt của mô hình hệ thống được đưa ra với các phương pháp nhận dạng mống mắt của nhiều tác giả,
công trình nghiên cứu trước đó.
Từ khóa: biến đổi Hough, mạng neuron nhân tạo (ANN), nhận dạng mống mắt, phân tích thành phần
độc lập (ICA), sinh trắc học.
Abstract
This paper will present an iris biometric identification system comprising Threshold method, the Hough
transform, Histogram equalization of input eye image in order to create a transformed image with
dimensions 100x100. Next, each image is divided into 4 sub-block images (each block has dimensions
50x50). Then, the features of each sub-block are extracted by using Independent Component Analysis
(ICA) algorithm. Finally, they are included in the Artificial Neural Network (ANN) model for training
and testing. The paper performs a comparison of the performance of different ANN algorithms, on
different neural network structures, in order to select the best performing model for identification. In
addition, the study also compared the iris recognition performance of the system model with the iris
identification methods of many previous authors and studies.
Keywords: Hough transform, artificial neural network (ANN), iris recognition, independent component
analysis (ICA), biometrics.
Email: [email protected]
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019)
4
1. Giới thiệu
1.1. Sinh trắc học mống mắt
Mỗi người đều mang trên mình những
điểm sinh trắc học duy nhất (bao gồm
khuôn mặt, giọng nói, vân tay,). Trong
nhiều trường hợp, những đặc điểm, tính
chất của các mẫu sinh trắc có thể được sử
dụng để phân biệt người này với người
khác. Mỗi mẫu sinh trắc có những ưu
điểm và khuyết điểm riêng, nhưng hệ
thống nhận diện người dựa trên mẫu sinh
trắc học mống mắt được xem là hệ thống
nhận dạng có hiệu suất cao (các nghiên
cứu đều đạt hiệu suất trên 90%) và đã
được áp dụng nhiều vào thực tế. Những
cấu trúc đặc biệt duy nhất của mống mắt
gần như là ổn định trong suốt một đời
người và thậm chí còn độc lập nhau giữa
mắt trái và mắt phải của cùng một người,
do đó đây là một trong những mẫu sinh
trắc hiệu quả để thực hiện trong các hệ
thống nhận dạng [2].
Hình 1. Mống mắt của con người
1.2. Mạng neuron nhân tạo
Một cấu trúc mạng neural nhân tạo
(ANN) là một mô hình máy học hoạt động
tương tự như chức năng của bộ não con
người mà tại đó, hệ thống học hỏi thông
qua quá trình huấn luyện từ những dữ liệu
đã biết để đưa ra những quyết định, dự
đoán về những dữ liệu chưa biết [6]. Đây là
một mô hình có mối quan hệ phức tạp và
phi tuyến giữa dữ liệu đầu ra với đầu vào
thông qua một lượng lớn neuron. Trong bài
viết, cấu trúc Feed Forward Back
Propagation của mạng neuron được sử
dụng vì tính đơn giản và phổ biến của nó.
W1,1
.
.
.
.
.
.
`
.
.
.
.
.
.
. . .
Lớp đầu vào Lớp ẩn Lớp đầu ra
Đầu vào
. . .
. . .
Đầu ra
W2,1
Wn,1 Wn,2
W2,2
W1,2 W1,k
W2,k
Wn,k Wn,k+1
W2,k+1
W1,k+1
Hình 2. Cấu trúc mạng neuron nhân tạo
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN
5
Cấu trúc mạng neuron sẽ có nhiều lớp,
bao gồm một lớp đầu vào, một lớp đầu ra
và giữa chúng sẽ có một hoặc nhiều hơn
các lớp ẩn. Mô hình được huấn luyện dựa
trên giải thuật Back Propagation (BP) dựa
trên các phương trình:
𝑈𝑘(𝑡) = ∑ 𝑤𝑗𝑘(𝑡). 𝑥𝑗(𝑡) + 𝑏𝑘(𝑡)
𝑛
𝑗=1
(1)
𝑌𝑘(𝑡) = 𝜑(𝑈𝑘(𝑡)) (2)
Trong đó, xj(t) là giá trị đầu vào của j
tại thời gian t, wjk(t) là trọng số của neuron
k tại đầu vào là neuron thứ j ở thời điểm t,
φ là hàm kích hoạt phi tuyến, bk(t) là giá trị
bias của neuron thứ k tại thời điểm t, và
yk(t) là đầu ra của neuron k tại thời điểm t.
Quá trình học được lặp lại nhiều lần để
điều chỉnh giá trị trọng số của mạng
neuroncho đến khi đạt được sai số giữa giá
trị đầu ra mong muốn với giá trị đầu ra tính
toán được là nhỏ nhất. Phương trình điều
chỉnh trọng số có dạng:
𝑤𝑗𝑘(𝑡 + 1) = 𝑤𝑗𝑘(𝑡) + 𝜂𝛿𝑘𝑦𝑘 + 𝛼(𝑤𝑗𝑘(𝑡) − 𝑤𝑗𝑘(𝑡 − 1)) (3)
Trong đó, 𝛿𝑘 là sai số ở lớp đầu ra, 𝜂
là tốc độ học, 𝛼 là hệ số momentum. Hai
tham số 𝛿𝑘 và 𝜂 được sử dụng để quyết
định đến giải thuật điều chỉnh giá trị trọng
số của hệ thống mạng neuron. Ngoài ra,
còn có 2 nhân tố khác ảnh hưởng đến quá
trình huấn luyện của một mạng neuron
nhân tạo, đó là số lớp ẩn và số neuron của
mỗi lớp ẩn trong mạng neuron nhân tạo đó.
2. Hệ thống được đề xuất
Hệ thống nhận dạng mống mắt mà bài
viết đưa ra sẽ bao gồm các bước chính:
phân đoạn mống mắt, trích xuất đặc trưng,
hình thành mẫu sinh trắc, huấn luyện mạng
neuron và kiểm tra kết quả (được minh họa
trong Hình 4). Đầu vào của hệ thống sử
dụng cơ sở dữ liệu ảnh mắt CASIA có kích
thước 320x280 đơn vị pixel [3]. Ảnh đầu
vào sẽ được phân đoạn đối với vùng mống
mắt sử dụng giải thuật thresholding để ước
lượng vùng pixel của con ngươi;, dựa vào
vùng pixel này để xác định tâm thô của con
ngươi (ta giả định con ngươi của mắt xem
như là hình tròn); sau đó lần lượt xác định
tâm và bán kính của biên trong và biên
ngoài của vùng mống mắt sử dụng biến đổi
Hough [13]. Từ kết quả phân đoạn, hệ
thống cho hình ảnh chuẩn hóa đầu ra có
kích thước 100x100 đơn vị pixel sau khi đã
loại bỏ những vùng thông tin không cần
thiết. Ảnh chuẩn hóa sẽ được sử dụng giải
thuật ICA để trích xuất thông tin đặc trưng
của mống mắt, cuối cùng các thông tin đặc
trưng này sẽ được đưa vào mạng neuron
(dưới dạng ma trận) để huấn luyện và kiểm
tra hiệu suất của hệ thống.
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019)
6
Ảnh mống mắt
Phân đoạn mống mắt
Chuẩn hóa
Trích xuất đặc trưng bằng ICA
Learning ?
Kiểm tra bằng
mạng neuron
Vector đầu ra
Huấn luyện mạng
neuron
Cơ sở dữ liệu
So sánh với ngưỡng
Thỏa mãn điều
kiện so sánh
Cho kết quả
nhận dạng
Không nhận
dạng được
NO
YES
YES
NO
Hình 3. Lưu đồ giải thuật của hệ thống để xuất
2.1. Phân đoạn mống mắt
2.1.1. Xác định vùng con ngươi
Trước khi sử dụng giải thuật dựa trên
biến đổi Hough để xác định tâm và bán
kính của con ngươi (được xem như là hình
tròn), giải thuật thresholding được dùng để
ước lượng vùng pixel dựa trên các giá trị
mức xám thấp, từ đó xác định tâm thô của
nó [4]. Kết quả được minh họa trong Hình
4a,b. Dựa trên vùng con ngươi vừa xác
định được, có thể ước lượng vị trí tâm thô
của con ngươi theo công thức [10]:
𝑥 =
1
𝑁
∑ 𝑥𝑖
𝑁
𝑖=1
; 𝑦 =
1
𝑁
∑ 𝑦𝑖
𝑁
𝑖=1
(4)
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN
7
Trong đó, (xi, yi) thể hiện vị trí của giá
trị mức xám 0 trong ảnh nhị phân là ảnh kết
quả sau khi sử dụng thuật toán thresholding
lên ảnh mắt để tách các pixel thành hai
phần: phần thuộc vật thể (màu đen) và phần
thuộc môi trường (màu trắng).
Hình 4. a. Ảnh mống mắt; b. Kết quả phân đoạn vùng con ngươi dùng giải thuật
thresholding. Kết quả xác định biên trong biên ngoài của vùng mống mắt:
c. Không sử dụng cân bằng histogram; d. Sử dụng cân bằng histogram
Sau khi ước lượng vị trí của con
ngươi, hệ thống sử dụng giải thuật dựa trên
biến đổi Hough để tìm ra tâm và bán kính
thực của con ngươi [10].
2.1.2. Xác định biên của mống mắt
Sau khi tìm được tâm thô của con
ngươi, vì tâm của các đường biên trong và
biên ngoài của vùng mống mắt gần như là
trùng nhau (trùng với tâm của con ngươi),
nên việc ước lượng tâm cũng như bán kính
của hai đường biên này sẽ tương đối giống
nhau về nguyên lý thực hiện. Mặc dù sẽ có
một số bước tiền xử lý trước khi xác định
biên ngoài của mống mắt để cải thiện mức
độ tương phản giữa các pixel của vùng
mống mắt với những pixel không thuộc
vùng mống mắt, sau đó mới áp dụng biến
đổi Hough để cho kết quả xử lý tốt hơn.
Khác với biên ngoài, biên trong của mống
mắt có sự thay đổi về các giá trị mức xám
của vùng mống mắt và con ngươi là dễ
dàng nhận ra hơn nên khi áp dụng các bộ
lọc tìm đường biên như bộ lọc Canny ta dễ
dàng tìm được các đường biên này chính
xác. Ngược lại ranh giới này ở đường biên
ngoài của mống mắt khó nhận biết hơn nên
cần phải sử dụng cân bằng histogram trước
khi áp dụng bộ lọc đường biên cho ảnh [4].
Kết quả xử lý và so sánh giữa hai trường
hợp xác định biên trong biên ngoài của
mống mắt được minh họa trong Hình 4c,d.
Tóm tắt các bước phân đoạn mống mắt
● Ước lượng vị trí của con ngươi
dùng giải thuật thresholding.
● Ước lượng tâm và bán kính của con
ngươi (biên trong mống mắt) dùng lọc
Canny và biến đổi Hough.
● Cân bằng Histogram, ước lượng
tâm, bán kính của con ngươi dùng bộ lọc
Canny và biến đổi Hough.
2.2. Chuẩn hóa
Sau khi đã xác định được vùng mống
mắt từ bước phân đoạn, các pixel trong
vùng mống mắt sẽ được chuẩn hóa để cho
một ảnh pixel đầu ra. Ngoài mục đích đưa
các pixel của vùng mống mắt về một ma
trận pixel có kích thước chuẩn, công việc
này còn làm giảm đáng kể lượng thông tin
dữ liệu dư thừa, để qua đó giúp giảm thời
gian xử lý của hệ thống. Thông thường,
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019)
8
quá trình chuẩn hóa có các bước loại bỏ
các nhiễu do chân mày, lông mi và những
đốm sáng phản xạ nằm trên vùng mống
mắt, để không làm ảnh hưởng đến hiệu
suất nhận diện của hệ thống cũng như độ
chính xác của việc xử lý. Trong bài viết
này, vùng mống mắt ở phía trên và phía
dưới của con ngươi sẽ được lược bỏ, vì đây
là những vùng pixel thường hay có nhiễu
do lông mi và chân mày. Phần còn lại của
mống mắt sẽ được hệ thống lấy mẫu để cho
ma trận ảnh đầu ra có kích thước 100x100
đơn vị pixel. Vùng pixel của mống mắt để
xử lý chuẩn hóa được minh họa trong Hình
5a.
Bằng cách này, các nhiễu do chân mày
và lông mi sẽ được loại bỏ, ma trận ảnh
đầu ra không cần phải sử dụng các phương
pháp loại bỏ nhiễu, từ đó giảm được thời
gian xử lý của hệ thống [14]. Tuy nhiên,
đánh đổi cho nó, lại là việc mất đi thông tin
mống mắt nằm trong những phần trên và
phần dưới của con ngươi so với các
phương pháp truyền thống. Kết quả đầu ra
của bước chuẩn hóa được minh họa trong
Hình 5b,c.
Hình 5. a. Vùng mống mắt được dùng để xử lý chuẩn hóa; b. Ảnh trước khi chuẩn hóa;
c. Ảnh sau khi chuẩn hóa
2.3. Trích xuất đặc trưng với ICA
Sau quá trình chuẩn hóa, ảnh thu được
có kích thước là 100x100 tạo thành một
không gian với số chiều quá lớn [14]. Tuy
nhiên, kích thước nội tại của không gian
mống mắt là nhỏ hơn nhiều. Kỹ thuật
không gian được sử dụng nhằm mục đích
làm giảm số chiều quá lớn của dữ liệu
được quét. Trong khía cạnh này, các công
cụ phân tích không gian được sử dụng
rộng rãi nhất như Singular Value
Decomposition (SVD) [14], phân tích
thành phần chính (PCA), Kernel PCA [11],
phân tích thành phần độc lập (Independent
Component Analysis - ICA) [18]. Để trích
xuất đặc trưng mống mắt, thuật toán ICA
đã được áp dụng, vì trong ICA áp dụng các
phép biến đổi tuyến tính. Trong bài viết
này, một chương trình MATLAB được đưa
ra bởi Gävert, Hurri, Särelä, and Hyvärinen
[15] nhằm áp dụng để thực hiện thuật
toán FastICA.
Mô hình tuyến tính không nhiễu của
ICA có thể được biểu diễn bằng:
𝑥 = 𝐴𝑠 (1)
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN
9
Trong đó, 𝑥 = (𝑥1, 𝑥2, , 𝑥𝑁)
𝑇 là
vector của tín hiệu quan sát được với kích
thước là N, 𝑠 = (𝑠1, 𝑠2, , 𝑠𝑀)
𝑇 với kích
thước M là số thành phần độc lập và A là
ma trận trộn chưa biết. Trong giải thuật
ICA sẽ áp dụng thuật toán điểm cố định để
ước lượng ma trận A và thành phần độc lập
s dựa vào vector x.
Giả sử 𝑥′ = (𝑥1
′ , 𝑥2
′ , , 𝑥𝑁
′ )𝑇 là một
ảnh mống mắt sau quá trình chuẩn hóa với
N biến ngẫu nhiên và giả định rằng sự kết
hợp tuyến tính của M thành phần độc lập
chưa biết được ký hiệu là 𝑠′ =
(𝑠1
′ , 𝑠2
′ , , 𝑠𝑀
′ )𝑇, với tất cả i, i = 1,2,..,N, ảnh
𝑥𝑖
′ và thành phần độc lập 𝑠𝑖
′ được chuyển
đổi lần lượt thành 𝑥𝑖 và 𝑠𝑖 bằng cách nối
hàng và được ký hiệu tương ứng là 𝑥 =
(𝑥1, 𝑥2, , 𝑥𝑁)
𝑇 và 𝑠 = (𝑠1, 𝑠2, , 𝑠𝑀)
𝑇. Từ
đó, hình ảnh mống mắt được đại diện bởi
một sự kết hợp tuyến tính của 𝑠1, 𝑠2, , 𝑠𝑀
với các trọng số 𝑎𝑖1, 𝑎𝑖2, , 𝑎𝑖𝑀. Vì thế, ma
trận A đại diện cho không gian của tất cả
các ảnh mống mắt.
2.4. Cấu trúc mạng neuron nhân tạo
2.4.1. Lớp đầu vào
Lớp đầu vào đại diện cho hình ảnh
mống mắt như là đầu vào của hệ thống.
Kích thước của vector đặc trưng sau khi áp
dụng thuật toán ICA xác định số lượng
neuron ở lớp đầu vào và nó bằng chính giá
trị M của ma trận trộn A.
2.4.2. Lớp ẩn
Lớp ẩn bao gồm nhiều neuron nhận dữ
liệu đầu vào từ các neuron lớp trước và
chuyển đổi các giá trị đầu vào này sang các
lớp xử lý tiếp theo. Trong quá trình đào
tạo, số lượng lớp ẩn cũng như số neuron
trong mỗi lớp ẩn được thay đổi để đạt mô
hình tối ưu.
2.4.3. Lớp đầu ra
Số lượng neuron của lớp đầu ra phụ
thuộc vào số lượng người sử dụng để huấn
luyện.
2.4.4. Các thuật toán huấn luyện
Các thuật toán huấn luyện cần điều
chỉnh trọng số của ANN để giảm thiểu sai
số càng nhiều càng tốt. Ở đây, hàm Mean
square error (MSE) được sử dụng như một
hàm hiệu suất cho hệ thống nhận dạng
mống mắt và nó được giảm thiểu trong quá
trình huấn luyện Feed Forward Back
Propagation (FFBPNN). MSE thể hiện
khác biệt giữa mô hình ANN mong muốn
và mô hình thực tế theo phương trình sau:
𝑀𝑆𝐸 = ∑
(𝑇𝑖 − 𝑦𝑖)
2
𝑛
𝑛
𝑖=1
(2)
Trong đó, Ti và yi lần lượt là các giá trị
mong muốn và thực tế thứ i của mô hình.
Ở đây, 10 thuật toán ANN tối ưu được
sử dụng để huấn luyện các mô hình ANN
và xác định mô hình tốt nhất cho hệ thống
nhận dạng mống mắt:
● Levenberg-Marquardt (TRAINLM)
● Broyden Fletcher Goldfarb
Shanno (TRAINBFG)
● Bayesian regularization algorithm
(TRAINBR)
● Conjugate gradient back-
propagation with Fletcher-Reeves updates
(TRAINCGF)
● Gradient descent - (TRAINGD)
● Gradient descent with momentum
(TRAINGDM)
● Gradient descent with adaptive
learning rate - (TRAINGDA)
● Gradient descent momentum and an
adaptive learning rate (TRAINGDX)
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019)
10
● One-step secant - (TRAINOSS)
● Resilient back-propagation (TRAINRP)
Các thuật ngữ (LM, BFG, BR, CGF,
GD, GDM, GDA, GDX, OSS và RP) được
sử dụng trong các bảng được mô tả trong
phần kết quả đại diện cho 10 thuật toán
tương ứng.
3. Kết quả thực hiện
Hệ thống thực hiện trên máy tính có
cấu hình Intel Core i3 với tốc độ 2.4 GHz
và RAM 4 GB với bộ dữ liệu CASIA Iris
Interval [3]. Các mô hình ANN khác nhau
đã được xây dựng cho hệ thống nhận dạng
mống mắt. Mỗi mô hình được huấn luyện
với 10 thuật toán như đã nêu ở trên. Đối với
mỗi mô hình, số lớp ẩn được thay đổi để
đánh giá hiệu quả. MATLAB được sử dụng
để viết các chương trình liên quan đến việc
huấn luyện các mô hình ANN khác nhau
cũng như các chương trình để kiểm tra tỷ lệ
chính xác của chúng xác định cấu trúc mô
hình ANN tối ưu. Để đánh giá hiệu suất của
mô hình đã xây dựng, hai thông số được
tính toán là tỷ lệ nhận dạng và thời gian hội
tụ. Hiệu quả của các thuật toán huấn luyện
khác nhau cũng được đánh giá.
Các kết quả trong Bảng 1 và Bảng 2
khi mô hình có 20 người, mỗi người có 5
ảnh (trong đó 3 ảnh để huấn luyện và 2 ảnh
để kiểm tra). Mỗi ảnh sau khi chuẩn hóa có
kích thước 100x100 và được chia thành 4
khối nhỏ, mỗi khối có kích thước 50x50.
Sau đó dùng giải thuật ICA với M = 50,
mô hình đầu tiên được xây dựng với ba lớp
(lớp đầu vào, 1 lớp ẩn và lớp đầu ra). Bảng
1 cho thấy kết quả khi mô hình có ba lớp
(lớp đầu vào, 1 lớp ẩn và lớp đầu ra) được
huấn luyện với 10 thuật toán khác nhau.
Bảng 1 cho thấy tỷ lệ nhận dạng chính
xác nhất khi sử dụng thuật toán GDA
(Gradient Descent with Adaptive learning
rate). Ngoài ra, thuật toán này hội tụ rất
nhanh. Tuy nhiên, các thuật toán như LM,
BFG, BR, CGF cần thời gian hội tụ lớn
nhưng tỷ lệ nhận dạng thấp. Để kiểm tra ảnh
hưởng của số lớp ẩn đến kết quả nhận dạng,
mô hình thứ hai đã được thực hiện với 5 lớp
(lớp đầu vào, 3 lớp ẩn và lớp đầu ra). Kết
quả được thể hiện trong Bảng 2.
Bảng 1. Kết quả của mô hình ANN có 1 lớp ẩn
Hàm huấn luyện Tỷ lệ nhận dạng Thời gian hội tụ
LM 7.5 % 1800 s
BFG 25 % 1200 s
BR 10 % 1500 s
CGF 12.5 % 1608 s
GD 87.5 % 240 s
GDM 87.5 % 233 s
GDA 92.5 % 10 s
GDX 90 % 10 s
OSS 40 % 18 s
RP 87.5 % 10 s
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN
11
Bảng 2. Kết quả của mô hình ANN có 3 lớp ẩn
Hàm huấn luyện Tỷ lệ nhận dạng Thời gian hội tụ
LM 7.5 % 2375 s
BFG 25 % 1620 s
BR 10 % 1724 s
CGF 12.5 % 1801 s
GD 87.5 % 320 s
GDM 87.5 % 286 s
GDA 97.5 % 18 s
GDX 90 % 25 s
OSS 47.5 % 37 s
RP 90 % 16 s
Dễ thấy rằng, với mô hình có 3 lớp ẩn,
thời gian hội tụ tương đối lớn nhưng hiệu
suất đã được cải thiện, thuật toán cho hiệu
quả tốt nhất vẫn là GDA (97,5%). Việc cần
thêm thời gian cho các thuật toán hội tụ là
điều dễ hiểu vì càng nhiều lớp ẩn đòi hỏi
phải thực hiện nhiều phép tính toán hơn.
Nhưng với công nghệ và sự phát triển của
máy tính ngày nay, vấn đề này sẽ được
khắc phục. Dựa vào các kết quả trên, mô
hình ANN tối ưu được lựa chọn cho hệ
thống nhận dạng mống mắt là mô hình
ANN với 5 lớp (lớp đầu vào, 3 lớp ẩn và
lớp đầu ra) và sử dụng thuật toán GDA.
Bảng 3. Kết quả khi ảnh không được chia khối
Không
chia khối
Giá trị M của ma trân A Không chia
khối
Giá trị M của ma trân A
10 30 50 100 10 30 50 100
Số
người
5
432
Số
người
5 100%
20
10
366 246
10 100% 100%
14 6
20
238 249 258
20
90%
(9/10)
100% 90% (9/10)
28 15 27
40
251 261 273 247
40
95%
(19/20)
100% 100% 100%
37 28 17 16
60
268 257 261 242
60 100% 100% 100% 100%
46 29 31 40
90
405 458 523 298
90
10.56%
(19/180)
96.11%
(173/180)
98.89%
(178/180)
97.22%
(175 /180) 49 51 41 26
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019)
12
Bảng 4. Kết quả khi ảnh được chia thành 4 khối
Chia 4
khối
Số dimension
Chia 4 khối
Số dimension
10 30 50 100 10 30 50 100
Số
người
5
5 4 4
Số
người
5 100% 100%
90%
(8/10)
16 4 3
10
5 5 5 5
10 100% 100%
95%
(19/20)
87.5%
(16/20) 25 17 14 5
20
6 5 6 6
20
92.5%
(37/40)
95%
(38/40)
97.5%
(39/40)
87.5%
(35/40) 61 27 26 15
40
8 8 8 11
40
15%
(12/80)
93.75%
(75/80)
91.25%
(73/80)
88.75%
(71/80) 17 78 76 51
60
12 15 13 20
60
12.5%
(15/120)
93.33%
(112/120)
92.5%
(111/120)
89.16%
(107/120) 22 178 149 120
90
19 19 19 23
90
6.67%
(12/180)
8.33%
(15/180)
89.44%
(161/180)
83.89%
(151/180)
34 24 273 248
Theo kết quả trong các Bảng 3 và
Bảng 4, khi ảnh không được chia thành các
khối nhỏ thì hiệu suất nhận dạng rất cao
nhưng thời gian tính toán giải thuật ICA và
thời gian thuật toán huấn luyện trong mạng
ANN là rất lớn, không phù hợp cho các ứng
dụng trong thời gian thực. Khi ảnh được
chia thành 4 khối, mỗi khối có kích thước
là 50x50 thì hiệu suất nhận dạng không tốt
như khi không chia khối, nhưng thời gian
tính toán ICA và thời gian thuật toán huấn
luyện hội tụ được giảm đáng kể. Kết quả
nhận dạng đạt được tốt nhất khi giải thuật
ICA với số chiều là 50. Bảng 5 cho thấy sự
so sánh ngắn gọn về hiệu quả dựa trên tỷ lệ
nhận dạng giữa phương pháp đề xuất của
chúng tôi và một số phương pháp khác
nhau trong các bài báo đã công bố. Các
phương pháp này bao gồm Daugman [9],
Tisse [5], Li Ma [12] và Chirchi [18].
Bảng 5. Bảng so sánh với các phương pháp khác
Phương pháp Tỷ lệ nhận dạng (%)
Daugman [9] 99.37
Tisse [5] 96.61
Li Ma [12] 94.33
Chirchi [18] 99.75
Phương pháp đề xuất 97.5
LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN
13
Từ kết quả, phương pháp của
Daugman có hiệu suất tốt nhất, trong khi
hệ thống đề xuất cho kết quả tốt hơn khi so
sánh với các phương pháp của Tisse, Li
Ma. Vì vậy, hệ thống đề xuất chứng minh
hiệu quả khi so sánh các phương pháp tiếp
cận khác. Trong nghiên cứu gần đây [18],
không có đề cập đến thời gian xử lý của
phương pháp cũng như số lượng người
nhận diện để có thể so sánh thời gian xử lý
giữa hai phương pháp. Mặc dù hiệu quả
nhận dạng không cao lắm so với phương
pháp trong tài liệu [18] nhưng hiệu suất của
phương pháp nhận dạng mống mắt dùng
ANN và ICA vẫn chấp nhận được với thời
gian xử lý nhanh và có thể được kết hợp
vào ứng dụng thời gian thực.
4. Kết luận
Bài nghiên cứu đã đưa ra một phương
pháp hiệu quả cho hệ thống nhận dạng
mống mắt. Sau quá trình chuẩn hóa, hình
ảnh với kích thước 100x100 được chia
thành 4 khối hình ảnh nhỏ trước khi trích
xuất đặc trưng. Mỗi khối nhỏ được trích
xuất đặc trưng bằng cách sử dụng thuật
toán ICA. Bằng cách chia hình ảnh thành
các khối nhỏ, thời gian tính toán ICA được
giảm xuống đáng kể. Các thành phần độc
lập này phản ánh thông tin chi tiết của
mống mắt (như tàn nhang, dải, rãnh,)
thay đổi, phân bố của nó cho thấy sự khác
biệt cá nhân của mống mắt đối với mỗi
người. Sau đó, các đặc trưng mống mắt này
đã được phân loại và nhận dạng theo mô
hình mạng neuron nhân tạo (ANN). Các
mô hình ANN khác nhau được xây dựng
và được huấn luyện với 10 thuật toán khác
nhau để đạt được mô hình ANN tối ưu. Kết
quả đạt được khi thực hiện với cơ sở dữ
liệu CASIA. Tỷ lệ nhận dạng của phương
pháp này là 97,5%. Đặc biệt, so sánh giữa
hệ thống đề xuất và các phương pháp của
Tisse, Li Ma, Boles đã được làm để chứng
minh hiệu quả của phương pháp nhận dạng
mống mắt dùng ANN và ICA đề xuất.
Trong tương lai, hệ thống nhận dạng mống
mắt cần phải được phát triển để thực hiện
trên phần cứng và trong thời gian thực để
trở thành một ứng dụng phổ biến.
LỜI CẢM ƠN
Các tác giả cảm ơn khoa Điện-Điện tử
trường Đại học Bách Khoa TP.Hồ Chí Minh đã
hỗ trợ tài chính và hướng dẫn để hoàn thành
thành công nghiên cứu này.
TÀI LIỆU THAM KHẢO
1. A. Albadarneh, J. Alquatawna, Iris
recognition System for Secure
Authentication Based on Texture and Shape
Features Pro.IEEE Jordan Conf. Applied
Electrical Engineering and Computer
Technologies (2015).
2. Anil K.Jain, R. Bolle, S.Pankanti,
Biometrics Personal Identification in
Networked Society, Kluwer Academic
Publishers (2002), New York, Boston,
Dordrecht, London, Moscow, ISBN 0-306-
47044-6.G.
3. CASIA Iris database -
ser.do?id=
4. Cherabit, F.Z.Chelali, A.Djeradi, Circular
Hough Transform for Iris localization,
Science and Technology (2012), 2(5): 114-
121, DOI: 10.5923/j.scit.20120205.02.
5. Christel-Loic Tisse, Lionel Torres, Michel
Robert Personal Identification Technique
Using Human Iris Recognition, Proceeding
of the 15th International Conference on
Vision interface (2002).
6. Ethem Alpaydin, Introduction to Machine
Learning, The MIT Press, Cambridge,
Massachusetts, London, England (2004),
ISBN 0-262-01211-1.
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019)
14
7. G. Supriya, S. Halvi, N. T. Deshpande,
Efficient Iris Recognition by Fusion of
Matching Scores obtained by Lifting DWT
and Log-Gabor methods of Feature
Extraction, International Journal of Applied
Research (2015).
8. H. Zang, V. M. Patel, M. E. Fathy and R.
Chellapa, Touch Gesture Based Active
User Authentication Using Dictionaries,
Proc. IEEE Winter Conf. Applications of
Computer Vision, (2015, pp 207-214).
9. J.Daugman, Statistical richness of visual
phase information: Update on recognizing
persons by iris patterns, International
Journal of Computer Vision, (Vol 45, No.
1, pp. 25-38, 2001).
10. J.Yang, L.Nanni, State of the Art in
Biometrics, Published by InTech (2011),
ISBN 978-953-307-307-489-4.
11. K.I.Kim, K.Jung, H.J.Kim, Face recognition
using kernel principal component analysis.
IEEE Signal Process Letters, (Vol. 9, No. 2,
pp. 40-42, Feb. 2002).
12. L.Ma, Y.H.Wang, T.N.Tan, Iris recognition
based on multichannel Gabor filtering.
Proceedings of the Fifth Asian Conference
on Computer Vision (ACCV2002),
Australia (pp. 279-283, Jan. 2002).
13. P.Daniel Rana, G. Neelima Image
Segmentation by using Histogram
Thresholding, IJSET (|January 2012| Vol 2,
Issue 1, 776- 779), ISSN: 2231-0711.
14. Roman Swiniarski, Experiment on
human iris recoginition using error
backpropagation artificial neural network,
San Diego State University, April 2004M.
Young, The Technical Writer’s Handbook.
Mill Valley, CA: University Science,
(1989).
15. R. Swiniarski, Independent Component
Analysis, CS553 Class Notes, San Diego
State University, (2004).
16. Shinyoung Lim, Kwanyong Lee, Okhwan
Byeon, and Taiyun Kim, Efficient Iris
Recognition through Improvement of
Feature Vector and Classifier, ETRI
Journal, Volume 23, Number 2, June 2001.
17. Sushikumar S.Salve, S.P.Narote, Iris
Recognition Using SVM and ANN, (IEEE
WISPNET 2016 conference), ISBN 978-1-
4673-9338-6/16/S31.00
18. V.R.E. Chirchi, L.M. Waghmare,
Enhanced Isocentric Segmentor and
Wavelet Rectangular Coder to Iris
Segmentation and Recognition,
International Journal of Intelligent
Engineering and Systems, (Vol. 10, No. 3,
pp. 1-10, 2017).
19. Yong Wang, Jiu-Qiang Han, Iris
Recognition Using Independent Component
Analysis, Proceedings of the Fourth
International Conference on Machine
Learning and Cybernetics, Guangzhou,
(18-21 August 2005).
Ngày nhận bài: 01/08/2018 Biên tập xong: 15/12/2018 Duyệt đăng: 20/01/2019

File đính kèm:

nhan_dang_mong_mat_dung_phuong_phap_mang_neuron_nhan_tao_va.pdf