Nhận dạng mống mắt dùng phương pháp mạng neuron nhân tạo và phân tích thành phần độc lập
Tóm Tắt
Bài viết trình bày một hệ thống nhận dạng sử dụng mẫu sinh trắc học mống mắt dựa trên các phương
pháp Thresholding, biến đổi Hough, cân bằng Histogram ảnh mắt đầu vào để cho ảnh chuẩn hóa đầu ra
có kích thước 100x100. Mỗi ảnh sau khi được xử lý sẽ lại được chia thành 4 khối nhỏ với kích thước
50x50. Sau đó, trích xuất các đặc trưng của mống mắt sử dụng giải thuật ICA, và cuối cùng đưa vào mô
hình mạng neuron nhân tạo (ANN) để huấn luyện và kiểm tra. Bài viết cũng nghiên cứu so sánh hiệu
suất của các giải thuật ANN và kiểm tra với các cấu trúc mạng neuron khác nhau để chọn ra mô hình
cho kết quả nhận dạng tốt nhất. Ngoài ra, nghiên cứu còn thực hiện so sánh hiệu suất nhận dạng mống
mắt của mô hình hệ thống được đưa ra với các phương pháp nhận dạng mống mắt của nhiều tác giả,
công trình nghiên cứu trước đó.
Tóm tắt nội dung tài liệu: Nhận dạng mống mắt dùng phương pháp mạng neuron nhân tạo và phân tích thành phần độc lập
TRƯỜNG ĐẠI HỌC SÀI GÒN SAIGON UNIVERSITY TẠP CHÍ KHOA HỌC SCIENTIFIC JOURNAL ĐẠI HỌC SÀI GÒN OF SAIGON UNIVERSITY Số 61 (01/2019) No. 61 (01/2019) Email: tcdhsg@sgu.edu.vn ; Website: https://tapchikhoahoc.sgu.edu.vn 3 NHẬN DẠNG MỐNG MẮT DÙNG PHƯƠNG PHÁP MẠNG NEURON NHÂN TẠO VÀ PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP Iris recognition by using artificial neural network and independent component analysis GS.TS. Lê Tiến Thường(1), Nguyễn Duy Phú(2), Lê Bá Lộc(3), ThS. Phan Xuân Hạnh(4) (1),(2),(3),(4)Trường Đại học Bách khoa TP.HCM Tóm Tắt Bài viết trình bày một hệ thống nhận dạng sử dụng mẫu sinh trắc học mống mắt dựa trên các phương pháp Thresholding, biến đổi Hough, cân bằng Histogram ảnh mắt đầu vào để cho ảnh chuẩn hóa đầu ra có kích thước 100x100. Mỗi ảnh sau khi được xử lý sẽ lại được chia thành 4 khối nhỏ với kích thước 50x50. Sau đó, trích xuất các đặc trưng của mống mắt sử dụng giải thuật ICA, và cuối cùng đưa vào mô hình mạng neuron nhân tạo (ANN) để huấn luyện và kiểm tra. Bài viết cũng nghiên cứu so sánh hiệu suất của các giải thuật ANN và kiểm tra với các cấu trúc mạng neuron khác nhau để chọn ra mô hình cho kết quả nhận dạng tốt nhất. Ngoài ra, nghiên cứu còn thực hiện so sánh hiệu suất nhận dạng mống mắt của mô hình hệ thống được đưa ra với các phương pháp nhận dạng mống mắt của nhiều tác giả, công trình nghiên cứu trước đó. Từ khóa: biến đổi Hough, mạng neuron nhân tạo (ANN), nhận dạng mống mắt, phân tích thành phần độc lập (ICA), sinh trắc học. Abstract This paper will present an iris biometric identification system comprising Threshold method, the Hough transform, Histogram equalization of input eye image in order to create a transformed image with dimensions 100x100. Next, each image is divided into 4 sub-block images (each block has dimensions 50x50). Then, the features of each sub-block are extracted by using Independent Component Analysis (ICA) algorithm. Finally, they are included in the Artificial Neural Network (ANN) model for training and testing. The paper performs a comparison of the performance of different ANN algorithms, on different neural network structures, in order to select the best performing model for identification. In addition, the study also compared the iris recognition performance of the system model with the iris identification methods of many previous authors and studies. Keywords: Hough transform, artificial neural network (ANN), iris recognition, independent component analysis (ICA), biometrics. Email: thuongle@hcmut.edu.vn SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 4 1. Giới thiệu 1.1. Sinh trắc học mống mắt Mỗi người đều mang trên mình những điểm sinh trắc học duy nhất (bao gồm khuôn mặt, giọng nói, vân tay,). Trong nhiều trường hợp, những đặc điểm, tính chất của các mẫu sinh trắc có thể được sử dụng để phân biệt người này với người khác. Mỗi mẫu sinh trắc có những ưu điểm và khuyết điểm riêng, nhưng hệ thống nhận diện người dựa trên mẫu sinh trắc học mống mắt được xem là hệ thống nhận dạng có hiệu suất cao (các nghiên cứu đều đạt hiệu suất trên 90%) và đã được áp dụng nhiều vào thực tế. Những cấu trúc đặc biệt duy nhất của mống mắt gần như là ổn định trong suốt một đời người và thậm chí còn độc lập nhau giữa mắt trái và mắt phải của cùng một người, do đó đây là một trong những mẫu sinh trắc hiệu quả để thực hiện trong các hệ thống nhận dạng [2]. Hình 1. Mống mắt của con người 1.2. Mạng neuron nhân tạo Một cấu trúc mạng neural nhân tạo (ANN) là một mô hình máy học hoạt động tương tự như chức năng của bộ não con người mà tại đó, hệ thống học hỏi thông qua quá trình huấn luyện từ những dữ liệu đã biết để đưa ra những quyết định, dự đoán về những dữ liệu chưa biết [6]. Đây là một mô hình có mối quan hệ phức tạp và phi tuyến giữa dữ liệu đầu ra với đầu vào thông qua một lượng lớn neuron. Trong bài viết, cấu trúc Feed Forward Back Propagation của mạng neuron được sử dụng vì tính đơn giản và phổ biến của nó. W1,1 . . . . . . ` . . . . . . . . . Lớp đầu vào Lớp ẩn Lớp đầu ra Đầu vào . . . . . . Đầu ra W2,1 Wn,1 Wn,2 W2,2 W1,2 W1,k W2,k Wn,k Wn,k+1 W2,k+1 W1,k+1 Hình 2. Cấu trúc mạng neuron nhân tạo LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 5 Cấu trúc mạng neuron sẽ có nhiều lớp, bao gồm một lớp đầu vào, một lớp đầu ra và giữa chúng sẽ có một hoặc nhiều hơn các lớp ẩn. Mô hình được huấn luyện dựa trên giải thuật Back Propagation (BP) dựa trên các phương trình: 𝑈𝑘(𝑡) = ∑ 𝑤𝑗𝑘(𝑡). 𝑥𝑗(𝑡) + 𝑏𝑘(𝑡) 𝑛 𝑗=1 (1) 𝑌𝑘(𝑡) = 𝜑(𝑈𝑘(𝑡)) (2) Trong đó, xj(t) là giá trị đầu vào của j tại thời gian t, wjk(t) là trọng số của neuron k tại đầu vào là neuron thứ j ở thời điểm t, φ là hàm kích hoạt phi tuyến, bk(t) là giá trị bias của neuron thứ k tại thời điểm t, và yk(t) là đầu ra của neuron k tại thời điểm t. Quá trình học được lặp lại nhiều lần để điều chỉnh giá trị trọng số của mạng neuroncho đến khi đạt được sai số giữa giá trị đầu ra mong muốn với giá trị đầu ra tính toán được là nhỏ nhất. Phương trình điều chỉnh trọng số có dạng: 𝑤𝑗𝑘(𝑡 + 1) = 𝑤𝑗𝑘(𝑡) + 𝜂𝛿𝑘𝑦𝑘 + 𝛼(𝑤𝑗𝑘(𝑡) − 𝑤𝑗𝑘(𝑡 − 1)) (3) Trong đó, 𝛿𝑘 là sai số ở lớp đầu ra, 𝜂 là tốc độ học, 𝛼 là hệ số momentum. Hai tham số 𝛿𝑘 và 𝜂 được sử dụng để quyết định đến giải thuật điều chỉnh giá trị trọng số của hệ thống mạng neuron. Ngoài ra, còn có 2 nhân tố khác ảnh hưởng đến quá trình huấn luyện của một mạng neuron nhân tạo, đó là số lớp ẩn và số neuron của mỗi lớp ẩn trong mạng neuron nhân tạo đó. 2. Hệ thống được đề xuất Hệ thống nhận dạng mống mắt mà bài viết đưa ra sẽ bao gồm các bước chính: phân đoạn mống mắt, trích xuất đặc trưng, hình thành mẫu sinh trắc, huấn luyện mạng neuron và kiểm tra kết quả (được minh họa trong Hình 4). Đầu vào của hệ thống sử dụng cơ sở dữ liệu ảnh mắt CASIA có kích thước 320x280 đơn vị pixel [3]. Ảnh đầu vào sẽ được phân đoạn đối với vùng mống mắt sử dụng giải thuật thresholding để ước lượng vùng pixel của con ngươi;, dựa vào vùng pixel này để xác định tâm thô của con ngươi (ta giả định con ngươi của mắt xem như là hình tròn); sau đó lần lượt xác định tâm và bán kính của biên trong và biên ngoài của vùng mống mắt sử dụng biến đổi Hough [13]. Từ kết quả phân đoạn, hệ thống cho hình ảnh chuẩn hóa đầu ra có kích thước 100x100 đơn vị pixel sau khi đã loại bỏ những vùng thông tin không cần thiết. Ảnh chuẩn hóa sẽ được sử dụng giải thuật ICA để trích xuất thông tin đặc trưng của mống mắt, cuối cùng các thông tin đặc trưng này sẽ được đưa vào mạng neuron (dưới dạng ma trận) để huấn luyện và kiểm tra hiệu suất của hệ thống. SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 6 Ảnh mống mắt Phân đoạn mống mắt Chuẩn hóa Trích xuất đặc trưng bằng ICA Learning ? Kiểm tra bằng mạng neuron Vector đầu ra Huấn luyện mạng neuron Cơ sở dữ liệu So sánh với ngưỡng Thỏa mãn điều kiện so sánh Cho kết quả nhận dạng Không nhận dạng được NO YES YES NO Hình 3. Lưu đồ giải thuật của hệ thống để xuất 2.1. Phân đoạn mống mắt 2.1.1. Xác định vùng con ngươi Trước khi sử dụng giải thuật dựa trên biến đổi Hough để xác định tâm và bán kính của con ngươi (được xem như là hình tròn), giải thuật thresholding được dùng để ước lượng vùng pixel dựa trên các giá trị mức xám thấp, từ đó xác định tâm thô của nó [4]. Kết quả được minh họa trong Hình 4a,b. Dựa trên vùng con ngươi vừa xác định được, có thể ước lượng vị trí tâm thô của con ngươi theo công thức [10]: 𝑥 = 1 𝑁 ∑ 𝑥𝑖 𝑁 𝑖=1 ; 𝑦 = 1 𝑁 ∑ 𝑦𝑖 𝑁 𝑖=1 (4) LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 7 Trong đó, (xi, yi) thể hiện vị trí của giá trị mức xám 0 trong ảnh nhị phân là ảnh kết quả sau khi sử dụng thuật toán thresholding lên ảnh mắt để tách các pixel thành hai phần: phần thuộc vật thể (màu đen) và phần thuộc môi trường (màu trắng). Hình 4. a. Ảnh mống mắt; b. Kết quả phân đoạn vùng con ngươi dùng giải thuật thresholding. Kết quả xác định biên trong biên ngoài của vùng mống mắt: c. Không sử dụng cân bằng histogram; d. Sử dụng cân bằng histogram Sau khi ước lượng vị trí của con ngươi, hệ thống sử dụng giải thuật dựa trên biến đổi Hough để tìm ra tâm và bán kính thực của con ngươi [10]. 2.1.2. Xác định biên của mống mắt Sau khi tìm được tâm thô của con ngươi, vì tâm của các đường biên trong và biên ngoài của vùng mống mắt gần như là trùng nhau (trùng với tâm của con ngươi), nên việc ước lượng tâm cũng như bán kính của hai đường biên này sẽ tương đối giống nhau về nguyên lý thực hiện. Mặc dù sẽ có một số bước tiền xử lý trước khi xác định biên ngoài của mống mắt để cải thiện mức độ tương phản giữa các pixel của vùng mống mắt với những pixel không thuộc vùng mống mắt, sau đó mới áp dụng biến đổi Hough để cho kết quả xử lý tốt hơn. Khác với biên ngoài, biên trong của mống mắt có sự thay đổi về các giá trị mức xám của vùng mống mắt và con ngươi là dễ dàng nhận ra hơn nên khi áp dụng các bộ lọc tìm đường biên như bộ lọc Canny ta dễ dàng tìm được các đường biên này chính xác. Ngược lại ranh giới này ở đường biên ngoài của mống mắt khó nhận biết hơn nên cần phải sử dụng cân bằng histogram trước khi áp dụng bộ lọc đường biên cho ảnh [4]. Kết quả xử lý và so sánh giữa hai trường hợp xác định biên trong biên ngoài của mống mắt được minh họa trong Hình 4c,d. Tóm tắt các bước phân đoạn mống mắt ● Ước lượng vị trí của con ngươi dùng giải thuật thresholding. ● Ước lượng tâm và bán kính của con ngươi (biên trong mống mắt) dùng lọc Canny và biến đổi Hough. ● Cân bằng Histogram, ước lượng tâm, bán kính của con ngươi dùng bộ lọc Canny và biến đổi Hough. 2.2. Chuẩn hóa Sau khi đã xác định được vùng mống mắt từ bước phân đoạn, các pixel trong vùng mống mắt sẽ được chuẩn hóa để cho một ảnh pixel đầu ra. Ngoài mục đích đưa các pixel của vùng mống mắt về một ma trận pixel có kích thước chuẩn, công việc này còn làm giảm đáng kể lượng thông tin dữ liệu dư thừa, để qua đó giúp giảm thời gian xử lý của hệ thống. Thông thường, SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 8 quá trình chuẩn hóa có các bước loại bỏ các nhiễu do chân mày, lông mi và những đốm sáng phản xạ nằm trên vùng mống mắt, để không làm ảnh hưởng đến hiệu suất nhận diện của hệ thống cũng như độ chính xác của việc xử lý. Trong bài viết này, vùng mống mắt ở phía trên và phía dưới của con ngươi sẽ được lược bỏ, vì đây là những vùng pixel thường hay có nhiễu do lông mi và chân mày. Phần còn lại của mống mắt sẽ được hệ thống lấy mẫu để cho ma trận ảnh đầu ra có kích thước 100x100 đơn vị pixel. Vùng pixel của mống mắt để xử lý chuẩn hóa được minh họa trong Hình 5a. Bằng cách này, các nhiễu do chân mày và lông mi sẽ được loại bỏ, ma trận ảnh đầu ra không cần phải sử dụng các phương pháp loại bỏ nhiễu, từ đó giảm được thời gian xử lý của hệ thống [14]. Tuy nhiên, đánh đổi cho nó, lại là việc mất đi thông tin mống mắt nằm trong những phần trên và phần dưới của con ngươi so với các phương pháp truyền thống. Kết quả đầu ra của bước chuẩn hóa được minh họa trong Hình 5b,c. Hình 5. a. Vùng mống mắt được dùng để xử lý chuẩn hóa; b. Ảnh trước khi chuẩn hóa; c. Ảnh sau khi chuẩn hóa 2.3. Trích xuất đặc trưng với ICA Sau quá trình chuẩn hóa, ảnh thu được có kích thước là 100x100 tạo thành một không gian với số chiều quá lớn [14]. Tuy nhiên, kích thước nội tại của không gian mống mắt là nhỏ hơn nhiều. Kỹ thuật không gian được sử dụng nhằm mục đích làm giảm số chiều quá lớn của dữ liệu được quét. Trong khía cạnh này, các công cụ phân tích không gian được sử dụng rộng rãi nhất như Singular Value Decomposition (SVD) [14], phân tích thành phần chính (PCA), Kernel PCA [11], phân tích thành phần độc lập (Independent Component Analysis - ICA) [18]. Để trích xuất đặc trưng mống mắt, thuật toán ICA đã được áp dụng, vì trong ICA áp dụng các phép biến đổi tuyến tính. Trong bài viết này, một chương trình MATLAB được đưa ra bởi Gävert, Hurri, Särelä, and Hyvärinen [15] nhằm áp dụng để thực hiện thuật toán FastICA. Mô hình tuyến tính không nhiễu của ICA có thể được biểu diễn bằng: 𝑥 = 𝐴𝑠 (1) LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 9 Trong đó, 𝑥 = (𝑥1, 𝑥2, , 𝑥𝑁) 𝑇 là vector của tín hiệu quan sát được với kích thước là N, 𝑠 = (𝑠1, 𝑠2, , 𝑠𝑀) 𝑇 với kích thước M là số thành phần độc lập và A là ma trận trộn chưa biết. Trong giải thuật ICA sẽ áp dụng thuật toán điểm cố định để ước lượng ma trận A và thành phần độc lập s dựa vào vector x. Giả sử 𝑥′ = (𝑥1 ′ , 𝑥2 ′ , , 𝑥𝑁 ′ )𝑇 là một ảnh mống mắt sau quá trình chuẩn hóa với N biến ngẫu nhiên và giả định rằng sự kết hợp tuyến tính của M thành phần độc lập chưa biết được ký hiệu là 𝑠′ = (𝑠1 ′ , 𝑠2 ′ , , 𝑠𝑀 ′ )𝑇, với tất cả i, i = 1,2,..,N, ảnh 𝑥𝑖 ′ và thành phần độc lập 𝑠𝑖 ′ được chuyển đổi lần lượt thành 𝑥𝑖 và 𝑠𝑖 bằng cách nối hàng và được ký hiệu tương ứng là 𝑥 = (𝑥1, 𝑥2, , 𝑥𝑁) 𝑇 và 𝑠 = (𝑠1, 𝑠2, , 𝑠𝑀) 𝑇. Từ đó, hình ảnh mống mắt được đại diện bởi một sự kết hợp tuyến tính của 𝑠1, 𝑠2, , 𝑠𝑀 với các trọng số 𝑎𝑖1, 𝑎𝑖2, , 𝑎𝑖𝑀. Vì thế, ma trận A đại diện cho không gian của tất cả các ảnh mống mắt. 2.4. Cấu trúc mạng neuron nhân tạo 2.4.1. Lớp đầu vào Lớp đầu vào đại diện cho hình ảnh mống mắt như là đầu vào của hệ thống. Kích thước của vector đặc trưng sau khi áp dụng thuật toán ICA xác định số lượng neuron ở lớp đầu vào và nó bằng chính giá trị M của ma trận trộn A. 2.4.2. Lớp ẩn Lớp ẩn bao gồm nhiều neuron nhận dữ liệu đầu vào từ các neuron lớp trước và chuyển đổi các giá trị đầu vào này sang các lớp xử lý tiếp theo. Trong quá trình đào tạo, số lượng lớp ẩn cũng như số neuron trong mỗi lớp ẩn được thay đổi để đạt mô hình tối ưu. 2.4.3. Lớp đầu ra Số lượng neuron của lớp đầu ra phụ thuộc vào số lượng người sử dụng để huấn luyện. 2.4.4. Các thuật toán huấn luyện Các thuật toán huấn luyện cần điều chỉnh trọng số của ANN để giảm thiểu sai số càng nhiều càng tốt. Ở đây, hàm Mean square error (MSE) được sử dụng như một hàm hiệu suất cho hệ thống nhận dạng mống mắt và nó được giảm thiểu trong quá trình huấn luyện Feed Forward Back Propagation (FFBPNN). MSE thể hiện khác biệt giữa mô hình ANN mong muốn và mô hình thực tế theo phương trình sau: 𝑀𝑆𝐸 = ∑ (𝑇𝑖 − 𝑦𝑖) 2 𝑛 𝑛 𝑖=1 (2) Trong đó, Ti và yi lần lượt là các giá trị mong muốn và thực tế thứ i của mô hình. Ở đây, 10 thuật toán ANN tối ưu được sử dụng để huấn luyện các mô hình ANN và xác định mô hình tốt nhất cho hệ thống nhận dạng mống mắt: ● Levenberg-Marquardt (TRAINLM) ● Broyden Fletcher Goldfarb Shanno (TRAINBFG) ● Bayesian regularization algorithm (TRAINBR) ● Conjugate gradient back- propagation with Fletcher-Reeves updates (TRAINCGF) ● Gradient descent - (TRAINGD) ● Gradient descent with momentum (TRAINGDM) ● Gradient descent with adaptive learning rate - (TRAINGDA) ● Gradient descent momentum and an adaptive learning rate (TRAINGDX) SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 10 ● One-step secant - (TRAINOSS) ● Resilient back-propagation (TRAINRP) Các thuật ngữ (LM, BFG, BR, CGF, GD, GDM, GDA, GDX, OSS và RP) được sử dụng trong các bảng được mô tả trong phần kết quả đại diện cho 10 thuật toán tương ứng. 3. Kết quả thực hiện Hệ thống thực hiện trên máy tính có cấu hình Intel Core i3 với tốc độ 2.4 GHz và RAM 4 GB với bộ dữ liệu CASIA Iris Interval [3]. Các mô hình ANN khác nhau đã được xây dựng cho hệ thống nhận dạng mống mắt. Mỗi mô hình được huấn luyện với 10 thuật toán như đã nêu ở trên. Đối với mỗi mô hình, số lớp ẩn được thay đổi để đánh giá hiệu quả. MATLAB được sử dụng để viết các chương trình liên quan đến việc huấn luyện các mô hình ANN khác nhau cũng như các chương trình để kiểm tra tỷ lệ chính xác của chúng xác định cấu trúc mô hình ANN tối ưu. Để đánh giá hiệu suất của mô hình đã xây dựng, hai thông số được tính toán là tỷ lệ nhận dạng và thời gian hội tụ. Hiệu quả của các thuật toán huấn luyện khác nhau cũng được đánh giá. Các kết quả trong Bảng 1 và Bảng 2 khi mô hình có 20 người, mỗi người có 5 ảnh (trong đó 3 ảnh để huấn luyện và 2 ảnh để kiểm tra). Mỗi ảnh sau khi chuẩn hóa có kích thước 100x100 và được chia thành 4 khối nhỏ, mỗi khối có kích thước 50x50. Sau đó dùng giải thuật ICA với M = 50, mô hình đầu tiên được xây dựng với ba lớp (lớp đầu vào, 1 lớp ẩn và lớp đầu ra). Bảng 1 cho thấy kết quả khi mô hình có ba lớp (lớp đầu vào, 1 lớp ẩn và lớp đầu ra) được huấn luyện với 10 thuật toán khác nhau. Bảng 1 cho thấy tỷ lệ nhận dạng chính xác nhất khi sử dụng thuật toán GDA (Gradient Descent with Adaptive learning rate). Ngoài ra, thuật toán này hội tụ rất nhanh. Tuy nhiên, các thuật toán như LM, BFG, BR, CGF cần thời gian hội tụ lớn nhưng tỷ lệ nhận dạng thấp. Để kiểm tra ảnh hưởng của số lớp ẩn đến kết quả nhận dạng, mô hình thứ hai đã được thực hiện với 5 lớp (lớp đầu vào, 3 lớp ẩn và lớp đầu ra). Kết quả được thể hiện trong Bảng 2. Bảng 1. Kết quả của mô hình ANN có 1 lớp ẩn Hàm huấn luyện Tỷ lệ nhận dạng Thời gian hội tụ LM 7.5 % 1800 s BFG 25 % 1200 s BR 10 % 1500 s CGF 12.5 % 1608 s GD 87.5 % 240 s GDM 87.5 % 233 s GDA 92.5 % 10 s GDX 90 % 10 s OSS 40 % 18 s RP 87.5 % 10 s LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 11 Bảng 2. Kết quả của mô hình ANN có 3 lớp ẩn Hàm huấn luyện Tỷ lệ nhận dạng Thời gian hội tụ LM 7.5 % 2375 s BFG 25 % 1620 s BR 10 % 1724 s CGF 12.5 % 1801 s GD 87.5 % 320 s GDM 87.5 % 286 s GDA 97.5 % 18 s GDX 90 % 25 s OSS 47.5 % 37 s RP 90 % 16 s Dễ thấy rằng, với mô hình có 3 lớp ẩn, thời gian hội tụ tương đối lớn nhưng hiệu suất đã được cải thiện, thuật toán cho hiệu quả tốt nhất vẫn là GDA (97,5%). Việc cần thêm thời gian cho các thuật toán hội tụ là điều dễ hiểu vì càng nhiều lớp ẩn đòi hỏi phải thực hiện nhiều phép tính toán hơn. Nhưng với công nghệ và sự phát triển của máy tính ngày nay, vấn đề này sẽ được khắc phục. Dựa vào các kết quả trên, mô hình ANN tối ưu được lựa chọn cho hệ thống nhận dạng mống mắt là mô hình ANN với 5 lớp (lớp đầu vào, 3 lớp ẩn và lớp đầu ra) và sử dụng thuật toán GDA. Bảng 3. Kết quả khi ảnh không được chia khối Không chia khối Giá trị M của ma trân A Không chia khối Giá trị M của ma trân A 10 30 50 100 10 30 50 100 Số người 5 432 Số người 5 100% 20 10 366 246 10 100% 100% 14 6 20 238 249 258 20 90% (9/10) 100% 90% (9/10) 28 15 27 40 251 261 273 247 40 95% (19/20) 100% 100% 100% 37 28 17 16 60 268 257 261 242 60 100% 100% 100% 100% 46 29 31 40 90 405 458 523 298 90 10.56% (19/180) 96.11% (173/180) 98.89% (178/180) 97.22% (175 /180) 49 51 41 26 SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 12 Bảng 4. Kết quả khi ảnh được chia thành 4 khối Chia 4 khối Số dimension Chia 4 khối Số dimension 10 30 50 100 10 30 50 100 Số người 5 5 4 4 Số người 5 100% 100% 90% (8/10) 16 4 3 10 5 5 5 5 10 100% 100% 95% (19/20) 87.5% (16/20) 25 17 14 5 20 6 5 6 6 20 92.5% (37/40) 95% (38/40) 97.5% (39/40) 87.5% (35/40) 61 27 26 15 40 8 8 8 11 40 15% (12/80) 93.75% (75/80) 91.25% (73/80) 88.75% (71/80) 17 78 76 51 60 12 15 13 20 60 12.5% (15/120) 93.33% (112/120) 92.5% (111/120) 89.16% (107/120) 22 178 149 120 90 19 19 19 23 90 6.67% (12/180) 8.33% (15/180) 89.44% (161/180) 83.89% (151/180) 34 24 273 248 Theo kết quả trong các Bảng 3 và Bảng 4, khi ảnh không được chia thành các khối nhỏ thì hiệu suất nhận dạng rất cao nhưng thời gian tính toán giải thuật ICA và thời gian thuật toán huấn luyện trong mạng ANN là rất lớn, không phù hợp cho các ứng dụng trong thời gian thực. Khi ảnh được chia thành 4 khối, mỗi khối có kích thước là 50x50 thì hiệu suất nhận dạng không tốt như khi không chia khối, nhưng thời gian tính toán ICA và thời gian thuật toán huấn luyện hội tụ được giảm đáng kể. Kết quả nhận dạng đạt được tốt nhất khi giải thuật ICA với số chiều là 50. Bảng 5 cho thấy sự so sánh ngắn gọn về hiệu quả dựa trên tỷ lệ nhận dạng giữa phương pháp đề xuất của chúng tôi và một số phương pháp khác nhau trong các bài báo đã công bố. Các phương pháp này bao gồm Daugman [9], Tisse [5], Li Ma [12] và Chirchi [18]. Bảng 5. Bảng so sánh với các phương pháp khác Phương pháp Tỷ lệ nhận dạng (%) Daugman [9] 99.37 Tisse [5] 96.61 Li Ma [12] 94.33 Chirchi [18] 99.75 Phương pháp đề xuất 97.5 LÊ TIẾN THƯỜNG và cộng sự TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN 13 Từ kết quả, phương pháp của Daugman có hiệu suất tốt nhất, trong khi hệ thống đề xuất cho kết quả tốt hơn khi so sánh với các phương pháp của Tisse, Li Ma. Vì vậy, hệ thống đề xuất chứng minh hiệu quả khi so sánh các phương pháp tiếp cận khác. Trong nghiên cứu gần đây [18], không có đề cập đến thời gian xử lý của phương pháp cũng như số lượng người nhận diện để có thể so sánh thời gian xử lý giữa hai phương pháp. Mặc dù hiệu quả nhận dạng không cao lắm so với phương pháp trong tài liệu [18] nhưng hiệu suất của phương pháp nhận dạng mống mắt dùng ANN và ICA vẫn chấp nhận được với thời gian xử lý nhanh và có thể được kết hợp vào ứng dụng thời gian thực. 4. Kết luận Bài nghiên cứu đã đưa ra một phương pháp hiệu quả cho hệ thống nhận dạng mống mắt. Sau quá trình chuẩn hóa, hình ảnh với kích thước 100x100 được chia thành 4 khối hình ảnh nhỏ trước khi trích xuất đặc trưng. Mỗi khối nhỏ được trích xuất đặc trưng bằng cách sử dụng thuật toán ICA. Bằng cách chia hình ảnh thành các khối nhỏ, thời gian tính toán ICA được giảm xuống đáng kể. Các thành phần độc lập này phản ánh thông tin chi tiết của mống mắt (như tàn nhang, dải, rãnh,) thay đổi, phân bố của nó cho thấy sự khác biệt cá nhân của mống mắt đối với mỗi người. Sau đó, các đặc trưng mống mắt này đã được phân loại và nhận dạng theo mô hình mạng neuron nhân tạo (ANN). Các mô hình ANN khác nhau được xây dựng và được huấn luyện với 10 thuật toán khác nhau để đạt được mô hình ANN tối ưu. Kết quả đạt được khi thực hiện với cơ sở dữ liệu CASIA. Tỷ lệ nhận dạng của phương pháp này là 97,5%. Đặc biệt, so sánh giữa hệ thống đề xuất và các phương pháp của Tisse, Li Ma, Boles đã được làm để chứng minh hiệu quả của phương pháp nhận dạng mống mắt dùng ANN và ICA đề xuất. Trong tương lai, hệ thống nhận dạng mống mắt cần phải được phát triển để thực hiện trên phần cứng và trong thời gian thực để trở thành một ứng dụng phổ biến. LỜI CẢM ƠN Các tác giả cảm ơn khoa Điện-Điện tử trường Đại học Bách Khoa TP.Hồ Chí Minh đã hỗ trợ tài chính và hướng dẫn để hoàn thành thành công nghiên cứu này. TÀI LIỆU THAM KHẢO 1. A. Albadarneh, J. Alquatawna, Iris recognition System for Secure Authentication Based on Texture and Shape Features Pro.IEEE Jordan Conf. Applied Electrical Engineering and Computer Technologies (2015). 2. Anil K.Jain, R. Bolle, S.Pankanti, Biometrics Personal Identification in Networked Society, Kluwer Academic Publishers (2002), New York, Boston, Dordrecht, London, Moscow, ISBN 0-306- 47044-6.G. 3. CASIA Iris database - ser.do?id= 4. Cherabit, F.Z.Chelali, A.Djeradi, Circular Hough Transform for Iris localization, Science and Technology (2012), 2(5): 114- 121, DOI: 10.5923/j.scit.20120205.02. 5. Christel-Loic Tisse, Lionel Torres, Michel Robert Personal Identification Technique Using Human Iris Recognition, Proceeding of the 15th International Conference on Vision interface (2002). 6. Ethem Alpaydin, Introduction to Machine Learning, The MIT Press, Cambridge, Massachusetts, London, England (2004), ISBN 0-262-01211-1. SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 61 (01/2019) 14 7. G. Supriya, S. Halvi, N. T. Deshpande, Efficient Iris Recognition by Fusion of Matching Scores obtained by Lifting DWT and Log-Gabor methods of Feature Extraction, International Journal of Applied Research (2015). 8. H. Zang, V. M. Patel, M. E. Fathy and R. Chellapa, Touch Gesture Based Active User Authentication Using Dictionaries, Proc. IEEE Winter Conf. Applications of Computer Vision, (2015, pp 207-214). 9. J.Daugman, Statistical richness of visual phase information: Update on recognizing persons by iris patterns, International Journal of Computer Vision, (Vol 45, No. 1, pp. 25-38, 2001). 10. J.Yang, L.Nanni, State of the Art in Biometrics, Published by InTech (2011), ISBN 978-953-307-307-489-4. 11. K.I.Kim, K.Jung, H.J.Kim, Face recognition using kernel principal component analysis. IEEE Signal Process Letters, (Vol. 9, No. 2, pp. 40-42, Feb. 2002). 12. L.Ma, Y.H.Wang, T.N.Tan, Iris recognition based on multichannel Gabor filtering. Proceedings of the Fifth Asian Conference on Computer Vision (ACCV2002), Australia (pp. 279-283, Jan. 2002). 13. P.Daniel Rana, G. Neelima Image Segmentation by using Histogram Thresholding, IJSET (|January 2012| Vol 2, Issue 1, 776- 779), ISSN: 2231-0711. 14. Roman Swiniarski, Experiment on human iris recoginition using error backpropagation artificial neural network, San Diego State University, April 2004M. Young, The Technical Writer’s Handbook. Mill Valley, CA: University Science, (1989). 15. R. Swiniarski, Independent Component Analysis, CS553 Class Notes, San Diego State University, (2004). 16. Shinyoung Lim, Kwanyong Lee, Okhwan Byeon, and Taiyun Kim, Efficient Iris Recognition through Improvement of Feature Vector and Classifier, ETRI Journal, Volume 23, Number 2, June 2001. 17. Sushikumar S.Salve, S.P.Narote, Iris Recognition Using SVM and ANN, (IEEE WISPNET 2016 conference), ISBN 978-1- 4673-9338-6/16/S31.00 18. V.R.E. Chirchi, L.M. Waghmare, Enhanced Isocentric Segmentor and Wavelet Rectangular Coder to Iris Segmentation and Recognition, International Journal of Intelligent Engineering and Systems, (Vol. 10, No. 3, pp. 1-10, 2017). 19. Yong Wang, Jiu-Qiang Han, Iris Recognition Using Independent Component Analysis, Proceedings of the Fourth International Conference on Machine Learning and Cybernetics, Guangzhou, (18-21 August 2005). Ngày nhận bài: 01/08/2018 Biên tập xong: 15/12/2018 Duyệt đăng: 20/01/2019
File đính kèm:
- nhan_dang_mong_mat_dung_phuong_phap_mang_neuron_nhan_tao_va.pdf