So sánh mô hình học sâu với các phương pháp học tự động khác để nhận dạng gai động kinh biểu hiện trên đối tượng bệnh nhân động kinh

Trong chẩn đoán lâm sàng bệnh động kinh bằng dữ liệu điện não (EEG), khả năng tự động phát hiện và

phân loại một cách chính xác các gai động kinh là hữu ích và rất có ý nghĩa về y học. Bài báo giới thiệu một

cách tiếp cận mới để phát hiện tự động gai động kinh (spike epilepsy). Hiện nay phân loại gai động kinh đã

được thực hiện dựa trên nhiều phương pháp kết hợp của các mô hình machine learning. Nghiên cứu này chỉ

ra một mô hình kết hợp mới mà cụ thể lấy deep learning làm tập con của machine learning để thực hiện

phân loại các gai động kinh dựa trên nguồn dữ liệu chuẩn đã có. Nghiên cứu cũng thực hiện mô hình thực

nghiệm với nhiều các mô hình học sâu khác để đánh giá khả năng ứng dụng mô hình trong việc phát hiện

gai động kinh. Kết quả thực nghiệm cho thấy mô hình xây dựng có độ chính xác cao (98,8%) so với các

nghiên cứu khác.

pdf 6 trang phuongnguyen 120
Bạn đang xem tài liệu "So sánh mô hình học sâu với các phương pháp học tự động khác để nhận dạng gai động kinh biểu hiện trên đối tượng bệnh nhân động kinh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: So sánh mô hình học sâu với các phương pháp học tự động khác để nhận dạng gai động kinh biểu hiện trên đối tượng bệnh nhân động kinh

So sánh mô hình học sâu với các phương pháp học tự động khác để nhận dạng gai động kinh biểu hiện trên đối tượng bệnh nhân động kinh
Tạp chí Khoa học và Công nghệ 145 (2020) 021-026 
21 
So sánh mô hình học sâu với các phương pháp học tự động khác để nhận 
dạng gai động kinh biểu hiện trên đối tượng bệnh nhân động kinh 
Comparison of Deep Learning Model with other Automatic Learning Models for Recognizing Spikes 
Expressed from Epilepsy Patients 
Lê Thanh Xuyến*, Nguyễn Đức Thuận 
Trường Đại học Bách khoa Hà Nội – Số 1, Đại Cồ Việt, Hai Bà Trưng, Hà Nội, Việt Nam 
Đến Tòa soạn: 10-02-2020; chấp nhận đăng: 25-09-2020 
Tóm tắt 
Trong chẩn đoán lâm sàng bệnh động kinh bằng dữ liệu điện não (EEG), khả năng tự động phát hiện và 
phân loại một cách chính xác các gai động kinh là hữu ích và rất có ý nghĩa về y học. Bài báo giới thiệu một 
cách tiếp cận mới để phát hiện tự động gai động kinh (spike epilepsy). Hiện nay phân loại gai động kinh đã 
được thực hiện dựa trên nhiều phương pháp kết hợp của các mô hình machine learning. Nghiên cứu này chỉ 
ra một mô hình kết hợp mới mà cụ thể lấy deep learning làm tập con của machine learning để thực hiện 
phân loại các gai động kinh dựa trên nguồn dữ liệu chuẩn đã có. Nghiên cứu cũng thực hiện mô hình thực 
nghiệm với nhiều các mô hình học sâu khác để đánh giá khả năng ứng dụng mô hình trong việc phát hiện 
gai động kinh. Kết quả thực nghiệm cho thấy mô hình xây dựng có độ chính xác cao (98,8%) so với các 
nghiên cứu khác. 
Từ khóa: Mạng nơron tích chập (CNN), học sâu (deep learning), học máy (machine learning), gai động kinh, 
các dạng sóng nhọn, tín hiệu điện não đồ (EEG). 
Abstract 
In the clinical diagnosis of epilepsy using EEG data, the ability to automatically detect and correctly classify 
epilepsy spikes is helpful and significant for medicines. The article introduces a new approach for automatic 
detection of spike. Currently, epilepsy classification has been progressed based on many combined 
methods of machine learning models. This study investigates a new combined model that specifically takes 
deep learning as a subset of machine learning to perform the classification of epilepsy based on existing 
standard data sources. The study also implements experimental models in other deep learning models to 
evaluate the applicability of the model in detecting epilepsy spikes. Experimental results show that the 
proposed model has high accuracy (98.8%) compared to other studies. 
Keywords: Convolutional Neural Network (CNN), deep learning, machine learning, spike epilepsy, pick, EEG 
Electroencephalogram (EEG) 
1. Đặt vấn đề* 
Deep learning là một lĩnh vực con của học máy 
(Machine learning). Các phương pháp học máy truyền 
thống (decision tree, logistic regression, naive bayes, 
support vector machine,...) [1] làm việc tốt nhờ có sự 
thiết kế các đặc trưng, các thuộc tính đầu vào của con 
người (Feature extraction). Machine learning sẽ tối ưu 
các trọng số của thuật toán để được kết quả dự đoán 
cuối cùng tốt nhất. Các phương pháp học máy cơ bản 
được triển khai dựa trên sự mô tả dữ liệu bằng các 
thuộc tính mà máy tính có thể hiểu được, đòi hỏi 
người thiết kế phải có sự hiểu biết nhất định trong lĩnh 
vực của bài toán đó, sau đó các thuộc tính được đưa 
qua thuật toán học nhằm tối ưu các trọng số của mô 
hình. Trái ngược với các phương pháp học máy truyền 
thống, Deep learning nỗ lực học các biểu diễn tốt nhất, 
*Địa chỉ liên hệ: Tel: (+84) 983519599 
Email: [email protected] 
tìm ra những đặc trưng tốt nhất của dữ liệu một cách 
tự động. Đầu vào cho các thuật toán deep learning có 
thể là dữ liệu thô. Lý do để deep learning trở nên vượt 
trội so với các phương pháp truyền thống là các thuộc 
tính được trích chọn một cách thủ công thường được 
xác định một cách rõ ràng. Việc học ra các thuộc tính 
được thực hiện dễ dàng và nhanh chóng hơn, linh 
hoạt hơn trong biểu diễn thông tin. Deep learning có 
thể học không giám sát (không cần dữ liệu có nhãn 
sẵn, từ chính dữ liệu thô) hoặc học có giám sát (với 
các nhãn đặc biệt như positive/negative). Một bộ não 
hoạt động tốt là nhờ vào các tín hiệu điện mà các tế 
bào thần kinh truyền cho nhau. Tuy nhiên ở bệnh 
nhân mắc chứng động kinh, các bộ phận của não có 
mức tín hiệu điện cao bất thường, làm gián đoạn chức 
năng thần kinh bình thường. Ứng dụng phương pháp 
học sâu trong xử lý tin hiệu sinh học để hiểu rõ hơn 
mối quan hệ giữa gai (spike) và cơn co giật (seizures) 
[2, 3]. Deep learning xứng đáng là một sáng tạo vượt 
bậc đầy tiềm năng của lĩnh vực trí tuệ nhân tạo, hứa 
Tạp chí Khoa học và Công nghệ 145 (2020) 021-026 
22 
hẹn sẽ làm thay đổi cách thức hoạt động trong ngành 
y tế (phân loại mẫu trong các xét nghiệm,..). 
Mô hình học sâu đặc biệt là mạng nơ-ron tích 
chập CNNs là mô hình được sử dụng phổ biến trong 
cộng đồng học máy cho hiệu quả trong các bài toán 
phân loại hình ảnh [4], phân loại văn bản và gần đây 
đã có nhiều nghiên cứu sử dụng mạng nơ-ron tích 
chập trong lĩnh vực tín hiệu sinh học [5] như phân tích 
Protein Zacharaki [6], phân tích ảnh y khoa [7]. Ưu 
điểm của CNN là tận dụng được tính năng trích chọn 
đặc trưng của lớp tích chập và bộ phân lớp được huấn 
luyện đồng thời. Ý tưởng học cùng lúc đặc trưng và 
bộ phân lớp có thể hỗ trợ với nhau trong quá trình 
huấn luyện và quá trình phân lớp tìm ra các tham số 
phù hợp với các véc-tơ đặc trưng tìm được từ lớp tích 
chập và ngược lại lớp tích chập điều chỉnh các tham số 
của lớp tích chập để cho các véc-tơ đặc trưng thu được 
là tuyến tính phù hợp với bộ phân lớp của lớp cuối 
cùng. 
Những gai và sóng nhọn thường gặp trong bản 
ghi EEG của bênh nhân động kinh. Các gai là những 
sóng có nền (cạnh đáy) hẹp có biên độ tương đối cao 
tạo cho sóng có hình dạng cao và hẹp với 1 đỉnh 
nhọn. Sóng nhọn có đáy hơi rộng một chút so với các 
gai nhưng cũng giống hệt, là điểm có hoạt động nền 
xảy ra cơn kich phát (seizure activy) phóng điện, hoạt 
động điện đồng bộ các đuôi gai (dendrites) của tế bào 
thần kinh. Các tiêu chuẩn xác định phóng điện dạng 
động kinh: điện thế cao, hình thái với gai: thời gian 
xuất hiện nhỏ hơn 70ms, sóng nhọn: 70-200ms, nền 
(background) bất thường, vị trí và trạng thái không 
giống như sự chuyển biến sinh lý thông thường [8]. 
Hình thái của gai rất đa dạng và phức tạp phụ thuộc 
vào bệnh nhân khác nhau giữa các bản ghi. Dạng 
phức hợp gai sóng (spikes and wave) và gai đặc trưng 
nhất có biên độ cao, chúng có thể xuất hiện đồng bộ 
(synchronously) và cân đối hai bên trong các bệnh 
động kinh toàn thể hóa (generalized epilepsies) hoặc 
khu trú trong bệnh động kinh cục bộ. Không có một 
định nghĩa rõ ràng về gai, hình thái của gai động kinh 
đa dạng và phức tạp thay đổi theo bệnh nhân [9]. 
Nhóm nghiên cứu qua bước tiền xử lý đã đề xuất bộ 
dữ liệu như hình 1. Gai động kinh có hình dạng của 
một đỉnh tín hiệu, việc tìm tất cả các đỉnh của hệ 
thống rất quan trọng để tìm các gai động kinh một 
cách chính xác. Một giá trị mẫu được so sánh với 2 
đỉnh gần nhất, nếu giá trị mẫu là lớn nhất được định 
nghĩa là đỉnh dương, giá trị mẫu nhỏ nhất là đỉnh âm. 
Sau khi chọn đỉnh các đỉnh nhỏ chắc chắn không phải 
là gai động kinh dược loại bỏ dựa trên các tiêu chí 
ngưỡng sau: khoảng cách giữa một cặp đỉnh liền kề 
nhỏ hơn, khoảng cách giữa cặp đỉnh liền kề trước và 
sau đó [10]. Bước xử lý đã giúp hệ thống nhận biết 
các cơn động kinh dễ dàng hơn trong một số lượng 
lớn các đỉnh phát sinh từ nhiễu không mong muốn 
như nhiễu EMG (với biên độ nhỏ) được loại bỏ. Một 
số gai động kinh thực tế trong tập dữ liệu nghiên cứu 
được mô tả trong Hình 1: 
Trong các công trình nghiên cứu trước, việc 
quan trọng không thể thiếu là lọc dữ liệu. Tín hiệu 
EEG gồm rất nhiều thành phần bên trong nó, phụ 
thuộc vào tình trạng sức khỏe của từng bệnh nhân, 
điển hình là các nhiễu artifacts bao gồm: ECG, EOG, 
EMG làm sai lệch và khó phát hiện được gai động 
kinh như mong muốn. Vì thế, việc đầu tiên của họ là 
lọc nhiễu để loại bỏ artifacts. Trong nghiên cứu này, 
tác giả không cần bất kỳ một phương pháp lọc nào, 
chỉ dùng dữ liệu thô (raw) để tiến hành vào quá trình 
phân loại. Vì thế, có thể nói đây là một ưu điểm, và 
lợi thế hơn khi không cần phải tìm hiểu những đặc 
điểm, đặc tính của các loại nhiễu để tiến hành loại bỏ 
chúng. Điều này sẽ giúp cho hệ thống hoạt động một 
cách nhanh hơn. 
Ứng dụng mô hình học sâu các công trình 
nghiên cứu từ trước đến nay chủ yếu chuyên sâu để 
phát hiện ra các cơn động kinh dựa vào các xung 
động kinh (epileptic seizures). Trong khi đó gai động 
kinh có thể xuất hiện trong bản ghi EEG lúc bệnh 
nhân tỉnh táo, các công trình nghiên cứu về gai động 
kinh còn rất ít. Năm 2016 Johansen và đồng nghiệp 
sử dụng kỹ thuật mới là mạng nơ ron tích chập 
(CNN) để phát hiện các dạng gai đông kinh, giá trị 
hiệu suất AUC đạt được của hệ thống là 0,947, tuy 
nhiên nghiên cứu này không đưa ra giá trị độ nhạy 
Sensitivity (SEN) 
Trong bài viết này, tác giả đề xuất huấn luyện 
mô hình mạng tích chập CNN để nhận dạng gai động 
kinh và so sánh hiệu quả của CNN với các giải thuật 
khác. 
2. So sánh các mô hình học sâu giải quyết bài toán 
tìm gai động kinh 
Trong các công trình nghiên cứu trước tác giả đã 
so sánh các thuật toán học máy phổ biến để tìm ra 
phương pháp tốt nhất cho bài toán phát hiện gai động 
kinh. Bài báo này vẫn tiếp tục ý tưởng đó bằng cách 
Hình 1. Mô tả bộ dữ liệu gai động kinh của 3 bệnh 
nhân (đánh dấu chấm: phần đỉnh, giữa, đáy) được sử 
dụng trong nghiên cứu 
Tạp chí Khoa học và Công nghệ 145 (2020) 021-026 
23 
thêm phương pháp CNN với nhiều ưu điểm hơn để 
đánh giá và lựa chọn phương pháp tối ưu. Mở rộng 
đầu vào biểu diễn dưới dạng đơn kênh trong phương 
pháp DBN thành đa kênh dưới dạng ten-xơ [11, 12] 
trong CNN để tính toán các thông số phát hiện gai 
động kinh. 
Mạng nơ-ron tích chập (CNNs) [13] là một mô 
hình học sâu có thể xây dựng được các hệ thống phân 
loại với độ chính xác cao. Ý tưởng của CNNs được 
lấy cảm hứng từ khả năng nhận biết thị giác của bộ 
não người. Để có thể nhận biết được các hình ảnh 
trong vỏ não người có hai loại tế bào là tế bào đơn 
giản và tế bào phức tạp [14]. Các tế bào đơn giản 
phản ứng với các mẫu hình dạng cơ bản ở các vùng 
kích thích thị giác và các tế bào phức tạp tổng hợp 
thông tin từ các tế bào đơn giản để xác định các mẫu 
hình dạng phức tạp hơn. Khả năng nhận biết các hình 
ảnh của não người là một hệ thống xử lý hình ảnh tự 
nhiên đủ mạnh và tự nhiên. CNNs được phát triển 
dựa trên ba ý tưởng chính: tính kết nối cục bộ (Local 
connectivity, compositionality), tính bất biến 
(Location invariance) và tính bất biến đối với quá 
trình chuyển đổi cục bộ (Invariance to local 
transition) [15]. CNNs là một dạng mạng nơ-ron 
chuyên dụng để xử lý các dữ liệu dạng lưới 1 chiều 
như dữ liệu âm thanh, dữ liệu MGE hoặc nhiều chiều 
như dữ liệu hình ảnh. Các lớp cơ bản trong một mạng 
CNN bao gồm: Lớp tích chập (Convolutional), Lớp 
kích hoạt phi tuyến ReLU (Rectified Linear Unit), 
Lớp lấy mẫu (Pooling) và Lớp kết nối đầy đủ (Fully-
connected), được thay đổi về số lượng và cách sắp 
xếp để tạo ra các mô hình huấn luyện phù hợp cho 
từng bài toán. 
Lớp tích chập (Convolution) Tích chập được sử 
dụng trong xử lý số tín hiệu theo nguyên lý biến đổi 
thông tin, có thể áp dụng kĩ thuật này vào xử lý ảnh 
và video số. Trong lớp tích chập sử dụng các bộ lọc 
có kích thước nhỏ hơn với ma trận đầu vào, áp lên 
một vùng của ma trận đầu vào và tiến hành tính tích 
chập giữa bộ lọc (filter) và giá trị của ma trận trong 
vùng cục bộ đó. Các filter sẽ dịch chuyển một bước 
trượt (Stride) chạy dọc theo ma trận đầu vào và quét 
toàn bộ ma trận. Trọng số của filter ban đầu sẽ được 
khởi tạo ngẫu nhiên và sẽ được học dần trong quá 
trình huấn luyện mô hình. 
Lớp phi tuyến Relu (Rectified linear unit) Giả sử 
mạng CNNs có L lớp có lớp input là lớp thứ 0. Mạng 
sẽ có L ma trận trọng số w được ký hiệu là l∈ 

()×
 , = 1,2 trong đó W l là các kết nối từ lớp 
thứ l-1 đến lớp thứ l, phần tử   thể hiện kết nối 
của nơ-ron thứ i của lớp (l-1) đến nơ-ron thứ j của lớp 
l. Các bias thứ (l) được ký hiệu là  l ∈ 
()
. Để thực 
hiện phân lớp có kết quả tối ưu là quá trình đi tìm bộ 
tham số w và b. Mỗi nơ-ron không phải lớp input 
được tính bằng công thức: 

()
= (
() () + 
 (1) 
f là một hàm kích hoạt phi tuyến được áp dụng 
cho một ma trận. Trong kiến trúc mạng CNNs thường 
sử dụng hàm kích hoạt f(x) = max (0, x) chuyển toàn 
bộ giá trị âm trong kết quả lấy từ lớp tích chập thành 
giá trị 0 để tạo tính phi tuyến cho mô hình gọi là 
Relu. Ngoài ra còn có nhiều hàm kích hoạt khác như 
signmod, tang nhưng hàm relu dễ cài đặt tính toán 
nhanh và hiệu quả [16]. 
 Lớp lấy mẫu (Pooling) sử dụng một cửa số trượt 
quét qua toàn bộ ma trận dữ liệu theo một bước trượt 
cho trước để tiến hành lấy mẫu. Các phương thức lấy 
phổ biến trong lớp Pooling là MaxPooling (lấy giá trị 
lớn nhất), MinPooling (lấy giá trị nhỏ nhất) và 
AveragePooling (lấy giá trị trung bình). Công dụng 
của lớp Pooling dùng để giảm kích thước dữ liệu, các 
tầng trong CNNs chồng lên nhau có lớp Pooling ở 
cuối mỗi tầng giúp cho kích thước dữ liệu được co lại 
nhưng vẫn giữ được các đặc trưng để lấy mẫu. Giảm 
kích thước dữ liệu sẽ giảm số lượng tham số của 
mạng tăng tính hiệu quả và kiểm soát hiện tượng học 
vẹt (Overfiting). 
 Lớp kết nối đầy đủ (Fully connect layer) Lớp 
kết nối đầy đủ là một lớp giống như mạng nơ-ron 
truyền thẳng các giá trị được tính toán từ các lớp 
trước sẽ được liên kết đầy đủ vào trong nơ-ron của 
lớp tiếp theo. Tại lớp kết nối đầy đủ sẽ tiến hành phân 
lớp dữ liệu bằng cách kích hoạt hàm softmax để tính 
xác suất ở lớp đầu ra. 
Mạng học sâu cho nhận dạng gai động kinh, 
mạng bắt đầu với 1 loạt các tế bào thần kinh 
tương ứng 28x28 pixel của ảnh đầu vào, 784 tế 
bào thần kinh, mỗi tế bào đại diện cho giá trị màu 
xám của điểm ảnh tương ứng, từ 0 (đối với pixel đen) 
đến 1 (đối với pixel trắng), tất cả 784 các tế bào thần 
kinh tạo nên lớp đầu tiên của mạng nơ-ron. Lớp cuối 
cùng, lớp này có 10 tế bào thần kinh, mỗi tế bào đại 
diện cho một số tương ứng từ (7-17), giá trị kích hoạt 
của các tế bào thần kinh là một số 0&1. Mô hình thực 
nghiệm với phương pháp học sâu phân loại gai động 
kinh (hình 1). 
Mô hình phân loại đa lớp sử dụng hàm sotfmax 
[17], cần có một hàm sao cho mỗi giá trị đầu vào x, ai 
thể hiện xác suất mà nó rơi vào phân lớp thứ i với 
điều kiện: 
 ∑ (|) = 1 (2) 
nếu zi = wTi x càng lớn thì xác suất rơi vào lớp 
thứ i càng cao, nghĩa là cần một hàm đồng biến. z có 
thể nhận giá trị dương hoặc âm, để đảm bảo z dương 
Tạp chí Khoa học và Công nghệ 145 (2020) 021-026 
24 
và đồng biến ta cho exp(zi ) = ez I . Sử dụng nhiều 
hàm sigmoid cho bài toán phân loại đa lớp, như vậy: 
∑ (|) ≠ 1 (3) 
ta muốn đầu ra của mạng như là xác suất để đầu ra là 
của một lớp, ta sử dụng một hàm kích hoạt sum-to-
one: softmax 
ai =
 ( )
∑  ( )


 ∀i = 1,2  C (4) 
Khi zi quá lớn, việc tính exp(zi) thường gặp hiện 
tượng tràn số. Ta có thể khắc phục như sau: 
()
∑ 


= 
( ) ()
( ) ∑ 


=
()
∑  ()


 (5) 
với c là một hằng số bất kỳ, thông thường c=max(zi) 
3. Kết quả mô phỏng và đánh giá 
Mô hình thực nghiệm để đánh giá kết quả đưa ra 
CNN là tốt hơn các phương pháp trước DBN do đầu 
vào đã được đa kênh hóa và nhờ việc dùng các lớp 
Convolutional đưa ra kết quả chính xác hơn. Đề xuất 
giao thức mô hình Deep Learing cho phân loại gai 
động kinh trong các bản ghi điện não đồ (EEG) như 
hình 2. 
Hình 3(a) gai động kinh biểu diễn gai động kinh 
theo thời gian. Hình 3(b) gai động kinh trong 10 
thang tỉ lệ của phép biến đổi sóng con, 3D wavelet ở 
các scale từ 0 đến 10. Hình 3(c), năng lượng của mỗi 
hệ số biến đổi sóng con trong 10 thang tỉ lệ, biểu diễn 
giá trị hình ảnh. 
Kết quả chạy thử nghiệm trên các mô hình đưa ra kết 
quả so sánh hiệu suất giữa CNN và các mô hình học 
máy khác như bảng 1. Kết quả cho thấy rằng SPE của 
CNN có độ chính xác cao nhất (98,89%). 
Hình 2. Mô hình thực nghiệm với phương pháp học sâu phân loại gai động kinh 
Hình 3. Mình họa các scale của biến đổi sóng con một gai động kinh trong 219ms (tương đương với 56 mẫu dữ 
liệu)
(a) (b) (c) 
Tạp chí Khoa học và Công nghệ 145 (2020) 021-026 
25 
Bảng 1. Bảng so sánh hiệu suất model CNN và các 
model học khác 
Model SEN SPE AUC 
CNN 88.45% 98.89% 0.9798 
DBN 87.35% 97.89% 0.9597 
ANN 65.74% 91.72% 0.8918 
SVM 58.64% 92.53% 0.8815 
kNN 28.40% 95.42% 0.8058 
Bệnh động kinh khá nguy hiểm nhưng xác suất 
mắc bệnh của loại bệnh này đối với tỷ lệ dân số là rất 
thấp chẳng hạn 1:10000. Một người có các biểu hiện 
bệnh động kinh và thực hiện các xét nghiệm. Sau khi 
xem kết quả sẽ có giả định rằng bác sĩ kết luận sai. 
Khi đó có 2 khả năng xảy ra: Loại I: Bản thân bệnh 
nhân hoàn toàn bình thường, khi đo EEG bác sĩ kết 
luận bệnh nhân bị động kinh, Loại II: Bệnh nhân bị 
động kinh trong bản ghi EEG không có nhưng bác sĩ 
kết luận hoàn toàn bình thường. Rõ ràng sai lầm loại 
II gây ra hậu quả lớn hơn vì bệnh nhân không phát 
hiện sớm bệnh của mình để điều trị kịp thời sẽ dẫn 
đến bệnh phát triển xấu đi. Sai lầm loại I có ảnh 
hưởng tới chi phí khám chữa bệnh nhưng không ảnh 
hưởng đến sức khỏe và hậu quả là ít nghiêm trọng 
hơn. Một số phương pháp xử lý tín hiệu hỗ trợ nhận 
biết gai động kinh bằng kĩ thuật xử lí tín hiệu tiên tiến 
nhằm tăng tính khách quan và độ chính xác về mặt tín 
hiệu. Điều đó cho phép biết bệnh nhân có bị động 
kinh hay không, giảm tối thiểu tình trạng cảnh báo giả 
như loại II. Tác giả đã đưa ra tiềm năng mới của hệ 
thống học sâu, ứng dụng công nghệ mới cho bài toán 
nhận dạng gai động kinh xuất hiện trong các bản ghi 
EEG. Có nhiều tiêu chí được sử dụng để đánh giá 
hiệu suất của một hệ thống phân loại gai động kinh, 
các tham số đánh giá sau: Accuracy (ACC), 
Sensitivity (SEN), Specificity (SPE), Selectivity 
(SEL) được dùng một cách phổ biến đưa ra những 
nhận xét khá tổng quan và chi tiết [4,15-117]. Sử 
dụng bộ tham số đánh giá này để kiểm tra chất lượng 
của hệ thống phân loại tín hiệu gai động kinh. Đánh 
giá một mô hình phân loại theo các tham số sau: tính 
toán độ nhạy (SEN), độ chọn lọc (SEL), độ đặc hiệu 
(SPE), hiệu suất của hệ thống (ACC) của CNN là tốt 
hơn. Các mô hình học máy đã được đánh giá chi tiết 
ở Bảng 1. 
Độ nhạy, tính chọn lọc, tính đặc hiệu và độ 
chính xác, đó là biện pháp thống kê điển hình trong 
học máy và khoa học máy tính, được tác giả sử dụng 
để đánh giá chất lượng của hệ thống phát hiện gai 
động kinh. Qua hai hướng đánh giá trực quan và 
thống kê, cho thấy mạng CNN chuyển sang mô hình 
phân loại thực sự có khả năng tìm kiếm gai động kinh 
rất đáng mong đợi. 
Ngoài ra, để trực quan hóa kết quả đánh giá, như 
hình 2.(a) (b) tác giả sử dụng đường cong ROC 
(Receiver Operating Curve) để mô tả chất lượng của 
hệ thống khi sử dụng các ngưỡng phân loại khác 
nhau, biểu đồ MSE (mean square error) cho biết tỉ lệ 
sai lệch. Kết quả phân loại tốt hơn khi hệ số MSE cho 
toàn bộ tập testing rất nhỏ khoảng 10-7, trong khi đó 
đường ROC cũng cho thấy phần diện tích (AUC) 
dưới đường cong tiệm cận tới 1, hệ thống chỉ phải trả 
giá tỉ lệ dự đoán sai rất thấp khi muốn tăng tỉ lệ đoán 
đúng lên. Lấy ý tưởng từ bộ não sinh học, các mô 
hình học sâu xây dựng các thuật toán giúp máy suy 
nghĩ và xử lý thông tin giống như bộ não con người 
[18]. Nhờ có nhiều lớp thần kinh nhân tạo hơn học 
máy, học sâu sẽ có khả năng tự học và nhận diện 
nhiều vấn đề có cấp độ phức tạo hơn. Học sâu cho 
phép máy tính tự động hiểu, xử lý và học từ dữ liệu 
để thực thi nhiệm vụ được giao, cũng như cách đánh 
giá, giúp tăng tính hiệu quả [19]. 
Ứng dụng các thuật toán của phương pháp học 
sâu để giải quyết bài toán phát hiện và phân loại gai 
động kinh, đối tượng bệnh nhân là người Việt nam. 
Hình 4. Đánh giá chất lượng hệ thống CNN 
Tạp chí Khoa học và Công nghệ 145 (2020) 021-026 
26 
4. Kết luận 
Trong bài báo này chúng tôi đã áp dụng mô hình 
học sâu để phân loại gai động kinh dùng thực nghiệm 
theo trình tự sau. Bước 1, xây dựng cơ sở dữ liệu 
(CSDL) cho các bản ghi EEG. Bước 2, tiền xử lý ảnh 
trong CSDL (lọc nền) và gán nhãn. Hai bước đầu tiên 
này chỉ cần thực hiện một lần khi xây dựng bộ CSDL 
ảnh huấn luyện cho phương pháp học máy truyền 
thống. Bước 3, thực hiện các bước tính toán cần thiết 
để ứng dụng mô hình CNN. Bước 4, huấn luyện mô 
hình nhận dạng gai động kinh từ CSDL ảnh đã xây 
dựng. Bước 5, thống kê độ chính xác, kết quả có thể 
thấy độ chính xác đạt được là rất cao ~98.8%, vượt 
trội so với với độ chính xác của mô hình huấn luyện 
sử dụng phương pháp học máy truyền thống. 
Các kết quả nghiên cứu từ thực nghiệm đã cho 
thấy tính hiệu quả của mô hình học sâu trong việc 
phát hiện gai động kinh. 
Lời cảm ơn 
Tác giả bài báo xin chân thành cám ơn sự hỗ trợ 
khoa học từ nhóm nghiên cứu thuộc trường Đại học 
công nghệ Đại học quốc gia Hà Nội mã số CN.16.07. 
Giúp đỡ về ý tưởng khoa học của PGS.TS. Nguyễn 
Linh Trung. Bộ dữ liệu EEG dùng trong bài báo là 
một phần cơ sở dữ liệu động kinh EEG được xây 
dựng trong khuôn khổ dự án QG 10.40 do Việt nam 
tài trợ trường Đại học quốc gia Hà Nội. 
Tài liệu tham khảo 
[1] C. D. A. Vanitha, D. Devaraj, and M. Venkatesulu, 
Gene expression data classification using support 
vector machine and mutual information-based gene 
selection, Procedia Comput. Sci., vol. 47, pp. 13–21, 
2015. 
[2] Chung JE, Magland JF, Barnett AH, Tolosa VM, 
Tooker AC, Lee KY, Shah KG, Felix SH, Frank LM, 
Greengard LF, A Fully Automated Approach to 
Spike Sorting, Neuron (2017). 
[3] Rossant C, Kadir SN, Goodman DFM, Schulman J, 
Hunter MLD, Saleem AB, Grosmark A, Belluscio M, 
Denfield GH, Ecker AS, Tolias AS, Solomon S, 
Buzsaki G, Carandini M, Harris KD. Spike sorting 
for large, dense electrode arrays, Nature 
Neuroscience (2016): 634-641. 
[4] Fakoor R, Ladhak F, Nazi A et al. Using deep 
learning to enhance cancer diagnosis and 
classification, Proceedings of the International 
Conference on Machine Learning. 2013. 
[5] Y. Kim, Convolutional neural networks for sentence 
classification, 2014. 
[6] E. I. Zacharaki, Prediction of protein function using a 
deep CNN ensemble, PeerJ Prepr, 2017. 
[7] S. Min, B. Lee, and S. Yoon, Deep learning in 
bioinformatics, Brief. Bioinform, 2016. 
[8] Stallkamp, Johannes, et al. The German Traffic Sign 
Recognition Benchmark: A multi-class classification 
competition. Neural Networks (IJCNN), The 2011 
International Joint Conference on Neural Networks. 
San Jose, CA, USA: IEEE, 2011. 
[9] Gotman, J. and Gloor, P. (1976), Automatic 
recognition and quantification of interictal epileptic 
activity in the human scalp EEG, Electroenceph. 
Clin. Neu-rophysiol 41, 513-529 
[10] Le Trung Thanh, Nguyen Thi Anh-Dao, Viet-Dung 
Nguyen, Nguyen LinhTrung, and Karim Abed-
Meraim, Multi-channel EEG epileptic spike 
detection by a new method of tensor decomposition, 
Journal of Neural Engineering (major revise). 
[11] Martin Abadi et al., TensorFlow: Large-Scale 
Machine Learning on Heterogeneous Systems. 2015. 
[12] Q. Li, W. Cai, et al., Medical image classification 
with convolutional neural network in Control 
Automation Robotics & Vision (ICARCV) 2014. 
[13] Y. LeCun, Y. Bengio, and G. Hinton, Deep learning 
Nature, vol. 521, no. 7553, pp. 436–444, 2015Anal. 
[14] Stallkamp, Johannes, et al. The German Traffic Sign 
Recognition Benchmark: A multi-class classification 
competition, Neural Networks (IJCNN), The 2011 
International Joint Conference on Neural Networks. 
San Jose, CA, USA: IEEE, 2011. 
[15] Kelley DR, Snoek J, Rinn J. Basset: Learning the 
regulatory code of the accessible genome with deep 
convolutional neural networks. bioRxiv 
2015:028399. 
[16] Le Thanh Xuyen et al. VNU Journal of Science: 
Comp. Science & Com. Eng., Vol. 33, No. 2 (2017) 
1-13 
[17] Ali Shoeb, Herman Edwards, Jack Connolly, Blaise 
Bourgeois, S. Ted Treves, John Guttag. Patient-
Specific Seizure Onset Detection. Epilepsy and 
Behavior. August 2004, 5(4): 483-498. 
[doi:10.1016/j.yebeh.2004.05.005] 
[18] E. I. Zacharaki, Prediction of protein function using a 
deep CNN ensemble PeerJ Prepr, 2017. 
[19] Y. Kim, Convolutional neural networks for sentence 
classification, 2014. 

File đính kèm:

  • pdfso_sanh_mo_hinh_hoc_sau_voi_cac_phuong_phap_hoc_tu_dong_khac.pdf