Kết quả bước đầu của ứng dụng trí tuệ nhân tạo trong phát hiện polyp đại tràng tại Việt Nam

Từ 11/2019 đến 06/2020, nhóm tác giả thu thập 8.190 ảnh nội soi đại tràng (NSĐT) có polyp và 4.000 ảnh

NSĐT không polyp, chia thành tập huấn luyện và tập kiểm chứng nhằm xây dựng mô hình AI. Mô hình học sâu

đề xuất được xây dựng theo kiến trúc U-Net với nhánh EfficientNet, huấn luyện trong 150 bước với thuật toán

SGD và đánh giá bởi chỉ số F1, giá trị dự đoán dương tính (PPV), độ nhạy (Se), độ đặc hiệu (Sp). Kết quả trên

tập kiểm chứng cho thấy chỉ số F1 trên 2 tập ảnh khi hội tụ đạt > 95 %. Kết quả kiểm định thuật toán trên tập

thực nghiệm (1.321 ảnh với 1.543 polyp) là PPV (94,60%), Se (96,39%) và Sp (99,84%). Trong tổng số 1543

polyp, 63,58% có kích thước < 5="" mm="" và="" 81,14%="" thuộc="" nhóm="" is="" (phân="" loại="" paris).="" 52="" vùng="" bị="" khoanh="" sai="" do="">

có bọt, vùng lóa hoặc dịch nhầy. Các vùng bị nhầm chủ yếu là nếp niêm mạc (44,23%) và dịch nhầy (13,46%).

Nghiên cứu cho thấy thuật toán xây dựng trong phát hiện polyp đại tràng có PPV, Se, Sp cao và có tính khả thi

pdf 10 trang phuongnguyen 80
Bạn đang xem tài liệu "Kết quả bước đầu của ứng dụng trí tuệ nhân tạo trong phát hiện polyp đại tràng tại Việt Nam", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Kết quả bước đầu của ứng dụng trí tuệ nhân tạo trong phát hiện polyp đại tràng tại Việt Nam

Kết quả bước đầu của ứng dụng trí tuệ nhân tạo trong phát hiện polyp đại tràng tại Việt Nam
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020 101
KẾT QUẢ BƯỚC ĐẦU CỦA ỨNG DỤNG TRÍ TUỆ NHÂN TẠO 
TRONG PHÁT HIỆN POLYP ĐẠI TRÀNG TẠI VIỆT NAM 
Đào Việt Hằng1,2,3, , Lê Quang Hưng², Nguyễn Phúc Bình¹, Nguyễn Mạnh Hùng¹
Lâm Ngọc Hoa¹, Đào Văn Long1,2,3, Nguyễn Thị Thủy⁴, Đinh Viết Sang⁵, Vũ Hải⁶
1Viện Nghiên cứu và Đào tạo Tiêu hóa, Gan mật
²Bộ môn Nội tổng hợp,Trường Đại học Y Hà Nội
³Trung tâm Nội soi, Bệnh viện Đại học Y Hà Nội
⁴Học viện Nông nghiệp Việt Nam
⁵Trường Đại học Bách khoa Hà Nội
⁶Công ty cổ phần công nghệ VDSense
Từ 11/2019 đến 06/2020, nhóm tác giả thu thập 8.190 ảnh nội soi đại tràng (NSĐT) có polyp và 4.000 ảnh 
NSĐT không polyp, chia thành tập huấn luyện và tập kiểm chứng nhằm xây dựng mô hình AI. Mô hình học sâu 
đề xuất được xây dựng theo kiến trúc U-Net với nhánh EfficientNet, huấn luyện trong 150 bước với thuật toán 
SGD và đánh giá bởi chỉ số F1, giá trị dự đoán dương tính (PPV), độ nhạy (Se), độ đặc hiệu (Sp). Kết quả trên 
tập kiểm chứng cho thấy chỉ số F1 trên 2 tập ảnh khi hội tụ đạt > 95 %. Kết quả kiểm định thuật toán trên tập 
thực nghiệm (1.321 ảnh với 1.543 polyp) là PPV (94,60%), Se (96,39%) và Sp (99,84%). Trong tổng số 1543 
polyp, 63,58% có kích thước < 5 mm và 81,14% thuộc nhóm Is (Phân loại Paris). 52 vùng bị khoanh sai do ảnh 
có bọt, vùng lóa hoặc dịch nhầy. Các vùng bị nhầm chủ yếu là nếp niêm mạc (44,23%) và dịch nhầy (13,46%). 
Nghiên cứu cho thấy thuật toán xây dựng trong phát hiện polyp đại tràng có PPV, Se, Sp cao và có tính khả thi. 
I. ĐẶT VẤN ĐỀ
Từ khóa: Nội soi đại tràng, polyp đại tràng, phát hiện polyp, trí tuệ nhân tạo, học sâu.
Polyp đại trực tràng (ĐTT) là một mô phát 
triển đẩy lồi niêm mạc ĐTT. Trong đó, polyp u 
tuyến có nguy cơ cao trở thành ung thư. Khoảng 
85% ung thư đại trực tràng phát triển từ một 
polyp u tuyến (adenoma).¹ Việc phát hiện polyp 
ĐTT, đặc biệt là adenoma để cắt qua nội soi 
đóng vai trò quan trọng trong phòng ngừa ung 
thư ĐTT. Theo các nghiên cứu, tỷ lệ bỏ sót polyp 
đại tràng (polyp miss rate - PMR) đặc biệt là các 
adenoma (adenoma miss rate – AMR) tương 
đối cao, có thể dao động từ 20 – 47%.2-4 Trong 
khi đó, một nghiên cứu theo dõi trên 314872 
ca nội soi đại tràng toàn bộ ghi nhận mỗi 1% 
tỷ lệ phát hiện adenoma (adenoma detection 
rate – ADR) tăng làm giảm được 3% nguy cơ 
tiến triển thành ung thư ĐTT.⁵ Hiện tại, có nhiều 
kỹ thuật mới đã được áp dụng với mong muốn 
cải thiện tỷ lệ ADR: sử dụng các công nghệ nội 
soi tăng cường hình ảnh, dây soi với góc mở 
vi trường rộng hoặc các thiết bị như Endocuff 
để quan sát được phía sau các nếp niêm mạc 
v.v... Ứng dụng công nghệ thông tin đặc biệt là 
xây dựng các thuật toán trí tuệ nhân tạo trong 
hỗ trợ phát hiện polyp đại trực tràng để đưa ra 
Tác giả liên hệ: Đào Việt Hằng, 
Trường Đại học Y Hà Nội
Email: [email protected]
Ngày nhận: 17/07/2020
Ngày được chấp nhận: 13/08/2020
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020102
dự đoán cũng là một hướng đi mới được tập 
trung phát triển trong những năm gần đây trên 
thế giới. Một số nghiên cứu hồi cứu đã ghi nhận 
tiềm năng hứa hẹn của AI trong việc hỗ trợ phát 
hiện polyp đại trực tràng với tỷ lệ dự đoán chính 
xác có thể lên đến 94 – 96%.6-8
Tại Việt Nam, theo GLOBOCAN 2018, ung 
thư ĐTT có tỷ lệ mắc đứng hàng thứ 5 và tỷ lệ 
tử vong đứng hàng thứ 6 trong số các bệnh lý 
ác tính.⁹ Theo hướng dẫn của Hội Ung thư Hoa 
kỳ cũng như Bộ Y tế Việt Nam năm 2018, polyp 
ĐTT được coi là yếu tố nguy cơ của ung thư 
ĐTT và cần có tầm soát bằng nội soi đại tràng 
toàn bộ trên nhóm đối tượng có nguy cơ.10,11 
Điều này đặt ra nhu cầu cần tìm các giải pháp 
và xây dựng chương trình sàng lọc để phát 
hiện được sớm ung thư đại trực tràng, trong 
đó, phát hiện các tổn thương polyp trên nội 
soi chính là một khâu đóng vai trò quan trọng 
để tầm soát. Tại Việt Nam, đã có một số công 
trình nghiên cứu phát triển các thuật toán trí tuệ 
nhân tạo trong phân tích hình ảnh X-quang tim 
phổi, chụp cộng hưởng từ gan.12-14 Tuy nhiên 
hiện chưa có nghiên cứu về ứng dụng trí tuệ 
nhân tạo đặc biệt xây dựng các thuật toán học 
máy trong nội soi đường tiêu hóa dưới để đánh 
giá tiềm năng cũng như tính khả thi trong hoàn 
cảnh thực tế của nước ta. 
Vì vậy, nhóm nghiên cứu chúng tôi tiến hành 
nghiên cứu này với 2 mục tiêu chính: (1) xây 
dựng thuật toán học máy phát hiện polyp trên 
ảnh nội soi đại tràng toàn bộ và (2) bước đầu 
đánh giá độ chính xác của thuật toán.
II. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP
1. Đối tượng
Hình ảnh nội soi đại tràng toàn bộ được thu 
thập bằng hệ thống nội soi độ phân giải cao của 
Fujifilm (600, 7000 và LASEREO) ở các chế độ 
ánh sáng trắng (WLI) và chế độ phổ màu đa 
băng tần (FICE).
Tiêu chuẩn lựa chọn: Các hình ảnh thu thập 
phải đảm bảo đã được xóa toàn bộ thông tin 
định danh người bệnh, chất lượng hình ảnh 
rõ nét, không bị tối, mờ và mức độ sạch theo 
thang điểm Boston ≥ 2
Tiêu chuẩn loại trừ: hình ảnh nội soi đại tràng 
có các tổn thương phối hợp khác như ung thư 
đại trực tràng, Crohn, viêm loét đại tràng chảy 
máu, có tổn thương loét hoặc có chứa dụng cụ 
nội soi.
2. Phương pháp
Thời gian nghiên cứu: Từ tháng 11/2019 đến 
tháng 06/2020
Địa điểm nghiên cứu: Nghiên cứu được tiến 
hành tại Viện Nghiên cứu và Đào tạo Tiêu hóa, 
Gan mật.
Quá trình thu thập hình ảnh nội soi
Hình ảnh nội soi đại tràng sẽ được các 
chuyên gia là các bác sĩ nội soi > 5 năm kinh 
nghiệm chuẩn hóa, gán nhãn có polyp hay 
không và gán nhãn chế độ ánh sáng. Các 
chuyên gia cũng sẽ khoanh vùng polyp trên ảnh 
nội soi. 
Hình 1. Minh họa hình ảnh nội soi polyp đại tràng được bác sĩ khoanh vùng
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020 103
Ảnh sau khi được gán nhãn và đánh dấu 
sẽ được chuyển vào tập huấn luyện; trong đó, 
20% số ảnh được đưa vào tập kiểm chứng. 
Dựa trên dữ liệu ban đầu này, một mô hình 
mạng học sâu sẽ được xây dựng. 
Xây dựng thuật toán phát hiện polyp đại 
tràng 
Chúng tôi sử dụng mạng nơ-ron nhiều lớp 
dựa theo kiến trúc U-Net15 gồm hai phần: nhánh 
mã hóa (encoder) và nhánh giải mã (decoder). 
Nhánh mã hóa được thiết kế theo kiến trúc tích 
chập EfficientNet16 có nhiệm vụ trích xuất đặc 
trưng đa mức từ ảnh đầu vào. Kết quả của 
nhánh mã hóa được đưa vào nhánh giải mã 
để tiếp tục trích xuất đặc trưng ở mức cao hơn, 
đồng thời tăng dần độ phân giải về kích thước 
ảnh gốc ban đầu để sinh ra ảnh đánh dấu polyp 
(xem Hình 2). 
Hình 2. Minh họa kết quả dự đoán polyp và khoanh vùng của thuật toán
Đầu ra các lớp của nhánh mã hóa là các đặc 
trưng mức thấp được chuyển trực tiếp sang lớp 
tương ứng của nhánh giải mã qua các kết nối 
tắt. Nhờ vậy, thông tin giàu ngữ cảnh ở nhánh 
giải mã sẽ được kết hợp với các thông tin chi 
tiết ở mức thấp để hiệu chỉnh chính xác đường 
biên khoanh vùng polyp. Hàm mục tiêu được 
sử dụng là Tversky tiêu điểm.17 Mô hình được 
huấn luyện trong 150 bước (epoch) bằng thuật 
toán SGD với tốc độ học là 0.001 và hệ số quán 
tính 0.9. 
Đánh giá độ chính xác của thuật toán
Đầu tiên, chúng tôi đánh giá độ chính xác 
của thuật toán ở mức từng điểm ảnh trên tập 
huấn luyện và tập kiểm chứng. Thuật toán sẽ 
phải dự đoán từng điểm ảnh có thuộc vùng 
polyp hay không. Do sự mất cân bằng giữa số 
điểm ảnh polyp và số điểm ảnh không thuộc 
polyp nên chúng tôi sử dụng chỉ số F1 là bình 
quân điều hòa của giá trị dự báo dương tính 
(PPV) và độ nhạy (Se) để đánh giá hiệu năng 
của thuật toán. Chỉ số F1 có giá trị cao nhất là 
1, khi và chỉ khi PPV và Se là tuyệt đối.
Tiếp theo, chúng tôi sử dụng tập ảnh thực 
nghiệm khác để xác định độ chính xác của 
thuật toán ở mức phát hiện polyp khi so sánh 
với ý kiến chuyên gia (Bảng 1).
Các chỉ số ghi nhận trong nghiên cứu bao 
gồm chế độ ảnh (WLI, FICE), số lượng polyp 
trên ảnh, kích thước polyp và đặc điểm hình 
thái học polyp theo phân loại Paris (Bảng 2).
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020104
Bảng 1. Các độ đo đánh giá độ chính xác của thuật toán
Chỉ số Công thức Đánh giá câu hỏi
Độ nhạy (Se) A/(A+C) Khả năng của thuật toán để xác định ảnh chứa polyp
Độ đặc hiệu (Sp) D/(B+D) Khả năng của thuật toán để xác định ảnh không chứa polyp
Giá trị dự đoán dương
tính (PPV) A/(A+B) 
Xác suất một ảnh chứa polyp khi thuật 
toán dương tính
Giá trị dự đoán âm tính (NPV) D/(C+D) Xác suất một ảnh không chứa polyp khi thuật toán âm tính
Chỉ số F1 2*Se*PPV/ (Se+PPV)
Chỉ số kết quả chính xác của thuật toán ở 
mức điểm ảnh
*A: Số trường hợp dương tính thật; B: Số trường hợp dương tính giả; C: Số trường hợp âm tính 
giả; D: Số trường hợp âm tính thật
Bảng 2. Phân loại Paris
Type I: Các tổn thương lồi
Ip (pedunculated): tổn thương có cuống
Is (sessile): tổn thương không có cuống 
(nhô lên > 2,5 mm so với bề mặt)
Type II: Các tổn thương dạng 
phẳng
IIa (slightly elevated): nhô lên < 2,5 mm
IIb (true flat lesion): tổn thương phẳng
IIc (mildly depressed lesion): tổn thương lõm nhẹ trên bề mặt
Type III: Các tổn thương loét
III. KẾT QUẢ
Từ tháng 11/2019 đến tháng 06/2020, 
nghiên cứu thu thập được 8.190 hình ảnh nội 
soi đại tràng có polyp và 4.000 hình ảnh nội soi 
đại tràng không có polyp. Dữ liệu hình ảnh đã 
gán nhãn được chia làm hai bộ dữ liệu theo tỉ 
lệ 80% cho huấn luyện mạng và 20% cho quá 
trình kiểm chứng. Hình 2 minh họa kết quả dự 
đoán polyp và khoanh vùng của thuật toán.
Hình 3 mô tả độ chính xác của thuật toán 
tính theo chỉ số F1 trên bộ dữ liệu huấn luyện 
và bộ dữ liệu kiểm chứng. Trục ngang của Hình 
3 thể hiện số bước huấn luyện (epoch). Có thể 
thấy chỉ số F1 tăng dần theo thời gian và hội tụ 
ổn định khi số bước đạt 70. Chỉ số F1 đối với 
tập huấn luyện và tập kiểm chứng khi hội tụ đều 
đạt trên 95% và chênh lệch nhau không đáng 
kể. Điều này chứng tỏ mô hình được huấn 
luyện hiệu quả, không bị hiện tượng học quá 
khớp (overfitting). 
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020 105
Hình 3. Độ chính xác tính theo chỉ số F1 trên tập huấn luyện và tập kiểm chứng 
tại từng thời điểm khác nhau (epoch) trong quá trình huấn luyện
Tập ảnh thực nghiệm bao gồm 1.321 ảnh với 1.543 polyp trong đó 76% số ảnh trong tập này ở 
chế độ WLI. Các đặc điểm chi tiết về số lượng, kích thước polyp và hình thái theo phân loại Paris 
được mô tả chi tiết trong Bảng 3.
Bảng 3. Đặc điểm tập ảnh đánh giá thực nghiệm của mô hình
Tần số (n) Tỉ lệ (%) Tần số (n)
Tỉ lệ
(%)
Chế độ ảnh Số lượng polyp trong mỗi ảnh
WLI 1004 76 1 polyp 1204 91,14
FICE 317 24 Nhiều polyp 117 8,86
Tổng cộng 1.321 100 Tổng cộng 1.321 100
Kích thước polyp Phân loại Paris
< 5mm 981 63,58 Ip 127 8,23
5 - 10 mm 460 29,81 Is 1252 81,14
> 10 mm 102 6,61 IIa 164 10,63
Tổng cộng 1.543 100 IIb 0 0
Tổng cộng 1.543 100
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020106
PPV, Se và Sp của mô hình AI trong tập ảnh thực nghiệm lần lượt là 94,60%, 96,39% và 99,84%. 
Khi so sánh với ý kiến chuyên gia, có 38 ảnh khoanh thừa 52 tổn thương, 67 ảnh phát hiện đúng 
tổn thương nhưng khoanh viền chưa chính xác và 14 ảnh khoanh thiếu 37 tổn thương với các đặc 
điểm được mô tả chi tiết trong Bảng 4. Trong đó tất cả polyp bị bỏ sót đều có kích thước < 0,5cm và 
phân loại Paris Is.
Bảng 4. Mô tả đặc điểm các ảnh khoanh thừa và ảnh khoanh sót tổn thương
Lỗi đánh dấu 
khoanh thừa
Số vùng đánh 
dấu sai (n)
Tỉ lệ
(%)
Lỗi bỏ sót
Số polyp 
(n)
Tỉ lệ
(%)
Bọt 7 13,46 Bỏ sót polyp nhỏ 31 83,8
Cuống polyp 5 9,62 Bỏ sót polyp ở xa 3 8,1
Dịch nhầy 7 13,46 Bỏ sót polyp trên nếp niêm mạc 3 8,1
Nếp niêm mạc 23 44,23 Tổng cộng 37 100
Niêm mạc 8 15,38
Vùng lóa 2 3,85
Tổng cộng 52 100
IV. BÀN LUẬN
Theo các nghiên cứu, tình trạng bỏ sót polyp 
hay adenoma đại tràng liên quan đến nhiều yếu 
tố bao gồm chất lượng hệ thống trang thiết bị, 
quy trình nội soi (chuẩn bị đại tràng, thời gian 
rút dây), môi trường làm việc và kinh nghiệm 
của bác sĩ.2-4 Chính vì vậy việc áp dụng công 
nghệ mới như các kĩ thuật nội soi tăng cường 
hình ảnh hay AI được kì vọng có thể giúp giảm 
tỷ lệ bỏ sót tổn thương. Khuyến cáo mới đây 
của Hội Nội soi tiêu hóa châu Âu trong phát 
hiện và phân loại tổn thương ác tính của đại 
tràng cũng đã đề cập đến việc có thể kết hợp 
các phương thức hỗ trợ của máy tính trong 
phát hiện, xác định đặc điểm tổn thương trong 
nội soi đại tràng.18
Một số nghiên cứu hồi cứu đã ghi nhận tiềm 
năng hứa hẹn của AI trong việc hỗ trợ phát hiện 
polyp đại trực tràng.6-8 Nghiên cứu của Urban 
và cộng sự huấn luyện trên 8641 ảnh nội soi 
được gán nhãn bởi chuyên gia thu thập từ 
2000 bệnh nhân và kiểm định trên 20 video nội 
soi cho thấy tỷ lệ dự đoán chính xác của thuật 
toán là 96,4%. Kĩ thuật mạng neuron tích chập 
(Convolutional Neural Network – CNN) phát 
triển trong nghiên cứu này còn có ưu điểm là 
có khả năng chạy trên hệ thống máy tính thông 
thường với tốc độ xử lý nhanh. Tác giả Wang 
và cộng sự cũng đã xây dựng mô hình phát 
hiện polyp với PPV là 94,3% và Sp là 95,9% 
trong đó hệ thống có tốc độ xử lý hình ảnh 
video là 25 ảnh/s do vậy độ trễ khi phân tích 
video nội soi đồng thời rất khó nhận biết được, 
kể cả bởi chuyên gia.19 Điểm chung của thuật 
toán do chúng tôi và các nhóm tác giả trên thế 
giới xây dựng là đều dựa trên các tập ảnh tĩnh 
đã được bác sĩ gán nhãn, khoanh vùng. 
Một điểm hạn chế là không có nhiều tập ảnh 
dữ liệu công bố trong lĩnh vực này. Tập dữ liệu 
công bố lớn nhất là tập Kvasir bao gồm 1000 
ảnh có polyp, 1000 ảnh polyp được tiêm phồng 
và 1000 ảnh chân vết cắt polyp sau can thiệp 
thủ thuật. Nghiên cứu nền trên tập ảnh Kvasir 
được thực hiện bởi Pogorelov và cộng sự ghi 
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020 107
nhận Sp và PPV lần lượt là 95,8% và 92,7%.20 
Đồng thời, nghiên cứu phân tích gộp thực hiện 
bởi Lui và cộng sự cho thấy các thuật toán AI 
trong nội soi đại tràng ghi nhận PPV, Se lần lượt 
là 96% và 92,3%.21 Khi so sánh với nghiên cứu 
của các tác giả trên thế giới, thuật toán chúng 
tôi đang xây dựng có PPV, Se và Sp gần tương 
đương. Có thể thấy, nhóm nghiên cứu đã bước 
đầu thành công trong việc xây dựng dữ liệu 
hình ảnh nội soi. Đồng thời, dữ liệu cũng vẫn 
đang được thu nhận thêm, đặc biệt là dữ liệu 
dạng video nhằm kiểm định độ chính xác cũng 
như thời gian phân tích xử lý ảnh.
Tại Việt Nam, hiện chưa có nhiều nghiên 
cứu về ứng dụng trí tuệ nhân tạo trong nội soi 
đường tiêu hóa để đánh giá tiềm năng cũng 
như tính khả thi trong hoàn cảnh thực tế của 
nước ta. Năm 2019, nhóm nghiên cứu của 
chúng tôi đã tiến hành một nghiên cứu bước 
đầu đánh giá việc ứng dụng AI trong xác định 7 
vị trí giải phẫu của dạ dày với PPV trung bình là 
92,48%. Ngoài ra, kết quả nghiên cứu cũng cho 
thấy khả năng ứng dụng trong thực tế dựa trên 
phân tích thời gian bác sĩ nội soi phân loại ảnh 
theo vị trí giải phẫu theo cách thông thường 
và khi có sự hỗ trợ của phần mềm. Trung vị 
thời gian phân loại của ba chuyên gia nội soi 
khi sử dụng phần mềm (3,86 phút) ngắn hơn 
một cách có ý nghĩa thống kê so với cách phân 
loại truyền thống (12,82 phút).22 Trên cơ sở đó, 
nhóm nghiên cứu chúng tôi tiến hành xây dựng 
thuật toán đối với phát hiện tổn thương polyp 
của đường tiêu hóa dưới. 
Năm 2019, nhóm nghiên cứu của Đại học 
quốc gia Thành phố Hồ Chí Minh đã tiến hành 
đánh nhãn trên tập dữ liệu KVASIR để phát 
hiện các tổn thương của đường tiêu hóa cả 
trên và dưới bao gồm viêm thực quản, polyp 
đại tràng và các dụng cụ can thiệp. Kết quả ghi 
nhận chỉ số F1 của các thuật toán học sâu xây 
dựng được dao động từ 83 - 94% trên 2 tập dữ 
liệu Medico và BioMedia, tuy nhiên nhóm tác 
giả cũng nhận thấy thuật toán chưa đủ mạnh 
trong việc phát hiện tổn thương các polyp đại 
tràng đặc biệt ở nhóm được tiêm phồng trước 
thủ thuật. Nhóm tác giả đã đánh dấu vùng phát 
hiện polyp cho 3.088 ảnh và dụng cụ cho 1.886 
ảnh để xây dựng bộ dữ liệu chuẩn cho các 
nghiên cứu tiếp theo. Tuy nhiên, mô hình Faster 
R-CNN sử dụng trong nghiên cứu này là kiến 
trúc hai giai đoạn (two-stage) dựa trên mạng 
xương sống ResNet10 có kích thước rất lớn và 
sâu nên tốc độ xử lý chậm và khó ứng dụng 
cho bước tiếp theo là chạy trên video hoặc xử 
lý thời gian thực.23 Nghiên cứu của chúng tôi 
sử dụng tập ảnh huấn luyện được gán nhãn 
với 8.190 hình ảnh nội soi đại tràng có polyp 
và 4.000 hình ảnh nội soi đại tràng không có 
polyp trong đó số ảnh được khoanh vùng là 
6.234 ảnh. Đây là tập dữ liệu đầu tiên được xây 
dựng tại Việt Nam, bao gồm 76% ảnh chế độ 
WLI và 23% chế độ FICE với kích thước, hình 
thái polyp đa dạng cũng là một điểm mạnh giúp 
đánh giá ưu nhược điểm của thuật toán.
Khi kiểm định trên tập thực nghiệm, PPV 
và Se thu nhận được tương tự như của các 
nhóm tác giả trên thế giới lần lượt là 94,6% 
và 96,39%. Các trường hợp bị sót tổn thương 
đều là polyp bé dưới 5 mm và hình thái Paris là 
Is. Nguyên nhân có thể là do kích thước polyp 
quá nhỏ hoặc nằm trong vùng tối của ảnh nên 
phần mềm khó xác định ranh giới rõ ràng của 
polyp với niêm mạc xung quanh dẫn đến bỏ 
sót. Những trường hợp bị nhận nhầm polyp 
thường là do chất lượng ảnh (bọt, có lóa, dịch 
nhầy) hoặc nhận nhầm với nếp niêm mạc. Chất 
lượng ảnh kém có khả năng đã tạo nên các 
đường ranh giới mờ xung quanh các vùng có 
bọt, lóa và dịch nhầy khiến cho thuật toán xác 
định nhầm là ranh giới của polyp. Đối với các 
trường hợp nhận nhầm nếp niêm mạc, các nếp 
có thể đã tạo nên hình ảnh cấu trúc lồi trên bề 
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020108
mặt niêm mạc gần giống với polyp Is theo phân 
loại Paris khiến phần mềm xác định nhầm. Các 
trường hợp bỏ sót và nhận nhầm được mô tả 
ở trên cũng là những đặc điểm được báo cáo 
trong một số nghiên cứu của các tác giả trên 
thế giới và gợi ý một số định hướng giúp nhóm 
nghiên cứu cải thiện thêm thuật toán. Nghiên 
cứu này của chúng tôi còn một số hạn chế như 
là nghiên cứu đơn trung tâm, tập dữ liệu là 
ảnh tĩnh và chỉ mới thu nhận trên 2 chế độ ánh 
sáng là WLI và FICE của hệ thống máy Fujifilm. 
Trong tương lai, sẽ cần triển khai nghiên cứu 
đa trung tâm trên nhiều hệ thống máy và chế 
độ ánh sáng để đảm bảo cơ sở dữ liệu đầu vào 
phong phú.
V. KẾT LUẬN
Nghiên cứu được tiến hành nhằm phát triển 
hệ thống ứng dụng thuật toán AI để phát hiện 
polyp đại tràng thông qua xây dựng tập dữ liệu 
ảnh nội soi của bệnh nhân Việt Nam (với 8.190 
ảnh có polyp và 4.000 ảnh không polyp), đồng 
thời tiến hành đánh giá bước đầu độ chính xác 
của thuật toán. Trong quá trình xây dựng mô 
hình, kết quả thử nghiệm cho thấy mô hình có 
chỉ số F1 cao, trên 95%. Kết quả kiểm định trên 
tập 1.321 ảnh với 1.543 tổn thương ghi nhận 
PPV, Se và Sp của mô hình lần lượt là 94,6%, 
96,39% và 99,84% với 52 vùng khoanh thừa 
và 37 tổn thương bỏ sót đều có kích thước < 5 
mm và hình thái Is theo phân loại Paris. Kết quả 
ghi nhận bước đầu cho thấy hướng nghiên cứu 
này có tính khả thi ở nước ta và là một hướng 
đi mới cần tiếp tục đi sâu phát triển.
TÀI LIỆU THAM KHẢO
1. Giacosa A, Frascio F, Munizzi F. 
Epidemiology of colorectal polyps. Tech 
Coloproctol. 2004; 8 Suppl 2: s243-247.
2. Moriyama T, Uraoka T, Esaki M, 
Matsumoto T. Advanced technology for the 
improvement of adenoma and polyp detection 
during colonoscopy. Dig Endosc. 2015; 27 
Suppl 1: 40 - 44.
3. Zhao S, Wang S, Pan P, et al. Magnitude, 
Risk Factors, and Factors Associated With 
Adenoma Miss Rate of Tandem Colonoscopy: 
A Systematic Review and Meta-analysis. 
Gastroenterology. 2019; 156(6): 1661 - 1674 
e1611.
4. Shin JG, Kim HW, Park SB, et al. Polyp 
missing rate and its associated risk factors of 
referring hospitals for endoscopic resection 
of advanced colorectal neoplasia. Medicine 
(Baltimore). 2017; 96(19): e6742.
5. Corley DA, Jensen CD, Marks AR, et al. 
Adenoma detection rate and risk of colorectal 
cancer and death. N Engl J Med. 2014; 370(14): 
1298 - 1306.
6. Karkanis SA, Iakovidis DK, Maroulis 
DE, Karras DA, Tzivras M. Computer-aided 
tumor detection in endoscopic video using 
color wavelet features. IEEE Transactions on 
Information Technology in Biomedicine. 2003; 
7(3): 141 - 152.
7. Urban G, Tripathi P, Alkayali T, et al. 
Deep Learning Localizes and Identifies Polyps 
in Real Time With 96% Accuracy in Screening 
Colonoscopy. Gastroenterology. 2018; 155(4): 
1069 - 1078 e1068.
8. Viscaino M, Cheein FA. Machine learning 
for computer-aided polyp detection using 
wavelets and content-based image. Paper 
presented at: 2019 41st Annual International 
Conference of the IEEE Engineering in 
Medicine and Biology Society (EMBC); 23 - 27 
July 2019, 2019.
9. Bray F, Ferlay J, Soerjomataram I, Siegel 
RL, Torre LA, Jemal A. Global cancer statistics 
2018: GLOBOCAN estimates of incidence 
and mortality worldwide for 36 cancers in 185 
countries. CA Cancer J Clin. 2018; 68(6): 394 
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020 109
- 424.
10. Wolf AMD, Fontham ETH, Church TR, 
et al. Colorectal cancer screening for average-
risk adults: 2018 guideline update from the 
American Cancer Society. CA Cancer J Clin. 
2018; 68(4): 250-281.
11. Bộ Y tế. Quyết định 2549/QĐ-BYT 2018 
ban hành Tài liệu Hướng dẫn chẩn đoán và 
điều trị ung thư đại - trực tràng. In: 2018.
12. Huynh HT, Anh VNN. A Deep Learning 
Method for Lung Segmentation on Large Size 
Chest X-Ray Image. Paper presented at: 
2019 IEEE-RIVF International Conference on 
Computing and Communication Technologies 
(RIVF); 20-22 March 2019, 2019.
13. Ngoc LT, Huynh KD, Bao PT, Hieu 
HT. Liver intensity determination in the 3D 
abdominal MR image using neural network. 
Vietnam Journal of Science and Technology. 
2016; 3A(54).
14. Le TN, Bao PT, Huynh HT. Liver Tumor 
Segmentation from MR Images Using 3D 
Fast Marching Algorithm and Single Hidden 
Layer Feedforward Neural Network. BioMed 
Research International. 2016; 2016: 3219068.
15. Ronneberger O, Fischer P, Brox T. 
U-Net: Convolutional Networks for Biomedical 
Image Segmentation. Vol 93512015.
16. Tan M, Le Q. EfficientNet: Rethinking 
Model Scaling for Convolutional Neural 
Networks. 2019.
17. Abraham N, Khan NM. A Novel Focal 
Tversky Loss Function With Improved Attention 
U-Net for Lesion Segmentation. Paper 
presented at: 2019 IEEE 16th International 
Symposium on Biomedical Imaging (ISBI 
2019); 8 - 11 April 2019, 2019.
18. Bisschops R, East JE, Hassan C, 
et al. Advanced imaging for detection and 
differentiation of colorectal neoplasia: European 
Society of Gastrointestinal Endoscopy (ESGE) 
Guideline - Update 2019. Endoscopy. 2019; 
51(12): 1155 - 1179.
19. Wang P, Xiao X, Glissen Brown JR, et al. 
Development and validation of a deep-learning 
algorithm for the detection of polyps during 
colonoscopy. Nature Biomedical Engineering. 
2018; 2(10): 741 - 748.
20. Pogorelov K, Randel KR, Griwodz C, 
et al. KVASIR: A Multi-Class Image Dataset 
for Computer Aided Gastrointestinal Disease 
Detection. 2017.
21. Lui TKL, Guo CG, Leung WK. Accuracy 
of artificial intelligence on histology prediction 
and detection of colorectal polyps: a systematic 
review and meta-analysis. Gastrointestinal 
Endoscopy. 2020; 92(1): 11-22.e16.
22. Đào Việt Hằng, Nguyễn Phúc Bình, Vũ 
Hải, et al. Xác định vị trí giải phẫu của dạ dày 
qua nội soi đường tiêu hóa trên sử dụng mạng 
noron tích chập. Tạp chí Y học thực hành. 2019; 
1120(12): 10 - 12.
23. Hoang TH, Nguyen HD, Nguyen VA, 
Nguyen TA, Nguyen VT, Tran MT. Enhancing 
Endoscopic Image Classification with Symptom 
Localization and Data Augmentation. 2019.
TẠP CHÍ NGHIÊN CỨU Y HỌC
TCNCYH 130 (6) - 2020110
Summary
PRELIMINARY RESULTS OF ARTIFICIAL INTELLIGENT 
APPLICATION IN COLONOSCOPIC POLYPS DETECTION 
IN VIETNAM
This study intention is to build a deep learning model for polyps detection in colonoscopy images, 
conducted from November 2019 to June 2020. We collected a dataset of 8190 colonoscopy images 
with at least one polyp and 4000 colonoscopy images without polyp. 80% of the dataset was used for 
training and 20% was used for testing in which images with polyps were labeled and annotated by 
experts. The proposed model was built based on the U-Net architecture with an Efficient Net encoder 
and was trained in 150 epochs before testing on the experimental dataset (1321 colonoscopy 
images with 1543 polyps). The model’s accuracy was then evaluated using the F1 score, the PPV 
index, the Se index, and the Sp index. Preliminary assessment of the proposed model showed 
that the F1 scores of both the training set and the testing set are over 95%. The AI model was 
then tested on the experimental dataset, which recorded the PPV, Se and Sp indexes of 94.60%, 
96.39% and 99.84%, respectively. Furthermore, 37 polyps were missed, 63.58% of which were 
less than 5mm in diameter, and 81.14% were categorized as Is according to Paris classification. 
52 areas incorrectly marked as polyp were foam, optical flare, or mucus in the images. Most of 
the false-positive areas were mucosal folds (44.23%) and mucus (13.46%). This preliminary study 
showed that the proposed deep learning model yielded good precision and recall. Application of 
AI in colonoscopic polyps’ detection is then feasible and requires further investigation in Vietnam. 
Key words: Artificial intelligent, colonoscopy, colonoscopic polyps, deep learning, polyp 
detection

File đính kèm:

  • pdfket_qua_buoc_dau_cua_ung_dung_tri_tue_nhan_tao_trong_phat_hi.pdf