Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức

TÓM TẮT - Trong các hệ thống tra cứu ảnh dựa vào nội dung, các kết quả trả về thường không thỏa mãn nhu cầu thông tin

của người dùng. Có hạn chế này là do: (1) ảnh truy vấn không biểu diễn được đầy đủ nhu cầu thông tin của người dùng, (2) các đặc

trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh và (3) hàm khoảng cách kết hợp với các đặc trưng không thể hiện

được nhận thức của người dùng. Để khắc phục hạn chế đó, chúng tôi đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận

thức bằng việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu

trong không gian đặc trưng. Chúng tôi đã thực nghiệm trên cơ sở dữ liệu ảnh gồm 10.800 ảnh. Các kết quả thực nghiệm chỉ ra rằng

kỹ thuật này cải tiến được hiệu năng của hệ thống tra cứu ảnh dựa vào nội dung so với phương pháp đã có và cho kết quả gần với

nhận thức của người dùng.

pdf 6 trang phuongnguyen 5240
Bạn đang xem tài liệu "Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức

Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức
Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 
DOI: 10.15625/vap.2015.000181 
MỘT PHƯƠNG PHÁP TRA CỨU ẢNH 
DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC 
Vũ Văn Hiệu1, Nguyễn Hữu Quỳnh2, Ngô Quốc Tạo3 
1 Khoa Công nghệ Thông tin, Trường Đại học Hải Phòng 
2 Khoa Công nghệ Thông tin, Trường Đại học Điện lực 
3Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam 
hieuvvdhhp@gmail.com, quynhnh@epu.edu.vn, nqtao@ioit.ac.vn 
TÓM TẮT - Trong các hệ thống tra cứu ảnh dựa vào nội dung, các kết quả trả về thường không thỏa mãn nhu cầu thông tin 
của người dùng. Có hạn chế này là do: (1) ảnh truy vấn không biểu diễn được đầy đủ nhu cầu thông tin của người dùng, (2) các đặc 
trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh và (3) hàm khoảng cách kết hợp với các đặc trưng không thể hiện 
được nhận thức của người dùng. Để khắc phục hạn chế đó, chúng tôi đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận 
thức bằng việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu 
trong không gian đặc trưng. Chúng tôi đã thực nghiệm trên cơ sở dữ liệu ảnh gồm 10.800 ảnh. Các kết quả thực nghiệm chỉ ra rằng 
kỹ thuật này cải tiến được hiệu năng của hệ thống tra cứu ảnh dựa vào nội dung so với phương pháp đã có và cho kết quả gần với 
nhận thức của người dùng. 
Từ khóa - Tra cứu ảnh dựa vào nội dung, tương tự nhận thức, véc tơ đặc trưng. 
I. GIỚI THIỆU 
Các truy vấn lựa chọn “Top-k” đang trở nên phổ biến trong nhiều ứng dụng cơ sở dữ liệu hiện đại. Không như các 
hệ cơ sở dữ liệu quan hệ truyền thống, ở đó một truy vấn gồm một điều kiện lựa chọn chính xác và người dùng kỳ vọng 
nhận lại tập các đối tượng thỏa mãn chính xác điều kiện, trong các truy vấn lựa chọn “Top-k”, người dùng chỉ rõ các đối 
tượng mục tiêu và không kỳ vọng nhận lại các đối tượng thỏa mãn chính xác điều kiện. Kết quả của các truy vấn này là 
một danh sách các đối tượng được xếp hạng theo thứ tự giảm dần của độ tương tự với truy vấn người dùng. 
Do bản chất chủ quan của các truy vấn “Top-k”, các đối tượng trả về bởi hệ thống so với truy vấn người dùng 
thường không thỏa mãn nhu cầu thông tin của người dùng ngay lập tức [1, 2, 3]. Điều này là do một số lý do: các ảnh truy 
vấn ban đầu không phải là các ảnh tốt nhất để biểu diễn nhu cầu thông tin của người dùng hoặc các đặc trưng mức thấp 
không phản ánh được thông tin ngữ nghĩa của ảnh hoặc hàm khoảng cách kết hợp với các đặc trưng không thể hiện được 
nhận thức của người dùng. Quá trình này được gọi là điều chỉnh truy vấn và truy vấn mới được gọi là “truy vấn điều 
chỉnh”. Trong tra cứu ảnh dựa vào nội dung, người dùng điều chỉnh truy vấn bằng việc tìm trong số các ảnh được trả về, 
một hoặc nhiều ảnh mà gần với những gì người dùng mong muốn [4, 5, 6]. Dựa trên phản hồi của người dùng, hệ thống sẽ 
tính các ảnh truy vấn mới và các trọng số mới và thực hiện truy vấn điều chỉnh. Một cách khác để điều chỉnh truy vấn là 
người dùng điều chỉnh các trọng số của các đặc trưng một cách thủ công để biểu diễn tốt nhất nhận thức về độ tương tự 
của người dùng [6]. Trong cả hai trường hợp, người dùng có thể tiếp tục điều chỉnh truy vấn trên nhiều vòng lặp cho đến 
khi thỏa mãn với các kết quả. Các nghiên cứu gần đây chỉ ra rằng các kỹ thuật điều chỉnh truy vấn cải tiến đáng kể chất 
lượng của tập kết quả và tập kết quả cải tiến qua các lần lặp phản hồi [7, 8]. 
Giới hạn của nhiều cách tiếp cận dựa vào đặc trưng đã có đó là giới hạn người dùng đối với một đặc trưng đơn 
được sử dụng cho tra cứu [8]. Các hệ thống hỗ trợ các truy vấn đa đặc trưng cung cấp các cơ chế đặc biệt cho người dùng 
để chỉ ra độ quan trọng trong các đặc trưng [5, 9, 10]. Độ tương tự toàn bộ giữa một đối tượng và ảnh truy vấn được tính 
toán bằng tổng có trọng số các độ tương tự trên tập đặc trưng. Có một số hạn chế đối với một cách tiếp cận như thế [1, 2, 
3]. Nó đặt quá nhiều gánh nặng lên người dùng khi xây dựng nhu cầu thông tin chính xác. Người dùng có thể khó biểu 
diễn truy vấn của họ dưới dạng các đặc trưng được cung cấp do ban đầu họ có thể không có ý tưởng rõ ràng về nhu cầu 
thông tin. Với hạn chế thứ nhất và thứ hai khi người dùng gửi ảnh truy vấn ban đầu không phải là các ảnh tốt nhất để biểu 
diễn nhu cầu thông tin của người dùng và các đặc trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh. Hơn 
nữa, có thể có sự không phù hợp giữa nhận thức của người dùng về các thuộc tính trực quan và các biểu diễn đặc trưng 
được sử dụng cho tra cứu. Những người dùng khác nhau có thể có nhận thức khác nhau về khái niệm tương tự giữa các 
thuộc tính ảnh. Cuối cùng, thậm chí nó còn không khả thi để biểu diễn nhu cầu thông tin của người dùng bằng một kết hợp 
có trọng số các đặc trưng của một ảnh truy vấn đơn. Các cách tiếp cận này cố định biểu diễn truy vấn và hàm đối sánh 
tương tự cũng làm cho hệ thống rất cứng nhắc. 
Bài báo đưa ra cách khắc phục hạn chế trên, đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức bằng 
việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu trong 
không gian đặc trưng. Chúng tôi cho phép người dùng chọn trọng số các ảnh trả về, những ảnh mà họ cho là thỏa mãn nhu 
cầu thông tin của họ nhất và sau đó tính lại biểu diễn của truy vấn dựa trên sự phản hồi này. Phương pháp đề xuất tính toán 
độ phân tán của các điểm dữ liệu do người dùng lựa chọn trên không gian đặc trưng để xác định mong muốn của người 
dùng về chiều dữ liệu quan trọng. 
Phần còn lại của bài báo này được tổ chức như sau: Trình bày chi tiết phương pháp đề xuất, mô tả các kết quả thực 
nghiệm tương ứng trong phần hai và ba, cuối cùng là kết luận sẽ được đưa ra trong phần bốn. 
462 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC 
II. PHƯƠNG PHÁP TRA CỨU ẢNH VỚI ĐIỀU CHỈNH TRUY VẤN 
A. Mô hình đề xuất 
Trong số k ảnh được trả về bởi việc thực hiện truy vấn khởi tạo, người dùng sẽ chọn n ảnh liên quan. Trên không 
gian đặc trưng F, tính giá trị trung bình của n đối tượng ảnh (theo từng đặc trưng) và thay biểu diễn trong không gian đặc 
trưng F của truy vấn khởi tạo bằng biểu diễn tương ứng với giá trị trung bình vừa tính được. Lặp lại quá trình này chúng ta 
sẽ nhận được điểm truy vấn tối ưu trong không gian đặc trưng F. Đến đây, chúng ta đã nhận được truy vấn tối ưu nhưng độ 
quan trọng của các chiều dữ liệu trong không gian đặc trưng F vẫn chưa theo mong muốn của người dùng. Do đó, tính 
phương sai của các dữ liệu trong không gian đặc trưng F theo mỗi chiều dữ liệu để xác định độ quan trọng của mỗi chiều 
dữ liệu trong không gian đặc trưng này (phương sai càng lớn, độ phân tán dữ liệu càng lớn và vì thế chiều đó sẽ ít quan 
trọng) là cần thiết. 
Dưới đây chúng tôi sẽ đề cập tới ba thuật toán thể hiện ý tưởng trên, thuật toán QRR tìm truy vấn tối ưu, thuật toán 
SIDFS tính độ quan quan theo chiều dữ liệu trên không gian đặc trưng và thuật toán IRuPS tính độ tương tự theo nhận 
thức. 
Thuật toán 1: QRR (Query Representation Refinement) 
Đầu vào: 
S /*Tập các véc tơ đặc trưng ảnh cơ sở dữ liệu*/ 
F /* Tập các đặc trưng */ 
m /*Chiều của không gian đặc trưng*/ 
Kết quả: 
 qopt /*Véc tơ truy vấn tối ưu*/ 
For F∈F do 
{ 
 QF= /* Thực hiện truy vấn khởi tạo đơn điểm với k ảnh trả về*/ 
 While User chưa dừng phản hồi do 
 { 
 For j=1 to m do */ m số chiều của không gian đặc trưng*/ 
 { 
 SumF=0 
 SumwF=0 
 For i=1 to n do 
 { 
 ܧ௜ி=User_Choose_RelevanceImage(QF, k) /* User chọn n đối tượng, E1,Ei,En 
 liên quan trong số k đối tượng trả về*/ 
 ݓ௜ி=User_Choose_RelevanceLevel({1,2,3}) 
 SumF=SumF+ݓ௜	ܧ௜ிሾ݆ሿ 
 SumwF=SumwF+ݓ௜ 
 } 
 CF[j]= ௌ௨௠
ಷ
ௌ௨௠௪ಷ 
 } 
 } 
 ݍ௢௣௧ி =CF /* véc tơ truy vấn tối ưu trên không gian đặc trưng F*/ 
 } 
Return qopt 
Hình 1. Thuật toán điều chỉnh biểu diễn truy vấn QRR 
Thuật toán 1 (QRR) điều chỉnh biểu diễn truy vấn được thực hiện như sau: Trên không gian đặc trưng F, người 
dùng thực hiện việc nhập vào một ảnh truy vấn mẫu q0 và thực hiện truy vấn này trên tập cơ sở dữ liệu đặc trưng S để được 
k ảnh kết quả. Quan sát trên k ảnh kết quả này, người dùng chọn n ảnh liên quan so với ảnh truy vấn và gần với nhu cầu 
thông tin của mình, với mỗi ảnh liên quan chọn giá trị trọng số wi (một mức liên quan trong các mức 0: không liên quan – 
mặc định không chọn, 1: liên quan và 2: liên quan cao, 4: liên quan rất cao). Trên cơ sở các ảnh được chọn và giá trị wi 
được nhập, thuật toán tính trọng tâm C theo chiều mỗi chiều j. Kết thúc một lần lặp phản hồi của người dùng là véc tơ 
trọng tâm CF gồm m chiều, cũng chính là véc tơ truy vấn tối ưu ݍ௢௣௧ி trên không gian F của lần lặp này. Lặp lại quá trình 
trên một số lần, thuật toán sẽ cho ra véc tơ truy vấn tối ưu qopt. 
Thuật toán SIDFS (Hình 2) tính độ quan trọng của chiều dữ liệu trong không gian đặc trưng F. 
Vũ Văn Hiệu, Nguyễn Hữu Quỳnh, Ngô Quốc Tạo 463 
Thuật toán 2: SIDFS (Select Important Dimensions in Feature Space) 
Đầu vào: 
E /*Tập n ảnh do User chọn*/ 
F /*Tập các đặc trưng*/ 
m /*Chiều của không gian đặc trưng*/ 
Đầu ra: 
 Weight_j /*Độ quan trọng theo chiều j*/ 
 For F∈F do 
 { 
 For j=1 to m do 
 { 
 ߤ௝ ൌ ଵ௡ ∑ ܧ௜ிሾ݆ሿ௡௜ୀଵ 
 ߪ௝ி 	ൌ ሺଵ௡ ∑ ሺܧ௜ிሾ݆ሿ െ ߤ௝ሻଶሻ௡௜ୀଵ
ଵ/ଶ	 
 Weight_j = ଵఙೕಷ
 /* trọng số theo chiều j*/ 
 } 
 } 
Hình 2. Thuật toán tính độ quan trọng của chiều dữ liệu SIDFS. 
Thuật toán 2 SIDFS tính độ quan trọng của chiều dữ liệu được thực hiện như sau: Thuật toán lấy đầu vào là n ảnh 
ܧଵி, ܧ௜ி,ܧ௡ி tương tự nhận thức với truy vấn tối ưu ݍ௢௣௧ி (đầu ra của thuật toán 1) trên không gian F. Lúc này, theo 
chiều thứ j của không gian đặc trưng F sẽ có n điểm dữ liệu ܧଵிሾ݆ሿ, ܧ௜ிሾ݆ሿ, ܧ௡ிሾ݆ሿ và thuật toán tính phương sai ߪ௝ி	của n 
điểm dữ liệu này theo chiều j của không gian F. Sau khi tính được giá trị của phương sai ߪ௝ி, thuật toán đưa ra độ quan 
trọng của từng chiều dữ liệu j trong không gian đặc trưng F bởi vì ߪ௝ி	lớn có nghĩa là độ phân tán dữ liệu theo chiều j trong 
không gian đặc trưng F lớn, cũng có nghĩa là độ quan trọng của chiều j trong không gian đặc trưng F nhỏ. Do đó độ quan 
trọng dữ liệu theo chiều j sẽ được tính bằng ଵఙೕಷ
 và gán cho Weight_j. 
Thuật toán IRuPS (Hình 3) tra cứu ảnh dựa vào độ tương tự nhận thức cho ra tập kết quả gồm các ảnh có độ tương 
tự nhận thức cao nhất với truy vấn. Thuật toán IRuPS được thực hiện như sau: Với đầu vào là véc tơ truy vấn tối ưu qopt 
(đầu ra của thuật toán 1) và trọng số Weight_j (đầu ra của thuật toán 2) của chiều j trên không gian đặc trưng F, thuật toán 
tính khoảng cách giữa truy vấn tối ưu ݍ௢௣௧ி với mỗi ảnh ݏ௜ி. Khoảng cách này được tính theo từng chiều j với độ quan trọng 
Weight_j được đưa vào công thức tính khoảng cách. Cuối cùng thuật toán trả lại k ảnh, k ảnh này tương tự về mặt nhận 
thức nhất với qopt bởi vì khoảng cách được tính dựa vào hai yếu tố: (1) véc tơ truy vấn qopt có véc tơ đặc trưng gần với nhu 
cầu thông tin của người dùng và (2) độ quan trọng của chiều dữ liệu trong không gian đặc trưng được cập nhật tự động. 
Thuật toán 3: IRuPS (Image Retrieval using Perceived Similarity) 
Đầu vào: 
S /*Tập các ảnh*/ 
qopt /*Véc tơ truy vấn tối ưu*/ 
Weight_j /*Trọng số chiều j của không gian đặc trưng F*/ 
Đầu ra: 
P /* Tập k ảnh tương tự nhận thức với qopt */ 
 For F∈F do 
{ 
 For i=1 to ImageCount(S) do 
 { 
 Similarity(ݍ௢௣௧ி , ݏ௜ி)=0 
 For j=1 to m do 
 Similarity(ݍ௢௣௧ி , ݏ௜ி)=(Similarity(ݍ௢௣௧ி , ݏ௜ி)+(1-Weight_j*ሺݍ௢௣௧ி ሾ݆ሿ െ ݏ௜ிሾ݆ሿሻଶ)1/2) /*cập nhật trọng số theo 
chiều j*/ 
 } 
} 
/*Sắp xếp các ảnh si trong cơ sở dữ liệu theo thứ tự giảm dần của độ tương tự so với qopt */ 
Return P /* k ảnh tương tự nhất (về mặt nhận thức) với qopt */ 
Hình 3. Thuật toán tra cứu ảnh dựa vào độ tương tự nhận thức IRuPS 
464 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC 
III. THỰC NGHIỆM 
A. Dữ liệu thực nghiệm 
Chúng tôi sử dụng tập dữ liệu con của tập Corel[11] gồm 10,800 ảnh. Tập dữ liệu trên được chia thành 80 chủ đề 
gồm: biển, thẻ, ngựa, bướm, hoa, vận động viên thể thao, lướt ván, thuyền buồm, hoa quả, cờ, chim, nhà, thác nước, gấu, 
linh dương đầu bò, ô tô, núi và hoàng hôn, cánh rừng,... 
Các ảnh được lưu trữ theo định dạng JPEG với cỡ 120×80. Cơ sở dữ liệu này sẽ được sử dụng để minh chứng sự 
chính xác của kỹ thuật. Thực nghiệm được cài đặt trên ngôn ngữ C# trên một máy tính PC Core i3 M350 2.27 GHz 2.27 
GHz chạy hệ điều hành Windows 7. 
Để phân tích tính hiệu quả cho cách tiếp cận đề xuất của chúng tôi, chỉ tiêu được sử dụng là độ chính xác và triệu 
hồi, đó là hai độ đo để đánh giá thực nghiệm, chúng được định nghĩa là: 
)(
)(
Rarea
Rarearecall A= và 
)(
)(
Aarea
Rareaprecision A= 
Triệu hồi (Recall) là tỷ số của các ảnh liên quan trong cơ sở dữ liệu được tra cứu theo một truy vấn. Độ chính xác 
(Precision) là tỷ số của các ảnh được tra cứu mà liên quan đến ảnh truy vấn. 
Trong đó độ chính xác là tập ảnh tích cực với ảnh truy vấn ở mỗi vòng lặp phản hồi, tra cứu là tập ảnh kết quả trả 
về từ cách tiếp cận đề xuất ở mỗi phản hồi. 
Ký hiệu R là một tập các ảnh liên quan trong cơ sở dữ liệu, A là tập các ảnh tra cứu được trả về, RA là tập các ảnh 
liên quan trong tập A (Hình 4). 
Hình 4. Triệu hồi và chính xác cho các kết quả truy vấn 
B. Kết quả thực nghiệm 
Trong thực nghiệm ba đặc trưng gồm Color Histogram, Color Intensity và Textual được sử dụng để tính độ tương 
tự của ảnh truy vấn với từng ảnh trong cơ sở dữ liệu. Trong mỗi lần lặp phản hồi, để tìm truy vấn tối ưu chúng tôi sử dụng 
trọng số w biểu diễn mối quan hệ quan trọng với truy vấn. Để tìm ra truy vấn tối ưu và các trọng số quan trọng của chiều, 
chúng tôi chỉ tập trung quan sát trên tập các đối tượng liên quan. Từ tập các đối tượng liên quan, thuật toán 1 và thuật toán 
2 được áp dụng để tìm ra truy vấn tối ưu và trọng số quan trọng của chiều. Do vậy, trọng số chỉ mức quan hệ được đề xuất 
gồm 4 mức: 0, 1, 2 và 4 tương ứng với ý nghĩa không liên quan, liên quan, liên quan cao và liên quan rất cao. Chúng tôi đã 
so sánh nghiên cứu này với một số nghiên cứu phản hồi liên quan đang tồn tại như là phương pháp Naïve QP[4] và Naïve 
QR[5]. Để cung cấp các kết quả đáng tin cậy, chúng tôi sử dụng tập thử nghiệm gồm 1000 ảnh ngẫu nhiên trong 80 chủ đề 
nói trên. Các ảnh trong tập thử nghiệm được sử dụng lần lượt như ảnh truy vấn của IRuPS, Naïve QR và Naïve QP để chỉ 
ra hiệu quả của IRuPS. Bảng 1 dưới đây là kết quả trung bình của mỗi lần lặp đối với các phương pháp IRuPS, Naïve QR 
và Naïve QP. 
Bảng 1. Trung bình độ chính xác của cách tiếp cận khác nhau trên tập thử nghiệm 1000 ảnh 
Vòng 
lặp IRuPS 
Naïve 
QR 
Naïve 
QP 
1 0.7448 0.7448 0.7028 
2 0.84985 0.7621 0.76535 
3 0.90145 0.84765 0.79675 
4 0.92935 0.8805 0.8225 
5 0.94725 0.90125 0.84095 
6 0.96015 0.91725 0.85645 
7 0.96855 0.92625 0.8686 
Kết quả bảng 1 cho thấy trung bình độ chính xác của các phương pháp IRuPS, Naïve QR và Naïve QP qua 7 lần lặp 
phản hồi tương ứng là 90.02%, 85.42% và 80.76%, từ đó chỉ ra rằng kỹ thuật đề xuất cải thiện độ chính xác đáng kể. 
Hình 5 cho biết lược đồ so sánh độ chính xác trên 7 lần lặp phản hồi tương ứng của các phương pháp IRuPS, Naïve 
QR và Naïve QP. 
Vũ Văn Hiệu, Nguyễn Hữu Quỳnh, Ngô Quốc Tạo 465 
Hình 5. So sánh độ chính xác của IRuPS, Naïve QR và Naïve QP 
Để minh họa kết quả sau một số lần lặp phản hồi, hình 6,7 và 8 dưới đây chúng tôi minh họa ảnh hoàng hôn sử 
dụng làm ảnh truy vấn trên cả ba phương pháp IRuPS, Naïve QR và Naïve QP tương ứng. Kết quả ở lần lặp thứ sáu minh 
họa cho thấy kỹ thuật đề xuất cải thiện độ chính xác đáng kể. 
Hình 6. Những ảnh tìm thấy bởi kỹ thuật Naïve QR 
Hình 7. Những ảnh tìm thấy bởi kỹ thuật Naïve QP 
0
0.2
0.4
0.6
0.8
1
1.2
1 2 3 4 5 6 7
Naïve QP
Naïve QR
IRuPS
466 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC 
Hình 8. Những ảnh tìm thấy bởi kỹ thuật IRuPS 
IV. KẾT LUẬN
Chúng tôi đã phát triển phương pháp tra cứu ảnh IRuPS dựa vào nhận thức của người dùng và phản hồi liên quan. 
Phương pháp này có hai ưu điểm: yêu cầu người dùng suy nghĩ trong tâm trí ảnh đối tượng cần tìm mà không cần miêu tả 
cụ thể và đánh giá ảnh đối tượng trong mỗi lần tra cứu bằng cách đưa vào các mức độ liên quan. Qua mỗi lần lặp phản hồi, 
dựa trên các đối tượng mà người dùng lựa chọn, hệ thống tự động học thông tin bằng việc đánh giá chiều quan trọng. Dựa 
trên trọng số quan trọng của mỗi chiều, hệ thống đã cho kết quả gần với nhu cầu tra cứu của người dùng. 
V. TÀI LIỆU THAM KHẢO 
[1] Flickner, Myron, Et Al. "Query by Image and Video Content: The QBIC System."Computer 28.9 (1995): 23-32. 
[2] Bach, Jeffrey R., Et Al. "Virage Image Search Engine: An Open Framework For Image Management." Electronic 
Imaging: Science & Technology. International Society For Optics And Photonics, 1996. 
[3] Rui, Yong, et al. "Relevance feedback: a power tool for interactive content-based image retrieval." Circuits and 
Systems for Video Technology, IEEE Transactions on 8.5 (1998): 644-655. 
[4] Y. Rui, T. Huang, And S. Mehrotra. Content-Based Image Retrieval With Relevance Feedback in Mars. Proc. Of Ieee 
Int. Conf. On Image Processing, 1997. 
[5] K. Porkaew, K. Chakrabarti, And S. Mehrotra. Query Refinement For Content-Based Multimedia Retrieval in Mars. 
Proceedings Of Acm Multimedia Conference, 1999. 
[6] Y. Ishikawa, R. Subramanya, and C. Faloutsos. Mindreader: Querying Databases Through Multiple Examples. Proc. of 
Vldb, 1998. 
[7] K. Chakrabarti, K. Porkaew, And S. Mehrotra. Efficient Query Refinement in Multimedia Databases. Proceedings Of 
International Conference In Data Engineering(Icde), 2000. 
[8] Wu, Leejay, et al. "Multimedia queries by example and relevance feedback." IEEE Data Engineering Bulletin 24.3 
(2001): 14-21. 
[9] Chakrabarti, Kaushik, et al. "Evaluating refined queries in top-k retrieval systems." Knowledge and Data Engineering, 
IEEE Transactions on 16.2 (2004): 256-270. 
[10] Luo, Xin, Guowen Wu, and Kenji Kita. "Learning distance metrics with feature space performance for image 
retrieval." Proceedings of the 2013 International Conference on Electrical and Information Technologies for Rail 
Transportation (EITRT2013)-Volume II. Springer Berlin Heidelberg, 2014 
[11]  
AN IMAGE RETRIEVAL METHODS BASED ON PERCEIVED SIMILARITY 
Vu Van Hieu, Nguyen Huu Quynh, Ngo Quoc Tao 
ABSTRACT - Content-based image retrieval systems, the returned results are not satisfying the user's information needs. This 
restriction is due to: (1) query image is not fully represent the information needs of users, (2) low level features does not reflect the 
semantic information of image and (3) distance function combined with the features can not be perceived by the user. To overcome such 
limitations, we propose image retrieval method based on similarity perception by developing optimal query from user feedback. We 
have experimental database includes 10,800 images from Corel subset. The experimental results indicate that this technique improved 
content-based image retrieval system performance compared with the exit method and the results have been close to the perception of 
users. 

File đính kèm:

  • pdfmot_phuong_phap_tra_cuu_anh_dua_vao_do_tuong_tu_nhan_thuc.pdf