Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức

TÓM TẮT - Trong các hệ thống tra cứu ảnh dựa vào nội dung, các kết quả trả về thường không thỏa mãn nhu cầu thông tin

của người dùng. Có hạn chế này là do: (1) ảnh truy vấn không biểu diễn được đầy đủ nhu cầu thông tin của người dùng, (2) các đặc

trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh và (3) hàm khoảng cách kết hợp với các đặc trưng không thể hiện

được nhận thức của người dùng. Để khắc phục hạn chế đó, chúng tôi đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận

thức bằng việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu

trong không gian đặc trưng. Chúng tôi đã thực nghiệm trên cơ sở dữ liệu ảnh gồm 10.800 ảnh. Các kết quả thực nghiệm chỉ ra rằng

kỹ thuật này cải tiến được hiệu năng của hệ thống tra cứu ảnh dựa vào nội dung so với phương pháp đã có và cho kết quả gần với

nhận thức của người dùng.

6 trang phuongnguyen 14740

Download

Bạn đang xem tài liệu "Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức

Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015
DOI: 10.15625/vap.2015.000181
MỘT PHƯƠNG PHÁP TRA CỨU ẢNH
DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC
Vũ Văn Hiệu1, Nguyễn Hữu Quỳnh2, Ngô Quốc Tạo3
1 Khoa Công nghệ Thông tin, Trường Đại học Hải Phòng
2 Khoa Công nghệ Thông tin, Trường Đại học Điện lực
3Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
[email protected], [email protected], [email protected]
TÓM TẮT - Trong các hệ thống tra cứu ảnh dựa vào nội dung, các kết quả trả về thường không thỏa mãn nhu cầu thông tin
của người dùng. Có hạn chế này là do: (1) ảnh truy vấn không biểu diễn được đầy đủ nhu cầu thông tin của người dùng, (2) các đặc
trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh và (3) hàm khoảng cách kết hợp với các đặc trưng không thể hiện
được nhận thức của người dùng. Để khắc phục hạn chế đó, chúng tôi đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận
thức bằng việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu
trong không gian đặc trưng. Chúng tôi đã thực nghiệm trên cơ sở dữ liệu ảnh gồm 10.800 ảnh. Các kết quả thực nghiệm chỉ ra rằng
kỹ thuật này cải tiến được hiệu năng của hệ thống tra cứu ảnh dựa vào nội dung so với phương pháp đã có và cho kết quả gần với
nhận thức của người dùng.
Từ khóa - Tra cứu ảnh dựa vào nội dung, tương tự nhận thức, véc tơ đặc trưng.
I. GIỚI THIỆU
Các truy vấn lựa chọn “Top-k” đang trở nên phổ biến trong nhiều ứng dụng cơ sở dữ liệu hiện đại. Không như các
hệ cơ sở dữ liệu quan hệ truyền thống, ở đó một truy vấn gồm một điều kiện lựa chọn chính xác và người dùng kỳ vọng
nhận lại tập các đối tượng thỏa mãn chính xác điều kiện, trong các truy vấn lựa chọn “Top-k”, người dùng chỉ rõ các đối
tượng mục tiêu và không kỳ vọng nhận lại các đối tượng thỏa mãn chính xác điều kiện. Kết quả của các truy vấn này là
một danh sách các đối tượng được xếp hạng theo thứ tự giảm dần của độ tương tự với truy vấn người dùng.
Do bản chất chủ quan của các truy vấn “Top-k”, các đối tượng trả về bởi hệ thống so với truy vấn người dùng
thường không thỏa mãn nhu cầu thông tin của người dùng ngay lập tức [1, 2, 3]. Điều này là do một số lý do: các ảnh truy
vấn ban đầu không phải là các ảnh tốt nhất để biểu diễn nhu cầu thông tin của người dùng hoặc các đặc trưng mức thấp
không phản ánh được thông tin ngữ nghĩa của ảnh hoặc hàm khoảng cách kết hợp với các đặc trưng không thể hiện được
nhận thức của người dùng. Quá trình này được gọi là điều chỉnh truy vấn và truy vấn mới được gọi là “truy vấn điều
chỉnh”. Trong tra cứu ảnh dựa vào nội dung, người dùng điều chỉnh truy vấn bằng việc tìm trong số các ảnh được trả về,
một hoặc nhiều ảnh mà gần với những gì người dùng mong muốn [4, 5, 6]. Dựa trên phản hồi của người dùng, hệ thống sẽ
tính các ảnh truy vấn mới và các trọng số mới và thực hiện truy vấn điều chỉnh. Một cách khác để điều chỉnh truy vấn là
người dùng điều chỉnh các trọng số của các đặc trưng một cách thủ công để biểu diễn tốt nhất nhận thức về độ tương tự
của người dùng [6]. Trong cả hai trường hợp, người dùng có thể tiếp tục điều chỉnh truy vấn trên nhiều vòng lặp cho đến
khi thỏa mãn với các kết quả. Các nghiên cứu gần đây chỉ ra rằng các kỹ thuật điều chỉnh truy vấn cải tiến đáng kể chất
lượng của tập kết quả và tập kết quả cải tiến qua các lần lặp phản hồi [7, 8].
Giới hạn của nhiều cách tiếp cận dựa vào đặc trưng đã có đó là giới hạn người dùng đối với một đặc trưng đơn
được sử dụng cho tra cứu [8]. Các hệ thống hỗ trợ các truy vấn đa đặc trưng cung cấp các cơ chế đặc biệt cho người dùng
để chỉ ra độ quan trọng trong các đặc trưng [5, 9, 10]. Độ tương tự toàn bộ giữa một đối tượng và ảnh truy vấn được tính
toán bằng tổng có trọng số các độ tương tự trên tập đặc trưng. Có một số hạn chế đối với một cách tiếp cận như thế [1, 2,
3]. Nó đặt quá nhiều gánh nặng lên người dùng khi xây dựng nhu cầu thông tin chính xác. Người dùng có thể khó biểu
diễn truy vấn của họ dưới dạng các đặc trưng được cung cấp do ban đầu họ có thể không có ý tưởng rõ ràng về nhu cầu
thông tin. Với hạn chế thứ nhất và thứ hai khi người dùng gửi ảnh truy vấn ban đầu không phải là các ảnh tốt nhất để biểu
diễn nhu cầu thông tin của người dùng và các đặc trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh. Hơn
nữa, có thể có sự không phù hợp giữa nhận thức của người dùng về các thuộc tính trực quan và các biểu diễn đặc trưng
được sử dụng cho tra cứu. Những người dùng khác nhau có thể có nhận thức khác nhau về khái niệm tương tự giữa các
thuộc tính ảnh. Cuối cùng, thậm chí nó còn không khả thi để biểu diễn nhu cầu thông tin của người dùng bằng một kết hợp
có trọng số các đặc trưng của một ảnh truy vấn đơn. Các cách tiếp cận này cố định biểu diễn truy vấn và hàm đối sánh
tương tự cũng làm cho hệ thống rất cứng nhắc.
Bài báo đưa ra cách khắc phục hạn chế trên, đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức bằng
việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu trong
không gian đặc trưng. Chúng tôi cho phép người dùng chọn trọng số các ảnh trả về, những ảnh mà họ cho là thỏa mãn nhu
cầu thông tin của họ nhất và sau đó tính lại biểu diễn của truy vấn dựa trên sự phản hồi này. Phương pháp đề xuất tính toán
độ phân tán của các điểm dữ liệu do người dùng lựa chọn trên không gian đặc trưng để xác định mong muốn của người
dùng về chiều dữ liệu quan trọng.
Phần còn lại của bài báo này được tổ chức như sau: Trình bày chi tiết phương pháp đề xuất, mô tả các kết quả thực
nghiệm tương ứng trong phần hai và ba, cuối cùng là kết luận sẽ được đưa ra trong phần bốn.
462 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC
II. PHƯƠNG PHÁP TRA CỨU ẢNH VỚI ĐIỀU CHỈNH TRUY VẤN
A. Mô hình đề xuất
Trong số k ảnh được trả về bởi việc thực hiện truy vấn khởi tạo, người dùng sẽ chọn n ảnh liên quan. Trên không
gian đặc trưng F, tính giá trị trung bình của n đối tượng ảnh (theo từng đặc trưng) và thay biểu diễn trong không gian đặc
trưng F của truy vấn khởi tạo bằng biểu diễn tương ứng với giá trị trung bình vừa tính được. Lặp lại quá trình này chúng ta
sẽ nhận được điểm truy vấn tối ưu trong không gian đặc trưng F. Đến đây, chúng ta đã nhận được truy vấn tối ưu nhưng độ
quan trọng của các chiều dữ liệu trong không gian đặc trưng F vẫn chưa theo mong muốn của người dùng. Do đó, tính
phương sai của các dữ liệu trong không gian đặc trưng F theo mỗi chiều dữ liệu để xác định độ quan trọng của mỗi chiều
dữ liệu trong không gian đặc trưng này (phương sai càng lớn, độ phân tán dữ liệu càng lớn và vì thế chiều đó sẽ ít quan
trọng) là cần thiết.
Dưới đây chúng tôi sẽ đề cập tới ba thuật toán thể hiện ý tưởng trên, thuật toán QRR tìm truy vấn tối ưu, thuật toán
SIDFS tính độ quan quan theo chiều dữ liệu trên không gian đặc trưng và thuật toán IRuPS tính độ tương tự theo nhận
thức.
Thuật toán 1: QRR (Query Representation Refinement)
Đầu vào:
S /*Tập các véc tơ đặc trưng ảnh cơ sở dữ liệu*/
F /* Tập các đặc trưng */
m /*Chiều của không gian đặc trưng*/
Kết quả:
qopt /*Véc tơ truy vấn tối ưu*/
For F∈F do
{
QF= /* Thực hiện truy vấn khởi tạo đơn điểm với k ảnh trả về*/
While User chưa dừng phản hồi do
{
For j=1 to m do */ m số chiều của không gian đặc trưng*/
{
SumF=0
SumwF=0
For i=1 to n do
{
ܧ௜ி=User_Choose_RelevanceImage(QF, k) /* User chọn n đối tượng, E1,Ei,En
liên quan trong số k đối tượng trả về*/
ݓ௜ி=User_Choose_RelevanceLevel({1,2,3})
SumF=SumF+ݓ௜ ܧ௜ிሾ݆ሿ
SumwF=SumwF+ݓ௜
}
CF[j]= ௌ௨௠
ಷ
ௌ௨௠௪ಷ
}
}
ݍ௢௣௧ி =CF /* véc tơ truy vấn tối ưu trên không gian đặc trưng F*/
}
Return qopt
Hình 1. Thuật toán điều chỉnh biểu diễn truy vấn QRR
Thuật toán 1 (QRR) điều chỉnh biểu diễn truy vấn được thực hiện như sau: Trên không gian đặc trưng F, người
dùng thực hiện việc nhập vào một ảnh truy vấn mẫu q0 và thực hiện truy vấn này trên tập cơ sở dữ liệu đặc trưng S để được
k ảnh kết quả. Quan sát trên k ảnh kết quả này, người dùng chọn n ảnh liên quan so với ảnh truy vấn và gần với nhu cầu
thông tin của mình, với mỗi ảnh liên quan chọn giá trị trọng số wi (một mức liên quan trong các mức 0: không liên quan –
mặc định không chọn, 1: liên quan và 2: liên quan cao, 4: liên quan rất cao). Trên cơ sở các ảnh được chọn và giá trị wi
được nhập, thuật toán tính trọng tâm C theo chiều mỗi chiều j. Kết thúc một lần lặp phản hồi của người dùng là véc tơ
trọng tâm CF gồm m chiều, cũng chính là véc tơ truy vấn tối ưu ݍ௢௣௧ி trên không gian F của lần lặp này. Lặp lại quá trình
trên một số lần, thuật toán sẽ cho ra véc tơ truy vấn tối ưu qopt.
Thuật toán SIDFS (Hình 2) tính độ quan trọng của chiều dữ liệu trong không gian đặc trưng F.
Vũ Văn Hiệu, Nguyễn Hữu Quỳnh, Ngô Quốc Tạo 463
Thuật toán 2: SIDFS (Select Important Dimensions in Feature Space)
Đầu vào:
E /*Tập n ảnh do User chọn*/
F /*Tập các đặc trưng*/
m /*Chiều của không gian đặc trưng*/
Đầu ra:
Weight_j /*Độ quan trọng theo chiều j*/
For F∈F do
{
For j=1 to m do
{
ߤ௝ ൌ ଵ௡ ∑ ܧ௜ிሾ݆ሿ௡௜ୀଵ
ߪ௝ி ൌ ሺଵ௡ ∑ ሺܧ௜ிሾ݆ሿ െ ߤ௝ሻଶሻ௡௜ୀଵ
ଵ/ଶ
Weight_j = ଵఙೕಷ
/* trọng số theo chiều j*/
}
}
Hình 2. Thuật toán tính độ quan trọng của chiều dữ liệu SIDFS.
Thuật toán 2 SIDFS tính độ quan trọng của chiều dữ liệu được thực hiện như sau: Thuật toán lấy đầu vào là n ảnh
ܧଵி, ܧ௜ி,ܧ௡ி tương tự nhận thức với truy vấn tối ưu ݍ௢௣௧ி (đầu ra của thuật toán 1) trên không gian F. Lúc này, theo
chiều thứ j của không gian đặc trưng F sẽ có n điểm dữ liệu ܧଵிሾ݆ሿ, ܧ௜ிሾ݆ሿ, ܧ௡ிሾ݆ሿ và thuật toán tính phương sai ߪ௝ி của n
điểm dữ liệu này theo chiều j của không gian F. Sau khi tính được giá trị của phương sai ߪ௝ி, thuật toán đưa ra độ quan
trọng của từng chiều dữ liệu j trong không gian đặc trưng F bởi vì ߪ௝ி lớn có nghĩa là độ phân tán dữ liệu theo chiều j trong
không gian đặc trưng F lớn, cũng có nghĩa là độ quan trọng của chiều j trong không gian đặc trưng F nhỏ. Do đó độ quan
trọng dữ liệu theo chiều j sẽ được tính bằng ଵఙೕಷ
và gán cho Weight_j.
Thuật toán IRuPS (Hình 3) tra cứu ảnh dựa vào độ tương tự nhận thức cho ra tập kết quả gồm các ảnh có độ tương
tự nhận thức cao nhất với truy vấn. Thuật toán IRuPS được thực hiện như sau: Với đầu vào là véc tơ truy vấn tối ưu qopt
(đầu ra của thuật toán 1) và trọng số Weight_j (đầu ra của thuật toán 2) của chiều j trên không gian đặc trưng F, thuật toán
tính khoảng cách giữa truy vấn tối ưu ݍ௢௣௧ி với mỗi ảnh ݏ௜ி. Khoảng cách này được tính theo từng chiều j với độ quan trọng
Weight_j được đưa vào công thức tính khoảng cách. Cuối cùng thuật toán trả lại k ảnh, k ảnh này tương tự về mặt nhận
thức nhất với qopt bởi vì khoảng cách được tính dựa vào hai yếu tố: (1) véc tơ truy vấn qopt có véc tơ đặc trưng gần với nhu
cầu thông tin của người dùng và (2) độ quan trọng của chiều dữ liệu trong không gian đặc trưng được cập nhật tự động.
Thuật toán 3: IRuPS (Image Retrieval using Perceived Similarity)
Đầu vào:
S /*Tập các ảnh*/
qopt /*Véc tơ truy vấn tối ưu*/
Weight_j /*Trọng số chiều j của không gian đặc trưng F*/
Đầu ra:
P /* Tập k ảnh tương tự nhận thức với qopt */
For F∈F do
{
For i=1 to ImageCount(S) do
{
Similarity(ݍ௢௣௧ி , ݏ௜ி)=0
For j=1 to m do
Similarity(ݍ௢௣௧ி , ݏ௜ி)=(Similarity(ݍ௢௣௧ி , ݏ௜ி)+(1-Weight_j*ሺݍ௢௣௧ி ሾ݆ሿ െ ݏ௜ிሾ݆ሿሻଶ)1/2) /*cập nhật trọng số theo
chiều j*/
}
}
/*Sắp xếp các ảnh si trong cơ sở dữ liệu theo thứ tự giảm dần của độ tương tự so với qopt */
Return P /* k ảnh tương tự nhất (về mặt nhận thức) với qopt */
Hình 3. Thuật toán tra cứu ảnh dựa vào độ tương tự nhận thức IRuPS
464 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC
III. THỰC NGHIỆM
A. Dữ liệu thực nghiệm
Chúng tôi sử dụng tập dữ liệu con của tập Corel[11] gồm 10,800 ảnh. Tập dữ liệu trên được chia thành 80 chủ đề
gồm: biển, thẻ, ngựa, bướm, hoa, vận động viên thể thao, lướt ván, thuyền buồm, hoa quả, cờ, chim, nhà, thác nước, gấu,
linh dương đầu bò, ô tô, núi và hoàng hôn, cánh rừng,...
Các ảnh được lưu trữ theo định dạng JPEG với cỡ 120×80. Cơ sở dữ liệu này sẽ được sử dụng để minh chứng sự
chính xác của kỹ thuật. Thực nghiệm được cài đặt trên ngôn ngữ C# trên một máy tính PC Core i3 M350 2.27 GHz 2.27
GHz chạy hệ điều hành Windows 7.
Để phân tích tính hiệu quả cho cách tiếp cận đề xuất của chúng tôi, chỉ tiêu được sử dụng là độ chính xác và triệu
hồi, đó là hai độ đo để đánh giá thực nghiệm, chúng được định nghĩa là:
)(
)(
Rarea
Rarearecall A= và
)(
)(
Aarea
Rareaprecision A=
Triệu hồi (Recall) là tỷ số của các ảnh liên quan trong cơ sở dữ liệu được tra cứu theo một truy vấn. Độ chính xác
(Precision) là tỷ số của các ảnh được tra cứu mà liên quan đến ảnh truy vấn.
Trong đó độ chính xác là tập ảnh tích cực với ảnh truy vấn ở mỗi vòng lặp phản hồi, tra cứu là tập ảnh kết quả trả
về từ cách tiếp cận đề xuất ở mỗi phản hồi.
Ký hiệu R là một tập các ảnh liên quan trong cơ sở dữ liệu, A là tập các ảnh tra cứu được trả về, RA là tập các ảnh
liên quan trong tập A (Hình 4).
Hình 4. Triệu hồi và chính xác cho các kết quả truy vấn
B. Kết quả thực nghiệm
Trong thực nghiệm ba đặc trưng gồm Color Histogram, Color Intensity và Textual được sử dụng để tính độ tương
tự của ảnh truy vấn với từng ảnh trong cơ sở dữ liệu. Trong mỗi lần lặp phản hồi, để tìm truy vấn tối ưu chúng tôi sử dụng
trọng số w biểu diễn mối quan hệ quan trọng với truy vấn. Để tìm ra truy vấn tối ưu và các trọng số quan trọng của chiều,
chúng tôi chỉ tập trung quan sát trên tập các đối tượng liên quan. Từ tập các đối tượng liên quan, thuật toán 1 và thuật toán
2 được áp dụng để tìm ra truy vấn tối ưu và trọng số quan trọng của chiều. Do vậy, trọng số chỉ mức quan hệ được đề xuất
gồm 4 mức: 0, 1, 2 và 4 tương ứng với ý nghĩa không liên quan, liên quan, liên quan cao và liên quan rất cao. Chúng tôi đã
so sánh nghiên cứu này với một số nghiên cứu phản hồi liên quan đang tồn tại như là phương pháp Naïve QP[4] và Naïve
QR[5]. Để cung cấp các kết quả đáng tin cậy, chúng tôi sử dụng tập thử nghiệm gồm 1000 ảnh ngẫu nhiên trong 80 chủ đề
nói trên. Các ảnh trong tập thử nghiệm được sử dụng lần lượt như ảnh truy vấn của IRuPS, Naïve QR và Naïve QP để chỉ
ra hiệu quả của IRuPS. Bảng 1 dưới đây là kết quả trung bình của mỗi lần lặp đối với các phương pháp IRuPS, Naïve QR
và Naïve QP.
Bảng 1. Trung bình độ chính xác của cách tiếp cận khác nhau trên tập thử nghiệm 1000 ảnh
Vòng
lặp IRuPS
Naïve
QR
Naïve
QP
1 0.7448 0.7448 0.7028
2 0.84985 0.7621 0.76535
3 0.90145 0.84765 0.79675
4 0.92935 0.8805 0.8225
5 0.94725 0.90125 0.84095
6 0.96015 0.91725 0.85645
7 0.96855 0.92625 0.8686
Kết quả bảng 1 cho thấy trung bình độ chính xác của các phương pháp IRuPS, Naïve QR và Naïve QP qua 7 lần lặp
phản hồi tương ứng là 90.02%, 85.42% và 80.76%, từ đó chỉ ra rằng kỹ thuật đề xuất cải thiện độ chính xác đáng kể.
Hình 5 cho biết lược đồ so sánh độ chính xác trên 7 lần lặp phản hồi tương ứng của các phương pháp IRuPS, Naïve
QR và Naïve QP.
Vũ Văn Hiệu, Nguyễn Hữu Quỳnh, Ngô Quốc Tạo 465
Hình 5. So sánh độ chính xác của IRuPS, Naïve QR và Naïve QP
Để minh họa kết quả sau một số lần lặp phản hồi, hình 6,7 và 8 dưới đây chúng tôi minh họa ảnh hoàng hôn sử
dụng làm ảnh truy vấn trên cả ba phương pháp IRuPS, Naïve QR và Naïve QP tương ứng. Kết quả ở lần lặp thứ sáu minh
họa cho thấy kỹ thuật đề xuất cải thiện độ chính xác đáng kể.
Hình 6. Những ảnh tìm thấy bởi kỹ thuật Naïve QR
Hình 7. Những ảnh tìm thấy bởi kỹ thuật Naïve QP
0
0.2
0.4
0.6
0.8
1
1.2
1 2 3 4 5 6 7
Naïve QP
Naïve QR
IRuPS
466 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC
Hình 8. Những ảnh tìm thấy bởi kỹ thuật IRuPS
IV. KẾT LUẬN
Chúng tôi đã phát triển phương pháp tra cứu ảnh IRuPS dựa vào nhận thức của người dùng và phản hồi liên quan.
Phương pháp này có hai ưu điểm: yêu cầu người dùng suy nghĩ trong tâm trí ảnh đối tượng cần tìm mà không cần miêu tả
cụ thể và đánh giá ảnh đối tượng trong mỗi lần tra cứu bằng cách đưa vào các mức độ liên quan. Qua mỗi lần lặp phản hồi,
dựa trên các đối tượng mà người dùng lựa chọn, hệ thống tự động học thông tin bằng việc đánh giá chiều quan trọng. Dựa
trên trọng số quan trọng của mỗi chiều, hệ thống đã cho kết quả gần với nhu cầu tra cứu của người dùng.
V. TÀI LIỆU THAM KHẢO
[1] Flickner, Myron, Et Al. "Query by Image and Video Content: The QBIC System."Computer 28.9 (1995): 23-32.
[2] Bach, Jeffrey R., Et Al. "Virage Image Search Engine: An Open Framework For Image Management." Electronic
Imaging: Science & Technology. International Society For Optics And Photonics, 1996.
[3] Rui, Yong, et al. "Relevance feedback: a power tool for interactive content-based image retrieval." Circuits and
Systems for Video Technology, IEEE Transactions on 8.5 (1998): 644-655.
[4] Y. Rui, T. Huang, And S. Mehrotra. Content-Based Image Retrieval With Relevance Feedback in Mars. Proc. Of Ieee
Int. Conf. On Image Processing, 1997.
[5] K. Porkaew, K. Chakrabarti, And S. Mehrotra. Query Refinement For Content-Based Multimedia Retrieval in Mars.
Proceedings Of Acm Multimedia Conference, 1999.
[6] Y. Ishikawa, R. Subramanya, and C. Faloutsos. Mindreader: Querying Databases Through Multiple Examples. Proc. of
Vldb, 1998.
[7] K. Chakrabarti, K. Porkaew, And S. Mehrotra. Efficient Query Refinement in Multimedia Databases. Proceedings Of
International Conference In Data Engineering(Icde), 2000.
[8] Wu, Leejay, et al. "Multimedia queries by example and relevance feedback." IEEE Data Engineering Bulletin 24.3
(2001): 14-21.
[9] Chakrabarti, Kaushik, et al. "Evaluating refined queries in top-k retrieval systems." Knowledge and Data Engineering,
IEEE Transactions on 16.2 (2004): 256-270.
[10] Luo, Xin, Guowen Wu, and Kenji Kita. "Learning distance metrics with feature space performance for image
retrieval." Proceedings of the 2013 International Conference on Electrical and Information Technologies for Rail
Transportation (EITRT2013)-Volume II. Springer Berlin Heidelberg, 2014
[11]
AN IMAGE RETRIEVAL METHODS BASED ON PERCEIVED SIMILARITY
Vu Van Hieu, Nguyen Huu Quynh, Ngo Quoc Tao
ABSTRACT - Content-based image retrieval systems, the returned results are not satisfying the user's information needs. This
restriction is due to: (1) query image is not fully represent the information needs of users, (2) low level features does not reflect the
semantic information of image and (3) distance function combined with the features can not be perceived by the user. To overcome such
limitations, we propose image retrieval method based on similarity perception by developing optimal query from user feedback. We
have experimental database includes 10,800 images from Corel subset. The experimental results indicate that this technique improved
content-based image retrieval system performance compared with the exit method and the results have been close to the perception of
users.

File đính kèm:

mot_phuong_phap_tra_cuu_anh_dua_vao_do_tuong_tu_nhan_thuc.pdf