Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức
TÓM TẮT - Trong các hệ thống tra cứu ảnh dựa vào nội dung, các kết quả trả về thường không thỏa mãn nhu cầu thông tin
của người dùng. Có hạn chế này là do: (1) ảnh truy vấn không biểu diễn được đầy đủ nhu cầu thông tin của người dùng, (2) các đặc
trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh và (3) hàm khoảng cách kết hợp với các đặc trưng không thể hiện
được nhận thức của người dùng. Để khắc phục hạn chế đó, chúng tôi đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận
thức bằng việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu
trong không gian đặc trưng. Chúng tôi đã thực nghiệm trên cơ sở dữ liệu ảnh gồm 10.800 ảnh. Các kết quả thực nghiệm chỉ ra rằng
kỹ thuật này cải tiến được hiệu năng của hệ thống tra cứu ảnh dựa vào nội dung so với phương pháp đã có và cho kết quả gần với
nhận thức của người dùng.
Tóm tắt nội dung tài liệu: Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức
Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 DOI: 10.15625/vap.2015.000181 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC Vũ Văn Hiệu1, Nguyễn Hữu Quỳnh2, Ngô Quốc Tạo3 1 Khoa Công nghệ Thông tin, Trường Đại học Hải Phòng 2 Khoa Công nghệ Thông tin, Trường Đại học Điện lực 3Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam hieuvvdhhp@gmail.com, quynhnh@epu.edu.vn, nqtao@ioit.ac.vn TÓM TẮT - Trong các hệ thống tra cứu ảnh dựa vào nội dung, các kết quả trả về thường không thỏa mãn nhu cầu thông tin của người dùng. Có hạn chế này là do: (1) ảnh truy vấn không biểu diễn được đầy đủ nhu cầu thông tin của người dùng, (2) các đặc trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh và (3) hàm khoảng cách kết hợp với các đặc trưng không thể hiện được nhận thức của người dùng. Để khắc phục hạn chế đó, chúng tôi đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức bằng việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu trong không gian đặc trưng. Chúng tôi đã thực nghiệm trên cơ sở dữ liệu ảnh gồm 10.800 ảnh. Các kết quả thực nghiệm chỉ ra rằng kỹ thuật này cải tiến được hiệu năng của hệ thống tra cứu ảnh dựa vào nội dung so với phương pháp đã có và cho kết quả gần với nhận thức của người dùng. Từ khóa - Tra cứu ảnh dựa vào nội dung, tương tự nhận thức, véc tơ đặc trưng. I. GIỚI THIỆU Các truy vấn lựa chọn “Top-k” đang trở nên phổ biến trong nhiều ứng dụng cơ sở dữ liệu hiện đại. Không như các hệ cơ sở dữ liệu quan hệ truyền thống, ở đó một truy vấn gồm một điều kiện lựa chọn chính xác và người dùng kỳ vọng nhận lại tập các đối tượng thỏa mãn chính xác điều kiện, trong các truy vấn lựa chọn “Top-k”, người dùng chỉ rõ các đối tượng mục tiêu và không kỳ vọng nhận lại các đối tượng thỏa mãn chính xác điều kiện. Kết quả của các truy vấn này là một danh sách các đối tượng được xếp hạng theo thứ tự giảm dần của độ tương tự với truy vấn người dùng. Do bản chất chủ quan của các truy vấn “Top-k”, các đối tượng trả về bởi hệ thống so với truy vấn người dùng thường không thỏa mãn nhu cầu thông tin của người dùng ngay lập tức [1, 2, 3]. Điều này là do một số lý do: các ảnh truy vấn ban đầu không phải là các ảnh tốt nhất để biểu diễn nhu cầu thông tin của người dùng hoặc các đặc trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh hoặc hàm khoảng cách kết hợp với các đặc trưng không thể hiện được nhận thức của người dùng. Quá trình này được gọi là điều chỉnh truy vấn và truy vấn mới được gọi là “truy vấn điều chỉnh”. Trong tra cứu ảnh dựa vào nội dung, người dùng điều chỉnh truy vấn bằng việc tìm trong số các ảnh được trả về, một hoặc nhiều ảnh mà gần với những gì người dùng mong muốn [4, 5, 6]. Dựa trên phản hồi của người dùng, hệ thống sẽ tính các ảnh truy vấn mới và các trọng số mới và thực hiện truy vấn điều chỉnh. Một cách khác để điều chỉnh truy vấn là người dùng điều chỉnh các trọng số của các đặc trưng một cách thủ công để biểu diễn tốt nhất nhận thức về độ tương tự của người dùng [6]. Trong cả hai trường hợp, người dùng có thể tiếp tục điều chỉnh truy vấn trên nhiều vòng lặp cho đến khi thỏa mãn với các kết quả. Các nghiên cứu gần đây chỉ ra rằng các kỹ thuật điều chỉnh truy vấn cải tiến đáng kể chất lượng của tập kết quả và tập kết quả cải tiến qua các lần lặp phản hồi [7, 8]. Giới hạn của nhiều cách tiếp cận dựa vào đặc trưng đã có đó là giới hạn người dùng đối với một đặc trưng đơn được sử dụng cho tra cứu [8]. Các hệ thống hỗ trợ các truy vấn đa đặc trưng cung cấp các cơ chế đặc biệt cho người dùng để chỉ ra độ quan trọng trong các đặc trưng [5, 9, 10]. Độ tương tự toàn bộ giữa một đối tượng và ảnh truy vấn được tính toán bằng tổng có trọng số các độ tương tự trên tập đặc trưng. Có một số hạn chế đối với một cách tiếp cận như thế [1, 2, 3]. Nó đặt quá nhiều gánh nặng lên người dùng khi xây dựng nhu cầu thông tin chính xác. Người dùng có thể khó biểu diễn truy vấn của họ dưới dạng các đặc trưng được cung cấp do ban đầu họ có thể không có ý tưởng rõ ràng về nhu cầu thông tin. Với hạn chế thứ nhất và thứ hai khi người dùng gửi ảnh truy vấn ban đầu không phải là các ảnh tốt nhất để biểu diễn nhu cầu thông tin của người dùng và các đặc trưng mức thấp không phản ánh được thông tin ngữ nghĩa của ảnh. Hơn nữa, có thể có sự không phù hợp giữa nhận thức của người dùng về các thuộc tính trực quan và các biểu diễn đặc trưng được sử dụng cho tra cứu. Những người dùng khác nhau có thể có nhận thức khác nhau về khái niệm tương tự giữa các thuộc tính ảnh. Cuối cùng, thậm chí nó còn không khả thi để biểu diễn nhu cầu thông tin của người dùng bằng một kết hợp có trọng số các đặc trưng của một ảnh truy vấn đơn. Các cách tiếp cận này cố định biểu diễn truy vấn và hàm đối sánh tương tự cũng làm cho hệ thống rất cứng nhắc. Bài báo đưa ra cách khắc phục hạn chế trên, đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức bằng việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu trong không gian đặc trưng. Chúng tôi cho phép người dùng chọn trọng số các ảnh trả về, những ảnh mà họ cho là thỏa mãn nhu cầu thông tin của họ nhất và sau đó tính lại biểu diễn của truy vấn dựa trên sự phản hồi này. Phương pháp đề xuất tính toán độ phân tán của các điểm dữ liệu do người dùng lựa chọn trên không gian đặc trưng để xác định mong muốn của người dùng về chiều dữ liệu quan trọng. Phần còn lại của bài báo này được tổ chức như sau: Trình bày chi tiết phương pháp đề xuất, mô tả các kết quả thực nghiệm tương ứng trong phần hai và ba, cuối cùng là kết luận sẽ được đưa ra trong phần bốn. 462 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC II. PHƯƠNG PHÁP TRA CỨU ẢNH VỚI ĐIỀU CHỈNH TRUY VẤN A. Mô hình đề xuất Trong số k ảnh được trả về bởi việc thực hiện truy vấn khởi tạo, người dùng sẽ chọn n ảnh liên quan. Trên không gian đặc trưng F, tính giá trị trung bình của n đối tượng ảnh (theo từng đặc trưng) và thay biểu diễn trong không gian đặc trưng F của truy vấn khởi tạo bằng biểu diễn tương ứng với giá trị trung bình vừa tính được. Lặp lại quá trình này chúng ta sẽ nhận được điểm truy vấn tối ưu trong không gian đặc trưng F. Đến đây, chúng ta đã nhận được truy vấn tối ưu nhưng độ quan trọng của các chiều dữ liệu trong không gian đặc trưng F vẫn chưa theo mong muốn của người dùng. Do đó, tính phương sai của các dữ liệu trong không gian đặc trưng F theo mỗi chiều dữ liệu để xác định độ quan trọng của mỗi chiều dữ liệu trong không gian đặc trưng này (phương sai càng lớn, độ phân tán dữ liệu càng lớn và vì thế chiều đó sẽ ít quan trọng) là cần thiết. Dưới đây chúng tôi sẽ đề cập tới ba thuật toán thể hiện ý tưởng trên, thuật toán QRR tìm truy vấn tối ưu, thuật toán SIDFS tính độ quan quan theo chiều dữ liệu trên không gian đặc trưng và thuật toán IRuPS tính độ tương tự theo nhận thức. Thuật toán 1: QRR (Query Representation Refinement) Đầu vào: S /*Tập các véc tơ đặc trưng ảnh cơ sở dữ liệu*/ F /* Tập các đặc trưng */ m /*Chiều của không gian đặc trưng*/ Kết quả: qopt /*Véc tơ truy vấn tối ưu*/ For F∈F do { QF= /* Thực hiện truy vấn khởi tạo đơn điểm với k ảnh trả về*/ While User chưa dừng phản hồi do { For j=1 to m do */ m số chiều của không gian đặc trưng*/ { SumF=0 SumwF=0 For i=1 to n do { ܧி=User_Choose_RelevanceImage(QF, k) /* User chọn n đối tượng, E1,Ei,En liên quan trong số k đối tượng trả về*/ ݓி=User_Choose_RelevanceLevel({1,2,3}) SumF=SumF+ݓ ܧிሾ݆ሿ SumwF=SumwF+ݓ } CF[j]= ௌ௨ ಷ ௌ௨௪ಷ } } ݍ௧ி =CF /* véc tơ truy vấn tối ưu trên không gian đặc trưng F*/ } Return qopt Hình 1. Thuật toán điều chỉnh biểu diễn truy vấn QRR Thuật toán 1 (QRR) điều chỉnh biểu diễn truy vấn được thực hiện như sau: Trên không gian đặc trưng F, người dùng thực hiện việc nhập vào một ảnh truy vấn mẫu q0 và thực hiện truy vấn này trên tập cơ sở dữ liệu đặc trưng S để được k ảnh kết quả. Quan sát trên k ảnh kết quả này, người dùng chọn n ảnh liên quan so với ảnh truy vấn và gần với nhu cầu thông tin của mình, với mỗi ảnh liên quan chọn giá trị trọng số wi (một mức liên quan trong các mức 0: không liên quan – mặc định không chọn, 1: liên quan và 2: liên quan cao, 4: liên quan rất cao). Trên cơ sở các ảnh được chọn và giá trị wi được nhập, thuật toán tính trọng tâm C theo chiều mỗi chiều j. Kết thúc một lần lặp phản hồi của người dùng là véc tơ trọng tâm CF gồm m chiều, cũng chính là véc tơ truy vấn tối ưu ݍ௧ி trên không gian F của lần lặp này. Lặp lại quá trình trên một số lần, thuật toán sẽ cho ra véc tơ truy vấn tối ưu qopt. Thuật toán SIDFS (Hình 2) tính độ quan trọng của chiều dữ liệu trong không gian đặc trưng F. Vũ Văn Hiệu, Nguyễn Hữu Quỳnh, Ngô Quốc Tạo 463 Thuật toán 2: SIDFS (Select Important Dimensions in Feature Space) Đầu vào: E /*Tập n ảnh do User chọn*/ F /*Tập các đặc trưng*/ m /*Chiều của không gian đặc trưng*/ Đầu ra: Weight_j /*Độ quan trọng theo chiều j*/ For F∈F do { For j=1 to m do { ߤ ൌ ଵ ∑ ܧிሾ݆ሿୀଵ ߪி ൌ ሺଵ ∑ ሺܧிሾ݆ሿ െ ߤሻଶሻୀଵ ଵ/ଶ Weight_j = ଵఙೕಷ /* trọng số theo chiều j*/ } } Hình 2. Thuật toán tính độ quan trọng của chiều dữ liệu SIDFS. Thuật toán 2 SIDFS tính độ quan trọng của chiều dữ liệu được thực hiện như sau: Thuật toán lấy đầu vào là n ảnh ܧଵி, ܧி,ܧி tương tự nhận thức với truy vấn tối ưu ݍ௧ி (đầu ra của thuật toán 1) trên không gian F. Lúc này, theo chiều thứ j của không gian đặc trưng F sẽ có n điểm dữ liệu ܧଵிሾ݆ሿ, ܧிሾ݆ሿ, ܧிሾ݆ሿ và thuật toán tính phương sai ߪி của n điểm dữ liệu này theo chiều j của không gian F. Sau khi tính được giá trị của phương sai ߪி, thuật toán đưa ra độ quan trọng của từng chiều dữ liệu j trong không gian đặc trưng F bởi vì ߪி lớn có nghĩa là độ phân tán dữ liệu theo chiều j trong không gian đặc trưng F lớn, cũng có nghĩa là độ quan trọng của chiều j trong không gian đặc trưng F nhỏ. Do đó độ quan trọng dữ liệu theo chiều j sẽ được tính bằng ଵఙೕಷ và gán cho Weight_j. Thuật toán IRuPS (Hình 3) tra cứu ảnh dựa vào độ tương tự nhận thức cho ra tập kết quả gồm các ảnh có độ tương tự nhận thức cao nhất với truy vấn. Thuật toán IRuPS được thực hiện như sau: Với đầu vào là véc tơ truy vấn tối ưu qopt (đầu ra của thuật toán 1) và trọng số Weight_j (đầu ra của thuật toán 2) của chiều j trên không gian đặc trưng F, thuật toán tính khoảng cách giữa truy vấn tối ưu ݍ௧ி với mỗi ảnh ݏி. Khoảng cách này được tính theo từng chiều j với độ quan trọng Weight_j được đưa vào công thức tính khoảng cách. Cuối cùng thuật toán trả lại k ảnh, k ảnh này tương tự về mặt nhận thức nhất với qopt bởi vì khoảng cách được tính dựa vào hai yếu tố: (1) véc tơ truy vấn qopt có véc tơ đặc trưng gần với nhu cầu thông tin của người dùng và (2) độ quan trọng của chiều dữ liệu trong không gian đặc trưng được cập nhật tự động. Thuật toán 3: IRuPS (Image Retrieval using Perceived Similarity) Đầu vào: S /*Tập các ảnh*/ qopt /*Véc tơ truy vấn tối ưu*/ Weight_j /*Trọng số chiều j của không gian đặc trưng F*/ Đầu ra: P /* Tập k ảnh tương tự nhận thức với qopt */ For F∈F do { For i=1 to ImageCount(S) do { Similarity(ݍ௧ி , ݏி)=0 For j=1 to m do Similarity(ݍ௧ி , ݏி)=(Similarity(ݍ௧ி , ݏி)+(1-Weight_j*ሺݍ௧ி ሾ݆ሿ െ ݏிሾ݆ሿሻଶ)1/2) /*cập nhật trọng số theo chiều j*/ } } /*Sắp xếp các ảnh si trong cơ sở dữ liệu theo thứ tự giảm dần của độ tương tự so với qopt */ Return P /* k ảnh tương tự nhất (về mặt nhận thức) với qopt */ Hình 3. Thuật toán tra cứu ảnh dựa vào độ tương tự nhận thức IRuPS 464 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC III. THỰC NGHIỆM A. Dữ liệu thực nghiệm Chúng tôi sử dụng tập dữ liệu con của tập Corel[11] gồm 10,800 ảnh. Tập dữ liệu trên được chia thành 80 chủ đề gồm: biển, thẻ, ngựa, bướm, hoa, vận động viên thể thao, lướt ván, thuyền buồm, hoa quả, cờ, chim, nhà, thác nước, gấu, linh dương đầu bò, ô tô, núi và hoàng hôn, cánh rừng,... Các ảnh được lưu trữ theo định dạng JPEG với cỡ 120×80. Cơ sở dữ liệu này sẽ được sử dụng để minh chứng sự chính xác của kỹ thuật. Thực nghiệm được cài đặt trên ngôn ngữ C# trên một máy tính PC Core i3 M350 2.27 GHz 2.27 GHz chạy hệ điều hành Windows 7. Để phân tích tính hiệu quả cho cách tiếp cận đề xuất của chúng tôi, chỉ tiêu được sử dụng là độ chính xác và triệu hồi, đó là hai độ đo để đánh giá thực nghiệm, chúng được định nghĩa là: )( )( Rarea Rarearecall A= và )( )( Aarea Rareaprecision A= Triệu hồi (Recall) là tỷ số của các ảnh liên quan trong cơ sở dữ liệu được tra cứu theo một truy vấn. Độ chính xác (Precision) là tỷ số của các ảnh được tra cứu mà liên quan đến ảnh truy vấn. Trong đó độ chính xác là tập ảnh tích cực với ảnh truy vấn ở mỗi vòng lặp phản hồi, tra cứu là tập ảnh kết quả trả về từ cách tiếp cận đề xuất ở mỗi phản hồi. Ký hiệu R là một tập các ảnh liên quan trong cơ sở dữ liệu, A là tập các ảnh tra cứu được trả về, RA là tập các ảnh liên quan trong tập A (Hình 4). Hình 4. Triệu hồi và chính xác cho các kết quả truy vấn B. Kết quả thực nghiệm Trong thực nghiệm ba đặc trưng gồm Color Histogram, Color Intensity và Textual được sử dụng để tính độ tương tự của ảnh truy vấn với từng ảnh trong cơ sở dữ liệu. Trong mỗi lần lặp phản hồi, để tìm truy vấn tối ưu chúng tôi sử dụng trọng số w biểu diễn mối quan hệ quan trọng với truy vấn. Để tìm ra truy vấn tối ưu và các trọng số quan trọng của chiều, chúng tôi chỉ tập trung quan sát trên tập các đối tượng liên quan. Từ tập các đối tượng liên quan, thuật toán 1 và thuật toán 2 được áp dụng để tìm ra truy vấn tối ưu và trọng số quan trọng của chiều. Do vậy, trọng số chỉ mức quan hệ được đề xuất gồm 4 mức: 0, 1, 2 và 4 tương ứng với ý nghĩa không liên quan, liên quan, liên quan cao và liên quan rất cao. Chúng tôi đã so sánh nghiên cứu này với một số nghiên cứu phản hồi liên quan đang tồn tại như là phương pháp Naïve QP[4] và Naïve QR[5]. Để cung cấp các kết quả đáng tin cậy, chúng tôi sử dụng tập thử nghiệm gồm 1000 ảnh ngẫu nhiên trong 80 chủ đề nói trên. Các ảnh trong tập thử nghiệm được sử dụng lần lượt như ảnh truy vấn của IRuPS, Naïve QR và Naïve QP để chỉ ra hiệu quả của IRuPS. Bảng 1 dưới đây là kết quả trung bình của mỗi lần lặp đối với các phương pháp IRuPS, Naïve QR và Naïve QP. Bảng 1. Trung bình độ chính xác của cách tiếp cận khác nhau trên tập thử nghiệm 1000 ảnh Vòng lặp IRuPS Naïve QR Naïve QP 1 0.7448 0.7448 0.7028 2 0.84985 0.7621 0.76535 3 0.90145 0.84765 0.79675 4 0.92935 0.8805 0.8225 5 0.94725 0.90125 0.84095 6 0.96015 0.91725 0.85645 7 0.96855 0.92625 0.8686 Kết quả bảng 1 cho thấy trung bình độ chính xác của các phương pháp IRuPS, Naïve QR và Naïve QP qua 7 lần lặp phản hồi tương ứng là 90.02%, 85.42% và 80.76%, từ đó chỉ ra rằng kỹ thuật đề xuất cải thiện độ chính xác đáng kể. Hình 5 cho biết lược đồ so sánh độ chính xác trên 7 lần lặp phản hồi tương ứng của các phương pháp IRuPS, Naïve QR và Naïve QP. Vũ Văn Hiệu, Nguyễn Hữu Quỳnh, Ngô Quốc Tạo 465 Hình 5. So sánh độ chính xác của IRuPS, Naïve QR và Naïve QP Để minh họa kết quả sau một số lần lặp phản hồi, hình 6,7 và 8 dưới đây chúng tôi minh họa ảnh hoàng hôn sử dụng làm ảnh truy vấn trên cả ba phương pháp IRuPS, Naïve QR và Naïve QP tương ứng. Kết quả ở lần lặp thứ sáu minh họa cho thấy kỹ thuật đề xuất cải thiện độ chính xác đáng kể. Hình 6. Những ảnh tìm thấy bởi kỹ thuật Naïve QR Hình 7. Những ảnh tìm thấy bởi kỹ thuật Naïve QP 0 0.2 0.4 0.6 0.8 1 1.2 1 2 3 4 5 6 7 Naïve QP Naïve QR IRuPS 466 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC Hình 8. Những ảnh tìm thấy bởi kỹ thuật IRuPS IV. KẾT LUẬN Chúng tôi đã phát triển phương pháp tra cứu ảnh IRuPS dựa vào nhận thức của người dùng và phản hồi liên quan. Phương pháp này có hai ưu điểm: yêu cầu người dùng suy nghĩ trong tâm trí ảnh đối tượng cần tìm mà không cần miêu tả cụ thể và đánh giá ảnh đối tượng trong mỗi lần tra cứu bằng cách đưa vào các mức độ liên quan. Qua mỗi lần lặp phản hồi, dựa trên các đối tượng mà người dùng lựa chọn, hệ thống tự động học thông tin bằng việc đánh giá chiều quan trọng. Dựa trên trọng số quan trọng của mỗi chiều, hệ thống đã cho kết quả gần với nhu cầu tra cứu của người dùng. V. TÀI LIỆU THAM KHẢO [1] Flickner, Myron, Et Al. "Query by Image and Video Content: The QBIC System."Computer 28.9 (1995): 23-32. [2] Bach, Jeffrey R., Et Al. "Virage Image Search Engine: An Open Framework For Image Management." Electronic Imaging: Science & Technology. International Society For Optics And Photonics, 1996. [3] Rui, Yong, et al. "Relevance feedback: a power tool for interactive content-based image retrieval." Circuits and Systems for Video Technology, IEEE Transactions on 8.5 (1998): 644-655. [4] Y. Rui, T. Huang, And S. Mehrotra. Content-Based Image Retrieval With Relevance Feedback in Mars. Proc. Of Ieee Int. Conf. On Image Processing, 1997. [5] K. Porkaew, K. Chakrabarti, And S. Mehrotra. Query Refinement For Content-Based Multimedia Retrieval in Mars. Proceedings Of Acm Multimedia Conference, 1999. [6] Y. Ishikawa, R. Subramanya, and C. Faloutsos. Mindreader: Querying Databases Through Multiple Examples. Proc. of Vldb, 1998. [7] K. Chakrabarti, K. Porkaew, And S. Mehrotra. Efficient Query Refinement in Multimedia Databases. Proceedings Of International Conference In Data Engineering(Icde), 2000. [8] Wu, Leejay, et al. "Multimedia queries by example and relevance feedback." IEEE Data Engineering Bulletin 24.3 (2001): 14-21. [9] Chakrabarti, Kaushik, et al. "Evaluating refined queries in top-k retrieval systems." Knowledge and Data Engineering, IEEE Transactions on 16.2 (2004): 256-270. [10] Luo, Xin, Guowen Wu, and Kenji Kita. "Learning distance metrics with feature space performance for image retrieval." Proceedings of the 2013 International Conference on Electrical and Information Technologies for Rail Transportation (EITRT2013)-Volume II. Springer Berlin Heidelberg, 2014 [11] AN IMAGE RETRIEVAL METHODS BASED ON PERCEIVED SIMILARITY Vu Van Hieu, Nguyen Huu Quynh, Ngo Quoc Tao ABSTRACT - Content-based image retrieval systems, the returned results are not satisfying the user's information needs. This restriction is due to: (1) query image is not fully represent the information needs of users, (2) low level features does not reflect the semantic information of image and (3) distance function combined with the features can not be perceived by the user. To overcome such limitations, we propose image retrieval method based on similarity perception by developing optimal query from user feedback. We have experimental database includes 10,800 images from Corel subset. The experimental results indicate that this technique improved content-based image retrieval system performance compared with the exit method and the results have been close to the perception of users.
File đính kèm:
- mot_phuong_phap_tra_cuu_anh_dua_vao_do_tuong_tu_nhan_thuc.pdf