Bài giảng Hệ lưu trữ và tìm kiếm thông tin CDS/ISIS for windows
1. TỔNG QUAN
CDS/ISIS FOR WINDOWS (viết tắt là WINISIS) là hệ thống lưu trữ và tìm
kiếm thông tin được thiết kế ở dạng bảng chọn, ứng dụng cho việc xây dựng và quản
trị các cơ sở dữ liệu (CSDL) dạng văn bản có cấu trúc. Một trong những ưu điểm của
WINISIS là nó cho phép thao tác với số lượng không hạn chế các CSDL bao gồm các
mục mô tả dữ liệu khác nhau. Mặc dù một vài chức năng của WINISIS đòi hỏi một số
kiến thức và kinh nghiệm nhất định về tin học, song phần lớn các ứng dụng được thiết
kế để người sử dụng có ít kinh nghiệm hoặc chưa có kinh nghiệm về tin học có thể sử
dụng được dễ dàng. Đối với người sử dụng có kinh nghiệm, WINISIS tạo cho các
phương tiện lập trình liên kết và cho phép phát triển các đặc thù ứng dụng riêng cũng
như các phương tiện chức năng bổ sung khác ngoài các phương tiện tiêu chuẩn của
chương trình.
Tóm tắt nội dung tài liệu: Bài giảng Hệ lưu trữ và tìm kiếm thông tin CDS/ISIS for windows
TRƯỜNG ĐẠI HỌC VĂN HÓA HÀ NỘI BỘ MÔN CÔNG NGHỆ THÔNG TIN ĐỖ QUANG VINH BÀI GIẢNG HỆ LƯU TRỮ VÀ TÌM KIẾM THÔNG TIN CDS/ISIS FOR WINDOWS HÀ NỘI - 2004 ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 2 1. TỔNG QUAN CDS/ISIS FOR WINDOWS (viết tắt là WINISIS) là hệ thống lưu trữ và tìm kiếm thông tin được thiết kế ở dạng bảng chọn, ứng dụng cho việc xây dựng và quản trị các cơ sở dữ liệu (CSDL) dạng văn bản có cấu trúc. Một trong những ưu điểm của WINISIS là nó cho phép thao tác với số lượng không hạn chế các CSDL bao gồm các mục mô tả dữ liệu khác nhau. Mặc dù một vài chức năng của WINISIS đòi hỏi một số kiến thức và kinh nghiệm nhất định về tin học, song phần lớn các ứng dụng được thiết kế để người sử dụng có ít kinh nghiệm hoặc chưa có kinh nghiệm về tin học có thể sử dụng được dễ dàng. Đối với người sử dụng có kinh nghiệm, WINISIS tạo cho các phương tiện lập trình liên kết và cho phép phát triển các đặc thù ứng dụng riêng cũng như các phương tiện chức năng bổ sung khác ngoài các phương tiện tiêu chuẩn của chương trình. 1.1 CSDL trong WINISIS WINISIS cho phép xây dựng và quản lý các CSDL có cấu trúc không chỉ kiểu dữ liệu số, mà chủ yếu là CSDL văn bản. Mặc dù WINISIS có liên quan đến việc xử lý các dữ liệu dạng văn bản và từ, nhưng nó có nhiều đặc điểm của phần mềm xử lý văn bản thông thường, nó hoạt động giống như một trình xử lý văn bản. Đó là vì văn bản mà WINISIS xử lý được cấu trúc hoá thành các phần tử dữ liệu (data element). Nói cách khác, CSDL trong WINISIS như là một tệp của các dữ liệu có quan hệ với nhau được thu thập để thoả mãn nhu cầu thông tin cho một cộng đồng người sử dụng nào đó. Nó có thể đơn giản chỉ là một tệp các địa chỉ hoặc một tệp phức tạp hơn như là mục lục thư viện, kho tra cứu các dự án nghiên cứu. Mỗi một đơn vị thông tin được lưu giữ trong CSDL bao gồm các phần tử dữ liệu rời rạc, mỗi phần tử đó chứa các đặc tính cụ thể về bản chất đối tượng được mô tả. Thí dụ, CSDL dạng thư mục chứa các thông tin về sách, báo cáo, tạp chí, bài báo Mỗi một đơn vị trong đó sẽ chứa các phần tử dữ liệu như tác giả nhan đề, ngày tháng xuất bản Phần tử dữ liệu được lưu trữ trong trường (field), mỗi trường được gán một nhãn dạng số biểu thị nội dung. Nhãn trường được WINISIS hiểu như là tên của trường. Tập hợp các trường chứa tất cả các phần tử dữ liệu được gọi là biểu ghi (record). ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 3 Một đặc tính thống nhất của WINISIS là chúng được thiết kế đặc biệt để quản lý các trường có độ dài không cố định. Điều này, một mặt cho phép tối ưu hoá vùng nhớ trên đĩa, mặt khác cho phép hoàn toàn tự do xác định độ dài tối đa của mỗi trường. Trường có thể tuỳ chọn (có thể không có trong một hoặc vài biểu ghi), nó có thể chứa một phần tử dữ liệu duy nhất hoặc vài phần tử dữ liệu có độ dài thay đổi. Trong trường hợp sau trường được coi là trường có trường con (subfield). Mỗi trường con được xác định bằng dấu phân cách trường con (subfield delimiter) gồm 2 ký tự đứng trước mỗi phần tử dữ liệu tương ứng. Trường có thể lặp, tức là trong biểu ghi có chứa nhiều hơn một nội dung (occurrence) của trường. 1.2 Các chức năng hệ thống WINISIS có các chức năng chính sau đây: Xác định cở sở dữ liệu chứa các phần tử dữ liệu yêu cầu; Nhập biểu ghi mới vào CSDL hiện tại; Sửa đổi, hiệu đính hoặc xoá các biểu ghi hiện có; Tự động xây dựng và duy trì tệp truy nhập nhanh đối với mỗi CSDL nhằm tăng đối đa tốc độ truy tìm; Tìm các biểu ghi theo nội dung, thông qua ngôn ngữ tìm tin vạn năng; Trình bày biểu ghi hay một phần biểu ghi theo yêu cầu; Sắp xếp biểu ghi theo thứ tự yêu cầu; In toàn bộ hoặc từng phần mục lục; Phát triển các ứng dụng đặc thù nhờ phương tiện lập trình liên kết. 1.3 Cấu trúc CSDL Mặc dù CSDL trong WINISIS xuất hiện đối với người sử dụng như là một tệp chứa thông tin duy nhất, song trên thực tế nó bao gồm một số các tệp liên quan với nhau về mặt logic nhưng được máy tính nhận biết riêng biệt về mặt vật lý. Việc quản trị các tệp vật lý này thuộc về WINISIS, người sử dụng không cần phải hiểu biết về cấu trúc chi tiết của nó để vận hành CSDL. Tuy nhiên, nếu có một số kiến thức cơ bản nào đó về các chức năng và mục đích của các tệp này sẽ giúp ta hiểu rõ hơn về hệ thống. a. Các tệp xác định CSDL ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 4 Xây dựng CSDL trong WINISIS bao gồm việc xác định của các thành phần cấu thành được lưu giữ dưới dạng các tệp riêng biệt sau: Bảng xác định trường FDT: xác định các trường trong CSDL và các đặc tính của chúng; Worksheet nhập dữ liệu: các kiểu bố trí trên màn hình dùng để cập nhật tệp chủ (tệp chứa dữ liệu nhập) của CSDL. WINISIS cung cấp phương tiện để tạo lập Worksheet một cách thuận tiện: Các format trình bày: xác định chính xác các yêu cầu trình bày các biểu ghi khi tìm kiếm, thể hiện trên màn hình, kết quả in ra. WINISIS cung cấp phương tiện lập format dễ dàng, đủ mạnh để ta trình bày nội dung các biểu ghi tuỳ ý. Bảng chọn trường FST: xác định các trường trong CSDL sẽ được chọn làm trường tìm kiếm (trường đánh chỉ số), thông qua tệp đảo. b. Tệp chủ (Master tệp) Tệp chủ chứa tất cả các biểu ghi của CSDL, mỗi biểu ghi gồm một số trường có độ dài thay đổi. Mỗi biểu ghi mang một số hiệu nhất định do WINISIS tự động gán cho biểu ghi khi nó được tạo ra, gọi là số của biểu ghi (MFN - Master File Number). Tệp chủ có phần mở rộng là MST. Thí dụ TVVH.MST. Để truy cập nhanh tới từng biểu ghi trong tệp chủ, WINISIS tạo ra một tệp đặc biệt gọi là tệp tham khảo chéo (Cross Reference), thực chất là tệp chứa các địa chỉ biểu ghi trong tệp chủ. Tệp này có phần mở rộng là XRF. Thí dụ TVVH.XRF. c. Tệp đảo (Inverted File) Mặc dù có thể tìm trực tiếp tới từng biểu ghi trong tệp chủ theo số MFN, nhưng vẫn cần phải có các cách truy nhập khác tới từng biểu ghi. Thí dụ khi tìm tin trong CSDL thư mục có thể có những yêu cầu tìm theo tên tác giả, từ khoá, phân loại chủ đề Để tạo thuận lợi cho việc tìm kiếm, WINISIS cho phép xác lập một số lượng không hạn chế các điểm truy nhập cho từng biểu ghi thông qua một tệp đặc biệt gọi là tệp đảo. Tệp đảo chứa tất cả các thuật ngữ có thể dùng như những điểm truy nhập trong quá trình tìm, và với mỗi thuật ngữ có gắn với thông tin chỉ đến biểu ghi trong tệp chủ mà từ đó thuật ngữ được lấy ra. Tập hợp tất cả các điểm truy nhập của CSDL được gọi là từ điển. Có thể coi tệp đảo như tệp chỉ dẫn về nội dung tệp chủ. ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 5 WINISIS cho phép ta tạo ra một cách có lựa chọn tệp đảo (từ điển) cho từng CSDL. Nghĩa là, ta có thể chọn ra các trường, các trường con hoặc các phần tử mà từ đó dữ liệu sẽ được lấy ra để đưa vào tệp đảo. Hơn nữa, bằng các lựa chọn phù hợp ta có thể chỉ lấy ra từng từ, từng câu, hoặc một phần mô tả trong những trường đã chọn. Để xác định các phần tử tìm cho một CSDL, WINISIS cung cấp bảng chọn trường (FST) trong đó chứa các trường cần đánh chỉ số và kỹ thuật đánh chỉ số cho từng trường. d. Tệp ANY Tệp ANY là tệp có liên quan đến tệp đảo, nhằm hỗ trợ cho tệp đảo. Nó được dùng để nối những thuật ngữ có quan hệ nhất định với nhau khi tìm kiếm. Một thuật ngữ ANY là tên gán chung cho một nhóm các thuật ngữ. Khi sử dụng thuật ngữ ANY để tìm, nhóm có tên chung đó được truy cập tới và các thuật ngữ có trong nhóm được tự động sắp xếp lại cùng nhau. 1.4 Khởi động WINISIS a. Giao diện Chúng ta có thể thực thi chương trình WINISIS theo các cách sau: Cách 1: Nháy đúp chuột vào biểu tượng của WINISIS ở màn hình nền Desktop ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 6 Cách 2: Start\Program\CDS/ISIS for Windows\CDS/ISIS for Windows Cách 3: Nháy vào biểu tượng WINISIS trong trình Windows Explorer Cách 4: Start\Run, gõ dòng lệnh: C:\WINISIS\WISIS.EXE trong hộp sau: ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 7 Xuất hiện giao diện có dạng sau đây: Các thành phần của Giao diện: Thanh tiêu đề (Title Bar) nằm ở phía trên đỉnh của cửa sổ; Bảng chọn (Menu Bar) cho phép truy nhập tới tất cả các chức năng của WINISIS; Thanh công cụ: nằm dưới bảng chọn cho phép truy nhập nhanh bằng chuột đến các chức năng của hệ thống WINISIS, như mở CSDL, tìm hoặc in; Thanh trạng thái, ở dưới cửa sổ, thường dùng để hiển thị thông báo. Có thể không hiển thị thanh trạng thái bằng cách sửa các tham số trong tệp SYSPAR.PAR. b. Chọn CSDL - Menu Cơ sở dữ liệu Để chọn CSDL ra làm việc chúng ta nháy chuột vào menu Cơ sở dữ liệu. Menu chứa các lệnh sau: ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 8 + Mở CSDL: Có các cách mở CSDL sau: - Chọn 1 trong các CSDL có trong danh sách ở dưới menu trên, thí dụ nháy chuột vào mục C:\DATA\TVVH.MST; - Chọn lệnh mở CSDL theo menu; - Nhấn chuột vào biểu tượng mở CSDL trên thanh công cụ. Trong 2 trường hợp sau WINISIS sẽ đưa ra hộp đối thoại mở CSDL. Sau khi mở CSDL thì cửa sổ CSDL tương ứng sẽ được trình bày. + Tạo CSDL mới: cho phép tạo CSDL mới (tạo cấu trúc cho CSDL). Ta có thể mở CSDL mới bằng cách nhấn vào biểu tượng mở CSDL trên thanh công cụ. + Đóng CSDL: đóng CSDL hiện tại đang sử dụng, các cửa sổ liên quan đến CSDL này như cửa sổ tìm, sẽ được đóng tự động; + Đóng tất cả các CSDL: đóng tất cả các CSDL đang sử dụng: + Nhập dữ liệu vào theo tệp ISO: cho phép nhập dữ liệu từ tệp ngoài vào theo format trao đổi thông tin IS0-2709. Khi lựa chọn lệnh này, WINISIS sẽ đưa ra Hộp đối thoại (Open Dialog Box), từ đó ta chọn tệp để nhập. Hộp đối thoại này có chứa các tham số mà ta phải khai báo. + Xuất dữ liệu theo ISO. + Cập nhật tệp đảo. + In: cho phép in ra theo yêu cầu tìm hay một giới hạn các biểu ghi nào đó, in ra có sắp xếp theo một hoặc vài trường nào đó. ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 9 Khi chọn lệnh này WINISIS sẽ đưa ra Hộp thoại in để ta khai báo các tham số in và sắp xếp; + Thiết lập máy in: cho phép thiết lập các máy in được chọn trước khi in. Khi ta chọn lệnh này hệ thống sẽ đưa ra Hộp thoại in; + Thoát ra. 1.5 Cấu trúc hệ thống a. Bảng chọn (Menu) Các phần tử cơ bản của hệ thống WINISIS là hệ thống bảng chọn của nó, trên đó cho phép ta chọn lựa các phương tiện. Chọn các thao tác bằng cách dùng chuột hay bàn phím lựa chọn các lệnh tương ứng trên bảng chọn . Lệnh là một chỉ thị báo cho WINISIS thực hiện một công đoạn nào đó. Menu là danh mục các lệnh, từ đó ta có thể chọn. Bảng chọn được đưa ra dưới dạng thanh bảng chọn ở vùng trên cùng của cửa sổ hệ thống WINISIS ngay dưới thanh tiêu đề. Chọn lệnh trước hết nháy chuột vào bảng chọn tương ứng, sau đó chỉ chuột vào lệnh chọn và nháy đúp chuột. Chú ý: khi bảng chọn xuất hiện, một số lệnh được đưa ra ở dạng mờ nhạt. Các lệnh này không thể chọn dùng được tại thời điểm hiện tại. Thí dụ, ta không thể chọn được lệnh tải dữ liệu từ ngoài vào nếu lệnh mở CSDL chưa được chọn ở bảng chọn đầu tiên. b. Tính đa ngôn ngữ WINISIS là hệ thống đối thoại đa ngôn ngữ. Tính chất đa ngôn ngữ cho phép ta chọn ngôn ngữ làm việc trong đó tất cả bảng chọn, thông báo sẽ được đưa ra theo ngôn ngữ đó, thí dụ bằng tiếng Anh, Việt, Pháp, Nga Mỗi lần khởi động chương trình, WINISIS sẽ đưa ra bảng chọn bằng ngôn ngữ định trước (default) do ta thiết lập ban đầu khi cài đặt. Ta có thể thay đổi ngôn ngữ đối thoại bất cứ khi nào ta muốn bằng cách chọn lệnh thay đổi ngôn ngữ trong menu cấu hình. Máy sẽ đưa ra danh sách các ngôn ngữ làm việc hiện đã cài đặt. Dùng chuột kích vào mục ngôn ngữ mong muốn. Từ thời điểm này trở đi, mọi menu và thông báo, nhắc nhở của hệ thống sẽ xuất hiện dưới ngôn ngữ đã chọn đó. c. Hộp thoại ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 10 Trong một số trường hợp WINISIS cần có thông tin hỗ trợ thêm trước khi nó thực thi một lệnh. Ta phải cung cấp thông tin thêm bằng cách chọn một ô khung đặc biệt gọi là Hộp thoại. d. Cửa sổ (Window) WINISIS sử dụng các loại cửa sổ khác nhau cho các mục đích khác nhau. Thí dụ để trình bày biểu ghi trong CSDL hệ thống sẽ sử dụng cửa sổ CSDL, để tìm tin sẽ sử dụng cửa sổ tìm, để nhập tin sẽ sử dụng cửa sổ nhập tin. Các cửa sổ này được tự động đưa ra màn hình tương ứng với các lệnh được chọn. 1.6 Hạn chế của hệ thống 1. Số lượng tối đa các CSDL quản lý được Không hạn chế 2. Số lượng tối đa các biểu ghi trong CSDL 16 triệu (dưới 500 MB) 3. Kích thước tối đa của biểu ghi 32.000 ký tự 4. Kích thước tối đa của trường 32.000 ký tự 5. Số lượng tối đa các trường (xác định trong FDT) 200 (không kể các giá trị lặp của trường lặp) 6. Số lượng tối đa các dòng FST 600 7. Số lượng tối đa các từ vô nghĩa (Stopwords) 799 8. Kích thước tối đa của Format trình bày 10.000 ký tự 9. Kích thước tối đa của buffer trình bày 64.000 ký tự 2. CÀI ĐẶT WINISIS 2.1 Yêu cầu về cấu hình ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 11 Cấu hình tối thiểu để chạy WINISIS như sau: - CPU: Bộ vi xử lý Pentium 100 MHz trở lên; - RAM: 16MB trở lên; - 1 Hard Disk Driver; - 1 màn hình loại VGA với độ phân giải tối thiểu 640 x 480; - 1 máy in tuỳ chọn; - Hệ điều hành WINDOWS’98 trở lên. 2.2 Thủ tục cài đặt 1- Đặt đĩa có nhãn “disk 01” vào ổ A: nháy đúp chuột vào tệp SETUP.EXE trong ổ A, hoặc tại mục “RUN” của nút Start gõ: a: setup 2- Đặt tiếp tục địa có nhãn “Disk 02” vào ổ A khi máy nhắc. Chọn các thư mục ngầm định hoặc sửa đổi tên thư mục tuỳ chọn khi hệ thống hỏi. 3- Các tham số hệ thống ta phải cung cấp như sau: - Thư mục chính của WINISIS (ngầm định là C:\WINISIS). - Cửa sổ hệ thống do trình Window Explorer tạo ra, ở đó chứa đựng biểu tượng của WINISIS (ngầm định WINISIS). - Thư mục chứa CSDL: (ngầm định C:\WINISIS\DATA). - Ngôn ngữ ngầm định: tiếng Anh (EN) -Thư mục chứa chương trình WINISIS Pascal: C:\WINISIS\PROGRAM; - Font hệ thống của Windows: S- font nhỏ, L- font lớn (ngầm định là S). - Thư mục chứa menu (ngầm định: C:\WINISIS\MENU) - Thư mục chứa thông báo (ngầm định: C:\WINISIS\MSG) - Thư mục các tệp tạm thời (C:\WINISIS\WORK) Đối với trường hợp WINISIS chạy trong hệ điều hành WINDOWS 2K trở lên, phải cài đặt thêm tệp phụ, bằng cách sao chép tệp CTL3DV2.DLL nằm trong thư mục con CTL3D của thư mục chính WINISIS sang thư mục \WINDOWS\SYSTEM của máy đang cài đặt. Copy \WINISIS\CTL3D\*.DLL \WINDOWS\SYSTEM Chú ý: Tuy chạy trong WINDOWS 2K nhưng WINISIS không quản lý được các tên quá dài của tệp và thư mục. Đối với tên thư mục, tối đa không quá 8 ký tự, còn đối với tên CSDL tối đa không quá 6 ký tự. ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 12 2.3 Khai báo lại các tệp tham số hệ thống a. SYSPAR.PAR: các tham số toàn cục Tệp hệ thống SYSPAR.PAR chứa các tham số cài đặt hệ thống. Máy sẽ đọc tệp này mỗi lần WINISIS được kích hoạt. Khi ta làn đầu cài đặt chương trình, chương trình SETUP tự động tạo ra tệp SYSPAR.PAR với các tham số ngầm định mà ta cung cấp. SYSPAR.PAR là tệp text, có thể hiệu đính tệp này bằng các chương trình soạn thảo văn bản như Notepad. Mỗi tham số bắt đầu ở dòng mới và có format chung như sau: n=giá trị n: giá trị của tham số; giá trị: giá trị tương ứng của tham số. Mục giá trị ... c tìm tin. NSD có kinh nghiệm có thể gõ trực tiếp biểu thức vào hộp này. Khả năng chứa thông tin của hộp soạn thảo là rất lớn (cho phép soạn thảo biểu thức tìm dài đến 1000 ký tự). Một số nút điều khiển của hộp thoại: Từ điển: hiện cửa sổ từ điển Tìm: sau khi hoàn thành biểu thức tìm, WINISIS tự động thực hiện tìm tin. Xem kết quả: xem kết quả tìm tin Xoá: xoá biểu thức tìm Winisis HELP: hiển thị các hướng dẫn trợ giúp Thoát: thoát khỏi lệnh tìm kiếm Danh sách câu hỏi: - Hộp thoại này chứa danh sách các lệnh tìm vừa tìm xong. Trước mỗi lệnh tìm là số của lệnh tìm CSDL số lượng biểu ghi tìm được. Mỗi khi tìm một lệnh xong, lệnh tìm này sẽ tự động gắn tiếp vào đầu cạnh các lệnh tìm. - Khi con trỏ đặt trên mỗi lệnh tìm, nháy con trỏ chuột hai lần liên tiếp chúng ta sẽ có kết quả tìm tin tương ứng hiện trên cửa sổ CSDL. ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 37 - Khi con trỏ đặt trên mỗi lệnh tìm, nháy con trỏ chuột một lần, lệnh tìm sẽ tự động chuyển lên hộp thoại câu hỏi. CỬA SỔ TÌM TIN CÓ TRỢ GIÚP Đây là một giao diện tìm kiếm đơn giản, cho phép những người chưa có kinh nghiệm tìm tin có thể tìm kiếm thông tin có hiệu quả. Cửa sổ sẽ hiển thị khi chúng ta nháy con trỏ chuột vào mục chọn Tìm tin có trợ giúp. Các thành phần tìm kiếm Có bốn cửa sổ cho viết thuật ngữ tìm. Có thể nháy con trỏ chuột chọn nút lệnh Từ điển để hiển thị cửa sổ từ điển, để chúng ta có thể chọn thuật ngữ thích hợp một cách chính xác. Tìm theo các trường Mỗi thành phần tìm kiếm có thể định vị tìm vào một trường nhất định nào đó hoặc định vị tìm vào tất cả các trường. Các toán tử Các thành phần tìm kiếm có thể liên kết với một trong ba toán tử AND, OR, hoặc NOT, bằng cách chọn toán tử thích hợp trong cửa sổ toán tử. Lệnh tìm kiếm trước Khi đã thực hiện một hoặc nhiều lệnh tìm tin, chúng ta có thể chọn một trong các lệnh tìm trước để thực hiện lại lệnh tìm. ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 38 Các nút lệnh - Để thực hiện việc tìm tin chúng ta ấn nút Tìm. Lệnh tìm tin sẽ hiện lên hộp Câu hỏi. Khi quá trình tìm tin kết thúc, số thứ tự của biểu thức tìm sẽ hiện trong hộp Số câu hỏi tìm được và tổng số biểu ghi tìm được theo lệnh sẽ hiện trong hộp Số biểu tìm được. - Có thể hiện kết quả bằng cách ấn nút Xem kết quả tìm và ấn nút Xoá để xoá toàn bộ các thành phần tìm. Cửa sổ Từ điển Cửa sổ Từ điển để hiện từ điển các thuật ngữ tìm tin mỗi khi ta ấn nút Từ điển tại cửa sổ Tìm trình độ cao, Tìm có trợ giúp, cửa sổ Nhập tin hoặc cửa sổ CSDL. - Các trường tìm kiếm thông tin Hộp trượt này cho phép ta chọn trường sẽ được tìm tin khi đang ở chế độ Tìm tin trình độ cao. Nếu chọn tất cả các trường chúng ta sẽ tìm được trong tất cả các trường được chỉ mục. - Hộp thuật ngữ ở Từ điển ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 39 Gõ một hoặc nhiều hơn các ký tự trong hộp thuật ngữ, hệ thống sẽ tự động định vị cửa sổ từ điển tương ứng với ký tự gõ vào. - Từ điển thuật ngữ Chọn thuật ngữ bằng cách nháy kép con trỏ chuột trên thuật ngữ đó. Phụ thuộc vào cửa sổ mà từ đó từ điển được gọi ra mà thuật ngữ được chuyển vào vị trí thích hợp. Cửa sổ tìm tin trình độ cao: thuật ngữ sẽ được chuyển vào đúng vị trí con trỏ trong hộp biểu thức tìm. Cửa sổ tìm tin có trợ giúp: thuật ngữ sẽ được chuyển vào hộp thành phần tìm kiếm Cửa sổ nhập tin: thuật ngữ sẽ được chuyển vào đúng vị trí con trỏ trong hộp soạn thảo trường. Chú ý: các thao tác chuyển thuật ngữ từ hộp từ điển sang các cửa sổ khác nhau nêu ở trên, có thể thực hiện bằng cách dùng con chuột nháy một lần trên thuật ngữ và kéo nó sang các cửa sổ thích hợp. - Các nút trang trước và trang sau: bấm các nút này sẽ chuyển sang trang trước hoặc trang sau của từ điển. Hộp thoại danh sách các câu hỏi tìm tin: ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 40 Muốn chọn lệnh tìm trong danh sách các câu hỏi tìm tin để thực hiện lại việc tìm kiếm thông tin, chỉ việc đưa con trỏ đến câu hỏi đó và nháy con trỏ chuột. THIẾT LẬP LỆNH TÌM TIN BIỂU THỨC TÌM TIN Các dạng của thuật ngữ tìm tin Trong khi hình thành biểu thức tìm tin chúng ta có thể sử dụng ba dạng thuật ngữ sau đây: 1. Thuật ngữ chính xác Một thuật ngữ chính xác là bất kỳ yếu tố nào đó mà có thể tìm kiếm thông tin được và đã được xác định cho CSDL như: Từ khoá, Tên sách, Tác giả .... Mỗi khi tạo lập lệnh tìm tin, NSD cần biết và nhớ các yếu tố có thể tìm kiếm đã được xác định trong CSDL. Khi dùng thuật ngữ chính xác để tìm tin, cần chú ý cách sử dụng thuật ngữ trong CSDL. Tốt nhất là có danh sách thuật ngữ tìm trong tay hoặc dùng từ điển để hiển thị thuật ngữ chính xác. Thậm chí một vài thay đổi nhỏ trong thuật ngữ tìm cũng không cho chúng ta kết quả tìm tin mong muốn. Thí dụ, trong từ điển hiện là Tua bin mà ta lại viết trong biểu thức tìm là Tuốc bin thì chúng ta sẽ nhận được kết quả tìm tin không mong muốn. Một điều quan trọng là nếu trong thuật ngữ tìm tin có chứa các ký tự như các dấu (,), , ?, / hoặc các dấu toán tử: * + (G) (F) $ hoặc bắt đầu bằng dấu #, chúng ta cần đưa thuật ngữ tìm vào trong dấu nháy kép “ ”. Thí dụ: “ Thư viện” 2. Thuật ngữ chặt phải Thay vì viết đầy đủ thuật ngữ tìm tin, chúng ta có thể chỉ viết gốc thuật ngữ. WINISIS sẽ tự động gán toán tử OR giữa các thuật ngữ tìm đã được chỉ định bằng gốc thuật ngữ. Dùng dấu đô la làm dấu chặt phải ($) và viết dấu này ngay sát ký tự cuối cùng của gốc thuật ngữ. Thí dụ: Thư viện$ ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 41 Hệ thống sẽ tìm kiếm tất cả các trường (đã chỉ mục) và các biểu ghi các câu bắt đầu bằng chữ Thư viện. TOÁN TỬ TÌM TIN Chúng ta có thể kết hợp hai hoặc nhiều hơn các thuật ngữ tìm tin vào một biểu thức tìm tin bằng cách dùng các toán tử. - Toán tử OR Toán tử OR kết hợp các thuật ngữ tìm theo kiểu cộng và mở rộng phạm vi tìm tin và về nguyên tắc kết quả tìm tin sẽ rất lớn. Trong biểu thức tìm, toán tử OR được thay bằng dấu +. - Toán tử AND Trong biểu thức tìm tin, toán tử AND được thay bằng dấu sao *. Kết quả tìm tin theo toán tử AND giữa hai lớp thuật ngữ tìm là các biểu ghi có nội dung bao hàm cả lớp thuật ngữ thứ nhất và lớp thuật ngữ thứ hai. Như vậy, khi dùng toán tử AND, sẽ thu hẹp kết quả tìm: - Toán tử NOT Trong biểu thức tìm tin, toán tử NOT được thay bằng dấu . Kết quả tìm tin của lệnh tìm dùng toán tử NOT giữa hai lớp thuật ngữ tìm tin là tổng các biểu ghi có nội ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 42 dung của lớp thuật ngữ thứ nhất trừ đi toàn bộ các biểu ghi có nội dung của lớp thuật ngữ thứ hai. Chú ý: khác với các toán tử OR và toán tử AND, khi dùng toán tử NOT trong biểu thức tìm tin sẽ không cho kết quả giống nhau khi chúng ta hoán vị các thuật ngữ, thí dụ: A ^ B Sẽ có kết quả tìm tin khác với B ^ A CÚ PHÁP CỦA BIỂU THỨC TÌM Khi đó, chúng ta có thể tạo lập một biểu thức phức tạp bằng cách liên kết hai hoặc nhiều hơn các thuật ngữ bằng các toán tử nêu trên. Chúng ta có thể sử dụng dấu ngoặc để xác lập thứ tự thực hiện tìm kiếm. Trong một biểu thức tìm tin nếu không có dấu ngoặc thứ tự ưu tiên thực hiện các phép tính như sau: Cao nhất * và ^ Tiếp theo + Nếu hai toán tử cùng mức ưu tiên đều nằm trong một biểu thức tìm tin, cùng trong ngoặc, việc tìm kiếm sẽ được thực hiện từ trái qua phải. Thí dụ, ta có biểu thức tìm tin sau đây: A + B * C WINISIS sẽ thực hiện việc tìm tin giữa B * C trước, sau đó việc tìm tin sẽ được thực hiện giữa A và (B * C) bằng toán tử OR. Ngược lại, nếu ta viết biểu thức tìm tin như sau: (A + B) * C Việc tìm kiếm thông tin sẽ thực hiện giữa A + B trước, sau đó, thực hiện toán tử logic AND giữa (A + B) và C. Chúng ta có thể tạo lập lệnh tìm bằng cách sử dụng các toán tử kết hợp với dấu ngoặc: (A + B) * C + (D + E + F ) ^ G 3. Dấu hạn định toán hạng Chúng ta có thể dùng dấu hạn định toán hạng để định vị trường / các trường tìm kiếm cho một thuật ngữ tìm nào đó. ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 43 Dấu hạn định toán hạng có cú pháp như sau: Thuật ngữ tìm / (t1, t2, t3 ...) trong đó: t1, t2, t3 ... là nhãn trường định vị PHÁT TRIỂN CHIẾN LƯỢC TÌM TIN Trong khi tạo lập lệnh tìm tin và thực hiện tìm kiếm thông tin WINISIS sẽ gán cho biểu thức tìm một con số. Con số này vừa là đại diện cho biểu thức tìm vừa chứa thông tin về số lượng biểu ghi tìm được theo biểu thức tìm đó. Vì vậy, sau khi thực hiện nhiều lệnh tìm tin, chúng ta có thể gọi lại một lệnh tìm bất kỳ trước đó bằng cách viết dấu thăng # ngay trước số thứ tự của lệnh tìm. Tiện ích cho phép chúng ta từng bước phát triển chiến lược tìm kiếm. Thí dụ, sau khi xem kết quả tìm tin theo lệnh tìm thứ nhất, yêu cầu tìm các tài liệu về vấn đề đầu tư trong nước và phát triển kinh tế Việt Nam. (Kinh tế + Đầu tư) * Việt Nam thấy rằng có một số biểu ghi không phù hợp vì nội dung của chúng về đầu tư nước ngoài vào Việt Nam. Chúng ta cần hiệu chỉnh lại biểu thức tìm tin cho chính xác như sau: #1 Đầu tư nước ngoài Chú ý: chúng ta có thể dùng dấu hạn định toán hạng để chính xác hoá biểu thức tìm. Thí dụ: # 1/ (2) tức là thực hiện tìm các biểu ghi thoả mãn hai điều kiện: - Đó là điều kiện của biểu thức tìm số 1 - Chỉ thực hiện việc tìm tin trong trường có nhãn 2. Trên thực tế không tồn tại qui định chung cho việc tạo lập các lệnh tìm tin, nhưng có một nguyên tắc chung cho NSD: - Định rõ yêu cầu tìm tin - Hiểu được bản chất của các toán tử - Nắm được cú pháp lệnh tìm tin Nói chung, những người chưa có kinh nghiệm, không nên tạo lập các lệnh tìm phức tạp ngay, nên bắt đầu từ những lệnh tìm đơn giản nhất. Với lệnh tìm mô tả ở trên, chúng ta có thể tách thành bốn bước: ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 44 #1: Việt Nam #2: Kinh tế + Đầu tư #3: Đầu tư nước ngoài #4: #1 * #2 ^ #3 TÌM TỰ DO Kỹ thuật cho phép: - Tìm kiếm thông tin trong các trường chưa được đảo (chưa được tạo lập chỉ mục) - Xác định trường có/ không có dữ liệu - So sánh giá trị số của trường Để thực hiện tìm tin tự do, chúng ta cần chọn chế độ tìm tin trình độ cao trong mục chọn Tìm tin. Viết biểu thức tìm trong hộp câu hỏi tìm tin. Dùng dấu hỏi (?) để thông báo cho hệ thống về chế độ tìm tự do: ? Biểu thức logic trong đó: ? Dấu nhận biết lệnh tìm tự do Thí dụ, chúng ta có lệnh tìm tự do sau đây: ? v2: “Thư viện” and val(v10) >= 2000 WINISIS sẽ tìm toàn bộ các biểu ghi mà trong trường 2 có chứa thuật ngữ Thư viện với năm xuất bản tài liệu từ 2000 cho tới nay. Tương tự với tìm tin theo tệp đảo (chỉ mục), mỗi lệnh tìm tự do được gán cho một con số mà sau này mỗi khi muốn gọi lại biểu thức tìm, chúng ta chỉ cần viết dấu thăng # ngay trước số đó là đủ. Tuy nhiên, chúng ta không thể viết một lệnh tìm hỗn hợp bao gồm biểu thức tìm tin theo tệp đảo và biểu thức tìm tự do. Chỉ thực hiện được sự kết hợp như vậy khi chúng ta dùng dấu thăng # số thứ tự của biểu thức tìm tin. #1 Thư viện #2 ? val(v10) >= 2000 #4 #1 * #2 CÁC TOÁN TỬ TÌM TIN MỨC TRƯỜNG VÀ LÂN CẬN Các toán tử này là các dạng thu hẹp của toán tử AND và đặc biệt tiện lợi cho việc tìm theo ngôn ngữ tự nhiên. ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 45 Các toán tử tìm mức trường và lân cận là: (G) Cùng một trường (tất cả các giá trị của trường lặp được hiểu như một đơn nguyên). Thí dụ: Thư viện (G) điện tử sẽ tìm tất cả các biểu ghi chứa 2 từ này trong cùng một trường. (F) Cùng một trường hoặc cùng một giá trị của trường lặp Thư viện (F) điện tử sẽ tìm tất cả các biểu ghi chứa 2 từ này trong cùng một trường, hoặc trong cùng một giá trị trường lặp. G và F tương đương nhau khi trường không phải là trường lặp. Như (F) thêm điều kiện là không có quá n từ giữa các thuật ngữ, trong đó n là số lượng dấu chấm trừ đi 1. Thí dụ: A.B A và B sát cạnh nhau A..B nhiều nhất có một từ giữa A và B A...B nhiều nhất có hai từ giữa A và B $: như (F) nhưng thêm điều kiện là giữa các thuật ngữ có đúng n từ trong đó n là số lượng dấu $ trừ đi 1. Thí dụ: A$B A và B sát cạnh nhau A$$B có đúng 1 từ giữa A và B A$$$B có đúng 2 từ giữa A và B. Chú ý: trước và sau dấu $ phải có một dấu cách. TÀI LIỆU THAM KHẢO [1] Trung tâm Thông tin khoa học và công nghệ Quốc gia (1999), Tài liệu hướng đẫn sử dụng CDS/ISIS for WINDOWS, Hà Nội. [2] UNESCO (2004), Reference Manual CDS/ISIS for WINDOWS version 1.5. [3] A.Buxton, A. Hopkinson (2001), The CDS/ISIS for WINDOWS Handbook, Paris. ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 46 Phụ lục 1 - Các lỗi cài đặt WINISIS Lỗi Khắc phục 1. Khi nháy vào biểu tượng WINISIS hệ thống báo lỗi, không tìm thấy các tệp *.DLL trong Windows Sao chép các tệp có kiểu *.DLL ở thư mục c:\winisis\ctl3d sang thư mục c:\windows\system 2. Không hiển thị tiếng Việt ở các menu và thông báo hệ thống Xem lại tham số 101 (giá trị này phải là 101=VN) Xem tham số 106 và 107 (bảng mã chuyển đổi) 3. Dữ liệu tiếng Việt hiển thị đúng Xem lại tham số 110 của tệp SYSPAR.PAR. Điều chỉnh lại Font, kiểm tra lại các Font trong WINDOWS 4. Khi nhập tin vào hộp nhập, các chữ tiếng Việt không hiện thị đúng Xem lại bàn gõ của bộ VIETKEY trong WINDOWS Xem lại tham số 109 trong tệp SYSPAR.PAR 5. Khi thoát ra khỏi chương trình bằng cách nháy chuột vào chữ x ở góc phải windows, máy báo lỗi error Lỗi của WINDOWS, hoặc do chế độ bảo vệ trong mạng (khi khai tham số 4 của tệp SYSPAR.PAR không đúng). Thoát ra bằng cách sử dụng menu Cơ sở dữ liệu - Thoát ra của WINISIS Phụ lục 2 - Các phím soạn thảo dùng trong WINISIS Các phím soạn thảo chuẩn dùng trong WINISIS được mô tả trong bảng dưới đây: Các phím Công dụng Ctrl + Ins hoặc Ctrl + C Sao chép đoạn văn đã chọn sang Clipboard Shift + Del hoặc Ctrl + X Di chuyển đoạn văn đã chọn sang Clipboard và xoá chúng khỏi màn hình Shift + Ins hoặc Ctrl + V Dán (paste) nội dung của Clipboard vào vị trí con trỏ hiện tại Alt + Backspace hoặc Ctrl + Z Huỷ bỏ (Undo) lần hiệu đính cuối Esc Trả lại nội dung trường từ đĩa (trong chế độ nhập) ĐQV - BÀI GIẢNG CDS/ISIS FOR WINDOWS 47 ← Di chuyển con trỏ sang trái 1 vị trí Ctrl + ← Di chuyển con trỏ sang trái 1 từ → Di chuyển con trỏ sang phải 1vị trí Ctrl + → Di chuyển con trỏ sang phải 1 từ ↑ Chuyển con trỏ lên vị trí của dòng trên (nếu trong cùng một trường) hoặc lên vị trí đầu tiên của trường ↓ Chuyển con trỏ xuống vị trí của dòng dưới (nếu trong cùng một trường) hoặc xuống vị trí cuối cùng của trường Home Chuyển con trỏ lên vị trí đầu của dòng hiện tại Ctrl + Home Chuyển con trỏ đến đầu trường End Chuyển con trỏ đến vị trí cuối của dòng hiện tại Ctrl + End Chuyển con trỏ đến vị trí cuối của trường PgUp Chuyển lên 1 trang (nếu trong cùng một trường) hoặc đến dòng đầu tiên của trường PgDn Chuyển xuống 1 trang (nếu trong cùng một trường) hoặc đến dòng cuối cùng của trường Backspace Xoá 1 ký tự về phía trái con trỏ và chuyển con trỏ sang trái 1 vị trí Delete Xoá ký tự ở vị trí con trỏ (con trỏ không di chuyển) Shift + Con trỏ Chọn đoạn văn bản
File đính kèm:
- bai_giang_he_luu_tru_va_tim_kiem_thong_tin_cdsisis_for_windo.pdf