Bài giảng Cơ sở dữ liệu và quản trị cơ sở dữ liệu - Chương 6: Chuẩn hóa cơ sở dữ liệu - Nguyễn Vương Thịnh
CHUẨN HÓA CƠ SỞ DỮ LIỆU
6.1. TẠI SAO PHẢI CHUẨN HÓA CƠ SỞ DỮ LIỆU?
6.2. CÁC DẠNG CHUẨN HÓA CỦA CƠ SỞ DỮ LIỆU
6.3. CÁC PHÉP TÁCH BẢO TOÀN THÔNG TIN VÀ BẢO TOÀN PHỤ THUỘC HÀM
6.4. PHÉP TÁCH VỀ DẠNG CHUẨN BOYCE CODD (BCNF) BẢO TOÀN THÔNG TIN
6.5. PHÉP TÁCH VỀ DẠNG CHUẨN 3 (3NF) BẢO TOÀN THÔNG TIN VÀ BẢO TOÀN PHỤ THUỘC HÀM
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Cơ sở dữ liệu và quản trị cơ sở dữ liệu - Chương 6: Chuẩn hóa cơ sở dữ liệu - Nguyễn Vương Thịnh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Cơ sở dữ liệu và quản trị cơ sở dữ liệu - Chương 6: Chuẩn hóa cơ sở dữ liệu - Nguyễn Vương Thịnh
TR ƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KHOA CÔNG NGHỆ THÔNG TIN BÀI G I ẢNG HỌC PHẦN CƠ SỞ DỮ LIỆU VÀ QUẢN TRỊ CƠ SỞ DỮ LIỆU Giảng viên : ThS. Nguyễn V ươ ng Thịnh Bộ môn : Hệ thống thông tin Hải Phòng, 2016 Chương 6 CHUẨN HÓA CƠ SỞ DỮ LIỆU 2 Thông tin về giảng viên Họ và tên Nguyễn Vương Thịnh Đơn vị công tác Bộ môn Hệ thống thông tin – Khoa Công nghệ thông tin Học vị Thạc sỹ Chuyên ngành Hệ thống thông tin Cơ sở đào tạo Trường Đại học Công nghệ - Đại học Quốc Gia Hà Nội Năm tốt nghiệp 2012 Điện thoại 0983283791 Email thinhnv@vimaru.edu.vn Website 3 Thông tin về học phần Tên học phần Cơ sở dữ liệu và quản trị cơ sở dữ liệu Tên tiếng Anh Data base and Database Management Mã học phần 17425 Số tín chỉ 04 tín chỉ (LT: 45 tiết, TH: 30 tiết) Bộ môn phụ trách Hệ thống thông tin PHƯƠNG PHÁP HỌC TẬP, NGHIÊN CỨU Nghe giảng, t hảo luận, trao đổi với giảng viên trên lớp. Tự n ghiên cứu tài liệu và làm bài tập ở nhà. PHƯƠNG PHÁP ĐÁNH GIÁ SV phải t ham dự ít nhất 75% thời gian . Có 02 bài kiểm tra viết giữa học phần (X 2 = (L 1 + L 2 )/2), 01 bài kiểm tra thực hành (X 3 ). Điểm quá trình X = (X 2 + X 3 )/2. Thi kết thúc học phần bằng hình thức trắc nghiệm khách quan trên máy tính (Z = 0.5X + 0.5Y). 4 Tài liệu tham khảo Elmasri, Navathe, Somayajulu, Gupta, Fundamentals of Database Systems (the 4 th Edition) , Pearson Education Inc, 2004. Nguyễn Tuệ, Giáo trình Nhập môn Hệ Cơ sở dữ liệu , Nhà xuất bản Giáo dục Việt Nam, 2007. Nguyễn Kim Anh, Nguyên lý của các hệ Cơ sở dữ liệu , Nhà xuất bản Đại học Quốc g ia Hà Nội, 2004. 5 Tài liệu tham khảo CHUẨN HÓA CƠ SỞ DỮ LIỆU 6 .1. TẠI SAO PHẢI CHUẨN HÓA CƠ SỞ DỮ LIỆU? 6 .2. CÁC DẠNG CHUẨN HÓA CỦA CƠ SỞ DỮ LIỆU 6 .3. CÁC PHÉP TÁCH BẢO TOÀN THÔNG TIN VÀ BẢO TOÀN PHỤ THUỘC HÀM 6.4. PHÉP TÁCH VỀ DẠNG CHUẨN BOYCE CODD (BCNF) BẢO TOÀN THÔNG TIN 6.5. PHÉP TÁCH VỀ DẠNG CHUẨN 3 (3NF) BẢO TOÀN THÔNG TIN VÀ BẢO TOÀN PHỤ THUỘC HÀM 6 7 6 .1. TẠI SAO PHẢI CHUẤN HÓA CƠ SỞ DỮ LIỆU? Ví dụ 6.1 : Xét quan hệ trên lược đồ quan hệ Kết_Quả_Học _ Phần(Mã SV, Họ và tên, Mã HP, Tên HP, Điểm) Mã SV Họ và tên Mã HP Tên HP Điểm HHA001 Nguyễn Văn An HP01 Toán rời rạc 6.5 HHA002 Nguyễn Thu Ân HP02 Cơ sở dữ liệu 7.0 HHA003 Nguyễn Văn Bình HP01 Toán rời rạc 7.5 HHA001 Nguyễn Văn An HP03 Tin học đại cương 8.0 HHA002 Nguyễn Thu Ân HP01 Toán rời rạc 6.0 HHA001 Nguyễn Văn An HP02 Cơ sở dữ liệu 7.0 NHƯỢC ĐIỂM 1. Dư thừa dữ liệu : Cùng 01 sinh viên nhưng không chỉ có mã sinh viên mà họ tên sinh viên cũng bị lặp đi lặp lại nhiều lần ở các vị trí khác nhau. Tương tự, cùng một học phần thì không chỉ có mã học phần mà tên học phần cũng bị lặp lại ở những vị trí khác nhau. 8 2. Khó khăn khi cập nhật dữ liệu : Thêm : Ta không thể thêm tên một học phần mới vào quan hệ nếu học phần đó chưa được sinh viên nào đăng ký. Tương tự ta không thể thêm thông tin về một sinh viên mới nếu sinh viên đó chưa đăng ký một học phần nào. Xóa : Nếu ta xóa thông tin về học phần "Toán rời rạc" thì cũng sẽ mất luôn thông tin của sinh viên "Nguyễn Văn Bình" có mã sinh viên là "HHA003" vì chỉ có một bản ghi duy nhất có chứa thông tin về sinh viên này. Sửa : Giả sử có nhiều sinh viên đăng ký học môn "Toán rời rạc", khi đó sẽ có nhiều bản ghi có liên quan đến "Toán rời rạc". Nếu ta muốn đổi tên môn "Toán rời rạc" thành "Toán tin" thì ta sẽ phải cập nhật tên môn ở nhiều vị trí tương ứng, gây mất nhiều thời gian và dễ xảy ra sai sót. 3. Không nhất quán dữ liệu : Là hệ quả của 02 điều trên. 9 6 .2. CÁC DẠNG CHUẨN HÓA CƠ SỞ DỮ LIỆU 6 .2.1. DẠNG CHUẨN 1 (1NF) Một lược đồ quan hệ R( Ω) được gọi là ở dạng chuẩn 1 (1NF) nếu như toàn bộ các thuộc tính đều mang giá trị đơn và nguyên tố . Mã NV Họ tên Chuyên Môn Ngoại Ngữ NV01 Nguyễn Văn An Kỹ sư xây dựng Tiếng Anh NV02 Nguyễn Thị Ánh Kiến trúc sư Tiếng Anh Tiếng Pháp NV03 Lê Văn Bình Cử nhân Kinh tế Tiếng Anh Tiếng Trung Ví dụ 6.2 : Các lược đồ quan hệ sau đây không thỏa mãn chuẩn 1: Mã hàng hóa Số lượng Thuộc tính Kích thước Khối lượng Màu sắc MH01 40 40 100 Đỏ MH02 50 65 250 Vàng MH03 120 45 130 Xanh MH04 123 56 300 Tím 10 6.2.2. DẠNG CHUẨN 2 (2NF) Một lược đồ quan hệ R( Ω) được gọi là ở dạng chuẩn 2 (2NF) nếu nó ở dạng chuẩn 1 và mỗi thuộc tính không khóa (nếu có) đều phải phụ thuộc hàm đầy đủ vào một khóa nào đó của lược đồ quan hệ . Lưu ý một số khái niệm : Thuộc tính không khóa (nonprime attribute) là thuộc tính không nằm trong bất kỳ một khóa nào của lược đồ quan hệ. Y được gọi là phụ thuộc hàm đầy đủ vào X nếu X → Y và không tồn tại X’⊆ X sao cho X’→Y (nói cách khác: phụ thuộc hàm đầy đủ có nghĩa là Y chỉ phụ thuộc hàm vào X chứ không phụ thuộc vào một tập con nào đó của X ) . Ví dụ 6.2 : Xét lược đồ quan hệ Kết Quả Học Phần(Mã SV, Họ và tên, Mã HP, Tên HP, Điểm) Có tập phụ thuộc hàm : F = {Mã SV → Họ và tên, Mã HP → Tên HP, { Mã SV, Mã HP} → Điểm } Khóa K = {Mã SV, Mã HP} Họ và tên phụ thuộc hàm vào Mã SV là 1 phần của khóa Tên HP phụ thuộc hàm vào Mã HP là 1 phần của khóa KHÔNG THỎA MÃN CHUẨN 2 11 Hệ quả : Nếu một lược đồ quan hệ đạt chuẩn 1 và tập thuộc tính không khóa của nó là tập rỗng thì đương nhiên lược đồ quan hệ đó đạt chuẩn 2. Nếu tất cả các khóa của lược đồ quan hệ chỉ gồm một thuộc tính thì lược đồ quan hệ đó đạt chuẩn 2. THUẬT TOÁN KIỂM TRA MỘT LƯỢC ĐỒ QUAN HỆ CÓ ĐẠT CHUẨN 2 Input: Lược đồ quan hệ R(Ω) và tập phụ thuộc hàm F Output: Khẳng định R(Ω) có đạt chuẩn 2 hay không. Bước 1 : Tìm tất cả các khóa của lược đồ quan hệ và xác định các thuộc tính không khóa. Bước 2 : Với mỗi khóa K, tìm bao đóng của tất cả các tập con thật sự S của K. Bước 3 : Nếu tồn tại một bao đóng S + nào đó chứa thuộc tính không khóa thì R(Ω) không đạt chuẩn 2. Ngược lại thì đạt chuẩn 2. Lưu ý : Đối với những bài toán đơn giản, n gười ta thường xuất phát từ định nghĩa của dạng chuẩn 2 để xác định xem một lược đồ quan hệ có thỏa mãn dạng chuẩn 2 hay không thay vì phải sử dụng thuật toán nêu trên. 12 Ví dụ 6.3 : Cho lược đồ quan hệ R(A,B,C,D) và tập phụ thuộc hàm: F = {AB → C, B → D, BC → A} Hỏi lược đồ quan hệ này có đạt chuẩn 2 hay không? Giải Đầu tiên ta tìm tất cả các khóa của lược đồ quan hệ: TN = B, TG = AC Ta có hai khóa K 1 = AB, K 2 = BC. Thuộc tính không khóa là D. Ta thấy B→D trong khi B ⊂ K 1 . Vậy thuộc tính không khóa D phụ thuộc hàm vào một phần của khóa nên lược đồ quan hệ không thỏa mãn chuẩn 2. X i S i = TN ∪ X i (TN ∪ X i ) + Siêu khóa Khóa ⍉ B BD A AB Ω AB AB C BC Ω BC BC AC ABC Ω ABC 13 Ví dụ 6.4 : Cho lược đồ quan hệ R(A,B,C,D) và tập phụ thuộc hàm F = {B → D, A → C, C → ABD}. Hỏi lược đồ quan hệ này có đạt chuẩn 2 hay không? Giải Đầu tiên ta tìm tất cả các khóa của lược đồ quan hệ: TN =⍉ , TG = ABC Ta có hai khóa K 1 = A, K 2 = C. Tất cả các khóa của lược đồ quan hệ đều có một thuộc tính nên theo hệ quả 2, lược đồ quan hệ đạt chuẩn 2. X i S i = TN ∪ X i (TN ∪ X i ) + Siêu khóa Khóa ⍉ ⍉ A A Ω A A B B BD C C Ω C C AB AB Ω AB BC BC Ω BC AC AC Ω AC ABC ABC Ω ABC 14 6.2.3. DẠNG CHUẨN 3 (3NF) A. Định nghĩa cổ điển Một lược đồ quan hệ R( Ω) được gọi là ở dạng chuẩn 3 ( 3 NF ) nếu nó đã ở dạng chuẩn 2 và không tồn tại thuộc tính không khóa phụ thuộc hàm bắc cầu vào khóa chính của lược đồ quan hệ . Lưu ý : Một t huộc tính A được gọi là phụ thuộc hàm bắc cầu vào tập thuộc tính X nếu tồn tại tập thuộc tính Y để cả ba điều sau được thỏa mãn: X → Y , Y → A Y → X ∉ F + A ∉ XY B. Định nghĩa tổng quát Một lược đồ quan hệ R(Ω) được gọi là ở dạng chuẩn 3 (3NF) nếu với mọi phụ thuộc hàm X→A ∈ F + (A ∉ X) ta đều có: Hoặc X là siêu khóa. Hoặc A là thuộc tính khóa . 15 MaSV HoTen MaLop TenLop HHA001 Nguyễn Văn An L01 CNT50-ĐH1 HHA002 Nguyễn Văn Án L02 ĐKT51-ĐH2 HHA003 Nguyễn Văn Ân L01 CNT50-ĐH1 HHA004 Nguyễn Văn Bình L02 ĐKT51-ĐH2 HHA005 Nguyễn Văn Bông L01 CNT50-ĐH1 HHA006 Nguyễn Văn Cường L03 CTT51-ĐH Ví dụ 6.5 : Xét lược đồ quan hệ: SinhVien( MaSV , HoTen, MaLop, TenLop) Tập phụ thuộc hàm: F = {MaLop → TenLop; MaSV → HoTen , MaLop} Khóa chính K = { MaSV} Lược đồ này không thỏa mãn chuẩn 3 vì có thuộc tính không khóa là TenLop phụ thuộc hàm bắc cầu vào khóa chính MaSV như sau: MaSV → MaLop và MaLop → TenLop . 16 Hệ quả : Nếu một lược đồ quan hệ đạt chuẩn 3 thì đương nhiên đạt chuẩn 2. Nếu một lược đồ quan hệ không có thuộc tính không khóa thì đạt chuẩn 3. THUẬT TOÁN KIỂM TRA MỘT LƯỢC ĐỒ QUAN HỆ CÓ ĐẠT CHUẨN 3 Input : Lược đồ quan hệ R(Ω) và tập phụ thuộc hàm F. Output : Khẳng định R(Ω) có đạt chuẩn 2 hay không. Bước 1 : Tìm tất cả các khóa của lược đồ quan hệ R(Ω). Bước 2 : Từ tập phụ thuộc hàm F, tạo ra tập phụ thuộc hàm F’ tương đương với F và có vế phải chỉ có một thuộc tính (nhờ sử dụng luật phân rã). Bước 3 : Nếu mọi phụ thuộc hàm X→A ∈ F’ với A ∉ X đều có X là siêu khóa hoặc A là thuộc tính khóa thì lược đồ quan hệ đạt chuẩn 3. Ngược lại thì lược đồ quan hệ không đạt chuẩn 3. 17 Ví dụ 6.6 : Cho lược đồ quan hệ R(A,B,C,D) và tập phụ thuộc hàm: F = {AB → C , D → B , C → ABD} Hỏi lược đồ quan hệ này có đạt chuẩn 3 hay không? Giải Bước 1 : Sau khi áp dụng thuật toán tìm tất cả các khóa, ta tìm được 3 khóa : K 1 = AB, K 2 = AD, K 3 = C. Như vậy, các thuộc tính khóa là: A, B, C, D. Bước 2 : Xây dựng tập phụ thuộc hàm F ’ tương đương với F có vế phải một thuộc tính nhờ luật phân rã: F ’ = { AB → C , D → B , C → A , C → B , C → D} Bước 3 : Duyệt các phụ thuộc hàm trong F’, ta thấy tất cả các phụ thuộc hàm đều có vế phải là thuộc tính khóa nên lược đồ quan hệ đạt chuẩn 3. 18 Ví dụ 6.7 : Cho lược đồ quan hệ R(A,B,C,D) và tập phụ thuộc hàm: F = {B → D , A → C , C → ABD} Hỏi lược đồ quan hệ này có đạt chuẩn 3 hay không? Giải Bước 1 : Sau khi áp dụng thuật toán tìm tất cả các khóa, ta tìm được 2 khóa : K 1 = A và K 2 = C. Các thuộc tính khóa là: A, C. Bước 2 : Xây dựng tập phụ thuộc hàm F’ tương đương với F có vế phải một thuộc tính nhờ luật phân rã: F ’ = { B → D , A → C , C → A , C → B , C → D} Bước 3 : Duyệt các phụ thuộc hàm trong F’ ta thấy phụ thuộc hàm B → D có vế trái không phải là siêu khóa, vế phải cũng không phải là thuộc tính khóa. Vậy lược đồ quan hệ không đạt chuẩn 3. 19 6.2.4. DẠNG CHUẨN BOYCE CODD (BCNF) Một lược đồ quan hệ R(Ω) được gọi là ở dạng chuẩn Boyce Codd (BCNF ) nếu với mọi phụ thuộc hàm X → A ∈ F + (A ∉ X) ta đều có X là siêu khóa . G ần giống định nghĩa tổng quát của chuẩn 3, nhưng chặt chẽ hơn ở chỗ không chấp nhận trường hợp A là thuộc tính khóa . Hệ quả : Nếu một lược đồ quan hệ đạt chuẩn Boyce Codd thì đương nhiên đạt chuẩn 3. 20 THUẬT TOÁN KIỂM TRA MỘT LƯỢC ĐỒ QUAN HỆ CÓ ĐẠT CHUẨN BOYCE CODD Input : Lược đồ quan hệ R(Ω) và tập phụ thuộc hàm F. Output: Khẳng định R(Ω) có đạt chuẩn Boyce Codd hay không. Bước 1 : Tìm tất cả các khóa của lược đồ quan hệ R(Ω). Bước 2 : Từ tập phụ thuộc hàm F, tạo ra tập phụ thuộc hàm F’ tương đương với F và có vế phải chỉ có một thuộc tính (nhờ sử dụng luật phân rã). Bước 3 : Nếu mọi phụ thuộc hàm X→A ∈ F’ với A ∉ X đều có X là siêu khóa thì lược đồ quan hệ đạt chuẩn Boyce C odd. Ngược lại thì lược đồ quan hệ không đạt chuẩn Boyce Codd. 21 Ví dụ 6.8 : Cho lược đồ quan hệ R(A,B,C,D,E,I) và tập phụ thuộc hàm F = {ACD → EBI , CE → AD }. Hỏi lược đồ quan hệ này có đạt chuẩn Boyce Codd hay không? Giải Bước 1 : Sau khi áp dụng thuật toán tìm tất cả các khóa, tìm được 2 khóa: K 1 = ACD, K 2 = CE. Bước 2 : Xây dựng tập phụ thuộc hàm tương đương F’ có vế phải một thuộc tính nhờ luật phân rã: F ’ = { ACD → E , ACD → B , ACD → I , CE → A , CE → D } Bước 3 : Duyệt các phụ thuộc hàm trong F’ ta thấy các phụ thuộc hàm đều có vế trái là khóa ACD hoặc CE nên đương nhiên lược đồ quan hệ thỏa mãn chuẩn Boyce Codd. 22 6.2.5. XÁC ĐỊNH DẠNG CHUẨN CAO NHẤT CỦA LƯỢC ĐỒ QUAN HỆ Dạng chuẩn 1 (1 st Normal Form) Dạng chuẩn 2 (2 nd Normal Form) Dạng chuẩn 3 (3 rd Normal Form) Dạng chuẩn Boyce Codd (BCNF) Một lược đồ quan hệ đã đạt dạng chuẩn nào thì đương nhiên cũng thỏa mãn các dạng chuẩn thấp hơn. 23 THUẬT TOÁN XÁC ĐỊNH DẠNG CHUẨN CAO NHẤT CỦA LƯỢC ĐỒ QUAN HỆ Input : Lược đồ quan hệ R(Ω) và tập phụ thuộc hàm F. Output: Dạng chuẩn cao nhất của lược đồ quan hệ R(Ω). Bước 1 : Tìm tất cả các khóa của R(Ω). Bước 2 : Kiểm tra xem R(Ω) có đạt chuẩn Boyce Codd không. Nếu R(Ω) có đạt chuẩn Boyce Codd thì kết luận chuẩn Boyce Codd là dạng chuẩn cao nhất của lược đồ quan hệ và kết thúc thuật toán. Ngược lại nếu không đạt chuẩn Boyce Codd thì chuyển qua bước 3. Bước 3 : Kiểm tra xem R(Ω) có đạt chuẩn 3 không. Nếu R(Ω) có đạt chuẩn 3 thì kết luận chuẩn 3 là dạng chuẩn cao nhất của lược đồ quan hệ và kết thúc thuật toán. Ngược lại nếu không đạt chuẩn 3 thì chuyển qua bước 4. Bước 4 : Kiểm tra xem R(Ω) có đạt chuẩn 2 không. Nếu R(Ω) có đạt chuẩn 2 thì kết luận chuẩn 2 là dạng chuẩn cao nhất của lược đồ quan hệ và kết thúc thuật toán. Ngược lại thì kết luận R(Ω) đạt chuẩn 1. Đ ể xác định dạng chuẩn cao nhất của lược đồ quan hệ người ta sẽ kiểm tra lần lượt từ chuẩn Boyce Codd đến các dạng chuẩn thấp hơn. 24 6.3. CÁC PHÉP TÁCH BẢO TOÀN THÔNG TIN VÀ BẢO TOÀN TẬP PHỤ THUỘC HÀM 6.3.1. PHÉP TÁCH BẢO TOÀN THÔNG TIN A. Khái niệm Phép tách lược đồ quan hệ R( Ω ) thành m lược đồ quan hệ con R 1 ( Ω 1 ), R 2 ( Ω 2 ), ... , R m ( Ω m ) được gọi là bảo toàn thông tin nếu như với mọi quan hệ r trên R( Ω ) ta luôn có: Đảm bảo việc khôi phục nguyên vẹn quan hệ gốc ban đầu từ các quan hệ con sau khi tách, không phát sinh các bộ phụ thêm. DanhSachHocSinh ( MaHS , HoTen , DiemThi , MaLop , TenLop , PhongHoc ) HocSinh ( MaHS , HoTen , DiemThi , MaLop ) Lop ( MaLop , TenLop , PhongHoc ) MaHS HoTen DiemThi MaLop TenLop PhongHoc HS01 Nguyễn Văn An 6 L01 10A1 203 HS02 Nguyễn Văn Bình 8 L01 10A1 203 HS03 Lê Hữu Cường 5 L02 10A2 204 HS04 Thái Văn Dương 9 L01 10A1 203 HS05 Bùi Văn Đạt 6 L02 10A2 204 HS06 Lê Thái Minh 7 L03 10A3 205 MaHS HoTen DiemThi MaLop HS01 Nguyễn Văn An 6 L01 HS02 Nguyễn Văn Bình 8 L01 HS03 Lê Hữu Cường 5 L02 HS04 Thái Văn Dương 9 L01 HS05 Bùi Văn Đạt 6 L02 HS06 Lê Thái Minh 7 L03 MaLop TenLop PhongHoc L01 10A1 203 L02 10A1 203 L03 10A2 204 26 B. Thuật toán kiểm tra một phép tách có bảo toàn thông tin Input : Lược đồ quan hệ R(Ω ) với Ω = {A 1 , A 2 ,..., A n } và tập phụ thuộc hàm F . Phép tách R(Ω ) thành m lược đồ con R 1 ( Ω 1 ), R 2 ( Ω 2 ), ... , R m ( Ω m ) Output : Khẳng định phép tách có bảo toàn thông tin hay không. Bước 1 : Tạo một ma trận S có m hàng và n cột. Mỗi cột tương ứng với một thuộc tính A j trong Ω và mỗi hàng tương ứng với một lược đồ quan hệ con R i ( Ω i ) . Bước 2 : Đặt p hần tử S(i, j) của ma trận nhận giá trị bằng 1 nếu A j ∈ Ω i và ngược lại, S(i, j) nhận giá trị bằng 0 nếu A j ∉ Ω i Bước 3 : Lặp lại thao tác sau đây cho tới khi nào không còn sự thay đổi trong ma trận S: Với mỗi phụ thuộc hàm X → Y trong F, xác định các hàng trong S có chứa các giá trị 1 như nhau trong các cột ứng với các thuộc tính trong X. Nếu có một hàng trong số đó chứa giá trị 1 trong các cột ứng với tập thuộc tính Y thì làm cho các cột tương ứng của các hàng khác cũng chứa giá trị 1. Bước 4 : Nếu tồn tại 01 hàng có chứa toàn giá trị 1 thì phép tách là bảo toàn thông tin, ngược lại là không bảo toàn. Ví dụ 6.9 : Cho lược đồ quan hệ PhanCong ( MaNV , TenNV , ChuyenMon , MaDA , TenDA , DiaDiem , NgayBD , NgayKT ) Và tập phụ thuộc hàm: F = { MaNV → TenNV, ChuyenMon; MaDA → TenDA, DiaDiem; MaNV, MaDA → NgayBD, NgayKT } Người ta tách lược đồ quan hệ PhanCong thành các lược đồ con sau đây: NhanVien ( MaNV , TenNV , ChuyenMon ) DuAn ( MaDA , TenDA , DiaDiem ) PhanCongNV ( MaNV , MaDA , NgayBD , NgayKT ) Hỏi phép tách trên có bảo toàn thông tin không? Giải MaNV TenNV ChuyenMon MaDA TenDA DiaDiem NgayBD NgayKT NhanVien 1 1 1 0 0 0 0 0 DuAn 0 0 0 1 1 1 0 0 PhanCongNV 1 0 0 1 0 0 1 1 MaNV TenNV ChuyenMon MaDA TenDA DiaDiem NgayBD NgayKT NhanVien 1 1 1 0 0 0 0 0 DuAn 0 0 0 1 1 1 0 0 PhanCongNV 1 1 1 1 1 1 1 1 28 6.3.2. PHÉP TÁCH BẢO TOÀN TẬP PHỤ THUỘC HÀM A. PHÉP CHIẾU TẬP PHỤ THUỘC HÀM Phép chiếu tập phụ thuộc hàm F trên tập thuộc tính Ω i (ký hiệu là (F))cho kết quả là một tập các phụ thuộc hàm X → Y ∈ F + sao cho X, Y ⊆ Ω i . B. PHÉP TÁCH BẢO TOÀN TẬP PHỤ THUỘC HÀM Cho lược đồ quan hệ R( Ω ) và tập phụ thuộc hàm F. Phép tách lược đồ quan hệ R( Ω ) thành m lược đồ con R 1 ( Ω 1 ), R 2 ( Ω 2 ),..., R m ( Ω m ) được gọi là bảo toàn tập phụ thuộc hàm nếu hợp kết quả các phép chiếu của F trên các Ω i vẫn tương đương với F. Tức là 29 6.4. PHÉP TÁCH VỀ DẠNG CHUẨN BOYCE CODD BẢO TOÀN THÔNG TIN Thuật toán tách Input : Lược đồ quan hệ gốc R(Ω ) và tập phụ thuộc hàm F . Output: Tập D gồm c ác lược đồ quan hệ con R 1 ( Ω 1 ), R 2 ( Ω 2 ), ... , R m ( Ω m ) thỏa mãn BCNF và bảo toàn thông tin Bước 1 : Khởi tạo D = {R(Ω)} Bước 2 : Lặp lại thao tác sau đây: Với mỗi lược đồ quan hệ R i ( Ω i ) trong D không ở BCNF, tìm một phụ thuộc hàm X → Y vi phạm định nghĩa BCNF và thay thế R i ( Ω i ) bằng 02 lược đồ quan hệ S i ( Ω i \Y) và T i (X ∪Y ). Quá trình lặp dừng khi không còn lược đồ quan hệ nào trong D không thỏa mãn BCNF. 30 Ví dụ 6.10 : Xét lược đồ quan hệ R(A,B,C,D,E,F) và tập phụ thuộc hàm: F = {A → BCDEF, BC → ADEF, B → F, D → E, D → B} Hãy tách lược đồ trên thành các lược đồ con thỏa mãn BCNF và bảo toàn thông tin. Giải R(A,B,C,D,E,F) F = {A → BCDEF, BC → ADEF, B → F, D → E, D → B} K 1 = A, K 2 = BC R 1 (B,F) F 1 = {B → F} K = B R 2 (A,B,C,D,E) F 2 = {A → BCDE, BC → ADE, D → E, D → B} K 1 = A, K 2 = BC R 21 (D,E) F 21 = {D → E } K = D R 22 (A,B,C,D) F 22 = {A → BCD, BC → AD, D → B} K 1 = A, K 2 = BC R 222 (A,C,D) F 222 = {A → CD} K = A R 221 (D,B) F 221 = {D → B} K = D D = {R 1 (B,F), R 21 (D,E), R 221 (D,B), R 222 (A,C,D)} 31 Ví dụ 6.11 : Xét lược đồ quan hệ PhanCong (MaNV, TenNV, ChuyenMon, MaDA, TenDA, DiaDiem, NgayBD, NgayKT) và tập phụ thuộc hàm: F = { MaNV → TenNV, ChuyenMon; MaDA → TenDA, DiaDiem; MaNV, MaDA → NgayBD, NgayKT } Hãy tách lược đồ trên thành các lược đồ con thỏa mãn BCNF và bảo toàn thông tin. Giải PhanCong (MaNV, TenNV, ChuyenMon, MaDA, TenDA, DiaDiem, NgayBD, NgayKT) F = {MaNV → TenNV, ChuyenMon; MaDA → TenDA, DiaDiem; MaNV, MaDA → NgayBD, NgayKT} K = {MaNV, MaDA} NhanVien (MaNV,TenNV, ChuyenMon) F 1 = {MaNV → TenNV, ChuyenMon} K = MaNV PhanCong1 (MaNV, MaDA, TenDA, DiaDiem, NgayBD, NgayKT) F 2 = { MaDA → TenDA, DiaDiem; MaNV, MaDA → NgayBD, NgayKT } K = {MaNV, MaDA} DuAn (MaDA, TenDA, DiaDiem) F 3 = {MaDA → TenDA} K = MaDA PhanCongNV (MaNV, MaDA, NgayBD, NgayKT) F 4 = {MaNV, MaDA → NgayBD, NgayKT} K = {MaNV, MaDA} D = {NhanVien, DuAn, PhanCongNV} 32 6.5. PHÉP TÁCH VỀ DẠNG CHUẨN 3 BẢO TOÀN THÔNG TIN VÀ BẢO TOÀN PHỤ THUỘC HÀM Thuật toán tách Input : Lược đồ quan hệ gốc R(Ω ) và tập phụ thuộc hàm F . Output: Tập D gồm c ác lược đồ quan hệ con R 1 ( Ω 1 ), R 2 ( Ω 2 ), ... , R m ( Ω m ) thỏa mãn chuẩn 3, bảo toàn thông tin và bảo toàn phụ thuộc hàm. Bước 1 : Tìm phủ tối thiểu G của F (nếu F chưa phải là tập PTH tối thiểu). Bước 2 : Với mỗi phụ thuộc hàm X → A trong G ta tạo ra một lược đồ quan hệ con S(X∪{A}) trong D. Nếu có nhiều phụ thuộc hàm có chung vế trái: X→A 1 , X→A 2 ,..., X→A k thì thay vì phải tạo lược đồ quan hệ con ứng với từng phụ thuộc hàm riêng lẻ, ta tạo ra một lược đồ quan hệ con chung S(X∪{A 1 }∪{A 2 }∪...∪{A k }) Lưu ý: X là khóa chính của các lược đồ quan hệ con này. Bước 3 : Nếu không có lược đồ quan hệ con nào trong D chứa một khóa của R thì tạo thêm một lược đồ quan hệ con trong D có các thuộc tính là thuộc tính khóa cấu thành một khóa nào đó của R. 33 Ví dụ 6.12 : Xét lược đồ quan hệ PhanCong (MaGV, TenGV, MaPhong, DiaDiem, MaMon, TenMon) và tập phụ thuộc hàm: F = {MaGV → TenGV ; MaPhong → DiaDiem; MaMon → TenMon } Hãy tách lược đồ trên thành các lược đồ con thỏa mãn 3NF, bảo toàn thông tin và bảo toàn tập phụ thuộc hàm. Giải 1. Bản thân t ập F đã là tập phụ thuộc hàm tối thiểu rồi nên ta không cần tìm phủ tối thiểu G của F nữa. 2. Khóa của lược đồ quan hệ là K = {MaGV, SoPhong, MaMon } 3. Áp dụng thuật toán, ta lần lượt tạo ra các lược đồ quan hệ R(XA) tương ứng với các phụ thuộc hàm X → A: GiangVien (MaGV, TenGV) có F = { MaGV → TenGV} và K = MaGV PhongHoc (MaPhong, DiaDiem) có F = { MaPhong → DiaDiem} và K = MaPhong MonHoc (MaMon, TenMon) có F = {MaMon → TenMon} và K = MaMon 4. Trong các lược đồ quan hệ con đã tạo không có lược đồ nào có chứa khóa của lược đồ quan hệ gốc nên ta tạo ra một lược đồ quan hệ nữa chứa toàn các thuộc tính của khóa: PhanCongGiangDay (MaGV, MaPhong, MaMon) có K = Ω Kết quả của phép tách là: D = {GiangVien, PhongHoc, MonHoc, PhanCongGiangDay} 34 Q & A 35
File đính kèm:
- bai_giang_co_so_du_lieu_va_quan_tri_co_so_du_lieu_chuong_6_c.pptx