Bài giảng Thiết kế thí nghiệm - Chương 2: Ước lượng và kiểm định giả thiết
Kiểm định giả thiết là một bài toán hay gặp trong thống kê. Phạm vi nghiên cứu khá rộng và
về mặt lý thuyết có những vấn đề khá phức tạp nếu muốn giải quyết thật tỷ mỷ, chính xác.
Trong chương này chỉ trình bầy một vài bài toán kiểm định giả thiết cụ thể liên quan đến các
biến định lượng. Chương sau sẽ tiếp tục kiểm định giả thiết với biến định tính. Nhưng trước
hết cần giới thiệu chung về giả thiết và đối thiết và hai loại sai lầm mắc phải khi kiểm định.
Bạn đang xem tài liệu "Bài giảng Thiết kế thí nghiệm - Chương 2: Ước lượng và kiểm định giả thiết", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Thiết kế thí nghiệm - Chương 2: Ước lượng và kiểm định giả thiết
Chương 2 Ước lượng và kiểm ñịnh giả thiết Kiểm ñịnh giả thiết là một bài toán hay gặp trong thống kê. Phạm vi nghiên cứu khá rộng và về mặt lý thuyết có những vấn ñề khá phức tạp nếu muốn giải quyết thật tỷ mỷ, chính xác. Trong chương này chỉ trình bầy một vài bài toán kiểm ñịnh giả thiết cụ thể liên quan ñến các biến ñịnh lượng. Chương sau sẽ tiếp tục kiểm ñịnh giả thiết với biến ñịnh tính. Nhưng trước hết cần giới thiệu chung về giả thiết và ñối thiết và hai loại sai lầm mắc phải khi kiểm ñịnh. 2.1. Giả thiết và ñối thiết Khi khảo sát một tổng thể (hoặc nhiều tổng thể) và xem xét một (hoặc nhiều) biến ngẫu nhiên có thể ñưa ra một giả thiết nào ñó liên quan ñến phân phối của biến ngẫu nhiên hoặc nếu biết phân phối rồi thì ñưa ra giả thiết về tham số của tổng thể. ðể có thể ñưa ra một kết luận thống kê nào ñó ñối với giả thiết thì phải chọn mẫu ngẫu nhiên, tính tham số mẫu, chọn mức ý nghĩa α sau ñó ñưa ra kết luận. Bài toán kiểm ñịnh tham số Θ của phân phối có dạng H0 : Θ = Θo với Θo là một số ñã cho nào ñó. Kết luận thống kê có dạng: “chấp nhận H0” hay “bác bỏ H0”. Nhưng nếu ñặt vấn ñề như vậy thì cách giải quyết hết sức khó, vì nếu không chấp nhận H0 : Θ = Θo thì ñiều ñó có nghĩa là có thể chấp nhận một trong vô số Θ khác Θo, do ñó thường ñưa ra bài toán dưới dạng cụ thể hơn nữa: cho giả thiết H0 và ñối thiết H1, khi kết luận thì hoặc chấp nhận H0 hoặc bác bỏ H0, và trong trường hợp này, tuy không hoàn toàn tương ñương, nhưng coi như chấp nhận ñối thiết H1. Nếu chấp nhận H0 trong lúc giả thiết ñúng là H1 thì mắc sai lầm loại II và xác suất mắc sai lầm này ñược gọi là rủi ro loại hai β. Ngược lại nếu bác bỏ H0 trong lúc giả thiết ñúng chính là H0 thì mắc sai lầm loại I và xác suất mắc sai lầm ñó gọi là rủi ro loại một α. Quyết ñịnh Giả thiết Bác bỏ H0 Chấp nhận H0 H0 ñúng Sai lầm loại I (α) Quyết ñịnh ñúng H0 sai Quyết ñịnh ñúng Sai lầm loại II (β) Như vậy trong bài toán kiểm ñịnh giả thiết luôn luôn có hai loại rủi ro, loại I và loại II, tuỳ vấn ñề mà nhấn mạnh loại rủi ro nào. Thông thường người ta hay tập trung chú ý vào sai lầm loại I và khi kiểm ñịnh phải khống chế sao cho rủi ro loại I không vượt quá một mức α gọi là mức ý nghĩa. Chương 2 Ước lượng và kiểm ñịnh giả thiết 19 Trước hết xem xét cụ thể bài toán kiểm ñịnh giả thiết H0: Θ = Θo, ñối thiết H1: Θ = Θ1 với Θ1 là một giá trị khác Θo. ðây là bài toán kiểm ñịnh giả thiết ñơn. Quy tắc kiểm ñịnh căn cứ vào hai giá trị cụ thể Θ1 và Θo, vào mức ý nghĩa α và còn căn cứ vào cả sai lầm loại hai. Việc này về lý thuyết thống kê không gặp khó khăn gì. Sau ñó mở rộng quy tắc sang cho bài toán kiểm ñịnh giả thiết kép. H1: Θ≠Θo; Θ > Θo hoặc Θ < Θo, việc mở rộng này có khó khăn nhưng các nhà nghiên cứu lý thuyết xác suất thống kê ñã giải quyết ñược, do ñó về sau khi kiểm ñịnh giả thiết H0 : Θ = Θo có thể chọn một trong 3 ñối thiết H1 sau: H1 : Θ ≠ Θo gọi là ñối thiết hai phía H1 : Θ > Θo gọi là ñối thiết phải H1 : Θ < Θo gọi là ñối thiết trái Hai ñối thiết sau gọi là ñối thiết một phía. Việc chọn ñối thiết nào tuỳ thuộc vấn ñề khảo sát cụ thể. Trong phạm vi tài liệu này ñề cập chủ yếu ñến ñối thiết hai phía hay còn gọi là hai ñuôi. 2.2. Ước lượng giá trị trung bình µ của biến phân phối chuẩn N(µ, σ2). 2.2.1. Ước lượng µ khi biết phương sai σ2 Dựa vào lý thuyết xác suất có thể ñưa ra ước lượng giá trị trung bình quần thể (µ) theo các bước sau ñây: + Chọn mẫu dung lượng n, tính trung bình cộng x + Ở mức tin cậy P ñã cho lấy α = 1- P, sau ñó tìm giá trị tới hạn z(α/2) trong bảng 1 (hàm Φ(z) tìm z sao cho Φ(z) = 1 - α/2 ) + Khoảng tin cậy ñối xứng ở mức tin cậy P: n zx n zx σ αµσα )2/()2/( +≤≤− Ví dụ 2.1: Khối lượng bao thức ăn gia súc phân phối chuẩn N(µ,σ2) với σ = 1,5kg. Cân thử 25 bao ñược khối lượng trung bình x = 49kg. Hãy ước lượng kỳ vọng µ với mức tin cậy P = 0,95; z (0,025) = 1,96 25 5,196,149 25 5,196,149 +≤≤− µ 49 - 0,588 ≤ µ ≤ 49 + 0,588 48,41kg ≤ µ ≤ 49,59kg Thiết kế thí nghiệm 20 2.2.2. Ước lượng µ khi không biết phương sai σ2 Dựa vào phân phối Student có thể ñưa ra ước lượng µ theo các bước sau ñây: + Chọn mẫu dung lượng n, tính trung bình cộng _ x và ñộ lệch chuẩn s. + Ở mức tin cậy P lấy α = 1- P, tìm giá trị tới hạn t(α/2, n-1) trong bảng 2, cột α/2, dòng n-1 + Khoảng tin cậy ñối xứng ở mức tin cậy P: n s ntx n s ntx )1,2/()1,2/( −+≤≤−− αµα Ví dụ 2.2: Cân 22 con gà ñược khối lượng trung bình x = 3,03kg; s = 0,0279 kg. Hãy ước lượng µ với mức tin cậy P = 0,98; α = 1- P = 0,02; α/2 = 0,01 t(0,01;21) = 2,518 22 0279,0518,203,3 22 0279,0518,203,3 +≤≤− µ 3,03 - 0,089 ≤ µ ≤ 3,03 + 0,089 2,94kg ≤ µ ≤ 3,12 kg 2.3. Kiểm ñịnh giá trị trung bình µ của biến phân phối chuẩn N(µ, σ2). 2.3.1. Kiểm ñịnh giả thiết H0: µ = µ0 khi biết σ2 Tiến hành kiểm ñịnh theo các các bước sau: + Chọn mẫu dung lượng n, tính trung bình cộng _ x + Chọn mức ý nghĩa α + Tìm giá trị tới hạn z(α/2) nếu kiểm ñịnh 2 phía hoặc z(α) nếu kiểm ñịnh một phía + Tính giá trị thực nghiệm ZTN = σ µ σ µ nx n x )()( 00 − = − So sánh ZTN và z tới hạn ñể rút ra kết luận theo nguyên tắc sau: Kết luận: Với H1 : µ ≠ µ0 (Kiểm ñịnh hai phía) Nếu ZTN (giá trị tuyệt ñối của ZTN) nhỏ hơn hay bằng z(α/2) thì chấp nhận H0 nếu ngược lại thì bác bỏ H0, tức là chấp nhận H1. Với H1 : µ > µ0 (Kiểm ñịnh một phía) Nếu ZTN nhỏ hơn hay bằng giá trị tới hạn z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1. Với H1: µ < µ0 (Kiểm ñịnh một phía) Nếu ZTN lớn hơn hay bằng giá trị tới hạn - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1. Chương 2 Ước lượng và kiểm ñịnh giả thiết 21 Ví dụ 2.3: Nuôi 100 con cừu theo một chế ñộ riêng. Mục ñích của thí nghiệm là xem chế ñộ này có làm tăng khối lượng của cừu một năm tuổi hay không. Biết rằng 100 cừu này ñược lấy mẫu từ một quần thể có khối lượng trung bình một năm tuổi là 30 kg và phương sai là 25 kg². Giả thiết tăng trọng phân phối chuẩn N(µ,25), hãy kiểm ñịnh giả thiết H0: µ = 30 ñối thiết H1: µ > 30 ở mức α= 0,05. Biết rằng khối lượng trung bình của 100 cừu thí nghiệm là 32 kg. ZTN 45 100)3032( = − = ; z(0,05) = 1,64 Kết luận: Vì ZTN > ZLT nên giả thiết H0 bị bác bỏ, như vậy tăng trọng trung bình không phải là 30 kg. Chế ñộ nuôi mới ñã làm tăng khối lượng cừu một năm tuổi. Ví dụ 2.4: Một mẫu cho trước gồm 100 bò sữa có sản lượng sữa một chu kỳ tiết sữa trung bình là 3850kg. Số bò này có xuất phát từ quần thể có giá trị trung bình là 4000kg và ñộ lệch chuẩn là 1000 hay không? Giả sử sản lượng sữa của quần thể tuân theo phân phối chuẩn N((µ,1000²). Hãy kiểm ñịnh giả thiết H0: µ = 4000 ñối thiết H1: µ ≠ 4000 ở mức α= 0,05 ZTN 5,11000 100)40003850( −= − = ZTN = 1,5; z(0,025) = 1,96 Kết luận: Chấp nhận H0, số bò sữa nêu trên xuất phát từ một quần thể ban ñầu có sản lượng sữa chu kỳ là 4000kg. 2.3.2. Kiểm ñịnh giả thiết H0: µ = µ0 khi không biết σ2 ðây là trường hợp phổ biến khi kiểm ñịnh giá trị trung bình của phân phối chuẩn. Tiến hành các bước sau: + Lấy mẫu dung lượng n, tính _ x và s2 + Tính giá trị T thực nghiệm TTN = s nx )( 0 __ µ− + Tìm giá trị tới hạn t(α/2, n-1) với kiểm ñịnh 2 phía hoặc tìm t(α, n-1) nếu kiểm ñịnh 1 phía trong bảng 2. Kết luận: Với H1 : µ ≠ µ0 (Kiểm ñịnh hai phía) Nếu TTN (giá trị tuyệt ñối của Ttn) nhỏ hơn hay bằng t(α/2,n-1) thì chấp nhận H0 nếu ngược lại thì bác bỏ H0, tức là chấp nhận H1 Với H1 : µ > µ0 (Kiểm ñịnh một phía) Nếu TTN ≤ t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1 Với H1: µ < µ0 (Kiểm ñịnh một phía) Nếu TTN ≥ - t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1. Thiết kế thí nghiệm 22 Ví dụ 2.5: Thời gian mang thai của bò phân phối chuẩn N(285,σ2). Theo dõi thời gian mang thai (ngày) của 6 bò ñược các số liệu 307 293 293 283 294 297 Kiểm ñịnh giả thiết H0: µ = 285 ngày ñối thiết H1: µ ≠ 285 ngày Tính 5,294 6 1767 6 )297294283293293307( == +++++ =x 9,59 5 6 1767)297294....293307 2 2222 2 = −++++ =s ; 74,77395,79,59 ≈==s TTN 007,316,3 5,96 74,7 )2855,294( ==× − = ; t(0,025;5) =2,571 Kết luận: Vì TTN = 3,007 > t(0,025;5) nên bác bỏ H0 như vậy thời gian mang thai không phải 285 ngày Ví dụ 2.6: Trong ñiều kiện chăn nuôi bình thường, lượng sữa trung bình của một con bò là 19 kg / ngày. Trong một ñợt hạn, người ta theo dõi 25 con bò và ñược lượng sữa trung bình 17,5 kg/ ngày, ñộ lệch chuẩn s = 2,5 kg. Giả thiết lượng sữa phân phối chuẩn, hãy kiểm ñịnh giả thiết H0: µ = 19 với ñối thiết µ < 19 ở mức α = 0,05. TTN = = 5,2 25)195,17( − - 3 ; t(0,05;24) = 1,711 Kết luận: TTN < - 1,711 nên giả thiết H0 bị bác bỏ, như vậy sản lượng sữa trung bình không còn là 19 kg / ngày nữa mà thấp hơn. 2.4. Kiểm ñịnh hai giá trị trung bình của hai biến phân phối chuẩn Giả sử chúng ta có hai tổng thể và theo dõi một biến ñịnh lượng X nào ñó, ví dụ khối lượng sau 6 tháng nuôi của hai ñàn gà, năng suất của hai giống lúa, năng suất của một giống ngô khi bón theo hai công thức phân bón khác nhau, sản lượng một loại quả khi trồng theo hai khoảng cách hàng . . . Chúng ta gọi biến X trên tổng thể thứ nhất là X1 (phân phối chuẩn N(µ1,σ12)) và biến X trên tổng thể thứ hai là X2 (phân phối chuẩn N(µ2,σ22)). ðể so sánh µ1 và µ2 chúng ta phải chọn mẫu. Có hai cách chọn mẫu: Chọn mẫu theo cặp và chọn mẫu ñộc lập. 2.4.1. Chọn mẫu theo cặp Từ tổng thể thứ nhất ta chọn một mẫu n cá thể ñược các giá trị x1, x2, . . . ,xn , từ tổng thể thứ hai chọn một mẫu cũng gồm n cá thể ñược y1, y2, . . ., yn. Giữa hai mẫu này có mối quan hệ cặp, tức là có n cặp (xi, yi) (i = 1, n). Các cặp này hình thành do khi chọn mẫu ta ñã dùng những quan hệ cặp như quan hệ gia ñình (vợ chồng, anh em, thí dụ chọn n tổ chim sau ñó bắt chim ñực vào mẫu ñại diện cho tổng thể chim ñực, bắt chim cái vào mẫu ñại diện cho tổng thể chim cái), quan hệ trước sau (thí dụ cá thể ñược ño một chỉ số trước khi dùng thuốc và số liệu này ñại diện cho tổng thể trước khi dùng thuốc, Chương 2 Ước lượng và kiểm ñịnh giả thiết 23 một thời gian sau khi dùng thuốc lại ño lại chỉ số và số liệu này ñại diện cho tổng thể sau khi dùng thuốc), cũng có khi các cặp này là các cặp số liệu do chúng ta bố trí thí nghiệm theo cặp: chọn 2 ô ruộng, một ô ruộng(hay một chuồng) bố trí giống thử nghiệm, một ô ruộng (một chuồng) bố trí giống ñối chứng. Viết lại số liệu dưới dạng hai cột hay hai hàng rồi tính hiệu số di = yi - xi X1 x1 x2 . . . xn X2 y1 y2 . . . yn d d1 d2 . . . dn Tiếp theo tính giá trị trung bình _ d và ñộ lệch chuẩn sd Giả thiết H0: µ2 = µ1 ñối thiết H1: µ2 ≠ µ1 ñược chuyển thành H0: µd = 0 ñối thiết H1: µd ≠ 0 (tương tự H1: µ2 > µ1 chuyển thành H1: µd > 0 và H1: µ2 < µ1 chuyển thành H1: µd < 0). Ở mức ý nghĩa α việc kiểm ñịnh gồm các bước sau: + Tính giá trị thực nghiệm TTN = ds nd + Tìm giá trị tới hạn t(α/2, n-1) nếu kiểm ñịnh 2 phía hoặc t(α, n-1) nếu kiểm ñịnh một phía bảng 2 Kết luận: + Kiểm ñịnh hai phía H1: µ2 ≠ µ1 Nếu TTN ≤ t(α/2, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1 + Kiểm ñịnh một phía H1: µ2 > µ1 Nếu TTN ≤ t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1 + Kiểm ñịnh một phía H1: µ2 < µ1 Nếu TTN ≥ - t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1 Ví dụ 2.7: Tăng trọng (pound) của 10 cặp bê sinh ñôi giống hệt nhau dưới hai chế ñộ chăm sóc khác nhau (A và B). Bê trong từng cặp ñược bắt thăm ngẫu nhiên về một trong hai cách chăm sóc. Giả thiết tăng trọng có phân phối chuẩn. Hãy kiểm ñịnh giả thiết H0: Tăng trọng trung bình ở hai cách chăm sóc như nhau, ñối thiết H1: Tăng trọng trung bình khác nhau ở hai cách chăm sóc với mức ý nghĩa α = 0,05. Số liệu thu ñược như sau: Cặp sinh ñôi 1 2 3 4 5 6 7 8 9 10 Tăng trọng ở cách A 43 39 39 42 46 43 38 44 51 43 Tăng trọng ở cách B 37 35 34 41 39 37 35 40 48 36 Chênh lệch (d) 6 4 5 1 7 6 3 4 3 7 n = 10; − d = 4,6; sd = 1,955; TTN = 955,1 106,4 = 7,44; t(0,025;9) = 2,262 Kết luận: Bác bỏ giả thiết H0, chấp nhận H1: “Tăng trọng trung bình ở hai cách chăm sóc là khác nhau”. Thiết kế thí nghiệm 24 Ví dụ 2.8: Có 15 trại phối hợp tham gia thử nghiệm khẩu phần ăn bình thường (A) và khẩu phần ăn có bổ sung ñồng (B). Mỗi trại lấy 2 khu nuôi lợn tương tự về mọi mặt sau ñó chỉ ñịnh ngẫu nhiên một khu ăn khẩu phần A, một khu ăn khẩu phần B. Tăng trọng trung bình (kg/ngày) của một con lợn ñược trình bày ở bảng dưới. Kiểm ñịnh giả thiết H0: “Hai khẩu phần A và B cho kết quả tăng trọng trung bình như nhau” với ñối thiết H1: “Khẩu phần có bổ sung ñồng cho tăng trọng trung bình cao hơn” Khẩu phần Khẩu phần Khẩu phần Trại A (xi) B (yi) Trại A (xi) B (yi) Trại A (xi) B (yi) 1 0,42 0,53 6 0,50 0,52 11 0,50 0,51 2 0,53 0,47 7 0,44 0,44 12 0,54 0,54 3 0,48 0,56 8 0,45 0,46 13 0,46 0,50 4 0,50 0,59 9 0,30 0,43 14 0,48 0,50 5 0,42 0,47 10 0,52 0,57 15 0,53 0,59 Giá trị trung bình − d = 0,0407; ñộ lệch chuẩn sd = 0,0489 TTN 22,3150489,0 0407,0 =×= ; t(0,05;14) = 1,761 Kết luận: Vì TTN > t nên bác bỏ H0, chấp nhận H1. Như vậy khẩu phần bổ sung ñồng cho tăng trọng trung bình cao hơn khẩu phần ăn thường. 2.4.2. Chọn mẫu ñộc lập Từ hai tổng thể chọn ra hai mẫu ñộc lập, dung lượng có thể bằng nhau hoặc khác nhau. Tính các tham số thống kê 1 − x ; s12 của mẫu thứ nhất; 2 − x ; s22 của mẫu thứ hai. ðể kiểm ñịnh giả thiết H0: µ2 = µ1 với các ñối thiết H1 ở mức ý nghĩa α ta chia ra 3 trường hợp: 2.4.2.1. Biết phương sai σ12 và σ22 + Tính Z thực nghiệm ZTN 2 2 2 1 2 1 1 _ 2 _ )( nn xx σσ + − = + Tìm giá trị tới hạn z(α/2) nếu kiểm ñịnh 2 phía hoặc z(α) nếu kiểm ñịnh một phía trong bảng 1 Kết luận: + Kiểm ñịnh hai phía H1: µ2 ≠ µ1 Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1 + Kiểm ñịnh một phía H1: µ2 > µ1 Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 + Kiểm ñịnh một phía H1: µ2 < µ1 Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 Chương 2 Ước lượng và kiểm ñịnh giả thiết 25 Ví dụ 2.9: Chiều dài cá trong 2 ao phân phối chuẩn với ñộ lệch chuẩn σ1 = 2cm và σ2 = 2,2cm. Lấy mẫu 100 con của ao thứ nhất ñược giá trị trung bình 1 _ x = 8 cm; lấy mẫu 120 con của ao thứ hai ñược giá trị trung bình 2 _ x = 8,5 cm. Hãy kiểm ñịnh giả thiết H0: µ1 = µ2 với ñối thiết H1: µ1 ≠ µ2 ở mức ý nghĩa α=0,05 Z TN 764,1 120 2,2 100 2 )85,8( 22 = + − = ; z(0,025) = 1,96 Vì ZTN = 1,764 < 1,96 nên chấp nhận H0: “Chiều dài cá trung bình trong 2 ao như nhau”. 2.4.2.2. Không biết phương sai σ12 và σ22 mẫu lớn( n1 ≥ 30, n2 ≥ 30). + Tính giá trị thực nghiệm ZTN 2 2 2 1 2 1 1 _ 2 _ )( n s n s xx + − = + Tìm giá trị tới hạn z(α/2) nếu kiểm ñịnh 2 phía hoặc z(α) nếu kiểm ñịnh một phía trong bảng 1 Kết luận: + Kiểm ñịnh hai phía H1: µ2 ≠ µ1 Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1 + Kiểm ñịnh một phía H1: µ2 > µ1 Nếu ZTN ≤ z(α) thì chấp nhận H0, ... 5) vì vậy chấp nhận H1: “chế ñộ ăn thứ hai cho kết quả trung bình cao hơn chế ñộ ăn thứ nhất”. Thiết kế thí nghiệm 26 2.4.2.3. Không biết phương sai σ12 và σ22, mẫu bé ( ít nhất một trong 2 số n1, n2 <30) ðây là một bài toán còn rất nhiều vướng mắc về mặt lý thuyết do ñó chúng ta chỉ trình bầy trường hợp có thêm giả thiết phụ : σ12 = σ22 + Tính phương sai chung: s2c = 2 )1()1( 21 2 22 2 11 −+ −+− nn snsn + Tính TTN = )11( )( 21 2 12 nn s xx c + − + Tìm giá trị tới hạn t(α/2, n1 + n2 - 2) với kiểm ñịnh 2 phía hoặc t(α, n1 + n2 - 2) nếu kiểm ñịnh một phía Kết luận: + Kiểm ñịnh hai phía H1: µ2 ≠ µ1 Nếu TTN≤ t(α/2,n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1 + Kiểm ñịnh một phía H1: µ2 > µ1 Nếu TTN ≤ t(α ,n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1 + Kiểm ñịnh một phía H1: µ2 < µ1 Nếu TTN ≥ - t(α,n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1 Ví dụ 2.11: ðể so sánh khối lượng của 2 giống bò, chọn ngẫu nhiên 12 bò của giống thứ nhất và 15 bò của giống thứ 2. Khối lượng (kg) của từng bò ñược xác ñịnh và thu ñược các tham số thống kê sau: n1 = 12; 1 _ x = 196,2kg; s1 = 10,62 kg; n2 = 15; 2 _ x = 153,70kg; s2 = 12,30kg. Kiểm ñịnh giả thiết H0: Hai giống bò có khối lượng trung bình như nhau với ñối thiết H1: Giống bò thứ nhất có khối lượng trung bình lớn hơn giống bò thứ hai. Giả sử khối lượng của 2 giống bò có phân phối chuẩn và hai phương sai bằng nhau với mức ý nghĩa α = 0,05. 33,134 1411 )30,121462,1011( 222 = + ×+× =cs TTN 46,9489,4 5,42 15 1 12 133,134 )7,1532,196( == +× − = ; t(0,05,25) = 1,708 Kết luận: Ở mức ý nghĩa α = 0,05 vì TTN > t nên bác bỏ H0. Như vậy giống thứ nhất có khối lượng trung bình cao hơn giống thứ hai. Ví dụ 2.12 : Hai giống gà có khối lượng phân phối chuẩn, lấy mẫu 10 gà ñối với giống thứ nhất và 16 gà của giống thứ 2. Các tham số về khối lượng 45 ngày tuổi của 2 mẫu nêu trên như sau: Với mẫu thứ nhất n1 = 10; 1 _ x = 2,8kg; s12 = 0,1111 kg² với mẫu thứ hai n2 = 16; 2 _ x = 2,35kg; s2 2 = 0,0667kg². Kiểm ñịnh giả thiết H0: Hai giống gà có khối lượng trung bình như nhau với ñối thiết H1: Hai giống gà có khối lượng trung bình khác nhau. Mức ý nghĩa α = 0,05. Chương 2 Ước lượng và kiểm ñịnh giả thiết 27 83331,0 24 99995,1 159 0667,0151111,092 == + ×+× =cs TTN = = -3,866 TTN= 3,866; t(0,025;24) = 2,064 Kết luận: Bác bỏ H0, như vậy hai giống gà có khối lượng trung bình khác nhau. 2.5. Ước lượng và kiểm ñịnh xác suất Trường hợp tổng thể có 2 loại cá thể A và A’, loại A chiếm tỷ lệ p và A’ chiếm tỷ lệ q = 1-p. Sau khi chọn mẫu có thể dùng phân phối chuẩn ñể tính gần ñúng phân phối nhị thức, từ ñó suy ra công thức ước lượng p. 2.5.1. Ước lượng xác suất p Khi dung lượng mẫu lớn (n ≥ 30 nhưng thực tế tốt nhất là trên 100) và p không bé quá, cũng không lớn quá ( np > 5, nq > 5). Từ mẫu có dung lượng n, tính số cá thể loại A ñược tần số m và tần suất f = m/ n với mức tin cậy P có khoảng tin cậy ñối xứng sau: n ff zfp n ff zf )1()2/()1()2/( −+≤≤−− αα Ví dụ 2.13: ðể biết tỷ lệ trứng nở p của một loại trứng; cho vào máy ấp 100 quả, kết quả có 80 quả nở. f = 80 / 100 = 0,8 ở mức tin cậy P = 0,95 thì α = 0,05 và z(0,025) = 1,96. Ta có thể tính ñược khoảng tin cậy như sau: 100 2,08,096,18,0 100 2,08,096,18,0 ×+≤≤×− p 0,8 - 0,0784 ≤ p ≤ 0,8 + 0,0784 ⇔ 0,72 ≤ p ≤ 0,88 2.5.2. Kiểm ñịnh giả thiết H0: p = p0 Khi dung lượng mẫu lớn (n ≥ 30 nhưng thực tế thấy tốt nhất là trên 100) và p không bé quá, cũng không lớn quá ( np > 5, nq > 5). Từ mẫu có dung lượng n, tính số cá thể loại A ñược tần số m và tần suất f = m / n. Ở mức ý nghĩa α tính z(α/2) với kiểm ñịnh 2 phía hoặc z(α) nếu kiểm ñịnh một phía. Tính ZTN = n pp pf o )1( 0 0 − − Kết luận: Với ñối thiết hai phía H1: p ≠ p0 Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1 Với ñối thiết một phía H1: p > p0 Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 Với ñối thiết một phía H1: p < p0 Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 Thiết kế thí nghiệm 28 Ví dụ 2.14: Ấp 100 quả trứng có 82 quả nở. Kiểm ñịnh giả thiết H0: tỷ lệ nở p = 0,80, ñối thiết H1: p ≠0,8 với α = 0,05. n = 100; m = 82; f = 82/100 = 0,82; ZTN = 100 2,0.8,0 80,082,0 − = 0,5 ; z(0,025) = 1,96 Kết luận: Chấp nhận H0: “Tỷ lệ ấp nở là 0,80”. 2.5.3. Kiểm ñịnh giả thiết H0: p2 = p1 Khi dung lượng cả 2 mẫu ñều lớn ( n1 > 100, n2 > 100) và các pi không bé quá (hoặc lớn quá) có thể kiểm ñịnh như sau (ở mức ý nghĩa α) Tính các tần suất: 1 1 1 n mf = ; 2 2 2 n mf = Tính tần suất chung: 21 21 nn mmf + + = Tìm giá trị tới hạn z(α/2) nếu kiểm ñịnh 2 phía hoặc z(α) nếu kiểm ñịnh một phía Tính giá trị thực nghiệm: ZTN )11)(1( 21 12 nn ff ff +− − = Kết luận: Với ñối thiết hai phía H1: p2 ≠ p1 Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1 Với ñối thiết một phía H1: p2 > p1 Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 Với ñối thiết một phía H1: p2 < p1 Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì thì chấp nhận H1 Ví dụ 2.15: Dùng thuốc A ñiều trị cho 200 bệnh nhân thấy 150 người khỏi bệnh. Tương tự với thuốc B ñối với 100 bệnh nhân thì 72 người khỏi bệnh. Hãy kiểm ñịnh giả thiết H0: Tỷ lệ khỏi bệnh của hai thuốc như nhau với ñối thiết H1: tỷ lệ khỏi bệnh của hai thuốc khác nhau với mức ý nghĩa α = 0,05. n1 = 200; m1 = 150; f1 = 150/ 200 = 0,75; n2 = 100; m2 = 72; f2 = 72 /100 = 0,72 ; 74,0 100200 72150 = + + =f ZTN 5584,0 ) 100 1 200 1(26,074,0 75,072,0 −= +×× − = |ZTN| = 0,5584; z(0,025) = 1,96. Kết luận: Chấp nhận H0; tức là tỷ lệ khỏi bệnh ở 2 loại thuốc là như nhau. Chương 2 Ước lượng và kiểm ñịnh giả thiết 29 2.6. Phân tích phương sai Mở rộng bài toán so sánh hai trung bình của hai tổng thể ở mục trên khi có nhiều hơn 2 trung bình chúng ta có bài toán phân tích phương sai một nhân tố. Thí dụ có a tổng thể, ñể khảo sát các biến X1, X2, . . . , Xa trên các tổng thể ñó chúng ta lấy ở mỗi tổng thể một mẫu các quan sát ñộc lập: Mẫu 1 x11, x12, . , x1r1 Mẫu 2 x21, x22, . , x2r2 . . Mẫu a xa1, xa2, ., x2ra Tất cả có n = Σri quan sát. Viết lại các quan sát xi j dưới dạng xi j = µi + ei j ei j gọi là sai số hay phần dư (2.1) Giả thiết các biến Xi ñộc lập, phân phối chuẩn N(µi, σ2), các quan sát trong mẫu ñộc lập.Từ giả thiết trên có thể nêu cụ thể 3 giả thiết sau ñối với các sai số ei j a- Các biến ei j ñộc lập với nhau b- Các biến ei j phân phối chuẩn với kỳ vọng bằng 0 c- Các biến ei j có phương sai bằng nhau (σ2) Bài toán phân tích phương sai một nhân tố chính là bài toán kiểm ñịnh giả thiết H0: “Các trung bình µi bằng nhau” với ñối thiết H1: “Có ít nhất một cặp trung bình khác nhau”. Nếu gọi µ là trung bình của các µi thì có thể viết (2.1) lại như sau: xi j = µ + ai + ei j (2.2) với ai = µi - µ; Σai = 0 Giả thiết H0 bây giờ là : “Các ai ñều bằng 0” còn H1 là “Không phải tất cả các ai ñều bằng 0”. ðể phân tích phương sai chúng ta gọi các trung bình cộng của các mẫu quan sát là ix _ . Nếu giả thiết H0 ñúng thì các Xi có cùng phân phối N(µ,σ2) và có thể coi các mẫu quan sát nói trên ñược lấy ra từ cùng một tổng thể. Gọi _ x là trung bình chung của tất cả các mẫu. Tính tổng bình phương tất cả các sai số (gọi là tổng bình phương toàn bộ SSTO) SSTO 2 1 1 2 1 1 2)( xnxxx a i n j ij a i n j ij ii −=−= ∑∑∑∑ = == = ðem tổng bình phương này chia cho (n - 1) ñược một ước lượng của σ2. SSTO/ σ2 phân phối χ2 với dfTO = (n - 1) bậc tự do. ðối với mỗi mẫu quan sát chúng ta tính tổng bình phương sai số trong mẫu (mà nếu ñem chia cho bậc tự do tương ứng (ni - 1) thì ñược một ước lượng của σ2) sau ñó gộp lại thành tổng bình phương do sai số SSE (Giống như cách ñã làm khi ñi tìm phương sai chung s2c trong trường hợp mẫu bé và hai phương sai bằng nhau ở mục 2.4.2.3 ) SSE ∑∑ = = −= a i n j iij i xx 1 1 2)( Thiết kế thí nghiệm 30 ðem SSE chia cho n - a ñược một ước lượng của σ2 SSE /σ2 phân phối χ2 với dfE = (n - a) bậc tự do. Có thể chứng minh hệ thức sau: ∑∑∑∑∑∑ = == == = −+−=− a i n j i a i n j iij a i n j ij iii xxxxxx 1 1 2 1 1 2 1 1 2 )()()( Tổng thứ ba gọi là tổng bình phương do nhân tố SSA. Nếu xi j phân phối chuẩn N(µi, σ2) thì các trung bình cộng . _ ix phân phối chuẩn N(µi, σ2/ni). Từ ñó suy ra nếu ñem SSA chia cho (a - 1) thì ñược ước lượng của σ2. Tổng SSA/σ2 phân phối χ2 với dfA = (a-1) bậc tự do. Như vậy chúng ta ñã tách tổng bình phương toàn bộ ra hai tổng: SSTO = SSA + SSE ðồng thời bậc tự do toàn bộ cũng tách thành 2 bậc tự do: dfTO = dfA + dfE Mỗi tổng bình phương chia cho bậc tự do tương ứng sẽ cho một ước lượng của phương sai σ2 và mỗi tổng sau khi chia cho σ2 sẽ phân phối χ2 với số bậc tự do tương ứng. Bây giờ xét tỷ số MSA / MSE với MSA = SSA / dfA và MSE = SSE / dfE Dựa trên lý thuyết về phân phối Khi bình phương (χ2) và phân phối F có kết luận sau: MSA / MSE phân phối Fisher- Snederco (F). Từ ñó có cách kiểm ñịnh sau ñây ñối với giả thiết H0 (ñối thiết H1): + Tính giá trị thực nghiệm FTN = MSA / MSE + Tìm giá trị tới hạn F(α,dfA,dfE) + Nếu FTN ≤ F(α,dfA,dfE) thì chấp nhận H0, ngược lại thì chấp nhận H1 Toàn bộ quy trình phân tích phương sai ñược tóm tắt trong bảng phân tích phương sai sau: Nguồn biến ñộng Bậc tự do Tổng bình phương Trung bình bình phương FTN F tới hạn Nhân tố dfA = a-1 SSA MSA = SSA/dfA MSA/MSE F(α,dfA,dfE) Sai số ngẫu nhiên dfE = n-a SSE MSE = SSE/dfE Tổng biến ñộng dfTO = n-1 SSTO ðể thuận tiện thường kẻ bảng chứa dữ liệu và tính theo thứ tự sau: + Tính dung lượng ni, tổng hàng THi, trung bình . _ ix , TH2i / ni + Tổng các dung lượng n = Σni , tổng tất cả các xi j ST =ΣΣ xi j + Số ñiều chỉnh G = ST2 / n + SSTO = ΣΣ x2i j - G bậc tự do dfTO = n - 1 + SSA = ΣTH2i / ni - G bậc tự do dfA = a - 1 + SSE = SSTO - SSA bậc tự do dfE = dfTO - dfA = n - a + Tính các trung bình MSA = SSA / dfA và MSE = SSE / dfE + Tính FTN = MSA / MSE + Tìm giá trị F(α,dfA,dfE) + So sánh FTN với F(α,dfA,dfE). Chương 2 Ước lượng và kiểm ñịnh giả thiết 31 Ví dụ 2.16: Khối lượng (kg) của 20 lợn 90 ngày tuổi ñược nuôi ở 5 chế ñộ khác nhau từ lúc cai sữa 21 ngày tuổi. Biết rằng 20 lợn ñược chọn ñồng ñều nhau vào thời ñiểm cai sữa và bố trí ngẫu nhiên về một trong 5 công thức thí nghiệm. Số liệu ñược trình bày trong bảng dưới. Giả thiết khối lượng tuân theo phân phối chuẩn. Kiểm ñịnh giả thiết H0: Khối lượng trung bình của lợn 90 ngày tuổi ở 5 chế ñộ chăm sóc bằng nhau với ñối thiết H1: Khối lượng trung bình của lợn 90 ngày tuổi ở 5 chế ñộ chăm sóc không bằng nhau. Mức ý nghĩa α = 0,05. Công thức Khối lượng (kg) ni THi THi2/ni . _ ix A 32,2 34,9 29,7 3 96,8 3123,413 32,27 B 28,4 28,0 22,8 28,5 29,4 5 137,1 3759,282 27,42 C 28,8 29,5 23,1 20,1 4 101,5 2575,563 25,38 D 41,5 36,3 31,7 31,0 38,2 5 178,7 6386,738 35,74 E 33,0 26,0 30,6 3 89,6 2676,053 29,87 Tổng 20 603,7 18521,0492 n = 20 ST = 603,7 ΣTH2i / ni = 18521,0492 Số ñiều chỉnh G = 603,72 / 20 = 18222,6845 Tổng các bình phương ΣΣ x2i j = 18727,6900 SSTO = 18727,69 - 18222,68 = 505,0055; bậc tự do dfTO = 20 -1 = 19 SSA = 18521,0492 - 18222,6845 = 298,3647; bậc tự do dfA = 5 - 1 = 4 SSE = 505,0055 - 298,3647 = 206,6408; bậc tự do dfE = 19 - 4 = 15 MSA = 298,3647 / 4 = 74,5912; MSE = 206,6408 / 15 = 13,7761 FTN = 74,5912/ 13,7761 = 5,4145 F(0,05;4;15) = 3,056 Có thể tổng hợp các kết quả thu ñược theo bảng phân tích phương sai (ANOVA) sau: Nguồn biến ñộng Bậc tự do Tổng bình phương Trung bình bình phương FTN F tới hạn Công thức 4 298,3647 74,5912 3,056 F(0,05;4;15) = 3,056 Sai số ngẫu nhiên 15 206,6408 13,7761 Tổng biến ñộng 19 505,0055 Kết luận: Bác bỏ H0, như vậy là bác bỏ giả thiết “Khối lượng trung bình của lợn 90 ngày tuổi ở 5 chế ñộ chăm sóc bằng nhau”. Sau khi có kết luận như trên thì vấn ñề ñặt ra là phải so sánh 5 trung bình của 5 lô ñể tìm ra các trung bình nào bằng nhau, các trung bình nào khác nhau. Vấn ñề này sẽ ñược trình bầy kỹ ở phần sau. Qua cách làm như trên chúng ta thấy ñể kiểm ñịnh giả thiết H0: “Các trung bình bằng nhau” với ñối thiết H1: “Có ít nhất một cặp trung bình khác nhau” phải tìm cách tách tổng bình phương toàn bộ SSTO thành các tổng bình phương SSA và SSE căn cứ vào 2 nguồn biến ñộng của số liệu: biến ñộng do sự khác nhau giữa các mẫu và biến ñộng do sự khác nhau giữa các số liệu trong cùng một mẫu. ðồng thời phải tách bậc tự do toàn bộ dfTO thành các bậc tự do dfA và dfE tương ứng với các tổng SSA, SSE. Từ ñó có tên phân tích phương sai. Trong phần sau khi có nhiều nguồn biến ñộng thì phải tách SSTO thành nhiều tổng ứng với các nguồn biến ñộng và tách bậc tự do dfTO thành nhiều bậc tự do, sau ñó kiểm ñịnh các giả thiết tương ứng với các nguồn biến ñộng nhờ phân phối Fisher- Snederco. Thiết kế thí nghiệm 32 2.7. Bài tập 2.7.1 Tăng trọng trung bình (gram/ngày) của 36 lợn nuôi vỗ béo giống Landrace ñược rút ngẫu nhiên từ một trại chăn nuôi. Số liệu thu ñược như sau: 577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586 621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589 Cán bộ kỹ thuật trại cho rằng tăng trọng trung bình của toàn ñàn lợn trong trại là 607 gram/ngày. Theo anh chị kết luận ñó ñúng hay sai, vì sao? 2.7.2 Anh chị hãy kiểm tra kết luận với bài tập tương tự như 2.7.1, biết rằng ñộ lệch chuẩn của tính trạng này ở Landrace là 24 gram/ngày. 2.7.3 Tỷ lệ thụ thai bằng thụ tinh nhân tạo từ tinh trùng của 2 bò ñực giống ñược xác ñịnh trên nhóm bò cái gồm 50 con; 18 nhóm bò cái sử dụng tinh trùng của bò ñực A và 16 ñối với bò ñực B. Tỷ lệ thụ thai (%) thu ñược như sau: Bò ñực A 74,2 62,1 57,7 71,7 62,0 76,1 70,6 68,3 68,4 79,8 71,1 70,9 65,5 61,2 60,8 73,9 51,9 63,7 Bò ñực B 49,6 49,2 53,2 56,5 69,1 54,2 80,7 62,7 71,5 67,5 64,6 75,4 79,6 59,8 68,8 60,2 Hãy cho biết tỷ lệ thụ thai của 2 bò ñực nêu trên. 2.7.4 Nồng ñộ fructoza (mg%) trong tinh dịch bò trước và sau khi ủ ñược xác ñịnh trên 12 mẫu tinh bò ñực; các giá trị thu ñược như sau: Mẫu số 1 2 3 4 5 6 7 8 9 10 11 12 Trước khi ủ 116 190 570 375 236 505 120 322 429 102 167 299 Sau khi ủ 30 58 100 48 58 153 54 66 67 34 69 82 Kết luận về nồng ñộ fructoza trong tinh dịch bò trước và sau khi ủ. 2.7.5 Một thí nghiệm ñược tiến hành nhằm nghiên cứu ảnh hưởng của progesterone lên chu kỳ ñộng dục của cừu Merino. Sử dụng 4 liều khác nhau (0, 10, 25 và 40 mg/ngày) tiêm dưới da liên tục trong 4 ngày tính từ ngày ñộng dục. Chu kỳ ñộng dục (ngày) của 8 cừu trong mỗi nhóm thu ñược như sau: Liều 0 mg/ngày 18 14 18 18 18 18 18 19 Liều 10 mg/ngày 15 14 17 14 12 13 12 13 Liều 25 mg/ngày 11 13 11 11 12 11 11 12 Liều 40 mg/ngày 9 10 12 10 11 11 10 11 Cho biết ảnh hưởng của progesterone lên chu kỳ ñộng dục ở cừu Merino.
File đính kèm:
- bai_giang_thiet_ke_thi_nghiem_chuong_2_uoc_luong_va_kiem_din.pdf