Bài giảng Thiết kế thí nghiệm - Chương 2: Ước lượng và kiểm định giả thiết

Kiểm định giả thiết là một bài toán hay gặp trong thống kê. Phạm vi nghiên cứu khá rộng và

về mặt lý thuyết có những vấn đề khá phức tạp nếu muốn giải quyết thật tỷ mỷ, chính xác.

Trong chương này chỉ trình bầy một vài bài toán kiểm định giả thiết cụ thể liên quan đến các

biến định lượng. Chương sau sẽ tiếp tục kiểm định giả thiết với biến định tính. Nhưng trước

hết cần giới thiệu chung về giả thiết và đối thiết và hai loại sai lầm mắc phải khi kiểm định.

pdf 15 trang phuongnguyen 10980
Bạn đang xem tài liệu "Bài giảng Thiết kế thí nghiệm - Chương 2: Ước lượng và kiểm định giả thiết", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Thiết kế thí nghiệm - Chương 2: Ước lượng và kiểm định giả thiết

Bài giảng Thiết kế thí nghiệm - Chương 2: Ước lượng và kiểm định giả thiết
Chương 2 
Ước lượng và kiểm ñịnh giả thiết 
Kiểm ñịnh giả thiết là một bài toán hay gặp trong thống kê. Phạm vi nghiên cứu khá rộng và 
về mặt lý thuyết có những vấn ñề khá phức tạp nếu muốn giải quyết thật tỷ mỷ, chính xác. 
Trong chương này chỉ trình bầy một vài bài toán kiểm ñịnh giả thiết cụ thể liên quan ñến các 
biến ñịnh lượng. Chương sau sẽ tiếp tục kiểm ñịnh giả thiết với biến ñịnh tính. Nhưng trước 
hết cần giới thiệu chung về giả thiết và ñối thiết và hai loại sai lầm mắc phải khi kiểm ñịnh. 
2.1. Giả thiết và ñối thiết 
Khi khảo sát một tổng thể (hoặc nhiều tổng thể) và xem xét một (hoặc nhiều) biến ngẫu nhiên 
có thể ñưa ra một giả thiết nào ñó liên quan ñến phân phối của biến ngẫu nhiên hoặc nếu biết 
phân phối rồi thì ñưa ra giả thiết về tham số của tổng thể. ðể có thể ñưa ra một kết luận thống 
kê nào ñó ñối với giả thiết thì phải chọn mẫu ngẫu nhiên, tính tham số mẫu, chọn mức ý nghĩa 
α sau ñó ñưa ra kết luận. 
Bài toán kiểm ñịnh tham số Θ của phân phối có dạng H0 : Θ = Θo với Θo là một số ñã cho nào 
ñó. Kết luận thống kê có dạng: “chấp nhận H0” hay “bác bỏ H0”. Nhưng nếu ñặt vấn ñề như 
vậy thì cách giải quyết hết sức khó, vì nếu không chấp nhận H0 : Θ = Θo thì ñiều ñó có nghĩa 
là có thể chấp nhận một trong vô số Θ khác Θo, do ñó thường ñưa ra bài toán dưới dạng cụ 
thể hơn nữa: cho giả thiết H0 và ñối thiết H1, khi kết luận thì hoặc chấp nhận H0 hoặc bác bỏ 
H0, và trong trường hợp này, tuy không hoàn toàn tương ñương, nhưng coi như chấp nhận ñối 
thiết H1. 
Nếu chấp nhận H0 trong lúc giả thiết ñúng là H1 thì mắc sai lầm loại II và xác suất mắc sai 
lầm này ñược gọi là rủi ro loại hai β. Ngược lại nếu bác bỏ H0 trong lúc giả thiết ñúng chính 
là H0 thì mắc sai lầm loại I và xác suất mắc sai lầm ñó gọi là rủi ro loại một α. 
 Quyết ñịnh 
Giả thiết Bác bỏ H0 Chấp nhận H0 
H0 ñúng Sai lầm loại I (α) Quyết ñịnh ñúng 
H0 sai Quyết ñịnh ñúng Sai lầm loại II (β) 
Như vậy trong bài toán kiểm ñịnh giả thiết luôn luôn có hai loại rủi ro, loại I và loại II, tuỳ 
vấn ñề mà nhấn mạnh loại rủi ro nào. Thông thường người ta hay tập trung chú ý vào sai lầm 
loại I và khi kiểm ñịnh phải khống chế sao cho rủi ro loại I không vượt quá một mức α gọi là 
mức ý nghĩa. 
Chương 2 Ước lượng và kiểm ñịnh giả thiết 
19
Trước hết xem xét cụ thể bài toán kiểm ñịnh giả thiết H0: Θ = Θo, ñối thiết H1: Θ = Θ1 với Θ1 
là một giá trị khác Θo. ðây là bài toán kiểm ñịnh giả thiết ñơn. Quy tắc kiểm ñịnh căn cứ vào 
hai giá trị cụ thể Θ1 và Θo, vào mức ý nghĩa α và còn căn cứ vào cả sai lầm loại hai. Việc này 
về lý thuyết thống kê không gặp khó khăn gì. 
Sau ñó mở rộng quy tắc sang cho bài toán kiểm ñịnh giả thiết kép. H1: Θ≠Θo; Θ > Θo hoặc 
Θ < Θo, việc mở rộng này có khó khăn nhưng các nhà nghiên cứu lý thuyết xác suất thống kê 
ñã giải quyết ñược, do ñó về sau khi kiểm ñịnh giả thiết H0 : Θ = Θo có thể chọn một trong 3 
ñối thiết H1 sau: 
 H1 : Θ ≠ Θo gọi là ñối thiết hai phía 
 H1 : Θ > Θo gọi là ñối thiết phải 
 H1 : Θ < Θo gọi là ñối thiết trái 
Hai ñối thiết sau gọi là ñối thiết một phía. Việc chọn ñối thiết nào tuỳ thuộc vấn ñề khảo sát 
cụ thể. Trong phạm vi tài liệu này ñề cập chủ yếu ñến ñối thiết hai phía hay còn gọi là hai 
ñuôi. 
2.2. Ước lượng giá trị trung bình µ của biến phân phối chuẩn N(µ, σ2). 
2.2.1. Ước lượng µ khi biết phương sai σ2 
Dựa vào lý thuyết xác suất có thể ñưa ra ước lượng giá trị trung bình quần thể (µ) theo các 
bước sau ñây: 
+ Chọn mẫu dung lượng n, tính trung bình cộng x 
+ Ở mức tin cậy P ñã cho lấy α = 1- P, sau ñó tìm giá trị tới hạn z(α/2) trong bảng 1 (hàm Φ(z) 
tìm z sao cho Φ(z) = 1 - α/2 ) 
+ Khoảng tin cậy ñối xứng ở mức tin cậy P: 
n
zx
n
zx
σ
αµσα )2/()2/( +≤≤− 
Ví dụ 2.1: Khối lượng bao thức ăn gia súc phân phối chuẩn N(µ,σ2) với σ = 1,5kg. Cân thử 
25 bao ñược khối lượng trung bình x = 49kg. Hãy ước lượng kỳ vọng µ với mức tin cậy P = 
0,95; z (0,025) = 1,96 
25
5,196,149
25
5,196,149 +≤≤− µ
49 - 0,588 ≤ µ ≤ 49 + 0,588 
48,41kg ≤ µ ≤ 49,59kg 
Thiết kế thí nghiệm 20
2.2.2. Ước lượng µ khi không biết phương sai σ2 
Dựa vào phân phối Student có thể ñưa ra ước lượng µ theo các bước sau ñây: 
+ Chọn mẫu dung lượng n, tính trung bình cộng 
_
x và ñộ lệch chuẩn s. 
+ Ở mức tin cậy P lấy α = 1- P, tìm giá trị tới hạn t(α/2, n-1) trong bảng 2, cột α/2, dòng n-1 
+ Khoảng tin cậy ñối xứng ở mức tin cậy P: 
n
s
ntx
n
s
ntx )1,2/()1,2/( −+≤≤−− αµα 
Ví dụ 2.2: Cân 22 con gà ñược khối lượng trung bình x = 3,03kg; s = 0,0279 kg. Hãy ước 
lượng µ với mức tin cậy P = 0,98; α = 1- P = 0,02; α/2 = 0,01 t(0,01;21) = 2,518 
22
0279,0518,203,3
22
0279,0518,203,3 +≤≤− µ 
3,03 - 0,089 ≤ µ ≤ 3,03 + 0,089 
2,94kg ≤ µ ≤ 3,12 kg 
2.3. Kiểm ñịnh giá trị trung bình µ của biến phân phối chuẩn N(µ, σ2). 
2.3.1. Kiểm ñịnh giả thiết H0: µ = µ0 khi biết σ2 
Tiến hành kiểm ñịnh theo các các bước sau: 
+ Chọn mẫu dung lượng n, tính trung bình cộng 
_
x 
+ Chọn mức ý nghĩa α 
+ Tìm giá trị tới hạn z(α/2) nếu kiểm ñịnh 2 phía hoặc z(α) nếu kiểm ñịnh một phía 
+ Tính giá trị thực nghiệm ZTN =
σ
µ
σ
µ nx
n
x )()( 00 −
=
−
So sánh ZTN và z tới hạn ñể rút ra kết luận theo nguyên tắc sau: 
Kết luận: 
Với H1 : µ ≠ µ0 (Kiểm ñịnh hai phía) 
Nếu ZTN  (giá trị tuyệt ñối của ZTN) nhỏ hơn hay bằng z(α/2) thì chấp nhận H0 nếu ngược 
lại thì bác bỏ H0, tức là chấp nhận H1. 
Với H1 : µ > µ0 (Kiểm ñịnh một phía) 
Nếu ZTN nhỏ hơn hay bằng giá trị tới hạn z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1. 
Với H1: µ < µ0 (Kiểm ñịnh một phía) 
Nếu ZTN lớn hơn hay bằng giá trị tới hạn - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1. 
Chương 2 Ước lượng và kiểm ñịnh giả thiết 
21
Ví dụ 2.3: Nuôi 100 con cừu theo một chế ñộ riêng. Mục ñích của thí nghiệm là xem chế ñộ 
này có làm tăng khối lượng của cừu một năm tuổi hay không. Biết rằng 100 cừu này ñược lấy 
mẫu từ một quần thể có khối lượng trung bình một năm tuổi là 30 kg và phương sai là 25 kg². 
Giả thiết tăng trọng phân phối chuẩn N(µ,25), hãy kiểm ñịnh giả thiết H0: µ = 30 ñối thiết H1: 
µ > 30 ở mức α= 0,05. Biết rằng khối lượng trung bình của 100 cừu thí nghiệm là 32 kg. 
ZTN 45
100)3032(
=
−
= ; z(0,05) = 1,64 
Kết luận: Vì ZTN > ZLT nên giả thiết H0 bị bác bỏ, như vậy tăng trọng trung bình không phải là 
30 kg. Chế ñộ nuôi mới ñã làm tăng khối lượng cừu một năm tuổi. 
Ví dụ 2.4: Một mẫu cho trước gồm 100 bò sữa có sản lượng sữa một chu kỳ tiết sữa trung bình 
là 3850kg. Số bò này có xuất phát từ quần thể có giá trị trung bình là 4000kg và ñộ lệch chuẩn 
là 1000 hay không? Giả sử sản lượng sữa của quần thể tuân theo phân phối chuẩn N((µ,1000²). 
Hãy kiểm ñịnh giả thiết H0: µ = 4000 ñối thiết H1: µ ≠ 4000 ở mức α= 0,05 
ZTN 5,11000
100)40003850(
−=
−
=  ZTN = 1,5; z(0,025) = 1,96 
Kết luận: Chấp nhận H0, số bò sữa nêu trên xuất phát từ một quần thể ban ñầu có sản lượng 
sữa chu kỳ là 4000kg. 
2.3.2. Kiểm ñịnh giả thiết H0: µ = µ0 khi không biết σ2 
ðây là trường hợp phổ biến khi kiểm ñịnh giá trị trung bình của phân phối chuẩn. Tiến hành 
các bước sau: 
 + Lấy mẫu dung lượng n, tính 
_
x và s2 
+ Tính giá trị T thực nghiệm TTN = 
s
nx )( 0
__
µ−
+ Tìm giá trị tới hạn t(α/2, n-1) với kiểm ñịnh 2 phía hoặc tìm t(α, n-1) nếu kiểm ñịnh 1 phía 
trong bảng 2. 
Kết luận: 
Với H1 : µ ≠ µ0 (Kiểm ñịnh hai phía) 
Nếu TTN (giá trị tuyệt ñối của Ttn) nhỏ hơn hay bằng t(α/2,n-1) thì chấp nhận H0 nếu 
ngược lại thì bác bỏ H0, tức là chấp nhận H1 
Với H1 : µ > µ0 (Kiểm ñịnh một phía) 
Nếu TTN ≤ t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Với H1: µ < µ0 (Kiểm ñịnh một phía) 
Nếu TTN ≥ - t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1. 
Thiết kế thí nghiệm 22
Ví dụ 2.5: Thời gian mang thai của bò phân phối chuẩn N(285,σ2). Theo dõi thời gian mang 
thai (ngày) của 6 bò ñược các số liệu 
307 293 293 283 294 297 
Kiểm ñịnh giả thiết H0: µ = 285 ngày ñối thiết H1: µ ≠ 285 ngày 
Tính 5,294
6
1767
6
)297294283293293307(
==
+++++
=x 
9,59
5
6
1767)297294....293307
2
2222
2
=
−++++
=s ; 74,77395,79,59 ≈==s 
TTN 007,316,3
5,96
74,7
)2855,294(
==×
−
= ; t(0,025;5) =2,571 
Kết luận: Vì TTN = 3,007 > t(0,025;5) nên bác bỏ H0 như vậy thời gian mang thai không 
phải 285 ngày 
Ví dụ 2.6: Trong ñiều kiện chăn nuôi bình thường, lượng sữa trung bình của một con bò là 19 
kg / ngày. Trong một ñợt hạn, người ta theo dõi 25 con bò và ñược lượng sữa trung bình 17,5 
kg/ ngày, ñộ lệch chuẩn s = 2,5 kg. Giả thiết lượng sữa phân phối chuẩn, hãy kiểm ñịnh giả 
thiết H0: µ = 19 với ñối thiết µ < 19 ở mức α = 0,05. 
 TTN = = 5,2
25)195,17( −
 - 3 ; t(0,05;24) = 1,711 
Kết luận: TTN < - 1,711 nên giả thiết H0 bị bác bỏ, như vậy sản lượng sữa trung bình không 
còn là 19 kg / ngày nữa mà thấp hơn. 
2.4. Kiểm ñịnh hai giá trị trung bình của hai biến phân phối chuẩn 
Giả sử chúng ta có hai tổng thể và theo dõi một biến ñịnh lượng X nào ñó, ví dụ khối lượng 
sau 6 tháng nuôi của hai ñàn gà, năng suất của hai giống lúa, năng suất của một giống ngô khi 
bón theo hai công thức phân bón khác nhau, sản lượng một loại quả khi trồng theo hai khoảng 
cách hàng . . . 
Chúng ta gọi biến X trên tổng thể thứ nhất là X1 (phân phối chuẩn N(µ1,σ12)) và biến X trên 
tổng thể thứ hai là X2 (phân phối chuẩn N(µ2,σ22)). ðể so sánh µ1 và µ2 chúng ta phải chọn 
mẫu. Có hai cách chọn mẫu: Chọn mẫu theo cặp và chọn mẫu ñộc lập. 
2.4.1. Chọn mẫu theo cặp 
Từ tổng thể thứ nhất ta chọn một mẫu n cá thể ñược các giá trị x1, x2, . . . ,xn , từ tổng thể thứ 
hai chọn một mẫu cũng gồm n cá thể ñược y1, y2, . . ., yn. 
Giữa hai mẫu này có mối quan hệ cặp, tức là có n cặp (xi, yi) (i = 1, n). Các cặp này hình 
thành do khi chọn mẫu ta ñã dùng những quan hệ cặp như quan hệ gia ñình (vợ chồng, anh 
em, thí dụ chọn n tổ chim sau ñó bắt chim ñực vào mẫu ñại diện cho tổng thể chim ñực, bắt 
chim cái vào mẫu ñại diện cho tổng thể chim cái), quan hệ trước sau (thí dụ cá thể ñược ño 
một chỉ số trước khi dùng thuốc và số liệu này ñại diện cho tổng thể trước khi dùng thuốc, 
Chương 2 Ước lượng và kiểm ñịnh giả thiết 
23
một thời gian sau khi dùng thuốc lại ño lại chỉ số và số liệu này ñại diện cho tổng thể sau khi 
dùng thuốc), cũng có khi các cặp này là các cặp số liệu do chúng ta bố trí thí nghiệm theo cặp: 
chọn 2 ô ruộng, một ô ruộng(hay một chuồng) bố trí giống thử nghiệm, một ô ruộng (một 
chuồng) bố trí giống ñối chứng. 
 Viết lại số liệu dưới dạng hai cột hay hai hàng rồi tính hiệu số di = yi - xi 
X1 x1 x2 . . . xn 
X2 y1 y2 . . . yn 
d d1 d2 . . . dn 
Tiếp theo tính giá trị trung bình 
_
d và ñộ lệch chuẩn sd 
Giả thiết H0: µ2 = µ1 ñối thiết H1: µ2 ≠ µ1 ñược chuyển thành H0: µd = 0 ñối thiết H1: µd ≠ 0 
(tương tự H1: µ2 > µ1 chuyển thành H1: µd > 0 và H1: µ2 < µ1 chuyển thành H1: µd < 0). 
Ở mức ý nghĩa α việc kiểm ñịnh gồm các bước sau: 
+ Tính giá trị thực nghiệm TTN = 
ds
nd
+ Tìm giá trị tới hạn t(α/2, n-1) nếu kiểm ñịnh 2 phía hoặc t(α, n-1) nếu kiểm ñịnh một phía 
bảng 2 
Kết luận: 
+ Kiểm ñịnh hai phía H1: µ2 ≠ µ1 
Nếu TTN ≤ t(α/2, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1 
+ Kiểm ñịnh một phía H1: µ2 > µ1 
Nếu TTN ≤ t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1 
+ Kiểm ñịnh một phía H1: µ2 < µ1 
Nếu TTN ≥ - t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Ví dụ 2.7: Tăng trọng (pound) của 10 cặp bê sinh ñôi giống hệt nhau dưới hai chế ñộ chăm 
sóc khác nhau (A và B). Bê trong từng cặp ñược bắt thăm ngẫu nhiên về một trong hai cách 
chăm sóc. Giả thiết tăng trọng có phân phối chuẩn. Hãy kiểm ñịnh giả thiết H0: Tăng trọng 
trung bình ở hai cách chăm sóc như nhau, ñối thiết H1: Tăng trọng trung bình khác nhau ở hai 
cách chăm sóc với mức ý nghĩa α = 0,05. Số liệu thu ñược như sau: 
Cặp sinh ñôi 1 2 3 4 5 6 7 8 9 10 
Tăng trọng ở cách A 43 39 39 42 46 43 38 44 51 43 
Tăng trọng ở cách B 37 35 34 41 39 37 35 40 48 36 
Chênh lệch (d) 6 4 5 1 7 6 3 4 3 7 
n = 10; 
−
d = 4,6; sd = 1,955; TTN = 955,1
106,4
 = 7,44; t(0,025;9) = 2,262 
Kết luận: Bác bỏ giả thiết H0, chấp nhận H1: “Tăng trọng trung bình ở hai cách chăm sóc là 
khác nhau”. 
Thiết kế thí nghiệm 24
Ví dụ 2.8: Có 15 trại phối hợp tham gia thử nghiệm khẩu phần ăn bình thường (A) và khẩu 
phần ăn có bổ sung ñồng (B). Mỗi trại lấy 2 khu nuôi lợn tương tự về mọi mặt sau ñó chỉ ñịnh 
ngẫu nhiên một khu ăn khẩu phần A, một khu ăn khẩu phần B. Tăng trọng trung bình 
(kg/ngày) của một con lợn ñược trình bày ở bảng dưới. Kiểm ñịnh giả thiết H0: “Hai khẩu 
phần A và B cho kết quả tăng trọng trung bình như nhau” với ñối thiết H1: “Khẩu phần có bổ 
sung ñồng cho tăng trọng trung bình cao hơn” 
 Khẩu phần Khẩu phần Khẩu phần 
Trại A (xi) B (yi) Trại A (xi) B (yi) Trại A (xi) B (yi) 
1 0,42 0,53 6 0,50 0,52 11 0,50 0,51 
2 0,53 0,47 7 0,44 0,44 12 0,54 0,54 
3 0,48 0,56 8 0,45 0,46 13 0,46 0,50 
4 0,50 0,59 9 0,30 0,43 14 0,48 0,50 
5 0,42 0,47 10 0,52 0,57 15 0,53 0,59 
Giá trị trung bình 
−
d = 0,0407; ñộ lệch chuẩn sd = 0,0489 
TTN 22,3150489,0
0407,0
=×= ; t(0,05;14) = 1,761 
Kết luận: Vì TTN > t nên bác bỏ H0, chấp nhận H1. Như vậy khẩu phần bổ sung ñồng cho 
tăng trọng trung bình cao hơn khẩu phần ăn thường. 
2.4.2. Chọn mẫu ñộc lập 
Từ hai tổng thể chọn ra hai mẫu ñộc lập, dung lượng có thể bằng nhau hoặc khác nhau. Tính 
các tham số thống kê 1
−
x ; s12 của mẫu thứ nhất; 2
−
x ; s22 của mẫu thứ hai. ðể kiểm ñịnh giả 
thiết H0: µ2 = µ1 với các ñối thiết H1 ở mức ý nghĩa α ta chia ra 3 trường hợp: 
2.4.2.1. Biết phương sai σ12 và σ22 
+ Tính Z thực nghiệm ZTN
2
2
2
1
2
1
1
_
2
_
)(
nn
xx
σσ
+
−
= 
+ Tìm giá trị tới hạn z(α/2) nếu kiểm ñịnh 2 phía hoặc z(α) nếu kiểm ñịnh một phía trong 
bảng 1 
Kết luận: 
+ Kiểm ñịnh hai phía H1: µ2 ≠ µ1 
Nếu ZTN  ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1 
+ Kiểm ñịnh một phía H1: µ2 > µ1 
Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 
+ Kiểm ñịnh một phía H1: µ2 < µ1 
Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Chương 2 Ước lượng và kiểm ñịnh giả thiết 
25
Ví dụ 2.9: Chiều dài cá trong 2 ao phân phối chuẩn với ñộ lệch chuẩn σ1 = 2cm và σ2 = 
2,2cm. Lấy mẫu 100 con của ao thứ nhất ñược giá trị trung bình 1
_
x = 8 cm; lấy mẫu 120 con 
của ao thứ hai ñược giá trị trung bình 2
_
x
= 8,5 cm. Hãy kiểm ñịnh giả thiết H0: µ1 = µ2 với 
ñối thiết H1: µ1 ≠ µ2 ở mức ý nghĩa α=0,05 
Z
TN
764,1
120
2,2
100
2
)85,8(
22
=
+
−
= ; z(0,025) = 1,96 
Vì ZTN = 1,764 < 1,96 nên chấp nhận H0: “Chiều dài cá trung bình trong 2 ao như nhau”. 
2.4.2.2. Không biết phương sai σ12 và σ22 mẫu lớn( n1 ≥ 30, n2 ≥ 30). 
+ Tính giá trị thực nghiệm ZTN
2
2
2
1
2
1
1
_
2
_
)(
n
s
n
s
xx
+
−
=
+ Tìm giá trị tới hạn z(α/2) nếu kiểm ñịnh 2 phía hoặc z(α) nếu kiểm ñịnh một phía trong 
bảng 1 
Kết luận: 
+ Kiểm ñịnh hai phía H1: µ2 ≠ µ1 
Nếu ZTN  ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1 
+ Kiểm ñịnh một phía H1: µ2 > µ1 
Nếu ZTN ≤ z(α) thì chấp nhận H0, ... 5) vì vậy chấp nhận H1: “chế ñộ ăn thứ hai cho kết quả trung bình cao hơn chế ñộ 
ăn thứ nhất”. 
Thiết kế thí nghiệm 26
2.4.2.3. Không biết phương sai σ12 và σ22, mẫu bé ( ít nhất một trong 2 số n1, n2 <30) 
ðây là một bài toán còn rất nhiều vướng mắc về mặt lý thuyết do ñó chúng ta chỉ trình bầy 
trường hợp có thêm giả thiết phụ : σ12 = σ22 
+ Tính phương sai chung: s2c = 2
)1()1(
21
2
22
2
11
−+
−+−
nn
snsn
+ Tính TTN =
)11(
)(
21
2
12
nn
s
xx
c +
−
+ Tìm giá trị tới hạn t(α/2, n1 + n2 - 2) với kiểm ñịnh 2 phía hoặc t(α, n1 + n2 - 2) nếu kiểm 
ñịnh một phía 
Kết luận: 
+ Kiểm ñịnh hai phía H1: µ2 ≠ µ1 
Nếu TTN≤ t(α/2,n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1 
+ Kiểm ñịnh một phía H1: µ2 > µ1 
Nếu TTN ≤ t(α ,n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1 
+ Kiểm ñịnh một phía H1: µ2 < µ1 
Nếu TTN ≥ - t(α,n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Ví dụ 2.11: ðể so sánh khối lượng của 2 giống bò, chọn ngẫu nhiên 12 bò của giống thứ nhất 
và 15 bò của giống thứ 2. Khối lượng (kg) của từng bò ñược xác ñịnh và thu ñược các tham số 
thống kê sau: n1 = 12; 1
_
x = 196,2kg; s1 = 10,62 kg; n2 = 15; 2
_
x
= 153,70kg; s2 = 12,30kg. 
Kiểm ñịnh giả thiết H0: Hai giống bò có khối lượng trung bình như nhau với ñối thiết H1: 
Giống bò thứ nhất có khối lượng trung bình lớn hơn giống bò thứ hai. Giả sử khối lượng của 2 
giống bò có phân phối chuẩn và hai phương sai bằng nhau với mức ý nghĩa α = 0,05. 
33,134
1411
)30,121462,1011( 222
=
+
×+×
=cs 
TTN 46,9489,4
5,42
15
1
12
133,134
)7,1532,196(
==






+×
−
= ; t(0,05,25) = 1,708 
Kết luận: Ở mức ý nghĩa α = 0,05 vì TTN > t nên bác bỏ H0. Như vậy giống thứ nhất có khối 
lượng trung bình cao hơn giống thứ hai. 
Ví dụ 2.12 : Hai giống gà có khối lượng phân phối chuẩn, lấy mẫu 10 gà ñối với giống thứ 
nhất và 16 gà của giống thứ 2. Các tham số về khối lượng 45 ngày tuổi của 2 mẫu nêu trên 
như sau: 
Với mẫu thứ nhất n1 = 10; 1
_
x = 2,8kg; s12 = 0,1111 kg² với mẫu thứ hai n2 = 16; 2
_
x = 2,35kg; 
s2
2
 = 0,0667kg². Kiểm ñịnh giả thiết H0: Hai giống gà có khối lượng trung bình như nhau với 
ñối thiết H1: Hai giống gà có khối lượng trung bình khác nhau. Mức ý nghĩa α = 0,05. 
Chương 2 Ước lượng và kiểm ñịnh giả thiết 
27
83331,0
24
99995,1
159
0667,0151111,092
==
+
×+×
=cs 
TTN = = -3,866  TTN= 3,866; t(0,025;24) = 2,064 
Kết luận: Bác bỏ H0, như vậy hai giống gà có khối lượng trung bình khác nhau. 
2.5. Ước lượng và kiểm ñịnh xác suất 
Trường hợp tổng thể có 2 loại cá thể A và A’, loại A chiếm tỷ lệ p và A’ chiếm tỷ lệ q = 1-p. 
Sau khi chọn mẫu có thể dùng phân phối chuẩn ñể tính gần ñúng phân phối nhị thức, từ ñó suy 
ra công thức ước lượng p. 
2.5.1. Ước lượng xác suất p 
Khi dung lượng mẫu lớn (n ≥ 30 nhưng thực tế tốt nhất là trên 100) và p không bé quá, cũng 
không lớn quá ( np > 5, nq > 5). Từ mẫu có dung lượng n, tính số cá thể loại A ñược tần số m 
và tần suất f = m/ n với mức tin cậy P có khoảng tin cậy ñối xứng sau: 
n
ff
zfp
n
ff
zf )1()2/()1()2/( −+≤≤−− αα 
Ví dụ 2.13: ðể biết tỷ lệ trứng nở p của một loại trứng; cho vào máy ấp 100 quả, kết quả có 
80 quả nở. 
f = 80 / 100 = 0,8 ở mức tin cậy P = 0,95 thì α = 0,05 và z(0,025) = 1,96. Ta có thể tính 
ñược khoảng tin cậy như sau: 
100
2,08,096,18,0
100
2,08,096,18,0 ×+≤≤×− p 
0,8 - 0,0784 ≤ p ≤ 0,8 + 0,0784 ⇔ 0,72 ≤ p ≤ 0,88 
2.5.2. Kiểm ñịnh giả thiết H0: p = p0 
Khi dung lượng mẫu lớn (n ≥ 30 nhưng thực tế thấy tốt nhất là trên 100) và p không bé quá, 
cũng không lớn quá ( np > 5, nq > 5). Từ mẫu có dung lượng n, tính số cá thể loại A ñược tần 
số m và tần suất f = m / n. Ở mức ý nghĩa α tính z(α/2) với kiểm ñịnh 2 phía hoặc z(α) nếu 
kiểm ñịnh một phía. 
Tính ZTN =
n
pp
pf
o )1( 0
0
−
−
Kết luận: 
Với ñối thiết hai phía H1: p ≠ p0 
Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Với ñối thiết một phía H1: p > p0 
Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Với ñối thiết một phía H1: p < p0 
Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Thiết kế thí nghiệm 28
Ví dụ 2.14: Ấp 100 quả trứng có 82 quả nở. Kiểm ñịnh giả thiết H0: tỷ lệ nở p = 0,80, ñối 
thiết H1: p ≠0,8 với α = 0,05. 
n = 100; m = 82; f = 82/100 = 0,82; 
ZTN = 
100
2,0.8,0
80,082,0 −
 = 0,5 ; z(0,025) = 1,96 
Kết luận: Chấp nhận H0: “Tỷ lệ ấp nở là 0,80”. 
2.5.3. Kiểm ñịnh giả thiết H0: p2 = p1 
Khi dung lượng cả 2 mẫu ñều lớn ( n1 > 100, n2 > 100) và các pi không bé quá (hoặc lớn quá) 
có thể kiểm ñịnh như sau (ở mức ý nghĩa α) 
Tính các tần suất: 
1
1
1
n
mf = ; 
2
2
2
n
mf = 
Tính tần suất chung: 
21
21
nn
mmf
+
+
= 
Tìm giá trị tới hạn z(α/2) nếu kiểm ñịnh 2 phía hoặc z(α) nếu kiểm ñịnh một phía 
Tính giá trị thực nghiệm: ZTN
)11)(1(
21
12
nn
ff
ff
+−
−
= 
Kết luận: 
Với ñối thiết hai phía H1: p2 ≠ p1 
Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Với ñối thiết một phía H1: p2 > p1 
Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Với ñối thiết một phía H1: p2 < p1 
Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì thì chấp nhận H1 
Ví dụ 2.15: Dùng thuốc A ñiều trị cho 200 bệnh nhân thấy 150 người khỏi bệnh. Tương tự 
với thuốc B ñối với 100 bệnh nhân thì 72 người khỏi bệnh. Hãy kiểm ñịnh giả thiết H0: Tỷ lệ 
khỏi bệnh của hai thuốc như nhau với ñối thiết H1: tỷ lệ khỏi bệnh của hai thuốc khác nhau 
với mức ý nghĩa α = 0,05. 
n1 = 200; m1 = 150; f1 = 150/ 200 = 0,75; n2 = 100; m2 = 72; f2 = 72 /100 = 0,72 ; 
74,0
100200
72150
=
+
+
=f 
ZTN 5584,0
)
100
1
200
1(26,074,0
75,072,0
−=
+××
−
=  |ZTN| = 0,5584; z(0,025) = 1,96. 
Kết luận: Chấp nhận H0; tức là tỷ lệ khỏi bệnh ở 2 loại thuốc là như nhau. 
Chương 2 Ước lượng và kiểm ñịnh giả thiết 
29
2.6. Phân tích phương sai 
Mở rộng bài toán so sánh hai trung bình của hai tổng thể ở mục trên khi có nhiều hơn 2 trung 
bình chúng ta có bài toán phân tích phương sai một nhân tố. Thí dụ có a tổng thể, ñể khảo sát 
các biến X1, X2, . . . , Xa trên các tổng thể ñó chúng ta lấy ở mỗi tổng thể một mẫu các quan 
sát ñộc lập: 
 Mẫu 1 x11, x12, . , x1r1 
 Mẫu 2 x21, x22, . , x2r2 
 . . 
 Mẫu a xa1, xa2, ., x2ra 
Tất cả có n = Σri quan sát. Viết lại các quan sát xi j dưới dạng 
 xi j = µi + ei j ei j gọi là sai số hay phần dư (2.1) 
Giả thiết các biến Xi ñộc lập, phân phối chuẩn N(µi, σ2), các quan sát trong mẫu ñộc lập.Từ 
giả thiết trên có thể nêu cụ thể 3 giả thiết sau ñối với các sai số ei j 
a- Các biến ei j ñộc lập với nhau 
b- Các biến ei j phân phối chuẩn với kỳ vọng bằng 0 
c- Các biến ei j có phương sai bằng nhau (σ2) 
Bài toán phân tích phương sai một nhân tố chính là bài toán kiểm ñịnh giả thiết H0: “Các 
trung bình µi bằng nhau” với ñối thiết H1: “Có ít nhất một cặp trung bình khác nhau”. 
Nếu gọi µ
là trung bình của các µi thì có thể viết (2.1) lại như sau: 
 xi j = µ + ai + ei j (2.2) 
 với ai = µi - µ; Σai = 0 
Giả thiết H0 bây giờ là : “Các ai ñều bằng 0” còn H1 là “Không phải tất cả các ai ñều bằng 0”. 
ðể phân tích phương sai chúng ta gọi các trung bình cộng của các mẫu quan sát là ix
_
. Nếu 
giả thiết H0 ñúng thì các Xi có cùng phân phối N(µ,σ2) và có thể coi các mẫu quan sát nói trên 
ñược lấy ra từ cùng một tổng thể. 
Gọi 
_
x là trung bình chung của tất cả các mẫu. 
Tính tổng bình phương tất cả các sai số (gọi là tổng bình phương toàn bộ SSTO) 
SSTO 2
1 1
2
1 1
2)( xnxxx
a
i
n
j
ij
a
i
n
j
ij
ii
−=−= ∑∑∑∑
= == =
ðem tổng bình phương này chia cho (n - 1) ñược một ước lượng của σ2. 
SSTO/ σ2 phân phối χ2 với dfTO = (n - 1) bậc tự do. 
ðối với mỗi mẫu quan sát chúng ta tính tổng bình phương sai số trong mẫu (mà nếu ñem chia 
cho bậc tự do tương ứng (ni - 1) thì ñược một ước lượng của σ2) sau ñó gộp lại thành tổng 
bình phương do sai số SSE (Giống như cách ñã làm khi ñi tìm phương sai chung s2c trong 
trường hợp mẫu bé và hai phương sai bằng nhau ở mục 2.4.2.3 ) 
SSE ∑∑
= =
−=
a
i
n
j
iij
i
xx
1 1
2)( 
Thiết kế thí nghiệm 30
ðem SSE chia cho n - a ñược một ước lượng của σ2 
SSE /σ2 phân phối χ2 với dfE = (n - a) bậc tự do. 
Có thể chứng minh hệ thức sau: 
∑∑∑∑∑∑
= == == =
−+−=−
a
i
n
j
i
a
i
n
j
iij
a
i
n
j
ij
iii
xxxxxx
1 1
2
1 1
2
1 1
2 )()()( 
Tổng thứ ba gọi là tổng bình phương do nhân tố SSA. 
Nếu xi j phân phối chuẩn N(µi, σ2) thì các trung bình cộng .
_
ix phân phối chuẩn N(µi, σ2/ni). 
Từ ñó suy ra nếu ñem SSA chia cho (a - 1) thì ñược ước lượng của σ2. 
Tổng SSA/σ2 phân phối χ2 với dfA = (a-1) bậc tự do. 
Như vậy chúng ta ñã tách tổng bình phương toàn bộ ra hai tổng: 
 SSTO = SSA + SSE 
ðồng thời bậc tự do toàn bộ cũng tách thành 2 bậc tự do: 
 dfTO = dfA + dfE 
Mỗi tổng bình phương chia cho bậc tự do tương ứng sẽ cho một ước lượng của phương sai σ2 
và mỗi tổng sau khi chia cho σ2 sẽ phân phối χ2
 với số bậc tự do tương ứng. 
Bây giờ xét tỷ số MSA / MSE với MSA = SSA / dfA và MSE = SSE / dfE 
Dựa trên lý thuyết về phân phối Khi bình phương (χ2) và phân phối F có kết luận sau: MSA / 
MSE phân phối Fisher- Snederco (F). Từ ñó có cách kiểm ñịnh sau ñây ñối với giả thiết H0 
(ñối thiết H1): 
 + Tính giá trị thực nghiệm FTN = MSA / MSE 
+ Tìm giá trị tới hạn F(α,dfA,dfE) 
+ Nếu FTN ≤ F(α,dfA,dfE) thì chấp nhận H0, ngược lại thì chấp nhận H1 
Toàn bộ quy trình phân tích phương sai ñược tóm tắt trong bảng phân tích phương sai sau: 
Nguồn biến ñộng Bậc tự do Tổng bình phương 
Trung bình 
bình phương FTN F tới hạn 
Nhân tố dfA = a-1 SSA MSA = SSA/dfA MSA/MSE F(α,dfA,dfE) 
Sai số ngẫu nhiên dfE = n-a SSE MSE = SSE/dfE 
Tổng biến ñộng dfTO = n-1 SSTO 
ðể thuận tiện thường kẻ bảng chứa dữ liệu và tính theo thứ tự sau: 
+ Tính dung lượng ni, tổng hàng THi, trung bình .
_
ix , TH2i / ni 
+ Tổng các dung lượng n = Σni , tổng tất cả các xi j ST =ΣΣ xi j 
+ Số ñiều chỉnh G = ST2 / n 
+ SSTO = ΣΣ x2i j - G bậc tự do dfTO = n - 1 
+ SSA = ΣTH2i / ni - G bậc tự do dfA = a - 1 
+ SSE = SSTO - SSA bậc tự do dfE = dfTO - dfA = n - a 
+ Tính các trung bình MSA = SSA / dfA và MSE = SSE / dfE 
+ Tính FTN = MSA / MSE 
+ Tìm giá trị F(α,dfA,dfE) 
+ So sánh FTN với F(α,dfA,dfE). 
Chương 2 Ước lượng và kiểm ñịnh giả thiết 
31
Ví dụ 2.16: Khối lượng (kg) của 20 lợn 90 ngày tuổi ñược nuôi ở 5 chế ñộ khác nhau từ lúc 
cai sữa 21 ngày tuổi. Biết rằng 20 lợn ñược chọn ñồng ñều nhau vào thời ñiểm cai sữa và bố 
trí ngẫu nhiên về một trong 5 công thức thí nghiệm. Số liệu ñược trình bày trong bảng dưới. 
Giả thiết khối lượng tuân theo phân phối chuẩn. Kiểm ñịnh giả thiết H0: Khối lượng trung 
bình của lợn 90 ngày tuổi ở 5 chế ñộ chăm sóc bằng nhau với ñối thiết H1: Khối lượng trung 
bình của lợn 90 ngày tuổi ở 5 chế ñộ chăm sóc không bằng nhau. Mức ý nghĩa α = 0,05. 
Công thức Khối lượng (kg) ni THi THi2/ni 
.
_
ix
A 32,2 34,9 29,7 3 96,8 3123,413 32,27 
B 28,4 28,0 22,8 28,5 29,4 5 137,1 3759,282 27,42 
C 28,8 29,5 23,1 20,1 4 101,5 2575,563 25,38 
D 41,5 36,3 31,7 31,0 38,2 5 178,7 6386,738 35,74 
E 33,0 26,0 30,6 3 89,6 2676,053 29,87 
 Tổng 20 603,7 18521,0492 
n = 20 ST = 603,7 ΣTH2i / ni = 18521,0492 
Số ñiều chỉnh G = 603,72 / 20 = 18222,6845 
Tổng các bình phương ΣΣ x2i j = 18727,6900 
SSTO = 18727,69 - 18222,68 = 505,0055; bậc tự do dfTO = 20 -1 = 19 
SSA = 18521,0492 - 18222,6845 = 298,3647; bậc tự do dfA = 5 - 1 = 4 
SSE = 505,0055 - 298,3647 = 206,6408; bậc tự do dfE = 19 - 4 = 15 
MSA = 298,3647 / 4 = 74,5912; MSE = 206,6408 / 15 = 13,7761 
FTN = 74,5912/ 13,7761 = 5,4145 F(0,05;4;15) = 3,056 
Có thể tổng hợp các kết quả thu ñược theo bảng phân tích phương sai (ANOVA) sau: 
Nguồn biến ñộng Bậc tự do Tổng bình phương 
Trung bình 
bình phương FTN F tới hạn 
Công thức 4 298,3647 74,5912 3,056 F(0,05;4;15) = 3,056 
Sai số ngẫu nhiên 15 206,6408 13,7761 
Tổng biến ñộng 19 505,0055 
Kết luận: Bác bỏ H0, như vậy là bác bỏ giả thiết “Khối lượng trung bình của lợn 90 ngày tuổi 
ở 5 chế ñộ chăm sóc bằng nhau”. 
Sau khi có kết luận như trên thì vấn ñề ñặt ra là phải so sánh 5 trung bình của 5 lô ñể tìm ra 
các trung bình nào bằng nhau, các trung bình nào khác nhau. Vấn ñề này sẽ ñược trình bầy kỹ 
ở phần sau. 
Qua cách làm như trên chúng ta thấy ñể kiểm ñịnh giả thiết H0: “Các trung bình bằng nhau” 
với ñối thiết H1: “Có ít nhất một cặp trung bình khác nhau” phải tìm cách tách tổng bình 
phương toàn bộ SSTO thành các tổng bình phương SSA và SSE căn cứ vào 2 nguồn biến ñộng 
của số liệu: biến ñộng do sự khác nhau giữa các mẫu và biến ñộng do sự khác nhau giữa các 
số liệu trong cùng một mẫu. ðồng thời phải tách bậc tự do toàn bộ dfTO thành các bậc tự do 
dfA và dfE tương ứng với các tổng SSA, SSE. Từ ñó có tên phân tích phương sai. 
Trong phần sau khi có nhiều nguồn biến ñộng thì phải tách SSTO thành nhiều tổng ứng với các 
nguồn biến ñộng và tách bậc tự do dfTO thành nhiều bậc tự do, sau ñó kiểm ñịnh các giả thiết 
tương ứng với các nguồn biến ñộng nhờ phân phối Fisher- Snederco. 
Thiết kế thí nghiệm 32
2.7. Bài tập 
2.7.1 
Tăng trọng trung bình (gram/ngày) của 36 lợn nuôi vỗ béo giống Landrace ñược rút ngẫu 
nhiên từ một trại chăn nuôi. Số liệu thu ñược như sau: 
577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586 
621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589 
Cán bộ kỹ thuật trại cho rằng tăng trọng trung bình của toàn ñàn lợn trong trại là 607 
gram/ngày. Theo anh chị kết luận ñó ñúng hay sai, vì sao? 
2.7.2 
Anh chị hãy kiểm tra kết luận với bài tập tương tự như 2.7.1, biết rằng ñộ lệch chuẩn của tính 
trạng này ở Landrace là 24 gram/ngày. 
2.7.3 
Tỷ lệ thụ thai bằng thụ tinh nhân tạo từ tinh trùng của 2 bò ñực giống ñược xác ñịnh trên 
nhóm bò cái gồm 50 con; 18 nhóm bò cái sử dụng tinh trùng của bò ñực A và 16 ñối với bò 
ñực B. Tỷ lệ thụ thai (%) thu ñược như sau: 
Bò ñực A 74,2 62,1 57,7 71,7 62,0 76,1 70,6 68,3 68,4 79,8 
 71,1 70,9 65,5 61,2 60,8 73,9 51,9 63,7 
Bò ñực B 49,6 49,2 53,2 56,5 69,1 54,2 80,7 62,7 71,5 67,5 
 64,6 75,4 79,6 59,8 68,8 60,2 
Hãy cho biết tỷ lệ thụ thai của 2 bò ñực nêu trên. 
2.7.4 
Nồng ñộ fructoza (mg%) trong tinh dịch bò trước và sau khi ủ ñược xác ñịnh trên 12 mẫu tinh 
bò ñực; các giá trị thu ñược như sau: 
Mẫu số 1 2 3 4 5 6 7 8 9 10 11 12 
Trước khi ủ 116 190 570 375 236 505 120 322 429 102 167 299 
Sau khi ủ 30 58 100 48 58 153 54 66 67 34 69 82 
Kết luận về nồng ñộ fructoza trong tinh dịch bò trước và sau khi ủ. 
2.7.5 
Một thí nghiệm ñược tiến hành nhằm nghiên cứu ảnh hưởng của progesterone lên chu kỳ 
ñộng dục của cừu Merino. Sử dụng 4 liều khác nhau (0, 10, 25 và 40 mg/ngày) tiêm dưới da 
liên tục trong 4 ngày tính từ ngày ñộng dục. Chu kỳ ñộng dục (ngày) của 8 cừu trong mỗi 
nhóm thu ñược như sau: 
Liều 0 mg/ngày 18 14 18 18 18 18 18 19 
Liều 10 mg/ngày 15 14 17 14 12 13 12 13 
Liều 25 mg/ngày 11 13 11 11 12 11 11 12 
Liều 40 mg/ngày 9 10 12 10 11 11 10 11 
Cho biết ảnh hưởng của progesterone lên chu kỳ ñộng dục ở cừu Merino. 

File đính kèm:

  • pdfbai_giang_thiet_ke_thi_nghiem_chuong_2_uoc_luong_va_kiem_din.pdf