Bài giảng Thiết kế thí nghiệm - Chương 7: Kiểm định một phân phối và bảng tương liên

Biến ngẫu nhiên liên tục bằng tổng bình phương của nhiều biến ngẫu nhiên độc lập, phân phối

chuẩn tắc là biến Khi bình phương χ2. Biến này được khảo sát tỷ mỷ và lập bảng phân phối

(bảng 4). Biến χ2 có nhiều ứng dụng khác nhau ở đây chúng ta chỉ đề cập đến hai ứng dụng

đối với các biến định tính.

pdf 13 trang phuongnguyen 11120
Bạn đang xem tài liệu "Bài giảng Thiết kế thí nghiệm - Chương 7: Kiểm định một phân phối và bảng tương liên", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Thiết kế thí nghiệm - Chương 7: Kiểm định một phân phối và bảng tương liên

Bài giảng Thiết kế thí nghiệm - Chương 7: Kiểm định một phân phối và bảng tương liên
Chương 7 
Kiểm ñịnh một phân phối và bảng tương liên 
Biến ngẫu nhiên liên tục bằng tổng bình phương của nhiều biến ngẫu nhiên ñộc lập, phân phối 
chuẩn tắc là biến Khi bình phương χ2. Biến này ñược khảo sát tỷ mỷ và lập bảng phân phối 
(bảng 4). Biến χ2 có nhiều ứng dụng khác nhau ở ñây chúng ta chỉ ñề cập ñến hai ứng dụng 
ñối với các biến ñịnh tính. 
7.1. Kiểm ñịnh một phân phối 
ðể khảo sát một biến ñịnh tính X ta lấy mẫu quan sát gồm N cá thể và căn cứ vào sự thể hiện 
của biến X ñể phân chia thành k lớp như bảng sau: 
(Li là lớp thứ i, Oi là số lần quan sát thấy X thuộc lớp i). 
Biến X L1 L2 . . . Lk Tổng 
Tần số Oi O1 O2 . . . Ok N=ΣOi 
Từ một lý thuyết nào ñó, có thể là một lý thuyết ñã ñược xây dựng chặt chẽ, có giải thích cơ 
chế, cũng có thể chỉ là một lý thuyết mang tính kinh nghiệm, ñúc kết từ những quan sát trước 
ñây về biến X, người ta ñưa ra một giả thiết H0 thể hiện ở dãy các tần suất lý thuyết f1, f2, . . . , 
fk của biến X( có nghĩa là dãy tần suất này ñược tính từ lý thuyết ñã nêu trên). Căn cứ vào tần 
suất lý thuyết fi và tần số thực tế mi chúng ta phải ñưa ra một trong hai kết luận: 
1) Chấp nhận H0 tức là coi tần số thực tế mi phù hợp với lý thuyết ñã nêu thể hiện ở tần suất fi. 
2) Bác bỏ H0 tức là dãy tần số thực tế mi không phù hợp với lý thuyết ñã nêu. 
Việc kiểm ñịnh ñược thực hiện với mức ý nghĩa α , tức là nếu giả thiết H0 ñúng thì xác suất 
ñể bác bỏ một cách sai lầm H0 bằng α. 
Các bước thực hiện: 
1) Tính các tần số lý thuyết theo công thức: Ei = N. fi (7.1) 
2) Tính khoảng cách giữa hai số Oi và Ei theo cách tính khoảng cách 
χ2 = ( )
i
ii
E
EO 2−
Thiết kế thí nghiệm 102
3) Tính khoảng cách giữa hai dãy tần số thực tế mi và tần số lý thuyết ti theo công thức : 
χ2TN = 
( )
∑
=
−
k
i i
ii
E
EO
1
2
 (7.2) 
4) Tìm giá trị tới hạn trong bảng 4 (cột α, dòng k-1, ký hiệu là χ2(α,k-1)) 
5) Nếu χ2tn ≤ χ2(α,k-1) thì chấp nhận H0: “Tần số thực tế Oi phù hợp với lý thuyết ñã nêu”. 
Nếu χ2tn > χ2(α,k-1) thì bác bỏ H0, tức là “Tần số thực tế Oi không phù hợp với lý thuyết ñã 
nêu”. 
ðể sử dụng phép thử χ2, cần thoả mãn các ñiều kiện sau: 
1) Các Oi là các quan sát ñộc lập 
2) Tất cả các Ei ñều phải lớn hơn hoặc bằng 5 
3) Các Oi và Ei không phải là các tỷ lệ phần trăm. 
Ví dụ 7.1: Số liệu thống kê năm 1995 cho thấy, tỷ lệ màu lông (fi) trắng, nâu và ñen trắng 
của thỏ trong một quần thể tương ứng là 0,36; 0,48 và 0,16. Năm 2005, từ 400 con thỏ rút một 
cách ngẫu nhiên từ quần thể nêu trên có 140 con màu lông trắng, 240 con màu nâu và 20 con 
màu ñen trắng. Câu hỏi ñặt ra: Sau 10 năm (từ 1995 ñến 2005) tỷ lệ màu lông của thỏ trong 
quần thể có thay ñổi hay không? 
Giả thiết H0: Tỷ lệ màu lông của thỏ trong quần thể sau 10 năm không thay ñổi 
Ta có thể tóm tắt số liệu quan sát thu ñược năm 2005 như sau: 
Màu lông Trắng Nâu ðen trắng Tổng số 
Tần số (Oi) 140 240 20 400 
Dựa vào tỷ lệ ban ñầu (năm 1995) ta có các tần suất lý thuyết (ti) 
Màu lông Trắng Nâu ðen trắng Tổng số 
fi 0,36 0,48 0,16 1 
Ei 400×0,36= 144 400×0,48= 192 400×0,16= 64 400 
 χ2TN = 
( )
∑
=
−
k
i i
ii
E
EO
1
2
= 
( ) ( ) 361,42
64
)6420(
192
192240
144
144140 222
=
−
+
−
+
−
Bậc tự do df = (3 - 1) = 2; giá trị tới hạn χ2(0,05; 2) = 5,991 
Kết luận: χ2TN < χ2(0,05, 2) nên bác bỏ giả thiết H0. Chứng tỏ tỷ lệ màu lông thỏ trong quần 
thể sau 10 năm có sự thay ñổi. 
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên 
103
Ví dụ 7.2: Giả sử chúng ta ñiều tra giới tính của một quần thể cho trước. Trong một mùa nhất 
ñịnh trong năm người ta thấy tỷ lệ giới tính lúc sinh ra có xu hướng con cái cao hơn. ðể giải 
ñáp câu hỏi trên tiến hành chọn ngẫu nhiên 297 con chim mới sinh thì thấy có 167 con cái. 
Liệu yếu tố mùa có làm ảnh hưởng ñến tỷ lệ giới tính hay không? 
ðối với trường hợp giới tính, ta luôn thừa nhận tỷ lệ ñực cái là 1:1 hay 0,5:0,5. Nếu mùa 
không làm ảnh hưởng ñến tỷ lệ giới tính thì theo ước tính lý thuyết từ 297 con chim quan sát 
ta sẽ có số chim ñực và số chim cái bằng nhau và bằng 297 × 0,5 = 148,5. 
Ta có bảng tổng hợp sau: 
 ðực Cái Tổng số 
Tần số quan sát (Oi) 130 167 297 
Tần số lý thuyết (Ei) 148,5 148,5 297 
χ2TN = 
( )
∑
=
−
k
i i
ii
E
EO
1
2
 χ2TN = 
( )
∑
=
−
k
i i
ii
E
EO
1
2
= 
( ) ( ) 61,4
5,148
5,148167
5,148
5,148130 22
=
−
+
−
Bậc tự do df = (2 - 1) = 1; giá trị tới hạn χ2(0,05; 1) = 3,84 
Kết luận: χ2TN < χ2(0,05, 1) nên bác bỏ giả thiết H0. Chứng tỏ tỷ lệ giới tính không tuân theo 
tỷ lệ ñực cái 1:1. ðiều kiện khí hậu ñã làm thay ñổi tỷ lệ này. 
Hiệu chỉnh Yate 
( )
∑
=
−−
=
k
i i
ii
E
EO
1
2
2 5,0χ 
Hệ số 0,5 trong công thức nêu trên gọi là hệ số hiệu chỉnh Yate hay còn gọi là hiệu chỉnh tính 
liên tục ñể loại bỏ sự thiên lệch. Hiệu chỉnh Yate sẽ ñược trình bày chi tiết ở phần tiếp theo 
Theo ví dụ trên ta có giá trị χ² hiệu chỉnh là: 
χ2TN = 
( )
∑
=
−
k
i i
ii
E
EO
1
2
= 
( ) ( )
36,4
5,148
5,05,148167
5,148
5,05,148130 22
=
−−
+
−−
Giá trị χ² hiệu chỉnh (4,36) bé hơn giá trị χ² trước khi hiệu chỉnh (4,61), tuy nhiên giá trị hiệu 
chỉnh vẫn lớn hơn giá trị tới hạn (3,84) cho nên ta vẫn có kết luận tương tự như trên. 
7.2. Bảng tương liên l × k 
Có 2 biến ñịnh tính, biến X chia ra k lớp, biến Y chia ra l lớp, qua khảo sát thu ñược bảng hai 
chiều chứa các số quan sát ñược của các ô Oij (gọi là bảng tương liên): 
Thiết kế thí nghiệm 104
 Bảng các tần số Oij 
 Y 
 X Y1 Y2 . . . Yl THi 
X1 O11 O12 . . . O1l TH1 
X2 O21 O22 . . . O2l TH2 
. . . . . . . . . . . . . . . . . . 
Xk Ok1 Ok2 . . . Okl THk 
TCj TC1 TC2 . . . TCl N 
Các số Oij thường ñược gọi là các tần số thực tế. Bài toán ñặt ra ở ñây là biến X(hàng) và biến 
Y(cột) có quan hệ hay không? 
Giả thiết H0 : “hàng và cột không quan hệ” với ñối thuyết H1: “hàng và cột có quan hệ”. 
ðể kiểm tra giả thiết này phải thực hiện các bước sau: 
1) Từ giả thiết hàng và cột không quan hệ suy ra các số ở trong ô về lý thuyết phải bằng tổng 
hàng (THi ) nhân với tổng cột (TCj) chia cho tổng số quan sát N (trong thí dụ 7.4 chúng ta sẽ 
lý giải vấn ñề này). Gọi tần số lý thuyết là Eij ta có : 
N
TCTH
E jiij
×
=
 (7.3) 
2) Tính khoảng cách giữa 2 tần số Oij và Eij theo cách tính khoảng cách χ2 
ij
ijij
E
EO 2)( −
3) Tính khoảng cách giữa 2 dãy mij và tij bằng χ2tn: 
∑∑
−
=
k l
ij
ijij
tn t
tm
1 1
2
2 )(χ (7.4) 
4) Chọn mức ý nghĩa α và tìm giá trị tới hạn trong bảng 4 χ2 (α,(k-1)(l-1)) tương ứng với cột 
α và bậc tự do (k-1)(l-1) 
5) Kết luận: 
Ở mức ý nghĩa α nếu χ2tn ≤ χ2 (α,(k-1)(l-1)) chấp nhận H0, ngược lại thì bác bỏ H0 
Bài toán về bảng tương liên thường thể hiện dưới hai dạng: 
1) X và Y là hai tính trạng, giả thiết H0: “Hai biến X, Y không có quan hệ” hay còn phát biểu 
một cách khác là “X và Y ñộc lập”. Thường gọi bài toán này là bài toán kiểm ñịnh tính ñộc 
lập của hai biến ñịnh tính, hay kiểm ñịnh tính ñộc lập của hai tính trạng. 
2) Hàng X là các ñám ñông, cột Y là các nhóm, việc phân chia ñám ñông thành các nhóm căn 
cứ vào một tiêu chuẩn nào ñó. Bài toán này thường ñược gọi là bài toán kiểm ñịnh tính thuần 
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên 
105
nhất của các ñám ñông (tức là các ñám ñông có cùng tỷ lệ phân chia), hay còn gọi là kiểm 
ñịnh các tỷ lệ. 
Ví dụ 7.3: Từ một ñàn trước khi cho tiếp xúc với nguồn bệnh, chọn ra 295 ñộng vât thí 
nghiệm (tiêm vắc xin) và 55 ñộng vật ñối chứng (không tiêm vắc xin). Số ñộng vật này sau 
khi cho tiếp xúc với nguồn bệnh ta thu ñược kết quả như trong bảng sau. Liệu vắc xin có làm 
giảm tỷ lệ chết hay không? 
 Kết quả 
Thuốc Sống Chết Tổng hàng 
Vắc xin 120 175 295 
ðối chứng 30 25 55 
Tổng cột 150 200 350 
Ở ñây có thể coi hàng là các lớp của biến thuốc X (có 2 lớp A, B), cột là là các lớp của biến 
kết quả Y (có 2 lớp: sống và chết). Cũng có thể coi hàng là các ñám ñông: “những ñộng vật 
tiêm vắc xin” và “những ñộng vật không tiêm vắc xin”. Cột là sự phân chia mỗi ñám ñông 
thành 2 nhóm sống và chết. 
Bảng tần số lý thuyết: 
 Kết quả 
Thuốc Sống Chết Tổng hàng 
Vắc xin 4,126
350
150295
=
×
6,168
350
200295
=
×
295 
ðối chứng 6,23
350
15055
=
×
4,31
350
20055
=
×
55 
Tổng cột 150 200 350 
 χ2TN = 
( ) 64,3
4,31
)4,3125(
6,23
)6,2330(
6,168
)6,168175(
4,126
4,126120 2222
=
−
+
−
+
−
+
−
 Bậc tự do df = (2-1)(2-1) = 1. Giá trị tới hạn χ2(0,05,1) = 3,84 
Kết luận: Vì “χ2TN = 3,64 < χ2(0,05,1) = 3,84, ta chưa có ñủ bằng chứng ñể bác bỏ H0. Hay 
nói một cách khác vắc xin ñã không làm giảm ñược tỷ lệ chết. 
Ví dụ 7.4: Nghiên cứu ảnh hưởng của việc thiến ñến sự xuất hiện bệnh tiểu ñường ở chuột. 
Từ 100 chuột thí nghiệm, chia ngẫu nhiên về 1 trong 2 cách xử lý thiến và không thiến. Số 
chuột ở 2 lô thí nghiệm ñược theo dõi cho ñến 140 ngày tuổi và tiến hành lấy mẫu nghiên cứu 
từ 42 ngày tuổi. Bệnh tiểu ñường ñược xác ñịnh ñối với chuột có hàm lượng ñường trong máu 
lớn hơn 200 mg/ dl. Kết quả thí nghiệm ñược ghi lại ở bảng sau: 
Thiết kế thí nghiệm 106
Cách xử lý Kết quả 
 Mắc bệnh Không mắc bệnh Tổng 
Thiến 26 24 50 
Không thiến 12 38 50 
Tổng số 38 62 100 
Tần suất lý thuyết 
Cách xử lý Kết quả 
 Mắc bệnh Không mắc bệnh Tổng 
Thiến 19
100
3850
=
×
 31
100
6250
=
×
50 
Không thiến 19
100
3850
=
×
 31
100
6250
=
×
50 
Tổng số 38 62 100 
=
−
+
−
+
−
+
−
=
31
)3138(
31
)3124(
19
)1912(
19
)1926( 22222
TNχ 8,32 
ðối với trường hợp bảng tương liên 4 ô 
a b 
c d 
Có thể tính χ2TN theo công thức 
))()()((
)( 22
dbcadcba
bcad
nTN ++++
−
×=χ = 32,8
62385050
)24123826(100
2
=
×××
×−×
× 
Bậc tự do df = (2-1)(2-1) = 1. Giá trị tới hạn χ2(0,05;1) = 3,84 
Kết luận: Vì χ2TN = 8,32 > χ2(0,05;1) = 3,84 nên giả thiết H0 bị bác bỏ. Chứng tỏ, tỷ lệ chuột 
sau khi thiến mắc bệnh ñái ñường cao hơn so với chuột không bị thiến. 
Hiệu chỉnh Yates 
( )( )( )( )dcdbcaba
n
nbcad
++++






−−
=
2
2 2χ 
Với ví dụ trên ta có giá trị χ² hiệu chỉnh là: 
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên 
107
( )( )( )( ) 17,73812382412262426
100
2
10012243826
2
2
=
++++
×





−×−×
=χ 
Kết luận: Với hiệu chỉnh Yate, giá trị χ² thực nghiệm bé hơn (χ² = 7,17) so với trước khi hiêu 
chỉnh (χ² = 8,32). Tuy nhiên giá trị c² thực nghiệm vẫn lớn hơn giá trị tới hạn, nên ta có kết 
luận tương tự về bệnh tiểu ñường của chuột như ñã nêu ở phần trên. 
Lưu ý: 
Hệ số ñiều chỉnh của Yate trong kiểm ñịnh một phân phối có 2 lớp và trong bảng tương liên 
2× 2. 
a) Kiểm ñịnh một phân phối có 2 lớp 
Tính trạng nghiên cứu Loại 1 Loại 2 Tổng 
Tần số thực tế m1 m2 N 
Tần số lý thuyết t1=N×p1/(p1+p2) t2=N×p2/(p1+p2) N 
ðể kiểm ñịnh giả thiết H0: “Hai lớp nói trên phân phối theo tỷ lệ p1:p2 “có thể sử dụng phương 
pháp χ2 với nội dung: 
Tính 
2
2
22
1
2
112 )()(
t
tm
t
tm
tn
−
+
−
=χ 
So χ2TN với giá trị tới hạn χ2 với mức ý nghĩa α và bậc tự do bằng 1. Nếu χ2TN ≤ χ2(α,1) thì 
chấp nhận H0, nếu χ2tn > χ2(α,1) thì bác bỏ H0. 
Bài toán kiểm ñịnh này tương ñương với bài toán kiểm ñịnh một xác suất, việc tính toán dựa 
trên cách tính xấp xỉ phân phối nhị thức bằng phân phối chuẩn, từ ñó suy ra χ2TN xấp xỉ phân 
phối χ2 (là một phân phối liên tục suy ra từ phân phối chuẩn). Trường hợp N < 100 phép xấp 
xỉ không thật tốt, thường cho χ2TN hơi to do ñó Yate ñề nghi ñiều chỉnh lại χ2TN theo hướng 
làm nhỏ bớt χ2TN, ñiều chỉnh này thường gọi là ñiều chỉnh do tính liên tục. 
Công thức tính χ2TN ñiều chỉnh như sau: 
2
2
22
1
2
112
)5,0()5,0(
t
tm
t
tm
tn
−−
+
−−
=χ 
b) Bảng tương liên 4 ô (2 x 2) 
Tính trạng B Tính trạng A 
Lớp B1 Lớp B2 Tổng hàng 
Loại A1 a b a+b 
Loại A2 c d c+d 
Tổng cột a+c b+d N=a+b+c+d 
Thiết kế thí nghiệm 108
ðể kiểm ñịnh giả thiết H0: “Hai tính trạng A và B ñộc lập” có thể dùng phương pháp χ2 với 
các nội dung sau: 
+ Tính các số lý thuyết 
N
caba
a
))((
ˆ
++
= 
N
dbbab ))((ˆ ++= 
N
cadc
c
))((
ˆ
++
= 
N
dbdcd ))((ˆ ++= 
+ Tính χ²TN
d
dd
c
cc
b
bb
a
aa
ˆ
)ˆ(
ˆ
)ˆ(
ˆ
)ˆ(
ˆ
)ˆ( 2222 −
+
−
+
−
+
−
= 
Có thể tính χ2TN bằng công thức sau: 
 ))()()((
)( 22
dbdccaba
Nbcad
tn ++++
×−
=χ 
+ So với giá trị tới hạn χ2 với mức ý nghĩa α và bậc tự do bằng 1. Nếu χ2TN ≤ χ2(α,1) thì chấp 
nhận H0, nếu χ2TN > χ2(α,1) thì bác bỏ H0. 
Bài toán này tương ñương với bài toán so sánh hai xác suất, việc tính toán dựa trên cách tính 
xấp xỉ phân phối nhị thức bằng phân phối chuẩn, từ ñó suy ra χ2TN xấp xỉ phân phối χ2. 
Khi N nhỏ việc xấp xỉ không tốt do ñó có một số hướng dẫn như sau: 
+ Nếu N ≤ 20 thì không nên dùng phưong pháp χ2TN 
+ Nếu 20 < N ≤ 40 và có ô có số lý thuyết bé < 5 thì cũng không nên dùng phương pháp χ2TN 
Cả hai trường hợp này nên dùng phương pháp chính xác Fisher (xem phần 7.3) 
Nếu N ≥ 100 thì có thể dùng phương pháp χ2. 
Nếu N < 100 và không rơi vào 2 trường hợp ñầu thì nên ñưa thêm ñiều chỉnh do tính liên tục 
Yate nhằm làm nhỏ bớt χ2TN như sau: 
 ))()()((
)5,0( 22
dbdccaba
NNbcad
tn ++++
×−−
=χ 
7.3. Kiểm ñịnh chính xác của Fisher ñối với bảng tương liên 2×2 
Khi các giá trị ước tính (Ei) trong bảng tương liên 2×2 rất bé (Ei < 5) thì việc sử dụng phép 
kiểm ñịnh χ² không còn ñảm bảo ñược ñộ chính xác. Trường hợp này hay gặp trong nghiên 
cứu dịch tễ học và phép kiểm ñịnh chính xác của Fisher ñược sử dụng. Phép kiểm ñịnh này 
cho ta một xác suất trực tiếp và chính xác thay vì ñi tìm giá trị xác suất từ bảng. 
Nếu ta có bảng tương liên 2×2 
a b a + b 
c d c + d 
a + c b + d n 
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên 
109
Fisher dựa trên phân phối siêu hình học (hypergeometric distribution) ñể tính xác suất của 
phép thử theo công thức. 
p = ( ) ( ) ( ) ( )
!!!!
!!!!
dcba
dbcadcba ++++
Các bước thực hiện: 
1) Tính p1 với bảng số liệu ñã cho 
2) Tính ad – bc. 
+ Nếu ad – bc > 0 thì tăng a và d, giảm b và c bằng 1 ñơn vị rồi tính xác suất p2; làm tương tự 
cho ñến khi a bằng min của (a+b) hoặc (a+c) 
+ Nếu ad – bc < 0 thì giảm a và d, tăng b và c rồi tính xác suất p2; làm tương tự cho ñến khi a 
bằng 0 
3) Tính P = 2×(p1 + p2 +....+ pn) 
4) Nếu xác suất P < 0,05 thì kết luận bác bỏ H0. 
Ví dụ 7.5: Từ một ñàn trước khi cho tiếp xúc với nguồn bệnh, chọn ra 10 ñộng vât thí nghiệm 
(tiêm vắc xin) và 10 ñộng vật ñối chứng (không tiêm vắc xin). Số ñộng vật này sau khi cho 
tiếp xúc với nguồn bệnh ta thu ñược kết quả như trong bảng sau. Liệu vắc xin có làm giảm tỷ 
lệ chết hay không? 
 Kết quả 
Thuốc Sống Chết Tổng hàng 
Vắc xin 9 1 10 
ðối chứng 2 8 10 
Tổng cột 11 9 20 
1) p1 = ( ) ( ) ( ) ( )!!!!!
!!!!
ndcba
dbcadcba ++++
= 002679,0
!20!8!2!1!9
!9!11!10!10
= 
2) ad – bc = 9×8 - 1×2 = 70 > 0 
Tăng a, d và giảm b, c bằng 1 ñơn vị ta có 
9 +1 2 -1 11 10 1 11 
1 - 1 8 + 1 
 
0 9 
10 10 
p2 = 850000595379,0!20!9!1!0!10
!9!11!10!10
= 
3) P = 2×(p1 + p2 +....+ pn) = 2×(0,002679 + 0,000059537985) = 0,005477076 
4) Với xác suất này, giả thiết H0 bị bác bỏ. ðiều này chứng tỏ vắc xin ñã làm giảm tỷ lệ chết. 
Thiết kế thí nghiệm 110
Ví dụ 7.6: Tương tự như ví dụ 7.5 từ 15 ñộng vât thí nghiệm (tiêm vắc xin) có 2 ñộng vật mắc 
bệnh và từ 13 ñộng vật ñối chứng (không tiêm vắc xin) có 10 ñộng vật mắc bệnh. Liệu vắc 
xin có làm giảm tỷ lệ mắc bệnh hay không? 
 Kết quả 
Thuốc Mắc bệnh Không Tổng hàng 
Vắc xin 2 13 15 
ðối chứng 10 3 13 
Tổng cột 12 16 28 
1) p1 = ( ) ( ) ( ) ( )!!!!!
!!!!
ndcba
dbcadcba ++++
= 00098712,0
!28!3!10!13!2
!16!12!13!15
= 
2) ad – bc = 2×3 - 13×10 = -124 < 0 
Giảm a, d và tăng b, c bằng 1 ñơn vị ta có 
2 -1 13 + 1 15 1 14 15 
10 + 1 3 - 1 13 
 
11 2 13 
12 16 28 12 16 28 
p2 = 00003846,0!28!2!11!14!1
!16!12!13!15
= 
Giảm a, d và tăng b, c bằng 1 ñơn vị ta có 
1 - 1 14 + 1 15 0 15 15 
11 + 1 2 - 1 13 
 
12 1 13 
12 16 28 12 16 28 
p3 = 0000004273,0!28!1!12!15!0
!16!12!13!15
= 
3) P = 2×(p1 + p2 +....+ pn) = 2×(0,00098712 + 0,00003846 + 0,0000004273) = 0,00205202 
4) Với xác suất này, giả thiết H0 bị bác bỏ. ðiều này chứng tỏ vắc xin ñã làm giảm tỷ lệ mắc 
bệnh. 
Cochran khuyến cáo nên sử dụng phép thử chính xác của Fisher nếu trong thí nghiệm n < 20 
hoặc 20 < n <40 và dự ñoán bé nhất nhỏ hơn 5. 
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên 
111
7.4. Xác ñịnh mức liên kết trong dịch tễ học bằng kiểm ñịnh χ² 
Trong dịch tễ học, tầm quan trọng của sự liên kết giữa hàng và cột trong bảng tương liên còn 
ñược xem xét bởi: 1) nguy cơ tương ñối (RR) và 2) tỷ suất chênh (OR). 
Nếu ta có bảng tương liên 2×2 như sau: 
 Bệnh Tổng số 
Nhân tố + - 
+ a b a + b 
- c d c + d 
Tổng số a + c b + d n 
Ta có: 
OR = 
bc
ad
dc
ba
=
/
/
 RR =
dc
c
ba
a
+
+
7.4.1. Nghiên cứu cắt ngang (cross sectional studies) 
Mục ñích của nghiên cứu cắt ngang là tìm ra mối liên hệ giữa yếu tố nguy cơ và bệnh; tức là 
so sánh tần suất mắc bệnh của nhóm có tiếp xúc và không tiếp xúc. Trong nghiên cứu này 
toàn bộ các phép ño phải thực hiện trong thời ñiểm nhất ñịnh. 
Ví dụ 7.7: Tỷ lệ bò mắc bệnh viêm vú giữa 2 trại (A và B) có sự sai khác có ý nghĩa hay 
không? Biết rằng sau khi kiểm tra 96 bò ở trại A và 72 bò ở trại B trong 1 ngày thấy số lượng 
bò mắc bệnh viêm vú tương ứng là 36 và 10. 
Giả thiết H0: Tỷ lệ bò mắc bệnh viêm vú ở hai trại là như nhau với ñối thiết H1: Tỷ lệ bò mắc 
bệnh viêm vú ở 2 trại là khác nhau. 
Nếu sử dụng phép thử χ² ta ñược giá trị χ²TN = 11,535; giá trị χ²(0,05; 1) = 3,841. 
Kết luận: 
Vì χ²TN > χ² tới hạn nên có thể kết luận rằng tỷ lệ bò mắc bệnh viêm vú ở hai trại là khác 
nhau. Mặt khác ta có tỷ suất chênh OR = (36×62)/(60×10) = 3,72; tức là số bò mắc bệnh viêm 
vú ở trại A cao gấp 3,72 lần so với số bò mắc bệnh ở trại B. 
7.4.2. Tiến cứu (cohort studies) 
Trong nghiên cứu này ñộng vật ñược chia thành 2 nhóm; một trong hai nhóm sẽ tiếp xúc với 
yếu tố nguy cơ của bệnh, nhóm còn lại là ñối chứng. Theo dõi trong một thời gian ñể xác ñịnh 
sự xuất hiện bệnh ở hai nhóm. Căn cứ vào kết quả thu ñược ñể kết luận giữa yếu tố nguy cơ 
và tỷ lệ mắc bệnh. Chính vì vậy nghiên cứu này ñược gọi là tiến cứu (cohort studies). 
Thiết kế thí nghiệm 112
Ví dụ 7.8: Xem xét ví dụ 7.5, từ một ñàn trước khi cho tiếp xúc với nguồn bệnh, chọn ra 10 
ñộng vât thí nghiệm (tiêm vắc xin) và 10 ñộng vật ñối chứng (không tiêm vắc xin). Số ñộng 
vật này sau khi cho tiếp xúc với nguồn bệnh ta thu ñược kết quả như trong bảng sau. Liệu vắc 
xin có làm giảm tỷ lệ chết hay không? 
 Kết quả 
Thuốc Sống Chết Tổng hàng 
Vắc xin 9 1 10 
ðối chứng 2 8 10 
Tổng cột 11 9 20 
Nếu sử dụng phép thử chính xác của Fisher ta có xác suất P = 0,005477076 
Kết luận: Với xác suất này, giả thiết H0 bị bác bỏ. ðiều này chứng tỏ vắc xin ñã làm giảm tỷ 
lệ chết. Bên cạnh ñó, nguy cơ tương ñối RR = (9/10)/(2/10) = 4,5. Hay nói một cách khác 
ñộng vật sử dụng vắc xin mức ñộ sống sót gấp 4,5 lần so với ñộng vật không dùng vắc xin. 
7.4.3. Nghiên cứu - bệnh chứng hay hồi cứu (case-control studies) 
Trong nghiên cứu bệnh - chứng hay hồi cứu, các nhóm ñộng vật nhiễm bệnh và không nhiễm 
bệnh ñược chọn ra, sau ñó ta ñánh giá trong quá khứ ñộng vật ñã tiếp xúc với yếu tố nguy cơ 
như thế nào. Vì vậy nghiên cứu bệnh - chứng mang ý nghĩa của một hồi cứu. 
Ví dụ 7.9: Trong một nghiên cứu, có 62 bò sữa ñược chẩn ñoán ung thư biểu mô mắt và 124 
không mắc ñược chọn ngẫu nhiên từ quần thể. Có mối liên hệ nào giữa giống bò và tỷ lệ mắc 
bệnh ung thư biểu mô mắt hay không? Nếu số liệu thu thập ñược như sau: 
Giống Mắc bệnh Không mắc bệnh Tổng số 
Hereford 44 63 107 
Giống khác 18 61 79 
Tổng số 62 124 186 
Giả thiết H0: Không có mối liên hệ giữa giống và tỷ lệ mắc bệnh với ñối thiết H1: Có mối liên 
hệ giữa bệnh và giống.. 
Sử dụng phép thử χ², ta có χ²TN = 6,876 và χ² (0,05;1) = 3,841. 
Kết luận: 
Vì χ²TN > χ² tới hạn nên ta bác bỏ H0 chấp nhận H1; chứng tỏ có mối liên hệ giữa giống và 
bệnh. Tỷ suất chênh OR = (44×61)/(18×63) = 2,37. Hay nói cách khác giống Hereford mắc 
bệnh ung thư biểu mô mắt cao hơn 2,37 lần so với các giống khác. 
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên 
113
7.5. Bài tập 
7.5.1 
Một trung tâm thu tinh nhân tạo tiến hành thử nghiệm 3 phương pháp thụ tinh nhân tạo khác 
nhau. Tỷ lệ phối có chửa ở 3 phương pháp thu ñược như sau: ở phương pháp I, có 275 bò có 
chửa từ 353 bò tham gia thí nghiệm; tương tự ở phương pháp II, các con số này lần lượt là 
192 và 256 con, phương pháp III là 261 và 384 con. Tỷ lệ thụ tinh thành công ở 3 phương 
pháp này có khác nhau hay không? 
7.5.2 
Chọn mẫu ngẫu nhiên thế hệ con của bò lang Shorthorn thu ñược kết quả sau ñây: 82 con màu 
lông ñỏ, 209 con lang và 89 con trắng. Phân bố màu lông của bò có tuân theo giả thiết rằng 
màu lông ñược xác ñịnh bởi một cặp allen trội không hoàn toàn? Biết rằng trội không hoàn 
toàn là trường hợp có một allen trội và dị hợp tử thể hiện sự ảnh hưởng của ñồng thời cả 2 
allen. 
7.5.3 
Một thí nghiệm ñược tiến hành nhằm ñánh giá sự liên hệ giữa tỷ lệ viêm nội mạc tử cung và 
giống. Trong tổng số 700 bò sữa trong nghiên cứu thuần tập (cohort studies), có 500 con 
giống Holstein Friesian và 200 con giống Jersey. Kết quả nghiên cứu thu ñược như sau: 
 Viêm nội mạc tử cung Tổng số 
 Có Không 
Giống Holstein 100 400 500 
 Jersey 10 190 200 
 Tổng số 110 590 700 
Có sự liên hệ giữa tỷ viêm nội mạc tử cung và các giống hay không? 

File đính kèm:

  • pdfbai_giang_thiet_ke_thi_nghiem_chuong_7_kiem_dinh_mot_phan_ph.pdf