Bài giảng Thiết kế thí nghiệm - Chương 1: Một số khái niệm trong xác suất và thống kê mô tả

Một phần kiến thức cơ bản không thể tách rời trong quá trình thiết kế và xử lý dữ liệu thí

nghiệm ñó là các kiến thức về xác suất và thống kê. Mục ñích của chương này là tập hợp lại

một số khái niệm về xác suất, các phân phối thường ñược sử dụng trong sinh học nói chung

và trong chăn nuôi, thú y nói riêng; ñồng thời cũng khái quát hoá và nêu ý nghĩa của một số

tham số thống kê mô tả cơ bản

pdf 13 trang phuongnguyen 8400
Bạn đang xem tài liệu "Bài giảng Thiết kế thí nghiệm - Chương 1: Một số khái niệm trong xác suất và thống kê mô tả", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Thiết kế thí nghiệm - Chương 1: Một số khái niệm trong xác suất và thống kê mô tả

Bài giảng Thiết kế thí nghiệm - Chương 1: Một số khái niệm trong xác suất và thống kê mô tả
Chương 1 
Một số khái niệm trong xác suất và thống kê mô tả 
Một phần kiến thức cơ bản không thể tách rời trong quá trình thiết kế và xử lý dữ liệu thí 
nghiệm ñó là các kiến thức về xác suất và thống kê. Mục ñích của chương này là tập hợp lại 
một số khái niệm về xác suất, các phân phối thường ñược sử dụng trong sinh học nói chung 
và trong chăn nuôi, thú y nói riêng; ñồng thời cũng khái quát hoá và nêu ý nghĩa của một số 
tham số thống kê mô tả cơ bản. 
1.1. Tóm tắt về xác suất và biến ngẫu nhiên 
1.1.1. Xác suất cơ bản 
Số chỉnh hợp chập k trong n vật ( )!
!)1)...(2)(1(
kn
nknnnnAkn
−
=+−−−= 
Số tổ hợp chập k của n vật )!(!
!
! knk
n
k
AC
k
nk
n
−
== 
Số hoán vị của k vật !kAkk = 
Số chỉnh hợp lặp chập k của n vật kkn nA =
~
Nhị thức Niu-tơn kkn
n
k
k
n
n baCba −
=
∑=+
0
)( 
Quy tắc cộng tổng quát p(A ∪ B) = p(A) + p(B) - p(A∩B) 
Quy tắc cộng ñơn giản p(A ∪ B) = p(A) + p(B) nếu A∩ B = ∅ 
Quy tắc nhân tổng quát p(A∩ B) = p(A). p(B/A)= p(B).p(A/B) 
Quy tắc nhân ñơn giản p(A∩ B) = p(A). p(B) nếu A, B ñộc lập 
1.1.2. Hệ sự kiện ñầy ñủ 
Hệ sự kiện ñầy ñủ hay hệ sự kiện toàn phần nếu: 
 Ω=
=
U
n
i
iA
1
 và ∅=∩ ji AA với ji ≠ 
Thiết kế thí nghiệm 6
Công thức xác suất toàn phần ∑
=
=
n
k
ii ABpApBp
1
)/().()( 
Công thức Bayes )(
)/().()/(
Bp
ABpApBAp ii= 
1.1.3. Biến ngẫu nhiên, bảng phân phối, hàm phân phối 
Kỳ vọng toán học i
n
i pxMX ∑=
1
Phương sai ∑ −=
n
ii pMXxDX
1
2)( hay 2
1
2 )(MXpxDX
n
i
ii −=∑
=
Bảng phân phối của biến ngẫu nhiên rời rạc 
X x1 x2 . . . xn Tổng 
pi p1 p2 . . . pn 1 
Hàm phân phối 
 0 x ≤ x1 
 p1 x1 ≤ x < x2 
F(x) = p( X < x) = p1 + p2 x2 ≤ x < x3 
 p1 + p2 + p3 x3 ≤ x < x4 
 . . . 
 1 xn < x 
1.1.4. Một số phân phối thường gặp 
Phân phối Bécnuli 
X 0 1 
pi p q 
 Kỳ vọng MX = µ = p Phương sai DX = pq 
Phân phối Nhị thức B(n,p) 
X 0 1 . . . K . . . n MX = np DX=npq 
pi 
qn 
C1npqn-1 
. . . 
Cknpkqn-k 
. . . 
pn 
ModX là số nguyên 
np-q ≤ ModX ≤np+p 
Phân phối siêu bội 
 Nếu trong N bi có M bi trắng, rút n bi, X là số bi trắng 
X = 0, n với pk = p(X = k) n
N
kn
MN
k
M
C
CC −
−
MX = 
N
nM
 DX = 
1−
−−
N
nN
N
MN
N
M
n
Chương 1 Một số khái niệm trong xác suất và thống kê 
7
Phân phối hình học 
 X = 1, ∞ với pk = p(X = k) = pqk-1 (p là xác suất thành công, q = 1- p) 
 MX = p
1
 DX = 2p
q
Phân phối Poátxông 
X = 0, ∞ với xác suất pk = p(X = k) = 
k
k
e λ
λ
!
−
 MX = DX = λ 
Phân phối chuẩn N(µ,σ2 ) 
 Hàm mật ñộ xác suất 2
2
2
)(
2
1)( σ
µ
σpi
−
−
=
x
exf 
)()(),(
σ
µ
σ
µ −Φ−−Φ=< abbXap
với )(zΦ là hàm phân phối của biến chuẩn tắc 
Phân phối chuẩn tắc N(0,1) 
 Mật ñộ xác suất 2
2
2
1)(
z
ez
−
=
pi
ϕ 
 Hàm phân phối ∫
∞−
−
=Φ
z x
dxez 2
2
2
1)(
pi
 Tính gần ñúng phân phối nhị thức bằng phân phối chuẩn khi n lớn 
p(k ≤ X ≤ l) ≈ )()(
npq
npk
npq
npl −Φ−−Φ 
p(X = k) ) ≈ )(1
npq
npk
npq
−ϕ 
Dung lượng mẫu cần thiết ñể trung bình cộng khác µ không quá ε (ñộ chính xác) khi có phân 
phối chuẩn N(µ,σ2) và mức tin cậy P = 1 - α 
2
22z
n
ε
σ≥ z là giá trị sao cho Φ(z) = 1-α/2 
Dung lượng mẫu cần thiết ñể tần suất khác xác suất không quá ε trong phân phối nhị thức và 
mức tin cậy P = 1 - α 
2
2
4
z
n
ε
≥ z là giá trị sao cho Φ(z) = 1-α/2 
Thiết kế thí nghiệm 8
1.2. Biến sinh học 
Trong quá trình thực hiện thí nghiệm, chúng ta tiến hành thu thập dữ liệu ñể sau ñó xử lý và 
ñưa ra các kết luận. Các dữ liệu có thể là các giá trị bằng số hoặc bằng chữ ñặc trưng cho một 
cá thể hoặc một nhóm và thay ñổi từ cá thể này qua cá thể khác. Các dữ liệu như vậy ñược gọi 
là các biến, hay còn ñược gọi là các biến ngẫu nhiên vì các dữ liệu thu ñược là kết quả của 
việc chọn một cách ngẫu nhiên cá thể hay nhóm cá thể trong tổng thể. 
1.2.1. Khái niệm về biến sinh học 
ðối tượng nghiên cứu trong chăn nuôi là các vật sống, vì vậy các biến như ñã nêu trên gọi 
chung là các biến sinh học. Có thể phân loại các biến sinh học như sau: 
Biến ñịnh tính (qualitative) 
 Biến ñịnh danh (nominal) 
 Biến thứ hạng (ranked) 
Biến ñịnh lượng (quantitative) 
 Biến liên tục (continuous) 
 Biến rời rạc (discontinuous) 
Biến ñịnh tính bao gồm các biến có hai trạng thái (binary): thí dụ như giới tính (cái hay 
ñực), vật nuôi sau khi ñược ñiều trị (sống hay chết, khỏi bệnh hay không khỏi bệnh), tình 
trạng nhiễm bệnh (có, không), mang thai (có, không) . . .Tổng quát hơn có các biến có nhiều 
trạng thái, từ ñó chia ra các lớp (loại) thí dụ mầu lông của các giống lợn (trắng, ñen, loang, 
hung, . . .) các kiểu gen (ñồng hợp tử trội, dị hợp tử, ñồng hợp tử lặn . . . ); giống bò (bò vàng, 
Jersey, Holstein). Các biến như thế ñược gọi là biến ñịnh danh (nominal) hay biến có 
thang ño ñịnh danh, cũng còn gọi là biến thuộc tính. Trong các biến có nhiều trạng thái, có 
một số biến có thể sắp thứ tự theo một cách nào ñó, ví dụ mức ñộ mắc bệnh của vật nuôi. 
Thường dùng số thứ tự ñể xếp hạng các biến này, thí dụ xếp ñộng vật theo mức ñộ mắc bệnh 
(--, -, -+, +, ++), thể trạng của vật nuôi (ñối với bò từ 1-5, 1-rất gầy,, 5-rất béo) . Các biến 
này gọi là biến thứ hạng (ranked) hay biến có thang ño thứ bậc. 
Biến ñịnh lượng là biến phải dùng một gốc ño, một ñơn vị ño ñể xác ñịnh giá trị (số ño) của 
biến. Biến ñịnh lượng bao gồm: biến rời rạc, thí dụ số trứng nở khi ấp 12 quả (X = 0, 1, . . . , 
12), số lợn con sinh ra trong một lứa ñẻ, số tế bào hồng cầu ñếm trên ñĩa của kính hiển vi và 
biến liên tục, thí dụ khối lượng gà 45 ngày tuổi, sản lượng sữa bò trong một chu kỳ, tăng 
trọng trên ngày của ñộng vật, nồng ñộ canxi trong máu . . . Sau khi chọn ñơn vị ño thì giá trị 
cụ thể của X là một số nằm trong một khoảng [a, b] nào ñó. 
ðối với các biến ñịnh lượng có thể phân biệt: 1) biến khoảng (interval) hay biến có thang ño 
khoảng, biến này chỉ chú ý ñến mức chênh lệch giữa hai giá trị (giá trị 0 mang tính quy ước, 
tỷ số hai giá trị không có ý nghĩa). Thí dụ ñối với nhiệt ñộ chỉ nói nhiệt ñộ tăng thêm hay 
giảm ñi mấy °C ( thí dụ cơ thể ñang từ 36,5°C tăng lên 38°C là biểu hiện bắt ñầu sốt cao) 
chứ không nói vật thể có nhiệt ñộ 60°C nóng gấp ñôi vật thể có nhiệt ñộ 30°C. Hướng gió 
có quy ước 0° là hướng Bắc, 45° là hướng ðông Bắc, 90° là hướng ðông, 180° là hướng 
Nam . . . , không thể nói hướng gió ðông gấp ñôi hướng gió ðông Bắc; 2) biến tỷ số (ratio) 
hay biến có thang ño tỷ lệ, ñối với biến này giá trị 0, mức chênh lệch giữa hai giá trị và tỷ số 
hai giá trị ñều có ý nghĩa. Thí dụ khối lượng bắt ñầu thí nghiệm của lợn là 25 kg, khối lượng 
kết thúc là 90 kg, vậy khối lượng kết thúc thí nghiệm nặng gấp 3,6 lần. 
Chương 1 Một số khái niệm trong xác suất và thống kê 
9
1.2.2. Tổng thể và mẫu 
Một ñám ñông gồm rất nhiều cá thể chung nhau nguồn gốc, hoặc chung nhau nơi sinh sống, 
hoặc chung nhau nguồn lợi . . . ñược gọi là một tổng thể. Lấy từng cá thể ra ño một biến sinh 
học X, chúng ta ñược một biến ngẫu nhiên, có thể ñịnh tính hoặc ñịnh lượng. Tập hợp tất cả 
các giá trị của X gọi là một tổng thể (population). 
Muốn hiểu biết ñầy ñủ về biến X phải khảo sát toàn bộ tổng thể, nhưng vì nhiều lý do không 
thể làm ñược. Có thể do không ñủ tiền tài, vật lực, thời gian, . . . , nên không thể khảo sát toàn 
bộ, cũng có thể do phải huỷ hoại cá thể khi khảo sát nên không thể khảo sát toàn bộ, cũng có 
khi cân nhắc giữa mức chính xác thu ñược và chi phí khảo sát thấy không cần thiết phải khảo 
sát hết. 
Như vậy là có nhiều lý do khiến người ta chỉ khảo sát một bộ phận gọi là mẫu (sample) sau ñó 
xử lý các dữ liệu (số liệu) rồi ñưa ra các kết luận chung cho tổng thể. Các kết luận này ñược 
gọi là “kết luận thống kê”. 
ðể các kết luận ñưa ra ñúng cho tổng thể thì mẫu phải “phản ánh” ñược tổng thể (còn nói là 
mẫu phải “ñại diện”, phải “ñiển hình” cho tổng thể. . .), không ñược thiên về phía “tốt” hay 
thiên về phía “xấu”. 
1.2.3. Sơ lược về cách chọn mẫu 
Tuỳ theo ñặc thù của ngành nghề người ta ñưa ra rất nhiều cách chọn mẫu khác nhau, thí dụ 
chọn ruộng ñể gặt nhằm ñánh giá năng suất, chọn các sản phẩm của một máy ñể ñánh giá chất 
lượng, chọn các hộ ñể ñiều tra dân số hoặc ñiều tra xã hội học, chọn một số sản phẩm ra kiểm 
tra trước khi xuất khẩu một lô hàng. . . Cách chọn mẫu phải hợp lý về mặt chuyên môn, phải 
dễ cho người thực hiện và phải ñảm bảo yêu cầu chung về mặt xác suất thống kê là “ngẫu 
nhiên” không thiên lệch. 
Thuần tuý về thống kê cũng có nhiều cách chọn mẫu: 
Chọn mẫu hoàn toàn ngẫu nhiên (rút thăm, dùng bảng số ngẫu nhiên ñể lựa chọn,. . .). 
Chia tổng thể thành các lớp ñồng ñều hơn theo một tiêu chuẩn nào ñó thí dụ chia toàn quốc 
thành các vùng (vùng cao, trung du, ñồng bằng), chia theo tầng lớp xã hội, chia theo thu nhập, 
theo ngành nghề, chia sản phẩm thành các lô hàng theo nguồn vật liệu, theo ngày sản xuất, . . . 
Sau khi có các lớp thì căn cứ vào mức ñồng ñều trong từng lớp mà chọn số lượng cá thể 
(dung lượng mẫu) ñại diện cho lớp. 
Có thể chia tổng thể thành các lớp, sau ñó chọn một số lớp gọi là mẫu cấp một. Mỗi lớp trong 
mẫu cấp một lại ñược chia thành nhiều lớp nhỏ hơn, ñều hơn. Chọn một số trong ñó gọi là 
mẫu cấp hai. Có thể khảo sát hết các cá thể trong mẫu cấp hai hoặc chỉ khảo sát một bộ phận. 
Không ñi sâu vào việc chọn mẫu chúng ta chỉ nhấn mạnh mẫu phải ngẫu nhiên, phải chọn 
mẫu một cách khách quan không ñược chọn mẫu theo chủ quan người chọn. 
1.2.4. Các tham số của mẫu 
Gọi số cá thể ñược chọn vào mẫu là kích thước (cỡ, dung lượng) mẫu n. Gọi các số liệu ño 
ñược trên các cá thể của mẫu là 1x , 2x , . . . , nx , nếu có nhiều số liệu bằng nhau thì có thể ghi 
lại dưới dạng có tần số (số lần gặp) 
Thiết kế thí nghiệm 10
Giá trị ix 1x 2x . . . kx 
tần số mi 1m 2m . . . km nm
k
i
i =∑
=1
Các tham số (số ñặc trưng) của mẫu, hay còn gọi là các thống kê, ñược chia thành hai nhóm: 
1) các tham số về vị trí và 2) các tham số về ñộ phân tán của số liệu. 
Các tham số về vị trí thường gồm: a) trung bình, b) trung vị, c) mode. Các tham số về ñộ 
phân tán gồm: a) phương sai, b) ñộ lệch chuẩn, c) sai số chuẩn, d) khoảng biến ñộng và e) hệ 
số biến ñộng. 
TRUNG BÌNH 
Trung bình cộng ký hiệu là 
_
x 
n
x
x
n
i
i∑
=
=
1
_
 hay 
∑
∑
=
=
= k
i
i
k
i
ii
m
mx
x
1
1
_
khi có tần suất 
Ví dụ 1.1: Khối lượng (gram) của 16 chuột cái tại thời ñiểm cai sữa như sau: 
54,1 49,8 24,0 46,0 44,1 34,0 52,6 54,4 
56,1 52,0 51,9 54,0 58,0 39,0 32,7 58,5 
58,47
16
2,761
16
5,58....8,491,541_
==
+++
==
∑
=
n
x
x
n
i
i
gram 
Ví dụ 1.2: Phân bố tần suất khối lượng của 4547 lợn Piétrain × (Yorkshire × Landrace) nuôi 
vỗ béo ñến 210 ngày tuổi (kg). 
Nhóm khối 
lượng (kg) 
Khối lượng 
trung bình (kg) 
Số lượng Tần suất Tần suất 
tích luỹ 
60,73 - 66,99 63,86 11 0,24 0,24 
67,00 - 74,99 71,00 31 0,68 0,92 
75,00 - 82,99 79,00 80 1,76 2,68 
83,00 - 90,99 87,00 218 4,79 7,48 
91,00 - 98,99 95,00 484 10,64 18,12 
99,00 - 106,99 103,00 951 20,91 39,04 
107,00 - 114,99 111,00 1083 23,82 62,85 
115,00 - 122,99 119,00 907 19,95 82,8 
123,00 - 130,99 127,00 512 11,26 94,06 
131,00 - 138,99 135,00 203 4,46 98,53 
139,00 - 146,99 143,00 55 1,21 99,74 
147,00 - 156,10 151,55 12 0,26 100,00 
Chương 1 Một số khái niệm trong xác suất và thống kê 
11
48,110
12....3111
1255,151.....3100,711186,63
1
1
_
=
+++
×++×+×
==
∑
∑
=
=
k
i
i
k
i
ii
m
mx
x kg 
Giá trị trung bình cộng có bất lợi là bị các giá trị ngoại lai làm ảnh hưởng. Giá trị ngoại lai là 
giá trị có xu hướng không thích hợp với toàn bộ số liệu thu thập ñược, thường là các giá trị 
quá lớn hoặc quá bé so với bình thường. Nếu giá trị ngoại lai quá lớn sẽ làm cho giá trị trung 
bình có xu hướng tăng quá mức hoặc ngược lại. 
Trung bình nhân ký hiệu là G 
 G = n nxxx ...21 n
m
k
mm kxxxG ...21 21= 
Ví dụ 1.3: Bệnh dại ñã tăng 10% trong năm thứ nhất, 11% trong năm thứ 2 và 15% trong năm 
thứ 3. Mức tăng trưởng trung bình của bệnh là bao nhiêu phần trăm? 
Ta không thể tính tăng trưởng trung bình như sau (10 + 11 + 15)/3 = 12 mà phải tính mức 
tăng trưởng trung bình là G = 11979,115,111,11,1... 321 =××=n nxxx . Nghĩa là mức tăng 
trưởng trung bình là 0,11979 hay tương ñương mức 11,979 %. 
Ví dụ 1.4: Một loại mô bào sinh trưởng sau 3 tháng sẽ tăng gấp ñôi khối lượng. Mức tăng 
trưởng trung bình mỗi tháng là bao nhiêu? 
 Mức tăng trưởng trung bình mỗi tháng là: G = 3 2 = 1,26; nghĩa là 26% mỗi tháng. 
Ta có thể minh hoạ sự tăng trưởng qua 3 tháng như sau: 
1×1,26 = 1,26 
1,26×1,26 = 1,5876 
1,5876×1,26 = 2,00037 
Trung bình ñiều hoà ký hiệu là H 
 H =
∑
=
n
i ix
n
1
1
 hoặc H=
∑
i i
i
x
m
n
Ví dụ 1.5: Ba lò mổ mỗi lò mổ 1000 con; lò mổ thứ nhất có năng suất giết mổ 10 con/giờ, lò 
mổ thứ hai 15 con/giờ và lò mổ thứ ba 30 con/giờ. Trung bình một giờ giết mổ ñược bao 
nhiêu con? 
Trung bình sẽ không phải là (10 + 15 + 30)/3 = 55/3. ðây là trung bình cộng, chính bằng trung 
bình mỗi giờ nếu cả 3 lò mổ song song song với nhau. 
Giá trị trung bình phải là H = 15
30
1
15
1
10
1
3
1 =
++
=
∑
i ix
n
con/giờ. 
ðiều này có thể minh hoạ như sau: ðể giết mổ ñược 90 con lò thứ nhất phải thực hiện trong 9 
giờ, lò thứ hai trong 6 giờ và lò thứ 3 trong 3 giờ; nghĩa là 270 con lợn ñược giết mổ trong 18 
giờ; tức là trung bình 15 con/giờ. Chú ý rằng số lợn giết mổ ñược cố ñịnh khi bắt ñầu. 
Thiết kế thí nghiệm 12
TRUNG VỊ ký hiệu Me 
Nếu sắp xếp các giá trị từ nhỏ ñến lớn thì giá trị ở vị trí chính giữa ñược gọi là trung vị (Me). 
Nói một cách lý thuyết thì Me là giá trị có 50% số giá trị nhỏ hơn và 50% số giá trị lớn hơn. 
ðể tính nhanh giá trị trung vị ta có thể tiến hành các bước sau: 
1) Sắp xếp các giá trị theo trình tự tăng dần 
2) ðánh số thứ tự cho các dữ liệu 
3) Tìm trung vị ở vị trí có số thứ tự (n + 1)/2 
Nếu n là số lẻ và các giá trị ñều khác nhau thì có một giá trị chính ở giữa 
Ví dụ 1.6: Nồng ñộ vitamin E (µmol/l) của 11 bê cái có dấu hiệu lâm sàng của phát triển cơ 
không bình thường ñược trình bày như sau: 
4,2 3,3 7,0 6,9 5,1 3,4 2,5 8,6 3,5 2,9 4,9 
Sau khi sắp xếp theo thứ tự tăng dần ta có: 
2,5 2,9 3,3 3,4 3,5 4,2 4,9 5,1 6,9 7,0 8,6 
1 2 3 4 5 6 7 8 9 10 11 
Như vậy vị trí trung vị sẽ là (n + 1)/2 = (11 + 1)/2 = 6, do 6 là vị trí của trung vị nên giá trị 
của trung vị sẽ là 4,2. 
Nếu n là số chẵn và các giá trị ñều khác nhau thì có 2 số ñứng giữa, cả hai ñều ñược gọi là 
trung vị. Khoảng giữa 2 số ñứng giữa ñược gọi là khoảng trung vị. Nếu ñược phép dùng số 
thập phân thì lấy ñiểm giữa của khoảng làm trung vị Me. 
Xét ví dụ 1.1: Khối lượng (gram) của 16 chuột cái tại thời ñiểm cai sữa như sau: 
54.1 49.8 24.0 46.0 44.1 34.0 52.6 54.4 
56.1 52.0 51.9 54.0 58.0 39.0 32.7 58.5 
Vị trí của trung vị sẽ là (16 + 1)/2 = 8,5; khoảng trung vị sẽ nằm ở vị trí số 8 và số 9, tức là từ 
49,8 – 51,9. Như vậy giá trị của trung vị Me = (49,8 + 51,9)/2 = 50,9. 
Nếu các số liệu chia thành lớp có tần số thì phải chọn lớp trung vị sau ñó nội suy ñể tính gần 
ñúng trung vị. 
Ngoài trung vị còn có các phân vị, trong ñó hay dùng nhất là tứ phân vị dưới Q1 mà chúng ta 
có thể ñịnh nghĩa một cách lý thuyết là giá trị có 25% số giá trị nhỏ hơn, tứ phân vị trên Q2 là 
giá trị có 25% số giá trị lớn hơn. 
MODE ký hiệu Mod 
Mode là giá trị có tần suất cao nhất. Thông thường Mode có giá trị khác với giá trị trung bình 
cộng và trung vị. Ba giá trị này này sẽ bằng nhau khi số liệu có phân bố chuẩn. Nhóm Mode 
hay lớp Mode là nhóm hoặc lớp mà một số lớn các quan sát rơi vào ñó. Thông qua tổ chức ñồ 
ta có thể xác ñịnh ñược giá trị của lớp này. 
Xét trường hợp ví dụ 2, nhóm Mod ñược ñại diện bằng các giá trị từ 107 ñến 115 kg. Từ 4547 
lợn quan sát có 1083 con nằm trong khoảng từ 107 ñến 115kg ; ñây là tần suất cao nhất. Cũng 
theo ví dụ 1 ta thấy Mod có giá trị khoảng 111kg. 
Chương 1 Một số khái niệm trong xác suất và thống kê 
13
P 
(kg) 
60,7 
66,9 
67,0 
74,9 
75,0 
82,9 
83,0 
90,9 
91,0 
98,9 
99,0 
106,9 
107,0 
114,9 
115,0 
122,9 
123,0 
130,9 
131,0 
138,9 
139,0 
146,9 
147,0 
156,1 
n 11 31 80 218 484 951 1083 907 512 203 55 12 
Trường hợp có nhiều giá trị có tần số lớn bằng nhau và lớn hơn các tần số khác thì không xác 
ñịnh ñược Mod. 
Trường hợp số liệu chia lớp thì tìm lớp có tần số lớn nhất sau ñó dùng cách nội suy ñể tính 
gần ñúng Mod. 
PHƯƠNG SAI MẪU ký hiệu s² 
Phương sai mẫu chưa hiệu chỉnh s2p tính theo công thức: 
n
xx
s
n
i
i
p
∑
=
−






−
=
1
2
2
 hay 
n
mxx
s
k
i
ii
p
∑
=
−






−
=
1
2
2
Phương sai mẫu ñược dùng trong tài liệu này là phương sai ñã hiệu chỉnh, gọi tắt là phương 
sai mẫu s2: 
1
1
2
2
−






−
=
∑
=
−
n
xx
s
n
i
i
p hay 1
1
2
2
−






−
=
∑
=
−
n
mxx
s
k
i
ii
p 
ðối với máy tính bỏ túi, có thể tính phương sai theo công thức sau: 
 )1(
)
)(
(
2
2
2
−
−
=
∑
∑
n
n
x
x
s i
i
i
i
Khi có phương sai mẫu chưa hiệu chỉnh s2p có thể tính s2 theo công thức 
22
)1( psn
n
s
−
= 
Xét ví dụ 1.1, khối lượng của 16 chuột cái tại thời ñiểm cai sữa; giá trị trung bình ñã tính là 
47,58gram. Như vậy phương sai mẫu hiệu chỉnh sẽ là: 
( ) ( ) ( ) 27,103
116
58,475,58....58,478,4958,471,54
1
222
1
2
2
=
−
−++−+−
=
−






−
=
∑
=
−
n
xx
s
n
i
i
gram² 
ðỘ LỆCH CHUẨN ký hiệu là s 
Căn bậc hai của s2 gọi là ñộ lệch chuẩn: 2ss = 
Xét ví dụ 1, khối lượng của 16 chuột cái tại thời ñiểm cai sữa. Các số liệu này ñã ñược sử 
dụng ñể tính giá trị trung bình (47,58 gram) và phương sai (103,27 gram²) như ñã nêu trên. 
Như vậy ñộ lệch chuẩn sẽ là: 16,1027,1032 === ss gram 
Thiết kế thí nghiệm 14
HỆ SỐ BIẾN ðỘNG ký hiệu là Cv (%) 
Hệ số biến ñộng ñược tính theo công thức 
 100
_
×=
x
sCv 
Xét ví dụ 1.1, khối lượng của 16 chuột cái tại thời ñiểm cai sữa. Ta ñã có giá trị trung bình 
(47,58gram) và ñộ lệch chuẩn (10,16 gram). Như vậy phương sai mẫu hiệu chỉnh sẽ là: 
36,21100
58,47
16,10100
_
=×=×=
x
sCv % 
KHOẢNG BIẾN THIÊN (phạm vi chứa số liệu Range) 
Gọi Xmax là giá trị lớn nhất, Gọi Xmin là giá trị nhỏ nhất, ta có khoảng biến thiên: 
R = xmax - xmin 
Với ví dụ 1.1, khối lượng của 16 chuột tại thời ñiểm cai sữa. 
Ta có R = xmax - xmin = 58,5 – 24,0 = 34,5 gram 
SAI SỐ CHUẨN (sai số của trung bình cộng) ký hiệu là SE 
SE
n
S
= 
Xét ví dụ 1.1, khối lượng của 16 chuột cái tại thời ñiểm cai sữa. Ta ñã có ñộ lệch chuẩn 
(10,16 gram). Như vậy sai số tiêu chuẩn sẽ là: 
SE 54,2
16
16,10
===
n
S gram 
Ngoài các tham số trên, trong thống kê còn dùng ñộ lệch (ñộ bất ñối xứng), ñộ nhọn. Hai 
tham số này ñược dùng khi xem xét có nên chuyển ñổi số liệu không phân phối chuẩn thành 
số liệu phân phối chuẩn hay không. 
1.2.5. Biểu diễn số liệu bằng ñồ thị 
ðồ thị là tóm tắt số liệu ở các dạng hình ảnh khác nhau và cho phép dễ dàng phát hiện những 
ñiểm ñặc biệt hơn so với tóm tắt bằng số. ðồ thị ñặc biệt hiệu quả khi ta muốn biết ñược các 
thông tin về số liệu một cách nhanh chóng. 
Có nhiều cách biểu diễn số liệu bằng ñồ thị: ðồ thị tần số, ñồ thị hình thanh, ñồ thị ña giác, 
chữ nhật (tổ chức ñồ). 
ðối với biến ñịnh tính hoặc biến rời rạc có thể biểu diễn số liệu bằng ñồ thị thanh hoặc ñồ thị 
bánh hình tròn. 
Chương 1 Một số khái niệm trong xác suất và thống kê 
15
Lứa Số con ñẻ 
ra (con) 
Tần suất 
(%) 
Tần suất 
tích luỹ (%) 
1 337 30,12 30,12 
2 275 24,58 54,69 
3 213 19,03 73,73 
4 137 12,24 85,97 
5 86 7,69 93,66 
6 49 4,38 98,03 
7 22 1,97 100,00 
Biểu ñồ hình thanh biểu diễn số lợn sơ 
sinh qua 7 lứa (n = 1119) 
Biểu ñồ dạng bánh biểu hiện tần số kiểu 
gen Halothane của lợn sơ sinh Pietrain (n 
=2760) 
Kiểu 
gen 
Số con ñẻ ra 
(con) 
Tần suất (%) 
nn 724 26,20 
Nn 1368 49,60 
NN 668 24,20 
ðối với biến ñịnh lượng có thể sử dụng ñồ thị ña giác, ñồ thị hộp hay tổ chức ñồ ñể thể hiện. 
Ví dụ : Sản lượng sữa (kg) của 108 dê Bách Thảo trong một chu kỳ tiết sữa ghi lại như sau : 
 147,9 125,4 104,1 164,4 193,8 188,4 222,4 287,3 158,1 
 132,0 224,0 163,8 153,3 100,6 219,5 130,4 114,0 182,1 
 156,9 66,3 140,6 128,3 193,2 127,1 125,0 129,9 89,7 
 254,4 240,3 148,2 190,0 176,7 73,8 147,9 222,7 191,6 
 174,3 211,0 214,5 169,5 115,0 193,6 168,0 196,9 87,3 
 144,4 138,4 171,6 100,0 125,6 283,9 116,5 71,0 220,1 
 139,7 140,7 270,5 176,8 155,0 163,5 161,6 152,0 141,0 
 180,0 202,6 112,8 153,5 77,9 140,7 136,4 272,3 90,0 
 197,5 96,8 96,8 137,8 150,4 101,5 132,0 146,3 242,3 
 311,0 118,7 146,6 184,2 243,8 260,7 279,2 135,9 109,5 
 96,8 119,0 109,3 143,8 102,9 229,3 244,2 137,1 143,6 
 130,6 72,0 105,1 135,0 320,4 182,2 217,8 172,5 136,4 
16 Thiết kế thí nghiệm 
Tổ chức ñồ : Phân bố tần suất sản 
lượng sữa dê Bách Thảo trong chu 
kỳ tiết sữa 
ðồ thị hộp : Phân bố tần suất sản 
lượng sữa dê Bách Thảo trong chu 
kỳ tiết sữa 
Tóm tắt và biểu diễn dữ liệu của các tính trạng số lượng (dữ liệu 2 chiều) 
ðồ thị phân tán ñược sử dụng một cách rất hữu hiệu khi ta quan tâm ñến mối liên hệ giữa 2 
biến liên tục. ðồ thị ñược xây dựng khi ta vẽ n các ñiểm trên hệ toạ ñộ, các ñiểm này có toạ 
ñộ là xiyi. Vấn ñề này sẽ ñược ñề cập cụ thể trong chương 6. 
ðồ thị phân tán thể hiện mối quan 
hệ giữa thời gian cai sữa (ngày) và 
khối lượng sơ sinh sinh/con (kg) 
của lợn Landrace n = 321. 
Chương 1 Một số khái niệm trong xác suất và thống kê 17 
1.3. Bài tập 
1.3.1 
Xác suất mắc một bệnh là P = 0,35 (0,35 là xác suất nhiễm bệnh ñược tính toán dựa trên một 
quan sát với dung lượng mẫu lớn). Hãy tính xác suất mắc bệnh của 2 trong số 10 ñộng vật. 
1.3.2 
Xác suất mắc một bệnh là 0,25. Hãy tính xác suất không phát hiện ñược ca nhiễm bệnh trong 
số 30 ñộng vật kiểm tra. 
1.3.3 
Bệnh dại xuất hiện với tần suất 0,005. Cần tiến hành kiểm tra bao nhiêu chó trong vùng ñể 
phát hiện bệnh dại với ñộ chính xác 95%. 
1.3.4 
Khối lượng (kg) ở 210 ngày tuổi của lợn Pietrain có các kiểu gen Halothane khác nhau ñược 
trình bày ở bảng số liệu dưới ñây. Vẽ ñồ thị và tính các tham số thống kê mô tả của bộ số liệu 
vừa nêu. 
NN Nn Nn 
118,54 
123,66 
97,10 
96,30 
112,20 
124,40 
109,51 
110,98 
128,80 
119,51 
120,24 
114,10 
100,20 
114,00 
104,15 
101,71 
86,27 
106,34 
110,49 
128,54 
112,68 
107,47 
103,90 
101,50 
114,88 
133,90 
127,07 
136,34 
120,10 
107,60 
102,68 
89,50 
119,02 
125,61 
94,70 
91,33 
114,60 
144,88 
102,89 
116,80 
117,56 
112,44 
116,34 
117,11 
136,10 
111,57 
120,00 
110,98 
113,20 
83,90 
105,85 
100,49 
108,54 
80,00 
106,27 
121,95 
111,50 
130,00 
112,20 
110,49 
101,20 
137,56 
122,68 
102,00 
116,34 
116,63 
111,22 
111,50 
112,00 
121,71 
103,66 
131,95 
104,15 
121,50 
153,70 
102,00 
109,76 
110,73 
123,90 
110,70 
117,60 
135,37 
78,29 
95,00 
102,17 
103,61 
92,44 
116,30 
113,66 
67,07 
119,28 
102,41 
126,59 
108,78 
131,71 
96,34 
88,29 
74,15 
121,50 
120,50 
112,77 
82,20 
108,78 
105,78 
117,07 
105,78 
101,46 
98,50 
107,95 
118,00 
96,39 
121,95 
114,22 
111,81 
105,78 
111,33 
113,73 
97,56 
100,00 
125,61 
121,93 
101,46 
108,92 
91,00 
103,00 
115,42 
109,76 
102,00 
101,69 
115,12 
109,00 
100,98 
111,71 
107,80 
118,78 
91,22 
92,00 
97,59 
99,76 
118,05 
95,66 
101,70 
108,67 
105,61 
74,88 
118,00 
107,95 
112,53 
138,07 
108,54 
109,76 
93,73 
129,27 
81,20 
100,96 
109,02 
113,25 
102,93 
112,29 
121,69 
126,83 
104,34 
107,00 
124,39 
120,96 
95,85 
96,10 
110,36 
131,95 
108,00 
126,99 
84,10 
105,61 
92,68 
76,39 
115,66 
98,07 
100,00 
120,98 
118,05 
111,00 
125,06 
145,37 
125,54 
120,24 
116,63 
89,76 
111,57 
105,12 
121,95 
99,27 
109,27 
103,13 
122,65 
96,87 
93,66 
85,37 
111,08 
94,15 
106,75 
107,23 
109,16 
102,89 
99,02 
114,94 
101,93 
110,84 
88,43 
97,32 
113,98 
117,83 
120,24 
107,56 
129,76 
119,76 
110,49 
110,36 
110,73 
81,93 
101,93 
105,54 
93,90 
95,18 
105,78 
93,01 
109,76 
91,81 
115,90 
107,23 
86,02 
93,01 
95,85 
104,58 
130,60 
113,17 
104,34 
90,36 
88,67 
108,43 
113,90 
105,54 
133,01 
111,95 
65,85 
118,78 
97,11 
123,37 
111,33 
122,20 
96,63 
101,20 
104,58 
111,81 
107,71 
104,34 
86,51 
94,70 
114,70 
108,19 
99,27 
131,08 
102,65 
106,34 
95,85 
115,37 
104,10 
118,54 
97,56 
111,33 
120,96 
94,94 
81,22 
111,33 
109,40 
110,60 
96,39 
112,29 
106,27 
134,63 
108,92 
130,98 
114,94 
98,05 
90,36 
123,13 
111,57 
91,71 
105,78 
104,82 
114,39 
110,36 
109,40 
104,10 
102,17 
120,98 
126,10 
108,43 
96,59 
116,63 
109,88 

File đính kèm:

  • pdfbai_giang_thiet_ke_thi_nghiem_chuong_1_mot_so_khai_niem_tron.pdf