Bài giảng Lý thuyết xác suất và thống kê toán - Chương 3: Các phân phối xác suất thông dụng

CHƯƠNG 3

Các phân phối xác suất thông dụng

1. Các phân phối của ĐLNN rời rạc

1.1 Phân phối Nhị thức

1.1.1 Định nghĩa và các số đặc trưng

Trong một phép thử, biến cố A xảy ra với xác

suất p. Thực hiện phép thử n lần độc lập. Gọi X là số

lần biến cố A xảy ra thì X là ĐLNN. Theo công thức

 

pdf 34 trang phuongnguyen 4580
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất và thống kê toán - Chương 3: Các phân phối xác suất thông dụng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Lý thuyết xác suất và thống kê toán - Chương 3: Các phân phối xác suất thông dụng

Bài giảng Lý thuyết xác suất và thống kê toán - Chương 3: Các phân phối xác suất thông dụng
 CHƯƠNG 3 
Các phân phối xác suất thông dụng 
1. Các phân phối của ĐLNN rời rạc 
1.1 Phân phối Nhị thức 
1.1.1 Định nghĩa và các số đặc trưng 
 Trong một phép thử, biến cố A xảy ra với xác 
suất p. Thực hiện phép thử n lần độc lập. Gọi X là số 
lần biến cố A xảy ra thì X là ĐLNN. Theo công thức 
Nhị thức: 
P(X=k) = k k n knC p q
− 
 ĐLNN X có phân phối xác suất như trên được 
được gọi là ĐLNN có phân phối Nhị thức, ký hiệu X 
~ B(n, p). Giá trị của X là 0, 1, ..., n. 
 Đặt q = 1–p. Ta tính được: 
E(X) = np Var(X) = npq 
(n+1)p – 1 ≤ Mod(X) ≤ (n+1)p 
Excel 
 Pk = P(X=k) =BINOMDIST(k, n, p, 0) 
 P(X ≤ k) =BINOMDIST(k, n, p, 1) 
 Ví dụ 
(1) Lấy ngẫu nhiên có hoàn lại 10 sản phẩm từ lô 
hàng có 80% chính phẩm. Tính xác suất có 8 chính 
phẩm. 
Biến cố "lấy được chính phẩm" có xác suất p = 80%. 
Số lần lặp lại phép thử là n = 10. Gọi X là số chính 
phẩm đếm được thì X ~ B(10; 80%). Xác suất cần 
tính là P(X=8). Theo công thức: 
 P(X=8) = 810C (0,8)
8(0,2)2 ≈ 30% 
=BINOMDIST(8, 10, 80%, 0) 
 (2) Cho X~B(79; 75%), Y~B(30; 25%). Tính Mod(X), 
Mod(Y). 
Lưu ý Mod(X), Mod(Y) đều là số nguyên, ta có: 
 59 ≤ Mod(X) ≤ 60 ⇒ Mod(X) = 59 hay Mod(X) = 60 
 6,75 ≤ Mod(Y) ≤ 7,75 ⇒ Mod(Y) = 7 
(3) Một xạ thủ bắn trúng bia với xác suất 20%. Tính 
xác suất xạ thủ này bắn vào bia 5 phát thì có không 
quá 2 phát trúng bia. 
 1.1.2 Xấp xỉ Nhị thức bởi phân phối Chuẩn 
 Xét B(n, p). Nếu n đủ lớn và p không quá gần 0 
hay 1 thì phân phối Nhị thức được xấp xỉ bởi phân 
phối Chuẩn có cùng kỳ vọng và phương sai: 
B(n, p) ≈ N(np, npq) 
Ta cũng có công thức tính gần đúng: 
 P(X = k) ≈ 
1 k np
( )
npq npq
−
ϕ 
=NORMDIST(k, n*p, (n*p*q)^.5, 0) 
 P(a ≤ X ≤ b) ≈ Φ(
b np
npq
−
) − Φ(
a np
npq
−
) 
Trong đó ϕ là hàm Gauss ϕ(z) =
2z / 21 e
2
−
pi
. 
 Ghi chú 
 "n đủ lớn và p không quá gần 0 hay 1" nghĩa là 
p ≥ 10%, q ≥ 10%, np > 5 và nq > 5. 
 Ví dụ 
 Xác suất chữa khỏi bệnh của một loại thuốc là 
80%. Có 1.000 người dùng thuốc này. Tính xác suất 
có ít ra 790 người khỏi bệnh. 
Biến cố "một người khỏi bệnh sau khi dùng thuốc" có 
xác suất p = 85%. Số người dùng thuốc là n = 1.000. 
Gọi X là số người khỏi bệnh sau khi dùng thuốc thì 
X~B(1.000; 80%). Xác suất cần tính là P(X ≥ 790). 
Do n đủ lớn và p không quá gần 0 hay 1 nên 
B(1.000; 80%) ≈ N(800, 160). 
P(X ≥ 790) ≈ 0,5 – 
790 800
( )
160
−
Φ = 0,5 + Φ(0,79) ≈ 79% 
=1–NORMDIST(790, 800, 160^.5, 1) 
 1.2 Phân phối Poisson 
1.2.1 Định nghĩa và các số đặc trưng 
 ĐLNN rời rạc X nhận các giá trị 0, 1, ... với 
P(X=k) định bởi công thức sau gọi là ĐLNN có phân 
phối Poisson với tham số λ (λ > 0), ký hiệu X ~ P(λ): 
P(X=k) = 
k
e
k !
−λλ 
 Ta tính được: 
E(X) = λ Var(X) = λ λ – 1 ≤ Mod(X) ≤ λ 
Excel 
 P(X=k) =POISSON(k, λ, 0) P(X ≤ k) =POISSON(k, λ, 1) 
Ghi chú 
 Khi λ > 10 thì P(λ) ≈ N(λ, λ). 
 1.2.2 Xấp xỉ Nhị thức bởi phân phối Poisson 
 Xét ĐLNN B(n, p). Nếu n đủ lớn và p đủ nhỏ 
thì phân phối Nhị thức được xấp xỉ bởi phân phối 
Poisson có cùng kỳ vọng: 
B(n, p) ≈ P(np) 
Ghi chú 
 "n đủ lớn và p đủ nhỏ" nghĩa là n ≥ 20 và p ≤ 5%. 
 Điều kiện khác là n ≥ 30, p ≤ 10% và np < 10. 
 Xấp xỉ sẽ tốt hơn nếu n ≥ 100 và np < 10. 
 Ví dụ 
(1) Xác suất bị đứt trong 1 giờ hoạt động của một 
ống sợi là 0,2%. Một máy dệt có 1.000 ống sợi. Tính 
xác suất trong 1 giờ hoạt động của máy dệt có nhiều 
hơn 2 ống sợi bị đứt. 
 Biến cố "ống sợi bị đứt" có xác suất p = 0,2%. 
Gọi X là số ống sợi bị đứt trong số n = 1.000 ống sợi 
thì X~B(1.000, 0,2%). Xác suất cần tính là P(X > 2). 
 Do n đủ lớn và p đủ nhỏ nên ta xấp xỉ X bởi P(λ) 
với λ = 1.000×0,2% = 2. Ta có: 
 P(X > 2) = 1 – P(X=0) – P(X=1) – P(X=2) 
 = 1 – 
0
22 e
0 !
−
 – 
1
22 e
1 !
−
 – 
2
22 e
2 !
−
 = 1 – e–2(1+2+2) ≈ 32% 
 =1−POISSON(2, 2, 1) 
 (2) Một cộng đồng có khoảng 2% người sống đến 90 
tuổi. Cộng đồng hiện có 1.000 người. 
a) Tính trung bình cộng đồng có bao nhiêu người 
sống đến 90 tuổi? 
b) Tính xác suất cộng đồng có đúng 20 người sống 
đến 90 tuổi. 
c) Tính xác suất cộng đồng có hơn 20 người sống 
đến 90 tuổi. 
(3) Trung bình một ngày bãi giữ xe nhận 600 xe. 
Tính xác suất ngày mai có 700 xe được gởi tại bãi 
giữ xe này. 
 1.3 Phân phối Siêu bội 
1.3.1 Định nghĩa và các số đặc trưng 
 Xét tập hợp gồm N phần tử trong đó có M phần 
tử có tính chất tốt. Gọi X là số phần tử có tính chất 
tốt có được khi lấy ngẫu nhiên n phần tử. Xét k là 
một số nguyên từ max(0, n+M–N) đến min(M, n). 
Theo công thức Siêu bội ta có: 
P(X=k) = 
k n k
M N M
n
N
C .C
C
−
− =HYPGEOMDIST(k, n, M, N) 
 X được gọi là ĐLNN có phân phối Siêu bội, ký 
hiệu X ~ H(N, M, n). 
 Đặt p = M/N và q = 1 – p. Ta tính được: 
 E(X) = np Var(X) = 
N n
npq
N 1
−
−
Mod(X) = 
(n 1)(M 1)
N 2
 + +
 + 
 Ví dụ 
(1) Một công ty có 10 chiếc xe trong đó có 3 chiếc 
Lexus. Điều ngẫu nhiên 4 chiếc xe để đi công tác. 
Tính xác suất trong các xe đó có 1 chiếc Lexus. 
Mô hình Siêu bội. 
 N = 10 M = 3 n = 4 
Gọi X là số xe Lexus có trong các xe được điều thì 
X~H(10, 3, 4). Cần tính là P(X=1). 
 P(X=1) = 
1 3
3 7
4
10
C .C
C
 = 50% =HYPGEOMDIST(1, 4, 3, 10) 
 (2) Một lớp 70 sinh viên trong đó có 40 sinh viên 
giỏi Toán. Chọn ngẫu nhiên 10 sinh viên. Tính xác 
suất có ít ra là 3 sinh viên giỏi Toán. 
 1.3.2 Xấp xỉ Siêu bội bởi phân phối Nhị thức 
 Nếu n đủ nhỏ so với N, M và p = M/N không quá 
gần 0 hay 1 thì ta có xấp xỉ: 
H(N, M, n) ≈ B(n, 
M
N
) 
Ghi chú 
"n đủ nhỏ so với N, M và p = M/N không quá gần 0 
hay 1" nghĩa là 20n < N, 20n < M và 10% ≤ p ≤ 90%. 
* Khi n đủ nhỏ so với N thì việc lấy ngẫu nhiên có 
hoàn lại hoặc không hoàn lại là gần như nhau. 
 Ví dụ 
(1) Lô hàng gồm 10.000 sản phẩm trong số có 9.000 
chính phẩm. Lấy ra 10 sản phẩm. Tính xác suất 
trong các sản phẩm này có 9 chính phẩm. 
Mô hình Siêu bội. 
Gọi X là số chính phẩm có trong 10 sản phẩm lấy ra 
thì X ~ H(1.000, 900, 10). Cần tính P(X=9). 
Vì n đủ nhỏ so với N, M và p = M/N không quá gần 0 
hay 1 nên: 
 H(1.000, 900, 10) ≈ B(10, 900/1.000) = B(10, 90%) 
Vậy: 
 P(X=9) = 910C .(90%)
9.(10%)1 ≈ 39% 
 =BINOMDIST(9, 10, 90%, 0) 
 (2) Tỷ lệ phế phẩm của nhà máy là 90%. Khách 
hàng lấy 100 sản phẩm để kiểm tra và nếu thấy có 
ít ra là 93 chính phẩm thì đồng ý mua sản phẩm của 
nhà máy. Tính xác suất khách hàng đồng ý mua. 
Gọi N, M là tổng số sản phẩm, chính phẩm của nhà 
máy, X là số chính phẩm có trong 100 sản phẩm lấy 
ra kiểm tra thì X ~ H(N, M, 100). Cần tính P(X ≥ 93). 
Do số sản phẩm lấy ra kiểm tra đủ nhỏ so với số sản 
phẩm cũng như số chính phẩm của nhà máy và tỷ 
chính phẩm M/N = 90% không quá gần 0 hay 1 nên: 
 H(N, M, 100) ≈ B(100, 90%) 
Lại do n = 100 đủ lớn và p = 90% không quá gần 0 
hay 1 nên B(100, 90%) ≈ N(90, 9). Vậy: 
 P(X ≥ 93) = 0,5 – 
93 90
( )
9
−
Φ = 0,5 – Φ(1) ≈ 15,87% 
=1–NORMDIST(93, 90, 9^.5, 1) 
Xác suất khách hàng đồng ý mua sản phẩm của nhà 
máy là 15,87%. 
 2. Các phân phối của ĐLNN liên tục 
2.1 Phân phối Chuẩn 
 Theo Liapunov, một ĐLNN X là tổng của một số 
lớn các ĐLNN độc lập và mỗi giá trị của ĐLNN 
thành phần có vai trò rất nhỏ trong tổng thì X sẽ là 
một ĐLNN có quy luật phân phối Chuẩn. 
 Xét Z ~ N(0; 1), ta có P(–zα/2 < Z < zα/2) = 1–α. 
 Lấy α = 5% thì P(–1,96 < Z < 1,96) = 95%. 
 Điều này chứng tỏ một ĐLNN có phân phối 
Chuẩn Chính tắc thì 95% giá trị của nó đều nằm 
trong khoảng (–1,96; 1,96). Nói theo nguyên lý Xác 
suất Lớn thì hầu hết giá trị của phân phối Chuẩn 
Chính tắc đều nằm trong khoảng (–1,96; 1,96). 
 Lấy α = 5% thì P(Z < 1,6449) = 95%. 
 Điều này chứng to một ĐLNN có phân phối 
Chuẩn Chính tắc thì 95% giá trị của nó đều nhỏ hơn 
1,6449. Nói theo nguyên lý Xác suất Lớn thì hầu hết 
giá trị của phân phối Chuẩn Chính tắc đều nhỏ hơn 
1,6449. 
 Nếu X ~ N(µ; σ2) thì 
X − µ
σ
 là phân phối Chuẩn 
Chính tắc. Giá trị 
X − µ
σ
 gọi là điểm−Z. ĐLNN X có 
phân phối Chuẩn thì hầu hết giá trị điểm−Z của X 
đều nằm trong khoảng (–1,96; 1,96) và hầu hết đều 
nhỏ hơn 1,6449. 
 Ví dụ 
 Trọng lượng ghi trên bao bì của một bao cám là 
5Kg với độ lệch chuẩn là 0,1Kg. Biết trọng lượng của 
một bao cám lấy ngẫu nhiên là một ĐLNN có phân 
phối Chuẩn. 
a) Một bao cám được coi là đạt tiêu chuẩn nếu 
trọng lượng sai lệch không quá 200g trọng lượng ghi 
trên bao bì. Tính tỷ lệ bao cám đạt tiêu chuẩn. 
b) Tính xác suất mua được một bao cám có trọng 
lượng từ 4,9Kg đến 5,2Kg. 
c) Trọng lượng tối đa của một bao cám trong số 
95% bao cám nhẹ nhất là bao nhiêu? 
 Gọi X là trọng lượng một bao cám (đơn vị: Kg). Theo 
giả thiết thì X ~ N(µ, σ2) với µ = 5, σ = 0,1. 
a) Cần tính P(X − 5 < 0,2). Ta có: 
 P(X−5< 0,2) = 2Φ(0,2/0,1) = 2Φ(2) ≈ 95% 
=2*NORMSDIST(.2/.1)−1 
b) Cần tính P(4,9 < X < 5,2). Ta có: 
 P(4,9 < X < 5,2) = Φ(
5, 2 5
0, 1
−
) − Φ(
4, 9 5
0, 1
−
) 
 = Φ(2) – Φ(–1) = Φ(2)+Φ(1) ≈ 82% 
=NORMDIST(5.2, 5, .1, 1) − NORMDIST(4.9, 5, .1, 1) 
 c) Gọi x là trọng lượng cần tìm. Trọng lượng của 
một bao cám trong số 95% bao cám nhẹ nhất có 
điểm−Z không quá 1,6449. Vậy: 
x 5
0, 1
−
 = 1,6449 ⇒ x = 5,1645 
Trọng lượng tối đa của một bao cám trong số 95% 
bao cám nhẹ nhất là 5,1645Kg. 
 2.2 Phân phối Chi Bình phương 
 Xét X1, X2, , Xk là các ĐLNN độc lập và có 
phân phối Chuẩn Chính tắc. Đặt: 
χ2 = 2 2 21 2 kX X ... X+ + +
 χ2 là ĐLNN liên tục gọi là có phân phối Chi 
Bình phương bậc tự do k, ký hiệu χ2~χ2(k). Ta có: 
E(χ2(k)) = k Var(χ2(k)) = 2k 
 Khi k ≥ 30 thì phân phối Chi Bình phương được 
xấp xỉ bởi phân phối Chuẩn Chính tắc. 
 Trong ứng dụng, ta cần tìm phân vị mức α của 
phân phối Chi Bình phương χ2~χ2(k), tức là tìm χ2α 
sao cho P(χ2 > χ2α) = α. Giá trị χ
2
α được tìm bằng cách 
tra bảng kê số hoặc dùng hàm Excel =CHIINV(α, k). 
 2.3 Phân phối Student 
 Xét hai ĐLNN độc lập Z~N(0, 1), χ2~χ2(k). Đặt: 
T = 2Z / / kχ 
 T là ĐLNN liên tục gọi là có phân phối Student 
bậc tự do k, ký hiệu T ~ T(k). Ta có: 
E(T) = 0 Var(T) = 
k
k 2−
 Khi k ≥ 30 thì phân phối Student được xấp xỉ 
bởi phân phối Chuẩn Chính tắc. 
 Trong ứng dụng, ta cần tìm phân vị mức α của 
phân phối Student T~T(k), tức là tìm tα sao cho 
P(T > tα) = α. Giá trị tα được tìm bằng cách tra bảng 
kê số hoặc dùng hàm Excel =TINV(2*α, k). 
 2.4 Phân phối Fisher–Snedecor 
 Xét hai ĐLNN độc lập là χ2(n1) và χ
2
(n2). Đặt: 
F = 
2
1 1
2
2 2
(n ) / n
(n ) / n
χ
χ
 F là ĐLNN liên tục gọi là có phân phối Fisher–
Snedecor bậc tự do n1 và n2, ký hiệu F ~ F(n1, n2). 
Khi n2 > 4, ta tính được: 
E(F) = 2
2
n
n 2−
 Var(F) = 
 2
2 1 2
2
1 2 2
2n (n n 2)
n (n 2) (n 4)
+ −
− −
 Trong ứng dụng, ta cần tìm phân vị mức α của 
phân phối Fisher-Snedecor F ~ F(n1, n2), tức là tìm fα 
sao cho P(F > fα) = α. Giá trị fα được tìm bằng cách tra 
bảng kê số hoặc dùng hàm Excel =FINV(α, n1, n2). 
 3. Phép toán trên các phân phối 
3.1 Tổng của các phân phối Nhị thức 
 Nếu X1~B(n1, p), X2~B(n2, p),..., Xm~B(nm, p) là 
các ĐLNN độc lập thì tổng của chúng sẽ là ĐLNN có 
phân phối Nhị thức với n = n1 + n2 +...+ nm. Tức là: 
B(n1, p) + B(n2, p) + B(nm, p) = B(n1 + n2 +...+ nm, p) 
 Ví dụ 
 Lô hàng I (II) gồm 500 (750) sản phẩm trong đó 
có 200 (300) sản phẩm tốt. Mua 5 sản phẩm thuộc lô 
hàng I và 10 sản phẩm thuộc lô hàng II. Tính xác 
suất mua được 8 sản phẩm tốt. 
Gọi X1 (X2) là số sản phẩm tốt mua được tại cửa 
hàng I (II) thì số sản phẩm tốt mua được là 
Y = X1 + X2. Xác suất cần tính là P(X = 8). Ta có: 
 X1 ~ H(500, 200, 5) X2 ~ H(750, 300, 10) 
Do n đủ nhỏ so với N, M và p = M/N không quá gần 0 
hay 1 nên X1 ≈ B(5, 40%) X2 ≈ B(10, 40%) 
Vậy Y = X1+X2 ≈ B(5, 40%) + B(10, 40%) = B(15, 40%) 
 ⇒ P(Y = 8) ≈ 11,8% 
 3.2 Tổng của các phân phối Poisson 
 Nếu X1~P(λ1), X2~P(λ2),..., Xn~P(λn) là các ĐLNN 
độc lập thì tổng của chúng sẽ là ĐLNN có phân phối 
Poisson với tham số λ = λ1 + λ2 +...+ λn. Tức là: 
P(λ1) + P(λ2) + ... + P(λn) = P(λ1 + λ2 +...+ λn) 
 Ví dụ 
 Máy dệt I (II, III) có 1.000 (1.500, 1.000) ống 
sợi. Xác suất bị đứt một ống sợi trên máy I (II, III) 
là 0,2% (0,1%, 0,15%). Tính xác suất 3 máy dệt có từ 
5 ống sợi các loại bị đứt trở lên. 
Gọi X1, X2, X3 là số ống sợi loại A, B, C bị đứt thì 
tổng số ống sợi bị đứt là Y = X1 + X2 + X3. Cần tính 
P(Y ≥ 5). Ta có: 
X1~B(1000;0,2%) X2~B(1500;0,1%) X3~B(1000;0,15%) 
Do n đủ lớn và p đủ nhỏ nên X1, X2, X3 được xấp xỉ: 
 X1 ≈ P(2) X2 ≈ P(1,5) X3 ≈ P(1,5) 
 ⇒ Y ≈ P(2) + P(1,5) + P(1,5) = P(2 + 1,5 + 1,5) = P(5) 
 ⇒ P(Y ≥ 5) = 1 − P(Y ≤ 4) ≈ 56% =1 − POISSON(4, 5, 1) 
 3.3 Tổ hợp tuyến tính các phân phối Chuẩn 
 Nếu X1~N(µ1, 21σ ), X2~N(µ2,
 2
2σ ),..., Xn~N(µn,
 2
nσ ) là 
các ĐLNN độc lập thì tổ hợp tuyến tính của chúng 
a1X1 + a2X2 +...+ anXn cũng là ĐLNN có phân phối 
Chuẩn với kỳ vọng là a1µ1 + a2µ2 +...+ anµn, phương sai 
là 2 2 2 2 2 2n1 1 2 2 2a a ... aσ + σ + + σ . Tức là: 
a1N(µ1, 21σ ) + a2N(µ2, 
 2
2σ ) +...+ anN(µn, 
 2
nσ ) 
= N(a1µ1 + a2µ2 +...+ anµn, 2 2 2 2 2 2n1 1 2 2 2a a ... aσ + σ + + σ ) 
 Ví dụ 
 Trong một nông trại, trọng lượng trung bình của 
một con gà trống là 1,5Kg với độ lệch chuẩn 100g, 
trọng lượng trung bình của một con gà mái là 1,7Kg 
với độ lệch chuẩn 200g. Được biết, trọng lượng của 
một con gà được chọn ngẫu nhiên là ĐLNN có phân 
phối Chuẩn. Một người mua 2 con gà trống và 3 con 
gà mái. Tính xác suất trọng lượng của 5 con gà này 
không vượt quá 8,5Kg. 
Gọi X1 (X2) là trọng lượng (Kg) một con gà trống 
(mái). Trọng lượng 5 con gà được mua là Y = 2X1 + 3X2. 
Cần tính P(X ≤ 8,5). 
 Theo giả thiết X1~N(1,5; 0,1
2), X2~N(1,7; 0,2
2) nên 
Y = 2X1 + 3X2 là phân phối Chuẩn với kỳ vọng và 
phương sai là: 
 µ = 2×1,5 + 3×1,7 = 8,1 
 σ2 = 22×0,12 + 32×0,22 = 2,46 
Vậy: 
 P(Y ≤ 8,5) = 0,5 + Φ(
8, 5 8, 1
2, 46
−
) = 0,5+Φ(0,25) ≈ 60% 
=NORMDIST(8, 8.1, 2.46^.5, 1) 

File đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_chuong_3_cac_phan_phoi_xac_suat.pdf