Bài giảng Lý thuyết xác suất và thống kê toán - Chương 6: Tổng thể và mẫu

THỐNG KÊ TOÁN

CHƯƠNG 6

Tổng thể và mẫu

1. Tổng thể và các số đặc trưng

Một đợt thi tuyển sinh có 50.000 thí sinh tham

dự. Ta quan tâm đến điểm thi môn Toán của mỗi thí

sinh.

Trên đây là một ví dụ về tổng thể. Lượng thí

sinh gọi là kích thước tổng thể, ký hiệu N. Điểm

thi môn Toán là dấu hiệu quan tâm, ký hiệu X*.

Gọi X là giá trị của dấu hiệu X* (được đo hoặc

được lượng hoá) tại một phần tử của tổng thể được

chọn ngẫu nhiên thì X là ĐLNN

 

pdf 15 trang phuongnguyen 4720
Bạn đang xem tài liệu "Bài giảng Lý thuyết xác suất và thống kê toán - Chương 6: Tổng thể và mẫu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Lý thuyết xác suất và thống kê toán - Chương 6: Tổng thể và mẫu

Bài giảng Lý thuyết xác suất và thống kê toán - Chương 6: Tổng thể và mẫu
 THỐNG KÊ TOÁN 
CHƯƠNG 6 
Tổng thể và mẫu 
1. Tổng thể và các số đặc trưng 
 Một đợt thi tuyển sinh có 50.000 thí sinh tham 
dự. Ta quan tâm đến điểm thi môn Toán của mỗi thí 
sinh. 
 Trên đây là một ví dụ về tổng thể. Lượng thí 
sinh gọi là kích thước tổng thể, ký hiệu N. Điểm 
thi môn Toán là dấu hiệu quan tâm, ký hiệu X*. 
 Gọi X là giá trị của dấu hiệu X* (được đo hoặc 
được lượng hoá) tại một phần tử của tổng thể được 
chọn ngẫu nhiên thì X là ĐLNN. Kỳ vọng, phương 
 sai, độ lệch chuẩn của ĐLNN này gọi là trung bình 
tổng thể (µ), phương sai tổng thể (σ2), độ lệch 
chuẩn tổng thể (σ). 
 Nếu quy định thêm một chỉ tiêu, chẳng hạn 
trong ví dụ trên chỉ tiêu đạt môn Toán là từ 5 điểm 
trở lên, gọi M là số phần tử của tổng thể đạt chỉ tiêu 
này thì p = M/N gọi là tỷ lệ tổng thể. 
 µ, σ2, σ, p là các số đặc trưng của tổng thể. 
 2. Mẫu 
2.1 Khái niệm mẫu 
2.1.1 Mẫu ngẫu nhiên 
 Vì nhiều lý do, không thể có số liệu tổng thể, 
vậy các số đặc trưng của tổng thể là không biết được. 
 Lấy n phần tử tổng thể (có hoàn lại) ta được n 
ĐLNN X1, X2,... Xn độc lập có cùng phân phối với 
ĐLNN của tổng thể. Ta gọi đây là một mẫu ngẫu 
nhiên kích thước n, ký hiệu WX(X1, X2, ..., Xn). 
 Từ n ĐLNN X1, X2, ..., Xn ta thành lập các 
ĐLNN đặc trưng mẫu: 
 Trung bình mẫu ngẫu nhiên: X = 
n
i
i 1
1
X
n =
∑ 
 Phương sai mẫu ngẫu nhiên (hiệu chỉnh): 
S2 = ( )
n 2
i
i 1
1
X X
n 1 =
−
− ∑ 
 Độ lệch chuẩn mẫu ngẫu nhiên: S = 2S 
 Tỷ lệ mẫu ngẫu nhiên: F = 
n
i
i 1
1
Y
n =
∑ 
 Yi là ĐLNN bằng 1 nếu phần tử thứ i được chọn 
vào mẫu đạt chỉ tiêu và bằng 0 nếu không đạt. 
 2.1.2 Mẫu cụ thể 
 Từ WX(X1, X2, ..., Xn), lấy số đo cụ thể của X1, X2, 
..., Xn là x1, x2, ..., xn, ta được một mẫu cụ thể kích 
thước n, ký hiệu WX(x1, x2, ..., xn). 
 Các số đặc trưng của mẫu cụ thể: 
Trung bình mẫu: x = 
n
i
i 1
1
x
n =
∑ 
Phương sai mẫu (hiệu chỉnh): 
 s2 = ( )
n
2
i
i 1
1
x x
n 1 =
−
− ∑ 
Độ lệch chuẩn mẫu: s = 2s 
Tỷ lệ mẫu: f = T
n
n
 nT: số ph.tử (mẫu) đạt chỉ tiêu. 
 2.2 Các dạng số liệu của mẫu cụ thể 
 Trong thực tế, số liệu của mẫu cụ thể được trình 
bày dưới nhiều dạng khác nhau và ta sẽ dùng các 
công thức thích hợp để tính các số đặc trưng mẫu. 
2.2.1 Số liệu dạng điểm không có tần số 
 Số liệu là dãy gồm các giá trị xi. Công thức: 
x = 
n
i
i 1
1 x
n =
∑ s2 = 
2n n
2
i i
i 1 i 1
1 1x x
n 1 n= =
   −    −   
∑ ∑ 
Excel 
n ≤ 30, x1, x2,... ,xn ghi trong miền M thì: 
 x =AVERAGE(M) s2 =VAR(M) s =STDEV(M) 
 Ghi chú 
 Có thể xem “điểm không tần số” là “điểm có tần 
số bằng 1”. 
Ví dụ 
 Chi phí hoạt động hàng tháng (triệu đồng) của 
một doanh nghiệp trong năm 2012: 
100, 106, 60, 160, 70, 170, 140, 120, 116, 120, 140, 150 
 Tính trung bình mẫu và phương sai mẫu. 
 2.2.2 Số liệu dạng điểm có tần số 
 Số liệu là dãy x1, x2, ...xk ứng với các tần số n1, 
n2, ...nk. Ta dùng công thức: 
n = 
k
i
i 1
n
=
∑ x = 
k
i i
i 1
1 n x
n =
∑ 
s2 = 
2k k
2
i i i i
i 1 i 1
1 1n x n x
n 1 n= =
   −    −   
∑ ∑ 
 Ví dụ 
Điều tra về số xe bán được trong ngày của một số đại 
lý chọn ngẫu nhiên ta có bảng số liệu sau: 
Số xe bán được 1 2 3 4 5 6 
Số đại lý 15 12 9 5 3 1 
Tính trung bình mẫu, phương sai mẫu. 
 n = 45 x = 107/45 ≈ 2,38 s2 ≈ 1,83 
 2.2.3 Số liệu dạng khoảng có tần số 
 Số liệu gồm k khoảng dạng [ai, bi) hoặc (ai, bi] và 
tần số tương ứng n1, n2, , nk. 
 Thay mỗi khoảng bởi giá trị trung tâm của 
khoảng là xi = i i
a b
2
+
 thì có được số liệu dạng điểm 
có tần số. Lúc này có thể tính các số đặc trưng mẫu 
theo cách đã biết. 
 Ví dụ 
 Điều tra về thu nhập năm 2005 (triệu đồng) của 
một số nhân viên ngân hàng AĐ ta có bảng: 
Thu 
nhập 
Số 
NV 
 Thu nhập 
Số 
NV 
Thu 
nhập 
Số 
NV 
80–85 9 95–100 36 110–115 16 
85–90 12 100–105 25 115–120 10 
90–95 24 105–110 20 120–130 8 
 n = 60 x = 101,3125 s2 = 111,7885 
 1.3.4 Số liệu dạng bảng hai chiều 
 Khi quan tâm và đo cùng lúc hai thuộc tính của 
các phần tử thuộc mẫu ta có ĐLNN hai chiều (X, Y). 
Lúc này tại mỗi phần tử của một mẫu cụ thể sẽ có 
hai giá trị xi và yj. 
 Bảng số liệu hai chiều có tần số liệt kê các giá 
trị của xi, của yj và tần số nij cho biết số lần xuất 
hiện của cặp (xi, yj) trong mẫu cụ thể: 
X Y y1 y2 ... yh 
x1 n11 n12 ... n1h 
x2 n21 n22 ... n2h 
... ... ... ... ... 
xk nk1 nk2 ... nkh 
 Từ bảng này, cộng tần số theo dòng (cột) ta có 
bảng phân phối thực nghiệm theo X (Y). Lấy tần số 
theo cột j (dòng i) ta có bảng tần số thực nghiệm 
theo X (Y) với điều kiện Y = yj (X = xi). 
 Từ các bảng phân phối theo thực nghiệm, ta 
tính trung bình mẫu, phương sai mẫu theo công thức 
số liệu dạng điểm có tần số. Các ký hiệu sau: 
 * Trung bình mẫu, phương sai mẫu của X: x , 2Xs . 
 * Trung bình mẫu, phương sai mẫu của Y: y , 2Ys . 
 * Trung bình mẫu, phương sai mẫu của X với 
điều kiện Y=yj: j/ yx , 
 j
2
X / y
s . 
 * Trung bình mẫu, phương sai mẫu của Y với 
điều kiện X=xi: i/ xy , 
 i
2
Y / x
s . 
 Ví dụ 
Khảo sát về tỷ lệ thu nhập chi cho giáo dục (%) và 
thu nhập bình quân đầu người (triệu đồng/tháng) của 
400 hộ gia đình ta có bảng: 
 Chi Giáo dục 
Thu nhập 
10 20 30 40 50 
1–3 10 40 20 
3–7 40 60 20 
7–11 20 80 40 
11–17 30 30 10 
Ta muốn tính: trung bình tỷ lệ thu nhập chi cho giáo 
dục, thu nhập bình quân đầu người, trung bình và độ 
lệch chuẩn thu nhập bình quân đầu người của những 
hộ chi 30% thu nhập cho giáo dục. 
 Gọi X là tỷ lệ thu nhập chi cho giáo dục, Y là 
thu nhập bình quân đầu người. 
⇒ x = 7,45 
 ⇒ y = 29,75 
⇒ /30x = 7,79 
2
X / 30s =12,76 X / 30s =3,57 
Trung bình tỷ lệ thu 
nhập chi cho GD là 7,45%, TN bình quân 1 người là 
29,75 triệu/tháng, TN bình quân 1 người (30%) là 
7,79 triệu/tháng, độ lệch chuẩn là 3,57. 
ai − bi 1–3 3–7 7–11 11–17 Σ 
xi 2 5 9 14 
ni 70 120 140 70 400 
yj 10 20 30 40 50 Σ 
nj 10 100 190 90 10 400 
ai − bi 1–3 3–7 7–11 11–17 Σ 
xi /30 2 5 9 14 
ni /30 20 60 80 30 190 

File đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_chuong_6_tong.pdf