Bài giảng Thống kê sinh học - Nguyễn Thành Hiền

Chương 1

PHÂN BỐ THỰC NGHIỆM VÀ PHƢƠNG PHÁP ƢỚC LƢỢNG

CÁC THAM SỐ ĐẶC TRƢNG CỦA TỔNG THỂ (15 tiết)

Mục tiêu:

- Biết đƣợc phân bố thực nghiệm trong lâm nghiệp.

- Biết đƣợc các phƣơng pháp ƣớc lƣợng các tham số đặc trƣng của tổng thể trong lâm

nghiệp.

- Rèn luyện tƣ duy phân tích-tổng hợp, kỹ năng hợp tác nhóm và làm việc độc lập, kỹ năng

ƣớc lƣợng các tham số đặc trƣng.

1.1. Một số khái niệm

1.1.1. Tổng thể và mẫu

Trong thực tế, muốn khảo sát, nghiên cứu vấn đề gì, đầu tiên phải tiến hành thu thập số

liệu, những số liệu này chỉ là số liệu đƣợc quan sát từ một bộ phận của toàn thể đối tƣợng mà ta

cần nghiên cứu. Toàn bộ đối tƣợng cần nghiên cứu đƣợc gọi là tổng thể, số lƣợng các phần tử của

tổng thể đƣợc gọi là dung lƣợng tổng thể. Dung lƣợng tổng thể ký hiệu làN, là một số hữu hạn

hoặc vô hạn.

Mẫu là một bộ phận của tổng thể, mà trên đó ngƣời ta tiến hành điều tra, đo đếm và thu

thập tài liệu. Số lƣợng các phần tử của mẫu đƣợc gọi là dung lƣợng mẫu, dung lƣợng mẫu ký hiệu

là n, dung lƣợng mẫu là một số hữu hạn.

pdf 94 trang phuongnguyen 9740
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê sinh học - Nguyễn Thành Hiền", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Thống kê sinh học - Nguyễn Thành Hiền

Bài giảng Thống kê sinh học - Nguyễn Thành Hiền
 1 
ỦY BAN NHÂN DÂN TỈNH KON TUM 
TRƢỜNG CAO ĐẲNG CỘNG ĐỒNG 
   
 BÀI GIẢNG 
 THỐNG KÊ SINH HỌC 
Dùng cho sinh viên cao đẳng ngành lâm sinh 
(Tài liệu lƣu hành nội bộ) 
 Biên soạn : Ths. Nguyễn Thành Hiền 
 Tổ bộ môn: Lâm sinh 
Kon Tum, tháng 03/2019 
 2 
Chương 1 
PHÂN BỐ THỰC NGHIỆM VÀ PHƢƠNG PHÁP ƢỚC LƢỢNG 
CÁC THAM SỐ ĐẶC TRƢNG CỦA TỔNG THỂ (15 tiết) 
Mục tiêu: 
 - Biết đƣợc phân bố thực nghiệm trong lâm nghiệp. 
 - Biết đƣợc các phƣơng pháp ƣớc lƣợng các tham số đặc trƣng của tổng thể trong lâm 
nghiệp. 
 - Rèn luyện tƣ duy phân tích-tổng hợp, kỹ năng hợp tác nhóm và làm việc độc lập, kỹ năng 
ƣớc lƣợng các tham số đặc trƣng. 
1.1. Một số khái niệm 
1.1.1. Tổng thể và mẫu 
 Trong thực tế, muốn khảo sát, nghiên cứu vấn đề gì, đầu tiên phải tiến hành thu thập số 
liệu, những số liệu này chỉ là số liệu đƣợc quan sát từ một bộ phận của toàn thể đối tƣợng mà ta 
cần nghiên cứu. Toàn bộ đối tƣợng cần nghiên cứu đƣợc gọi là tổng thể, số lƣợng các phần tử của 
tổng thể đƣợc gọi là dung lƣợng tổng thể. Dung lƣợng tổng thể ký hiệu làN, là một số hữu hạn 
hoặc vô hạn. 
 Mẫu là một bộ phận của tổng thể, mà trên đó ngƣời ta tiến hành điều tra, đo đếm và thu 
thập tài liệu. Số lƣợng các phần tử của mẫu đƣợc gọi là dung lƣợng mẫu, dung lƣợng mẫu ký hiệu 
là n, dung lƣợng mẫu là một số hữu hạn. 
 Trong lâm nghiệp tổng thể thƣờng rất lớn, vì vậy phải dựa vào tài liệu quan sát ở mẫu rồi 
dùng công cụ toán học là lý thuyết xác suất để suy đoán cho tổng thể, làm nhƣ vậy vừa tiết kiệm, 
vừa tránh đƣợc sự phá hoại của đối tƣợng mà vẫn đảm bảo độ chính xác cần thiết. 
 Một yêu cầu quan trọng để có thể nghiên cứu bằng phƣơng pháp thống kê toán học là mẫu 
chọn phải đại biểu đƣợc cho toàn bộ tổng thể, muốn vậy việc rút mẫu phải đảm boả đƣợc tính 
chất ngẫu nhiên. 
 Để thực hiện việc chọn mẫu ngẫu nhiên, ngƣời ta thƣờng dùng các phƣơng pháp nhƣ rút 
thăm gay bảng số ngẫu nhiên. Ở phƣơng pháp rút thăm, các phần tử của tổng thể đƣợc đánh số từ 
1 đến hết (1,2,3,N), rồi dùng các thăm cũng đƣợc đánh số tƣơng tự (1,2,3.,N). Phần tử đƣợc 
quan sát, đo đếm là phần tử có số hiệu trùng với số hiệu của thăm đƣợc bốc ngẫu nhiên. Bảng số 
ngẫu nhiên là bảng gồm các con số gồm 2 hay nhiều chữ số đƣợc thiết lập một cách ngẫu nhiên từ 
10 số nguyên tự nhiên đầu tiên: 0,1,2,,9. Để thiết lập một mẫu ngẫu nhiên bằng bảng số ngẫu 
nhiên, phải đánh số các phần tử của tổng thể từ 1 đến hết, rồi dùng bảng số ngẫu nhiên để chọn 
các phần tử. Phần tử của tổng thể đƣợc quan sát, đo đếm là phần từ có số trùng với số đƣợc chọn 
ngẫu nhiên trong bảng số ngẫu nhiên. 
 3 
 Vì trong lâm nghiệp, số phần tử của tổng thể thƣờng rất lớn, nên rất khó thực hiện phƣơng 
pháp chọn mẫu này, mặc dù mẫu đƣợc chọn đảm bảo hoàn toàn ngẫu nhiên. Do vậy, phƣơng 
pháp rút mẫu thƣờng đƣợc vận dụng là phƣơng pháp chọn mẫu hệ thống sau: 
 * Phƣơng pháp chọn mẫu hệ thống theo tuyến: Toàn bộ diện tích khu vực rừng tự nhiên 
cần điều tra đƣợc kẻ thành các tuyến song song cách đều (thƣờng là 100m), trên các tuyến đặt các 
ô điều tra có diện tích và cự ly đều nhau. Giả sử khu rừng có diện tích là Sr (ha), diện tích 1 ô là 
Sô thì dung lƣợng tổng thể (số ô có thể thiết lập đƣợc) là: 
N = 
0
S
S
r (1.1) 
 Tuỳ thuộc vào dung lƣợng mẫu mà quy định cách lấy mẫu hệ thống là 1,3,5,7 hay 
1,5,10, 15 
 * Phƣơng pháp chọn mẫu hệ thống theo mắt lƣới: Khu vực rừng tự nhiên cần điều tra đƣợc 
kẻ thành các tuyến song song cách đều (thƣờng là 100 m) theo hai chiều vuông góc, tại giao điểm 
của các tuyến đặt các ô điều tra có diện tích nhƣ nhau, cũng tuỳ thuộc vào dung lƣợng mẫu quy 
định về cách lấy mẫu hệ thống thích hợp. 
 Trong phƣơng pháp chọn mẫu hệ thống, nếu phần tử đầu tiên đƣợc chọn một cách ngẫu 
nhiên thì đƣợc gọi là phƣơng pháp chọn mẫu ngẫu nhiên hệ thống. So với phƣơng pháp chọn mẫu 
ngẫu nhiên bằng rút thăm hay bảng số ngẫu nhiên thì phƣơng pháp chọn mẫu hệ thống đơn giản, 
dễ thực hiện, các phần tử đƣợc uan sát rải đều trong tổng thể, song có nhƣợc điểm là hay phụ 
thuộc vào chủ quan và cho đến nay việc tính toán sai số chƣa đƣợc xây dựng thành một lý luận 
hoàn chỉnh. 
 Ngoài ra, trong lâm nghiệp còn áp dụng phƣơng pháp chọn mẫu, ở đó mẫu đƣợc chọn từ 
các bộ phận khác nhau của tổng thể, gọi là phƣơng pháp chọn mẫu có phân khối hay phân tầng. 
Phƣơng pháp chọn mẫu này nhằm làm giảm mức độ biến động của các trị số quan sát trong cùng 
một khối, để tăng độ chính xác của kết quả ƣớc lƣợng. Trên mỗi khối, cách rút mẫu cũng có thể 
sử dụng các phƣơng pháp nhƣ: chọn mẫu ngẫu nhiên, chọn mẫu hệ thống 
1.1.2. Dấu hiệu quan sát (tiêu thức thống kê) 
 Trong thống kê toán học, ngƣời ta gọi các đặc điểm hay tính chất nào đó đƣợc quan sát, đo 
đếm là dấu hiệu quan sát hay tiêu thức thống kê. Dấu hiệu quan sát đƣợc chia ra: 
 * Dấu hiệu quan sát về lƣợng (đại lƣợng quan sát): là đại lƣợng có thể cân, đong đo, đếm 
một cách chính xác bằng các dụng cụ điều tra. Ký hiện đại lƣợng quan sát là các chữ cái in: X, Y, 
Z Nếu đại lƣợng quan sát X có thể lấy các giá trị bất kỳ trong một khoảng xác định nào đó thì 
X đƣọc gọi là đại lƣợng liên tục. Ví dụ: chiều cao cây rừng, bề dày sản phẩm, độ dài sợi nấm là 
những đại lƣợng liên tục. 
 4 
 Ngƣợc lại, nếu đại lƣợng quan sát X có thể lấy các giá trị là những số tròn đếm đƣợc thì X 
đƣợc gọi là đại lƣợng đứt quãng hay rời rạc. Ví dụ: số quả có trên một cành, số sâu có trên một 
cây, số sản phẩm đƣợc sản xuất trong 1 ca của một cỗ máy là những đại lƣợng đứt quãng. 
 * Dấu hiệu quan sát về chất: là dấu hiệu mà các phần tử phân biệt nhau bởi 1 đặc điểm hay 
tính chất nào đó. Ví dụ: hạt này mầm, không nảy mầm; cây bị bệnh, không bị bệnh; cây tốt, xấu, 
trung bình là các dấu hiệu quan sát về lƣợng, bằng cách gán cho các phần tử mang đặc điểm A 
giá trị 0 và các phần tử mang đặc điểm khác A giá trị là 1, khi đó nhận đƣợc dấu hiệu quan sát về 
lƣợng 2 giá trị 0,1 – là đại lƣợng đứt quãng. 
1.2. Phân bố thực nghiệm 
1.2.1. Khái niệm 
 Quy luật phân bố của những giá trị quan sát đƣợc ở mẫu có thể khái quát hoá thành phân 
bố lý thuyết gọi là phân bố thực nghiệm. 
 Xây dựng các phân bố thực nghiệm để khái quát hoá thành các phân bố lý thuyết là một 
trong những nhiệm vụ cơ bản của ngƣời làm công tác thống kê. 
 Vấn đề đặt ra là lam thế nào có thể phát hiện các quy luật phân bố vốn tồn tại khách quan 
trong tổng thể dựa vào tài liệ quan sát ở mẫu với một dung lƣợng hữu hạn? Để trả lời câu hỏi này, 
trong thực tế ngƣời ta thƣờng sắp xếp các trị số quan sát ở mẫu theo một trật tự nhất định, rồi 
thống kê các phần tử có cùng giá trị (đối với đại lƣợng đứt quãng) hoặc các phần tử có giá trị nằm 
trong những khoảng xác định (đối với đại lƣợng liên tục) theo kiểu kiểm phiếu bầu cử. Cách làm 
nhƣ vậy đƣợc gọi là chỉnh lý tài liệu quan sát. 
 Ví dụ 1: Lập phân bố thực nghiệm số ô theo số cây thông nhựa tái sinh tự nhiên có trong 
60 ô quan sát ở khu vực Uông Bí – Quảng Ninh sau: 
Bảng 1.1: Số cây thông tái sinh tự nhiên có trong 60 ô quan sát 
Số TTô Số cây/ô Số TTô Số cây/ô Số TTô Số cây/ô Số TTô Số cây/ô 
1 
2 
3 
4 
5 
6 
7 
8 
9 
7 
9 
8 
10 
8 
11 
3 
12 
4 
16 
17 
18 
19 
20 
21 
22 
23 
24 
7 
11 
6 
9 
13 
7 
10 
6 
12 
31 
32 
33 
34 
35 
36 
37 
38 
39 
13 
8 
8 
11 
8 
15 
8 
15 
13 
46 
47 
48 
49 
50 
51 
52 
53 
54 
9 
12 
10 
6 
11 
10 
9 
14 
11 
 5 
10 
11 
12 
13 
14 
15 
14 
5 
7 
5 
9 
12 
25 
26 
27 
28 
29 
30 
9 
14 
8 
10 
11 
9 
40 
41 
42 
43 
44 
45 
8 
10 
11 
8 
11 
10 
55 
56 
57 
58 
59 
60 
13 
7 
12 
10 
15 
10 
 Nhìn vào bảng trên, ta không thể phát hiện đƣợc quy luật phân bố số ô theo số cây thực 
nghiệm, vì vậy phải tiến hành chỉnh lý tài liệu bằng cách sắp xếp các trị số quan sát số cây có trên 
1 ô theo thứ tự từ bé đến lớn, sau đó thống kê số ô có cùng số cây theo kiểu kiểm phiếu bầu cử, 
kết quả đƣợc cho ở bảng 1.2. 
 Trên hình vẽ 1.1 là biểu đồ phân bố số ô theo số cây thông tái sinh tự nhiên ở khu vực 
Uông Bí – Quảng Ninh. Nhìn vào bảng 1.2 và biểu đồ hình 1.1, chúng ta có thể thấy ngay quy 
luật phân bố số ô theo số cây thông tái sinh tự nhiên. 
Bảng 1.2: Bảng phân bố tần số thực nghiệm số ô theo số cây 
Số cây/ô Kiểm phiếu fi Pi=fi/n 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 
13 
14 
15 
1 
1 
2 
3 
5 
7 
8 
10 
8 
5 
4 
3 
3 
0.017 
0.017 
0.034 
0.050 
0.083 
0.116 
0.133 
0.167 
0.133 
0.083 
0.167 
0.050 
0.050 
 n = 60 Pi = 1.000 
Ghi chú: fi là tần số thực nghiệm 
 Pi là tần suất thực nghiệm 
 Số cây trên ô tăng thì số ô cũng tăng theo, đạt giá trị cực đại là 10 ô với số cây trên ô là 10, 
khi số cây trên ô tăng lên nữa thì số ô sẽ giảm xuống. 
 6 
 Ví dụ 1.2: Kết quả đo bề dày của 50 sản phẩm đƣợc sản xuất từ một cỗ máy đƣợc cho ở 
bảng sau: 
Bảng 1.3: Bề dày (cm) của 50 sản phẩm được sản xuất từ một cỗ máy chế biến gỗ 
Số TT Bề dày Số TT Bề dày Số TT Bề dày Số TT Bề dày 
1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 
13 
7.75 
9.05 
7.45 
9.75 
8.10 
8.25 
8.35 
9.80 
8.65 
8.25 
6.75 
7.25 
8.75 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
9.15 
7.85 
9.35 
8.30 
8.65 
8.25 
9.25 
8.15 
7.75 
8.35 
8.85 
7.85 
8.65 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
7.95 
8.15 
8.35 
8.45 
9.05 
7.15 
8.45 
8.85 
8.65 
8.90 
8.55 
9.25 
8.55 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
8.95 
8.45 
8.65 
7.30 
9.65 
8.25 
6.25 
7.25 
7.90 
8.15 
8.65 
 Để lập đƣợc phân bố thực nghiệm số sản phẩm theo bề dày, phải tiến hành chia tổ ghép 
nhóm các trị số quan sát theo công thức kinh nghiệm của Brooks và Carruther sau: 
m=5.lg(n) (1.2) 
k = 
m
XX
minmax
 (1.3) 
 Trong đó: 
- m là số tổ đƣợc chia. 
- k là cự ly tổ. 
- Xmax, Xmin là trị số quan sát lớn nhất và bé nhất 
Từ công thức kinh nghiệm (1.2) và (1.3) dễ dàng xác định đƣợc số tổ và cự ly tổ cho ví dụ 
1.2: 
m = 5.lg50 8 tổ 
k = 
m
XX
minmax
 = 
8
25.68.9 
 = 0.5 (cm) 
 Với số tổ và cự ly mỗi tổ đã xác định, có thể lập bảng phân bố tần số thực nghiệm nhƣ sau: 
Bảng 1.4: Bảng phân bố số sản phẩm theo bề dày 
Giá trị các tổ Xi fi Pi=fi/n 
 7 
6.25-6.75 
6.75-7.25 
7.25-7.75 
7.75-8.25 
8.25-8.75 
8.75-9.25 
9.25-9.75 
9.75-10.25 
6.25 
7.00 
7.50 
8.00 
8.50 
9.00 
9.50 
10.00 
 1 
2 
5 
11 
18 
9 
3 
1 
0.02 
0.04 
0.10 
0.22 
0.36 
0.18 
0.06 
0.02 
 Trên hình vẽ 1.2 là biểu đồ phân bố số sản phẩm theo bề dày sản phẩm từ kết quả chỉnh lý 
tài liệu đo đếm 50 sản phẩm đƣợc sản xuất từ một cỗ máy. 
 Xây dựng các phân bố thực nghiệm có ý nghĩa rất lớn về mặt lý luận và thực tiễn, bằng các 
phân bố thực nghiệm ngƣời làm công tác thống kê có một hình ảnh trực quan về quy luật phân bố 
của các trị số quan sát ở mẫu, từ đó có thể dự đoán đƣợc những phƣơng pháp thống kê ứng dụng 
hay đề xuất các giải pháp kỹ thuật hợp lý tiếp theo sao cho phù hợp với đối tƣợng nghiên cứu. 
1.2.2. Các đặc trưng của phân bố thực nghiệm (đặc trưng mẫu) 
 Bảng phân bố tần số thực nghiệm cùng với biểu đồ phân bố tần số thực nghiệm cho biết 
một cách khaí quát về quy luật biến thiên của các trị số quan sát của mẫu. Tuy nhiên, trong thực 
tiễn nhiều khi chúng ta lại cần biết những số rất điển hình cho từng mặt của quy luật giến thiên 
ấy, nhữn số này gọi chung là các đặc trƣng mẫu, nhờ các đặc trƣng mẫu mà có thể đúc kết những 
tính chất bản chất nhất của dãy thống kê. Sau đây là một số đặc trƣng mẫu cơ bản. 
 1.2.2.1. Số trung bình mẫu 
 Khái niệm: Giả sử có một dãy trị số quan sát: x1, x2,. xn, thì trị số: 
 ).....(
1
21 n
xxx
n
x
n
1

n
i
i
x
1
 (1.4) 
đƣợc gọi là số trung bình mẫu giản đơn. Số trung bình mẫu giản đơn này thƣờng tính với tài liệu 
quan sát có dung lƣợng mẫu nhỏ (n<30), chƣa qua chỉnh lý. 
 Ví dụ 1.3: Tính trung bình về chiều cao cây rừng từ số liệu đo cao 10 cây sau: 
Bảng 1.5: Số liệu đo cao 10 cây rừng 
Số TT 1 2 3 4 5 6 7 8 9 10 
hi(m) 2.5 2.9 3.3 4.0 3.1 3.6 2.9 3.4 3.0 3.5 
 Chiều cao bình quân theo công thức (1.4) sẽ là: 
mh
h
h
n
i
i
22.3
10
2.32
)5.30.34.39.26.31.30.43.39.25.2(
10
11
1
 
 8 
 Trong trƣờng hợp mẫu lớn, tài liệu đã qua chỉnh lý, số trung bình mẫu đƣợc tính theo công 
thức sau: 
 x
n
1

m
i
ii
xf
1
 (1.5) 
đƣợc gọi là só bình quân gia quyền. 
 Với xi là trị số giữa tổ, fi là tần số tƣơng ứng với mỗi tổ. 
 Ví dụ 1.4: Từ tài liệu chỉnh lý phân bố số sản phẩm theo bề dày của 50 sản phẩm đƣợc sản 
xuất từ một cỗ máy chế biến (bảng 1.4), có thể tính đƣợc số bình quân gia quyền về bề dày theo 
công thức (1.5) nhƣ sau: 
 x
n
1

m
i
ii
xf
1
cmxxx 37.8)0.101.....0.725.61(
50
1
1.2.2.2. Số bình quân toàn phương 
 Khái niệm: Giả sử có 1 dãy các trị số quan sát: z1, z2,.. zn thì số bình quân: 

n
i
i
z
n
z
1
21
 (1.6) 
đƣợc gọi là số trung bình toàn phƣơng. 
 Trong lâm nghiệp, đã vận dụng số trung bình toàn phƣơng để tính đƣờng kính bình quân 
cây rừng theo công thức: 

n
i
i
d
n
d
1
21
 (1.7) 
 Ví dụ 1.5: Tính đƣờng kính bình quân toàn phƣơng của 6 cây rừng sau: 
d1=8.2 cm; d2=7.5 cm; d3=6.4 cm; d4=9.0 cm; d5=8.0 cm; d6=7.3 cm. 

n
i
i
d
n
d
1
21
)3.7...5.72.8(
6
1 222
 =7.78 cm 
 1.2.2.3. Phương sai và sai tiêu chuẩn 
 Khái niệm: Sai tiêu chuẩn mẫu là số bình quân toàn phƣơng về độ lệch giữa các giá trị 
quan sát với số trung bình mẫu của nó. Công thức hiệu đính sai tiêu chuẩn mẫu đƣợc viết nhƣ 
sau: 

n
i
i
xx
n
S
1
)(
1
1
 (1.8) 
 Để tính sai tiêu chuẩn mẫu, có thể dùng 1 trong những công thức cho hai tƣờng hợp sau: 
 * Trƣờng hợp mẫu nhỏ (n<30) 
1 
n
Q
S
x với 
n
x
xQ
i
ix

 
2
2
)(
 (1.9) 
 9 
 Ví dụ 1.6: Tính sai tiêu chuẩn về chiều cao từ số liệu đo chiều cao 10 cây rừng (Bảng 1.5) 
 Bảng 1.6 
Số TT 1 2 3 4 5 6 7 8 9 10  
hi (m) 2.5 2.9 3.3 4.0 3.1 3.6 2.9 3.4 3.0 3.5 32.2 
hi
2 
6.25 8.41 10.89 16.0 9.61 12.96 8.41 11.56 9.0 12.25 105.34 
 Từ bảng 1.6 ta tính đƣợc: đặt hi=xi và hi
2
=xi
2
n
x
xQ
i
ix

 
2
2
)(
656.1
10
2.32
34.105
2
1 
n
Q
S
x
m424.0
110
656.1
* Trong trƣờng hợp mẫu lớn (n>30), tài liệu đã qua chỉnh lý: 
1 
n
Q
S
x với 
n
xf
xfQ
ii
iix

 
2
2
)(
 (1.10) 
 Ví dụ 1.7: Từ tài liệu chỉnh lý số sản phẩm theo bề dày của 50 sản phẩm đƣợc sản xuất ở 1 
cỗ máy chế biến (ví dụ 1.2 – bảng 1.4), có thể tính đƣợc sai tiêu chuẩn về bề dầy sản phẩm bằng 
cách lập bảng tính (bảng 1.7), từ bảng 1.7 tính đƣợc: 
n
xf
xfQ
ii
iix

 
2
2
)(
905.2250
5.418
75.3525
2
1 
n
Q
S
x
cm684.0
150
905.22
 Bình phƣơng sai tiêu chuẩn mẫu đƣợc gọi là phƣơng sai mẫu, phƣơng sai mẫu ký hiệu là: 
S
2
. 
Bảng 1.7 
Xi fi Xi
2 
fi.Xi fi.Xi
2 
6.5 
7.0 
7.5 
8.0 
8.5 
9.0 
9.5 
10.0 
1 
2 
5 
11 
18 
9 
3 
1 
42.25 
44.00 
56.25 
64.00 
72.25 
81.00 
90.25 
100.00 
6.5 
14.0 
37.5 
88.0 
153.0 
81.0 
28.5 
10.0 
42.25 
98.00 
281.25 
704.00 
1300.50 
729.0 ... 5.78) 
yxxxyxx
QQQQD
12121
5
 (5.79) 
4.7.3. Kiểm tra sự tồn tại của các tham số của liên hệ tuyến tính 2 lớp 
 Trong tự nhiên và xã hội, chúng ta thƣờng gặp những liên hệ tuyến tính 2 lớp mà sự 
tham gia của X1 và X2 là khác nhau về cƣờng độ và chiều hƣớng. Nếu một tham số ai nào đó 
quá bé thì thực tế ảnh hƣởng của Xi đối với hàm y là không đáng kể và khi đó có thể bỏ đi 
đƣợc. và liên hệ tuyến tính hai lớp trở về dạng tuyến tính một lớp. Nhƣng tham số ai nhƣ thế 
nào là quá bé và loại khỏi phƣơng trình để trả lời câu hỏi này, ngƣời làm công tác thống kê 
cần phải kiểm tra sự tồn tại của chúng bằng tiêu chuẩn thống kê. 
 Ngƣời ta đã chứng minh đƣợc rằng, nếu giả thuyết H0: Ai=0 (H1: có ít nhất 1 Ai 0) thì 
đại lƣợng: 
 2,1
.
 i
CS
a
t
n
i (5.80) 
có phân bố t với k=n-3 bậc tự do. Vì vậy, nếu /t/ tính theo (5.80)>t05 tra bảng với k=n-3 bậc tự 
do thì giả thuyết H0 bị bác, các tham số ai đƣợc xem là tồn tại thực sự. Ngƣợc lại, nếu /t/ t05 
tra bảng với k=n-3 bậc tự do thì giả thuyết H0 đƣợc chấp nhận các tham số là không tồn tại. 
4.7.4. Ước lượng khoảng hệ số hồi quy 2 lớp 
 85 
 Trƣờng hợp nếu các tham số ai thực sự tồn tại thông qua việc kiểm tra bằng tiêu chuẩn 
t của Student, thì bƣớc tiếp theo là ƣớc lƣợng khoảng các tham số Ai trong tổng thể theo công 
thức: 
 1.... 2/2/ nkaiinkai CStaACStaP (5.81) 
 Trong đó: Cij là các thừa số Gauss. 
 Sˆ là sai tiêu chuẩn thừa của liên hệ tuyến tính 2 lớp. 
 Để phân tích mối liên hệ tuyến tính hai lớp, lập bảng tính sau: 
Bảng 5.9: Bảng tính các tham số a0, a1 và a2 của liên hệ tuyến tính 2 lớp 
x1 x2 y x1
2 
x2
2
 y
2
 x1.x2 x1y x2y 
Công thức kiểm tra 
z=x1+x2+y z
2 
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) 
 x1  x2  y  x1
2
  x2
2
  y2  x1.x2  x1y  x2y z z
2 
Công thức kiểm tra: 
  x1
2
+ x2
2
+ y2+2 x1.x2+2 x1y+2 x2y=z
2
 (5.82) 
 Ví dụ 5.6: Để thăm dò phƣơng hƣớng lập biểu thể tích cho Thông nhựa và Thông đuôi 
ngựa ở vùng Đông Bắc, Bộ môn Điều tra quy hoạch, trƣờng ĐHLN đã nghiên cứu mối quan 
hệ giữa thể tích với các nhân tố điều tra cấu thành thể tích là chiều cao vút ngọn và đƣờng 
kính ngang ngực cây rừng, dạng: 
2
13210
HDaHaaV (5.82) 
 Số liệu đo đếm thể tích (V), chiều cao (H) và đƣờng kính ngang ngực (D1.3) của 15 cây 
thông mã vĩ tuổi 30 đƣợc cho ở bảng 5.10. 
 Nếu đặt Vy ˆ , x1=H và x2=H.D1.3
2
 thì phƣơng trình (5.82) trở về dạng liên hệ tuyến 
tính 2 lớp: 
22110
ˆ xaxaay 
 86 
Bảng 5.10 Bảng tính tương quan tuyến tính 2 lớp V=a0+a1.H+a2.H.D1.3
2
TT x1(m) x2(m
3
) y(m
3
) x1
2
 x2
2
 y
2
 x1.y x2.y x1.x2 
Cột kiểm tra 
z=x1+x2+y z2 
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) 
1 15.50 1.063982 0.307615 240.250000 1.132058 0.094627 4.768033 0.327297 16.491721 16.871597 284.650785 
2 15.80 1.741539 0.014712 249.640000 3.032958 0.000216 0.232450 0.025622 27.516316 17.556251 308.221949 
3 13.30 0.575411 0.197229 176.890000 0.331098 0.038899 2.623146 0.113488 7.652966 14.072640 198.039197 
4 15.50 0.670592 0.271170 240.250000 0.449694 0.073533 4.203135 0.181844 10.394176 16.441762 270.331538 
5 13.45 0.563236 0.249691 180.902500 0.317235 0.062346 3.358344 0.140635 7.575524 14.262927 203.431087 
6 11.60 0.426220 0.178234 134.560000 0.181663 0.031767 2.067514 0.075967 4.944152 12.204454 148.948697 
7 15.00 1.029660 0.341156 225.000000 1.060200 0.116387 5.117340 0.351275 15.444900 16.370816 268.003617 
8 14.90 0.601974 0.163095 222.010000 0.362373 0.026600 2.430116 0.098179 8.969413 15.665069 245.394387 
9 12.65 0.331986 0.147716 160.022500 0.110215 0.021820 1.868607 0.049040 4.199623 13.129702 172.389075 
10 13.36 0.513238 0.186912 178.489600 0.263413 0.034936 2.497144 0.095930 6.856860 14.060150 197.687818 
11 13.10 0.503250 0.187641 171.610000 0.253261 0.035209 2.458097 0.094430 6.592575 13.790891 190.188675 
12 14.75 0.807651 0.333528 217.562500 0.652300 0.111241 4.919538 0.269374 11.912852 15.891179 252.529570 
13 14.40 1.081094 0.424224 207.360000 1.168764 0.179966 6.108826 0.458626 15.567754 15.905318 252.979141 
14 15.70 0.685792 0.286445 246.490000 0.470311 0.082051 4.497187 0.196442 10.766934 16.672237 277.963487 
15 13.20 0.650545 0.256416 174.240000 0.423209 0.065749 3.384691 0.166810 8.587194 14.106961 199.006349 
 212.21 11.246170 3.545784 3025.277100 10.208750 0.975348 50.534167 2.644958 163.472960 3469.765369 
 87 
Từ bảng 5.10 tính đƣợc: 
Tính các tổng biến động và thừa số Gauss: 
199219.0
908833.21
364677.4
053068.1
908833.21
071494.23
081032.0
908833.21
775318.1
163523.5361481.1364677.4481371.0071494.23
316033.0481371.0304677.4361481.1775318.1
917531.2361481.1206799.0071494.23
135416.0481371.0206799.0775318.1
908833.21364677.4775318.1071494.23
364677.4
15
249572.1121.212
510121.163
481371.0
15
145244.4249572.11
690185.3
361481.1
15
145244.421.212
005629.60
206799.0
15
145244.4
352335.1
775318.1
15
249572.11
212182.10
071494.23
15
21.212
2771.3025
12
22
11
5
4
2
3
2
2
2
1
2
2
2
21
2
1
2
1
C
C
C
D
D
D
D
D
Q
Q
Q
Q
Q
Q
xx
yx
yx
y
x
x
Kiểm tra việc tính toán theo hệ phƣơng trình (5.61): 
 1364677.4199219.0071494.23081032.0..
211
1211
xxz
QCQC 
1775318.1053068.1364677.4199219.0..
0364677.4053068.1071494.23199219.0..
0775318.1199219.0364677.4081032.0..
221
211
221
2221
2221
1211
xxx
xxx
xxx
QCQC
QCQC
QCQC
* Xác định các tham số a0, a1 và a2 của liên hệ tuyến tính 2 lớp: 
22110
1
5
2
1
4
1
2356.0
908833.23
163523.5
0144.0
908833.23
316033.0
xaxaya
D
D
a
D
D
a
 88 
Trong đó: 
276349.0
15
145244.4
749971.0
15
249572.11
14.14
15
21.212
2
2
1
1



n
y
y
n
x
x
n
x
x
 a0=0.276349-0.0144 14.14-0.2356 0.749971= -0.10396 
 Vậy phƣơng trình hồi quy tuyến tính 2 lớp biểu thị mối quan hệ giữa thể tích với đƣờng 
kính và chiều cao cây rừng có dạng: 
21
.2356.0.0144.010396.0ˆ xxy 
 Hay: 
2
3.1
..2356.0.0144.010396.0 DHHH 
* Tính phƣơng sai thừa: 
 Phƣơng sai thừa 2Sˆ đƣợc tính theo công thức (5.57) 
0835.0006982.0ˆ
006982.0
315
481371.02356.0361481.10144.0206799.0
3
ˆ 21 212
S
n
QaQaQ
S
yxyxy
* Kiểm tra sự tồn tịa của các tham số a1 và a2: 
 Với giả thuyết: H0: A1=0 và A2 =0 
 H1: A1 0 và A2 0 
 Giả thuyết H0 đƣợc kiểm tra theo tiêu chuản t của Student. 
 Với tham số a1: 
 607.0
081032.0.0835.0
0144.0
.
11
1
1
CS
a
t
a
 Với tham số a2: 
 76.2
053068.1.0835.0
2356.0
.
22
2
2
CS
a
t
a
 Vì 
1
a
t =0.607< t05 tra bảng với K=12 bằng 2.18 nên tham số a1 không tồn tại, ngƣợc lại vì 
2
a
t =2.76> t05 với K=12 bằng 2.17 nên tham số a2 là thực sự tồn tại. Nhƣ vậy, nếu muốn đơn giản 
phƣơng trình hồi quy tuyến tính hai lứop trong sử dụng và yêu cầu độ chính xác không cao thì có 
thể gạt biến X1 ra khỏi phƣơng tình, khi đó phƣơng trình hồi quy biểu thị mối quan hệ giữa thể 
tích với chiều cao và đƣờng kính ngang ngực cây rừng có dạng tuyến tính một lớp: 
2
3.120
.. DHaaV Hay 
2
3.1
.2356.010396.0 DHV 
 Nhƣng nếu muốn biểu có độ chính xác cao thì có thể cứ giữ biến X1 ở lại phƣơng trình mà 
cũng không có ảnh hƣởng gì đến kết quả nghiên cứu. 
* Tính hệ số tƣơng quan kép và kiểm tra sự tồn tại của hệ số tƣơng quan kép: 
77.0
206799.0
083783.0.315
1
ˆ3
1
2
y
Q
Sn
R 
 Trong quan giữa thể tích với các nhân tố điều tra cấu thành là chặt chẽ. 
 89 
 Để kiểm tra sự tồn tại của hệ số tƣơng quan kép, dùng tiêu chuẩn F của Fisher với giả 
thuyết: H0: R0=0 
 H1: R0 0 
 98.7
2
315
.
77.01
77.0
2
3
.
1
2
2
2
2
n
R
R
F 
 Vì F tính =7.98>F05(K1=2,K2=12)=2.88 nên giả thuyết H0 bị bác bỏ, hệ số tƣơng quan kép 
giữa thể tích với đƣờng kính và chiều cao cây rừng dạng tuyến tính hai lớp là khác 0. 
* Ƣớc lƣợng khoảng các tham số của phƣơng trình hồi quy hai lớp: 
 Với tham số A1: 
 1.ˆ..ˆ. 222/12222/1 CStaACStaP kk 
 1.085.018.22356.0.085.018.22356.0
22222
CACP 
 95.04224.00488.0
95.01868.02356.01868.02356.0
2
2
AP
AP
4.8. Liên hệ phi tuyến tính 
 Trong Lâm nghiệp, ngoài những liên hệ tuyến tính (1 lớp, 2 lớp và K lớp) nhƣ đã trình 
bày ở trên, ngƣời làm công tác thống kê còn gặp nhiều dạng liên hệ giữa các đại lƣợng không 
phải là tuyến tính. Ví dụ: 
 * Liên hệ giữa chiều cao vút ngọn (Hvn) và đƣờng kính ngang ngực cây rừng có thể tồn tại 
ở các dạng: 
...
86.5
85.5.
84.5.
83.5lg.
2
3.123.110
3.1
DaDaaH
bKH
DKH
DbaH
D
b
 * Liên hệ giữa chiều cao tầng trội (h0) với tuổi cây (A): 
 87.5.
2
1
.
0
C
AC
emh
Trong đó: m là giá trị cực đại của đại lƣợng điều tra. 
 C1, C2 là các tham số. 
 * Liên hệ giữa suất tăng trƣởng thể tích cây rừng (Pv) với tuổi cây (A): 
 88.5. .
1
2
AC
v
eCP
Trong đó: A là tuổi cây. 
 * Liên hệ giữa dòng chảy mặt hoặc lƣợng đất xói mòn (Y) với lƣợng mƣa hay cƣờng độ 
mƣa (X): 
 89.5.
b
XaY 
 Những liên hệ trên đƣợc gọi là liên hệ phi tuyến tính, khi phân tích mối liên hệ phi tuyến 
tính giữa hai đại lƣợng X và Y, trƣớc hết phải chuyển các liên hệ phi tuyến về dạng tuyến tính, ví 
dụ: 
 1. Dạng hàm mũ đơn: 
 ....,.,.,.
.
1
2 bAC
v
Db
XaYeCPbKhDKh 
 Để chuyển các hàm mũ trên về dạng tuyến tính, logarit hoá hai vế, chẳng hạn: 
 90 
DbKh
KKh
b
lglglg
.
 Đặt: 
xD
aK
yh
lg
lg
ˆlg
Sẽ nhận đƣợc phƣơng trình hồi quy tuyến tính 1 lớp: 
 bxay ˆ 
Tƣơng tự, hàm phi tuyến AC
v
eCP
.
1
2.
 bằng cách logarit hoá 2 vế: 
 ACCP
v
.lnln
21
 Đặt: 
xA
bC
aC
yP
v
2
1
ln
ˆln
Nhận đƣợc phƣơng trình hồi quy tuyến tính 1 lớp: 
 bxay ˆ 
 2. Dạng hàm mũ kép: 
2
1
.
0
.
C
AC
emh
Logarit hoá hai vế: 
 2.ln
1
0
C
AC
h
m 
Logarit hoá lần thứ 2: 
 ACC
h
m
lnlnlnln
21
0
Đặt: 
xA
bC
aC
y
h
m
ln
ln
ˆlnln
2
1
0
Nhận đƣợc phƣơng trình hồi quy tuyến tính 1 lớp: 
 bxay ˆ 
 3. Dạng hàm Parabon.ví dụ: 
2
3.123.110
DaDaaH 
 Đặt: 
i
i
xX hay 
13.1
xD và 
2
2
3.1
xD , yH ˆ nhận đƣợc phƣơng trình hồi quy tuyến 
tính 2 lớp: 
22110
ˆ xaxaay 
 4. Dạng hàm tích của nhiều biến số, ví dụ: cb hdKV .. , đối với dạng hàm này, 
logarit hoá 2 vế: 
 91 
 hcdbKV lg.lg.lglg 
 Đặt: 
2
1
lg
lg
lg
ˆlg
xh
xd
aK
yV
Nhận đƣợc phƣơng trình hồi quy tuyến tính 2 lớp: 
21
ˆ cxbxay 
 Nhƣ vậy, bằng cách này hay cách khác, ngƣời làm công tác thống kê nhìn 
chung đều có thể chuyển các liên hệ phi tuyến về dạng tuyến tính. 
 Sau khi đã chuyển các liên hệ phi tuyến về dạng tuyến tính 1 lớp hay nhiều 
lớp, trình tự các bƣớc phân tích mối liên hệ giữa các đại lƣợng cũng tƣơng tự nhƣ 
đối với liên hệ tuyến tính, chỉ khác là chỉ tiêu thống kê biểu thị mức độ liên hệ (r, 
R) giữa các đại lƣợng trong trƣờng hợp này là giữa các đại lƣợng sau khi biến đổi, 
hơn nữa, sau khi xác định đƣợc các tham số của phƣơng trình hồi quy tuyến tính, 
cũng cần phải tiến hành biến đổi để chuyển về biến số thực để viết phƣơng trình 
hồi quy phi tuyến chính tắc. 
 Ví dụ 5.7: Trong công trình nghiên cứu của TS Nguyễn Ngọc Lung về qy 
hoạch thiết kế lƣu vực phòng hộ xây dựng rừng phòng hộ đầu nguồn nƣớc, rừng 
chống gió bão ven biển đã thử nghiệm mối quan hệ giữa xói mòn đất (kg/ha) với 
dòng chảy mặt (m3/ha) dạng y=a.xb. Số liệu thực nghiệm đƣợc cho ở bảng 5.11. 
Bảng 5.11: Phân bố xói mòn đất (kg/ha) và dòng chảy mặt (m3/ha) trong các tháng 
mùa mưa năm 1993 ở ô rừng tự nhiên 3 tầng, độ che phủ 70-80% 
Tháng 
Đại lƣợng 
Tháng 
4+5+6 
Tháng 
7 
Tháng 
8 
Tháng 
9 
Tháng 
10 
Tháng 
11 
Tháng 
12 
Xói mòn đất 
(kg/ha) 
7.7 183.3 19.5 66.8 449.5 520.3 28.7 
Dòng chảy măt 
(m
3
/ha) 
2.1 38.6 5.9 18.0 67.4 75.0 13.6 
 Trình tự các bƣớc phân tích mối liên hệ giữa xói mòn đất và dòng chảy mặt 
nhƣ sau: 
1. Tuyến tính hoá phương trình phi tuyến 
 Ta có: y=a.x
b
 bằng cách logarit hoá 2 vế: 
 xbay lg.lglg 
 Đặt: 
xx
a
yy
ˆlg
lg
ˆlg
Nhận đƣợc phƣơng trình hồi quy tuyến tính 1 lớp: 
 bxay ˆ 
2. Lập bảng tính 
 92 
Bảng 5.12: Bảng tính tương quan y=a.xb 
X Y Xˆ (lgx) Yˆ (lgy) 2Xˆ 2Yˆ YX ˆ.ˆ Yll 
2.1 7.7 0.3222193 0.8864907 0.1038253 0.7858658 0.2856444 5.544294 
38.6 183.3 1.5865873 2.2631625 2.5172593 5.1219043 3.5907048 187.76088 
5.9 19.5 0.770852 1.2900346 0.5942128 1.6641893 0.9944258 19.348485 
18 66.8 1.2552725 1.8247765 1.5757091 3.3298091 2.2905917 74.60146 
67.4 449.5 1.8286599 2.6527297 3.343997 7.0369748 4.8509404 368.54348 
75 520.3 1.8750613 2.7162538 3.5158547 7.3780348 5.0931423 419.40128 
13.6 28.7 1.1335389 1.4578819 1.2849105 2.1254196 1.6525659 53.144931 
Tổng 8.7721912 13.09133 12.935769 27.442198 18.758015 
3. Tính các tổng biến động 
352.2
7
092.13773.8
760.18
ˆˆ
ˆˆ
957.2
7
092.13
443.27
ˆ
ˆ
944.1
7
773.8
939.12
ˆ
ˆ
ˆˆ
2
2
2
ˆ
2
2
2
ˆ






n
yx
yxQ
n
y
yQ
n
x
xQ
yx
y
x
4. Xác định mức độ liên hệ 
 98.0
398.2
352.2
957.2944.1
352.2
ˆˆ
ˆˆ
yx
yx
QQ
Q
r 
Nhƣ vậy, quan hệ giữa hai đại lƣợng X và Y là rất chặt chẽ. 
5. Xác định các tham số của phương trình hồi quy và lập phương trình chính tắc 
35.0
516.187.1
7
773.8
2099.1
7
092.13ˆ
.
ˆ
.
2099.1
944.1
352.2
ˆ
ˆˆ

n
x
b
n
y
xby
Q
Q
b
x
yx
Phƣơng trình hồi quy có dạng: 
 xy ˆ.2099.1354.0ˆ 
vì: lg(a)= nên a=10 =100.354=2.2594 
 Phƣơng trình chính tắc biểu thị mối quan hệ giữa lƣợng xói mòn và dòng chảy mặt có 
dạng: 
 2099.12594.2 xy 
6. Kiểm tra sự tồn tại của các tham số 
 Đặt giả thuyết: H0: A = 0 và B = 0 
 H1: A 0 và B 0 
 Với tham số a: 
 93 
a
a
S
a
t Trong đó: Sa = 
x
nQ
x
S

2
.ˆ 

2
.
ˆ x
Qn
S
a
t
x
a
2
.ˆ
2
n
QbQ
S
xy
 149.0
27
944.12099.1957.2
ˆ
2
 S 
 145.0
944.17
939.12
149.0 
a
S 
Vậy: 
44.2
145.0
354.0
a
a
S
a
t 
Với tham số b: 
b
b
S
b
t Trong đó 
x
b
Q
SS
1
 107.0
944.1
1
149.0 
b
S 
Vậy: 
 307.11
107.0
2099.1
b
b
S
b
t 
Vì /ta/ = 2.44 t05(k=5) nên tham số A trong tổng thể không tồn tại, 
ngƣợc lại tham số B là thực sự tồn tại. 
7. Ước lượng các tham số A và B trong tổng thể. 
Do chỉ có tham số B thực sự tồn tại trong tổng thể vì vậy chúng ta chỉ ƣớc lƣợng khoảng 
cho tham số B mà thôi: 
Với tham số B: P (b - ta/2/(K).Sb < B < b + t /2(K).Sb) = 1 - 
Thay số: 
 P (1.2099 - 2.57 0.107< B <1.2099 + 2.57 0.107) = 0,95 
P (0.9349 < B 1.4849) = 0,95 
Chúng ta tin tới mức 95% rằng tham số B tổng thể nằm trong khoảng 0.9349 đến 1.4849. 
 94 
8. Tính trị số lý luận của phương trình và vẽ biểu đồ tương quan 
Từ phƣơng trình tƣơng quan đã thiết lập, có thể tính đƣợc lƣợng xối mòn lý thuyết ứng 
với các giá trị tƣơng ứng của dòng chảy mặt. 
Bảng 5.13: Bảng tính lượng xói mòn lý thuyết (kg/ha) 
Dòng chảy mặt 
(m
3
/ha) 
2.1 5.9 13.6 18 38.6 67.4 75 
Xói mòn đất TN 
(kg/ha) 
7.7 19.5 28.7 66.8 183.3 449.5 520.3 
Xói mòn đất LT 
(kg/ha) 
5.5443 19.3485 53.1449 74.6015 187.7609 368.5435 419.4013 
 Từ kết quả bảng 5.13 vẽ biểu đồ tƣơng quan giữa lƣợng xói mòn với dòng chảy mặt trên 
hình 5.6: 
Hình 5.6: Biểu đồ tương quan lượng xói mòn đất và dòng chảy mặt 
0
100
200
300
400
500
600
0 20 40 60 80
Y thùc tÕ
Y lý thuyÕt
X(m3/ha) 
Y(kg/ha) 

File đính kèm:

  • pdfbai_giang_thong_ke_sinh_hoc_nguyen_thanh_hien.pdf