Bài giảng Phân tích dữ liệu - Chương 8: Hồi quy tuyến tính - Nguyễn Thống
HÂN TÍCH DỮ LIỆU
Chương 8: Hồi quy tuyến tính
Để có thể biểu diễn hồi quy CÓ
NGHĨA Các biến phải có tính
NHÂN QUẢ (có ý nghĩa liên quan
kinh tế, xã hội, vật lý, ).
Lưu ý, phân tích phương sai dùng
xem xét quan hệ biến giữa biến giải
thích dạng ĐỊNH TÍNH & biến cần
được giải thích dạng ĐỊNH LƯỢNG
Bạn đang xem tài liệu "Bài giảng Phân tích dữ liệu - Chương 8: Hồi quy tuyến tính - Nguyễn Thống", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Phân tích dữ liệu - Chương 8: Hồi quy tuyến tính - Nguyễn Thống
1PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 1 TRƯỜNG ĐẠI HỌC BÁ H KHOA TP. HCM Khoa KTXD - Bộ môn KTTNN Giảng viên: PGS. TS. NGUYỄN THỐNG E-mail: nguyenthong@hcmut.edu.vn or nthong56@yahoo.fr Web: Tél. (08) 38 691 592- 098 99 66 719 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính NỘI DUNG MÔN HỌC Chương 1. Thống kê mô tả (ôn). Chương 1bis. Xác suất & phân phối thống kê (ôn).. Chương 2. Khoảng tin cậy. Chương 3. Kiểm định thống kê. Chương 4. Phân loại dữ liệu (Classification). Chương 5. Phân nhóm dữ liệu (Cluster). Chương 6. Phân tích thành phần chính (PCA). Chương 7. Phân tích chuỗi thời gian. Chương 8. Hồi quy tuyến tính. Chương 9. Xử lý số liệu thực nghiệm. Chương 10. Giới thiệu phần mềm SPSS or R PGS. TS. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 3 GIỚI THIỆU HỒI QUY Đây là phương pháp nghiên cứu (định lượng) nhằm giải thích một biến ĐỊNH LƯỢNG nhờ vào 1 hoặc nhiều biến ĐỊNH LƯỢNG dưới dạng một phương trình toán học. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 4 Để có thể biểu diễn hồi quy CÓ NGHĨA Các biến phải có tính NHÂN QUẢ (có ý nghĩa liên quan kinh tế, xã hội, vật lý,). Lưu ý, phân tích phương sai dùng xem xét quan hệ biến giữa biến giải thích dạng ĐỊNH TÍNH & biến cần được giải thích dạng ĐỊNH LƯỢNG. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 5 TỔNG QUÁT HỒI QUY TUYẾN TÍNH HỒI QUY PHI TUYẾN PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 6 PGS. Dr. Nguyễn Thống X Y Y X 0 0 0 X1 X2 Y HỒI QUY ĐƠN TUYẾN TÍNH (đường thẳng) HỒI QUY ĐƠN PHI TUYẾN HỒI QUY BỘI (mặt phẳng or siêu mặt phẳng) 2PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 7 HỒI QUY TUYẾN TÍNH Hồi quy tuyến tính đơn Hồi quy tuyến tính bội PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 8 HỒI QUY TUYẾN TÍNH ĐƠN PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 9 X Y 0 Xi Yi di PGS. Dr. Nguyễn Thống Ñöôøng thaúng hoài quy ñôn HỒI QUY TUYẾN TÍNH ĐƠN THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 10 TãM T¾T Lý THUYÕT M« h×nh ®îc m« t¶ bëi ph¬ng tr×nh tuyÕn tÝnh cã d¹ng sau: t=1 N (sè lîng quan tr¾c) yt gi¸ biÕn cÇn nghiªn cøu t¹i thêi ®iÓm t, xi,t gi¸ trÞ biÕn gi¶i thÝch thø i t¹i thêi ®iÓm t. N sè lîng quan tr¾c c¸c biÕn. a0, a1 : tham sè m« h×nh sÏ ®îc x¸c ®Þnh tõ sè liÖu quan s¸t t: sai soá cuûa moâ hình. PGS. Dr. Nguyễn Thống tt,110t Xaay PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 11 PHƯƠNG TRÌNH HỒI QUY TUYẾN TÍNH ĐƠN 0 X Y t1 t2 t3 t4 t5 tI tN Y0 Xu theá tuyeán tính Y=a 0 +a 1 X ΔY3 PGS. Dr. Nguyễn Thống ? ? ? ΔY4 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 12 Gọi yi là khoảng cách thẳng đứng từ giá trị quan sát (xi,yi) đến đường thẳng cần xác định. Ta định nghĩa haøm muïc tieâu: min)Xaa(YYD 2N 1i i10i N 1i 2 i PGS. Dr. Nguyễn Thống Quan sát Hồi quy 3PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 13 Đây là một hàm 2 biến a0 và a1, để cho D cực trị (với ý nghĩa vật lý của bài toán ta biết đó là cực tiểu) ta phải có: )2(0 a D )1(0 a D 1 0 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 14 Töø ñoù: Giải hệ phương trình trên ta có: PGS. Dr. Nguyễn Thống ]1[0xaay2 i i10i ]2[0xxaay2 i i i10i i 2 i 2 i i iiii 1 xNx yxNyx a i1i0 xaya PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 15 HAØM TÍNH a, b TRONG EXCEL Intercept(Y,X) tính tung ñoä goác b cuûa quan heä tuyeán tính. Linest(Y,X) tính heä soá a (ñoä doác cuûa quan heä tuyeán tính giöõa Y i & X i ). PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 16 PHƯƠNG TRÌNH PHƯƠNG SAI N i i yySST 1 2 Phöông sai moâ hình (chaát löôïng moâ hình) Phöông sai toång (baûn chaát soá lieäu) N i i yySSE 1 2 ˆ PGS. Dr. Nguyễn Thống Sum of Square Total Sum of Square Explicative PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 17 SST = SSE + SSR [1] [1] phöông trình phöông sai Phöông sai thaëng dö (sai soá moâ hình) yi: giaù trò quan saùt, : giaù trò tính töø moâ hình y : giaù trò trung bình bieán nghieân cöùu N i ii yySSR 1 2 ˆ yˆ PGS. Dr. Nguyễn Thống Sum of Square Residual PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 18 KIỂM ĐỊNH & ĐÁNH GIÁ CHẤT LƯỢNG MÔ HÌNH HỒI QUY PGS. Dr. Nguyễn Thống 4PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 19 CHẤT LƯỢNG Hệ sô ́ xác định R2 R2 1 mô hình càng TỐT PGS. Dr. Nguyễn Thống 10 yy yy SST SSR 1 SST SSE R i 2 i i 2 i 2 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 20 Hệ sô ́ xác định R2 hiệu chỉnh: Khi số liệu quan sát n nhỏ, giá trị R2 được hiệu chỉnh như sau (k=1: hồi quy đơn): Chú ý: Khi n lớn PGS. Dr. Nguyễn Thống )R1( 1kn 1n 1R 22 22 RR 22 RR PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 21 KIỂM ĐỊNH HỆ SỐ ai MÔ HÌNH ai là các giá trị trung bình thống kê Kiểm định ai là khác 0 hay bằng 0 theo quan điểm thống kê. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 22 KIỂM ĐỊNH HỆ SỐ ai MÔ HÌNH biến độc lập liên kết Xi có nghĩa trong phương trình hồi quy. biến Xi KHÔNG CÓ trong phương trình hồi quy. Kiểm định Student PGS. Dr. Nguyễn Thống 0a i 0a i PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 23 GIAÛI THÍCH KIEÅM ÑÒNH STUDENT (kieåm ñònh caùc heä soá a i cuûa moâ hình vaø 0) BAÈNG ÑOÀ THÒ Phân Student PGS. Dr. Nguyễn Thống -t t S t 5% -t 5% - Neáu S > 5% t =0 theo quan ñieåm thoáng keâ. - Neáu S < 5% t khaùc 0 theo quan ñieåm thoáng keâ. 0 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 24 VÍ DỤ PGS. Dr. Nguyễn Thống 5PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 25 TÍNH TỰ TƯƠNG QUAN có tính TỰ TƯƠNG QUAN BẬC 2 0,with)t()t()t( 2i1ii PGS. Dr. Nguyễn Thống i 0 1 2 3 i 4 6 7 3 i-1 4 6 7 Chuỗi trể bậc 1 của PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính Xét hồi quy tuyến tính bội bậc k: ii,kki,22i,11i Xa...XaXaY 26 Biến cần giải thích X Biến giải thích Sai số mô hình PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 27 KIỂM ĐỊNH CÁC THẶNG DƯ CÓ BỊ TÍNH TỰ TƯƠNG QUAN Kiểm định Durbin-Watson, DW Thặng dư PGS. Dr. Nguyễn Thống iii yye Giá trị quan sát Giá trị từ mô hình PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 28 CHÚ Ý Mô hình hồi quy tuyến tính đơn sẽ TỐT khi t là một “NHIỄU TRẮNG” Nó KHÔNG CÓ tính tự tương quan PGS. Dr. Nguyễn Thống tt,110t XaaY PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 29 TỰ TƯƠNG QUAN Tính tự tương quan bậc 1 Với khác 0 có tính TỰ TƯƠNG QUAN BẬC 1 MÔ HÌNH CHƯA TỐT THÊM BIẾN ??? PGS. Dr. Nguyễn Thống 1ii ee PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 30 Kiểm định Durbin-Watson Trong thực hành có thể dùng kiểm định Durbin-Watson để đánh giá (Tham số DW): DW 2 Ok DW KHÁC giá trị 2 càng nhiều càng có nguy cơ tính TỰ TƯƠNG QUAN CỦA ei. PGS. Dr. Nguyễn Thống 6PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 31 Tham số DW DW =2 Chuỗi KHÔNG có tính tự tương quan PGS. Dr. Nguyễn Thống 1i 2 i 2i 2 1ii DW PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 32 Xem SPSS TKUD \ Durbin Watson Exampe 1.sav PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 33 Ví duï: Moät thí nghieäm xaùc ñònh goùc noäi ma saùt vaø löïc dính cuûa taàng ñòa chaát nghieân cöùu. Keát quaû cuûa 12 thí nghieäm cho caùc öùng suaát tieáp vaø öùng suaát phaùp ñöôïc trình baøy trong baûng sau. Xaùc ñònh vaø c trong quan heä. ctg PGS. Dr. Nguyễn Thống Mẫu 1 2 3 4 5 6 kg/cm2) 3.2 3.7 3.7 4.2 5.2 5.3 (kg/cm2) 3.6 4.2 4.3 4.9 6.2 6.5 Mẫu 7 8 9 10 11 12 kg/cm2) 5.5 5.8 6.1 6.6 8.3 9.0 (kg/cm2) 6.6 7.0 7.5 8.1 10.4 11.4 Hệ số m/hình hqtt PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 34 SỬ DỤNG EXCEL HOẶC SPSS ĐỂ ỨNG DỤNG TÍNH HỒI QUY TUYẾN TÍNH PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 35 EXCEL PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 36 PGS. Dr. Nguyễn Thống 7PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 37 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 38 SPSS Analyze Regression Linear PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 39 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 40 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 41 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 42 PGS. Dr. Nguyễn Thống 8PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 43 HỒI QUY TUYẾN TÍNH BỘI PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 44 Trong trường hợp số biến giải thích >1 hồi quy tuyến tính bội. Ví dụ: Hồi quy tuyến tính bội bậc k. PGS. Dr. Nguyễn Thống kk22110 Xa...XaXaaY Biến cần được giải thích Biến giải thích PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 45 GIẢ THIẾT Giả thiết về ngẫu nhiên • H1 : các giá trị của xi,t được quan trắc đúng (không có sai số). • H2 : E(t )=0; trung bình số học của các sai số là bằng 0. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 46 • H3 : Phương sai của sai số là hằng số với mọi t (biên độ dao động của quanh giá trị TB của nó là không bị phân kỳ). PGS. Dr. Nguyễn Thống .hs)(E 22t PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 47 H3 PGS. Dr. Nguyễn Thống t hs2 hs2 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 48 • H4 : các sai số thì độc lập với nhau. • H5 : Cov(xi,t , t )=0 : các sai số độc lập với biến giải thích. PGS. Dr. Nguyễn Thống 0pif0).(E ptt 9PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 49 Giả thiết về cấu trúc • H6 : các biến giải thích là độc lập tuyến tính với nhau, điều này cho phép ma trận [X’X] nghịch đảo được. (Tính đa cộng tuyến trong hồi quy bội - Cần loại bỏ) PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 50 Giả thiết về cấu trúc • H7 : X’X/n tiến về giới hạn hữu hạn n. • H8 : n>(k+1) : số lượng quan trắc phải lớn hơn số lượng biến giải thích. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 51 XÁC ĐỊNH HỆ SỐ MÔ HÌNH aI Dùng phương pháp BPTT (xem tài liệu Kinh tế lượng- Tg. Dr. Nguyễn Thống). Gọi PGS. Dr. Nguyễn Thống 1,nt1,1k1k,n1,n axXY Sai số mô hình PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 52 Với: n số quan trắc, k số biến độc lập PGS. Dr. Nguyễn Thống )1k,n(knn1 2k12 1k11 x.x1 .... x.x1 x.x1 X )1,n(n 2 1 y . y y Y )1,1k(k 1 0 a . a a a Hệ số của mô hình hồi quy cần xác định PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 53 THIẾT LẬP PHƯƠNG TRÌNH ĐỂ XÁC ĐỊNH ai PGS. Dr. Nguyễn Thống Min 1,nt1,1k1k,n1,n axXY PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 54 PGS. Dr. Nguyễn Thống )S(Min XaYXaYMin )(MinMin t i ' t 2 t Dùng p/p bình phương tối thiểu: X Ma trận chuyển vị của X 10 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 55 ÔN Ví dụ: Tính module của vectơ U PGS. Dr. Nguyễn Thống 133*32*2UUU 3,2U 3 2 U 2 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 56 MA TRẬN SUY BiẾN Ví dụ: Xét ma trận vuông sau: Giải thích: Xét theo hàng (hoặc cột), các vectơ là “phụ thuộc tuyến tính” ma trận U suy biến det[U] =0. PGS. Dr. Nguyễn Thống 0Udet 153 51 U PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 57 Vì S =f(a) S cực trị (cực tiểu) : Chú ý: PGS. Dr. Nguyễn Thống 0XaXaYXaXaYYY aa S YXXYXYa a XaY a PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 58 Do đó: [X]’ ma trận chuyển vị [X] PGS. Dr. Nguyễn Thống YXXXaa 1 0XaX2YX2 a S PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 59 CHÚ Ý Để ma trận : nghịch đảo được Khi Hiện tượng ĐA CỘNG TUYẾN trong hồi quy tuyến tính bội. PGS. Dr. Nguyễn Thống 1XX 0XXdet 0XXdet PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 60 ÔN Xét ma trận: Nhận xét 2 vectơ cột là PHỤ THUỘC TUYẾN TÍNH: PGS. Dr. Nguyễn Thống 03*26*1Adet 63 21 ]A[ !!! 3 1 2 6 2 11 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 61 CHÚ Ý Khi các vectơ Xk (vectơ biến độc lập) có mang tính PHỤ THUỘC TUYẾN TÍNH với nhau. PTTT Vectơ bất kỳ Xk là tổ hợp tuyến tính của các vectơ còn lại. PGS. Dr. Nguyễn Thống 0XXdet PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 62 Phụ thuộc tuyến tính giữa Xk n số quan trắc, k số biến độc lập PGS. Dr. Nguyễn Thống )1k,n(knn1 2k12 1k11 x.x1 .... x.x1 x.x1 X PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 63 Ví dụ: Sè liÖu quan s¸t trong 6 n¨m vÒ tiªu dïng (Y), thu nhËp (X1) vµ tuæi trung b×nh (X2) nh sau. Dïng phÇn mÒm SPSS x¸c ®Þnh håi quy tuyÕn tÝnh. a. X¸c ®Þnh c¸c hÖ sè cña m« h×nh. b. X¸c ®Þnh ®é lÖch chuÈn cña c¸c hÖ sè. c. KiÔm ®Þnh gi¶ thiÕt c¸c hÖ sè nµy so víi 0. PGS. Dr. Nguyễn Thống 22110 XaXaaY PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 64 i Y X1 X2 1 140 200 45 2 155 220 34 3 180 250 28 4 195 270 24 5 270 400 36 6 330 500 40 PGS. Dr. Nguyễn Thống 22110 XaXaaY Xem SPSS TKUD \ HoiQuyBoi_1.sav PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 65 XÁC ĐỊNH HỆ SỐ MÔ HÌNH PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 66 PGS. Dr. Nguyễn Thống Model Unstandardized Coefficients Standardized Coefficients t Sig.B Std. Error Beta 1 (Constant) 37.22 3.60 10.33 .002 X1 .629 .006 1.009 99.10 .000 X2 -.537 .097 -.056 -5.52 .012 Mô hình Y = 37.22+0.629X1 – 0.537X2 12 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 67 ĐỘ LỆCH CHUẨN CỦA CÁC HỆ SỐ MÔ HÌNH PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 68 PGS. Dr. Nguyễn Thống Model Unstandardized Coefficients Standardized Coefficients t Sig.B Std. Error Beta 1 (Constant) 37.22 3.60 10.33 .002 X1 .629 .006 1.009 99.10 .000 X2 -.537 .097 -.056 -5.52 .012 Độ lệch chuẩn PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 69 KIỂM ĐỊNH CÁC HỆ SỐ CỦA ai MÔ HÌNH CÓ NGHĨA HAY KHÔNG (KHÁC 0 HAY BẰNG 0 THEO QUAN ĐIỂM THỐNG KÊ) PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 70 Model Unstandardized Coefficients Standardized Coefficients t Sig.B Std. Error Beta 1 (Constant) 37.22 3.60 10.33 .002 X1 .629 .006 1.009 99.10 .000 X2 -.537 .097 -.056 -5.52 .012 PGS. Dr. Nguyễn Thống iai /aError.Std/Bt PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 71 Model Unstandardized Coefficients Standardized Coefficients t Sig.B Std. Error Beta 1 (Constant) 37.22 3.60 10.33 .002 X1 .629 .006 1.009 99.10 .000 X2 -.537 .097 -.056 -5.52 .012 PGS. Dr. Nguyễn Thống Nếu Sig < 5% Hệ số ai KHÁC 0 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 72 T¬ng tù vÝ dô 1 víi c¸c sè liÖu nh sau: N0 y x1 x2 x3 x4 x5 1 147.4 2 5 20 8 51 2 187.3 4 4 22 18 55 3 139.9 5 9 24 11 58 4 147.1 6 12 22 12 60 5 105.3 8 14 30 10 62 6 131.1 9 12 29 12 55 7 124.7 10 10 27 8 47 8 170.7 7 9 21 13 65 9 172.6 10 8 20 10 45 10 144.8 9 12 22 9 58 11 189.3 9 15 24 19 55 12 165.5 11 13 28 18 50 PGS. Dr. Nguyễn Thống 13 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 73 Hướng dẫn: Dùng SPSS với file TKUD\ HoiQuyBoi_2.sav PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 74 Hướng dẫn: Dùng SPSS với file TKUD\ HoiQuyBoi_2.sav Model Unstandardized Coefficients Standardiz ed Coeffici ents t Sig. Collinearity Statistics B Std. Error Beta Toleranc e VIF 1 (Constant) 222.680 18.758 11.871 .000 X1 2.352 .824 .253 2.853 .029 .324 3.090 X2 -1.072 .711 -.143 -1.507 .182 .282 3.552 X3 -4.947 .461 -.687 -10.726 .000 .618 1.619 X4 5.045 .333 .777 15.163 .000 .966 1.035 X5 -.368 .288 -.086 -1.276 .249 .554 1.806 PGS. Dr. Nguyễn Thống 431 X04.5X94.4X35.268.222Y PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 75 Bài tập: Người ta muốn kiểm tra sự quan hệ tuyến tính nếu có giữa số ngày nghĩ việc không phép của công nhân trong năm (Y) và các yếu tố thâm niên (x1) và tuổi tác (X2). Xem số liệu sau. PGS. Dr. Nguyễn Thống 22110 XaXaaY PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 76 PGS. Dr. Nguyễn Thống TT Số ngày vắng (Y) Thâm niên (X1) Tuổi (X2) 1 5 5 30 2 4 15 45 3 2 10 42 4 6 6 30 5 8 8 32 6 6 7 35 7 5 10 40 8 3 2 28 9 7 5 50 10 2 19 54 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 77 Bài tập: Người ta muốn kiểm tra sự quan hệ tuyến tính nếu có giữa lượng rác thải hàng ngày và nhiệt độ trong ngày (so với nhiệt độ chuẩn 650F) và độ ẩm (so với độ ẩm chuẩn 55%). Xem số liệu sau. PGS. Dr. Nguyễn Thống 22110 XaXaaY PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 78 PGS. Dr. Nguyễn Thống TT Rác thải ngày (Y) Nhiệt (X1) Độ ẩm (X2) 1 14 -5 1 2 12 -8 1 3 16 1 4 4 20 6 6 5 24 8 7 6 29 12 14 7 24 3 17 8 14 -2 2 9 16 -7 1 10 10 -3 -1 11 14 -8 -2 12 8 -2 3 14 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 79 HIỆN TƯỢNG ĐA CỘNG TUYẾN TRONG HỒI QUY TUYẾN TÍNH BỘI PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 80 Để X1, X2, , Xi giữ vai trò là biến giải thích để nghiên cứu biến Y các biến X1, X2, Xi phải ĐỘC LẬP TUYẾN TÍNH. Đây là điều kiện « CẦN » phải có khi nghiên cứu hồi quy tuyến tính bội. nếu KHÔNG các hệ số của mô hình (ai) không xác định được !!! PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 81 Ghi chú Để X1 & X2 là ĐỘC LẬP TUYẾN TÍNH: [X1].[X2] 0 Để X1, X2 & X3 là ĐỘC LẬP TUYẾN TÍNH: XI KHÔNG LÀ TỔ HỢP TUYẾN TÍNH CỦA X CÒN LẠI. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 82 ĐÁNH GIÁ HIỆN TƯỢNG ĐA CỘNG TUYẾN TRONG HỒI QUY BỘI VỚI THAM SỐ VIF PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 83 VIF Variance Inflation Factor ri 2 hệ số xác định trong hồi quy tuyến tính của biến giải thích Xi theo tất cả các biến giải thích Xj còn lại. PGS. Dr. Nguyễn Thống 2 ir1 1 VIF PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 84 VIF càng lớn CÀNG CÓ KHẢ NĂNG có hiện tượng ĐA CỘNG TUYẾN (vì r2 1) PGS. Dr. Nguyễn Thống r2 VIF 1 1 VIF=f(r2) r2>r* 2 Ok 15 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 85 CHÚ Ý Phổ biến r2 <0,5 VIF < 2. Ok KHÔNG CÓ HIỆN TƯỢNG về Đa cộng tuyến của các biến độc lập. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 86 ĐỒ THỊ ỨNG DỤNG TRONG PHÂN TÍCH ĐA CỘNG TUYẾN PGS. Dr. Nguyễn Thống r2 Tolerence= 1/VIF 1 1 Tolerence=1/VIF =(1-r2) Khu vực “ÍT” có khả năng ĐA CỘNG TUYẾN r20 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 87 CHÚ Ý Tolerance = 1/VIF Nếu Tolerance < (1-R2) CÓ THỂ có hiện tượng ĐA CỘNG TUYẾN. Yêu cầu: Tolerance > (1-R2) R2 hệ số xác định (hiệu chỉnh) của mô hình. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 88 SPSS NHẬN BIẾT ĐA CỘNG TUYẾN (xem SPSS với file HoiQuyBoi.sav) Ví dụ: Một nghiên cứu y về quan hệ giữa Cholesterol (biến nghiên cứu Y) và các yếu tố Tuổi (Age), Trọng lượng (Weight), Chiều cao (height), Áp huyết của 20 đối tượng như sau: PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 89 PGS. Dr. Nguyễn Thống Tension.aHeight.a Weight.aAge.aa.Choles 43 210 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 90 PGS. Dr. Nguyễn Thống TT Cholesterol Age Weight Height Aphuyet 1 130 25 66.0 1.775 110 2 125 27 60.0 1.725 120 3 140 39 56.0 1.750 140 4 135 35 70.0 1.825 130 5 160 42 65.2 1.750 120 6 140 26 64.8 1.725 110 7 180 38 72.4 1.825 115 16 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 91 PGS. Dr. Nguyễn Thống TT Cholesterol Age Weight Height Aphuyet 8 170 31 68.8 1.700 105 9 160 29 55.6 1.625 135 10 150 25 58.0 1.600 140 11 150 23 64.8 1.725 115 12 220 52 66.4 1.800 125 13 240 51 63.6 1.700 135 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 92 PGS. Dr. Nguyễn Thống TT Cholesterol Age Weight Height Aphuyet 14 210 48 72.8 1.825 140 15 200 47 57.2 1.600 110 16 190 36 64.8 1.750 125 17 160 33 68.8 1.775 125 18 170 31 72.4 1.775 140 19 150 29 59.6 1.725 135 20 190 48 63.6 1.725 130 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 93 PGS. Dr. Nguyễn Thống Coeffici ents Sig. Collinearity Statistics B Std. Error Tolerance VIF Constant 298.304 103.508 0.011 HEIGHT -269.803 83.826 0.006 0.383 2.613 AGE 2.826 0.384 0.000 0.924 1.082 TENSION 0.244 0.316 0.453 0.892 1.121 WEIGHT 3.203 1.041 0.008 0.378 2.643 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 94 LOẠI BỎ BIẾN WEIGHT PGS. Dr. Nguyễn Thống Unstandardized Coefficients t Sig. Collinearity Statistics B Std. Error Tolerance VIF (Constant) 188.471 120.127 1.569 .136 age 2.859 .475 6.024 .000 .925 1.082 height -69.587 65.310 -1.065 .302 .964 1.037 tension -.012 .378 -.031 .976 .958 1.044 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 95 TÓM TẮT Xem xét giá trị R2 (càng gần giá trị 1 Ok) Xem xét các hệ số mô hình có KHÁC 0 ? (sig <5% ok, nếu không loaị biến liên quan) Xem xét tính tự tương quan (D-W 2 tốt nhất), nếu KHÔNG thêm biến giải thích Kiểm tra tính ĐA CỘNG TUYẾN VỚI tham số VIF ( 2. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 96 BIẾN GIẢ (BIẾN CHỈ BÁO, DUMMY) PGS. Dr. Nguyễn Thống 17 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 97 BIEÁN CHÆ BAÙO BiÕn chØ b¸o ®îc sö dông trong trêng hîp biÕn gi¶i thÝch cã d¹ng lµ c¸c biÕn côc bé t¸c dông lªn biÕn nghiªn cøu. VÝ dô 3: KÕt qu¶ kinh doanh 10 n¨m cuèi cña C«ng ty Z nh sau víi: Dso : doanh thu ; Pub : chi phÝ qu¶ng c¸o ; Promo : tû lÖ gi·m gi¸ ; Xhoi : yÕu tè x· héi PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 98 Naêm Dso (100tr.) Pub (tr.) Promo Xhoi(%) 1996 49 41 10 0 1997 40 32 15 0 1998 41 38 10 0 1999 46 40 10 0 2000 52 40 5 0 2001 57 42 0 0 2002 53 44 0 0 2003 35 46 0 1 2004 65 50 5 0 2005 64 55 0 0 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 99 Dso 0 10 20 30 40 50 60 70 1994 1996 1998 2000 2002 2004 2006 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 100 Pub 0 10 20 30 40 50 60 1994 1996 1998 2000 2002 2004 2006 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 101 Promo 0 2 4 6 8 10 12 14 16 1994 1996 1998 2000 2002 2004 2006 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 102 BIẾN ĐỊNH TÍNH PGS. Dr. Nguyễn Thống 18 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 103 BIEÁN ÑÒNH TÍNH Cã 2 lo¹i biÕn trong nghiªn cøu håi quy: - BiÕn ®Þnh lîng: Thu nhËp, Doanh thu, Sè lîng s¶n phÈm tiªu thô... - BiÕn ®Þnh tÝnh: NghÒ nghiÖp, Tr×nh ®é v¨n hãa, Giíi tÝnh, §ång ý kh«ng ®ång ý, Mµu s¾c, ... PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 104 BIEÁN ÑÒNH TÍNH i Y Giíi tÝnh Trinh ®é Th© m niªn (t/nhËp ) Nam Nu <=PT DH SDH 1 15000 1 0 1 0 0 8 2 25000 0 1 0 1 0 15 . . 1 0 . . . . . . . . . . . . N 12000 0 1 0 1 0 5 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 105 Coù giaù trò cuûa α, ν1, ν2 xaùc ñònh giaù trò cuûa F bôûi: %Pr 21 ; FF Xaùc suaát α% Fα p PHÂN PHỐI FISHER t Vuøng giaù trò kieåm ñònh =0 Vuøng giaù trò kieåm ñònh khaùc 0 0 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 106 Fisher với α=5% 2\ν1 1 2 3 4 5 6 7 8 9 1 161 200 216 225 230 234 237 239 241 2 18.5 19 19.2 19.2 19.3 19.3 19.4 19.4 19.4 3 10.1 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.1 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 8 5.32 4.46 4.07 3.84 3.69 3.58 3.5 3.44 3.39 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 10 4.96 4.1 3.71 3.48 3.33 3.22 3.14 3.07 3.02 11 4.84 3.98 3.59 3.36 3.2 3.09 3.01 2.95 2.9 12 4.75 3.89 3.49 3.26 3.11 3 2.91 2.85 2.8 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 14 4.6 3.74 3.34 3.11 2.96 2.85 2.76 2.7 2.65 PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 107 Fisher với α=5% 15 4.54 3.68 3.29 3.06 2.9 2.79 2.71 2.64 2.59 16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 17 4.45 3.59 3.2 2.96 2.81 2.7 2.61 2.55 2.48 18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 19 4.38 3.52 3.13 2.9 2.74 2.63 2.54 2.48 2.42 20 4.35 3.49 3.1 2.87 2.71 2.6 2.51 2.45 2.39 21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 22 4.3 3.44 3.05 2.82 2.66 2.55 2.46 2.4 2.34 23 4.28 3.42 3.03 2.8 2.64 2.53 2.44 2.37 2.32 24 4.26 3.4 3.01 2.78 2.62 2.51 2.42 2.36 2.3 25 4.24 3.39 2.99 2.76 2.6 2.49 2.4 2.34 2.28 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 60 4 3.15 2.76 2.53 2.37 2.25 2.17 2.1 2.04 120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 3.84 3 2.6 2.37 2.21 2.1 2.01 1.94 1.88 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 108 10 12 15 20 24 30 40 60 120 242 244 246 248 249 250 251 252 253 254 19.4 19.4 19.4 19.5 19.5 19.5 19.5 19.5 19.5 19.5 8.79 8.74 8.7 8.66 8.64 8.62 8.59 8.57 8.55 8.53 5.96 5.91 5.86 5.8 5.77 5.75 5.72 5.69 5.66 5.63 4.74 4.68 4.62 4.56 4.53 4.5 4.46 4.43 4.4 4.37 4.06 4 3.94 3.87 3.84 3.81 3.77 3.74 3.7 3.67 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.3 3.27 3.23 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93 3.14 3.07 3.01 2.94 2.9 2.86 2.83 2.79 2.75 2.71 2.98 2.91 2.85 2.77 2.74 2.7 2.66 2.62 2.58 2.54 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.4 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.3 2.67 2.6 2.53 2.46 2.42 2.38 2.34 2.3 2.25 2.21 2.6 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13 2.54 2.48 2.4 2.33 2.29 2.25 2.2 2.16 2.11 2.07 PGS. Dr. Nguyễn Thống 19 PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 109 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01 2.45 2.38 2.31 2.23 2.19 2.15 2.1 2.06 2.01 1.96 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92 2.39 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88 2.35 2.28 2.2 2.12 2.08 2.04 1.99 1.95 1.9 1.84 2.32 2.25 2.18 2.1 2.05 2.01 1.96 1.92 1.87 1.81 2.3 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78 2.27 2.2 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62 2.08 2 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51 1.99 1.92 1.84 1.75 1.7 1.65 1.59 1.53 1.47 1.39 1.91 1.83 1.75 1.66 1.61 1.55 1.5 1.43 1.35 1.25 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 8: Hồi quy tuyến tính 8/29/2016 110 PGS. Dr. Nguyễn Thống HẾT
File đính kèm:
- bai_giang_phan_tich_du_lieu_chuong_8_hoi_quy_tuyen_tinh_nguy.pdf