Bài giảng Phân tích dữ liệu - Chương 6: Phân tích thành phần chính (PCA) - Nguyễn Thống
GIỚI THIỆU
Phân tích nhân tố các thành phần chính
chuẩn hóa (PTNT) là một phương pháp
phân tích dữ liệu (định tính) cho phép:
Nhận biết xu thế chính của tập hợp
dữ liệu khảo sát;
Đánh giá và sắp hạng các cá nhân
nghiên cứu dựa vào các đặc trưng
(biến định lượng) của chúng.
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Phân tích dữ liệu - Chương 6: Phân tích thành phần chính (PCA) - Nguyễn Thống", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Phân tích dữ liệu - Chương 6: Phân tích thành phần chính (PCA) - Nguyễn Thống
1PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 1 TRƯỜNG ĐẠI HỌC BÁCH KHOA TP. HCM Khoa KTXD - Bộ môn KTTNN Giảng viên: PGS. TS. NGUYỄN THỐNG E-mail: nguyenthong@hcmut.edu.vn or nthong56@yahoo.fr Web: Tél. (08) 38 691 592- 098 99 66 719 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) NỘI DUNG MÔN HỌC Chương 1. Thống kê mô tả (ôn). Chương 1bis. Xác suất & phân phối thống kê (ôn).. Chương 2. Khoảng tin cậy. Chương 3. Kiểm định thống kê. Chương 4. Phân loại dữ liệu (Classification). Chương 5. Phân nhóm dữ liệu (Cluster). Chương 6. Phân tích thành phần chính (PCA). Chương 7. Phân tích chuỗi thời gian. Chương 8. Hồi quy tuyến tính. Chương 9. Xử lý số liệu thực nghiệm. Chương 10. Giới thiệu phần mềm SPSS or R PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 3 KIEÅM TRA - Kieåm tra giöõa kyøø 60 ph. - Thi vieát cuoái moân hoïc 90ph. - Tiểu luận. Chuù yù: - Cho pheùp mang taøi lieäu tham khaûo. - Mang theo maùy tính laøm baøi taäp. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 4 NỘI DUNG - Giới thiệu. - Khái niệm cơ bản. - Nội dung phương pháp phân tích nhân tố chính. - Ví dụ áp dụng. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 5 GIỚI THIỆU Phân tích nhân tố các thành phần chính chuẩn hóa (PTNT) là một phương pháp phân tích dữ liệu (định tính) cho phép: Nhận biết xu thế chính của tập hợp dữ liệu khảo sát; Đánh giá và sắp hạng các cá nhân nghiên cứu dựa vào các đặc trưng (biến định lượng) của chúng. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 6 GIỚI THIỆU Đây là một phương pháp phân tích định tính dựa trên cơ sở giá trị các biến định lượng liên kết với từng cá nhân (hoặc khảo sát). Mỗi biến sẽ được đánh giá theo một thang điểm thích hợp. PGS. Dr. Nguyễn Thống 2PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 7 KHÁI NIỆM CƠ BẢN Momen quán tính chất điểm m đối với tâm O PGS. Dr. Nguyễn Thống Chất điểm khối lượng m d Tâm O 2 o/m mdM PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 8 KHÁI NIỆM CƠ BẢN Momen quán tính chất điểm m đối với đường thẳng D PGS. Dr. Nguyễn Thống Chất điểm khối lượng m d Tâm O 2 )D/(m mdM (D) PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 9 KHÁI NIỆM CƠ BẢN Momen quán tính hệ thống chất điểm mi đối với tâm O PGS. Dr. Nguyễn Thống Chất điểm khối lượng m1 d1 Tâm O 2iio/m dmM i di mi m1 m2 d2 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 10 KHÁI NIỆM CƠ BẢN TRỌNG TÂM G HỆ CHẤT ĐIỂM PGS. Dr. Nguyễn Thống Chất điểm khối lượng mi d1 Trọng tâm G MindmM 2iiG/mi di mi m1 m2 d2 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 11 KHÁI NIỆM CƠ BẢN Momen quán tính hệ thống chất điểm mi đối với đường thẳng D PGS. Dr. Nguyễn Thống Chất điểm khối lượng m1 d1 2ii)D/(m dmM i di mi m1 m2 d2 (D) PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 12 KHÁI NIỆM KHÔNG GIAN p CHIỀU PGS. Dr. Nguyễn Thống X1 X2 M(x1,x2) KHÔNG GIAN 2D o x1 x2 KHÔNG GIAN 3D X1 X2 X3 M(x1,x2,x3) x3 x1 x2 o X1 X2Xp o M(x1,x2,..,xp)KHÔNG GIAN p chiều 3PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 13 TÍCH VÔ HƯỚNG 2 VECTƠ Xét 2 vectơ u và v hợp với nhau bởi 1 góc . Tích vô hướng của 2 vectơ như sau : Chú ý : • Nếu thẳng góc ta có : X=0 • Nếu ta có PGS. Dr. Nguyễn Thống cos.v.uv.uX vu // vuvu .. PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 14 TÍCH VÔ HƯỚNG 2 VECTƠ Giả sử trong không gian 2D, u( 1,1) & v( 2,2) Chú ý: PGS. Dr. Nguyễn Thống 2121v.u 2 1 2 1u PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 15 TÍCH VÔ HƯỚNG 2 VECTƠ PGS. Dr. Nguyễn Thống O M(x1,x2) U( 1, 2) 2211 xxU.MO G Nếu U là vectơ đơn vị 1x1+ 2x2=OG G là hình chiếu của M xuống X1 X2 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 16 NHẬN XÉT Khi góc hợp bởi vectơ OM và vectơ U càng bé hình chiếu của OM xuống vectơ U KHÔNG BỊ « BIẾN DẠNG » nhiều (mất thông tin) so với OM ban đầu. bé chất lượng hình chiếu của OM xuống trục chứa vectơ U càng tốt. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 17 TÍCH VÔ HƯỚNG 2 VECTƠ PGS. Dr. Nguyễn Thống O M(x1,x2,..,xp) U( 1, 2,.., p) pp2211 x...xxU.MO G Trong không gian p chiều PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 18 CHÚ Ý Xét 2 vectơ u và v là vectơ đơn vị và hợp với nhau bởi 1 góc . Tích vô hướng của 2 vectơ như sau : Tổng quát hoá trong không gian p chiều với u(x1,x2,,xp) và v(y1, y2,,yp) là các vectơ đơn vị PGS. Dr. Nguyễn Thống cos. vuX pp2211 yx...yxyxcos 4PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 19 NHẬN XÉT Một cách tổng quát, trong không gian p chiều, xét giá trị tích vô hướng X của 2 vectơ đơn vị: X 0. 2 vectơ gần trực giao nhau X 1. 2 vectơ cùng chiều nhau X -1. 2 vectơ ngược chiều nhau PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 20 BÀI TẬP Bài 1: Tính góc hợp bởi các vectơ sau: U(3,4) & V(-2,50.5) U(1,3) & V(-6,2) U(1,3,4,-2) & V(2,1,1,4) Bài 2: Tính giá trị hình chiếu của vectơ M lên vectơ U: M(1,5) & U(30.5/2,1/2) M(2,-1,3,2) & U(1/2,-1/2,-1/2,1/2) PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 21 BÀI TẬP Bài 3: Tìm góc hợp bởi vectơ OM(3,4,3,20.5) với các trục tọa độ trong không gian 4D. Bài 4: Chứng minh trong không gian p chiều, gọi i là góc hợp bởi một vectơ OM bất kỳ với các trục tọa độ i có tính chất sau: PGS. Dr. Nguyễn Thống p 1i i 2 1cos PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 22 KIẾN THỨC THỐNG KÊ CẦN THIẾT SỬ DỤNG TRONG PHÂN TÍCH NHÂN TỐ • Biến thống kê định lượng, các phân phối thống kê; • Giá trị trung bình, phương sai, độ lệch chuẩn của một biến thống kê; • Biến được trung tâm hóa và chuẩn hóa; PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 23 • Hệ số tương quan tuyến tính của 2 biến. Đây là các kiến thức cần thiết không thể thiếu để tiếp tục nghiên cứu phương pháp này . PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 24 TRỌNG TÂM G Xét X(x1,x2,..xn) PGS. Dr. Nguyễn Thống Gx 1x1Nx ix X N x x i i G O Nx 5PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 25 Momen quán tính của n phần tử có khối lượng đơn vị so với trọng tâm G được xác định như sau : PGS. Dr. Nguyễn Thống i 2 Gi G xx.1M PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 26 PHƯƠNG SAI V(X) Xét X(x1,x2,..xn) PGS. Dr. Nguyễn Thống 1N )xx( )X(V i 2 Gi 2 Gx 1x1Nx ix X Mô tả sự phân tán của X chung quanh giá trị trung bình của các giá trị biến nghiên cứu PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 27 MỘT SỐ BIẾN ĐỔI BIẾN THỐNG KÊ PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 28 BIẾN TRUNG TÂM HÓA VÀ CHUẨN HÓA Standardized Gọi X là một biến thống kê. Một biến được xem là trung tâm hóa và chuẩn hóa ký hiệu ti suy từ xi được định nghĩa: Tính chất: ti số KHÔNG đơn vị PGS. Dr. Nguyễn Thống Xx t ii 1;0t it i i PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 29 Normalized Tính chất: ti [ 0 1] ti : không đơn vị PGS. Dr. Nguyễn Thống minmax mini i xx xx t PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 30 Adjusted Normalized Tính chất: ti [ -1 1] ti : không đơn vị PGS. Dr. Nguyễn Thống 1 xx xx *2t minmax mini i 6PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 31 HIỆP PHƯƠNG SAI Cov(X,Y) Hệ số tương quan tuyến tính r của 2 biến X và Y như sau : Chú ý: Nếu biến đã chuẩn hoá Cov=r PGS. Dr. Nguyễn Thống N 1i ii N )Yy)(Xx( )Y,X(Cov 1;1)Y,X(Covr yx PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 32 Ý nghĩa r: PGS. Dr. Nguyễn Thống X Y r +1 r -1 X Y 0 0 0 r 0 X Y PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 33 BÀI TẬP Bài 1: Tính Cov của các vectơ sau: U(2,4,4,3,5) & V(1,3,5,3,7) Đáp số: Cov(U,V)=1,92 Bài 2: Tính r của các vectơ sau: U(3,2,5,5,1) & V(3,1,7,6,1) Đáp số: Cov(U,V)=3,88, U =1,79 & V =2,79 r=0,78 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 34 BÀI TẬP Bài 3: Xét 2 vectơ X1,X2 trong không gian 4D như sau: Kiểm tra tính chất phương sai của biến Xi đã được chuẩn & trung tâm hoá bằng 1 (σ2=V=1). PGS. Dr. Nguyễn Thống a b c d X1 2 5 8 1 X2 3 2 1 6 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 35 TRỤC QUÁN TÍNH Xét một cố thể (tập hợp vô số các phần tử có khối lượng 1 đơn vị) có trọng tâm là G. Trục quán tính cấp 1 là đường thẳng đi qua G và hình chiếu của tất cả các chất điểm xuống trục này có PHƯƠNG SAI CỰC ĐẠI. Trục quán tính cấp 2 là đường thẳng qua G, thẳng góc với trục 1 và hình chiếu tất cả các chất điểm xuống trục này có PHƯƠNG SAI CỰC ĐẠI. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 36 Bài tập 0: Xét 3 chất điểm có khối lượng 1 đơn vị ở các vị trí trong không gian 2D là A(-3,-2), B(2,5), C(1,-3). Xác định trục chính 1 & trục chính 2. PGS. Dr. Nguyễn Thống 7PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 37 Bài tập 1: Xét tấm gỗ đồng chất dạng tam giác cân với các đỉnh A(0,9), B(2,0) & C(-2,0). Xác định trục quán tính cấp 1 và cấp 2. Bài tập 2: Xét tấm gỗ đồng chất hình ellippe có phương trình: Xác định trục quán tính chính cấp 1 và cấp 2 PGS. Dr. Nguyễn Thống 1 4 2Y 25 1X 22 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 38 LÝ THUYẾT PHƯƠNG PHÁP PHÂN TÍCH THÀNH PHẦN CHÍNH Principal Component Analysis (PCA) PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 39 HÌNH THÀNH VẤN ĐỀ Khảo sát các yếu tố trong không gian p chiều (biến số , p>2). Ta không thể phân tích số liệu một cách « trực quan ». Vấn đề càng khó tưởng tượng khi p càng lớn. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 40 HÌNH THÀNH VẤN ĐỀ PGS. Dr. Nguyễn Thống O (Gốc, trọng tâm) Var1(.,.,.,.) Var2(.,.,.,.) Var3(.,.,.,.) Var4(.,.,.,.)Var5(.,.,.,.) Var6(.,.,.,.) Varp(.,.,.,.) KHÔNG GIAN BIẾN PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 41 DẠNG SỐ LIỆU PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 42 TRONG PHÂN TÍCH NHÂN TỐ CHÍNH CÁC BIẾN ĐƯỢC TRUNG TÂM & CHUẨN HOÁ PGS. Dr. Nguyễn Thống Xx t ii 8PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 43 Var1 Var2 Var3 Obs1 0.472 -0.970 0.956 Obs2 -1.551 0.728 -1.036 Obs3 0.135 -1.213 0.159 Obs4 1.146 0.728 0.956 Obs5 -0.202 0.728 -1.036 Moy 0.00 0.00 0.00 Sigma 1.00 1.00 1.00 DẠNG SỐ LIỆU PHÂN TÍCH PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 44 HÌNH THÀNH VẤN ĐỀ Nhu cầu phân tích số liệu trong các mặt phẳng (không gian 2D). Chiếu số liệu trong không gian p chiều xuống các mặt phẳng (không gian 2D). Chọn các mặt phẳng chiếu sao cho ÍT mất thông tin nhất do thực hiện phép chiếu. Đó chính là các MẶT PHẲNG CHÍNH trong phương pháp PTNT. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 45 HÌNH THÀNH VẤN ĐỀ Phương pháp PTNT chỉ chọn một số trục ÍT NHẤT CÓ THỂ để biểu diễn số liệu (thông thường từ 2 (2D) đến 4 (4D) trục). Đó là các trục NHÂN TỐ CHÍNH (Principal Componant Axe). PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 46 Phân tích nhân tố Giảm số biến ban đầu xuống còn ÍT biến hơn. Mỗi biến mới sẽ là ĐẠI BIỂU của một tập hợp biến cũ gọi là 1 NHÂN TỐ (item). PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 47 PRINCIPALE COMPONANT PGS. Dr. Nguyễn Thống O (Gốc, trọng tâm) Var1(.,.,.,.) Var2(.,.,.,.) Var3(.,.,.,.) Var4(.,.,.,.)Var5(.,.,.,.) Var6(.,.,.,.) Varp(.,.,.,.) 1=F1(Var) 2=F2(Var) 3=F3(Var) PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 48 Trục nhân tố được xác định theo phương pháp PHƯƠNG SAI CỦA CÁC HÌNH CHIẾU BIẾN BAN ĐẦU XUỐNG TRỤC NHÂN TỐ CHÍNH LÀ CỰC ĐẠI. PGS. Dr. Nguyễn Thống 9PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 49 Gọi 1, 2 , 3 , . Là các thành phần CHÍNH 1, 2, 3, . Tính chất: Variance các BIẾN TRÊN 1 > Variance các BIẾN TRÊN 2 > Variance các BIẾN TRÊN 3 > . PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 50 PHƯƠNG TRÌNH XÁC ĐỊNH TRỤC CHÍNH 1, 2 , 3 , ,. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 51 Giả thiết xem xét trong không gian p biến & n quan sát (observation): Trục chính 1( 1, 2, 3,.., n) ? i (?) toạ độ chuẩn hoá của trục 1 trong KHÔNG GIAN n. PGS. Dr. Nguyễn Thống 1 n 1i 2 i PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 52 PHƯƠNG TRÌNH XÁC ĐỊNH TRỤC CHÍNH 1 Chú ý: Hình chiếu Var(i) xuống 1 , PGS. Dr. Nguyễn Thống Max]1[)*)i(Variable(V 21 p 1i 1 1*)i(Variable PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 53 [1] là hàm theo các tham số i Đạt cực trị Đạo hàm riêng phần theo i và = 0 Nhận được hệ phương trình giải ra xác định i PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 54 SỬ DỤNG SOLVER TRONG EXCEL (BÀI TOÁN QUY HOẠCH TUYẾN TÍNH) HÀM MỤC TIÊU & CÁC RÀNG BUỘC NẾU CÓ PGS. Dr. Nguyễn Thống 10 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 55 Giá trị V1 gọi là PHƯƠNG SAI GIẢI THÍCH CỦA TRỤC CHÍNH 1 V1 là max so với Vi của các trục chính i còn lại PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 56 Phương sai giải thích của trục chính 1: PGS. Dr. Nguyễn Thống (%) V V )(Variance p 1i i 1 1 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 57 PHƯƠNG TRÌNH XÁC ĐỊNH TRỤC CHÍNH 2 Điều kiện: Hai trục là trực giao nhau , PGS. Dr. Nguyễn Thống Max)*)i(Var(V 22 p 1i 2 0* 21 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tí ... 576135 PHYSY 0.532775 0.471409 -0.481203481 PSYCO 0.76358 0.227476 -0.353774256 r PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 148 PGS. Dr. Nguyễn Thống Component Matrix F1 F2 F3 REGULA 0.82318 -0.3116 -0.129039797 RETOUR 0.897319 -0.07397 -0.03769372 REV 0.903516 0.029839 0.072613915 SERV 0.014602 0.892555 -0.267075043 SMASCH 0.227757 0.883421 -0.311706814 TOUCH 0.246897 0.747919 0.57520454 VOLER -0.06658 0.950885 0.049657953 r PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 149 DÙNG BẢN KẾT QUẢ TƯƠNG QUAN GIỮA TRỤC CHÍNH & BIẾN Trục I : Pass, Rev, Retour, Lob Trục II : Vol, Serv, Smash Trục III : Touch, Amor PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 150 Ý NGHĨA TRỤC CHÍNH (Biến composite) Trục I : Pass, Rev, Retour, Lob Thể hiện bản lĩnh “phòng thủ” Đây là trục đại biểu cho tiêu chí phòng thủ TỐT. PGS. Dr. Nguyễn Thống 26 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 151 Ý NGHĨA TRỤC CHÍNH (Biến composite) Trục I : Pass, Rev, Retour, Lob PGS. Dr. Nguyễn Thống 1 Rev Retour Lob Pass PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 152 Ý NGHĨA TRỤC CHÍNH (Biến composite) Trục I : PGS. Dr. Nguyễn Thống Biến Hệ số tương quan tuyến tính r với trục F1 PASS 0.944 REV 0.904 RET 0.898 LOB 0.853 REGU 0.825 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 153 Ý NGHĨA TRỤC CHÍNH (Biến composite) Trục II : Vol, Serv, Smash Thể hiện lối đánh “tấn công” Đây là trục đại biểu cho tiêu chí đánh tấn công nhanh. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 154 Ý NGHĨA TRỤC CHÍNH (Biến composite) Trục II : Vol, Serv, Smash PGS. Dr. Nguyễn Thống 2 Vol Serv Smash PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 155 Ý NGHĨA TRỤC CHÍNH (Biến composite) Trục II : PGS. Dr. Nguyễn Thống Biến Hệ số tương quan tuyến tính r với trục F2 VOL 0.949 SER 0.892 SMAS 0.885 TOU 0.75 AMO 0.639 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 156 Ý NGHĨA TRỤC CHÍNH (Biến composite) Trục III : Touch, Amor Lối đánh thiên về “khéo léo”, ngược với tính chất dùng thể lực (Phy). PGS. Dr. Nguyễn Thống 27 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 157 Ý NGHĨA TRỤC CHÍNH (Biến composite) Trục III : Touch, Amor PGS. Dr. Nguyễn Thống 3 Phy Touch Amor PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 158 KHẢ NĂNG GIẢI THÍCH SỐ LIỆU GỐC CỦA CÁC TRỤC CHÍNH PGS. Dr. Nguyễn Thống PHÖÔNG PHAÙP ÑÒ H LÖÔÏNG TRONG QUAÛN LYÙ Chương 7: Phân tích thành phần chính (PCA) PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 159 KHẢ NĂNG CÁC TRỤC CHÍNH F Trục chính F1 giải thích được 41,77% BẢN CHẤT SỐ LIỆU GỐC của các CÁ NHÂN. Tiếp theo là trục F2 được 30,14%. Trục F3 được 9,4%. Trục F4 được 4,6% (có thể bỏ qua vì < 1/15=6,6% giá trị TB mỗi trục). Với 3 trục chính đầu đã giải thích được 81,3% tính chất CÁ NHÂN (khá tốt). PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 160 KHẢ NĂNG CÁC TRỤC CHÍNH F Mặt phẳng nhân tố thứ 1 (F1, F2) chiếm 71,9% sự khác biệt tổng quát của 35 đấu thủ xét trên 15 tiêu chuẩn đưa ra. Mặt phẳng thứ 2 có thể giải thích 52,2% số liệu gốc. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 161 NGHIÊN CỨU CÁ NHÂN (Nghiên cứu khẳng định) PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 162 Cá nhân Tọa độ trên trục I BOR 2.62 CON 2.18 WIL 1.20 LEN 1.68 MAC 1.15 PGS. Dr. Nguyễn Thống 28 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 163 Cá nhân Tọa độ trên trục II NOA 2.01 BEC 1.94 TAN 1.87 MAC 1.19 EDB 1.12 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 164 Cá nhân Tọa độ trên trục III GER 2.84 MAC 2.15 MEC 2.08 PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 165 SẮP HẠNG CÁ NHÂN Khai thác số liệu từ kết quả cho bởi SPSS. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 166 PHƯƠNG TRÌNH TUYẾN TÍNH CỦA CÁ NHÂN BIỂU DIỄN THEO CÁC TRỤC CHÍNH PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 167 CÂU HỎI Từ số liệu cho bởi SPSS, hãy cho biết cách xác định cos( ) GIÁ TRỊ xác định chất lượng trình bày của trục chính đối với cá nhân N. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 168 BÀI TẬP Anh (Chị) hãy hình thành các chủ đề mà ta có thể sử dụng phương pháp CPA để nghiên cứu: Hình thành bài toán, Chuẩn bị dạng số liệu. Các kết luận dự kiến rút ra từ kết quả với SPSS. PGS. Dr. Nguyễn Thống 29 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 169 Bài tập: Một nghiên cứu đánh giá nhằm sắp hạn các nhà thầu xây dựng để phục vụ lựa chọn nhà thầu. Một nghiên cứu với 40 nhà đầu tư để đánh giá 11 tiêu chí (thang điểm 10) thể hiện chất lượng. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 170 Số liệu thăm dò và kết quả cho bởi phương pháp PTNT như sau. a.Dùng ma trận tương quan xác định các biến có tương quan cao. b.Xác định các trục chính và giải thích các kết quả. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 171 BIẾN TÊN • Safety reco. Sar • Value profess. Vap • Reput. On time Ron • Rept. Serv. Res • Capital Cap • Experience Exp • Post. Serv Pos • Effi. Organi. Efo • Exp. Similaire pro. Esp • Personal team. Pet • Depth of tech. resource Dtr PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 172 MỘT SỐ KẾT QUẢ PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 173 PGS. Dr. Nguyễn Thống Safety reco. Value. Pro. Reput. On time Rept. Serv. Capital Experie nce 1 9 5 3 2 6 3 2 8 7 10 8 7 9 3 10 9 7 5 9 9 4 6 5 2 2 6 2 5 6 4 6 7 5 7 6 10 6 4 3 5 3 7 6 10 9 6 7 7 8 6 4 8 7 6 6 9 6 8 8 8 6 6 10 9 4 6 5 5 5 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 174 PGS. Dr. Nguyễn Thống Post. Serv Effi. Organi . Exp. Similair e pro. Personal team. Depth of tech. resource 1 6 5 2 6 6 2 6 5 3 6 5 3 10 7 4 10 10 4 6 4 2 6 6 5 6 3 3 4 4 6 6 6 3 6 6 7 9 9 6 9 8 8 5 3 4 4 4 9 6 3 4 5 5 10 5 4 4 5 4 30 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 175 PGS. Dr. Nguyễn Thống Safety reco. Value. Pro. Reput. On time Rept. Serv. Capital Experie nce 11 5 5 6 10 4 6 12 6 5 4 5 4 5 13 5 5 6 9 6 7 14 8 6 4 2 6 3 15 5 5 3 4 5 4 16 6 5 5 5 4 5 17 10 5 3 3 5 4 18 6 5 5 6 5 6 19 6 6 7 7 6 6 20 10 8 7 5 8 6 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 176 PGS. Dr. Nguyễn Thống Post. Serv Effi. Organi Exp. Similair e pro. Personal team. Depth of tech. resource 11 8 4 10 5 5 12 5 5 4 5 4 13 6 7 5 9 9 14 6 5 2 7 8 15 5 4 2 5 5 16 5 4 4 5 5 17 5 5 5 5 5 18 9 4 3 4 1 19 6 4 4 6 4 20 8 8 4 8 9 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 177 (Số liệu còn lại xem trong PTNT_Tennis_Beerxls) PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 178 PGS. Dr. Nguyễn Thống Mean Std. Deviation Analysis N CAP 5.55 2.601 40 EXP 6.00 1.679 40 DTR 6.18 1.781 40 EFO 6.68 1.639 40 ESP 5.33 1.831 40 PET 4.18 2.062 40 POS 5.65 2.020 40 RES 5.45 2.320 40 ROT 5.90 1.722 40 SAR 5.78 2.069 40 VAP 6.75 1.780 40 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 179 KẾT QUẢ XEM TRONG Output1_ChonThau.ops Phân tích kết quả PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 180 BÀI TÂP Bài 2. Để có thể tìm ra một chiến lược cho phép thâm nhập thị trường tiêu thụ bia ở VN có hiệu quả, một Công ty nước ngoài đã thực hiện một cuộc thăm dò ý kiến người tiêu dùng về các loại bia đang kinh doanh ở thị trường, với các đặc trưng phân tích đánh giá cụ thể. Các loại bia sẽ được đánh giá theo thang điểm 10 với các đặc trưng nghiên cứu. Kết quả thống kê được trình bày ở bảng sau : PGS. Dr. Nguyễn Thống 31 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 181 Ghi chú : FOR : Hình dạng PUB : Quảng cáo VOL : Thể tích ALC : Tỷ lệ alcool RES : Phân phối EFI : Tác dụng đầu tiên PSY : Tâm lý PRI : Giá PAR : Mùi vị EFS : Tác dụng lâu dài. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 182 PGS. Dr. Nguyễn Thống Tên TIG GUI BGI HEI BTH SMI HAM 333 Tính chất FOR 9 9 6 10 4 7 5 9 PUB 7 4 5 5 3 10 10 5 VOL 5 6 5 5 2 8 8 6 ALC 9 10 4 10 6 7 4 10 RES 9 7 5 6 3 9 10 7 EFI 10 9 5 10 3 6 5 9 PSY 10 6 5 7 3 8 8 6 PRI 4 6 4 10 2 3 7 8 PAR 9 7 6 9 3 6 5 8 EFS 9 7 5 9 2 6 5 7 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 183 a - Các Anh (Chị) có thể nói gì về các trục chính F1, F2... và các mặt phẳng chính tương ứng ? b - Biến nào được giới thiệu tốt cho mặt phẳng chính số 1. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 184 c - Loại bia nào đang “chiếm lĩnh” thị trường theo kết quả này . Theo Anh (Chị), chiến lược nào phải được chọn để thâm nhập thị trường. Hãy giải thích tác dụng yếu tố giá (PRI) trong trường hợp này . PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 185 MỘT SỐ KẾT QUẢ PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 186 PGS. Dr. Nguyễn Thống Tên TIG GUI BGI HEI BTH SMI HAM 333 Tính chất FOR 0.74 0.74 -0.63 1.19 -1.53 -0.17 -1.08 0.74 PUB 0.33 -0.8 -0.43 -0.43 -1.18 1.47 1.47 -0.43 VOL -0.33 0.2 -0.33 -0.33 -1.89 1.24 1.24 0.2 ALC 0.57 0.95 -1.34 0.95 -0.57 -0.19 -1.34 0.95 RES 0.86 0 -0.86 -0.43 -1.72 0.86 1.29 0 EFI 1.07 0.7 -0.79 1.07 -1.53 -0.42 -0.79 0.7 PSY 1.58 -0.29 -0.76 0.18 -1.7 0.64 0.64 -0.29 PRI -0.55 0.18 -0.55 1.65 -1.28 -0.92 0.55 0.92 PAR 1.15 0.18 -0.3 1.15 -1.75 -0.3 -0.79 0.67 EFS 1.19 0.32 -0.54 1.19 -1.84 -0.11 -0.54 0.32 BIÊN CHUÂN HOÁ & TT HOÁ 32 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 187 PGS. Dr. Nguyễn Thống Biến Giá trị trung bình Độ chênh lệch FOR 7.375 2.0578 PUB 6.125 2.4717 VOL 5.625 1.7984 ALC 7.5 2.4495 RES 7 2.1794 EFI 7.125 2.5218 PSY 6.625 1.9961 PRI 5.5 2.5495 PAR 6.625 1.9325 EFS 6.25 2.1651 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 188 PGS. Dr. Nguyễn Thống FOR PUB VOL ALC RES EFI PSY PRI PAR EFS FOR 1 PUB -0.132 1 VOL 0.173 0.826 1 ALC 0.88 -0.341 -0.071 1 RES 0.251 0.859 0.861 0.047 1 EFI 0.979 -0.083 0.176 0.86 0.341 1 PSY 0.46 0.719 0.622 0.217 0.891 0.556 1 PRI 0.608 -0.03 0.286 0.46 0.202 0.612 0.209 PAR 0.947 0.01 0.211 0.726 0.356 0.959 0.612 0.596 1 EFS 0.933 0.134 0.313 0.707 0.477 0.956 0.716 0.589 0.978 1 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 189 Giá trị riêng : 5.6769 3.0544 0.714 Phần trăm tham gia tính trên tổng phương sai của hệ thống đối với từng trục : 56.8% 30.5% 7.1% • Cột 1 : Tương quan giữa biến và các trục chính • Cột 2 : Cột 1 bình phương PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 190 PGS. Dr. Nguyễn Thống Biến Thành phần chính Trục 1 Trục 2 Trục 3 FOR 0.9175 0.8418 -0.3650 0.1332 0.0307 0.0009 PUB 0.2351 0.0553 0.9539 0.9099 0.0125 0.0002 VOL 0.4559 0.2078 0.7750 0.6006 -0.2892 0.0836 ALC 0.7200 0.5184 -0.5507 0.3033 0.1067 0.0114 RES 0.5936 0.3524 0.7762 0.6026 0.0455 0.0021 EFI 0.9457 0.8943 -0.3064 0.0939 0.0726 0.0053 PSY 0.7470 0.5580 0.5597 0.3133 0.2887 0.0833 PRI 0.6421 0.4123 0.1902 0.0360 0.7140 0.5111 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 191 Cột 1 : Tọa độ của các cá thể nghiên cứu trên trục chính Cột 2 : Chất lượng giới thiệu (cos2) PGS. Dr. Nguyễn Thống Hiệu Trục 1 Trục 2 Trục 3 TIG 2.5156 0.6513 0.2606 0.0070 1.7179 0.3038 GUI 1.0358 0.3256 -1.1609 0.4090 -0.0769 0.0018 BGI -2.1414 0.7886 -0.1933 0.0064 -0.0924 0.0015 HEI 2.5663 0.6108 -1.7600 0.2873 -0.8037 0.0599 BTH -4.9172 0.8849 -1.6506 0.0997 0.4288 0.0067 SMI 0.1038 0.0016 2.4053 0.8419 0.5703 0.0473 HAM -0.6543 0.0356 3.1909 0.8456 -1.0596 0.0932 333 1.4915 0.5355 -1.0921 0.2871 -0.6845 0.1128 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 192 Bài 2. Để nghiên cứu về mức sống của 20 nước có kỹ nghệ phát triển nhất trên thế giới, người ta đã tiến hành một điều tra về các khoảng chi tiêu khác nhau trên đầu người. Kết quả số liệu điều tra được trình bày ở bảng sau. Ghi chú : ALIM : Thực phẩm; HABI : ăn mặc; LOGE : ở MEU : Nội thất; SAN : Thuốc men; TRA : Di chuyển; LOIS : Giải trí AUTR : Khác PGS. Dr. Nguyễn Thống 33 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 193 PGS. Dr. Nguyễn Thống Pay.1 ALI M HAB I LOG E MEU SAN TRA LOI S AUT R 1 BEL 1548 587 1332 757 772 885 472 1027 2 DK 2093 531 2235 608 158 1551 856 870 3 RFA 1556 738 1743 767 1303 1332 816 899 4 GRE 1074 231 313 222 79 404 121 251 5 FRA 1643 580 1503 678 711 1314 577 1011 6 IRL 1722 255 495 260 102 518 365 272 7 ITA 1589 591 970 558 359 819 546 1056 8 LUI 1702 481 1534 672 488 1237 252 946 9 HOL 1392 533 1418 550 923 795 693 992 10 GB 1153 440 1237 113 81 992 589 1191 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 194 PGS. Dr. Nguyễn Thống Pay.1 ALIM HABI LOGE MEU SAN TRA LOIS AUTR 11 ESP 1045 277 584 272 132 533 258 736 12 POR 753 187 99 173 92 296 116 266 13 HOR 2302 724 1514 721 325 1555 772 943 14 SUE 1921 614 2085 530 204 1318 806 510 15 SUI 3479 583 2343 643 1115 1360 1214 1226 16 AUT 1644 766 1406 505 367 1154 428 1195 17 FIN 1951 420 1406 549 276 1314 753 903 18 USA 1589 767 2307 672 1642 1789 1079 1818 19 CAN 1452 516 1923 766 347 1286 891 1213 20 JAP 2056 594 1761 506 990 889 913 1672 PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 195 Áp dụng phương pháp phân tích nhân tố các thành phần chính chuẩn hóa, Anh (Chị) hãy : a - Thực hiện các bước cơ bản để phân tích và giải thích kết quả. b - Những nước nào được giới thiệu tốt nhất, xấu nhất bởi mặt phẳng chính (1,2). Hãy giải thích ý nghĩa vật lý. PGS. Dr. Nguyễn Thống PHÂN TÍCH DỮ LIỆU Chương 6: Phân tích thành phần chính (PCA) 8/29/2016 196 HẾT CHƯƠNG PGS. Dr. Nguyễn Thống
File đính kèm:
- bai_giang_phan_tich_du_lieu_chuong_6_phan_tich_thanh_phan_ch.pdf