Bài giảng Thống kê kinh doanh và SPSS - Bài 3: Thống kê mô tả - Trương Minh Chiến
1. Kiểm tra dữ liệu (Explore)
2. Bảng phân bố tần suất
3. Mô tả dữ liệu (Descriptive)
4. Lập bảng nhiều chiều cho các biến một trả lời
5. Lập bảng cho biến nhiều trả lời
6. Tác vụ xoay bảng trên Ouput Viewer
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê kinh doanh và SPSS - Bài 3: Thống kê mô tả - Trương Minh Chiến", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Thống kê kinh doanh và SPSS - Bài 3: Thống kê mô tả - Trương Minh Chiến
Bài 3THỐNG KÊ MÔ TẢ 1. Kiểm tra dữ liệu (Explore) 2. Bảng phân bố tần suất 3. Mô tả dữ liệu (Descriptive) 4. Lập bảng nhiều chiều cho các biến một trả lời 5. Lập bảng cho biến nhiều trả lời 6. Tác vụ xoay bảng trên Ouput Viewer Download trọn bộ SPSS 19+crack và ebooks – articles tại Bài tập tình huống. Dưới đây là số liệu về độ tuổi của các bệnh nhân đến khám ở bệnh viện A vào ngày 20/8/2008 32 45 53 60 79 73 73 53 61 48 51 49 62 72 37 70 38 66 52 33 78 45 65 47 64 47 61 75 57 64 Yêu cầu : Xây dựng biểu đồ thân lá Xây dựng bảng phân bố tần số thích hợp Vẽ các đồ thị biểu diễn tần số và tần số tích lũy, tần suất tích lũy Cho nhận xét về phân bố tuổi của các bệnh nhân nói trên 1. Kiểm tra dữ liệu (Explore) Để nhận dạng và phát hiện sai sót trong dữ liệu, ta có ba cách hiển thị dữ liệu như sau: Biểu đồ Histogram Sơ đồ cành và lá (Stem-and-leaf plot) Sơ đồ Boxplot (hộp ria mèo) Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Sử dụng công cụ Statistics Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Để kiểm tra dữ liệu Chọn trên menu Analyze/Descriptive Statistic/Explore để mở hộp thoại Explore: Các biến trong tập dữ liệu xuất hiện trong hộp bên trái. Chọn một hay nhiều biến đưa vào ô Dependent list, các biến cần quan sát sẽ được liệt kê trong ô này. Chúng ta cũng có thể tách các quan sát thành các nhóm nhỏ riêng biệt để kiểm tra dựa vào các giá trị của các biến kiểm soát sẽ được đưa vào ô Factor List . Có thể lần ra các quan sát này bằng cách gán nhãn cho nó bằng gía trị của một biến nào đó, biến này sẽ được đưa vào trong ô label cases by . Ô Display , cho phép chúng ta chọn cách hiễn thị kết quả, các tham sô thống kê (Statistic) , hoặc đồ thị (Plot) , SPSS mặc định là hiễn thị cả hai Để kiểm tra dữ liệu (tt) Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Sử dụng công cụ Statistics cho phéplựa chọn các thống kê hiển thị Descriptives : Cho phép ta hiễn thị các giá trị thống kê như giá trị trung bình, khoảng tin cậy, trung vị, trung bình giãn lược, giá trị nhỏ nhất, lớn nhất, khoảng biến thiên, các bách phân vị M-estimators: Hiễn thị giá trị trung bình theo trọng số (gán các trọng số khác nhau cho các giá trị quan sát tùy theo khoảng cách của nó đến giá trị trung bình, càng xa trọng số càng nhỏ) Outliers: Hiễn thị các quan sát với 5 giá trị nhỏ nhất và 5 giá trị lớn nhất, gọi là Extreme Values Percentiles : Hiển thị các giá trị vị phân Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Sử dụng công cụ Plots Để lựa chọn dạng đồ thị (Histogram), biểu đồ chuẩn tắc, các phép kiểm tra về phân phối chuẩn, tính đồng đều của phương sai: Boxplots: Điều kiện để hiễn thị của Boxplots là ta phải đang quan sát nhiều hơn một biến phụ thuộc (hiễn thị trong ô dependent list). Factor levels together đưa ra một hiển thị riêng biệt cho mỗi biến phụ thuộc. Trong phạm vi một hiển thị, Boxplots được hiển thị cho mỗi một nhóm được phân ra theo giá trị của biến điều khiển (factor variable). Dependents together đưa ra một hiển thị riêng biệt theo mỗi nhóm được phân theo các giá trị trong biến điều khiển. Trong phạm vi của hiễn thị, boxplots được đưa ra lần lượt cho mỗi biến phụ thuộc Descriptive: Cho phép lựa chọn hiển thị dạng đồ thị Histogram hay dạng cành lá (stem-and-leaf plots) Sử dụng công cụ Plots Normality plots with tests . Đưa ra các dạng đồ thị về phân phối chuẩn. Đồng thời cung cấp một kiểm nghiệm thống kê Kolmogorov-Smirnov statistic, với mức tin cậy Lilliefors dùng để kiểm nghiện tính chuẩn của phân phối mẫu đang quan sát. Spread vs. Level with Levene Test . Cho phép chúng ta kiểm tra tính đồng đều của phương sai giữa các mẫu trong dữ liệu gốc hay dữ liệu đã được biến đổi. Kiểm định Kolmogorov-Smirnov (Lilliefors) Kiểm định Lilliefors là một dạng kiểm định Kolmogorov-Smirnov, dùng để kiểm định tính chuẩn của một mẫu hay hai mẫu. Với giá trị sig. nhỏ hơn mức ý nghĩa (0.05) là kết quả bác bỏ giả thuyết phân phối mẫu là phân phối chuẩn.. Kiểm định Levene Kiểm định Levene là phép kiểm định tính đồng nhất của phương sai. ở đây ta kiểm định giả thuyết cho rằng phương sai của giữa các mẫu quan sát là bằng nhau. Kiểm định cho ta kết quả Sig. nhỏ hơn mức tin cậy (5%) ta kết luận không chấp nhận giả thuyết cho rằng phương sai mẫu thì bằng nhau. Áp dụng vào bài tập tình huống. Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Áp dụng vào bài tập tình huống. Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Áp dụng vào bài tập tình huống. Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Áp dụng vào bài tập tình huống. Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Áp dụng vào bài tập tình huống. Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Áp dụng vào bài tập tình huống. Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại 2. Bảng phân bố tần suất Bảng phân phối tần suất được thể hiện với tất cả các biến định tính (rời rạc) với các thang đo định danh, thứ bậc và các biến định lượng (liên tục) với thang đo khoảng cách hoặc tỉ lệ. Từ thanh menu chọn: Analyze / Descriptive Statistics / Frequencies Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Frequencies Chọn một hoặc một số biến định lượng hoặc định tính Nhắp Statistics để có các thống kê mô tả đối với biến định lượng Nhắp Charts để có đồ thị thanh, đồ thị tròn, và biểu đồ tần suất. Nhắp Format để có trật tự mà các kết quả được thể hiện. Frequencies Statistics Percentile Values . Các trị số của một biến định lượng chia dữ liệu có thứ bậc vào thành các nhóm sao cho một tỷ lệ % cụ thể là nằm trên nó và một tỷ lệ % khác nằm dưới nó. Các số tứ phân vị chia các quan sát ra thành 4 nhóm có cùng số lượng quan sát. Nếu muốn một số lượng các nhóm lớn hơn 4, hãy chọn Cut points for n equal groups. Cũng có thể xác định các số phân vị riêng biệt (ví dụ, phân vị thứ 95, là trị số mà nằm dưới nó là 95% số lượng quan sát). Central Tendency . Các thống kê mô tả trung tâm của một phân bố bao gồm trung bình, trung vị, mode, và tổng mọi trị số. Dispersion . Các thống kê đo đạc độ lớn của sự biến thiên bao gồm độ lệch chuẩn, phương sai, phạm vi, trị số lớn nhất, nhỏ nhất, và sai số chuẩn của trung bình. Distribution . Skewness {Độ lệch} và Kurtosis {độ nhọn} là các thống kê mô tả hình dạng và độ cân xứng của một phân bố. Value are group midpoints . Nếu các trị số trong dữ liệu là điểm giữa của các nhóm, hãy chọn tuỳ chọn này để ước lượng trung vị và các phân vị cho dữ liệu thô, không nhóm gộp. Frequencies Charts các nhóm dưới dạng hình ảnh. Một biểu đồ tần số {Histogram} cũng có các thanh, nhưng chúng được vẽ dọc theo một thang đo khoảng bằng nhau. Chiều cao của từng thanh là số lượng của các trị số của một biến định lượng rơi vào trong khoảng. Một biểu đồ tần suất thể hiện hình dạng, trung tâm, và độ trải rộng của phân bố. Một đường cong chuẩn đặt chồng thêm vào một biểu đồ tần suất giúp bạn xét đoán liệu chừng dữ liệu có phân bố chuẩn. Chart Values . Đối với đồ thị thanh, trục thang đo có thể được đặt nhãn bởi số lượng hoặc tỷ lệ %. Chart Type : Một đồ thị tròn {pie chart} thể hiện phân bố của các bộ phận trong toàn bộ. Từng miếng của đồ thị tròn tương ứng với một nhóm được xác định bởi một biến lập nhóm. Một đồ thị thanh {bar chart} thể hiện số lượng/tần số của từng trị số riêng biệt hoặc từng nhóm như là một thanh riêng, cho phép bạn so sánh Áp dụng vào bài tập tình huống. Áp dụng vào bài tập tình huống. Sau đó chúng ta có thể áp dụng Excel để làm lại bảng và trình bày cho đẹp như bên dưới Độ tuổi Tần số Tần suất (%) Tần số tích lũy Tần suất tích lũy(%) 30-35 2 6.67 2 6.67 35-40 2 6.67 4 13.33 40-45 0 0 4 13.33 45-50 6 20 10 33.33 50-55 4 13.33 14 46.67 55-60 1 3.33 15 50 60-65 6 20 21 70 65-70 4 6.67 23 76.67 70-75 2 13.33 27 90 75-80 3 10 30 100 Tổng 30 100 / / Áp dụng vào bài tập tình huống. 3. Mô tả dữ liệu (Descriptive) Sử dụng Statisticts\Summaries\Descriptives để mở hộp thoại mô tả thống kê Đây là một dạng công cụ khác có thể được dùng để tóm tắc dữ liệu và chỉ cho phép thao tác trên dạng dữ liệu định lượng (thang đo khoảng và tỷ lệ). Được dùng để thể hiện xu hướng tập trung của dữ liệu (central tendency) thông qua giá trị trung bình của các giá trị trong biến (mean), và mô tả sự phân tán của dữ liệu thông qua phương sai và độ lệch chuẩn. Chuyển các biến cần tóm tắt vào hộp thoại variables và nhấp thanh options để lựa chọn các thông số thống kê cần mô tả, như giá trị trung bình–mean, giá trị tối thiểu, giá trị tối đa, phương sai và độ lệch chuẩn 4. Lập bảng nhiều chiều cho các biến một trả lời Bảng nhiều chiều là dạng bảng chéo thể hiện tần suất xuất hiện của một biến này trong mối quan hệ với một hay nhiều biến khác. Bảng chéo còn cung cấp nhiều loại kiểm định thống kê và đo lường mối quan hệ và tương quan giữa các biến trong bảng Chọn trên menu Statistics/Summaries/Crosstabs Các biến trong tập dữ liệu được hiển thị bên hộp bên trái. Chọn các biến hàng đưa vào hộp Row(s) và các biến cột đưa vào hộp Column(s). Thông thường biến phụ thuộc hay biến cần quan sát thường được đưa và hàng (rows) và biến độc lập hay biến kiểm soát được đưa và cột (columns). Crosstabs Ngoài ra, chúng ta có thể đưa thêm vào bảng chéo các biến điều khiển (layer) để tạo ra các bảng biến chéo nhiều chiều. Mỗi bảng chéo riêng biệt sẽ được tạo ra ứng với mỗi giá trị của mỗi biến điều khiển. Mỗi biến điều khiển sẽ chia bảng chéo thành nhiều nhóm nhỏ hơn. Có thể thêm tối đa 8 biến điều khiển. Việc đưa vào các biến điều khiển này cho phép ta xem xét các mối quan hệ mà lúc ban đầu không thể thấy ngay. Công cụ Cells trong hộp thoại cho phép ta tính toán các hệ số đo lường mối quan hệ giữa các biến đó như % hàng, % cột, % Total tuỳ thuộc vào yêu cầu nghiên cứu. 5. Lập bảng cho biến nhiều trả lời 5.1 Định nghĩa nhóm biến nhiều trả lời (define multi response sets) Trong câu hỏi nhiều trả lời sẽ bao gồm nhiều biến chứa đựng các trả lời có thể có, những biến này gọi là biến sơ cấp. Do đó để xữ lý, chúng ta phải gộp các biến sơ cấp này thành một biến gộp chứa các biến sơ cấp. chọn menu Statistics/Multiple Response/Define sets Chọn tất cả những biến sơ cấp liên quan đến một câu hỏi nhiều trả lời ở hộp thoại Set Definition bên trái chuyển sang hộp thoại Variables in Set bên phải Sau đó chỉ định cách mã hóa các biến đó (dichotomy hay category); dãy giá trị mã hóa (Range Through) xác định khoảng biến thiên cho các giá trị trong biến gộp; xác định tên và gán nhãn cho biến gộp. Sau đó ấn thanh Add để đưa tên nhóm vừa xác định vào hộp Multi Response Sets. Lập bảng cho biến nhiều trả lời 5.2 Lập bảng cho các biến nhiều trả lời: Sử dụng các tên nhóm đa biến đã được định nghĩa bằng công cụ Define Multi Response Sets đã được đề cập ở phần trên sau đó vào Statistics\Multiple response và chọn Frequencies hoặc Crosstabs tùy theo nhu cầu lập bảng một chiều hay đa chiều. Chú ý : Trong các công cụ Frequencies và Crosstabs sử dụng cho biến nhiều trả lời chỉ mô tả tần suất xuất hiện của các giá trị trong biến gộp và các tỷ lệ % nhưng không có các phương pháp kiểm định thống kê kèm theo. Lập bảng Khi tiến hành lập bảng mô tả thống kê cho kết quả cuối cùng của vấn đề nghiên cứu có thể dùng các công cụ trong statistics\custom table để tạo ra các bảng biểu (có thể là bảng một chiều, bảng nhiều chiều): Bảng biểu thể hiện tần số xuất hiện ( Tables of frequencies ): Cho phép chúng ta tạo ra những bảng biểu thể hiện tần số xuất hiện của một hay nhiều biến đơn Dạng bảng biểu cơ bản ( Basic tables ): Thể hiện các dữ liệu nghiên cứu theo dạng bảng chéo ( cross-tabulation ) giữa hai biến hoặc giữa một biến và một nhóm các biến. Dạng bảng đa biến ( Multiple response tables ): Giống như basic tables thể hiện tần suất xuất hiện và bảng chéo, tuy nhiên dạng bảng biểu này cho phép ta xây dựng bảng biểu cho các câu trả lời đa biến Dạng bảng biểu tổng hợp ( General tables ): Giống như bảng biểu cơ bản và đa trả lời. Các dữ liệu được thể hiện dưới dạng bảng chéo, tuy nhiên ở dạng bảng biểu này cho phép người phân tích thể hiện mối liên hệ giữa một biến với nhiều biến khác trên cùng một bảng. 6. Trụ và xoay bảng trên Output Viewer (Pivot table) Nhấp đúp chuột vào bảng cần tương tác hoặc chấp chuột một lần vào bảng trên vùng Viewer rồi chọn tính năng Pivot trên Menu-bar Pivot table (tt) Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Pivot table (tt) Áp dụng tính năng Kéo-thả (drag-drop) để kéo biểu tượng “statistics” vào thả lên vùng trình chiếu trên nhằm đổi chiều của bảng từ dọc sang trình chiếu ngang. Pivot table (tt) Pivot table (tt)
File đính kèm:
- bai_giang_thong_ke_kinh_doanh_va_spss_bai_3_thong_ke_mo_ta_t.ppt