Giáo trình Phần mềm Epidata - Phạm Việt Cường

BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU

Sẽ rất khó để có thể hình dung về mục đích, ý nghĩa của các công việc mà chúng ta

thực hiện với Epidata, nếu như chúng chỉ được hướng dẫn thực hành với phần mềm.

Vì vậy, mục tiêu của bài học này là giới thiệu về phần mềm Epidata, quá trính thu thập

xử lý số liệu và những kiến thức liên quan đến dữ liệu (số liệu).

1. Phần mềm Epidata là gì?

EpiData là phần mềm hỗ trợ nhập và quản lý số liệu, được lập trình bởi Bác sĩ Jens

M.Lauritsen, người Đan Mạch. Phần mềm này đã được sử dụng lần đầu tiên cho một

nghiên cứu dịch tễ học “Phòng chống tai nạn”.

pdf 104 trang phuongnguyen 14200
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Phần mềm Epidata - Phạm Việt Cường", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Giáo trình Phần mềm Epidata - Phạm Việt Cường

Giáo trình Phần mềm Epidata - Phạm Việt Cường
TRƯỜNG ĐẠI HỌC Y TẾ CÔNG CỘNG 
BỘ MÔN TIN HỌC – THỐNG KÊ 
TÀI LIỆU GIẢNG DẠY MÔN KỸ THUẬT MÁY TÍNH 
PHẦN MỀM EPIDATA 
HÀ NỘI, NĂM 2006 
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 2 
OOOOOOOOOOOOOOOOOOOOOOOOOOOOO 
CHỦ BIÊN 
Kỹ sư Phạm Việt Cường 
NHÓM BIÊN SOẠN 
Cử nhân Mạc Văn Huy 
Cử nhân Chử Việt Anh 
Cử nhân Trương Đức Tùng 
THƯ KÝ BIÊN SOẠN 
Cử nhân Mạc Văn Huy 
OOOOOOOOOOOOOOOOOOOOOOOOOOOOO 
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 3 
MỤC LỤC 
BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU .......................... 6 
1. Phần mềm Epidata là gì? ........................................................................................ 6 
2. Đặc điểm của phần mềm Epidata ........................................................................... 6 
3. Tiến trình thu thập và xử lý số liệu ....................................................................... 7 
4. Chu trình của số liệu ............................................................................................... 8 
5. Kiểu dữ liệu .......................................................................................................... 10 
BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA .................................................. 16 
1. Cài đặt Epidata ..................................................................................................... 16 
1.1 Tải tệp chương trình cài đặt ............................................................................. 16 
1.2 Cài đặt chương trình ........................................................................................ 20 
2. Khởi động chương trình ....................................................................................... 25 
3. Thiết lập tùy chọn chương trình .......................................................................... 29 
4. Tệp liên đới ........................................................................................................... 37 
BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU ............................ 40 
1. Khai báo bộ câu hỏi .............................................................................................. 40 
2. Hạn chế lỗi số liệu ................................................................................................ 52 
2.1 Lỗi số liệu ........................................................................................................ 52 
2.2 Phát hiện lỗi dữ liệu ......................................................................................... 53 
2.3 Kiểm tra lỗi dữ liệu ......................................................................................... 54 
3. Thiết lập ràng buộc số liệu với phần mềm Epidata .............................................. 55 
4. Liên kết các tệp dữ liệu liên quan với lệnh RELATE .......................................... 64 
BÀI 4: NHẬP DỮ LIỆU ............................................................................................. 71 
1. Nhập số liệu .......................................................................................................... 71 
2. Xem dữ liệu .......................................................................................................... 77 
3. Xem cấu trúc tệp REC .......................................................................................... 77 
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 4 
4. Liệt kê số liệu ....................................................................................................... 78 
5. Xem mô tả số liệu ................................................................................................. 79 
BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU ...................................... 82 
1. Ghép tệp số liệu .................................................................................................... 82 
2. Xuất nhập tệp số liệu ............................................................................................ 87 
2.1 Xuất tệp số liệu ................................................................................................ 87 
2.2 Nhập tệp số liệu ............................................................................................... 88 
BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH ...................................................................... 90 
1. Sửa tên trường ...................................................................................................... 90 
2. Sao chép cấu trúc tệp REC ................................................................................... 91 
3. Đếm bản ghi theo trường dữ liệu .......................................................................... 93 
4. So sánh hai tệp dữ liệu .......................................................................................... 95 
5. Đóng gói tệp số liệu .............................................................................................. 96 
6. Tạo tệp QES từ tệp REC ...................................................................................... 97 
BÀI TẬP TỔNG KẾT ................................................................................................. 98 
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 5 
LỜI GIỚI THIỆU 
Tài liệu này được viết bởi các cán bộ Bộ môn Tin học – Thống kê, Trường Đại học Y 
tế công cộng, được sử dụng làm giáo trình phục vụ cho giảng dạy và là tài liệu tham 
khảo cho sinh viên và học viên Y tế công cộng và các đối tượng tự học khác. Tài liệu 
cung cấp cho người học những kiến thức, kỹ thuật làm việc với số liệu sử dụng phần 
mềm Epidata. 
Nội dung tài liệu được chia làm 6 bài học, lần lượt cung cấp cho người học những 
kiến thức, kỹ thuật liên quan đến các bước trong tiến trình thu thập và xử lý số liệu 
trong gian đoạn trước phân tích thống kê số liệu. Tài liệu cũng cung cấp cho người 
học một cách tiếp cận đơn giản với các khái niệm về số liệu và hướng dẫn người học 
sử dụng phần mềm Epidata trong thu thập và xử lý số liệu. Tài liệu này cũng giúp 
người học hình dung được họ phải làm gì và làm như thế nào để có một bộ số liệu 
phục vụ cho thống kê phân tích số liệu. 
Tài liệu này được xây dựng lần đầu tiên nên khó tránh khỏi những thiếu sót. Chúng tôi 
mong muốn các học viên, giảng viên cũng như bạn đọc sẽ đưa ra các ý kiến đóng góp 
quý báu để tài liệu ngày càng hoàn thiện và phục vụ người đọc tốt hơn. 
Hà Nội, tháng 11 năm 2006 
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 6 
 BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 
Sẽ rất khó để có thể hình dung về mục đích, ý nghĩa của các công việc mà chúng ta 
thực hiện với Epidata, nếu như chúng chỉ được hướng dẫn thực hành với phần mềm. 
Vì vậy, mục tiêu của bài học này là giới thiệu về phần mềm Epidata, quá trính thu thập 
xử lý số liệu và những kiến thức liên quan đến dữ liệu (số liệu). 
1. Phần mềm Epidata là gì? 
EpiData là phần mềm hỗ trợ nhập và quản lý số liệu, được lập trình bởi Bác sĩ Jens 
M.Lauritsen, người Đan Mạch. Phần mềm này đã được sử dụng lần đầu tiên cho một 
nghiên cứu dịch tễ học “Phòng chống tai nạn”. 
2. Đặc điểm của phần mềm Epidata 
Trước khi EpiData ra đời, đã có những phần mềm được sử dụng để nhập liệu và thực 
hiện các công việc thống kê số liệu như EpiInfo (do Tổ chức Y tế Thế giới xây dựng) 
và những sản phẩm thương mại có sẵn khác. Tuy nhiên, những phần mềm đó không có 
nhiều ưu điểm như phần mềm Epidata. Phần mềm Epidata đơn giản, dễ sử dụng, có 
khả năng kiểm tra và hạn chế lỗi số liệu, đặc biệt là khả năng hỗ trợ tạo ra công cụ 
nhập liệu nhanh hơn nhiều so với các phần mềm khác. 
Ý tưởng của người phát triển phần mềm EpiData là việc tạo ra một phần mềm nhập 
liệu miễn phí, giao diện người dùng thân thiện, dễ sử dụng. Với Epidata, người sử 
dụng có thể nhập số liệu dưới dạng văn bản đơn giản và sau đó chuyển đổi số liệu 
sang các dạng khác nhau để phục vụ cho việc phân tích thống kê số liệu bằng các 
phần mềm khác nhau. Phần mềm Epidata có những đặc điểm sau: 
ƒ Epidata được phát triển nhằm phục vụ cho mục đích nghiên cứu và học tập, hỗ 
trợ cho quy trình quản trị số liệu. 
ƒ Epidata có giao diện người dùng thân thiện và tạo ra tiến trình làm việc đơn 
giản. Những người sử dụng có trình độ Tin học khác nhau đều có thể dễ dàng 
học tập và sử dụng được phần mềm này trong một thời gian rất ngắn. 
ƒ EpiData là sản phần hoàn toàn miễn phí, người sử dụng có thể tải chương 
trình cài đặt từ trang Web  
ƒ EpiData có thể chạy trên các máy tính cài đặt hệ điều hành Microsoft Windows 
hoặc Macintosh. 
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 7 
ƒ Epidata có thể xuất số liệu sang nhiều dạng khác nhau để sử dụng cho phân 
tích số liệu bằng các phần mềm như Stata, Spss, .v.v. 
Những ưu điểm của Epidata đã khiến cho phần mềm này được nhiều người sử dụng 
trên thế giới lựa chọn. Tuy nhiên, Epidata không có phiên bản hỗ trợ tiếng Việt, vì 
vậy, cộng đồng sử dụng tiếng Việt nên sử dụng tiếng Việt không dấu khi làm việc với 
Epidata. 
3. Tiến trình thu thập và xử lý số liệu 
Tiến trình thu thập và xử lý số liệu gồm nhiều bước nối tiếp nhau. Đây là công việc rất 
tỷ mỉ. Chất lượng của số liệu có ảnh hưởng quyết định đến tính chính xác của kết quả 
phân tích số liệu. Các bước của tiến trình thu thập và xử lý số liệu như sau: 
1. Điều tra viên phỏng vấn, thu thập số liệu. 
2. Điều tra viên kiểm tra thông tin trên phiếu đã phỏng vấn để xác định lỗi 
và sửa lỗi. 
3. Giám sát viên kiểm tra lại các phiếu đã phỏng vấn, chọn ra một số phiếu 
trong số các phiếu đã phỏng vấn và thực hiện phỏng vấn lại để kiếm tra 
đánh giá tính chính xác của những thông tin đã phỏng vấn. 
4. Nhập liệu viên nhập số liệu vào máy tính. 
5. Nhập liệu viên khác hoặc một nhóm nhập liệu viên khác nhập lại số liệu
lần thứ 2. 
6. So sánh số liệu hai lần nhập để tìm lỗi số liệu sinh ra do quá trình nhập
liệu và sửa lỗi. 
7. Kiểm tra ràng buộc số liệu. Tính ràng buộc của số liệu thể hiện những
quy luật của thông tin. Số liệu không thỏa mản các ràng buộc thì số liệu đó
là không chính xác. Ví dụ, thông tin về một sự kiện mang thai phải thuộc
vào những cá nhân có giới tính là nữ. Tuy nhiên, trong cơ sở dữ liệu lại có
những trường hợp cá nhân có giới tính là nam có thông tin về việc mang
thai và sinh đẻ. Đây chính là những số liệu không thỏa mãn ràng buộc số
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 8 
liệu. 
8. Tạo các biến (biến số liệu còn gọi là trường số liệu) mới từ các biến có
sẵn trong cơ sở dữ liệu (cơ sở dữ liệu là một tệp hoặc một tập hợp các tệp
lưu trữ thông tin về số liệu và lưu trữ số liệu). Việc tạo ra biến mới thực
chất là tạo ra các thông tin mới trong cơ sở dữ liệu từ những thông tin ban
đầu. 
9. Liên kết số liệu để tạo ra những bộ số liệu có đủ những biến mong muốn
phục vụ cho mục đích phân tích tích thống kê số liệu. 
10. Xuất tệp số liệu sang các dạng khác. Hiện nay có nhiều dạng tệp số 
liệu khác nhau như các dạng tệp số liệu của phần mềm Spss là dạng tệp 
.SAV, Stata là dạng tệp .DTA và Epi_info là dạng .REC, .v.v. Các phần 
mềm thường chỉ hiểu được dạng tệp mà nó tạo ra. Chẳng hạn, phần mềm 
Epi_info chỉ hiểu được tệp .REC, phần mềm Stata chỉ hiểu được tệp .DTA. 
Điều này có nghĩa là chỉ có thể chạy phân tích số liệu bằng phần mềm 
Epi_info với tệp .REC, phần mềm Stata với tệp .DTA. Chính vì vậy, khi số 
liệu được nhập vào tệp .REC với phần mềm Epidata chỉ sử dụng được cho 
phần mềm Epi_info. Để có thể phân tích số liệu với phần mềm Stata hay 
Spss cần chuyển tệp .REC thành tệp .DTA hoặc .SAV. Việc này gọi là xuất 
tệp số liệu sang các dạng khác nhau. 
4. Chu trình của số liệu 
Số liệu được thu thập thông qua phỏng vấn, hoặc quan sát, hoặc đo đếm .v.v. trên các 
đối tượng nghiên cứu, sau đó được ghi lại trên một phiếu thu thập thông tin (phiếu thu 
thập thông tin còn được gọi là bộ câu hỏi). 
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 9 
Hình 1: Mô tả biến và bản ghi 
Số liệu được thu thập và được điền vào các mục (các câu hỏi) tương ứng trên bộ câu 
hỏi. Qua qúa trình nhập liệu, số liệu được lưu vào cơ sở dữ liệu dưới dạng các bản ghi. 
Mỗi bản ghi thường là một tập hợp các số liệu trên một bộ câu hỏi, được lưu liền kề 
nhau và được gắn kết lại với nhau thành một khối trong cơ sở dữ liệu. 
Hinh 2: Mô tả tệp số liệu 
Tệp số liệu 
Bản ghi 2 
Bản ghi 3 
Bản ghi 1 
Mã số : . 
Họ và tên: 
Ngày sinh:
Giới tính: 
Tình trạng hôn nhân: 
 Biến 1 
 Nhóm biến 
Một bản ghi 
(1 case) 
 Biến 2 
 Biến 3 
 Biến 4 
 Biến 5 
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 10 
Các bản ghi số liệu của các bộ câu hỏi được xếp nối tiếp nhau trong cơ sở dữ liệu với 
cùng một cấu trúc. Cấu trúc đó cũng chính là cấu trúc dữ liệu. Ta có thể hình dung cầu 
trúc dữ liệu được sắp xếp giống như một bảng biểu gồm nhiều hàng nhiều cột, mỗi 
hàng là một bản ghi, mỗi cột là một trường số liệu (gọi là trường) hay còn gọi một biến 
số liệu (gọi là biến) và số liệu được lưu trong mỗi trường đều thuộc vào một dạng duy 
nhất nào đó đã được xác định trước. Ví dụ số liệu trong trường họ và tên là dạng số 
liệu văn bản và số liệu trong trường ngày sinh là số liệu dạng ngày tháng. Các quy 
định về cấu trúc số liệu cũng đảm bảo cho các tính toán trên số liệu cho ra kết quả 
chính xác. Hình 1 và 2 sau đây là minh họa cho liên quan giữa thông tin trên phiếu 
điều tra và các biến trong tệp số liệu, cấu trúc tệp số liệu. Bảng sau đây là ví dụ về số 
liệu trong một tệp số liệu có 4 trường (biến) và có 4 bản ghi. 
5. Kiểu dữ liệu 
Tệp số liệu trong Epidata có cấu trúc gồm nhiều trường, trường có các thuộc tính là 
nhãn, kiểu và độ rộng. Nhãn biến là chú thích về biến, kiểu cho biết dạng số liệu (dạng 
ngày tháng, dạng số, dạng xâu chuỗi văn bản .v.v.) và độ rộng cho biết kích thước lớn 
nhất của số liệu mà biến có thể chứa được. Các dạng số liệu được thu thập ở các câu hỏi 
trên các bộ câu hỏi luôn thuộc vào một dạng số liệu nào đó. Vì vậy, khi xây dựng cơ sở 
dữ liệu để lưu trữ số liệu, người thực hiện công việc này cần nắm được các kiểu dữ liệu 
mà phần mềm hỗ trợ. 
 bản 
ghi 
 trường số liệu (biến) 
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 11 
Hình 3: Kiểu dữ liệu trong Epidata 
Epidata hỗ trợ các kiểu dữ liệu gồm Numeric, ID Number, Text, Date, Boolean và 
Soundex. Những người sử dụng Epidata cần nắm được đặc điểm và cách sử dụng các 
kiểu dữ liệu này. 
5.1.1. Kiểu ID number 
Kiểu ID number là kiểu dữ liệu số tự động và có các đặc điểm sau: 
ƒ Chuỗi định dạng là 
ƒ Một trường số liệu được khai báo kiểu ID number thì giá trị số liệu của trường 
sẽ được tự động nhập khi nhập số liệu. Người sử dụng không được nhập giá trị 
cho trường này. 
ƒ Kiểu ID number thường  ... sang định dạng của Spss 
Chọn các tham số tùy chọn và xuất tệp số liệu 
Khi tệp REC đã được mở, hộp thoại Export Data xuất hiện. Việc tiếp theo là chọn các 
tham số tùy chọn và nhấn OK để thực hiện xuất tệp số liệu. 
[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 88 
Hình 68: Hộp thoại Export data 
Chú ý: Hộp thoại Export Data có các tham số có ý nghĩa như sau: 
ƒ All records: Xuất tất cả các bản ghi của tệp dữ liệu 
ƒ From record # to # : Chỉ xuất các bản ghi từ số # đến số # 
ƒ Select fields: cho phép chọn các trường dữ liệu sẽ xuất hiện ở tệp đầu ra 
(trường được tích trong danh sách sẽ xuất hiện trong tệp đầu ra) 
2.2 Nhập tệp số liệu 
Nếu chức năng xuất tệp số liệu sinh ra tệp số liệu có định dạng khác từ một tệp REC 
thì chức năng nhập tệp số liệu của Epidata tạo ra tệp số liệu REC từ tệp số liệu Excel, 
dBase hoặc Stata. Để nhập tệp số liệu, chọn Import Data từ thực đơn Data in/out trên 
thanh thực đơn, sau đó chọn tệp số liệu đầu vào và chọn OK trên hộp thoại Import 
from Stata (dBase/Text). 
[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 89 
Hình 69: Khởi động chức năng import tệp Stata 
Hình 70: Hộp thoại chọn tệp 
Chú ý: trên hộp thoại nhập tệp số liệu, có thể chọn nút để chọn tệp số liệu đầu vào, 
sau đó chỉ định tên tệp đầu ra (tệp REC) và nơi lưu tệp ở mục Import to. 
Câu hỏi lượng giá 
1. Nêu các bước của kỹ thuật ghép các tệp số liệu. 
2. Nêu ý nghĩa của hai phương thức ghép tệp số liệu Append và Merge. 
3. Vì sao phải thực hiện chuyển định dạng tệp số liệu? 
4. Các bước để thực hiện chuyển định dạng tệp số liệu với chức năng Xuất tệp dữ 
liệu của Epidata. 
[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 90 
 BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 
Bài học này hướng dẫn người học sử dụng các chức năng tiện ích của Epidata. Các 
chức năng này được phát triển dựa trên những yêu cầu thực tế của công việc quản trị 
số liệu, vì vậy, chúng làm cho Epidata trở thành một công cụ hiệu quả đối với người 
sử dụng. 
1. Sửa tên trường 
Thực tế, khi tệp REC được tạo ra, số liệu đã được nhập vào thì người sử dụng lại muốn 
sửa lại tên biến (trường). Người sử dụng có thể sửa lại tên trường trong tệp QES và tạo 
lại tệp REC từ tệp QES. Tuy nhiên, số liệu đã nhập sẽ bị mất nếu ta làm theo cách này. 
Epidata có tính năng sửa tên trường (Rename fields) hỗ trợ đổi tên trường trực tiếp 
trên tệp REC, không làm mất số liệu đã nhập. Để sửa tên trường, ta chọn tools, chọn 
rename fields trên thanh thực đơn chương trình. Khi hộp thoại Open xuất hiện, ta chọn 
tệp REC và chọn Open, hộp thoại change field names sau đó được mở có hình ảnh như 
sau: 
Hình 71: Hộp thoại đổi tên trường 
Hộp thoại trên có ba cột Field name, Label và New field name. Cột Field name chứa 
tên hiện tại của các trường số liệu trong tệp REC, cột Label chứa nhãn biến và cột 
New field name cho phép nhập vào tên mới của các trường số liệu. Để sửa tên trường 
[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 91 
nào, người sử dụng chỉ cần nhập tên mới của các biến vào cột New field name trên 
cùng dòng, tương ứng với tên biến cũ và sau đó chọn Save and close để ghi lại tên biến 
mới và đóng hộp thoại. 
2. Sao chép cấu trúc tệp REC 
Chức năng sao chép cấu trúc tệp REC cho phép người sử dụng sao chép cấu trúc tệp 
REC, không bao gồm số liệu. Chức năng này giúp cho người sử dụng có thể sử dụng 
lại tệp REC để nhập số liệu mà không cần đến tệp QES. Các bước sao chép cấu trúc 
tệp REC gồm khởi động chức năng, chọn tệp REC, đặt các tham số tùy chọn và thực 
hiện copy. 
Khởi động chức năng 
Để khởi động chức năng, ta chọn tool, chọn Copy structure trên thanh thực đơn. 
Hình 72: Khởi động chức năng copy cấu trúc tệp số liệu 
Chọn tệp REC 
Epidata yêu cầu chọn tệp REC trên hộp thoại Select data file to copy sau khi chức 
năng này được khởi động. Tiếp theo, người sử dụng phải chọn tệp REC để hoàn thành 
bước này. 
[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 92 
Hình 73: Chọn tệp REC 
Đặt các tham số tùy chọn và thực hiện Copy 
Khi tệp REC được chọn, Epidata yêu cầu người sử dụng phải chọn các tham số tùy 
chọn trên hộp thoại Copy file structure. 
Hình 74: Đặt tham số tùy chọn với hộp thoại copy cấu trúc tệp REC 
Trong bước này, người sử dụng phải điền vào các tham số tùy chọn trên hộp thoại và 
nhấn nút OK để kết thúc. Các tham số tùy chọn trên hộp thoại gồm: 
ƒ New data file: tên tệp REC mới 
[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 93 
ƒ Don’t copy text field : không copy trường kiểu text 
ƒ Copy check file: copy tệp CHK liên quan tệp REC 
3. Đếm bản ghi theo trường dữ liệu 
Chức năng này đưa ra báo cáo về số lượng bản ghi theo các giá trị số liệu xuất hiện 
trong một trường số liệu nào đó, các bước thực hiện gồm khởi động chức năng, chọn 
tệp REC, đặt các tham số tùy chọn và kết thúc. 
Khởi động chức năng 
Để khởi động chức năng, ta chọn 5.Document, chọn Count Records trên thanh thực 
đơn. 
Hình 75: Khởi động chức năng đếm bản ghi 
Chọn tệp REC, các tham số tùy chọn và kết thúc 
Sau khi khởi động chức năng, Epidata mở hộp thoại Count record by field, yêu cầu 
người sử dụng chọn tệp REC, chọn biến sẽ được sử dụng. Cuối cùng người sử dụng 
phải chọn OK để kết thúc. 
[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 94 
Hình 76: Hộp thoại Count record by field 
Hình 77: Báo cáo kết quả đếm bản ghi theo trường SG1 
Chú ý: Các tham số tùy chọn trên hộp thoại gồm: 
ƒ Enter filename: tên tệp REC 
ƒ Field to evaluate: tên trường sử dụng 
[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 95 
4. So sánh hai tệp dữ liệu 
Chức năng này cho phép người sử dụng đưa ra báo cáo về các thông tin giống và khác 
nhau của số liệu trong hai tệp REC. Chẳng hạn, ta đem so sánh hai tệp thông tin điều 
tra cúm gia cầm được nhập ở bởi hai nhóm nhập liệu khác nhau là cumgiacam1.rec và 
cumgiacam2.rec, các bước thực hiện như sau: 
Khởi động chức năng 
Để khởi động chức năng, ta chọn 5.Document, chọn chọn Validate duplicate files. 
Chọn tệp REC 
Trên hộp thoại Validate files, ta chọn các tệp và chọn OK để chuyển sang bước tiếp 
theo. 
Hình 78: Hộp thoại chọn tệp Validate files 
Chọn các tham số tùy chọn và kết thúc 
Trong bước này, người sử dụng phải chọn các trường khóa (select key fields) và các 
tham số tùy chọn khác (option) như bỏ qua các bản ghi được đánh dấu xóa (ignore 
deleted records), trường kiểu Text (ignore text fields), .v.v. và nhấn OK để đưa ra báo 
cáo. 
[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 96 
Hình 79: Hộp thoại tùy chọn Validate files 
Hình 80: Kết quả so sánh số liệu 
5. Đóng gói tệp số liệu 
[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 97 
Chức năng đóng gói tệp số liệu tạo ra tệp REC mới từ một tệp REC ban đầu, trong đó, 
các bản ghi được đánh dấu xóa không được sao chép sang tệp mới. Để thực hiện đóng 
gói, ta chọn Tool và chọn Pack data file trên thanh thực đơn và chọn tệp REC trong 
hộp thoại Open. Khi nhấn nút Open để kết thúc bước chọn tệp REC, Epidata đưa ra 
thông báo hỏi người sử dụng xác nhận là xóa các bản ghi đã được đánh dấu xóa. Nếu 
đồng ý, người sử dụng nhấn OK để kết thúc và nhấn Cancel để hủy bỏ. 
6. Tạo tệp QES từ tệp REC 
Chức năng này được sử dụng để sinh ra một tệp QES từ một tệp REC. Thực tế, người 
sử dụng có thể muốn sinh ra tệp REC có cấu trúc gần giống với tệp REC đang có, 
nhưng lại chưa có tệp QES. Để có thể tạo nhanh ra một tệp REC như vậy, người sử 
dụng có thể sử dụng chức năng này sinh ra tệp QES từ tệp REC, sửa lại nội dung tệp 
QES và sinh ra tệp REC mong muốn. Để sinh tệp QES từ tệp REC, ta chọn Tool trên 
thanh thực đơn, chọn QES file from REC file, chọn tệp REC trên hộp thoại Create 
QES file from data file và chọn OK để kết thúc. 
Câu hỏi lượng giá 
Hãy nêu tên các tiện ích được nhắc đến trong bài học và chức năng của các tiện ích 
đó. 
[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 98 
 BÀI TẬP TỔNG KẾT 
Giáo trình này đã trình bày những kiến thức và kỹ thuật cần thiết để làm việc với phần 
mềm Epidata. Để giúp cho người học củng cố lại những kiến thức và kỹ thuật trong 
nội dung giáo trình, chúng tôi đưa ra bài tập tổng kết này. Bộ câu hỏi được đưa ra 
dưới đây là một phần trong bộ câu hỏi “Nghiên cứu đánh giá tình trạng hút thuốc lá 
thụ động và sự chấp nhận của xã hội với hút thuốc”. Yêu cầu đặt ra cho những người 
học là hãy sử dụng phẩn mềm Epidata để tạo ra công cụ nhập số liệu cho bộ câu hỏi 
của nghiên cứu này. Các kỹ thuật mà những người học cần thực hiện gồm: khai báo 
bộ câu hỏi, tạo tệp REC, thiết lập ràng buộc số liệu và nhập số liệu. 
/___________________________________________________________________/ 
Nghiên cứu đánh giá tình trạng hút thuốc lá thụ động 
và sự chấp nhận của xã hội với hút thuốc 
(Bộ câu hỏi giành cho phụ nữ) 
Họ và tên:................................................................................................................ 
Họ tên điều tra viên:................................................................................................ 
Họ tên giám sát viên:.................................................................. ............................ 
Ngày phỏng vấn:......................................... ............................... ........................... 
Đồng ý tham gia phỏng vấn: 1. Có 
 2. Không 
Mức độ hoàn thành bảng hỏi: 
1. Hoàn thành 
2. Không gặp (ĐTV đến 3 lần không gặp) 
3. Không có nhà 
4. Không hợp tác 
(Chú ý:1. Tiêu chuẩn lựa chọn đối tượng: Phụ nữ độ tuổi 18-55 (theo danh sách). 
 2. Thay thế đối tượng: Trong trường hợp không gặp, không có nhà, không 
hợp tác: chọn đối tượng nhà liền kề bên tay phái) 
[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 99 
I. THÔNG TIN CHUNG Chuyển câu
C1 Năm sinh (dương lịch) ....................... 
C2 Chị hiện đang sống ở đâu Nông thôn 1 
 Thành thị (thị trấn/thị xã) 2 
C3 Trình độ học vấn cao nhất 
(Với hệ 10 năm: lớp 7 là hết 
cấp II 
Với hệ 11 năm: lớp 8 là hết cấp 
II 
Với hệ 12 năm: lớp 9 là hết cấp 
II) 
Chưa bao giờ đi học 
 Chưa học hết hoặc hết cấp I 
Chưa học hết hoặc hết cấp II 
Chưa học hết hoặc hết cấp III 
Trung cấp 
Cao đẳng, đại học 
Trên Đại học 
1 
2 
3 
4 
5 
6 
7 
C4 Nghề nghiệp chính (nghề 
mang lại thu nhập chính) 
của chị hiện nay là gì? 
Công chức (đang công tác) 
Nông dân 
Công nhân 
Thợ xây, Thợ thủ công 
Học sinh/sinh viên 
Buôn bán nhỏ 
Hưu trí 
Thất nghiệp/Nội trợ 
 Khác, (ghi rõ).......................... 
1 
2 
3 
4 
5 
6 
7 
8 
9 
C5 Tình trạng hôn nhân hiện 
tại 
Đang sống với chồng 
Độc thân 
1 
2 
[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 100 
(Xa nhau vì công việc là 
người chồng có mặt ở nhà 
ít hơn 1 tuần/tháng) 
Ly thân 
Ly dị 
Goá 
Xa nhau vì công việc 
Khác, (ghi rõ)........................ 
3 
4 
5 
6 
7 
C6 Hiện tại chị có hút thuốc lá 
/lào không ? 
Có 
Không 
1 
2 
C7 Trong nhà chị hiện tại có 
ai hút thuốc lá/lào không 
(sống cùng nhà với chị 
trong vòng ít nhất 3 tháng 
trở lại đây)? 
(nhiều lựa chọn) 
Bố 
Chồng 
Anh/em trai 
Khác, (ghi rõ)........................ 
Không ai hút 
1 
2 
3 
4 
5 
ÆC9 
C8 
Nếu có, có bất cứ ai trong 
số những người hút thuốc 
ở cùng nhà với chị trong 
tuần qua không? 
Có 
Không 
1 
2 
1.1.1. II. Thực trạng hút thuốc thụ động 
C9 Trong tuần qua, có bao 
nhiêu ngày chị tiếp xúc với 
khói thuốc ở nhà? 
(phòng khách, phòng ngủ, 
phòng ăn nhà vệ sinh) 
(Chỉ cần tiếp xúc 1 hoặc 
một số lần trong ngày) 
Ghi tổng số 
ngày..... 
(giá trị từ 0 - 7 ngày) 
[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 101 
C10 Trong tuần qua, có bao 
nhiêu ngày chị tiếp xúc với 
khói thuốc ở nơi làm việc? 
(Chỉ hỏi với những người 
đi làm - được trả lương) 
(Chỉ cần tiếp xúc 1 hoặc 
một số lần trong ngày) 
Ghi tổng số 
ngày..... 
(giá trị từ 0 - 7 ngày) 
C11 Trong tuần qua, có bao 
nhiêu ngày chị tiếp xúc với 
khói thuốc ở nơi công 
cộng (bến tàu xe, nơi tập 
trung đông người...)? 
(Chỉ cần tiếp xúc 1 hoặc 
một số lần trong ngày) 
Ghi tổng số 
ngày..... 
(giá trị từ 0 - 7 ngày) 
C12 Con/cháu/trẻ em (nhỏ hơn 
16 tuổi, sống cùng nhà) 
của chị có phải tiếp xúc 
với khói thuốc lá của bất 
cứ thành viên nào sống 
cùng nhà trong tuần qua 
không? 
Có 
Không 
Tôi không có con/trẻ con sống 
cùng nhà 
Không biết/không trả lời 
1 
2 
3 
4 
C13 Câu nói nào sau đây mô tả 
đúng nhất tình trạng tiếp 
xúc với khói thuốc của các 
thành viên trong nhà chị? 
(Đọc các phương án trả 
Mọi người có thể tiếp xúc khói 
thuốc ở bất cứ đâu trong nhà 
vào bất cứ lúc nào 
Mọi người tiếp xúc khói thuốc ở 
một số nơi, và/hoặc vào một lúc 
nào đó 
1 
2 
3 
[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 102 
lời) Mọi người không bao giờ phải 
tiếp xúc khói thuốc trong nhà 
Không biết/không trả lời 
4 
III. Hiểu biết về tác hại của khói thuốc lá 
C14 Theo chị khói thuốc của 
người hút thuốc có ảnh 
hưởng tới sức khỏe của 
người xung quanh không? 
Có 
Không 
Không biết/ không trả lời 
1 
2 
3 
Æ C16 
Æ C16
C15 Theo chị nếu hít phải khói 
thuốc có thể gây bệnh thì 
đó là bệnh gì? 
(nhiều lựa chọn, để tự trả 
lời) 
 Bệnh phổi/phế quản/ho & 
viêm họng 
Ung thư phổi 
Lao phổi 
Bệnh tim mạch 
Gày yếu suy nhược 
Khác (ghi 
rõ):.................. 
1 
2 
3 
4 
5 
6 
C16 Theo chị phụ nữ có thai hít 
phải khói thuốc thì có hại 
không? 
(để phụ nữ đánh giá mức 
độ có hại của khói thuốc 
thụ động dựa vào thang đo 
bên) 
Rất có hại 
Có hại 
Không có ý kiến gì/ko chắc chắn 
Không có hại lắm 
Hoàn toàn không có hại 
1 
2 
3 
4 
5 
ÆC18 
C17 Theo chị thì khói thuốc có 
thể gây ra những bệnh gì 
Sinh con nhẹ cân 1 
[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 103 
cho phụ nữ có thai và thai 
nhi? 
(nhiều lựa chọn, để tự trả 
lời) 
Tăng nguy cơ trẻ sinh ra bị ung thư 
não, máu trắng 
Viêm đường hô hấp cấp tính trẻ em 
Sảy thai/đẻ non 
Không biết/không trả lời 
Khác (ghi rõ):................................ 
2 
3 
4 
5 
6 
C18 Theo chị khói thuốc có hại 
đến sức khỏe của trẻ em 
không? 
(để phụ nữ đánh giá mức 
độ có hại của khói thuốc 
thụ động dựa vào thang đo 
bên) 
Rất có hại 
Có hại 
Không có ý kiến gì/không chắc 
chắn 
Không có hại lắm 
Hoàn toàn không có hại 
1 
2 
3 
4 
5 
ÆC20 
C19 Nếu có hại thì khói thuốc 
có thể gây bệnh gì cho trẻ 
em? 
(nhiều lựa chọn, để tự trả 
lời) 
Viêm đường hô hấp 
 Tăng nguy cơ các bệnh 
về tim Hen suyễn 
Viêm tai giữa 
Không biết 
Khác (ghi 
rõ):.......................................... 
1 
2 
3 
4 
5 
6 
/___________________________________________________________________/ 
[Bộ môn Tin học – Đại học YTCC] | TÀI LIỆU THAM KHẢO 104 
 TÀI LIỆU THAM KHẢO 
1. Epidata for data entry and documentation, Ziad EI, Clinical Cancer Epidemiology, 
2004 
2. Jens ML, Michael BR, Epidata Help, The Epidata Association, Odense 
Denmark,26/10/2004 

File đính kèm:

  • pdfgiao_trinh_phan_mem_epidata_pham_viet_cuong.pdf