Tính giá trị và độ tin cậy của đề thi MCQ sản khoa cho sinh viên y năm thứ tư năm học 2014-2015

Đặt vấn đề: Sử dụng MCQ để lượng giá kiến thức đã được dùng rộng rãi tại Khoa Y, đại học Y Dược

Thành phố Hồ Chí Minh, nhưng rất ít nghiên cứu đã được thực hiện về chất lượng của những kỳ thi MCQ này.

Mục tiêu: Xác định tính giá trị và độ tin cậy của đề thi MCQ sản khoa sinh viên y năm thứ tư năm học

2014-2015.

Đối tượng - Phương pháp nghiên cứu: Sinh viên Y4 tham gia thi trắc nghiệm Sản khoa học kỳ 1 và học kỳ

2 năm học 2014-2015 được thăm dò ý kiến bằng bảng câu hỏi về các yếu tố bên ngoài ảnh hưởng đến tính giá trị

đề thi và về nội dung đề thi. Kết quả thi của sinh viên được thu thập để tính độ tin cậy của đề thi bằng hệ số

Kuder Richardson 20 và các chỉ số của câu hỏi. Phỏng vấn người chịu trách nhiệm chính trong việc ra đề thi về

quá trình hình thành đề thi. Một nhóm 4 giảng viên của bộ môn Sản đánh giá đề thi của học kỳ 1 và học kỳ 2 để

xem xét liệu 2 đề thi có tương đồng với nhau về mặt nội dung. Kết quả thống kê mô tả được phân tích và so sánh

dữ liệu từ đề thi hai học kỳ.

pdf 8 trang phuongnguyen 140
Bạn đang xem tài liệu "Tính giá trị và độ tin cậy của đề thi MCQ sản khoa cho sinh viên y năm thứ tư năm học 2014-2015", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Tính giá trị và độ tin cậy của đề thi MCQ sản khoa cho sinh viên y năm thứ tư năm học 2014-2015

Tính giá trị và độ tin cậy của đề thi MCQ sản khoa cho sinh viên y năm thứ tư năm học 2014-2015
Y Học TP. Hồ Chí Minh * Tập 25 * Số 2 * 2021 Nghiên cứu Y học 
Chuyên Đề Y Tế Công Cộng 182 
TÍNH GIÁ TRỊ VÀ ĐỘ TIN CẬY CỦA ĐỀ THI MCQ SẢN KHOA CHO 
SINH VIÊN Y NĂM THỨ TƯ NĂM HỌC 2014-2015 
Đoàn Thị Thu Hoa1, Âu Nhựt Luân2 
TÓM TẮT 
Đặt vấn đề: Sử dụng MCQ để lượng giá kiến thức đã được dùng rộng rãi tại Khoa Y, đại học Y Dược 
Thành phố Hồ Chí Minh, nhưng rất ít nghiên cứu đã được thực hiện về chất lượng của những kỳ thi MCQ này. 
Mục tiêu: Xác định tính giá trị và độ tin cậy của đề thi MCQ sản khoa sinh viên y năm thứ tư năm học 
2014-2015. 
Đối tượng - Phương pháp nghiên cứu: Sinh viên Y4 tham gia thi trắc nghiệm Sản khoa học kỳ 1 và học kỳ 
2 năm học 2014-2015 được thăm dò ý kiến bằng bảng câu hỏi về các yếu tố bên ngoài ảnh hưởng đến tính giá trị 
đề thi và về nội dung đề thi. Kết quả thi của sinh viên được thu thập để tính độ tin cậy của đề thi bằng hệ số 
Kuder Richardson 20 và các chỉ số của câu hỏi. Phỏng vấn người chịu trách nhiệm chính trong việc ra đề thi về 
quá trình hình thành đề thi. Một nhóm 4 giảng viên của bộ môn Sản đánh giá đề thi của học kỳ 1 và học kỳ 2 để 
xem xét liệu 2 đề thi có tương đồng với nhau về mặt nội dung. Kết quả thống kê mô tả được phân tích và so sánh 
dữ liệu từ đề thi hai học kỳ. 
Kết quả: Một số yếu tố bên ngoài có thể ảnh hưởng đến tính giá trị của đề thi đã được loại trừ, tuy nhiên đề 
thi được sinh viên đánh giá là khó và thời gian thi không đủ. Độ tin cậy của đề thi ở 2 học kỳ thấp (0,4920 ở học 
kỳ 1 và 0,6235 ở học kỳ 2). Đề thi có độ khó trung bình (0,560 học kỳ 1 và 0,563 học kỳ 2), nhưng độ phân cách 
không cao ở mức tạm được (0,203 và 0,230). Quá trình xây dựng đề thi không được chặt chẽ do không có test 
blueprint cụ thể. Tỷ lệ các câu hỏi phân bố chưa cân đối. Hệ số tương quan Pearson giữa 2 đề thi là 0,73 (p <0,01) 
khi xét phân bố câu hỏi theo bài học, tuy nhiên, khi xét theo chủ đề thì hệ số tương quan Pearson không có ý nghĩa 
thống kê (hệ số tương quan Pearson 0,601, p=0,051). 
Kết luận: Đề thi trắc nghiệm Sản cho sinh viên y năm thứ tư năm học 2014-2015 có độ tin cậy thấp, tính 
giá trị về mặt nội dung chưa cao. 
Từ khóa: tính giá trị, độ tin cậy 
ABSTRACT 
VALIDITY AND RELIABILITY OF MCQ EXAMS OF OBSTETRICS-GYNECOLOGY FOR FOURTH 
YEAR STUDENTS IN ACADEMIC YEAR 2014-2015 
Doan Thi Thu Hoa, Au Nhut Luan 
* Ho Chi Minh City Journal of Medicine * Vol. 25 - No. 1 - 2021: 182 - 189 
Background: MCQ has been widely used to assess knowledge in Faculty of Medicine, University of 
Medicine and Pharmacy at Hochiminh city, but very few researches have been done on the quality of these 
MCQ exams. 
Objective: Investigate validity and reliability of MCQ exams of Obstetrics-Gynecology for fourth year 
students in academic year 2014-2015. 
Methods: Fourth year students in academic year 2014-2015 participating in MCQ final exams of OB-GYN 
were asked for their opinions by a questionaire (14 items) about test content and extraneous factors that could 
1Trung tâm huấn luyện nâng cao mô phỏng lâm sàng, Khoa Y, Đại học Y Dược TP. Hồ Chí Minh 
2Bộ môn Sản phụ khoa, Khoa Y, Đại học Y Dược TP. Hồ Chí Minh 
Tác giả liên lạc: BS. Đoàn Thị Thu Hoa ĐT: 0918992334 Email: [email protected] 
Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 25 * Số 2 * 2021 
Chuyên Đề Y Tế Công Cộng 183 
influence test validity. Student test results were collected to calculate test reliability using the Kuder Richardson 
20 coefficient and item analysis. Interviewing the test developer about test construction and a panel of 4 OBGYN 
lecturers judged whether the two exams assessed similar content. The descriptive statistical results were analyzed 
and data from two semester exams were compared. 
Results: Extraneous factors that could influence test validity had been excluded, however, according to 
student’s perspectives, tests were considered as difficult and had inadequate testing time. Test reliability was low 
in the 2 semesters (0.4920 in semester 1 and 0.6235 in semester 2). The tests had moderate difficulty index (0.560 
semesters 1 and 0.563 semesters 2), and moderate discrimination index (0.203 and 0.230). The test construction 
process was not rigorous as a formal specific test blueprint had not been developed. Items were distributed at some 
extent disproportion. The Pearson correlation coefficient between the two tests was 0.73 (p <0.01) when 
considering the item distribution across lessons, however, when considering item distribution across topics, the 
Pearson correlation coefficient was not statistically significant (coefficient 0.601, p=0.051). 
Conclusion: MCQ exams of Obstetrics-Gynecology for fourth year students in academic year 2014-2015 
has low reliability and not high content validity. 
Keywords: validity, reliability 
ĐẶT VẤN ĐỀ 
Lượng giá sinh viên đóng vai trò quan trọng 
trong chương trình giảng dạy. Việc lượng giá 
trong giáo dục y khoa có xu hướng dùng các 
phương pháp lượng giá khách quan, cụ thể là thi 
trắc nghiệm câu hỏi nhiều lựa chọn Multiple 
Choice Question (MCQ). 
Tổng quan tài liệu cho thấy rằng để xây 
dựng được một đề thi có tính giá trị cao đòi hỏi 
một qui trình chặt chẽ nhất định. Quá trình xây 
dựng đề thi bao gồm những bước sau(1,2,3,4): (1) 
Xác định mục đích của kỳ thi; (2) Xây dựng test 
blueprint, bao gồm liệt kê các mục tiêu và nội 
dung, tỉ lệ các câu hỏi phân bố cho mỗi mục tiêu 
và nội dung đó; (3) Viết câu hỏi hoặc rút câu hỏi 
từ ngân hàng theo test blueprint, cần rút câu hỏi 
nhiều hơn số câu hỏi đã dự định để đảm bảo 
rằng sẽ có sẵn câu hỏi dự bị nếu như có những 
câu hỏi bị loại bỏ, mục tiêu của bước này là có 
được đề thi có tính đại diện; (4) Xem lại câu hỏi 
đã được lấy ra, bao gồm kiểm tra lại nội dung 
mục tiêu, đáp án và lỗi kĩ thuật của các mồi nhử; 
(5) Bản thảo đề thi được kiểm tra một lần nữa và 
sửa chữa những lỗi đánh máy và câu hỏi trùng 
lắp; (6) Sau khi thi xong, các câu hỏi được xem 
xét một lần nữa dựa trên phân tích thống kê và ý 
kiến sinh viên. 
Sử dụng MCQ để lượng giá kiến thức đã 
được dùng rộng rãi tại Khoa Y, Đại học Y Dược 
Thành phố Hồ Chí Minh. Dù đã được dùng rộng 
rãi, nhưng rất ít nghiên cứu đã được thực hiện 
về chất lượng của những kỳ thi MCQ này. Tính 
giá trị và độ tin cậy là 2 đặc tính quan trọng đối 
với bất kỳ một kỳ thi nào, do đó tính giá trị và độ 
tin cậy phản ánh chất lượng của đề thi. Một 
nghiên cứu về tính giá trị và độ tin cậy của đề thi 
MCQ Nhi khoa cho sinh viên y năm thứ tư năm 
học 2002-2003(5) đã cho thấy các vấn đề gồm: 
chưa xây dựng test blueprint, các câu hỏi phân 
bố không cân đối giữa các bài học, hệ số tương 
quan giữa hai đề thi khi xem xét số câu hỏi phân 
bố giữa các bài học là 0,6, và độ tin cậy của đề thi 
là 0,79. 
Nhằm mục tiêu nhận diện thực trạng của 
đề thi MCQ, nghiên cứu này nhằm mục đích 
xác định tính giá trị và độ tin cậy của đề thi 
MCQ sản khoa sinh viên y năm thứ tư năm 
học 2014-2015. 
ĐỐI TƯỢNG - PHƯƠNG PHÁP NGHIÊN CỨU 
Đối tượng nghiên cứu 
311 sinh viên Y4 thi Sản học kỳ 1 và 280 sinh 
viên Y4 thi Sản học kỳ 2 đã trả lời bảng thăm dò 
ý kiến về đề thi MCQ mới vừa thi xong bằng 
bảng questionaire gồm 14 câu hỏi về những yếu 
tố bên ngoài có ảnh hưởng đến tính giá trị của đề 
thi và về nội dung đề thi. Đối với mỗi câu hỏi, 
Y Học TP. Hồ Chí Minh * Tập 25 * Số 2 * 2021 Nghiên cứu Y học 
Chuyên Đề Y Tế Công Cộng 184 
sinh viên trả lời theo mức độ rất không đồng ý, 
không đồng ý, trung lập, đồng ý, rất đồng ý. 
Thống kê mô tả để trình bày kết quả. 
Phương pháp nghiên cứu 
Dữ liệu kết quả thi của 315 sinh viên Y4 học 
kỳ 1 và 285 sinh viên học kỳ 2 thi MCQ trong 
năm học 2014-2015 được thu thập để tính độ tin 
cậy của đề thi và các chỉ số của câu hỏi. Độ tin 
cậy của 2 kỳ thi MCQ được đo lường bằng hệ số 
Kuder Richardson 20. Chỉ số khó, chỉ số phân 
cách và hiệu quả của các mồi nhử được tính cho 
mỗi câu hỏi trong đề thi MCQ. 
Phỏng vấn người chịu trách nhiệm chính 
trong việc ra đề thi về quá trình hình thành đề 
thi, về test blueprint, về xây dựng/rút câu hỏi, 
chỉnh sửa câu hỏi, thống kê sau khi thi. 
Một nhóm 4 giảng viên của bộ môn Sản 
đánh giá đề thi về nội dung. Đối với mỗi câu hỏi 
trong đề thi, mỗi giảng viên sẽ đánh giá như sau: 
xác định câu hỏi thuộc chủ đề nào (trong 7 chủ 
đề), thuộc nội dung nào (thuộc bài học nào trong 
34 bài học); xác định mức độ tư duy sinh viên 
cần vận dụng để trả lời câu hỏi: mức độ nhớ lại, 
mức độ hiểu giải thích, mức độ áp dụng giải 
quyết vấn đề; đánh giá mức độ quan trọng của 
kiến thức được hỏi theo thang điểm từ 1-4 (từ 
mức độ “không cần lượng giá” đến mức độ 
‘phải lượng giá”); nhận xét chung về đề thi có 
cân đối theo chủ đề và bài học hay không. 
Thống kê mô tả phần đánh giá của giảng 
viên về đề thi theo 7 chủ đề và 34 nội dung bài 
học. Hệ số tương quan về số câu hỏi được phân 
bố theo chủ đề và theo các nội dung bài học giữa 
2 đề thi học kỳ 1 và học kỳ 2 sẽ được tính. Thống 
kê mô tả số câu hỏi đề thi theo 3 mức độ tư duy 
nhớ, hiểu, ứng dụng. Điểm trung bình về mức 
độ quan trọng của kiến thức được lượng giá 
trong mỗi câu hỏi sẽ được tính, nếu >2,5 nghĩa là 
kiến thức được lượng giá là quan trọng. 
KẾT QUẢ 
Ý kiến sinh viên 
Ý kiến sinh viên về mỗi phát biểu liên quan 
đến các yếu tố bên ngoài và các yếu tố liên quan 
nội dung đề thi được trình bày trong Bảng 1 theo 
tỷ lệ phần trăm. Điểm trung bình của mỗi phát 
biểu cũng được tính. 
Bảng 1: Ý kiến sinh viên ở học kỳ 1 và học kỳ 2 
Học kỳ 
(HK) 
Rất không 
đồng ý (%) 
Không 
đồng ý (%) 
Trung lập 
(%) 
Đồng ý 
(%) 
Rất đồng 
ý (%) 
Trung 
bình 
1. Nhìn chung đề thi là 
HK1 
Rất khó 
42,5 
Khó 
49,0 
Vừa sức 
7,8 
Dễ 
0,3 
Rất dễ 
0,3 
1,67 
HK2 35,4 53,9 10,4 0,4 1,76 
2. Thời gian làm bài thi là 
HK1 
Thiếu giờ 
59,5 
Đủ giờ 
37,9 
Dư giờ 
2,6 
1,43 
HK2 23,9 70,0 6,1 1,82 
3. Đề thi có hướng dẫn cụ thể cách làm bài 
HK1 3,9 1,0 6,1 54,7 34,3 4,15 
HK2 5,8 2,5 10,1 49,8 31,8 3,99 
4. Tổ chức thi nghiêm túc 
HK1 2,3 0 2,6 53,1 42,1 4,33 
HK2 3,6 0,7 7,5 46,1 42,1 4,23 
5. Các câu hỏi trong đề thi nói chung là dễ hiểu 
HK1 1,3 15,9 20,1 57,5 5,2 3,49 
HK2 3,6 14,0 24,0 52,3 6,1 3,43 
6. Đề thi có những câu hỏi gây hiểu nhầm ý 
HK1 3,6 29,7 32,4 30,1 4,2 3,02 
HK2 4,6 27,1 38,9 24,3 5,0 2,98 
7. Đề thi có những câu hỏi dùng từ ngữ khó hiểu 
phức tạp làm bạn mất thời gian để hiểu ý câu 
hỏi 
HK1 4,6 38,9 32,0 18,6 5,9 2,82 
HK2 4,3 38,7 32,6 21,1 3,2 2,80 
8. Đề thi có những câu hỏi có manh mối gợi ý 
cho câu trả lời đúng 
HK1 11,0 39,2 27,2 21,7 1,0 2,62 
HK2 7,9 40,5 31,9 18,3 1,4 2,65 
9. Đề thi đánh giá đúng khả năng của bạn HK1 2,9 21,4 25,2 43,4 7,1 3,30 
Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 25 * Số 2 * 2021 
Chuyên Đề Y Tế Công Cộng 185 
Học kỳ 
(HK) 
Rất không 
đồng ý (%) 
Không 
đồng ý (%) 
Trung lập 
(%) 
Đồng ý 
(%) 
Rất đồng 
ý (%) 
Trung 
bình 
HK2 4,3 16,1 31,1 40,7 7,9 3,32 
10. Nội dung bài thi phù hợp với mục tiêu 
HK1 3,9 17,6 14,7 55,0 8,8 3,47 
HK2 7,5 13,3 22,9 49,8 6,5 3,34 
11. Nội dung bài thi phù hợp với nội dung đã 
được dạy 
HK1 6,5 29,2 14,6 45,1 4,5 3,12 
HK2 5,4 28,3 26,2 35,1 5,0 3,06 
12. Nhìn chung tỷ lệ câu hỏi cho các 
chương/các phần cân đối với số giờ học các 
chương/các phần đó 
HK1 2,3 22,8 16,0 55,0 3,9 3,36 
HK2 3,9 12,2 39,1 40,1 4,7 3,29 
13. Có các phần quan trọng của chương trình 
môn học không được hỏi trong đề thi này 
HK1 6,8 38,8 34,0 19,7 0,6 2,69 
HK2 3,6 36,3 35,6 23,0 1,4 2,82 
14. Đề thi có những câu hỏi mà nội dung của nó 
không có trong chương trình giảng dạy 
HK1 3,6 30,8 26,9 32,1 6,6 3,07 
HK2 5,4 24,5 34,3 28,9 6,9 3,07 
Về các yếu tố bên ngoài 
Các phát biểu về “hướng dẫn cụ thể cách 
làm bài”, “tổ chức thi nghiêm túc”, “câu hỏi nói 
chung dễ hiểu” đều có trung bình cao hơn 3 
(thang điểm giữa của thang 5). Đối với các phát 
biểu “câu hỏi dùng từ ngữ phức tạp khó hiểu”, 
“câu hỏi có manh mối gợi ý câu trả lời đúng” có 
điểm trung bình <3, cho thấy đa số cho rằng câu 
hỏi không có từ ngữ phức tạp khó hiểu, không 
có manh mối đoán mò được câu trả lời đúng. 
Tuy nhiên phát biểu “đề thi có những câu hỏi 
gây hiểu nhầm ý” có trung bình 3,02 và 2,98 ở 
học kỳ 1 và học kỳ 2 cho thấy tỷ lệ sinh viên 
đồng ý và tỷ lệ không đồng ý là gần bằng nhau, 
có thể dẫn đến giả định rằng có khả năng có một 
số câu hỏi được viết không tốt, dẫn đến gây hiểu 
nhầm ý. 
Phần lớn sinh viên cho rằng đề thi là khó. Ý 
kiến của sinh viên về “độ khó của đề thi” có 
điểm trung bình thấp dưới 2 ở cả học kỳ 1 (1,67) 
và 2 (1,76). Thời gian làm bài thi ở học kỳ 1 chỉ có 
37,9 % cho rằng đủ giờ, còn 59,5% cho rằng thiếu 
giờ; ở học kỳ 2 23,9% cho là thiếu giờ 70% cho là 
đủ giờ. 
Về nội dung đề thi dưới góc nhìn của sinh viên 
Các phát biểu về “đề thi đánh giá đúng 
khả năng”, về “nội dung thi phù hợp mục 
tiêu”, về “tỉ lệ câu hỏi cân đối” có điểm trung 
bình cao hơn 3. Tuy nhiên, phát biểu về “đề thi 
phù hợp nội dung đã được dạy” có trung bình 
quanh mức 3 ở cả hai học kỳ 3,12 (học kỳ 1) và 
3,06 (học kỳ 2), với 35,7% sinh viên ở học kỳ 1 
và 33,7% sinh viên ở học kỳ 2 không đồng ý 
với phát biểu “nội dung bài thi phù hợp với 
nội dung đã được dạy”. 
Phát biểu “có các phần quan trọng của 
chương trình môn học không được hỏi trong đề 
thi này” có điểm trung bình là 2,69 (học kỳ 1) và 
2,82 (học kỳ 2) cho thấy rằng số đông sinh viên 
nghĩ rằng các phần quan trọng đã được hỏi 
trong đề thi. 
Độ tin cậy của đề thi, chất lượng câu hỏi về chỉ 
số khó, chỉ số phân cách và mồi nhử 
Độ tin cậy của đề thi 
Đề thi mỗi học kỳ có 60 câu hỏi với 4 lựa 
chọn. Kết quả đánh giá độ tin cậy của từng đề 
thi MCQ, thống kê mô tả số câu hỏi có độ khó 
và độ phân cách khác nhau được trình bày 
trong Bảng 2. 
Bảng 2: Kết quả độ tin cậy, thống kê mô tả số câu hỏi 
có độ khó và độ phân cách khác nhau 
 HK 1 HK 2 
Độ tin cậy bài thi 0,4920 0,6235 
Độ khó bài thi 0,560 0,563 
Độ phân cách bài thi 0,203 0,230 
Số câu hỏi dễ có độ khó >0,7 12 17 
Số câu hỏi có độ khó trung bình 0,3-0,7 44 40 
Số câu hỏi có độ khó <0,3 4 3 
Số câu hỏi có độ phân cách <0,2 28 22 
Số câu hỏi có độ phân cách 0,2 - <0,3 19 18 
Số câu hỏi có độ phân cách 0,3 - <0,4 13 13 
Số câu hỏi có độ phân cách >= 0,4 0 7 
Độ tin cậy của cả hai đề thi học kỳ 1 và học 
kỳ 2 cùng thấp hơn 0,8, cho thấy độ tin cậy chưa 
cao. Nếu sử dụng công thức Spearman Brown 
Y Học TP. Hồ Chí Minh * Tập 25 * Số 2 * 2021 Nghiên cứu Y học 
Chuyên Đề Y Tế Công Cộng 186 
để dự đoán sự gia tăng độ tin cậy bằng cách tăng 
chiều dài đề trắc nghiệm như sau: 
rn = nrs/((n-1)rs + 1)), với n là số lần tăng 
chiều dài đề trắc nghiệm, rs là độ tin cậy của đề 
thi hiện tại, rn là độ tin cậy của đề thi được gia 
tăng số câu hỏi thì khi tăng gấp đôi số câu (tức 
đề thi có 120 câu) thì hệ số tin cậy của đề thi 
giả định sẽ là 0,76. 
Độ khó và độ phân cách của các đề thi, hiệu 
quả mồi nhử của các câu hỏi 
Đề thi có độ khó trung bình ở cả học kỳ (HK) 
1 (0,560) và học kỳ 2 (0,563), tuy nhiên độ phân 
cách của để thi chưa cao (0,203 và 0,230), có 22/60 
(36,6%) câu hỏi ở học kỳ 1 và 28/60 (46,6%) câu 
hỏi ở học kỳ 2 có độ phân cách kém <0,2. Trung 
bình số mồi nhử hiệu quả là 2,23 (75%) ở học kỳ 
1 và 2,48 (82,7%) ở học kỳ 2. 
Một câu hỏi lý tưởng là câu hỏi có độ khó 
trung bình (0,3-0,7), độ phân cách cao (>=0,4) và 
hiệu quả mồi nhử 100%. 
Phỏng vấn người chịu trách nhiệm chính trong 
việc ra đề thi 
Phỏng vấn cho thấy rằng ở thời điểm nghiên 
cứu (năm 2014), bộ môn chưa xây dựng một 
cách chính thức test blueprint. Các giảng viên 
khi được phân công giảng bài nào thì sẽ được 
yêu cầu gửi câu hỏi của bài mình chịu trách 
nhiệm người phụ trách đề thi. Người phụ trách 
đề thi của bộ môn có phân nhóm câu hỏi theo 
các chủ đề tình huống, mỗi chủ đề có 3 câu. Số 
câu hỏi được gửi khoảng 100 câu. Các câu hỏi 
được chọn lọc lại theo chủ đề phù hợp để lấy 60 
câu cho thi. Các câu được chọn sẽ được chỉnh 
sửa các mồi nhử về mặt kĩ thuật viết câu (khi cần 
thiết). Bản thảo đề thi có kiểm tra về định dạng, 
lỗi chính tả, lỗi kỹ thuật, và kiểm tra có phù hợp 
với các chủ đề. Sau khi thi xong, các câu hỏi 
được xem xét một lần nữa dựa trên phân tích 
câu hỏi. 
Ý kiến của 4 giảng viên đánh giá về nội dung 
Kết quả đề thi lý thuyết sản được đánh giá 
theo chủ đề và bài học 
Kết quả số câu hỏi được phân bố theo 7 chủ 
đề theo đánh giá của giảng viên được trình bày 
trong Bảng 3. 
Bảng 3: So sánh số câu hỏi phân bố giữa các chủ đề 
Chủ đề 
Đề thi 
HK 1 
Đề thi 
HK 2 
Chủ đề 1. Tam cá nguyệt thứ nhất và nửa 
đầu tam cá nguyệt thứ nhì 
12 15 
Chủ đề 2. Nửa sau tam cá nguyệt thứ nhì và 
tam cá nguyệt thứ ba 
6 6 
Chủ đề 3. Chăm sóc một thai phụ chuyển dạ 
bình thường 
9 3 
Chủ đề 4. Chăm sóc một thai phụ chuyển dạ 
có vấn đề 
6 9 
Chủ đề 5. Chăm sóc bà mẹ và sơ sinh những 
ngày đầu hậu sản 
5 8 
Chủ đề 6. Nuôi con bằng sữa mẹ 7 7 
Chủ đề 7. Phết mỏng tế bào cổ tử cung. Tiết 
dịch âm đạo bất thường 
6 0 
Không thuộc 7 chủ đề 9 12 
Chủ đề 8. (Không thuộc 7 chủ đề) “Sinh lý chu 
kỳ buồng trứng” 
3 6 
Chủ đề 9. (Không thuộc 7 chủ đề) “Các 
phương pháp tránh thai tạm thời” 
3 3 
Chủ đề 10. (Không thuộc 7 chủ đề) “Lựa chọn 
phương pháp tránh thai” 
3 0 
Chủ đề 11. (Không thuộc 7 chủ đề) “Khung 
chậu về phương diện sản khoa” 
0 3 
Có 9 câu hỏi của học kỳ 1 và 12 câu hỏi của 
học kỳ 2 được nhận định là “không thuộc 7 chủ 
đề lớn”. Những câu không xếp được vào 7 chủ 
đề là các câu hỏi về “Sinh lý chu kỳ buồng 
trứng”, “Các phương pháp tránh thai tạm thời”, 
“Lựa chọn phương pháp tránh thai”, “Khung 
chậu về phương diện sản khoa”. Như vậy, việc 
phân theo 7 chủ đề như trên vẫn chưa đầy đủ, 
bộ môn và người phụ trách đề thi cần xem lại 
cách phân chia chủ đề sao cho toàn diện, tránh 
bỏ sót. 
Xét phân bố câu hỏi theo chủ đề giữa 2 đề 
thi, hệ số tương quan Pearson giữa 2 đề thi 
(0,601) không có ý nghĩa thống kê (p=0,051). 
Kết quả số câu hỏi được phân bố theo 34 bài 
học theo đánh giá của giảng viên được trình bày 
trong Bảng 4. 
Có một số câu hỏi không được nhóm giảng 
viên xếp vào nội dung bài học nào là các câu 
22, 23, 24, 43, 44, 45 ở học kỳ 2, đây là những 
câu hỏi liên quan tăng huyết áp thai kỳ, băng 
huyết sau sanh. Ngoài ra, có một số bài học 
Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 25 * Số 2 * 2021 
Chuyên Đề Y Tế Công Cộng 187 
không có câu hỏi thi nào ở cả học kỳ 1 và học 
kỳ 2. Thực ra, trong bối cảnh lồng ghép, việc 
phân định rạch ròi là không đơn giản. Vì vậy, 
khi thiết kế chương trình, cần lưu ý những chủ 
đề giảng dạy lý thuyết để bao phủ đủ những 
mục tiêu quan trọng. 
Bảng 4: So sánh số câu hỏi phân bố giữa các nội dung bài học 
Bài học Đề thi HK 1 Đề thi HK 2 Số tiết 
Giải phẫu cơ quan sinh dục nữ 0 0 0 
Sinh lý thụ tinh, sự làm tổ của trứng đã thụ tinh 1 0 0 
Chẩn đoán thai 0 0 0 
Nội dung khám thai, lịch khám thai 9 6 0 
Theo dõi thai phụ trong chuyển dạ 0 0 0 
Ngôi, thế, kiểu thế 0 0 0 
Sinh lý chu kỳ buồng trứng. Chu kỳ nội mạc tử cung 3 6 2 
Phát triển bào thai và các phần phụ của trứng 0 0 1 
Khung chậu về phương diện sản khoa 3 3 1 
Căn bản về siêu âm sản khoa 0 3 2 
Nội tiết học thai nghén. Thay đổi giải phẫu sinh lý khi có thai 0 0 2 
Vệ sinh thai nghén 0 0 1 
Quản lý thai. Làm mẹ an toàn và chăm sóc sản khoa thiết yếu 0 0 1 
Sinh lý chuyển dạ 0 0 1 
Sản đồ và nguyên lý xây dựng sản đồ, model Tổ chức Y Tế Thế giới 0 0 1 
Cơ chế đẻ ngôi chỏm. Cách đỡ sanh ngôi chỏm 0 0 1 
Sổ nhau thường qui. Sổ nhau tích cực 0 2 1 
Ứng dụng của sản đồ. Các vấn đề thường gặp ở sản đồ 6 4 2 
Hậu sản thường. Chăm sóc sơ sinh trong những ngày đầu. Tiêm chủng 2 3 2 
Nuôi con bằng sữa mẹ 8 7 1 
Các vấn đề thường gặp ở tuyến vú trong thời kỳ hậu sản 0 0 1 
Đặc điểm lâm sàng và chăm sóc sơ sinh đủ tháng 2 0 1 
So sánh sơ sinh đủ tháng với non tháng và già tháng 0 2 1 
Căn bản về đọc CTG. Nhận dạng các hình thái căn bản của biểu đồ 6 6 2 
Đánh giá tình trạng sơ sinh sau sanh. Hồi sức sơ sinh 3 3 2 
Khảo sát hình ảnh trong Phụ khoa 0 0 2 
hCG trong Phụ khoa. Các chỉ báo khối u 0 0 2 
Xuất huyết 3 tháng đầu thai kỳ. Định hướng cho tiếp cận, chẩn đoán, quản lý 5 6 2 
Tầm soát ung thư cổ tử cung. Phết mỏng cổ tử cung. Sinh thiết cổ tử cung 0 0 2 
Hình ảnh mô học cổ tử cung bình thường. Căn bản về soi cổ tử cung 1 0 2 
Viêm âm đạo do 3 tác nhân thường gặp 4 0 2 
Tránh thai bằng phương rào chắn. Tránh thai với Cu-IUD 1 0 2 
Tránh thai với viên nội tiết phối hợp. LASDS. Tránh thai vĩnh viễn 3 3 2 
Tư vấn chọn lựa một biện pháp tránh thai 3 0 2 
Bài học 0 (không thuộc bài nào) 0 6 
Xét phân bố câu hỏi theo bài học giữa 2 đề 
thi, hệ số tương quan Pearson giữa 2 đề thi là 
0,73 có ý nghĩa thống kê (p <0,01). 
Hệ số tương quan cao khi xếp câu hỏi theo 
bài học có thể là do việc giảng viên gửi câu hỏi 
theo bài học rồi tập hợp lại thành đề thi nên có 
sự tương hợp nhất định giữa đề học kỳ 1 và học 
kỳ 2. Tuy nhiên hệ số tương quan thấp khi xếp 
câu hỏi theo 7 chủ đề lớn và có một số đáng kể 
các câu hỏi không thể xếp vào 7 chủ đề, cũng 
như có một số câu hỏi không thể xếp vào nội 
dung bài học. Vì vậy bộ môn cần xem lại thiết kế 
tiếp cận dạy và học để phù hợp với mục tiêu cần 
lượng giá. 
Ý kiến của giảng viên đánh giá về mức độ quan 
trọng của kiến thức được lượng giá 
Khi đánh giá về “mức độ quan trọng của 
kiến thức được lượng giá”, nhóm giảng viên đã 
Y Học TP. Hồ Chí Minh * Tập 25 * Số 2 * 2021 Nghiên cứu Y học 
Chuyên Đề Y Tế Công Cộng 188 
nhận định có 59/60 câu hỏi (98,3%) ở cả học kỳ 1 
và học kỳ 2 có điểm trung bình >2,5 nghĩa là kiến 
thức được lượng giá là quan trọng, chỉ có 1 câu 
hỏi có (1,7%) có điểm trung bình là 2,5. 
Ý kiến của giảng viên đánh giá về mức độ đại 
diện được nội dung cần lượng giá và cân đối của 
đề thi 
Ý kiến của 4 giảng viên đối với phát biểu 
“nhìn chung, các câu hỏi thi được hỏi đại diện 
được nội dung cần lượng giá đối với sinh viên 
Y4”, ở học kỳ 1 có 3 trong 4 giảng viên phát 
biểu đồng ý và ở học kỳ 2 có 4 trong 4 phát 
biểu đồng ý. 
Khi nhận xét về tính cân đối với chủ đề có 
3/4 giảng viên đồng ý với phát biểu “Nhìn 
chung, tỷ lệ câu hỏi trong đề thi cho các chủ đề 
cân đối với số giờ học các chủ đề”. Tuy nhiên, 
khi nhận xét về tính cân đối với bài học chỉ có 2/4 
đồng ý với phát biểu “Nhìn chung, tỷ lệ câu hỏi 
trong đề thi cho các các bài học cân đối với số giờ 
học các bài học đó”. 
Ý kiến của giảng viên đánh giá về mức độ kiến 
thức cần vận dụng để trả lời câu hỏi 
Kết quả cho thấy hầu hết các câu hỏi được 
cho là lượng giá kiến thức ở mức áp dụng giải 
quyết vấn đề, cụ thể ở học kỳ 1 có 46 câu ở mức 
áp dụng, 14 câu ở mức hiểu; ở học kỳ 2 có 41 câu 
ở mức áp dụng, 19 câu ở mức hiểu, không có câu 
nào ở mức nhớ lại. 
BÀN LUẬN 
Về các yếu tố bên ngoài 
Từ kết quả khảo sát ý kiến sinh viên cho 
phép nhận định rằng trong hai kỳ thi MCQ đã 
được khảo sát, một số yếu tố bên ngoài có thể 
ảnh hưởng đến tính giá trị của đề thi đã được 
loại trừ. Đề thi có hướng dẫn cụ thể cách làm bài, 
tổ chức thi nghiêm túc. Việc dùng câu hỏi không 
phạm phải các lỗi kĩ thuật viết câu, và được 
đánh giá là rõ ràng và dễ hiểu (câu hỏi dễ hiểu 
có điểm trung bình >3; câu hỏi dùng từ ngữ 
phức tạp khó hiểu, câu hỏi có manh mối gợi ý 
đoán mò được câu trả lời đúng có điểm trung 
bình <3). 
Dù rằng độ khó của đề thi là trung bình, 
nhưng đề thi vẫn được đánh giá là khó theo ý 
kiến của sinh viên. Thiếu thời gian làm bài 
(59,5% ý kiến ở học kỳ 1 và 23,9% ý kiến ở học 
kỳ 2) có vẻ như một yếu tố có thể đã ảnh hưởng 
đến độ tin cậy và tính giá trị của đề thi. 
Về nội dung đề thi 
Từ kết quả khảo sát ý kiến sinh viên, sinh 
viên cho rằng đề thi đã đo lường đúng khả năng, 
phù hợp mục tiêu, các phần quan trọng đã được 
hỏi trong đề thi. Phát biểu “nội dung bài thi phù 
hợp với nội dung đã được dạy” có trung bình 
chỉ ở quanh mức 3, cho thấy rằng tính nhất quán 
giữa nội dung được dạy và nội dung thi vẫn 
chưa tốt; hay nói cách khác là các tiếp cận dạy và 
học chưa thoả mãn được các mục tiêu lượng giá. 
Từ kết quả đánh giá đề thi của nhóm giảng 
viên cho thấy các câu hỏi được cho là lượng giá 
kiến thức quan trọng và đa số lượng giá kiến 
thức ở mức độ tư duy cao là mức áp dụng, tuy 
nhiên tỷ lệ các câu hỏi phân bố chưa cân đối. 
Theo phỏng vấn, dường như là đề thi được 
cho theo một test blueprint ẩn. Điều này thể hiện 
qua khi phân tích sự tương quan giữa hai đề thi. 
Nhìn chung hai đề thi dường như lượng giá 
những nội dung bài học giống nhau với hệ số 
tương quan Pearson 0,73 có ý nghĩa thống kê 
(p <0,01), khi xét phân bố câu hỏi theo bài học. 
Tuy nhiên, khi xét phân bố câu hỏi theo chủ đề 
thì có vẻ không tương đồng với hệ số tương 
quan Pearson không có ý nghĩa thống kê (hệ số 
tương quan Pearson 0,601, p=0,051). Ngoài ra có 
một số câu hỏi không thể xếp vào bài học hoặc 
chủ đề là một yếu tố cần xem xét có ảnh hưởng 
đến tính giá trị về mặt nội dung của đề thi. Việc 
thiếu một test blueprint cụ thể có thể là nguyên 
nhân của hiện tượng này. Cần xây dựng test 
blueprint cụ thể để đảm bảo đề thi lượng giá 
những nội dung cần thiết và các đề thi khác 
nhau có thể tương đồng nhau về mặt nội dung. 
Về quá trình xây dựng đề thi 
Quá trình xây dựng đề thi không được chặt 
Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 25 * Số 2 * 2021 
Chuyên Đề Y Tế Công Cộng 189 
chẽ do không có test blueprint cụ thể. Trong suốt 
quá trình xây dựng đề thi chỉ có 1 người duy 
nhất kiểm tra tính bao phủ nội dung của đề thi. 
Chính điều này cùng với việc không xây dựng 
testblueprint cụ thể trước có lẽ là nguyên nhân 
dẫn đến việc phân bố các câu hỏi giữa các chủ đề 
và bài học có chỗ chưa cân đối làm cho hệ số 
tương quan không cao giữa 2 đề thi khi xét theo 
chủ đề và bài học. 
Sau khi thi xong, bộ môn có phân tích thống 
kê để xem lại chất lượng câu hỏi thi. 
Về độ tin cậy và phân tích câu hỏi 
Các test có 80-120 câu MCQ có hệ số tin cậy 
0,64-0,99(6). Đối với các kỳ thi có mức độ quan 
trọng vừa phải như thi cuối năm chẳng hạn thì 
đòi hỏi độ tin cậy ít nhất là 0,8(7). 
Độ tin cậy của đề thi ở 2 học kỳ thấp (0,4920 
và 0,6235) đặc biệt ở học kỳ 1 thấp hơn ở học kỳ 
2 có thể là do yếu tố thời gian thi không đủ góp 
phần ảnh hưởng đến độ tin cậy của đề thi học kỳ 
1. Để cải thiện độ tin cậy, trong giả định rằng với 
cùng một chất lượng câu hỏi như hiện tại, thì 
một phương án khả thi là điều chỉnh thời gian 
thi phù hợp sao cho đủ thời gian và cần tăng 
thêm số câu hỏi thi (120 câu), để đạt độ tin cậy 
chấp nhận được. 
Phân tích chỉ số khó, chỉ số phân cách và 
hiệu quả của các mồi nhử đề thi học kỳ 1 và 2 
cho thấy đa số các câu hỏi có độ khó trung bình 
nhưng độ phân cách chưa cao ở mức tạm được 
(0,203 và 0,230), hiệu quả mồi nhử 75%-82,7%. 
KẾT LUẬN 
Chất lượng của kỳ thi MCQ được khảo sát là 
chưa thoả đáng. Thời gian làm bài không đủ. 
Mặc dù các câu hỏi được cho là lượng giá kiến 
thức quan trọng và lượng giá kiến thức ở mức 
độ tư duy cao là mức áp dụng, tuy nhiên tỷ lệ 
các câu hỏi phân bố chưa cân đối chủ yếu do 
chưa có test blueprint cụ thể. 
Đề thi trắc nghiệm Sản cho sinh viên y năm 
thứ tư năm học 2014-2015 có độ tin cậy thấp, 
tính giá trị về mặt nội dung chưa cao. 
Làm gì để tốt hơn? 
Việc xây dựng một test blueprint chính thức 
chặt chẽ cụ thể là cần thiết, làm cơ sở cho việc 
hình thành đề thi, đánh giá đề thi. Sau khi đã có 
bản thảo đề thi cần thiết có giảng viên/nhóm 
giảng viên khác kiểm tra xem đề thi có phù hợp 
với test blueprint hay không. Bộ môn cần xem lại 
các chủ đề và nội dung bài học cần lượng giá, 
đồng thời cần xem lại chương trình phù hợp với 
mục tiêu học tập và lượng giá, nhằm hạn chế các 
lỗ hổng đã thấy qua nghiên cứu này. Cần chú ý 
thời gian thi phù hợp để đủ thời gian làm bài và 
tăng thêm số câu hỏi thi để cải thiện độ tin cậy 
của đề thi. Thực hiện điều chỉnh câu hỏi sau thi 
dựa trên phân tích câu hỏi để gia tăng chất 
lượng câu hỏi. 
TÀI LIỆU THAM KHẢO 
1. Downing SM, Haladyna TM (1997). Test item development: 
Validity evidence from quality assurance procedures. Applied 
measurement Education, 10(1):61-82 
2. Gjerde CL (1981). “Curriculum mapping”: objectives, 
instruction, and evaluation. Journal of Medical Education, 56:316-
323. 
3. Sireci SG (1998). Gathering and analyzing content validity data. 
Educational Measurement, 5(4):299-231 
4. Verhoeven BH, Verwijnen GM, Scherpbier AJJA, Schuwirth 
LWT, Van der Vleuten CPM (1999). Quality assurance in test 
construction: the approach of a multidisciplinary central test 
committee. Education for Health: Change in Learning & Practice, 
12:49-60. 
5. Đoàn Thị Thu Hoa, Trần Quang Trung (2005). Tính giá trị của 
đề thi trắc nghiệm nhi khoa sinh viên y năm thứ tư năm học 
2002-2003. Y học Thành phố Hồ Chí Minh, 9(1):123-128. 
6. Fenderson BA, Damjanov I (1997). The virtues of extended 
matching and uncued tests as alternatives to multiple choice 
questions. Human Pathology, 28:526-532 
7. Downing SM (2004). Reliability: on the reproducibility of 
assessment data. Medical Education, 38(9):1006–1012. 
Ngày nhận bài báo: 11/12/2020 
Ngày nhận phản biện nhận xét bài báo: 06/02/2021 
Ngày bài báo được đăng: 10/03/2021 

File đính kèm:

  • pdftinh_gia_tri_va_do_tin_cay_cua_de_thi_mcq_san_khoa_cho_sinh.pdf