MỤC LỤC
Trang
Trang phụbìa
Lời cam đoan. 1
Lời cảm ơn . 2
Mục lục. 3
Danh mục các chữviết tắt . 5
Danh mục bảng . 6
Danh mục hình . 7
MỞ ĐẦU
1. Lý do chọn đềtài . 8
2. Mục đích nghiên cứu . 9
3. Giới hạn nghiên cứu . 9
4. Phương pháp nghiên cứu . 9
Chương 1. CƠSỞLÝ LUẬN VÀ TỔNG QUAN
1.1. Các khái niệm vềchất lượng bộ đềthi trắc nghiệm . 11
1.1.1. Các công cụ đo lường đánh giá kết quảhọc tập. 11
1.1.2. Trắc nghiệm và những vấn đềliên quan . 13
1.1.3. Độtin cậy của bộcâu hỏi trắc nghiệm . 19
1.1.4. Độgiá trị(hiệu lực) của bộcâu hỏi trắc nghiệm. 24
1.2. Quy trình xây dựng bộ đềthi trắc nghiệm khách quan . 26
1.2.1. Các quy tắc viết câu hỏi trắc nghiệm nhiều lựa chọn . 26
1.2.2. Xây dựng bảng trọng sốcủa môn học . 31
1.2.3. Xây dựng ngân hàng đềthi trắc nghiệm môn học . 32
Chương 2. PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Những định hướng, trọng tâm nghiên cứu. 34
2.1.1. Chuyên đềnghiên cứu thứnhất. 34
2.1.2. Chuyên đềnghiên cứu thứhai. 34
2.1.3. Chuyên đềnghiên cứu thứba . 35
2.2. Thiết kếmẫu phiếu điều tra đối với giáo viên. 35
Chương 3. XỬLÝ SỐLIỆU KẾT QUẢTHI TRẮC NGHIỆM
3.1. Xửlý sốliệu kết quảthi TNKQ . 39
3.1.1. Phân tích độkhó của item . 39
3.1.2. Phân tích độphân biệt của item . 40
3.1.3. Đánh giá độtin cậy của bài trắc nghiệm. 42
3.1.4. Xửlý sốliệu đềthi trên mô hình QUEST . 48
3.1.5. Kết luận về độgiá trịcủa các bộ đề. 52
3.2. Xửlý sốliệu mẫu phiếu hỏi trong giảng viên . 52
3.2.1. Đánh giá độtin cậy của công cụ đo (mẫu phiếu hỏi). 52
3.2.2. Đánh giá về độgiá trịcủa công cụ đo và sựphù hợp của mô hình các yếu tố ảnh hưởng đến chất lượng bộ đềthi TNKQ qua xửlý phiếu hỏi. 62
3.3. Kết luận vềcác yếu tố ảnh hưởng đến việc xây dựng bộ đềTNKQ . 62
KẾT LUẬN, ĐỀXUẤT GIẢI PHÁP, KIẾN NGHỊ
4.1. Kết luận . 71
4.2. Đềxuất giải pháp. 73
TÀI LIỆU THAM KHẢO. 74
PHỤLUC
Phụlục 1. File dữliệu mon01.Itn . 75
Phụlục 2. File dữliệu mon01.map. 77
Phụlục 3. Mẫu phiếu hỏi khảo sát giảng viên. 81
81 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2500 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Đánh giá các yếu tố ảnh hưởng đến chất lượng các bộ đề thi trắc nghiệm khách quan tại Khoa Công Nghệ Thông tin - Đại học Thái Nguyên, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hỏi trở nên có dạng hai phương án để chọn. Do đó nếu thích, chúng ta có
thể đưa ra bốn câu có ý nghĩa trái nhau từng đôi một.
- Cẩn thận khi dùng các cụm từ “ Không câu nào trên đây đúng” hoặc
30
“Tất cả các phương án đều đúng” như là một trong những phương án để chọn,
vì về mặt văn phạm các mệnh đề này thường không ăn khớp với các câu hỏi.
- Câu trả lời đúng nhất hay hợp lý nhất phải được đặt ở các vị trí khác
nhau một số lần tương đương nhau.
- Tránh dùng các thể phủ định trong các câu hỏi. Người ta thường nên
nhấn mạnh khía cạnh xác định hơn khía cạnh phủ định trong kiến thức. Khi
bắt buộc phải dùng những từ này, nên gạch dưới hay in đậm để học sinh
chú ý hơn.
Đối với việc xây dựng các công cụ đo lường kết quả học tập, cụ thể là
việc xây dựng các bộ đề thi TNKQ dùng trong thi kiểm tra giữa kỳ hay hết
học phần áp dụng trong các trường đại học, ta chỉ quan tâm đến thang bậc
năng lực nhận thức. Với hầu hết các bộ đề được sử dụng trong nhà trường
hiện nay, chỉ có thể đánh giá được ba bậc nhận thức đầu là Biết, Hiểu và Vận
dụng. Để có thể đánh giá được các năng lực nhận thức ở cấp độ cao hơn, phải
thông qua các hình thức đánh giá khác như bài tập lớn, khoá luận…
1.2.2. Xây dựng bảng trọng số của môn học
Để đề thi có thể đánh giá đúng mục tiêu của môn học, cấu trúc đề thi phải
được xây dựng phù hợp với cấu trúc của môn học và các yêu cầu khối lượng
kiến thức tương ứng. Mỗi đề thi được xây dựng phục vụ cho những mục đích
nhất định. Tuỳ theo mục đích thi người viết đề thi phải thiết kế số câu hỏi và
thể loại câu hỏi phù hợp tương ứng. Vì thế trước khi xây dựng đề thi chúng ta
cần xác định mục đích cụ thể của đề thi. Mục đích của đề thi phải định ra
được những nội dung kiến thức và cấp độ kiến thức cần kiểm tra (cấp độ kiến
thức tương ứng với thang bậc về năng lực nhận thức). Tất cả những yêu cầu
này được thể hiện trong bảng trọng số đề thi. Về mặt nguyên tắc, đề thi
TNKQ hết học phần bao phủ hết nội dung kiến thức môn học, cho nên bảng
trọng số của đề thi tương ứng với bảng trọng số kiến thức của môn học.
31
Với các đề thi TNKQ thông thường thì bảng trọng số chỉ được xây dựng
với ba mức độ nhận thức là “nhận biết”, “hiểu” và “vận dụng” tương ứng với
các mức độ khó của đề thi là “dễ”, “vừa” và “khó”. Có thể lấy một ví dụ về
bảng trọng số đề thi như sau:
Bảng 1.1: Ví dụ về bảng trọng số của 1 đề thi hết học phần
gồm 60 câu trắc nghiệm
Mức độ năng lực nhận thức
Nội dung Nhận biết
(Dễ)
Hiểu
(Vừa)
Vận dụng
(Khó)
Tổng số
câu hỏi
Chương 1 3 4 3 10
Chương 2 2 2 1 5
Chương 3 3 4 3 10
Chương 4 5 4 4 15
Chương 5 4 6 5 15
Chương 6 2 2 1 5
Tổng cộng 19 22 17 60
1.2.3. Xây dựng ngân hàng đề thi trắc nghiệm cho môn học
Để thực hiện việc triển khai thi TNKQ một cách rộng rãi đòi hỏi phải có
một ngân hàng câu hỏi TNKQ. Đây là cơ sở dữ liệu để xây dựng các đề thi
một cách độc lập, có độ tin cậy, độ bao phủ kiến thức đồng đều cho các lần
thi. Vừa là nguồn dữ liệu cho sinh viên và cả giáo viên học tập. Việc tiến hành
xây dựng ngân hàng câu hỏi thi phải theo đúng những quy trình và nguyên tắc
kiểm tra đánh giá đã trình bày ở trên. Cụ thể phải tiến hành theo các bước sau:
32
1. Xác định rõ mục tiêu đào tạo của từng giai đoạn cần kiểm tra đánh giá.
2. Các chuyên gia chuyên ngành kết hợp cùng chuyên gia kiểm tra đánh
giá xây dựng cấu trúc đề thi, bảng trọng số, hình thức và thể loại thi riêng phù
hợp cho từng chuyên ngành theo yêu cầu của từng giai đoạn.
3. Hội thảo để lấy ý kiến về các cấu trúc đề thi, bảng trọng số, hình thức
và thể loại thi vừa được xây dựng và thẩm định, công nhận các sản phẩm đó.
4. Các chuyên gia chuyên ngành soạn thảo các câu hỏi thi theo bảng
trọng số và cấu trúc thi đã được xây dựng và thông qua.
5. Nghiệm thu các câu hỏi thô.
6. Loại bỏ các câu hỏi không đạt chuẩn quy định chung. Sửa lại một số
câu cho phù hợp, viết bổ sung một số câu hỏi mới.
7. Thử nghiệm để lấy kết quả đánh giá và hoàn thiện hơn các câu hỏi thi.
8. Lưu trữ các câu hỏi thi theo lĩnh vực kiến thức và các độ dễ khó khác
nhau trong ngân hàng dữ liệu.
9. Trước khi tổ chức thi các chuyên gia căn cứ theo yêu cầu và mục tiêu
đào tạo của từng đợt thi tổ hợp đề thi theo đúng yêu cầu về độ khó của câu hỏi
thi và các yêu cầu về kiến thức sinh viên cần đạt được.
10. Sau khi thi, kết quả thi phải được phân tích xử lý và đánh giá để
có các thông tin phản hồi như đã nêu trong quy trình và nguyên tắc kiểm
tra đánh giá.
11. Sau khi có các kết quả xử lý phân tích, các câu hỏi thi được hoàn
thiện lại.
12. Hàng năm có tổ chức viết thêm các câu hỏi thi để bổ sung ngân hàng
dữ liệu và đồng thời loại bỏ các câu hỏi không còn phù hợp với phát triển của
mục tiêu đào tạo và năng lực thực sự của sinh viên trong từng giai đoạn.
33
Chương 2
PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Những định hướng, trọng tâm nghiên cứu
2.1.1. Chuyên đề nghiên cứu thứ nhất
Để đánh giá các yếu tố ảnh hưởng đến chất lượng bộ đề thi TNKQ, luận
văn phải xuất phát từ việc đánh giá chất lượng của các bộ đề thực tế đã sử
dụng tại nhà trường qua xử lý số liệu kết quả thi của các môn học (50 môn
học). Từ kết quả thi đã được xử lý và lý thuyết về đo lường đánh giá có thể
cho phép kết luận sơ bộ về chất lượng các bộ đề này (về độ tin cậy, độ giá
trị…). Nghiên cứu này được thực hiện bằng phương pháp thống kê phân
tích, xử lý số liệu trên phần mềm SPSS, QUEST, kết hợp với phương pháp
chuyên gia qua việc thẩm định độ giá trị nội dung, độ gía trị cấu trúc… của
các bộ đề thi.
2.1.2. Chuyên đề nghiên cứu thứ hai
Xuất phát từ thực tế là các bộ đề thi TNKQ trong nhà trường có chất
lượng không giống nhau. Câu hỏi đặt ra là “Vậy thì những yếu tố nào ảnh
hưởng đến chất lượng của các bộ đề thi TNKQ”? Có thể bỏ qua các yếu tố như
điều kiện bên ngoài, ta nhận thấy yếu tố ảnh hưởng lớn nhất chính là từ phía
những người xây dựng bộ đề thi này. Bằng kinh nghiệm thực tiễn công tác
cũng như tham khảo ý kiến của các chuyên gia trong lĩnh vực đo lường đánh
giá giáo dục, tác giả mạnh dạn đề xuất một bộ công cụ đo các yếu tố ảnh
hưởng đến chất lượng bộ đề thi TNKQ thực hiện trên nhóm mẫu là giáo viên
tham gia xây dựng đề thi. Chất lượng một bộ đề thi nói chung phụ thuộc
nhiều yếu tố nhưng chủ yếu và trực tiếp là các yếu tố tác động đến chính bản
thân người ra đề. Trong điều kiện giảng dạy hiện nay, có thể khái quát thành 5
nhóm yếu tố giả thuyết có ảnh hưởng đến người ra đề, đó là:
- Thời gian đầu tư cho công việc thiết kế trắc nghiệm.
34
- Động cơ của người thiết kế trắc nghiệm.
- Mức độ người ra đề được trang bị kỹ thuật thiết kế trắc nghiệm.
- Sự quan tâm của nhà trường.
- Tính chất, đặc điểm của các nhóm môn học.
Từ 5 nhóm yếu tố tác động trên, luận văn sẽ xây dựng một mẫu phiếu
hỏi, lấy thông tin từ nhóm giáo viên xây dựng đề. Lưu ý là các phiếu này sẽ
được đánh dấu tương ứng với chất lượng đề thi của cá nhân đó. Với kết quả
xử lý 50 mẫu phiếu điều tra sẽ chỉ ra được các yếu tố có tương quan chặt
trong nhóm 5 yếu tố được thăm dò.
2.1.3. Chuyên đề nghiên cứu thứ ba
Trên cơ sở kết quả của hai nghiên cứu nói trên, ta sẽ tiến hành đánh giá
tương quan được lượng hoá thành số giữa các mẫu phiếu đánh giá và chất
lượng đề thi trong nhóm mẫu kết quả thi. Từ đó sẽ cho các kết luận cụ thể về
mối quan hệ giữa các nhóm yếu tố ảnh hưởng và chất lượng đề thi. Những
đánh giá này được thực hiện trên bảng trụ xoay (crosstab) kết hợp với phương
pháp chuyên gia.
Với những phân tích ở trên, sau khi thực hiện xong ba chuyên đề nghiên
cứu, đặc biệt là chuyên đề nghiên cứu thứ ba, luận văn sẽ chỉ ra được các yếu
tố ảnh hưởng thực sự tới chất lượng xây dựng đề thi TNKQ, từ đó có những
đề xuất giải pháp nhằm cải thiện chất lượng xây dựng đề thi của nhà trường.
2.2. Thiết kế mẫu phiếu điều tra đối với giáo viên
Để thuận tiện trong việc lượng hoá các item trong phiếu hỏi, chúng tôi sử
dụng thang bậc đánh giá theo 5 mức độ đồng ý với 27 item của phiếu hỏi là
các phát biểu thuận chiều, 03 phát biểu là phát biểu nghịch chiều (khi xử lý
phải đổi điểm ngược lại) và 03 phát biểu mở (cung cấp thông tin khi đánh giá
bằng phương pháp chuyên gia).
35
Trong bảng hỏi, 5 nhóm yếu tố đã kể trên sẽ được chia thành 30 item
theo cấu trúc sau:
- Thời gian đầu tư cho công việc: 03 item
- Động cơ của người thực hiện: 05 item
- Mức độ được trang bị kỹ thuật : 16 item
- Sự quan tâm của nhà trường: 03 item
- Tính chất các nhóm môn học: 03 item
Qua phân bố các item trong cấu trúc trên, dễ nhận thấy yếu tố thứ 3
“Mức độ nắm vững kỹ thuật ra đề TNKQ của giảng viên” có trọng số lớn hơn
cả. Điều này không phải là một nhận định quá chủ quan mà nó được xây dựng
trên kinh nghiệm cá nhân, thăm dò dư luận đám đông và ý kiến của các
chuyên gia có kinh nghiệm về đo lường đánh giá trong giáo dục.
Mẫu phiếu dùng trong nghiên cứu của luận văn sử dụng thang bậc đánh
giá được lượng hoá thành 5 mức như sau:
0 = Hoàn toàn không đúng / hoàn toàn không đồng ý
1 = Cơ bản không đúng / cơ bản không đồng ý
2 = Đúng một phần / đồng ý một phần/ phân vân
3 = Cơ bản đúng / cơ bản đồng ý
4 = Hoàn toàn đúng / hoàn toàn đồng ý
Các nội dung trong phiếu đánh giá cụ thể như sau:
Yếu tố “Thời gian dành cho công việc” được đánh giá qua 3 item (từ 1 đến 3)
1- Tôi đã đầu tư nhiều thời gian cho việc ra đề thi TNKQ.
2- Nhà trường bố trí thời gian đủ cho giáo viên xây dựng bộ đề thi TNKQ.
3- Tôi đã áp dụng thử bộ đề thi trước khi thi kết thúc môn học.
Yếu tố “Động cơ của người thực hiện” được đánh giá qua 5 item (từ 4 đến 8)
4- Tôi thực sự hứng thú đối với việc áp dụng phương pháp thi TNKQ.
5- Tôi đã dành thời gian tìm hiểu kỹ về thi TNKQ.
6- Tôi đã chủ động áp dụng việc thi TNKQ trong môn học do mình giảng dạy.
36
7- Tôi cho rằng thi TNKQ là không cần thiết.
8- Tôi nhận thấy thi TNKQ là tiện lợi và khoa học.
Yếu tố “Mức độ nắm vững kỹ thuật ra đề TNKQ của giảng viên” được
đánh giá qua 16 item (từ 9 đến 24)
9- Bộ đề thi TNKQ dùng để đánh giá SV được thiết kế theo ma trận kiến
thức của môn học tôi giảng dạy.
10- Bộ đề thi TNKQ tôi thiết kế có thể phân loại được sinh viên theo lực học.
11- Bộ đề thi TNKQ tôi thiết kế không quá khó, phù hợp với lực học
trung bình của sinh viên.
12- Tôi hiểu rõ từng câu hỏi và có thể trả lời đúng từng câu hỏi trong bộ
đề thi của mình mà không cần tới đáp án.
13- Tôi đã được tập huấn những kiến thức cơ bản về kỹ thuật ra đề
thi TNKQ.
14- Các câu hỏi trong đề thi phù hợp với thời lượng của từng nội dung
trong đề cương chi tiết môn học.
15- Số lượng các câu hỏi trong đề thi phân bố đều ở các nội dung và bao
quát cả chương trình môn học.
16- Tôi đã bỏ ra khá nhiều thời gian để tự nghiên cứu về kỹ thuật ra đề
thi TNKQ.
17- Tôi đã trao đổi về nội dung bộ đề thi TNKQ trong nhóm giảng
viên của Bộ môn.
18- Bộ đề thi TNKQ của tôi được thiết kế chung cho cả nhóm môn học
trong Bộ môn.
19- Sau mỗi lần thi tôi thường đánh giá chất lượng đề (các đặc tính đo
lường) để bổ sung và chỉnh sửa bộ đề thi.
20- Tôi thiết kế đề thi TNKQ chủ yếu dựa trên kinh nghiêm cá nhân.
21- Tôi chưa nắm được kỹ thuật phân tích item.
22- Tôi chưa nắm được lý thuyết hồi đáp IRT.
23- Tôi biết sử dụng phần mêm SPSS để đánh giá độ tin cậy.
24- Tôi biết sử dụng phần mêm Quest hoặc Conquest để phân tích item.
Yếu tố “Sự quan tâm của nhà trường” được đánh giá qua 3 item (từ 25 đến 27)
25- Nhà trường khuyến khích việc áp dụng thi TNKQ.
26- Xây dựng đề thi TNKQ được coi là một tiêu chuẩn nhằm đánh giá
đổi mới phương pháp giảng dạy.
37
27- Nhà trường có hỗ trợ kinh phí thích đáng cho việc xây dựng đề
thi TNKQ.
Yếu tố “Tính chất các nhóm môn học” được đánh giá qua 3 item (từ
28 đến 30)
28- Môn học tôi giảng dạy phù hợp với việc thi TNKQ.
29- Tôi cho rằng đề thi TNKQ chỉ phù hợp với một số môn học.
30- Tôi cho rằng tính chất các nhóm môn học có ảnh hưởng đáng kể đến
chất lượng đề thi TNKQ.
Ngoài ra phiếu đánh giá còn có thêm 3 item nhằm lấy thêm thông tin:
31. Anh chị giảng dạy môn học thuộc nhóm nào?
a. Nhóm Toán, Lý, Hoá c. Nhóm Ngoại ngữ
b. Nhóm Văn, Chính trị xã d. Nhóm các môn Kỹ thuật
32. Theo anh chị, yếu tố nào (trong 5 nhóm yếu tố trên) có ảnh hưởng
lớn nhất đến quá trình ra đề thi TNKQ của giảng viên?
33. Anh chị có kinh nghiệm như thế nào về ra đề thi TNKQ:
Các item 07, 21, 22 và 29 là các phát biểu nghịch chiều, khi xử lý kết
quả phải lấy điểm số theo chiều ngược lại.
Các item còn lại trong bảng kẻ là các phát biểu thuận chiều, khi xử lý kết
quả phải lấy điểm số dương.
Các item 31, 32, 33 là các phát biểu mở nhằm cung cấp thêm thông tin
cho người xử lý.
Điểm số lượng hoá của phiếu hỏi bằng tổng đại số điểm của các item
trong bảng kẻ (Giá trị của điểm số tổng cộng mặc định là tương quan chặt
với điều kiện thuận lợi cho việc xây dựng đề thi TNKQ).
38
Chương 3
XỬ LÝ SỐ LIỆU THI VÀ KẾT QUẢ PHIẾU ĐIỀU TRA
3.1. Xử lý số liệu kết quả thi TNKQ
3.1.1. Phân tích độ khó của item
Độ khó của item được dùng để tạo ra sự phân biệt giữa những người làm
trắc nghiệm. Mức độ khó của item được định nghĩa dựa trên tỷ lệ người trả
lời đúng item đó. Phân tích độ khó của item chỉ phù hợp cho những trắc
nghiệm đánh giá thành tích hay năng khiếu, những trắc nghiệm cho phép bộc
lộ tối đa năng lực của người làm trắc nghiệm. Phân tích độ khó không phù
hợp cho những trắc nghiệm đánh giá nhân cách hay quan điểm thái độ.
Độ khó của từng item trực tiếp ảnh hưởng đến độ tin cậy và độ giá trị
(hiệu lực) của trắc nghiệm. Ví dụ, một trắc nghiệm có 50 item nhưng có 20
item quá khó (tất cả sinh viên đều nhận điểm 0 trên các item này). Như vậy,
phân bố điểm của trắc nghiệm gồm 50 item này cũng giống như phân bố
điểm của trắc nghiệm chỉ gồm 30 item. Khi đó, độ khó của các item đã thực
sự làm giảm độ dài của trắc nghiệm. Về mặt lý thuyết, độ dài của trắc nghiệm
giảm sẽ làm giảm độ tin cậy của trắc nghiệm và cũng làm giảm độ hiệu lực
của trắc nghiệm [4].
Công thức tính độ khó của item:
P = (Số người trả lời đúng trên item) / N
P: Độ khó của item
N: Tổng số người trả lời item
P có gía trị từ 0,0 đến 1,0. Giá trị của P càng gần 0,0 thì độ khó của item
càng tăng. Ngược lại, giá trị của P càng gần 1,0 thì độ khó càng giảm. Độ khó
của item không phải chỉ có một giá trị cố định mà ngược lại mỗi khi trắc
nghiệm được làm với một mẫu nào đó, ta lại có một giá trị xác định. Độ khó
có thể thay đổi tuỳ thuộc vào trình độ, năng lực của người làm trắc nghiệm.
39
Một item có độ khó phù hợp nhất khi P nằm xung quanh 0,5. Tuy nhiên, để
đánh giá được độ khó của item phù hợp nhất cho trắc nghiệm cần căn cứ vào
mục đích của trắc nghiệm và kiểu item.
Độ khó của item không chỉ nói lên mức độ nắm vững / không nắm vững
(kiến thức hay kỹ năng) của người làm trắc nghiệm mà nhiều khi trả lời đúng
là do đoán mò. Đối với những item có hai lựa chọn (đúng / sai) hay có nhiều
lựa chọn, xác suất đoán trúng là 50% hay 25% (nếu là 4 lựa chọn). Như vậy
độ khó tối ưu (optimal item dificulty) được tính theo công thức sau:
Điểm giữa P do đoán đúng = 1,0 – (khả năng có thể đoán đúng) / 2
Độ khó tối ưu cho đoán đúng = điểm giữa P + khả năng đoán đúng.
Độ khó của item sẽ ảnh hưởng đến điểm của trắc nghiệm. Những item
quá khó (P < 0,1) sẽ làm giảm điểm trung bình, thu hẹp phạm vi điểm vì hầu
hết mọi người mất điểm trên những item này hoặc có điểm là do đoán mò.
Điều này có thể ảnh hưởng đến điểm số của những người làm trắc nghiệm.
Những item quá dễ sẽ làm mọi người đều có điểm trên item đó, do đó sự
khác nhau giữa những người đạt điểm cao nhất (được xem là có năng lực tốt
nhất) và những người có điểm thấp nhất (được xem là có năng lực tồi nhất)
có điểm ngang nhau ở những item này do vậy độ phân biệt sẽ có giá trị gần
bằng 0. Điều này sẽ ảnh hưởng đến độ hiệu lực của trắc nghiệm.
3.1.2. Phân tích độ phân biệt của item
Phân tích độ phân biệt là chỉ ra mức độ khác biệt trong cách trả lời item ở
những mẫu người khác nhau. Không giống như phân tích độ khó, phân tích độ
phân biệt thích hợp cho hầu hết các kiểu trắc nghiệm.
Một item có độ phân biệt tốt là khi trả lời item đó, hầu hết những người
có điểm trắc nghiệm cao trả lời đúng, đồng thời những người có điểm trắc
nghiệm thấp trả lời sai.
40
Có nhiều kỹ thuật đánh giá độ phân biệt của item, tuy nhiên có thể xem
có hai cách thường được sử dụng nhất:
- Đánh giá chỉ số phân biệt của item (item discrimination index)
- Đánh giá tương quan điểm item với điểm trắc nghiệm (item – total
correlation)
Độ phân biệt được xác định từ kết quả so sánh điểm trắc nghiệm của hai
nhóm người có điểm số cao và thấp rút ra từ hai mẫu riêng rẽ hoặc từ một
mẫu. Nếu lấy từ một mẫu hãy chọn (khoảng 1/3 hay 1/4 ) số người làm trắc
nghiệm có điểm cao nhất và số người làm trắc nghiệm có điểm thấp nhất. Sau
khi xác định được hai nhóm có điểm cao và điểm thấp, hãy tính tỷ lệ % số
người trả lời đúng trên từng item cho mỗi nhóm. Chỉ số phân biệt của item
được tính theo công thức sau:
Số người trả lời đúng Số người trả lời đúng
ở nhóm điểm cao ở nhóm điểm thấp
D = ---------------------------- - ---------------------------
Tổng số người trả lời Tổng số người trả lời
ở nhóm điểm cao ở nhóm điểm thấp
D: Độ phân biệt của item
Với các trắc nghiệm đánh giá năng lực, ta có thể giải thích sự thay đổi
các giá trị của D như sau: Nếu item có câu trả lời khó cho những người ở
nhóm điểm thấp mà dễ cho những người ở nhóm điểm cao, thì khi đó chỉ số
D là tiếp cận 1,0 (item có độ phân biệt lý tưởng). Nếu item có câu trả lời khó
ngang bằng cho cả hai nhóm thì chỉ số D tiếp cận 0,0 (item không có độ phân
biệt hay độ phân biệt kém). Nếu item có câu trả lời dễ cho những người ở
nhóm điểm thấp mà lại khó cho nhóm người điểm cao thì chỉ số phân biệt D
tiếp cận – 1,0, khi đó item vẫn có độ phân biệt lý tưởng nhưng không giống
như mong đợi.
41
Theo các chuyên gia trong lĩnh vực này thì chỉ số phân biệt của từng
item, được coi là thích hợp khi D lớn hơn hoặc bằng 0,3. Những item có chỉ
số phân biệt nhỏ hơn hoặc bằng 0,2 nên được viết lại.
Phương pháp đánh giá độ phân biệt bằng cách đánh giá tương quan
giữa item và toàn bộ trắc nghiệm
Nếu trắc nghiệm và item cùng đo một đặc tính hay một cấu trúc thì điểm
trả lời trên item sẽ tương quan với tổng số điểm của trắc nghiệm. Cũng vậy,
nếu các item cùng đo một đặc tính hay một cấu trúc thì chúng sẽ tương quan
với nhau. Công thức tính tương quan điểm item và điểm của trắc nghiệm
như sau:
))((
))(()/(
YX
XY
YXNXY
R σσ
∑ −=
X: Điểm của item được phân tích
Y: Điểm tổng của các item còn lại (điểm trắc nghiệm)
X : Điểm trung bình của item được phân tích
Y : Điểm trung bình của trắc nghiệm
σX : Độ lệchchuẩn của điểm trên item được phân tích
σY : Độ lệch chuẩn của điểm trắc nghiệm
Giá trị của hệ số tương quan càng tiệm cận 1,0 càng chứng tỏ item và
trắc nghiệm có tính đồng nhất cao, tức là cùng đo một đặc tính. Với các trắc
nghiệm đánh giá năng lực, giá trị tương quan càng gần 1,0 sẽ cho biết càng có
nhiều người có điểm trắc nghiệm cao trả lời đúng item đó. Ngược lại giá trị
tương quan càng gần -1,0 sẽ cho biết càng có nhiều người có điểm trắc
nghiệm thấp trả lời đúng item đó.
3.1.3. Đánh giá độ tin cậy của bài trắc nghiệm
Việc phân tích độ khó, độ phân biệt của các item trong bài trắc nghiệm
như đã chỉ ra ở trên chỉ có tính chất đánh giá cục bộ, đơn lẻ trên các item.
42
Những kết quả đó chưa phản ánh hết toàn bộ độ tin cậy của toàn bộ bài trắc
nghiệm. Để có kết luận một cách toàn diện về độ tin cậy của cả bài trắc
nghiệm người ta thường dùng phương pháp đánh giá dựa trên mô hình tương
quan Alpha của Cronbach (Cronbach’s coefficent alpha).
- Sử dụng thủ tục Reliability Analysis trên phần mềm SPSS.
Từ cửa sổ file dữ liệu SPSS.dat
+ Chọn Analyze \ Scale \ Relibility Analisis.
+ Chọn mode Alpha.
+ Chuyển các biến (item) vào hộp item.
+ Bấm vào hộp Statistic…
+ Chọn Scale.
+ Chọn Scale if item deleted.
+ Tích vào các hộp Hotenlling’s Tsquare và Tukey’s test.
+ Chọn continue \ Ok.
Kết quả tại Out put ta có bảng mức độ tin cậy của từng item của thang đo
(là các câu hỏi trong trắc nghiệm).
43
Bảng 3.1: Kết quả phân tích độ tin cậy (Reliability Analysis Alpha)
của toàn bài trắc nghiệm trong đề số 1
Tên
biến
Varia
ble
Điểm trung bình
của thang đo nếu
item bị xoá
Scale Mean if
Item Deleted
Phương sai của
thang đo nếu
item bị xoá
Scale Variance
if Item Deleted
Hệ số tương quan
của item với các
item còn lại
Corrected Item-
Total Correlation
Hệ số alpha
nếu item bị
xoá
Cronbach's
Alpha if Item
Deleted
c1
c2
c3
c4
c5
c6
c7
c8
c9
c11
c12
c13
c14
c15
c16
c17
c18
c19
c20
c21
c22
c23
c24
c25
c26
c27
c28
c29
c30
c31
c32
42.02
42.35
42.12
41.96
42.29
41.96
42.58
42.04
42.15
41.96
42.15
42.31
42.58
41.98
42.10
41.98
42.04
42.17
42.15
42.31
42.52
42.25
42.17
42.29
41.96
42.00
42.02
42.42
42.13
42.33
42.10
35.196
37.603
35.202
35.920
34.954
35.763
37.817
35.763
34.015
35.685
35.780
36.727
37.425
36.294
34.755
35.862
34.351
35.362
35.035
38.178
37.078
35.328
34.381
32.680
34.822
35.020
34.568
33.504
32.785
33.087
33.304
.234
.284
.159
.066
.160
.134
.328
.063
.386
.168
.030
.144
.263
.084
.269
.069
.438
.107
.178
.380
.201
.099
.300
.575
.546
.320
.416
.403
.668
.488
.604
.756
.778
.759
.760
.759
.759
.778
.761
.750
.759
.763
.772
.776
.763
.755
.760
.751
.761
.758
.781
.774
.761
.753
.741
.752
.755
.752
.748
.740
.745
.743
44
Tên
biến
Varia
ble
Điểm trung bình
của thang đo nếu
item bị xoá
Scale Mean if
Item Deleted
Phương sai của
thang đo nếu
item bị xoá
Scale Variance
if Item Deleted
Hệ số tương quan
của item với các
item còn lại
Corrected Item-
Total Correlation
Hệ số alpha
nếu item bị
xoá
Cronbach's
Alpha if Item
Deleted
c33
c34
c35
c36
c37
c38
v39
c40
c41
c42
c43
c44
c45
c46
c47
c48
c49
c50
c51
c52
c53
c54
c55
c56
c57
c58
c59
c60
42.00
42.31
42.23
42.62
41.98
42.08
42.38
42.12
42.00
42.12
42.62
42.54
42.02
42.00
42.62
42.25
42.25
42.12
42.02
42.48
42.15
42.04
41.98
42.15
42.04
42.15
41.98
41.98
35.412
33.982
33.710
37.457
35.156
33.680
34.908
33.241
35.020
33.712
32.908
34.998
33.862
34.196
33.849
33.407
33.407
35.398
35.353
34.372
34.172
36.038
35.862
35.388
35.763
36.015
35.862
36.015
.196
.330
.404
.274
.322
.544
.160
.591
.320
.485
.559
.150
.624
.586
.377
.453
.453
.117
.189
.253
.354
.008
.069
.107
.063
.017
.069
.063
.758
.752
.749
.776
.755
.746
.759
.743
.755
.747
.742
.759
.746
.748
.750
.747
.747
.760
.758
.755
.751
.763
.760
.761
.761
.765
.760
.761
45
Các thông tin về độ tin cậy của toàn bài trắc nghiệm được cho trong bảng sau
Bảng 3.2: Các thông số về độ tin cậy (Reliability Statistics)
Hệ số tin cậy
Cronbach's Alpha
Hệ số tin cậy trên các item chuẩn
Cronbach's Alpha Based on
Standardized Items
Số lượng item
N of Items
.805 .819 60
Qua phân tích số liệu trên bảng Output ta thấy đề thi trên dù còn có một
số câu hỏi (item) chưa được tốt song độ tin cậy của toàn bộ trắc nghiệm là
khá cao. Kết quả phân tích cho hệ số tin cậy của toàn trắc nghiệm α = 0,805
có nghĩa là 80,5% phương sai của điểm trắc nghiệm là phương sai của điểm
số thực và chỉ có 15,5% phương sai của điểm là do sai số ngẫu nhiên của
phép đo. Cũng bằng phép phân tích này, nhìn vào bảng 1 ta thấy, những item
có tương quan với các item còn lại là thấp (αi < 0.30) thì cần phải xem lại,
những item có tương quan qúa thấp (αi < 0) thì nên loại bỏ.
Bằng cách tương tự ta có kết quả tổng hợp về độ tin cậy của 50 đề thi
trong bảng dưới đây.
Bảng 3.3: Hệ số tin cậy Alpha Cronbach’s của 50 đề trắc nghiệm
Đề thi
Hệ số tin cậy
Cronbach's
Alpha
Hệ số tin cậy trên các item
chuẩn
Cronbach's Alpha Based on
Standardized Items
Số lượng item
N of Items
Đề số 1 .80 .819 60
Đề số 2 .78 .794 60
Đề số 3 .75 .760 60
Đề số 4 .60 .621 60
Đề số 5 .54 .554 60
Đề số 6 .35 .360 60
Đề số 7 .33 .345 60
Đề số 8 .84 .850 60
46
Đề số 9 .86 .872 60
Đề số 10 .65 .661 60
Đề số 11 .65 .655 60
Đề số 12 .58 .591 60
Đề số 13 .48 .492 60
Đề số 14 .47 .485 60
Đề số 15 .50 .512 60
Đề số 16 .73 .743 60
Đề số 17 .74 .750 60
Đề số 18 .70 .712 60
Đề số 19 .69 .700 60
Đề số 20 .47 .485 60
Các file đính kèm theo tài liệu này:
- Đánh giá các yếu tố ảnh hưởng đến chất lượng các bộ đề thi trắc nghiệm khách quan tại Khoa Công Nghệ Thông tin - Đại học Thái Nguyên.pdf