MỤC LỤC
MỞ ĐẦU 3
CHƯƠNG 1: CƠ SỞ LÍ LUẬN 7
1.1 lịch sử những phép đo lường và trắc nghiệm 7
1.1.1 Trên thế giới 7
1.1.2. ở nước ta 8
1.2. Các khái niệm 9
1.2.1. Trắc nghiệm là gì? 9
1.2.2. Trắc nghiệm khách quan là gì? 13
1.2.3. Các tiêu chuẩn để đánh giá các câu TN và bài thi TNKQ 25
1.2.4. Lý thuyết ứng đáp câu hỏi và mô hình Rasch 42
CHƯƠNG 2: LẬP DÀN BÀI TRẮC NGHIỆM 49
2.1. Mục đích của bài TN 49
2.2. Phân tích nội dung môn học 49
2.3. Thiết lập dàn bài TN 50
2.4 Quá trình thực hiện. 50
CHƯƠNG 3: PHÂN TÍCH KẾT QUẢ 52
3.1. Phân tích bài tn 52
3.1.1. Phân tích câu TN 52
3.1.2. Phân tích bài TN 55
TÀI LIỆU THAM KHẢO 59
60 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2591 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Khóa luận Xây dựng bộ câu trắc nghiệm khách quan về môn hoá học lớp 11, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
nh kép, không để học sinh đoán được câu trả lời nhờ chiều dài của câu, nên dùng các từ định tính hơn định lượng
Phương pháp chấm điểm loại TN đúng sai:
Có hai phương pháp được áp dụng cho loại TN đúng sai:
Phương pháp thứ nhất là cho mỗi câu trả lời đúng một điểm và không kể đến câu sai hoặc không làm.
Phương pháp thứ hai thường dùng hơn đếm số câu trả lời đúng R và trừ đi số câu trả lời sai W . Công thức tính điểm khi đó sẽ là:
Điểm số = Số câu đúng R - Số câu sai W
Nguyên nhân dùng công thức này là, theo lí thuyết, một học sinh không biết gì, dùng cách đoán mò, có thể trả lời 50 câu và sai 50 câu trong một bài 100 câu hỏi. Nhiều nhà TN cho rằng một người đoán mò như thế phải bị điểm không, nên điểm số của học sinh trên bằng số câu hỏi đúng nhờ may rủi (50) trừ số câu sai (50). Nhiều chuyên viên TN như W.B.Michacl, J.A.R.Wilson và M.C Robeck (1969) khuyên không nên dùng công thức hiệu chỉnh cho số câu TL sai trừ trường hợp bài TN tốc độ. Việc dùng công thức hiệu chỉnh thường đưa vào một nguồn sai số làthói quen trả lời câu hỏi theo một khuynh hướng nào đó (liều lĩnh hay thận trọng) sẽ làm giảm giá trị của bài trắc nghiệm.
1.2.2.3.4. Trắc ngiệm có nhiều phương án trả lời (MCQ).
ở phần trên chúng ta đã tìm hiểu về một số loại câu hỏi TNKQ và cũng thấy được rằng các loại đó vẫn còn nhiều nhược điểm. Một loại câu hỏi mà khắc phục được nhiều nhược điểm đó chính là TN-MCQ (TN có nhiều phương án TL). Đây là dạng TNKQ được ưa chuộng nhất, thường được kí hiệu là MCQ.
Đặc điểm: Một CH loại này gồm một phần phát biểu chính,thường gọi là lời dẫn, hay CH, và bốn, năm, hay nhiều phương án trả lời cho sẵn để TS chọn ra câu TL đúng nhất, hay hợp lí nhất. Ngoài một câu đúng, các câu TL khác trong các phương án chọn lựa phải có vẻ hợp lí với TS.
Ưu điểm của TN-MCQ:
Có thể đo được các mức khả năng tâm linh khác nhau. Với sự phối hợp của nhiều phương án TL để chọn cho mỗi CH có thể kiểm tra, đánh giá những mục tiêu giảng dạy, học tập khác nhau một cách khá toàn diện.
Độ tin cậy cao hơn. Yếu tố đoán mò may rủi của học sinh giảm đi nhiều so với các loại TNKQ khác khi số phương án chọn lựa tăng lên.
Học sinh phải xét đoán và phân biệt kĩ càng khi TLCH. Tính chất tuyệt đối trong loại đúng sai nhường chỗ cho tính chất tương đối khi HS phải chọn lựa câu TL đúng nhất hay hợp lí nhất trong số các phương án TL đã cho.
Tính chất giá trị tốt hơn do dạng TN này có thể đo được đầy đủ các mức tâm linh khác nhau như: nhớ, hiểu, áp dụng, phân tích, tổng hợp, đánh giá.
Có thể phân tích được tính chất mỗi CH. Dùng phương pháp phân tích câu hỏi, chúng ta có thể xác định câu nào dễ quá, câu nào khó quá, câu nào mơ hồ hay không giá trị đối với các mục tiêu cần TN. Ngoài ra, chúng ta có thể xét xem câu TL cho sẵn nào không ích lợi, hoặc làm giảm giá trị CH. Phương pháp này không thực hiện với loại CHTL, hay khó thực hiện với loại TN khác.
Tính khách quan khi chấm bài thi. Dựa vào máy, bài thi được quét và vào điểm một cách hoàn toàn khách quan. Ngay cả những khi bài thi được chấm bằng tay thì điểm số trên bài thi của TS cũng không phụ thuộc vào người chấm vì TNMCQ không phụ thuộc vào các yếu tố như phẩm chất của chữ viết, hoặc khả năng diễn đạt tư tưởng.
Ngoài ra, TNMCQ còn có tất cả các ưu điểm khác của TNKQ.
Nhược điểm của loại CHTNMCQ:
Ngoài những nhược điểm của CHTNKQ so với TL mà ta đã so sánh ở trên thì TNMCQ còn có những tồn tại sau:
Khó soạn CH. Việc soạn CHMCQ sẽ mất nhiều thời gian và sự công phu mới viết được những CH đạt tiêu chuẩn, đúng kĩ thuật. Yêu cầu đặt ra ở đây là phải chọn ra phương án đúng nhất trong khi các phương án nhiễu đề ra cũng phải có vẻ hợp lí. Qua đó ta mới có thể đo được các mục tiêu đã định sẵn và các mức kĩ năng cao hơn mức nhớ.
Đối với những TS học khá thường khó chịu với những CH mà họ có thể có phương án TL hay hơn. Vì vậy khi soạn CH thì GV phải cố gắng soạn để có câu TL tốt nhất và hay nhất.
Còn có những nhược điểm khác là: tốn nhiều giấy để in CH, và TS sẽ phải tốn nhiều thời gian để đọc CH.
Nếu so với CHTL thì CHMCQ không thể đo được khả năng giải quyết vấn đề khéo léo hay khả năng phán xét , nhìn nhận vấn đề của TS.
Các quy tắc khi soạn CHTNMCQ:
Một yếu tố không thể thiếu trong TNMCQ là phần chính, hay câu dẫn của CH phải diễn đạt rõ ràng một vấn đề. Các câu TL để chọn phải là những câu khả dĩ thích hợp với vấn đề đã nêu. Tránh dùng những câu có vẻ như CH loại "đúng, sai" không có liên hệ với nhau sắp chung một chỗ.
Phần chính của câu hỏi nên mang chọn ý nghĩa và phần câu TL để chọn nên ngắn gọn. Tránh những từ rườm rà không cần thiết để diễn tả ý nghĩa câu hỏi.
Nên có nhiều phương án TL để TS lựa chọn nhưng cũng không nên nhiều quá gây rối cho TS, làm giảm giá trị của những mồi nhử. Nếu phương án chọn ít qúa sẽ làm tăng yếu tố may rủi nên dừng lại ở bốn hoặc năm phương án.
Đối với câu hỏi: a) Nên tránh thể phủ định, hay hai thể phủ định liên tiếp, nếu có thì phải gạch chân hoặc viết hoa để TS chú ý hơn.
b) Câu hỏi nhằm đo sự hiểu biết, suy luận, hay khả năng áp dụng các nguyên lí vào các trường hợp mới thì phải trình bày dưới nhiều hình thức khác nhau và mới mẻ.
Nếu câu hỏi đề cập đến vấn đề nhiều tranh luận thì phải nêu rõ nguồn gốc, quan điểm... trong lời dẫn.
Đối với các phương án TL:
Phải chắc chắn chỉ có một câu đúng.
Độ dài các câu phải gần bằng nhau.
Phải đồng nhất với nhau. Tính chất đồng nhất có thể dựa trên căn bản ý nghĩa, âm thanh, độ dài, hoặc cùng là động từ, tính từ, danh từ.
Lưu ý đến những điểm liên hệ về văn phạm giúp TS nhận biết câu TL.
Không nên dùng hai phương án trái nghĩa nhau làm cho TS chỉ chú ý đến hai phương án này. Điều này làm cho câu hỏi TNMCQ giông dạng TN " đúng sai".
Phương án đúng nên đặt một cách ngẫu nhiên ở các vị trí và không nên dùng các từ mang ý nghĩa chung chung như: “không câu nào trên đây đúng” hoặc “tất cả các câu trên đây đều đúng”.
Phương án cho điểm loại câu hỏi MCQ:
Giả sử một TS có số câu TL đúng là R và số câu TL sai là W với số phương án TL cho sẵn để lựa chọn là k thì công thức thường được dùng để chấm điểm là:
Điểm =
Đây là công thức có hiệu chỉnh do yếu tố đoán mò may rủi. Nguyên nhân là do nếu bài thi gồm có 60 câu, mỗi câu có năm phương án lựa chọn. Xác suất để một người đoán mò đoán đúng là 20% tức là 12 câu, và sẽ trả lời sai là 48 câu. Chia 48 cho (5-1) thì ta được 12. Khi trừ con số này cho 12 câu trả lời đúng chỉ nhờ may mắn, người đó sẽ được điểm không. Tuy nhiên nhiêu công trình và nhiều tác giả cho thấy là việc áp dụng công thức là không cần thiết vì sẽ dùng điểm âm.
1.2.3. Các tiêu chuẩn để đánh giá các câu TN và bài thi TNKQ
1.2.3.1. Các mức độ mục tiêu trong lĩnh vực nhận thức
1.2.3.1.1. Các mức kĩ năng trong lĩnh vực nhận thức
Theo B. S. Bloom, các hoạt động giáo dục bao gồm ba lĩnh vực, đó là lĩnh vực về nhận thức, lĩnh vực về hoạt động, và lĩnh vực về cảm xúc thái độ. Lĩnh vực về nhận thức thể hiện ở khả năng suy nghĩ, lập luận, bao gồm việc thu thập các sự kiện, giải thích, lập luận theo kiểu diễn dịch và quy nạp và sự đánh giá có phê phán.
Bloom và các cộng sự của ông ta cũng xây dựng nên các cấp độ của các mục tiêu giáo dục, thường được gọi là cách phân loại B.loom, trong đó lĩnh vực nhận thức được chia thành các mức độ hành vi từ đơn giản nhất đến phức tạp nhất như sau (5, tr 3):
nhớ: là sự nhớ lại các dữ liệu đã học được trước đây. Có nghĩa là nhắc lại một loạt dữ liệu, từ các sự kiện đơn giản đến các lí thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là cấp độ thấp nhất của kết quả học tập trong lĩnh vực nhận thức.
hiểu: là khả năng nắm được ý nghĩa của tài liệu. Điều này thể hiện bằng việc chuyển tài liệu từ dạng này sang dạng khác, bằng cách giải thích tài liệu (hoặc tóm tắt) và bằng cách ước lượng xu hướng tương lai (dự báo các hệ quả hoặc ảnh hưởng). Kết quả học tập ở mức độ nay cao hơn so với nhớ, và là mức thấp nhất của việc thấu hiểu sự vật.
áp dụng: là khả năng sử dụng những điều đã học vào một hoàn cảnh cụ thể mới. Điều đó có thể bao gồm việc áp dụng các quy tắc, phương pháp, khái niệm nguyên lí, định luật và lí thuyết. Kết quả học tập ở lĩnh vực này đòi hỏi cấp độ thấu hiểu cao so với cấp độ hiểu ở trên.
phân tích: là khả năng phân chia một tài liệu ra thành các phần của nó sao cho có thể hiểu được các cấu trúc tổ chức của nó. Bao gồm việc chỉ ra đúng các bộ phận, phân tích các mối quan hệ giữa các bộ phận, và nhận biết được các nguyên lí tổ chức được bao hàm. Phân tích đòi hỏi một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài liệu nên kết quả học tập ở đây thể hiện một mức trí tuệ cao hơn so với mức hiểu.
tổng hợp: là khả năng sắp xếp các bộ phận lại với nhau để hình thành một tổng thể mới. Bao gồm việc tạo ra một cuộc giao tiếp đơn nhất (chủ đề hoặc bài phát biểu), một kế hoạch hành động (dự án nghiên cứu), hoặc một mạng lưới các quan hệ trừu tượng (sơ đồ để phân lớp thông tin). Kết quả học tập trong lĩnh vực này nhấn mạnh các hành vi sáng tạo, đặc biệt tập trung chủ yếu vào việc hình thành các mô hình và cấu trúc mới.
đánh giá: là khả năng xác định giá trị của tài liệu (tuyên bố, tiểu thuyết, thơ, báo cáo nghiên cứu). Việc đánh giá dựa trên các tiêu chí nhất dịnh. Đó có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu chí bên ngoài (phù hợp với mục đích), và người đánh giá phải tự xác định hoặc được cung cấp các tiêu chí. Kết quả học tập trong lĩnh vực này là cao nhất trong các cấp bậc nhận thức vì nó chứa các yếu tố của mọi cấp bậc khác.
Các công cụ đánh giá có hiệu quả phải giúp xác định được kết quả học tập ở mọi cấp độ nói trên để đưa ra một nhận định chính xác về năng lực của người được đánh giá về chuyên môn liên quan.
1.2.3.1.2. Mục tiêu giảng dạy
Bất kì một hoạt động nào cũng phải có mục tiêu cần đạt đến. Trong giảng dạy cũng thế, muốn việc giảng dạy có hiệu quả thì ta phải đặt ra các mục tiêu giảng dạy để làm cái đích cho HS và GV hướng đến. TN nói chung và TNKQ nói riêng đều phải đo được cái cần đo, tức là đo được mức độ đạt các mục tiêu cụ thể của môn học, cần phải thiết kế và viết đề thi trắc nghiệm bám sát mục tiêu môn học. Mục tiêu giảng dạy là cơ sở quan trọng để xây dựng các đề thi TN.
Để giảng dạy tốt một môn học cần có một danh mục chi tiết về các mục tiêu giảng dạy, thể hiện ở năng lực hay hành vi cần phát triển của người học qua quá trình giảng dạy. Để viết một bài TN tốt cho môn học đó cần dựa vào các mục tiêu đề ra cho môn học. Khi đã có một mục tiêu chi tiêt của môn học thì chúng ta liệt kê các mục tiêu cụ thể liên quan đến các năng lực cần đo lường đối với từng phần của môn học, sau đó tuỳ thuộc vào mức độ quan trọng của từng mục tiêu ứng với từng phần của môn học mà quyết định là cần bao nhiêu câu hỏi.
Công cụ thuận lợi để thiết kế các thành phần của một đề TN là bảng mục tiêu giảng dạy. Trong bảng đó có chia ra các hàng ứng với các phần của môn học, và các cột ứng với các mức kĩ năng liê n quan đến mục tiêu cụ thể. ứng với mỗi ô của bảng người ta ghi số câu hỏi cần xây dựng cho bài TN. Tuỳ theo tầm quan trọng của nội dung và loại kĩ năng mà quy định số câu TN phải viết.
Việc xác định được chi tiết các mục tiêu cụ thể của môn học và thiết kế đề TN bám sát các mục tiêu đó là một đảm bảo để phép đo bằng đề thi TN có độ giá trị cần thiết.
1.2.3.2. Một số khái niệm và định luật quan trọng trong lí thuyết xác suất thống kê
TNKQ là một phương pháp khoa học dựa trên lí thuyết của xác suất thống kê do vậy chúng ta sẽ điểm lại một số kiến thức quan trọng cần đề cập đến trong lí thuyết thống kê.
1.2.3.2.1. Xác suất là gì?
Đối với các hiện tượng ngẫu nhiên người ta không thể biết chắc chắn một sự kiện hoặc biến cố gì sẽ xảy ra, chỉ có thể nói xác suất xảy ra một biến cố nào đó. Xác suất là một số không âm, có giá trị từ 0 (ứng với một sự cố không xảy ra) đến 1 (ứng với một sự cố chắc chắn xảy ra).
Một động tác để làm xuất hiện một sự cố được gọi là một phép thử. Chúng ta có thể thực hiện nhiều phép thử để khảo sát việc xuất hiện của một sự cố. Tỉ số lần xuất hiện sự cố trên tổng số phép thử được gọi là tần suất.
1.2.3.2.2. Luật số lớn là gì?
Khi số lượng phép thử tăng lên đủ lớn, giá trị tần suất sẽ tiến dần đến giá trị xác suất.
Đây là nội dung của luật số lớn, định luật này làm cơ sở quan trọng cho mọi nghiên cứu thống kê. Ngoài ra đây còn gọi là luật về giá trị trung bình.
1.2.3.2.3. Tổng thể và mẫu
Tổng thể là một tập hợp rất lớn các đối tượng dùng để xem xét các số liệu hoặc tính chất nào đó. VD: xem xét kết qủa TN trong một tổng thể gồm toàn bộ thí sinh tham dự kì thi cuối năm lớp 10.
Do việc thực hiện nghiên cứu trên một tổng thể với số lượng rất lớn đối tượng thường gây nhiều khó khăn và tốn kém, nên người ta thường triển khai một số nghiên cứu trên một tập hợp con với số lượng ít hơn của tổng thể. Tập hợp các con số đó gọi là mẫu nghiên cứu. Người ta phải chọn những mẫu nghiên cứu có tính đại diện cho tổng thể để việc nghiên cứu thu được các kết quả thống kê gần với kết quả thu được từ tổng thể.
1.2.3.2.4. Phân bố tần suất
Đường cong mô tả sự xuất hiện của một đăc trưng nào đó mà ta thực hiện phép đo trên một mẫu nghiên cứu được gọi là đường cong phân bố tần suất. VD: Khi tiến hành điều tra số học sinh phổ thông trung học của các tỉnh thuộc khu vực miền Bắc. Ta mô tả kết quả đo được trên một đồ thị, trục hoành biểu diễn số học sinh trong một trường (theo khoảng), trục tung biểu diễn tần suất xuất hiện của số học sinh trong khoảng nào đó. Nếu chúng ta tiến hành điều tra trên phạm vi cả nước thì ta sẽ được một đường cong có dạng giống như trên nhưng mịn và đều hơn. Khi phân bố tần suất đối với một tổng thể được gọi là phân bố xác suất.
Dạng phân bố kiểu hình chuông đối xứng như trên hình vẽ được gọi là phân bố chuẩn. Các đại lượng đặc trưng để phân bố tần suất là:
Giá trị trung bình của các giá trị đo được trên mẫu (gồm n cá thể).
=
giá trị trung bình xác định vị trí của một phân bố tần suất trên một thang đo nào đó.
Độ lệch tiêu chuẩn của các giá trị đo được so với giá trị trung bình.
S =
Khi n đủ lớn thì giá trị của S tính theo công thức trên gần với căn bậc hai của trung bình các bình phương độ lệch. Độ lệch tiêu chuẩn xác định mức độ phân tán của các số đo của đại lượng: khi độ lệch tiêu chuẩn bé đường phân bố sẽ có dạng hẹp và nhọn, còn khi độ lệch tiêu chuẩn lớn thì đường phân bố sẽ có dạng doãn và tù.
Khi một mẫu không đồng nhất ta sẽ thu được đường cong phân bố lệch (lệch âm hay lệch dương). Từ đó ta có thể phát biểu luật số lớn theo cách khác: Khi kích thước của mẫu chọn càng lớn, giá trị trung bình của các đại lượng đo trên mẫu sẽ tiến gần đến giá trị trung bình đo trên tổng thể.
Định lí giới hạn trung tâm
Nếu một đại lượng nào đó trong một tổng thể tuân theo một phân bố bất kì, từ tổng thể đó thì khi ta chọn nhiều mẫu khác nhau và xác định một đặc trưng nào đó của mẫu, chẳng hạn là giá trị trung bình thì định lí giới hạn trung tâm có nội dung như sau: nếu kích thước của mẫu chọn đủ lớn, phân bố của giá trị trung bình của mẫu theo các mẫu được chọn là gần với phân bố chuẩn, dù rằng phân bố của tổng thể theo quy luật nào đi nữa.
Hệ số tương quan
Biến là một đại lượng đặc trưng nào đó nhận các giá trị khác nhau từ một cá thể này đến một cá thể khác trong một tổng thể thống kê. Số liệu thống kê thường xem xét mối quan hệ giữa các biến khác nhau. Trong trường hợp có hai biến, mối quan hệ giữa chúng thường được biểu diễn bằng hệ số tương quan.
Hệ số tương quan R giữa hai biến x và y là:
R =
Trong đó: , là các độ lệch tiêu chuẩn của biến x và biến y, còn được gọi là hiệp phương sai giữa x và y được tính theo công thức:
S =
Từ đó có thể lập được biểu thức để tính hệ số tương quan Pearson:
R =
Hệ số tương quan là đại lượng để đo mối quan hệ tuyến tính giữa hai biến ngẫu nhiên. Nó có giá trị phân bố trong khoảng từ -1 đến 1.
R < 0 khi các giá trị cao (thấp,trung bình) của biến x tương ứng có liên hệ với các giá trị cao (thấp, trung bình) của biến y.
R > 0 khi các giá trị cao (trung bình, thấp) của biến x có liên hệ với các giá trị thấp (trung bình, cao) của biến y.
R = 0 khi quan hệ của các giá trị của biến x và các giá trị của biến y không tuân theo một quy luật rõ ràng nào.
1.2.3.3. Đánh giá các câu TN
Phân tích các câu trả lời của TS trong một bài TN là việc làm rất cần thiết và rất hữu ích cho người soạn TN. Nó giúp cho người soạn thảo:
Biết được những câu nào là quá khó, câu nào là quá dễ.
Lựa ra các câu có độ phân cách cao, nghĩa là phân biệt được giữa HS giỏi và HS kém.
Biết được lí do vì sao câu TN không đạt được hiệu quả mong muốn và cần phải sửa đổi như thế nào cho tốt hơn.
Một bài TN, sau khi đã được sửa đổi trên căn bản của sự phân tích như nói trên, có khả năng đạt được tính tin cậy cao hơn là một bài TN có cùng số câu hỏi nhưng chưa được thử nghiệm và phân tích.
Chúng ta sẽ phân tích câu TN ở hai tiêu chuẩn đó là: Độ khó và độ phân biệt.
1.2. 3.3.1 Độ khó
Khi soạn thảo xong một câu hoặc một bài TN người soạn thảo chỉ có thể ước lượng độ khó hoặc độ phân biệt của nó bằng cảm tính. Độ lớn của các đại lượng đó chỉ có thể tính được cụ thể bằng phương pháp thống kê sau lần TN thử, dựa vào kết quả thu được từ các câu và các bài TN của TS.
Độ khó của câu TN được định nghĩa bằng tỉ lệ của tổng số người trả lời đúng câu TN so với tổng số người làm câu TN ấy:
Tổng số TS trả lời đúng câu hỏi
Độ khó p của câu thứ i=
Tổng số TS trả lời câu hỏi
Việc sử dụng trị số p để đo độ khó là rất có ý nghĩa. Nó thay thế cách xác định độ khó theo các đặc tính nội tại của câu TN bằng cách đếm số người làm đúng câu hỏi. Nó cũng cho thấy rõ mức độ khó dễ phụ thuộc vào cả câu hỏi, lẫn người làm câu hỏi. Ngoài ra cách định nghĩa này cũng cho ta một đại lượng chung phản ánh độ khó dễ của các bài TN thuộc các lĩnh vực khoa học khác nhau.
Các câu hỏi của một bài TN thường phải có các độ khó khác nhau. Theo công thức tính độ khó như trên, rõ ràng gía trị p càng bé câu hỏi càng khó và ngược lại. Vậy p có giá trị như thế nào thì câu hỏi có thể được xem là có độ khó trung bình? Muốn xác định được khái niệm này cần phải lưu ý đến các xác suất làm đúng câu hỏi bằng cách chọn hú hoạ
Một bài TN được gọi là tốt không phải là bài TN gồm toàn những câu khó hay toàn những câu dễ cả, mà là bài TN gồm những câu có mức độ khó trung bình hay mức độ khó vừa phải.
Nhưng thế nào là độ khó vừa phải? Thông thường ta cho rằng một câu TN có độ khó vừa phải là câu có chỉ số khó là 50%, nghĩa là 50% học sinh làm đúng câu hỏi ấy và 50% làm sai. Nhưng muốn cho công bằng và đúng đắn hơn, ta cần phải phân biệt loại câu TN để xác định thế nào là độ khó vừa phải.
Với một câu TN thuộc loại đúng-sai thì độ khó 50% chưa hẳn là độ khó vừa phải vì như ta đã biết, câu hỏi thuộc loại này chỉ gồm có hai lựa chọn, do đó sự may rủi làm đúng câu hỏi ấy là 50%. Vậy ta không thể cho 50% là chỉ số khó thíchs hợp cho loại này. Vì lí do ấy, ta cần phải lưu ý đến một yếu tố khác. Đó là tỉ lệ may rủi kì vọng. Tỉ lệ này thay đổi tuỳ theo số câu lựa chọn trong mỗi câu hỏi. Nếu câu hỏi có hai lựa chọn thì tỉ lệ kì vọng là 50%. Như vậy, độ khó vừa phải của câu hai lựa chọn này phải là trung điểm giữa tỉ lệ may rủi kì vọng và100%, nghĩa là: (100 + 50)/ 2 = 75%. Nói cách khác, câu TN loại đúng-sai có độ khó vừa phải nếu 75% TS trả lời đúng câu hỏi ấy. Theo cách tính này thì tỉ lệ kì vọng của loại câu TN có 5 lựa chọn là 100/5, tức là 20%. Vậy độ khó vừa phải của câu TN có 5 lựa chọn là (100 + 20)/ 2 = 60%. Như vậy độ khó trung bình của một bài TN n phương án chọn là: (100%+1/n)/2. Còn đối với các câu TL tự do, như loại điền khuyết, thì độ khó trung bình là 50%.
Khi chọn các câu TN theo độ khó người ta thường phải loại các câu quá khó (không ai làm đúng) hoặc quá dễ (ai cũng làm đúng). Một bài TN tốt khi có nhiều câu ở độ khó trung bình.
Độ khó của bài TN được xét bằng cách đối chiếu điểm số trung bình của bài và điểm trung bình lí tưởng của nó. Điểm trung bình lí tưởng của bài TN là điểm số nằm giữa điểm tối đa người làm đúng toàn bộ nhận được và điểm mà người không biết gì có thể đạt được nhờ chọn hú hoạ. Giả sử chúng ta chỉ xét đến điểm thô. VD: một bài TN 50 câu, mỗi câu có 5 phương án TL. Điểm thô tối đa là 50, điểm có thể đạt được do chọn hú hoạ là 0,2 x 50 = 10, điểm trung bình lí tưởng là (50 + 10)/ 2 = 30. Nếu điểm trung bình quan sát được trên hay dưới 30 quá xa thì bài TN ấy sẽ là quá khó hay quá dễ. Nói chung, nếu điểm trung bình lí tưởng nằm ở khoảng giữa phân bố các điểm quan sát được thì bài TN là vừa sức đối với đối tượng TS, còn khi điểm đó nằm ở phía trên hoặc dưới phân bố điểm quan sát được thì bài trắc nghiệm tương ứng là khó hơn hoặc dễ hơn so với đối tượng TS. Thông thường độ khó của một câu hỏi có thể chấp nhận được nằm trong khoảng 0.25 – 0.75; câu có độ lớn hơn 0.75 là quá dễ, có độ nhỏ hơn 0.25 là quá khó. Việc tính độ khó theo cách nêu trên được thực hiện theo lý thuyết đo lường cổ điển. Trong lý thuyết trả lời câu hỏi ( IRT) hiện đại độ khó và năng lực của thí sinh được tính bằng cách ước lượng theo các mô hình toán học xác định.
1.2.3.3.2. Độ phân biệt
Trước hết chúng ta làm quen với phương pháp cổ điển đơn giản để tính độ phân biệt. Độ phân biệt của câu trắc nghiệm dùng để đo lường mức độ khác nhau giữa phản ứng của thí sinh giỏi và thí sinh kém lên câu hỏi đó. Độ phân biệt của một câu trắc nghiệm hoặc một bài trắc nghiệm liên quan đến độ khó. Thật vậy, nếu một bài trắc nghiệm dễ đến mức mọi thí sinh đều làm tốt, các điểm số đạt được chụm ở phần điểm cao, thì độ phân biệt của nó rất kém, mọi thí sinh đều có thể phản ứng như nhau đối với bài trắc nghiệm đó. Cũng vậy, nếu một bài trắc nghiệm khó đến mức mọi thí sinh đều không làm được, các điểm số đạt được chụm ở phần điểm thấp, thì độ phân biệt của nó cũng rất kém. Từ các trường hợp giới hạn nói trên có thể suy ra rằng muốn có độ phân biệt tốt thì bài trắc nghiệm phải có độ khó ở mức trung bình. Khi ấy điểm số thu được của nhóm thí sinh sẽ có phổ trải rộng.
Cách tính độ phân biệt
Dựa vào tổng điểm thô của từng thí sinh người ta tách từ đối tượng thí sinh ra một nhóm giỏi bao gồm 27% thí sinh đạt điểm cao từ trên xuống và nhóm kém bao gồm 27% thí sinh đạt điểm kém từ dưới lên. Gọi C là số thí sinh làm đúng câu hỏi thuộc nhóm giỏi, T là số thí sinh làm đúng câu hỏi thuộc nhóm kém, S là số lượng thí sinh của 27% tổng số, ta có biểu thức tính độ phân biệt D của câu hỏi như sau:
D = (C – T)/S
Người ta có thể tính theo phân biệt của một câu trắc nghiệm theo một định nghĩa khái quát hơn: đó là hệ số tương quan giữa các điểm của câu trắc nghiệm đó với tổng điểm của toàn bài trắc nghiệm xét trên mọi thí sinh làm bài trắc nghiệm ( hệ số tương quan điểm nhị phân). Hệ số tương quan có giá trị dương lớn ( gần bằng 1) nếu một thí sinh nào đó có điểm của câu trắc nghiệm cao thì điểm của toàn bài cũng cao và ngược lại. Hệ số tương quan có giá trị âm lớn ( gần bằng -1) nếu một thí sinh nào đó có điểm câu trắc nghiệm cao nhất thì điểm của toàn bài trắc nghiệm lại kém nhất, ngược lại. Hệ số tương quan bằng 0 nếu điểm của câu trắc nghiệm và điểm của toàn bài trắc nghiệm không có mối liên hệ chặt chẽ và ổn định nào cả. Nói cách khác, câu trắc nghiệm có độ phân biết tốt khi câu trắc nghiệm và toàn bài trắc nghiệm đều đo lường cùng một mục tiêu. Như vậy để tính độ phân biệt, ta có thể tính hệ số tương quan Pearson giữa điểm của câu trắc nghiệm với tổng điểm của toàn bài trắc nghiệm, sau đó kiểm nghiệm ý nghĩa của hệ số tương quan ấy.
1.2.3.4. Đánh giá bài trắc nghiệm
1.2.3.4.1. Độ tin cậy của bài trắc nghiệm
Trắc nghiệm là một phép đo: dùng thước đo là bài trắc nghiệm để đo lường một năng lực nào đó của thí sinh. Độ tin cậy của bài trắc nghiệm chính là đại lượng biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm. Có nhiều phương pháp theo khoa học thống kê để tính độ tin cậy của một bài trắc nghiệm.
Một bài trắc nghiệm được xem là đáng tin cậy khi nó cho ra những kết quả có tính vững chãi. Có nghĩa là nếu làm bài trắc nghiệm ấy nhiều lần, mỗi học sinh sẽ vẫn giữ được thứ hạng tương đối của mình trong nhóm nhưng không có nghĩa là bài trắc nghiệm ấy được làm đi làm lại nhiều lần. Một bài trắc nghiệm có thể gồm rất nhiều câu hỏi và đó là một mẫu trong một ngân hàng câu hỏi dùng để khảo sát kiến thức của học sinh, do đó chúng phải chịu sai số chọn mẫu. Nếu một bài trắc nghiệm có 50 câu hỏi được ra cho học sinh, tiếp theo đó là một bài với 50 câu khác về cùng một lĩnh vực khảo sát, thì chắc chắn sẽ có những sự khác biệt giữa hai điểm số của một số học sinh. Như vậy, một điểm số duy nhất dựa trên một mẫu các câu trắc nghiệm không phải là số đo lường hoàn toàn đáng tin cậy.
Có những yếu tố may rủi đóng góp vào sự thiếu tin cậy trong trường hợp các câu hỏi đúng sai và ở một mức độ ít hơn với các câu có nhiều lựa chọn. Điểm số của học sinh bao gồm trong đó một số câu trả lời đúng bằng lối phỏng đoán và một số câu làm đúng nhờ sự hiểu biết. Càng có nhiều câu phỏng đoán bao nhiêu thì người học sinh ấy càng có ít cơ may có được cùng một điểm số, nếu làm lại bài trắc nghiệm ấy lần thứ 2; do đó tính tin cậy của bài trắc nghiệm sẽ thấp nếu nhiều câu trả lời chỉ là những điều phỏng đoán. Vì yếu tố may rủi chi phối điểm s
Các file đính kèm theo tài liệu này:
- 40201.DOC