1. Nếu chúng ta biết chiều dài xương sọ là phân phối xấp xỉ bình thường với trung bình là 185,6 mm và độ lệch chuẩn 12,7 mm. Tính xác suất mẫu có cỡ mẫu 10 rút ra từ dân số này có trung bình lớn hơn 190.
2. Nếu trung bình và độ lệch chuẩn của sắt huyết thanh ở người đàn ông khỏe mạnh là 120 và 15 microgram/100 ml, tính xác suất một mẫu ngẫu nhiên gồm 50 người đàn ông có trung bình sắt huyết thanh ở giữa 115 và 125 microgram/100 ml.
3. Giả sử chúng ta có hai dân số - một dân số gồm những đứa trẻ bị suy dinh dưỡng lúc nhỏ và một dân số gồm những trẻ không bị suy dinh dưỡng. Phân phối của thương số thông minh của hai dân số này là xấp xỉ bình thường và có độ lệch chuẩn khoảng 20. Nếu chúng ta lấy một mẫu gồm 15 người trong mỗi dân số và tính thương số thôngminh của mỗi nhóm có kết quả như sau `x1 = 92, `x2 = 105. Nếu không có sự khác biệt về trí thông minh giữa hai nhóm trẻ em. Tính xác suất có thể quan sát được sự khác biệt này hoặc khác biệt nhiều hơn của hiệu số (`x1 -`x2 ) giữa hai trung bình mẫu.
4. Trong một dân số nam thanh niên và nữ thanh niên 17 tuổi, trung bình và độ lệch chuẩn của chiều dày nếp gấp da ở vùng dưới xương bả vai là như sau: nam 9,7 và 6,0; nữ 15,6 và 9,5. Một mẫu ngẫu nhiên đơn gồm 40 nam và 35 nữ được chọn từ dân số này. Tính xác suất sự khác biệt giữa trung bình mẫu (`xnu - `xnam ) sẽ lớn hơn 10?
5. Nếu chúng ta biết trong dân số tỉ lệ mù màu là 0,08. Nếu chúng ta chọn ngẫu nhiên trong dân số 150 đối tượng , xác suất để tỉ lệ mù màu lên đến 0,15.
6. Trung tâm y tế dự phòng tỉnh Cần thơ cho biết tỉ lệ trẻ em 12-18 tháng tiêm chủng phòng chống đủ 6 bệnh EPI là 90%. Chọn một mẫu ngẫu nhiên đơn gồm 200 trẻ trong lứa tuổi này và kiểm tra tình trạng tiêm chủng. Tính xác suất tỉ lệ tiêm chủng trong mẫu này dưới 85%.
7. Trong một dân số người ta biết rằng 10% những trẻ em trai bị béo phì. Giả sử cũng có 10% trẻ em gái bị béo phì, tìm xác suất một mẫu gồm 250 trẻ trai và 200 trẻ gái sẽ cho giá trị p1 - p2 ³ 0,06.
7 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 494 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Giáo trình Thống kê y học - Một số những phân phối lấy mẫu quan trọng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
MỘT SỐ NHỮNG PHÂN PHỐI LẤY MẪU QUAN TRỌNG.
Mục tiêu
Sau khi nghiên cứu chủ đề, học viên có khả năng:
- Phân biệt được sự khác biệt của phân phối xác suất của giá trị cá thể và phân phối xác suất của các ước lượng lấy mẫu
- Trình bày được công thức tính phân phối xác suất của trung bình mẫu, hiệu số trung bình mẫu, tỉ lệ và hiệu số tỉ lệ của mẫu.
1. Lấy mẫu ngẫu nhiên đơn
Mẫu xác suất là mẫu rút từ dân số theo cách sao cho mọi phần tử trong dân số đều có một xác suất được đưa vào mẫu.
Mẫu có cỡ mẫu n được rút từ trong dân số có N phần tử sao cho mọi cách lấy mẫu cỡ n đều có một xác suất lựa chọn như nhau, mẫu đó được gọi là mẫu ngẫu nhiên đơn.
Phương pháp lẫy mẫu còn được chia theo 2 loại: phương pháp lấy mẫu có hoàn lại và lấy mẫu không hoàn lại. Trong phương pháp lấy mẫu hoàn lại,một phần tử sau khi được rút chọn để đưa vào mẫu vẫn có khả năng được rút chọn thêm - như vậy, một phần tử có thể làm đại diện cho dân số 1, 2, 3 hay nhiều hơn lần. Trong phương pháp lấy mẫu không hoàn lại, những phần tử được rút chọn rồi sẽ không được chọn một lần nữa. Do đó một phần tử có thể được đưa vào mẫu tối đa 1 lần.
Thí dụ: Giả sử trong một dân số gồm mẫu đường huyết lúc đói của 150 đối tượng. Hãy dùng phương pháp rút chọn ngẫu nhiên đơn để chọn ra một mẫu ngẫu nhiên có cỡ mẫu bằng 10. Tính đường huyết trung bình trong mẫu đó.
2.Phân phối lấy mẫu
Phân phối của tất cả các giá trị (trung bình) được tính từ các mẫu ngẫu nhiên có cỡ mẫu bằng nhau được gọi là phân phối lấy mẫu (của trung bình).
- Ngoài tính giá trị trung bình, người ta có thể tính các giá trị khác như độ lệch chuẩn, tỉ lệ v.v.
- Nếu dân số là hữu hạn ta có thể tìm được tất cả các mẫu cỡ n có thể có và sau đó tính phân phối. Nhưng nếu dân số là vô hạn hay có kích thước lớn thì không thể liệt kê tất cả các mẫu, chỉ có thể nghiên cứu phân phối trên một số lớn những mẫu mà thôi.
3. Phân phối của trung bình của mẫu
Thí dụ:Giả sử chúng ta có một dân số có cỡ mẫu N = 5, bao gồm tuổi của năm đứa trẻ là bệnh nhân ngoại trú của một trung tâm sức khỏe tâm thần. Tuổi các đứa trẻ là như sau: x1 = 6, x2 = 8, x3 = 10, x4 = 12, x5 = 14. Tuổi trung bình của dân số này là Sxi /N = 10 và có phương sai s2 = 8.
Nếu chúng ta chọn mẫu có hoàn lại, có thể có đến 25 mẫu. Sau đó ta có thể xây dựng phân phối lấy mẫu của `x bằng cách liệt kê tất cả các giá trị của `x ở một cột và tần suất xuất hiện ở cột kia.
Và khi đó chúng ta có thể tính được trung bình của `x
m`x = 250 / 25 = 10
và s2 = 4
Ðịnh lí giới hạn trung tâm: Cho một dân số với bất kì hình dnạg phân phối nào với trung bình là m và phương sai là s2 , phân phối lấy mẫu của `x, tính từ mẫu cỡ n của dân số này sẽ có phân phối xấp xỉ bình thường với trung bình là m và phương sai là s2/n, khi cỡ mẫu lớn (cỡ mẫu ³ 30).
- Lưu ý:
. Khi các giá trị của phân phối đã là phân phối xấp xỉ bình thường thì định lí trên đúng, không cần điều kiện cỡ mẫu lớn.
. khi mẫu cỡ n là mẫu không hoàn lại từ một dân số hữu hạn, phân phối lấy mẫu của `x, tính từ mẫu cỡ n của dân số này sẽ có phân phối xấp xỉ bình thường với trung bình là (và phương sai là [(N-n)/(N-1)]s2/n, khi cỡ mẫu lớn (cỡ mẫu ³ 30). Hệ số (N-n)/(N-1) được gọi là hệ số hiệu chỉnh dân số hữu hạn. Thông thường người ta không quan tâm đến hệ số này trừ khi cỡ mẫu lớn hơn 5% quy mô của dân số.
4. Ứng dụng
Nếu chúng ta biết chiều dài xương sọ là phân phối xấp xỉ bình thường với trung bình là 185,6 mm và độ lệch chuẩn 12,7 mm. Tính xác suất mẫu có cỡ mẫu 10 rút ra từ dân số này có trung bình lớn hơn 190.
Bài giải:
Phân phối lấy mẫu của trung bình của chiều dài xương sọ sẽ có phân phối xấp xỉ bình thường với trung bình là 185,6 mm và độ lệch chuẩn = 12.7/Ö10 = 4,02.
Giá trị chiều dài xương sọ 190 tương ứng với z = (190-185,6)/4,02 =1,09.
Từ bảng phân phối chuẩn, ta biết diện tích phần bên phải 1,09 là 0,1379 hay xác suất một mẫu có cỡ mẫu 10 có trung bình lớn hơn 190 là 0,1379.
5. Phân phối của hiệu số của hai trung bình mẫu
Thí dụ: Giả sử chúng ta có hai dân số - một dân số gồm những đứa trẻ bị suy dinh dưỡng lúc nhỏ và một dân số gồm những trẻ không bị suy dinh dưỡng. Phân phối của thương số thông minh của hai dân số này là xấp xỉ bình thường và có độ lệch chuẩn khoảng 20. Nếu chúng ta lấy một mẫu gồm 15 người trong mỗi dân số và tính thương số thôngminh của mỗi nhóm có kết quả như sau `x1 = 92, `x2 = 105. Nếu không có sự khác biệt về trí thông minh giữa hai nhóm trẻ em. Tính xác suất có thể quan sát được sự khác biệt này hoặc khác biệt nhiều hơn của hiệu số (`x1 -`x2 ) giữa hai trung bình mẫu.
Áp dụng công thức:
Ta tính được z = -1,78
Do đó nếu không có sự khác biệt về trung bình dân số, xác suất có được sự khác biệt giữa trung bình dân số ³ 13 là 0,0375.
6. Phân phối của tỉ lệ của mẫu
Thí dụ: Nếu chúng ta biết trong dân số tỉ lệ mù màu p là 0,08. Nếu chúng ta chọn ngẫu nhiên trong dân số 150 đối tượng , xác suất để tỉ lệ mù màu p lên đến 0,15.
Theo công thức:
Ta tính được z= 3,15. Tra bảng phân phối chuẩn ta có xác suất quan sát được p³ 0,08 là 0,0008. Do vậy tìm được một mẫu như vậy là một sự kiện hiếm.
7. Phân phối của hiệu số của hai tỉ lệ mẫu
Thí dụ: Trong một dân số người ta biết rằng tỉ lệ trẻ em trai bị béo phì p1 = 10%. Giả sử cũng có tỉ lệ trẻ em gái bị béo phì p2 = 10%, tìm xác suất một mẫu gồm 250 trẻ trai và 200 trẻ gái sẽ cho giá trị p1 - p2 ³ 0,06.
Theo công thức
Ta tính được z = 2,11. Vậy xác suất này là 0,0174.
Bài tập
Bài tập phân phối lấy mẫu
1. Nếu chúng ta biết chiều dài xương sọ là phân phối xấp xỉ bình thường với trung bình là 185,6 mm và độ lệch chuẩn 12,7 mm. Tính xác suất mẫu có cỡ mẫu 10 rút ra từ dân số này có trung bình lớn hơn 190.
2. Nếu trung bình và độ lệch chuẩn của sắt huyết thanh ở người đàn ông khỏe mạnh là 120 và 15 microgram/100 ml, tính xác suất một mẫu ngẫu nhiên gồm 50 người đàn ông có trung bình sắt huyết thanh ở giữa 115 và 125 microgram/100 ml.
3. Giả sử chúng ta có hai dân số - một dân số gồm những đứa trẻ bị suy dinh dưỡng lúc nhỏ và một dân số gồm những trẻ không bị suy dinh dưỡng. Phân phối của thương số thông minh của hai dân số này là xấp xỉ bình thường và có độ lệch chuẩn khoảng 20. Nếu chúng ta lấy một mẫu gồm 15 người trong mỗi dân số và tính thương số thôngminh của mỗi nhóm có kết quả như sau `x1 = 92, `x2 = 105. Nếu không có sự khác biệt về trí thông minh giữa hai nhóm trẻ em. Tính xác suất có thể quan sát được sự khác biệt này hoặc khác biệt nhiều hơn của hiệu số (`x1 -`x2 ) giữa hai trung bình mẫu.
4. Trong một dân số nam thanh niên và nữ thanh niên 17 tuổi, trung bình và độ lệch chuẩn của chiều dày nếp gấp da ở vùng dưới xương bả vai là như sau: nam 9,7 và 6,0; nữ 15,6 và 9,5. Một mẫu ngẫu nhiên đơn gồm 40 nam và 35 nữ được chọn từ dân số này. Tính xác suất sự khác biệt giữa trung bình mẫu (`xnu - `xnam ) sẽ lớn hơn 10?
5. Nếu chúng ta biết trong dân số tỉ lệ mù màu là 0,08. Nếu chúng ta chọn ngẫu nhiên trong dân số 150 đối tượng , xác suất để tỉ lệ mù màu lên đến 0,15.
6. Trung tâm y tế dự phòng tỉnh Cần thơ cho biết tỉ lệ trẻ em 12-18 tháng tiêm chủng phòng chống đủ 6 bệnh EPI là 90%. Chọn một mẫu ngẫu nhiên đơn gồm 200 trẻ trong lứa tuổi này và kiểm tra tình trạng tiêm chủng. Tính xác suất tỉ lệ tiêm chủng trong mẫu này dưới 85%.
7. Trong một dân số người ta biết rằng 10% những trẻ em trai bị béo phì. Giả sử cũng có 10% trẻ em gái bị béo phì, tìm xác suất một mẫu gồm 250 trẻ trai và 200 trẻ gái sẽ cho giá trị p1 - p2 ³ 0,06.
Bài giải
1. Phân phối lấy mẫu của trung bình của chiều dài xương sọ sẽ có phân phối xấp xỉ bình thường với trung bình là 185,6 mm và độ lệch chuẩn = 12.7/Ö10 = 4,02.
Do đó, giá trị chiều dài xương sọ 190 tương ứng với z = (190-185,6)/4,02 =1,09.
P (`x >190) = P (z >1,09) = 1 - P(z £ 1,09) = 1 - 0,8621 = 0,1379
2. Theo định lí giới hạn trung tâm, giá trị trung bình sắt huyết thanh trung bình `x của 50 người đàn ông sẽ có phân phối bình thường (trung bình là 120 và độ lệch chuẩn = 15/Ö50 = 2,12.
Khi đó
P (115 < `x £ 125) = P{(115 - 120)/2.12 < z £(125 - 120)/2.12)} = P(-2,36 < z £ 2,36)
= 0,9909 - 0,0091 = 0,9818
3. Theo thống kê về phân phối của hiệu số giữa hai trung bình mẫu, ta có
có phân phối chuẩn. Với
m1 là trung bình dân số của thương số trí tuệ ở nhóm 1
m2 là trung bình dân số của thương số trí tuệ ở nhóm 2 = m1 nếu hai nhóm trẻ có gì khác biệt về trí tuệ.
`x1 là trung bình mẫu của thương số trí tuệ ở nhóm 1 (nhóm trẻ em suy dinh dưỡng) = 92,
`x2 là trung bình mẫu của thương số trí tuệ ở nhóm 2 (nhóm trẻ không bị suy dinh dưỡng) = 105.
s12 phương sai của thương số thông minh ở nhóm 1,
s22 phương sai của thương số thông minh ở nhóm 2, s22 = 202 = 400.
n1 là cỡ mẫu của nhóm 1,
n2 là cỡ mẫu của nhóm 2, n1 = n2 = 15.
Ta tính được z = -1,78.
P (`x1 -`x2 <-13) = P (z < -1,78) = 0,0375
Do đó nếu không có sự khác biệt về trung bình dân số, xác suất có được sự khác biệt giữa trung bình dân số ³ 13 là 0,0375.
4. Theo thống kê về phân phối của hiệu số giữa hai trung bình mẫu, ta có
có phân phối chuẩn. Với
mnu là trung bình dân số của chiều dày nếp gấp da ở nhóm nữ = 15,6
mnam là trung bình dân số của chiều dày nếp gấp da ở nhóm nam = 9,7
`xnu là trung bình mẫu của chiều dày nếp gấp da ở nhóm nữ
`xnam là trung bình mẫu của chiều dày nếp gấp da ở nhóm nam, `xnu -`xnam = 10
s2nu phương sai của chiều dày nếp gấp da ở nhóm nữ = 9,52 = 90,25
s2nam phương sai của chiều dày nếp gấp da ở nhóm nam = 62 = 36
nnu là cỡ mẫu của nhóm nữ = 35,
nnam là cỡ mẫu của nhóm nam =40,
Ta tính được z = 2,20
P (`x1 -`x2 >13) = P (z > 2,20) = 0,0375 = 1 - 0,9861 =0,0139
Xác suất có được sự khác biệt chiều dày lớp mỡ dưới da trung bình giưã nam và nữ > 10 là 0,0139.
5. Theo thống kê về phân phối tỉ lệ của mẫu, ta có
có phân phối bình thường.
với p: tỉ lệ mù màu trong trong dân số = 0,08
p: tỉ lệ mù màu trong mẫu = 0,15
n: cỡ mẫu = 150
Ta tính được z= 3,15.
P(p > 0.15) = P(z > 3,15) = 1 - P(z £ 3,15) = 1 - 0,9992 = 0,0008.
Xác suất này là rất hiếm
6. Theo thống kê về phân phối tỉ lệ của mẫu, ta có
có phân phối bình thường.
với p: tỉ lệ tiêm chủng trong dân số = 0,90
p: tỉ lệ tiêm chủng trong mẫu = 0,85
n: cỡ mẫu = 200
Ta tính được z= -2,36
Do đó:
P(pâ £ 0.85) = P(z £ -2,36) = 0,0091 » 1/100.
7. Theo thống kê về phân phối tỉ lệ của mẫu, ta có
có phân phối bình thường với
với p1: tỉ lệ béo phì trong dân số nam = 0,10
p2: tỉ lệ béo phì trong dân số nữ = 0,10
p1: tỉ lệ béo phì trong mẫu gồm 250 nam
p2: tỉ lệ béo phì trong mẫu gồm 200 nữ, pâ1 - pâ2 = 0,06
n1 là cỡ mẫu của nhóm nam = 250
n2 là cỡ mẫu của nhóm nữ = 200
Do đó P{(p1 - p2 )³ 0,06} = P(z ³ 2,11) = 1 - P(z £ 2,11) = 1- 0,9826 = 0,0174
Các file đính kèm theo tài liệu này:
- giao_trinh_thong_ke_y_hoc_mot_so_nhung_phan_phoi_lay_mau_qua.doc