Qua tính toán minh họa bằng số liệu điều tra mẫu trong thực tế từ khâu lập
phương án điều tra đến khâu ước lượng, kết quả đã cho ta thấy tính khả thi trong
việc áp dụng các phương pháp chọn mẫu ngẫu nhiên để thu thập số liệu thống
kê về chăn nuôi. Từ đó cho thấy, nếu muốn số liệu suy rộng cho toàn tỉnh, thì
mẫu triển khai trong toàn tỉnh. Muốn số liệu suy rộng cho từng huyện thì mẫu
phải lấy từ các huyện, tất nhiên mẫu phải đủ lớn để suy rộng cho từng quận
huyện. Nghĩa là nếu thông tin của mẫu được dùng để suy rộng cho tổng thể nào
thì mẫu phải được lấy ra từ tổng thể đó. Điều này tưởng chừng đơn giản nhưng
thực tế có khá nhiều kết luận không có giá trị chỉ vì nguyên tắc cơ bản này
không được chú ý. Lý do tác giả chọn hai địa phương là Thành Phố Hồ Chí Minh
và tỉnh Tây Ninh để thực hiện việc ứng dụng mẫu trong điều tra chăn nuôi vì ta
thấy đặc điểm chăn nuôi ở hai địa phương này có khác nhau, yêu cầu suy rộng
số liệu cũng khác nhau, thành phố Hồ Chí Minh suy rộng số liệu cho cả thành
phố, tỉnh Tây Ninh suy rộng số liệu cho từng thị xã, huyện và cho cả tỉnh, do đó
phương pháp chọn mẫu và lược đồ điều tra chọn mẫu áp dụng ở hai địa phương
cũng khác nhau.
229 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2072 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng phương pháp chọn mẫu trong điều tra chăn nuôi, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
My
i
M
i
i
m
2
2
2
1
1
1= ⎡⎣⎢
⎤
⎦⎥
−⎛⎝⎜ ⎞⎠⎟
− −
⎛
⎝⎜
⎞
⎠⎟∑
Trong đó 875,21
32
700
m
nn m === hộ/ấp
Dựa vào bảng 3.2 ta tính được:
⎟⎠
⎞⎜⎝
⎛ −−= 519
321
132
2196,2953
32
1s2
y
= 2,793480688
793480688,2s
y
=⇒ = 1,6713709
86
Như vậy sai số chọn mẫu của y là 1,67137 con.
Số heo bình quân của 1 hộ Y được ước lượng bởi:
y2/
szy α±
67137,1.z7986,15 2/α±
Nếu chọn mức độ tin cậy là 95% thì zα/2 = 1,96
Ta có: 15,7986 -1,96 × 1,6713709 < Y < 15,7986 +1,96 × 1,6713709
12,52 con < Y < 19,07 con
Với tổng số hộ chăn nuôi heo của cả thành phố là 12.025 hộ, thì tổng đàn heo
của thành phố được ước lượng:
12.025 x 12,52 < Yˆ < 12.025 x 19,07
150.553 < Yˆ < 229.317 (con)
Như vậy với độ tin cậy 95% thì tổng đàn heo của các hộ gia đình ở thành phố có
đến ngày 01/8/2004 sẽ nằm trong khoảng (150.553 con; 229.317 con).
Nếu ước lượng điểm thì tổng đàn heo của các hộ gia đình ở thành phố có đến
ngày 01/8/2004 là 12.025 x 15,7986 = 189.978 con.
* Kiểm tra tính đại biểu của mẫu
Số liệu của mẫu sau khi điều tra sẽ được tính toán để suy rộng cho tổng thể, để
số liệu suy rộng có thể sử dụng được, ta phải kiểm tra tính đại biểu của mẫu.
Trong thực tế ta có thể dùng các cách như: Kiểm định Chi bình phương- χ2 ,
Kiểm định bằng biểu đồ, và dùng tỷ lệ sai số chọn mẫu.
Kiểm định Chi bình phương - χ2
Ta biết, muốn cho tổng thể mẫu có tính đại biểu cao, nghĩa là các kết quả ước
lượng hay kiểm định giả thuyết đảm bảo độ tin cậy mong muốn thì mẫu phải
được chọn theo đúng phương pháp khoa học, đồng thời sau khi chọn được mẫu
87
cụ thể cần kiểm tra lại tính đại biểu của nó. Tính đại biểu của mẫu thể hiện
trước tiên ở sự giống nhau về luật phân phối và độ biến thiên của tiêu thức.
Riêng trong trường hợp tổng thể chung được phân phối theo quy luật chuẩn
(trường hợp này rất hay xảy ra), thì nhiệm vụ của chúng ta lại là kiểm định tính
chuẩn của phân phối mẫu. Để kiểm định tính chuẩn của phân phối mẫu có rất
nhiều cách, một trong các cách đó là sử dụng một kiểm định phi tham số phù
hợp.
Trong điều tra chăn nuôi, số liệu sau khi thu thập từ mẫu sẽ được suy rộng cho
tổng thể. Để việc suy rộng đảm bảo độ tin cậy mong muốn ta phải kiểm tra tính
chuẩn của mẫu và người ta thường sử dụng kiểm định 2χ .
Để thực hiện kiểm định 2χ , trước tiên ta có danh sách số lượng heo của 700 hộ
thuộc các ấp mẫu (xem phụ lục số 7). Sau đó ta sử dụng phần mềm thống kê
SPSS để nhập số liệu của 700 hộ vào. Ta lập bảng phân phối tần số để có cái
nhìn tổng quát về phân phối của mẫu.
Bảng 3.3: Các tham số của mẫu từ SPSS
Frequencies
Statistics
Số heo các hộ
Valid 700N
Missing 0
Mean 15.80
Std. Error of Mean .532
Std. Deviation 14.079
Minimum 1
Maximum 150
Bảng 3.4: Bảng phân phối tần số về số heo các hộ
Frequency Percent Valid Percent
Cumulative
Percent
1 53 7.6 7.6 7.6
2 37 5.3 5.3 12.9
Valid
3 27 3.9 3.9 16.7
88
4 36 5.1 5.1 21.9
5 11 1.6 1.6 23.4
6 10 1.4 1.4 24.9
8 7 1.0 1.0 25.9
9 11 1.6 1.6 27.4
10 47 6.7 6.7 34.1
11 45 6.4 6.4 40.6
12 42 6.0 6.0 46.6
13 13 1.9 1.9 48.4
14 21 3.0 3.0 51.4
15 21 3.0 3.0 54.4
16 16 2.3 2.3 56.7
17 57 8.1 8.1 64.9
18 33 4.7 4.7 69.6
19 18 2.6 2.6 72.1
20 45 6.4 6.4 78.6
21 15 2.1 2.1 80.7
22 12 1.7 1.7 82.4
23 6 .9 .9 83.3
24 12 1.7 1.7 85.0
25 14 2.0 2.0 87.0
26 11 1.6 1.6 88.6
27 12 1.7 1.7 90.3
28 8 1.1 1.1 91.4
29 5 .7 .7 92.1
30 8 1.1 1.1 93.3
31 1 .1 .1 93.4
33 2 .3 .3 93.7
35 1 .1 .1 93.9
36 2 .3 .3 94.1
37 2 .3 .3 94.4
38 1 .1 .1 94.6
40 8 1.1 1.1 95.7
42 2 .3 .3 96.0
43 1 .1 .1 96.1
44 2 .3 .3 96.4
45 2 .3 .3 96.7
48 1 .1 .1 96.9
50 1 .1 .1 97.0
54 1 .1 .1 97.1
57 1 .1 .1 97.3
59 2 .3 .3 97.6
60 6 .9 .9 98.4
61 1 .1 .1 98.6
62 1 .1 .1 98.7
89
63 1 .1 .1 98.9
67 1 .1 .1 99.0
70 1 .1 .1 99.1
75 1 .1 .1 99.3
80 1 .1 .1 99.4
90 1 .1 .1 99.6
103 1 .1 .1 99.7
106 1 .1 .1 99.9
150 1 .1 .1 100.0
Total 700 100.0 100.0
Nguồn: Số liệu điều tra mẫu 1/8/2004 được xử lý từ phần mềm SPSS
Biểu đồ 3.1: Biểu đồ phân phối tần số về số lượng heo của các hộ
Để kiểm định xem số lượng heo chăn nuôi trong các hộ gia đình mẫu có tuân
theo phân phối chuẩn hay không ta đặt giả thuyết H0 và H1 như sau:
Giả thuyết H0 : Số heo nuôi trong các hộ gia đình có phân phối chuẩn.
Giả thuyết H1 : Số heo nuôi trong các hộ gia đình không có phân phối chuẩn.
Trước tiên, chúng ta xác định các xác suất để một đại lượng phân phối chuẩn có
trị số rơi vào các khoảng nhất định. Từ bảng phân phối chuẩn, ta xác định được
các xác suất của đại lượng phân phối chuẩn Z. Chẳng hạn, tra bảng phân phối
chuẩn ta có xác suất để đại lượng phân phối chuẩn Z rơi vào khoảng từ 0 đến 1
là 0,3413 và gần phân nửa của xác suất này là 0,1700 ứng với trị số giới hạn z =
90
0,44. Vậy xác suất Z có trị số rơi vào khoảng từ 0,44 đến 1 bằng 0,1713 và xác
xuất Z rơi vào khoảng từ 1 → ∞ sẽ bằng 0,1587 ( 0,5 - 0,3413).
Hình 3.2: Các xác suất để Z nằm giữa các khoảng giá trị
Tương tự chúng ta xác định được các trị số giới hạn của biến Z và các xác xuất
để Z nhận các trị số nằm giữa các trị số giới hạn này đối xứng qua 0:
z = -1 z = -0,44 z = 0 z = 0,44 z = 1
p1 = 0,1587 , p2 = 0,1713 , p3 =0,17 , p4 =0,17 , p5 =0,1713 , p6 =0,1587
Từ công thức Ei =n.pi , (n = 700), các trị số lý thuyết Ei có kết quả tính toán như
sau:
E1 =111,09 , E2 =119,91 , E3 =119 , E4 =119 , E5 = 119,91 , E6 =111,09
Dựa vào công thức Y = μ + σZ (suy ra từ công thức chuẩn hóa các trị số quan
sát), chuyển các trị số giới hạn của đại lượng ngẫu nhiên có phân phối chuẩn Z
thành trị số của yếu tố đang nghiên cứu là số heo nuôi trong một hộ gia đình.
Chúng ta có thể dùng y và s (tham số mẫu) thay cho μ và σ (tham số tổng thể) .
Dựa vào phụ lục số 7, ta tính y và s.
7986,15
700
11059y ==
2097,198
1700
5986,138548
1n
)yy(
s
2
i2 =−=−
−= ∑ 0787,142097,198s ==⇒
Hoặc nếu dựa vào bảng 3.3 Statistics ta có ngay: trung bình Mean = 15,80 và độ
lệch tiêu chuẩn Std. Deviation = 14,079
91
Trị số giới hạn của các nhóm được xác định như sau:
y1 = 15,7986 + (-1)(14,0787) = 1,7199
y2 = 15,7986 + (-0,44)(14,0787) = 9,604
y3 = 15,7986 + (0) (14,0787) = 15,7986
y4 = 15,7986 + (0,44)(14,0787) = 21,9932
y5 = 15,7986 + (1)(14,0787) = 29,8773
Như vậy, ta đã xác định được các tổ, ở đây ta có 6 tổ, xác xuất để một quan sát
rơi vào tổ thứ i (pi), và số lượng quan sát theo lý thuyết (Ei).
Bảng 3.5: Bảng phân phối tần số lý thuyết
Yi (con) Pi
Tần số
lý thuyết
Ei =(n.pi)
< 1,72 0,1587 111,09
1,72 – 9,60 0,1713 119,91
9,60 – 15,80 0,1700 119,00
15,80 – 21,99 0,1700 119,00
21,99 – 29,88 0,1713 119,91
≥ 29,88 0,1587 111,09
Tổng cộng 1 700,00
Tiếp theo ta phải xác định các tần số thực tế 0i , tức là phân phối 700 hộ vào 6 tổ
trên. Rõ ràng là ta không thể làm bằng tay. Dựa vào bảng phân phối tần số 3.4
ta có thể nhặt ra số hộ ứng với từng tổ. Tuy nhiên ta có thể làm nhanh bằng cách
thực hiện lệnh Recode trong SPSS để tiến hành phân tổ lại.
Vào menu Transform > Recode > Into Different Variables, hộp thoại sau xuất
hiện:
92
Trong hộp thoại Recode này, ta chọn biến cần mã hóa lại, nhấn vào nút Old and
New Values để xác định các giá trị cũ và chỉ định mã mới tương ứng, hộp thoại
sau xuất hiện:
93
Sau khi đã tạo được biến mới, ta lập bảng phân phối tần số theo các tổ định sẵn,
ta có kết quả sau:
Frequencies
Statistics
N Valid 700
Missing 0
Bảng 3.6: Bảng phân tổ lại
Frequency Percent
Valid
Percent
Cumulative
Percent
Valid < 1,72 53 7,6 7,6 7,6
1,72 – 9,60 139 19,9 19,9 27,4
9,60 – 15,80 189 27,0 27,0 54,4
15,80 – 21,99 184 26,3 26,3 80,7
21,99 – 29,88 80 11,4 11,4 92,1
≥ 29,88 55 7,9 7,9 100,0
Total 700 100,0 100,0
Nguồn: Số liệu mẫu 1/8/2004 được xử lý từ phần mềm SPSS
94
Biểu đồ 3.3: Biểu đồ phân phối tần số theo bảng phân tổ lại
Như vậy ta đã có tần số thực tế của các tổ, ta lập bảng tính toán đại lượng kiểm
định 2χ . Vì số lượng heo là số nguyên dương, nên ta có thể viết lại các tổ trong
bảng 3.6 thành bảng 3.7
Bảng 3.7: Bảng tính toán đại lượng kiểm định 2χ
Yi (con) Pi Tần số lý thuyết
(Ei = nPi )
Tần số thực tế
(0i)
(0i – Ei)2/Ei
1 0,1587 111,09 53 30,3758
2 – 9 0,1713 119,91 139 3,0392
10 – 15 0,1700 119,00 189 41,1765
16 – 21 0,1700 119,00 184 35,5042
22 – 29 0,1713 119,91 80 13,2834
> 29 0,1587 111,09 55 28,3202
Tổng 1 700 700 151,6992
Nguồn: Số liệu mẫu 1/8/2004.
Tính giá trị kiểm định 2χ theo công thức ∑
=
−=χ
k
1i i
2
ii2
E
)E0(
95
Từ bảng 3.7 ta có 2χ = 151,7 và trong 6 tổ có hai tham số được ước lượng ( y cho
μ và s cho σ ) nên số bậc tự do là (k -1 - số tham số) = 6 -1 -2 = 3.
Tra bảng phân phối 2χ , ta có: χ23, 0,05 = 7,815 < 2χ =151,7. Do vậy ta bác bỏ giả
thuyết H0 ở mức ý nghĩa 5%, tức là số heo nuôi trong các hộ gia đình mẫu không
có phân phối chuẩn, do đó số liệu của điều tra mẫu không dùng để suy rộng cho
đàn heo của thành phố được. Như vậy để số liệu suy rộng bảo đảm độ tin cậy
cần phải điều tra theo cỡ mẫu tính được.
Kiểm định bằng biểu đồ
Người ta cũng có thể kiểm định tính chuẩn của mẫu bằng cách dùng biểu đồ.
Nhìn vào biểu đồ 3.3 ta thấy hình dáng có vẻ giống phân phối chuẩn. Tuy nhiên
nếu nhìn kỹ hai nhánh của biểu đồ ta thấy không đối xứng. Kiểm định bằng biểu
đồ thường dùng trực quan để kiểm tra nên thường không chính xác lắm, ta
thường phải kết hợp với các phương pháp khác.
Tính tỷ lệ sai số chọn mẫu
Trong thực tế người ta cũng thường dùng tỷ lệ sai số chọn mẫu (H) để kiểm tra
tính đại biểu của mẫu. H càng nhỏ thì chỉ tiêu nghiên cứu có tính đại diện càng
cao và ngược lại. Cũng như sai số chọn mẫu, tỷ lệ sai số chọn mẫu sẽ tính cho
từng chỉ tiêu riêng biệt và đó là căn cứ để xem số liệu điều tra của từng chỉ tiêu
có bảo đảm độ tin cậy cần thiết không.
Người ta thường sử dụng các mức độ để đánh giá như sau:
- Nếu H ≤ 5% thì số liệu đảm bảo độ tin cậy cần thiết.
- Nếu 5% < H ≤ 10% thì số liệu đảm bảo độ tin cậy ở mức tạm được.
- Nếu H > 10% thì số liệu không đảm bảo độ tin cậy.
Ta xác định H theo công thức sau:
96
1058,0
7986,15
6714,1100
y
s
H y ==×= = 10,58%
Với tỷ lệ sai số chọn mẫu H = 10,58% là tương đối cao, tuy nhiên số liệu này
gần giới hạn có thể chấp nhận được (H<10%), do đó nếu có kinh phí để điều tra
đủ cỡ mẫu tính được thì số liệu suy rộng hoàn toàn có thể tin cậy được. Kết luận
này cũng phù hợp với cách kiểm định 2χ .
Tóm lại trong 3 cách kiểm tra tính đại biểu của mẫu, ta thấy kiểm định 2χ cho
kết quả chính xác nhất, tuy nhiên tính toán hơi phức tạp. Tác giả đề nghị nên sử
dụng hai phương pháp là kiểm định 2χ và tính tỷ lệ sai số chọn mẫu để kiểm tra
tính đại biểu của mẫu trong thực tế. Việc tính theo phương pháp 2χ có phức tạp,
nhưng qua phần trình bày ở phần 3.1.2 rất cụ thể, với các phần mềm thống kê
phổ biến hiện nay, việc tính toán trở nên dễ dàng hơn.
Dựa vào kết quả tính ở lần điều tra này ta có thể xác định cỡ mẫu cho lần điều
tra sau:
Ta có:
2
y
2
2/2
2
y
2
2/
s
M
z
sz
m
α
α
+ε
=
Với: ( )∑ =−=−−⎥⎦⎤⎢⎣⎡= mi
2
i
2
m
i2
y 2651,95132
2196,2953
1m
yy
n
Ns
Thông thường trong thực tế người ta chọn ( )ε = ×10% y . Với độ tin cậy là 95%
thì chúng ta cần phải điều tra với quy mô mẫu như sau:
160
2651,95
519
96,1)7986,15%10(
2651,9596,1
s
M
z
sz
m 2
2
2
2
y
2
2/2
2
y
2
2/ ≈
×+×
×=
+ε
=
α
α ấp
Như vậy theo tính toán, quy mô mẫu cho cuộc điều tra tiếp theo là 160 ấp. Do
97
nhà nước có nhiều chính sách khuyến khích phát triển sản xuất nên một số hộ
mạnh dạn bỏ vốn để tăng qui mô đàn lên, do đó chênh lệch về qui mô đàn giữa
các hộ sẽ cao và phương sai tính ra sẽ có giá trị lớn, làm cho cỡ mẫu tính ra lớn.
* Phương pháp ước lượng gián tiếp
Ta có thể sử dụng phương pháp ước lượng gián tiếp để ước lượng đàn heo của
thành phố. Phương pháp ước lượng gián tiếp được sử dụng ở đây là phương pháp
ước lượng tỷ lệ.
Gọi:
xi: số heo của các ấp mẫu ở lần điều tra 01/10/2001
yi: số heo của các ấp mẫu điều tra 01/8/2004
r: tốc độ phát triển qua hai thời kỳ
1981,1
8418
10086
x
y
r 30
1i
i
30
1i
i
===
∑
∑
=
=
Trong trường hợp chọn ngẫu nhiên đơn thuần, chọn không lặp, thì phương sai
chọn mẫu của ước lượng số tổng của Y được tính theo công thức (1.7)
σ
Myr
YXM S
m
m
M
2 2
2
1= −⎛⎝⎜
⎞
⎠⎟
Với
( )
S
y Rx
MYX
i i
i
M
2
2
1
=
−
−
∑
Phương sai hiệu chỉnh của tổng thể SYX2 ta không biết nên ta sử dụng phương sai
hiệu chỉnh của mẫu:
( )
s
y rx
myx
i i
i
m
2
2
1
1
=
−
−
=
∑
Do đó phương sai chọn mẫu của ước lượng số tổng được tính:
98
( )s M M m
m
s
Myr yx
2 2= −
Bảng 3.8: Bảng tính ước lượng đàn heo
Số
thứ
tự
Tên ấp mẫu
Tổng số heo
1/10/2001
( )xi (con)
Tổng số heo
1/8/2004
( )yi (con)
ix r
2
ii ) xry( −
x =290,2759 y =347,7931 r = 1,1981
1 Aáp 8 –
Xã Bình Mỹ
225 308 269,5725 1476,6728
2 Aáp Phú Trung –
An Phú
301 605 360,6281 59717,6255
3 Aáp Mũi Lớn –
Tân An Hội
348 433 416,9388 257,9621
4 Aáp 8 –
Xã Tân Thạnh Đông
623 747 746,4163 0,3407
5 Aáp Đông Lân –
Bà Điểm
43 426 51,5183 140236,5436
6 Aáp Thới Tứ –
Thới Tam Thôn
421 219 504,4001 81453,2171
7 Aáp Mỹ Hòa 1 –
Xã Tân Xuân
797 601 954,8857 125235,0887
8 Aáp Mỹ Hòa 3 –
Xã Tân Xuân
1 31 1,1981 888,1532
9 Aáp 1 –
Xã Tân Kiên
292 596 349,8452 60592,1856
10 Aáp 4 –
Xã Lê Minh Xuân
34 38 40,7354 7,4824
11 Aáp 4 –
Xã Phong Phú
220 134 263,5820 16791,4947
12 Aáp 2 –
Xã Hưng Long
169 255 202,4789 2758,4659
13 Aáp 1 –
Xã Hiệp Phước
227 260 271,9687 143,2498
14 Aáp 3 –
Xã Nhơn Đức
1169 1279 1400,5789 14781,4289
15 Aáp Bình Phước –
Xã Bình Khánh
36 133 43,1316 8076,3293
99
16 Aáp Long Thạnh –
Xã Long Hòa
101 894 121,0081 597516,4775
17 Aáp Đông –
P. Bình Trưng Đông
161 127 192,8941 4342,0324
18 Aáp 3 –
Phường An Lợi Đông
163 72 195,2903 15200,4981
19 Khu phố 5 –
Phường Phước Long A
351 319 420,5331 10308,9704
20 Aáp 1 –
Phường Long Thạnh Mỹ
55 371 65,8955 93088,7559
21 Aáp Tam Đa –
Phường Long Trường
51 137 61,1031 5760,3394
22 Khu phố 2 –
Phường Thới An
446 72 534,3526 213769,9267
23 Khu phố 2 –
Phường Thạnh Lộc
440 574 527,1640 2193,6109
24 Khu phố 2 –
Phường Trung Mỹ Tây
430 97 515,1830 174877,0215
25 Khu phố 4 –
Phường Trung Mỹ Tây
40 82 47,9240 1161,1738
26 Khu phố 5 –
Phường Trung Mỹ Tây
97 160 116,2157 1917,0649
27 Aáp Xuân Trường –
Phường Linh Xuân
180 392 215,6580 31096,5010
28 Aáp Gò Dưa –
Phường Bình Chiểu
497 383 595,4557 45137,4245
29 Khu phố 3 –
Phường Bình Hưng Hòa
500 341 599,0500 66589,8025
Tổng 8418 10086 1775375,8398
Nguồn: Số liệu điều tra mẫu 1/8/2004 và tổng điều tra nông thôn, nông nghiệp
và thủy sản 2001[3].
Phương sai hiệu chỉnh của mẫu:
28,63406
129
8398,1775375s2yx =−=
Phương sai chọn mẫu của ước lượng số tổng:
100
( ) 1,55602934728,63406
29
29519519s2
yM r
=×−=
Sai số chọn mẫu của ước lượng số tổng:
2745,23580s
ryM
= con
X: số đàn heo thành phố do điều tra toàn bộ ngày 01/10/2001 là 205.017 con
Y: số đàn heo thành phố ngày 01/8/2004 do ước lượng điểm:
Y =X × r =205.017 × 1,1981 ≈ 245.631 con
Giả sử với độ tin cậy là 95% đàn heo của thành phố sẽ nằm trong khoảng:
Y s
My r
± ×1 96,
2745,2358096,1245631 ×±
(199.414 con; 291.848 con)
Như vậy với mức độ tin cậy là 95% đàn heo của thành phố sẽ nằm trong khoảng
từ 199.414 con đến 291.848 con.
Để xem xét mức độ đại diện của 29 ấp mẫu so với 519 ấp trong phương pháp
ước lượng tỷ lệ, ta tính tỷ lệ sai số chọn mẫu H:
096,0
245631
2745,23580
Y
s
H yrM ===
Tỷ lệ sai số chọn mẫu H = 9,6% (<10%) cho thấy số liệu nằm ở giới hạn có thể
chấp nhận được nhưng có độ tin cậy thấp hơn, nên khi sử dụng số liệu phải lưu
ý.
Dựa vào kết quả tính ở lần điều tra này ta có thể xác định cỡ mẫu cho lần điều
tra sau.
Từ công thức phương sai chọn mẫu của ước lượng số tổng:
( )s M M m
m
s
Myr yx
2 2= −
Ta có phạm vi sai số chọn mẫu của ước lượng số tổng:
101
2
yx2/yrM2/
s
m
)mM(Mzsz −==ε αα
Từ công thức trên ta tính đuợc:
2
yx
2
2/
2
2
yx
22
2/
Msz
sMz
m
α
α
+ε=
Với độ tin cậy 95%, zα/2 = 1,96, còn ε trong thực tế người ta chọn bằng 10%Y,
cỡ mẫu cần điều tra kỳ sau là:
93
28,406.6351996,1)631.245%10(
28,406.6351996,1m 22
22
≈××+×
××= ấp
Để so sánh hiệu quả của hai phương pháp ước lượng trực tiếp và phương pháp
ước lượng tỷ lệ trên đây, ta tính hệ số tương quan giữa X và Y.
Từ phụ lục 4 ta tính được:
0143,288s2414,952.82
129
7580,662.322.2s
4066,261s4212,333.68
129
7931,335.913.1s
y
2
y
x
2
x
=⇒=−=
=⇒=−=
Dựa vào bảng tính phụ lục số 5 ta tính được hệ số tương quan:
6521,0
4066,2610143,288)129(
655,581.374.1
ss)1m(
)xx)(yy(
xy
m
1i
ii
=×−=−
−−
=ρ
∑
=
Hệ số biến thiên của X:
9005,0
2759,290
4066,261
x
sx ==
Hệ số biến thiên của Y:
8281,0
7931,347
0143,288
y
s y ==
Như ta biết, ước lượng tỷ lệ có thể chính xác hơn hoặc kém chính xác hơn ước
lượng trực tiếp thông thường, điều này phụ thuộc vào hệ số tương quan giữa X
và Y và hệ số biến thiên của X và Y. Khi X là giá trị của Y ở thời kỳ trước và
102
hai hệ số biến thiên xấp xỉ nhau, thì ước lượng tỷ lệ tốt nhất nếu ρ >1/2. Đối
chiếu với kết quả tính toán trên ta thấy hệ số biến thiên của X và của Y xấp xỉ
bằng nhau và ρ = 0,65>1/2, điều này cho thấy ước lượng tỷ lệ cho kết quả chính
xác hơn.
3.2 Ứng dụng phương pháp chọn mẫu trong điều tra chăn nuôi ở tỉnh Tây
Ninh
3.2.1 Đặc điểm ngành chăn nuôi ở tỉnh Tây Ninh
Tây Ninh là tỉnh thuộc miền Đông Nam Bộ, nằm phía Tây Bắc thành phố
Hồ Chí Minh, thị xã Tây Ninh cách trung tâm thành phố Hồ chí Minh khoảng
100km theo quốc lộ 22A và 22B. Tây Ninh có địa hình bằng phẳng, khí hậu
nóng ẩm. Nông nghiệp được coi là thế mạnh của tỉnh, tạo đòn bẩy để thúc đẩy
phát triển toàn bộ nền kinh tế của tỉnh. Chăn nuôi liên tục phát triển, đạt được
những kết quả đáng khích lệ. Đặc biệt, từ năm 1996 đến nay, tốc độ phát triển
của ngành chăn nuôi ngày càng cao và đã vượt qua ngành trồng trọt.
Tây Ninh hiện có 1 thị xã và 8 huyện, gồm 3 phường, 8 thị trấn, 79 xã và
486 ấp. Đặc điểm chăn nuôi của Tây ninh là trải đều trên khắp các huyện thị. Vì
nằm gần thành phố Hồ Chí Minh nên sản phẩm chăn nuôi không chỉ phục vụ
cho nhu cầu tiêu thụ của tỉnh mà còn cung cấp cho thành phố.
3.2.2 Thiết kế lược đồ điều tra chọn mẫu, tổng hợp số liệu, tính toán suy
rộng và đánh giá kết quả điều tra chăn nuôi heo cho tỉnh Tây Ninh
Qui trình điều tra chăn nuôi của tỉnh Tây ninh thực hiện theo hướng dẫn
của Tổng Cục thống Kê như đã trình bày trong phần 2.3. Được sự hỗ trợ của Cục
Thống Kê tỉnh Tây Ninh, tôi đã thiết kế phương án điều tra mẫu về chăn nuôi
heo, kết hợp với điều tra chăn nuôi 1/8/2004 của tỉnh nhằm hoàn thiện phương
pháp chọn mẫu, tính toán sai số chọn mẫu và suy rộng.
103
Khác với Thành Phố Hồ Chí Minh, chăn nuôi heo ở tỉnh Tây Ninh trải đều khắp
các huyện, thị. Qui mô đàn giữa các hộ cũng không chênh lệch nhiều. Do đó ta
có thể áp dụng lược đồ chọn mẫu hai cấp (hai giai đoạn), cấp I chọn ấp, khu phố
(gọi tắt là ấp) cấp II chọn hộ gia đình có phân tổ theo các huyện, thị xã và theo
các vùng. Căn cứ vào điều kiện sinh thái, điều kiện kinh tế và tập quán chăn
nuôi của các xã, mỗi huyện phân thành 3 vùng. Mỗi vùng lấy ra 1 ấp đại diện
theo phương pháp chọn mẫu theo xác suất tỷ lệ với qui mô chăn nuôi gia súc của
từng ấp. Nếu ấp đại diện có số hộ nhỏ hơn hoặc bằng 250 hộ thì điều tra toàn
ấp, nếu ấp đại diện có số hộ lớn hơn 250 hộ thì chỉ điều tra đến hộ thứ 250, các
hộ được chọn điều tra liền kề nhau theo danh sách điều tra năm 1998.
Mỗi vùng của thị xã và từng huyện được xem là 1 tổ, như vậy toàn tỉnh Tây
Ninh sẽ có 27 tổ, trong đó có 9 tổ thuộc vùng 1, 9 tổ thuộc vùng 2 và 9 tổ thuộc
vùng 3.
Các đơn vị mẫu cấp I và cấp II cũng như việc phân bổ cho từng vùng của thị xã
Tây Ninh và 8 huyện được hệ thống trong bảng 3.9.
Bảng 3.9: Phân bổ các đơn vị mẫu cấp I, cấp II
Đơn vị cấp I
(Aáp, khu phố)
Đơn vị cấp II
(hộ gia đình)
STT
Thị xã, các huyện và
từng vùng
Tổng
số
M
Chọn
mẫu
m
Số hộ
chăn
nuôi
)N( i
Số hộ
điều tra
)n( i
Tỷ lệ
chọn
mẫu
cấp II
(%)
1 Thị xã Tây Ninh 44 3 235 122 51,91
Vùng 1 11 1 166 83 50,00
Vùng 2 17 1 30 23 76,67
Vùng 3 16 1 39 16 41,03
2 H. Tân Biên 49 3 154 124 80,52
Vùng 1 16 1 30 18 60,00
104
Vùng 2 11 1 35 24 68,57
Vùng 3 22 1 89 82 92,13
3 H. Tân Châu 71 3 131 82 62,60
Vùng 1 24 1 37 23 62,16
Vùng 2 21 1 39 24 61,54
Vùng 3 26 1 55 35 63,64
4 H. Dương M. Châu 59 3 104 78 75,00
Vùng 1 24 1 27 20 74,07
Vùng 2 19 1 34 29 85,29
Vùng 3 16 1 43 29 67,44
5 H. Châu Thành 71 3 396 230 58,08
Vùng 1 27 1 113 95 84,07
Vùng 2 23 1 236 99 41,95
Vùng 3 21 1 47 36 76,60
6 H. Hòa Thành 33 3 294 85 28,91
Vùng 1 9 1 25 9 36,00
Vùng 2 11 1 171 30 17,54
Vùng 3 13 1 98 46 46,94
7 H. Bến Cầu 39 3 204 132 64,71
Vùng 1 7 1 35 30 85,71
Vùng 2 12 1 120 58 48,33
Vùng 3 20 1 49 44 89,80
8 H. Gò Dầu 49 3 253 97 38,34
Vùng 1 18 1 39 16 41,03
Vùng 2 11 1 36 31 86,11
Vùng 3 20 1 178 50 28,09
9 H. Trảng Bàng 71 3 253 165 65,22
Vùng 1 21 1 86 81 94,19
Vùng 2 16 1 64 47 73,44
Vùng 3 34 1 103 37 35,92
Chung toàn tỉnh 486 27 2024 1115 55,09
Vùng 1 157 9 558 375 67,20
Vùng 2 141 9 765 365 47,71
Vùng 3 188 9 701 375 53,50
Nguồn: Số liệu điều tra mẫu 1/8/2004.
Sau khi chọn được 27 ấp mẫu, vào ngày 1/8/2004 tiến hành thu thập số liệu trên
các ấp mẫu về các chỉ tiêu: Tổng số heo, trong đó có heo nái, heo thịt, số heo
105
xuất chuồng, sản lượng thịt hơi xuất chuồng. Tuy nhiên trong luận án chỉ trình
bày chỉ tiêu là tổng đàn heo và heo nái.
Với lược đồ chọn mẫu như trên, quá trình tính toán các tham số của chỉ tiêu
nghiên cứu có thể chia thành 2 giai đoạn: Giai đoạn thứ nhất áp dụng các công
thức về mẫu 2 giai đoạn để tính các tham số cho từng tổ. Giai đoạn thứ hai vận
dụng các công thức về chọn mẫu phân tổ để tính các tham số tổng hợp chung
cho các tổ.
* Giai đoạn 1: Bao gồm 2 bước.
- Bước 1: Tính số lượng heo trung bình và phương sai mẫu giữa các đơn vị mẫu
cấp II (hộ gia đình) trong từng đơn vị mẫu cấp I (ấp).
Dựa vào số liệu điều tra thu thập được, ta lấy số liệu của huyện Tân Châu để
tính toán mi
Các file đính kèm theo tài liệu này:
- 46970.pdf