Luận văn Ứng dụng phương pháp chọn mẫu trong điều tra chăn nuôi

Qua tính toán minh họa bằng số liệu điều tra mẫu trong thực tế từ khâu lập

phương án điều tra đến khâu ước lượng, kết quả đã cho ta thấy tính khả thi trong

việc áp dụng các phương pháp chọn mẫu ngẫu nhiên để thu thập số liệu thống

kê về chăn nuôi. Từ đó cho thấy, nếu muốn số liệu suy rộng cho toàn tỉnh, thì

mẫu triển khai trong toàn tỉnh. Muốn số liệu suy rộng cho từng huyện thì mẫu

phải lấy từ các huyện, tất nhiên mẫu phải đủ lớn để suy rộng cho từng quận

huyện. Nghĩa là nếu thông tin của mẫu được dùng để suy rộng cho tổng thể nào

thì mẫu phải được lấy ra từ tổng thể đó. Điều này tưởng chừng đơn giản nhưng

thực tế có khá nhiều kết luận không có giá trị chỉ vì nguyên tắc cơ bản này

không được chú ý. Lý do tác giả chọn hai địa phương là Thành Phố Hồ Chí Minh

và tỉnh Tây Ninh để thực hiện việc ứng dụng mẫu trong điều tra chăn nuôi vì ta

thấy đặc điểm chăn nuôi ở hai địa phương này có khác nhau, yêu cầu suy rộng

số liệu cũng khác nhau, thành phố Hồ Chí Minh suy rộng số liệu cho cả thành

phố, tỉnh Tây Ninh suy rộng số liệu cho từng thị xã, huyện và cho cả tỉnh, do đó

phương pháp chọn mẫu và lược đồ điều tra chọn mẫu áp dụng ở hai địa phương

cũng khác nhau.

pdf229 trang | Chia sẻ: maiphuongdc | Lượt xem: 1987 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng phương pháp chọn mẫu trong điều tra chăn nuôi, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
My i M i i m 2 2 2 1 1 1= ⎡⎣⎢ ⎤ ⎦⎥ −⎛⎝⎜ ⎞⎠⎟ − − ⎛ ⎝⎜ ⎞ ⎠⎟∑ Trong đó 875,21 32 700 m nn m === hộ/ấp Dựa vào bảng 3.2 ta tính được: ⎟⎠ ⎞⎜⎝ ⎛ −−= 519 321 132 2196,2953 32 1s2 y = 2,793480688 793480688,2s y =⇒ = 1,6713709 86 Như vậy sai số chọn mẫu của y là 1,67137 con. Số heo bình quân của 1 hộ Y được ước lượng bởi: y2/ szy α± 67137,1.z7986,15 2/α± Nếu chọn mức độ tin cậy là 95% thì zα/2 = 1,96 Ta có: 15,7986 -1,96 × 1,6713709 < Y < 15,7986 +1,96 × 1,6713709 12,52 con < Y < 19,07 con Với tổng số hộ chăn nuôi heo của cả thành phố là 12.025 hộ, thì tổng đàn heo của thành phố được ước lượng: 12.025 x 12,52 < Yˆ < 12.025 x 19,07 150.553 < Yˆ < 229.317 (con) Như vậy với độ tin cậy 95% thì tổng đàn heo của các hộ gia đình ở thành phố có đến ngày 01/8/2004 sẽ nằm trong khoảng (150.553 con; 229.317 con). Nếu ước lượng điểm thì tổng đàn heo của các hộ gia đình ở thành phố có đến ngày 01/8/2004 là 12.025 x 15,7986 = 189.978 con. * Kiểm tra tính đại biểu của mẫu Số liệu của mẫu sau khi điều tra sẽ được tính toán để suy rộng cho tổng thể, để số liệu suy rộng có thể sử dụng được, ta phải kiểm tra tính đại biểu của mẫu. Trong thực tế ta có thể dùng các cách như: Kiểm định Chi bình phương- χ2 , Kiểm định bằng biểu đồ, và dùng tỷ lệ sai số chọn mẫu. ™ Kiểm định Chi bình phương - χ2 Ta biết, muốn cho tổng thể mẫu có tính đại biểu cao, nghĩa là các kết quả ước lượng hay kiểm định giả thuyết đảm bảo độ tin cậy mong muốn thì mẫu phải được chọn theo đúng phương pháp khoa học, đồng thời sau khi chọn được mẫu 87 cụ thể cần kiểm tra lại tính đại biểu của nó. Tính đại biểu của mẫu thể hiện trước tiên ở sự giống nhau về luật phân phối và độ biến thiên của tiêu thức. Riêng trong trường hợp tổng thể chung được phân phối theo quy luật chuẩn (trường hợp này rất hay xảy ra), thì nhiệm vụ của chúng ta lại là kiểm định tính chuẩn của phân phối mẫu. Để kiểm định tính chuẩn của phân phối mẫu có rất nhiều cách, một trong các cách đó là sử dụng một kiểm định phi tham số phù hợp. Trong điều tra chăn nuôi, số liệu sau khi thu thập từ mẫu sẽ được suy rộng cho tổng thể. Để việc suy rộng đảm bảo độ tin cậy mong muốn ta phải kiểm tra tính chuẩn của mẫu và người ta thường sử dụng kiểm định 2χ . Để thực hiện kiểm định 2χ , trước tiên ta có danh sách số lượng heo của 700 hộ thuộc các ấp mẫu (xem phụ lục số 7). Sau đó ta sử dụng phần mềm thống kê SPSS để nhập số liệu của 700 hộ vào. Ta lập bảng phân phối tần số để có cái nhìn tổng quát về phân phối của mẫu. Bảng 3.3: Các tham số của mẫu từ SPSS Frequencies Statistics Số heo các hộ Valid 700N Missing 0 Mean 15.80 Std. Error of Mean .532 Std. Deviation 14.079 Minimum 1 Maximum 150 Bảng 3.4: Bảng phân phối tần số về số heo các hộ Frequency Percent Valid Percent Cumulative Percent 1 53 7.6 7.6 7.6 2 37 5.3 5.3 12.9 Valid 3 27 3.9 3.9 16.7 88 4 36 5.1 5.1 21.9 5 11 1.6 1.6 23.4 6 10 1.4 1.4 24.9 8 7 1.0 1.0 25.9 9 11 1.6 1.6 27.4 10 47 6.7 6.7 34.1 11 45 6.4 6.4 40.6 12 42 6.0 6.0 46.6 13 13 1.9 1.9 48.4 14 21 3.0 3.0 51.4 15 21 3.0 3.0 54.4 16 16 2.3 2.3 56.7 17 57 8.1 8.1 64.9 18 33 4.7 4.7 69.6 19 18 2.6 2.6 72.1 20 45 6.4 6.4 78.6 21 15 2.1 2.1 80.7 22 12 1.7 1.7 82.4 23 6 .9 .9 83.3 24 12 1.7 1.7 85.0 25 14 2.0 2.0 87.0 26 11 1.6 1.6 88.6 27 12 1.7 1.7 90.3 28 8 1.1 1.1 91.4 29 5 .7 .7 92.1 30 8 1.1 1.1 93.3 31 1 .1 .1 93.4 33 2 .3 .3 93.7 35 1 .1 .1 93.9 36 2 .3 .3 94.1 37 2 .3 .3 94.4 38 1 .1 .1 94.6 40 8 1.1 1.1 95.7 42 2 .3 .3 96.0 43 1 .1 .1 96.1 44 2 .3 .3 96.4 45 2 .3 .3 96.7 48 1 .1 .1 96.9 50 1 .1 .1 97.0 54 1 .1 .1 97.1 57 1 .1 .1 97.3 59 2 .3 .3 97.6 60 6 .9 .9 98.4 61 1 .1 .1 98.6 62 1 .1 .1 98.7 89 63 1 .1 .1 98.9 67 1 .1 .1 99.0 70 1 .1 .1 99.1 75 1 .1 .1 99.3 80 1 .1 .1 99.4 90 1 .1 .1 99.6 103 1 .1 .1 99.7 106 1 .1 .1 99.9 150 1 .1 .1 100.0 Total 700 100.0 100.0 Nguồn: Số liệu điều tra mẫu 1/8/2004 được xử lý từ phần mềm SPSS Biểu đồ 3.1: Biểu đồ phân phối tần số về số lượng heo của các hộ Để kiểm định xem số lượng heo chăn nuôi trong các hộ gia đình mẫu có tuân theo phân phối chuẩn hay không ta đặt giả thuyết H0 và H1 như sau: Giả thuyết H0 : Số heo nuôi trong các hộ gia đình có phân phối chuẩn. Giả thuyết H1 : Số heo nuôi trong các hộ gia đình không có phân phối chuẩn. Trước tiên, chúng ta xác định các xác suất để một đại lượng phân phối chuẩn có trị số rơi vào các khoảng nhất định. Từ bảng phân phối chuẩn, ta xác định được các xác suất của đại lượng phân phối chuẩn Z. Chẳng hạn, tra bảng phân phối chuẩn ta có xác suất để đại lượng phân phối chuẩn Z rơi vào khoảng từ 0 đến 1 là 0,3413 và gần phân nửa của xác suất này là 0,1700 ứng với trị số giới hạn z = 90 0,44. Vậy xác suất Z có trị số rơi vào khoảng từ 0,44 đến 1 bằng 0,1713 và xác xuất Z rơi vào khoảng từ 1 → ∞ sẽ bằng 0,1587 ( 0,5 - 0,3413). Hình 3.2: Các xác suất để Z nằm giữa các khoảng giá trị Tương tự chúng ta xác định được các trị số giới hạn của biến Z và các xác xuất để Z nhận các trị số nằm giữa các trị số giới hạn này đối xứng qua 0: z = -1 z = -0,44 z = 0 z = 0,44 z = 1 p1 = 0,1587 , p2 = 0,1713 , p3 =0,17 , p4 =0,17 , p5 =0,1713 , p6 =0,1587 Từ công thức Ei =n.pi , (n = 700), các trị số lý thuyết Ei có kết quả tính toán như sau: E1 =111,09 , E2 =119,91 , E3 =119 , E4 =119 , E5 = 119,91 , E6 =111,09 Dựa vào công thức Y = μ + σZ (suy ra từ công thức chuẩn hóa các trị số quan sát), chuyển các trị số giới hạn của đại lượng ngẫu nhiên có phân phối chuẩn Z thành trị số của yếu tố đang nghiên cứu là số heo nuôi trong một hộ gia đình. Chúng ta có thể dùng y và s (tham số mẫu) thay cho μ và σ (tham số tổng thể) . Dựa vào phụ lục số 7, ta tính y và s. 7986,15 700 11059y == 2097,198 1700 5986,138548 1n )yy( s 2 i2 =−=− −= ∑ 0787,142097,198s ==⇒ Hoặc nếu dựa vào bảng 3.3 Statistics ta có ngay: trung bình Mean = 15,80 và độ lệch tiêu chuẩn Std. Deviation = 14,079 91 Trị số giới hạn của các nhóm được xác định như sau: y1 = 15,7986 + (-1)(14,0787) = 1,7199 y2 = 15,7986 + (-0,44)(14,0787) = 9,604 y3 = 15,7986 + (0) (14,0787) = 15,7986 y4 = 15,7986 + (0,44)(14,0787) = 21,9932 y5 = 15,7986 + (1)(14,0787) = 29,8773 Như vậy, ta đã xác định được các tổ, ở đây ta có 6 tổ, xác xuất để một quan sát rơi vào tổ thứ i (pi), và số lượng quan sát theo lý thuyết (Ei). Bảng 3.5: Bảng phân phối tần số lý thuyết Yi (con) Pi Tần số lý thuyết Ei =(n.pi) < 1,72 0,1587 111,09 1,72 – 9,60 0,1713 119,91 9,60 – 15,80 0,1700 119,00 15,80 – 21,99 0,1700 119,00 21,99 – 29,88 0,1713 119,91 ≥ 29,88 0,1587 111,09 Tổng cộng 1 700,00 Tiếp theo ta phải xác định các tần số thực tế 0i , tức là phân phối 700 hộ vào 6 tổ trên. Rõ ràng là ta không thể làm bằng tay. Dựa vào bảng phân phối tần số 3.4 ta có thể nhặt ra số hộ ứng với từng tổ. Tuy nhiên ta có thể làm nhanh bằng cách thực hiện lệnh Recode trong SPSS để tiến hành phân tổ lại. Vào menu Transform > Recode > Into Different Variables, hộp thoại sau xuất hiện: 92 Trong hộp thoại Recode này, ta chọn biến cần mã hóa lại, nhấn vào nút Old and New Values để xác định các giá trị cũ và chỉ định mã mới tương ứng, hộp thoại sau xuất hiện: 93 Sau khi đã tạo được biến mới, ta lập bảng phân phối tần số theo các tổ định sẵn, ta có kết quả sau: Frequencies Statistics N Valid 700 Missing 0 Bảng 3.6: Bảng phân tổ lại Frequency Percent Valid Percent Cumulative Percent Valid < 1,72 53 7,6 7,6 7,6 1,72 – 9,60 139 19,9 19,9 27,4 9,60 – 15,80 189 27,0 27,0 54,4 15,80 – 21,99 184 26,3 26,3 80,7 21,99 – 29,88 80 11,4 11,4 92,1 ≥ 29,88 55 7,9 7,9 100,0 Total 700 100,0 100,0 Nguồn: Số liệu mẫu 1/8/2004 được xử lý từ phần mềm SPSS 94 Biểu đồ 3.3: Biểu đồ phân phối tần số theo bảng phân tổ lại Như vậy ta đã có tần số thực tế của các tổ, ta lập bảng tính toán đại lượng kiểm định 2χ . Vì số lượng heo là số nguyên dương, nên ta có thể viết lại các tổ trong bảng 3.6 thành bảng 3.7 Bảng 3.7: Bảng tính toán đại lượng kiểm định 2χ Yi (con) Pi Tần số lý thuyết (Ei = nPi ) Tần số thực tế (0i) (0i – Ei)2/Ei 1 0,1587 111,09 53 30,3758 2 – 9 0,1713 119,91 139 3,0392 10 – 15 0,1700 119,00 189 41,1765 16 – 21 0,1700 119,00 184 35,5042 22 – 29 0,1713 119,91 80 13,2834 > 29 0,1587 111,09 55 28,3202 Tổng 1 700 700 151,6992 Nguồn: Số liệu mẫu 1/8/2004. Tính giá trị kiểm định 2χ theo công thức ∑ = −=χ k 1i i 2 ii2 E )E0( 95 Từ bảng 3.7 ta có 2χ = 151,7 và trong 6 tổ có hai tham số được ước lượng ( y cho μ và s cho σ ) nên số bậc tự do là (k -1 - số tham số) = 6 -1 -2 = 3. Tra bảng phân phối 2χ , ta có: χ23, 0,05 = 7,815 < 2χ =151,7. Do vậy ta bác bỏ giả thuyết H0 ở mức ý nghĩa 5%, tức là số heo nuôi trong các hộ gia đình mẫu không có phân phối chuẩn, do đó số liệu của điều tra mẫu không dùng để suy rộng cho đàn heo của thành phố được. Như vậy để số liệu suy rộng bảo đảm độ tin cậy cần phải điều tra theo cỡ mẫu tính được. ™ Kiểm định bằng biểu đồ Người ta cũng có thể kiểm định tính chuẩn của mẫu bằng cách dùng biểu đồ. Nhìn vào biểu đồ 3.3 ta thấy hình dáng có vẻ giống phân phối chuẩn. Tuy nhiên nếu nhìn kỹ hai nhánh của biểu đồ ta thấy không đối xứng. Kiểm định bằng biểu đồ thường dùng trực quan để kiểm tra nên thường không chính xác lắm, ta thường phải kết hợp với các phương pháp khác. ™ Tính tỷ lệ sai số chọn mẫu Trong thực tế người ta cũng thường dùng tỷ lệ sai số chọn mẫu (H) để kiểm tra tính đại biểu của mẫu. H càng nhỏ thì chỉ tiêu nghiên cứu có tính đại diện càng cao và ngược lại. Cũng như sai số chọn mẫu, tỷ lệ sai số chọn mẫu sẽ tính cho từng chỉ tiêu riêng biệt và đó là căn cứ để xem số liệu điều tra của từng chỉ tiêu có bảo đảm độ tin cậy cần thiết không. Người ta thường sử dụng các mức độ để đánh giá như sau: - Nếu H ≤ 5% thì số liệu đảm bảo độ tin cậy cần thiết. - Nếu 5% < H ≤ 10% thì số liệu đảm bảo độ tin cậy ở mức tạm được. - Nếu H > 10% thì số liệu không đảm bảo độ tin cậy. Ta xác định H theo công thức sau: 96 1058,0 7986,15 6714,1100 y s H y ==×= = 10,58% Với tỷ lệ sai số chọn mẫu H = 10,58% là tương đối cao, tuy nhiên số liệu này gần giới hạn có thể chấp nhận được (H<10%), do đó nếu có kinh phí để điều tra đủ cỡ mẫu tính được thì số liệu suy rộng hoàn toàn có thể tin cậy được. Kết luận này cũng phù hợp với cách kiểm định 2χ . Tóm lại trong 3 cách kiểm tra tính đại biểu của mẫu, ta thấy kiểm định 2χ cho kết quả chính xác nhất, tuy nhiên tính toán hơi phức tạp. Tác giả đề nghị nên sử dụng hai phương pháp là kiểm định 2χ và tính tỷ lệ sai số chọn mẫu để kiểm tra tính đại biểu của mẫu trong thực tế. Việc tính theo phương pháp 2χ có phức tạp, nhưng qua phần trình bày ở phần 3.1.2 rất cụ thể, với các phần mềm thống kê phổ biến hiện nay, việc tính toán trở nên dễ dàng hơn. Dựa vào kết quả tính ở lần điều tra này ta có thể xác định cỡ mẫu cho lần điều tra sau: Ta có: 2 y 2 2/2 2 y 2 2/ s M z sz m α α +ε = Với: ( )∑ =−=−−⎥⎦⎤⎢⎣⎡= mi 2 i 2 m i2 y 2651,95132 2196,2953 1m yy n Ns Thông thường trong thực tế người ta chọn ( )ε = ×10% y . Với độ tin cậy là 95% thì chúng ta cần phải điều tra với quy mô mẫu như sau: 160 2651,95 519 96,1)7986,15%10( 2651,9596,1 s M z sz m 2 2 2 2 y 2 2/2 2 y 2 2/ ≈ ×+× ×= +ε = α α ấp Như vậy theo tính toán, quy mô mẫu cho cuộc điều tra tiếp theo là 160 ấp. Do 97 nhà nước có nhiều chính sách khuyến khích phát triển sản xuất nên một số hộ mạnh dạn bỏ vốn để tăng qui mô đàn lên, do đó chênh lệch về qui mô đàn giữa các hộ sẽ cao và phương sai tính ra sẽ có giá trị lớn, làm cho cỡ mẫu tính ra lớn. * Phương pháp ước lượng gián tiếp Ta có thể sử dụng phương pháp ước lượng gián tiếp để ước lượng đàn heo của thành phố. Phương pháp ước lượng gián tiếp được sử dụng ở đây là phương pháp ước lượng tỷ lệ. Gọi: xi: số heo của các ấp mẫu ở lần điều tra 01/10/2001 yi: số heo của các ấp mẫu điều tra 01/8/2004 r: tốc độ phát triển qua hai thời kỳ 1981,1 8418 10086 x y r 30 1i i 30 1i i === ∑ ∑ = = Trong trường hợp chọn ngẫu nhiên đơn thuần, chọn không lặp, thì phương sai chọn mẫu của ước lượng số tổng của Y được tính theo công thức (1.7) σ Myr YXM S m m M 2 2 2 1= −⎛⎝⎜ ⎞ ⎠⎟ Với ( ) S y Rx MYX i i i M 2 2 1 = − − ∑ Phương sai hiệu chỉnh của tổng thể SYX2 ta không biết nên ta sử dụng phương sai hiệu chỉnh của mẫu: ( ) s y rx myx i i i m 2 2 1 1 = − − = ∑ Do đó phương sai chọn mẫu của ước lượng số tổng được tính: 98 ( )s M M m m s Myr yx 2 2= − Bảng 3.8: Bảng tính ước lượng đàn heo Số thứ tự Tên ấp mẫu Tổng số heo 1/10/2001 ( )xi (con) Tổng số heo 1/8/2004 ( )yi (con) ix r 2 ii ) xry( − x =290,2759 y =347,7931 r = 1,1981 1 Aáp 8 – Xã Bình Mỹ 225 308 269,5725 1476,6728 2 Aáp Phú Trung – An Phú 301 605 360,6281 59717,6255 3 Aáp Mũi Lớn – Tân An Hội 348 433 416,9388 257,9621 4 Aáp 8 – Xã Tân Thạnh Đông 623 747 746,4163 0,3407 5 Aáp Đông Lân – Bà Điểm 43 426 51,5183 140236,5436 6 Aáp Thới Tứ – Thới Tam Thôn 421 219 504,4001 81453,2171 7 Aáp Mỹ Hòa 1 – Xã Tân Xuân 797 601 954,8857 125235,0887 8 Aáp Mỹ Hòa 3 – Xã Tân Xuân 1 31 1,1981 888,1532 9 Aáp 1 – Xã Tân Kiên 292 596 349,8452 60592,1856 10 Aáp 4 – Xã Lê Minh Xuân 34 38 40,7354 7,4824 11 Aáp 4 – Xã Phong Phú 220 134 263,5820 16791,4947 12 Aáp 2 – Xã Hưng Long 169 255 202,4789 2758,4659 13 Aáp 1 – Xã Hiệp Phước 227 260 271,9687 143,2498 14 Aáp 3 – Xã Nhơn Đức 1169 1279 1400,5789 14781,4289 15 Aáp Bình Phước – Xã Bình Khánh 36 133 43,1316 8076,3293 99 16 Aáp Long Thạnh – Xã Long Hòa 101 894 121,0081 597516,4775 17 Aáp Đông – P. Bình Trưng Đông 161 127 192,8941 4342,0324 18 Aáp 3 – Phường An Lợi Đông 163 72 195,2903 15200,4981 19 Khu phố 5 – Phường Phước Long A 351 319 420,5331 10308,9704 20 Aáp 1 – Phường Long Thạnh Mỹ 55 371 65,8955 93088,7559 21 Aáp Tam Đa – Phường Long Trường 51 137 61,1031 5760,3394 22 Khu phố 2 – Phường Thới An 446 72 534,3526 213769,9267 23 Khu phố 2 – Phường Thạnh Lộc 440 574 527,1640 2193,6109 24 Khu phố 2 – Phường Trung Mỹ Tây 430 97 515,1830 174877,0215 25 Khu phố 4 – Phường Trung Mỹ Tây 40 82 47,9240 1161,1738 26 Khu phố 5 – Phường Trung Mỹ Tây 97 160 116,2157 1917,0649 27 Aáp Xuân Trường – Phường Linh Xuân 180 392 215,6580 31096,5010 28 Aáp Gò Dưa – Phường Bình Chiểu 497 383 595,4557 45137,4245 29 Khu phố 3 – Phường Bình Hưng Hòa 500 341 599,0500 66589,8025 Tổng 8418 10086 1775375,8398 Nguồn: Số liệu điều tra mẫu 1/8/2004 và tổng điều tra nông thôn, nông nghiệp và thủy sản 2001[3]. Phương sai hiệu chỉnh của mẫu: 28,63406 129 8398,1775375s2yx =−= Phương sai chọn mẫu của ước lượng số tổng: 100 ( ) 1,55602934728,63406 29 29519519s2 yM r =×−= Sai số chọn mẫu của ước lượng số tổng: 2745,23580s ryM = con X: số đàn heo thành phố do điều tra toàn bộ ngày 01/10/2001 là 205.017 con Y: số đàn heo thành phố ngày 01/8/2004 do ước lượng điểm: Y =X × r =205.017 × 1,1981 ≈ 245.631 con Giả sử với độ tin cậy là 95% đàn heo của thành phố sẽ nằm trong khoảng: Y s My r ± ×1 96, 2745,2358096,1245631 ×± (199.414 con; 291.848 con) Như vậy với mức độ tin cậy là 95% đàn heo của thành phố sẽ nằm trong khoảng từ 199.414 con đến 291.848 con. Để xem xét mức độ đại diện của 29 ấp mẫu so với 519 ấp trong phương pháp ước lượng tỷ lệ, ta tính tỷ lệ sai số chọn mẫu H: 096,0 245631 2745,23580 Y s H yrM === Tỷ lệ sai số chọn mẫu H = 9,6% (<10%) cho thấy số liệu nằm ở giới hạn có thể chấp nhận được nhưng có độ tin cậy thấp hơn, nên khi sử dụng số liệu phải lưu ý. Dựa vào kết quả tính ở lần điều tra này ta có thể xác định cỡ mẫu cho lần điều tra sau. Từ công thức phương sai chọn mẫu của ước lượng số tổng: ( )s M M m m s Myr yx 2 2= − Ta có phạm vi sai số chọn mẫu của ước lượng số tổng: 101 2 yx2/yrM2/ s m )mM(Mzsz −==ε αα Từ công thức trên ta tính đuợc: 2 yx 2 2/ 2 2 yx 22 2/ Msz sMz m α α +ε= Với độ tin cậy 95%, zα/2 = 1,96, còn ε trong thực tế người ta chọn bằng 10%Y, cỡ mẫu cần điều tra kỳ sau là: 93 28,406.6351996,1)631.245%10( 28,406.6351996,1m 22 22 ≈××+× ××= ấp Để so sánh hiệu quả của hai phương pháp ước lượng trực tiếp và phương pháp ước lượng tỷ lệ trên đây, ta tính hệ số tương quan giữa X và Y. Từ phụ lục 4 ta tính được: 0143,288s2414,952.82 129 7580,662.322.2s 4066,261s4212,333.68 129 7931,335.913.1s y 2 y x 2 x =⇒=−= =⇒=−= Dựa vào bảng tính phụ lục số 5 ta tính được hệ số tương quan: 6521,0 4066,2610143,288)129( 655,581.374.1 ss)1m( )xx)(yy( xy m 1i ii =×−=− −− =ρ ∑ = Hệ số biến thiên của X: 9005,0 2759,290 4066,261 x sx == Hệ số biến thiên của Y: 8281,0 7931,347 0143,288 y s y == Như ta biết, ước lượng tỷ lệ có thể chính xác hơn hoặc kém chính xác hơn ước lượng trực tiếp thông thường, điều này phụ thuộc vào hệ số tương quan giữa X và Y và hệ số biến thiên của X và Y. Khi X là giá trị của Y ở thời kỳ trước và 102 hai hệ số biến thiên xấp xỉ nhau, thì ước lượng tỷ lệ tốt nhất nếu ρ >1/2. Đối chiếu với kết quả tính toán trên ta thấy hệ số biến thiên của X và của Y xấp xỉ bằng nhau và ρ = 0,65>1/2, điều này cho thấy ước lượng tỷ lệ cho kết quả chính xác hơn. 3.2 Ứng dụng phương pháp chọn mẫu trong điều tra chăn nuôi ở tỉnh Tây Ninh 3.2.1 Đặc điểm ngành chăn nuôi ở tỉnh Tây Ninh Tây Ninh là tỉnh thuộc miền Đông Nam Bộ, nằm phía Tây Bắc thành phố Hồ Chí Minh, thị xã Tây Ninh cách trung tâm thành phố Hồ chí Minh khoảng 100km theo quốc lộ 22A và 22B. Tây Ninh có địa hình bằng phẳng, khí hậu nóng ẩm. Nông nghiệp được coi là thế mạnh của tỉnh, tạo đòn bẩy để thúc đẩy phát triển toàn bộ nền kinh tế của tỉnh. Chăn nuôi liên tục phát triển, đạt được những kết quả đáng khích lệ. Đặc biệt, từ năm 1996 đến nay, tốc độ phát triển của ngành chăn nuôi ngày càng cao và đã vượt qua ngành trồng trọt. Tây Ninh hiện có 1 thị xã và 8 huyện, gồm 3 phường, 8 thị trấn, 79 xã và 486 ấp. Đặc điểm chăn nuôi của Tây ninh là trải đều trên khắp các huyện thị. Vì nằm gần thành phố Hồ Chí Minh nên sản phẩm chăn nuôi không chỉ phục vụ cho nhu cầu tiêu thụ của tỉnh mà còn cung cấp cho thành phố. 3.2.2 Thiết kế lược đồ điều tra chọn mẫu, tổng hợp số liệu, tính toán suy rộng và đánh giá kết quả điều tra chăn nuôi heo cho tỉnh Tây Ninh Qui trình điều tra chăn nuôi của tỉnh Tây ninh thực hiện theo hướng dẫn của Tổng Cục thống Kê như đã trình bày trong phần 2.3. Được sự hỗ trợ của Cục Thống Kê tỉnh Tây Ninh, tôi đã thiết kế phương án điều tra mẫu về chăn nuôi heo, kết hợp với điều tra chăn nuôi 1/8/2004 của tỉnh nhằm hoàn thiện phương pháp chọn mẫu, tính toán sai số chọn mẫu và suy rộng. 103 Khác với Thành Phố Hồ Chí Minh, chăn nuôi heo ở tỉnh Tây Ninh trải đều khắp các huyện, thị. Qui mô đàn giữa các hộ cũng không chênh lệch nhiều. Do đó ta có thể áp dụng lược đồ chọn mẫu hai cấp (hai giai đoạn), cấp I chọn ấp, khu phố (gọi tắt là ấp) cấp II chọn hộ gia đình có phân tổ theo các huyện, thị xã và theo các vùng. Căn cứ vào điều kiện sinh thái, điều kiện kinh tế và tập quán chăn nuôi của các xã, mỗi huyện phân thành 3 vùng. Mỗi vùng lấy ra 1 ấp đại diện theo phương pháp chọn mẫu theo xác suất tỷ lệ với qui mô chăn nuôi gia súc của từng ấp. Nếu ấp đại diện có số hộ nhỏ hơn hoặc bằng 250 hộ thì điều tra toàn ấp, nếu ấp đại diện có số hộ lớn hơn 250 hộ thì chỉ điều tra đến hộ thứ 250, các hộ được chọn điều tra liền kề nhau theo danh sách điều tra năm 1998. Mỗi vùng của thị xã và từng huyện được xem là 1 tổ, như vậy toàn tỉnh Tây Ninh sẽ có 27 tổ, trong đó có 9 tổ thuộc vùng 1, 9 tổ thuộc vùng 2 và 9 tổ thuộc vùng 3. Các đơn vị mẫu cấp I và cấp II cũng như việc phân bổ cho từng vùng của thị xã Tây Ninh và 8 huyện được hệ thống trong bảng 3.9. Bảng 3.9: Phân bổ các đơn vị mẫu cấp I, cấp II Đơn vị cấp I (Aáp, khu phố) Đơn vị cấp II (hộ gia đình) STT Thị xã, các huyện và từng vùng Tổng số M Chọn mẫu m Số hộ chăn nuôi )N( i Số hộ điều tra )n( i Tỷ lệ chọn mẫu cấp II (%) 1 Thị xã Tây Ninh 44 3 235 122 51,91 Vùng 1 11 1 166 83 50,00 Vùng 2 17 1 30 23 76,67 Vùng 3 16 1 39 16 41,03 2 H. Tân Biên 49 3 154 124 80,52 Vùng 1 16 1 30 18 60,00 104 Vùng 2 11 1 35 24 68,57 Vùng 3 22 1 89 82 92,13 3 H. Tân Châu 71 3 131 82 62,60 Vùng 1 24 1 37 23 62,16 Vùng 2 21 1 39 24 61,54 Vùng 3 26 1 55 35 63,64 4 H. Dương M. Châu 59 3 104 78 75,00 Vùng 1 24 1 27 20 74,07 Vùng 2 19 1 34 29 85,29 Vùng 3 16 1 43 29 67,44 5 H. Châu Thành 71 3 396 230 58,08 Vùng 1 27 1 113 95 84,07 Vùng 2 23 1 236 99 41,95 Vùng 3 21 1 47 36 76,60 6 H. Hòa Thành 33 3 294 85 28,91 Vùng 1 9 1 25 9 36,00 Vùng 2 11 1 171 30 17,54 Vùng 3 13 1 98 46 46,94 7 H. Bến Cầu 39 3 204 132 64,71 Vùng 1 7 1 35 30 85,71 Vùng 2 12 1 120 58 48,33 Vùng 3 20 1 49 44 89,80 8 H. Gò Dầu 49 3 253 97 38,34 Vùng 1 18 1 39 16 41,03 Vùng 2 11 1 36 31 86,11 Vùng 3 20 1 178 50 28,09 9 H. Trảng Bàng 71 3 253 165 65,22 Vùng 1 21 1 86 81 94,19 Vùng 2 16 1 64 47 73,44 Vùng 3 34 1 103 37 35,92 Chung toàn tỉnh 486 27 2024 1115 55,09 Vùng 1 157 9 558 375 67,20 Vùng 2 141 9 765 365 47,71 Vùng 3 188 9 701 375 53,50 Nguồn: Số liệu điều tra mẫu 1/8/2004. Sau khi chọn được 27 ấp mẫu, vào ngày 1/8/2004 tiến hành thu thập số liệu trên các ấp mẫu về các chỉ tiêu: Tổng số heo, trong đó có heo nái, heo thịt, số heo 105 xuất chuồng, sản lượng thịt hơi xuất chuồng. Tuy nhiên trong luận án chỉ trình bày chỉ tiêu là tổng đàn heo và heo nái. Với lược đồ chọn mẫu như trên, quá trình tính toán các tham số của chỉ tiêu nghiên cứu có thể chia thành 2 giai đoạn: Giai đoạn thứ nhất áp dụng các công thức về mẫu 2 giai đoạn để tính các tham số cho từng tổ. Giai đoạn thứ hai vận dụng các công thức về chọn mẫu phân tổ để tính các tham số tổng hợp chung cho các tổ. * Giai đoạn 1: Bao gồm 2 bước. - Bước 1: Tính số lượng heo trung bình và phương sai mẫu giữa các đơn vị mẫu cấp II (hộ gia đình) trong từng đơn vị mẫu cấp I (ấp). Dựa vào số liệu điều tra thu thập được, ta lấy số liệu của huyện Tân Châu để tính toán mi

Các file đính kèm theo tài liệu này:

  • pdf46970.pdf
Tài liệu liên quan