Các loại phân tổ thống kê
o Căn cứ vào số lượng tiêu thức phân tổ: Phân
tổ theo 1 tiêu thức (phân tổ giản đơn, ví dụ:
phân tổ dân số theo riêng tiêu thức độ tuổi,
giới tính.) và phân tổ theo nhiều tiêu thức.
Phân tổ theo nhiều tiêu thức được chia thành
hai loại:
Phân tổ kết hợp: là phân tổ lần lượt theo
từng tiêu thức, tiêu thức nào trước, tiêu thức nào sau phụ thuộc vào mục
đích nghiên cứu. Nó cho phép nhìn nhận hiện tượng trên nhiều góc độ,
nhiều khía cạnh khác nhau.
Ví dụ: Tổng thể dân số khi được phân chia theo tiêu thức giới tính thì hình
thành hai tổ: nam và nữ. Ở mỗi tổ dân số nam và dân số nữ này lại được
phân chia tiếp theo tiêu thức nhóm tuổi.
Phân tổ kết hợp tuy có nhiều ưu điểm nhưng chúng ta cũng không nên quá
lạm dụng, kết hợp quá nhiều tiêu thức sẽ làm cho việc phân tổ trở nên phức
tạp, tổng thể bị chia nhỏ gây khó khăn cho việc nghiên cứu.
Phân tổ nhiều chiều: cùng một lúc phân tổ theo nhiều tiêu thức khác nhau
nhưng có vai trò ngang nhau trong phản ánh hiện tượng.
Ví dụ: Khi phân tổ các doanh nghiệp xây dựng theo qui mô nhưng không
nói rõ qui mô gì, người ta sẽ phân tổ đồng thời theo các tiêu thức: vốn, lao
động, tài sản cố định, giá trị xây lắp, doanh thu. Các tiêu thức này có vai
trò ngang nhau khi phản ánh qui mô của doanh nghiệp.Bài 2: Quá trình nghiên cứu thống kê
v1.0 27
o Căn cứ vào mục đích phân tổ, người ta chia thành:
Phân tổ phân loại: để chia tổng thể thành các loại hình khác nhau, thường
phân tổ theo tiêu thức thuộc tính.
Phân tổ kết cấu: để nghiên cứu kết cấu của tổng thể, có thể phân tổ theo tiêu
thức thuộc tính, có thể theo tiêu thức số lượng.
Phân tổ liên hệ: để nghiên cứu mối liên hệ giữa các tiêu thức, phải đặt trong
những điều kiện thời gian, không g
26 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 644 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Giáo trình Thống kê học - Bài 2: Quá trình nghiên cứu thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
trình điều tra và giúp chúng ta xác định
chính xác đối tượng, đơn vị và nội dung điều tra.
Xác định đối tượng điều tra và đơn vị điều tra
Đối tượng điều tra là tổng thể các đơn vị thuộc hiện tượng nghiên cứu có các
dữ liệu cần thiết khi tiến hành điều tra. Xác định đối tượng điều tra là xác định
Bài 2: Quá trình nghiên cứu thống kê
22 v1.0
phạm vi đối tượng cần nghiên cứu, cần điều tra nhằm thu thập tài liệu chính xác,
không nhầm lẫn với các hiện tượng khác.
Đơn vị điều tra là từng đơn vị cá biệt thuộc đối tượng điều tra và được xác định sẽ
điều tra thực tế. Trong điều tra toàn bộ, số đơn vị điều tra cũng chính là số đơn vị
thuộc đối tượng điều tra. Trong điều tra không toàn bộ, số đơn vị điều tra là những
đơn vị được chọn ra từ tổng thể các đơn vị thuộc đối tượng điều tra.
Xác định đơn vị điều tra tức là xác định tài liệu sẽ được thu thập ở đâu. Tuỳ theo
mục đích và đối tượng điều tra mà đơn vị điều tra được xác định khác nhau.
Ví dụ: Trong Tổng điều tra dân số và nhà ở 1/4/2009.
Mục đích điều tra: Phục vụ công tác nghiên cứu, phân tích và dự báo quá trình
phát triển dân số và nhà ở trên phạm vi cả nước và từng địa phương...
Đối tượng điều tra: Tất cả công dân Việt Nam.
Đơn vị điều tra: Hộ gia đình.
Ví dụ: Trong điều tra sản xuất và kinh doanh rau sạch, đơn vị điều tra có thể là
doanh nghiệp, hợp tác xã, hộ nông dân hoặc từng người dân có sản xuất và kinh
doanh rau sạch.
Ví dụ: Trong điều tra về thị trường sữa trẻ em ở Việt Nam, đơn vị điều tra là các
siêu thị, đại lý, cửa hàng... có kinh doanh sữa trẻ em.
Xác định nội dung điều tra
Mỗi đơn vị điều tra có rất nhiều tiêu thức khác nhau. Nhưng trong một cuộc điều
tra, không nhất thiết phải thu thập tất cả các tiêu thức, mà chỉ thu thập theo một số
tiêu thức chủ yếu, những tiêu thức quan trọng nhất đáp ứng cho mục đích điều tra
và mục đích nghiên cứu. Như vậy, nội dung điều tra là toàn bộ các đặc điểm cơ
bản của từng đối tượng, từng đơn vị điều tra mà ta cần thu được thông tin hay nói
cách khác, đó là danh mục các tiêu thức hay đặc trưng của các đơn vị điều tra cần
thu thập.
Để xác định nội dung điều tra, cần phải căn cứ vào các yếu tố sau:
o Mục đích điều tra.
o Đặc điểm của hiện tượng nghiên cứu.
o Năng lực, trình độ thực tế của đơn vị, người tổ chức điều tra.
Trong kế hoạch điều tra phải xác định và thống nhất danh mục các tiêu thức cần
thu thập. Các tiêu thức này phải được diễn đạt thành câu hỏi ngắn gọn, dễ hiểu, cụ
thể, rõ ràng để cả người điều tra và đơn vị điều tra đều hiểu một cách thống nhất.
Danh mục các tiêu thức này được thể hiện dưới dạng phiếu hỏi, phiếu điều tra,
bảng hỏi hay biểu mẫu điều tra.
Đi kèm theo phiếu hỏi phải có bảng giải thích cách ghi phiếu nhằm giải thích
cụ thể nội dung từng tiêu thức, cách thu thập và ghi chép số liệu. Mục đích giúp
người đi điều tra, đơn vị điều tra hiểu và thực hiện chính xác, thu thập số liệu
cho đúng.
Xác định thời điểm điều tra, thời kỳ điều tra và thời hạn điều tra
Trong đó:
o Thời điểm điều tra là mốc thời gian (ngày, giờ cụ thể) được xác định để
tiến hành thu thập tài liệu một cách thống nhất trên tất cả các đơn vị của hiện
tượng nghiên cứu.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 23
Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009,
thời điểm điều tra là 0 giờ ngày 1/4/2009.
Tuỳ theo tính chất, đặc điểm của hiện tượng
nghiên cứu mà xác định thời điểm điều tra. Tuy
nhiên, thời điểm điều tra thường được xác định
vào lúc hiện tượng ít biến động nhất và gắn kết
với những kế hoạch của địa phương.
Ví dụ: Điều tra về du lịch biển ở Sầm Sơn thì
không nên chọn vào mùa đông.
o Thời kỳ điều tra là độ dài (khoảng) thời gian có sự
tích luỹ về mặt lượng của hiện tượng nghiên cứu.
Ví dụ: Điều tra tình hình xuất khẩu gạo của địa
phương A trong quý 1 năm 2008.
Thời kỳ điều tra dài hay ngắn phụ thuộc vào mục đích nghiên cứu.
o Thời hạn điều tra là khoảng thời gian kể từ lúc bắt đầu tiến hành điều tra cho
đến khi hoàn thành việc thu thập tài liệu trên tất cả các đơn vị điều tra.
Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009, thời hạn điều tra trong vòng 20
ngày từ sáng 1/4 đến tối 20/4...
Như vậy, thời hạn điều tra dài hay ngắn phụ thuộc vào qui mô, tính chất phức
tạp của hiện tượng, nội dung nghiên cứu và lực lượng tham gia nhưng nhìn
chung, thời hạn điều tra không nên quá lâu vì sẽ dẫn đến việc thu thập tài liệu
thiếu chính xác.
Ngoài 4 vấn đề chính ở trên, trong phương án điều tra thống kê còn đề cập tới
một số vấn đề về nguồn nhân lực, kinh phí, thời gian thực hiện, điều tra thử,
thành lập các cơ quan điều tra và tuyên truyền trong nhân dân...
Trong tiến hành điều tra thống kê, dù khoa học đến mấy nhưng vẫn có sai số.
Vậy sai số là gì? Liệu có thể khắc phục được sai số hay không?
2.1.6. Sai số trong điều tra thống kê
2.1.6.1. Khái niệm
Sai số trong điều tra thống kê là chênh lệch giữa các trị
số của tiêu thức điều tra thu thập được so với trị số thực
tế của hiện tượng nghiên cứu.
Ví dụ: Trong điều tra dân số, sai số hay mắc phải là về
tiêu thức tuổi do một số nguyên nhân: Người già không
nhớ chính xác tuổi, tâm lý trẻ muốn già hơn và ngược
lại; trong điều tra về mức sống, đối tượng điều tra
nhiều khi không nhớ chính xác về các khoản đã chi
trong thời gian nghiên cứu...
Sai số trong điều tra thống kê là sai số vốn có. Phạm vi
sai số cho phép trong điều tra thống kê là ± 5%. Tuy nhiên, sai số càng lớn thì chất
lượng của kết quả điều tra càng giảm và gây ảnh hưởng đến chất lượng của cả quá
trình nghiên cứu thống kê. Vấn đề đặt ra là phải xác định được sai số do nguyên nhân
nào để từ đó chủ động tìm biện pháp khắc phục.
Bài 2: Quá trình nghiên cứu thống kê
24 v1.0
2.1.6.2. Các loại sai số
Căn cứ vào nguyên nhân dẫn đến sai số mà người ta chia sai số trong điều tra thống kê
thành các loại sau:
Sai số do ghi chép tài liệu (do đăng ký lần đầu): đây là loại sai số mà tất cả các
cuộc điều tra đều mắc phải, xảy ra do các nguyên nhân:
o Người điều tra vô tình cân, đo, đong, đếm và ghi chép sai.
o Đơn vị điều tra không hiểu câu hỏi dẫn đến trả lời sai.
o Cả đơn vị điều tra và người điều tra cố tình ghi chép sai.
Sai số do tính chất đại biểu của số đơn vị được chọn: chỉ xảy ra trong điều tra
chọn mẫu, do các nguyên nhân:
o Cỡ mẫu không đủ lớn.
o Do cố tình vi phạm nguyên tắc chọn mẫu.
o Do bản thân nguyên tắc chọn mẫu.
2.1.6.3. Các biện pháp khắc phục sai số
Sai số trong thống kê là một vấn đề không thể tránh khỏi. Để khắc phục sai số, cần
phải thực hiện tốt các biện pháp sau:
Làm tốt công tác chuẩn bị điều tra
o Lập phương án điều tra khoa học, chi tiết.
o Chuẩn bị cán bộ điều tra đảm bảo chất lượng.
o Coi trọng công tác tuyên truyền sâu rộng về mục đích cuộc điều tra.
Làm tốt công tác kiểm tra điều tra
o Kiểm tra tài liệu thu thập được có đầy đủ về nội dung và số đơn vị điều tra
không, có chính xác về con số và logic không.
o Kiểm tra tính đại biểu của số đơn vị được chọn trong điều tra chọn mẫu.
Sau khi kết thúc điều tra, chúng ta thu được một số lượng lớn các tài liệu. Nhưng
những tài liệu này mới chỉ ở dạng thô, mang tính chất rời rạc, chưa cho thấy đặc trưng
chung của hiện tượng nghiên cứu. Công việc tiếp theo là phải tổng hợp những tài liệu
đó lại để tìm ra các đặc trưng của hiện tượng làm cơ sở cho quá trình phân tích và dự
đoán thống kê.
2.2. Tổng hợp thống kê
2.2.1. Khái niệm chung về tổng hợp thống kê
2.2.1.1. Khái niệm
Tổng hợp thống kê là tiến hành tập trung chỉnh lý và hệ thống hóa một cách khoa học
toàn bộ tài liệu thu thập được trong điều tra thống kê.
Ví dụ: Sau khi điều tra về thị trường sữa trẻ em ở Việt Nam hiện nay, chúng ta thu
được một tập số liệu nhưng chưa biết được hiện có bao nhiêu chủng loại sữa, giá bán
mỗi loại, thị phần... Tổng hợp thống kê sẽ giúp giải quyết những câu hỏi đó.
Chỉnh lý, hệ thống hoá là việc kiểm tra lại và sắp xếp tài liệu theo một trật tự nào đó
chứ không sửa trực tiếp vào phiếu điều tra.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 25
2.2.1.2. Ý nghĩa và nhiệm vụ của tổng hợp thống kê
Tổng hợp thống kê là giai đoạn trung gian, xử lý sơ bộ
tài liệu, làm căn cứ cho phân tích và dự đoán thống kê.
Nếu tài liệu điều tra tỉ mỉ chi tiết nhưng tổng hợp
không đúng thì tính toán phân tích sẽ sai. Mặt khác,
bản thân việc tổng hợp thống kê này đã là một phương
pháp trong phân tích thống kê.
Ví dụ: Phương pháp trình bày dữ liệu, phương pháp
phân tích kết cấu của tổng thể trong trạng thái tĩnh, phương pháp phân tích chuyển
dịch cơ cấu của tổng thể trong trạng thái động...
Qua tổng hợp, có thể làm cho các đặc trưng riêng của từng đơn vị tổng thể bước đầu
chuyển thành các đặc trưng chung của cả tổng thể (từ các tiêu thức xây dựng nên các
chỉ tiêu). Hệ thống hóa là nhiệm vụ chủ yếu của tổng hợp thống kê.
Sau đây là một số phương pháp tổng hợp thống kê cơ bản.
2.2.2. Phân tổ thống kê
2.2.2.1. Một số vấn đề chung về phân tổ thống kê
Khái niệm: Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để
tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ và các tiểu
tổ có tính chất khác nhau.
Ví dụ: Trong nghiên cứu dân số, căn cứ vào tiêu
thức giới tính, người ta chia dân số thành 2 tổ: nam
và nữ; căn cứ vào tiêu thức tuổi, chia dân số thành
các tổ: 0; 1 – 4; 5 – 9, 10 – 14, 15 – 19...
Ví dụ: Trong điều tra về thị trường sữa ở nước ta
hiện nay, căn cứ theo tiêu thức loại sữa để phân
chia tổng thể điều tra thành các loại sữa với nhãn
hiệu khác nhau; hoặc căn cứ vào tiêu thức giá bán để phân chia thành các loại sữa
với mức giá bán khác nhau...
Ý nghĩa: Phân tổ thống kê là một trong những phương pháp thường được sử dụng
trong nghiên cứu thống kê.
o Giai đoạn điều tra thống kê: Trong điều tra toàn bộ và điều tra không toàn bộ,
người ta phải phân tổ trước các hiện tượng cần nghiên cứu nhằm giúp cho việc
điều tra được dễ dàng, thuận tiện; trong điều tra chọn mẫu, phương pháp phân
tổ được sử dụng để đảm bảo tính đại diện của mẫu.
o Giai đoạn tổng hợp thống kê: Phân tổ là phương pháp cơ bản nhất dùng để
chỉnh lý và hệ thống hóa toàn bộ tài liệu thu thập được trong điều tra thống kê.
o Giai đoạn phân tích thống kê: Phân tổ là một trong những phương pháp quan
trọng, là cơ sở để vận dụng các phương pháp thống kê khác một cách có hiệu
quả. Bản thân phân tổ thống kê cũng đã là một phương pháp phân tích thống kê
quan trọng, đó là phân tích kết cấu của hiện tượng ở trạng thái tĩnh và chuyển
dịch cơ cấu ở trạng thái động.
Nhiệm vụ: Nó cho phép giải quyết ba nhiệm vụ cơ bản sau:
Bài 2: Quá trình nghiên cứu thống kê
26 v1.0
o Thứ nhất, phân chia các loại hình kinh tế – xã hội theo đúng với sự tồn tại
khách quan của nó. Trên cơ sở đó, nghiên cứu mối quan hệ giữa các loại hình
kinh tế – xã hội nhằm nhận thức được quá trình vận động và phát triển của
hiện tượng.
Ví dụ: Phân tổ các cơ sở sản xuất công nghiệp ở nước ta theo thành phần
kinh tế: Nhà nước, ngoài Nhà nước và có vốn đầu tư nước ngoài.
o Thứ hai, biểu hiện kết cấu của hiện tượng nghiên cứu, qua đó nêu lên đặc điểm
cơ bản của hiện tượng trong điều kiện thời gian và địa điểm cụ thể. Mặt khác,
khi nghiên cứu sự biến động kết cấu của hiện tượng qua thời gian ta sẽ thấy
được xu hướng phát triển cơ bản của hiện tượng nghiên cứu.
Ví dụ: Khi nghiên cứu kết cấu của các cơ sở sản xuất công nghiệp ở nước ta
trong một khoảng thời gian, có thể thấy sự chuyển dịch theo hướng: tỷ trọng
các cơ sở sản xuất công nghiệp trong khu vực Nhà nước giảm dần, tỷ trọng các
cơ sở sản xuất công nghiệp trong khu vực ngoài Nhà nước và có vốn đầu tư
nước ngoài tăng dần.
o Thứ ba, biểu hiện mối liên hệ giữa các tiêu thức. Ta chia tiêu thức thành tiêu
thức nguyên nhân (tiêu thức gây ảnh hưởng) và tiêu thức kết quả (tiêu thức bị
ảnh hưởng), sau đó sẽ tiến hành phân tổ theo tiêu thức nguyên nhân.
Ví dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động, giữa năng suất lao
động và tiền lương, giữa lượng phân bón và năng suất cây trồng, giữa thu nhập
và loại sữa dùng cho trẻ
Các loại phân tổ thống kê
o Căn cứ vào số lượng tiêu thức phân tổ: Phân
tổ theo 1 tiêu thức (phân tổ giản đơn, ví dụ:
phân tổ dân số theo riêng tiêu thức độ tuổi,
giới tính...) và phân tổ theo nhiều tiêu thức.
Phân tổ theo nhiều tiêu thức được chia thành
hai loại:
Phân tổ kết hợp: là phân tổ lần lượt theo
từng tiêu thức, tiêu thức nào trước, tiêu thức nào sau phụ thuộc vào mục
đích nghiên cứu. Nó cho phép nhìn nhận hiện tượng trên nhiều góc độ,
nhiều khía cạnh khác nhau.
Ví dụ: Tổng thể dân số khi được phân chia theo tiêu thức giới tính thì hình
thành hai tổ: nam và nữ. Ở mỗi tổ dân số nam và dân số nữ này lại được
phân chia tiếp theo tiêu thức nhóm tuổi.
Phân tổ kết hợp tuy có nhiều ưu điểm nhưng chúng ta cũng không nên quá
lạm dụng, kết hợp quá nhiều tiêu thức sẽ làm cho việc phân tổ trở nên phức
tạp, tổng thể bị chia nhỏ gây khó khăn cho việc nghiên cứu.
Phân tổ nhiều chiều: cùng một lúc phân tổ theo nhiều tiêu thức khác nhau
nhưng có vai trò ngang nhau trong phản ánh hiện tượng.
Ví dụ: Khi phân tổ các doanh nghiệp xây dựng theo qui mô nhưng không
nói rõ qui mô gì, người ta sẽ phân tổ đồng thời theo các tiêu thức: vốn, lao
động, tài sản cố định, giá trị xây lắp, doanh thu... Các tiêu thức này có vai
trò ngang nhau khi phản ánh qui mô của doanh nghiệp.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 27
o Căn cứ vào mục đích phân tổ, người ta chia thành:
Phân tổ phân loại: để chia tổng thể thành các loại hình khác nhau, thường
phân tổ theo tiêu thức thuộc tính.
Phân tổ kết cấu: để nghiên cứu kết cấu của tổng thể, có thể phân tổ theo tiêu
thức thuộc tính, có thể theo tiêu thức số lượng.
Phân tổ liên hệ: để nghiên cứu mối liên hệ giữa các tiêu thức, phải đặt trong
những điều kiện thời gian, không gian khác nhau.
2.2.2.2. Tiêu thức phân tổ và chỉ tiêu giải thích
Khái niệm: Tiêu thức phân tổ là tiêu thức thống kê
được chọn làm căn cứ để phân tổ thống kê.
Ví dụ: Phân tổ dân số theo giới tính thì giới tính là
tiêu thức phân tổ.
Mỗi đơn vị tổng thể đều bao gồm nhiều tiêu thức, tiêu
thức nào cũng có thể dùng để phân tổ được. Tuy nhiên,
mỗi tiêu thức lại có ý nghĩa khác nhau nhưng tiêu thức
phân tổ sẽ phản ánh đúng bản chất của hiện tượng nhất
theo mục đích nghiên cứu.
Với cùng một tài liệu, nếu chọn tiêu thức phân tổ khác
nhau có thể đưa đến kết luận khác nhau. Và nếu chọn
tiêu thức phân tổ không đúng theo mục đích nghiên cứu sẽ dẫn đến nhận xét đánh
giá khác nhau về thực tế của một hiện tượng. Vậy làm thế nào để chọn tiêu thức
phân tổ cho chính xác?
Những căn cứ để lựa chọn tiêu thức phân tổ: Có ba căn cứ sau:
o Phải tiến hành phân tích lý luận kinh tế – xã hội để hiểu được đặc điểm, bản
chất của hiện tượng, từ đó mới chọn ra tiêu thức nói rõ bản chất nhất, phù hợp
với mục đích nghiên cứu để làm tiêu thức phân tổ.
Ví dụ: Để nghiên cứu về mức sống dân cư, ở thành thị chúng ta có thể sử dụng
tiêu thức thu nhập, chi tiêu hay diện tích nhà ở bình quân nhưng nếu nghiên
cứu ở nông thôn, tiêu thức diện tích nhà ở bình quân lại không có ý nghĩa.
o Phải dựa vào điều kiện lịch sử cụ thể của hiện tượng (thời gian và địa điểm cụ
thể) để lựa chọn tiêu thức thích hợp.
Ví dụ: Ngày nay, việc phân tổ các cơ sở sản xuất kinh doanh theo tiêu thức
thành phần kinh tế mới có ý nghĩa; trong thời kỳ trước đổi mới, tiêu thức này là
không phù hợp vì đa phần các cơ sở sản xuất kinh doanh đều thuộc sở hữu của
Nhà nước.
o Tuỳ theo tính chất phức tạp của hiện tượng và mục đích yêu cầu nghiên cứu, có
thể lựa chọn phân tổ theo một hay nhiều tiêu thức khác nhau.
Sau khi đã lựa chọn được tiêu thức phân tổ, người ta còn phải xác định các chỉ
tiêu giải thích để nói rõ đặc trưng của các tổ cũng như của toàn bộ tổng thể.
Mỗi chỉ tiêu giải thích có ý nghĩa quan trọng riêng giúp ta thấy rõ các đặc trưng
số lượng của từng tổ cũng như cả tổng thể, làm căn cứ để so sánh các tổ với
nhau và tính ra các chỉ tiêu khác. Tuy nhiên, cũng không nên đề ra quá nhiều
Bài 2: Quá trình nghiên cứu thống kê
28 v1.0
chỉ tiêu, mà phải lựa chọn một số chỉ tiêu thích hợp nhất đối với mục đích
nghiên cứu.
Ví dụ: Mục tiêu phân tích thực trạng của các doanh nghiệp hiện nay, chúng ta
có thể lựa chọn những chỉ tiêu phản ánh rõ nét thực trạng đó nhất như: qui mô
lao động, qui mô vốn, doanh thu, lợi nhuận...
Sau khi đã chọn được tiêu thức phân tổ, chúng ta tiến hành phân tổ. Nhưng
phân ra thành bao nhiêu tổ là phù hợp?
2.2.2.3. Xác định số tổ
Có các trường hợp sau:
Nếu tiêu thức phân tổ là tiêu thức thuộc tính: Các tổ được hình thành theo các
loại hình khác nhau, tuy nhiên không nhất thiết mỗi loại hình phải hình thành một tổ.
o Trường hợp đơn giản (tiêu thức có ít biểu hiện): Mỗi biểu hiện của tiêu thức có
thể hình thành 1 tổ.
Ví dụ: 2 giới tính, 5 thành phần kinh tế...
o Trường hợp phức tạp (tiêu thức có nhiều biểu
hiện): Ghép một số tổ nhỏ thành tổ lớn tùy theo
đặc điểm hiện tượng và yêu cầu về mức độ chi
tiết khi phân tổ. Cần bảo đảm yêu cầu các tổ
nhỏ được ghép phải giống nhau hoặc gần giống
nhau về đặc điểm và tính chất.
Việc ghép tổ này đạt được hai mục đích, làm cho số tổ ít đi và đảm bảo giữa
các tổ có sự khác nhau về đặc điểm, tính chất.
Ví dụ: Mặc dù chỉ có 5 thành phần kinh tế nhưng theo mục đích nghiên cứu, ta
chỉ cần phân tổ theo 2 thành phần: Nhà nước và ngoài Nhà nước.
Ví dụ: Trong công nghiệp, có thể phân thành 3 nhóm ngành lớn: công nghiệp
khai thác, công nghiệp chế biến và công nghiệp điện, ga, nước.
Ví dụ: Phân chỗ ngồi ở chợ theo các nhóm ngành hàng: hàng khô, hàng rau
quả, hàng thịt,...
Nếu tiêu thức phân tổ là tiêu thức số lượng: Tùy theo số lượng biến của tiêu
thức nhiều hay ít mà có cách giải quyết khác nhau.
o Số lượng các lượng biến ít: Với trường hợp này, lượng biến thay đổi ít, mỗi
lượng biến có thể hình thành nên 1 tổ. Khi đó gọi là phân tổ không có khoảng
cách tổ.
Ví dụ: Phân tổ công nhân doanh nghiệp A theo bậc thợ.
Bậc thợ Số công nhân (người)
1 10
2 20
3 45
4 60
5 35
6 25
7 5
Tổng 200
Bài 2: Quá trình nghiên cứu thống kê
v1.0 29
Trong nhiều trường hợp, với mục đích nghiên cứu khác nhau, tuy số lượng các
lượng biến ít, người ta vẫn ghép một số lượng biến thành 1 tổ.
Ví dụ: Trong nghiên cứu dân số, khi nghiên cứu về qui mô hộ gia đình. Một hộ gia
đình có thể có 1, 2, 3, 4... người. Cùng với sự phát triển của xã hội, qui mô hộ thu
hẹp lại; khi đó làm nảy sinh khái niệm “gia đình hạt nhân” chỉ có bố mẹ và con cái
và “gia đình truyền thống” gồm 3, 4 thế hệ. Ngày nay, số lượng các gia đình hạt
nhân tăng lên, số lượng gia đình truyền thống giảm xuống.
o Số lượng các lượng biến nhiều: phải căn cứ vào quan hệ lượng – chất xem
lượng biến tích lũy đến một mức độ nào đó thì chất thay đổi và làm nảy sinh
một tổ mới. Mỗi tổ sẽ bao gồm 1 phạm vi lượng biến với 2 giới hạn: giới hạn
dưới: lượng biến nhỏ nhất để hình thành tổ; giới hạn trên: lượng biến lớn nhất,
nếu vượt qua giới hạn này thì chất đổi, dẫn đến hình thành 1 tổ mới. Phân tổ
như trên gọi là phân tổ có khoảng cách tổ. Chênh lệch giữa giới hạn trên và
giới hạn dưới gọi là khoảng cách tổ.
h = Giới hạn trên – Giới hạn dưới
Có các trường hợp:
Trường hợp phân tổ có khoảng cách tổ bằng nhau:
Xác định trị số khoảng cách tổ:
max minX Xh
n
Trong đó:
Xmax, Xmin: Lượng biến lớn nhất và nhỏ nhất của tiêu thức nghiên cứu.
n: Số tổ định chia.
Ví dụ: Khi nghiên cứu thu nhập bình quân một tháng (triệu đồng) tại một
phòng giao dịch của Ngân hàng ACB có 20 nhân viên, người ta thu được
kết quả sau:
3,0 4,6 5,8 15,0 6,5
9,0 7,7 9,5 3,4 8,5
5,2 7,0 5,5 11,0 10,0
12,5 8,8 7,5 5,8 8,2
Theo tiêu thức thu nhập bình quân một tháng, người ta muốn chia số nhân
viên nói trên thành 6 tổ có khoảng cách tổ bằng nhau.
Sau khi sắp xếp số liệu theo thứ tự tăng dần, nhận thấy, mức thu nhập thấp
nhất là 3 triệu đồng, mức thu nhập cao nhất là 15 triệu đồng. Khi đó,
khoảng cách tổ sẽ được tính như sau:
15 3h 2
6
(triệu đồng)
Các tổ được thiết lập như sau:
Bài 2: Quá trình nghiên cứu thống kê
30 v1.0
Thu nhập bình quân một tháng
(triệu đồng) Số nhân viên (người)
3 – 5 3
5 – 7 5
7 – 9 6
9 – 11 3
11 – 13 2
13 – 15 1
Tổng 20
Chú ý:
Giới hạn trên của tổ đứng trước được lấy làm giới hạn dưới của tổ đứng sau với mục
đích làm cho dãy số kín hay liên tục.
Khi 1 đơn vị có lượng biến đúng bằng giới hạn trên và giới hạn dưới của 2 tổ liền
nhau thì thường được xếp vào tổ đứng sau.
o Trường hợp phân tổ có khoảng cách tổ không bằng nhau: Dựa vào ý nghĩa kinh
tế – xã hội của hiện tượng mà xác định nội dung và phạm vi của tổ.
Ví dụ: Phân tổ số học sinh của địa phương A theo lớp học như sau:
Lớp Số học sinh
1 – 5 320
6 – 9 270
10 – 12 180
Tổng 770
o Trường hợp phân tổ mở: là trường hợp tổ đầu tiên không có giới hạn dưới hay
tổ cuối cùng không có giới hạn trên.
Ví dụ: Phân tổ các cơ sở sản xuất công nghiệp của địa phương A theo số
lao động:
Số lao động (người) Số cơ sở công nghiệp
20 10
21 – 50 30
51 – 100 20
100 10
Tổng 70
Chú ý:
Quy ước: Khoảng cách tổ của tổ gần nhất được sử dụng làm khoảng cách tổ cho tổ
mở khi xác định trị số giữa.
Sau khi phân tổ hiện tượng nghiên cứu theo một tiêu thức nào đó thì các đơn vị của
hiện tượng được sắp xếp vào các tổ tương ứng với các biểu hiện của tiêu thức mà đơn
vị đó có, khi đó sẽ hình thành nên một dãy số phân phối.
2.2.2.4. Dãy số phân phối
Khái niệm: Dãy số phân phối là một dãy số được lập nên do phân phối các đơn vị
tổng thể vào các tổ theo một tiêu thức phân tổ nào đó và được sắp xếp theo trình tự
biến động của lượng biến tiêu thức phân tổ.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 31
Ví dụ : Các ví dụ nêu trên đều là dãy số phân phối.
Tác dụng của dãy số phân phối
o Cho biết tỉ mỉ, chi tiết tình hình phân phối các đơn vị
của hiện tượng nghiên cứu theo 1 tiêu thức cụ thể.
o Là cơ sở để tiến hành tính toán và phân tích thống kê.
Phân loại dãy số phân phối: Có 2 loại dãy số phân phối
tương ứng với loại tiêu thức phân tổ.
o Dãy số thuộc tính: là kết quả của phân tổ theo tiêu
thức thuộc tính.
o Dãy số lượng biến: là kết quả của phân tổ theo tiêu thức số lượng.
Trong thống kê, người ta thường sử dụng các dãy số lượng biến. Đặc điểm của
dãy số này là các lượng biến bao giờ cũng được sắp xếp theo thứ tự từ nhỏ đến
lớn hoặc ngược lại.
Dạng tổng quát của một dãy số lượng biến:
Lượng biến
xi
Tần số
fi
Tần suất
di
Tần số tích lũy
Si
Tần suất tích lũy
Si’
x1 f1 d1 S1 = f1 S1’= d1
x2 f2 d2 S2 = S1 + f2 S2’= S1’ + d2
xn fn dn Sn = Sn-1 + fn Sn’= Sn-1’ + dn
∑fi ∑di
Trong đó lượng biến xi (i = 1,n ) là các trị số biểu hiện mức độ cụ thể của tiêu
thức số lượng.
Căn cứ vào tính chất liên tục hay không liên tục của lượng biến có thể chia ra:
Lượng biến liên tục: các trị số của nó có thể được biểu hiện bằng số nguyên
hay số thập phân (ví dụ: tiền lương). Khi đó, dãy số lượng biến phải có
khoảng cách tổ.
Lượng biến không liên tục (rời rạc): các trị số của dãy số chỉ có thể biểu
hiện bằng các số nguyên (ví dụ: tuổi). Dãy số lượng biến có thể có hoặc
không có khoảng cách tổ.
Đối với phân tổ có khoảng cách tổ, lượng biến xi là trị số giữa của từng tổ và
được tính:
xi =
Giới hạn dưới + Giới hạn trên
2
Tần số fi (i = 1,n ): Là số lượng biến của từng tổ được sắp xếp vào trong
từng tổ hay là số lần lặp lại của các lượng biến.
∑fi: Tổng số đơn vị trong tổng thể.
Tần suất di (i = 1,n ): Là tỷ trọng từng bộ phận trong tổng thể, là tần số
được biểu hiện bằng số tương đối. Vai trò của fi và di là tương đương nhau,
có thể thay thế cho nhau. Công thức: ii
i
fd =
f (lần, %).
Bài 2: Quá trình nghiên cứu thống kê
32 v1.0
Tần số tích lũy tiến Si (i = 1,n ): Là cộng dồn tần số, có 2 tác dụng: cho biết
số lượng các đơn vị có lượng biến nhỏ hơn hay lớn hơn 1 lượng biến cụ thể
nào đó và cho phép xác định 1 đơn vị đứng ở vị trí nào đó trong dãy số có
lượng biến là bao nhiêu.
Ví dụ: Có tài liệu về NSLĐ của 40 công nhân như sau:
NSLĐ (kg)
(xi)
Số lao động
(người) (fi) di (%) Si
50 3 7,5 3
55 5 12,5 8
60 10 25,0 18
65 12 30,0 30
70 7 17,5 37
72 3 7,5 40
∑ 40 100,0
Si = 18 khi xi = 60: Nó cho biết có 18 người có NSLĐ từ 60 sản phẩm trở
xuống và có 40 – 18 = 22 người có NSLĐ từ 60 sản phẩm trở lên. Vậy người
thứ 20 có NSLĐ là bao nhiêu?
Người thứ 20 nằm trong khoảng 18 – 30 nên có NSLĐ là 65 sản phẩm.
Tần suất tích lũy tiến iS (i = 1,n ): là cộng dồn tần suất.
Mật độ phân phối (mi): Trong dãy số lượng biến có các tổ với khoảng cách
tổ không bằng nhau thì tần số trong các khoảng cách tổ không trực tiếp so
sánh với nhau được, vì các tần số đó phụ thuộc vào trị số khoảng
Các file đính kèm theo tài liệu này:
- bai_giang_thong_ke_hoc_bai_2_qua_trinh_nghien_cuu_thong_ke.pdf