Tác dụng
Mốt biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng
hay bù trừ chênh lệch giữa các lượng biến (khác x ), nó có thể bổ sung hay thay
thế cho số trung bình cộng trong trường hợp việc tính số trung bình gặp khó khăn.
Mốt bảo đảm ý nghĩa kinh tế hơn các tính toán khác khi có lượng biến đột xuất vì
nó không chịu ảnh hưởng của lượng biến đột xuất.
Mốt là một trong những tham số nêu lên đặc trưng phân phối của dãy số.
Mốt sử dụng trong bài toán lý thuyết phục vụ đám đông: trong kinh doanh, chọn
loại nào, màu sắc, kiểu cỡ nào phù hợp nhất và vừa ý nhất với số đông để sản xuất
nhiều, đáp ứng nhu cầu khách hàng.
Ưu, nhược điểm của Mốt
Ưu điểm:
o Mốt không thay đổi đối với những lượng biến đột xuất.
o Mốt có thể được tính ra từ cả tiêu thức thuộc tính và tiêu thức số lượng.
Hạn chế:
o Mốt kém nhạy bén với sự biến thiên của tiêu thức: Chỉ quan tâm tới lượng biến
có tần số lớn nhất mà không quan tâm tới các lượng biến khác.
o Đối với 1 dãy số phân phối có thể có nhiều Mốt, có thể không có Mốt. Không
nên tính Mốt trong trường hợp dãy số phân phối có nhiều lượng biến có tần số
lớn xấp xỉ nhau (trường hợp có nhiều Mốt).
Chính vì những hạn chế này nên thống kê đã sử dụng một chỉ tiêu khác để bổ sung
cho số bình quân cũng như để khắc phục nhược điểm của Mốt, đó là trung vị.
28 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 1215 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Giáo trình Thống kê học - Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế - xã hội, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hội tụ.
3.2. Số bình quân trong thống kê
Số bình quân biểu hiện mức độ đại biểu cho tất cả các lượng biến theo một tiêu
thức nào đó của các đơn vị cùng loại.
Qua khái niệm trên, có hai vấn đề cần làm rõ như sau:
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
48 v1.0
Theo một tiêu thức: Số bình quân chỉ đại biểu theo
một tiêu thức chứ không theo nhiều tiêu thức của toàn
bộ tổng thể.
Ví dụ: Tiền lương bình quân của công nhân trong
doanh nghiệp A là 2,5 triệu đồng/người/tháng cho
thấy có nhiều tiêu thức khác nhau nhưng trong trường
hợp này: 2,5 triệu đồng là biểu hiện mức độ đại biểu
theo tiêu thức tiền lương.
Các đơn vị cùng loại: Số bình quân được tính ra từ
tổng thể bao gồm một số lớn các đơn vị và phải là tổng thể đồng chất.
Trong thống kê, tuỳ thuộc vào đặc điểm của đối tượng nghiên cứu và điều kiện tài
liệu cho phép mà có thể tính số bình quân bằng các công thức khác nhau. Trong
đó, số bình quân cộng được sử dụng phổ biến nhất.
3.2.1. Số bình quân cộng (Mean)
3.2.1.1. Khái niệm
Số bình quân cộng thực chất là số bình quân được tính theo phương pháp trung bình
cộng trong toán học.
Số bình quân cộng được áp dụng trong trường hợp có sẵn tài liệu về lượng biến tiêu
thức nghiên cứu xi và số lượng đơn vị tương ứng mỗi lượng biến, tức là tần số fi.
Các lượng biến này có mối liên hệ tổng với nhau.
Công thức chung:
Tổng lượng biến của tiêu thức
x =
Tổng số đơn vị của tổng thể
Chú ý
Vì số bình quân mang tính chất đại diện cho tổng thể, nên để số bình quân có tính đại biểu
cao thì cần đảm bảo sao cho số đơn vị tổng thể dùng để tính số bình quân phải đủ lớn.
3.2.1.2. Đặc điểm
Số bình quân cộng san bằng mọi sự chênh lệch về lượng biến của tiêu thức để có
một con số duy nhất đại diện cho tất cả lượng biến của tiêu thức nghiên cứu.
Chịu ảnh hưởng của lượng biến đột xuất trong dãy số. Đây cũng là một nhược
điểm của số bình quân cộng.
3.2.1.3. Tác dụng
Tác dụng của số bình quân cộng:
Dùng để biểu hiện mức độ đại biểu, nêu lên đặc điểm chung nhất của hiện tượng.
Dùng để so sánh các hiện tượng không cùng quy mô.
Ví dụ: Để so sánh giữa các doanh nghiệp không có cùng qui mô, người ta không
thể so sánh lợi nhuận, doanh thu của từng doanh nghiệp mà phải so sánh NSLĐ
bình quân, mức doanh lợi bình quân
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
v1.0 49
Thông qua sự biến động của số bình quân để thấy được xu hướng phát triển của
hiện tượng.
Ví dụ: Thông qua NSLĐ bình quân của doanh nghiệp qua các năm, có thể thấy
được xu hướng phát triển của NSLĐ trong toàn doanh nghiệp.
Dùng để lập kế hoạch, phân tích thống kê.
3.2.1.4. Các loại số bình quân cộng
Số bình quân cộng giản đơn: Áp dụng khi tài liệu thống kê chưa phân tổ hoặc khi
số lần xuất hiện của các lượng biến trong tài liệu là như nhau. Với n lượng biến xi,
ta có công thức tính số bình quân cộng giản đơn như sau:
n
i
i 1
x
x
n
Số bình quân cộng gia quyền: Áp dụng khi tài liệu đã được phân tổ.
o Đối với tài liệu phân tổ không có khoảng cách tổ:
Ứng với mỗi lượng biến xi chúng ta có một tần số fi hay nói cách khác, trong
mỗi tổ (bộ phận) thì mỗi lượng biến xi lặp lại là fi lần. Như vậy, tổng lượng
biến của tiêu thức sẽ là tổng các xifi và tổng số đơn vị của tổng thể sẽ là tổng
các fi. Khi đó, công thức tính số bình quân cộng gia quyền là:
n
i i
1 1 2 2 n n i 1
n
1 2 n
i
i 1
x f
x f x f ... x fx
f f ... f f
Trong đó, fi được gọi là tần số, đóng vai trò là quyền số (đại lượng có mặt ở cả tử
số và mẫu số), nói lên tầm quan trọng của từng lượng biến trong tính số bình quân.
Số bình quân chịu ảnh hưởng bởi lượng biến có tần số lớn nhất hay lượng biến
nào có tần số lớn nhất thì ảnh hưởng nhiều nhất đối với trị số của số bình quân.
Do vậy, số bình quân ở gần lượng biến có tần số lớn nhất.
Với trường hợp bình quân cộng giản đơn, fi đều bằng nhau và bằng 1 nên
không có sự khác biệt giữa các lượng biến đối với trị số của số bình quân.
Ví dụ: Có tài liệu về lương của công nhân trong doanh nghiệp A như sau:
a Lương
(1.000 đồng) xi
Số công nhân
(người) fi di xifi xidi
3.000 15 0,075 45.000 225,0
3.500 30 0,150 105.000 525,0
4.000 45 0,225 180.000 900,0
4.500 55 0,275 247.500 1.237,5
5.000 40 0,200 200.000 1.000,0
5.500 15 0,075 82.500 412,5
Tổng 200 1,000 860.000 4.300,0
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
50 v1.0
Yêu cầu: Tính lương trung bình của công nhân trong doanh nghiệp.
Như vậy, với tài liệu đã phân tổ này, cần phải tính theo công thức bình quân
cộng gia quyền.
Xác định xi, fi:
xi: Lượng biến – là biểu hiện cụ thể bằng số của tiêu thức số lượng. Tiêu
thức đang nghiên cứu là lương công nhân, vậy lượng biến xi là lương.
fi: Tần số – là số đơn vị của tổng thể được sắp xếp vào từng tổ. Ở mỗi mức
lương khác nhau sẽ có số lượng công nhân tương ứng. Vậy, tần số fi là số
công nhân.
Vậy lương trung bình của công nhân trong doanh nghiệp là:
i i
i
x f 860.000x
f 200
4.300 (nghìn đồng)
Nhận xét: Mức lương trung bình của công
nhân trong doanh nghiệp A là 4.300 nghìn
đồng. Ta thấy, kết quả này gần với mức lương
4.500 nghìn đồng, là mức lương có nhiều công
nhân nhận được nhất.
Như chúng ta đã biết, việc tính số bình quân
phụ thuộc vào điều kiện tài liệu cho phép.
Trong trường hợp tài liệu chỉ cung cấp tần suất
di, vậy số bình quân sẽ được tính theo công thức:
i i
i i
i
x f
x x d
f
Nếu tần suất tính bằng đơn vị %:
i ix dx
100
Khi đó, di đóng vai trò là quyền số.
Với ví dụ trên, giả sử không cho số công nhân mà chỉ cho tỷ trọng số công
nhân nhận mức lương đó trong tổng số công nhân, tức chỉ cho tần suất di. Khi
đó, mức lương trung bình của công nhân trong doanh nghiệp được tính:
i ix x d = 4.300 (nghìn đồng)
Kết quả này hoàn toàn trùng khớp với kết quả tính được ở trên. Như vậy, dù
tính theo công thức nào, kết quả số bình quân tính ra đều như nhau.
o Đối với tài liệu phân tổ có khoảng cách tổ: Trong trường hợp này, số bình quân
được tính theo 2 bước.
Bước 1: Tính trị số giữa làm lượng biến đại diện cho từng tổ.
Trị số giữa của từng tổ xi Giới hạn dưới + Giới hạn trên 2
Bước 2: Tính số bình quân theo công thức trung bình cộng gia quyền.
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
v1.0 51
Ví dụ: Có tài liệu về NSLĐ của doanh nghiệp A như sau:
NSLĐ
(triệu đồng) Số công nhân (người) xi xifi
10 – 15 10 12,5 125,0
15 – 20 30 17,5 525,0
20 – 25 45 22,5 1.012,5
25 – 30 80 27,5 2.200,0
30 – 35 30 32,5 975,0
35 – 40 5 37,5 187,5
Tổng 200 5.025,0
Yêu cầu: Tính năng suất lao động trung bình của
công nhân doanh nghiệp A.
Tính trị số giữa xi:
1
10 15x 12,5
2
(triệu đồng)
Năng suất lao động trung bình:
i i
i
x f 5.025x
x 200
25,125 (triệu đồng)
Chú ý
Với trường hợp dãy số có khoảng cách tổ mở, việc tính trị số giữa phải căn cứ vào
khoảng cách tổ liền kề có đầy đủ giới hạn trên và giới hạn dưới để tính.
Số bình quân cộng điều hòa gia quyền
Áp dụng khi biết lượng biến tiêu thức xi và tổng lượng biến tiêu thức từng bộ phận
(từng tổ) Mi = xi fi
Công thức tính bình quân cộng điều hoà gia quyền:
_
i i i i i
i i ii
i i
x f x f M
x x f Mf
x x
Khi đó, Mi đóng vai trò là quyền số.
Số bình quân cộng điều hoà giản đơn được áp dụng khi các Mi bằng nhau và được
tính theo công thức:
i i i i
ii
i
i ii
x f M n M nx M 1 1f M
x xx
Ví dụ: Có hai công nhân cùng sản xuất một loại sản phẩm. Người thứ nhất làm
trong 8 giờ, sản xuất một sản phẩm hết 2 phút. Người thứ hai làm trong 9 giờ, sản
xuất một sản phẩm hết 6 phút. Tính thời gian hao phí bình quân để sản xuất 1 sản
phẩm của hai người nói trên.
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
52 v1.0
Phân tích:
x : Thời gian hao phí bình quân để sản xuất 1 sản phẩm;
xi: Các mức thời gian hao phí để sản xuất 1 sản phẩm;
fi: Số sản phẩm được sản xuất ra của từng người;
Mi: Tổng thời gian lao động của từng người.
Vì 2 người có thời gian lao động khác nhau Mi khác nhau Áp dụng công
thức bình quân cộng điều hòa gia quyền, ta có:
i
i
i
M 8 60 9 60x M 8 60 9 60
2 6x
= 3,09 phút
3.2.1.5. Điều kiện vận dụng số bình quân cộng trong thống kê
Từ đặc điểm cơ bản của số bình quân, có 2 điều kiện khi vận dụng số bình quân cộng
như sau:
Số bình quân cộng phải được tính từ tổng thể đồng chất. Trong tổng thể đồng chất
có sự khác nhau về trị số nên có thể san bằng về mặt lượng. Tổng thể không đồng
chất có sự khác nhau về bản chất nên không thể san bằng được.
Số bình quân chung che lấp sự chênh lệch lượng biến của các bộ phận cấu thành
tổng thể. Do đó, cần vận dụng kết hợp với số bình quân tổ và dãy số phân phối để
có thể giải thích sâu sắc từng khía cạnh, từng bộ phận của hiện tượng.
Số bình quân cộng được tính khi giữa các lượng biến có quan hệ tổng. Tuy nhiên
trong thực tế, có những lượng biến không thể cộng với nhau, ví dụ như tốc độ phát
triển, vậy sẽ tính số bình quân như thế nào?
3.2.2. Số bình quân nhân
3.2.2.1. Điều kiện vận dụng số bình quân nhân trong thống kê
Số bình quân nhân là số bình quân được tính theo phương pháp trung bình nhân trong
toán học.
Điều kiện vận dụng số bình quân nhân:
Số bình quân nhân vận dụng khi các lượng biến trong dãy số có quan hệ tích,
thông thường để tính tốc độ phát triển bình quân.
Số bình quân nhân cũng có đặc điểm như số bình quân cộng là san bằng chênh
lệch giữa các lượng biến và chịu ảnh hưởng của lượng biến đột xuất, số bình quân
nhân cũng phải được tính ra từ tổng thể đồng chất. Khi phân tích cũng nên kết hợp
với các số bình quân tổ để có được kết quả tốt nhất.
3.2.2.2. Các loại số bình quân nhân
Căn cứ vào vai trò đóng góp khác nhau của các thành phần tham gia bình quân hóa, có
2 loại số bình quân nhân:
Số bình quân nhân giản đơn: vận dụng khi các tần số fi bằng nhau.
n
nn
1 2 n ii 1
x x x ...x x
Số bình quân nhân gia quyền: vận dụng khi các tần số fi khác nhau.
xi được lặp lại fi lần ifix
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
v1.0 53
i i1 2 n i
nf ff f f f
ii 1
x x x ...x x
Ví dụ: Khi nghiên cứu về chỉ tiêu doanh thu của doanh nghiệp A trong 10 năm,
người ta nhận thấy:
5 năm có tốc độ phát triển hàng năm là 110%.
2 năm có tốc độ phát triển hàng năm là 125%.
3 năm có tốc độ phát triển hàng năm là 115%.
Yêu cầu: Tính tốc độ phát triển bình quân hàng năm
trong giai đoạn 10 năm nói trên của chỉ tiêu doanh thu
của doanh nghiệp A.
Phân tích:
xi: Tốc độ phát triển. Các xi có quan hệ tích số nên nếu
nhân lại với nhau sẽ tính được tốc độ phát triển doanh
thu của doanh nghiệp năm thứ 10 so với năm đầu tiên.
fi: Thời gian.
Tốc độ phát triển bình quân hàng năm được tính theo công thức:
i i
nf f 5 2 310
ii 1
x x 1,1 1,25 1,15 1,1436
lần (114,36%)
Vậy, trong 10 năm tốc độ phát triển bình quân doanh thu của doanh nghiệp A là
114,36%.
Trong một số trường hợp như tổng thể là tiềm ẩn, hoặc phức tạp không xác định
được quy mô điều tra thì sẽ không áp dụng được số bình quân cộng hay nhân mà chúng
ta phải dùng các mức độ khác để tính toán thay thế. Các mức độ đó chính là trung vị và mốt.
3.2.3. Mốt (Mode)
3.2.3.1. Khái niệm
Mốt là biểu hiện của một tiêu thức phổ biến nhất hay được gặp nhiều nhất trong tổng
thể hay trong 1 dãy số phân phối. Vì mốt là biểu hiện của tiêu thức được gặp nhiều
nhất nên nó có tần số fi lớn nhất.
3.2.3.2. Cách tính mốt
Đối với dãy số không có khoảng cách tổ: Mốt là lượng biến xi có tần số fi lớn nhất.
Ví dụ: Xem ví dụ về tiền lương công nhân ở trên (Phần 3.2.1.4 – Các loại số bình
quân cộng).
fi max = 55 ứng với lượng biến 4.500 nghìn đồng.
Vậy, M0 = 4.500 nghìn đồng là mức lương nhiều công nhân trong doanh nghiệp
nhận được nhất.
Đối với dãy số có khoảng cách tổ bằng nhau: Mốt được xác định theo 2 bước:
o Bước 1: Xác định tổ có Mốt – là tổ có tần số lớn nhất.
o Bước 2: Tính trị số gần đúng của Mốt:
0 0
0 0
0 0 0 0
M M 1
0 M min M
M M 1 M M 1
f f
M x h
(f f ) (f f )
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
54 v1.0
Trong đó:
0M min
x : Giới hạn dưới của tổ có Mốt.
0M
h : Khoảng cách tổ của tổ có Mốt.
oM
f : Tần số của tổ có Mốt.
oM 1
f : Tần số của tổ đứng liền trước tổ có Mốt.
oM 1
f : Tần số của tổ đứng liền sau tổ có Mốt.
Ví dụ: Từ tài liệu về NSLĐ của 200 công nhân trong doanh nghiệp A.
Xác định tổ có M0: Tổ (25 – 30) là tổ có M0 vì có tần số lớn nhất. Tính M0.
0
80 45M 25 5
80 45 80 30
= 27,06 (triệu đồng)
Đối với dãy số có khoảng cách tổ không bằng nhau: với trường hợp này, việc
xác định Mốt phải căn cứ vào mật độ phân phối.
i
i
i
fm
h
Vì các khoảng cách tổ khác nhau nên tổ chứa Mốt sẽ là tổ có mi max. Cần phải
thêm cột vào bảng tính để xác định tổ chứa Mốt và tính giá trị của Mốt tương tự
theo công thức trên, nhưng thay các f bằng các m.
3.2.3.3. Tác dụng
Mốt biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng
hay bù trừ chênh lệch giữa các lượng biến (khác x ), nó có thể bổ sung hay thay
thế cho số trung bình cộng trong trường hợp việc tính số trung bình gặp khó khăn.
Mốt bảo đảm ý nghĩa kinh tế hơn các tính toán khác khi có lượng biến đột xuất vì
nó không chịu ảnh hưởng của lượng biến đột xuất.
Mốt là một trong những tham số nêu lên đặc trưng phân phối của dãy số.
Mốt sử dụng trong bài toán lý thuyết phục vụ đám đông: trong kinh doanh, chọn
loại nào, màu sắc, kiểu cỡ nào phù hợp nhất và vừa ý nhất với số đông để sản xuất
nhiều, đáp ứng nhu cầu khách hàng.
3.2.3.4. Ưu, nhược điểm của Mốt
Ưu điểm:
o Mốt không thay đổi đối với những lượng biến đột xuất.
o Mốt có thể được tính ra từ cả tiêu thức thuộc tính và tiêu thức số lượng.
Hạn chế:
o Mốt kém nhạy bén với sự biến thiên của tiêu thức: Chỉ quan tâm tới lượng biến
có tần số lớn nhất mà không quan tâm tới các lượng biến khác.
o Đối với 1 dãy số phân phối có thể có nhiều Mốt, có thể không có Mốt. Không
nên tính Mốt trong trường hợp dãy số phân phối có nhiều lượng biến có tần số
lớn xấp xỉ nhau (trường hợp có nhiều Mốt).
Chính vì những hạn chế này nên thống kê đã sử dụng một chỉ tiêu khác để bổ sung
cho số bình quân cũng như để khắc phục nhược điểm của Mốt, đó là trung vị.
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
v1.0 55
3.2.4. Trung vị (Median)
3.2.4.1. Khái niệm
Trung vị là lượng biến của đơn vị đứng ở vị trí chính
giữa trong dãy số lượng biến, chia dãy số thành hai
phần bằng nhau.
Như vậy, từ khái niệm trên có 3 vấn đề cần làm rõ:
Thứ nhất, trung vị là lượng biến chứ không phải
là vị trí. Vì là lượng biến nên trung vị chỉ được
tính ra từ tiêu thức số lượng.
Thứ hai, trung vị là lượng biến của đơn vị ở vị trí giữa. Vậy đơn vị nào ở giữa?
o Nếu số đơn vị tổng thể lẻ (n = 2m + 1), vị trí giữa là đơn vị thứ m + 1.
o Nếu số đơn vị tổng thể chẵn (n = 2m), vị trí giữa là 2 đơn vị m và m + 1.
Thứ ba, vị trí giữa ở đây là trong dãy số lượng biến chứ không phải trong dãy số
bất kỳ. Vì vậy, trước khi tính trung vị, ta phải sắp xếp các lượng biến theo thứ tự
(từ lượng biến nhỏ nhất xmin tới lượng biến lớn nhất xmax hay ngược lại).
3.2.4.2. Cách tính trung vị
Đối với dãy số không có khoảng cách tổ: Me là lượng biến của đơn vị đứng ở vị
trí giữa.
o Nếu số đơn vị tổng thể lẻ: ∑f = 2m + 1, Me = xm + 1, là lượng biến của đơn vị
thứ m + 1.
o Nếu số đơn vị tổng thể chẵn: ∑f = 2m, m m 1e x xM 2
, là trung bình cộng 2
lượng biến của 2 đơn vị thứ m và m + 1.
Ví dụ: Xét ví dụ về lương của công nhân doanh nghiệp A ở trên.
Lương
(1.000 đồng) xi
Số công nhân
(người) fi Tần số tích luỹ Si
3.000 15 15
3.500 30 45
4.000 45 90
4.500 55 145
5.000 40 185
5.500 15 200
Tổng 200
Dãy số lượng biến có ∑f = 200 = 2m. Vậy m = 100.
Vậy trung vị là trung bình cộng của hai lượng biến đứng ở vị trí thứ 100 và 101.
Để xác định giá trị của hai đơn vị thứ 100 và 101 ta phải dựa vào tần số
tích luỹ. Nhìn vào bảng tính tần số tích luỹ ở trên, ta thấy, hai đơn vị thứ 100
và 101 nằm ở tổ thứ tư và có lượng biến là 4.500 nghìn đồng. Nghĩa là,
x100 = x101 = 4.500 (nghìn đồng). Khi đó:
m m 1
e
x x 4.500 4.500M 4.500
2 2
(nghìn đồng)
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
56 v1.0
Trung vị của dãy số lượng biến trên là 4.500 nghìn đồng. Điều này có nghĩa là
50% số công nhân nhận mức lương từ 4.500 nghìn đồng trở xuống và 50% số
công nhân nhận mức lương từ 4.500 nghìn đồng trở lên.
Đối với dãy số có khoảng cách tổ: Me được xác định theo 2 bước.
o Bước 1: Xác định tổ có trung vị, là tổ chứa lượng biến của đơn vị đứng ở vị trí giữa.
o Bước 2: Tính trị số gần đúng của trung vị.
e
e e
e
i
M 1
e M min M
M
f
S
2M x h
f
Trong đó:
eM min
x : Giới hạn dưới của tổ có trung vị.
eM
h : Khoảng cách tổ của tổ có trung vị.
eM 1
S : Tần số tích lũy của tổ đứng liền trước tổ có trung vị.
eM
f : Tần số của tổ có trung vị.
Ví dụ: Xét ví dụ về NSLĐ ở trên.
NSLĐ
(triệu đồng)
Số công nhân
(người) Si
10 – 15 10 10
15 – 20 30 40
20 – 25 45 85
25 – 30 80 165
30 – 35 30 195
35 – 40 5 200
Tổng 200
Tổ 25 – 30 là tổ có Me vì nó chứa lượng biến của 2 vị trí ở giữa 100 và 101 dựa
theo tần số tích lũy Si, ta có:
e
200 85
2M 25 5
80
25,94 (triệu đồng)
Kết quả tính trung vị ở trên cho biết, có 50% số công nhân có NSLĐ từ 25,94 triệu
đồng trở xuống và 50% số công nhân có NSLĐ từ 25,94 triệu đồng trở lên.
Chú ý
Vì là tham số đặc trưng nên trung vị, mốt và số bình quân không nhất thiết phải bằng 1
lượng biến cụ thể nào.
3.2.4.3. Tác dụng
Me biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng
hay bù trừ chênh lệch giữa các lượng biến (khác x ). Do đó, nó có thể bổ sung hay
thay thế cho số trung bình cộng khi việc tính số trung bình gặp khó khăn. Bên cạnh
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
v1.0 57
đó, Me không chịu ảnh hưởng của lượng biến đột xuất (lượng biến quá nhỏ hay
quá lớn).
Dựa vào tính chất toán học đáng chú ý của Me: Tổng các chênh lệch tuyệt đối giữa
các lượng biến với Me là trị số nhỏ nhất so với M0, x để ứng dụng trong công tác
kỹ thuật và phục vụ công cộng ở nơi thuận lợi, phục vụ được nhiều người nhất.
i ex M min
Cùng với x và M0, Me là một trong những tham số nêu lên đặc trưng phân phối của
dãy số.
x x x
f f f
xxx > Me > M0< Me < M0= Me = M0
Đối xứng
(phân phối chuẩn)
Lệch trái
(phân phối âm)
Lệch phải
(phân phối dương)
Xác định được M0 trước tiên vì đây là lượng biến tương ứng với tần số lớn nhất.
Me và x nằm ở đâu sẽ quyết định hình dáng của phân phối. Trong phân phối
chuẩn, Me luôn nằm giữa x và M0. Mặt khác, tổ chứa Mốt sẽ là tổ chứa Me.
Vì vậy, trong tính toán chỉ cần tìm tổ chứa M0 là có thể suy ra tổ chứa Me mà
không cần tìm Si.
o x = Me = M0: Dãy số có phân phối chuẩn đối xứng.
o x < Me < M0: Dãy số có phân phối lệch trái, số đơn vị có lượng biến lớn hơn
số trung bình chiếm đa số.
o x > Me > M0: Dãy số có phân phối lệch phải, số đơn vị có lượng biến nhỏ hơn
số trung bình chiếm đa số.
3.2.4.4. Một số phân vị thường dùng
Như trên đã trình bày, trung vị chia dãy số phân phối thành 2 phần bằng nhau: 50%
các đơn vị ở dưới và 50% các đơn vị ở trên. Tuy nhiên, trong nghiên cứu thống kê, tuỳ
theo mục đích nghiên cứu khác nhau, người ta còn có thể chia dãy số phân phối hay
tổng thể thành những phần nhỏ hơn bằng nhau. Các phần này được gọi là các phân vị.
Trong thống kê, người ta thường hay sử dụng tứ phân vị: chia tổng thể thành 4 phần
bằng nhau, ngũ phân vị: chia thành 5 phần bằng nhau, thập phân vị: 10 phần bằng
nhau hay bách phân vị: chia tổng thể thành 100 phần bằng nhau,... trong đó tứ phân vị
là phổ biến nhất.
Với tứ phân vị, người ta chia tập hợp số liệu thành 4 phần bằng nhau. Khi đó, chúng ta
sẽ xác định được 3 phân vị Q1, Q2 và Q3. Với tứ phân vị đầu tiên Q1, ta sẽ có 25%
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
58 v1.0
số đơn vị có lượng biến từ Q1 trở xuống và 75% số đơn vị có lượng biến từ Q1 trở lên.
Tứ phân vị thứ hai Q2 là trung vị của dãy số, chia dãy số thành hai phần 50% bằng
nhau. Còn tứ phân vị cuối cùng Q3 chia dãy số thành 75% số đơn vị có lượng biến từ
Q3 trở xuống và 25% số đơn vị có lượng biến từ Q3 trở lên.
Ví dụ: Có tài liệu thu thập được về số giờ ngồi máy tính trung bình trong tuần của 20
sinh viên như sau:
25 41 27 32 43
66 35 31 15 5
34 26 32 38 16
30 38 30 20 21
Hãy xác định tứ phân vị cho bộ số liệu trên.
Để xác định tứ phân vị, trước hết chúng ta phải sắp xếp lại số liệu theo thứ tự tăng
dần. Sau đó chia số liệu thành 4 phần bằng nhau và tính các phân vị Q1, Q2 và Q3.
Kết quả như sau:
5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 38 38 41 43 66
Nhóm thứ nhất Nhóm thứ hai Nhóm thứ ba Nhóm thứ tư
Tứ phân vị thứ nhất: 1 21 25Q 23,02
(giờ)
Tứ phân vị thứ hai: 2 30 31Q 30,52
(giờ)
Tứ phân vị thứ ba: 3 35 38Q 36,52
(giờ)
Như vậy, có 25% số sinh viên nói trên có số giờ ngồi máy tính trung bình một tuần ít
hơn 23,0 giờ, 25% số sinh viên có số giờ ngồi máy tính trong tuần từ 23,0 đến 30,5
giờ, 25% trong khoảng 30,5 đến 36,5 giờ và 25% còn lại có số giờ ngồi máy tính trong
tuần lớn hơn 36,5 giờ.
3.3. Các tham số đo độ biến thiên của tiêu thức
Ý nghĩa của các tham số đo độ biến thiên hay độ phân
tán của tiêu thức (dispersion):
Giúp đánh giá trình độ đại biểu của số bình quân: nếu
độ biến thiên thấp, trình độ đại biểu của số bình quân
cao và ngược lại.
Quan sát độ biến thiên của tiêu thức trong 1 dãy số
lượng biến cho thấy đặc trưng về phân phối, kết cấu
và tính đồng đều của tổng thể.
Độ biến thiên của tiêu thức thường được dùng trong
nhiều trường hợp nghiên cứu thống kê: phân tích biến
động, mối liên hệ trong điều tra, dự đoán...
Q1 Q2 Q3
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
v1.0 59
Ví dụ: Số liệu năng suất lao động của 5 công nhân trong 2 tổ sản xuất như sau:
Sản phẩm/1 công nhân
NSLĐA NSLĐB
40 58
50 59
60 60
70 61
80 62
Khi so sánh Ax và Bx ở 2 tổ, ta thấy Ax = Bx = 60 sản phẩm/1 công nhân. Như vậy,
NSLĐ bình quân của công nhân 2 tổ sản xuất là như nhau nhưng tính đại biểu của Bx
cao hơn vì độ biến thiên trong NSLĐ của 5 công nhân ở tổ sản xuất B ít hơn.
Để đưa ra kết luận đúng đắn cho các hiện tượng, người ta cần so sánh cả độ biến
thiên của tiêu thức. Có 5 tham số sau:
3.3.1. Khoảng biến thiên (range)
Khái niệm: Khoảng biến thiên là độ lệch giữa lượng biến lớn nhất và lượng biến
nhỏ nhất của tiêu thức nghiên cứu.
R = xmax – xmin
Ví dụ: Với số liệu ở trên R1 > R2 nên độ biến thiên (phân tán) về NSLĐ tổ 1 lớn
hơn tổ 2, vì vậy tính chất đại diện của số bình quân tổ 1 kém hơn tổ 2.
Ưu điểm: Dễ tính.
Hạn chế: Chỉ tính đến lượng biến đầu và cuối, như vậy sẽ không chính xác nếu có
lượng biến đột xuất, làm sai bản chất của hiện tượng.
Để khắc phục nhược điểm trên, người ta sử dụng tham số dưới đây.
3.3.2. Độ lệch tuyệt đối bình quân (mean absolute deviation - MAD)
Khái niệm: Độ lệch tuyệt đối bình quân là số bình quân cộng của các độ lệch
tuyệt đối giữa lượng biến và số bình quân cộng của các lượng biến đó.
Công thức:
o Giản đơn: ix xd
n
o Gia quyền: i i
i
x x f
d
f
Trong công thức này, người ta phải lấy giá trị tuyệt đối vì ∑(xi – x ) = 0.
Độ lệch tuyệt đối bình quân càng lớn, độ biến thiên càng lớn.
Ưu điểm: Đo được tất cả các độ lệch bên trong lượng biến, do đó nó rất có ý nghĩa
khi dùng phân tích chất lượng sản phẩm để xét độ đồng đều.
Hạn chế: Chỉ tính giá trị tuyệt đối của độ lệch giữa các lượng biến với số trung
bình các lượng biến đó.
Để khắc phục hạn chế về giá trị tuyệt đối của độ lệch, người ta tính tham số thứ ba.
Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội
60 v1.0
3.3.3. Phương sai (Variance)
Khái niệm: Phương sai là bình quân cộng của bình phương các độ lệch giữa các
lượng biến với số bình quân cộng của các lượng biến đó.
Công thức:
o Giản đơn: 2i2 x x
n
= 22i ix x
n n
= 22x x
o Gia quyền: 2i i2
i
x x f
f
=
22
i i i i
i i
x f x f
f f
=
22x x
Ưu điểm: Khắc phục được sự khác nhau về dấu của độ lệch.
Hạn chế: Vì là bình phương các độ lệch nên trị số bị khuếch đại và không có đơn
vị tính phù hợp.
Tham số thứ t
Các file đính kèm theo tài liệu này:
- bai_giang_thong_ke_hoc_bai_3_nghien_cuu_thong_ke_cac_muc_do.pdf