Giáo trình Thống kê học - Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế - xã hội

Tác dụng

 Mốt biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng

hay bù trừ chênh lệch giữa các lượng biến (khác x ), nó có thể bổ sung hay thay

thế cho số trung bình cộng trong trường hợp việc tính số trung bình gặp khó khăn.

 Mốt bảo đảm ý nghĩa kinh tế hơn các tính toán khác khi có lượng biến đột xuất vì

nó không chịu ảnh hưởng của lượng biến đột xuất.

 Mốt là một trong những tham số nêu lên đặc trưng phân phối của dãy số.

 Mốt sử dụng trong bài toán lý thuyết phục vụ đám đông: trong kinh doanh, chọn

loại nào, màu sắc, kiểu cỡ nào phù hợp nhất và vừa ý nhất với số đông để sản xuất

nhiều, đáp ứng nhu cầu khách hàng.

Ưu, nhược điểm của Mốt

 Ưu điểm:

o Mốt không thay đổi đối với những lượng biến đột xuất.

o Mốt có thể được tính ra từ cả tiêu thức thuộc tính và tiêu thức số lượng.

 Hạn chế:

o Mốt kém nhạy bén với sự biến thiên của tiêu thức: Chỉ quan tâm tới lượng biến

có tần số lớn nhất mà không quan tâm tới các lượng biến khác.

o Đối với 1 dãy số phân phối có thể có nhiều Mốt, có thể không có Mốt. Không

nên tính Mốt trong trường hợp dãy số phân phối có nhiều lượng biến có tần số

lớn xấp xỉ nhau (trường hợp có nhiều Mốt).

Chính vì những hạn chế này nên thống kê đã sử dụng một chỉ tiêu khác để bổ sung

cho số bình quân cũng như để khắc phục nhược điểm của Mốt, đó là trung vị.

pdf28 trang | Chia sẻ: trungkhoi17 | Lượt xem: 957 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Giáo trình Thống kê học - Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế - xã hội, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hội tụ. 3.2. Số bình quân trong thống kê Số bình quân biểu hiện mức độ đại biểu cho tất cả các lượng biến theo một tiêu thức nào đó của các đơn vị cùng loại. Qua khái niệm trên, có hai vấn đề cần làm rõ như sau: Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội 48 v1.0  Theo một tiêu thức: Số bình quân chỉ đại biểu theo một tiêu thức chứ không theo nhiều tiêu thức của toàn bộ tổng thể. Ví dụ: Tiền lương bình quân của công nhân trong doanh nghiệp A là 2,5 triệu đồng/người/tháng cho thấy có nhiều tiêu thức khác nhau nhưng trong trường hợp này: 2,5 triệu đồng là biểu hiện mức độ đại biểu theo tiêu thức tiền lương.  Các đơn vị cùng loại: Số bình quân được tính ra từ tổng thể bao gồm một số lớn các đơn vị và phải là tổng thể đồng chất. Trong thống kê, tuỳ thuộc vào đặc điểm của đối tượng nghiên cứu và điều kiện tài liệu cho phép mà có thể tính số bình quân bằng các công thức khác nhau. Trong đó, số bình quân cộng được sử dụng phổ biến nhất. 3.2.1. Số bình quân cộng (Mean) 3.2.1.1. Khái niệm Số bình quân cộng thực chất là số bình quân được tính theo phương pháp trung bình cộng trong toán học. Số bình quân cộng được áp dụng trong trường hợp có sẵn tài liệu về lượng biến tiêu thức nghiên cứu xi và số lượng đơn vị tương ứng mỗi lượng biến, tức là tần số fi. Các lượng biến này có mối liên hệ tổng với nhau. Công thức chung: Tổng lượng biến của tiêu thức x = Tổng số đơn vị của tổng thể Chú ý Vì số bình quân mang tính chất đại diện cho tổng thể, nên để số bình quân có tính đại biểu cao thì cần đảm bảo sao cho số đơn vị tổng thể dùng để tính số bình quân phải đủ lớn. 3.2.1.2. Đặc điểm  Số bình quân cộng san bằng mọi sự chênh lệch về lượng biến của tiêu thức để có một con số duy nhất đại diện cho tất cả lượng biến của tiêu thức nghiên cứu.  Chịu ảnh hưởng của lượng biến đột xuất trong dãy số. Đây cũng là một nhược điểm của số bình quân cộng. 3.2.1.3. Tác dụng Tác dụng của số bình quân cộng:  Dùng để biểu hiện mức độ đại biểu, nêu lên đặc điểm chung nhất của hiện tượng.  Dùng để so sánh các hiện tượng không cùng quy mô. Ví dụ: Để so sánh giữa các doanh nghiệp không có cùng qui mô, người ta không thể so sánh lợi nhuận, doanh thu của từng doanh nghiệp mà phải so sánh NSLĐ bình quân, mức doanh lợi bình quân Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội v1.0 49  Thông qua sự biến động của số bình quân để thấy được xu hướng phát triển của hiện tượng. Ví dụ: Thông qua NSLĐ bình quân của doanh nghiệp qua các năm, có thể thấy được xu hướng phát triển của NSLĐ trong toàn doanh nghiệp.  Dùng để lập kế hoạch, phân tích thống kê. 3.2.1.4. Các loại số bình quân cộng  Số bình quân cộng giản đơn: Áp dụng khi tài liệu thống kê chưa phân tổ hoặc khi số lần xuất hiện của các lượng biến trong tài liệu là như nhau. Với n lượng biến xi, ta có công thức tính số bình quân cộng giản đơn như sau: n i i 1 x x n    Số bình quân cộng gia quyền: Áp dụng khi tài liệu đã được phân tổ. o Đối với tài liệu phân tổ không có khoảng cách tổ: Ứng với mỗi lượng biến xi chúng ta có một tần số fi hay nói cách khác, trong mỗi tổ (bộ phận) thì mỗi lượng biến xi lặp lại là fi lần. Như vậy, tổng lượng biến của tiêu thức sẽ là tổng các xifi và tổng số đơn vị của tổng thể sẽ là tổng các fi. Khi đó, công thức tính số bình quân cộng gia quyền là: n i i 1 1 2 2 n n i 1 n 1 2 n i i 1 x f x f x f ... x fx f f ... f f           Trong đó, fi được gọi là tần số, đóng vai trò là quyền số (đại lượng có mặt ở cả tử số và mẫu số), nói lên tầm quan trọng của từng lượng biến trong tính số bình quân. Số bình quân chịu ảnh hưởng bởi lượng biến có tần số lớn nhất hay lượng biến nào có tần số lớn nhất thì ảnh hưởng nhiều nhất đối với trị số của số bình quân. Do vậy, số bình quân ở gần lượng biến có tần số lớn nhất. Với trường hợp bình quân cộng giản đơn, fi đều bằng nhau và bằng 1 nên không có sự khác biệt giữa các lượng biến đối với trị số của số bình quân. Ví dụ: Có tài liệu về lương của công nhân trong doanh nghiệp A như sau: a Lương (1.000 đồng) xi Số công nhân (người) fi di xifi xidi 3.000 15 0,075 45.000 225,0 3.500 30 0,150 105.000 525,0 4.000 45 0,225 180.000 900,0 4.500 55 0,275 247.500 1.237,5 5.000 40 0,200 200.000 1.000,0 5.500 15 0,075 82.500 412,5 Tổng 200 1,000 860.000 4.300,0 Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội 50 v1.0 Yêu cầu: Tính lương trung bình của công nhân trong doanh nghiệp. Như vậy, với tài liệu đã phân tổ này, cần phải tính theo công thức bình quân cộng gia quyền. Xác định xi, fi:  xi: Lượng biến – là biểu hiện cụ thể bằng số của tiêu thức số lượng. Tiêu thức đang nghiên cứu là lương công nhân, vậy lượng biến xi là lương.  fi: Tần số – là số đơn vị của tổng thể được sắp xếp vào từng tổ. Ở mỗi mức lương khác nhau sẽ có số lượng công nhân tương ứng. Vậy, tần số fi là số công nhân. Vậy lương trung bình của công nhân trong doanh nghiệp là: i i i x f 860.000x f 200    4.300 (nghìn đồng) Nhận xét: Mức lương trung bình của công nhân trong doanh nghiệp A là 4.300 nghìn đồng. Ta thấy, kết quả này gần với mức lương 4.500 nghìn đồng, là mức lương có nhiều công nhân nhận được nhất. Như chúng ta đã biết, việc tính số bình quân phụ thuộc vào điều kiện tài liệu cho phép. Trong trường hợp tài liệu chỉ cung cấp tần suất di, vậy số bình quân sẽ được tính theo công thức: i i i i i x f x x d f    Nếu tần suất tính bằng đơn vị %: i ix dx 100  Khi đó, di đóng vai trò là quyền số. Với ví dụ trên, giả sử không cho số công nhân mà chỉ cho tỷ trọng số công nhân nhận mức lương đó trong tổng số công nhân, tức chỉ cho tần suất di. Khi đó, mức lương trung bình của công nhân trong doanh nghiệp được tính: i ix x d = 4.300 (nghìn đồng) Kết quả này hoàn toàn trùng khớp với kết quả tính được ở trên. Như vậy, dù tính theo công thức nào, kết quả số bình quân tính ra đều như nhau. o Đối với tài liệu phân tổ có khoảng cách tổ: Trong trường hợp này, số bình quân được tính theo 2 bước. Bước 1: Tính trị số giữa làm lượng biến đại diện cho từng tổ. Trị số giữa của từng tổ xi Giới hạn dưới + Giới hạn trên 2 Bước 2: Tính số bình quân theo công thức trung bình cộng gia quyền. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội v1.0 51 Ví dụ: Có tài liệu về NSLĐ của doanh nghiệp A như sau: NSLĐ (triệu đồng) Số công nhân (người) xi xifi 10 – 15 10 12,5 125,0 15 – 20 30 17,5 525,0 20 – 25 45 22,5 1.012,5 25 – 30 80 27,5 2.200,0 30 – 35 30 32,5 975,0 35 – 40 5 37,5 187,5 Tổng 200 5.025,0 Yêu cầu: Tính năng suất lao động trung bình của công nhân doanh nghiệp A.  Tính trị số giữa xi: 1 10 15x 12,5 2   (triệu đồng)  Năng suất lao động trung bình: i i i x f 5.025x x 200    25,125 (triệu đồng) Chú ý Với trường hợp dãy số có khoảng cách tổ mở, việc tính trị số giữa phải căn cứ vào khoảng cách tổ liền kề có đầy đủ giới hạn trên và giới hạn dưới để tính.  Số bình quân cộng điều hòa gia quyền Áp dụng khi biết lượng biến tiêu thức xi và tổng lượng biến tiêu thức từng bộ phận (từng tổ) Mi = xi  fi Công thức tính bình quân cộng điều hoà gia quyền: _ i i i i i i i ii i i x f x f M x x f Mf x x        Khi đó, Mi đóng vai trò là quyền số. Số bình quân cộng điều hoà giản đơn được áp dụng khi các Mi bằng nhau và được tính theo công thức: i i i i ii i i ii x f M n M nx M 1 1f M x xx        Ví dụ: Có hai công nhân cùng sản xuất một loại sản phẩm. Người thứ nhất làm trong 8 giờ, sản xuất một sản phẩm hết 2 phút. Người thứ hai làm trong 9 giờ, sản xuất một sản phẩm hết 6 phút. Tính thời gian hao phí bình quân để sản xuất 1 sản phẩm của hai người nói trên. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội 52 v1.0 Phân tích: x : Thời gian hao phí bình quân để sản xuất 1 sản phẩm; xi: Các mức thời gian hao phí để sản xuất 1 sản phẩm; fi: Số sản phẩm được sản xuất ra của từng người; Mi: Tổng thời gian lao động của từng người. Vì 2 người có thời gian lao động khác nhau  Mi khác nhau  Áp dụng công thức bình quân cộng điều hòa gia quyền, ta có: i i i M 8 60 9 60x M 8 60 9 60 2 6x         = 3,09 phút 3.2.1.5. Điều kiện vận dụng số bình quân cộng trong thống kê Từ đặc điểm cơ bản của số bình quân, có 2 điều kiện khi vận dụng số bình quân cộng như sau:  Số bình quân cộng phải được tính từ tổng thể đồng chất. Trong tổng thể đồng chất có sự khác nhau về trị số nên có thể san bằng về mặt lượng. Tổng thể không đồng chất có sự khác nhau về bản chất nên không thể san bằng được.  Số bình quân chung che lấp sự chênh lệch lượng biến của các bộ phận cấu thành tổng thể. Do đó, cần vận dụng kết hợp với số bình quân tổ và dãy số phân phối để có thể giải thích sâu sắc từng khía cạnh, từng bộ phận của hiện tượng. Số bình quân cộng được tính khi giữa các lượng biến có quan hệ tổng. Tuy nhiên trong thực tế, có những lượng biến không thể cộng với nhau, ví dụ như tốc độ phát triển, vậy sẽ tính số bình quân như thế nào? 3.2.2. Số bình quân nhân 3.2.2.1. Điều kiện vận dụng số bình quân nhân trong thống kê Số bình quân nhân là số bình quân được tính theo phương pháp trung bình nhân trong toán học. Điều kiện vận dụng số bình quân nhân:  Số bình quân nhân vận dụng khi các lượng biến trong dãy số có quan hệ tích, thông thường để tính tốc độ phát triển bình quân.  Số bình quân nhân cũng có đặc điểm như số bình quân cộng là san bằng chênh lệch giữa các lượng biến và chịu ảnh hưởng của lượng biến đột xuất, số bình quân nhân cũng phải được tính ra từ tổng thể đồng chất. Khi phân tích cũng nên kết hợp với các số bình quân tổ để có được kết quả tốt nhất. 3.2.2.2. Các loại số bình quân nhân Căn cứ vào vai trò đóng góp khác nhau của các thành phần tham gia bình quân hóa, có 2 loại số bình quân nhân:  Số bình quân nhân giản đơn: vận dụng khi các tần số fi bằng nhau. n nn 1 2 n ii 1 x x x ...x x    Số bình quân nhân gia quyền: vận dụng khi các tần số fi khác nhau. xi được lặp lại fi lần  ifix Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội v1.0 53 i i1 2 n i nf ff f f f ii 1 x x x ...x x     Ví dụ: Khi nghiên cứu về chỉ tiêu doanh thu của doanh nghiệp A trong 10 năm, người ta nhận thấy: 5 năm có tốc độ phát triển hàng năm là 110%. 2 năm có tốc độ phát triển hàng năm là 125%. 3 năm có tốc độ phát triển hàng năm là 115%. Yêu cầu: Tính tốc độ phát triển bình quân hàng năm trong giai đoạn 10 năm nói trên của chỉ tiêu doanh thu của doanh nghiệp A. Phân tích: xi: Tốc độ phát triển. Các xi có quan hệ tích số nên nếu nhân lại với nhau sẽ tính được tốc độ phát triển doanh thu của doanh nghiệp năm thứ 10 so với năm đầu tiên. fi: Thời gian. Tốc độ phát triển bình quân hàng năm được tính theo công thức: i i nf f 5 2 310 ii 1 x x 1,1 1,25 1,15 1,1436       lần (114,36%) Vậy, trong 10 năm tốc độ phát triển bình quân doanh thu của doanh nghiệp A là 114,36%. Trong một số trường hợp như tổng thể là tiềm ẩn, hoặc phức tạp không xác định được quy mô điều tra thì sẽ không áp dụng được số bình quân cộng hay nhân mà chúng ta phải dùng các mức độ khác để tính toán thay thế. Các mức độ đó chính là trung vị và mốt. 3.2.3. Mốt (Mode) 3.2.3.1. Khái niệm Mốt là biểu hiện của một tiêu thức phổ biến nhất hay được gặp nhiều nhất trong tổng thể hay trong 1 dãy số phân phối. Vì mốt là biểu hiện của tiêu thức được gặp nhiều nhất nên nó có tần số fi lớn nhất. 3.2.3.2. Cách tính mốt  Đối với dãy số không có khoảng cách tổ: Mốt là lượng biến xi có tần số fi lớn nhất. Ví dụ: Xem ví dụ về tiền lương công nhân ở trên (Phần 3.2.1.4 – Các loại số bình quân cộng). fi max = 55 ứng với lượng biến 4.500 nghìn đồng. Vậy, M0 = 4.500 nghìn đồng là mức lương nhiều công nhân trong doanh nghiệp nhận được nhất.  Đối với dãy số có khoảng cách tổ bằng nhau: Mốt được xác định theo 2 bước: o Bước 1: Xác định tổ có Mốt – là tổ có tần số lớn nhất. o Bước 2: Tính trị số gần đúng của Mốt: 0 0 0 0 0 0 0 0 M M 1 0 M min M M M 1 M M 1 f f M x h (f f ) (f f )         Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội 54 v1.0 Trong đó: 0M min x : Giới hạn dưới của tổ có Mốt. 0M h : Khoảng cách tổ của tổ có Mốt. oM f : Tần số của tổ có Mốt. oM 1 f  : Tần số của tổ đứng liền trước tổ có Mốt. oM 1 f  : Tần số của tổ đứng liền sau tổ có Mốt. Ví dụ: Từ tài liệu về NSLĐ của 200 công nhân trong doanh nghiệp A. Xác định tổ có M0: Tổ (25 – 30) là tổ có M0 vì có tần số lớn nhất. Tính M0. 0 80 45M 25 5 80 45 80 30       = 27,06 (triệu đồng)  Đối với dãy số có khoảng cách tổ không bằng nhau: với trường hợp này, việc xác định Mốt phải căn cứ vào mật độ phân phối. i i i fm h  Vì các khoảng cách tổ khác nhau nên tổ chứa Mốt sẽ là tổ có mi max. Cần phải thêm cột vào bảng tính để xác định tổ chứa Mốt và tính giá trị của Mốt tương tự theo công thức trên, nhưng thay các f bằng các m. 3.2.3.3. Tác dụng  Mốt biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng hay bù trừ chênh lệch giữa các lượng biến (khác x ), nó có thể bổ sung hay thay thế cho số trung bình cộng trong trường hợp việc tính số trung bình gặp khó khăn.  Mốt bảo đảm ý nghĩa kinh tế hơn các tính toán khác khi có lượng biến đột xuất vì nó không chịu ảnh hưởng của lượng biến đột xuất.  Mốt là một trong những tham số nêu lên đặc trưng phân phối của dãy số.  Mốt sử dụng trong bài toán lý thuyết phục vụ đám đông: trong kinh doanh, chọn loại nào, màu sắc, kiểu cỡ nào phù hợp nhất và vừa ý nhất với số đông để sản xuất nhiều, đáp ứng nhu cầu khách hàng. 3.2.3.4. Ưu, nhược điểm của Mốt  Ưu điểm: o Mốt không thay đổi đối với những lượng biến đột xuất. o Mốt có thể được tính ra từ cả tiêu thức thuộc tính và tiêu thức số lượng.  Hạn chế: o Mốt kém nhạy bén với sự biến thiên của tiêu thức: Chỉ quan tâm tới lượng biến có tần số lớn nhất mà không quan tâm tới các lượng biến khác. o Đối với 1 dãy số phân phối có thể có nhiều Mốt, có thể không có Mốt. Không nên tính Mốt trong trường hợp dãy số phân phối có nhiều lượng biến có tần số lớn xấp xỉ nhau (trường hợp có nhiều Mốt). Chính vì những hạn chế này nên thống kê đã sử dụng một chỉ tiêu khác để bổ sung cho số bình quân cũng như để khắc phục nhược điểm của Mốt, đó là trung vị. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội v1.0 55 3.2.4. Trung vị (Median) 3.2.4.1. Khái niệm Trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng biến, chia dãy số thành hai phần bằng nhau. Như vậy, từ khái niệm trên có 3 vấn đề cần làm rõ:  Thứ nhất, trung vị là lượng biến chứ không phải là vị trí. Vì là lượng biến nên trung vị chỉ được tính ra từ tiêu thức số lượng.  Thứ hai, trung vị là lượng biến của đơn vị ở vị trí giữa. Vậy đơn vị nào ở giữa? o Nếu số đơn vị tổng thể lẻ (n = 2m + 1), vị trí giữa là đơn vị thứ m + 1. o Nếu số đơn vị tổng thể chẵn (n = 2m), vị trí giữa là 2 đơn vị m và m + 1.  Thứ ba, vị trí giữa ở đây là trong dãy số lượng biến chứ không phải trong dãy số bất kỳ. Vì vậy, trước khi tính trung vị, ta phải sắp xếp các lượng biến theo thứ tự (từ lượng biến nhỏ nhất xmin tới lượng biến lớn nhất xmax hay ngược lại). 3.2.4.2. Cách tính trung vị  Đối với dãy số không có khoảng cách tổ: Me là lượng biến của đơn vị đứng ở vị trí giữa. o Nếu số đơn vị tổng thể lẻ: ∑f = 2m + 1, Me = xm + 1, là lượng biến của đơn vị thứ m + 1. o Nếu số đơn vị tổng thể chẵn: ∑f = 2m, m m 1e x xM 2  , là trung bình cộng 2 lượng biến của 2 đơn vị thứ m và m + 1. Ví dụ: Xét ví dụ về lương của công nhân doanh nghiệp A ở trên. Lương (1.000 đồng) xi Số công nhân (người) fi Tần số tích luỹ Si 3.000 15 15 3.500 30 45 4.000 45 90 4.500 55 145 5.000 40 185 5.500 15 200 Tổng 200 Dãy số lượng biến có ∑f = 200 = 2m. Vậy m = 100. Vậy trung vị là trung bình cộng của hai lượng biến đứng ở vị trí thứ 100 và 101. Để xác định giá trị của hai đơn vị thứ 100 và 101 ta phải dựa vào tần số tích luỹ. Nhìn vào bảng tính tần số tích luỹ ở trên, ta thấy, hai đơn vị thứ 100 và 101 nằm ở tổ thứ tư và có lượng biến là 4.500 nghìn đồng. Nghĩa là, x100 = x101 = 4.500 (nghìn đồng). Khi đó: m m 1 e x x 4.500 4.500M 4.500 2 2     (nghìn đồng) Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội 56 v1.0 Trung vị của dãy số lượng biến trên là 4.500 nghìn đồng. Điều này có nghĩa là 50% số công nhân nhận mức lương từ 4.500 nghìn đồng trở xuống và 50% số công nhân nhận mức lương từ 4.500 nghìn đồng trở lên.  Đối với dãy số có khoảng cách tổ: Me được xác định theo 2 bước. o Bước 1: Xác định tổ có trung vị, là tổ chứa lượng biến của đơn vị đứng ở vị trí giữa. o Bước 2: Tính trị số gần đúng của trung vị. e e e e i M 1 e M min M M f S 2M x h f    Trong đó: eM min x : Giới hạn dưới của tổ có trung vị. eM h : Khoảng cách tổ của tổ có trung vị. eM 1 S  : Tần số tích lũy của tổ đứng liền trước tổ có trung vị. eM f : Tần số của tổ có trung vị. Ví dụ: Xét ví dụ về NSLĐ ở trên. NSLĐ (triệu đồng) Số công nhân (người) Si 10 – 15 10 10 15 – 20 30 40 20 – 25 45 85 25 – 30 80 165 30 – 35 30 195 35 – 40 5 200 Tổng 200 Tổ 25 – 30 là tổ có Me vì nó chứa lượng biến của 2 vị trí ở giữa 100 và 101 dựa theo tần số tích lũy Si, ta có: e 200 85 2M 25 5 80      25,94 (triệu đồng) Kết quả tính trung vị ở trên cho biết, có 50% số công nhân có NSLĐ từ 25,94 triệu đồng trở xuống và 50% số công nhân có NSLĐ từ 25,94 triệu đồng trở lên. Chú ý Vì là tham số đặc trưng nên trung vị, mốt và số bình quân không nhất thiết phải bằng 1 lượng biến cụ thể nào. 3.2.4.3. Tác dụng  Me biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng hay bù trừ chênh lệch giữa các lượng biến (khác x ). Do đó, nó có thể bổ sung hay thay thế cho số trung bình cộng khi việc tính số trung bình gặp khó khăn. Bên cạnh Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội v1.0 57 đó, Me không chịu ảnh hưởng của lượng biến đột xuất (lượng biến quá nhỏ hay quá lớn).  Dựa vào tính chất toán học đáng chú ý của Me: Tổng các chênh lệch tuyệt đối giữa các lượng biến với Me là trị số nhỏ nhất so với M0, x để ứng dụng trong công tác kỹ thuật và phục vụ công cộng ở nơi thuận lợi, phục vụ được nhiều người nhất. i ex M min   Cùng với x và M0, Me là một trong những tham số nêu lên đặc trưng phân phối của dãy số. x x x f f f xxx > Me > M0< Me < M0= Me = M0 Đối xứng (phân phối chuẩn) Lệch trái (phân phối âm) Lệch phải (phân phối dương) Xác định được M0 trước tiên vì đây là lượng biến tương ứng với tần số lớn nhất. Me và x nằm ở đâu sẽ quyết định hình dáng của phân phối. Trong phân phối chuẩn, Me luôn nằm giữa x và M0. Mặt khác, tổ chứa Mốt sẽ là tổ chứa Me. Vì vậy, trong tính toán chỉ cần tìm tổ chứa M0 là có thể suy ra tổ chứa Me mà không cần tìm Si. o x = Me = M0: Dãy số có phân phối chuẩn đối xứng. o x < Me < M0: Dãy số có phân phối lệch trái, số đơn vị có lượng biến lớn hơn số trung bình chiếm đa số. o x > Me > M0: Dãy số có phân phối lệch phải, số đơn vị có lượng biến nhỏ hơn số trung bình chiếm đa số. 3.2.4.4. Một số phân vị thường dùng Như trên đã trình bày, trung vị chia dãy số phân phối thành 2 phần bằng nhau: 50% các đơn vị ở dưới và 50% các đơn vị ở trên. Tuy nhiên, trong nghiên cứu thống kê, tuỳ theo mục đích nghiên cứu khác nhau, người ta còn có thể chia dãy số phân phối hay tổng thể thành những phần nhỏ hơn bằng nhau. Các phần này được gọi là các phân vị. Trong thống kê, người ta thường hay sử dụng tứ phân vị: chia tổng thể thành 4 phần bằng nhau, ngũ phân vị: chia thành 5 phần bằng nhau, thập phân vị: 10 phần bằng nhau hay bách phân vị: chia tổng thể thành 100 phần bằng nhau,... trong đó tứ phân vị là phổ biến nhất. Với tứ phân vị, người ta chia tập hợp số liệu thành 4 phần bằng nhau. Khi đó, chúng ta sẽ xác định được 3 phân vị Q1, Q2 và Q3. Với tứ phân vị đầu tiên Q1, ta sẽ có 25% Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội 58 v1.0 số đơn vị có lượng biến từ Q1 trở xuống và 75% số đơn vị có lượng biến từ Q1 trở lên. Tứ phân vị thứ hai Q2 là trung vị của dãy số, chia dãy số thành hai phần 50% bằng nhau. Còn tứ phân vị cuối cùng Q3 chia dãy số thành 75% số đơn vị có lượng biến từ Q3 trở xuống và 25% số đơn vị có lượng biến từ Q3 trở lên. Ví dụ: Có tài liệu thu thập được về số giờ ngồi máy tính trung bình trong tuần của 20 sinh viên như sau: 25 41 27 32 43 66 35 31 15 5 34 26 32 38 16 30 38 30 20 21 Hãy xác định tứ phân vị cho bộ số liệu trên. Để xác định tứ phân vị, trước hết chúng ta phải sắp xếp lại số liệu theo thứ tự tăng dần. Sau đó chia số liệu thành 4 phần bằng nhau và tính các phân vị Q1, Q2 và Q3. Kết quả như sau: 5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 38 38 41 43 66 Nhóm thứ nhất Nhóm thứ hai Nhóm thứ ba Nhóm thứ tư Tứ phân vị thứ nhất: 1 21 25Q 23,02   (giờ) Tứ phân vị thứ hai: 2 30 31Q 30,52   (giờ) Tứ phân vị thứ ba: 3 35 38Q 36,52   (giờ) Như vậy, có 25% số sinh viên nói trên có số giờ ngồi máy tính trung bình một tuần ít hơn 23,0 giờ, 25% số sinh viên có số giờ ngồi máy tính trong tuần từ 23,0 đến 30,5 giờ, 25% trong khoảng 30,5 đến 36,5 giờ và 25% còn lại có số giờ ngồi máy tính trong tuần lớn hơn 36,5 giờ. 3.3. Các tham số đo độ biến thiên của tiêu thức Ý nghĩa của các tham số đo độ biến thiên hay độ phân tán của tiêu thức (dispersion):  Giúp đánh giá trình độ đại biểu của số bình quân: nếu độ biến thiên thấp, trình độ đại biểu của số bình quân cao và ngược lại.  Quan sát độ biến thiên của tiêu thức trong 1 dãy số lượng biến cho thấy đặc trưng về phân phối, kết cấu và tính đồng đều của tổng thể.  Độ biến thiên của tiêu thức thường được dùng trong nhiều trường hợp nghiên cứu thống kê: phân tích biến động, mối liên hệ trong điều tra, dự đoán... Q1 Q2 Q3 Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội v1.0 59 Ví dụ: Số liệu năng suất lao động của 5 công nhân trong 2 tổ sản xuất như sau: Sản phẩm/1 công nhân NSLĐA NSLĐB 40 58 50 59 60 60 70 61 80 62 Khi so sánh Ax và Bx ở 2 tổ, ta thấy Ax = Bx = 60 sản phẩm/1 công nhân. Như vậy, NSLĐ bình quân của công nhân 2 tổ sản xuất là như nhau nhưng tính đại biểu của Bx cao hơn vì độ biến thiên trong NSLĐ của 5 công nhân ở tổ sản xuất B ít hơn. Để đưa ra kết luận đúng đắn cho các hiện tượng, người ta cần so sánh cả độ biến thiên của tiêu thức. Có 5 tham số sau: 3.3.1. Khoảng biến thiên (range)  Khái niệm: Khoảng biến thiên là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu. R = xmax – xmin Ví dụ: Với số liệu ở trên R1 > R2 nên độ biến thiên (phân tán) về NSLĐ tổ 1 lớn hơn tổ 2, vì vậy tính chất đại diện của số bình quân tổ 1 kém hơn tổ 2.  Ưu điểm: Dễ tính.  Hạn chế: Chỉ tính đến lượng biến đầu và cuối, như vậy sẽ không chính xác nếu có lượng biến đột xuất, làm sai bản chất của hiện tượng. Để khắc phục nhược điểm trên, người ta sử dụng tham số dưới đây. 3.3.2. Độ lệch tuyệt đối bình quân (mean absolute deviation - MAD)  Khái niệm: Độ lệch tuyệt đối bình quân là số bình quân cộng của các độ lệch tuyệt đối giữa lượng biến và số bình quân cộng của các lượng biến đó.  Công thức: o Giản đơn: ix xd n   o Gia quyền: i i i x x f d f    Trong công thức này, người ta phải lấy giá trị tuyệt đối vì ∑(xi – x ) = 0. Độ lệch tuyệt đối bình quân càng lớn, độ biến thiên càng lớn.  Ưu điểm: Đo được tất cả các độ lệch bên trong lượng biến, do đó nó rất có ý nghĩa khi dùng phân tích chất lượng sản phẩm để xét độ đồng đều.  Hạn chế: Chỉ tính giá trị tuyệt đối của độ lệch giữa các lượng biến với số trung bình các lượng biến đó. Để khắc phục hạn chế về giá trị tuyệt đối của độ lệch, người ta tính tham số thứ ba. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội 60 v1.0 3.3.3. Phương sai (Variance)  Khái niệm: Phương sai là bình quân cộng của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó.  Công thức: o Giản đơn:  2i2 x x n    = 22i ix x n n         = 22x x o Gia quyền:  2i i2 i x x f f     = 22 i i i i i i x f x f f f           = 22x x  Ưu điểm: Khắc phục được sự khác nhau về dấu của độ lệch.  Hạn chế: Vì là bình phương các độ lệch nên trị số bị khuếch đại và không có đơn vị tính phù hợp. Tham số thứ t

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_thong_ke_hoc_bai_3_nghien_cuu_thong_ke_cac_muc_do.pdf
Tài liệu liên quan