Giáo trình Thống kê học - Bài 2: Quá trình nghiên cứu thống kê

Các loại phân tổ thống kê

o Căn cứ vào số lượng tiêu thức phân tổ: Phân

tổ theo 1 tiêu thức (phân tổ giản đơn, ví dụ:

phân tổ dân số theo riêng tiêu thức độ tuổi,

giới tính.) và phân tổ theo nhiều tiêu thức.

Phân tổ theo nhiều tiêu thức được chia thành

hai loại:

 Phân tổ kết hợp: là phân tổ lần lượt theo

từng tiêu thức, tiêu thức nào trước, tiêu thức nào sau phụ thuộc vào mục

đích nghiên cứu. Nó cho phép nhìn nhận hiện tượng trên nhiều góc độ,

nhiều khía cạnh khác nhau.

Ví dụ: Tổng thể dân số khi được phân chia theo tiêu thức giới tính thì hình

thành hai tổ: nam và nữ. Ở mỗi tổ dân số nam và dân số nữ này lại được

phân chia tiếp theo tiêu thức nhóm tuổi.

Phân tổ kết hợp tuy có nhiều ưu điểm nhưng chúng ta cũng không nên quá

lạm dụng, kết hợp quá nhiều tiêu thức sẽ làm cho việc phân tổ trở nên phức

tạp, tổng thể bị chia nhỏ gây khó khăn cho việc nghiên cứu.

 Phân tổ nhiều chiều: cùng một lúc phân tổ theo nhiều tiêu thức khác nhau

nhưng có vai trò ngang nhau trong phản ánh hiện tượng.

Ví dụ: Khi phân tổ các doanh nghiệp xây dựng theo qui mô nhưng không

nói rõ qui mô gì, người ta sẽ phân tổ đồng thời theo các tiêu thức: vốn, lao

động, tài sản cố định, giá trị xây lắp, doanh thu. Các tiêu thức này có vai

trò ngang nhau khi phản ánh qui mô của doanh nghiệp.Bài 2: Quá trình nghiên cứu thống kê

v1.0 27

o Căn cứ vào mục đích phân tổ, người ta chia thành:

 Phân tổ phân loại: để chia tổng thể thành các loại hình khác nhau, thường

phân tổ theo tiêu thức thuộc tính.

 Phân tổ kết cấu: để nghiên cứu kết cấu của tổng thể, có thể phân tổ theo tiêu

thức thuộc tính, có thể theo tiêu thức số lượng.

 Phân tổ liên hệ: để nghiên cứu mối liên hệ giữa các tiêu thức, phải đặt trong

những điều kiện thời gian, không g

pdf26 trang | Chia sẻ: trungkhoi17 | Lượt xem: 478 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Giáo trình Thống kê học - Bài 2: Quá trình nghiên cứu thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
trình điều tra và giúp chúng ta xác định chính xác đối tượng, đơn vị và nội dung điều tra.  Xác định đối tượng điều tra và đơn vị điều tra Đối tượng điều tra là tổng thể các đơn vị thuộc hiện tượng nghiên cứu có các dữ liệu cần thiết khi tiến hành điều tra. Xác định đối tượng điều tra là xác định Bài 2: Quá trình nghiên cứu thống kê 22 v1.0 phạm vi đối tượng cần nghiên cứu, cần điều tra nhằm thu thập tài liệu chính xác, không nhầm lẫn với các hiện tượng khác. Đơn vị điều tra là từng đơn vị cá biệt thuộc đối tượng điều tra và được xác định sẽ điều tra thực tế. Trong điều tra toàn bộ, số đơn vị điều tra cũng chính là số đơn vị thuộc đối tượng điều tra. Trong điều tra không toàn bộ, số đơn vị điều tra là những đơn vị được chọn ra từ tổng thể các đơn vị thuộc đối tượng điều tra. Xác định đơn vị điều tra tức là xác định tài liệu sẽ được thu thập ở đâu. Tuỳ theo mục đích và đối tượng điều tra mà đơn vị điều tra được xác định khác nhau. Ví dụ: Trong Tổng điều tra dân số và nhà ở 1/4/2009. Mục đích điều tra: Phục vụ công tác nghiên cứu, phân tích và dự báo quá trình phát triển dân số và nhà ở trên phạm vi cả nước và từng địa phương... Đối tượng điều tra: Tất cả công dân Việt Nam. Đơn vị điều tra: Hộ gia đình. Ví dụ: Trong điều tra sản xuất và kinh doanh rau sạch, đơn vị điều tra có thể là doanh nghiệp, hợp tác xã, hộ nông dân hoặc từng người dân có sản xuất và kinh doanh rau sạch. Ví dụ: Trong điều tra về thị trường sữa trẻ em ở Việt Nam, đơn vị điều tra là các siêu thị, đại lý, cửa hàng... có kinh doanh sữa trẻ em.  Xác định nội dung điều tra Mỗi đơn vị điều tra có rất nhiều tiêu thức khác nhau. Nhưng trong một cuộc điều tra, không nhất thiết phải thu thập tất cả các tiêu thức, mà chỉ thu thập theo một số tiêu thức chủ yếu, những tiêu thức quan trọng nhất đáp ứng cho mục đích điều tra và mục đích nghiên cứu. Như vậy, nội dung điều tra là toàn bộ các đặc điểm cơ bản của từng đối tượng, từng đơn vị điều tra mà ta cần thu được thông tin hay nói cách khác, đó là danh mục các tiêu thức hay đặc trưng của các đơn vị điều tra cần thu thập. Để xác định nội dung điều tra, cần phải căn cứ vào các yếu tố sau: o Mục đích điều tra. o Đặc điểm của hiện tượng nghiên cứu. o Năng lực, trình độ thực tế của đơn vị, người tổ chức điều tra. Trong kế hoạch điều tra phải xác định và thống nhất danh mục các tiêu thức cần thu thập. Các tiêu thức này phải được diễn đạt thành câu hỏi ngắn gọn, dễ hiểu, cụ thể, rõ ràng để cả người điều tra và đơn vị điều tra đều hiểu một cách thống nhất. Danh mục các tiêu thức này được thể hiện dưới dạng phiếu hỏi, phiếu điều tra, bảng hỏi hay biểu mẫu điều tra. Đi kèm theo phiếu hỏi phải có bảng giải thích cách ghi phiếu nhằm giải thích cụ thể nội dung từng tiêu thức, cách thu thập và ghi chép số liệu. Mục đích giúp người đi điều tra, đơn vị điều tra hiểu và thực hiện chính xác, thu thập số liệu cho đúng.  Xác định thời điểm điều tra, thời kỳ điều tra và thời hạn điều tra Trong đó: o Thời điểm điều tra là mốc thời gian (ngày, giờ cụ thể) được xác định để tiến hành thu thập tài liệu một cách thống nhất trên tất cả các đơn vị của hiện tượng nghiên cứu. Bài 2: Quá trình nghiên cứu thống kê v1.0 23 Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009, thời điểm điều tra là 0 giờ ngày 1/4/2009. Tuỳ theo tính chất, đặc điểm của hiện tượng nghiên cứu mà xác định thời điểm điều tra. Tuy nhiên, thời điểm điều tra thường được xác định vào lúc hiện tượng ít biến động nhất và gắn kết với những kế hoạch của địa phương. Ví dụ: Điều tra về du lịch biển ở Sầm Sơn thì không nên chọn vào mùa đông. o Thời kỳ điều tra là độ dài (khoảng) thời gian có sự tích luỹ về mặt lượng của hiện tượng nghiên cứu. Ví dụ: Điều tra tình hình xuất khẩu gạo của địa phương A trong quý 1 năm 2008. Thời kỳ điều tra dài hay ngắn phụ thuộc vào mục đích nghiên cứu. o Thời hạn điều tra là khoảng thời gian kể từ lúc bắt đầu tiến hành điều tra cho đến khi hoàn thành việc thu thập tài liệu trên tất cả các đơn vị điều tra. Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009, thời hạn điều tra trong vòng 20 ngày từ sáng 1/4 đến tối 20/4... Như vậy, thời hạn điều tra dài hay ngắn phụ thuộc vào qui mô, tính chất phức tạp của hiện tượng, nội dung nghiên cứu và lực lượng tham gia nhưng nhìn chung, thời hạn điều tra không nên quá lâu vì sẽ dẫn đến việc thu thập tài liệu thiếu chính xác. Ngoài 4 vấn đề chính ở trên, trong phương án điều tra thống kê còn đề cập tới một số vấn đề về nguồn nhân lực, kinh phí, thời gian thực hiện, điều tra thử, thành lập các cơ quan điều tra và tuyên truyền trong nhân dân... Trong tiến hành điều tra thống kê, dù khoa học đến mấy nhưng vẫn có sai số. Vậy sai số là gì? Liệu có thể khắc phục được sai số hay không? 2.1.6. Sai số trong điều tra thống kê 2.1.6.1. Khái niệm Sai số trong điều tra thống kê là chênh lệch giữa các trị số của tiêu thức điều tra thu thập được so với trị số thực tế của hiện tượng nghiên cứu. Ví dụ: Trong điều tra dân số, sai số hay mắc phải là về tiêu thức tuổi do một số nguyên nhân: Người già không nhớ chính xác tuổi, tâm lý trẻ muốn già hơn và ngược lại; trong điều tra về mức sống, đối tượng điều tra nhiều khi không nhớ chính xác về các khoản đã chi trong thời gian nghiên cứu... Sai số trong điều tra thống kê là sai số vốn có. Phạm vi sai số cho phép trong điều tra thống kê là ± 5%. Tuy nhiên, sai số càng lớn thì chất lượng của kết quả điều tra càng giảm và gây ảnh hưởng đến chất lượng của cả quá trình nghiên cứu thống kê. Vấn đề đặt ra là phải xác định được sai số do nguyên nhân nào để từ đó chủ động tìm biện pháp khắc phục. Bài 2: Quá trình nghiên cứu thống kê 24 v1.0 2.1.6.2. Các loại sai số Căn cứ vào nguyên nhân dẫn đến sai số mà người ta chia sai số trong điều tra thống kê thành các loại sau:  Sai số do ghi chép tài liệu (do đăng ký lần đầu): đây là loại sai số mà tất cả các cuộc điều tra đều mắc phải, xảy ra do các nguyên nhân: o Người điều tra vô tình cân, đo, đong, đếm và ghi chép sai. o Đơn vị điều tra không hiểu câu hỏi dẫn đến trả lời sai. o Cả đơn vị điều tra và người điều tra cố tình ghi chép sai.  Sai số do tính chất đại biểu của số đơn vị được chọn: chỉ xảy ra trong điều tra chọn mẫu, do các nguyên nhân: o Cỡ mẫu không đủ lớn. o Do cố tình vi phạm nguyên tắc chọn mẫu. o Do bản thân nguyên tắc chọn mẫu. 2.1.6.3. Các biện pháp khắc phục sai số Sai số trong thống kê là một vấn đề không thể tránh khỏi. Để khắc phục sai số, cần phải thực hiện tốt các biện pháp sau:  Làm tốt công tác chuẩn bị điều tra o Lập phương án điều tra khoa học, chi tiết. o Chuẩn bị cán bộ điều tra đảm bảo chất lượng. o Coi trọng công tác tuyên truyền sâu rộng về mục đích cuộc điều tra.  Làm tốt công tác kiểm tra điều tra o Kiểm tra tài liệu thu thập được có đầy đủ về nội dung và số đơn vị điều tra không, có chính xác về con số và logic không. o Kiểm tra tính đại biểu của số đơn vị được chọn trong điều tra chọn mẫu. Sau khi kết thúc điều tra, chúng ta thu được một số lượng lớn các tài liệu. Nhưng những tài liệu này mới chỉ ở dạng thô, mang tính chất rời rạc, chưa cho thấy đặc trưng chung của hiện tượng nghiên cứu. Công việc tiếp theo là phải tổng hợp những tài liệu đó lại để tìm ra các đặc trưng của hiện tượng làm cơ sở cho quá trình phân tích và dự đoán thống kê. 2.2. Tổng hợp thống kê 2.2.1. Khái niệm chung về tổng hợp thống kê 2.2.1.1. Khái niệm Tổng hợp thống kê là tiến hành tập trung chỉnh lý và hệ thống hóa một cách khoa học toàn bộ tài liệu thu thập được trong điều tra thống kê. Ví dụ: Sau khi điều tra về thị trường sữa trẻ em ở Việt Nam hiện nay, chúng ta thu được một tập số liệu nhưng chưa biết được hiện có bao nhiêu chủng loại sữa, giá bán mỗi loại, thị phần... Tổng hợp thống kê sẽ giúp giải quyết những câu hỏi đó. Chỉnh lý, hệ thống hoá là việc kiểm tra lại và sắp xếp tài liệu theo một trật tự nào đó chứ không sửa trực tiếp vào phiếu điều tra. Bài 2: Quá trình nghiên cứu thống kê v1.0 25 2.2.1.2. Ý nghĩa và nhiệm vụ của tổng hợp thống kê Tổng hợp thống kê là giai đoạn trung gian, xử lý sơ bộ tài liệu, làm căn cứ cho phân tích và dự đoán thống kê. Nếu tài liệu điều tra tỉ mỉ chi tiết nhưng tổng hợp không đúng thì tính toán phân tích sẽ sai. Mặt khác, bản thân việc tổng hợp thống kê này đã là một phương pháp trong phân tích thống kê. Ví dụ: Phương pháp trình bày dữ liệu, phương pháp phân tích kết cấu của tổng thể trong trạng thái tĩnh, phương pháp phân tích chuyển dịch cơ cấu của tổng thể trong trạng thái động... Qua tổng hợp, có thể làm cho các đặc trưng riêng của từng đơn vị tổng thể bước đầu chuyển thành các đặc trưng chung của cả tổng thể (từ các tiêu thức xây dựng nên các chỉ tiêu). Hệ thống hóa là nhiệm vụ chủ yếu của tổng hợp thống kê. Sau đây là một số phương pháp tổng hợp thống kê cơ bản. 2.2.2. Phân tổ thống kê 2.2.2.1. Một số vấn đề chung về phân tổ thống kê  Khái niệm: Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ và các tiểu tổ có tính chất khác nhau. Ví dụ: Trong nghiên cứu dân số, căn cứ vào tiêu thức giới tính, người ta chia dân số thành 2 tổ: nam và nữ; căn cứ vào tiêu thức tuổi, chia dân số thành các tổ: 0; 1 – 4; 5 – 9, 10 – 14, 15 – 19... Ví dụ: Trong điều tra về thị trường sữa ở nước ta hiện nay, căn cứ theo tiêu thức loại sữa để phân chia tổng thể điều tra thành các loại sữa với nhãn hiệu khác nhau; hoặc căn cứ vào tiêu thức giá bán để phân chia thành các loại sữa với mức giá bán khác nhau...  Ý nghĩa: Phân tổ thống kê là một trong những phương pháp thường được sử dụng trong nghiên cứu thống kê. o Giai đoạn điều tra thống kê: Trong điều tra toàn bộ và điều tra không toàn bộ, người ta phải phân tổ trước các hiện tượng cần nghiên cứu nhằm giúp cho việc điều tra được dễ dàng, thuận tiện; trong điều tra chọn mẫu, phương pháp phân tổ được sử dụng để đảm bảo tính đại diện của mẫu. o Giai đoạn tổng hợp thống kê: Phân tổ là phương pháp cơ bản nhất dùng để chỉnh lý và hệ thống hóa toàn bộ tài liệu thu thập được trong điều tra thống kê. o Giai đoạn phân tích thống kê: Phân tổ là một trong những phương pháp quan trọng, là cơ sở để vận dụng các phương pháp thống kê khác một cách có hiệu quả. Bản thân phân tổ thống kê cũng đã là một phương pháp phân tích thống kê quan trọng, đó là phân tích kết cấu của hiện tượng ở trạng thái tĩnh và chuyển dịch cơ cấu ở trạng thái động.  Nhiệm vụ: Nó cho phép giải quyết ba nhiệm vụ cơ bản sau: Bài 2: Quá trình nghiên cứu thống kê 26 v1.0 o Thứ nhất, phân chia các loại hình kinh tế – xã hội theo đúng với sự tồn tại khách quan của nó. Trên cơ sở đó, nghiên cứu mối quan hệ giữa các loại hình kinh tế – xã hội nhằm nhận thức được quá trình vận động và phát triển của hiện tượng. Ví dụ: Phân tổ các cơ sở sản xuất công nghiệp ở nước ta theo thành phần kinh tế: Nhà nước, ngoài Nhà nước và có vốn đầu tư nước ngoài. o Thứ hai, biểu hiện kết cấu của hiện tượng nghiên cứu, qua đó nêu lên đặc điểm cơ bản của hiện tượng trong điều kiện thời gian và địa điểm cụ thể. Mặt khác, khi nghiên cứu sự biến động kết cấu của hiện tượng qua thời gian ta sẽ thấy được xu hướng phát triển cơ bản của hiện tượng nghiên cứu. Ví dụ: Khi nghiên cứu kết cấu của các cơ sở sản xuất công nghiệp ở nước ta trong một khoảng thời gian, có thể thấy sự chuyển dịch theo hướng: tỷ trọng các cơ sở sản xuất công nghiệp trong khu vực Nhà nước giảm dần, tỷ trọng các cơ sở sản xuất công nghiệp trong khu vực ngoài Nhà nước và có vốn đầu tư nước ngoài tăng dần. o Thứ ba, biểu hiện mối liên hệ giữa các tiêu thức. Ta chia tiêu thức thành tiêu thức nguyên nhân (tiêu thức gây ảnh hưởng) và tiêu thức kết quả (tiêu thức bị ảnh hưởng), sau đó sẽ tiến hành phân tổ theo tiêu thức nguyên nhân. Ví dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động, giữa năng suất lao động và tiền lương, giữa lượng phân bón và năng suất cây trồng, giữa thu nhập và loại sữa dùng cho trẻ  Các loại phân tổ thống kê o Căn cứ vào số lượng tiêu thức phân tổ: Phân tổ theo 1 tiêu thức (phân tổ giản đơn, ví dụ: phân tổ dân số theo riêng tiêu thức độ tuổi, giới tính...) và phân tổ theo nhiều tiêu thức. Phân tổ theo nhiều tiêu thức được chia thành hai loại:  Phân tổ kết hợp: là phân tổ lần lượt theo từng tiêu thức, tiêu thức nào trước, tiêu thức nào sau phụ thuộc vào mục đích nghiên cứu. Nó cho phép nhìn nhận hiện tượng trên nhiều góc độ, nhiều khía cạnh khác nhau. Ví dụ: Tổng thể dân số khi được phân chia theo tiêu thức giới tính thì hình thành hai tổ: nam và nữ. Ở mỗi tổ dân số nam và dân số nữ này lại được phân chia tiếp theo tiêu thức nhóm tuổi. Phân tổ kết hợp tuy có nhiều ưu điểm nhưng chúng ta cũng không nên quá lạm dụng, kết hợp quá nhiều tiêu thức sẽ làm cho việc phân tổ trở nên phức tạp, tổng thể bị chia nhỏ gây khó khăn cho việc nghiên cứu.  Phân tổ nhiều chiều: cùng một lúc phân tổ theo nhiều tiêu thức khác nhau nhưng có vai trò ngang nhau trong phản ánh hiện tượng. Ví dụ: Khi phân tổ các doanh nghiệp xây dựng theo qui mô nhưng không nói rõ qui mô gì, người ta sẽ phân tổ đồng thời theo các tiêu thức: vốn, lao động, tài sản cố định, giá trị xây lắp, doanh thu... Các tiêu thức này có vai trò ngang nhau khi phản ánh qui mô của doanh nghiệp. Bài 2: Quá trình nghiên cứu thống kê v1.0 27 o Căn cứ vào mục đích phân tổ, người ta chia thành:  Phân tổ phân loại: để chia tổng thể thành các loại hình khác nhau, thường phân tổ theo tiêu thức thuộc tính.  Phân tổ kết cấu: để nghiên cứu kết cấu của tổng thể, có thể phân tổ theo tiêu thức thuộc tính, có thể theo tiêu thức số lượng.  Phân tổ liên hệ: để nghiên cứu mối liên hệ giữa các tiêu thức, phải đặt trong những điều kiện thời gian, không gian khác nhau. 2.2.2.2. Tiêu thức phân tổ và chỉ tiêu giải thích  Khái niệm: Tiêu thức phân tổ là tiêu thức thống kê được chọn làm căn cứ để phân tổ thống kê. Ví dụ: Phân tổ dân số theo giới tính thì giới tính là tiêu thức phân tổ. Mỗi đơn vị tổng thể đều bao gồm nhiều tiêu thức, tiêu thức nào cũng có thể dùng để phân tổ được. Tuy nhiên, mỗi tiêu thức lại có ý nghĩa khác nhau nhưng tiêu thức phân tổ sẽ phản ánh đúng bản chất của hiện tượng nhất theo mục đích nghiên cứu. Với cùng một tài liệu, nếu chọn tiêu thức phân tổ khác nhau có thể đưa đến kết luận khác nhau. Và nếu chọn tiêu thức phân tổ không đúng theo mục đích nghiên cứu sẽ dẫn đến nhận xét đánh giá khác nhau về thực tế của một hiện tượng. Vậy làm thế nào để chọn tiêu thức phân tổ cho chính xác?  Những căn cứ để lựa chọn tiêu thức phân tổ: Có ba căn cứ sau: o Phải tiến hành phân tích lý luận kinh tế – xã hội để hiểu được đặc điểm, bản chất của hiện tượng, từ đó mới chọn ra tiêu thức nói rõ bản chất nhất, phù hợp với mục đích nghiên cứu để làm tiêu thức phân tổ. Ví dụ: Để nghiên cứu về mức sống dân cư, ở thành thị chúng ta có thể sử dụng tiêu thức thu nhập, chi tiêu hay diện tích nhà ở bình quân nhưng nếu nghiên cứu ở nông thôn, tiêu thức diện tích nhà ở bình quân lại không có ý nghĩa. o Phải dựa vào điều kiện lịch sử cụ thể của hiện tượng (thời gian và địa điểm cụ thể) để lựa chọn tiêu thức thích hợp. Ví dụ: Ngày nay, việc phân tổ các cơ sở sản xuất kinh doanh theo tiêu thức thành phần kinh tế mới có ý nghĩa; trong thời kỳ trước đổi mới, tiêu thức này là không phù hợp vì đa phần các cơ sở sản xuất kinh doanh đều thuộc sở hữu của Nhà nước. o Tuỳ theo tính chất phức tạp của hiện tượng và mục đích yêu cầu nghiên cứu, có thể lựa chọn phân tổ theo một hay nhiều tiêu thức khác nhau. Sau khi đã lựa chọn được tiêu thức phân tổ, người ta còn phải xác định các chỉ tiêu giải thích để nói rõ đặc trưng của các tổ cũng như của toàn bộ tổng thể. Mỗi chỉ tiêu giải thích có ý nghĩa quan trọng riêng giúp ta thấy rõ các đặc trưng số lượng của từng tổ cũng như cả tổng thể, làm căn cứ để so sánh các tổ với nhau và tính ra các chỉ tiêu khác. Tuy nhiên, cũng không nên đề ra quá nhiều Bài 2: Quá trình nghiên cứu thống kê 28 v1.0 chỉ tiêu, mà phải lựa chọn một số chỉ tiêu thích hợp nhất đối với mục đích nghiên cứu. Ví dụ: Mục tiêu phân tích thực trạng của các doanh nghiệp hiện nay, chúng ta có thể lựa chọn những chỉ tiêu phản ánh rõ nét thực trạng đó nhất như: qui mô lao động, qui mô vốn, doanh thu, lợi nhuận... Sau khi đã chọn được tiêu thức phân tổ, chúng ta tiến hành phân tổ. Nhưng phân ra thành bao nhiêu tổ là phù hợp? 2.2.2.3. Xác định số tổ Có các trường hợp sau:  Nếu tiêu thức phân tổ là tiêu thức thuộc tính: Các tổ được hình thành theo các loại hình khác nhau, tuy nhiên không nhất thiết mỗi loại hình phải hình thành một tổ. o Trường hợp đơn giản (tiêu thức có ít biểu hiện): Mỗi biểu hiện của tiêu thức có thể hình thành 1 tổ. Ví dụ: 2 giới tính, 5 thành phần kinh tế... o Trường hợp phức tạp (tiêu thức có nhiều biểu hiện): Ghép một số tổ nhỏ thành tổ lớn tùy theo đặc điểm hiện tượng và yêu cầu về mức độ chi tiết khi phân tổ. Cần bảo đảm yêu cầu các tổ nhỏ được ghép phải giống nhau hoặc gần giống nhau về đặc điểm và tính chất. Việc ghép tổ này đạt được hai mục đích, làm cho số tổ ít đi và đảm bảo giữa các tổ có sự khác nhau về đặc điểm, tính chất. Ví dụ: Mặc dù chỉ có 5 thành phần kinh tế nhưng theo mục đích nghiên cứu, ta chỉ cần phân tổ theo 2 thành phần: Nhà nước và ngoài Nhà nước. Ví dụ: Trong công nghiệp, có thể phân thành 3 nhóm ngành lớn: công nghiệp khai thác, công nghiệp chế biến và công nghiệp điện, ga, nước. Ví dụ: Phân chỗ ngồi ở chợ theo các nhóm ngành hàng: hàng khô, hàng rau quả, hàng thịt,...  Nếu tiêu thức phân tổ là tiêu thức số lượng: Tùy theo số lượng biến của tiêu thức nhiều hay ít mà có cách giải quyết khác nhau. o Số lượng các lượng biến ít: Với trường hợp này, lượng biến thay đổi ít, mỗi lượng biến có thể hình thành nên 1 tổ. Khi đó gọi là phân tổ không có khoảng cách tổ. Ví dụ: Phân tổ công nhân doanh nghiệp A theo bậc thợ. Bậc thợ Số công nhân (người) 1 10 2 20 3 45 4 60 5 35 6 25 7 5 Tổng 200 Bài 2: Quá trình nghiên cứu thống kê v1.0 29 Trong nhiều trường hợp, với mục đích nghiên cứu khác nhau, tuy số lượng các lượng biến ít, người ta vẫn ghép một số lượng biến thành 1 tổ. Ví dụ: Trong nghiên cứu dân số, khi nghiên cứu về qui mô hộ gia đình. Một hộ gia đình có thể có 1, 2, 3, 4... người. Cùng với sự phát triển của xã hội, qui mô hộ thu hẹp lại; khi đó làm nảy sinh khái niệm “gia đình hạt nhân” chỉ có bố mẹ và con cái và “gia đình truyền thống” gồm 3, 4 thế hệ. Ngày nay, số lượng các gia đình hạt nhân tăng lên, số lượng gia đình truyền thống giảm xuống. o Số lượng các lượng biến nhiều: phải căn cứ vào quan hệ lượng – chất xem lượng biến tích lũy đến một mức độ nào đó thì chất thay đổi và làm nảy sinh một tổ mới. Mỗi tổ sẽ bao gồm 1 phạm vi lượng biến với 2 giới hạn: giới hạn dưới: lượng biến nhỏ nhất để hình thành tổ; giới hạn trên: lượng biến lớn nhất, nếu vượt qua giới hạn này thì chất đổi, dẫn đến hình thành 1 tổ mới. Phân tổ như trên gọi là phân tổ có khoảng cách tổ. Chênh lệch giữa giới hạn trên và giới hạn dưới gọi là khoảng cách tổ. h = Giới hạn trên – Giới hạn dưới Có các trường hợp:  Trường hợp phân tổ có khoảng cách tổ bằng nhau: Xác định trị số khoảng cách tổ:  max minX Xh n Trong đó: Xmax, Xmin: Lượng biến lớn nhất và nhỏ nhất của tiêu thức nghiên cứu. n: Số tổ định chia. Ví dụ: Khi nghiên cứu thu nhập bình quân một tháng (triệu đồng) tại một phòng giao dịch của Ngân hàng ACB có 20 nhân viên, người ta thu được kết quả sau: 3,0 4,6 5,8 15,0 6,5 9,0 7,7 9,5 3,4 8,5 5,2 7,0 5,5 11,0 10,0 12,5 8,8 7,5 5,8 8,2 Theo tiêu thức thu nhập bình quân một tháng, người ta muốn chia số nhân viên nói trên thành 6 tổ có khoảng cách tổ bằng nhau. Sau khi sắp xếp số liệu theo thứ tự tăng dần, nhận thấy, mức thu nhập thấp nhất là 3 triệu đồng, mức thu nhập cao nhất là 15 triệu đồng. Khi đó, khoảng cách tổ sẽ được tính như sau: 15 3h 2 6   (triệu đồng) Các tổ được thiết lập như sau: Bài 2: Quá trình nghiên cứu thống kê 30 v1.0 Thu nhập bình quân một tháng (triệu đồng) Số nhân viên (người) 3 – 5 3 5 – 7 5 7 – 9 6 9 – 11 3 11 – 13 2 13 – 15 1 Tổng 20 Chú ý:  Giới hạn trên của tổ đứng trước được lấy làm giới hạn dưới của tổ đứng sau với mục đích làm cho dãy số kín hay liên tục.  Khi 1 đơn vị có lượng biến đúng bằng giới hạn trên và giới hạn dưới của 2 tổ liền nhau thì thường được xếp vào tổ đứng sau. o Trường hợp phân tổ có khoảng cách tổ không bằng nhau: Dựa vào ý nghĩa kinh tế – xã hội của hiện tượng mà xác định nội dung và phạm vi của tổ. Ví dụ: Phân tổ số học sinh của địa phương A theo lớp học như sau: Lớp Số học sinh 1 – 5 320 6 – 9 270 10 – 12 180 Tổng 770 o Trường hợp phân tổ mở: là trường hợp tổ đầu tiên không có giới hạn dưới hay tổ cuối cùng không có giới hạn trên. Ví dụ: Phân tổ các cơ sở sản xuất công nghiệp của địa phương A theo số lao động: Số lao động (người) Số cơ sở công nghiệp  20 10 21 – 50 30 51 – 100 20  100 10 Tổng 70 Chú ý: Quy ước: Khoảng cách tổ của tổ gần nhất được sử dụng làm khoảng cách tổ cho tổ mở khi xác định trị số giữa. Sau khi phân tổ hiện tượng nghiên cứu theo một tiêu thức nào đó thì các đơn vị của hiện tượng được sắp xếp vào các tổ tương ứng với các biểu hiện của tiêu thức mà đơn vị đó có, khi đó sẽ hình thành nên một dãy số phân phối. 2.2.2.4. Dãy số phân phối  Khái niệm: Dãy số phân phối là một dãy số được lập nên do phân phối các đơn vị tổng thể vào các tổ theo một tiêu thức phân tổ nào đó và được sắp xếp theo trình tự biến động của lượng biến tiêu thức phân tổ. Bài 2: Quá trình nghiên cứu thống kê v1.0 31 Ví dụ : Các ví dụ nêu trên đều là dãy số phân phối.  Tác dụng của dãy số phân phối o Cho biết tỉ mỉ, chi tiết tình hình phân phối các đơn vị của hiện tượng nghiên cứu theo 1 tiêu thức cụ thể. o Là cơ sở để tiến hành tính toán và phân tích thống kê.  Phân loại dãy số phân phối: Có 2 loại dãy số phân phối tương ứng với loại tiêu thức phân tổ. o Dãy số thuộc tính: là kết quả của phân tổ theo tiêu thức thuộc tính. o Dãy số lượng biến: là kết quả của phân tổ theo tiêu thức số lượng. Trong thống kê, người ta thường sử dụng các dãy số lượng biến. Đặc điểm của dãy số này là các lượng biến bao giờ cũng được sắp xếp theo thứ tự từ nhỏ đến lớn hoặc ngược lại. Dạng tổng quát của một dãy số lượng biến: Lượng biến xi Tần số fi Tần suất di Tần số tích lũy Si Tần suất tích lũy Si’ x1 f1 d1 S1 = f1 S1’= d1 x2 f2 d2 S2 = S1 + f2 S2’= S1’ + d2 xn fn dn Sn = Sn-1 + fn Sn’= Sn-1’ + dn ∑fi ∑di Trong đó lượng biến xi (i = 1,n ) là các trị số biểu hiện mức độ cụ thể của tiêu thức số lượng. Căn cứ vào tính chất liên tục hay không liên tục của lượng biến có thể chia ra:  Lượng biến liên tục: các trị số của nó có thể được biểu hiện bằng số nguyên hay số thập phân (ví dụ: tiền lương). Khi đó, dãy số lượng biến phải có khoảng cách tổ.  Lượng biến không liên tục (rời rạc): các trị số của dãy số chỉ có thể biểu hiện bằng các số nguyên (ví dụ: tuổi). Dãy số lượng biến có thể có hoặc không có khoảng cách tổ. Đối với phân tổ có khoảng cách tổ, lượng biến xi là trị số giữa của từng tổ và được tính: xi = Giới hạn dưới + Giới hạn trên 2  Tần số fi (i = 1,n ): Là số lượng biến của từng tổ được sắp xếp vào trong từng tổ hay là số lần lặp lại của các lượng biến. ∑fi: Tổng số đơn vị trong tổng thể.  Tần suất di (i = 1,n ): Là tỷ trọng từng bộ phận trong tổng thể, là tần số được biểu hiện bằng số tương đối. Vai trò của fi và di là tương đương nhau, có thể thay thế cho nhau. Công thức: ii i fd = f (lần, %). Bài 2: Quá trình nghiên cứu thống kê 32 v1.0  Tần số tích lũy tiến Si (i = 1,n ): Là cộng dồn tần số, có 2 tác dụng: cho biết số lượng các đơn vị có lượng biến nhỏ hơn hay lớn hơn 1 lượng biến cụ thể nào đó và cho phép xác định 1 đơn vị đứng ở vị trí nào đó trong dãy số có lượng biến là bao nhiêu. Ví dụ: Có tài liệu về NSLĐ của 40 công nhân như sau: NSLĐ (kg) (xi) Số lao động (người) (fi) di (%) Si 50 3 7,5 3 55 5 12,5 8 60 10 25,0 18 65 12 30,0 30 70 7 17,5 37 72 3 7,5 40 ∑ 40 100,0 Si = 18 khi xi = 60: Nó cho biết có 18 người có NSLĐ từ 60 sản phẩm trở xuống và có 40 – 18 = 22 người có NSLĐ từ 60 sản phẩm trở lên. Vậy người thứ 20 có NSLĐ là bao nhiêu? Người thứ 20 nằm trong khoảng 18 – 30 nên có NSLĐ là 65 sản phẩm.  Tần suất tích lũy tiến iS (i = 1,n ): là cộng dồn tần suất.  Mật độ phân phối (mi): Trong dãy số lượng biến có các tổ với khoảng cách tổ không bằng nhau thì tần số trong các khoảng cách tổ không trực tiếp so sánh với nhau được, vì các tần số đó phụ thuộc vào trị số khoảng

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_thong_ke_hoc_bai_2_qua_trinh_nghien_cuu_thong_ke.pdf