Giới thiệu (tt)
Làm thống kê trên mẫu vì khó (hoặc không
thể) có được quan sát trên toàn bộ quần thể
Thống kê sử dụng thông tin có được từ mẫu
để suy diễn thông tin của toàn bộ quần thể
Mẫu phải đại diện được cho quần thể5
Giới thiệu (tt)
Ví dụ: phân loại Táo, Lê
◦ Quần thể: tập hợp tất cả các quả Táo, Lê
◦ Đặc trưng quan tâm: màu sắc, hình dạng, khối lượng
◦ Kích thước mẫu: 10 000 quả Táo, 10 000 quả Lê
◦ Lấy mẫu: 6
Lấy mẫu ngẫu nhiên
Phép lấy mẫu được xem là một ‘thực nghiệm’
ngẫu nhiên
Chọn một cá thể từ quần thể là một cách lấy
ngẫu nhiên có thể xem cá thể chọn là một
biến ngẫu nhiên.
Gọi Xi là biến ngẫu nhiên thể hiện cá thể được
chọn ở lần chọn thứ i. Thông thường các Xi đôi
một độc lập và có cùng phân bố xác suất (
8 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 470 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Thu thập dữ liệu (Bản hay), để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ThuThu thth ậậpp dd ữữ lili ệệuu
1
Dàn bài
Gi i thi u
L y m u ng u nhiên
◦ L y m u ng u nhiên ơ n gi n
◦ L y m u ng u nhiên phân t ng
2
Gi i thi u
Th ng kê c n ph i th c hi n trên t p d li u
Khái ni m
◦ Qu n th - population: t p h p t t các các i
tư ng quan tâm
◦ Mu – sample: t p con c a population
Các v n c n ph i gi i quy t
◦ Xác nh qu n th i t ư ng
◦ Xác nh các c tr ưng c n ph i xem xét
◦ Xác nh kích th ư c m u
◦ L y sample
3
Gi i thi u (tt)
Làm th ng kê trên m u vì khó (ho ặc không
th ể) có ư c quan sát trên toàn b qu n th
Th ng kê s d ng thông tin có ư c t m u
suy di n thông tin c a toàn b qu n th
M u ph i đại di ện ư c cho qu n th
4
Gi i thi u (tt)
Ví d : phân lo i Táo, Lê
◦ Qu n th : t p h p t t c các qu Táo, Lê
◦ c tr ưng quan tâm: màu s c, hình d ng, kh i l ư ng
◦ Kích th ư c m u: 10 000 qu Táo, 10 000 qu Lê
◦ L y m u:
5
L y m u ng u nhiên
Phép l y m u ư c xem là m t ‘th c nghi m’
ng u nhiên
Ch n m t cá th t qu n th là m t cách l y
ng u nhiên có th xem cá th ch n là m t
bi n ng u nhiên.
G i X i là bi n ng u nhiên th hi n cá th ư c
ch n l n ch n th . Thông th ư ng các X i
m t c l p và có cùng phân b xác su t (i.i.d -
independent, identically distributed)
=
p(X1,..., X n ) p(X1)... p(X n )
6
L y m u ng u nhiên ơ n gi n
(simple random sampling)
Ý t ư ng: m i m u u có kh ư c ch n
nh ư nhau.
Có 2 lo i
◦ L y m u có thay th
◦ L y m u không thay th
7
L y m u ng u nhiên phân t ng
(stratified random sampling)
Ý t ư ng: chia qu n th ra thành nhi u t ng và
áp d ng l y m u ơ n gi n cho t ng t ng,
thông th ư ng s ư ng l y m u t ng t ng t
l v i s ư ng cá th trong t ng ó v i toàn
b qu n th .
8
Các file đính kèm theo tài liệu này:
- bai_giang_hu_thap_du_lieu_ban_hay.pdf