Giới thiệu (tt)
 Làm thống kê trên mẫu vì khó (hoặc không
thể) có được quan sát trên toàn bộ quần thể
 Thống kê sử dụng thông tin có được từ mẫu
để suy diễn thông tin của toàn bộ quần thể
 Mẫu phải đại diện được cho quần thể5
Giới thiệu (tt)
 Ví dụ: phân loại Táo, Lê
◦ Quần thể: tập hợp tất cả các quả Táo, Lê
◦ Đặc trưng quan tâm: màu sắc, hình dạng, khối lượng
◦ Kích thước mẫu: 10 000 quả Táo, 10 000 quả Lê
◦ Lấy mẫu: 6
Lấy mẫu ngẫu nhiên
 Phép lấy mẫu được xem là một ‘thực nghiệm’
ngẫu nhiên
 Chọn một cá thể từ quần thể là một cách lấy
ngẫu nhiên  có thể xem cá thể chọn là một
biến ngẫu nhiên.
 Gọi Xi là biến ngẫu nhiên thể hiện cá thể được
chọn ở lần chọn thứ i. Thông thường các Xi đôi
một độc lập và có cùng phân bố xác suất (
                
              
                                            
                                
            
 
            
                 8 trang
8 trang | 
Chia sẻ: trungkhoi17 | Lượt xem: 682 | Lượt tải: 0 
              
            Bạn đang xem nội dung tài liệu Bài giảng Thu thập dữ liệu (Bản hay), để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ThuThu thth ậậpp dd ữữ lili ệệuu
 1
Dàn bài
 Gi  i thi  u
 L y m  u ng  u nhiên
 ◦ L y m  u ng  u nhiên  ơ n gi  n
 ◦ L y m  u ng  u nhiên phân t  ng
 2
Gi  i thi  u
 Th  ng kê c  n ph  i th  c hi  n trên t  p d   li  u
 Khái ni  m
 ◦ Qu n th  - population: t p h  p t  t các các   i 
 tư ng quan tâm
 ◦ Mu – sample: t p con c  a population
 Các v  n    c n ph  i gi  i quy  t
 ◦ Xác   nh qu  n th     i t ư ng
 ◦ Xác   nh các   c tr ưng c  n ph  i xem xét
 ◦ Xác   nh kích th ư c m  u
 ◦ L y sample
 3
Gi  i thi  u (tt)
 Làm th  ng kê trên m  u vì khó (ho ặc không 
 th ể) có  ư c quan sát trên toàn b   qu  n th  
 Th  ng kê s   d ng thông tin có  ư c t   m u 
    suy di  n thông tin c  a toàn b   qu  n th  
 M u ph  i đại di ện  ư c cho qu  n th  
 4
Gi  i thi  u (tt)
 Ví d : phân lo  i Táo, Lê
 ◦ Qu  n th  : t  p h  p t  t c   các qu   Táo, Lê
 ◦   c tr ưng quan tâm: màu s  c, hình d  ng, kh  i l ư ng
 ◦ Kích th ư c m  u: 10 000 qu   Táo, 10 000 qu   Lê
 ◦ L y m  u:
 5
L y m  u ng  u nhiên
 Phép l  y m  u  ư c xem là m t ‘th  c nghi  m’
 ng  u nhiên
 Ch  n m  t cá th   t  qu  n th   là m t cách l  y 
 ng  u nhiên  có th   xem cá th   ch  n là m t 
 bi  n ng  u nhiên.
 G i X i là bi  n ng  u nhiên th   hi  n cá th    ư c 
 ch  n   l n ch  n th     . Thông th ư ng các X i     
 m t   c l  p và có cùng phân b   xác su  t (i.i.d -
 independent, identically distributed)
 =
 p(X1,..., X n ) p(X1)... p(X n )
 6
L y m  u ng  u nhiên  ơ n gi  n 
(simple random sampling)
 Ý t ư ng: m  i m  u   u có kh         ư c ch  n 
 nh ư nhau.
 Có 2 lo  i
 ◦ L y m  u có thay th  
 ◦ L y m  u không thay th  
 7
L y m  u ng  u nhiên phân t  ng 
(stratified random sampling)
 Ý t ư ng: chia qu  n th   ra thành nhi  u t  ng và
 áp d  ng l  y m  u  ơ n gi  n cho t  ng t  ng, 
 thông th ư ng s    ư ng l  y m  u   t ng t  ng t  
 l  v i s    ư ng cá th   trong t  ng  ó v i toàn 
 b  qu  n th  .
 8
            Các file đính kèm theo tài liệu này:
 bai_giang_hu_thap_du_lieu_ban_hay.pdf bai_giang_hu_thap_du_lieu_ban_hay.pdf