Bài giảng Thu thập dữ liệu (Bản hay)

Giới thiệu (tt)

 Làm thống kê trên mẫu vì khó (hoặc không

thể) có được quan sát trên toàn bộ quần thể

 Thống kê sử dụng thông tin có được từ mẫu

để suy diễn thông tin của toàn bộ quần thể

 Mẫu phải đại diện được cho quần thể5

Giới thiệu (tt)

 Ví dụ: phân loại Táo, Lê

◦ Quần thể: tập hợp tất cả các quả Táo, Lê

◦ Đặc trưng quan tâm: màu sắc, hình dạng, khối lượng

◦ Kích thước mẫu: 10 000 quả Táo, 10 000 quả Lê

◦ Lấy mẫu: 6

Lấy mẫu ngẫu nhiên

 Phép lấy mẫu được xem là một ‘thực nghiệm’

ngẫu nhiên

 Chọn một cá thể từ quần thể là một cách lấy

ngẫu nhiên  có thể xem cá thể chọn là một

biến ngẫu nhiên.

 Gọi Xi là biến ngẫu nhiên thể hiện cá thể được

chọn ở lần chọn thứ i. Thông thường các Xi đôi

một độc lập và có cùng phân bố xác suất (

pdf8 trang | Chia sẻ: trungkhoi17 | Lượt xem: 358 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Thu thập dữ liệu (Bản hay), để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ThuThu thth ậậpp dd ữữ lili ệệuu 1 Dàn bài  Gi i thi u  Ly m u ng u nhiên ◦ Ly m u ng u nhiên ơ n gi n ◦ Ly m u ng u nhiên phân t ng 2 Gi i thi u  Th ng kê c n ph i th c hi n trên t p d li u  Khái ni m ◦ Qu n th  - population: tp h p t t các các i tưng quan tâm ◦ Mu – sample: tp con c a population  Các v n cn ph i gi i quy t ◦ Xác nh qu n th i t ưng ◦ Xác nh các c tr ưng c n ph i xem xét ◦ Xác nh kích th ưc m u ◦ Ly sample 3 Gi i thi u (tt)  Làm th ng kê trên m u vì khó (ho ặc không th ể) cóưc quan sát trên toàn b qu n th  Th ng kê s dng thông tin cóưc t mu suy di n thông tin c a toàn b qu n th  Mu ph i đại di ệnưc cho qu n th 4 Gi i thi u (tt)  Ví d: phân lo i Táo, Lê ◦ Qu n th : t p h p t t c các qu Táo, Lê ◦ c tr ưng quan tâm: màu s c, hình d ng, kh i l ưng ◦ Kích th ưc m u: 10 000 qu Táo, 10 000 qu Lê ◦ Ly m u: 5 Ly m u ng u nhiên  Phép l y m u ưc xem là mt ‘th c nghi m’ ng u nhiên  Ch n m t cá th t qu n th là mt cách l y ng u nhiên  có th xem cá th ch n là mt bi n ng u nhiên.  Gi X i là bi n ng u nhiên th hi n cá th ưc ch n ln ch n th . Thông th ưng các X i mt c l p và có cùng phân b xác su t (i.i.d - independent, identically distributed) = p(X1,..., X n ) p(X1)... p(X n ) 6 Ly m u ng u nhiên ơ n gi n (simple random sampling)  Ý t ưng: m i m u u có kh ưc ch n nh ư nhau.  Có 2 lo i ◦ Ly m u có thay th ◦ Ly m u không thay th 7 Ly m u ng u nhiên phân t ng (stratified random sampling)  Ý t ưng: chia qu n th ra thành nhi u t ng và áp d ng l y m u ơ n gi n cho t ng t ng, thông th ưng s ưng l y m u tng t ng t l vi s ưng cá th trong t ng ó vi toàn b qu n th . 8

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_hu_thap_du_lieu_ban_hay.pdf
Tài liệu liên quan