Giáo trình Toán thống kê

Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ .3

I. TỔNG THỂ VÀ MẪU. 3

1.1. Tổng thể .3

1.2. Mẫu.3

1.3. Các phƣơng pháp lấy mẫu.3

II. BỐ TRÍ MẪU VÀ PHÂN PHỐI MẪU. 3

2.1. Sắp xếp số liệu.3

2.2. Biểu diễn hình học của mẫu .5

III. CÁC SỐ ĐẶC TRƢNG CỦA MẪU . 5

3.1. Trung bình mẫu .5

2.2. Phƣơng sai mẫu.5

2.3. Phƣơng sai hiệu chỉnh của mẫu.6

IV. MẪU NGẪU NHIÊN . 8

4.1. Mẫu ngẫu nhiên.8

4.2. Các đặc trƣng của mẫu ngẫu nhiên .8

4.3. Thống kê.8

V. MỘT SỐ PHÂN PHỐI XÁC SUẤT DÙNG TRONG TOÁN THỐNG KÊ . 8

5.1. Các định lý về phân phối chuẩn .8

5.2. Phân phối khi-bình phƣơng (2).9

5.3. Phân phối Student.9

5.4. Phân phối Fisher-Snedecor.10

5.5. Phân vị mức 1 –  .10

BÀI TẬP CHƢƠNG 4 . 11

Chương 5. ƢỚC LƢỢNG THAM SỐ .12

Khái niệm về bài toán ƣớc lƣợng tham số.12

I. ƢỚC LƢỢNG ĐIỂM . 12

1.1. Định nghĩa.12

1.2. Các loại ƣớc lƣợng .12

1.3. Các ƣớc lƣợng điểm thƣờng gặp. .13

a-/ Trung bình mẫu ngẫu nhiên: .13

b-/ Phƣơng sai mẫu ngẫu nhiên hiệu chỉnh: .13

c-/ Tần suất .14

II. ƢỚC LƢỢNG KHOẢNG . 14

2.1. Khoảng tin cậy. Độ tin cậy.14

2.2. Ƣớc lƣợng kỳ vọng (giá trị trung bình) của phân phối chuẩn.15

a) Trƣờng hợp biết phƣơng sai D(X) = 2. .15

b) Trƣờng hợp không biết phƣơng sai 2.16

2.3. Ƣớc lƣợng phƣơng sai của phân phối chuẩn.17

2.4. Ƣớc lƣợng xác suất (tỷ lệ).17

2.5. Kích thƣớc mẫu cần thiết .19

BÀI TẬP CHƢƠNG 5 . 20ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

2

Chương 6. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ . 22

I. GIẢ THUYẾT, ĐỐI THUYẾT.22

1.1. Giả thuyết, đối thuyết . 22

1.2. Quy tắc kiểm định giả thuyết. 22

1.3. Các loại sai lầm. 23

II. CÁC BÀI TOÁN KIỂM ĐỊNH THAM SỐ .23

2.1. Kiểm định kỳ vọng của biến chuẩn . 23

a) Trƣờng hợp biết phƣơng sai 2. 23

b) Trƣờng hợp chƣa biết phƣơng sai 2. 24

c) Chú thích: . 25

2.2. Kiểm định một xác suất (tỷ lệ) . 27

2.3. Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu độc lập. 28

a) Trƣờng hợp biết σ v 2 2 x y à σ . . 28

b) Trƣờng hợp không biết σ v 2 2 x y à σ . 29

c) Chú ý. 30

2.4. Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu theo cặp. 31

2.5. Kiểm định sự bằng nhau của phƣơng sai hai biến chuẩn. . 32

2.6. Kiểm định sự bằng nhau của hai xác suất (so sánh hai tỷ lệ) . 33

III. MỘT VÀI KIỂM ĐỊNH PHI THAM SỐ.34

3.1. Kiểm định luật phân phối xác suất . 34

a) Trƣờng hợp các pi đã biết . 35

b) Trƣờng hợp các pi phụ thuộc các tham số chƣa biết . 36

3.2. Kiểm định sự độc lập của hai đặc tính định tính . 37

BÀI TẬP CHƢƠNG 6.40

Chương 7. TƢƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH . 45

I. MẪU THỐNG KÊ HAI CHIỀU .45

1.1. Biến ngẫu nhiên hai chiều . 45

1.2. Mẫu thống kê hai chiều. 45

a) Nếu mẫu nhỏ (n nhỏ) . 45

b) Nếu mẫu lớn và có nhiều số liệu trùng nhau . 45

c) Nếu mẫu lớn và các số liệu ít trùng nhau . 45

II. HỆ SỐ TƢƠNG QUAN .46

2.1. Sự liên hệ tƣơng quan. 46

2.2. Hệ số tƣơng quan lý thuyết. 46

2.2. Hệ số tƣơng quan mẫu. 47

2.3. Kiểm định sự tƣơng quan . 48

III. HỒI QUY TUYẾN TÍNH .49

3.1. Hàm hồi quy lý thuyết . 49

3.2. Hàm hồi quy tuyến tính mẫu . 50

3.3. Dự báo theo phƣơng trình hồi quy. 52

BÀI TẬP CHƢƠNG 7.54

CÁC BẢNG SỐ. 57

Bảng1: Giá trị hàm phân phối chuẩn tắc: . 57

Bảng 2: Phân vị Student: . 58

Bảng 3: Phân vị khi bình phƣơng .

pdf61 trang | Chia sẻ: trungkhoi17 | Lượt xem: 724 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Giáo trình Toán thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Thí dụ 1: Kết quả điều tra giá bán mặt hàng A tại 10 cửa hàng nhƣ sau (đơn vị nghìn đồng một sản phẩm): 15,0; 14,7; 14,8; 15,1; 14,8; 15,2; 15,0; 14,7; 15,1; 15,2 Biết giá bán trung bình của mặt hàng này năm trƣớc là 14,8 nghìn đồng/ sản phẩm. Giả sử giá bán là lƣợng ngẫu nhiên chuẩn. Với mức 0,05 có thể coi mặt hàng A là tăng giá? Giải: Gọi X là giá bán mặt hàng A, ta phải kiểm định giả thuyết H0: E(X) = 14,8 với đối thuyết H1: E(X) > 14,8. Ta có: Dung lƣợng mẫu: n = 10, Tổng của X: x = 15 + 14,7 + 14,8 + + 15,2 = 149,6 Tổng của X2: x2 = 152 + 14,72 + 14,82 + + 15,22 = 2238,36 Từ đó: x = 10 6,149 = 14,96; s2 = 9.10 6,14936,2238.10 2 = 0,0382 Lƣợng thống kê: ZT = (14,96 – 14,8) 0382,0 10 = 2,588 Tra bảng Student đƣợc: t(0,05; 9) = 1,833 Vậy, Bác bỏ H0, chấp nhận H1: Có thể coi mặt hàng A là tăng giá. ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 26 Thí dụ 2: Kiểm tra ngẫu nhiên trọng lƣợng X (gam) của các gói mỳ ăn liền có trọng lƣợng quy định 75 gam đƣợc kết quả: X (gam) 72 73 74 75 76 77 ni (Số gói) 2 6 10 5 3 2 Giả sử trọng lƣợng các gói mỳ là lƣợng ngẫu nhiên chuẩn. Với mức ý nghĩa  = 0,05, có thể coi trọng lƣợng các gói mỳ là đạt trọng lƣợng quy định? (Tiến hành kiểm định hai phía và kiểm định một phía). Giải: 1) Kiểm định hai phía: Giả thuyết H0: E(X) = 75; đối thuyết H1: E(X)  75 Ta có: n = 2 + 6 + 10 + 5 + 3 + 2 = 28 x = 72.2 + 73.6 + + 77.2 = 2079 x2 = 722.2 + 732.6 + + 772.2 = 154413 Từ đó: x = 28 2079 = 74,25; s2 = 27 2)25,74.(28154413 = 1,750 Lƣợng thống kê: ZT = (74,25 – 75) 75,1 28 = – 3,00 Tra bảng Student đƣợc t(0,025; 27) = 2,025 Kết luận: Bác bỏ H0, chấp nhận H1: Trọng lƣợng trung bình các gói mỳ không đúng quy định. 2) Kiểm định một phía: Giả thuyết H0: E(X) = 75; đối thuyết H1: E(X) < 75 Tính toán nhƣ trên đƣợc ZT = – 3,00 Tra bảng Student đƣợc t(0,1; 27) = 1,703 Kết luận: Bác bỏ H0, chấp nhận H1: Trọng lƣợng trung bình các gói mỳ thấp hơn quy định. Thí dụ 3: Một máy tiện tự động đƣợc lập trình để tiện ra các chi tiết có đƣờng kính 1,5 cm. Để kiểm tra ngƣời ta đo thử đƣờng kính của 40 chi tiết và tính đƣợcx = 1,506 cm và s = 0,02. Giả sử đƣờng kính các chi tiết là lƣợng ngẫu nhiên chuẩn N(, 2). Ở mức 0,05, hãy kiểm định: a) Giả thuyết H0:  = 1,5 với đối thuyết H1:   1,5 b) Giả thuyết H0:  = 1,5 với đối thuyết H1:  > 1,5 Giải: Từ giả thuyết đã cho, ta có: ZT = (1,506 – 1,5) 02,0 40 = 1,897 a) Tra bảng Student đƣợc t(0,025; 39) = 1,96  Chấp nhận H0: Các chi tiết đạt yêu cầu. b) Tra bảng Student đƣợc t(0,05; 39) = 1,645  Chấp nhận H1: Các chi tiết đạt có đƣờng kính lớn hơn yêu cầu. (Hai kết luận trong a) và b) là khác nhau do mắc các sai lầm (loại một hoặc loại hai) trong đó) Bài giảng Toán Thống kê 27 2.2. Kiểm định một xác suất (tỷ lệ) Bài toán: Giả sử mỗi cá thể trong tổng thể có đặc tính A với xác suất p chƣa biết (tỷ lệ cá thể có đặc tính A bằng p). Lấy mẫu kích thƣớc n, thấy có k cá thể có đặc tính A. Hãy xây dựng quy tắc kiểm định giả thuyết H0: p = p0 với các đối thuyết khác nhau ở mức ý nghĩa . Tiêu chuẩn kiểm định Mẫu ngẫu nhiên trong bài toán này là lƣợng ngẫu nhiên X chỉ số cá thể có đặc tính A trong mẫu kích thƣớc n. Nếu H0 đúng, thì X là số cá thể có đặc tính A trong n cá thể là biến ngẫu nhiên nhị thức tham số n, p0. Khi n lớn (n  100) và p0 không quá nhỏ hoặc quá lớn (0,01  p0  0,99) thì: X  N(np0, np0q0)  F = n X  N(p, n qp 00 ), trong đó q0 = 1 – p0. Do đó thống kê Z = n )q1(p pF 00 0   =    00 0 p1p n pF    N(0,1) Từ đó với mức  đã cho, nếu đối thuyết H1 là: a) H1: p  p0 thì tìm từ bảng chuẩn số u/2 sao cho: P(| Z | > u/2) = 1 – . Vậy miền bác bỏ giả thuyết H0 là: W = (–,–u/2)  (u/2, ) b) H1: p > p0 thì tìm số u từ bảng chuẩn sao cho: P(Z > u) =  Vậy có miền bác bỏ giả thuyết H0 là: W = (u, ) c) H1: p < p0 thì tìm số u từ bảng chuẩn sao cho: P( U < – u) =  Vậy có miền bác bỏ giả thuyết H0 là: W = (–,–u) Vậy có quy tắc kiểm định: Quy tắc 3. Từ mẫu cụ thể có k cá thể có tính chất A trong n cá thể quan sát thì thực hiện các bƣớc sau để kiểm định giả thuyết H0: p = p0 với các đối thuyết H1 khác nhau ở mức . - Bƣớc 1: Tính tần suất cá thể có tính chất A từ mẫu đã cho f = n k - Bƣớc 2 Tính lƣợng thống kê thực nghiêm: ZT =    00 0 p1p n pf   , (6.5) - Bƣớc 3: Tra bảng và kết luận Đối thuyết H1: p  p0 p > p0 p < p0 Tra bảng Chuẩn u(/2) u() Kết luận Chấp nhận H0 | ZT |  u/2 ZT  u ZT  – u Bác bỏ H0 | ZT | > u/2 ZT > u ZT < – u Chú thích: Việc tiến hành kiểm định hai phía hay một phía là tuỳ thuộc vào giá trị tần suất f tính đƣợc và số p0 đã cho: - Nếu f  p0 thì tiến hành kiểm định hai phía - Nếu f << p0 thì tiến hành kiểm định một phía với H1: p < p0 - Nếu f >> p0 thì tiến hành kiểm định một phía với H1: p > p0. Thí dụ: Theo báo cáo của phân xƣởng thì tỷ lệ sản phẩm loại một của phân xƣởng là 90%. Kiểm tra ngẫu nhiên 200 sản phẩm do phân xƣởng đó sản suất thấy có 172 sản phẩm loại một. ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 28 Ở mức 0,05 hãy cho nhận xét về báo cáo tỷ lệ sản phẩm loại một của phân xƣởng là phù hợp hay thấp hơn thực tế? Giải: Gọi p là tỷ lệ sản phẩm loại một của phân xƣởng, bài toán đã nêu là kiểm định giả thuyết H0: p = 0,9 với đối thuyết H1: p < 0,9 ở mức 0,05. Ta có Tần suất sản phẩm loại một theo mẫu: f = 200 172 = 0,86 Lƣợng thống kê ZT = (0,86 – 0,9) 1,0.9,0 200 = –1,8856 Tra bảng chuẩn đƣợc u0,05 = 1,645 Vậy: H0 bị bác bỏ, chấp nhận H1: Tỷ lệ sản phẩm loại một theo báo cáo là thấp hơn thực tế. 2.3. Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu độc lập Bài toán: Giả sử X~N(x, x 2) và Y~N(y, y 2), trong đó x, y chƣa biết. Hãy kiểm định giả thuyết H0: x = y với các đối thuyết H1 khác nhau ở mức ý nghĩa . Các đối thuyết H1 là: xy (1 phía); x>y; xy; x<y là một vì chỉ cần coi X là Y và Y là X thì đối thuyết này trở thành đối thuyết kia và ngƣợc lại. a) Trƣờng hợp biết 2 2x yσ và σ . Xét hai mẫu ngẫu nhiên: (X1, X2, ,Xn) của X và (Y1, Y2, , Ym) của Y Ta có:    n 1i iX n 1 X ~ N(x, n 2 x );    m 1i iY m 1 Y ~ N(y, m 2 y )  mn ,(N~YX 2 y 2 x yx     ), nếu H0 đúng thì x – y = 0  Thống kê Z = 2 y 2 x 2 y 2 x nm m.n )YX( mn YX       ~ N(0,1), nếu H0 đúng Bởi vậy, với mức  đã cho, nếu đối thuyết H1 là: a1) H1: x  y thì tìm u/2 từ bảng chuẩn sao cho P(| Z | > u/2) = 1 – . Từ đó có: Miền bác bỏ giả thuyết H0 là: W = (– , – u/2)  (u/2, ) a2) H1: x > y thì tìm u từ bảng chuẩn sao cho P(Z > u) = 1 – . Từ đó có: Miền bác bỏ giả thuyết H0 là: W = (u, ) Vậy có quy tắc kiểm định Quy tắc 4. Từ hai mẫu cụ thể (x1, x2, ..., xn) của X và (y1, y2, ..., yn) của Y thực hiện các bƣớc sau để kiểm định giả thuyết H0: x = y với đối thuyết H1 khác nhau khi biết x và y: - Bƣớc 1: Tính các trung bình mẫux vày từ các mẫu đã cho - Bƣớc 2: Tính thống kê thực nghiệm: ZT = 2 x 2 y nm m.n )yx(   (6.6) - Bƣớc 3: Đối thuyết H1: x  y x > y x < y Tra bảng Chuẩn u(/2) u() Kết luận Chấp nhận H0 | ZT |  u/2 ZT  u ZT  – u Bác bỏ H0 | ZT | > u/2 ZT > u ZT < – u Bài giảng Toán Thống kê 29 b) Trƣờng hợp không biết 2 2x yσ và σ Khi đó, ƣớc lƣợng x và y tƣơng ứng bằng phƣơng sai hiệu chỉnh của mẫu X và mẫu Y:      n 1i 2 i 2 x )XX( 1n 1 S ,      m 1i 2 i 2 y )YY( 1m 1 S ) Trƣờng hợp 1: các mẫu là lớn (n  30 và m  30) Khi đó, ngƣời ta chứng minh đƣợc thống kê: Z =   2 222 x yyx X Y n m X Y mS nSSS n m        N(0,1), nếu H0 đúng Bởi vậy, ở mức  đã cho, với các đối thuyết H1 khác nhau thì miền chấp nhận giả thuyết H0, miền bác bỏ giả thuyết H0 và các quy tắc kiểm định tƣơng ứng giống nhƣ trong 2.3a (Quy tắc 4 nhƣng thay x 2 bằng sx 2 và y 2 bằng sx 2) ) Trƣờng hợp 2: có mẫu nhỏ (hoặc n < 30, hoặc m < 30) và 2 2x yσ σ . Giả thuyết x = y =  và đƣợc ƣớc lƣợng bằng phƣơng sai chung: 2mn S)1m(S)1n( 2mn )YY()XX( S 2 y 2 x m 1i 2 i n 1i 2 i 2         và, ngƣời ta chứng minh đƣợc thống kê: Z = 222 S)mn( m.n )YX( m S n S YX     ~ t(n + m – 2), nếu H0 đúng Bởi vậy, với mức  đã cho, nếu đối thuyết H1 là: b1) H1: x  y thì tìm t/2 = t(/2, n+m –2) từ bảng Student. Từ đó có: Miền bác bỏ giả thuyết H0 là: W = (– , – t/2)  (t/2, ) b2) H1: x > y thì tìm t = t(, n+m –2) từ bảng Student. Từ đó có: Miền bác bỏ giả thuyết H0 là: (u, ) Vậy có quy tắc kiểm định Quy tắc 5. Từ hai mẫu cụ thể (x1, x2, ..., xn) của X và (y1, y2, ..., yn) của Y thực hiện các bƣớc sau để kiểm định giả thuyết H0: x = y với các đối thuyết H1 khác nhau khi không biết x và y và mẫu nhỏ (n ≤ 30, m ≤ 30): - Bƣớc1: Tính các trung bình mẫu và các phƣơng sai hiệu chỉnhx, sx 2 vày, sy 2 từ các mẫu đã cho - Bƣớc 2: Tính phƣơng sai chung s2 = 2mn s)1m(s)1n( 2y 2 x   - Bƣớc 3 Tính thống kê thực nghiệm: ZT = 2s)mn( m.n )yx(   (6.7) - Bƣớc 4: Đối thuyết H1: x  y x > y x < y Tra bảng Student tb = t(/2; n+m–2) tb = t(; n+m–2) Kết luận Chấp nhận H0 | ZT |  tb ZT  tb ZT  – tb Bác bỏ H0 | ZT | > tb ZT > tb ZT < – tb ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 30 Chú thích: Nếu không có giả thuyết x = y thì phải bổ sung vào các quy tắc 5 kiểm định giả thuyết phụ H0: x = y sau khi đã tính các trung bình và phƣơng sai hiệu chỉnh của các mẫu thống kê (quy tắc kiểm định giả thuyết H0: x = y đƣợc trình bày ở phần sau). Thí dụ 1: Điều tra năng suất của cùng một giống lúa tại hai địa phƣơng nhƣ sau: Địa phƣơng A: Điều tra 40 hộ, tính đƣợc năng suất trung bìnhx = 52,37 tạ/ha và sx 2 = 2,4326 Địa phƣơng B: Điều tra 35 hộ, tính đƣợc năng suất trung bìnhy = 53,22 tạ/ha và sy 2 = 3,2574 Giả sử năng suất lúa tại các địa phƣơng là lƣợng ngẫu nhiên chuẩn. Với mức ý nghĩa 0,05, hãy kiểm định giả thuyết H0: Năng suất lúa trung bình ở hai địa phƣơng là nhƣ nhau; với các đối thuyết H1: a) Năng suất lúa trung bình ở hai địa phƣơng là khác nhau. b) Năng suất lúa trung bình ở địa phƣơng A là thấp hơn địa phƣơng B. Giải: Ta có lƣợng thống kê: ZT = (52,37 – 53,22 ) 4326,2.352574,3.40 35.40  = – 2,167 a) Tra bảng chuẩn đƣợc u0,025 = 1,96  Có thể coi năng suất lúa trung bình ở hai địa phƣơng là khác nhau (bác bỏ H0, chấp nhận H1) b) Tra bảng chuẩn đƣợc u0,05 = 1,645  Có thể coi năng suất lúa trung bình ở địa phƣơng A là thấp hơn năng suất lúa trung bình ở địa phƣơng B (bác bỏ H0¸ chấp nhận H1) Thí dụ 2: Độ tăng trọng X (kg/con) của 6 con lợn nuôi theo phƣơng pháp A trong một tháng đƣợc: 15,5 17,7 18,9 16,2 15,3 17,5 Độ tăng trọng Y (kg/con) của 8 con lợn nuôi theo phƣơng pháp B trong một tháng đƣợc: 16,5 15,6 18,2 18,3 19,1 16,5 17,4 19,0 Giả sử X~N(x,  2) và Y~N(y,  2) (cùng phƣơng sai 2). Với mức  = 0,05, có thể coi độ tăng trọng trung bình của hai phƣơng pháp nuôi là nhƣ nhau không? Giải: Từ mẫu của X, Ta có: n = 6; x = 15,5 + 17,7 + 18,9 + 16,2 +15,3 +17,5 = 101,1 x2 = 15,52 + 17,72 + 18,92 + 16,22 + 15,32 + 17,52 =1713,53 Từ đó: x = 16,85; sx 2 = 1,999 Tƣơng tự, tính đƣợc: m = 8;y = 17,775; sy 2 = 1,645 Từ đó có phƣơng sai chung: s2 = 12 645,1.7999,1.5  = 1,7925 Lƣợng thống kê ZT = (16,85 – 1,999) 7925,1)86( 8.6  = 1,003 Tra bảng Student đƣợc t(0,025; 12) = 2,179 Vậy, chấp nhận H0: Độ tăng trọng trung bình của hai phƣơng pháp nuôi lợn là nhƣ nhau. c) Chú ý Chú ý 1: Có thể coi hai đối thuyết H1: x > y và x < y là một vì chỉ cần thay X bằng Y và ngƣợc lại. Bài giảng Toán Thống kê 31 Chú ý 2: Việc chọn đối thuyết H1 là x  y hay x > y tuỳ thuộc vào các giá trịx vày tính đƣợc. Nếux y thì chọn x  y, nếux >>y thì chọn x >y, nếux <<y thì chọn x<y. 2.4. Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu theo cặp Bài toán: Giả sử X~N(x, x 2) và Y~N(y, y 2), trong đó x, y chƣa biết và cần so sánh x với y ở mức  (kiểm định H0: x = y). Trong điều kiện có thể, hai mẫu thống kê của X và của Y đƣợc khảo sát trên cùng một mẫu gồm n cá thể, mỗi cá thể thứ i của mẫu đều đƣợc xác định cả giá trị xi của X và cả giá trị yi của Y. Nhƣ vậy ta có n cặp số (x1, y1), (x2, y2),, (xn, yn). Các số liệu thu đƣợc theo cặp thƣờng trình bày thành bảng nhƣ sau: Cá thể 1 2 n X x1 x2 xn Y y1 y2 yn Việc khảo sát đồng thời cả X và Y trên cùng một mẫu gọi là bố trí thí nghiệm theo cặp. Chẳng hạn, chọn n thửa ruộng, mỗi thửa đƣợc chia đôi để gieo trồng 2 giống lúa (ngô, ) hoặc để thực hiện hai quy trình chăm sóc khác nhau. Thực hiện hai phƣơng pháp xác định hàm lƣợng một chất nào đó trên cùng n mẫu vật cũng là bố trí thí nghiệm từng cặp; Khi đó mẫu ngẫu nhiên là n cặp biến ngẫu nhiên (X1, Y1), (X2, Y2), , (Xn, Yn). Đặt U = X – Y, vì X, Y là cùng tồn tại trong mỗi cá thể nên có thể coi U là một biến ngẫu nhiên của tập hợp chính đang nghiên cứu. Mẫu ngẫu nhiên của U là: (U1, U2, , Un), trong đó Ui = Xi – Yi. Từ đó có U~N(u, 2 u ) với u và 2 u đƣợc ƣớc lƣợng bằng    n 1i iU n 1 U       n 1i 2 i 2 u UU 1n 1 S Do U = X  Y nên u = x  y. Bởi vậy H0: x = y  u = 0. Và bài toán so sánh theo cặp trở thành bài toán kiểm định kỳ vọng biến chuẩn khi chƣa biết phƣơng sai với giả thuyết H0: u = 0. Và, nếu H0 đúng thì thống kê: Z = 2 uS n U là biến Student với n – 1 bậc tự do Vậy có quy tắc kiểm định: Quy tắc 6: Từ mẫu cụ thể theo cặp (x1,y1), (x2,y2), ..., (xn,yn) thực hiện các bƣớc sau để kiểm định giả thuyết H0: x = y với các đối thuyết H1 khác nhau, theo cặp, mức . - Bƣớc 1: Lập mẫu thống kê (u1, u2, , un) với ui = xi – yi từ các cặp số liệu (xi, yi), i = 1,2,, n - Bƣớc 2: Tính trung bình mẫuu và phƣơng sai hiệu chỉnh 2us . - Bƣớc 3: Tính thống kê: ZT = 2 us n u (6.8) - Bƣớc 4: Tra bảng và kết luận: Đối thuyết H1: x  y x > y x < y Tra bảng Student tb = t(/2; n – 1) tb = t(, n – 1) Kết luận Chấp nhận H0 | ZT |  tb ZT  tb ZT  – tb Bác bỏ H0 | ZT | > tb ZT > tb ZT < – tb ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 32 Chú ý: Nếu u  0 thì nên dùng H1: x  y, Nếu u >> 0 thì nên dùng H1: x > y; còn nếu u << 0 thì nên dùng H1: x < y. Thí dụ: Dùng hai phƣơng pháp xác định hàm lƣợng chất A trong 6 mẫu nƣớc thải đƣợc kết quả (đơn vị tính mg/lít): Mẫu số 1 2 3 4 5 6 Phƣơng pháp I 15,4 11,5 10,7 12,8 16,3 17,1 Phƣơng pháp II 14,9 11,7 10,8 12,5 15,9 17,4 Ở mức  = 0,05, có thể coi hai phƣơng pháp cho cùng một kết quả hay không? Biết kết quả của mỗi phƣơng pháp là lƣợng ngẫu nhiên chuẩn. Giải: Gọi X là kết quả của phƣơng pháp I, Y là kết quả của phƣơng pháp II; ta phải kiểm định giả thuyết H0: x = y với đối thuyết x  y theo cặp. Đặt U = X – Y ta có mẫu thống kê của U: 0,5 -0,2 -0,1 0,3 0,4 -0,3 Từ đó u = 0,5 – 0,2 – 0,1 + 0,3 + 0,4 – 0,3 = 0,6  u = 0,1 u2 = 0,52 + (0,2)2 + + (0,3)2 = 0,64  s2 = 0,116 Lƣợng thống kê ZT = 116,0 6 1,0 = 0,719. Tra bảng Student đƣợc t(0,025; 5) = 2,571 Vậy, chấp nhận H0: Có thể coi hai phƣơng pháp cho kết quả nhƣ nhau 2.5. Kiểm định sự bằng nhau của phƣơng sai hai biến chuẩn. Bài toán: Giả sử X~N(x,x 2), Y~N(y,y 2) với x 2 và y 2 chƣa biết, tiến hành kiểm định giả thuyết H0: x = y với đối thuyết H1: x > y ở mức  (Kiểm định một phía). Nếu H0 đúng, có thể chứng minh đƣợc thống kê Z = 2 y 2 x S S (với 2y 2 x S,S tƣơng ứng là phƣơng sai hiệu chỉnh của các mẫu ngẫu nhiên của X và Y) là biến ngẫu nhiên Fisher-Snedecor với n – 1, m – 1 bậc tự do. Từ đó, với mức  đã cho, tìm số Fb = F(, n – 1, m – 1) từ bảng Fisher-Snedecor, ta có: Miền bác bỏ giả thuyết H0: W = (Fb, ) và miền chấp nhận H0: (0, Fb]. Vậy có: Quy tắc 7: Với hai mẫu thống kê cụ thể: (x1, x2, ,xn) của X và (y1, y2, , ym) của Y, quy tắc kiểm định giả thuyết H0: x 2 = y 2 với đối thuyết H1: x 2 > y 2 ở mức  nhƣ sau: - Bƣớc 1: Tính các phƣơng sai mẫu sx 2 và sy 2 từ các mẫu thống kê của X và của Y - Bƣớc 2: Tính lƣợng thống kê thực nghiệm ZT = 2 y 2 x s s (6.9) - Bƣớc 3: Tra bảng Fisher-Snedecor, tìm số F = F(, n – 1, m – 1) (cột n – 1, dòng m – 1, bảng ) - Bƣớc 4: Nếu ZT  F: Chấp nhận H0; Nếu ZT > F: Bác bỏ H0. Chú ý: Do đối thuyết H0: x 2 > y 2 nên FT tính theo (6.9) luôn luôn lớn hơn 1. Nếu khi tính phƣơng sai đƣợc sx 2 < sy 2 thì khi tính FT phải để sy 2 ở tử số và khi đó Fb = F(, m – 1, n – 1). Thí dụ: Năng suất giống lúa A trên 7 mảnh ruộng thí nghiệm là: X (tạ/ha): 55, 57, 55, 58, 61, 54, 52 Năng suất giống lúa B trên 6 mảnh ruộng thí nghiệm là: Y (ta/ha): 55, 50, 58, 61, 54, 52. Bài giảng Toán Thống kê 33 Biết năng suất các giống lúa là các lƣợng ngẫu nhiên chuẩn. Có thể coi năng suất lúa của hai giống là nhƣ nhau đƣợc không? (mức  = 0,05). Giải: Đây là bài toán kiểm định giả thuyết H0: x = y với đối thuyết H1: x  y chƣa có giả thuyết x= y Từ mẫu đã cho tính đƣợc: n = 7; x = 56; sx 2 = 8,6667; m = 6; y = 55; sy 2 = 16,00 Kiểm định giả thuyết phụ H0: x 2 = y 2 với đối thuyết H1: y 2 > x 2. Ta có: ZT = 6667,8 16 = 1,846; F(0,05; 5; 6) = 4,378  Chấp nhận H0: x 2 = y 2 Phƣơng sai chung: s2 = 11 16.56667,8.6  = 12,00 Lƣợng thống kê thực nghiệm: ZT = )67(12 6.7 )5556(   = 0,519 Tra bảng Student: t(0,025; 11) = 2,201  Chấp nhận H0: x = y. 2.6. Kiểm định sự bằng nhau của hai xác suất (so sánh hai tỷ lệ) Bài toán: Có hai tập hợp chính; trong tập hợp thứ nhất, mỗi phần tử có tính chất A với xác suất p1; trong tập hợp thứ hai, mỗi phần tử có tính chất A với xác suất p2 (p1, p2 chƣa biết). Lấy mẫu dung lƣợng n1 từ tập thứ nhất thấy có k1 phần tử có tính chất A. Lấy mẫu dung lƣợng n2 từ tập thứ hai thấy có k2 phần tử có tính chất A. Xây dựng tiêu chuẩn kiểm định giả thuyết H0: p1 = p2 với các đối thuyết H1 khác nhau, mức ý nghĩa . Giải: Ta có: f1 = 1 1 n k là tần suất cá thể có tính chất A trong mẫu thứ nhất f2 = 2 2 n k là tần suất cá thể có tính chất A trong mẫu thứ hai Nếu H0 đúng, nghĩa là p1 = p2 = p và đƣợc ƣớc lƣợng bằng tần suất cá thể có tính chất A chung của cả hai mẫu: f = 21 21 nn kk   Gọi X là số cá thể có tính chất A trong n1 cá thể lấy từ tập chính thứ nhất. Y là số cá thể có tính chất A trong n2 cá thể lấy từ tập chính thứ hai. Khi đó nếu H0 đúng: F1 =         11 n )p1(p ;pN n X ; F2 =         22 n )p1(p ;pN n Y , (xem ở mục 2.2. kiểm định một xác suất). Do đó: F1 – F2           21 n )p1(p n )p1(p ;ppN . Do p – p = 0, nên: Thống kê Z =         21 21 n 1 n 1 )p1(p FF =   1 21 2 1 2 n n F F p(1 p)(n n )     N(0, 1). Từ đó có quy tắc: ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 34 Quy tắc 8. Quy tắc kiểm định giả thuyết H0: p1 = p2 với các đối thuyết H1 khác nhau, mức . - Bƣớc 1: Tính các tần suất cá thể có tính chất A từ các mẫu đã cho: mẫu 1: f1 = 1 1 n k , mẫu 2: f2 = 2 2 n k , tần suất chung: f = 21 21 nn kk   - Bƣớc 2: Tính lƣợng thống kê thực nghiệm: ZT = (f1 – f2) )nn)(f1(f n.n 21 21  (6.10) - Bƣớc 3: Tra bảng và kết luận: Đối thuyết p1  p2 p1 > p2 P1 < p2 Tra bảng chuẩn tìm u/2 u Kết luận Chấp nhận H0 ZT  u/2 ZT  u ZT  – u Bác bỏ H0 ZT > u/2 ZT > u ZT < – u Chú ý: Nếu có f1  f2 thì dùng đối thuyết H1: p1  p2, nếu f1 >> f2 thì dùng H1: p1 > p2, nếu f1 << f2 thì H1: p1 < p2. Thí dụ: Gieo 500 hạt một loại giống cây trồng do cơ sở A sản xuất có 425 hạt nảy mầm. Gieo 400 hạt giống cùng loại cây trồng trên do cơ sở B sản xuất có 360 hạt nảy mầm Ở mức ý nghĩa 0,05 có thể coi tỷ lệ nảy mầm của hạt giống do cơ sở B sản xuất là cao hơn của cơ sở A sản xuất hay không? Giải: Gọi p1, p2 tƣơng ứng là tỷ lệ hạt giống của cơ sở A và cơ sở B nảy mầm thì bài toán là bài toán kiểm định giả thuyết H0: p1 = p2 với đối thuyết H1: p1 < p2. Tần suất nảy mầm của hạt giống do cơ sở A sản xuất là: f1 = 425/500 = 0,85 Tần suất nảy mầm của hạt giống do cơ sở B sản xuất là: f2 = 360/400 = 0,90 Tần suất nảy mầm chung của hạt giống của hai cơ sở là: f = (425+360)/(500+400) = 0,872 Lƣợng thống kê thực nghiệm là: ZT = (0,90 – 0,85) )400500)(872,01(872,0 400.500  = 2,231 Tra bảng chuẩn đƣợc t0,025 = 1,645. Vậy, H1 đƣợc chấp nhận, nghĩa là có thể coi hạt giống của cơ sở B có tỷ lệ nảy mầm cao hơn tỷ lệ nảy mần hạt giống của cơ sở B. III. MỘT VÀI KIỂM ĐỊNH PHI THAM SỐ 3.1. Kiểm định luật phân phối xác suất Bài toán: Giả sử A1, A2, , Ak là hệ đầy đủ các sự kiện của một phép thử nào đó. Thực hiện dãy n phép thử độc lập thấy có ni lần xuất hiện sự kiện Ai (i = 1, 2, , k), n1 + n2 + + nk = n. Trình bày kết quả thành bảng: Sự kiện A1 A2 Ak Tần số n1 n2 nk Tiến hành kiểm định giả thuyết H0: P(A1) = p1, P(A2) = p2, , P(Ak) = pk với đối thuyết H1: i{1, 2, , k} để P(Ai)  pi. Mức ý nghĩa của kiểm định là . Bài giảng Toán Thống kê 35 a) Trƣờng hợp các pi đã biết Nếu H0 đúng thì tần số lý thuyết npi là xấp xỉ tần số quan sát ni, nếu npi và ni có sai lệch lớn thì H0 là sai. Pearson đã đƣa ra thống kê Z =   k 1i i 2 ii np )npn( để đánh giá sự sai lệch giữa ni và npi, đồng thời chứng minh đƣợc Z xấp xỉ phân phối  2(k – 1), bởi vậy ở mức  có: Miền bác bỏ H0 là: W = ( 2(, k – 1), ) Từ đó có quy tắc: Quy tắc 9. Quy tắc kiểm định giả thuyết về luật phân phối xác suất, không phải ƣớc lƣợng tham số - Tính các tần số lý thuyết npi, - Tính lƣợng thống kê thực nghiệm     k 1i i 2 ii T np )npn( Z (6.11) - Tra bảng Khi-bình phƣơng tìm số 2(, k – 1) - Nếu ZT   2(, k – 1): Chấp nhận H0; Nếu ZT >  2(, k – 1): Bác bỏ H0. Thí dụ 1: Lai giống hoa màu hồng thuần chủng với giống hoa màu đỏ thuần chủng, ở thế hệ F1 cho các cây hoa có màu hồng, cánh sen và đỏ. Kiểm tra ngẫu nhiên các cây lai F1 đƣợc kết quả: Màu hoa Hồng Cánh sen Đỏ Số cây 65 163 62 Với mức 0,05 có thể coi tỷ lệ hoa màu hồng, cánh sen, đỏ là 1:2:1 đƣợc không? Giải: Nên lập bảng tính: Màu hoa Hồng Cánh sen Đỏ Tổng Số cây 65 163 62 290 pi 1/4 1/2 1/2 1 npi 72,5 145 72,5 290 Từ đó: ZT = 5,72 )5,7262( 145 )145163( 5,72 )5,7265( 222      = 4,531 < 2(0,05; 2) = 5,991 Vậy, có thể coi tỷ lệ các màu hoa hồng, cánh sen, đỏ là 1:2:1. Chú thích: Có thể đƣa công thức (6.11) về dạng đơn giản hơn:     k 1i i 2 ii T np )npn( Z =  k 1i i 2 i 2 ii 2 i np pnnpn2n =      k 1i k 1i i k 1i i i 2 i npn2 np n =    k 1i i 2 i n np n (6.11a) Thí dụ 2: Theo định luật thứ 3 của Mendel, ở đời lai thứ hai của việc lai hai cặp tính trạng có sự phân ly theo tỉ số: 9:3:3:1. Ông đã làm thì nghiệm bằng cách lai đậu thuần chủng hạt trơn (A) màu vàng (B) với đậu thuần chủng hạt nhăn (a) màu xanh (b). Phân loại 556 hạt đậu thu đƣợc ông có kết quả; 315 hạt trơn vàng; 101 hạt nhăn vàng; 108 hạt trơn xanh; 32 hạt nhăn xanh. Hỏi dữ liệu của Mendel có phù hợp tốt với lý thuyết không ?  = 0,01. Giải: Ta phải kiểm định giả thuyết H0: p1 = P(AB) = 9/16; p2 = P(aB) = 3/16; p3 = P(Ab) = 3/16; p4 = P(ab) = 1/16; Lập bảng tính: ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 36 Tính trạng Trơn,Vàng (AB) Nhăn,Vàng (aB) Trơn,Xanh (Ab) Nhăn, Xanh (ab) Kết quả (ni) 315 101 108 32 Tổng n = 556 pi 9/16 3/16 3/16 1/16 npi 312,75 104,25 104,25 34,75 Từ đó: ZT = 75,34 32 25,104 108 25,104 101 75,312 312 2222  = 0,47 < 2(0,01; 3) = 11,345.  Chấp nhận giả thiết H0: dữ liệu Mendel phù hợp với định luật của ông. b) Trƣờng hợp các pi phụ thuộc các tham số chƣa biết Giả sử pi = pi(1, 2, , r) là các hàm phụ thuộc r tham số j (j = 1, 2, r), r < k – 1 trong đó các tham số j chƣa xác định đƣợc giá trị. Trƣờng hợp này phải tìm các ƣớc lƣợng điểm jˆ của j (j = 1, 2, , r), khi đó )ˆ,...,ˆ,ˆ(ppˆ k21ii  là ƣớc lƣợng điểm của các pi. Từ đó có quy tắc: Quy tắc 9b. Quy tắc kiểm định giả thuyết về luật phân phối xác suất, phải ƣớc lƣợng tham số - Tìm ƣớc lƣợng điểm jˆ của tham số j, - Tìm ƣớc lƣợng điểm )ˆ,...,ˆ,ˆ(ppˆ k21ii  của pi, - Tính các tần số lý thuyết n ipˆ , - Tính lƣợng thống kê thực nghiệm     k 1i i 2 ii T pˆn )pˆnn( Z (6.12) - Tra bảng Khi-bình phƣơng tìm số 2(, k – 1 – r) - Nếu ZT   2(

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_toan_thong_ke.pdf