Bài giảng Lý thuyết xác suất - Chương 8: Kiểm định giả thiết thống kê

Phương pháp ước lượng hợp lý tối đa

Xét ĐLNN X đã biết quy luật phân phối tổng

quát nhưng chưa biết một hay một số tham số. Một

hay một số tham số chưa biết ký hiệu là θ. Miền

chứa các giá trị hợp lệ của θ ký hiệu là Θ.

Xét mẫu cụ thể x1, x2,., xn.

Xét trường hợp X là ĐLNN rời rạc.

Vì chưa biết θ nên giá trị P(X = xi) phụ thuộc θ.

Ta ký hiệu giá trị này là P(xi, θ).

Xác suất xảy ra biến cố (X = x1).(X = x2) (X = xn)

là:L(θ) = P(x1, θ).P(x2, θ).P(xn, θ)

Giá trị θ = θ (x1, x2,., xn) làm cho xác suất của

biến cố tích trên đạt cực đại gọi là giá trị ước

lượng hợp lý tối đa của θ.

Hàm n biến ngẫu nhiên θ = θ (X1, X2,., Xn) gọi

là hàm ước lượng hợp lý tối đa của θ.

θ cũng là điểm mà hàm L đạt cực đại trên miền

Θ. Do L là tích nên để đơn giản hoá việc tìm cực đại,

người ta thường xét hàm lnL.

Trường hợp X là ĐLNN liên tục, giá trị hàm

mật độ lúc này phụ thuộc θ, ta ký hiệu là f(x, θ).

Theo ý nghĩa của hàm mật độ, hàm L sẽ là:

L(θ) = f(x1, θ).f(x2, θ).f(xn, θ)

73 trang | Chia sẻ: trungkhoi17 | Lượt xem: 694 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất - Chương 8: Kiểm định giả thiết thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định bác bỏ giả thiết Ho, chấp nhận giả thiết H1. Các chi tiết sản xuất không đúng chuẩn (với độ tin cậy 95%). 2.1.2 Kiểm định phải (H1 : µ > µo) Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa α cho trước, ta cần kiểm định: Ho: µ = µo với H1: µ > µo TH1,2,3 n > 30 hoặc "n ≤ 30, biết σ2 và tổng thể có phân phối Chuẩn" Khi một trong các trường hợp trên xảy ra thì với mẫu ngẫu nhiên kích thước n, X / n − µ σ có phân phối Chuẩn Chính Tắc hay được xấp xỉ với phân phối Chuẩn Chính Tắc. Trường hợp chưa biết σ thì thay bởi S. Giả định Ho đúng, tức là µ = µo. Do − µ σ oX / n có phân phối Chuẩn Chính Tắc nên biến cố − µ σ oX / n ≤ zα xảy ra với xác suất 1–α. Vì vậy nếu với một mẫu cụ thể kích thước n, ta thấy − µ σ ox / n > zα thì đây là điều vô lý, chứng tỏ giả định µ = µo sai. Vậy nếu dấu hiệu này xảy ra ta quyết định bác bỏ giả thiết Ho. Khi − µ σ ox / n > zα xảy ra, tức là khi bác bỏ Ho, thì ta vẫn có − µ σ x / n ≤ zα, do đó − µ σ ox / n > − µ σ x / n . Điều này chứng tỏ khi bác bỏ giả thiết Ho thì µ > µo. Vậy ta chọn: Tiêu chuẩn kiểm định: G = − µ σ oX / n (Nếu chưa biết σ thì thay bởi S) Miền bác bỏ Ho: Wα = (zα, +∞) TH4 n ≤ 30, chưa biết phương sai tổng thể σ2, tổng thể có phân phối Chuẩn Phân tích tương tự trên với phân phối Student, ta chọn: Tiêu chuẩn kiểm định: G = − µoX S / n Miền bác bỏ Ho: Wα = (tα, +∞) Tóm tắt – Kiểm định phải trung bình tổng thể (H1: µ > µo) Cho trước một mẫu cụ thể và mức ý nghĩa α. Ta tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH). Nếu giá trị kiểm định lớn hơn giá trị tới hạn thì bác bỏ Ho (KĐ > TH). Công thức tính giá trị kiểm định: − µ σ ox / n (Nếu chưa biết σ thì thay bởi s) Giá trị tới hạn được tra theo hai trường hợp: n > 30 hoặc "n ≤ 30, biết σ2 và tổng thể có phân phối Chuẩn" Giá trị tới hạn: zα n ≤ 30, chưa biết σ2 và tổng thể có phân phối Chuẩn Giá trị tới hạn: t(n–1)α Ví dụ Trọng lượng của một con gà khi xuất chuồng được chọn ngẫu nhiên là ĐLNN có phân phối Chuẩn. Trước đây, trọng lượng trung bình là 1,7Kg. Người ta áp dụng phương pháp chăn nuôi mới và cân thử 25 con gà xuất chuồng thì tính được trọng lượng trung bình là 1,87Kg và phương sai là 0,25. Hãy cho nhận xét về phương pháp chăn nuôi mới với mức ý nghĩa 5%. Do gà tăng trọng nên ta kiểm định giả thiết: Ho: µ = µo "Phương pháp chăn nuôi mới không làm gà tăng trọng" H1: µ > µo "Phương pháp chăn nuôi mới làm gà tăng trọng" Ta có: n = 25 x= 1,87 µo = 1,7 s 2 = 0,25 ⇒ s = 0,5 Giá trị kiểm định: KĐ = −x 1,7 s / n = 1,7 Giá trị tới hạn: α = 5% ⇒ TH = t(n–1)α = t(24)0,05 = 1,711 =TINV(0,05*2; 24) Điều kiện bác bỏ Ho là KĐ > TH không thoả, quyết định chấp nhận giả thiết Ho. Phương pháp chăn nuôi mới không làm gà tăng trọng (với mức ý nghĩa 5%). 2.1.3 Kiểm định trái (H1 : µ < µo) Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa α cho trước, ta cần kiểm định: Ho: µ = µo với H1: µ < µo Phân tích tương tự trên, ta đi đến kết luận: TH1,2,3 n > 30 hoặc "n ≤ 30, biết σ2 và tổng thể có phân phối Chuẩn" Tiêu chuẩn kiểm định: G = − µ σ oX / n (Nếu chưa biết σ thì thay bởi S) Miền bác bỏ Ho: Wα = (–∞, –zα) TH4 n ≤ 30, chưa biết phương sai tổng thể σ2, tổng thể có phân phối Chuẩn Tiêu chuẩn kiểm định: G = − µoX S / n Miền bác bỏ Ho: Wα = (–∞, –tα) Tóm tắt – Kiểm định trái trung bình tổng thể (H1: µ < µo) Cho trước một mẫu cụ thể và mức ý nghĩa α. Ta tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH). Nếu giá trị kiểm định nhỏ hơn giá trị tới hạn thì bác bỏ Ho (KĐ < TH). Công thức tính giá trị kiểm định: − µ σ ox / n (Nếu chưa biết σ thì thay bởi s) Giá trị tới hạn được tra theo hai trường hợp: n > 30 hoặc "n ≤ 30, biết σ2 và tổng thể có phân phối Chuẩn" Giá trị tới hạn: –zα n ≤ 30, chưa biết σ2 và tổng thể có phân phối Chuẩn Giá trị tới hạn: –t(n–1)α Ví dụ Mức tiêu hao nguyên liệu để sản xuất một sản phẩm là ĐLNN có phân phối chuẩn. Mức tiêu hao trung bình là 1,2Kg với độ lệch chuẩn 3,1Kg. Sau một thời gian sản xuất, người ta kiểm tra mức sử dụng nguyên liệu của 25 sản phẩm thì thu được bảng sau: Mức NL (Kg) 0,9 1,0 1,1 1,2 1,3 Số sản phẩm 4 5 6 7 3 Với mức ý nghĩa 5%, hãy cho nhận xét về mức tiêu hao nguyên liệu trung bình. Do lượng tiêu hao nguyên liệu trung bình giảm nên ta kiểm định giả thiết: Ho: µ = µo "Mức tiêu hao nguyên liệu trung bình không thay đổi" H1: µ < µo "Mức tiêu hao nguyên liệu trung bình có giảm" Ta có: n = 25 x = 1,1 µo = 1,2 σ = 3,1 Giá trị kiểm định: KĐ = − µ σ ox / n = –0,16 Giá trị tới hạn: α = 5% ⇒ TH = –zα = –z0,05 = –1,645 =–NORMSINV(1–0,05) Điều kiện bác bỏ Ho là KĐ < TH không thoả, quyết định chấp nhận giả thiết Ho. Mức tiêu hao nguyên liệu trung bình không thay đổi (với mức ý nghĩa 5%). 2.2 Kiểm định tỷ lệ tổng thể Ta chỉ xét trường hợp khi n đủ lớn (npo ≥ 10 và n(1–po) ≥ 10). 2.2.1 Kiểm định hai phía (H1 : p ≠ po) Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa α cho trước, ta cần kiểm định: Ho: p = po với H1: p ≠ po Theo giả thiết n đủ lớn, − − F p p(1 p) / n được xấp xỉ bởi phân phối Chuẩn Chính Tắc. Giả định Ho đúng, tức là p = po, − − o o o F p p (1 p ) / n có phân phối Chuẩn Chính Tắc. Vì vậy, với mẫu cụ thể kích thước n, nếu − − o o o F p p (1 p ) / n > zα/2 thì ta quyết định bác bỏ giả thiết Ho. Vậy ta chọn: Tiêu chuẩn kiểm định: G = − − o o o F p p (1 p ) / n Miền bác bỏ Ho: Wα = (–∞, –zα/2)∩(zα/2, +∞). Tóm tắt – Kiểm định hai phía tỷ lệ tổng thể (H1: p ≠ po) Cho trước một mẫu cụ thể và mức ý nghĩa α. Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH). Nếu giá trị kiểm định có trị tuyết đối lớn hơn giá trị tới hạn thì bác bỏ Ho (KĐ > TH). Công thức tính giá trị kiểm định: − − o o o f p p (1 p ) / n Giá trị tới hạn: zα/2 Ví dụ Người ta cho rằng tỷ lệ sinh viên trên 35 tuổi là 2%. Điều tra về tuổi của 800 sinh viên thì thấy có 24 sinh viên trên 35 tuổi. Với độ tin cậy 95%, hãy cho biết ý kiến về tỷ lệ trên. Ta cần kiểm định giả thiết: Ho: p = po "Tỷ lệ sinh viên trên 35 tuổi là 2%" H1: p ≠ po "Tỷ lệ sinh viên trên 35 tuổi không phải là 2%" Ta có: n = 800 f = 24/800 po = 2% Giá trị kiểm định: KĐ = − − o o o f p p (1 p ) / n = 2,0203 Giá trị tới hạn: 1–α = 95% ⇒ TH = zα/2 = z0,025 = 1,96 =NORMSINV(1–0,025) Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định bác bỏ giả thiết Ho, chấp nhận giả thiết H1. Tỷ lệ sinh viên trên 35 tuổi không phải là 2% (với độ tin cậy 95%). 2.2.2 Kiểm định phải (H1 : p > po) Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa α cho trước, ta cần kiểm định: Ho: p = po với H1: p > po Lập luận tương tự trên, ta chọn: Tiêu chuẩn kiểm định: G = − − o o o F p p (1 p ) / n Miền bác bỏ Ho: Wα = (zα, +∞) Tóm tắt – Kiểm định phải tỷ lệ tổng thể (H1: p > po) Cho trước một mẫu cụ thể và mức ý nghĩa α. Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH). Nếu giá trị kiểm định lớn hơn giá trị tới hạn thì bác bỏ Ho (KĐ > TH). Công thức tính giá trị kiểm định: − − o o o f p p (1 p ) / n Giá trị tới hạn: zα Ví dụ Tỷ lệ sản phẩm có chất lượng cao tại một nhà máy là 45%. Sau khi cải tiến sản xuất, người ta kiểm tra ngẫu nhiên 400 lượt sản phẩm thì thấy có 215 sản phẩm có chất lượng cao. Vậy việc cải tiến sản xuất có làm tăng tỷ lệ sản phẩm có chất lượng cao không? Hãy cho khẳng định về điều này với mức ý nghĩa 5%. Ta cần kiểm định giả thiết: Ho: p = po "Tỷ lệ sản phẩm có chất lượng cao không đổi" H1: p > po "Tỷ lệ sản phẩm có chất lượng cao có tăng sau khi cải tiến sản xuất" Ta có: n = 400 f = 215/400 po = 45% Giá trị kiểm định: KĐ = − − o o o f p p (1 p ) / n = 3,5176 Giá trị tới hạn: α = 5% ⇒ TH = zα = z0,05 = 1,6449 =NORMSINV(1–0,05) Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định bác bỏ giả thiết Ho, chấp nhận giả thiết H1. Tỷ lệ sản phẩm có chất lượng cao có tăng sau khi cải tiến sản xuất (với mức ý nghĩa 5%). 2.2.3 Kiểm định trái (H1 : p < po) Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa α cho trước, ta cần kiểm định: Ho: p = po với H1: p < po Lập luận tương tự trên, ta chọn: Tiêu chuẩn kiểm định: G = − − o o o F p p (1 p ) / n Miền bác bỏ Ho: Wα = (–∞, –zα) Tóm tắt – Kiểm định trái tỷ lệ tổng thể (H1: p < po) Cho trước một mẫu cụ thể và mức ý nghĩa α. Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH). Nếu giá trị kiểm định nhỏ hơn giá trị tới hạn thì bác bỏ giả thiết Ho (KĐ < TH). Công thức tính giá trị kiểm định: − − o o o f p p (1 p ) / n Giá trị tới hạn: –zα Ví dụ Tỷ lệ người hút thuốt trong một khu dân cư trước đây là 5%. Sau khi vận động tuyên truyền, người ta gặp ngẫu nhiên 800 lượt người thì thấy có 24 người vẫn còn hút thuốt. Với mức ý nghĩa 5%, hãy cho biết: a) Việc vận động tuyên truyền có làm giảm tỷ lệ người hút thuốt không? b) Nếu tuyên bố tỷ lệ người hút thuốt trong khu dân cư này chỉ còn 2% thì có chấp nhận được không? a) Ta cần kiểm định giả thiết: Ho: p = po "Tỷ lệ người hút thuốt không đổi" H1: p < po "Tỷ lệ người hút thuốt có giảm" Ta có: n = 800 f = 24/800 po = 5% Giá trị kiểm định: KĐ = − − o o o f p p (1 p ) / n = –2,5955 Giá trị tới hạn: α = 5% ⇒ TH = –zα = –z0,05 = –1,6449 =–NORMSINV(1–0,05) Điều kiện bác bỏ Ho là KĐ < TH thoả, quyết định bác bỏ giả thiết Ho, chấp nhận giả thiết H1. Tỷ lệ người hút thuốt có giảm sau khi vận động tuyên truyền (với mức ý nghĩa 5%). b) Ta cần kiểm định giả thiết: Ho: p = po "Tỷ lệ người hút thuốt chỉ còn 2%" H1: p ≠ po "Tỷ lệ người hút thuốt không phải chỉ còn 2%" Ta có: n = 800 f = 24/800 po = 2% Giá trị kiểm định: KĐ = − − o o o f p p (1 p ) / n = 2,0203 Giá trị tới hạn: α = 5% ⇒ TH = zα/2 = z0,025 = 1,96 =NORMSINV(1–0,025) Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định bác bỏ giả thiết Ho, chấp nhận giả thiết H1. Tỷ lệ người hút thuốt không phải chỉ còn 2% (với mức ý nghĩa 5%). 2.3 Kiểm định phương sai tổng thể Ta chỉ xét trường hợp tổng thể là ĐLNN có phân phối Chuẩn. 2.3.1 Kiểm định hai phía (H1 : σ 2 ≠ σo2) Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa α cho trước, ta cần kiểm định: Ho: σ 2 = σo 2 với H1: σ 2 ≠ σo 2 ĐLNN − σ 2 2 (n 1)S có phân phối Chi Bình n–1 bậc tự do. Giả định Ho đúng, tức là σ 2 = σo 2 thì 2 2 o (n 1)S− σ có phân phối Chi Bình n–1 bậc tự do. Ta có: P(χ21–α/2 < 2 2 o (n 1)S− σ < χ2α/2) = 1–α Vậy nếu với một mẫu cụ thể kích thước n, ta thấy − σ 2 2 o (n 1)s > χ2α/2 hay − σ 2 2 o (n 1)s < χ21–α/2 thì giả thiết Ho bị bác bỏ. Theo phân tích trên, ta chọn: Tiêu chuẩn kiểm định: G = − σ 2 2 o (n 1)S Miền bác bỏ Ho: Wα = (0, χ 2 1–α/2)∩(χ 2 α/2, +∞) Tóm tắt – Kiểm định hai phía phương sai tổng thể (H1 : σ 2 ≠ σo2) Cho trước một mẫu cụ thể và mức ý nghĩa α. Tính giá trị kiểm định và tra giá trị tới hạn nhỏ (THN) và giá trị tới hạn lớn (THL). Nếu giá trị kiểm định lớn hơn giá trị tới hạn lớn hoặc nhỏ hơn giá trị tới hạn nhỏ thì bác bỏ Ho (KĐ > THL hoặc KĐ < THN). Công thức tính giá trị kiểm định: 2 2 o (n 1)s− σ Giá trị tới hạn lớn, nhỏ là χ2(n–1)α/2, χ 2 (n–1)1–α/2. Ví dụ Đường kính của một trục máy chọn ngẫu nhiên là một ĐLNN có phân phối Chuẩn. Độ lệch chuẩn của máy tiện sản xuất trục máy theo thiết kế là 5mm. Người ta nghi ngờ máy tiện bị hư nên đo thử đường kính của 20 sản phẩm thì tính được phương sai mẫu là 27,5. Với mức ý nghĩa 2% hãy cho biết máy tiện có hoạt động bình thường không? Ta cần kiểm định giả thiết: Ho: σ 2 = σo 2 "Máy tiện hoạt động bình thường" H1: σ 2 ≠ σo 2 "Máy tiện bị hư" Ta có: n = 20 s2 = 27,5 σo 2 = 52 = 25 Giá trị kiểm định: KĐ = 2 2 o (n 1)s− σ = 20,9 Các giá trị tới hạn: α = 2% ⇒ THL = χ 2 (n–1)α/2 = χ 2 (19)0,01 = 36,1909 =CHIINV(0,01; 19) THN = χ 2 (n–1)1–α/2 = χ 2 (19)0,99 = 7,6327 =CHIINV(0,99; 19) Điều kiện bác bỏ Ho là KĐ THL không thoả, quyết định chấp nhận giả thiết Ho. Máy tiện hoạt động bình thường (với mức ý nghĩa 2%). 2.3.2 Kiểm định phải (H1 : σ 2 > σo2) Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa α cho trước, ta cần kiểm định: Ho: σ 2 = σo 2 với H1: σ 2 > σo 2 Phân tích tương tự trên, ta chọn: Tiêu chuẩn kiểm định: G = − σ 2 2 o (n 1)S Miền bác bỏ Ho: Wα = (χ 2 α, +∞) Tóm tắt – Kiểm định phải phương sai tổng thể (H1 : σ 2 > σo2) Cho trước một mẫu cụ thể và mức ý nghĩa α. Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH). Nếu giá trị kiểm định lớn hơn giá trị tới hạn thì bác bỏ Ho (KĐ > TH). Công thức tính giá trị kiểm định: 2 2 o (n 1)s− σ Giá trị tới hạn: χ2(n–1)α Ví dụ Chiều cao của một cư dân trưởng thành gặp ngẫu nhiên là một ĐLNN có phân phối Chuẩn. Mức chênh lệch chiều cao được đo bằng độ lệch chuẩn. 5 năm trước độ lệch chuẩn là 20cm. Ngày nay, đo chiều cao của 100 lượt cư dân trưởng thành chọn ngẫu nhiên thì tính được độ lệch chuẩn là 24,215cm. Hãy cho kết luận về mức chênh lệch chiều cao hiện nay với độ tin cậy 95%. Vì độ lệch chuẩn tăng nên ta kiểm định giả thiết: Ho: σ 2 = σo 2 "Mức chênh lệch về chiều cao không đổi so với 5 năm trước" H1: σ 2 > σo 2 "Mức chênh lệch về chiều cao tăng so với 5 năm trước" Ta có: n = 100 s2 = 24,2152 σo 2 = 202 Giá trị kiểm định: KĐ = 2 2 o (n 1)s− σ = 145,126 Giá trị tới hạn: 1–α = 95% ⇒ TH = χ2(n–1)α = χ 2 (99)0,05 = 123,225 =CHIINV(0,05; 99) Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định bác bỏ giả thiết Ho, chấp nhận giả thiết H1. Mức chênh lệch về chiều cao tăng so với 5 năm trước (với độ tin cậy 95%). 2.3.3 Kiểm định trái (H1 : σ 2 < σo2) Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa α cho trước, ta cần kiểm định: Ho: σ 2 = σo 2 với H1: σ 2 < σo 2 Phân tích tương tự trên, ta chọn: Tiêu chuẩn kiểm định: G = − σ 2 2 o (n 1)S Miền bác bỏ Ho: Wα = (0, χ 2 1–α) Tóm tắt – Kiểm định trái phương sai tổng thể (H1 : σ 2 < σo2) Cho trước một mẫu cụ thể và mức ý nghĩa α. Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH). Nếu giá trị kiểm định nhỏ hơn giá trị tới hạn χ2(n–1)α thì bác bỏ Ho (KĐ < TH). Công thức tính giá trị kiểm định: 2 2 o (n 1)s− σ Giá trị tới hạn: χ2(n–1)1–α Ví dụ Trọng lượng của một con gia súc là một ĐLNN có phân phối Chuẩn. Mức chênh lệch trọng lượng của bầy gia súc được đo bằng độ lệch chuẩn. Khi bầy gia súc được 2 tháng tuổi, người ta cân và tính được độ lệch chuẩn là 6,253Kg. Khi được 3 tháng tuổi, cân 50 con gia súc chọn ngẫu nhiên thì tính được độ lệch chuẩn là 5,975Kg. Với mức ý nghĩa 4%, hãy cho kết luận về mức chênh lệch trọng lượng của bầy gia súc sau khi nuôi 3 tháng. Vì độ lệch chuẩn giảm nên ta kiểm định giả thiết: Ho: σ 2 = σo 2 "Mức chênh lệch trọng lượng bầy gia súc 3 tháng tuổi không đổi so với lúc 2 tháng tuổi" H1: σ 2 < σo 2 "Mức chênh lệch trọng lượng bầy gia súc 3 tháng tuổi giảm so với lúc 2 tháng tuổi" Ta có: n = 50 s2 = 5,9752 σo 2 = 6,2532 Giá trị kiểm định: KĐ = 2 2 o (n 1)s− σ = 44,74 Giá trị tới hạn: α = 4% ⇒ TH = χ2(n–1)1–α = χ 2 (49)0,96 = 33,12 =CHIINV(0,96; 49) Điều kiện bác bỏ Ho là KĐ < TH không thoả, quyết định chấp nhận giả thiết Ho. Mức chênh lệch trọng lượng bầy gia súc 3 tháng tuổi không đổi so với lúc 2 tháng tuổi (với mức ý nghĩa 4%). 3. Kiểm định phi số 3.1 Kiểm định quy luật phân phối xác suất 3.1.1 Phương pháp ước lượng hợp lý tối đa Xét ĐLNN X đã biết quy luật phân phối tổng quát nhưng chưa biết một hay một số tham số. Một hay một số tham số chưa biết ký hiệu là θ. Miền chứa các giá trị hợp lệ của θ ký hiệu là Θ. Xét mẫu cụ thể x1, x2,..., xn. Xét trường hợp X là ĐLNN rời rạc. Vì chưa biết θ nên giá trị P(X = xi) phụ thuộc θ. Ta ký hiệu giá trị này là P(xi, θ). Xác suất xảy ra biến cố (X = x1).(X = x2)(X = xn) là: L(θ) = P(x1, θ).P(x2, θ)...P(xn, θ) Giá trị θ = θ (x1, x2,..., xn) làm cho xác suất của biến cố tích trên đạt cực đại gọi là giá trị ước lượng hợp lý tối đa của θ. Hàm n biến ngẫu nhiên θ = θ (X1, X2,..., Xn) gọi là hàm ước lượng hợp lý tối đa của θ. θ cũng là điểm mà hàm L đạt cực đại trên miền Θ. Do L là tích nên để đơn giản hoá việc tìm cực đại, người ta thường xét hàm lnL. Trường hợp X là ĐLNN liên tục, giá trị hàm mật độ lúc này phụ thuộc θ, ta ký hiệu là f(x, θ). Theo ý nghĩa của hàm mật độ, hàm L sẽ là: L(θ) = f(x1, θ).f(x2, θ)...f(xn, θ) Ví dụ (1) Cho biết X~(λ). a) Tìm hàm ước lượng hợp lý tối đa của λ. b) Cho mẫu cụ thể của X: X 1 2 3 4 Tần số 5 4 2 1 Tìm giá trị ước lượng hợp lý tối đa của λ. a) L(λ) = 1x 1 e x ! −λλ . 2x 2 e x ! −λλ ... nx n e x ! −λλ = 1 2 nx x ... x n 1 2 n e x !x !...x ! + + + − λλ lnL(λ) = –nλ + (Σxi)lnλ – Σlnxi! ⇒ lnL∂ ∂λ = –n + n i i 1 x = λ ∑ lnL∂ ∂λ = 0 ⇒ λ = n i i 1 x n = ∑ ⇒ 2 2 lnL∂ ∂λ = –1 < 0 Chứng tỏ hàm L đạt cực đại tại λ = n i i 1 x n = ∑ . Vậy hàm ước lượng hợp lý tối đa của λ là λ = n i i 1 X n = ∑ . b) Với mẫu cụ thể dạng điểm có tần số ta tính được n = Σni = 12, Σnixi = 10, vậy giá trị ước lượng hợp lý tối đa của λ theo công thức trên là 10/12 = 0,83. (2) Cho biết X~upslopeellipsis(µ, σ2). Tìm hàm ước lượng hợp lý tối đa của µ, σ2. L(µ, σ2) = n 2 i 2 i 1 1 (x ) exp 22=  − µ −  σσ pi   ∏ = ( ) n 2 in 2 i 1 1 1 exp (x ) 2 2 =   − − µ  σ σ pi ∑ lnL = n 2 i2 i 1 1 (x ) 2 = − − µ σ ∑ – n 2 ln 2σ – nln 2pi ⇒ lnL∂ ∂µ = n i2 i 1 1 (x ) 2 = − µ σ ∑ ⇒ 2 lnL∂ ∂σ = n 2 i4 i 1 1 (x ) 2 = − µ σ ∑ – 2 n 2σ lnL∂ ∂µ = 2 lnL∂ ∂σ = 0 ⇒ µ = n i i 1 1 x n = ∑ σ2 = n 2 i i 1 1 (x ) n = − µ∑ Bằng cách tính tiếp các đạo hàm riêng ta thấy AC – B2 < 0 và A < 0 nên hàm L đạt cực đại tại điểm (µ, σ2) nh trên. Ta có các hàm ước lượng hợp lý tối đa của µ, σ2: µ = n i i 1 1 X n = ∑ (=X ) σ2 = n 2 i i 1 1 (X X) n = −∑ (= 2ˆ S ) 3.1.2 Kiểm định phân phối của ĐLNN Ta kiểm định giả thiết ĐLNN X có quy luật phân phối xác suất Q gồm r tham số chưa biết với mức ý nghĩa α. Các giả thiết: Ho: X có phân phối xác suất theo quy luật Q. H1: X có phân phối xác suất không theo quy luật Q. Giả định Ho đúng, tức là xem X có phân phối Q. Xét mẫu ngẫu nhiên kích thước n. Chia miền giá trị của X thành k tập hợp rời nhau S1, S2,..., Sk. Gọi Ni là số lần X có giá trị thuộc Si, ni là giá trị của Ni ứng với một mẫu cụ thể. Các tham số của quy luật phân phối Q được ước lượng hợp lý tối đa. Đặt pi = P(X∈Si). Khi n đủ lớn (npi ≥ 10 với mọi i) thì ĐLNN k 2 i i ii 1 (N np ) np= −∑ có quy luật phân phối xác suất xấp xỉ với phân phối Chi Bình k–r–1 bậc tự do. Ta có: P( k 2 i i ii 1 (N np ) np= −∑ < χ2α) = 1–α Vậy nếu với một mẫu cụ thể kích thước n, ta thấy = −∑ k 2 i i ii 1 (n np ) np > χ2α thì giả thiết Ho bị bác bỏ. Theo phân tích trên, ta chọn: Tiêu chuẩn kiểm định: G = k 2 i i ii 1 (N np ) np= −∑ Miền bác bỏ Ho: Wα = (χ 2 α, +∞) Vậy thủ tục kiểm định ĐLNN X có phân phối xác suất theo quy luật Q với r tham số chưa biết như sau: Cho trước một mẫu cụ thể kích thước n dạng điểm có tần số (xi, ni) và mức ý nghĩa α. Giả định X có quy luật phân phối Q với r tham số chưa biết. Từ mẫu cụ thể, ước lượng hợp lý tối đa để tính giá trị của r tham số này. Cũng từ mẫu cụ thể, chọn các tập hợp S1, S2,..., Sk phân chia miền giá trị X thành các tập hợp rời nhau. Tính các xác suất pi = P(x∈Si). Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH). Nếu giá trị kiểm định lớn hơn giá trị tới hạn thì bác bỏ Ho (KĐ > TH). Công thức tính giá trị kiểm định: k 2 i i ii 1 (n np ) np= −∑ Giá trị tới hạn: χ2(k–r–1)α Ví dụ (1) Dự đoán điểm thi của các sinh viên có tỷ lệ: Điểm F D C B A Tỷ lệ 5% 20% 35% 30% 10% Sau khi thi, xem điểm của một số sinh viên: Điểm F D C B A Số sinh viên 5 15 40 25 15 Với mức ý nghĩa 5%, hãy cho biết dự đoán có đúng không? Gọi X là điểm của sinh viên gặp ngẫu nhiên. Ta cần kiểm định giả thiết: Ho : X có phân phối như bảng - dự đoán đúng. H1 : X có phân phối khác bảng - dự đoán sai. Miền giá trị của X là tập hợp {F, D, C, B, A}. Dựa theo mẫu cụ thể, chia miền giá trị của X thành 5 tập hợp S1, S2,..., S5. Tính các giá trị pi = P(x∈Si) theo bảng phân phối dự đoán. Lập bảng tính giá trị tới hạn: Si ni pi npi (ni–npi) 2 (ni–npi) 2/npi F 5 5% 5 0 0,00000 D 15 20% 20 25 1,25000 C 40 35% 35 25 0,71429 B 25 30% 30 25 0,83333 A 15 10% 10 25 2,50000 Σ 100 5,29762 Giá trị kiểm định: KĐ = 5,29762 Giá trị tới hạn: k = 5 r = 0 α = 5% ⇒ TH = χ2(k–r–1)α = χ 2 (4)0,05 = 9,48773 =CHIINV(0,05;4) Điều kiện bác bỏ Ho là KĐ > TH không thoả. Quyết định chấp nhận giả thiết Ho. Dự đoán đúng (mức ý nghĩa 5%). (2) Gọi X là lượng khách vào quán trong khoảng thời gian 30 phút. Quan sát 100 lần thì được bảng số liệu sau: X 1 2 3 4 5 Tần số 5 35 30 15 15 Với mức ý nghĩa 5%, hãy cho biết X có phải là ĐLNN có phân phối Poisson không? Ta cần kiểm định giả thiết: Ho : X có phân phối (λ). H1 : X có phân phối không theo quy luật Poisson. Giả định Ho đúng, tức là xem X có phân phối (λ). Tham số λ theo giá trị ước lượng hợp lý tối đa: λ = i i i n x n ∑ ∑ = 3 Miền giá trị của X là tập hợp số nguyên không âm. Dựa theo mẫu cụ thể, chia miền giá trị của X thành 5 tập hợp S1, S2,..., S5. Tính các giá trị pi = P(x∈Si) theo công thức của phân phối (3). Lập bảng tính giá trị tới hạn: Si ni pi npi (ni–npi) 2 (ni–npi) 2/npi ≤ 1 5 0,19915 19,915 222,4572 11,17034 2 35 0,22404 22,404 158,6592 7,08174 3 30 0,22404 22,404 57,69922 2,57540 4 15 0,16803 16,803 3,250809 0,19347 ≥ 5 15 0,18474 18,474 12,06868 0,65328 Σ 100 21,6742

Các file đính kèm theo tài liệu này:

bai_giang_ly_thuyet_xac_suat_chuong_8_kiem_dinh_gia_thiet_th.pdf