Phương pháp ước lượng hợp lý tối đa
Xét ĐLNN X đã biết quy luật phân phối tổng
quát nhưng chưa biết một hay một số tham số. Một
hay một số tham số chưa biết ký hiệu là θ. Miền
chứa các giá trị hợp lệ của θ ký hiệu là Θ.
Xét mẫu cụ thể x1, x2,., xn.
Xét trường hợp X là ĐLNN rời rạc.
Vì chưa biết θ nên giá trị P(X = xi) phụ thuộc θ.
Ta ký hiệu giá trị này là P(xi, θ).
Xác suất xảy ra biến cố (X = x1).(X = x2) (X = xn)
là:L(θ) = P(x1, θ).P(x2, θ).P(xn, θ)
Giá trị θ = θ (x1, x2,., xn) làm cho xác suất của
biến cố tích trên đạt cực đại gọi là giá trị ước
lượng hợp lý tối đa của θ.
Hàm n biến ngẫu nhiên θ = θ (X1, X2,., Xn) gọi
là hàm ước lượng hợp lý tối đa của θ.
θ cũng là điểm mà hàm L đạt cực đại trên miền
Θ. Do L là tích nên để đơn giản hoá việc tìm cực đại,
người ta thường xét hàm lnL.
Trường hợp X là ĐLNN liên tục, giá trị hàm
mật độ lúc này phụ thuộc θ, ta ký hiệu là f(x, θ).
Theo ý nghĩa của hàm mật độ, hàm L sẽ là:
L(θ) = f(x1, θ).f(x2, θ).f(xn, θ)
73 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 461 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất - Chương 8: Kiểm định giả thiết thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định
bác bỏ giả thiết Ho, chấp nhận giả thiết H1.
Các chi tiết sản xuất không đúng chuẩn (với độ tin
cậy 95%).
2.1.2 Kiểm định phải (H1 : µ > µo)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: µ = µo với H1: µ > µo
TH1,2,3 n > 30 hoặc "n ≤ 30, biết σ2 và tổng
thể có phân phối Chuẩn"
Khi một trong các trường hợp trên xảy ra thì với
mẫu ngẫu nhiên kích thước n,
X
/ n
− µ
σ
có phân phối
Chuẩn Chính Tắc hay được xấp xỉ với phân phối
Chuẩn Chính Tắc. Trường hợp chưa biết σ thì thay
bởi S.
Giả định Ho đúng, tức là µ = µo. Do
− µ
σ
oX
/ n
có
phân phối Chuẩn Chính Tắc nên biến cố
− µ
σ
oX
/ n
≤ zα
xảy ra với xác suất 1–α. Vì vậy nếu với một mẫu cụ
thể kích thước n, ta thấy
− µ
σ
ox
/ n
> zα thì đây là điều
vô lý, chứng tỏ giả định µ = µo sai. Vậy nếu dấu hiệu
này xảy ra ta quyết định bác bỏ giả thiết Ho.
Khi
− µ
σ
ox
/ n
> zα xảy ra, tức là khi bác bỏ Ho, thì
ta vẫn có
− µ
σ
x
/ n
≤ zα, do đó
− µ
σ
ox
/ n
>
− µ
σ
x
/ n
. Điều này
chứng tỏ khi bác bỏ giả thiết Ho thì µ > µo.
Vậy ta chọn:
Tiêu chuẩn kiểm định: G =
− µ
σ
oX
/ n
(Nếu chưa biết σ thì thay bởi S)
Miền bác bỏ Ho: Wα = (zα, +∞)
TH4 n ≤ 30, chưa biết phương sai tổng thể
σ2, tổng thể có phân phối Chuẩn
Phân tích tương tự trên với phân phối Student,
ta chọn:
Tiêu chuẩn kiểm định: G =
− µoX
S / n
Miền bác bỏ Ho: Wα = (tα, +∞)
Tóm tắt – Kiểm định phải trung bình tổng thể
(H1: µ > µo)
Cho trước một mẫu cụ thể và mức ý nghĩa α. Ta
tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
(TH). Nếu giá trị kiểm định lớn hơn giá trị tới hạn
thì bác bỏ Ho (KĐ > TH).
Công thức tính giá trị kiểm định:
− µ
σ
ox
/ n
(Nếu chưa biết σ thì thay bởi s)
Giá trị tới hạn được tra theo hai trường hợp:
n > 30 hoặc "n ≤ 30, biết σ2 và tổng thể có
phân phối Chuẩn"
Giá trị tới hạn: zα
n ≤ 30, chưa biết σ2 và tổng thể có phân
phối Chuẩn
Giá trị tới hạn: t(n–1)α
Ví dụ
Trọng lượng của một con gà khi xuất chuồng
được chọn ngẫu nhiên là ĐLNN có phân phối Chuẩn.
Trước đây, trọng lượng trung bình là 1,7Kg. Người ta
áp dụng phương pháp chăn nuôi mới và cân thử 25
con gà xuất chuồng thì tính được trọng lượng trung
bình là 1,87Kg và phương sai là 0,25. Hãy cho nhận
xét về phương pháp chăn nuôi mới với mức ý nghĩa
5%.
Do gà tăng trọng nên ta kiểm định giả thiết:
Ho: µ = µo "Phương pháp chăn nuôi mới không
làm gà tăng trọng"
H1: µ > µo "Phương pháp chăn nuôi mới làm gà
tăng trọng"
Ta có: n = 25 x= 1,87 µo = 1,7 s
2 = 0,25 ⇒ s =
0,5
Giá trị kiểm định: KĐ =
−x 1,7
s / n
= 1,7
Giá trị tới hạn: α = 5% ⇒ TH = t(n–1)α = t(24)0,05 =
1,711
=TINV(0,05*2; 24)
Điều kiện bác bỏ Ho là KĐ > TH không thoả, quyết
định chấp nhận giả thiết Ho.
Phương pháp chăn nuôi mới không làm gà tăng
trọng (với mức ý nghĩa 5%).
2.1.3 Kiểm định trái (H1 : µ < µo)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: µ = µo với H1: µ < µo
Phân tích tương tự trên, ta đi đến kết luận:
TH1,2,3 n > 30 hoặc "n ≤ 30, biết σ2 và tổng
thể có phân phối Chuẩn"
Tiêu chuẩn kiểm định: G =
− µ
σ
oX
/ n
(Nếu chưa biết σ thì thay bởi S)
Miền bác bỏ Ho: Wα = (–∞, –zα)
TH4 n ≤ 30, chưa biết phương sai tổng thể
σ2, tổng thể có phân phối Chuẩn
Tiêu chuẩn kiểm định: G =
− µoX
S / n
Miền bác bỏ Ho: Wα = (–∞, –tα)
Tóm tắt – Kiểm định trái trung bình tổng thể
(H1: µ < µo)
Cho trước một mẫu cụ thể và mức ý nghĩa α. Ta
tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
(TH). Nếu giá trị kiểm định nhỏ hơn giá trị tới hạn
thì bác bỏ Ho (KĐ < TH).
Công thức tính giá trị kiểm định:
− µ
σ
ox
/ n
(Nếu chưa biết σ thì thay bởi s)
Giá trị tới hạn được tra theo hai trường hợp:
n > 30 hoặc "n ≤ 30, biết σ2 và tổng thể có
phân phối Chuẩn"
Giá trị tới hạn: –zα
n ≤ 30, chưa biết σ2 và tổng thể có phân
phối Chuẩn
Giá trị tới hạn: –t(n–1)α
Ví dụ
Mức tiêu hao nguyên liệu để sản xuất một sản
phẩm là ĐLNN có phân phối chuẩn. Mức tiêu hao
trung bình là 1,2Kg với độ lệch chuẩn 3,1Kg. Sau
một thời gian sản xuất, người ta kiểm tra mức sử
dụng nguyên liệu của 25 sản phẩm thì thu được bảng
sau:
Mức NL (Kg) 0,9 1,0 1,1 1,2 1,3
Số sản phẩm 4 5 6 7 3
Với mức ý nghĩa 5%, hãy cho nhận xét về mức
tiêu hao nguyên liệu trung bình.
Do lượng tiêu hao nguyên liệu trung bình giảm nên
ta kiểm định giả thiết:
Ho: µ = µo "Mức tiêu hao nguyên liệu trung bình
không thay đổi"
H1: µ < µo "Mức tiêu hao nguyên liệu trung bình
có giảm"
Ta có: n = 25 x = 1,1 µo = 1,2 σ = 3,1
Giá trị kiểm định: KĐ =
− µ
σ
ox
/ n
= –0,16
Giá trị tới hạn: α = 5% ⇒ TH = –zα = –z0,05 = –1,645
=–NORMSINV(1–0,05)
Điều kiện bác bỏ Ho là KĐ < TH không thoả, quyết
định chấp nhận giả thiết Ho.
Mức tiêu hao nguyên liệu trung bình không thay đổi
(với mức ý nghĩa 5%).
2.2 Kiểm định tỷ lệ tổng thể
Ta chỉ xét trường hợp khi n đủ lớn (npo ≥ 10 và
n(1–po) ≥ 10).
2.2.1 Kiểm định hai phía (H1 : p ≠ po)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: p = po với H1: p ≠ po
Theo giả thiết n đủ lớn,
−
−
F p
p(1 p) / n
được xấp xỉ
bởi phân phối Chuẩn Chính Tắc. Giả định Ho đúng,
tức là p = po,
−
−
o
o o
F p
p (1 p ) / n
có phân phối Chuẩn
Chính Tắc. Vì vậy, với mẫu cụ thể kích thước n, nếu
−
−
o
o o
F p
p (1 p ) / n
> zα/2 thì ta quyết định bác bỏ giả thiết
Ho. Vậy ta chọn:
Tiêu chuẩn kiểm định: G =
−
−
o
o o
F p
p (1 p ) / n
Miền bác bỏ Ho: Wα = (–∞, –zα/2)∩(zα/2, +∞).
Tóm tắt – Kiểm định hai phía tỷ lệ tổng thể
(H1: p ≠ po)
Cho trước một mẫu cụ thể và mức ý nghĩa α.
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
(TH). Nếu giá trị kiểm định có trị tuyết đối lớn hơn
giá trị tới hạn thì bác bỏ Ho (KĐ > TH).
Công thức tính giá trị kiểm định:
−
−
o
o o
f p
p (1 p ) / n
Giá trị tới hạn: zα/2
Ví dụ
Người ta cho rằng tỷ lệ sinh viên trên 35 tuổi là
2%. Điều tra về tuổi của 800 sinh viên thì thấy có 24
sinh viên trên 35 tuổi. Với độ tin cậy 95%, hãy cho
biết ý kiến về tỷ lệ trên.
Ta cần kiểm định giả thiết:
Ho: p = po "Tỷ lệ sinh viên trên 35 tuổi là 2%"
H1: p ≠ po "Tỷ lệ sinh viên trên 35 tuổi không
phải là 2%"
Ta có: n = 800 f = 24/800 po = 2%
Giá trị kiểm định: KĐ =
−
−
o
o o
f p
p (1 p ) / n
= 2,0203
Giá trị tới hạn: 1–α = 95% ⇒ TH = zα/2 = z0,025 = 1,96
=NORMSINV(1–0,025)
Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định
bác bỏ giả thiết Ho, chấp nhận giả thiết H1.
Tỷ lệ sinh viên trên 35 tuổi không phải là 2% (với
độ tin cậy 95%).
2.2.2 Kiểm định phải (H1 : p > po)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: p = po với H1: p > po
Lập luận tương tự trên, ta chọn:
Tiêu chuẩn kiểm định: G =
−
−
o
o o
F p
p (1 p ) / n
Miền bác bỏ Ho: Wα = (zα, +∞)
Tóm tắt – Kiểm định phải tỷ lệ tổng thể
(H1: p > po)
Cho trước một mẫu cụ thể và mức ý nghĩa α.
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
(TH). Nếu giá trị kiểm định lớn hơn giá trị tới hạn
thì bác bỏ Ho (KĐ > TH).
Công thức tính giá trị kiểm định:
−
−
o
o o
f p
p (1 p ) / n
Giá trị tới hạn: zα
Ví dụ
Tỷ lệ sản phẩm có chất lượng cao tại một nhà
máy là 45%. Sau khi cải tiến sản xuất, người ta kiểm
tra ngẫu nhiên 400 lượt sản phẩm thì thấy có 215
sản phẩm có chất lượng cao. Vậy việc cải tiến sản
xuất có làm tăng tỷ lệ sản phẩm có chất lượng cao
không? Hãy cho khẳng định về điều này với mức ý
nghĩa 5%.
Ta cần kiểm định giả thiết:
Ho: p = po "Tỷ lệ sản phẩm có chất lượng cao
không đổi"
H1: p > po "Tỷ lệ sản phẩm có chất lượng cao có
tăng sau khi cải tiến sản xuất"
Ta có: n = 400 f = 215/400 po = 45%
Giá trị kiểm định: KĐ =
−
−
o
o o
f p
p (1 p ) / n
= 3,5176
Giá trị tới hạn: α = 5% ⇒ TH = zα = z0,05 = 1,6449
=NORMSINV(1–0,05)
Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định
bác bỏ giả thiết Ho, chấp nhận giả thiết H1.
Tỷ lệ sản phẩm có chất lượng cao có tăng sau khi cải
tiến sản xuất (với mức ý nghĩa 5%).
2.2.3 Kiểm định trái (H1 : p < po)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: p = po với H1: p < po
Lập luận tương tự trên, ta chọn:
Tiêu chuẩn kiểm định: G =
−
−
o
o o
F p
p (1 p ) / n
Miền bác bỏ Ho: Wα = (–∞, –zα)
Tóm tắt – Kiểm định trái tỷ lệ tổng thể
(H1: p < po)
Cho trước một mẫu cụ thể và mức ý nghĩa α.
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
(TH). Nếu giá trị kiểm định nhỏ hơn giá trị tới hạn
thì bác bỏ giả thiết Ho (KĐ < TH).
Công thức tính giá trị kiểm định:
−
−
o
o o
f p
p (1 p ) / n
Giá trị tới hạn: –zα
Ví dụ
Tỷ lệ người hút thuốt trong một khu dân cư
trước đây là 5%. Sau khi vận động tuyên truyền,
người ta gặp ngẫu nhiên 800 lượt người thì thấy có
24 người vẫn còn hút thuốt. Với mức ý nghĩa 5%, hãy
cho biết:
a) Việc vận động tuyên truyền có làm giảm tỷ lệ
người hút thuốt không?
b) Nếu tuyên bố tỷ lệ người hút thuốt trong khu
dân cư này chỉ còn 2% thì có chấp nhận được không?
a) Ta cần kiểm định giả thiết:
Ho: p = po "Tỷ lệ người hút thuốt không đổi"
H1: p < po "Tỷ lệ người hút thuốt có giảm"
Ta có: n = 800 f = 24/800 po = 5%
Giá trị kiểm định: KĐ =
−
−
o
o o
f p
p (1 p ) / n
= –2,5955
Giá trị tới hạn: α = 5% ⇒ TH = –zα = –z0,05 = –1,6449
=–NORMSINV(1–0,05)
Điều kiện bác bỏ Ho là KĐ < TH thoả, quyết định bác
bỏ giả thiết Ho, chấp nhận giả thiết H1.
Tỷ lệ người hút thuốt có giảm sau khi vận động
tuyên truyền (với mức ý nghĩa 5%).
b) Ta cần kiểm định giả thiết:
Ho: p = po "Tỷ lệ người hút thuốt chỉ còn 2%"
H1: p ≠ po "Tỷ lệ người hút thuốt không phải chỉ
còn 2%"
Ta có: n = 800 f = 24/800 po = 2%
Giá trị kiểm định: KĐ =
−
−
o
o o
f p
p (1 p ) / n
= 2,0203
Giá trị tới hạn: α = 5% ⇒ TH = zα/2 = z0,025 = 1,96
=NORMSINV(1–0,025)
Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định
bác bỏ giả thiết Ho, chấp nhận giả thiết H1.
Tỷ lệ người hút thuốt không phải chỉ còn 2% (với
mức ý nghĩa 5%).
2.3 Kiểm định phương sai tổng thể
Ta chỉ xét trường hợp tổng thể là ĐLNN có
phân phối Chuẩn.
2.3.1 Kiểm định hai phía (H1 : σ 2 ≠ σo2)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: σ
2 = σo
2 với H1: σ
2 ≠ σo
2
ĐLNN
−
σ
2
2
(n 1)S
có phân phối Chi Bình n–1 bậc
tự do. Giả định Ho đúng, tức là σ
2
= σo
2 thì
2
2
o
(n 1)S−
σ
có phân phối Chi Bình n–1 bậc tự do. Ta có:
P(χ21–α/2 <
2
2
o
(n 1)S−
σ
< χ2α/2) = 1–α
Vậy nếu với một mẫu cụ thể kích thước n, ta thấy
−
σ
2
2
o
(n 1)s
> χ2α/2 hay
−
σ
2
2
o
(n 1)s
< χ21–α/2 thì giả thiết Ho
bị bác bỏ.
Theo phân tích trên, ta chọn:
Tiêu chuẩn kiểm định: G =
−
σ
2
2
o
(n 1)S
Miền bác bỏ Ho: Wα = (0, χ
2
1–α/2)∩(χ
2
α/2, +∞)
Tóm tắt – Kiểm định hai phía phương sai tổng
thể (H1 : σ 2 ≠ σo2)
Cho trước một mẫu cụ thể và mức ý nghĩa α.
Tính giá trị kiểm định và tra giá trị tới hạn nhỏ
(THN) và giá trị tới hạn lớn (THL). Nếu giá trị kiểm
định lớn hơn giá trị tới hạn lớn hoặc nhỏ hơn giá trị
tới hạn nhỏ thì bác bỏ Ho (KĐ > THL hoặc KĐ < THN).
Công thức tính giá trị kiểm định:
2
2
o
(n 1)s−
σ
Giá trị tới hạn lớn, nhỏ là χ2(n–1)α/2, χ
2
(n–1)1–α/2.
Ví dụ
Đường kính của một trục máy chọn ngẫu nhiên
là một ĐLNN có phân phối Chuẩn. Độ lệch chuẩn
của máy tiện sản xuất trục máy theo thiết kế là
5mm. Người ta nghi ngờ máy tiện bị hư nên đo thử
đường kính của 20 sản phẩm thì tính được phương
sai mẫu là 27,5. Với mức ý nghĩa 2% hãy cho biết
máy tiện có hoạt động bình thường không?
Ta cần kiểm định giả thiết:
Ho: σ
2
= σo
2 "Máy tiện hoạt động bình thường"
H1: σ
2
≠ σo
2 "Máy tiện bị hư"
Ta có: n = 20 s2 = 27,5 σo
2
= 52 = 25
Giá trị kiểm định: KĐ =
2
2
o
(n 1)s−
σ
= 20,9
Các giá trị tới hạn:
α = 2% ⇒ THL = χ
2
(n–1)α/2 = χ
2
(19)0,01 = 36,1909
=CHIINV(0,01; 19)
THN = χ
2
(n–1)1–α/2 = χ
2
(19)0,99 = 7,6327
=CHIINV(0,99; 19)
Điều kiện bác bỏ Ho là KĐ THL
không thoả, quyết định chấp nhận giả thiết Ho.
Máy tiện hoạt động bình thường (với mức ý nghĩa
2%).
2.3.2 Kiểm định phải (H1 : σ 2 > σo2)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: σ
2 = σo
2 với H1: σ
2 > σo
2
Phân tích tương tự trên, ta chọn:
Tiêu chuẩn kiểm định: G =
−
σ
2
2
o
(n 1)S
Miền bác bỏ Ho: Wα = (χ
2
α, +∞)
Tóm tắt – Kiểm định phải phương sai tổng thể
(H1 : σ 2 > σo2)
Cho trước một mẫu cụ thể và mức ý nghĩa α.
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
(TH). Nếu giá trị kiểm định lớn hơn giá trị tới hạn
thì bác bỏ Ho (KĐ > TH).
Công thức tính giá trị kiểm định:
2
2
o
(n 1)s−
σ
Giá trị tới hạn: χ2(n–1)α
Ví dụ
Chiều cao của một cư dân trưởng thành gặp
ngẫu nhiên là một ĐLNN có phân phối Chuẩn. Mức
chênh lệch chiều cao được đo bằng độ lệch chuẩn. 5
năm trước độ lệch chuẩn là 20cm. Ngày nay, đo
chiều cao của 100 lượt cư dân trưởng thành chọn
ngẫu nhiên thì tính được độ lệch chuẩn là 24,215cm.
Hãy cho kết luận về mức chênh lệch chiều cao hiện
nay với độ tin cậy 95%.
Vì độ lệch chuẩn tăng nên ta kiểm định giả thiết:
Ho: σ
2
= σo
2 "Mức chênh lệch về chiều cao không
đổi so với 5 năm trước"
H1: σ
2
> σo
2 "Mức chênh lệch về chiều cao tăng
so với 5 năm trước"
Ta có: n = 100 s2 = 24,2152 σo
2
= 202
Giá trị kiểm định: KĐ =
2
2
o
(n 1)s−
σ
= 145,126
Giá trị tới hạn: 1–α = 95%
⇒ TH = χ2(n–1)α = χ
2
(99)0,05 = 123,225
=CHIINV(0,05; 99)
Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định
bác bỏ giả thiết Ho, chấp nhận giả thiết H1.
Mức chênh lệch về chiều cao tăng so với 5 năm trước
(với độ tin cậy 95%).
2.3.3 Kiểm định trái (H1 : σ 2 < σo2)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: σ
2 = σo
2 với H1: σ
2 < σo
2
Phân tích tương tự trên, ta chọn:
Tiêu chuẩn kiểm định: G =
−
σ
2
2
o
(n 1)S
Miền bác bỏ Ho: Wα = (0, χ
2
1–α)
Tóm tắt – Kiểm định trái phương sai tổng thể
(H1 : σ 2 < σo2)
Cho trước một mẫu cụ thể và mức ý nghĩa α.
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
(TH). Nếu giá trị kiểm định nhỏ hơn giá trị tới hạn
χ2(n–1)α thì bác bỏ Ho (KĐ < TH).
Công thức tính giá trị kiểm định:
2
2
o
(n 1)s−
σ
Giá trị tới hạn: χ2(n–1)1–α
Ví dụ
Trọng lượng của một con gia súc là một ĐLNN
có phân phối Chuẩn. Mức chênh lệch trọng lượng của
bầy gia súc được đo bằng độ lệch chuẩn. Khi bầy gia
súc được 2 tháng tuổi, người ta cân và tính được độ
lệch chuẩn là 6,253Kg. Khi được 3 tháng tuổi, cân 50
con gia súc chọn ngẫu nhiên thì tính được độ lệch
chuẩn là 5,975Kg. Với mức ý nghĩa 4%, hãy cho kết
luận về mức chênh lệch trọng lượng của bầy gia súc
sau khi nuôi 3 tháng.
Vì độ lệch chuẩn giảm nên ta kiểm định giả thiết:
Ho: σ
2
= σo
2 "Mức chênh lệch trọng lượng bầy
gia súc 3 tháng tuổi không đổi so
với lúc 2 tháng tuổi"
H1: σ
2
< σo
2 "Mức chênh lệch trọng lượng bầy
gia súc 3 tháng tuổi giảm so với
lúc 2 tháng tuổi"
Ta có: n = 50 s2 = 5,9752 σo
2
= 6,2532
Giá trị kiểm định: KĐ =
2
2
o
(n 1)s−
σ
= 44,74
Giá trị tới hạn: α = 4%
⇒ TH = χ2(n–1)1–α = χ
2
(49)0,96 = 33,12
=CHIINV(0,96; 49)
Điều kiện bác bỏ Ho là KĐ < TH không thoả, quyết
định chấp nhận giả thiết Ho.
Mức chênh lệch trọng lượng bầy gia súc 3 tháng tuổi
không đổi so với lúc 2 tháng tuổi (với mức ý nghĩa
4%).
3. Kiểm định phi số
3.1 Kiểm định quy luật phân phối xác suất
3.1.1 Phương pháp ước lượng hợp lý tối đa
Xét ĐLNN X đã biết quy luật phân phối tổng
quát nhưng chưa biết một hay một số tham số. Một
hay một số tham số chưa biết ký hiệu là θ. Miền
chứa các giá trị hợp lệ của θ ký hiệu là Θ.
Xét mẫu cụ thể x1, x2,..., xn.
Xét trường hợp X là ĐLNN rời rạc.
Vì chưa biết θ nên giá trị P(X = xi) phụ thuộc θ.
Ta ký hiệu giá trị này là P(xi, θ).
Xác suất xảy ra biến cố (X = x1).(X = x2)(X = xn)
là:
L(θ) = P(x1, θ).P(x2, θ)...P(xn, θ)
Giá trị θ = θ (x1, x2,..., xn) làm cho xác suất của
biến cố tích trên đạt cực đại gọi là giá trị ước
lượng hợp lý tối đa của θ.
Hàm n biến ngẫu nhiên θ = θ (X1, X2,..., Xn) gọi
là hàm ước lượng hợp lý tối đa của θ.
θ cũng là điểm mà hàm L đạt cực đại trên miền
Θ. Do L là tích nên để đơn giản hoá việc tìm cực đại,
người ta thường xét hàm lnL.
Trường hợp X là ĐLNN liên tục, giá trị hàm
mật độ lúc này phụ thuộc θ, ta ký hiệu là f(x, θ).
Theo ý nghĩa của hàm mật độ, hàm L sẽ là:
L(θ) = f(x1, θ).f(x2, θ)...f(xn, θ)
Ví dụ
(1) Cho biết X~(λ).
a) Tìm hàm ước lượng hợp lý tối đa của λ.
b) Cho mẫu cụ thể của X:
X 1 2 3 4
Tần số 5 4 2 1
Tìm giá trị ước lượng hợp lý tối đa của λ.
a) L(λ) =
1x
1
e
x !
−λλ .
2x
2
e
x !
−λλ ...
nx
n
e
x !
−λλ =
1 2 nx x ... x
n
1 2 n
e
x !x !...x !
+ + +
− λλ
lnL(λ) = –nλ + (Σxi)lnλ – Σlnxi!
⇒
lnL∂
∂λ
= –n +
n
i
i 1
x
=
λ
∑
lnL∂
∂λ
= 0 ⇒ λ =
n
i
i 1
x
n
=
∑
⇒
2
2
lnL∂
∂λ
= –1 < 0
Chứng tỏ hàm L đạt cực đại tại λ =
n
i
i 1
x
n
=
∑
. Vậy
hàm ước lượng hợp lý tối đa của λ là λ =
n
i
i 1
X
n
=
∑
.
b) Với mẫu cụ thể dạng điểm có tần số ta tính được
n = Σni = 12, Σnixi = 10, vậy giá trị ước lượng hợp lý
tối đa của λ theo công thức trên là 10/12 = 0,83.
(2) Cho biết X~upslopeellipsis(µ, σ2). Tìm hàm ước lượng hợp lý
tối đa của µ, σ2.
L(µ, σ2) =
n 2
i
2
i 1
1 (x )
exp
22=
− µ
−
σσ pi
∏
=
( )
n
2
in 2
i 1
1 1
exp (x )
2
2 =
− − µ
σ σ pi
∑
lnL =
n
2
i2
i 1
1
(x )
2 =
− − µ
σ
∑ –
n
2
ln 2σ – nln 2pi
⇒
lnL∂
∂µ
=
n
i2
i 1
1
(x )
2 =
− µ
σ
∑
⇒
2
lnL∂
∂σ
=
n
2
i4
i 1
1
(x )
2 =
− µ
σ
∑ – 2
n
2σ
lnL∂
∂µ
=
2
lnL∂
∂σ
= 0 ⇒ µ =
n
i
i 1
1
x
n =
∑
σ2 =
n
2
i
i 1
1
(x )
n =
− µ∑
Bằng cách tính tiếp các đạo hàm riêng ta thấy
AC – B2 < 0 và A < 0 nên hàm L đạt cực đại tại
điểm (µ, σ2) nh trên.
Ta có các hàm ước lượng hợp lý tối đa của µ, σ2:
µ =
n
i
i 1
1
X
n =
∑ (=X ) σ2 =
n
2
i
i 1
1
(X X)
n =
−∑ (=
2ˆ
S )
3.1.2 Kiểm định phân phối của ĐLNN
Ta kiểm định giả thiết ĐLNN X có quy luật
phân phối xác suất Q gồm r tham số chưa biết với
mức ý nghĩa α. Các giả thiết:
Ho: X có phân phối xác suất theo quy luật Q.
H1: X có phân phối xác suất không theo quy luật
Q.
Giả định Ho đúng, tức là xem X có phân phối Q.
Xét mẫu ngẫu nhiên kích thước n. Chia miền giá trị
của X thành k tập hợp rời nhau S1, S2,..., Sk. Gọi Ni
là số lần X có giá trị thuộc Si, ni là giá trị của Ni ứng
với một mẫu cụ thể.
Các tham số của quy luật phân phối Q được ước
lượng hợp lý tối đa. Đặt pi = P(X∈Si).
Khi n đủ lớn (npi ≥ 10 với mọi i) thì ĐLNN
k 2
i i
ii 1
(N np )
np=
−∑ có quy luật phân phối xác suất xấp xỉ
với phân phối Chi Bình k–r–1 bậc tự do. Ta có:
P(
k 2
i i
ii 1
(N np )
np=
−∑ < χ2α) = 1–α
Vậy nếu với một mẫu cụ thể kích thước n, ta thấy
=
−∑
k 2
i i
ii 1
(n np )
np
> χ2α thì giả thiết Ho bị bác bỏ.
Theo phân tích trên, ta chọn:
Tiêu chuẩn kiểm định: G =
k 2
i i
ii 1
(N np )
np=
−∑
Miền bác bỏ Ho: Wα = (χ
2
α, +∞)
Vậy thủ tục kiểm định ĐLNN X có phân phối
xác suất theo quy luật Q với r tham số chưa biết như
sau:
Cho trước một mẫu cụ thể kích thước n dạng
điểm có tần số (xi, ni) và mức ý nghĩa α. Giả định X
có quy luật phân phối Q với r tham số chưa biết. Từ
mẫu cụ thể, ước lượng hợp lý tối đa để tính giá trị
của r tham số này. Cũng từ mẫu cụ thể, chọn các tập
hợp S1, S2,..., Sk phân chia miền giá trị X thành các
tập hợp rời nhau. Tính các xác suất pi = P(x∈Si).
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
(TH). Nếu giá trị kiểm định lớn hơn giá trị tới hạn
thì bác bỏ Ho (KĐ > TH).
Công thức tính giá trị kiểm định:
k 2
i i
ii 1
(n np )
np=
−∑
Giá trị tới hạn: χ2(k–r–1)α
Ví dụ
(1) Dự đoán điểm thi của các sinh viên có tỷ lệ:
Điểm F D C B A
Tỷ lệ 5% 20% 35% 30% 10%
Sau khi thi, xem điểm của một số sinh viên:
Điểm F D C B A
Số sinh viên 5 15 40 25 15
Với mức ý nghĩa 5%, hãy cho biết dự đoán có
đúng không?
Gọi X là điểm của sinh viên gặp ngẫu nhiên. Ta cần
kiểm định giả thiết:
Ho : X có phân phối như bảng - dự đoán đúng.
H1 : X có phân phối khác bảng - dự đoán sai.
Miền giá trị của X là tập hợp {F, D, C, B, A}. Dựa
theo mẫu cụ thể, chia miền giá trị của X thành 5 tập
hợp S1, S2,..., S5. Tính các giá trị pi = P(x∈Si) theo
bảng phân phối dự đoán. Lập bảng tính giá trị tới
hạn:
Si ni pi npi (ni–npi)
2 (ni–npi)
2/npi
F 5 5% 5 0 0,00000
D 15 20% 20 25 1,25000
C 40 35% 35 25 0,71429
B 25 30% 30 25 0,83333
A 15 10% 10 25 2,50000
Σ 100 5,29762
Giá trị kiểm định: KĐ = 5,29762
Giá trị tới hạn:
k = 5 r = 0 α = 5%
⇒ TH = χ2(k–r–1)α = χ
2
(4)0,05 = 9,48773
=CHIINV(0,05;4)
Điều kiện bác bỏ Ho là KĐ > TH không thoả. Quyết
định chấp nhận giả thiết Ho.
Dự đoán đúng (mức ý nghĩa 5%).
(2) Gọi X là lượng khách vào quán trong khoảng
thời gian 30 phút. Quan sát 100 lần thì được bảng số
liệu sau:
X 1 2 3 4 5
Tần số 5 35 30 15 15
Với mức ý nghĩa 5%, hãy cho biết X có phải là
ĐLNN có phân phối Poisson không?
Ta cần kiểm định giả thiết:
Ho : X có phân phối (λ).
H1 : X có phân phối không theo quy luật Poisson.
Giả định Ho đúng, tức là xem X có phân phối (λ).
Tham số λ theo giá trị ước lượng hợp lý tối đa:
λ =
i i
i
n x
n
∑
∑
= 3
Miền giá trị của X là tập hợp số nguyên không âm.
Dựa theo mẫu cụ thể, chia miền giá trị của X thành
5 tập hợp S1, S2,..., S5. Tính các giá trị pi = P(x∈Si)
theo công thức của phân phối (3). Lập bảng tính giá
trị tới hạn:
Si ni pi npi (ni–npi)
2 (ni–npi)
2/npi
≤ 1 5 0,19915 19,915 222,4572 11,17034
2 35 0,22404 22,404 158,6592 7,08174
3 30 0,22404 22,404 57,69922 2,57540
4 15 0,16803 16,803 3,250809 0,19347
≥ 5 15 0,18474 18,474 12,06868 0,65328
Σ 100 21,6742
Các file đính kèm theo tài liệu này:
- bai_giang_ly_thuyet_xac_suat_chuong_8_kiem_dinh_gia_thiet_th.pdf