Luận văn Kiểm định giả thuyết thống kê và ứng dụng vào kiểm tra hàng hóa

MỤC LỤC

Trang

Chương I: Tổng quan kiểm định giả thuyết thống kê truyền thống. 1

I. Kiểm định giả thuyết thống kê truyền thống. 1

1.1 Những khái niệm về kiểm định giả thuyết thống kê truyền thống.1

1.1.1. Giả thuyếtthống kê . 1

1.1.2. Giả thuyết không(đơn) và giả thuyết ngược lại( đối thuyết). 1

1.1.3. Các loại sai lầm trong việckiểm định giả thuyết thống kê. 2

1.1.4. Miền bác bỏ và miền chấp nhận . 3

1.1.5. Kiểm định một đầu và kiểm định hai đầu . 3

1.2. Các bước của việc kiểm định giả thuyết thống kê .4

1.3. Kiểm định giá trị trung bình µcủa phân phối chuẩn

1.3.1. Các trường hợp. 5

1.3.2. Thí dụ . 6

1.3.3. Thí dụ . 7

1.4. Kiểm định giá trị trung bình µcủa phân phối chuẩn

1.4.1. Các trường hợp. 8

1.4.2. Thí dụ . 9

1.5. Kiểm định phương sai của phân phối chuẩn. 10

1.5.1. Các trường hợp. 11

1.5.2. Thí dụ . 11

1.6 Kiểm định giá trị tỉ số pcủa tập chính trong điều kiện cỡ mẫu lớn. 12

1.6.1. Các trường hợp. 13

1.6.2. Thí dụ . 13

1.7 Kiểm định giả thuyết về qui luật phân phối lý thuyết. 14

1.7.1. Kiểm định tính phù hợp .14

1.7.2. Thí dụ . 15

1.7.3. Kiểm định giả thuyết về qui luật phânphối lý thuyết. 16

1.7.4. Thí dụ (Kiểm định phân phối chuẩn). 17

1.8 Bảng dữ kiện ngẫu nhiên. 20

1.8.1. Bảng dữ liệu ngẫu nhiên hai chiều. 20

1.8.2. Kiểm định giả thuyếtvề tính độc lập giữa hai thuộc tính của tập

hợp chính. 21

1.8.3. Thí dụ . 21

Chương II: Kiểm định giả thuyết thống kê theo phương pháp Bayes. 24

2.1. Kiểm định giả thuyết. 24

2.1.1. Kiểm định giả thuyết truyền thống. 24

2.1.2. Vấn đề của phương pháp truyền thống . 25

2.1.3. Phương pháp Bayes . 26

2.1.4. Thí dụ. 29

2.2. Kiểm định giả thuyết một chiều. 30

2.2.1. Địnhnghĩa. 30

2.2.2. P-giá trị . 31

2.3. Phương pháp Lindley. 32

2.3.1. Sự thỏa hiệp với thống kê truyền thống . 32

2.3.2. Ví dụ . 33

2.3.3. Thảo luận. 34

2.4. Giảthuyết trị không với thông tin tiên nghiệm. 34

2.4.1. Khi nào thì giả thuyết trị không là hợp lý?. 34

2.4.2. Trường hợp hàm hợp lí gần như là hàm hằng . 36

2.4.3. Phương pháp Bayes cho giả thuyết trị không . 37

2.4.4. Thống kê đầy đủ. 38

2.5. Xác định phân giả thuyết cho phân phối chuẩn. 39

2.5.1. Tính toán hệ số Bayes . 39

2.5.2. Ví dụ

2.5.3. Nghịch lý của Lindley . 43

2.5.4. Giới hạn không phụ thuộc vào phân phối tiên nghiệm . 44

2.5.5. Trường hợp không biết phương sai . 44

2.6. Triết lý Doogian. 48

2.6.1. Mô tả phương pháp. 48

2.6.2. Ví dụ. 49

2.6.3. Nghịch lý của Lindley . 43

2.6.4. Giới hạn không phụ thuộc vào phân phối tiên nghiệm . 44

Chương III: Ứng dụng kiểm định giả thuyết vào kiểm tra hàng hóa 50

3.1. Kiểm tra ngẫu nhiên hàng hóa xuất nhập khẩu trong hải quan: trường

hợp mẫu lớn. 50

3.1.1. Đặt vấn đề . 50

3.1.2. Ví dụ

3.1.3. Lời giải bài toán kiểm định giả thuyết thống kê. 51

3.1.4. Các định nghĩa . 52

3.1.5. Lời giải tối ưu. 52

3.1.6. Nhận xét. 53

3.1.7. Các thí dụ. 53

3.1.8. Kếtluận . 54

3.2. Kiểm tra ngẫu nhiên hàng hóa xuất nhập khẩu trong hải quan: trường

hợp mẫu nhỏ. 57

3.2.1. Thảo luận. 57

3.2.2. Đại lượng nhị thức và bài toán kiểm định giả thuyết về tỷ lệ cho

trường hợp mẫu nhỏ. 58

3.2.3. Bài toán kiểm định giả thuyếttrong trường hợp mẫu nhỏ. . 59

3.2.4. Bài toán kiểm tra ngẫu nhiên hàng hoá xuất nhập khẩu cho trường

hợp mẫu nhỏ . 61

3.2.5. Nhận xét. 61

3.2.6. Lời giải tối ưu của bài toán kiểm tra hàng hoá xuất nhập khẩu . 61

3.2.7. Các thí dụ. 62

3.2.8. Thảo luận. 65

3.3. Ứng dụng phương pháp P_ giá trị vào kiểm tra hàng hóa xuất nhập khẩu

trong trường hợp mẫu lớn. 65

3.3.1. Đặt vấn đề. 65

3.3.2. Tổng quanvề phương pháp P_ giá trị. 65

3.3.3. Phương pháp P_ giá trị của trường hợp mẫu lớn trong bài toán

kiểm tra xuất nhập khẩu ở Hảiquan . 66

3.3.4. Các thí dụ . 68

3.4. Kiểm tra ngẫu nhiên hàng hóaxuất nhập khẩu bằng phương pháp

p_ giá trị: trường hợp mẫu nhỏ. 70

3.4.1. Đặt vấn đề. 70

3.4.2. Đại lượng nhị thức tần xuất và bài toán kiểm định giả thiết về tỷ

lệ cho trường hợp mẫu nhỏ . 70

3.4.3. Phương pháp P_ giá trị trong trường hợpmẫu nhỏ cho bài toán

kiểm tra ngẫu nhiên hàng hóa xuất nhập khẩu ở Hải quan . 71

3.4.4. Các thí dụ về kiểm tra ngẫu nhiên hàng hóa xuất nhập khẩu trong

trường hợp mẫu nhỏ bằng phương pháp P_ giá trị . 72

Phụ Lục: Chu trình kiểm tra ngẫu nhiên hàng hóa xuất nhập khẩu

trong hải quan. 76

1.Máy tính xác định mức độ kiểm tra . 76

2.Kiểm tra chi tiết hồ sơ. 77

3.Kiểm tra thực tế hàng hóa. 77

TÀI LIỆU THAM KHẢO

pdf23 trang | Chia sẻ: maiphuongdc | Lượt xem: 5380 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Kiểm định giả thuyết thống kê và ứng dụng vào kiểm tra hàng hóa, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 1 CHƯƠNG I TỔNG QUAN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ TRUYỀN THỐNG ( Tests of Hypotheses) Thông thường đối với tham số θ chưa biết của tập hợp chính ta có thể đưa ra nhiều giả thuyết về θ . Vấn đề đặt ra là làm thế nào kiểm định được giả thuyết nào thích hợp với các số liệu của mẫu quan sát được ( )1 2, ,..., nx x x . I. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ TRUYỀN THỐNG. 1.1 Những khái niệm về kiểm định giả thuyết thống kê truyền thống 1.1.1 Giả thuyết thống kê (Statistical Hypothesis) Là một giả sử hay một phát biểu có thể đúng, có thể sai liên quan đến tham số của một hay nhiều tập hợp chính. 1.1.2 Giả thuyết không (giả thuyết đơn) và giả thuyết ngược lại ( đối thuyết) ( Null Hypothesis and Alternative Hypothesis ) Giả thuyết không: là sự giả sử mà chúng ta muốn kiểm định thường được ký hiệu là 0H . Giả thuyết ngược lại: Việc bác bỏ giả thuyết không sẽ dẫn đến việc chấp nhận giả thuyết ngược lại. Giả thuyết ngược lại thường được ký hiệu là 1H . Ví dụ: Kiểm định giả thuyết 0 0:H θ θ≥ có thể 0θ θ= Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 2 với 1 0:H θ θ< Kiểm định giả thuyết 0 0:H θ θ≤ có thể 0θ θ= với 1 0:H θ θ> Kiểm định giả thuyết 0 0:H θ θ= với 1 0:H θ θ≠ 1.1.3 Các loại sai lầm trong việc kiểm định giả thuyết thống kê Việc kiểm định giả thuyết thống kê có thể phạm phải hai loại sai lầm 1.1.3.1 Sai lầm loại I ( Type I Error ) Là loại sai lầm mà chúng ta phạm phải trong việc bác bỏ giả thuyết 0H khi 0H đúng. Xác suất của việc bác bỏ 0H khi 0H đúng là xác suất của sai lầm loại I và được ký hiệu là α α = P(Bác bỏ 0H / 0H đúng )= P(type I error ) α : còn được gọi là mức ý nghĩa (level of significance) α = 0,05; 0,01; 0,001;… 1.1.3.2 Sai lầm loại II ( Type II error) Là sai lầm mà chúng ta phạm phải khi không bác bỏ giả thuyết 0H khi 0H sai. Xác suất của việc không bác bỏ 0H khi 0H sai là xác suất của sai lầm loại II và được ký hiệu là β . β = P(Không bác bỏ 0H / 0H sai )= P (type II error ) Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 3 Bản chất của 0H Quyết định về giả thuyết không 0H 0H đúng 0H sai Không bác bỏ (chấp nhận) Quyết định đúng Prob =1-α P(Không bác bỏ 0H / 0H đúng)= 1-α Sai lầm loại II Prob = β Bác bỏ Sai lầm loại I Prob = α (α là mức ý nghĩa của kiểm định) Quyết định đúng Prob =1-β (1- β :năng lực của kiểm định) 1.1.4 Miền bác bỏ và miền chấp nhận (Rejection Region and Acceptance Region) Tất cả các giá trị có thể có của đại lượng thống kê trong kiểm định có thể chia làm hai miền: miền bác bỏ và miền chấp nhận. Miền bác bỏ là miền chứa các giá trị làm cho giả thuyết 0H bị bác bỏ. Miền chấp nhận là miền chứa các giá trị giúp cho giả thuyết 0H không bị bác bỏ. Trong thực tế khi 0H không bị bác bỏ cùng nghĩa là nó được chấp nhận. Giá trị chia đôi hai miền được gọi là giá trị giới hạn (critical value) 1.1.5 Kiểm định một đầu và kiểm định hai đầu (One – Tailed Test and Two – Tailed Test) Kiểm định một đầu Khi giả thuyết ngược lại 1H có tính chất một phía (one – sided) thì việc kiểm định được gọi là kiểm định một đầu. Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 4 Ví dụ: 0 0 1 0 : : H H θ θ θ θ =⎧⎨ >⎩ hay 0 0 1 0 : : H H θ θ θ θ =⎧⎨ <⎩ Kiểm định hai đầu Khi giả thuyết ngược lại 1H có tính chất 2 phía ( two – sided) thì việc kiểm định được gọi là kiểm định hai đầu. Ví dụ: 0 0 1 0 : : H H θ θ θ θ =⎧⎨ ≠⎩ 1.2 CÁC BƯỚC CỦA VIỆC KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Gồm 6 bước: Bước 1: Thành lập giả thuyết 0H Ví dụ: 0 0:H θ θ= 0 0:H θ θ≤ 0 0:H θ θ≥ Bước 2: Thành lập giả thuyết 1H Ví dụ: 1 0:H θ θ< 1 0:H θ θ> 1 0:H θ θ≠ Bước 3: Xác định mức ý nghĩa α Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 5 Bước 4: Chọn các tham số thống kê thích hợp cho việc kiểm định và xác định các miền bác bỏ, miền chấp nhận và giá trị giới hạn. Bước 5: Tính toán các giá trị của tham số thống kê trong việc kiểm định dựa trên số liệu của mẫu ngẫu nhiên. Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ thì ra quyết định bác bỏ 0H . Ngược lại sẽ chấp nhận 0H . 1.3 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH μ CỦA PHÂN PHỐI CHUẨN 2( , )N μ σ KHI ĐÃ BIẾT 2σ Cho ( )1 2, ,..., nx x x là mẫu ngẩu nhiên cỡ mẫu n được lấy từ tập hợp chính tuân theo phân phối chuẩn 2( , )N μ σ trong đó 2σ đã biết. Vấn đề : Kiểm định giả thuyết 0 0:H μ μ≤ hay 0μ μ≥ hay 0μ μ= với giả thuyết ngược lại 1 0:H μ μ> hay 0μ μ< hay 0μ μ≠ . Sự kiểm định có mức ý nghĩa là α . Ta có 3 trường hợp: 1.3.1 Các trường hợp : i. 0 0 0 0 1 0 : : : H hay H H μ μ μ μ μ μ = ≥⎧⎨ <⎩ Miền bác bỏ R: Bác bỏ 0H nếu 0 / XZ Z n α μ σ −= < − Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 6 ii. 0 0 0 0 1 0 : : : H hay H H μ μ μ μ μ μ = ≤⎧⎨ >⎩ Miền bác bỏ R: Bác bỏ 0H nếu 0 / XZ Z n α μ σ −= > iii. 0 0 1 0 : : H H μ μ μ μ =⎧⎨ ≠⎩ Miền bác bỏ R: Bác bỏ 0H nếu / 2 / 2Z Z hay Z Zα α> < − với 0 / XZ n μ σ −= α 0.005 0.001 0.025 0.05 0.1 Zα 2.575 2.33 1.96 1.645 1.28 1.3.2 Thí dụ : Trong một nhà máy bánh kẹo, một máy tự động sản xuất ra các thanh Sôcôla với trọng lượng quy định là 250g. Biết rằng trọng lượng các thanh sôcôla được sản xuất ta có phân phối chuẩn 2( ,5 )N μ . Bộ phận kiểm tra kỹ thuật chọn một mẫu ngẫu nhiên gồm 16 thanh sôcôla và tính trọng lượng trung bình của chúng được 244g. Có thể khẳng định máy tự động sản xuất ra các thanh sôcôla có trọng lượng nhỏ hơn quy định không? Với mức ý nghĩa 0.05α = kiểm định giả thuyết thống kê tương ứng. Giải: 1/ 0 0: 250H gμ μ= = Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 7 2/ 1 : 250H gμ < 3/ 0.05α = 4/ 0.05 1.645Z Zα = = 1.645Zα− = − 5/ 0 244 250 4.8 / 5 / 16 XZ n μ σ − −= = = − với 2 25 5σ σ= ⇒ = 016, 244 , 250n X g gμ= = = 6/ 4.8 1.645Z Zα= − < − = − Ra quyết định : Bác bỏ giả thuyết 0H Ư Chấp nhận 1H , nghĩa là máy tự động sản xuất sôcôla có trọng lượng nhỏ hơn qui định. Ư Phải điều chỉnh lại máy. 1.3.3 Thí dụ Một máy khoan trong dây chuyền sản xuất dùng để khoan lỗ trên các bản thép. Khi nhà máy khoan hoạt động đúng chức năng thiết kế, đường kính các lỗ khoan sẽ tuân theo phân phối chuẩn với số trung bình là 2 inchs và độ lệch chuẩn là 0.06 inchs. Trong quá trình kiểm tra định kỳ xem máy khoan có hoạt động đúng hay không, người ta lấy mẫu đo ngẫu nhiên các lỗ đã khoan. Giả sử độ lệch chuẩn không thay đổi. Mẫu ngẫu nhiên gồm 9 lỗ khoan cho ta đường kính trung bìnhcủa mẫu là 1.95 inchs. Hãy Kiễm định giả thuyết 0H : Số trung bình của tập hợp chính là 2 inchs. Với đối thuyết 1H : Số trung bình của tập chính khác 2 inchs. Với mức ý nghĩa 5%α = Giải: 1/ 0 0: 2H μ μ= = Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 8 2/ 1 : 2H μ ≠ 3/ 0.05α = 4/ 2 0.025 1.96Z Zα = = 2 1.96Zα− = − 5/ 0 1.95 2 2.5 / 0.06 / 9 XZ n μ σ − −= = = − với 0.06σ = 09, 1.95, 2n X μ= = = 6/ 22.5 1.96Z Zα= − < − = − Ra quyết định : Bác bỏ giả thuyết 0H với mức ý nghĩa 5%. Ư Chấp nhận 1H , nghĩa là máy hoạt động không đúng chức năng thiết kế. Ư Phải điều chỉnh lại máy. 1.4 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH μ CỦA PHÂN PHỐI CHUẨN 2( , )N μ σ KHI CHƯA BIẾT 2σ Giả sử ta có mẫu ngẫu nhiên cỡ mẫu n được lấy từ tập hợp chính tuân theo phân phối chuẩn có số trung bình là μ . Gọi X và XS là số trung bình và độ lệch chuẩn của mẫu, ta sẽ có 3 trương hợp kiểm định μ với mức ý nghĩa α . 1.4.1 Các trường hợp i. 0 0 0 0 1 0 : : : H hay H H μ μ μ μ μ μ = ≥⎧⎨ <⎩ Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 9 Miền bác bỏ R: Bác bỏ 0H nếu 1 1,n nt t α− −< Với 01 /n x Xt S n μ − −= , 1nt − tuân theo phân phối Student t với độ tự do n -1. ii. 0 0 0 0 1 0 : : : H hay H H μ μ μ μ μ μ = ≤⎧⎨ >⎩ Miền bác bỏ R: Bác bỏ 0H nếu 1 1,n nt t α− −> với 01 /n x Xt S n μ − −= iii. 0 0 1 0 : : H H μ μ μ μ =⎧⎨ ≠⎩ Miền bác bỏ R: Bác bỏ 0H nếu 1 1, / 2n nt t α− −> 1 1, / 2n nt t α− −< − với 01 /n x Xt S n μ − −= 1.4.2 Thí dụ Nhà quản lý các của hàng bán lẻ nhận thấy rằng số lượng hàng bán ra trung bình trong tháng 12 cao hơn 20% so với tháng 11. Theo dõi sổ sách của sáu của hàng ( được chọn một cách ngẫu nhiên) nhà quản lý nhnậ thấy phần trăm độ tăng trung bình của lượng hàng bán ra tại sáu của hàngtrong tháng 12như sau: 19.2%, 18.4%, 20.2%, 20.4%, 19.0%. Kiểm định giải thuyết rằng phần trăm độ tăng trung bình của lượng hàng bán ra trong tháng 12 là 20% so với tháng 11 với 10%α = . Giải: 1/ 0 0: 20H μ μ= = Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 10 2/ 1 : 20H μ ≠ 3/ 10% 0.1α = = 4/ 1, 2 5,0.05 2.015nt tα− = = 1, 2 2.015nt α−− = − 5/ Xác định X và XS ix 2ix 19.2 368.64 18.4 338.56 19.8 392.04 20.2 408.04 20.4 416.16 19.0 361.00 Tổng 117 2284.44 117 19.5 6 ixX n = = =∑ ( ) ( )2 2 2 2 2 1 1 2284.44 6.19.5 1 5 0.588 0.588 0.767 X i X X S x nX n S S = − = −− = ⇒ = = ∑ 6/ 01 19.5 20 1.597 / 0.767 / 6n X Xt S n μ − − −= = = − Ta thấy 1, / 2 1 1, / 2 0.2015 1.597 2.015 n n nt t tα α− − −− < < ⇔ − < − < Ra quyết định : Chấp nhận giả thuyết 0H với mức ý nghĩa 10%. ( Những dữ kiện từ mẫu không đủ mạnh để bác bỏ 0H ) Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 11 1.5 KIỂM ĐỊNH PHƯƠNG SAI CỦA PHÂN PHỐI CHUẨN Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy ra từ tập hợp chính tuấn theo phân phối chuẩn có phương sai là 2σ . Gọi 2XS là phương sai mẫu, ta sẽ có 3 trường hợp kiểm định 2σ với mức ý nghĩa α . 1.5.1 Các trường hợp i. 2 2 2 2 0 0 0 0 2 2 1 0 : : : H hay H H σ σ σ σ σ σ ⎧ = ≥⎪⎨ <⎪⎩ Miền bác bỏ R: Bác bỏ 0H nếu 2 2 1 1,1n n αχ χ− − −< Với ( ) 22 1 2 0 1 X n n Sχ σ− −= , 2 1nχ − tuân theo phân phối 2χ với độ tự do n -1. ii. 2 2 2 2 0 0 0 0 2 2 1 0 : : : H hay H H σ σ σ σ σ σ ⎧ = ≤⎪⎨ >⎪⎩ Miền bác bỏ R: Bác bỏ 0H nếu 2 21 1,1n n αχ χ− − −> iii. 2 2 0 0 2 2 1 0 : : H H σ σ σ σ ⎧ =⎪⎨ ≠⎪⎩ Miền bác bỏ R: Bác bỏ 0H nếu 2 2 2 2 1 1, / 2 1 1,1 / 2n n n nhayα αχ χ χ χ− − − − −> < 1.5.2 Thí dụ Để thỏa mãn tiêu chuẩn đã được ấn định trong hợp đồng là phương sai của hàm lượng độc tố hóa học có trong nước thải trước khi thải ra ngoài sông là không vượt quá 4%. Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 12 Nhân viên môi trường lấy ngẫu nhiên 20 mẫu ở các thời điểm khác nhau để xét nghiệm thì thu được phương sai của hàm lượng độc tố hóa học là 5.62%. Hãy kiễm định giả thuyết phương sai của hàm lượng độc tố hóa học có trong nước thải không vượt quá 4% với 10%α = . Giả sử rằng tập hợp chính tuân theo phân phối chuẩn. Giải: 1/ 2 20 0: 4H σ σ≤ = 2/ 21 : 4H σ > 3/ 2 200.1, 20, 5.62, 4Xn Sα σ= = = = 4/ 2 21, 19,0.1 27.20n αχ χ− = = 5/ 2 2 1 2 0 ( 1) 19*5.62 26.695 4 X n n Sχ σ− −= = = 6/ Ra quyết định : Vì 2 21 1,26.695 27.20n n αχ χ− −= < = Không bác bỏ giả thuyết 0H với mức ý nghĩa 10%. Tức là thỏa mãn tiêu chuẩn là phương sai của hàm lượng độc tố hóa học có trong nước thải không vượt quá 4%. 1.6 KIỂM ĐỊNH GIÁ TRỊ TỈ SỐ p CỦA TẬP CHÍNH TRONG ĐIỀU KIỆN CỠ MẪU LỚN. Gọi p là tỉ số của số lần thành công trong tập hợp chính. f là tỉ số của số lần thành công trong n phép thử. Khi cỡ mẫu n lớn, thì biến ngẫu nhiên chuẩn hóa (1 ) / f pZ p p n −= − sẽ gần đúng có phân phối chuẩn chuẩn tắc. Ta có 3 trường hợp p với mức ý nghĩa α . Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 13 1.6.1 Các trường hợp i. 0 0 0 0 1 0 : : : H p p hay H p p H p p = ≥⎧⎨ <⎩ Miền bác bỏ R: Bác bỏ 0H nếu Z Zα< − Với (1 ) / f pZ p p n −= − , Z tuân theo phân phối chuẩn (0,1)N . ii. 0 0 0 0 1 0 : : : H p p hay H p p H p p = ≤⎧⎨ >⎩ Miền bác bỏ R: Bác bỏ 0H nếu Z Zα> Với (1 ) / f pZ p p n −= − , Z tuân theo phân phối chuẩn (0,1)N . iii. 0 0 1 0 : : H p p H p p =⎧⎨ ≠⎩ Miền bác bỏ R: Bác bỏ 0H nếu / 2 / 2Z Z hay Z Zα α> < − Với (1 ) / f pZ p p n −= − , Z tuân theo phân phối chuẩn (0,1)N . 1.6.2 Thí dụ: Công ty A nhập một lô hàng gồm nhiều kiện hàng qua của khẩu Việt Nam. Nhân viên Hải quan kiểm tra ngẫu nhiên 100 kiện hàng thấy có 95 kiện hàng khai báo đúng. Nhân viên Hải quan này cho rằng có 90% kiện hàng khai Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 14 báo đúng trong toàn bộ lô hàng của công ty A. Hãy kiểm định giả thuyết trên với mức ý nghĩa 10%α = . Giải: 1/ 0 0: 0.90H p p= = 2/ 1 : 90H μ ≠ 3/ 0.1α = 4/ 2 0.05 1.645Z Zα = = 2 0.05 1.645Z Zα− = − = − 5/ 0.95 0.9 5.27 (1 ) / 0.9(1 0.9) /100 f pZ p p n − −= = =− − với 0 95100, 0.90, 0.95 100 n p f= = = = 6/ Ra quyết định : Vì 25.27 1.645Z Zα= > = Bác bỏ giả thuyết 0H với mức ý nghĩa 10%. Tức là lô hàng trên khai báo đúng lớn hơn 90%. 1.7 KIỂM ĐỊNH GIẢ THUYẾT VỀ QUI LUẬT PHÂN PHỐI LÝ THUYẾT 1.7.1 Kiểm định tính phù hợp ( A Goddness – of –Fit Test) Giả sử ta có mẫu ngẫu nhiên với cỡ mẫu là n. Mỗi giá trị quan sát của mẫu ngẫu nhiên có thể xếp vào 1 trong K lớp. Gọi số phần tử của lớp thứ i là , 1, 2,..., .iO i K= Trong việc kiểm định tính phù hợp ta có : 0H : Xác suất để cho các giá trị quan sát rơi vào lớp thứ ( 1,2,..., )ii p i K= = 1H : Xác suất để cho các giá trị quan sát rơi vào lớp thứ ii p≠ R: Bác bỏ 0H nếu 2 21 1,K K αχ χ− −> Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 15 Với ( )22 1 1 k i i K i i O E E χ − = −=∑ • iE : Kỳ vọng của số phần tử trong lờp thứ i. Với giả thuyết 0H ta có .i iE n p= • 2 1Kχ − tuân theo phân phối 2χ với độ tự do là K – 1. 1.7.2 Thí dụ Một công ty chất đốt dựa vào kinh nghiệm trong quá khứ cho rằng đến cuối mùa đông sẽ có 80% lượng khách hàng trả đầy đủ tiền ngay, 10% trả chậm 1 tháng , 6% trả chậm 2 tháng và 4% trả chậm hơn 2 tháng. Đến cuối mùa đông để kiểm định lại điều này , Công ty lấy ngẫu nhiên mẫu gồm 400 khách hàng và nhận thấy có 287 khách trả tiền ngay, 49 trả chậm một tháng, 30 trả chậm 2 tháng và 34 trả chậm hơn 2 tháng. Hỏi những kinh nghiệm trong quá khứ có thể áp dụng cho mùa đông năm nay không? Kiểm định với mức ý nghĩa 5%. Giải: 1/ 0H : Xác suất lượng khách hàng trả tiền ở mùa đông hiện tại phù hợp với các số liệu trong qua khứ. Nghĩa là xác suất tương ứng với 4 loại khách hàng là: 1 2 3 40.8 0.1 0.06 0.04p p p p= = = = 2/ 1 1 2 3 4: 0.8, 0.1, 0.06, 0.04H p p p p≠ ≠ ≠ ≠ 3/ 2 21, 3,0.050.05, 4 7.81Kk αα χ χ−= = ⇒ = = 4/ Dưới giả thuyết 0H , kỳ vọng của số khách hàng trong mỗi loại từ tổng số 400 khách hàng sẽ là: 1 2 3 4 400*0.8 320 400*0.1 40 400*0.06 24 400*0.04 16 E E E E = = = = = = = = Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 16 Ta có : Số tháng trả chậm 0 1 2 >2 Tổng Số khách hàng dự vào mẫu quan sát Oi 287 49 30 34 400 Xác suất pi 0.8 0.1 0.06 0.04 1 Kỳ vọng của số khách hàng trong mỗi loại Ei . 320 40 24 16 400 5/ ( ) ( ) ( ) ( ) ( )2 2 2 2 22 1 1 2 1 287 320 49 40 30 24 34 16 320 40 24 16 27.187 k i i K i i K O E E χ χ − = − − − − − −= = + + + = ∑ 6/ Ra quyết định : Vì 2 21 1,K K αχ χ− −> ⇒ Bác bỏ 0H . Nghĩa là không thể áp dụng kinh nghiệm trong quá khứ vào năm nay. Số lượng khách hàng trả chậm trong năm nay nhiều hơn các năm trước. 1.7.3 Kiểm định giả thuyết về qui luật phân phối lý thuyết Trong việc kiểm định giả thuyết tính phù hợp của số liệu quan sát với qui luật phân phối lý thuyết ta có: 0H : Số liệu quan sát tuân theo qui luật phân phối lý thuyết 1H : Số liệu quan sát không tuân theo qui luật phân phối lý thuyết. Cách tìm miền bác bỏ R bằng kiểm định 2χ 1) Chia n số liệu quan sát làm K khoảng 2) Gọi Oi là số phần tử của mẫu quan sát nằm trong khoảng ( 1,2,..., )i i K= 3) Gọi iE là kỳ vọng của số phần tử nằm trong khoảng i ( iE được tính dựa vào quy luật phân phối lý thuyết). Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 17 .i iE n p= , với ip = xác suất để cho các phần tử nằm trong khoàng i. 4) Tính 2χ ( )22 1 k i i i i O E E χ = −=∑ 2χ gần đúng tuân theo phân phối chi bình phương với độ tự do là υ 1k rυ = − − r : tham số số cần phải ước lượng. • Với phân phối chuẩn r = 2 • Với phân phối Possion r = 1 5) Tìm miền bác bỏ R Nếu 2 2,υ αχ χ> ta bác bỏ giả thuyết 0H , Nghĩa là số liệu quan sát không tuần theo quy luật phân phối lý thuyết đã định -> Đi tìm quy luật phân phối lý thuyết khác. 1.7.4 Thí dụ: Kiểm định phân phối chuẩn Để đo lường chất lượng của 1 lô sản phẩm, người ta lấy ra đo 200 chi tiết và cho kết quả như sau: Các lớp Số chi tiết quan sát được iO 54.795 54.800 54.805 54.805 54.810 54.815 54.815 54.820 54.825 54.825 54.830 54.835 54.835 54.840 54.845 6 14 33 47 45 Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 18 54.845 54.850 54.855 54.855 54.860 54.865 54.865 54.870 54.875 33 15 7 n = 200 Vấn đề đặt ra là các số liệu quan sát được có tuân theo phân phối chuẩn không? Giải: 1/ 0H : Số liệu quan sát tuân theo qui luật phân phối chuẩn 2/ 1H : Số liệu quan sát không tuân theo qui luật phân phối chuẩn 3/ Tính iE .i iE n p= với ( ) 11 i ii i i x xp p x x x p Zμ μσ σ++ − −⎛ ⎞= < < = < <⎜ ⎟⎝ ⎠ ở đây lấy 54.835Xμ = = (số trung bình của mẫu) 0.016XSσ = = ( độ lệch của mẫu) Giả sử ta tính 1 1,p E ( )1 1 1 1 54.795 54.835 54.805 54.83554.795 54.805 0.016 0.016 ( 2.5 1.88) 0.4938 0.4699 0.0239 * 200*0.0239 4.78 p p X p Z p Z p E n p − −⎛ ⎞= < < = < <⎜ ⎟⎝ ⎠ = − < < − = − = ⇒ = = = Tính tương tự ta được: Các lớp Kỳ vọng của số phần tử nằm trong lớp i iE (−∞ 54.805) 54.795 - 54.805 54.805 - 54.815 54.815 - 54.825 54.825 - 54.835 4.78 6.02 14.74 31.46 46.18 Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 19 46.74 32.52 15.76 6.58 5.20 54.835 - 54.845 54.845 - 54.855 54.855 - 54.865 54.865 - 54.875 (54.865 +∞ Tổng 200n ≈ ( 197.38)n = 4/ Tính 2χ iO iE ( )i iO E− ( )2i iO E− ( )2i i i O E E − 6 14 33 47 45 33 15 7 6.02 14.74 31.46 46.18 46.74 32.52 15.76 6.58 -0.02 -0.74 1.54 0.82 -1.74 0.48 -0.76 0.42 0.0004 0.5476 2.3716 0.6724 3.0276 0.2304 0.5776 0.1764 0 0.037 0.075 0.014 0.069 0.007 0.036 0.027 n = 200 2χ = 0.265 5/ Tính 2,υ αχ : 1 8 2 1 5K rυ = − − = − − = Số lớp K = 8, r = 2 (phân phối chuẩn), 0.05α = Tra bảng 25,0.05 11.0706χ = 6/ Ra quyết định : Vì 2 25,0.050.265 11.0706χ χ= < = Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 20 Ư Không bác bỏ 0H Ư Số liệu quan sát tuân theo phân phối chuẩn. 1.8 BẢNG DỮ KIỆN NGẪU NHIÊN (Comtingency Tables) 1.8.1 Bảng dữ liệu ngẫu nhiên hai chiều ( Two Way Contingency Tables) Nếu các dữ kiện của biến ngẫu nhiên được xếp loại theo hai tiêu chuẩn thì các dữ kiện sẽ được trình bày trong bảng gồm hàng và cột gọi là bảng dữ kiện ngẫu nhiên hai chiều. Tổng quát, bảng ngẫu nhiên hai chiều gồm r hàng và c cột được trình bày như sau: Cột Hàng 1 2 3 …… c Tổng theo hàng 1 2 3 M 11O 12O 13O ……… 1cO 21O 22O 23O ……… 2cO 31O 32O 33O ……… 3cO M M M ……… M 1R 2R 3R M r 1rO 2rO 3rO ……… rcO rR Ký hiệu: ijO : Số dữ kiện quan sát ở hàng i cột j iR : Tổng các dữ kiện quan sát ở hàng i iC : Tổng các dữ kiện quan sát ở cột j n: cở mẫu i in R C= =∑ ∑ Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 21 1.8.2 Kiểm định giả thuyết về tính độc lập giữa hai thuộc tính của tập hợp chính Trong việc kiểm định giả thuyết về tính độc lập giữa 2 thuộc tính của tập hợp chính ta có : 0H : Các tiêu chuẩn được phân loại theo hàng và cột độc lập với nhau 1H : Các tiêu chuẩn được phân loại theo hàng và cột phụ thuộc với nhau R: Bác bỏ giả thuyết 0H nếu 2 2,υ αχ χ≥ ( )22 , ij ij i j ij O E E χ −=∑ ijE : là kỳ vọng của phần tử ở hàng i, cột j . * * * * * i ji iij ij i j R CR CE p n p p n n n n n = = = = .i j ij R C E n ⇒ = 2χ : tuân theo phân phối Chi – bình phương với độ tự do là υ 1.8.3 Thí dụ Để đánh giá hiệu quả làm tăng chất lượng của một biện pháp công nghệ mới trên một dây chuyền sản xuất, người ta thu thập được các số liệu sau: Chấtlượng Công nghệ Phế phẩm ( cái) Chính phẩm ( cái) Tổng số ( cái ) Sau khi thay đổi công nghệ 8 192 200 Trước khi thay đổi công nghệ 92 708 800 Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 22 Tổng số 100 900 1000 Vấn đề đặt ra là việc áp dụng công nghệ mới và chất lượng có liên quan hay không? ( với 0.05α = ) Giải: 1/ 0H : Công nghệ mới độc lập với chất lượng 2/ 1H : Chất lượng phụ thuộc công nghệ mới 3/ Tính :ijE • Tỉ lệ phế phẩm 100 10% 1000 = • Tỉ lệ chính phẩm 900 90% 1000 = Chất lượng Công nghệ Phế phẩm ( cái) Chính phẩm ( cái) Tổng số ( cái ) Sau khi thay đổi công nghệ 10200* 20 100 = 90200* 180 100 = 200 Trước khi thay đổi công nghệ 10800* 80 100 = 90200* 720 100 = 800 Tổng số 100 900 1000 4/ Tính 2χ : ( ) ( ) ( ) ( ) ( )2 2 2 2 22 , 2 8 20 92 80 192 180 708 720 20 80 180 720 10 ij ij i j ij O E E χ χ − − − − −= = + + + = ∑ 5/ Tính 2,υ αχ Ta có 0.05α = , ( 1)( 1) (2 1)(2 1) 1r cυ = − − = − − = Tổng quan kiễm định giả thuyết thống kê truyền thống Trang 23 Tra bảng 21,0.05 3.84χ = 6/ Ra quyết định: Vì 2 21,0.0510 3.84χ χ= > = Ư Bác bỏ giả thuyết 0H Nghĩa là việc áp dụng công nghệ mới đã làm tăng chất lượng sản phẩm.

Các file đính kèm theo tài liệu này:

  • pdf5_2.pdf
  • pdf1_3.pdf
  • pdf2_2.pdf
  • pdf3.pdf
  • pdf4.pdf
  • pdf6_4.pdf
  • pdf7.pdf
  • pdf8.pdf
  • pdf9.pdf
  • pdfBIA_Trong.pdf
Tài liệu liên quan