Giáo trình Ước lượng và kiểm định trong thống kê

Trang phụ bìa

Lời cảm ơn

Mục lục

Lời giới thiệu

CHƯƠNG 1 : CÁC KHÁI NIỆM.1

1. 1 Véc tơ ngẫu nhiên nhiều chiều .1

1. 1. 1 Véc tơ ngẫu nhiên nhiều chiều .1

1. 1. 1. 1 Định nghĩa .1

1. 1. 1. 2 Hàm phân phối xác suất .1

1. 1. 1. 3 Phân phối xác suất .1

1. 1. 2 Vector trung bình – vector kỳ vọng.2

1. 2 Ma trận hiệp phương sai.5

1. 2. 1 Ma trận hiệp phương sai mẫu .5

1. 2. 2 Ma trận hiệp phương sai tổng thể.6

1. 2. 3 Ma trận tương quan .7

1. 2. 4 Vector trung bình - ma trận hiệp phương sai cho nhiều nhóm con của các

biến .10

1. 2. 4. 1 Hai nhóm .10

1. 2. 4. 2 Ba hoặc nhiều các nhóm hơn.14

1. 3 Sự kết hợp tuyến tính giữa các biến .15

1. 3. 1 Tính chất của mẫu.15

1. 3. 2 Tính chất của tổng thể .22

1. 4 Hàm mật độ của một đại lượng ngẫu nhiên nhiều chiều.24

1. 4. 1 Định nghĩa .24

1.4.2 Tính chất.24

1. 5 Phân phối đại lượng ngẫu nhiên nhiều chiều .24

1. 5. 1 Định nghĩa .24

1. 5. 2 Tính chất .251. 6 Phân phối chuẩn nhiều chiều.26

1. 6. 1 Hàm mật độ phân phối chuẩn một biến.27

1. 6. 2 Hàm mật độ của phân phối chuẩn nhiều chiều.28

1. 6. 3 Tổng quát hóa phương sai tổng thể .28

1. 6. 4 Tính chất phân phối chuẩn của biến ngẫu nhiên nhiều chiều.30

1. 6. 5 Ước lượng trong phân bố chuẩn nhiều chiều .36

1. 6. 5. 1 Ước lượng hợp lý tối đa (MLE) .36

1. 6. 5. 2 Phân phối của y và S .38

CHƯƠNG 2 : ƯỚC LƯỢNG KHÔNG CHỆCH TUYẾN TÍNH.40

2. 1 Mô hình thống kê tuyến tính tổng quát hạng đầy đủ.40

2. 2 Ước lượng không chệch cho mô hình thống kê tuyến tính tổng quát hạng đầy

đủ .42

2. 2. 1 Định lí 2.1 (Gauss – Markov).42

2. 2. 2 Bổ đề 2.1.43

2. 2. 3 Hệ quả 2.1.44

2. 3 Mô hình thống kê tuyến tính với hạng không đầy đủ .46

2. 4 Ước lượng không chệch cho mô hình thống kê tuyến tính hạng không đầy đủ .

.46

2. 4. 1 Định lí 2.2 .46

2. 4. 2 Bổ đề 2.2.47

2. 4. 3 Định lí 2.3 ( Gauss – Markov ).48

2. 4. 4 Ước lượng bình phương bé nhất mở rộng .49

2. 4. 5 Tổ hợp tuyến tính tốt nhất của thống kê thứ tự .52

2. 5 Ứng dụng trong mô hình ước lượng tham số hồi quy nhiều chiều .59

2. 5. 1 Hàm hồi quy tổng thể (PRF).59

2. 5. 2 Dạng ma trận của hàm hồi quy.60

2. 5. 2. 1 Hàm hồi quy tổng thể PRF .60

2. 5. 2. 2 Hàm hồi quy mẫu SRF .60

2. 5. 3 Ước lượng bình phương bé nhất thông thường (OLS).61

165 trang | Chia sẻ: trungkhoi17 | Lượt xem: 1071 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Giáo trình Ước lượng và kiểm định trong thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

∂ ∂ ∂ ∂∂β ∂β ∂β ∂β ∂β" " k tk của hàm mục tiêu l ( )n n 22t 0 1 2 kt t1 t2 t 1 t 1 ESS U Y X X X = = = = −β −β −β − −β∑ ∑ . Ta có: ( ) ( )n 20 1 2 i kt t1 t2 ti tk t 10 n n n n n n 0 1 2 i kt t1 t2 ti t 1 t 1 t 1 t 1 t 1 t 1 ESS 2 Y X X X X . 1 2 Y X X X X = = = = = = = ∂ = −β −β −β − −β − −β −∂β ⎛ ⎞⎟⎜=− − β −β −β − −β − −β ⎟⎜ ⎟⎜ ⎟⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ ∑ tk ( ) ( )n 20 1 2 i kt t1 t2 ti tk t 11 n n n n 2 0 1 2t t1 t1 t1 t2 t1 t 1 t 1 t 1 t 1 n n i kit 1t tk t1 t 1 t 1 ESS 2 Y X X X X . X Y .X X X X .X 2 X .X X .X = = = = = = = ∂ = −β −β −β − −β − −β −∂β ⎛ ⎞⎟⎜ −β −β −β −⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜=− ⎟⎜ ⎟⎜ ⎟⎟⎜ −β − −β ⎟⎜ ⎟⎜ ⎟⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ ∑ t1 __________________________________________________________________ 64 Chương 2 ( ) ( )n 20 1 2 i kt t1 t 2 ti tk t 12 n n n n 2 0 1 2t t 2 t1 t1 t2 t 2 t 1 t 1 t 1 t 1 n n i kti t 2 tk t2 t 1 t 1 ESS 2 Y X X X X . X Y .X X X .X X 2 X .X X .X = = = = = = = ∂ = −β −β −β − −β − −β −∂β ⎛ ⎞⎟⎜ −β −β −β − ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜=− ⎟⎜ ⎟⎜ ⎟⎟⎜−β − −β ⎟⎜ ⎟⎜ ⎟⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ ∑ t 2 ( ) ( )n 20 1 2 i kt t1 t 2 ti tk t 1i n n n n 0 1 2t ti ti t1 ti t 2 ti t 1 t 1 t 1 t 1 n n 2 i kti tk ti t 1 t 1 ESS 2 Y X X X X . X Y .X X X .X X .X 2 X X .X = = = = = = = ∂ = −β −β −β − −β − −β −∂β ⎛ ⎞⎟⎜ −β −β −β − ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜=− ⎟⎜ ⎟⎜ ⎟⎟⎜−β − −β ⎟⎜ ⎟⎜ ⎟⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ti ( ) ( )n 20 1 2 i kt t1 t2 ti tk t 1k ESS 2 Y X X X X . X = ∂ = −β −β −β − −β − −β −∂β ∑ tk n n n n 0 1 2t tk tk t1 tk t 2 tk t 1 t 1 t 1 t 1 n n 2 i kti tk tk t 1 t 1 Y .X X X .X X .X 2 X .X X = = = = = = ⎛ ⎞⎟⎜ −β −β −β − ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜=− ⎟⎜ ⎟⎜ ⎟⎟⎜−β − −β ⎟⎜ ⎟⎜ ⎟⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ Hàm mục tiêu đạt cực trị khi các đạo hàm riêng = 0 ESS 0∂⇔ =∂β ( ) T T 1 k 0 1 2 i k 1 k ESS ESS ESS ESS ESS; ; ; ; ; ; 0;0;0; ;0; ;0 × × ⎛ ⎞∂ ∂ ∂ ∂ ∂ ⎟⎜ ⎟⇔ =⎜ ⎟⎜ ⎟⎜ ∂β ∂β ∂β ∂β ∂β⎝ ⎠" " " " Hiệp nhất các thành phần, ta có : 0 1 2 i k ESS ESS ESS ESS ESS0; 0; 0; ; 0; ; 0∂ ∂ ∂ ∂ ∂⇒ = = = = =∂β ∂β ∂β ∂β ∂β" " __________________________________________________________________ 65 Chương 2 n n n n 0 1 2t t1 t2 t 1 t 1 t 1 t 1 n n i kti tk t 1 t 1 t Y X X 2 0 X X .............................................................................................. Y .X 2 = = = = = = ⎛ ⎞⎟⎜ − β −β −β −⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟− =⎜ ⎟⎜ ⎟⎟⎜ ⎟−β − −β⎜ ⎟⎜ ⎟⎜⎝ ⎠ − ⇔ ∑ ∑ ∑ ∑ ∑ ∑ n n n n 2 0 1 2t1 t1 t1 t2 t1 t 1 t 1 t 1 t 1 n n i kti t1 tk t1 t 1 t 1 X X X .X 0 X .X X .X ....................................................................................... = = = = = = ⎛ ⎞⎟⎜ −β −β −β −⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟=⎜ ⎟⎜ ⎟⎟⎜ ⎟−β − −β⎜ ⎟⎜ ⎟⎜⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ n n n n 2 0 1 2t t2 t1 t1 t2 t2 t 1 t 1 t 1 t 1 n n i kti t2 tk t2 t 1 t 1 ................ Y .X X X .X X 2 0 X .X X .X ................................................................. = = = = = = ⎛ ⎞⎟⎜ −β −β −β −⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟− =⎜ ⎟⎜ ⎟⎟⎜ ⎟−β − −β⎜ ⎟⎜ ⎟⎜⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ n n n n 0 1 2t ti ti t1 ti t 2 ti t 1 t 1 t 1 t 1 n n 2 i kti tk ti t 1 t 1 ......................................... Y .X X X .X X .X 2 0 X X .X ........................................ = = = = = = ⎛ ⎞⎟⎜ −β −β −β −⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟− =⎜ ⎟⎜ ⎟⎟⎜ ⎟−β − −β⎜ ⎟⎜ ⎟⎜⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ n n n n 0 1 2t tk tk t1 tk t2 tk t 1 t 1 t 1 t 1 n n 2 i kti tk tk t 1 t 1 .................................................................. Y .X X X .X X .X 2 0 X .X X = = = = = = ⎧⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪ ⎨ ⎛ ⎞⎟⎜ −β −β −β −⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟− =⎜ ⎟⎜ ⎟⎟⎜ ⎟−β − −β⎜ ⎟⎜ ⎟⎜⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ ⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪ ⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎩ __________________________________________________________________ 66 Chương 2 n n n n n n 0 1 2 i kt t1 t2 ti t 1 t 1 t 1 t 1 t 1 t 1 t t1 t Y X X X X .......................................................................................................................... Y .X = = = = = = − β −β −β − −β − −β = ⇔ ∑ ∑ ∑ ∑ ∑ ∑ n n n n 2 0 1 2t1 t1 t2 t1 1 t 1 t 1 t 1 n n i kti t1 tk t1 t 1 t 1 n n 0 1t t2 t1 t 1 t 1 X X X .X X .X X .X 0 .......................................................................................... Y .X X = = = = = = = = −β −β −β − −β − −β = −β −β ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ n n 2 2t1 t2 t2 t 1 t 1 n n i kti t2 tk t2 t 1 t 1 n n n n 0 1 2t ti ti t1 ti t2 ti t 1 t 1 t 1 t 1 n n 2 i kti tk ti t 1 t 1 X .X X X .X X .X 0 Y .X X X .X X .X X X .X 0 = = = = = = = = = = −β − −β − −β = −β −β −β − −β − −β = ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ """""""""""""""""""""""" """"""""""""""""""""""" n n n n 0 1 2t tk tk t1 tk t2 tk t 1 t 1 t 1 t 1 n n 2 i kti tk tk t 1 t 1 Y .X X X .X X .X X .X X 0 = = = = = = ⎧⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪ −β −β −β −⎪⎪⎪⎪⎪⎪⎪ −β − −β =⎪⎪⎪⎪⎪⎪⎩ ∑ ∑ ∑ ∑ ∑ ∑ " tk 0 __________________________________________________________________ 67 Chương 2 n n n n 0 1 2 i kt t1 t2 ti t 1 t 1 t 1 t 1 t 1 n n n n 2 0 1 2t t1 t1 t1 t2 t1 t 1 t 1 t 1 t 1 n n i kti t1 tk t1 t 1 t 1 n n n 2 0 1 2t t2 t1 t1 t2 t2 t 1 t 1 t 1 Y n X X X X Y .X X X X .X X .X X .X Y .X X X .X X = = = = = = = = = = = = = = β +β +β + +β + +β =β +β +β + +β + +β =β +β +β ⇔ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ n t 1 n n i kti t 2 tk t2 t 1 t 1 n n n n 0 1 2t ti ti t1 ti t2 ti t 1 t 1 t 1 t 1 n n 2 i kti tk ti t 1 t 1 n 0t tk t 1 X .X X .X Y .X X X .X X .X X X .X Y .X = = = = = = = = = = + +β + +β =β +β +β + +β + +β =β ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ """""""""""""""""""""""""""" """""""""""""""""""""""""""" n n n 1 2tk t1 tk t2 tk t 1 t 1 t 1 n n 2 i kti tk tk t 1 t 1 X X .X X .X X .X X = = = = = ⎧⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪ +β +β +⎪⎪⎪⎪⎪⎪⎪ +β + +β⎪⎪⎪⎪⎪⎪⎪⎩ ∑ ∑ ∑ ∑ ∑ n tk = ∑ ,Y ⎛ ⎞ =⎜ ⎟ ⎝ ⎠ Ta có hệ phương trình chuẩn cần chứng minh 2. 5. 3. 3 Nghiệm hệ phương trình chuẩn Trong chương 2, chúng ta có: 011 12 1k 1 21 22 2k 21 n1 n2 nk nn k n 1k k 1 1 X X X Y 1 X X X Y X , 1 X X X Y× ×× ⎛ ⎞β⎛ ⎞ ⎟⎜⎟ ⎟⎟⎜ ⎜⎜⎟ ⎟⎟⎜ ⎜⎜⎟ ⎟⎟⎜ ⎜⎜⎟ ⎟⎟β⎜ ⎜⎜⎟ ⎟⎟⎜ ⎜⎜⎟ ⎟⎟= β=⎜ ⎜⎟ ⎟⎜ ⎟⎜ ⎟ ⎟⎜⎟ ⎟⎟⎜ ⎜⎜⎟ ⎟⎟⎜ ⎜⎜⎟ ⎟⎟⎜ ⎜⎜⎟ ⎟⎜ ⎜⎟⎝ ⎠ ⎜ ⎟β⎝ ⎠ " " # # # % # ## " __________________________________________________________________ 68 Chương 2 11 21 n1 T 12 22 n2 1k 2k nk k n 1 1 1 X X X X X X X X X X × ⎛ ⎞⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⇒ = ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎟⎜⎝ ⎠ " " " # # % # " 11 12 1k 11 21 n1 21 22 2kT 12 22 n2 n1 n2 nk n k 1k 2k nk k n 1 1 1 1 X X X X X X 1 X X X X X X X X 1 X X X X X X ×× ⎛ ⎞⎟⎜ ⎛ ⎞⎟⎜ ⎟ ⎟⎜⎜ ⎟ ⎟⎜⎜ ⎟ ⎟⎜⎜ ⎟ ⎟⎜⎜ ⎟ ⎟⎜⎜ ⎟ ⎟⇒ × = ×⎜⎟ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎟⎜⎜ ⎟ ⎟⎜⎜ ⎟ ⎟⎜⎜ ⎟⎜⎟ ⎝ ⎠⎜ ⎟⎟⎜⎝ ⎠ " "" "" # # # % ## # % # "" n n n t1 t 2 tk t 1 t 1 t 1 n n n n 2 t1 t1 t1 t 2 t1 tk t 1 t 1 t 1 t 1 n n n n 2 t 2 t 2 t1 t 2 t2 tk t 1 t 1 t 1 t 1 n n n n 2 tk tk t1 tk t2 tk t 1 t 1 t 1 t 1 n X X X X X X .X X .X X X .X X X .X X X .X X .X X = = = = = = = = = = = = = = = ⎛ ⎞⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎟⎜ ⎟⎜⎜⎜⎜⎜⎜=⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝ ⎠ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ " " " # # # % # " k k× ⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ và n t t 1 n 1 t t1 t 111 21 n1 2T n 12 22 n2 t t2 t 1 n n 1 1k 2k nk k n n t tk t 1 Y 1 1 1 Y Y .X X X X Y X Y X X X Y .X Y X X X Y .X = = = × × = ⎛ ⎞⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎛ ⎞ ⎜ ⎟⎟ ⎜⎜ ⎛ ⎞⎟ ⎜⎜ ⎟ ⎟⎜ ⎜⎜ ⎟ ⎟⎜ ⎜⎜ ⎟ ⎟⎜ ⎜⎜ ⎟ ⎟⎜ ⎜⎜ ⎟ ⎟⎜ ⎜⎜ ⎟ ⎟× = × =⎜⎟ ⎟ ⎜⎜ ⎟ ⎜ ⎟ ⎜⎜ ⎟ ⎟⎜ ⎜⎜ ⎟ ⎟⎜ ⎜⎜ ⎟ ⎟⎜ ⎜⎜ ⎟⎜⎟ ⎝ ⎠ ⎜⎜ ⎟⎟ ⎜⎜⎝ ⎠ ⎜⎜⎜⎜⎜⎜⎜⎝ ⎠ ∑ ∑ ∑ ∑ " " " ## # % # #" k 1× ⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ Do đó, ta suy ra dạng ma trận của __________________________________________________________________ 69 Chương 2 T T T 0 1 2 i k ESS ESS ESS ESS ESS ESS; ; ; ; ; 2X .Y 2X .X. ⎛ ⎞∂ ∂ ∂ ∂ ∂ ∂ ⎟⎜ ⎟= =⎜ ⎟⎜ ⎟⎜∂β ∂β ∂β ∂β ∂β ∂β⎝ ⎠ " " − + β : Hàm mục tiêu đạt cực trị khi các đạo hàm riêng bằng = 0 ESS 0∂⇔ =∂β T T T2X .Y 2X .X. 0 X .X. X .Y⇔− + β= ⇔ β= T ⎟ ( ) 1T TX .X .X .Y−⇔ β= Vì là bộ n giá trị của (k + 1) biến độc lập 11 12 1k 21 22 2k n1 n2 nk n k 1 X X X 1 X X X X 1 X X X × ⎛ ⎞⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟=⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜⎝ ⎠ " " # # # % # " Ù rankX = (k + 1) Ù ( là khả nghịch ) 1TX .X − Vậy ước lượng ( ) 1T TX .X .X .Y−β= 2. 5. 3. 4 Điều kiện đủ Ước lượng là ước lượng cực tiểu của hàm mục tiêu ESS ( ) 1TX .X .X .Y−β= T * Chứng minh Ta tính đạo hàm cấp hai ESS . ∂ ∂β∂β của hàm mục tiêu ESS Từ T TESS 2X .Y 2X .X.∂ =− + β∂β suy ra TESS 2X .X . ∂ =∂β∂β Gọi vectơ thực khác ( ) 1 2 T 1 2 k 1 k k k 1 c c 0,c c c c c c × × ⎛ ⎞⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟= ⇒ =⎜ ⎟⎜ ⎟⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜⎝ ⎠ G "# Xét dạng toàn phương: __________________________________________________________________ 70 Chương 2 ( ) ( ) T T (1 k) (k n) (n k) (k 1) T 1 n n 1 W c .X .X .c X.c . X.c × × × × × = = × Đặt vectơ Æ 1 2 (n k) (k 1) n n 1 v v v X .c v × × × ⎛ ⎞⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟= =⎜ ⎟⎜ ⎟⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜⎝ ⎠ # n T 2 t t 1 W v .v v 0 = = = ≥∑ Nếu vectơ v 0 X.c 0= ⇔ =G G Æ tồn tại tổ hợp tuyến tính giữa các cột trong ma trận X bằng 0 Æ mâu thuẫn rankX = (k + 1) Æ Æ W là xác định dương Æ n T 2 t t 1 W v .v v 0 = = = >∑ ESS. ∂ ∂β∂β là xác định dương Æ Ước lượng cực trị ( ) 1T TX .X .X .Y−β= là ước lượng cực tiểu của hàm mục tiêu ESS. Ví dụ 2.3: Từ số liệu của một mẫu gồm 8 quan sát, người ta tính được các tổng sau : 2 2 2 1 2 1 256; 48; 24; 420; 300; 80i i i i i iY X X Y X X∑ = ∑ = ∑ = ∑ = ∑ = ∑ = 1 2 1 2135; 354; 154i i i i i iX X X Y X Y∑ = ∑ = ∑ = Trong đó : là lượng hàng bán được của một loại hàng , đơn vị tính là tấn/tháng Y : là thu nhập của người tiêu dùng , đơn vị tính là triệu đồng/tháng 1X : là giá bán của mặt hàng này , đơn vị tính là ngàn đồng/kg 2X Ta sẽ tìm hàm hồi quy mẫu : l l l l10 1 21 2i iY X Xβ β β i U= + + + và cho biết ý nghĩa của hệ số hồi quy l1β và l 2β . Từ số liệu đã cho ta có được các ma trận cơ bản như sau : 1 2 2 1 1 1 2 2 2 1 2 2 8 48 24 48 300 135 24 135 80 TX X= i i i i i i i i i i n X X X X X X X X X X ∑⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥∑ ∑ ∑ =⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥∑ ∑ ∑ ⎣ ⎦⎣ ⎦ , __________________________________________________________________ 71 Chương 2 1 2 56 354 154 TX Y= i i i i i Y X Y X Y ∑⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥∑ =⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥∑ ⎣ ⎦⎣ ⎦ Ta có ma trận nghịch đảo ( ) 1TX X − là : ( ) 1 5775 600 7201 600 64 72120 720 72 96 TX X = − − −⎡ ⎤⎢ ⎥−⎢ ⎥⎢ ⎥−⎣ ⎦ Áp dụng công thức ước lượng được xây dựng ta có : ( ) 1 5775 600 720 561 600 64 72 354120 720 72 96 154 T TX X X Y= − − −⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥−⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥−⎣ ⎦ ⎣ ⎦ l l 1 2 11 2 120 1 1 1.2 0.41 144 1.2 : 120 1 1.2 0.448 0.4 i i i i i i Y X X SRF Y X X ⎡ ⎤ ⎡ ⎤ ⎧ = + −⎪⎢ ⎥ ⎢ ⎥= = → ⎨⎢ ⎥ ⎢ ⎥ U= + − +⎪⎩⎢ ⎥ ⎢ ⎥− −⎣ ⎦ ⎣ ⎦ Ý nghĩa của các hệ số hồi quy : l 1 1.2β = : Phản ánh tác động của đối với Y , tức là tác động của thu nhập đối với lượng hàng hóa bán được theo nghĩa , nếu thu nhập của người tiêu dùng tăng (hoặc giảm) 1 triệu đồng/tháng , thì lượng hàng bán được trung bình có xu hướng tăng (hay giảm) tương ứng xấp xỉ là 1.2 tấn/tháng với điều kiện giá bán của mặt hàng đó và các yếu tố khác là không đổi. 1X l 2 0.4β = − : Phản ánh tác động của đối với Y , tức là tác động của giá đối với lượng hàng bán được theo nghĩa, nếu giá bán của mặt hàng này tăng (hoặc giảm) 1 ngàn đồng/kg, thì lượng hàng bán được trung bình có xu hướng giảm (hay tăng) tương ứng xấp xỉ là 0.4 tấn/tháng , với điều kiện thu nhập của người tiêu dùng và các yếu tố khác là không đổi. 2X __________________________________________________________________ 72 Chương 2 2. 6 Xây dựng thuật toán hồi quy cho lập trình trên máy tính : 2. 6. 1 Bài toán xây dựng phương trình siêu phẳng hồi qui. Ta muốn tìm một hàm tuyến tính của ( )1m − biến còn lại 2 , , mX X 2 2 3 3 m ma X a X a X+ + + Để xấp xỉ 1X tốt nhất theo nghĩa cực tiểu sai số bình phương trung bình tức là: ( ){ }21 2 2 3 3 m mA E X a X a X a X C= − + + + + đạt cực tiểu Câu trả lời cho bài toán đặt ra là: ( )*11 1* 2 11 m k k k k X X EX EX = Λ= − − +Λ∑ trong đó ma trận covarian ( )ij m mλ ×Λ = ; ( ) ( ){ }ij i i j jE X EX X EXλ = − − *1kΛ là phần phụ đại số của 1kλ trong ma trận Sai số bình phương trung bình mắc phải khi tính bởi biểu thức ở vế phải được gọi là phương sai phần dư. Nó được tính bởi: 21.23... * 11 det mσ Λ= Λ Hệ số tương quan bội (hệ số tương quan tập hợp) đo mức độ phụ thuộc tuyến tính giữa và tổ hợp tuyến tính ở vế phải của công thức tính là: 1X 2 * 1.23... 1.23... * 2 11 11 1 det1 1 mm σρ λ σ Λ= − = −Λ 2. 6. 2 Bài toán tính hệ số tương quan riêng : Ta tìm số đo mức độ phụ thuộc tuyến tính giữa hai biến 1X và 2X sau khi đã loại trừ ảnh hưởng tuyến tính của 3, , mX X đối với chúng. Ta gọi đại lượng này là hệ số tương quan riêng và ký hiệu là 12.34...mρ 1212.34... 22 11 det det .detm ρ Λ= Λ Λ __________________________________________________________________ 73 Chương 2 trong đó là ma trận nhận được từ ma trận ijΛ bằng cách bỏ đi hàng i cột j, hoặc: ( ) ( )12.34... 1 1 .34... 1 2 .34... 112.34... 2 21 .34... 1 2 .34... 1 . 1 . 1 m m m m m m m m m m ρ ρ ρρ ρ ρ − − − − − −= − − Như vậy theo công thức trên từ các hệ số tương quan toàn phần ijρ ta tính được các hệ số tương quan riêng .ij kρ , rồi sau đó tính .ij klρ và vân vân Công thức về phương sai phần dư có thể biểu diễn dưới dạng: ( ) ( ) ( )2 2 2 21.23... 1 1.2 13.2 1 .23... 11 . 1 ... 1m mDXσ σ σ σ −= − − − m 2. 6. 3 Bài toán hồi quy từng bước : Ta muốn xác định xem những biến nào trong các biến X2, , Xm có ảnh hưởng nhiều đến X1. Nói khác đi tập các biến độc lập dùng để dự báo tuyến tính X1 cho toàn bộ các biến đang xét hay chỉ cần một tập con nào đó của tập đã cho. Để giải quyết bài toán này ta sẽ dùng phương pháp hồi qui từng bước. Ý cơ bản của phương pháp này dựa vào công thức phương sai phần dư như sau: Dựa vào công thức phương sai phần dư ở trên ta thực hiện các bước sau: Tính các hệ số tương quan toàn phần 1iρ , i = 2m Chẳng hạn 12 12 ax ii mmρ ρ≤ ≤= , ta chọn biến đầu tiên là biến X2 Đó là một trong các biến chính có tác động chính đến sự biến thiên của X1 Tính các hệ số tương quan riêng 1 .2iρ , i = 3m Chẳng hạn 13.2 1 .23 ax ii mmρ ρ≤ ≤= , ta chọn biến tiếp theo là biến X3 và vân vân. Sau mỗi lần chọn thêm biến ta tính phương sai phần dư . So sánh với phương sai phần dư ở bước trước 2 1.23...kσ 2 1.23... 1kσ − . Nếu giảm không đáng kể so với thì ta dừng lại và chọn tập biến độc lập là X 2 1.23...kσ 2 1.23... 1kσ − 2,, Xk – 1. Đó là tập các biến có tác động chính đến biến X1 (Theo công thức phương sai phần dư thì thực chất của __________________________________________________________________ 74 Chương 2 việc so sánh và 21.23...kσ 21.23... 1kσ − là việc đánh giá xem thừa số có gần 1 hay không hay tương đương với điều đó là xem ( 21 .34... 11 k kρ −− ) 2 1 .23... 1k kρ − có gần 0 hay không) 2. 6. 4 ij Mô tả phương pháp tính toán : 2. 6. 4. 1 Các ký hiệu sử dụng m : Số biến ngẫu nhiên (vec tơ m chiều) n : Cỡ mẫu ngẫu nhiên xi : Biến thứ i xik : Giá trị thứ k của biến thứ i xiTB : Giá trị trung bình mẫu của biến thứ i Aij : Giá trị trung bình mẫu của tích 2 biến và bk : Hệ số hồi qui của biến thứ i theo biến thứ k L_Da : Ma trận Covarian mẫu L_Da[i, j] : Phần tử hàng i cột j của ma trận covarian mẫu L_Da L_Daij : Ma trận được nhận từ ma trận L_Da bằng cách bỏ đi hàng i cột j *_L Da : Phần phụ đại số của phần tử L_Da[i, j] trong ma trận covarian mẫu L_Da S2 : Phương sai phần dư mẫu r : Hệ số tương quan mẫu i1,, im : Biến lấy được sau mỗi bước trong bài tóan hồi qui 2. 6. 4. 2 Phương pháp tính toán : Như trên ta thấy, để xây dựng được siêu phẳng hồi qui, tính được phương sai phần dư, hệ số tương quan bội, hệ số tương quan riêng, ta cần tính được ma trận covarian mẫu L_Da. Nhưng trên thực tế khi nghiên cứu m biến ngẫu nhiên chúng ta chỉ có thông tin duy nhất là n kết quả quan sát độc lập về vectơ m chiều này. Giả sử có mẫu ngẫu nhiên cỡ n về m biến ngẫu nhiên X1,, Xm: (x1k ,, xmk), k=1n. __________________________________________________________________ 75 Chương 2 Để giải quyết được các bài toán đặt ra việc đầu tiên là phải ước lượng được ma trận covarian mẫu L_Da. Ma trận covarian mẫu được sử dụng trong tất cả các bài toán phân tích thống kê biến ngẫu nhiên nhiều chiều, vì vậy nó cần được xây dựng xuất phát từ mẫu đã cho và chúng ta phải sử dụng nhiều lần đến nó. Trong thủ tục tính ma trận covarian mẫu ta cần phải tính: − Giá trị trung bình mẫu của biến thứ i 1 1 n TB ik k Xi x n = = ∑ i = 1...m − Giá trị trung bình mẫu của tích hai biến Xi và Xj 1 1 . n ij ik jk k A x x n = = ∑ i, j = 1...m Như vậy giá trị của các phần L_Da[i,j] mẫu là: [ ]_ , .ij TB TBL Da i j A Xi Xj= − i, j = 1...m Nhìn vào công thức tính toán ở trên ta dễ dàng nhận thấy được ma trận covarian mẫu L_Da là một ma trận đối xứng (L_Da[i,j] = L_Da[j,i]). Như vậy ta đã tính xong ma trận covarian mẫu L_Da. Sau đây là một số thuật toán liên quan đến bài toán đang xét: 2. 6. 5 Xây dựng hàm tính định thức của ma trận (sau đó sử dụng hàm này để tính định thức của ma trận covarian L_Da) 2. 6. 5. 1 Phần 1: Đưa ma trạn về dạng tam giác trên (khử các phần tử dưới đường chéo) [ ]: ,k a k i= Trong trường hợp phần tử trên đường chéo =0 thì trên cột chứa phần tử đó ta hoán đổi phần tử max với phần tử đường chéo. __________________________________________________________________ 76 Chương 2 Tức là nếu a[k, k] = 0 thì: : 0x = : 1...i k m= + Nếu abs( a[i, k] > x)thì: ⋅ [ ]: ,x a i k= ⋅ Đánh dấu hàng cần đổi: :r i= Nếu tất cả các phần tử trên cột bằng 0 thì định thức bằng 0 Sau mỗi lần hoán đổi thì định thức lại đổi dấu vì vậy ta sẽ dùng một biến shv để đánh dấu số lần đổi dấu: : 1shv shv= + Hoán đổi hàng có phần tử trên đường chéo =0 với hàng có phần tử trên cột đó nhận giá trị lớn nhất. [ ]: ,x a k i= [ ] [ ], : ,a k i a r i= [ ], :a r i x= : 1...i k m= + [ ] [ ]: , ,x a k i a k k= : 1...j m= [ ] [ ] [ ], : , ,a i j a j i x a j k= − ∗ 2. 6. 5. 2 Phần 2: Tính định thức bằng cách nhân các phần tử trên đường chéo: Định thức = 11 22 ... mma a a× × × : 1DT = : 1...i m= [ ]: ,DT DT a i i= ∗ Trong trường hợp (shv mod 2=0) thì định thức : DT= __________________________________________________________________ 77 Chương 2 Còn ngược lại thì định thức : DT= − Như vậy đã tính xong định thức của một ma trận. 2. 6. 5. 3 Xây dựng hàm tính định thức của ma trận khi bỏ đi 1 hàng 1 cột : Giả sử tính định thức của ma trận L_Da bỏ đi hàng i cột j Gán lại ma trận như sau: : 1...k m= : 1...r m= Nếu hàng k = hàng i, cột r = cột j thì gán TG[k, r] = 1 Nếu (hàng k = hàng i và cột r cột j) hoặc (hàng k hàng i và cột r = cột j) thì gán TG[k, r] = 0 Còn lại thì gán TG[k, r] = L_Da[k, r] Sau đó gọi hàm tính định thức cho ma trận TG, ma trận TG này có cỡ bằng cỡ với ma trận L_Da trên. Tương tự với cách tính định thức ma trận L_Da bỏ đi hàng i cột j bất kỳ ta sẽ dễ dàng tính được phần phụ đại số của một phần tử bất kỳ. Tiếp theo ta sẽ xây dựng phương trình siêu phẳng hồi quy. Như ta đã biết ở phần trên, để nhận được phương trình siêu phẳng hồi quy của X1 ta phải tính được: − Các hệ số hồi qui * 1 1 * 11 _ _ k k L Dab L Da −= k = 2m − Tính hằng số C 1 2 1 . m TB k TB k C X b Xk = = −∑ __________________________________________________________________ 78 Chương 2 Như vậy sau khi tính được các hệ số hồi quy b1k và hằng số C ta sẽ viết được phương trình siêu phẳng hồi qui có dạng như sau: 1 12 2 13 3 1... m mX b X b X b X= + + + +C Sau đó ta tính phương sai phần dư và hệ số tương quan bội như sau: − Phương sai phần dư: 2 1.234... * 11 det _ _m L DaS L Da = − Hệ số tương quan bội [ ] 2 1.23... 12.34... 1 _ 1,1 m m Sr L Da = − Như vậy đã tính xong bài toán về siêu phẳng hồi qui. 2. 6. 6 Bài toán về tương quan riêng : Hệ số tương quan riêng được tính bằng công thức: 12 12.34... 11 22 det _ det _ .det _m L Dar L Da L Da = 2. 6. 7 Bài toán về hồi quy từng bước : Theo như phần trên ta thấy, ở bước 1 chúng ta phải tính các hệ số tương quan toàn phần r1i , i = 2m. Nhưng thực chất ở đây ta phải tính tất cả rij, i, j = 1m với i < j Theo định nghĩa ta có : [ ] [ ] [ ] _ , _ , . _ , ij L Da i j r L Da i i L Da j j = Sang các bước sau, ta sẽ sử dụng công thức: ( ) ( )1 2 1 1 2 1 1 2 11 2 1 2 1 1 2 1 1, . , ,..., 1, . , ,..., , . , ,..., 1, . , ,..., 2 2 1, . , ,..., , . , ,..., . 1 . 1 k k k k k k k k k k i i i i i i i i i i i i i i i i i i i i i i i i i i r r r r r r − − − − −−= − − __________________________________________________________________ 79 Chương 2 Sau bước 1 ta chọn được r1,i1 đạt giá trị lớn nhất trong các rij. Biến được chọn là Xi1 Sử dụng công thức truy hồi trên, bước 2 ta sẽ phải tính các r1,i.i1, với 1i i≠ và . Sau đó lại chọn được r1i ≠ 1,i2.i1 đạt giá trị lớn nhất. Biến được chọn tiếp là Xi2 Cứ tiếp tục như vậy cho tới bước thứ k ta sẽ tính được với i khác1, i 11 . 1, 2,..., ki i i i r − 1, i2, ik – 1. Song song với các bước trên, mỗi khi chọn được is, s = 1k ta phải tính phương sai phần dư. Ở bước 2, phương sai phần dư sẽ là: [ ] ( )2 21, 1 1, 1_ 1,1 . 1i iS L Da r= − và như vậy cho tới bước thứ k ta sẽ có: ( )1 12 2 21, 1, 2,..., 1, 1, 2,..., 1, . 1, 2,...,. 1k k ki i i i i i i i i iS S r− −= − k 2. 6. 8 Điều đáng quan tâm của bài toán hồi quy từng bước này là việc phải xây dựng được hàm tính hệ số tương quan (ở bước 1 đó chính là tương quan toàn phần, ở các bước khác đó chính là tương quan riêng) giữa 2 biến bất kỳ. Hàm này sẽ được sử dụng sau mỗi khi ta lấy được một biến ứng với giá trị tương quan lớn nhất sau đó mới tính tiếp các giá trị phương sai phần dư của mỗi bước. Lưu đồ thuật toán của ba bài toán nêu trên (trang bên) : __________________________________________________________________ 80 Chương 2 __________________________________________________________________ 81 Chương 2 __________________________________________________________________ 82 Chương 3 CHƯƠNG 3 : KIỂM ĐỊNH GIẢ THIẾT TRÊN VECTƠ KỲ VỌNG 3. 1 Mâu thuẫn giữa kiểm định nhiều chiều và một chiều : Kiểm định giả thiết trong trường hợp đa chiều thường phức tạp hơn trong mô hình đơn chiều. Số lượng các biến số sẽ dẫn đến sự chênh lệch. Ví dụ như cho một phân phối chuẩn với p biến, sẽ có p trung binh, p phương sai và 2 p⎛ ⎞⎜ ⎟⎝ ⎠ hiệp phương sai, ở đây 2 p⎛ ⎞⎜ ⎟⎝ ⎠ biểu diễn số cặp biến tương quan trong p biến. Tổng số các biến số được quan tâm sẽ là : ( )1 3 2 2 p p p p p⎛ ⎞+ + = +⎜ ⎟⎝ ⎠ . Ví dụ khi cho p = 10 thì tổng số biến số sẽ là 65. Với mỗi một biến số , một giả thiết có thể được đề ra. Ngoài ra, ta có thể quan tâm trong kiểm tra giả thiết về nhóm con các biến số hoặc về các hàm của chúng. Trong một số trường hợp, ta có thể có hai giả định trong sự mâu thuẫn giữa các kiểm định thống kê. Ta bàn về quá trình đầu trong kiểm định p biến nhiều chiều thay vì ( hoặc thêm vào ) một biến đơn chiều.Ví dụ như giả thiết về 1 2, , ..., pμ μ μ trong μ . Ta có bốn luận cứ trong cách tiếp cận nhiều chiều để kiểm định giả thiết : 1. Sử dụng p đơn biến kiểm tra độ tăng tỉ lệ lỗi trong sai lầm I , α , bởi vì kiểm định mô hình nhiều chiều phải bảo đảm độ tin cậy α . Nếu ta cho p = 10 đơn biến riêng biệt và kiểm định ở độ tin cậy 0.05, xác suất có ít nhất một sai lầm được từ chối là lớn hơn 0.05. Nếu các biến là độc lập ( ít xảy ra ), chúng ta sẽ có (với giả thiết 0H ). P( ít nhất một từ chối) = 1−P( tất cả 10 kiểm định chấp nhận 0H ) ( )101 0 95 0 40. .= − = 2. Kết quả tổng cộng α của 0.40 là một tỉ lệ lỗi không chấp nhận được. Thông thường khi 10 biến là tương quan thì tổng α giao động trong khoảng từ 0.05 __________________________________________________________________ 83 Chương 3 đến 0.40. Các bài toán kiểm định đơn biến hoàn toàn bỏ qua sự tương quan giữa các biến, trong khi các kiểm định nhiều biến theo hướng sử dụng sự tương quan giữa các biến. 3. Trong nhiều trường hợp kiểm định nhiều biến thì mạnh hơn. Độ mạnh của một kiểm định là xác suất để từ chối 0H khi nó sai lầm. Tất cả p biến của kiểm định đơn biến không đạt đến một ý nghĩa, nhưng kiểm định nhiều chiều lại có ý nghĩa. Bởi vì ảnh hưởng nhỏ trên tổ hợp các biến đồng thời chứng tỏ được ý nghĩa. Tuy nhiên trong cùng một mẫu với giới hạn số lượng các biến, kiểm định nhiều biến có thể xử lí mà không mất đi sức mạnh của nó. Điều này sẽ được làm rõ ở

Các file đính kèm theo tài liệu này:

giao_trinh_uoc_luong_va_kiem_dinh_trong_thong_ke.pdf