HỒI QUI TUYẾN TÍNH BỘI
Trình tự giải thích kết quả Hồi qui:
• Khẳng định mô hình có ý nghĩa. Thông qua giá trị Sig.F
• Trình bày mức độ ảnh hưởng của các biến độc lập đến biến
phụ thuộc
• Kiểm tra mức ý nghĩa thống kê của từng biến độc lập, giải
thích sự ảnh hưởng của từng biến độc lập đến biến phục
thuộc. Chú ý đến dấu, dấu kỳ vọng và độ lớn của hệ số hồi
qui.
MỘT SỐ DẠNG HÀM
Các trường hợp mở rộng:
• Biến độc lập là biến định tính: Mô hình hồi qui với biến giả
• Biến phụ thuộc là biến định tính: Phân tích nhân tố
• Trường hợp phương trình hồi qui phi tuyến tính đối với
biến.
30 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 484 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Thống kê trong kinh doanh và kinh tế - Chương 9: Tương quan, hồi qui tuyến tính - Chế Ngọc Hà, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chương 9
TƯƠNG QUAN,
HỒI QUI TUYẾN TÍNH
1
I.TƯƠNG QUAN TUYẾN TÍNH
1. Khái niệm: được gọi là đại lượng đo lường mối tương
quan tuyến tính của 2 đại lượng ngẫu nhiên X và Y nếu:
-1 1
* < 0: X, Y có mối liên hệ nghịch
* > 0: X, Y có mối liên hệ thuận
* = 0: X, Y không có mối liên hệ.
*: càng lớn thì X, Y có mối liên hệ càng chặt chẽ.
2
I.TƯƠNG QUAN TUYẾN TÍNH
2. Hệ số tương quan mẫu:
Chọn ngẫu nhiên n cặp quan sát (xi, yi) từ hai tổng thể X,Y.
Ta có hệ số tương quan Spearson:
n
1i
n
1i
2
i
2
i
n
1i
ii
)yy()xx(
)yy)(xx(
r
Trường hợp |r| ≥ 0,8 chúng ta có thể kết luận X, Y có mối
tương quan tuyến tính chặt chẽ.
Để đảm bảo tính chính xác này, chúng ta có thể thực hiện
kiểm định giả thuyết
3
I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
1. Khái niệm hồi qui: Ví dụ, Nghiên cứu mối liên hệ giữa
chi tiêu Y và thu nhập X của hộ gia đình:
X
Y
80 100 120 140 160 180 200 220 240 260
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
88 113 125 140 160 189 185
115 162 191
E(Y/Xi) 65 77 89 101 113 125 137 149 161 173
4
I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
• E(Y/X) = f(X) : Phương trình hồi qui
• E(Y/X) = + X: Phương trình hồi qui tuyến tính
• Y = + X + U : Giá trị thực của Y
Trong đó:
• X: biến giải thích (độc lập);
• Y: biến được giải thích (phụ thuộc)
• : Tham số chặn
• : Tham số của biến
• U: Yếu tố ngẫu nhiên
• X,Y không có mối quan hệ hàm số mà có mối quan hệ
nhân quả và thống kê
5
I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
0
20
40
60
80
100
120
140
160
180
200
80 100 120 140 160 189 200 220 240 260
Đường hồi qui thực nghiệm:
6
I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
2. Xây dựng mô hình hồi qui mẫu: Ta cần ước lượng , ,
giả sử đó là a,b. Chọn n cặp quan sát (xi,yi) từ X,Y:
ii
iii
bxayˆ
ebxay
: Giá trị thực tế
: Giá trị lý thuyết
Ta cần tìm a, b sao cho 02 giá trị trên càng gần càng tốt.
Phương pháp bình phương bé nhất (OLS):
min)bxay()yˆy(eSSE
n
1i
2
ii
n
1i
2
ii
n
1i
2
i
2
i
ii
)xx(
)yy)(xx(
b xbya
7
I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
Ví dụ, nghiên cứu mối quan hệ giữa số tiền chi tiêu và thu
nhập của họ. Ta có số liệu sau:
Thu nhập X Chi tiêu Y Thu nhập X Chi tiêu Y
9.098 5.492 11.307 5.907
9.138 5.540 11.432 6.124
9.094 5.305 11.449 6.186
9.282 5.507 11.697 6.224
9.229 5.418 11.871 6.496
9.347 5.320 12.018 6.718
9.525 5.538 12.523 6.921
9.756 5.692 12.053 6.471
10.282 5.871 12.088 6.394
10.662 6.157 12.215 6.555
11.019 6.342 12.494 6.755
8
I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
9
I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
Regression Statistics
Multiple R 0,9587
R Square 0,9192
Adjusted R Square 0,9151
Standard Error 147,6697
Observations 22
df SS MS F Sig.F
Regression 1 4961434,4 4961434,4 227,5 2,17E-12
Residual 20 436126,9 21.806,4
Total 21 5397561,3
Coeffcients Standard Error t Stat Pvalue Lower 95% Upper 95%
Intercept 1922,4 274,95 6,99 9E-07 1348,86 2495,92
X 0,38 0,025 15,08 2E-12 0,329 0,434
10
II.HỒI QUI TUYẾN TÍNH BỘI
E(Y/X1,X2,, Xk) = + 1X1 + 2X2 + + kXk
Y = + 1X1 + 2X2 + + kXk + U
1. Xây dựng mô hình hồi qui mẫu: Mục tiêu là ta cần ước
lượng , 1, 2, k, giả sử đó là a,b1,b2,bk,. Chọn n cặp
quan sát (x1i, x2i, xki,yi) từ X và Y:
: Giá trị thực tế
: Giá trị lý thuyết kiki22i11i
ikiki22i11i
xb...xbxbayˆ
exb...xbxbay
n
1i
2
kiki11i min)xb...xbay(
11
II.HỒI QUI TUYẾN TÍNH BỘI
Ví dụ, Tốc độ tăng nền kinh tế (Y) phụ thuộc vào tốc độ tăng của nông
nghiệp (X1), tốc độ tăng trưởng của kim ngạch xuất khẩu (X2) và tỷ lệ
lạm phát (X3) được thu thập ở 48 nước:
Y(%) NN(%) XK(%) LP(%) Y(%) NN(%) XK(%) LP(%) Y(%) NN(%) XK(%) LP(%)
1,3 3,4 -2,7 13,0 8,0 3,1 10,9 37,3 5,6 3,9 6,4 13,9
1,0 1,4 -6,0 10,5 6,5 3,3 -0,6 8,9 6,9 1,3 11,6 6,4
0,4 0,1 -3,6 15,9 0,2 0,1 8,4 29,5 -4,6 0,8 -9,8 21,5
4,9 1,8 13,6 3,2 7,8 5,3 10,4 8,1 -2,6 1,7 -6,6 6,7
9,8 5,6 27,3 5,4 2,5 2,3 4,9 22,6 1,1 3,9 3,8 7,7
-2,1 2,2 2,6 5,2 -0,2 3,1 7,9 20,2 4,6 3,0 -3,5 8,6
2,0 2,3 -9,5 8,7 6,1 10,3 -19,0 -1,3 -0,6 2,5 2,0 11,5
5,8 3,0 4,4 1,4 2,9 -0,6 5,4 7,5 8,2 1,9 3,8 7,8
5,2 2,9 9,2 3,0 4,1 2,3 8,7 9,5 4,1 0,9 1,3 5,6
-1,1 -2,3 -6,3 14,9 -5,0 1,2 -2,0 1,1 12,6 7,9 11,7 3,8
0,2 0,3 12,0 20,3 2,1 2,7 5,6 11,2 4,1 2,8 -0,9 9,9
1,1 1,4 -7,2 19,8 7,7 3,0 2,0 8,9 0,6 2,8 -2,1 23,3
-12,0 4,8 -5,5 8,6 9,3 3,3 6,2 7,5 2,0 0,5 -3,1 33,5
-1,6 -0,4 -2,5 11,3 -1,7 2,0 -1,7 18,2 0,0 0,4 6,9 32,6
0,5 1,9 1,6 19,0 5,8 4,7 -0,2 2,1 -2,6 -1,3 3,4 7,7
2,2 -3,5 4,7 1,9 3,9 -3,9 -2,5 3,4 -3,4 7,9 -7,9 45,4
12
II.HỒI QUI TUYẾN TÍNH BỘI
Regression Statistics
Multiple R 0,6088
R Square 0,3707
Adjusted R Square 0,3278
Standard Error 3,6899
Observations 48
df SS MS F Significance F
Regression 3 352,861 117,621 8,639 0,000127
Residual 44 599,085 13,616
Total 47 951,947
Coefficients Standard Error t Stat Pvalue Lower 95% Upper 95%
Intercept 2,033 0,993 2,047 0,047 0,032 4,035
NN 0,501 0,206 2,435 0,019 0,086 0,915
XK 0,268 0,069 3,888 0,000 0,129 0,407
LP -0,105 0,053 -1,973 0,055 -0,212 0,002
13
II.HỒI QUI TUYẾN TÍNH BỘI
3. Ước lượng hệ số i:
Ước lượng sự ảnh hưởng của Xi đến Y
)Stb( bi2/,1knii )Sta( a2/,1kn
2. Ý nghĩa các tham số của Hồi qui:
• Dấu của i: Cho biết mối quan hệ thuận nghịch giữa Y và Xi
• Độ lớn của i: Cho biết mức độ tác động mạnh, yếu của Xi
đến Y
• : Có ý nghĩa tùy từng trường hợp cụ thể.
14
II.HỒI QUI TUYẾN TÍNH BỘI
4. Kiểm định từng tham số hồi qui:
Kiểm định Y có phụ thuộc vào biến xi hay không:
0:H
0:H
i1
i0
02/,1kn
bi
i H BBt
S
b
t
5. Hệ số xác định: R2 là hệ số nhằm xác định sự biến động
của Y phụ thuộc bao nhiêu % vào sự biến động của X1, X2,
Xk.
2
i
2
i
2
i
2
ii
2
i e)yyˆ()yyˆ()yˆy()yy(
SST
SSE
1
SST
SSR
RSSESSRSST 2
15
II.HỒI QUI TUYẾN TÍNH BỘI
6. Hệ số xác định đã điều chỉnh:
)
1kn
1n
)(R1(1
)1n/(SST
)1kn/(SSR
R 2
2
7. Kiểm định sự phù hợp của mô hình:
0),1kn(,k
2
2
k210
H BBFF
R1
R
.
k
)1k(n
)1k(n/SSE
k/SSR
MSE
MSR
F
0...:H
16
II.HỒI QUI TUYẾN TÍNH BỘI
Tốc độ tăng kinh tế - Y(%)
Biến độc lập ĐVT Dấu kỳ
vọng
Hệ số P
Tốc độ tăng nông nghiệp (NN) % + 0,501 0,019
Tốc độ tăng xuất khẩu (XK) % + 0,268 0,000
Lạm phát (LP) % - -0,105 0,055
Hệ số tự do 2,033 0,047
R2=0,37; Sig.F=0,000127, n=48
Tóm tắt kết quả hồi qui
17
II.HỒI QUI TUYẾN TÍNH BỘI
Trình tự giải thích kết quả Hồi qui:
• Khẳng định mô hình có ý nghĩa. Thông qua giá trị Sig.F
• Trình bày mức độ ảnh hưởng của các biến độc lập đến biến
phụ thuộc
• Kiểm tra mức ý nghĩa thống kê của từng biến độc lập, giải
thích sự ảnh hưởng của từng biến độc lập đến biến phục
thuộc. Chú ý đến dấu, dấu kỳ vọng và độ lớn của hệ số hồi
qui.
18
III.MỘT SỐ DẠNG HÀM
Các trường hợp mở rộng:
• Biến độc lập là biến định tính: Mô hình hồi qui với biến giả
• Biến phụ thuộc là biến định tính: Phân tích nhân tố
• Trường hợp phương trình hồi qui phi tuyến tính đối với
biến.
19
III.MỘT SỐ DẠNG HÀM
1. Một biến độc lập định tính: Hồi qui với biến giả.
1.1.Biến giả có 2 phạm trù: Xây dựng mô hình so sánh tiền
lương của công nhân làm việc trong khu vực tư nhân và
quốc doanh.
E(Y/D) = + D
• Y: Tiền lương
• D = 1: Công nhân khu vực tư nhân
• D = 0: Công nhân khu vực quốc doanh
E(Y/D=0) = : Lương công nhân khu vực quốc doanh
E(Y/D=1) = +: Lương công nhân khu vực tư nhân
20
III.MỘT SỐ DẠNG HÀM
Ví dụ:
Lương
(trđ/năm)
28 32 35 27 25 37 29 34 33 30
Khu vực 0 1 1 0 0 1 0 1 1 0
D4,68,27Yˆ
21
III.MỘT SỐ DẠNG HÀM
1.2.Biến giả có 3 phạm trù: Mô hình so sánh lương công
nhân khu vực tư nhân, liên doanh và quốc doanh.
E(Y/D1,D2) = + 1D1 +2D2
• D1 = 1: Công nhân khu vực tư nhân
D1 = 0: Công nhân khu vực khác
• D2 = 1: Công nhân khu vực liên doanh
D2 = 0: Công nhân khu vực khác
E(Y/D1=1,D2=0) = + 1: Lương CN khu vực TN
E(Y/D1=0,D2=1) = + 2: Lương CN khu vực LD
E(Y/D1=0,D2=0) = : Lương CN khu vực QD
22
III.MỘT SỐ DẠNG HÀM
1.3.Một biến giả và 1 biến định lượng:
E(Y/X,D) = + 1D1 +2X
• D = 1: Công nhân khu vực tư nhân
• D = 0: Công nhân khu vực quốc doanh
• X : Bậc thợ của công nhân
Lương trung bình công nhân khu vực tư nhân
E(Y/X,D=0) = + 2X:
Lương trung bình công nhân khu vực quốc doanh
E(Y/X,D=1) = (+1) + 2X:
23
III.MỘT SỐ DẠNG HÀM
2. Hàm log – log: Xét hàm Cobb – Douglas:
UeLKY 21
ULlnKlnlnYln 21
• Y: Sản lượng
• K: Vốn
• L: Lao động
• 1+2: Đo lường hiệu quả theo qui mô
• 1+2=1: Hiệu quả không đổi theo qui mô
• 1+2<1: Hiệu quả giảm theo qui mô
• 1+2=1: Hiệu quả tăng theo qui mô
24
III.MỘT SỐ DẠNG HÀM
Ý nghĩa của hệ số 1, 2
• 1: Hệ số co giãn riêng phần của sản lượng theo vốn. Đo
lường % biến động của sản lượng nếu vốn tăng lên 1% đơn
vị.
• 2: Hệ số co giãn riêng phần của sản lượng theo lao động.
Đo lường % biến động của sản lượng nếu lao động tăng lên
1% đơn vị.
YL2YK1
LdL
YdY
KdK
YdY
25
III.MỘT SỐ DẠNG HÀM
Ví dụ: Nông nghiệp của Đài Loan 1957 – 1972:
• lnY = -3,34 + 0,49lnK + 1,50lnL
• Y: GNP (triệu USD)
• K: Vốn (triệu USD)
• L: Ngày công lao động (triệu ngày)
Ví dụ: Hàm cầu lượng cà phê:
• lnQ = 0,78 - 0,25lnPcà phê + 0,38lnPtrà
• Q: Lượng cà phê sử dụng mỗi ngày (cân Anh)
• Pcà phê: Giá cà phê/cân Anh
• Ptrà: Giá trà/cân Anh
26
III.MỘT SỐ DẠNG HÀM
3. Mô hình log – lin:
dX
YdY
UXYln
• : Đo lường 100% thay đổi của Y khi X tăng lên 1 đơn vị
Ví dụ: GDP đầu người giai đoạn 1969 – 1983
• ln(GDP) = 6,9636 + 0,0269t
• GDP tăng trưởng 2,69% mỗi năm
• t=0 (1969): GDP 1.057 tỷ USD
27
III.MỘT SỐ DẠNG HÀM
4. Mô hình lin - log:
XdX
dY
UXlnY
• : Đo lường 1% thay đổi của Y khi x tăng lên 1%
Ví dụ: Mô hình GNP và lượng cung tiền:
• Y = -16.329 + 2.584,8lnX
• Y: GNP (tỷ USD)
• X: Lượng cung tiền (tỷ USD)
• Nếu cung tiền tăng 1% thì GNP tăng 25,848 tỷ USD
28
III.MỘT SỐ DẠNG HÀM
5. Mô hình nghịch đảo:
Y xU
X
1
Y
Đường cong phillips:
• Y: Tỷ lệ thay đổi của tiền lương
• Y: Tỷ lệ thất nghiệp
Ví dụ: Dữ liệu của Anh 1950 – 1966
• Y = -1,4282 + 8,7243 (1/X)
• Khi tỷ lệ thất nghiệp tăng đến vô hạn, % giảm trong tiền
lương sẽ không vượt quá 1,43%
Các file đính kèm theo tài liệu này:
- bai_giang_thong_ke_trong_kinh_doanh_va_kinh_te_chuong_9_tuon.pdf