LỜI CẢM ƠN . 1
MỤC LỤC . 2
DANH MỤC CÁC TỪ VIẾT TẮT . 3
MỞ ĐẦU. 4
1. Những ghi nhận ban đầu và câu hỏi xuất phát.4
2. Khung lý thuyết tham chiếu.7
3. Phương pháp nghiên cứu .9
CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG HAI
GIÁO TRÌNH CHUYÊN NGÀNH. 11
1.1. So sánh các mẫu dữ liệu thống kê .11
1.2. So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế .12
1.2.1. Phân tích giáo trình Phân tích và đầu tư chứng khoán.13
1.2.2. Phân tích giáo trình Kinh tế lượng .21
1.3. Tổng kết chương 1 .29
CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG GIÁO
TRÌNH XS – TK . 31
2.1. Phân tích GT3 .34
2.1.1. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN .34
2.1.2. Giá trị trung bình, phương sai của tổng thể và mẫu.41
2.1.3. Hàm hồi qui.43
2.1.4. Các tổ chức toán học liên quan đến so sánh các mẫu dữ liệu thống kê .43
2.2. Tổng kết chương 2 .48
CHƯƠNG 3: NGHIÊN CỨU THỰC NGHIỆM. 51
3.1. Thực nghiệm.51
3.2. Phân tích tiên nghiệm.54
3.3. Phân tích hậu nghiệm.59
KẾT LUẬN . 64
TÀI LIỆU THAM KHẢO . 66
PHỤ LỤC . 68
85 trang |
Chia sẻ: mimhthuy20 | Lượt xem: 682 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Vấn đề so sánh các mẫu dữ liệu thống kê: sự nối khớp giữa dạy học xác suất thống kê với đào tạo cử nhân kinh tế, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
của công nghệ B hay không” (GT2, tr.110).
Điều này được giải thích như sau:
Nếu sử dụng công nghệ sản xuất B thì E(Yi/Di = 0)= 1β
Nếu sử dụng công nghệ sản xuất A thì E(Yi/Di =1)= 1 2β β+
Do đó, ý nghĩa của hệ số 2β trong mô hình:
“ 2β phản ánh mức chênh lệch về năng suất trung bình giữa công nghệ B và công nghệ A”
(GT2, tr.110)
Cách tính các hệ số của mô hình này cũng giống như đối với mô hình hồi qui hai biến mà
tác giả đã trình bày ở phần trước:
“Mô hình (5.1) giống như mô hình hồi qui hai biến mà chúng ta đã nghiên cứu ở phần trước,
chỉ khác là biến số lượng X được thay bằng biến giả D” (GT2, tr.110)
Nhờ ý nghĩa của hệ số 2β mà mô hình hồi qui với biến giả có thể sử dụng để so sánh năng
suất trung bình của hai công nghệ A và B.
Tương tự như vậy, mô hình hồi qui với biến giả cũng được sử dụng để xem xét sự khác
nhau giữa năng suất trung bình của 3 công nghệ A, B, C
“Trong trường hợp này ta sử dụng 2 biến giả D1 và D2 và mô hình hồi qui sẽ là:
Yi = 1 2 1 3 2i i iD D Uβ β β+ + + (5.2)
Trong đó:
1iD = 1 nếu năng suất của công nghệ A
1iD = 0 nếu năng suất của công nghệ khác
2iD = 1 nếu năng suất của công nghệ B
23
2iD = 0 nếu năng suất của công nghệ khác
Khi 1iD =1 và 2iD = 0 thì (5.2) biểu thị năng suất của công nghệ A
Khi 1iD = 0 và 2iD = 1 thì (5.2) biểu thị năng suất của công nghệ B
Khi 1iD = 0 và 2iD = 0 thì (5.2) biểu thị năng suất của công nghệ C”
(GT2, tr.110)
GT2 cũng giải thích tại sao mô hình trên có thể xem xét sự khác biệt hay chênh lệch giữa
năng suất trung bình của 3 công nghệ:
Nếu sử dụng công nghệ sản xuất A thì năng suất trung bình
E(Yi/ 1iD =1, 2iD = 0)= 1 2β β+
Nếu sử dụng công nghệ sản xuất B thì năng suất trung bình
E(Yi/ 1iD = 0, 2iD = 1)= 1 3β β+
Nếu sử dụng công nghệ sản xuất C thì năng suất trung bình
E(Yi/ 1iD = 0, 2iD = 0)= 1β
Hơn nữa, tác giả nhấn mạnh ý nghĩa của các hệ số trong mô hình hồi qui như sau:
“ 2β biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ A
3β biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ B”
(GT2, tr.110-111)
Như vậy, mô hình hồi qui với một biến định tính như trên thể hiện mối liên hệ giữa biến phụ
thuộc Y (là một biến định lượng) và một biến định tính (có nhiều phạm trù). Dựa vào các hệ
số của mô hình hồi quy ta có thể so sánh được các giá trị trung bình của biến định lượng
ứng với từng giá trị của biến định tính.
Ngoài ra, các mô hình hồi qui với 1 biến định lượng và 1 biến định tính, hồi qui với 1 biến
định lượng và hai biến định tính cũng được giáo trình đưa vào, áp dụng trong trường hợp
biến phụ thuộc Y chịu ảnh hưởng bởi cả biến định lượng và biến định tính. Khi đó, mô hình
hồi qui cũng cho biết giá trị trung bình của Y ứng với mỗi phạm trù của biến định tính khác
nhau như thế nào.
24
Ta xét ví dụ trang 115 của GT2: Xem xét thu nhập hàng năm của giáo viên theo thâm niên
và nơi giảng dạy. Biến thâm niên là biến định lượng còn biến nơi giảng dạy là biến định tính
với 3 phạm trù: thành phố, đồng bằng, miền núi.
Mô hình hồi qui được sử dụng:
1 2 3 1 4 2i i i i iY X D D Uβ β β β= + + + + (5.14)
Trong đó:
Y là thu nhập của giáo viên phổ thông trung học (triệu đồng/năm), X là thâm niên giảng dạy
của giáo viên (năm)
1iD = 1 nếu giáo viên ở thành phố
1iD = 0 nếu giáo viên ở nơi khác
2iD = 1 nếu giáo viên ở đồng bằng
2iD = 0 nếu giáo viên ở nơi khác
(người ta đã chọn giáo viên giảng ở miền núi làm phạm trù cơ sở)
Khi đó, thu nhập của giáo viên ở miền núi:
1 2 1 2( / , 0, 0)i i i i iE Y X D D Xβ β= = = +
Thu nhập của giáo viên ở đồng bằng:
1 2 1 2 4( / , 0, 1)i i i i iE Y X D D Xβ β β= = = + +
Thu nhập của giáo viên ở thành phố:
1 2 1 2 3( / , 1, 0)i i i i iE Y X D D Xβ β β= = = + +
Như vậy cũng tương tự như các mô hình hồi qui đã nêu ở trên, mô hình hồi qui trong ví dụ
này cho phép người ta biết được sự chênh lệch giữa thu nhập của giáo viên phổ thông trung
học ở thành phố và đồng bằng so với giáo viên ở miền núi, và hiển nhiên ta có thể so sánh
thu nhập của giáo viên ở cả ba vùng với nhau:
“Sau khi ước lượng hàm hồi qui (5.14), chúng ta sẽ biết được mức chênh lệch về thu nhập
của giáo viên phổ thông trung học ở thành phố và đồng bằng so với giáo viên công tác ở miền
núi”. (GT2, tr.116)
25
Đối với trường hợp biến phụ thuộc Y chịu ảnh hưởng của nhiều biến định tính thì khi đó số
biến giả được đưa vào mô hình được tính bằng công thức tổng quát sau:
“n=∑
=
−
k
i
in
1
1( )
Trong đó: n là số biến giả được đưa vào mô hình; k là số biến định tính; ni là số mức độ (số
phạm trù) của biến định tính thứ i” (GT2, tr.116)
Để minh họa cho mô hình hồi qui với nhiều biến định tính, tác giả đưa vào ví dụ xét thu
nhập của giáo viên phổ thông dựa vào thâm niên giảng dạy; khu vực giảng dạy (đồng bằng,
thành phố, miền núi) và môn giảng dạy (tự nhiên, xã hội, anh văn).
Dựa vào công thức trên, ta có số lượng biến giả đưa vào là n = (3-1) + (3-1) = 4
“Mô hình có dạng:
1 2 3 1 4 2 5 3 6 4i i i i i i iY X D D D D Uβ β β β β β= + + + + + +
Trong đó:
Y là thu nhập của giáo viên phổ thông trung học (triệu đồng/năm)
X là thâm niên giảng dạy.
D1i = 1 nếu giáo viên giảng dạy ở thành phố
D1i = 0 nếu giáo viên giảng dạy ở nơi khác
D2i = 1 nếu giáo viên giảng dạy ở đồng bằng
D2i = 0 nếu giáo viên giảng dạy ở nơi khác
D3i = 1 nếu giáo viên giảng dạy các môn tự nhiên
D3i = 0 nếu giáo viên giảng dạy các môn thuộc nhóm khác
D4i = 1 nếu giáo viên giảng dạy các môn xã hội
D4i = 0 nếu giáo viên giảng dạy các môn thuộc nhóm khác.” (GT2, tr.117)
Trong mô hình trên, GT2 đã chọn phạm trù khu vực miền núi và phạm trù môn giảng dạy là
anh văn làm những phạm trù cơ sở.
Mô hình trên cho phép ước lượng thu nhập của giáo viên khi biết thâm niên, khu vực và
môn giảng dạy. Chính vì vậy, dựa vào mô hình hồi qui trên chúng ta có thể so sánh được
mức lương bình quân của một giáo viên có thâm niên Xi ở đồng bằng và thành phố so với
miền núi, dạy môn tự nhiên và xã hội so với môn tiếng Anh.
Qua một vài ví dụ về các mô hình hồi qui với biến giả mà giáo trình giới thiệu cho sinh
viên, chúng ta có thể thấy mô hình hồi quy với biến giả có thể giúp xem xét sự khác nhau
26
giữa năng suất trung bình của các công nghệ sản xuất, xem xét sự khác nhau giữa thu nhập
của giáo viên giữa nhiều khu vực, hay giữa nhiều nhóm chuyên ngành với nhau. Nói một
cách khác, mô hình hồi qui với biến giả cho phép chúng ta so sánh tham số trung bình của
các tổng thể từ những mẫu thu được. Từ đó, chúng tôi đã chỉ ra được một praxéologie -
trong đó các nhiệm vụ đều liên quan đến so sánh tham số trung bình của các tổng thể như
sau:
1. Kiểu nhiệm vụ
1
SSTBT : So sánh trung bình của hai tổng thể A, B
Kĩ thuật
1
SSTBτ :
- Tìm hàm hồi qui
E(Y/D) : 1 2i i iY D Uβ β= + + (Di = 1 ứng với giá trị quan sát thuộc tổng thể A, Di
= 0 ứng với giá trị quan sát thuộc tổng thể B)
- Xét hệ số 2β :
+ Nếu 2β khác 0 thì 2β thể hiện sự chênh lệch giữa giá trị trung bình của tổng thể
A so với tổng thể B.
+ Nếu 2β = 0 thì không có sự chênh lệch giữa giá trị trung bình của hai tổng thể
A, B.
Công nghệ
1
SSTBθ :
- Cách lượng hóa biến định tính bằng cách sử dụng biến giả Di.
- Mô hình hồi qui với 1 biến định tính có 2 phạm trù :
E(Y/D) : 1 2i i iY D Uβ β= + + trong đó Di là biến giả
- 2β phản ánh mức chênh lệch về giá trị trung bình của tổng thể A so với tổng thể
B
Lý thuyết
1
SSTBΘ :
“Hàm hồi qui tổng thể cho biết giá trị trung bình của biến phụ thuộc (Y) sẽ thay đổi như thế
nào khi biến độc lập (X) nhận các giá trị khác nhau” (GT2, tr.18)
27
Cụ thể hơn, dựa vào mô hình 1 2i i iY D Uβ β= + + (trong đó Di là biến giả xác định như trên)
ta tính được giá trị trung bình của hai tổng thể như sau :
Giá trị trung bình của tổng thể A
E(Y/D = 1) = 21 ββ +
Giá trị trung bình của tổng thể B
E(Y/D = 1) = 1β
Như vậy 2β phản ánh mức chênh lệch về giá trị trung bình của tổng thể A so với tổng thể B.
Ví dụ minh họa cho kiểu nhiệm vụ 1SSTBT :
“Bài 5.1: Để nghiên cứu nhu cầu của một loại hàng, người ta tiến hành khảo sát giá cả và
lượng hàng bán được ở 20 khu vực bán hàng và thu được các số liệu cho ở bảng sau:
Yi Xi Di Yi Xi Di
20
19
18
18
17
17
16
16
15
15
2
3
3
4
4
3
4
4
5
5
1
0
1
0
1
1
0
1
1
1
14
14
13
12
12
15
16
12
10
11
5
6
6
7
7
5
4
7
8
8
0
1
0
1
0
1
0
1
0
1
Trong đó: Y là lượng hàng bán được (tấn/tháng)
X là giá bán (ngàn đ/kg)
Di = 0 nếu khu vực bán hàng ở nông thôn
Di = 1 nếu khu vực bán hàng ở thành phố
a) Tìm các hàm hồi qui :
ii XY 10
^
ββ += (1)
iii DXY 210
^
ααα ++= (2)
b) Cho biết ý nghĩa của các hệ số hồi qui 21;αα ” (GT2, tr.127-128)
Lời giải bài toán trên, chúng tôi tham khảo trong cuốn Bài tập Kinh tế lượng với sự trợ giúp
của Eviews do tác giả Nguyễn Thị Ngọc Thanh chủ biên.
“a) Hàm hồi qui tuyến tính mẫu của Y theo X:
28
( ) ( )
)0000,0()000,0()000,0(
81,33019,1888,50
9455,0;9484,0;534483,167241,22
22
^
=
=−=
==−=
p
Ft
RRXY ii
Hàm hồi qui tuyến tính mẫu của Y theo X và D :
( )
)0000,0()751,0()000,0()000,0(
81,330);32,0()68,17(05,45
9427,0;9487,0;0973324,0532805,160562,22
22
^
=
=−=
==+−=
p
Ft
RRDXY iii
b) 532805,11 −=α cho biết khi giá bán tăng (hay giảm) 1 ngàn đ/kg thì lượng hàng bán
được trung bình của mặt hàng này sẽ giảm (hoặc tăng) 1,533 tấn/tháng.
097332,02 =α cho biết: Với giá bán như nhau, lượng hàng bán được trung bình ở thành
phố cao hơn ở nông thôn 0,09733 tấn/tháng.” (Nguyễn Thị Ngọc Thanh (2009), tr.88-89)
2. Kiểu nhiệm vụ 2SSTBT : So sánh trung bình của ba tổng thể A, B, C
Kĩ thuật
2
SSTBτ : (được tìm thấy thông qua thí dụ tr. 110)
- Tìm hàm hồi qui E(Y/D) : Yi = 1 2 1 3 2i i iD D Uβ β β+ + + .
(Trong đó 1iD = 1 nếu giá trị quan sát thuộc tổng thể A ; 1iD = 0 nếu giá trị quan sát
thuộc tổng thể khác ; 2iD = 1 nếu giá trị quan sát thuộc tổng thể B ; 2iD = 0 nếu giá
trị quan sát thuộc tổng thể khác)
- Xét hệ số 2β :
+ Nếu 2β khác 0 thì 2β thể hiện sự chênh lệch giữa giá trị trung bình của tổng thể A
so với tổng thể C
+ Nếu 2β = 0 thì không có sự chênh lệch giữa giá trị trung bình của hai tổng thể A và
C.
- Xét hệ số 3β :
+ Nếu 3β khác 0 thì 3β thể hiện sự chênh lệch giữa giá trị trung bình của tổng thể B
so với tổng thể C
+ Nếu 3β = 0 thì không có sự chênh lệch giữa giá trị trung bình của hai tổng thể B và
C.
29
Công nghệ
2
SSTBθ :
- Cách lượng hóa biến định tính bằng cách sử dụng biến giả D1i và D2i.
- Hàm hồi qui với biến định tính có 3 phạm trù:
E(Y/D) : Yi = 1 2 1 3 2i i iD D Uβ β β+ + + và các giá trị p tương ứng với các hệ số. (Trong
đó 1iD ; 2iD là hai biến giả)
2β biểu thị phần chênh lệch giữa giá trị trung bình của tổng thể C và tổng thể A
3β biểu thị phần chênh lệch giữa giá trị trung bình của tổng thể C và tổng thể B
Lý thuyết 2SSTBΘ :
“Hàm hồi qui tổng thể cho biết giá trị trung bình của biến phụ thuộc (Y) sẽ thay đổi như thế
nào khi biến độc lập (X) nhận các giá trị khác nhau” (GT2, tr.18)
1.3. Tổng kết chương 1
Trong chương 1, chúng tôi đã tìm hiểu, phân tích và làm rõ một số praxéologie có liên quan
đến so sánh tham số của các tổng thể trong GT1 và GT2. Đặc biệt, chúng tôi đã chỉ ra được
những yếu tố toán thống kê trong công nghệ của các praxéologie này. Sau đây là một số kết
quả chính của chương 1:
• Đối với GT1
So sánh tham số của hai tổng thể xuất hiện trong bài toán so sánh rủi ro của hai phương án
đầu tư chứng khoán. Thực chất, đây chính là bài toán so sánh độ phân tán của hai tổng thể.
GT1 đưa ra kĩ thuật so sánh như sau:
- So sánh phương sai hoặc độ lệch chuẩn của hai tổng thể khi hai tổng thể đó có kỳ
vọng (hay trung bình) bằng nhau.
- So sánh hệ số biến động của hai tổng thể khi hai tổng thể đó có kỳ vọng (hay giá trị
trung bình) khác nhau.
Như vậy, để chuẩn bị cho sinh viên học tốt môn Phân tích và đầu tư chứng khoán, môn XS
– TK cần thiết phải cung cấp cho sinh viên các khái niệm, đó là kỳ vọng, phương sai, độ
lệch chuẩn và hệ số biến động. Đặc biệt là các kĩ thuật giúp so sánh độ phân tán của hai tổng
thể.
• Đối với GT2
30
So sánh giá trị trung bình của các tổng thể được giải quyết bằng cách sử dụng mô hình hồi
quy với biến giả. Dựa vào hệ số của các mô hình này, chúng ta có thể đưa ra kết luận về giá
trị trung bình của các tổng thể hơn kém nhau như thế nào.
Như vậy, mô hình hồi qui với biến giả là một khái niệm cần thiết phải đưa vào chương trình
XS –TK để giúp sinh viên có thể học tốt hơn môn Kinh tế lượng.
Vậy, việc tiếp theo chúng tôi cần làm đó là:
- Tìm hiểu xem những khái niệm: kỳ vọng, trung bình, phương sai, độ lệch chuẩn, hệ
số biến động và mô hình hồi quy với biến giả được trình bày trong giáo trình Xác
suất – Thống kê như thế nào? Trong đó có những tổ chức toán học nào liên quan đến
so sánh các mẫu dữ liệu thống kê? Có sự chênh lệch nào giữa những khái niệm, lý
thuyết toán cần thiếtcho chuyên ngành và những nội dung được dạy trong XS-TK
không?
Đây cũng chính là nội dung của câu hỏi Q2 và Q3 mà chúng tôi sẽ tìm câu trả lời thông qua
việc phân tích giáo trình Xác suất – Thống kê của trường Đại học Kinh tế TP.HCM. Những
vấn đề này sẽ được chúng tôi trình bày chi tiết trong chương 2 của luận văn.
31
CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG
GIÁO TRÌNH XS – TK
Nội dung chính của chương 2 xoay quanh các câu hỏi sau:
Q2: Giáo trình XS – TK chuẩn bị cho sinh viên ra sao để sinh viên có thể
giải quyết tốt những vấn đề liên quan đến so sánh các mẫu dữ liệu TK mà hai
giáo trình chuyên ngành đã đề cập tới?
Q3: Có sự chênh lệch nào giữa những khái niệm, lý thuyết toán cần
thiếtcho chuyên ngành và những nội dung được dạy trong XS-TK không? Nếu
có thìsự khôngnối khớp đó ảnh hưởng đến sinh viên như thế nào?
Trên cơ sở phân tích ở chương 1, chúng tôi sẽ tìm hiểu xem vấn đề “so sánh các mẫu dữ
liệu thống kê” được trình bày trong giáo trình XS-TK như thế nào, đặc biệt là chỉ ra các tổ
chức toán học có liên quan đến vấn đề này. Với phân tích ở chương trước, chúng tôi thấy ở
đây cần phải làm rõ sự tồn tại của những tổ chức toán học liên quan đến kỳ vọng, phương
sai, độ lệch chuẩn, hệ số biến động, trung bình và hàm hồi qui với biến giả.
Giáo trình mà chúng tôi phân tích là cuốn giáo trình được sử dụng trong trường Đại học
Kinh tế TP.HCM, do tác giả Trần Gia Tùng viết, có tên là: Giáo trình lý thuyết xác suất &
thống kê toán học, Nxb Đại học Quốc gia TP. Hồ Chí Minh.
Đây là tài liệu được các giảng viên và sinh viên của trường Đại học Kinh tế TP.HCM tham
khảo và sử dụng. Trong luận văn này, chúng tôi sẽ ký hiệu đó là GT3.
Trước khi đi vào chi tiết, chúng tôi xem xét đề cương môn học XS-TK, nhằm làm rõ những
nội dung được đưa vào cũng như những vấn đề được ưu tiên giảng dạy.
Đề cương chi tiết của môn học (do sinh viên cung cấp) :
Ngày
(số tiết)
Nội dung giảng dạy
(tên chương, phần, phương
pháp giảng dạy)
Tài liệu đọc
(chương,
phần)
Chuẩn bị của
sinh viên
(bài tập, )
Ghi
chú
32
Ngày
(4 tiết)
Chương 1: Các khái niệm, các
công thức cơ bản
1-Phép thử, biến cố, không gian
mẫu
2- Định nghĩa xác suất
Giáo trình lý
thuyết và xác
suất thống kê.
Chương 1: §1,
§2
Ngày
(4 tiết)
Chương I: Các khái niệm, các
công thức cơ bản
3-Các công thức tính xác suất
Chương 1: §3 Giải các bài
tập chương 1
Ngày
(4 tiết)
Chương 2: Đại lượng ngẫu
nhiên và qui luật phân phối xác
suất
Chương 2
Giải các bài
tập chương 1
Ngày
(4 tiết)
Chương 3: Các qui luật phân
phối xác suất thông dụng
1- Phân phối nhị thức
2- Phân phối Poisson
3- Phân phối siêu bội
Chương 3
Phần §1, §2,
§3
Giải các bài
tập chương 2
Ngày
(4 tiết)
Chương 3: Các qui luật phân
phối xác suất thong dụng
4- Phân phối chuẩn
5- Phân phối χ2
6- Phân phối Student
Sửa bài tập chương 1
Chương 3
Phần §4, §5
Giải các bài
tập chương 3
Ngày
(4 tiết)
Chương 4: Đại lượng ngẫu
nhiên hai chiều – Hàm của các
đại lượng ngẫu nhiên.
Chương 2
Giải các bài
tập chương 3
33
Ngày
(4 tiết)
Chương 6: Lý thuyết mẫu
- Sửa các bài tập chương 2 và
chương 3
Chương 6
Giải các bài
tập chương 6
Ngày
(4 tiết)
Chương 7: Ước lượng các số
đặc trưng của tổng thể
- Sửa các bài tập chương 4
Chương 7
Giải các bài
tập chương 7
Ngày
(4 tiết)
Chương 8: Kiểm định giả thiết
thống kê
1- Bài toán kiểm định giả
thiết thống kê
2- Kiểm định giả thiết về
trung bình tổng thể
3- Kiểm định giả thiết về tỷ
lệ tổng thể
Chương 8
Phần §1, §2,
§3
Giải các bài
tập chương 8
Ngày
(4 tiết)
Chương 8: Kiểm định giả thiết
thống kê
9- Kiểm định giả thiết về qui
luật phân phối xác suất của
ĐLNN
10- Kiểm định giả thiết về
tính độc lập
Chương 8
Phần §4, §5,
§6, §7, §8, §9
§10
Giải các bài
tập chương 8
Ngày
(5 tiết)
- Sửa các bài tập chương 6, 7, 8
- Giải đáp thắc mắc
- Hệ thống môn học
Tổng
cộng :
34
45 tiết
Dựa vào đề cương này chúng tôi nhận thấy toàn bộ phần tương quan và hồi qui không được
dạy trong chương trình XS – TK. Điều này tác động đến sinh viên như thế nào, chúng tôi sẽ
phân tích kĩ ở mục dưới đây.
2.1. Phân tích GT3
2.1.1. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN
Kỳ vọng
Tùy theo việc ĐLNN là rời rạc hay liên tục, tập giá trị của nó là hữu hạn hay vô hạn đếm
được mà công thức tính kỳ vọng khác nhau. Cụ thể:
“• Đại lượng ngẫu nhiên rời rạc X có bảng phân phối xác suất
X x1 x2 xn
P p1 p2 pn
Kỳ vọng của X, ký hiệu là E(X), được xác định như sau:
E(X) = ∑
=
n
i
ii px
1
• Trong trường hợp X(S) vô hạn đếm được (và tổng ∑
+∞
=1i
ii px hội tụ tuyệt đối)
E(X) = ∑
+∞
=1i
ii px
• Đại lượng ngấu nhiên liên tục X có hàm mật độ xác suất là f(x) (và ∫
+∞
∞−
dxxxf )( hội tụ
tuyệt đối)
Kỳ vọng toán của X ký hiệu là E(X), xác định như sau:
E(X) = ∫
+∞
∞−
dxxxf )(
” (GT3, tr.46)
Để minh họa cho các định nghĩa trên, GT3 đưa vào hai ví dụ minh họa. Thông qua hai ví dụ
đó, tác giả muốn khẳng định ý nghĩa của kỳ vọng:
35
“Nói chung kỳ vọng cho ta ý niệm về độ lớn trung bình của đại lượng ngẫu nhiên X. Có khi
kỳ vọng còn được gọi là giá trị trung bình của X” (GT3, tr.47)
Đặc biệt, trong ví dụ 3.4, tác giả đưa ra bài toán so sánh kỳ vọng của hai đại lượng ngẫu
nhiên. Ví dụ được nêu như sau:
“Một công ty cần trang bị một số lượng lớn máy cho khu vực sản suất mới. Có hai loại máy
được xem xét là máy do công ty AP sản xuất và máy do công ty TB sản xuất với số liệu thống
kê như sau:
Mức độ hỏng 1 2 3
Máy
của
công ty
AP
Tỷ lệ hỏng (%) 4 4 2
Chi phi sửa chữa
(triệu đồng/năm) 7 10,5 15,5
Máy
của
công ty
TB
Tỷ lệ hỏng (%) 2 5 3
Chi phi sửa chữa
(triệu đồng/năm) 6,5 9,5 14
Giả sử các yếu tố khác không có sự khác biệt đáng kể và công ty này chỉ quan tâm đến chi phí
sửa chữa hàng năm, hỏi nên chọn mua máy của công ty nào sản xuất?
Giải : Gọi X là chi phí sửa chữa của một máy của công ty AP (triệu đồng/năm). Ta xem X là
đại lượng ngẫu nhiên có bảng phân phối xác suất như sau:
X 0 7 10,5 15,5
P 0,9 0,04 0,04 0,02
Ta có: E(X) = 1,01
Gọi Y là chi phí sửa chữa của một máy của công ty TB (triệu đồng/năm). Ta xem Y là đại
lượng ngẫu nhiên có bảng phân phối xác suất như sau:
Y 0 6,5 9,5 14
P 0,9 0,02 0,05 0,03
Ta có: E(Y) = 1,025
Vì 1,01 < 1,025; ta chọn mua máy của công ty AP.” (GT3, tr.48-49)
36
Trong ví dụ trên, người mua chỉ quan tâm tới chi phí sửa chữa hàng năm. Do đó, việc quyết
định mua máy của công ty nào sẽ phụ thuộc vào chi phí kỳ vọng sửa chữa một máy của
công ty đó có thấp hay không. Để giải quyết bài toán này, tác giả cho xác suất để máy chạy
tốt là 0,9 và xác suất để một máy hư là 0,1 (đối với cả hai loại máy của công ty AP và TB)
rồi lập bảng phân phối xác suất của các đại lượng ngẫu nhiên: chi phí sửa chữa một máy của
công ty AP và chi phí sửa một máy của công ty TB. Do chi phí sửa chữa kỳ vọng (hay trung
bình) nhỏ hơn nên máy của công ty AP đã được chọn. Như vậy, việc so sánh giá trị trung
bình của hai ĐLNN giúp người ta có thể đưa ra một quyết định hợp lý.
Ngoài việc giới thiệu ý nghĩa của kỳ vọng cho sinh viên, GT3 cũng nêu một số tính chất
thông dụng của kỳ vọng (có kèm theo chứng minh) như sau:
“(a) E(aX + b) = aE(X) + b
(b) E(X+Y) = E(X) + E(Y)
E(X1 + X2 + . + Xn)= E(X1)+ E(X2) + + E(Xn)
(c) Nếu X, Y độc thì E(X.Y) = E(X).E(Y)” (GT3, tr.49)
Mặc dù các khái niệm và tính chất liên quan đến kỳ vọng của một ĐLNN được đưa vào rất
chi tiết và đầy đủ nhưng những tính chất này không thể giải thích được cho những kĩ thuật
so sánh hai tham số trung bình bằng mô hình hồi qui với biến giả được trình bày trong giáo
trình Kinh tế lượng.
Phương sai và độ lệch chuẩn
Trước khi nêu ra định nghĩa, tác giả đã đặt ra vấn đề sau :
“Ta xem các đại lượng ngẫu nhiên rời rạc sau đây
X - 0,1 0,1 Z -90 10
P
2
1
2
1
P
10
1
10
9
Y -10000 10000
P
2
1
2
1
37
Mặc dù E(X) = E(Y) = E(Z) = 0 nhưng các ĐLNN này rất khác biệt nhau.
Ta cần đưa ra một đặc trưng cho sự khác biệt đó.” (GT3, tr.52)
Từ vấn đề đặt ra, cần thiết phải đưa thêm vào một tham số mới giúp chúng ta chỉ ra sự khác
nhau của các ĐLNN khi chúng có kỳ vọng như nhau. Mặt khác, tác giả cũng nhận xét rằng :
“Nếu đại lượng ngẫu nhiên X có E(X) = m thì
E(X – m) = E(X) – m = 0” (GT3, tr.52)
Do đó, nếu sử dụng đại lượng E(X – m) sẽ không chỉ ra được sự khác biệt giữa các ĐLNN.
Vì vậy, tham số cần đưa vào là phương sai, có định nghĩa như sau :
“Phương sai của đại lượng ngẫu nhiên X, kỳ hiệu là Var(X), được xác định như sau:
Var(X) = E[(X – E(X))2]” (GT3, tr.52)
Một công thức khác để tính phương sai :
“Var(X) = E(X 2) – [E(X)]2” (GT3, tr.52)
Tác giả cũng đặc biệt nhấn mạnh ý nghĩa của phương sai:
“Phương sai cho ta ý niệm về mức độ phân tán các giá trị của X xung quanh giá trị trung bình.
Phương sai càng lớn thì độ phân tán này càng lớn” (GT3, tr.52)
Với định nghĩa về phương sai nếu xem xét lại 3 đại lượng ngẫu nhiên X, Y, Z nêu trong ví
dụ ở trên, ta có :
Var(X) = 0,01 ; Var(Y) = 900 ; Var(Z) = 100000000
Như vậy, Var(Z) > Var(Y) > Var(X) hay độ phân tán của Z lớn nhất, kế tiếp là độ phân tán
của Y và cuối cùng, độ phân tán của X bé nhất.
Sau khi giới thiệu định nghĩa và ý nghĩa của phương sai, tác giả đưa vào 3 ví dụ, trong đó ví
dụ 3.6 và ví dụ 3.7 nhằm minh họa cho sinh viên cách tính phương sai khi biết bảng phân
phối xác suất hoặc biết hàm mật độ xác suất của ĐLNN X. Riêng ví dụ 3.8, ngoài việc tính
toán các kỳ vọng và phương sai của các ĐLNN, tác giả còn yêu cầu sinh viên phải so sánh
các giá trị tìm được :
“Một nhà đầu tư có 3 dự án. Gọi Xi (i = 1, 2, 3) là lợi nhuận khi thực hiện dự án thứ i, còn giá
trị âm chỉ số tiền bị thua lỗ. Qua nghiên cứu và bằng kinh nghiệm, nhà đầu tư có ước lượng
như sau :
X1 -2 -1 10 X2 -1 4 5
38
P 0,4 0,2 0,4 P 0,3 0,2 0,5
X3 -3 -2,5 8
P 0,3 0,2 0,5
Đơn vị tính : Tỷ đồng
Ta tính được :
E(X1) = 3 E(X2) = 3 E(X3) = 2,6
Var(X1) = 32,8 Var(X2) = 7 Var(X3)= 29,19
(Chú ý : Var(X) và E(X) không cùng đơn vị)
Nếu chọn một trong 3 dự án trên, theo bạn nên chọn dự án nào ?”
(GT3, tr.53-54)
Tác giả đưa ra câu hỏi mở đối với sinh viên và không nêu cách giải. Trong ví dụ trên có 3
ĐLNN X1, X2, X3 lần lượt là lợi nhuận khi thực hiện dự án thứ 1, 2, 3. Ta thấy bài toán ví
dụ này chính là một bài toán so sánh lợi nhuận và rủi ro trong đầu tư. Trong 3 dự án thì có 2
dự án cho lợi nhuận kỳ vọng bằng nhau còn dự án thứ 3 cho lợi nhuận kỳ vọng thấp hơn,
đồng thời phương sai của 3 dự án này đều khác nhau. Để quyết định chọn dự án nào thì sinh
viên phải xem xét cả lợi nhuận kỳ vọng và độ phân tán của mỗi dự án. Ở đây, sinh viên
chưa được tiếp cận định nghĩa rủi ro của dự án nên có thể hiểu độ phân tán của mỗi dự án
cho biết mức độ ổn định của lợi nhuận, nếu độ phân tán càng lớn thì khả năng lợi nhuận
nhận được khác với lợi nhuận kỳ vọng càng cao. Trong phần này, giáo trình mới chỉ giới
thiệu khái niệm phương sai và chưa hề nhắc tới hệ số biến động của ĐLNN. Chính vì vậy,
việc so sánh độ phân tán của ba dự án trên có vẻ khó khăn. Tuy nhiên, trong ví dụ này, tác
giả đã cố ý cho đại lượng ngẫu nhiên X3 có kỳ vọng thấp hơn kỳ vọng của hai đại lượng X1
và X2 nhưng có phương sai rất lớn. Trong khi đó, ĐLNN X1 vừa có kì vọng lớn hơn lại có
phương sai nhỏ nhất trong 3 dự án. Nếu sinh viên so sánh từng cặp dự án sẽ thấy ngay kết
quả:
- So sánh dự án 1 và 2 : Lợi nhuận kỳ vọng bằng nhau nhưng Var(X1) > Var(X2) do đó dự
án 2 tối ưu hơn dự án 1.
39
- So sánh dự án 2 và 3: E(X2) > E(X3) và Var(X2) lại nhỏ hơn Var(X3) rất nhiều. Vậy dự án
2 tối ưu hơn dự án 3. (Trong trường hợp này, kết luận độ phân tán của dự án 2 bé hơn độ
phân tán của
Các file đính kèm theo tài liệu này:
- tvefile_2014_05_30_8922550614_5125_1871508.pdf