Phân phối Chuẩn
Theo Liapunov, một ĐLNN X là tổng của một số
lớn các ĐLNN độc lập và mỗi giá trị của ĐLNN
thành phần có vai trò rất nhỏ trong tổng thì X sẽ là
một ĐLNN có quy luật phân phối Chuẩn.
Xét Z ~ N(0; 1), ta có P(–zα/2 < Z < zα/2) = 1–α.
Lấy α = 5% thì P(–1,96 < Z < 1,96) = 95%.
Điều này chứng tỏ một ĐLNN có phân phối
Chuẩn Chính tắc thì 95% giá trị của nó đều nằm
trong khoảng (–1,96; 1,96). Nói theo nguyên lý Xác
suất Lớn thì hầu hết giá trị của phân phối Chuẩn
Chính tắc đều nằm trong khoảng (–1,96; 1,96).Lấy α = 5% thì P(Z < 1,6449) = 95%.
Điều này chứng to một ĐLNN có phân phối
Chuẩn Chính tắc thì 95% giá trị của nó đều nhỏ hơn
1,6449. Nói theo nguyên lý Xác suất Lớn thì hầu hết
giá trị của phân phối Chuẩn Chính tắc đều nhỏ hơn
1,6449.
Nếu X ~ N(µ; σ2) thì X − µ
σ
là phân phối Chuẩn
Chính tắc. Giá trị X − µ
σ
gọi là điểm−Z. ĐLNN X có
phân phối Chuẩn thì hầu hết giá trị điểm−Z của X
đều nằm trong khoảng (–1,96; 1,96) và hầu hết đều
nhỏ hơn 1,6449.
34 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 656 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất - Chương 3: Các phân phối xác suất thông dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 3
Các phân phối xác suất thông dụng
1. Các phân phối của ĐLNN rời rạc
1.1 Phân phối Nhị thức
1.1.1 Định nghĩa và các số đặc trưng
Trong một phép thử, biến cố A xảy ra với xác
suất p. Thực hiện phép thử n lần độc lập. Gọi X là số
lần biến cố A xảy ra thì X là ĐLNN. Theo công thức
Nhị thức:
P(X=k) = k k n knC p q
−
ĐLNN X có phân phối xác suất như trên được
được gọi là ĐLNN có phân phối Nhị thức, ký hiệu X
~ B(n, p). Giá trị của X là 0, 1, ..., n.
Đặt q = 1–p. Ta tính được:
E(X) = np Var(X) = npq
(n+1)p – 1 ≤ Mod(X) ≤ (n+1)p
Excel
Pk = P(X=k) =BINOMDIST(k, n, p, 0)
P(X ≤ k) =BINOMDIST(k, n, p, 1)
Ví dụ
(1) Lấy ngẫu nhiên có hoàn lại 10 sản phẩm từ lô
hàng có 80% chính phẩm. Tính xác suất có 8 chính
phẩm.
Biến cố "lấy được chính phẩm" có xác suất p = 80%.
Số lần lặp lại phép thử là n = 10. Gọi X là số chính
phẩm đếm được thì X ~ B(10; 80%). Xác suất cần
tính là P(X=8). Theo công thức:
P(X=8) = 810C (0,8)
8(0,2)2 ≈ 30%
=BINOMDIST(8, 10, 80%, 0)
(2) Cho X~B(79; 75%), Y~B(30; 25%). Tính Mod(X),
Mod(Y).
Lưu ý Mod(X), Mod(Y) đều là số nguyên, ta có:
59 ≤ Mod(X) ≤ 60 ⇒ Mod(X) = 59 hay Mod(X) = 60
6,75 ≤ Mod(Y) ≤ 7,75 ⇒ Mod(Y) = 7
(3) Một xạ thủ bắn trúng bia với xác suất 20%. Tính
xác suất xạ thủ này bắn vào bia 5 phát thì có không
quá 2 phát trúng bia.
1.1.2 Xấp xỉ Nhị thức bởi phân phối Chuẩn
Xét B(n, p). Nếu n đủ lớn và p không quá gần 0
hay 1 thì phân phối Nhị thức được xấp xỉ bởi phân
phối Chuẩn có cùng kỳ vọng và phương sai:
B(n, p) ≈ N(np, npq)
Ta cũng có công thức tính gần đúng:
P(X = k) ≈
1 k np
( )
npq npq
−
ϕ
=NORMDIST(k, n*p, (n*p*q)^.5, 0)
P(a ≤ X ≤ b) ≈ Φ(
b np
npq
−
) − Φ(
a np
npq
−
)
Trong đó ϕ là hàm Gauss ϕ(z) =
2z / 21 e
2
−
pi
.
Ghi chú
"n đủ lớn và p không quá gần 0 hay 1" nghĩa là
p ≥ 10%, q ≥ 10%, np > 5 và nq > 5.
Ví dụ
Xác suất chữa khỏi bệnh của một loại thuốc là
80%. Có 1.000 người dùng thuốc này. Tính xác suất
có ít ra 790 người khỏi bệnh.
Biến cố "một người khỏi bệnh sau khi dùng thuốc" có
xác suất p = 85%. Số người dùng thuốc là n = 1.000.
Gọi X là số người khỏi bệnh sau khi dùng thuốc thì
X~B(1.000; 80%). Xác suất cần tính là P(X ≥ 790).
Do n đủ lớn và p không quá gần 0 hay 1 nên
B(1.000; 80%) ≈ N(800, 160).
P(X ≥ 790) ≈ 0,5 –
790 800
( )
160
−
Φ = 0,5 + Φ(0,79) ≈ 79%
=1–NORMDIST(790, 800, 160^.5, 1)
1.2 Phân phối Poisson
1.2.1 Định nghĩa và các số đặc trưng
ĐLNN rời rạc X nhận các giá trị 0, 1, ... với
P(X=k) định bởi công thức sau gọi là ĐLNN có phân
phối Poisson với tham số λ (λ > 0), ký hiệu X ~ P(λ):
P(X=k) =
k
e
k !
−λλ
Ta tính được:
E(X) = λ Var(X) = λ λ – 1 ≤ Mod(X) ≤ λ
Excel
P(X=k) =POISSON(k, λ, 0) P(X ≤ k) =POISSON(k, λ, 1)
Ghi chú
Khi λ > 10 thì P(λ) ≈ N(λ, λ).
1.2.2 Xấp xỉ Nhị thức bởi phân phối Poisson
Xét ĐLNN B(n, p). Nếu n đủ lớn và p đủ nhỏ
thì phân phối Nhị thức được xấp xỉ bởi phân phối
Poisson có cùng kỳ vọng:
B(n, p) ≈ P(np)
Ghi chú
"n đủ lớn và p đủ nhỏ" nghĩa là n ≥ 20 và p ≤ 5%.
Điều kiện khác là n ≥ 30, p ≤ 10% và np < 10.
Xấp xỉ sẽ tốt hơn nếu n ≥ 100 và np < 10.
Ví dụ
(1) Xác suất bị đứt trong 1 giờ hoạt động của một
ống sợi là 0,2%. Một máy dệt có 1.000 ống sợi. Tính
xác suất trong 1 giờ hoạt động của máy dệt có nhiều
hơn 2 ống sợi bị đứt.
Biến cố "ống sợi bị đứt" có xác suất p = 0,2%.
Gọi X là số ống sợi bị đứt trong số n = 1.000 ống sợi
thì X~B(1.000, 0,2%). Xác suất cần tính là P(X > 2).
Do n đủ lớn và p đủ nhỏ nên ta xấp xỉ X bởi P(λ)
với λ = 1.000×0,2% = 2. Ta có:
P(X > 2) = 1 – P(X=0) – P(X=1) – P(X=2)
= 1 –
0
22 e
0 !
−
–
1
22 e
1 !
−
–
2
22 e
2 !
−
= 1 – e–2(1+2+2) ≈ 32%
=1−POISSON(2, 2, 1)
(2) Một cộng đồng có khoảng 2% người sống đến 90
tuổi. Cộng đồng hiện có 1.000 người.
a) Tính trung bình cộng đồng có bao nhiêu người
sống đến 90 tuổi?
b) Tính xác suất cộng đồng có đúng 20 người sống
đến 90 tuổi.
c) Tính xác suất cộng đồng có hơn 20 người sống
đến 90 tuổi.
(3) Trung bình một ngày bãi giữ xe nhận 600 xe.
Tính xác suất ngày mai có 700 xe được gởi tại bãi
giữ xe này.
1.3 Phân phối Siêu bội
1.3.1 Định nghĩa và các số đặc trưng
Xét tập hợp gồm N phần tử trong đó có M phần
tử có tính chất tốt. Gọi X là số phần tử có tính chất
tốt có được khi lấy ngẫu nhiên n phần tử. Xét k là
một số nguyên từ max(0, n+M–N) đến min(M, n).
Theo công thức Siêu bội ta có:
P(X=k) =
k n k
M N M
n
N
C .C
C
−
− =HYPGEOMDIST(k, n, M, N)
X được gọi là ĐLNN có phân phối Siêu bội, ký
hiệu X ~ H(N, M, n).
Đặt p = M/N và q = 1 – p. Ta tính được:
E(X) = np Var(X) =
N n
npq
N 1
−
−
Mod(X) =
(n 1)(M 1)
N 2
+ +
+
Ví dụ
(1) Một công ty có 10 chiếc xe trong đó có 3 chiếc
Lexus. Điều ngẫu nhiên 4 chiếc xe để đi công tác.
Tính xác suất trong các xe đó có 1 chiếc Lexus.
Mô hình Siêu bội.
N = 10 M = 3 n = 4
Gọi X là số xe Lexus có trong các xe được điều thì
X~H(10, 3, 4). Cần tính là P(X=1).
P(X=1) =
1 3
3 7
4
10
C .C
C
= 50% =HYPGEOMDIST(1, 4, 3, 10)
(2) Một lớp 70 sinh viên trong đó có 40 sinh viên
giỏi Toán. Chọn ngẫu nhiên 10 sinh viên. Tính xác
suất có ít ra là 3 sinh viên giỏi Toán.
1.3.2 Xấp xỉ Siêu bội bởi phân phối Nhị thức
Nếu n đủ nhỏ so với N, M và p = M/N không quá
gần 0 hay 1 thì ta có xấp xỉ:
H(N, M, n) ≈ B(n,
M
N
)
Ghi chú
"n đủ nhỏ so với N, M và p = M/N không quá gần 0
hay 1" nghĩa là 20n < N, 20n < M và 10% ≤ p ≤ 90%.
* Khi n đủ nhỏ so với N thì việc lấy ngẫu nhiên có
hoàn lại hoặc không hoàn lại là gần như nhau.
Ví dụ
(1) Lô hàng gồm 10.000 sản phẩm trong số có 9.000
chính phẩm. Lấy ra 10 sản phẩm. Tính xác suất
trong các sản phẩm này có 9 chính phẩm.
Mô hình Siêu bội.
Gọi X là số chính phẩm có trong 10 sản phẩm lấy ra
thì X ~ H(1.000, 900, 10). Cần tính P(X=9).
Vì n đủ nhỏ so với N, M và p = M/N không quá gần 0
hay 1 nên:
H(1.000, 900, 10) ≈ B(10, 900/1.000) = B(10, 90%)
Vậy:
P(X=9) = 910C .(90%)
9.(10%)1 ≈ 39%
=BINOMDIST(9, 10, 90%, 0)
(2) Tỷ lệ phế phẩm của nhà máy là 90%. Khách
hàng lấy 100 sản phẩm để kiểm tra và nếu thấy có
ít ra là 93 chính phẩm thì đồng ý mua sản phẩm của
nhà máy. Tính xác suất khách hàng đồng ý mua.
Gọi N, M là tổng số sản phẩm, chính phẩm của nhà
máy, X là số chính phẩm có trong 100 sản phẩm lấy
ra kiểm tra thì X ~ H(N, M, 100). Cần tính P(X ≥ 93).
Do số sản phẩm lấy ra kiểm tra đủ nhỏ so với số sản
phẩm cũng như số chính phẩm của nhà máy và tỷ
chính phẩm M/N = 90% không quá gần 0 hay 1 nên:
H(N, M, 100) ≈ B(100, 90%)
Lại do n = 100 đủ lớn và p = 90% không quá gần 0
hay 1 nên B(100, 90%) ≈ N(90, 9). Vậy:
P(X ≥ 93) = 0,5 –
93 90
( )
9
−
Φ = 0,5 – Φ(1) ≈ 15,87%
=1–NORMDIST(93, 90, 9^.5, 1)
Xác suất khách hàng đồng ý mua sản phẩm của nhà
máy là 15,87%.
2. Các phân phối của ĐLNN liên tục
2.1 Phân phối Chuẩn
Theo Liapunov, một ĐLNN X là tổng của một số
lớn các ĐLNN độc lập và mỗi giá trị của ĐLNN
thành phần có vai trò rất nhỏ trong tổng thì X sẽ là
một ĐLNN có quy luật phân phối Chuẩn.
Xét Z ~ N(0; 1), ta có P(–zα/2 < Z < zα/2) = 1–α.
Lấy α = 5% thì P(–1,96 < Z < 1,96) = 95%.
Điều này chứng tỏ một ĐLNN có phân phối
Chuẩn Chính tắc thì 95% giá trị của nó đều nằm
trong khoảng (–1,96; 1,96). Nói theo nguyên lý Xác
suất Lớn thì hầu hết giá trị của phân phối Chuẩn
Chính tắc đều nằm trong khoảng (–1,96; 1,96).
Lấy α = 5% thì P(Z < 1,6449) = 95%.
Điều này chứng to một ĐLNN có phân phối
Chuẩn Chính tắc thì 95% giá trị của nó đều nhỏ hơn
1,6449. Nói theo nguyên lý Xác suất Lớn thì hầu hết
giá trị của phân phối Chuẩn Chính tắc đều nhỏ hơn
1,6449.
Nếu X ~ N(µ; σ2) thì
X − µ
σ
là phân phối Chuẩn
Chính tắc. Giá trị
X − µ
σ
gọi là điểm−Z. ĐLNN X có
phân phối Chuẩn thì hầu hết giá trị điểm−Z của X
đều nằm trong khoảng (–1,96; 1,96) và hầu hết đều
nhỏ hơn 1,6449.
Ví dụ
Trọng lượng ghi trên bao bì của một bao cám là
5Kg với độ lệch chuẩn là 0,1Kg. Biết trọng lượng của
một bao cám lấy ngẫu nhiên là một ĐLNN có phân
phối Chuẩn.
a) Một bao cám được coi là đạt tiêu chuẩn nếu
trọng lượng sai lệch không quá 200g trọng lượng ghi
trên bao bì. Tính tỷ lệ bao cám đạt tiêu chuẩn.
b) Tính xác suất mua được một bao cám có trọng
lượng từ 4,9Kg đến 5,2Kg.
c) Trọng lượng tối đa của một bao cám trong số
95% bao cám nhẹ nhất là bao nhiêu?
Gọi X là trọng lượng một bao cám (đơn vị: Kg). Theo
giả thiết thì X ~ N(µ, σ2) với µ = 5, σ = 0,1.
a) Cần tính P(X − 5 < 0,2). Ta có:
P(X−5< 0,2) = 2Φ(0,2/0,1) = 2Φ(2) ≈ 95%
=2*NORMSDIST(.2/.1)−1
b) Cần tính P(4,9 < X < 5,2). Ta có:
P(4,9 < X < 5,2) = Φ(
5, 2 5
0, 1
−
) − Φ(
4, 9 5
0, 1
−
)
= Φ(2) – Φ(–1) = Φ(2)+Φ(1) ≈ 82%
=NORMDIST(5.2, 5, .1, 1) − NORMDIST(4.9, 5, .1, 1)
c) Gọi x là trọng lượng cần tìm. Trọng lượng của
một bao cám trong số 95% bao cám nhẹ nhất có
điểm−Z không quá 1,6449. Vậy:
x 5
0, 1
−
= 1,6449 ⇒ x = 5,1645
Trọng lượng tối đa của một bao cám trong số 95%
bao cám nhẹ nhất là 5,1645Kg.
2.2 Phân phối Chi Bình phương
Xét X1, X2, , Xk là các ĐLNN độc lập và có
phân phối Chuẩn Chính tắc. Đặt:
χ2 = 2 2 21 2 kX X ... X+ + +
χ2 là ĐLNN liên tục gọi là có phân phối Chi
Bình phương bậc tự do k, ký hiệu χ2~χ2(k). Ta có:
E(χ2(k)) = k Var(χ2(k)) = 2k
Khi k ≥ 30 thì phân phối Chi Bình phương được
xấp xỉ bởi phân phối Chuẩn Chính tắc.
Trong ứng dụng, ta cần tìm phân vị mức α của
phân phối Chi Bình phương χ2~χ2(k), tức là tìm χ2α
sao cho P(χ2 > χ2α) = α. Giá trị χ
2
α được tìm bằng cách
tra bảng kê số hoặc dùng hàm Excel =CHIINV(α, k).
2.3 Phân phối Student
Xét hai ĐLNN độc lập Z~N(0, 1), χ2~χ2(k). Đặt:
T = 2Z / / kχ
T là ĐLNN liên tục gọi là có phân phối Student
bậc tự do k, ký hiệu T ~ T(k). Ta có:
E(T) = 0 Var(T) =
k
k 2−
Khi k ≥ 30 thì phân phối Student được xấp xỉ
bởi phân phối Chuẩn Chính tắc.
Trong ứng dụng, ta cần tìm phân vị mức α của
phân phối Student T~T(k), tức là tìm tα sao cho
P(T > tα) = α. Giá trị tα được tìm bằng cách tra bảng
kê số hoặc dùng hàm Excel =TINV(2*α, k).
2.4 Phân phối Fisher–Snedecor
Xét hai ĐLNN độc lập là χ2(n1) và χ
2
(n2). Đặt:
F =
2
1 1
2
2 2
(n ) / n
(n ) / n
χ
χ
F là ĐLNN liên tục gọi là có phân phối Fisher–
Snedecor bậc tự do n1 và n2, ký hiệu F ~ F(n1, n2).
Khi n2 > 4, ta tính được:
E(F) = 2
2
n
n 2−
Var(F) =
2
2 1 2
2
1 2 2
2n (n n 2)
n (n 2) (n 4)
+ −
− −
Trong ứng dụng, ta cần tìm phân vị mức α của
phân phối Fisher-Snedecor F ~ F(n1, n2), tức là tìm fα
sao cho P(F > fα) = α. Giá trị fα được tìm bằng cách tra
bảng kê số hoặc dùng hàm Excel =FINV(α, n1, n2).
3. Phép toán trên các phân phối
3.1 Tổng của các phân phối Nhị thức
Nếu X1~B(n1, p), X2~B(n2, p),..., Xm~B(nm, p) là
các ĐLNN độc lập thì tổng của chúng sẽ là ĐLNN có
phân phối Nhị thức với n = n1 + n2 +...+ nm. Tức là:
B(n1, p) + B(n2, p) + B(nm, p) = B(n1 + n2 +...+ nm, p)
Ví dụ
Lô hàng I (II) gồm 500 (750) sản phẩm trong đó
có 200 (300) sản phẩm tốt. Mua 5 sản phẩm thuộc lô
hàng I và 10 sản phẩm thuộc lô hàng II. Tính xác
suất mua được 8 sản phẩm tốt.
Gọi X1 (X2) là số sản phẩm tốt mua được tại cửa
hàng I (II) thì số sản phẩm tốt mua được là
Y = X1 + X2. Xác suất cần tính là P(X = 8). Ta có:
X1 ~ H(500, 200, 5) X2 ~ H(750, 300, 10)
Do n đủ nhỏ so với N, M và p = M/N không quá gần 0
hay 1 nên X1 ≈ B(5, 40%) X2 ≈ B(10, 40%)
Vậy Y = X1+X2 ≈ B(5, 40%) + B(10, 40%) = B(15, 40%)
⇒ P(Y = 8) ≈ 11,8%
3.2 Tổng của các phân phối Poisson
Nếu X1~P(λ1), X2~P(λ2),..., Xn~P(λn) là các ĐLNN
độc lập thì tổng của chúng sẽ là ĐLNN có phân phối
Poisson với tham số λ = λ1 + λ2 +...+ λn. Tức là:
P(λ1) + P(λ2) + ... + P(λn) = P(λ1 + λ2 +...+ λn)
Ví dụ
Máy dệt I (II, III) có 1.000 (1.500, 1.000) ống
sợi. Xác suất bị đứt một ống sợi trên máy I (II, III)
là 0,2% (0,1%, 0,15%). Tính xác suất 3 máy dệt có từ
5 ống sợi các loại bị đứt trở lên.
Gọi X1, X2, X3 là số ống sợi loại A, B, C bị đứt thì
tổng số ống sợi bị đứt là Y = X1 + X2 + X3. Cần tính
P(Y ≥ 5). Ta có:
X1~B(1000;0,2%) X2~B(1500;0,1%) X3~B(1000;0,15%)
Do n đủ lớn và p đủ nhỏ nên X1, X2, X3 được xấp xỉ:
X1 ≈ P(2) X2 ≈ P(1,5) X3 ≈ P(1,5)
⇒ Y ≈ P(2) + P(1,5) + P(1,5) = P(2 + 1,5 + 1,5) = P(5)
⇒ P(Y ≥ 5) = 1 − P(Y ≤ 4) ≈ 56% =1 − POISSON(4, 5, 1)
3.3 Tổ hợp tuyến tính các phân phối Chuẩn
Nếu X1~N(µ1, 21σ ), X2~N(µ2,
2
2σ ),..., Xn~N(µn,
2
nσ ) là
các ĐLNN độc lập thì tổ hợp tuyến tính của chúng
a1X1 + a2X2 +...+ anXn cũng là ĐLNN có phân phối
Chuẩn với kỳ vọng là a1µ1 + a2µ2 +...+ anµn, phương sai
là 2 2 2 2 2 2n1 1 2 2 2a a ... aσ + σ + + σ . Tức là:
a1N(µ1, 21σ ) + a2N(µ2,
2
2σ ) +...+ anN(µn,
2
nσ )
= N(a1µ1 + a2µ2 +...+ anµn, 2 2 2 2 2 2n1 1 2 2 2a a ... aσ + σ + + σ )
Ví dụ
Trong một nông trại, trọng lượng trung bình của
một con gà trống là 1,5Kg với độ lệch chuẩn 100g,
trọng lượng trung bình của một con gà mái là 1,7Kg
với độ lệch chuẩn 200g. Được biết, trọng lượng của
một con gà được chọn ngẫu nhiên là ĐLNN có phân
phối Chuẩn. Một người mua 2 con gà trống và 3 con
gà mái. Tính xác suất trọng lượng của 5 con gà này
không vượt quá 8,5Kg.
Gọi X1 (X2) là trọng lượng (Kg) một con gà trống
(mái). Trọng lượng 5 con gà được mua là Y = 2X1 + 3X2.
Cần tính P(X ≤ 8,5).
Theo giả thiết X1~N(1,5; 0,1
2), X2~N(1,7; 0,2
2) nên
Y = 2X1 + 3X2 là phân phối Chuẩn với kỳ vọng và
phương sai là:
µ = 2×1,5 + 3×1,7 = 8,1
σ2 = 22×0,12 + 32×0,22 = 2,46
Vậy:
P(Y ≤ 8,5) = 0,5 + Φ(
8, 5 8, 1
2, 46
−
) = 0,5+Φ(0,25) ≈ 60%
=NORMDIST(8, 8.1, 2.46^.5, 1)
Các file đính kèm theo tài liệu này:
- bai_giang_ly_thuyet_xac_suat_chuong_3_cac_phan_phoi_xac_suat.pdf