Luận văn Các số tổ hợp và một số ứng dụng trong thống kê

Mở đầu 1

1 Các số nhị thức: những khía cạnh đại số và tổ hợp 3

1.1 Đồng nhất thức các số nhị thức: chứng minh đại số và tổ hợp 3

1.2 Nghịch đảo các số nhị thức . . . . . . . . . . . . . . . . . . . 21

2 Một số ứng dụng của số nhị thức trong thống kê 29

2.1 Một số khái niệm của xác suất . . . . . . . . . . . . . . . . . 29

2.2 Phân bố nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.3 Hồi quy Catalan . . . . . . . . . . . . . . . . . . . . . . . . . 38

Kết luận 49

Tài liệu tham khảo 50

54 trang | Chia sẻ: honganh20 | Lượt xem: 628 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Luận văn Các số tổ hợp và một số ứng dụng trong thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ằng số Fibonacci fn+1, tức là: n ∑ k=0 ( n− k k ) = fn+1 (1.9) Chứng minh. * Bước cơ sở. Đối với n = 0 và n = 1 thì tổng đường chéo đông bắc lần lượt là 1= f1 và 1+0= f2. * Giả thiết quy nạp. Với n≥ 2, giả sử rằng n−1 ∑ k=0 ( n−1− k k ) = fn và n−2 ∑ k=0 ( n−2− k k ) = fn−1 * Bước quy nạp. Bằng quan hệ hồi quy Pascal, ta có( n− k k ) = ( n− k−1 k−1 ) + ( n− k−1 k ) 12 do đó n ∑ k=0 ( n− k k ) = n ∑ k=0 ( n− k−1 k−1 ) + n ∑ k=0 ( n− k−1 k ) = n−2 ∑ j=0 ( n− j−2 j ) + n−1 ∑ k=0 ( n− k−1 k ) = fn−1+ fn ( giả thiết quy nạp) = fn+1 ( phép hồi quy Fibonacci) Tích của hệ số nhị thức Một tính chất khác trong tam giác Pascal là hệ thức liên hệ giữa mỗi một phần tử và phần tử phía trên bên trái của nó. Ví dụ 1.1.17. Chúng ta theo dõi phần được thêm vào từ tam giác Pascal. 4 ( 7 4 ) = 4 ·35= 140= 7 ·20= 7 ( 6 3 ) n (n 2 ) (n 3 ) (n 4 ) (n 5 ) 5 6 20 7 35 8( 7 4 ) · 4 7 = 35 · 4 7 = 20= ( 6 3 ) hoặc tương đương( 7 4 ) ·4= 140= ( 6 3 ) ·7 13 Nguyên tắc chung của hệ thức này được gọi là tính hấp thu, được thiết lập bởi mệnh đề tiếp theo. Mệnh đề 1.1.18. ( Tính hấp thu). Với 0≤ k ≤ n, ta có:( n k ) k = n ( n−1 k−1 ) (1.10) Chứng minh. (Chứng minh đại số). Bằng biến đổi đại số, ta có( n k ) k = nk k! k = nk (k−1)! = n (n−1)k−1 (k−1)! = n ( n−1 k−1 ) Chứng minh. (Chứng minh tổ hợp). Ta thấy rằng ở vế trái( n k ) k là số cách chọn k phần tử từ tập n phần tử nhân với k. Ở vế phải là lấy phần tử n nhân với số cách chọn k−1 phần tử từ n−1 phần tử còn lại n ( n−1 k−1 ) Hai kết quả này là tương đương nhau. Tính hấp thu là một trường hợp đặc biệt của mối quan hệ giữa một phần tử và các phần tử khác dọc theo đường chéo tây bắc. Mối quan hệ này được biểu thị bằng một đồng nhất thức tổ hợp bậc cao, là sự tổng quát hóa cho minh họa sau đây. Ví dụ 1.1.19. Tiếp theo, ta nhận thấy rằng ở vị trí 1 về phía tây bắc của hệ số (7 4 ) ta có 20= ( 6 3 ) = ( 7 4 ) 41 71 = 35 · 4 7 14 ở vị trí 3 về phía tây bắc của (7 4 ) trong tam giác Pascal, ta có 4= ( 4 1 ) = ( 7 4 ) 43 73 = 35 · 24 210 n (n 1 ) (n 2 ) (n 3 ) (n 4 ) (n 5 ) 4 4 5 6 7 35 8 35 · 4 3 73 = ( 7 4 ) · 4 3/3! 73/3! = ( 4 1 ) = 4 hoặc tương đương( 7 4 ) · ( 4 3 ) = ( 7−3 4−3 ) · ( 7 3 ) Tính chất của phương trình sau đây là tính chất tập con của tập con. Mệnh đề 1.1.20. (Đồng nhất thức tập con của một tập con). Đối với 0≤ k ≤ m≤ n, ta có: ( n m )( m k ) = ( n k )( n− k m− k ) (1.11) Chứng minh. (Chứng minh đại số). Bằng các tính toán đại số đơn giản, ta có ( n m )( m k ) = n! m!(n−m)! · m! k!(m− k)! = n! k!(n−m)!(m− k)! = n! k!(n− k)! · (n− k)! (n−m)!(m− k)! 15 = ( n k )( n− k m− k ) Chứng minh. (Chứng minh tổ hợp). Chúng ta thấy rằng tổ hợp ở vế trái( n m )( m k ) là số cách chọn m phần tử từ tập có n phần tử nhân với số cách chọn k phần tử từ tập có m phần tử. Điều này rõ ràng tương đương với số cách chọn k phần tử từ tập n nhân với số cách chọn m− k phần tử từ tập n− k phần tử còn lại như ở vế phải. ( n k )( n− k m− k ) Phép nhân chập Vandermonde. Định lí 1.1.21. (Phép nhân chập Vandermonde). Giả sử m, n, k là các số nguyên không âm , khi đó n ∑ j=0 ( n j )( m k− j ) = ( n+m k ) (1.12) Chứng minh. (Chứng minh tổ hợp). Giả định rằng có n+m phần tử trong một tập, n phần tử màu xanh và m phần tử màu đỏ, và phải chọn ra k phần tử, thì có (n+m k ) cách chọn, đó là giá trị ở vế phải. Số cách để chọn j phần tử màu xanh và k− j phần tử màu đỏ là tích (nj)( mk− j). Vì vậy tổng tất cả các tích này ở vế trái phải giống như ở vế phải. Chứng minh. (Chứng minh khác). Tổng bên trái của phương trình tổ hợp trên bằng hệ số của xk ở vế trái của phương trình đa thức (1+ x)n(1+ x)m = (1+ x)n+m 16 và hệ số nhị thức ở vế phải của phương trình tổ hợp bằng hệ số của xk ở vế phải của phương trình đa thức đó. Bảng tóm tắt các đồng nhất thức của các số nhị thức cơ bản( n k ) = ( n−1 k ) + ( n−1 k−1 ) quan hệ hồi quy Pascal( n k ) = nk k! Công thức bậc lũy thừa( n k ) = n! k!(n− k)! Công thức giai thừa( n k ) = ( n n− k ) Tính đối xứng n ∑ k=0 ( n k ) = 2n Tổng dòng n ∑ r=0 ( r c ) = ( n+1 c+1 ) Tổng cột n ∑ k=0 ( r+ k k ) = ( r+n+1 n ) Đường chéo đông nam m ∑ k=0 ( n− k m− k ) = ( n+1 m ) Đường chéo tây bắc n ∑ k=0 ( n− k k ) = fn+1 Đường chéo đông bắc Fibonacci( n k ) k = n ( n−1 k−1 ) Tính hấp thu( n m )( m k ) = ( n k )( n− k m− k ) Tập con của một tập con n ∑ j=0 ( n j )( m k− j ) = ( n+m k ) Phép nhân chập Vandermonde Tính chẵn lẻ của các số nhị thức Một điều thú vị nữa khi tìm hiểu về các số nhị thức, đó là làm thế nào ta có thể xác định được tính chẵn lẻ của một hệ số nhị thức nhất định, chẳng 17 hạn như ( 165 93 ) mà không cần phải tính toán. Tam giác Pascal sẽ cho ta biết điều bí mật này. Ta thấy rằng tất cả các hạng tử trong dòng 1, 3 và 7, các số có dạng 2n− 1 là lẻ. Hơn nữa, số lượng các số lẻ liên tiếp dường như là lũy thừa của 2. Sự xác định tính chẵn lẻ của một hệ số nhị thức đã được nghiên cứu có hệ thống bởi nhà toán học người Anh James Glaisher (1848-1928). Định lí 1.1.22. Giả sử n và k là các số nguyên không âm, khi đó ( n k ) ≡ 0 mod 2 nếu n là chẵn và k là lẻ(bn/2c bk/2c ) mod 2 nếu n lẻ và k chẵn. Chứng minh. Để chứng minh định lý này ta xét 4 trường hợp sau đây. *Trường hợp 1: n chẵn và k lẻ. Vì n là chẵn, rõ ràng trong trường hợp này giá trị ở vế phải của đồng nhất thức hấp thu k ( n k ) = n ( n−1 k−1 ) là chẵn. Vì tích số k (n k ) ở vế trái cũng phải là chẵn và vì k là số lẻ nên theo đó (n k ) là chẵn. *Trường hợp 2: n chẵn và k chẵn. Trong trường hợp này chúng ta khai triển các hệ số nhị thức( n k ) = nk k! = n(n−1)(n−2)...(n− k+1) 1.2.3...k = (n−1)(n−3)...(n− k+1) 1.3.5...(k−1) · n(n−2)(n−4)...(n− k+2) 2.4.6...k Vì mẫu thức có k/2 thừa số chẵn, chúng ta tiếp tục = (n−1)(n−3)...(n− k+1) 1.3.5...(k−1) · n(n−2)(n−4)...(n− k+2) 2 k 2 ·1 ·2 ·3 · · · k2 18 và vì tử thức có k/2 thừa số chẵn, = (n−1)(n−3)...(n− k+1) 1.3.5...(k−1) · 2 k 2 · n2(n2−1)(n2−2) · · ·(n2− k2+1) 2 k 2 ·1 ·2 ·3 · · · k2 = (n−1)(n−3)...(n− k+1) 1.3.5...(k−1) · ( n/2 k/2 ) Do đó, 1.3.5....(k−1) ( n k ) = (n−1)(n−3)...(n− k+1) ( n/2 k/2 ) Từ đó suy ra cả n và k đều chẵn,( n k ) ≡ ( n/2 k/2 ) ≡ (bn/2c bk/2c ) mod 2 (1.13) Sự tương đương đầu tiên trong (1.13) là vì mỗi thừa số đứng trước hệ số nhị thức trong tử số và mẫu số là lẻ và phép nhân của một số nguyên với một số lẻ không làm thay đổi tính chẵn lẻ. Điều thứ hai là vì n/2= bn/2c và k/2= bk/2c cho cả n và k đều chẵn. *Trường hợp 3: n lẻ và k lẻ. Tương tự như trường hợp 1, điểm bắt đầu của chúng ta là đồng nhất thức hấp thu. k ( n k ) = n ( n−1 k−1 ) vì n và k đều là lẻ, và lại một lần nữa từ phép nhân của một số nguyên bởi một số lẻ không làm thay đổi tính chẵn lẻ, từ đó suy ra( n k ) ≡ ( n−1 k−1 ) mod 2 Từ n−1 và k−1 đều là chẵn, theo trường hợp 2 thì( n−1 k−1 ) ≡ (bn/2c bk/2c ) mod 2 và như vậy thì ( n k ) ≡ (bn/2c bk/2c ) mod 2 19 *Trường hợp 4: n lẻ và k chẵn. Theo tính đối xứng của đồng nhất thức thì (n− k) ( n k ) = (n− k) ( n n− k ) và n ( n−1 n− k−1 ) = n ( n−1 k ) Tiếp đó theo tính hấp thu của đồng nhất thức (n− k) ( n n− k ) = n ( n−1 n− k−1 ) thì (n− k) ( n k ) = n ( n−1 k ) vì n− k và n đều lẻ, ta có( n k ) ≡ ( n−1 k ) mod 2 Áp dụng trường hợp 2 vào vế phải, ta thu được( n k ) ≡ (b(n−1)/2c bk/2c ) mod 2 vì n là lẻ, nên chỉ số trên b(n−1)/2c bằng bn/2c Một thuật toán đơn giản quyết định tính chẵn lẻ của một hệ số nhị thức là áp dụng định lí 1.1.22 lặp đi lặp lại cho đến khi chỉ số trên là chẵn và chỉ số dưới là lẻ hoặc chỉ số dưới là 0. Ví dụ 1.1.23. Cả thẩy có hai kiểu kết thúc (chẵn, lẻ):( 165 93 ) ≡ ( 82 46 ) ≡ ( 41 23 ) ≡ ( 20 11 ) ≡ 0 mod 2( 75 11 ) ≡ ( 37 5 ) ≡ ( 18 2 ) ≡ ( 9 1 ) ≡ ( 4 0 ) ≡ 1 mod 2 Ta xét xem lý do tại sao số các hệ số nhị thức là lẻ liên tiếp trong một dòng của tam giác Pascal là lũy thừa của 2, chúng ta quan sát thấy trong hệ đếm nhị phân, phép toán lấy phần nguyên n 7→ bn/2c 20 đạt được bằng cách xóa bít ngoài cùng bên phải. Chúng ta cũng quan sát thấy trong trường hợp 1 cuả định lý 1.1.22 với n là số chẵn và k là số lẻ, là phân biệt bởi một 0-bit ở cuối bên phải của số nhị phân đối với n và 1-bit ở cuối bên phải của số nhị phân đối với k. Ví dụ 1.1.24. Trong biểu diễn các số dạng nhị phân 16510 = 101001012 9310 = 010111012 xét từ phải sang trái, sự xuất hiện của số 0 đầu tiên ở hàng trên tại 21−bit. Vì cũng tồn tại 0-bit ở ngay bên dưới nó, ta tiếp tục phân tích. Số 0 tiếp theo ở hàng trên xuất hiện tại 23−bit và có 1-bit bên dưới nó. Vì vậy quá trình phân tích kết thúc, và kết luận về tính chẵn lẻ là chẵn. Trong biểu diễn dạng nhị phân 7510 = 10010112 1110 = 00010112 ta thấy rằng có 0-bit hàng dưới mỗi khi có 0-bit ở hàng trên, vì vậy kết luận về tính chẵn lẻ là lẻ. Mệnh đề 1.1.25. Số các số nhị thức lẻ trong dòng n của tam giác Pascal là 2w, trong đó w là số các 1-bits trong phép biểu diễn nhị phân của n. Chứng minh. Do hệ số nhị thức (n k ) là lẻ, phải có số 0 ở mỗi bit trong khai triển nhị phân của k mà tại đó có số 0 ở bit tương ứng của khai triển nhị phân của n. Tuy nhiên nếu tồn tại số 1 tại một bit của khai triển nhị phân của n, thì có thể tồn tại hoặc 0 hoặc 1 ở bit tương ứng của khai triển nhị phân của k. Nếu tồn tại w 1-bits đối với n, thì tồn tại 2w giá trị đối với k thỏa mãn các quy tắc đối với 0-bits. 21 Hệ quả 1.1.26. Nếu số nguyên n có dạng 2r− 1, thì mỗi hệ số nhị thức trong hàng n của tam giác Pascal là số lẻ. Chứng minh. Không có 0-bits trong biểu diễn nhị phân của 2n−1 1.2 Nghịch đảo các số nhị thức Trong phần này sẽ phát triển một kỹ thuật đối với các hệ số nhị thức, được gọi là nghịch đảo nhị thức. Ứng dụng chính của nó trong phần này là lời giải cho một quan hệ hồi quy. Định nghĩa 1.2.1. Biến đổi của dãy 〈 fn〉 bởi nghịch đảo nhị thức là dãy 〈gn〉 với gn = n ∑ j=0 ( n j ) (−1) j f j (1.14) Có một tính chất đặc trưng của bất kỳ khái niệm toán học nào, gọi là phép toán đối ngẫu, là áp dụng hai lần phép toán sẽ khôi phục lại đối tượng ban đầu. Định lý 1.2.2 khẳng định rằng phép biến đổi nghịch đảo nhị thức các dãy có tính chất nói trên. Định lí 1.2.2. Giả sử 〈 fn〉 là một dãy và 〈gn〉 là biến đổi của nó bởi phép nghịch đảo nhị thức. Khi đó, với mọi n≥ 0 fn = n ∑ j=0 ( n j ) (−1) jg j (1.15) Nói cách khác, biến đổi hai lần phục hồi lại dãy ban đầu 〈 fn〉. Chứng minh. Xuất phát từ vế phải của phương trình (1.15) và thay thế công thức nghịch đảo của phương trình (1.14) đối với g j n ∑ j=0 ( n j ) (−1) jg j = n ∑ j=0 ( n j ) (−1) j j ∑ i=0 ( j i ) (−1)i fi 22 = n ∑ j=0 j ∑ i=0 ( n j )( j i ) (−1) j+i fi (1.16) Sự thay đổi thứ tự của phép lấy tổng là hữu ích ở đây = n ∑ i=0 n ∑ j=i ( n j )( j i ) (−1) j+i fi (1.17) Áp dụng đồng nhất thức tập con của một tập con (Mệnh đề 1.1.20) ta đưa về phép lấy tổng theo chỉ số j = n ∑ i=0 n ∑ j=i ( n i )( n− i j− i ) (−1) j+i fi Sau đó rút gọn thừa số bên trong tổng = n ∑ i=0 ( n i ) fi n ∑ j=i ( n− i j− i ) (−1) j−i với (−1)2i = 1 Thay k = j− i = n ∑ i=0 ( n i ) fi n−i ∑ k=0 ( n− i k ) (−1)k Tổng bên trong −→ số mũ nhị thức = n ∑ i=0 ( n i ) fi(1− x)n−i  x=1 = n ∑ i=0 ( n i ) fi(i= n) = ( n n ) fn(n= n) = fn Trong phương trình (1.17) ở trên, ta thấy rằng trong tổng chỉ số j xuất hiện 2 lần trong số hạng bên trong hệ số nhị thức, một lần là chỉ số trên và một lần là chỉ số dưới. Trong trường hợp như vậy, như đã thấy ở đây, 23 đồng nhất thức tập con của tập con thường làm biến đổi dễ dàng hơn, nó cho phép giảm số lần xuất hiện chỉ số trong. Một vài ví dụ cơ bản của phép nghịch đảo Ba ví dụ đầu tiên sau đây về phép nghịch đảo nhằm giới thiệu phép nghịch đảo được tiến hành như thế nào. Ví dụ 1.2.3. Dãy số không đổi 〈 fn〉= 1 1 1 1 · ·· có nghịch đảo là gn = n ∑ j=0 ( n j ) (−1) j f j = n ∑ j=0 ( n j ) (−1) j = (1− x)n  x=1 = (1−1)n = 1 nếu n= 00 nếu n> 0 ⇒ 〈gn〉= 1 0 0 0 · ·· Một cách tổng quát, dãy 〈 fn〉= c c c c · · · có nghịch đảo là 〈gn〉= c 0 0 0 · · · Ví dụ 1.2.4. Dãy số tự nhiên 〈 fn〉= 0 1 2 3 · · · 24 được nghịch đảo như sau gn = n ∑ j=0 ( n j ) (−1) j f j = n ∑ j=0 j ( n j ) (−1) j (1.18) Áp dụng đồng nhất thức hấp thu để loại bỏ sự xuất hiện của chỉ số j. = n ∑ j=0 n ( n−1 j−1 ) (−1) j = n n ∑ j=0 ( n−1 j−1 ) (−1) j Thay j = i+1 để sắp xếp các hệ số nhị thức với giới hạn của tổng. = n n−1 ∑ i=0 ( n−1 i ) (−1)i+1 =−n n−1 ∑ i=0 ( n−1 i ) (−1)i =−n(1− x)n−1  x=1 = −1 nếu n= 10 nếu n 6= 1 ⇒ 〈gn〉= 0 −1 0 0 · · · Trong phương trình (1.18) của ví dụ này, chỉ số lấy tổng j xuất hiện trong một hệ số nhị thức và cũng như là một nhân tử. Đồng nhất thức hấp thu là đồng nhất thức nhị thức thông thường mà số lần xuất hiện của biến chỉ số được rút gọn trong trường hợp như vậy. Dãy 0 1 2 3 · · · cũng có thể được biểu diễn như là 〈(n 1 )〉 . Theo đó, không có gì phải ngạc nhiên nếu nghịch đảo của dãy (n r ) tương tự như ví dụ 1.2.3. Ví dụ 1.2.5. Dãy số nhị thức fn = ( n r ) 25 đối với số không âm cố định r có dãy nghịch đảo là gn = n ∑ j=0 ( n j ) (−1) j f j = n ∑ j=0 ( j r )( n j ) (−1) j (1.19) Áp dụng đồng nhất thức tập con của một tập con và đặt nhân tử chung = n ∑ j=0 ( n r )( n− r j− r ) (−1) j = ( n r ) n ∑ j=0 ( n− r j− r ) (−1) j Thay j = i+ r, ta có gn = ( n r ) n−r ∑ i=−r ( n− r i ) (−1)i+r = ( n r )n−r ∑ i=0 ( n− r i ) (−1)i+r = (−1)r ( n r )n−r ∑ i=0 ( n− r i ) (−1)i = (−1) n nếu n= r 0 nếu n 6= r Ở phương trình (1.19), số hạng xuất hiện 2 lần có chỉ số lấy tổng là j. Lần này cả hai đều ở trong các hệ số nhị thức khác nhau, với một lần xuất hiện như chỉ số trên và một lần xuất hiện như chỉ số dưới. Đồng nhất thức tập con của một tập con thường được sử dụng để loại bỏ một trong những lần xuất hiện các số hạng như vậy. Do đó tổng được rút gọn. Sự xáo trộn Nghịch đảo nhị thức có nhiều ứng dụng đặc biệt. 26 Ví dụ 1.2.6. Mỗi hoán vị của đoạn các số nguyên [1 : n] có thể thu được bằng cách chọn r số từ đoạn [1 : n] và làm thay đổi thứ tự của chúng. Theo đó, nếu D j là một sự xáo trộn (thay đổi thứ tự) số, thì n!= ( n 0 ) D0+ ( n 1 ) D1+ ( n 2 ) D2+ · · ·+ ( n n ) Dn Từ đó suy ra rằng fn = (−1)nDn có nhị thức nghịch đảo gn = n! Bởi tính chất đối ngẫu nghịch đảo nhị thức, ta có fn = (−1)nDn = n ∑ j=0 ( n j ) (−1) jg j từ đó suy ra Dn = (−1)n n ∑ j=0 ( n j ) (−1) jg j = (−1)n n ∑ j=0 ( n j ) (−1) j j! = n ∑ j=0 n j(−1) j ⇒ Dn n! = 1− 1 1! + 1 2! − 1 3! + · · ·+(−1)n 1 n! lim−−−→ n→∞ e −1 Vì vậy, tỷ lệ giữa các xáo trộn và số các hoán vị của một tập hợp n đối tượng tiến dần đến e−1 khi n lớn. Các ví dụ khác về phép nghịch đảo Các phương pháp lấy tổng được trình bày trong phần này đối với các phép biến đổi dãy được áp dụng rộng rãi. Chúng ta bổ sung trong phần này thêm 27 hai ví dụ, kết hợp cả phương pháp nghịch đảo các số nhị thức với đồng nhất thức của các số nhị thức đã đề cập trước đây. Ví dụ 1.2.7. Khi hai thừa số của một số hạng là hai hệ số nhị thức có chứa chỉ số của phép lấy tổng như là chỉ số dưới, mấu chốt của sự đơn giản hoá là thiết lập một ánh xạ của phép nhân chập Vandermonde để rút gọn số hạng đó. Dãy số fn = (−1)n ( N n ) có dãy nhị thức nghịch đảo là gn = n ∑ j=0 ( n j ) (−1) j f j = n ∑ j=0 ( n j ) (−1) j(−1) j ( N j ) = n ∑ j=0 ( N j )( n j ) áp dụng đồng nhất thức đối xứng ta được = n ∑ j=0 ( N j )( n n− j ) và sau đó dùng phép nhân chập Vandermonde = ( N+n n ) Ví dụ 1.2.8. Đôi khi tồn tại thương của hai hệ số nhị thức mà cả hai đều chứa chỉ số của phép lấy tổng. Dãy số fn = (−1)n ( N n )−1 có biến đổi qua phép nghịch đảo nhị thức là dãy gn = n ∑ j=0 ( n j ) (−1) j f j 28 = n ∑ j=0 ( n j ) (−1) j(−1) j ( N j )−1 = n ∑ j=0 (n j )(N j ) Ở đây chúng ta áp dụng đồng nhất thức tập con của một tập con( N n )( n j ) = ( N j )( N− j n− j ) và có được gn = n ∑ j=0 (n j )(N n )(n j )/(N− j n− j ) = ( N n )−1 n ∑ j=0 ( N− j n− j ) có thể đơn giản hóa bằng cách sử dụng đồng nhất thức tổng đường chéo = ( N n )−1(N+1 n ) = N+1 N−n+1 29 Chương 2 Một số ứng dụng của số nhị thức trong thống kê Thống kê là khoa học nghiên cứu các phương pháp thu thập, phân tích và xử lý các số liệu nhằm phát hiện các quy luật thống kê trong tự nhiên và xã hội. Trong thống kê, giá trị trung bình, phương sai, độ lệch chuẩn, ... là các số đặc trưng để thu được các thông tin quan trọng. Các số đặc trưng này phản ánh những khía cạnh khác nhau của dấu hiệu điều tra và có mối liên hệ mật thiết với các số nhị thức. Vì vậy trong chương này tác giả xin trình bày một số ứng dụng của số nhị thức trong thống kê để thấy rõ hơn về mối quan hệ đó. 2.1 Một số khái niệm của xác suất Xác suất và các biến ngẫu nhiên Một số định nghĩa cơ bản được nhắc lại từ cơ sở của thống kê và xác suất. Định nghĩa 2.1.1. Không gian xác suất rời rạc là một cặp 〈Ω,Pr〉 xác định như sau: • Tập rời rạc Ω được gọi là không gian mẫu. • Một tập hợp con của Ω được gọi là biến cố. 30 • Tập 2Ω của tất cả các tập con của Ω được gọi là không gian biến cố. • Hàm xác suất Pr : 2Ω −→ R được gọi là độ đo xác suất, thỏa mãn các tiên đề sau: 1. 0 ≤ Pr(A) ≤ 1, với mọi biến cố A ⊆ Ω. Số Pr(A) được gọi là xác suất của biến cố A. 2. Pr(Ω) = 1. 3. Nếu các biến cố As, với s ∈ S là các tập con đôi một rời nhau của Ω thì Pr(∪As s∈S ) =∑ s∈S Pr(As) . Định nghĩa 2.1.2. Một biến ngẫu nhiên X trên một không gian mẫu là một hàm giá trị thực. Nó được gọi là biến ngẫu nhiên rời rạc nếu tập các giá trị của nó là hữu hạn hoặc vô hạn đếm được. Ký hiệu: Giả sử X : Ω−→ R là một biến ngẫu nhiên rời rạc trên một không gian mẫu Ω với độ đo xác suất là Pr. Với x ∈ R, xác suất của tập {ω ∈Ω | X(ω) = x} được ký hiệu là Pr(x). Giá trị trung bình và phương sai. Giá trị trung bình của một biến ngẫu nhiên, hay còn gọi là giá trị kỳ vọng, thường được mô tả như trung bình có trọng số. Phương sai và độ lệch chuẩn là số đo sự phân tán từ giá trị trung bình. Định nghĩa 2.1.3. Giả sử X : Ω−→R là một biến ngẫu nhiên rời rạc trên một không gian mẫu Ω với độ đo xác suất Pr, và giả sử D là tập các giá trị của X. Giá trị kỳ vọng hoặc giá trị trung bình của biến ngẫu nhiên X được 31 ký hiệu là E(X) hoặc µX , là tổng E(X) = µX = ∑ x∈D x ·Pr(x) (2.1) Định nghĩa 2.1.4. Giả sử X : Ω−→R là một biến ngẫu nhiên rời rạc trên một không gian mẫu Ω với độ đo xác suất Pr, và giả sử D là tập các giá trị của X. Phương sai của biến ngẫu nhiên X được ký hiệu là V(X) hoặc σ2X là tổng V (X) = σ2X = ∑ x∈D (x−µX)2 ·Pr(x) = E([X−µX ]2). (2.2) Định nghĩa 2.1.5. Giả sử X : Ω−→R là biến ngẫu nhiên rời rạc. Độ lệch chuẩn của biến ngẫu nhiên X ký hiệu là SD(X) hoặc σX là căn bậc hai của phương sai. SD(X) = σX = √ σ2X . (2.3) Các chỉ số giá trị trung bình và phương sai có thể được ký hiệu ngắn gọn là µ và σ2. Định nghĩa 2.1.6. Khi tính toán giá trị trung bình của một bảng các số hoặc phương sai của một bảng các số, mỗi một phần tử của bảng được xem bình đẳng như nhau. Mệnh đề 2.1.7. Giả sử X : Ω−→ R là biến ngẫu nhiên rời rạc. Khi đó σ2X = E(X 2)−µ2. (2.4) 2.2 Phân bố nhị thức Thí nghiệm điển hình trong đó xuất hiện phân bố nhị thức là một dãy n lần tung đồng tiền. Chọn một trong những khả năng xuất hiện của một lần 32 tung, chẳng hạn, mặt trước, là "thành công", thì số lần xuất hiện mặt trước có phân bố nhị thức. Chúng ta áp dụng các đồng nhất thức của các số nhị thức của chương 1 để tính giá trị trung bình và phương sai của phân bố nhị thức. Định nghĩa 2.2.1. Biến ngẫu nhiên rời rạc X có phân phối nhị thức B(n, p) nếu X biểu thị số lần xuất hiện sự kiện A nào đó trong dãy n phép thử độc lập Becnuli với xác suất để xuất hiện A trong mỗi phép thử đều bằng p. Khi đó: Pr(X = j) = ( n j ) p j(1− p)n− j. (2.5) Mệnh đề 2.2.2. Giá trị kỳ vọng của biến ngẫu nhiên nhị thức X trên n phép thử, mỗi phép thử có xác suất thành công p là E(X) = np Chứng minh. Phương trình (2.1) xác định giá trị kỳ vọng E(X) = n ∑ j=0 j ·Pr(X = j) Chúng ta thay xác suất của biến ngẫu nhiên nhị thức như đã được cho bởi phương trình (2.5) = n ∑ j=0 j ( n j ) p j(1− p)n− j Sự hấp thu loại trừ 1 trong 4 lần xuất hiện chỉ số j của tổng = n ∑ j=0 n ( n−1 j−1 ) p j(1− p)n− j = np n ∑ j=0 ( n−1 j−1 ) p j−1(1− p)n− j. Thay i= j−1 đưa đến tổng = np n−1 ∑ i=0 ( n−1 i ) pi(1− p)n−1−i 33 mà ta nhận ra là một khai triển nhị thức, và rút gọn = np [p+(1− p)]n−1 = np. Mệnh đề 2.2.3. Phương sai của biến ngẫu nhiên nhị thức X trong n phép thử với xác suất thành công p là: V (X) = np(1− p) Chứng minh. Một lần nữa ta bắt đầu từ phương trình (2.1) E(X2) = n ∑ j=0 j2 ·Pr(X = j) = n ∑ j=0 j2 ( n j ) p j(1− p)n− j. Một lần nữa chỉ số j của tổng xuất hiện 4 lần. Áp dụng sự hấp thu làm giảm số mũ của j trong một lần xuất hiện là một bước hợp lý. = n ∑ j=0 jn ( n−1 j−1 ) p j(1− p)n− j = np n ∑ j=0 j ( n−1 j−1 ) p j−1(1− p)n− j. Thay i = j− 1 để sắp xếp các chỉ số của các hệ số nhị thức với giới hạn trên và dưới của tổng là một bước hợp lý khác. = np n−1 ∑ i=0 (1+ i) ( n−1 i ) pi(1− p)n−1−i Chia tổng này giống như ở đây = np n−1 ∑ i=0 ( n−1 i ) pi(1− p)n−1−i+np n−1 ∑ i=0 i ( n−1 i ) pi(1− p)n−1−i 34 Vì tổng trong phần thứ nhất đã được nhận thấy như là một khai triển nhị thức = np+np n−1 ∑ i=0 i ( n−1 i ) pi(1− p)n−1−i Áp dụng sự hấp thu một lần nữa để loại trừ sự xuất hiện của chỉ số tổng = np+np n ∑ i=0 (n−1) ( n−2 i−1 ) pi(1− p)n−1−i Thay k = i− 1 rồi sắp xếp lại chỉ số dưới của hệ số nhị thức với giới hạn dưới của tổng. = np+n(n−1)p2 n ∑ k=0 ( n−2 k ) pk(1− p)n−2−k = np+n(n−1)p2 = np+n2p2−np2 = n2p2+np(1− p). Theo mệnh đề 2.1.7 và 2.2.2 σ2X = E(X 2)−E(X)2 = [ n2p2+np(1− p) ] −n2p2 = np(1− p). Ước lượng không chệch của giá trị trung bình Một phương pháp thống kê trực quan để ước lượng tỷ lệ cá thể trong một tập hợp có kích thước lớn N có đặc điểm đặc trưng ( chẳng hạn như có sở thích về toán học) là lấy một mẫu ngẫu nhiên và sử dụng tỷ lệ trong mẫu đó để ước lượng tỷ lệ trong tập hợp tổng quát. Chúng ta sẽ sử dụng đồng nhất thức của các số nhị thức để khẳng định tính đúng đắn của cách tiếp cận này. 35 Định nghĩa 2.2.4. Ước lượng θ̂ của đặc trưng thống kê θ của một tập hợp được gọi là ước lượng không chệch nếu giá trị kỳ vọng E(θ̂) của mẫu ngẫu nhiên bằng θ . Mệnh đề 2.2.5. Tỷ lệ mẫu là một ước lượng không chệch của tỷ lệ các cá thể có đặc trưng cho trước và tập hợp đầy đủ các đối tượng. Chứng minh. Giả sử rằng trong một tập hợp đối tượng kích thước N có đúng M cá thể có đặc điểm đang xét. Một mẫu cỡ n được lấy. Biến ngẫu nhiên được quan tâm là số m các cá thể với đặc điểm đang xét và tỷ lệ X = m n của những cá thể với đặc điểm đang xét. Tổng số các cách để chọn một mẫu kích thước n là ( N n ) . Số cách chọn một mẫu kích thước n sao cho có thể có đúng j cá thể với đặc điểm quy định là tích ( M j )( N−M n− j ) của số cách chọn j cá thể từ tập độ lớn M với đặc điểm đang xét và số cách chọn n− j cá thể còn lại từ tập N−M cá thể không có đặc điểm đang xét. Vì vậy Pr(m= j) = (M j )(N−M n− j )(N n ) Theo đó, E(X) = n ∑ j=0 j n ·Pr(m= j) = 1 n n ∑ j=0 j · (M j )(N−M n− j )(N n ) 36 = 1 n ( N n )−1 n ∑ j=0 j · ( M j )( N−M n− j ) Áp dụng đồng nhất thức hấp thu để loại bỏ một lần xuất hiện của chỉ số tổng = 1 n ( N n )−1 n ∑ j=0 M · ( M−1 j−1 )( N−M n− j ) = M n ( N n )−1 n ∑ j=0 ( M−1 j−1 )( N−M n− j ) Bây giờ sử dụng phép nhân chập Vandermonde = M n ( N n )−1(N−1 n−1 ) = M n · n! Nn · (N−1) n−1 (n−1)! = M N Như vậy, phương pháp trực quan ước lượng giá trị trung bình là không chệch. Ước lượng không chệch của phương sai Giả sử X là một biến ngẫu nhiên trên không gian mẫu Ω. Các biến ngẫu nhiên phân bố đồng nhất X1 X2 · · · Xn là các giá trị của X trên n mẫu từ Ω, với giá trị trung bình mẫu X . Các nhà thống kê sử dụng các ước lượng σ̂2 = ∑ (Xi−X)2 n−1 = ∑X2i −n−1(∑Xi)2 n−1 với n−1 ở mẫu số (chứ không phải n) cho phương sai. Điều này được giải th

Các file đính kèm theo tài liệu này:

luan_van_cac_so_to_hop_va_mot_so_ung_dung_trong_thong_ke.pdf