TRƢỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
--------------
LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC
PHÂN PHỐI BETA VÀ
PHÂN PHỐI CHUẨN MỘT CHIỀU
Giáo viên hƣớng dẫn
Sinh viên thực hiện
Ts. Võ Văn Tài
Nguyễn Nhƣ Mai
Mssv: 1117482
Ngành: Toán Ứng Dụng K37
Cần Thơ – 12/2014
2
PHẦN MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Phân phối xác suất đóng vai trò rất quan trọng trong lý thuyết xác suất.
Nó cũng là cơ sở cho sự phát triển của lý thuyết thống kê. Chúng ta đã biết
những phân phối xác suất quan trọng làm nền tảng cho thống kê như phân
phối chuẩn, Student, Khi bình phương, mũ,...
Trong lý thuyết xác suất và thống kê, phân phối Beta là một họ của phân
phối xác suất liên tục xác định trên đoạn 0,1 , được tham số hóa bởi hai tham
số hình học dương, ký hiệu là và , xuất hiện như số mũ của biến ngẫu
nhiên và điều chỉnh hình dạng của phân phối.
Phân phối Beta chuẩn tắc đã được sử dụng cho các biến ngẫu nhiên cụ
thể liên quan đến tỷ lệ. Nó đã được sử dụng như một sự mô tả thống kê của tần
số Allele trong dân số di truyền, thời gian phân bổ trong dự án hệ thống quản
lý hay kiểm soát, dữ liệu ánh nắng mặt trời, sự thay đổi của tính chất của đất,
tỷ lệ của khoáng chất đá trong địa tầng, tính không đồng nhất trong khả năng
lây nhiễm HIV,... Trong suy luận Bayes, phân phối Beta thường được dùng
làm phân phối xác suất tiên nghiệm cho tham số tỷ lệ.
Phân phối Beta tổng quát chưa được quan tâm nhiều đặc biệt là các ứng
dụng của nó. Ngoài ra những vấn đề liên quan đến phân phối Beta như tổng,
tích, thương của hai phân phối Beta là những vấn đề lý thuyết đang được nhiều
nhà thống kê hiện đại quan tâm, hứa hẹn nhiều tiềm năng phát triển. Như vậy,
mặc dù được đề cập rất sớm từ những nhà thống kê nổi tiếng như Karl Pearson
FRS (1936); William P.Elderton (1906); Richard Price (1911); Pearson và
Karl (1936) nhưng những kết quả về lý thuyết cũng như về ứng dụng của phân
phối vẫn được các nhà thống kê hiện đại quan tâm như Bowman và Shenton
(2007); N.Turkkan và Phạm Gia Thụ (1992).
Phân phối chuẩn (Normal distribution) được nêu ra bởi một người Anh
gốc Pháp tên là Abraham de Moivre (1733). Sau đó Gauss, một nhà toán học
người Đức, đã dùng luật phân phối chuẩn để nghiên cứu các dữ liệu về thiên
văn học (1809) và do vậy cũng được gọi là phân phối Gauss. Theo từ điển
bách khoa về khoa học thống kê, người đầu tiên dùng từ “normal” là ông C.S
Pierce (1780) vì vào thời đó người ta cho rằng mọi hiện tượng tự nhiên được
coi như có phân phối chuẩn nhưng thật ra còn có những luật phân phối khác.
Tuy vậy, hầu hết lý thuyết thống kê được xây dựng trên nền tảng của phân
phối chuẩn. Như vậy từ “normal” được dùng theo thói quen nhưng thực ra
1
không đúng, vì vậy trong tiếng Việt ta không thể dịch là phân phối “bình
thường” mà gọi là phân phối chuẩn.
Hai thông số quan trọng trong một phân phối là giá trị trung tâm hay gọi
là trung bình và phương sai 2 (hoặc độ lệch chuẩn ) và thường biểu thị
bằng X
N , 2 . Nếu phân phối chuẩn được chuẩn hóa với trung bình
0 và độ lệch chuẩn 1 , X
N 0, 2 1 , được gọi là phân phối
chuẩn tắc.
Hầu hết các hiện tượng sinh học tự nhiên (như chiều cao, trọng lượng cơ
thể, trị số mạch, huyết áp, đường máu, mật độ xương, số lượng hồng cầu, …)
đều có thể mô tả bằng luật phân phối chuẩn. Chính vì thế mà luật phân phối
chuẩn được ứng dụng cực kì rộng rãi trong khoa học thực nghiệm. Có thể nói
rằng phân phối chuẩn là nền tảng, là trụ cột của tất cả các phân tích thống kê.
Không có luật phân phối này cũng có nghĩa là không có khoa học thống kê
hiện đại. Để hiểu rõ hơn tầm quan trọng của luật phân phối chuẩn, chúng ta
cần ghi nhớ rằng trong nghiên cứu khoa học thực nghiệm, chúng ta không biết
các thông số của một quần thể, mà chỉ dựa vào các số liệu từ một hay nhiều
mẫu để suy luận cho một quần thể.
Theo tìm hiểu của tôi các kết quả về phân phối Beta và phân phối chuẩn
còn rời rạc, những ứng dụng của nó chưa được đề cập nhiều. Với mong muốn
tổng kết một cách có hệ thống lý thuyết liên quan đến phân phối Beta và phân
phối chuẩn cũng như những ứng dụng của nó làm nền tảng để có thể nghiên
cứu sâu hơn trong tương lai, tôi chọn đề tài "Phân phối Beta và phân phối
chuẩn một chiều" làm luận văn tốt nghiệp của mình.
2. MỤC ĐÍCH NGHIÊN CỨU
Tổng kết một cách có hệ thống, logic về phân phối Beta và phân phối
chuẩn; mối quan hệ của phân phối Beta và phân phối chuẩn với các phân phối
khác.
Một số ứng dụng quan trọng liên quan đến phân phối Beta và phân phối
chuẩn.
2
3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng nghiên cứu: Phân phối Beta, phân phối chuẩn một chiều.
Phạm vi nghiên cứu: Các vấn đề cơ bản của phân phối Beta và phân phối
chuẩn một chiều.
4. PHƯƠNG PHÁP NGHIÊN CỨU
Thu thập, tổng hợp, phân tích, hệ thống tài liệu, đặc biệt là các bài báo về
phân phối Beta và phân phối chuẩn những năm gần đây để trình bày lại vấn đề
nghiên cứu một cách có hệ thống và logic.
3
Chương 1
KIẾN THỨC CƠ SỞ
1.1 Biến ngẫu nhiên
1.1.1 Khái niệm
Trong không gian xác suất , F , P với F là - đại số và P : F
là hàm xác suất, biến ngẫu nhiên X là một ánh xạ được xác định như sau:
X:
X
Để có thể chặt chẽ hơn về mặt lý thuyết, trong định nghĩa trên người ta
đưa vào điều kiện, mọi tập hợp : X B F với B là một tập
Borel bất kỳ trên
nghĩa là chúng không rơi ra ngoài F . Vì vậy có thể tính
được xác suất của chúng.
Biến ngẫu nhiên là biến nhận các giá trị là các khả năng có thể của phép
thử ngẫu nhiên với một xác suất nào đó phụ thuộc vào kết quả của phép thử
ngẫu nhiên.
Các biến ngẫu nhiên thường được ký hiệu bằng các chữ cái in hoa như:
X ,Y , Z ,... hoặc dạng chỉ số: X1 , X 2 ,..., X n ; Y1 ,Y2 ,...,Yn ;...
Các giá trị có thể có của biến ngẫu nhiên được ký hiệu là: x1 , x 2 ,..., xm ;
y1 , y2 ,..., ym ;...
Một biến ngẫu nhiên coi như được xác định nếu biết tập các giá trị của
nó và các xác suất mà nó nhận giá trị thuộc tập đó.
1.1.2 Phân loại biến ngẫu nhiên
Biến ngẫu nhiên được chia thành hai loại: rời rạc và liên tục.
- Biến ngẫu nhiên X được gọi là rời rạc nếu nó nhận hữu hạn hoặc vô
hạn đếm được các giá trị. Như vậy, biến ngẫu nhiên rời rạc chỉ có thể nhận các
giá trị nằm rời rạc với nhau trên trục số.
- Biến ngẫu nhiên X được gọi là liên tục nếu tìm được hai số thực a b
sao cho mọi số nằm giữa a và b đều là giá trị của X . Như vậy, tập hợp các
4
giá trị ngẫu nhiên liên tục gồm các số thực trên một khoảng hay một đoạn của
trục số và là tập hợp vô hạn không đếm được.
1.1.3 Hàm mật độ xác suất của biến ngẫu nhiên
a) Đối với biến ngẫu nhiên rời rạc
Giả sử biến ngẫu nhiên rời rạc X có n giá trị có thể có xi , i 1,2,..., n
với xác suất tương ứng pi P X xi 0 , khi đó hàm mật độ xác suất của X
(ký hiệu: f x ) được xác định như sau:
p khi x xi , i 1,2,..., n
f x i
0 khi x xi
Thông thường để thuận lợi trong đánh giá biến ngẫu nhiên rời rạc, hàm
mật độ xác suất được biểu diễn dưới dạng bảng phân phối xác suất như sau:
...
X
x1
x2
xn
P
n
Chú ý:
p
i 1
i
p1
p2
...
pn
1.
b) Đối với biến ngẫu nhiên liên tục
i) Định nghĩa
Cho F x là hàm phân phối của biến ngẫu nhiên liên tục X . Khi đó
hàm số f x F x được gọi là hàm mật độ xác suất của biến ngẫu nhiên
liên tục X .
ii) Nhận xét
* Hàm mật độ có thể biểu diễn một cách trọn vẹn phân phối xác suất của
biến ngẫu nhiên liên tục.
* Nếu X là biến ngẫu nhiên liên tục thì c , P X c 0 . Từ đó,
a, b
sao cho a b , ta có
P a X b P a X b P a X b P a X b
iii) Tính chất
Hàm mật độ f x có một số tính chất cơ bản như sau:
5
* f x là hàm không âm, f x 0, x
.
*
f x dx 1 .
Đặc biệt, nếu X chỉ nhận giá trị trong a, b thì
b
f x dx 1.
a
b
* P a X b f x dx .
a
Chú ý: Với x đủ bé ta có
P x X x x f x x
Do đó ta thấy xác suất để X nhận giá trị thuộc lân cận khá bé x, x x
gần như tỷ lệ với f x .
1.1.4 Hàm phân phối xác suất của biến ngẫu nhiên
a) Định nghĩa
Giả sử X là biến ngẫu nhiên xác định trên không gian xác suất
, F , P . Khi đó hàm số
F x P X x P : X x x
được gọi là hàm phân phối xác suất của biến ngẫu nhiên X .
Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất
X
x1
x2
...
xn
P
p1
p2
...
pn
0
p
1
p1 p2
thì F x P X xi pi
x x
x x
p1 p2
1
i
i
pn1
Nếu X là biến ngẫu nhiên liên tục thì F x
x
f x dx .
6
khi x x1
khi x1 x x2
khi x2 x x3
khi
khi xn1 x xn
khi x xn
b) Tính chất
Hàm phân phối F x có một số tính chất cơ bản như sau:
i) Bị chặn: 0 F x 1, x .
ii) F x là hàm không giảm: nếu a b thì F a F b .
iii) P a X b F b F a .
iv) lim F x 0 và lim F x 1.
x
x
v) Nếu X là biến ngẫu nhiên liên tục thì F ' x f x .
c) Ý nghĩa
Hàm phân phối xác suất F x phản ánh mức độ tập trung xác suất về
bên trái của điểm x .
1.1.5 Các tham số đặc trưng
a) Mode
Mode của một biến ngẫu nhiên X (ký hiệu Mod X ) là giá trị của biến
ngẫu nhiên mà tại đó nó có nhiều khả năng xảy ra nhất.
Cụ thể ta có thể định nghĩa Mode cho từng loại biến ngẫu nhiên như sau:
Mode của biến ngẫu nhiên rời rạc: là giá trị của biến ngẫu nhiên mà tại
đó nó có xác suất lớn nhất.
Mode của biến ngẫu nhiên liên tục: là giá trị của biến ngẫu nhiên mà
tại đó hàm mật độ đạt giá trị cực đại.
Chú ý: Một biến ngẫu nhiên có thể có nhiều giá trị Mode.
b) Kỳ vọng
i) Định nghĩa
* Nếu X là biến ngẫu nhiên rời rạc nhận các giá trị có thể có xi với xác
suất tương ứng P X xi pi , i 1,2,..., n . Khi đó, kỳ vọng của biến ngẫu
nhiên X (ký hiệu E X ), được xác định bởi
n
E X xi pi
i 1
7
* Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f x thì
kỳ vọng của nó là
EX
xf x dx
ii) Tính chất
Gọi C là hằng số, X và Y là hai biến ngẫu nhiên. Ta có một số tính
chất cơ bản sau của kỳ vọng
E C C .
E CX CE X .
E X Y E X E Y .
E XY E X .E Y , nếu X , Y độc lập.
* Cho hàm số g x , khi đó
n
E g x g xi pi , nếu X rời rạc.
i 1
E g x
g x f x dx , nếu
X liên tục.
iii) Ý nghĩa
- Kỳ vọng của biến ngẫu nhiên chính là giá trị trung bình của biến ngẫu
nhiên đó. Nó phản ánh giá trị trung tâm của phân phối xác suất.
- Trong cơ học nếu coi x1 , x2 ,..., xn là các chất điểm, còn khối lượng là
n
p1 , p2 ,..., pn thì kỳ vọng E X xi pi chính là trọng tâm của hệ chất điểm.
i 1
- Trong thực tế sản xuất hay kinh doanh nếu ta cần chọn phương án cho
năng suất cao (hay lợi nhuận cao) ta cần chọn phương án cho năng suất kỳ
vọng cao (hay lợi nhuận kỳ vọng cao).
c) Phương sai
i) Định nghĩa
Phương sai của biến ngẫu nhiên X (ký hiệu V X ), được xác định bằng
biểu thức
8
V X E X E X
2
ii) Công thức
Trong thực tế ta thường sử dụng công thức
V X E X a
a E X
2
E X 2 2aX a 2
E X 2 2aE X E a 2
E X 2 a2
E X 2 E X
2
Từ công thức này ta cụ thể cho từng biến ngẫu nhiên như sau:
* Nếu X là biến ngẫu nhiên rời rạc nhận các giá trị có thể có xi với xác
suất tương ứng P X xi pi , i 1,2,..., n thì
n
n
V X xi E X pi xi2 pi E X
2
i 1
2
i 1
Trong đó E X 2 xi2 pi .
n
i 1
* Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f x thì
V X
x E X f x dx
2
Trong đó E X
x f x dx E X
2
2
2
x f x dx .
2
iii) Tính chất
Gọi C là hằng số, X và Y là hai biến ngẫu nhiên. Ta có một số tính
chất cơ bản sau của phương sai
V C 0 .
V CX C 2V X .
V X C V X .
9
V X Y V X V Y , nếu X , Y độc lập.
iv) Ý nghĩa
Từ định nghĩa phương sai ta thấy X E X chính là độ lệch giữa các
giá trị có thể có của biến ngẫu nhiên X so với giá trị trung bình của nó. Do
đó, phương sai chính là trung bình bình phương độ lệch, nó phản ánh mức độ
phân tán của các giá trị biến ngẫu nhiên chung quanh giá trị trung bình. Vậy,
khi phương sai nhỏ thì độ phân tán nhỏ tức mức độ tập trung lớn, ngược lại
khi phương sai lớn thì độ phân tán lớn tức mức độ tập trung nhỏ.
d) Độ lệch chuẩn
Phương sai của một biến ngẫu nhiên là con số đặc trưng cho sự phân tán
của biến ngẫu nhiên quanh kỳ vọng của nó. Tuy nhiên, nó không cùng đơn vị
với biến ngẫu nhiên. Chính vì điều này, người ta đưa ra một tham số mới cũng
có ý nghĩa giống như phương sai, nhưng cùng đơn vị với biến ngẫu nhiên. Đại
lượng này được gọi là độ lệch chuẩn (ký hiệu X ).
X V X
e) Moment
i) Moment cấp k
Moment cấp k của một biến ngẫu nhiên X (ký hiệu mk ), là kỳ vọng của
biến ngẫu nhiên X k
mk E X k
Trong trường hợp đặc biệt
* Khi k 1 thì m1 E X X .
* Khi k 2 thì m2 E X 2 .
ii) Moment trung tâm cấp k
Moment cấp k của một biến ngẫu nhiên X được định nghĩa là giá trị
k
M k E X X
Trong trường hợp đặc biệt
* Khi k 1 thì M1 E X X 0 .
10
2
* Khi k 2 thì M 2 E X X X2 m2 m12 .
1.2 Một số phân phối đặc biệt
Dựa vào phân loại biến ngẫu nhiên X ta có
Nếu X là biến ngẫu nhiên liên tục thì X có: phân phối Gamma hoặc
phân phối đều, phân phối mũ, phân phối Khi bình phương và phân phối
Student.
Nếu X là biến ngẫu nhiên rời rạc thì X có: phân phối nhị thức hoặc
phân phối Poisson và phân phối siêu bội.
1.2.1 Phân phối Gamma
a) Định nghĩa
Biến ngẫu nhiên liên tục X được gọi là có phân phối Gamma với hai
tham số và , nếu hàm mật độ xác suất của nó được xác định như sau:
1 x
x e
khi x 0
f x ,
0
khi x 0
Ký hiệu: X
G , .
Trong đó , 0 được xác định bởi công thức
x 1e x dx 1 1
0
b) Hàm đặc trưng
it
t 1
c) Các tham số đặc trưng
i) Trung bình: E X k
ii) Phương sai: V X
1
k
. . 1 ... k 1 , k 1, 2,...
.
k
iii) Trung vị: Mod X
1
, 1.
11
iv) Hệ số bất đối xứng: 1
v) Hệ số nhọn: 2
6
2
.
.
d) Tính chất
i) 1 . .
ii) 1 ! .
Chú ý: Nếu X1 , X 2 ,..., X n là các đại lượng ngẫu nhiên rời rạc, độc lập
nhau có phân phối Gamma với tham số i và , i 1,2,..., n thì đại lượng
ngẫu nhiên X X1 X 2 ... X n cũng có phân phối Gamma với tham số
1 2 ... n và .
1.2.2 Phân phối đều
a) Định nghĩa
Biến ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn
a, b , nếu hàm mật độ xác suất của nó được xác định như sau:
1
f x b a
0
Ký hiệu: X
khi x a; b
khi x a; b
U a; b .
b) Hàm phân phối xác suất
khi x a
0
x a
F x
khi a x b
b a
khi x b
1
c) Các tham số đặc trưng
b
i) Trung bình: E X x. f x dx
a
b
ab
.
2
ii) Phương sai: V X x f x
2
a
12
b a
dx
12
2
.
iii) Mod X là bất kỳ điểm nào trên a, b .
1.2.3 Phân phối mũ
a) Định nghĩa
Biến ngẫu nhiên liên tục X được gọi là có phân phối mũ với tham số
0 , nếu hàm mật độ xác suất của nó được xác định như sau:
e x khi x 0
f x
khi x 0
0
Ký hiệu: X
E .
b) Hàm phân phối xác suất
1 e x
F x
0
khi x 0
khi x 0
c) Hàm đặc trưng
t
it
d) Các tham số đặc trưng
i) Trung bình: E X k
ii) Phương sai: V X
k!
, k 1,2,...
k
1
k
iii) Trung vị: Mod X
.
ln 2
.
iv) Hệ số bất đối xứng: 1 2 .
v) Hệ số nhọn: 2 6 .
e) Tính chất
Một tính chất quan trọng của phân phối mũ là tính chất không nhớ. Ta
nói biến ngẫu nhiên không âm X không nhớ nếu với mọi s , t 0 , ta có
P X t s X s P X t
hoặc tương đương với
13
P X t s P X t P X s
Đẳng thức trên đúng nếu X có phân phối mũ
P X t s 1 F t s e t s e t .e s P X t P X s
Chú ý: Trong thực tế phân phối mũ được sử dụng phổ biến để diễn tả
khoảng thời gian giữa hai lần xuất hiện của một biến cố. Chẳng hạn khoảng
thời gian giữa hai ca cấp cứu trong một bệnh viện, giữa hai lần hỏng hóc của
một cái máy,...
1.2.4 Phân phối Khi bình phương
a) Định nghĩa
Phân phối Khi bình phương được Karl Pearson đề xuất năm 1900. Giả sử
các biến ngẫu nhiên Zi , i 1,2,..., n độc lập cùng có phân phối chuẩn tắc. Khi
n
đó, biến ngẫu nhiên X Z i2 được gọi là có phân phối Khi bình phương với
i 1
bậc tự do n .
Ký hiệu: X
2 n .
b) Hàm mật độ xác suất
Hàm mật độ xác suất của X
2 n là
0
1 n
1
1
f x n
e 2 x2
22 n
2
khi x 0
khi x 0
x
Trong đó x t x 1et dt được gọi là hàm Gamma với 1 1 ,
0
x 1 x x .
Chú ý: Đồ thị của hàm mật độ xác suất f x là đường cong không đối
xứng. Khi bậc tự do n 30 đồ thị hàm mật độ gần đối xứng và dịch chuyển về
bên phải (dạng hình chuông), nghĩa là phân phối Khi bình phương tiệm cận
phân phối chuẩn.
c) Các tham số đặc trưng
i) E X n .
14
ii) V X 2n .
d) Phân vị Khi bình phương
Phân vị Khi bình phương mức xác suất với n bậc tự do (ký hiệu
2 n ) là một giá trị của biến ngẫu nhiên X có phân phối Khi bình phương
với bậc tự do n sao cho P X 2 n .
1.2.5 Phân phối Student
a) Định nghĩa
Phân phối Student do William Sealy Gosset đề xuất năm 1908. Giả sử Z
là biến ngẫu nhiên có phân phối chuẩn tắc, V là biến ngẫu nhiên độc lập với
Z có phân phối Khi bình phương với bậc tự do n . Khi đó, biến ngẫu nhiên
Z
T
được gọi là có phân phối Student với bậc tự do n .
V/ n
Ký hiệu: T
tn .
b) Hàm mật độ xác suất
Hàm mật độ xác suất của T
tn là
n 1
n 1
x 2 2
2
f x
1
2
n
n
2
Chú ý: Đồ thị hàm mật độ f x là đường cong đối xứng qua trục tung.
c) Các hàm đặc trưng
i) Trung bình: E X 0 .
ii) Phương sai: V X
n
.
n2
d) Phân vị Student
Phân vị Student mức xác suất với n bậc tự do (ký hiệu t n ) là một
giá trị của biến ngẫu nhiên T
tn sao cho P 0 T t n .
15
1.2.6 Phân phối nhị thức
a) Định nghĩa
Biến ngẫu nhiên rời rạc X có tập giá trị X 0,1,..., n,... với xác
suất tương ứng được tính theo công thức Bernoulli
P X x Cnx p x q n x
Với x X , q 1 p được gọi là có phân phối nhị thức với tham số
n và p .
Ký hiệu: X
B n, p .
b) Hàm đặc trưng
t 1 p eit 1
n
c) Các tham số đặc trưng
i) E X np .
ii) E X 2 np n n 1 p 2 .
iii) E X 3 np 1 p 1 2 p .
iv) V ( X ) np 1 p .
m
d
v) m E X E X và m p 1 p nm m1 m .
dp
vi) np q Mod X np p .
1.2.7 Phân phối Poisson
a) Định nghĩa
Biến ngẫu nhiên rời rạc X có tập giá trị X 0,1,..., n,... được gọi
là có phân phối Poisson với tham số a a 0 nếu
a x a
P X x e
x!
Ký hiệu: X
P a .
16
b) Các tham số đặc trưng
Phân phối Poisson là một trường hợp đặc biệt của phân phối nhị thức. Vì
vậy với công thức tính các tham số đặc trưng của phân phối nhị thức ta dễ
dàng tính được các tham số đặc trưng của phân phối Poisson. Cụ thể:
i) Trung bình: E X np a .
ii) Phương sai: V X npq np 1 p a 1 p a (vì số p nhỏ nên
ta xem 1 p 1).
iii) Trung vị: a 1 Mod X a (vì ta có np q Mod X np p
mà np a và khi số n lớn, số p nhỏ ta có p 0, q 1 p 1 ).
Chú ý: Nếu X1 , X 2 ,..., X n là các đại lượng ngẫu nhiên rời rạc, độc lập
nhau có phân phối Poisson với trung bình ai , i 1,2,..., n thì đại lượng ngẫu
nhiên X X1 X 2 ... X n cũng có phân phối Poisson với tham số trung
bình a a1 a2 ... an .
* Xấp xỉ phân phối nhị thức bằng phân phối Poisson
Cho X
B n, p , nếu số phép thử n và xác suất p 0 sao cho
np a thì
F
X
P a
Trong thực hành với n khá lớn, p khá bé npq np thì hai phân phối
Poisson và nhị thức là như nhau, nhưng vì công thức tính nhị thức phức tạp (vì
có n! ), nên thay vào đó ta tính bằng công thức Poisson . Ta còn nói luật phân
phối Poisson là luật phân phối của biến cố hiếm.
Với a np thì
P X x C p q
x
n
x
n x
a x a
e
x!
Chứng minh
Vì np a nên suy ra p 0
Cnx p x 1 p
n x
n n 1 n 2 ... n x 1 x
n x
p 1 p
x!
1 n n 1 n 2 ... n x 1
x
n x
np 1 p
x
x!
n
17
Ta tìm giới hạn các thừa số: cố định x , ta có
n n 1 n 2 ... n x 1 1 2 x 1
= 1 1 ...1
1
nx
n
n n
np
x
ax
1 p
n x
1 p
np
p
1
1 p p
np
1 p p 1 p
xp
p
a
1
1 p p ea
xp
1 p p
np xp
p 0
p 0
1
Vậy Cnx p x q n x
a x a
e .
x!
1.2.8 Phân phối siêu bội
a) Định nghĩa
Từ một tập hợp gồm N phần tử trong đó có M phần tử có tính chất A ,
chọn ngẫu nhiên một tập hợp gồm n phần tử. Gọi X là số phần tử có tính
chất A trong n phần tử chọn ra. Ta có X là biến ngẫu nhiên rời rạc có thể
nhận các giá trị 0,1,...,n với
P X x
CMx CNnxM
CNn
Biến ngẫu nhiên rời rạc X có tập giá trị X 0,1,..., n,... với các
xác suất tương ứng tại X k được tính theo công thức trên được gọi là có
phân phối siêu bội với tham số N , M , n .
Ký hiệu: X
H N , M , n .
b) Các tham số đặc trưng
M
i) E X np, p .
N
ii) V X npq
N n
.
N 1
18
- Xem thêm -