Trong hoạt động thực tiễn, con người bắt buộc phải tiếp xúc với những hiện tượng ngẫu nhiên mà không thể dự đoán trước được.Tuy nhiên chúng ta có thể hệ thống hoá các hiện tượng ngẫu nhiên để rút ra các quy luật ngẫu nhiên và biểu diễn chúng bằng các mô hình Toán học. Đó cũng chính là nội dung của "Lý thuyết xác suất" - một lĩnh vực ngày càng được ứng dụng rộng rãi trong nhiều ngành Khoa học kỹ thuật, Khoa học xã hội và Nhân văn. Đối tượng nghiên cứu của "Lý thuyết xác suất"chính là những biến ngẫu nhiên là kết quả của một thí nghiệm nào đó. Biến ngẫu nhiên ở đây không chỉ đơn thuần là số chấm xuất hiện khi tung xúc sắc hay mặt xuất hiện khi tung một đồng xu, mà trong nhiều trường hợp biến ngẫu nhiên rất phức tạp và khó hình dung. Thông thường, chúng ta chỉ cảm thấy dễ hình dung về những điều ta tận mắt thấy, tận tai nghe, còn những cái không đong đếm được, không nhìn thấy hết được thì trở nên trừu tượng và khó hiểu. Biến ngẫu nhiên liên tục là một trong những "vật thể" như vậy. Vì vậy, khi tìm hiểu về biến ngẫu nhiên liên tục, cần hiểu rõ về khái niệm cũng như đặc điểm của nó. Tài liệu này mong muốn cung cấp một cách nhìn tổng quát và đầy đủ về biến ngẫu nhiên liên tục, bao gồm: khái niệm, các đặc trưng của biến ngẫu nhiên liên tục về hàm mật độ, kỳ vọng, sự độc lập, phân phối có điều kiện..., các phân phối liên tục và một số phân phối liên tục được sử dụng trong chọn mẫu thống kê.
TRƯỜNG ĐẠI HỌC SƯ PHẠM TPHCM
Khoa Toán
——————– * ———————
BIẾN NGẪU NHIÊN LIÊN TỤC
(XÁC SUẤT THỐNG KÊ 1)
Sinh viên thực hiện : Vũ Thị Mai - K41 Toán C
Giáo viên hướng dẫn : Cô Hoàng Thị Thảo Phương
Thành phố Hồ Chí Minh
Ngày 19 tháng 9 năm 2017
Biến ngẫu nhiên liên tục
Mở đầu
MỞ ĐẦU
Trong hoạt động thực tiễn, con người bắt buộc phải tiếp xúc với những hiện
tượng ngẫu nhiên mà không thể dự đoán trước được. Tuy nhiên chúng ta có thể
hệ thống hoá các hiện tượng ngẫu nhiên để rút ra các quy luật ngẫu nhiên và
biểu diễn chúng bằng các mô hình Toán học. Đó cũng chính là nội dung của
"Lý thuyết xác suất một lĩnh vực ngày càng được ứng dụng rộng rãi trong nhiều
ngành Khoa học kỹ thuật, Khoa học xã hội và Nhân văn. Đối tượng nghiên cứu
của "Lý thuyết xác suất"chính là những biến ngẫu nhiên là kết quả của một thí
nghiệm nào đó. Biến ngẫu nhiên ở đây không chỉ đơn thuần là số chấm xuất
hiện khi tung xúc sắc hay mặt xuất hiện khi tung một đồng xu, mà trong nhiều
trường hợp biến ngẫu nhiên rất phức tạp và khó hình dung. Thông thường,
chúng ta chỉ cảm thấy dễ hình dung về những điều ta tận mắt thấy, tận tai nghe,
còn những cái không đong đếm được, không nhìn thấy hết được thì trở nên trừu
tượng và khó hiểu. Biến ngẫu nhiên liên tục là một trong những "vật thể"như
vậy. Vì vậy, khi tìm hiểu về biến ngẫu nhiên liên tục, cần hiểu rõ về khái niệm
cũng như đặc điểm của nó.
Tài liệu này mong muốn cung cấp một cách nhìn tổng quát và đầy đủ về biến
ngẫu nhiên liên tục, bao gồm: khái niệm, các đặc trưng của biến ngẫu nhiên liên
tục về hàm mật độ, kỳ vọng, sự độc lập, phân phối có điều kiện..., các phân phối
liên tục và một số phân phối liên tục được sử dụng trong chọn mẫu thống kê.
Trong quá trình biên soạn, do kiến thức còn hạn hẹp, nên không tránh khỏi
những sai sót, mong cô và các bạn góp ý để em có thể hoàn thiện hơn.
Trường đại học Sư phạm TPHCM
2
Biến ngẫu nhiên liên tục
Mục lục
Mục lục
1 Kiến thức chuẩn bị
1.1 Một số định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Một số bổ đề và định lý . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
4
7
2 Hàm mật độ xác suất
7
3 Sự độc lập
10
4 Kỳ vọng
10
5 Ví dụ về biến ngẫu nhiên liên tục
5.1 Phân phối đều . . . . . . . . .
5.2 Phân phối mũ . . . . . . . . .
5.3 Phân phối chuẩn . . . . . . .
5.4 Phân phối Gamma . . . . . .
5.5 Phân phối Cauchy . . . . . .
5.6 Phân phối Beta . . . . . . . .
5.7 Phân phối Weibull . . . . . .
5.8 Phân phối Student . . . . . .
12
12
13
13
14
15
15
15
16
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Sự phụ thuộc
16
7 Phân phối có điều kiện và kỳ vọng có điều kiện
21
8 Hàm của biến ngẫu nhiên
24
9 Tổng của biến ngẫu nhiên
29
10 Phân phối chuẩn nhiều chiều
30
11 Phân phối phát sinh từ phân phối chuẩn
32
12 Lấy mẫu từ một phân phối
36
13 Ghép đôi và sự xấp xỉ phân phối Poisson
39
14 Xác suất hình học
44
15 Một số bài tập
50
Trường đại học Sư phạm TPHCM
3
Biến ngẫu nhiên liên tục
1. Kiến thức chuẩn bị
NỘI DUNG CHÍNH
Trong tài liệu này, nếu không nói rõ thì ta hiểu không gian xác suất là (Ω, F , P).
1
Kiến thức chuẩn bị
Để tìm hiểu về biến ngẫu nhiên liên tục, ta cần biết các khái niệm cơ bản về
xác suất, về biến cố, biến ngẫu nhiên và các tính chất của nó,... Ngoài ra, một số
kiến thức về tích phân, về sự liên tục, về lý thuyết độ đo,... cũng rất cần thiết. Các
định nghĩa, bổ đề và định lý dưới đây được biên soạn lại từ tài liệu G. Grimmett
and D. Stirzaker. Probability and random processes. Oxford New York: Oxford
University Press, 2001, nhằm chuẩn bị một số kiến thức cần thiết cho đề tài này.
1.1
Một số định nghĩa
Định nghĩa 1. Cho tập Rn .
σ-đại số Borel của Rn , ký hiệu B(Rn ), là σ-đại số chứa các tập Borel của Rn .
Hàm ϕ : (Rn , B(Rn )) → (R, B(R)), được gọi là hàm Borel, nếu nó B(Rn ) đo được,
tức là: ϕ−1 (B ) ∈ B(Rn ) với mỗi B ∈ B(R). Lưu ý rằng, từ định nghĩa suy ra, nếu ϕ là
hàm liên tục thì ϕ cũng là hàm Borel.
Định nghĩa 2. Ánh xạ X : Ω −→ R sao cho
©
ª
ω ∈ Ω : X (ω) ≤ x ∈ F , ∀x ∈ R
được gọi là biến ngẫu nhiên.
(mục 2.1.3, trang 27)
Định nghĩa 3. Hàm số
F
:
R −→ [0, 1]
x 7−→ F (x) = P(X ≤ x)
gọi là hàm phân phối xác suất của biến ngẫu nhiên X.
(mục 2.1.4, trang 27)
Định nghĩa 4. .
Biến ngẫu nhiên X được gọi là rời rạc nếu tập giá trị của nó là một tập con
©
ª
hữu hạn hoặc đếm được của R, tức là I m(X ) = x 1 , x 2 , . . . ⊂ R.
Biến ngẫu nhiên rời rạc X có hàm khối (xác suất) f : R −→ [0, 1], cho bởi
f (x) = P(X = x).
(mục 2.3.1, trang 33)
Định nghĩa 5. Hai biến cố A, B ∈ F được gọi là độc lập nếu P(A ∩ B ) = P(A)P(B )
(mục 1.5.1, trang 13)
©
ª
Định nghĩa 6. Hai biến ngẫu nhiên rời rạc X và Y là độc lập nếu X = x và
©
ª
Y = y là hai biến cố độc lập với mọi x và y .
(mục 3.2.1, trang 48)
Trường đại học Sư phạm TPHCM
4
Biến ngẫu nhiên liên tục
1. Kiến thức chuẩn bị
Định nghĩa 7. Cho X là biến ngẫu nhiên rời rạc, k là số nguyên dương.
Moment gốc cấp k của X , ký hiệu mk , là kỳ vọng của X k : m k = E(X k ).
Moment trung tâm cấp k , ký hiệu σk được cho bởi: σk = E((X − m1 )k ).
m 1 = E(X ) là gọi là kỳ vọng của X , σ2 = E((X − EX )2 ) là phương sai của X , ký
hiệu v ar (X ), D[X ] hay σ2X .
Ta chứng minh được: v ar (X ) = E((X − EX )2 ) = E(X 2 ) − (EX )2 .
(mục 3.3.5, trang 51)
Định nghĩa 8. Hiệp phương sai của hai biến ngẫu nhiên X và Y là:
cov(X , Y ) = E[(X − EX )(Y − EY )] = E(X Y ) − E(X )E(Y ).
Hệ số tương quan của hai biến ngẫu nhiên X và Y là:
ρ(X , Y ) = p
cov(X , Y )
v ar (X ).v ar (Y )
với điều kiện phương sai khác không.
(mục 3.6.7, trang 64)
Định nghĩa 9. X và Y được gọi là không tương quan nếu E(X Y ) = E(X )E(Y ) (hay
ρ = 0).
(mục 3.3.10, trang 53)
Định nghĩa 10. Biến ngẫu nhiên rời rạc X nhận giá trị 1 và 0 với xác suất tương
ứng là p và q(= 1− p). Phép thử với mô hình trên được gọi là phép thử Bernoulli.
Hàm khối xác suất:
f (0) = 1 − p,
f (1) = p.
(mục 3.5.1, trang 60)
Định nghĩa 11. Biến ngẫu nhiên rời rạc X nhận một trong các giá trị từ 0, 1, ..., n
với hàm khối xác suất có dạng:
f (k) = P(X = k) = C nk p k (1 − p)n−k
gọi là phân phối nhị thức với tham số n và p . Kí hiệu: x ∼ B (n, p).
(mục 3.5.2, trang 60)
Định nghĩa 12. Biến ngẫu nhiên rời rạc X có phân phối Poisson nếu hàm khối
xác suất của nó có dạng:
f (k) =
λk −λ
e ,
k!
k = 0, 1, 2, . . .
với λ > 0. Chú ý rằng phân phối B (n, λ/n) có phân phối Poisson với tham số λ khi
n→∞
(mục 3.5.4, trang 61)
Trường đại học Sư phạm TPHCM
5
Biến ngẫu nhiên liên tục
1. Kiến thức chuẩn bị
Định nghĩa 13. Phép thử với hai hậu quả đúng hoặc sai, xác suất xảy ra đúng là
p . Gọi X là số phép thử được tiến hành cho đến khi hậu quả đúng xuất hiện thì
dừng. Hàm khối xác suất:
f (k) = p(1 − p)k−1 ,
k = 1, 2, . . .
với p ∈ (0, 1). Phân phối này được gọi là phân phối hình học.
(mục 3.5.5, trang 61)
Định nghĩa 14. Hàm khối xác suất đồng thời của hai biến ngẫu nhiên rời rạc X
và Y , f : R2 −→ [0, 1], được cho bởi:
f (x, y) = P(X = x, Y = y).
(mục 3.6.2, trang 63)
Định nghĩa 15. Nếu P(B ) > 0, thì xác suất có điều kiện của biến cố A với điều
kiện biến cố B xảy ra được định nghĩa bởi:
P(A|B ) =
P(A ∩ B )
.
P(B )
(mục 1.4.1, trang 9)
Định nghĩa 16. A gọi là một phân hoạch của Ω nếu:
A i 6= ;, ∀A i ∈ A,
A i ∩ A j = ; với mọi phần tử A i 6= A j của A ,
Hợp tất cả các phần tử của tất cả các A i ta được Ω.
Định nghĩa 17. (trong thống kê)
Hàm ước lượng θ(x 1 , x 2 , . . . x n ) của θ được gọi là một ước lượng không chệch
của θ nếu: E(θ) = θ .
Định nghĩa 18. Giả sử hai thí nghiệm có không gian xác suất lần lượt là (Ω1 , F1 , P1 )
và (Ω2 , F2 , P2 ). Khi đó không gian mẫu đồng thời của hai thí nghiệm này
©
ª
Ω1 × Ω2 = (ω1 , ω2 ) : ω1 ∈ Ω1 , ω2 ∈ Ω2
được gọi là không gian tích.
(mục 1.6(B), trang 15)
Định nghĩa 19. Cho A ⊂ F . Hàm chỉ báo của A , ký hiệu I A được định nghĩa
1 nếu ω ∈ A
I A (ω) =
0 nếu ω ∉ A
Trường đại học Sư phạm TPHCM
6
Biến ngẫu nhiên liên tục
1.2
2. Hàm mật độ xác suất
Một số bổ đề và định lý
Bổ đề 1. Hàm phân phối F có các tính chất sau:
(a) lim F (x) = 0,
lim F (x) = 1,
x→−∞
x→∞
(b) Nếu x < y thì F (x) ≤ F (y),
(c) Hàm F liên tục phải, nghĩa là, F (x + h) → F (x) khi h → 0.
(mục 2.1.6, trang 28)
Bổ đề 2. Nếu F là hàm phân phối của X thì:
(a) P(X > x) = 1 − F (x),
(b) P(x < X ≤ y) = F (y) − F (x),
(c) P(X = x) = F (x)− lim F (y).
(mục 2.1.11, trang 30)
Bổ đề 3. Nếu X và Y độc lập thì E(X Y ) = E(X )E(Y ).
(mục 3.3.9, trang 53)
y→x
Định lý 1. Kỳ vọng E có các tính chất sau:
(a) Nếu X ≥ 0 thì E(X ) ≥ 0.
Do đó, E(X 2 ) ≥ 0 và E(X 2 ) = 0 khi và chỉ khi P(X = 0) = 1.
(b) Nếu a, b ∈ R thì E(a X + bY ) = aE(X ) + bE(Y ),
(c) E(c) = c , với c là hằng số.
(mục 3.3.8, trang 52)
Định lý 2. Cho hai biến ngẫu nhiên X và Y . Khi đó:
(a) v ar (a X ) = a 2 v ar (X ), ∀a ∈ R,
(b) v ar (X + Y ) = v ar (X ) + v ar (Y ) nếu X và Y không tương quan nhau.
(mục 3.3.11, trang 53)
2
Hàm mật độ xác suất
Định nghĩa 1. Biến ngẫu nhiên X được gọi là liên tục nếu hàm phân phối
F (x) = P(X ≤ x) của nó có thể biểu diễn dưới dạng:
Z
F (x) =
x
f (u)d u
(1)
−∞
với f : R −→ [0, ∞) là hàm khả tích.
Định nghĩa 2. Hàm dưới dấu tích phân f (.) trong phương trình (1) được gọi là
hàm mật độ (xác suất) của biến ngẫu nhiên liên tục X .
Nhận xét 1. i) Hàm mật độ của X chưa chắc xác định duy nhất bằng phương
trình (1) bởi vì hai hàm khả tích bằng nhau ở hầu khắp nơi (chỉ trừ một số điểm
đặc biệt) có thể có cùng tích phân. Tuy nhiên, nếu F khả vi tại u ta thường lấy
f (u) = F 0 (u).
ii) Ta có thể viết f X (u) khi cần nhấn mạnh vai trò của X .
Trường đại học Sư phạm TPHCM
7
Biến ngẫu nhiên liên tục
2. Hàm mật độ xác suất
Ví dụ 1. Một cây gậy thẳng được ném xuống mặt phẳng ngang một cách ngẫu
nhiên. Ta đo ω là góc hợp bởi cây gậy và hướng Bắc. Kết quả đo là một số nằm
trong Ω = [0, 2π). Độ đo xác suất P thoả:
P((a, b)) =
b−a
2π
Xét hai biến ngẫu nhiên X và Y :
X (ω) = ω, Y (ω) = ω2
Khi đó ta có Y = X 2 và các hàm phân phối của X và Y lần lượt là:
0
x
F X (x) =
2π
1
0
py
F Y (y) =
2π
1
x ≤0
0 < x < 2π
x ≥ 2π
y ≤0
0 < y < 4π2
y ≥ 4π2
Các biến ngẫu nhiên X và Y là liên tục vì ta có:
Z
F X (x) =
x
Z
f X (u)d u,
F Y (y) =
−∞
y
f Y (u)d u
−∞
Trong đó:
(2π)−1 ,
0
f X (u) = F X (u) =
0
1
(u)− 2
, 0 < u < 4π2
f Y (u) = F Y0 (u) =
4π
0
nơi khác
0 < u < 2π
nơi khác
Và f X (u), f Y (u) tương ứng là hàm mật độ của X , Y .
Nhận xét 2. i) f X (u) 6= 0 ⇔ x ∈ (0, 2π). Do đó, để đơn giản, ta có thể viết f X (u) =
(2π)−1 với 0 < u < 2π và hiểu ngầm rằng f X (u) = 0 ở nơi khác (tương tự đối với
f Y (u)).
ii) Chúng ta đã sử dụng cùng một kí hiệu f cho hàm khối xác suất (định nghĩa
4, mục 1.1) và hàm mật độ xác suất vì với những biến ngẫu nhiên thích hợp, hai
hàm này có cùng nhiệm vụ. Trong nhiều trường hợp, việc chứng minh những
kết quả của biến liên tục có thể được tiến hành dựa trên chứng minh của biến
P
rời rạc bằng cách thay tổng ( ) bằng tích phân và thay hàm khối xác suất f (x)
bằng f (x)d x tương ứng.
Bổ đề 1. Nếu f là hàm mật độ của X thì:
R∞
(a) −∞
f (x)d x = 1 và f (x) ≥ 0, ∀x ,
(b) P(X = x) = 0, ∀x ∈ R,
R
(c) P(a ≤ X ≤ b) = ab f (x)d x .
Chứng minh. Gọi F là hàm phân phối của X .
(a) Trong phương trình (1), cho x → ∞ ta được:
Z
∞
−∞
Trường đại học Sư phạm TPHCM
f (u)d u = lim F (x) = 1
x→∞
8
Biến ngẫu nhiên liên tục
3. Sự độc lập
Và F là hàm không giảm nên f (x) = F 0 (x) ≥ 0, ∀x ((bổ đề 1, mục 1.2).
(b) ∀x ∈ R, P(X = x) = F (x) − lim F (y) (bổ đề 2, mục 1.2)
y→x
Z
=
x
y
Z
−∞
Z
f (u)d u − lim
f (u)d u =
y→x −∞
x
Z
f (u)d u −
−∞
x
−∞
f (u)d u = 0
(c) Ta có: P(a ≤ X ≤ b) = P(a < X ≤ b) (do P(X = a) = 0)
= F (b) − F (a) (bổ đề 2, mục 1.2)
Z
=
b
a
Z
−∞
f (x)d x −
Z
f (x)d x =
−∞
b
f (x)d x.
a
■
Nhận xét 3. i) Biến ngẫu nhiên liên tục khác hoàn toàn với biến ngẫu nhiên rời
rạc (định nghĩa 4, mục 1.1) ở chỗ nó thoả P(X = x) = 0, ∀x ∈ R. Điều này nghe có
vẻ vô lý vì X nhất thiết phải nhận một vài giá trị nào đó. Nhưng hãy thử nghĩ theo
hướng này: Số các giá trị mà X có thể nhận (số phần tử của không gian mẫu) là
không đếm được và rất lớn nên xác suất để X nhận một giá trị gần như bằng 0.
ii) Hàm f (x) không phải là một xác suất. Tuy nhiên, ta có:
P(x < X ≤ x + d x) = F (x + d x) − F (x) ≈ f (x)d x
Do đó ta thấy xác suất để X nhận giá trị thuộc lân cận khá bé (x, x + d x) gần như
tỉ lệ với f (x), tức là ở nơi nào giá trị của f (x) lớn thì tại lân cận của điểm đó có độ
tập trung xác suất cao. Đây chính là ý nghĩa của hàm mật độ.
iii) Xác suất để X nhận giá trị trong [a, b] là:
P(a ≤ X ≤ b) =
Z
b
f (x)d x
a
Như vậy, để tính xác suất này, ta chỉ việc lấy tổng của từng phần tử nhỏ tạo thành
nó (tính chất của tích phân). Tổng quát hơn, nếu B là một tập con của R (B có
thể là một khoảng, một đoạn, hợp của các khoảng hoặc bằng R,...), thì ta có:
P(x ∈ B ) =
Z
f (x)d x
(2)
B
iv) Phần (a) của bổ đề trên chính là đặc trưng của hàm mật độ xác suất, tức
là nếu hàm f : R −→ [0, ∞) là hàm khả tích và f thoả (a) thì f là hàm mật độ của
một biến ngẫu nhiên nào đó.
Thật vậy, gọi F là tập tất cả những khoảng mở của R, thì σ - đại số sinh bởi F,
σ(F) (σ - đại số nhỏ nhất chứa F) chính là σ - đại số Borel của R, B(R). Với mỗi
B ∈ B(R), đặt P X (B ) = P(X ∈ B ). Khi đó (R, B(R), P) là một không gian xác suất.
R∞
Giả sử f : R −→ [0, ∞) là hàm khả tích và −∞
f (x)d x = 1. Với mỗi B ∈ B(R), từ
phương trình (2) ta có:
P X (B ) = P(X ∈ B ) =
Z
f (x)d x
B
Khi đó (R, B(R), P) là không gian xác suất và f là hàm mật độ của biến ngẫu
nhiên:
X
:
R −→ R
x 7−→ X (x) = x
Trường đại học Sư phạm TPHCM
9
Biến ngẫu nhiên liên tục
3
4. Kỳ vọng
Sự độc lập
Ta không thể định nghĩa sự độc lập của hai biến liên tục X và Y dựa trên các biến
©
ª
©
ª
cố X = x và Y = y bởi vì xác suất của các biến cố này bằng 0. Đối với biến liên
tục, ta quan tâm đến xác suất để X , Y nhận giá trị trong một khoảng, nên ta đi
đến định nghĩa sau:
Định nghĩa 1. Hai biến ngẫu nhiên X và Y được gọi là độc lập nếu
©
X ≤x
ª
và
©
Y ≤y
ª
là hai biến cố độc lập với mọi x, y ∈ R.
(3)
Nhận xét 1. i) Hai biến ngẫu nhiên rời rạc X , Y thoả (3) nếu và chỉ nếu X , Y thoả
định nghĩa 6 (mục 1.1). Do đó, định nghĩa trên đây là định nghĩa tổng quát về sự
độc lập của hai biến ngẫu nhiên bất kì.
ii) Định nghĩa trên có thể được tổng quát hoá như sau: Hai biến ngẫu nhiên
©
ª
©
ª
X và Y được gọi là độc lập nếu: X ∈ A và Y ∈ B là hai biến cố độc lập với
mọi A, B ∈ B(R) (xem định nghĩa 1, mục 1.1, trang 4).
iii) Cho hai biến ngẫu nhiên X , Y và g , h : R −→ R là các hàm Borel (xem định
nghĩa 1, mục 1.1, trang 4). Khi đó g (X ), h(Y ) là các hàm đi từ Ω vào R, xác định
bởi:
g (X )(ω) = g (X (ω)),
h(Y )(ω) = h(Y (ω))
và g (X ), h(Y ) cũng là các biến ngẫu nhiên.
Định lý 1. Nếu X và Y độc lập thì g (X ) và h(Y ) cũng độc lập.
Chứng minh. Từ điều kiện X , Y độc lập, định nghĩa về hàm Borel (định nghĩa 1,
mục 1.1, trang 4) và mục ii) của nhận xét trên, ta có: ∀a, b ∈ R,
P (g (X ) ≤ a, h(Y ) ≤ b) = P(X ∈ g −1 (−∞, a], Y ∈ h −1 (−∞, b])
= P(X ∈ g −1 (−∞, a]).P(Y ∈ h −1 (−∞, b])
= P(g (X ) ≤ a).P(h(Y ) ≤ b).
Vậy: g (X ) và h(Y ) độc lập.
4
■
Kỳ vọng
Kỳ vọng của biến ngẫu nhiên rời rạc X là EX = x xP(X = x). Đây là giá trị xác
suất trung bình của X . Đối với biến ngẫu nhiên liên tục, ta sẽ định nghĩa kỳ
vọng bằng tích phân.
P
Định nghĩa 1. Kỳ vọng (hay giá trị trung bình) của biến ngẫu nhiên liên tục X
với hàm mật độ f , ký hiệu là EX hay M [X ], được cho bởi:
EX =
Trường đại học Sư phạm TPHCM
Z
∞
x f (x)d x
−∞
10
Biến ngẫu nhiên liên tục
4. Kỳ vọng
R∞
R
EX tồn tại khi −∞ x f (x)d x tồn tại. Trong tài liệu này, ta định nghĩa g (x)d x tồn
R
tại khi |g (x)|d x < ∞.
Ví dụ 1. Ta quay trở lại ví dụ 1 (mục 2, trang 8). Biến ngẫu nhiên X và Y có kỳ
vọng là:
E(X ) =
2π
Z
0
x
d x = π,
2π
p
4π2
Z
E(Y ) =
y
4
d y = π2
4π
3
0
Kỳ vọng E của biến ngẫu nhiên liên tục có những tính chất tương tự như đối với
biến ngẫu nhiên rời rạc.
Định lý 1. Nếu X và g (X ) là các biến ngẫu nhiên liên tục thì:
E(g (X )) =
∞
Z
g (x) f X (x)d x
−∞
Để chứng minh định lý này với g ≥ 0, ta xét bổ đề sau.
Bổ đề 1. Nếu X có hàm mật độ f với f (x) = 0 khi x < 0 và hàm phân phối F , thì:
EX =
Z
∞
0
[1 − F (x)]d x
Chứng minh. Ta có:
∞
Z
[1 − F (x)]d x =
0
∞
Z
0
P(X > x)d x =
Z
∞
ÃZ
!
∞
f (y)d y d x.
y=x
0
Đổi thứ tự lấy tích phân ta được:
Z
∞
ÃZ
y=x
0
!
∞
∞ µZ y
Z
f (y)d y d x =
0
¶
f (y)d x d y =
0
∞
Z
(vì f (x) = 0 khi x < 0 nên
Z
y f (y)d y =
0
∞
−∞
y f (y)d y = EX
0
Z
−∞
y f (y)d y = 0).
■
Chứng minh. định lý 1 khi g ≥ 0:
Khi g ≥ 0 thì hàm mật độ của g (X ), f g (X ) = 0, ∀x < 0. Áp dụng bổ đề 1 ta được:
E(g (X )) =
©
Z
∞
0
P(g (X ) > x)d x =
Z
∞ µZ
¶
f X (y)d y d x
B
0
ª
với B = y : g (y) > x . Đổi thứ tự lấy tích phân ta được:
E(g (X )) =
Z
∞
−∞
ÃZ
!
g (y)
f X (y)d x d y =
0
Z
∞
g (y) f X (y)d y.
−∞
Chứng minh. định lý 1 trong trường hợp tổng quát:
E(g (X )) =
Z
∞
−∞
Z
y f g (X ) (y)d y =
Trường đại học Sư phạm TPHCM
∞
−∞
ÃZ
!
g −1 (y)
y f X (x)d x d y =
Z
∞
g (x) f X (x)d x.
−∞
11
Biến ngẫu nhiên liên tục
5. Ví dụ về biến ngẫu nhiên liên tục
Ví dụ 2. Quay trở lại ví dụ 1. Áp dụng bổ đề 1 ta có thể tìm được E(Y ) mà không
cần tính f Y :
2
E(Y ) = E(X ) =
Z
2π
Z
2
x f X (x)d x =
0
2π
0
4
x2
d x = π2 .
2π
3
Một số đặc trưng khác của biến ngẫu nhiên liên tục (moment, hiệp phương sai,
sự tương quan,...) được xây dựng tương tự như của biến ngẫu nhiên rời rạc (định
nghĩa 7 và 8, mục 1.1, trang 5). Chẳng hạn, ở định nghĩa 7 (mục 1.1, trang 5) ta
đã định nghĩa moment gốc cấp k (k nguyên dương) của biến rời rạc X là:
m k = E(X k )
(4)
thì moment gốc cấp k của biến liên tục cũng được định nghĩa bằng biểu thức
trên. Tuy nhiên, moment này có thể không tồn tại vì tích phân:
E(X k ) =
Z
x k f (x)d x
có thể không hội tụ (phân phối Cauchy là một ví dụ, sẽ được trình bày trong
phần sau).
5
5.1
Ví dụ về biến ngẫu nhiên liên tục
Phân phối đều
Biến ngẫu nhiên X có phân phối đều trên [a, b] nếu hàm phân phối của nó có
dạng:
nếu x ≤ a,
0
x −a
F (x) =
b−a
1
nếu a < x ≤ b,
nếu x > b.
hay nói cách khác, X có thể nhận bất kì giá trị nào trên [a, b] với xác suất như
nhau và không nhận giá trị nào bên ngoài đoạn [a, b]. Trong ví dụ 1 (mục 2,
trang 8), X có phân phối đều trên [0, 2π].
Hàm mật độ:
1
, x ∈ (a, b)
f (x) =
b−a
0,
x ∉ (a, b)
Kỳ vọng:
E(X ) =
Z
b
a
x
a +b
dx =
.
b−a
2
Tính toán tương tự, phương sai: v ar (X ) =
Trường đại học Sư phạm TPHCM
(a − b)2
.
12
12
Biến ngẫu nhiên liên tục
5.2
5. Ví dụ về biến ngẫu nhiên liên tục
Phân phối mũ
Biến ngẫu nhiên X có phân phối mũ với tham số λ(> 0) nếu nó có hàm phân
phối thoả:
F (x) = 1 − e −λx ,
∞
1
Kỳ vọng: EX =
[1 − F (x)]d x = .
λ
0
Phương sai: v ar X = E(X 2 ) − (EX )2 = λ12 .
x ≥ 0.
Z
Phân phối này có thể xem là "giới hạn liên tục"của phân phối hình học (định
nghĩa 13, mục 1.1, trang 6) và thường xuất hiện trong các bài toán về khoảng
thời gian giữa hai lần xuất hiện của một biến cố E nào đó mà số lần xuất hiện
của E tuân theo luật phân bố Poisson (định nghĩa 12, mục 1.1, trang 5), chẳng
hạn như giữa hai lần xuất hiện một cuộc điện thoại, một trận động đất, hay giữa
hai lần xe buýt đến,...
5.3
Phân phối chuẩn
Đây là một trong những phân phối liên tục quan trọng nhất. Biến ngẫu nhiên
liên tục X có phân phối chuẩn (hay phân phối Gauss), với hai tham số µ và σ2 ,
ký hiệu X ∼ N (µ, σ2 ), nếu hàm mật độ của X có dạng:
(x−µ)2
1
−
e 2σ2 ,
f (x) = p
2πσ
−∞ < x < ∞, σ > 0.
R∞
Ta chứng minh nếu f (x) có dạng như trên thì
R ∞ −u 2
p
minh −∞
e
d u = π. Thật vậy, ta có:
Z Z
R2
e
−(u 2 +v 2 )
Z
⇒
∞
e −v
2π µZ ∞
Z
d ud v =
2
∞
µZ
−∞
e
0
0
rdr dϕ =
e −u d u d v = π ⇒
x −µ
Trong (5), ta đặt p = t , thì:
σ 2
Z ∞
1
f (x) = p
π
−∞
Z
∞
f (x) = 1. Trước hết, ta chứng
¶
¶
2
−∞
−r 2
−∞
Z
(5)
∞
−∞
Z
2π
0
1
d ϕ = π.
2
2
e −u d u =
p
π.
2
−∞
e −t d t = 1.
Kỳ vọng và phương sai:
(x−µ)2
x
−
EX =
p e 2σ2 d x =
−∞ σ 2π
Z
∞
σ
=p
2π
Z
∞
te
−∞
Z
σt + µ − t 2
e 2 dt
p
−∞
2π
2
e− 2
dt +µ
p dt = µ
−∞ 2π
− t2
∞
Z
∞
(đặt
x −µ
= t)
σ
t2
(6)
Z ∞
(x−µ)2
x2
(σt + µ)2 − t 2
x −µ
−
2
E(X ) =
e 2 d t (đặt
= t)
p e 2σ d x =
p
σ
−∞ σ 2π
−∞
2π
Z ∞
Z ∞
Z ∞
2
2
σ2
(µ + σt )2 − t 2
µ2
− t2
2 − t2
=p
e
dt + p
t e
dt +
e 2 d t = µ2 + σ2 .
p
−∞
2π −∞
2π −∞
2π
2
Z
∞
v ar (X ) = E(X 2 ) − (EX )2 = µ2 + σ2 − µ2 = σ2 .
Trường đại học Sư phạm TPHCM
13
Biến ngẫu nhiên liên tục
5. Ví dụ về biến ngẫu nhiên liên tục
Nhận xét 1. Từ các chứng minh ở trên ta có thể kết luận: Nếu f (x) có dạng:
(x−µ)2
1
−
e 2σ2 ,
f (x) = p
2πσ
−∞ < x < ∞, σ > 0
thì f (x) là hàm mật độ phân phối chuẩn N (µ, σ2 ) của biến ngẫu nhiên X nào đó.
R∞
Tức là: −∞
f (x) = 1, và:
Z
∞
−∞
x f (x) = EX = µ;
Z
∞
−∞
x 2 f (x) = E(X 2 ) = µ2 + σ2 .
Nhận xét này thường được sử dụng khi tính toán với hàm của biến ngẫu nhiên
có phân phối chuẩn sau này.
Nếu µ = 0 và σ2 = 1 thì phân phối chuẩn được gọi là phân phối chuẩn tắc, ký
hiệu N (0, 1).
1
1 2
Hàm mật độ: ϕ(x) = p
2πZ
Hàm phân phối: Φ(x) =
Kỳ vọng: EX = 0.
Phương sai: v ar (X ) = 1.
e− 2 x ,
−∞ < x < ∞.
Z x
x
t2
1
e − 2 d t (hàm Laplace).
ϕ(t )d t = p
−∞
2π −∞
Mọi biến ngẫu nhiên có phân phối chuẩn, X ∼ N (µ, σ2 ), với σ > 0, đều có thể đưa
X −µ
.
σ
Khi đó: P(Y ≤ y) = P((X − µ)/σ ≤ y) = P(X ≤ yσ + µ)
Z yσ+µ (x−µ)2
Z y
v2
1
1
−
2
2σ
dx = p
= p
e
e− 2 d v
σ 2π −∞
2π −∞
Do đó, Y ∼ N (0, 1).
về dạng phân phối chuẩn tắc bằng cách đặt Y =
(đặt x = vσ + µ).
Nhận xét 2. i) Đường cong mật độ của phân phối chuẩn (đồ thị của hàm mật
độ) đối xứng qua đường thẳng x = µ. Đặc biệt, nếu X ∼ N (0, 1) thì đồ thị hàm
mật độ ϕ(x) của X đối xứng qua trục Oy, và hàm phân phối Φ(x) có tính chất
Φ(x) + Φ(−x) = 1, ∀x .
ii) Phân phối chuẩn có thể xem là giới hạn liên tục của phân phối nhị thức
B (n, p) (định nghĩa 11, mục 1.1, trang 5). Trong thực tế, có rất nhiều biến ngẫu
nhiên có phân phối chuẩn, chẳng hạn điểm thi của sinh viên, trọng lượng và
chiều cao của con người, mức độ thông minh của trẻ em,...
5.4
Phân phối Gamma
Biến ngẫu nhiên X có phân phối Gamma với tham số λ, t > 0, ký hiệu Γ(λ, t ), nếu
hàm mật độ của nó có dạng:
f (x) =
1 t t −1 −λx
λ x e
,
Γ(t )
x ≥ 0.
Trong đó, Γ(t ) là hàm Gamma:
Γ(t ) =
∞
Z
Trường đại học Sư phạm TPHCM
0
x t −1 e −x d x;
Γ(t + 1) = t Γ(t );
14
Biến ngẫu nhiên liên tục
5. Ví dụ về biến ngẫu nhiên liên tục
µ ¶ p
3
π
=
.
Γ
2
2
µ ¶
p
1
= π;
Γ
2
Γ(1) = 1;
Nếu t = 1 thì X có phân phối mũ với tham số λ.
Nếu λ = 21 , t = d2 , với d ∈ Z, thì X có phân phối "chi - bình phương" (trung tâm)
χ2 (d ) với d bậc tự do.
Kỳ vọng: EX = d .
Phương sai: v ar X = 2d .
5.5
Phân phối Cauchy
Biến ngẫu nhiên X có phân phối Cauchy nếu hàm mật độ của nó có dạng:
f (x) =
1
,
π(1 + x 2 )
−∞ < x < ∞.
Phân phối Cauchy có tính chất đặc trưng là không có moment.
5.6
Phân phối Beta
Biến ngẫu nhiên X có phân phối Beta, với tham số a, b > 0, nếu hàm mật độ của
nó có dạng:
f (x) =
1
x a−1 (1 − x)b−1 ,
β(a, b)
0 ≤ x ≤ 1.
Trong đó, β(a, b) là hàm Beta, được định nghĩa bởi:
β(a, b) =
1
Z
0
x a−1 (1 − x)b−1 d x =
Γ(a)Γ(b)
.
Γ(a + b)
Nếu a = b = 1 thì X có phân phối đều trên đoạn [0, 1].
5.7
Phân phối Weibull
Biến ngẫu nhiên X có phân phối Weibull, tham số α, β > 0, nếu hàm phân phối
của nó có dạng:
β
F (x) = 1 − e −αx ,
x ≥ 0.
Lấy đạo hàm hai vế ta được:
β
f (x) = αβx β−1 e −αx ,
x ≥ 0.
Với β = 1 thì X có phân phối mũ với tham số α.
Trường đại học Sư phạm TPHCM
15
Biến ngẫu nhiên liên tục
5.8
6. Sự phụ thuộc
Phân phối Student
Giả sử U là đại lượng ngẫu nhiên có phân phối chuẩn tắc và V là đại lượng ngẫu
nhiên độc lập với U có phân phối chi - bình phương với n bậc tự do. Khi đó đại
lượng ngẫu nhiên:
p
T=
U n
V
được gọi là có phân phối Student với n bậc tự do.
Ký hiệu: T ∼ t (n)
Hàm mật độ:
Ã
! n+1
2 − 2
)
Γ( n+1
t
f T (t ) = p 2 n 1 +
,
n
πnΓ( 2 )
−∞ < t < ∞
Kỳ vọng: E(T ) = 0
n
Phương sai: v ar T =
.
n −2
6
Sự phụ thuộc
Rất nhiều tính chất thú vị về cặp biến ngẫu nhiên X , Y liên quan đến cách mà X
và Y biến đổi cùng nhau trên Ω.
Định nghĩa 1. Hàm số F : R2 −→ [0, 1] cho bởi:
F (x, y) = P(X ≤ x, Y ≤ y)
được gọi là hàm phân phối xác suất đồng thời của X và Y .
Nếu X và Y là biến liên tục thì ta không thể nói về hàm khối xác suất đồng thời
(định nghĩa 14, mục 1.1, trang 6) của chúng vì nó luôn bằng 0. Thay vào đó, ta
sẽ xây dựng một hàm khác.
Định nghĩa 2. Hai biến ngẫu nhiên X và Y được gọi là liên tục (đồng thời), với
hàm mật độ (xác suất) đồng thời f : R2 −→ [0, ∞), nếu:
Z
F (x, y) =
y
Z
x
f (u, v)d ud v,
v=−∞ u=−∞
x, y ∈ R.
Nếu F khả vi tại (x, y), ta thường lấy:
f (x, y) =
∂2
F (x, y).
∂x∂y
Nhận xét 1. Hàm phân phối và hàm mật đồng thời có các tính chất như hàm
phân phối và hàm mật độ của biến ngẫu nhiên X (xem bổ đề 1 và 2, mục 1.2,
trang 7; bổ đề 1, mục 2, trang 8).
Trường đại học Sư phạm TPHCM
16
Biến ngẫu nhiên liên tục
6. Sự phụ thuộc
Cho hai biến ngẫu nhiên X và Y có hàm phân phối đồng thời F và hàm mật độ
đồng thời f . (Có thể viết F X ,Y và f X ,Y để nhấn mạnh vai trò của X và Y ). Khi đó:
P(a ≤ X ≤ b, c ≤ Y ≤ d ) = F (b, d ) − F (a, d ) − F (b, c) + F (a, c)
Z d Z b
=
f (x, y)d xd y.
y=c x=a
Ta có thể xem f (x, y)d xd y như một phần tử của xác suất P(x < X ≤ x + d x, y < Y ≤
y + d y), do đó, nếu B là một tập con của R2 (B có thể là một hình chữ nhật, hợp
của các hình chữ nhật hay bằng R2 ,...) thì:
P((X , Y ) ∈ B ) =
Z Z
(7)
f (x, y)d xd y.
B
Ta có thể xem (X , Y ) là một điểm được chọn một cách ngẫu nhiên trong mặt
phẳng, khi đó P((X , Y ) ∈ B ) là xác suất để điểm được chọn nằm trong B .
Phân phối biên: Hàm phân phối biên của X và Y được định nghĩa như sau:
F X (x) = P(X ≤ x) = F (x, ∞),
Khi đó: F X (x) =
Z
x
µZ
F Y (y) = P(Y ≤ y) = F (∞, y), với F (x, ∞) = lim F (x, y)
y→∞
∞
¶
f (u, y)d y d u
−∞
−∞
Do đó hàm mật độ biên của X là: f X (x) =
Z
∞
f (x, y)d y .
−∞Z
Tương tự, hàm mật độ biên của Y là: f Y (y) =
∞
f (x, y)d x .
−∞
Kỳ vọng: Nếu g : R2 −→ R là hàm Borel đo được (xem định nghĩa 1, mục 1.1, trang
4) thì:
Z ∞Z ∞
E(g (X , Y )) =
g (x, y) f (x, y)d xd y
−∞ −∞
Trường hợp đặc biệt, g (x, y) = ax + b y ,
E(a X + bY ) = aEX + bEY .
Chứng minh. Tương tự định lý 1 (mục 3, trang 11)
■
Sự độc lập: Biến ngẫu nhiên X và Y được gọi là độc lập nếu và chỉ nếu:
F (x, y) = F X (x)F Y (y),
∀x, y ∈ R.
Đối với biến ngẫu nhiên liên tục, điều này tương đương với:
f (x, y) = f X (x) f Y (y)
với F khả vi tại (x, y) và f , f X , f Y tương ứng là đạo hàm của F, F X , FY . Tổng quát
hơn, hai biến ngẫu nhiên liên tục X và Y độc lập nếu và chỉ nếu f X ,Y (x, y) có thể
phân tích thành tích của một hàm chỉ chứa x và một hàm chỉ chứa y :
f X ,Y (x, y) = g (x)h(y).
Trường đại học Sư phạm TPHCM
(8)
17
Biến ngẫu nhiên liên tục
6. Sự phụ thuộc
Chứng minh. i) X và Y độc lập
⇔ P(X ≤ a, Y ≤ b) = P(X ≤ a).P(Y ≤ b) ⇔ F (x, y) = F X (x)F Y (y)
(9)
Nếu X và Y là các biến ngẫu nhiên liên tục thì: (9) ⇔ f (x, y) = f X (x) f Y (y).
ii) Chứng minh hai biến ngẫu nhiên liên tục X và Y độc lập nếu và chỉ nếu
f X ,Y (x, y) = g (x)h(y):
+ Nếu X và Y là các biến ngẫu nhiên liên tục độc lập nhau thì ta có f (x, y) =
f X (x) f Y (y) = g (x)h(y).
+ Nếu f X ,Y (x, y) = g (x)h(y), thì:
Z
f X (x) = g (x)
và
Z
1=
∞
Z
h(y)d y,
−∞
∞
−∞
f Y (y) = h(y)
Z
f Y (y)d y =
∞
Z
g (x)d x
−∞
∞
g (x)d x.
−∞
∞
h(y)d y.
−∞
Do đó: f X (x) f Y (y) = g (x)h(y) = f X ,Y (x, y), nên X và Y độc lập.
■
Ví dụ 1. Bài toán cây kim của Buffon. Trên mặt phẳng có vô số đường kẻ song
song, khoảng cách giữa hai đường liên tiếp nhau là 1: y = n (n = 0, ±1, ±2, . . .).
Thả ngẫu nhiên một cây kim có chiều dài bằng 1 vào mặt phẳng. Tính xác suất
để cây kim cắt một đường thẳng bất kỳ.
Lời giải: Gọi (X , Y ) là toạ độ của trung điểm cây kim và ϕ(0 ≤ ϕ ≤ π) là góc hợp
bởi cây kim và trục hoành. Đặt khoảng cách từ trung điểm cây kim đến đường
kẻ gần nhất nằm dưới nó là Z = Y − [Y ] ([Y ] là phần nguyên của Y ). Khi đó:
Z có phân phối đều trên [0, 1], nên f Z (z) = 1 nếu 0 ≤ z ≤ 1,
ϕ có phân phối đều trên [0, π], nên f ϕ (θ) = 1/π nếu 0 ≤ θ ≤ π,
Z và ϕ độc lập, nên f Z ,ϕ (z, θ) = f Z (z) f ϕ (θ).
Do đó, cặp biến ngẫu nhiên Z , ϕ có hàm mật độ đồng thời f (z, θ) = 1/π, với
0 ≤ z ≤ 1, 0 ≤ θ ≤ π.
Gọi A là biến cố ngẫu nhiên: cây
kim cắt một đường thẳng nào đó.
Trường hợp 1: z ≤ 0.5. Dựa vào
hình bên ta suy ra A xảy ra khi và
chỉ khi z ≤ sin θ/2.
Trường hợp 2: z > 0.5. Dựa vào
hình bên bên ta suy ra A xảy ra khi
và chỉ khi 1 − z ≤ sin θ/2.
Tóm lại: A xảy ra khi và chỉ khi
(Z , ϕ) ∈ B , với B ⊂ [0, 1] × [0, π] được
cho bởi:
½
¾
1
1
B = (z, θ) : z ≤ sin θ hoặc 1 − z ≤ sin θ .
2
2
Trường đại học Sư phạm TPHCM
18
Biến ngẫu nhiên liên tục
Do đó: P(A) =
6. Sự phụ thuộc
Z Z
B
1
π
f (z, θ)d zd θ =
Z
0
π
Z
1
2
sin θ
dz +
0
1
Z
1− 12 sin θ
d z d θ =
2
.
π
Thí nghiệm này có thể dùng để tính số π. Nếu ta có n phép thử với n khá lớn, và
giả sử m là số lần cây kim cắt một đường thẳng. Khi đó, tần suất m/n ≈ P(A) = 2/π.
Ví dụ 2. Phân phối chuẩn hai chiều. Cho f : R2 → R được cho bởi:
f (x, y) =
1
− 1 (x 2 −2ρx y+y 2 )
e 2(1−ρ2 )
p
2π 1 − ρ 2
trong đó, ρ là một hằng số thoả: −1 < ρ < 1. Ta có:
f (x, y) ≥ 0
!
Z ∞Z ∞
Z ∞Ã
Z ∞
(x−ρy)2
y2
1
1
−
f (x, y)d xd y =
e 2(1−ρ2 ) d x d y = 1
p e− 2
p
2)
−∞ −∞
−∞
−∞
2π
2π(1
−
ρ
(vì các hàm dưới dấu tích phân lần lượt là hàm mật độ của phân phối chuẩn
N (ρy, 1 − ρ 2 ) và N (0, 1), xem nhận xét 1, mục 5.3, trang 14)
nên f (x, y) được gọi là hàm mật độ phân phối chuẩn tắc hai chiều của cặp biến
X , Y nào đó. Và:
∞
x2
1
f X (x) =
f (x, y)d y = p e − 2
−∞
2π
Z
Z
∞
1
e
p
−∞
2π(1 − ρ 2 )
−
(y−ρx)2
2(1−ρ 2 )
x2
1
d y = p e− 2
2π
(vì hàm dưới dấu tích phân là hàm mật độ của phân phối chuẩn N (ρx, 1 − ρ 2 )).
1
Tương tự, f Y (y) = p
y2
e − 2 . Do đó X , Y ∼ N (0, 1). Suy ra: EX = EY = 0 và v ar (X ) =
2π
v ar (Y ) = 1 (xem mục 5.3, trang 13). Do đó, theo định nghĩa 8 (mục 1.1, trang 5),
hệ số tương quan của X và Y :
ρ(X , Y ) = p
cov(X , Y )
v ar (X ).v ar (Y )
= cov(X , Y )
trong đó cov(X , Y ) là hiệp phương sai của X và Y . Cũng theo định nghĩa 8 (mục
1.1, trang 5), ta có:
cov(X , Y ) = E(X , Y ) − E(X )E(Y ) = E(X , Y ) =
Z
=
∞
µZ
∞
Z
∞
x y f (x, y)d xd y
−∞ −∞
∞
y g (y)
−∞
Z
¶
xh(x, y)d x d y,
−∞
trong đó
−
y2
2
e
g (y) = p ,
2π
−
(x−ρy)2
2(1−ρ 2 )
e
h(x, y) = p
2π(1 − ρ 2 )
lần lượt là hàm mật độ của phân phối chuẩn N (0, 1) và N (ρy, 1 − ρ 2 ), nên
R∞ 2
R∞
y
g
(y)
=
1
và
−∞
−∞ xh(x, y) = ρy (xem nhận xét 1, mục 5.3, trang 14).
Vậy: ρ(X , Y ) = cov(X , Y ) = ρ .
Từ định nghĩa 9 (mục 1.1, trang 5) và bổ đề 3 (mục 1.2, trang 7) ta có: nếu hai
Trường đại học Sư phạm TPHCM
19
Biến ngẫu nhiên liên tục
6. Sự phụ thuộc
biến ngẫu nhiên độc lập nhau thì chúng không tương quan nhau, nhưng điều
ngược lại không đúng. Tuy nhiên, trong trường hợp này, nếu X và Y không tương
quan nhau, tức là ρ(X , Y ) = cov(x, Y ) = ρ = 0 thì:
1 2
1 2
e− 2 x e− 2 y
= f X (x) f Y (y)
f (x, y) = p
p
2π 2π
do đó X và Y độc lập. Ta đi đến một kết luận quan trọng: Hai biến ngẫu nhiên
có phân phối chuẩn tắc hai chiều độc lập khi và chỉ khi chúng không tương
quan nhau.
Phân phối chuẩn hai chiều tổng quát thì phức tạp hơn. Ta nói cặp biến ngẫu
nhiên X , Y có phân phối chuẩn hai chiều với kỳ vọng µ1 và µ2 , phương sai σ21 và
σ22 , và hệ số tương quan ρ nếu hàm mật độ đồng thời của chúng có dạng:
f (x, y) =
1
p
2πσ1 σ2
1
1 − ρ2
e − 2 Q(x,y)
trong đó, σ1 , σ2 > 0 và Q là dạng toàn phương:
"µ
1
Q(x, y) =
1 − ρ2
Z
f X (x) =
∞
−∞
x − µ1
σ1
1
f (x, y)d y = p
e
2πσ1
1
=p
e
2πσ1
Tương tự: f Y (y) = p
−
(x−µ1 )2
2σ2
1
1
2πσ1
e
−
¶2
x − µ1
− 2ρ
σ1
µ
(x−µ1 )2
−
2σ2
1
¶µ
¶ µ
¶ #
y − µ2
y − µ2 2
.
+
σ2
σ2
µ
∞
Z
−∞
1
p
2π(1 − ρ 2 )
e
−
¶
x−µ 2
t −ρ σ 1
1
2(1−ρ 2 )
µ
dt
y − µ2
=t
σ2
¶
⇒ X ∼ N (µ1 , σ21 ) ⇒ EX = µ1 , v ar (X ) = σ21 .
(y−µ1 )2
2σ2
1
⇒ Y ∼ N (µ2 , σ22 ) ⇒ EY = µ2 , v ar (Y ) = σ22 .
Bằng cách lấy tích phân tương tự như trên ta suy ra hệ số tương quan: ρ(X , Y ) = ρ ,
và X và Y độc lập khi và chỉ khi ρ = 0.
Ví dụ 3. Đây là một ví dụ khác về cách thao tác với hàm mật độ. Cho X và Y có
hàm mật độ đồng thời:
f (x, y) =
e
−y− xy
0 < x, y < ∞.
,
y
Tìm hàm mật độ biên của Y .
Lời giải. Ta có:
Z
f Y (y) =
∞
−∞
Z
f (x, y)d x =
và do đó Y có phân phối mũ.
Trường đại học Sư phạm TPHCM
0
∞
e
−y− xy
y
d x = e −y ,
y > 0,
■
20
- Xem thêm -