Đăng ký Đăng nhập
Trang chủ Phân phối beta và phân phối chuẩn một chiều...

Tài liệu Phân phối beta và phân phối chuẩn một chiều

.PDF
101
741
50

Mô tả:

TRƢỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN BỘ MÔN TOÁN -------------- LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC PHÂN PHỐI BETA VÀ PHÂN PHỐI CHUẨN MỘT CHIỀU Giáo viên hƣớng dẫn Sinh viên thực hiện Ts. Võ Văn Tài Nguyễn Nhƣ Mai Mssv: 1117482 Ngành: Toán Ứng Dụng K37 Cần Thơ – 12/2014 2 PHẦN MỞ ĐẦU 1. LÝ DO CHỌN ĐỀ TÀI Phân phối xác suất đóng vai trò rất quan trọng trong lý thuyết xác suất. Nó cũng là cơ sở cho sự phát triển của lý thuyết thống kê. Chúng ta đã biết những phân phối xác suất quan trọng làm nền tảng cho thống kê như phân phối chuẩn, Student, Khi bình phương, mũ,... Trong lý thuyết xác suất và thống kê, phân phối Beta là một họ của phân phối xác suất liên tục xác định trên đoạn  0,1 , được tham số hóa bởi hai tham số hình học dương, ký hiệu là  và  , xuất hiện như số mũ của biến ngẫu nhiên và điều chỉnh hình dạng của phân phối. Phân phối Beta chuẩn tắc đã được sử dụng cho các biến ngẫu nhiên cụ thể liên quan đến tỷ lệ. Nó đã được sử dụng như một sự mô tả thống kê của tần số Allele trong dân số di truyền, thời gian phân bổ trong dự án hệ thống quản lý hay kiểm soát, dữ liệu ánh nắng mặt trời, sự thay đổi của tính chất của đất, tỷ lệ của khoáng chất đá trong địa tầng, tính không đồng nhất trong khả năng lây nhiễm HIV,... Trong suy luận Bayes, phân phối Beta thường được dùng làm phân phối xác suất tiên nghiệm cho tham số tỷ lệ. Phân phối Beta tổng quát chưa được quan tâm nhiều đặc biệt là các ứng dụng của nó. Ngoài ra những vấn đề liên quan đến phân phối Beta như tổng, tích, thương của hai phân phối Beta là những vấn đề lý thuyết đang được nhiều nhà thống kê hiện đại quan tâm, hứa hẹn nhiều tiềm năng phát triển. Như vậy, mặc dù được đề cập rất sớm từ những nhà thống kê nổi tiếng như Karl Pearson FRS (1936); William P.Elderton (1906); Richard Price (1911); Pearson và Karl (1936) nhưng những kết quả về lý thuyết cũng như về ứng dụng của phân phối vẫn được các nhà thống kê hiện đại quan tâm như Bowman và Shenton (2007); N.Turkkan và Phạm Gia Thụ (1992). Phân phối chuẩn (Normal distribution) được nêu ra bởi một người Anh gốc Pháp tên là Abraham de Moivre (1733). Sau đó Gauss, một nhà toán học người Đức, đã dùng luật phân phối chuẩn để nghiên cứu các dữ liệu về thiên văn học (1809) và do vậy cũng được gọi là phân phối Gauss. Theo từ điển bách khoa về khoa học thống kê, người đầu tiên dùng từ “normal” là ông C.S Pierce (1780) vì vào thời đó người ta cho rằng mọi hiện tượng tự nhiên được coi như có phân phối chuẩn nhưng thật ra còn có những luật phân phối khác. Tuy vậy, hầu hết lý thuyết thống kê được xây dựng trên nền tảng của phân phối chuẩn. Như vậy từ “normal” được dùng theo thói quen nhưng thực ra 1 không đúng, vì vậy trong tiếng Việt ta không thể dịch là phân phối “bình thường” mà gọi là phân phối chuẩn. Hai thông số quan trọng trong một phân phối là giá trị trung tâm hay gọi là trung bình  và phương sai  2 (hoặc độ lệch chuẩn  ) và thường biểu thị bằng X N   , 2  . Nếu phân phối chuẩn được chuẩn hóa với trung bình   0 và độ lệch chuẩn   1 , X N    0,  2  1 , được gọi là phân phối chuẩn tắc. Hầu hết các hiện tượng sinh học tự nhiên (như chiều cao, trọng lượng cơ thể, trị số mạch, huyết áp, đường máu, mật độ xương, số lượng hồng cầu, …) đều có thể mô tả bằng luật phân phối chuẩn. Chính vì thế mà luật phân phối chuẩn được ứng dụng cực kì rộng rãi trong khoa học thực nghiệm. Có thể nói rằng phân phối chuẩn là nền tảng, là trụ cột của tất cả các phân tích thống kê. Không có luật phân phối này cũng có nghĩa là không có khoa học thống kê hiện đại. Để hiểu rõ hơn tầm quan trọng của luật phân phối chuẩn, chúng ta cần ghi nhớ rằng trong nghiên cứu khoa học thực nghiệm, chúng ta không biết các thông số của một quần thể, mà chỉ dựa vào các số liệu từ một hay nhiều mẫu để suy luận cho một quần thể. Theo tìm hiểu của tôi các kết quả về phân phối Beta và phân phối chuẩn còn rời rạc, những ứng dụng của nó chưa được đề cập nhiều. Với mong muốn tổng kết một cách có hệ thống lý thuyết liên quan đến phân phối Beta và phân phối chuẩn cũng như những ứng dụng của nó làm nền tảng để có thể nghiên cứu sâu hơn trong tương lai, tôi chọn đề tài "Phân phối Beta và phân phối chuẩn một chiều" làm luận văn tốt nghiệp của mình. 2. MỤC ĐÍCH NGHIÊN CỨU  Tổng kết một cách có hệ thống, logic về phân phối Beta và phân phối chuẩn; mối quan hệ của phân phối Beta và phân phối chuẩn với các phân phối khác.  Một số ứng dụng quan trọng liên quan đến phân phối Beta và phân phối chuẩn. 2 3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU  Đối tượng nghiên cứu: Phân phối Beta, phân phối chuẩn một chiều.  Phạm vi nghiên cứu: Các vấn đề cơ bản của phân phối Beta và phân phối chuẩn một chiều. 4. PHƯƠNG PHÁP NGHIÊN CỨU Thu thập, tổng hợp, phân tích, hệ thống tài liệu, đặc biệt là các bài báo về phân phối Beta và phân phối chuẩn những năm gần đây để trình bày lại vấn đề nghiên cứu một cách có hệ thống và logic. 3 Chương 1 KIẾN THỨC CƠ SỞ 1.1 Biến ngẫu nhiên 1.1.1 Khái niệm Trong không gian xác suất  , F , P  với F là  - đại số và P : F  là hàm xác suất, biến ngẫu nhiên X là một ánh xạ được xác định như sau: X:  X   Để có thể chặt chẽ hơn về mặt lý thuyết, trong định nghĩa trên người ta đưa vào điều kiện, mọi tập hợp   : X    B  F với B là một tập Borel bất kỳ trên nghĩa là chúng không rơi ra ngoài F . Vì vậy có thể tính được xác suất của chúng. Biến ngẫu nhiên là biến nhận các giá trị là các khả năng có thể của phép thử ngẫu nhiên với một xác suất nào đó phụ thuộc vào kết quả của phép thử ngẫu nhiên. Các biến ngẫu nhiên thường được ký hiệu bằng các chữ cái in hoa như: X ,Y , Z ,... hoặc dạng chỉ số: X1 , X 2 ,..., X n ; Y1 ,Y2 ,...,Yn ;... Các giá trị có thể có của biến ngẫu nhiên được ký hiệu là: x1 , x 2 ,..., xm ; y1 , y2 ,..., ym ;... Một biến ngẫu nhiên coi như được xác định nếu biết tập các giá trị của nó và các xác suất mà nó nhận giá trị thuộc tập đó. 1.1.2 Phân loại biến ngẫu nhiên Biến ngẫu nhiên được chia thành hai loại: rời rạc và liên tục. - Biến ngẫu nhiên X được gọi là rời rạc nếu nó nhận hữu hạn hoặc vô hạn đếm được các giá trị. Như vậy, biến ngẫu nhiên rời rạc chỉ có thể nhận các giá trị nằm rời rạc với nhau trên trục số. - Biến ngẫu nhiên X được gọi là liên tục nếu tìm được hai số thực a  b sao cho mọi số nằm giữa a và b đều là giá trị của X . Như vậy, tập hợp các 4 giá trị ngẫu nhiên liên tục gồm các số thực trên một khoảng hay một đoạn của trục số và là tập hợp vô hạn không đếm được. 1.1.3 Hàm mật độ xác suất của biến ngẫu nhiên a) Đối với biến ngẫu nhiên rời rạc Giả sử biến ngẫu nhiên rời rạc X có n giá trị có thể có xi , i  1,2,..., n với xác suất tương ứng pi  P  X  xi   0 , khi đó hàm mật độ xác suất của X (ký hiệu: f  x  ) được xác định như sau:  p khi x  xi , i  1,2,..., n f  x   i 0 khi x  xi Thông thường để thuận lợi trong đánh giá biến ngẫu nhiên rời rạc, hàm mật độ xác suất được biểu diễn dưới dạng bảng phân phối xác suất như sau: ... X x1 x2 xn P n Chú ý: p i 1 i p1 p2 ... pn  1. b) Đối với biến ngẫu nhiên liên tục i) Định nghĩa Cho F  x  là hàm phân phối của biến ngẫu nhiên liên tục X . Khi đó hàm số f  x   F   x  được gọi là hàm mật độ xác suất của biến ngẫu nhiên liên tục X . ii) Nhận xét * Hàm mật độ có thể biểu diễn một cách trọn vẹn phân phối xác suất của biến ngẫu nhiên liên tục. * Nếu X là biến ngẫu nhiên liên tục thì c  , P  X  c   0 . Từ đó, a, b  sao cho a  b , ta có P  a  X  b  P a  X  b  P a  X  b  P a  X  b  iii) Tính chất Hàm mật độ f  x  có một số tính chất cơ bản như sau: 5 * f  x  là hàm không âm, f  x   0, x  .  *  f  x  dx  1 .  Đặc biệt, nếu X chỉ nhận giá trị trong  a, b  thì b  f  x  dx  1. a b * P  a  X  b    f  x  dx . a Chú ý: Với x đủ bé ta có P  x  X  x  x   f  x  x Do đó ta thấy xác suất để X nhận giá trị thuộc lân cận khá bé  x, x  x  gần như tỷ lệ với f  x  . 1.1.4 Hàm phân phối xác suất của biến ngẫu nhiên a) Định nghĩa Giả sử X là biến ngẫu nhiên xác định trên không gian xác suất  , F , P  . Khi đó hàm số F  x   P  X  x   P   : X    x  x  được gọi là hàm phân phối xác suất của biến ngẫu nhiên X .  Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất X x1 x2 ... xn P p1 p2 ... pn 0 p  1  p1  p2 thì F  x    P  X  xi    pi   x x x x   p1  p2   1 i i  pn1  Nếu X là biến ngẫu nhiên liên tục thì F  x   x  f  x  dx .  6 khi x  x1 khi x1  x  x2 khi x2  x  x3 khi khi xn1  x  xn khi x  xn b) Tính chất Hàm phân phối F  x  có một số tính chất cơ bản như sau: i) Bị chặn: 0  F  x   1, x . ii) F  x  là hàm không giảm: nếu a  b thì F  a   F  b  . iii) P  a  X  b   F  b   F  a  . iv) lim F  x   0 và lim F  x   1. x  x v) Nếu X là biến ngẫu nhiên liên tục thì F '  x   f  x  . c) Ý nghĩa Hàm phân phối xác suất F  x  phản ánh mức độ tập trung xác suất về bên trái của điểm x . 1.1.5 Các tham số đặc trưng a) Mode Mode của một biến ngẫu nhiên X (ký hiệu Mod  X  ) là giá trị của biến ngẫu nhiên mà tại đó nó có nhiều khả năng xảy ra nhất. Cụ thể ta có thể định nghĩa Mode cho từng loại biến ngẫu nhiên như sau:  Mode của biến ngẫu nhiên rời rạc: là giá trị của biến ngẫu nhiên mà tại đó nó có xác suất lớn nhất.  Mode của biến ngẫu nhiên liên tục: là giá trị của biến ngẫu nhiên mà tại đó hàm mật độ đạt giá trị cực đại. Chú ý: Một biến ngẫu nhiên có thể có nhiều giá trị Mode. b) Kỳ vọng i) Định nghĩa * Nếu X là biến ngẫu nhiên rời rạc nhận các giá trị có thể có xi với xác suất tương ứng P  X  xi   pi , i  1,2,..., n . Khi đó, kỳ vọng của biến ngẫu nhiên X (ký hiệu   E  X  ), được xác định bởi n E  X    xi pi i 1 7 * Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f  x  thì kỳ vọng của nó là EX     xf  x  dx  ii) Tính chất Gọi C là hằng số, X và Y là hai biến ngẫu nhiên. Ta có một số tính chất cơ bản sau của kỳ vọng E C   C . E  CX   CE  X  . E  X  Y   E  X   E Y  . E  XY   E  X  .E Y  , nếu X , Y độc lập. * Cho hàm số g  x  , khi đó n E  g  x    g  xi  pi , nếu X rời rạc. i 1 E  g  x     g  x  f  x  dx , nếu X liên tục.  iii) Ý nghĩa - Kỳ vọng của biến ngẫu nhiên chính là giá trị trung bình của biến ngẫu nhiên đó. Nó phản ánh giá trị trung tâm của phân phối xác suất. - Trong cơ học nếu coi x1 , x2 ,..., xn là các chất điểm, còn khối lượng là n p1 , p2 ,..., pn thì kỳ vọng E  X    xi pi chính là trọng tâm của hệ chất điểm. i 1 - Trong thực tế sản xuất hay kinh doanh nếu ta cần chọn phương án cho năng suất cao (hay lợi nhuận cao) ta cần chọn phương án cho năng suất kỳ vọng cao (hay lợi nhuận kỳ vọng cao). c) Phương sai i) Định nghĩa Phương sai của biến ngẫu nhiên X (ký hiệu V  X  ), được xác định bằng biểu thức 8  V  X   E  X  E  X  2  ii) Công thức Trong thực tế ta thường sử dụng công thức V  X   E  X  a  a  E  X  2  E  X 2  2aX  a 2   E  X 2   2aE  X   E  a 2   E  X 2   a2  E  X 2    E  X  2 Từ công thức này ta cụ thể cho từng biến ngẫu nhiên như sau: * Nếu X là biến ngẫu nhiên rời rạc nhận các giá trị có thể có xi với xác suất tương ứng P  X  xi   pi , i  1,2,..., n thì n n V  X     xi  E  X  pi   xi2 pi   E  X  2 i 1 2 i 1 Trong đó E  X 2    xi2 pi . n i 1 * Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f  x  thì V X      x  E  X  f  x  dx  2  Trong đó E  X   x f  x  dx   E  X  2 2   2    x f  x  dx . 2  iii) Tính chất Gọi C là hằng số, X và Y là hai biến ngẫu nhiên. Ta có một số tính chất cơ bản sau của phương sai V C   0 . V  CX   C 2V  X  . V  X  C V  X . 9 V  X  Y   V  X   V Y  , nếu X , Y độc lập. iv) Ý nghĩa Từ định nghĩa phương sai ta thấy X  E  X  chính là độ lệch giữa các giá trị có thể có của biến ngẫu nhiên X so với giá trị trung bình của nó. Do đó, phương sai chính là trung bình bình phương độ lệch, nó phản ánh mức độ phân tán của các giá trị biến ngẫu nhiên chung quanh giá trị trung bình. Vậy, khi phương sai nhỏ thì độ phân tán nhỏ tức mức độ tập trung lớn, ngược lại khi phương sai lớn thì độ phân tán lớn tức mức độ tập trung nhỏ. d) Độ lệch chuẩn Phương sai của một biến ngẫu nhiên là con số đặc trưng cho sự phân tán của biến ngẫu nhiên quanh kỳ vọng của nó. Tuy nhiên, nó không cùng đơn vị với biến ngẫu nhiên. Chính vì điều này, người ta đưa ra một tham số mới cũng có ý nghĩa giống như phương sai, nhưng cùng đơn vị với biến ngẫu nhiên. Đại lượng này được gọi là độ lệch chuẩn (ký hiệu   X  ).  X   V X  e) Moment i) Moment cấp k Moment cấp k của một biến ngẫu nhiên X (ký hiệu mk ), là kỳ vọng của biến ngẫu nhiên X k mk  E  X k  Trong trường hợp đặc biệt * Khi k  1 thì m1  E  X    X . * Khi k  2 thì m2  E  X 2  . ii) Moment trung tâm cấp k Moment cấp k của một biến ngẫu nhiên X được định nghĩa là giá trị k M k  E  X   X     Trong trường hợp đặc biệt * Khi k  1 thì M1  E  X   X   0 . 10 2 * Khi k  2 thì M 2  E  X   X     X2  m2  m12 .   1.2 Một số phân phối đặc biệt Dựa vào phân loại biến ngẫu nhiên X ta có Nếu X là biến ngẫu nhiên liên tục thì X có: phân phối Gamma hoặc phân phối đều, phân phối mũ, phân phối Khi bình phương và phân phối Student. Nếu X là biến ngẫu nhiên rời rạc thì X có: phân phối nhị thức hoặc phân phối Poisson và phân phối siêu bội. 1.2.1 Phân phối Gamma a) Định nghĩa Biến ngẫu nhiên liên tục X được gọi là có phân phối Gamma với hai tham số  và  , nếu hàm mật độ xác suất của nó được xác định như sau:     1   x x e khi x  0  f  x  ,        0 khi x  0  Ký hiệu: X G  ,   . Trong đó    ,   0 được xác định bởi công thức       x 1e x dx    1    1 0 b) Hàm đặc trưng  it    t   1      c) Các tham số đặc trưng i) Trung bình: E  X k   ii) Phương sai: V  X   1 k . .  1 ...   k  1 , k  1, 2,...  . k iii) Trung vị: Mod  X    1 ,   1.  11 iv) Hệ số bất đối xứng:  1  v) Hệ số nhọn:  2  6  2  . . d) Tính chất i)    1   .   . ii)    1   ! . Chú ý: Nếu X1 , X 2 ,..., X n là các đại lượng ngẫu nhiên rời rạc, độc lập nhau có phân phối Gamma với tham số i và  , i  1,2,..., n thì đại lượng ngẫu nhiên X  X1  X 2  ...  X n cũng có phân phối Gamma với tham số 1  2  ...  n và  . 1.2.2 Phân phối đều a) Định nghĩa Biến ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn  a, b , nếu hàm mật độ xác suất của nó được xác định như sau:  1  f  x  b  a 0  Ký hiệu: X khi x   a; b khi x   a; b U  a; b . b) Hàm phân phối xác suất khi x  a 0  x  a F  x   khi a  x  b b  a khi x  b 1 c) Các tham số đặc trưng b i) Trung bình: E  X    x. f  x  dx  a b ab . 2 ii) Phương sai: V  X     x    f  x  2 a 12 b  a  dx  12 2 . iii) Mod  X  là bất kỳ điểm nào trên  a, b  . 1.2.3 Phân phối mũ a) Định nghĩa Biến ngẫu nhiên liên tục X được gọi là có phân phối mũ với tham số   0 , nếu hàm mật độ xác suất của nó được xác định như sau: e x khi x  0 f x    khi x  0 0 Ký hiệu: X E   . b) Hàm phân phối xác suất 1  e x F  x   0 khi x  0 khi x  0 c) Hàm đặc trưng  t      it d) Các tham số đặc trưng i) Trung bình: E  X k   ii) Phương sai: V  X   k! , k  1,2,... k 1 k iii) Trung vị: Mod  X   . ln 2  . iv) Hệ số bất đối xứng:  1  2 . v) Hệ số nhọn:  2  6 . e) Tính chất Một tính chất quan trọng của phân phối mũ là tính chất không nhớ. Ta nói biến ngẫu nhiên không âm X không nhớ nếu với mọi s , t  0 , ta có P  X  t  s X  s  P  X  t hoặc tương đương với 13 P  X  t  s  P  X  t P  X  s Đẳng thức trên đúng nếu X có phân phối mũ P  X  t  s  1  F t  s  e  t  s   e t .e  s  P  X  t P  X  s Chú ý: Trong thực tế phân phối mũ được sử dụng phổ biến để diễn tả khoảng thời gian giữa hai lần xuất hiện của một biến cố. Chẳng hạn khoảng thời gian giữa hai ca cấp cứu trong một bệnh viện, giữa hai lần hỏng hóc của một cái máy,... 1.2.4 Phân phối Khi bình phương a) Định nghĩa Phân phối Khi bình phương được Karl Pearson đề xuất năm 1900. Giả sử các biến ngẫu nhiên Zi , i  1,2,..., n độc lập cùng có phân phối chuẩn tắc. Khi n đó, biến ngẫu nhiên X   Z i2 được gọi là có phân phối Khi bình phương với i 1 bậc tự do n . Ký hiệu: X  2  n . b) Hàm mật độ xác suất Hàm mật độ xác suất của X  2  n  là 0  1 n  1 1 f  x   n e 2 x2  22   n    2  khi x  0 khi x  0 x Trong đó   x    t x 1et dt được gọi là hàm Gamma với  1  1 , 0   x  1  x  x  . Chú ý: Đồ thị của hàm mật độ xác suất f  x  là đường cong không đối xứng. Khi bậc tự do n  30 đồ thị hàm mật độ gần đối xứng và dịch chuyển về bên phải (dạng hình chuông), nghĩa là phân phối Khi bình phương tiệm cận phân phối chuẩn. c) Các tham số đặc trưng i) E  X   n . 14 ii) V  X   2n . d) Phân vị Khi bình phương Phân vị Khi bình phương mức xác suất  với n bậc tự do (ký hiệu 2  n  ) là một giá trị của biến ngẫu nhiên X có phân phối Khi bình phương với bậc tự do n sao cho P  X  2  n     . 1.2.5 Phân phối Student a) Định nghĩa Phân phối Student do William Sealy Gosset đề xuất năm 1908. Giả sử Z là biến ngẫu nhiên có phân phối chuẩn tắc, V là biến ngẫu nhiên độc lập với Z có phân phối Khi bình phương với bậc tự do n . Khi đó, biến ngẫu nhiên Z T được gọi là có phân phối Student với bậc tự do n . V/ n Ký hiệu: T tn . b) Hàm mật độ xác suất Hàm mật độ xác suất của T tn là  n 1 n 1    x 2  2 2  f  x   1  2  n   n    2 Chú ý: Đồ thị hàm mật độ f  x  là đường cong đối xứng qua trục tung. c) Các hàm đặc trưng i) Trung bình: E  X   0 . ii) Phương sai: V  X   n . n2 d) Phân vị Student Phân vị Student mức xác suất  với n bậc tự do (ký hiệu t  n  ) là một giá trị của biến ngẫu nhiên T tn sao cho P  0  T  t  n     . 15 1.2.6 Phân phối nhị thức a) Định nghĩa Biến ngẫu nhiên rời rạc X có tập giá trị X     0,1,..., n,... với xác suất tương ứng được tính theo công thức Bernoulli P  X  x   Cnx p x q n x Với x  X    , q  1  p được gọi là có phân phối nhị thức với tham số n và p . Ký hiệu: X B  n, p  . b) Hàm đặc trưng   t   1  p  eit  1 n c) Các tham số đặc trưng i) E  X   np . ii) E  X 2   np  n  n  1 p 2 . iii) E  X 3   np 1  p 1  2 p  . iv) V ( X )  np 1  p  . m  d  v) m  E  X  E  X   và m  p 1  p  nm m1  m  . dp   vi) np  q  Mod  X   np  p . 1.2.7 Phân phối Poisson a) Định nghĩa Biến ngẫu nhiên rời rạc X có tập giá trị X     0,1,..., n,... được gọi là có phân phối Poisson với tham số a  a  0  nếu a x a P  X  x  e x! Ký hiệu: X P a . 16 b) Các tham số đặc trưng Phân phối Poisson là một trường hợp đặc biệt của phân phối nhị thức. Vì vậy với công thức tính các tham số đặc trưng của phân phối nhị thức ta dễ dàng tính được các tham số đặc trưng của phân phối Poisson. Cụ thể: i) Trung bình: E  X   np  a . ii) Phương sai: V  X   npq  np 1  p   a 1  p   a (vì số p nhỏ nên ta xem 1  p  1). iii) Trung vị: a  1  Mod  X   a (vì ta có np  q  Mod  X   np  p mà np  a và khi số n lớn, số p nhỏ ta có p  0, q  1  p  1 ). Chú ý: Nếu X1 , X 2 ,..., X n là các đại lượng ngẫu nhiên rời rạc, độc lập nhau có phân phối Poisson với trung bình ai , i  1,2,..., n thì đại lượng ngẫu nhiên X  X1  X 2  ...  X n cũng có phân phối Poisson với tham số trung bình a  a1  a2  ...  an . * Xấp xỉ phân phối nhị thức bằng phân phối Poisson Cho X B  n, p  , nếu số phép thử n   và xác suất p  0 sao cho np  a thì F X   P a Trong thực hành với n khá lớn, p khá bé  npq  np  thì hai phân phối Poisson và nhị thức là như nhau, nhưng vì công thức tính nhị thức phức tạp (vì có n! ), nên thay vào đó ta tính bằng công thức Poisson . Ta còn nói luật phân phối Poisson là luật phân phối của biến cố hiếm. Với a  np thì P  X  x  C p q x n x n x a x a  e x! Chứng minh Vì np  a nên suy ra p  0 Cnx p x 1  p  n x  n  n  1 n  2  ... n  x  1 x n x p 1  p  x!  1 n  n  1 n  2  ... n  x  1 x n x  np  1  p  x x! n 17 Ta tìm giới hạn các thừa số: cố định x , ta có n  n  1 n  2  ... n  x  1  1  2   x  1  = 1  1   ...1   1 nx n   n  n    np  x  ax 1  p  n x 1  p  np p 1  1  p  p np  1  p  p 1  p   xp p a 1    1  p  p   ea    xp 1  p  p  np  xp  p 0 p 0  1 Vậy Cnx p x q n x  a x a e . x! 1.2.8 Phân phối siêu bội a) Định nghĩa Từ một tập hợp gồm N phần tử trong đó có M phần tử có tính chất A , chọn ngẫu nhiên một tập hợp gồm n phần tử. Gọi X là số phần tử có tính chất A trong n phần tử chọn ra. Ta có X là biến ngẫu nhiên rời rạc có thể nhận các giá trị 0,1,...,n với P  X  x  CMx CNnxM CNn Biến ngẫu nhiên rời rạc X có tập giá trị X     0,1,..., n,... với các xác suất tương ứng tại X  k được tính theo công thức trên được gọi là có phân phối siêu bội với tham số N , M , n . Ký hiệu: X H  N , M , n . b) Các tham số đặc trưng M  i) E  X   np,  p   . N  ii) V  X   npq N n . N 1 18
- Xem thêm -

Tài liệu liên quan