Phân tích phương sai và ứng dụng

  • Số trang: 70 |
  • Loại file: PDF |
  • Lượt xem: 70 |
  • Lượt tải: 0
minhtuan

Đã đăng 15929 tài liệu

Mô tả:

TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN BỘ MÔN TOÁN ------------ LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC PHÂN TÍCH PHƯƠNG SAI VÀ ỨNG DỤNG GIÁO VIÊN HƯỚNG DẪN: SINH VIÊN THỰC HIỆN: TS. Võ Văn Tài Phạm Thị Xuân Thảo Bộ môn Toán – Khoa KHTN MSSV: 1117499 Ngành: Toán Ứng Dụng – K37 CẦN THƠ – 12/2014 LỜI CẢM ƠN ---------Tôi xin tỏ lòng kính trọng và biết ơn sâu sắc tới Thầy Võ Văn Tài, người đã tận tình hướng dẫn, chỉ bảo khích lệ và động viên tôi trong suốt quá trình làm luận văn. Bên cạnh đó thầy đã cung cấp cho tôi nhiều tài liệu quý giá giúp tôi hiểu sâu hơn về đề tài của mình. Để đạt được kết quả như ngày hôm nay, tôi xin gửi lời cảm ơn đến toàn thể quý thầy cô của bộ môn Toán - Khoa Khoa học Tự nhiên của trường Đại học Cần Thơ đã trang bị cho tôi những kiến thức cơ bản, các kỹ năng cần thiết trong suốt ba năm học tập tại trường, đây chính là hành trang quý báu, giúp tôi không chỉ thực hiện tốt đề tài tốt nghiệp mà còn giúp tôi tự tin vững bước trên con đường sự nghiệp sắp tới. Tôi xin cảm ơn quý thầy cô trong Hội đồng bảo vệ đã dành thời gian xem xét, chỉnh sửa những sai xót cũng như đóng góp ý kiến những mặt còn hạn chế của đề tài để đề tài được hoàn chỉnh hơn. Tôi xin cảm ơn các bạn, những người luôn sát cánh cùng tôi, giúp đỡ động viên tôi trong suốt quá trình vừa qua. Cuối cùng, tôi xin cảm ơn đến gia đình tôi, những người đã dạy dỗ, khuyến khích, động viên và tạo mọi điều kiện tốt nhất cho tôi trong quá trình học tập. Dù đã cố gắng hết sức cùng với sự tận tâm của Thầy hướng dẫn song do trình độ còn hạn chế nên khó tránh khỏi những thiếu sót. Rất mong nhận được sự thông cảm và góp ý của Thầy Cô và các bạn. Cần Thơ, tháng 12 năm 2014 Phạm Thị Xuân Thảo i MỤC LỤC Trang LỜI CẢM ƠN......................................................................................................... i DANH MỤC CÁC BẢNG .................................................................................... 1 DANH MỤC CÁC HÌNH ..................................................................................... 2 PHẦN MỞ ĐẦU.................................................................................................... 3 Chƣơng 1 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN......................................... 5 1.1 Kiểm định về phương sai ............................................................................... 5 1.1.1 Kiểm định phương sai ........................................................................... 5 1.1.2 So sánh hai phương sai .......................................................................... 6 1.1.3 So sánh nhiều phương sai ...................................................................... 6 1.2 Phân tích phương sai đơn biến một nhân tố ................................................... 7 1.2.1 Bài toán.................................................................................................. 7 1.2.2 Vấn đề thực hiện.................................................................................... 8 1.3 Phân tích phương sai đơn biến hai nhân tố .................................................. 11 1.3.1 Bài toán ................................................................................................. 11 1.3.2 Vấn đề thực hiện.................................................................................. 12 1.3 Phân tích phương sai đơn biến ba nhân tố ................................................... 21 1.4.1 Bài toán................................................................................................ 21 1.4.2 Vấn đề thực hiện.................................................................................. 22 Chƣơng 2 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN .......................................... 38 2.1 Phân tích phương sai đa biến một nhân tố với cở mẫu bằng nhau .............. 38 2.1.1 Giới thiệu .............................................................................................. 38 2.1.2 Vấn đề thực hiện ................................................................................... 39 2.2 Phân tích phương sai đa biến một nhân tố với cở mẫu không bằng nhau .. 42 2.2.1 Giới thiệu .............................................................................................. 42 2.2.2 Vấn đề thực hiện ................................................................................... 42 2.3 Phân tích phương sai đa biến hai nhân tố ................................................... 43 2.3.1 Giới thiệu .............................................................................................. 43 2.3.2 Vấn đề thực hiện ................................................................................... 43 Chƣơng 3 MỘT SỐ ỨNG DỤNG TRONG GIÁO DỤC ................................ 48 3.1 Giới thiệu .................................................................................................... 48 3.2 Phân tích điểm thi tuyển sinh vào ngành Toán ứng dụng K40 của trường đại học Cần Thơ ...................................................................................................... 48 3.2.1 Số liệu ................................................................................................... 48 3.2.2 Mục đích thực hiện ............................................................................... 49 3.2.3 Kết quả thực hiện .................................................................................. 50 3.3 Phân tích tỷ lệ có việc làm sau khi tốt nghiệp các ngành của Khoa Khoa học Tự nhiên............................................................................................................. 52 ii 3.3.1 Số liệu .................................................................................................. 52 3.3.2 Mục đích thực hiện .............................................................................. 54 3.3.3 Kết quả thực hiện .................................................................................. 55 3.4 Phân tích điểm học tập của sinh viên K36 Khoa Khoa học Tự nhiên......... 58 3.4.1 Số liệu ................................................................................................. 58 3.4.2 Mục đích thực hiện ............................................................................... 58 3.4.3 Kết quả thực hiện ................................................................................ 59 KẾT LUẬN .......................................................................................................... 62 TÀI LIỆU THAM KHẢO .................................................................................. 63 PHỤ LỤC 1.......................................................................................................... 64 PHỤ LỤC 2.......................................................................................................... 65 PHỤ LỤC 3.......................................................................................................... 66 iii DANH MỤC CÁC BẢNG Trang Bảng 1.1 Phân tích phương sai hai nhân tố .......................................................... 15 Bảng 1.2 Phân tích phương sai ba nhân tố ........................................................... 26 Bảng 2.1 Phân tích phương sai một nhân tố với cỡ mẫu bằng nhau .................... 41 Bảng 2.2 Phân tích phương sai một nhân tố với cỡ mẫu không bằng nhau ......... 42 Bảng 2.3 Phân tích phương sai đa biến hai nhân tố .............................................. 45 Bảng 3.1 Ảnh hưởng của các nhân tố đến điểm thi ............................................. 49 Bảng 3.2 Ảnh hưởng tương tác giữa các nhân tố đến điểm thi ............................ 50 Bảng 3.3 Ảnh hưởng của trình độ Ngoại Ngữ và Tin học đến việc làm .............. 54 Bảng 3.4 Ảnh hưởng của nhân tố khóa học, ngành học, xếp loại, giới tính đến việc làm ................................................................................................................. 55 Bảng 3.5 Ảnh hưởng của các nhân tố đến kết quả toàn khóa ............................... 58 Bảng 3.6 Ảnh hưởng tương tác giữa các nhân tố đến kết quả toàn khóa ............. 59 1 DANH MỤC CÁC HÌNH Trang Hình 3.1 Biểu đồ cơ cấu mẫu sinh viên theo khu vực của thí sinh ...................... 48 Hình 3.2 Biểu đồ cơ cấu mẫu sinh viên theo giới tính của thí sinh ...................... 48 Hình 3.3 Biểu đồ cơ cấu sinh viên theo ngành học .............................................. 52 Hình 3.4 Biểu đồ cơ cấu sinh viên theo khóa học ................................................ 52 Hình 3.5 Biểu đồ cơ cấu sinh viên theo giới tính ................................................. 52 Hình 3.6 Biểu đồ cơ cấu sinh viên theo trình độ Ngoại Ngữ ............................... 53 Hình 3.7 Biểu đồ cơ cấu sinh viên theo trình độ Tin học ..................................... 53 Hình 3.8 Biểu đồ cơ cấu sinh viên theo xếp loại học lực ..................................... 53 Hình 3.9 Biểu đồ cơ cấu mẫu sinh viên k36 theo giới tính .................................. 57 Hình 3.10 Biểu đồ cơ cấu mẫu sinh viên k36 theo ngành học ............................. 57 2 PHẦN MỞ ĐẦU 1. Lý do chọn đề tài Phân tích phương sai là một trong những bài toán kiểm định quan trọng bậc nhất trong thống kê. Nó được áp dụng trong nhiều lĩnh vực khác nhau của thực tế: kinh tế, y học, xã hội….Phân tích phương sai thật chất là bài toán so sánh các trung bình. Phân tích phương sai đơn biến là kiểm tra sự khác biệt trung bình giữa các nhóm. Phân tích phương sai đa biến là kiểm tra sự khác biệt của các vectơ trung bình. Ở nước ta, phân tích phương sai đơn biến cho các trương hợp khác nhau đã được áp dụng phổ biến trong thực nghiệm của các ngành y học, nông nghiệp, kinh tế, xã hội,…Tuy nhiên phân tích phương sai đa biến hầu như chưa được quan tâm. Nhiều yêu cầu trong thực nghiệm đòi hỏi chúng ta phải thực hiện phân tích phương sai đa biến mới đáp ứng được mục đích nghiên cứu. Chính vì những lý do trên là sinh viên ngành Toán ứng dụng, được trang bị kiến thức thống kê nên em chọn đề tài “Phân tích phương sai và ứng dụng” làm luận văn tốt nghiệp của mình. 2. Mục tiêu nghiên cứu - Tổng kết lý thuyết về phân tích phương sai đơn biến (ANOVA) và đa biến (MANOVA). - Áp dụng phân tích phương sai đa biến trong các số liệu thực tế. 3. Phƣơng pháp nghiên cứu - Phân tích, tổng hợp và hệ thống hóa các tài liệu liên quan đến lý thuyết phân tích phương sai đa biến. - Sử dụng phần mềm thống kê SPSS để giải quyết những ứng dụng cụ thể trong thực tế. 4. Đối tƣợng và phạm vi nghiên cứu - Đối tượng nghiên cứu: Phương pháp phân tích phương sai đa biến và vấn đề tính toán trong các phương pháp đó. - Phạm vi nghiên cứu: Phân tích phương sai đa biến một nhân tố và hai nhân tố, các số liệu thứ cấp thu được liên quan đến giáo dục. 5. Nội dung nghiên cứu Luận văn được cấu trúc gồm có phần mở đầu, phần nội dung, nhận xét và tài liệu tham khảo. Phần nội dung gồm có 3 chương: Chương 1: Phân tích phương sai đơn biến (ANOVA) Trình bày mô hình phân tích phương sai đơn biến một nhân tố, hai nhân tố và ba nhân tố. Chương 2: Phân tích phương sai đa biến (MANOVA) 3 Trình bày mô hình phân tích phương sai đa biến một nhân tố và hai nhân tố. Chương 3: Một số ứng dụng trong giáo dục Trình bày ba bài toán liên quan đến giáo dục từ số liệu tuyển sinh ngành toán ứng dụng K40, kết quả khảo sát ý kiến cựu sinh viên Khoa Khoa học Tự nhiên và điểm học tập của K36 Khoa Khoa học Tự nhiên. 4 Chƣơng 1 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN 1.1 Kiểm định về phƣơng sai 1.1.1 Kiểm định phƣơng sai a) Bài toán   2 Giả sử biến ngẫu nhiên X có phân phối chuẩn N a, với phương sai là V  X    2 chưa biết. Từ tổng thể của biến ngẫu nhiên X ta chọn một mẫu gồm n phần tử  x1 , x2 ,..., xn  và với mức ý nghĩa  cho trước, chúng ta  2   02  cần kết luận giả thiết H 0 :  2   02 hay một trong các đối thiết H1 :  2   02 là  2   2 0  đúng. b) Các bƣớc thực hiện 1 2  Chọn thống kê:  2  2  n  1 S 2 . Nếu giả thiết H 0 đúng thì  0 sẽ có phân phối  n21 .  Từ yêu cầu bài toán chọn giả thiết và đối thiết thích hợp.  Với mức ý nghĩa  cho trước, ta có miền bác bỏ Nếu H1 :  2   02 thì W    n21,1 ,   . Nếu H1 :  2   02 thì W   ,  n21,  . Nếu H1 :  2   02 thì    . W   ,  2      2  ,   n 1, 2    n 1,1 2   Với mẫu cụ thể  x1 , x2 ,..., xn  ta tìm được giá trị quan sát 2  qs   n  1 s 2  02  Trả lời: Nếu  qs2  W thì ta bác bỏ giả thiết, chấp nhận đối thiết, ngược lại ta sẽ chấp nhận giả thiết bác bỏ đối thiết. 5 1.1.2 So sánh hai phƣơng sai a) Bài toán Giả sử hai biến X và Y độc lập, cùng có luật phân phối chuẩn X  a ,  ,Y  a ,  trong đó hai tham số phương sai  x 2 x y 2 y 2 x 2 và  y chưa 2 2 2 2 biết. Xét giả thiết H 0 :  x   y và đối thiết H1 :  x   y . Cho trước một mức ý nghĩa  và với mẫu cụ thể chọn ra trước từ hai mẫu tổng thể của biến ngẫu nhiên X và Y , ta cần kiểm tra giả thiết H 0 là đúng hay đối thiết H1 là đúng. b) Các bƣớc thực hiện  Lập mẫu ngẫu nhiên Wx   X1 , X 2 ,..., X nx  , Wy   X1 , X 2 ,..., X ny  đối với X và Y . Chọn thống kê S x2 /  x2 F 2 S y /  y2 2 2 Trong đó S x , S y lần lượt là thống kê nhận giá trị bằng phương sai mẫu điều chỉnh của biến ngẫu nhiên X và Y . Nếu giả thiết H 0 đúng thì F sẽ có luật phân phối Fisher với bậc tự do n x  1, ny  1 .  Miền bác bỏ được thành lập theo dạng F  W  F1  nx  1, ny  1 ,     Với mẫu cụ thể w x   x1 , x2 ,..., xnx  , w y  x1 , x2 ,..., xny  ta tính được sx , s y là hai phương sai mẫu của hai biến ngẫu nhiên X và Y , khi đó sx2 tính được giá trị quan sát thực tế của thống kê F là F0  2 . sy 1.1.3 So sánh nhiều phƣơng sai Khi phân tích phương sai một nhân tố, ta phải có điều kiện phương sai của các nhân tố khác nhau không có ý nghĩa. Do đó ta phải kiểm định sự bằng nhau các phương sai của nhân tố trước khi thực hiện bài toán phân tích phương sai. Giả sử có k tổng thể có phương sai lần lượt là  i2 , i  1, 2,..., k chưa biết. Chọn mẫu gồm ni phần tử cho tổng thể thứ i . Với mức ý nghĩa  , ta cần kiểm tra phương sai của các tổng thể có bằng nhau không. Có nhiều phương pháp thực hiện kiểm định này như phương pháp Bartlett, Cochran, Levene,... Luận văn này tôi trình bày phương pháp Levene, một phương pháp được thực 6 hiện đơn giản và phổ biến. Các bước thực hiện kiểm định bằng phương pháp này giống như trường hợp tổng quát của bài toán kiểm định giả thiết thống kê, trong đó - Giả thiết H : 12  12  ...   k2 , - Đối thiết H : Không phải tất cả các phương sai đều bằng nhau. Miền bác bỏ: W   H ;k ;df ;   . - Trong đó df  n  1, n phần nguyên của 1 k  ni ; H ;k ;df là phân vị k i 1 Hatley mức xác suất  , bậc tự do  k , df  . Giá trị quan sát hqs  Trong 2 S max . 2 S min 2 2 Smax  max s12 , s22 ,..., sk2  , Smin  s12 , s22 ,..., sk2  đó với si2 , i  1, 2,..., k là phương sai mẫu của tổng thể thứ i . Chú ý: Bài toán phân tích phương sai một nhân tố chỉ thực hiện được khi nó thỏa các yêu cầu sau: - Các nhóm so sánh phải được chọn một cách độc lập và được chọn một cách ngẫu nhiên. - Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn. - Phương sai của các nhóm phải bằng nhau. 1.2 Phân tích phƣơng sai đơn biến một nhân tố 1.2.1 Bài toán Giả sử có m mẫu chuẩn với cỡ mẫu n1 , n2 ,..., nm . Các dữ liệu lấy từ N  n1  n2  ...  nm biến ngẫu nhiên độc lập X ij , j  1,..., n; i  1,..., m và X ij N  i ,  2  . Mẫu gồm m X i1  , X i 2 ,..., X in1 , i  1, m tạo nên bởi một nhân tố A tác động mức A1 , A2 ,..., Am được cho bởi bảng sau: A1 A2 X 11 X 21 X 12 X 22 ... ... X 1n1 X 2 n2 ... ... ... ... ... 7 Am X m1 X m2 ... X mnm Ta cần kiểm tra các mức của A có khác nhau không? 1.2.2 Vấn đề thực hiện Để khảo sát sự ảnh hưởng của nhân tố A , ta xét sự ảnh hưởng của từng mức A1 , A2 ,..., Am . Nếu tác động của từng mức A1 , A2 ,..., Am đến X khác nhau, thì có nghĩa là A có ảnh hưởng tới X . Vì vậy bài toán được đưa về so sánh các trung bình của các quan sát trong từng mức với nhau. Nếu các trung bình này khác nhau thì có nghĩa là A có tác động đến X . Kiểm định giả thiết: H 0 : 1  2  3  ...  m H1 : Có ít nhất một cặp kỳ vọng khác nhau.   X m Xét n1 i 1 j 1 X ij     X n1 m 2 i 1 j 1 m n1  ij     Xi  Xi  X    m n1   2 n1 m     X i  X   X ij  X i  2 X i  X X ij  X i i 1 j 1 n1 m 2  i 1 j 1   X i  X i 1 j 1 m n1    X ij  X i 1 j 1     X m 2 i 1 j 1    n  X  X     X m 2 i 1 i n1 m 2 i n1 i 1 j 1 ij  X i  2 i 1 j 1 ij  X i 2  2 (1.1) Đẳng thức (1.1) được gọi là đẳng thức tổng bình phương. Trong đó 1 Xi  ni n X j 1 ij ; i  1, m là trung bình mẫu thứ i , X 1  X 2  ...  X m 1 m n1 X   X ij là trung bình của m N i 1 j 1 m m mẫu và N   ni . i 1 X ij   N  0,1 là các biến ngẫu nhiên độc  lập. Khi đó áp dụng công thức tổng bình phương cho Z ij , ta nhận được Nếu H 0 đúng, ta có Zij  m n1 m m i 1 i 1   Zij2   ni Z 2   ni Zi  Z i 1 j 1 Đặt 8  2 m n1    Z ij  Z i i 1 j 1 . 2  ni m  SS W   X ij  X i i 1 j 1  m SS B   ni X i  X i 1   2 là tổng bình phương trong mẫu, 2 là tổng bình phương giữa các mẫu. Từ định nghĩa độ tự do ta có n1 m Z i 1 j 1 m 2 ij có độ tự do bằng N ,  ni Z   n1  n2  ...  nm  Z có độ tự do bằng 1, 2 2 i 1 m   ni Zi  Z i 1   m n1 i 1 j 1  2 m m   ni Zi   ni Z có độ tự do bằng m  1, 2 i 1 Zij  Zi  2 1 2 có độ tự do là N  m . Do đó, theo định lý Cochran khi H 0 đúng, ta có   Z m n1 i 1 j 1   m n1 i 1 j 1 i Z  Z ij  Z i 2   2 m 1   2 i 1   X m 1    ni X i  X 2 n1 ij  2 SS B   Xi i 1 j 1   2  m2 1 2  SS W   N2 m . 2 Khi đó SS B F  m 1 SS W N m Fm 1, N  m * Tính chất xác định miền bác bỏ giả thiết H 0 : m  Với SS B   ni X i  X i 1  2 và SS W    m ni i 1 j 1  X ij  X i m ni  SS B  2 i) E      i    m  1 i 1  m 1   SS W  2 ii ) E     N m 1 m Trong đó    i N  m i 1 Chứng minh. 9 m n . i 1 i  2  2 thì  ni m  SS B  2 i) E      i    m  1 i 1  m 1   2 Ta có 2  y n i i 1 Với y  y  y n 2 i i 1  my (1.2) 1 n  yi , từ đó ta có m i 1  m SS B   ni X i  X i 1 Với X  2  2 m   ni X i  NX 2 2 (1.3) i 1 1 m Xi m i 1 Vì X i  2  2  nên E X i  i ; D X i  . N  i ,  ni ni     Mà D X i  E X i2   E X i  ,   2 Nên E X i 2   EXi  2  D X i  i2  2 ni . (1.4) Ta có 1 m X   X i và các X 1 , X 2 ,..., X m là độc lập nhau nên m i 1  1 m ni  2 1 m 1 m E X   E X i   i   ; D X  D   X ij   m i 1 m i 1  N i 1 j 1  N   E X 2    EX 2 2  DX    Từ (1.3), (1.4) và (1.5) ta suy ra m   2 N   E  SS B    ni E X i  NE X i 1 2 10 2 (1.5) m   ni i2 m 2  N    2 2 i 1 m   m  1  2   ni i2  N  2 i 1  m   m  1  2   ni i   i 1  ni  SS B  2  E  i      m  1 i 1  m 1  m . 2 . 2  SS W  2 ii ) E     N m Ta có: m ni  SS W   X ij  X i i 1 j 1 m ni  2 m   X   ni X i i 1 j 1 ni 2 ij 2 i 1    E  SS W    E  X ij2    ni E X i m i 1 j 1 m i 1 2 m ni m  2     i2   2    ni  i2   ni  i 1 j 1 i 1   N 2  m 2   N  m  2  SS W  2 Suy ra E     N m Chú ý: Nếu giả thiết H 0 sai (tức tồn tại tham số i   ), thì trung bình của tử số thống kê F lớn hơn khi H 0 đúng, trong khi đó phân phối của mẫu số luôn không đổi dù H 0 đúng hay sai. Khi đó giả thiết H 0 bị bác bỏ ở mức  nếu m 1, N  m đó, F F  Fm1, N m trong là phân vị Fisher mức  . 1.3 Phân tích phƣơng sai đơn biến hai nhân tố 1.3.1 Bài toán Giả sử hai nhân tố A, B tác động lên các đối tượng. Nhân tố A được phân ra a mức là A1 , A2 ,..., Aa còn nhân tố B được phân làm b mức là 11 B1 , B2 ,..., Bb và mỗi ô  i, j  chịu tác động bởi Ai và B j có số quan sát như nhau và bằng n với các quan sát X ijk , i  1,..., a; j  1,..., b; k  1,..., n, X ij B1 B2 A1 X111... X11n X121... X12 n A2 X 211... X 21n X 221... X 22 n ... ... ... A3 X a11... X a1n X a 21... X a 2 n N  ij ,  2  . ... ... ... ... ... Bb X1b1... X1bn X 2b1... X 2bn ... X ab1... X abn Ta cần kiểm định trung bình tổng thể theo cột, hàng, sự tương tác giữa hàng và cột. 1.3.2 Vấn đề thực hiện Để kiểm tra tính tương tác hàng và cột, ta làm như sau: Đặt 1 b 1 a i   ij ;  j   ij b j 1 a i 1  1 a b 1 a 1 b      ij a  j i ab i 1 j 1 b i 1 i 1  i  i   j  j    ij  ij  i   j   Ta có ij     i   j   ij  E  X ijk   ij     i   j   ij  X ijk     i   j   ij   ijk Trong đó  i sinh ra do Ai tác động,  j sinh ra do B j tác động,  ij sinh ra do sự tác động chung của Ai B j .  ijk sinh ra do tác động của các yếu tố ngẫu nhiên khác. Nó có phân phối chuẩn với kỳ vọng bằng 0 và phương sai  2 . 12 Để biết được các nhân tố A, B có tác dụng đến X không và giữa A, B có sinh ra lực tác dụng có ý nghĩa đến X không, ta đi đến bài toán kiểm định ba giả thiết sau đây: H 0t : 1  ...   a  0, H 0c : 1  ...   b  0, H 0int :  ij  0. Với 1 n X ij   X ijk : Trung bình các phần tử ở hàng i cột j , n k 1 Xi  1 b n  X ijk : Trung bình tất cả các phần tử trên hàng i , bn j 1 k 1 1 a n X j   X ijk : Trung bình tất cả các phần tử trên cột j , an i 1 k 1 1 a b n X   X ijk trung bình tất cả các phần tử. abn i 1 j 1 k 1 Ta viết         X X X ijk  X  X i  X  X j  X  X ij  X i  X j  X  X ijk  X ij  X k j i 2 ijk         X  X i  X  X j  X  X ij  X  X j  i j k ijk   2  X ij  (1.6)  Vì  a  X X i  X   X   X i  a X   0  i 1 j 1 k 1 j 1 k 1  i 1  a b  n  b n  b  X X  X  X X  bX j i  0   i 1 j 1 k 1 i 1 k 1  j 1  a b  n  a n a  a  X X ij  X i  X j  X   X  X ij  X j   X i  X   0  i 1 j 1 k 1 j 1 k 1 i 1  i 1  a b n   b  n    Chứng minh tương tự ta có tổng chéo còn lại bằng 0. Từ (1.6) suy ra đẳng thức tổng bình phương     X ij2k   X   X i  X   X j  X 2 i j k i  j k i j  k 2 i  j  X ij  X i  X j  X   X ijk  X ij i j 2 k i 13 j k  k  2 (1.7) 2 Đặt a  SSr  bn X i  X i 1  b SSc  an X j  X j 1 a b i j   2 2 tổng bình phương hàng, tổng bình phương cột,  SSint  n X ij  X i  X j  X     SSe   X ijk  X ij i j j 2 tổng bình phương tương tác, tổng bình phương sai số, k SST   X ijk  X i 2  2 tổng bình phương tổng cộng. k Đẳng thức (1.7) có thể viết SST  SSr  SSc  SSint  SSe (1.8) Các thành phần trong (1.8) có độ tự do 2 nabX abn  1 độ tự do, a       SSr  bn X i  X i 1 b SSc  an X j  X j 1 2 2  a  1 độ tự do,  b  1 độ tự do, SSe   X ijk  X ij ab  n  1 độ tự do. i j 2 k Kiểm định giả thiết không có tương tác hàng – cột là H 0int ij0i, j. Chú ý: Dưới giả thiết H 0int các biến ngẫu nhiên Zijk  X ijk     i   j  và độc lập. Các biến ngẫu nhiên sau có phân phối N  0,1 Z ij  Zi  Zj  X ij     i   j  X i    i   1 b    j  0  0  b j 1   Xj  j 1 a     0  a  i  0  i 1     14 N  0,1 Z X   Từ đó Z ij  Z i  Z j  Z  Z ijk  Zij  Vì  Z X ij  X i  X j  X  X ijk  X ij  2 nab nên áp dụng đẳng thức tổng bình phương trong 2 ijk (1.7) cho Z ijk , sau đó áp dụng định lý Cochran. Khi H 0int đúng thì SS r  2 SSc  SSint 2 2 SSe  2a 1  2b 1 2b1 a 1 2 ba  n 1  Khi đó, ta có thống kê kiểm định 2 Fr  SSr /  a  1 SSe / ba  n  1 Fint  F a 1,ba n1 , Fc  SSint /  b  1 a  1 SSe / ba  n  1 SSc /  b  1 SSe / ba  n  1 Fb1,ba n1 F a 1b1,ba n1 . Muốn bác bỏ giả thiết H 0 ta dựa vào bảng sau: Nguồn biến động Hàng Bảng 1.1:Phân tích phƣơng sai hai nhân tố MBB với mức Tổng bình Độ tự do F phương ý nghĩa  SSr SS r a 1 a 1 Fr  F ,a1,a1b1 Fr  SSe  a  1 b  1 Cột SSc b 1 Sai số SSe  a 1b 1 SSc b 1 Fc  SSe  a  1 b  1 15 Fc  F ,b1, a1b1 *Tính chất xác định miền bác bỏ giả thiết H 0 Với a   b   2 a SSr  bn X i  X ; SSc  an X j  X i 1 a b 2 j 1   2 b n   SSint  n X ij  X i  X j  X ; SSe   X ijk  X ij . i 1 j 1 i 1 j 1 k 1 Ta có nb a 2  SS  i) E  r    2   i , a  1 i 1  a 1  na b 2  SSc  2 ii) E   i ,    b  1 j 1  b 1  a b   SSnt n 2 iii) E   2j ,       a  1b  1 i1 j 1   a  1 b  1   SSe  2 iv) E     .  ab  n  1  Chứng minh. nb a 2  SS  i) E  r    2   i a  1 i 1  a 1  Ta có a  SSr  bn X i  X i 1  2 a   bn X i  2 X i X  X i 1 2 a 2  a 2  bn   X i  2 X  X i  a X  i 1  i 1  b n   X  ij k  a 2  a 2  bn   X i  2 X  j 1 k 1  aX  bn  i 1  i 1     a  bn X i  2nab X  nab X 2 2 i 1 a  bn X i  nab X . 2 2 i 1 Suy ra 16 2 2  2
- Xem thêm -