Phân tích hiệp phƣơng sai và ứng dụng

  • Số trang: 82 |
  • Loại file: PDF |
  • Lượt xem: 37 |
  • Lượt tải: 0
minhtuan

Đã đăng 15929 tài liệu

Mô tả:

TRƢỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN BỘ MÔN TOÁN ------------ LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC PHÂN TÍCH HIỆP PHƢƠNG SAI VÀ ỨNG DỤNG Giáo viên hƣớng dẫn Sinh viên thực hiện Ts. VÕ VĂN TÀI NGUYỄN THỊ QUỲNH NHƢ Bộ môn Toán-Khoa KHTN Ngành: Toán Ứng Dụng K36 Cần Thơ-12/2013 TRƢỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN BỘ MÔN TOÁN ------------ LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC PHÂN TÍCH HIỆP PHƢƠNG SAI VÀ ỨNG DỤNG Giáo viên hƣớng dẫn Sinh viên thực hiện Ts. VÕ VĂN TÀI NGUYỄN THỊ QUỲNH NHƢ Bộ môn Toán-Khoa KHTN Ngành: Toán Ứng Dụng K36 Cần Thơ-12/2013 MỤC LỤC Trang LỜI CẢM ƠN .......................................................................................... iii DANH MỤC CÁC BẢNG ...................................................................... iv PHẦN MỞ ĐẦU ...................................................................................... 1 Chƣơng 1. PHÂN TÍCH PHƢƠNG SAI .................................................. 3 1.1 GIỚI THIỆU ................................................................................... 3 1.2 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN ...................................... 3 1.2.1 Phân tích phƣơng sai đơn biến một nhân tố ............................. 3 1.2.2 Phân tích phƣơng sai đơn biến hai nhân tố không tƣơng tác .... 5 1.2.3 Phân phƣơng sai đơn biến hai nhân tố tƣơng tác ..................... 8 1.3 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN ....................................... 11 1.3.1 Phân tích phƣơng sai đa biến một nhân tố .............................. 11 1.3.2 Phân tích phƣơng sai đa biến hai nhân tố .............................. 14 Chƣơng 2. PHÂN TÍCH HIỆP PHƢƠNG SAI ...................................... 18 2.1 GIỚI THIỆU ................................................................................ 18 2.2 PHÂN TÍCH HIỆP PHƢƠNG SAI ĐƠN BIẾN .......................... 19 2.2.1 Phân tích hiệp phƣơng sai đơn biến một nhân tố với một biến covariate ......................................................................... 19 2.2.2 Phân tích hiệp phƣơng sai đơn biến hai nhân tố không tƣơng tác và một biến covariate ........................................................ 27 2.2.3 Phân tích hiệp phƣơng sai đơn biến hai nhân tố tƣơng tác và một biến covariate .............................................................. 31 2.3 PHÂN TÍCH HIỆP PHƢƠNG SAI ĐA BIẾN ............................. 41 2.3.1 Phân tích hiệp phƣơng sai đa biến một nhân tố với q biến Covariates ............................................................................... 41 i 2.3.2 Phân tích hiệp phƣơng sai đa biến hai nhân tố ....................... 45 Chƣơng 3. ỨNG DỤNG ......................................................................... 51 3.1 GIỚI THIỆU ................................................................................. 51 3.2 ỨNG DỤNG TRONG NÔNG NGHIỆP ...................................... 52 3.2.1 Bài toán 1 ................................................................................ 52 3.2.2 Giải quyết bài toán 1 ............................................................... 52 3.3 ỨNG DỤNG TRONG KINH TẾ ................................................. 54 3.3.1 Bài toán 2 ................................................................................ 54 3.3.2 Giải quyết bài toán 2 ............................................................... 54 3.4 ỨNG DỤNG TRONG Y HỌC ..................................................... 56 3.4.1 Bài toán 3 ................................................................................ 56 3.4.2 Giải quyết bài toán 3 ............................................................... 57 3.5 ỨNG DỤNG TRONG GIÁO DỤC .............................................. 59 3.5.1 Bài toán 4 ................................................................................ 59 3.5.2 Giải quyết bài toán 4 ............................................................... 59 KẾT LUẬN VÀ ĐỊNH HƢỚNG NGHIÊN CỨU ................................. 63 TÀI LIỆU THAM KHẢO ...................................................................... 64 PHỤ LỤC ............................................................................................... 65 ii LỜI CẢM ƠN ---------- Qua thời gian dài học tập tại trƣờng Đại học Cần Thơ, Em đã đƣợc trang bị những kiến thức bổ ích và quý báu từ quý Thầy Cô và bạn bè. Em xin bầy tỏ lòng biết ơn và kính trọng nhất đến thầy Võ Văn Tài, ngƣời đã trực tiếp hƣớng dẫn, chỉ bảo và động viên Em trong suốt quá trình thực hiện đề tài. Bên cạnh đó, Em xin gởi lời cảm ơn đến toàn thể quý Thầy Cô của bộ môn Toán-Khoa Khoa học Tự nhiên. Em xin gởi lời cảm ơn đến thầy Trần Phƣớc Lộc, Cố vấn học tập và các bạn sinh viên ngành Toán Ứng dụng đã trợ giúp rất nhiều trong việc hoàn thành đề tài này. Em xin cảm ơn hội đồng bảo vệ luận văn đã xem xét và điều chỉnh những sai sót cũng nhƣ đóng góp ý kiến về những mặt còn hạn chế để đề tài đƣợc hoàn thiện hơn. Dù đã có nhiều cố gắng cùng với sự hƣớng dẫn tận tình của Thầy hƣớng dẫn, song do trình độ còn hạn chế nên khó tránh khỏi sai sót. Rất mong nhận đƣợc sự thông cảm và góp ý từ Thầy Cô và các bạn. Cần Thơ, ngày 2 tháng 12 năm 2013 Nguyễn Thị Quỳnh Nhƣ iii DANH MỤC CÁC BẢNG Trang Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố ........................... 4 Bảng 1.2 Bảng tóm tắt phân tích ANOVA một nhân tố ........................... 5 Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không tƣơng tác .................................................................................... 6 Bảng 1.4 Bảng tóm tắt phân tích ANOVA hai nhân tố không tƣơng tác .................................................................................... 8 Bảng 1.5 Bảng dữ liệu phân tích ANOVA hai nhân tố tƣơng tác ............ 8 Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tƣơng tác .......... 11 Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố ..................... 12 Bảng 1.8 Bảng tóm tắt phân tích MANOVA một nhân tố ..................... 14 Bảng 1.9 Bảng dữ liệu phân tích MANOVA hai nhân tố ....................... 15 Bảng 1.10 Bảng tóm tắt kết quả phân tích MANOVA hai nhân tố ........ 17 Bảng 2.1 Bảng dữ liệu phân tích ANCOVA một nhân tố ...................... 19 Bảng 2.2 Chiều cao và cân nặng trẻ em đƣợc phân theo giới tính ......... 24 Bảng 2.3 Bảng số liệu phân tích ANCOVA hai nhân tố không tƣơng tác .................................................................................. 27 Bảng 2.4 Bảng số liệu phân tích ANCOVA hai nhân tố tƣơng tác ........ 31 Bảng 2.5 Bảng số liệu về năng suất lúa .................................................. 37 Bảng 2.6 Bảng dữ liệu phân tích MANCOVA hai nhân tố .................... 45 Bảng 3.1 Bảng kiểm định giá trị phƣơng sai sai số ................................ 52 Bảng 3.2 Bảng kiểm định giả thiết H 01 , H 02 trong ANCOVA ............... 52 Bảng 3.3 Bảng kiểm định H 03 sự tƣơng tác giữa nhân tố và biến Covariate ................................................................................. 53 Bảng 3.4 Bảng kiểm định giả thiết trong phân tích ANOVA................. 53 iv Bảng 3.5 Bảng kiểm định bằng nhau của ma trận hiệp phƣơng sai ....... 54 Bảng 3.6 Bảng kiểm định giả thiết phân tích MANCOVA một nhân tố ..................................................................................... 54 Bảng 3.7 Bảng kiểm định của nhân tố với biến x1 .................................. 55 Bảng 3.8 Bảng kiểm định của nhân tố với biến x2 .................................. 56 Bảng 3.9 Bảng kiểm định phƣơng sai sai số ........................................... 57 Bảng 3.10 Bảng kiểm định giả thiết H 01 , H 02 trong phân tích MANCOVA ........................................................................... 57 Bảng 3.11 Bảng kiểm định ảnh hƣởng tƣơng tác giữa nhóm và x1 ........ 58 Bảng 3.12 Bảng kiểm định ảnh hƣởng tƣơng tác giữa nhóm và x2 ........ 58 Bảng 3.13 Bảng kiểm định sự bằng nhau của ma trận hiệp phƣơng sai . 60 Bảng 3.14 Bảng kiểm định các giả thiết thống kê MANCOVA ............ 60 Bảng 3.15 Bảng kiểm định sự tƣơng tác giữa giới tính và độ tuổi ......... 61 Bảng 3.16 Bảng kiểm định sự tƣơng tác giữa năm và độ tuổi ............... 61 Bảng 3.17 Bảng kiểm định tƣơng tác giữa nhân tố năm, giới tính và tuổi .................................................................................... 62 v PHẦN MỞ ĐẦU GIỚI THIỆU Trong phân tích và xử lý số liệu, ta thƣờng quan tâm đến mô hình phân tích hồi qui và phân tích phƣơng sai. Trong đó phân tích phƣơng sai đƣợc xem nhƣ một công cụ để thực hiện việc so sánh trung bình của hai hay nhiều tổng thể dựa trên giá trị trung bình của mẫu quan sát. Các tính toán trong phân tích phƣơng sai liên quan đến sự phân chia tổng phƣơng sai tổng thể thành các thành phần phƣơng sai bên trong nhóm và phƣơng sai giữa các nhóm. Thành phần bên trong nhóm cho ta ƣớc lƣợng phƣơng sai sai số, trong khi các thành phần giữa các nhóm ƣớc lƣợng phƣơng sai do ảnh hƣởng của các nhân tố đang xét. Tỷ số phƣơng sai giữa các nhóm với phƣơng sai bên trong nhóm cho ta một kiểm nghiệm đối với giả thiết cho rằng tất cả các trung bình đều bằng nhau. Trái lại, phân tích hồi qui chủ yếu đƣợc sử dụng để tìm mối quan hệ giữa các biến, chúng ta có thể ƣớc lƣợng hình thức mối quan hệ giữa một biến đáp ứng và một biến độc lập. Phân tích hiệp phƣơng sai là sự kết hợp cả hai phƣơng pháp trên. Phƣơng pháp này đƣợc R.A.Fisher sử dụng lần đầu tiên trong bài báo nghiên cứu (1932), Ông xem đây là một kỹ thuật “kết hợp những ƣu điểm và dung hòa các yêu cầu của hai phƣơng thức đƣợc áp dụng rộng rãi và đƣợc biết dƣới tên là hồi qui và phân tích phƣơng sai”. Phân tích hiệp phƣơng sai là một hƣớng nghiên cứu mới trong nhiều lĩnh vực do nó là sự mở rộng của mô hình phân tích phƣơng sai. Mục tiêu chính của phân tích hiệp phƣơng sai là đạt đƣợc độ chính xác bởi giảm tổng bình phƣơng sai số và mục tiêu thứ hai là giảm tác động của các nhân tố mà ngƣời thực hiện thí nghiệm không kiểm soát đƣợc. Từ đó, việc nghiên cứu ảnh hƣởng của các nhân tố đến biến đáp ứng chính xác hơn. I. BỐ CỤC LUẬN VĂN Bố cục luận văn gồm phần mở đầu, phần nội dung, phần kết luận, phần tài liệu tham khảo và phần phụ lục. Phần nội dung luận văn gồm 3 chƣơng: II. Chương 1. Phân Tích Phương Sai Trình bày một số mô hình phân tích phƣơng sai thông dụng nhƣ phân tích phƣơng sai một nhân tố, phân tích phƣơng sai hai nhân tố,… Đây cũng là cở sở cho việc hình thành phƣơng pháp phân tích hiệp phƣơng sai. 1 Chương 2. Phân tích hiệp phương sai Trình bày cở sở lý thuyết của các mô hình phân tích hiệp phƣơng sai nhƣ phân tích hiệp phƣơng sai đơn biến, phân tích hiệp phƣơng sai đa biến,… Bên cạnh đó còn trình bày một vài ví dụ đƣợc thực hiện thủ công dựa trên cở sở lý thuyết đã trình bày. Chương 3. Ứng dụng Dựa vào những mô hình đã phân tích ở chƣơng 2, chƣơng này đƣa ra một số ứng dụng của phân tích hiệp phƣơng sai dựa trên số liệu thực tế trong các lĩnh vực nhƣ giáo dục, nông nghiệp, y học và kinh tế. 2 Chƣơng 1 PHÂN TÍCH PHƢƠNG SAI 1.1 GIỚI THIỆU Giả sử chúng ta cần nghiên cứu, phân tích sự biến động của một tổng thể thông qua một biến ngẫu nhiên (chỉ tiêu nghiên cứu). Thông thƣờng chúng ta có các bài toán ƣớc lƣợng, kiểm định giả thiết về giá trị tham số và quy luật phân phối xác suất của biến ngẫu nhiên, tuy nhiên phƣơng pháp kiểm định, so sánh tham số đó chỉ sử dụng đƣợc khi sự biến động của biến ngẫu nhiên đó chỉ chịu tác động của một nhân tố và cũng ở một hoặc tối đa hai mức cố định. Nếu biến đó đƣợc tạo nên do nhiều nhân tố cùng tác động hoặc do nhiều nhân tố nhƣng ở mức tác động khác nhau thì phải tiến hành phân tích phƣơng sai mới thấy đƣợc vai trò ảnh hƣởng của từng mức nhân tố (nếu có) trong việc tạo nên sự biến đổi, sự sai khác đó. Nhân tố đƣợc hiểu là các yếu tố, điều kiện khách quan (thời tiết, khí hậu, thiên tai,…) hoặc chủ quan (phƣơng pháp thí nghiệm, giống cây trồng,…) có tác động trực tiếp đến sự biến động của biến ngẫu nhiên mà ta nghiên cứu. Quan điểm của phân tích phƣơng sai là việc khai triển phƣơng sai của biến ngẫu nhiên (X) thành tổng của những phƣơng sai của những biến ngẫu nhiên thành phần độc lập, mà mỗi cái trong chúng đặc trƣng cho sự ảnh hƣởng của yếu tố này hay yếu tố khác hoặc tác dụng chung giữa chúng. So sánh những phƣơng sai này cho phép ta đánh giá sự tồn tại ảnh hƣởng của các yếu tố đó với biến ngẫu nhiên (X) đang xét. 1.2 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN 1.2.1 Phân tích phƣơng sai đơn biến một nhân tố Phân tích phƣơng sai đơn biến một nhân tố đƣợc dùng để kiểm định giả thiết các tổng thể nhóm (tổng thể bộ phận) có giá trị trung bình bằng nhau. Kỹ thuật này dựa trên cơ sở tính toán mức độ biến thiên trong nội bộ các nhóm và biến thiên giữa các trung bình nhóm. Dựa trên hai ƣớc lƣợng này của mức độ biến thiên ta có thể rút ra kết luận về mức độ khác nhau giữa các trung bình nhóm. Hay nói cách khác ta phân tích ảnh hƣởng của một nhân tố nguyên nhân đến một nhân tố kết quả. 3 a) Mô hình Giả sử xét mẫu ngẫu nhiên đƣợc tạo bởi một yếu tố A tác động gồm m mức đƣợc cho bởi bảng sau: Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố STT quan sát A1 A2 A3 … Am 1 X 11 X 21 X 13 … X 1m 2 X 21 X 22 X 23 … X 2m 3 … ni X 31 … X n11 X 23 … X n2 2 X 33 … X n3 3 … … … X 3m … Xnmm Giả thiết rằng các quan sát X ij ( i  1,..., n j ; j  1, m ) có phân phối chuẩn N ( , 2 ) . Ứng với mỗi mức nhân tố i ta có biến ngẫu nhiên X i và chúng cũng tuân theo quy luật phân phối chuẩn. Khi đó mô hình phân tích ANOVA một nhân tố có dạng: X ij   +i   ij Trong đó X ij là biến đáp ứng,  là trung bình tất cả các X ij ,  i là mức tác động thứ i của nhân tố A,  ij là phần dƣ. b) Các bƣớc thực hiện * Chọn giả thiết và đối thiết: H 0 : 1  2  ...  m   H1 : Có ít nhất một cặp kỳ vọng khác nhau * Tính các tham số đặc trưng: 1 n X i   X ij : Trung bình mẫu thứ i, ni j 1 i ni m X ..   X i 1 j 1 m n : Trung bình tất cả các X ij . i i 1 m ij ni SST   ( X ij  X .. )2 : Tổng bình phƣơng chung, phản ánh biến thiên của i 1 j i biến đáp ứng do chịu ảnh hƣởng của tất cả các nhân tố. 4 m SSB   ni ( X i  X .. )2 : Tổng bình phƣơng giữa các mẫu, phản ánh biến i 1 thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố đang nghiên cứu. m ni SSE   ( X ij  X i )2 : Tổng bình phƣơng trong nội bộ mẫu, phản ánh biến i 1 j 1 thiên của biến đáp ứng do chịu ảnh hƣởng của các nhân tố không nghiên cứu. Khi đó SST  SSB  SSE . SSB MSFB * Giá trị quan sát: F   m 1 SSE MSE N m Trong đó SSB , với n-1 là bậc tự do của nhân tố, MSFB  n 1 SSE MSE  , với N-m là bậc tự do của sai số. N m * Trả lời: Bác bỏ giả thiết H 0 nếu F  F ( m1, N m) . Trong đó F ( m1, N m) là phân vị Fisher với mức ý nghĩa  và bậc tự do  m  1, N  m  . Bảng 1.2 Bảng tóm tắt phân tích ANOVA một nhân tố Nguồn biến động Tổng bình phƣơng Giữa các mẫu (nhân tố) SSB   ni ( X i  X .. )2 Trong nội bộ mẫu (sai số) SSE   ( X ij  X i )2 Bậc tự do Trung bình bình phƣơng m-1 MSFB N-m MSE Giá trị quan sát m i 1 m ni i 1 j 1 SSB MSFB F  n 1 SSE MSE N m  Chú ý: Để thực hiện được phân tích phương sai một nhân tố, ta cần quan tâm một số điều kiện sau: +  ij có phân phối chuẩn N (  , 2 ) , + Các nhóm so sánh phải đƣợc đƣợc chọn một cách ngẫu nhiên và độc lập, + Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu đủ lớn, + Phƣơng sai các nhóm so sánh phải đồng nhất. 5 1.2.2 Phân tích phƣơng sai đơn biến hai nhân tố không tƣơng tác Phƣơng pháp phân tích phƣơng sai hai nhân tố là phƣơng pháp ƣớc tính sự ảnh hƣởng của hai nhân tố thay vì một nhân tố nhƣ trƣớc đó. a) Mô hình Giả sử ta có biến ngẫu nhiên X ij có phân phối chuẩn chịu sự ảnh hƣởng của nhân tố A có m mức ( i  1, m ) và nhân tố C có n mức ( j  1, n ). Cụ thể ta có bảng số liệu sau: Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không tƣơng tác Nhân tố C C2 C1 … Nhân tố A X 11 A1 X 12 … A2 X 21 X 22 … … Am … X m1 … X m2 … … Cn X 1n X 2n … X mn Giả thiết rằng A và C cùng tác động lên X nhƣng theo một cách riêng rẽ. Ta có mô hình ANOVA 2 nhân tố không tƣơng tác nhƣ sau: X ij    ij  ij   ij Trong đó X ij là biến đáp ứng,  là trung bình của tất cả các giá trị X ij ,  ij là mức tác động thứ i của nhân tố A,  ij là mức tác động thứ j của nhân tố B,  ij là phần dƣ và  ij ~ N (0, 2 ) . b) Các bƣớc thực hiện * Chọn giả thiết và đối thiết: H 0A : 1   2  ...   m   ; H1A :  i   H 0C : 1   2  ...   n   ; H1C :  j   * Tính các tham số đặc trưng: Ta đặt 1 n X i.   X ij : Trung bình hàng thứ i, n j 1 X. j  1 m  X ij : Trung bình cột thứ j, m i 1 6 X ..  1 m 1 n 1 n m X  X   i. n   X ij : Trung bình tất cả số liệu. .j m i 1 n.m j 1 i 1 j 1 m n SST   ( X ij  X .. )2 : Tổng bình phƣơng chung, SST phản ánh biến thiên i 1 j i của biến đáp ứng do chịu ảnh hƣởng của tất cả các nhân tố. m n m SSA   ( X i.  X .. )2  n ( X i.  X .. )2 : Tổng bình phƣơng giữa các hàng. i 1 j 1 i 1 SSA phản ánh biến thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố A. m n n SSC   ( X . j  X .. )2  m ( X . j  X .. )2 : Tổng bình phƣơng giữa các cột. i 1 j 1 j 1 SSC phản ánh biến thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố C. m n SSE   ( X ij  X i.  X . j  X .. )2 : Sai số ngẫu nhiên. SSE phản ánh biến i 1 j 1 thiên của biến đáp ứng do chịu ảnh hƣởng của các nhân tố không nghiên cứu. Khi đó SST  SSA  SSC  SSE . MSFA m 1 * Giá trị quan sát cho H 0A là FA  MSE (m  1)(n  1) MSFC n 1 * Giá trị quan sát cho H 0C là FC  MSE (m  1)(n  1) Trong đó SSA , với (m  1) là bậc tự do của A, m 1 SSC MSFC  , với (n  1) là bậc tự do của C, n 1 SSE MSE  , với (m  1)(n  1) là bậc tự do của sai số. (m  1)(n  1) MSFA  * Trả lời: Bác bỏ giả thiết H 0A nếu FA  F Trong đó F  m 1),( m 1)( n 1 ( m1),( m1)( n 1) . là phân vị Fisher với mức ý nghĩa  và bậc tự do (m  1),(m  1)(n  1) . Bác bỏ giả thiết H 0C nếu FC  F ( n 1),( m 1)( n 1) 7 . Trong đó F( n1),( m1)( n1) là phân vị Fisher với bậc tự do  và bậc tự do (n  1),(m  1)(n  1) . Bảng 1.4 Bảng tóm tắt phân tích ANOVA hai nhân tố không tƣơng tác Nguồn Tổng bình phƣơng Bậc tự do Giá trị quan sát biến động MSFA m Nhân tố m 1 FA  SSA  n ( X i.  X .. )2 m-1 MSE hàng (A) i 1 (m  1)(n  1) MSFC n Nhân tố n 1 FC  SSC  m ( X . j  X .. )2 n-1 MSE cột (C) j 1 (m  1)(n  1) m n SSE   ( X ij  X i.  X . j  X .. )2 Sai số i 1 j 1 m ni SST   ( X ij  X .. )2 Tổng (m-1)(n-1) N-1 i 1 j i 1.2.3 Phân tích phƣơng sai đơn biến hai nhân tố tƣơng tác a) Mô hình Giả sử có hai yếu tố A, C tác động. Yếu tố A có m mức tác động, yếu tố C có n mức tác động và giả sử mỗi ô (i,j) chịu tác động bởi AC i j có số quan sát nhƣ   nhau. Với X ijk i  1, m; j  1, n; k  1, l là quan sát thứ k trên hàng i và cột j. Giả sử các X ijk có phân phối chuẩn N (  , 2 ) , kỳ vọng EXijk   , DX ijk   2 . Ta có bảng dữ liệu sau: Bảng 1.5 Bảng dữ liệu phân tích ANOVA hai nhân tố tƣơng tác Nhân tố C C2 C1 … Nhân tố A X121... X12l A1 X111... X11l … A2 X 211... X 21l X 221... X 22l … … Am … X m11... X m1l … X m 21... X m 2l … … Mô hình phân tích ANOVA hai nhân tố tƣơng tác có dạng: X ij    i   j   ij   ij Trong đó 8 Cn X1n1... X1nl X 2 n1... X 2 nl … X mn1... X mnl X ij là biến đáp ứng,  là trung bình của tác cả các giá trị của X ij ,  i là mức tác động thứ i của nhân tố A,  j là mức tác động thứ j của nhân tố C,  ij là mức tác động thức ij của nhân tố tƣơng tác AC,  ij là phần dƣ và  ij ~ N (0,  2 ) . Để kiểm tra sự tƣơng tác giữa hai nhân tố, ta đặt: ij .  EXij : Trung bình của AC i j, i..  1 n  ij . : Trung bình của Ai , n j 1 . j .  1 m  ij. : Trung bình của Ci , m i 1  1 m 1 n   . j . : Trung bình của biến đáp ứng đang nghiên cứu,  i.. n  m i 1 j 1 i  i..   : Ảnh hƣởng của nhân tố hàng, i  . j .   : Ảnh hƣởng của nhân tố cột,  ij  ij.  [  (i..   )  (. j.   )] : Tƣơng tác giữa hàng i và cột j. Khi đó ij .  i   j   ij   và X ijk ~ N (i   j   ij   , 2 ) . b) Các bƣớc thực hiện * Chọn giả thiết và đối thiết: H 0A : 1   2  ...   m  0; H1A : i  0 H 0C : 1  2  ...  n  0; H1C :  j  0 H 0AC :  ij  0; H1AC :  ij  0 * Tính các tham số đặc trưng: 1 l X ij .   X ijk : Trung bình các phần tử ở hàng i cột j, l i 1 1 n l X i ..   X ijk : Trung bình tất cả các phần tử ở hàng i, n.l j 1 k 1 1 m l X . j.   X ijk : Trung bình tất cả các phần tử tử cột j, m.l i 1 k 1 9 1 m n l  X ijk : Trung bình tất cả các phần tử. m.n.l i 1 j 1 i 1 X ...   Chú ý: X i..  X ... : Ƣớc lƣợng của  i . X . j .  X ... : Ƣớc lƣợng của  j . X ij .  X i.  X . j .  X ... : Ƣớc lƣợng của  ij . m n l SST   ( X ijk  X ... )2 : Tổng bình phƣơng chung, i 1 j 1 i 1 m n l m SSA   ( X i..  X ... )2  nl  ( X i..  X ... )2 : Tổng bình phƣơng giữa các hàng, i 1 j 1 i 1 m n i 1 l n SSC   ( X . j .  X ... )2  ml  ( X i..  X ... )2 : Tổng bình phƣơng giữa các cột, i 1 j 1 i 1 m n j 1 l m n SSAC   ( X ij .  X i..  X . j .  X ... )2  l  ( X ij .  X i..  X . j .  X ... ) 2 : Tổng i 1 j 1 i 1 i 1 j 1 bình phƣơng tƣơng tác, m n l SSE   ( X ijk  X ij . )2 : Tổng bình phƣơng sai số. i 1 j 1 i 1 Khi đó SST  SSA  SSA  SSAE  SSE . SSA (m  1) * Giá trị quan sát cho H 0A là FA  SSE mn(l  1) SSC (n  1) * Giá trị quan sát cho H 0C là FC  SSE mn(l  1) SSAC (m  1)(n  1) * Giá trị quan sát cho H 0AC là FAC  SSE mn(l  1) Trong đó MSFA  SSA , (m  1) : Bậc tự do của A, m 1 10 SSC , (n  1) : Bậc tự do của C, n 1 SSE , m.n(l  1) : Bậc tự do của sai số, MSE  m.n(l  1) MSFC  MSFAC  SSAC , (m  1)(n  1) : Bậc tự do của AC. (m  1)(n  1) *Trả lời: Bác bỏ giả thiết H 0A và H 0C nếu FA  F Trong đó F ( m 1)( mn ( l 1) và F ( n 1),( mn ( l 1) ( m1)( mn ( l 1) và FC  F ( n 1),( mn ( l 1) . có phân vị Fisher với mức ý nghĩa  và bậc tự do lần lƣợt là (m  1), mn(l  1) và (n  1), mn(l  1) . Bác bỏ giả thiết H 0AC nếu FAC  F Trong đó F ( m 1)( n 1), mn ( l 1) ( m 1)( n 1), mn ( l 1) . có phân vị Fisher với mức ý nghĩa  và bậc tự do (m  1)(n  1), mn(l  1) . Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tƣơng tác Nguồn biến động Tổng bình phƣơng Độ tự do Giá trị quan sát F SSA (m  1) FA  Nhân tố A SSA m-1 SSE mn(l  1) SSC (n  1) FC  Nhân tố C SSC n-1 SSE mn(l  1) SSAC (m  1)(n  1) Nhân tố AC SSAC (m-1)(n-1) FAC  SSE mn(l  1) 1.3 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN (MANOVA) 1.3.1 Phân tích phƣơng sai đa biến một nhân tố Phân tích phƣơng sai đa biến một nhân tố là phân tích ảnh hƣởng của một nhân tố nguyên nhân đến nhiều yếu tố kết quả. 11 a) Mô hình Giả sử có m mẫu ngẫu nhiên với cỡ mẫu tƣơng ứng là n1 , n2 ,..., nm và các dữ m liệu lấy từ N   ni biến ngẫu nhiên độc lập. Trong đó X ij ~ N p ( i , ) , i 1 (i  1, m; j  1, ni ) . Ta có bảng dữ liệu sau: Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố Mẫu 1 Mẫu 2 … Mẫu m X 111 , X 112 ,... X 11 p X 211 , X 212 ,... X 21 p … X m11 , X m12 ,... X m1 p X 121 , X 122 ,... X 11 p X 221 , X 222 ,... X 22 p … X m 21 , X m 22 ,... X m 2 p … … … … X 1n 1 , X 1n 2 ,... X 1n p 1 1 1 X 2 n 1 , X 2 n 2 ,... X 2 n p 2 2 2 … X mn 1 , X mn 2 ,... X mn m m mp Mô hình phân tích MANOVA một nhân tố có dạng: X ij    i   ij Trong đó mỗi quan sát X ij là một véc tơ ngẫu nhiên p chiều, có cùng  là ma trận hiệp phƣơng sai. Cụ thể X ij có dạng:  X ij1    X ij2   ,   Cov( X ij , X ijT )  E[X ij  EX ij ][X ij  EX ij ]T , X ij   ...    X   ijp   1    2     : Véc tơ trung bình của tất cả các véc tơ X ij ,  ...     p    i1    i2  i    : Mức tác động thứ i của nhân tố đang xét,  ...      ip   ij : Sai số ngẫu nhiên. 12 b) Các bƣớc thực hiện * Chọn giả thiết và đối thiết: H 0 : 1  2  ...  m   H 1 : i   Cụ thể  m1   11   21      12   22  m 2    H0 :   ...   ...   ...   ...         1 p   2 p   mp  * Tính các tham số đặt trưng: X i.  1 n  X ij : Trung bình mẫu thứ i, ni j 1 i 1 m n X  X 2.  ...  X m. X ..   X ij  1. : Trung bình tất cả số liệu. N i 1 j 1 m i X i . , X .. là các véc tơ ngẫu nhiên p chiều có dạng:  X i.1    X i.2   X i.   , ...    X   i. p  m  X ..1    X ..2   X ..   ...    X   .. p  ni m B   ( X i.  X .. )( X i.  X .. )T   ni ( X i.  X .. )( X i.  X .. )T : Ma trận tổng i 1 j 1 i 1 bình phƣơng và tích chéo giữa các mẫu. Ma trận B có độ tự do m-1. m ni E   ( X ij  X i . )( X ij  X i . )T : Ma trận tổng bình phƣơng và tích chéo i 1 j 1 trong nội bộ mẫu. Ma trận E có độ tự do là N-m. * Giá trị quan sát cho H 0 là   E EB Trong đó E là định thức của ma trận E, E  B là ma trận tổng bình phƣơng và tích chéo chung.  Chú ý: Việc đưa ra thống kê kiểm định giả thiết H 0 trên là dựa vào định lý kiểm định tỷ số hợp lý của thống kê Wilk sau đây: 13
- Xem thêm -