TRƢỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
------------
LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC
PHÂN TÍCH HIỆP PHƢƠNG SAI
VÀ ỨNG DỤNG
Giáo viên hƣớng dẫn
Sinh viên thực hiện
Ts. VÕ VĂN TÀI
NGUYỄN THỊ QUỲNH NHƢ
Bộ môn Toán-Khoa KHTN
Ngành: Toán Ứng Dụng K36
Cần Thơ-12/2013
TRƢỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
------------
LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC
PHÂN TÍCH HIỆP PHƢƠNG SAI
VÀ ỨNG DỤNG
Giáo viên hƣớng dẫn
Sinh viên thực hiện
Ts. VÕ VĂN TÀI
NGUYỄN THỊ QUỲNH NHƢ
Bộ môn Toán-Khoa KHTN
Ngành: Toán Ứng Dụng K36
Cần Thơ-12/2013
MỤC LỤC
Trang
LỜI CẢM ƠN .......................................................................................... iii
DANH MỤC CÁC BẢNG ...................................................................... iv
PHẦN MỞ ĐẦU ...................................................................................... 1
Chƣơng 1. PHÂN TÍCH PHƢƠNG SAI .................................................. 3
1.1 GIỚI THIỆU ................................................................................... 3
1.2 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN ...................................... 3
1.2.1 Phân tích phƣơng sai đơn biến một nhân tố ............................. 3
1.2.2 Phân tích phƣơng sai đơn biến hai nhân tố không tƣơng tác .... 5
1.2.3 Phân phƣơng sai đơn biến hai nhân tố tƣơng tác ..................... 8
1.3 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN ....................................... 11
1.3.1 Phân tích phƣơng sai đa biến một nhân tố .............................. 11
1.3.2 Phân tích phƣơng sai đa biến hai nhân tố .............................. 14
Chƣơng 2. PHÂN TÍCH HIỆP PHƢƠNG SAI ...................................... 18
2.1 GIỚI THIỆU ................................................................................ 18
2.2 PHÂN TÍCH HIỆP PHƢƠNG SAI ĐƠN BIẾN .......................... 19
2.2.1 Phân tích hiệp phƣơng sai đơn biến một nhân tố với một
biến covariate ......................................................................... 19
2.2.2 Phân tích hiệp phƣơng sai đơn biến hai nhân tố không tƣơng
tác và một biến covariate ........................................................ 27
2.2.3 Phân tích hiệp phƣơng sai đơn biến hai nhân tố tƣơng tác
và một biến covariate .............................................................. 31
2.3 PHÂN TÍCH HIỆP PHƢƠNG SAI ĐA BIẾN ............................. 41
2.3.1 Phân tích hiệp phƣơng sai đa biến một nhân tố với q biến
Covariates ............................................................................... 41
i
2.3.2 Phân tích hiệp phƣơng sai đa biến hai nhân tố ....................... 45
Chƣơng 3. ỨNG DỤNG ......................................................................... 51
3.1 GIỚI THIỆU ................................................................................. 51
3.2 ỨNG DỤNG TRONG NÔNG NGHIỆP ...................................... 52
3.2.1 Bài toán 1 ................................................................................ 52
3.2.2 Giải quyết bài toán 1 ............................................................... 52
3.3 ỨNG DỤNG TRONG KINH TẾ ................................................. 54
3.3.1 Bài toán 2 ................................................................................ 54
3.3.2 Giải quyết bài toán 2 ............................................................... 54
3.4 ỨNG DỤNG TRONG Y HỌC ..................................................... 56
3.4.1 Bài toán 3 ................................................................................ 56
3.4.2 Giải quyết bài toán 3 ............................................................... 57
3.5 ỨNG DỤNG TRONG GIÁO DỤC .............................................. 59
3.5.1 Bài toán 4 ................................................................................ 59
3.5.2 Giải quyết bài toán 4 ............................................................... 59
KẾT LUẬN VÀ ĐỊNH HƢỚNG NGHIÊN CỨU ................................. 63
TÀI LIỆU THAM KHẢO ...................................................................... 64
PHỤ LỤC ............................................................................................... 65
ii
LỜI CẢM ƠN
----------
Qua thời gian dài học tập tại trƣờng Đại học Cần Thơ, Em đã đƣợc trang bị
những kiến thức bổ ích và quý báu từ quý Thầy Cô và bạn bè.
Em xin bầy tỏ lòng biết ơn và kính trọng nhất đến thầy Võ Văn Tài, ngƣời
đã trực tiếp hƣớng dẫn, chỉ bảo và động viên Em trong suốt quá trình thực hiện đề
tài.
Bên cạnh đó, Em xin gởi lời cảm ơn đến toàn thể quý Thầy Cô của bộ môn
Toán-Khoa Khoa học Tự nhiên. Em xin gởi lời cảm ơn đến thầy Trần Phƣớc Lộc,
Cố vấn học tập và các bạn sinh viên ngành Toán Ứng dụng đã trợ giúp rất nhiều
trong việc hoàn thành đề tài này.
Em xin cảm ơn hội đồng bảo vệ luận văn đã xem xét và điều chỉnh những
sai sót cũng nhƣ đóng góp ý kiến về những mặt còn hạn chế để đề tài đƣợc hoàn
thiện hơn.
Dù đã có nhiều cố gắng cùng với sự hƣớng dẫn tận tình của Thầy hƣớng
dẫn, song do trình độ còn hạn chế nên khó tránh khỏi sai sót. Rất mong nhận
đƣợc sự thông cảm và góp ý từ Thầy Cô và các bạn.
Cần Thơ, ngày 2 tháng 12 năm 2013
Nguyễn Thị Quỳnh Nhƣ
iii
DANH MỤC CÁC BẢNG
Trang
Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố ........................... 4
Bảng 1.2 Bảng tóm tắt phân tích ANOVA một nhân tố ........................... 5
Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không
tƣơng tác .................................................................................... 6
Bảng 1.4 Bảng tóm tắt phân tích ANOVA hai nhân tố không
tƣơng tác .................................................................................... 8
Bảng 1.5 Bảng dữ liệu phân tích ANOVA hai nhân tố tƣơng tác ............ 8
Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tƣơng tác .......... 11
Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố ..................... 12
Bảng 1.8 Bảng tóm tắt phân tích MANOVA một nhân tố ..................... 14
Bảng 1.9 Bảng dữ liệu phân tích MANOVA hai nhân tố ....................... 15
Bảng 1.10 Bảng tóm tắt kết quả phân tích MANOVA hai nhân tố ........ 17
Bảng 2.1 Bảng dữ liệu phân tích ANCOVA một nhân tố ...................... 19
Bảng 2.2 Chiều cao và cân nặng trẻ em đƣợc phân theo giới tính ......... 24
Bảng 2.3 Bảng số liệu phân tích ANCOVA hai nhân tố không
tƣơng tác .................................................................................. 27
Bảng 2.4 Bảng số liệu phân tích ANCOVA hai nhân tố tƣơng tác ........ 31
Bảng 2.5 Bảng số liệu về năng suất lúa .................................................. 37
Bảng 2.6 Bảng dữ liệu phân tích MANCOVA hai nhân tố .................... 45
Bảng 3.1 Bảng kiểm định giá trị phƣơng sai sai số ................................ 52
Bảng 3.2 Bảng kiểm định giả thiết H 01 , H 02 trong ANCOVA ............... 52
Bảng 3.3 Bảng kiểm định H 03 sự tƣơng tác giữa nhân tố và biến
Covariate ................................................................................. 53
Bảng 3.4 Bảng kiểm định giả thiết trong phân tích ANOVA................. 53
iv
Bảng 3.5 Bảng kiểm định bằng nhau của ma trận hiệp phƣơng sai ....... 54
Bảng 3.6 Bảng kiểm định giả thiết phân tích MANCOVA một
nhân tố ..................................................................................... 54
Bảng 3.7 Bảng kiểm định của nhân tố với biến x1 .................................. 55
Bảng 3.8 Bảng kiểm định của nhân tố với biến x2 .................................. 56
Bảng 3.9 Bảng kiểm định phƣơng sai sai số ........................................... 57
Bảng 3.10 Bảng kiểm định giả thiết H 01 , H 02 trong phân tích
MANCOVA ........................................................................... 57
Bảng 3.11 Bảng kiểm định ảnh hƣởng tƣơng tác giữa nhóm và x1 ........ 58
Bảng 3.12 Bảng kiểm định ảnh hƣởng tƣơng tác giữa nhóm và x2 ........ 58
Bảng 3.13 Bảng kiểm định sự bằng nhau của ma trận hiệp phƣơng sai . 60
Bảng 3.14 Bảng kiểm định các giả thiết thống kê MANCOVA ............ 60
Bảng 3.15 Bảng kiểm định sự tƣơng tác giữa giới tính và độ tuổi ......... 61
Bảng 3.16 Bảng kiểm định sự tƣơng tác giữa năm và độ tuổi ............... 61
Bảng 3.17 Bảng kiểm định tƣơng tác giữa nhân tố năm, giới tính
và tuổi .................................................................................... 62
v
PHẦN MỞ ĐẦU
GIỚI THIỆU
Trong phân tích và xử lý số liệu, ta thƣờng quan tâm đến mô hình phân tích
hồi qui và phân tích phƣơng sai. Trong đó phân tích phƣơng sai đƣợc xem nhƣ
một công cụ để thực hiện việc so sánh trung bình của hai hay nhiều tổng thể dựa
trên giá trị trung bình của mẫu quan sát. Các tính toán trong phân tích phƣơng sai
liên quan đến sự phân chia tổng phƣơng sai tổng thể thành các thành phần
phƣơng sai bên trong nhóm và phƣơng sai giữa các nhóm. Thành phần bên trong
nhóm cho ta ƣớc lƣợng phƣơng sai sai số, trong khi các thành phần giữa các
nhóm ƣớc lƣợng phƣơng sai do ảnh hƣởng của các nhân tố đang xét. Tỷ số
phƣơng sai giữa các nhóm với phƣơng sai bên trong nhóm cho ta một kiểm
nghiệm đối với giả thiết cho rằng tất cả các trung bình đều bằng nhau. Trái lại,
phân tích hồi qui chủ yếu đƣợc sử dụng để tìm mối quan hệ giữa các biến, chúng
ta có thể ƣớc lƣợng hình thức mối quan hệ giữa một biến đáp ứng và một biến
độc lập.
Phân tích hiệp phƣơng sai là sự kết hợp cả hai phƣơng pháp trên. Phƣơng
pháp này đƣợc R.A.Fisher sử dụng lần đầu tiên trong bài báo nghiên cứu (1932),
Ông xem đây là một kỹ thuật “kết hợp những ƣu điểm và dung hòa các yêu cầu
của hai phƣơng thức đƣợc áp dụng rộng rãi và đƣợc biết dƣới tên là hồi qui và
phân tích phƣơng sai”.
Phân tích hiệp phƣơng sai là một hƣớng nghiên cứu mới trong nhiều lĩnh
vực do nó là sự mở rộng của mô hình phân tích phƣơng sai. Mục tiêu chính của
phân tích hiệp phƣơng sai là đạt đƣợc độ chính xác bởi giảm tổng bình phƣơng
sai số và mục tiêu thứ hai là giảm tác động của các nhân tố mà ngƣời thực hiện thí
nghiệm không kiểm soát đƣợc. Từ đó, việc nghiên cứu ảnh hƣởng của các nhân tố
đến biến đáp ứng chính xác hơn.
I.
BỐ CỤC LUẬN VĂN
Bố cục luận văn gồm phần mở đầu, phần nội dung, phần kết luận, phần tài
liệu tham khảo và phần phụ lục. Phần nội dung luận văn gồm 3 chƣơng:
II.
Chương 1. Phân Tích Phương Sai
Trình bày một số mô hình phân tích phƣơng sai thông dụng nhƣ phân tích
phƣơng sai một nhân tố, phân tích phƣơng sai hai nhân tố,… Đây cũng là cở sở
cho việc hình thành phƣơng pháp phân tích hiệp phƣơng sai.
1
Chương 2. Phân tích hiệp phương sai
Trình bày cở sở lý thuyết của các mô hình phân tích hiệp phƣơng sai nhƣ
phân tích hiệp phƣơng sai đơn biến, phân tích hiệp phƣơng sai đa biến,… Bên
cạnh đó còn trình bày một vài ví dụ đƣợc thực hiện thủ công dựa trên cở sở lý
thuyết đã trình bày.
Chương 3. Ứng dụng
Dựa vào những mô hình đã phân tích ở chƣơng 2, chƣơng này đƣa ra một
số ứng dụng của phân tích hiệp phƣơng sai dựa trên số liệu thực tế trong các lĩnh
vực nhƣ giáo dục, nông nghiệp, y học và kinh tế.
2
Chƣơng 1
PHÂN TÍCH PHƢƠNG SAI
1.1 GIỚI THIỆU
Giả sử chúng ta cần nghiên cứu, phân tích sự biến động của một tổng thể
thông qua một biến ngẫu nhiên (chỉ tiêu nghiên cứu). Thông thƣờng chúng ta có
các bài toán ƣớc lƣợng, kiểm định giả thiết về giá trị tham số và quy luật phân
phối xác suất của biến ngẫu nhiên, tuy nhiên phƣơng pháp kiểm định, so sánh
tham số đó chỉ sử dụng đƣợc khi sự biến động của biến ngẫu nhiên đó chỉ chịu tác
động của một nhân tố và cũng ở một hoặc tối đa hai mức cố định. Nếu biến đó
đƣợc tạo nên do nhiều nhân tố cùng tác động hoặc do nhiều nhân tố nhƣng ở mức
tác động khác nhau thì phải tiến hành phân tích phƣơng sai mới thấy đƣợc vai trò
ảnh hƣởng của từng mức nhân tố (nếu có) trong việc tạo nên sự biến đổi, sự sai
khác đó.
Nhân tố đƣợc hiểu là các yếu tố, điều kiện khách quan (thời tiết, khí hậu,
thiên tai,…) hoặc chủ quan (phƣơng pháp thí nghiệm, giống cây trồng,…) có tác
động trực tiếp đến sự biến động của biến ngẫu nhiên mà ta nghiên cứu.
Quan điểm của phân tích phƣơng sai là việc khai triển phƣơng sai của biến
ngẫu nhiên (X) thành tổng của những phƣơng sai của những biến ngẫu nhiên
thành phần độc lập, mà mỗi cái trong chúng đặc trƣng cho sự ảnh hƣởng của yếu
tố này hay yếu tố khác hoặc tác dụng chung giữa chúng. So sánh những phƣơng
sai này cho phép ta đánh giá sự tồn tại ảnh hƣởng của các yếu tố đó với biến ngẫu
nhiên (X) đang xét.
1.2 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN
1.2.1 Phân tích phƣơng sai đơn biến một nhân tố
Phân tích phƣơng sai đơn biến một nhân tố đƣợc dùng để kiểm định giả thiết
các tổng thể nhóm (tổng thể bộ phận) có giá trị trung bình bằng nhau. Kỹ thuật
này dựa trên cơ sở tính toán mức độ biến thiên trong nội bộ các nhóm và biến
thiên giữa các trung bình nhóm. Dựa trên hai ƣớc lƣợng này của mức độ biến
thiên ta có thể rút ra kết luận về mức độ khác nhau giữa các trung bình nhóm.
Hay nói cách khác ta phân tích ảnh hƣởng của một nhân tố nguyên nhân đến một
nhân tố kết quả.
3
a) Mô hình
Giả sử xét mẫu ngẫu nhiên đƣợc tạo bởi một yếu tố A tác động gồm m mức
đƣợc cho bởi bảng sau:
Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố
STT quan sát
A1
A2
A3
…
Am
1
X 11
X 21
X 13
…
X 1m
2
X 21
X 22
X 23
…
X 2m
3
…
ni
X 31
…
X n11
X 23
…
X n2 2
X 33
…
X n3 3
…
…
…
X 3m
…
Xnmm
Giả thiết rằng các quan sát X ij ( i 1,..., n j ; j 1, m ) có phân phối chuẩn N ( , 2 ) .
Ứng với mỗi mức nhân tố i ta có biến ngẫu nhiên X i và chúng cũng tuân theo quy
luật phân phối chuẩn. Khi đó mô hình phân tích ANOVA một nhân tố có dạng:
X ij +i ij
Trong đó
X ij là biến đáp ứng,
là trung bình tất cả các X ij ,
i là mức tác động thứ i của nhân tố A,
ij là phần dƣ.
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:
H 0 : 1 2 ... m
H1 : Có ít nhất một cặp kỳ vọng khác nhau
* Tính các tham số đặc trưng:
1 n
X i X ij : Trung bình mẫu thứ i,
ni j 1
i
ni
m
X ..
X
i 1 j 1
m
n
: Trung bình tất cả các X ij .
i
i 1
m
ij
ni
SST ( X ij X .. )2 : Tổng bình phƣơng chung, phản ánh biến thiên của
i 1 j i
biến đáp ứng do chịu ảnh hƣởng của tất cả các nhân tố.
4
m
SSB ni ( X i X .. )2 : Tổng bình phƣơng giữa các mẫu, phản ánh biến
i 1
thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố đang nghiên cứu.
m
ni
SSE ( X ij X i )2 : Tổng bình phƣơng trong nội bộ mẫu, phản ánh biến
i 1 j 1
thiên của biến đáp ứng do chịu ảnh hƣởng của các nhân tố không nghiên cứu.
Khi đó SST SSB SSE .
SSB
MSFB
* Giá trị quan sát: F
m 1
SSE
MSE
N m
Trong đó
SSB
, với n-1 là bậc tự do của nhân tố,
MSFB
n 1
SSE
MSE
, với N-m là bậc tự do của sai số.
N m
* Trả lời:
Bác bỏ giả thiết H 0 nếu F F ( m1, N m) .
Trong đó F ( m1, N m) là phân vị Fisher với mức ý nghĩa và bậc tự do
m 1, N m .
Bảng 1.2 Bảng tóm tắt phân tích ANOVA một nhân tố
Nguồn biến
động
Tổng bình phƣơng
Giữa các mẫu
(nhân tố)
SSB ni ( X i X .. )2
Trong nội bộ
mẫu (sai số)
SSE ( X ij X i )2
Bậc tự
do
Trung
bình bình
phƣơng
m-1
MSFB
N-m
MSE
Giá trị quan sát
m
i 1
m
ni
i 1 j 1
SSB
MSFB
F
n 1
SSE
MSE
N m
Chú ý: Để thực hiện được phân tích phương sai một nhân tố, ta cần quan tâm
một số điều kiện sau:
+ ij có phân phối chuẩn N ( , 2 ) ,
+ Các nhóm so sánh phải đƣợc đƣợc chọn một cách ngẫu nhiên và độc lập,
+ Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu đủ lớn,
+ Phƣơng sai các nhóm so sánh phải đồng nhất.
5
1.2.2 Phân tích phƣơng sai đơn biến hai nhân tố không tƣơng tác
Phƣơng pháp phân tích phƣơng sai hai nhân tố là phƣơng pháp ƣớc tính sự
ảnh hƣởng của hai nhân tố thay vì một nhân tố nhƣ trƣớc đó.
a) Mô hình
Giả sử ta có biến ngẫu nhiên X ij có phân phối chuẩn chịu sự ảnh hƣởng
của nhân tố A có m mức ( i 1, m ) và nhân tố C có n mức ( j 1, n ). Cụ thể ta có
bảng số liệu sau:
Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không tƣơng tác
Nhân tố C
C2
C1
…
Nhân tố A
X 11
A1
X 12
…
A2
X 21
X 22
…
…
Am
…
X m1
…
X m2
…
…
Cn
X 1n
X 2n
…
X mn
Giả thiết rằng A và C cùng tác động lên X nhƣng theo một cách riêng rẽ. Ta có
mô hình ANOVA 2 nhân tố không tƣơng tác nhƣ sau:
X ij ij ij ij
Trong đó
X ij là biến đáp ứng,
là trung bình của tất cả các giá trị X ij ,
ij là mức tác động thứ i của nhân tố A,
ij là mức tác động thứ j của nhân tố B,
ij là phần dƣ và ij ~ N (0, 2 ) .
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:
H 0A : 1 2 ... m
; H1A : i
H 0C : 1 2 ... n
; H1C : j
* Tính các tham số đặc trưng:
Ta đặt
1 n
X i. X ij : Trung bình hàng thứ i,
n j 1
X. j
1 m
X ij : Trung bình cột thứ j,
m i 1
6
X ..
1 m
1 n
1 n m
X
X
i. n
X ij : Trung bình tất cả số liệu.
.j
m i 1
n.m j 1 i 1
j 1
m
n
SST ( X ij X .. )2 : Tổng bình phƣơng chung, SST phản ánh biến thiên
i 1 j i
của biến đáp ứng do chịu ảnh hƣởng của tất cả các nhân tố.
m
n
m
SSA ( X i. X .. )2 n ( X i. X .. )2 : Tổng bình phƣơng giữa các hàng.
i 1 j 1
i 1
SSA phản ánh biến thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố A.
m
n
n
SSC ( X . j X .. )2 m ( X . j X .. )2 : Tổng bình phƣơng giữa các cột.
i 1 j 1
j 1
SSC phản ánh biến thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố C.
m
n
SSE ( X ij X i. X . j X .. )2 : Sai số ngẫu nhiên. SSE phản ánh biến
i 1 j 1
thiên của biến đáp ứng do chịu ảnh hƣởng của các nhân tố không nghiên cứu.
Khi đó SST SSA SSC SSE .
MSFA
m 1
* Giá trị quan sát cho H 0A là FA
MSE
(m 1)(n 1)
MSFC
n 1
* Giá trị quan sát cho H 0C là FC
MSE
(m 1)(n 1)
Trong đó
SSA
, với (m 1) là bậc tự do của A,
m 1
SSC
MSFC
, với (n 1) là bậc tự do của C,
n 1
SSE
MSE
, với (m 1)(n 1) là bậc tự do của sai số.
(m 1)(n 1)
MSFA
* Trả lời:
Bác bỏ giả thiết H 0A nếu FA F
Trong đó F
m 1),( m 1)( n 1
( m1),( m1)( n 1)
.
là phân vị Fisher với mức ý nghĩa và bậc tự do
(m 1),(m 1)(n 1) .
Bác bỏ giả thiết H 0C nếu FC F
( n 1),( m 1)( n 1)
7
.
Trong đó F( n1),( m1)( n1) là phân vị Fisher với bậc tự do và bậc tự do
(n 1),(m 1)(n 1) .
Bảng 1.4 Bảng tóm tắt phân tích ANOVA hai nhân tố không tƣơng tác
Nguồn
Tổng bình phƣơng
Bậc tự do
Giá trị quan sát
biến động
MSFA
m
Nhân tố
m 1
FA
SSA n ( X i. X .. )2
m-1
MSE
hàng (A)
i 1
(m 1)(n 1)
MSFC
n
Nhân tố
n 1
FC
SSC m ( X . j X .. )2
n-1
MSE
cột (C)
j 1
(m 1)(n 1)
m
n
SSE ( X ij X i. X . j X .. )2
Sai số
i 1 j 1
m
ni
SST ( X ij X .. )2
Tổng
(m-1)(n-1)
N-1
i 1 j i
1.2.3 Phân tích phƣơng sai đơn biến hai nhân tố tƣơng tác
a) Mô hình
Giả sử có hai yếu tố A, C tác động. Yếu tố A có m mức tác động, yếu tố C có
n mức tác động và giả sử mỗi ô (i,j) chịu tác động bởi AC
i j có số quan sát nhƣ
nhau. Với X ijk i 1, m; j 1, n; k 1, l là quan sát thứ k trên hàng i và cột j.
Giả sử các X ijk có phân phối chuẩn N ( , 2 ) , kỳ vọng EXijk , DX ijk 2 .
Ta có bảng dữ liệu sau:
Bảng 1.5 Bảng dữ liệu phân tích ANOVA hai nhân tố tƣơng tác
Nhân tố C
C2
C1
…
Nhân tố A
X121... X12l
A1
X111... X11l
…
A2
X 211... X 21l
X 221... X 22l
…
…
Am
…
X m11... X m1l
…
X m 21... X m 2l
…
…
Mô hình phân tích ANOVA hai nhân tố tƣơng tác có dạng:
X ij i j ij ij
Trong đó
8
Cn
X1n1... X1nl
X 2 n1... X 2 nl
…
X mn1... X mnl
X ij là biến đáp ứng,
là trung bình của tác cả các giá trị của X ij ,
i là mức tác động thứ i của nhân tố A,
j là mức tác động thứ j của nhân tố C,
ij là mức tác động thức ij của nhân tố tƣơng tác AC,
ij là phần dƣ và ij ~ N (0, 2 ) .
Để kiểm tra sự tƣơng tác giữa hai nhân tố, ta đặt:
ij . EXij : Trung bình của AC
i j,
i..
1 n
ij . : Trung bình của Ai ,
n j 1
. j .
1 m
ij. : Trung bình của Ci ,
m i 1
1 m
1 n
. j . : Trung bình của biến đáp ứng đang nghiên cứu,
i.. n
m i 1
j 1
i i.. : Ảnh hƣởng của nhân tố hàng,
i . j . : Ảnh hƣởng của nhân tố cột,
ij ij. [ (i.. ) (. j. )] : Tƣơng tác giữa hàng i và cột j.
Khi đó ij . i j ij và X ijk ~ N (i j ij , 2 ) .
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:
H 0A : 1 2 ... m 0; H1A : i 0
H 0C : 1 2 ... n 0; H1C : j 0
H 0AC : ij 0;
H1AC : ij 0
* Tính các tham số đặc trưng:
1 l
X ij . X ijk : Trung bình các phần tử ở hàng i cột j,
l i 1
1 n l
X i .. X ijk : Trung bình tất cả các phần tử ở hàng i,
n.l j 1 k 1
1 m l
X . j.
X ijk : Trung bình tất cả các phần tử tử cột j,
m.l i 1 k 1
9
1 m n l
X ijk : Trung bình tất cả các phần tử.
m.n.l i 1 j 1 i 1
X ...
Chú ý:
X i.. X ... : Ƣớc lƣợng của i .
X . j . X ... : Ƣớc lƣợng của j .
X ij . X i. X . j . X ... : Ƣớc lƣợng của ij .
m
n
l
SST ( X ijk X ... )2 : Tổng bình phƣơng chung,
i 1 j 1 i 1
m
n
l
m
SSA ( X i.. X ... )2 nl ( X i.. X ... )2 : Tổng bình phƣơng giữa các hàng,
i 1 j 1 i 1
m
n
i 1
l
n
SSC ( X . j . X ... )2 ml ( X i.. X ... )2 : Tổng bình phƣơng giữa các cột,
i 1 j 1 i 1
m
n
j 1
l
m
n
SSAC ( X ij . X i.. X . j . X ... )2 l ( X ij . X i.. X . j . X ... ) 2 : Tổng
i 1 j 1 i 1
i 1 j 1
bình phƣơng tƣơng tác,
m
n
l
SSE ( X ijk X ij . )2 : Tổng bình phƣơng sai số.
i 1 j 1 i 1
Khi đó SST SSA SSA SSAE SSE .
SSA
(m 1)
* Giá trị quan sát cho H 0A là FA
SSE
mn(l 1)
SSC
(n 1)
* Giá trị quan sát cho H 0C là FC
SSE
mn(l 1)
SSAC
(m 1)(n 1)
* Giá trị quan sát cho H 0AC là FAC
SSE
mn(l 1)
Trong đó
MSFA
SSA
, (m 1) : Bậc tự do của A,
m 1
10
SSC
, (n 1) : Bậc tự do của C,
n 1
SSE
, m.n(l 1) : Bậc tự do của sai số,
MSE
m.n(l 1)
MSFC
MSFAC
SSAC
, (m 1)(n 1) : Bậc tự do của AC.
(m 1)(n 1)
*Trả lời:
Bác bỏ giả thiết H 0A và H 0C nếu FA F
Trong đó F
( m 1)( mn ( l 1)
và F
( n 1),( mn ( l 1)
( m1)( mn ( l 1)
và FC F
( n 1),( mn ( l 1)
.
có phân vị Fisher với mức ý nghĩa và
bậc tự do lần lƣợt là (m 1), mn(l 1) và (n 1), mn(l 1) .
Bác bỏ giả thiết H 0AC nếu FAC F
Trong đó F
( m 1)( n 1), mn ( l 1)
( m 1)( n 1), mn ( l 1)
.
có phân vị Fisher với mức ý nghĩa và bậc tự do
(m 1)(n 1), mn(l 1) .
Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tƣơng tác
Nguồn biến động Tổng bình phƣơng
Độ tự do
Giá trị quan sát F
SSA
(m 1)
FA
Nhân tố A
SSA
m-1
SSE
mn(l 1)
SSC
(n 1)
FC
Nhân tố C
SSC
n-1
SSE
mn(l 1)
SSAC
(m 1)(n 1)
Nhân tố AC
SSAC
(m-1)(n-1) FAC
SSE
mn(l 1)
1.3 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN (MANOVA)
1.3.1 Phân tích phƣơng sai đa biến một nhân tố
Phân tích phƣơng sai đa biến một nhân tố là phân tích ảnh hƣởng của một
nhân tố nguyên nhân đến nhiều yếu tố kết quả.
11
a) Mô hình
Giả sử có m mẫu ngẫu nhiên với cỡ mẫu tƣơng ứng là n1 , n2 ,..., nm và các dữ
m
liệu lấy từ N ni biến ngẫu nhiên độc lập. Trong đó X ij ~ N p ( i , ) ,
i 1
(i 1, m; j 1, ni ) . Ta có bảng dữ liệu sau:
Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố
Mẫu 1
Mẫu 2
…
Mẫu m
X 111 , X 112 ,... X 11 p
X 211 , X 212 ,... X 21 p
…
X m11 , X m12 ,... X m1 p
X 121 , X 122 ,... X 11 p
X 221 , X 222 ,... X 22 p
…
X m 21 , X m 22 ,... X m 2 p
…
…
…
…
X 1n 1 , X 1n 2 ,... X 1n p
1
1
1
X 2 n 1 , X 2 n 2 ,... X 2 n p
2
2
2
…
X mn 1 , X mn 2 ,... X mn
m
m
mp
Mô hình phân tích MANOVA một nhân tố có dạng:
X ij i ij
Trong đó mỗi quan sát X ij là một véc tơ ngẫu nhiên p chiều, có cùng là ma trận
hiệp phƣơng sai. Cụ thể X ij có dạng:
X ij1
X ij2
, Cov( X ij , X ijT ) E[X ij EX ij ][X ij EX ij ]T ,
X ij
...
X
ijp
1
2
: Véc tơ trung bình của tất cả các véc tơ X ij ,
...
p
i1
i2
i : Mức tác động thứ i của nhân tố đang xét,
...
ip
ij : Sai số ngẫu nhiên.
12
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:
H 0 : 1 2 ... m
H 1 : i
Cụ thể
m1
11 21
12 22
m 2
H0 :
...
...
... ...
1 p 2 p
mp
* Tính các tham số đặt trưng:
X i.
1 n
X ij : Trung bình mẫu thứ i,
ni j 1
i
1 m n
X X 2. ... X m.
X .. X ij 1.
: Trung bình tất cả số liệu.
N i 1 j 1
m
i
X i . , X .. là các véc tơ ngẫu nhiên p chiều có dạng:
X i.1
X i.2
X i.
,
...
X
i. p
m
X ..1
X ..2
X ..
...
X
.. p
ni
m
B ( X i. X .. )( X i. X .. )T ni ( X i. X .. )( X i. X .. )T : Ma trận tổng
i 1 j 1
i 1
bình phƣơng và tích chéo giữa các mẫu. Ma trận B có độ tự do m-1.
m
ni
E ( X ij X i . )( X ij X i . )T : Ma trận tổng bình phƣơng và tích chéo
i 1 j 1
trong nội bộ mẫu. Ma trận E có độ tự do là N-m.
* Giá trị quan sát cho H 0 là
E
EB
Trong đó E là định thức của ma trận E, E B là ma trận tổng bình phƣơng và
tích chéo chung.
Chú ý: Việc đưa ra thống kê kiểm định giả thiết H 0 trên là dựa vào định lý
kiểm định tỷ số hợp lý của thống kê Wilk sau đây:
13
- Xem thêm -