TRƯỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
------------
LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC
PHÂN TÍCH PHƯƠNG SAI VÀ ỨNG DỤNG
GIÁO VIÊN HƯỚNG DẪN:
SINH VIÊN THỰC HIỆN:
TS. Võ Văn Tài
Phạm Thị Xuân Thảo
Bộ môn Toán – Khoa KHTN
MSSV: 1117499
Ngành: Toán Ứng Dụng – K37
CẦN THƠ – 12/2014
LỜI CẢM ƠN
---------Tôi xin tỏ lòng kính trọng và biết ơn sâu sắc tới Thầy Võ Văn Tài, người
đã tận tình hướng dẫn, chỉ bảo khích lệ và động viên tôi trong suốt quá trình làm
luận văn. Bên cạnh đó thầy đã cung cấp cho tôi nhiều tài liệu quý giá giúp tôi
hiểu sâu hơn về đề tài của mình.
Để đạt được kết quả như ngày hôm nay, tôi xin gửi lời cảm ơn đến toàn thể
quý thầy cô của bộ môn Toán - Khoa Khoa học Tự nhiên của trường Đại học Cần
Thơ đã trang bị cho tôi những kiến thức cơ bản, các kỹ năng cần thiết trong suốt
ba năm học tập tại trường, đây chính là hành trang quý báu, giúp tôi không chỉ
thực hiện tốt đề tài tốt nghiệp mà còn giúp tôi tự tin vững bước trên con đường sự
nghiệp sắp tới.
Tôi xin cảm ơn quý thầy cô trong Hội đồng bảo vệ đã dành thời gian xem
xét, chỉnh sửa những sai xót cũng như đóng góp ý kiến những mặt còn hạn chế
của đề tài để đề tài được hoàn chỉnh hơn.
Tôi xin cảm ơn các bạn, những người luôn sát cánh cùng tôi, giúp đỡ động
viên tôi trong suốt quá trình vừa qua.
Cuối cùng, tôi xin cảm ơn đến gia đình tôi, những người đã dạy dỗ,
khuyến khích, động viên và tạo mọi điều kiện tốt nhất cho tôi trong quá trình học
tập.
Dù đã cố gắng hết sức cùng với sự tận tâm của Thầy hướng dẫn song do
trình độ còn hạn chế nên khó tránh khỏi những thiếu sót. Rất mong nhận được sự
thông cảm và góp ý của Thầy Cô và các bạn.
Cần Thơ, tháng 12 năm 2014
Phạm Thị Xuân Thảo
i
MỤC LỤC
Trang
LỜI CẢM ƠN......................................................................................................... i
DANH MỤC CÁC BẢNG .................................................................................... 1
DANH MỤC CÁC HÌNH ..................................................................................... 2
PHẦN MỞ ĐẦU.................................................................................................... 3
Chƣơng 1 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN......................................... 5
1.1 Kiểm định về phương sai ............................................................................... 5
1.1.1 Kiểm định phương sai ........................................................................... 5
1.1.2 So sánh hai phương sai .......................................................................... 6
1.1.3 So sánh nhiều phương sai ...................................................................... 6
1.2 Phân tích phương sai đơn biến một nhân tố ................................................... 7
1.2.1 Bài toán.................................................................................................. 7
1.2.2 Vấn đề thực hiện.................................................................................... 8
1.3 Phân tích phương sai đơn biến hai nhân tố .................................................. 11
1.3.1 Bài toán ................................................................................................. 11
1.3.2 Vấn đề thực hiện.................................................................................. 12
1.3 Phân tích phương sai đơn biến ba nhân tố ................................................... 21
1.4.1 Bài toán................................................................................................ 21
1.4.2 Vấn đề thực hiện.................................................................................. 22
Chƣơng 2 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN .......................................... 38
2.1 Phân tích phương sai đa biến một nhân tố với cở mẫu bằng nhau .............. 38
2.1.1 Giới thiệu .............................................................................................. 38
2.1.2 Vấn đề thực hiện ................................................................................... 39
2.2 Phân tích phương sai đa biến một nhân tố với cở mẫu không bằng nhau .. 42
2.2.1 Giới thiệu .............................................................................................. 42
2.2.2 Vấn đề thực hiện ................................................................................... 42
2.3 Phân tích phương sai đa biến hai nhân tố ................................................... 43
2.3.1 Giới thiệu .............................................................................................. 43
2.3.2 Vấn đề thực hiện ................................................................................... 43
Chƣơng 3 MỘT SỐ ỨNG DỤNG TRONG GIÁO DỤC ................................ 48
3.1 Giới thiệu .................................................................................................... 48
3.2 Phân tích điểm thi tuyển sinh vào ngành Toán ứng dụng K40 của trường đại
học Cần Thơ ...................................................................................................... 48
3.2.1 Số liệu ................................................................................................... 48
3.2.2 Mục đích thực hiện ............................................................................... 49
3.2.3 Kết quả thực hiện .................................................................................. 50
3.3 Phân tích tỷ lệ có việc làm sau khi tốt nghiệp các ngành của Khoa Khoa học
Tự nhiên............................................................................................................. 52
ii
3.3.1 Số liệu .................................................................................................. 52
3.3.2 Mục đích thực hiện .............................................................................. 54
3.3.3 Kết quả thực hiện .................................................................................. 55
3.4 Phân tích điểm học tập của sinh viên K36 Khoa Khoa học Tự nhiên......... 58
3.4.1 Số liệu ................................................................................................. 58
3.4.2 Mục đích thực hiện ............................................................................... 58
3.4.3 Kết quả thực hiện ................................................................................ 59
KẾT LUẬN .......................................................................................................... 62
TÀI LIỆU THAM KHẢO .................................................................................. 63
PHỤ LỤC 1.......................................................................................................... 64
PHỤ LỤC 2.......................................................................................................... 65
PHỤ LỤC 3.......................................................................................................... 66
iii
DANH MỤC CÁC BẢNG
Trang
Bảng 1.1 Phân tích phương sai hai nhân tố .......................................................... 15
Bảng 1.2 Phân tích phương sai ba nhân tố ........................................................... 26
Bảng 2.1 Phân tích phương sai một nhân tố với cỡ mẫu bằng nhau .................... 41
Bảng 2.2 Phân tích phương sai một nhân tố với cỡ mẫu không bằng nhau ......... 42
Bảng 2.3 Phân tích phương sai đa biến hai nhân tố .............................................. 45
Bảng 3.1 Ảnh hưởng của các nhân tố đến điểm thi ............................................. 49
Bảng 3.2 Ảnh hưởng tương tác giữa các nhân tố đến điểm thi ............................ 50
Bảng 3.3 Ảnh hưởng của trình độ Ngoại Ngữ và Tin học đến việc làm .............. 54
Bảng 3.4 Ảnh hưởng của nhân tố khóa học, ngành học, xếp loại, giới tính đến
việc làm ................................................................................................................. 55
Bảng 3.5 Ảnh hưởng của các nhân tố đến kết quả toàn khóa ............................... 58
Bảng 3.6 Ảnh hưởng tương tác giữa các nhân tố đến kết quả toàn khóa ............. 59
1
DANH MỤC CÁC HÌNH
Trang
Hình 3.1 Biểu đồ cơ cấu mẫu sinh viên theo khu vực của thí sinh ...................... 48
Hình 3.2 Biểu đồ cơ cấu mẫu sinh viên theo giới tính của thí sinh ...................... 48
Hình 3.3 Biểu đồ cơ cấu sinh viên theo ngành học .............................................. 52
Hình 3.4 Biểu đồ cơ cấu sinh viên theo khóa học ................................................ 52
Hình 3.5 Biểu đồ cơ cấu sinh viên theo giới tính ................................................. 52
Hình 3.6 Biểu đồ cơ cấu sinh viên theo trình độ Ngoại Ngữ ............................... 53
Hình 3.7 Biểu đồ cơ cấu sinh viên theo trình độ Tin học ..................................... 53
Hình 3.8 Biểu đồ cơ cấu sinh viên theo xếp loại học lực ..................................... 53
Hình 3.9 Biểu đồ cơ cấu mẫu sinh viên k36 theo giới tính .................................. 57
Hình 3.10 Biểu đồ cơ cấu mẫu sinh viên k36 theo ngành học ............................. 57
2
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Phân tích phương sai là một trong những bài toán kiểm định quan trọng
bậc nhất trong thống kê. Nó được áp dụng trong nhiều lĩnh vực khác nhau của
thực tế: kinh tế, y học, xã hội….Phân tích phương sai thật chất là bài toán so
sánh các trung bình. Phân tích phương sai đơn biến là kiểm tra sự khác biệt
trung bình giữa các nhóm. Phân tích phương sai đa biến là kiểm tra sự khác
biệt của các vectơ trung bình.
Ở nước ta, phân tích phương sai đơn biến cho các trương hợp khác nhau
đã được áp dụng phổ biến trong thực nghiệm của các ngành y học, nông
nghiệp, kinh tế, xã hội,…Tuy nhiên phân tích phương sai đa biến hầu như
chưa được quan tâm. Nhiều yêu cầu trong thực nghiệm đòi hỏi chúng ta phải
thực hiện phân tích phương sai đa biến mới đáp ứng được mục đích nghiên
cứu. Chính vì những lý do trên là sinh viên ngành Toán ứng dụng, được trang
bị kiến thức thống kê nên em chọn đề tài “Phân tích phương sai và ứng
dụng” làm luận văn tốt nghiệp của mình.
2. Mục tiêu nghiên cứu
- Tổng kết lý thuyết về phân tích phương sai đơn biến (ANOVA) và đa
biến (MANOVA).
- Áp dụng phân tích phương sai đa biến trong các số liệu thực tế.
3. Phƣơng pháp nghiên cứu
- Phân tích, tổng hợp và hệ thống hóa các tài liệu liên quan đến lý thuyết
phân tích phương sai đa biến.
- Sử dụng phần mềm thống kê SPSS để giải quyết những ứng dụng cụ
thể trong thực tế.
4. Đối tƣợng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: Phương pháp phân tích phương sai đa biến và
vấn đề tính toán trong các phương pháp đó.
- Phạm vi nghiên cứu: Phân tích phương sai đa biến một nhân tố và hai
nhân tố, các số liệu thứ cấp thu được liên quan đến giáo dục.
5. Nội dung nghiên cứu
Luận văn được cấu trúc gồm có phần mở đầu, phần nội dung, nhận xét
và tài liệu tham khảo. Phần nội dung gồm có 3 chương:
Chương 1: Phân tích phương sai đơn biến (ANOVA)
Trình bày mô hình phân tích phương sai đơn biến một nhân tố, hai
nhân tố và ba nhân tố.
Chương 2: Phân tích phương sai đa biến (MANOVA)
3
Trình bày mô hình phân tích phương sai đa biến một nhân tố và hai
nhân tố.
Chương 3: Một số ứng dụng trong giáo dục
Trình bày ba bài toán liên quan đến giáo dục từ số liệu tuyển sinh
ngành toán ứng dụng K40, kết quả khảo sát ý kiến cựu sinh viên Khoa Khoa
học Tự nhiên và điểm học tập của K36 Khoa Khoa học Tự nhiên.
4
Chƣơng 1
PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN
1.1
Kiểm định về phƣơng sai
1.1.1 Kiểm định phƣơng sai
a) Bài toán
2
Giả sử biến ngẫu nhiên X có phân phối chuẩn N a, với phương
sai là V X 2 chưa biết. Từ tổng thể của biến ngẫu nhiên X ta chọn một
mẫu gồm n phần tử x1 , x2 ,..., xn và với mức ý nghĩa cho trước, chúng ta
2 02
cần kết luận giả thiết H 0 : 2 02 hay một trong các đối thiết H1 : 2 02 là
2 2
0
đúng.
b) Các bƣớc thực hiện
1
2
Chọn thống kê: 2 2 n 1 S 2 . Nếu giả thiết H 0 đúng thì
0
sẽ có phân phối n21 .
Từ yêu cầu bài toán chọn giả thiết và đối thiết thích hợp.
Với mức ý nghĩa cho trước, ta có miền bác bỏ
Nếu H1 : 2 02 thì W n21,1 , .
Nếu H1 : 2 02 thì W , n21, .
Nếu
H1 : 2 02
thì
.
W , 2 2
,
n 1,
2
n 1,1 2
Với mẫu cụ thể x1 , x2 ,..., xn ta tìm được giá trị quan sát
2
qs
n 1 s 2
02
Trả lời: Nếu qs2 W thì ta bác bỏ giả thiết, chấp nhận đối
thiết, ngược lại ta sẽ chấp nhận giả thiết bác bỏ đối thiết.
5
1.1.2 So sánh hai phƣơng sai
a) Bài toán
Giả sử hai biến X và Y độc lập, cùng có luật phân phối chuẩn
X
a , ,Y a , trong đó hai tham số phương sai
x
2
x
y
2
y
2
x
2
và y chưa
2
2
2
2
biết. Xét giả thiết H 0 : x y và đối thiết H1 : x y . Cho trước một mức ý
nghĩa và với mẫu cụ thể chọn ra trước từ hai mẫu tổng thể của biến ngẫu
nhiên X và Y , ta cần kiểm tra giả thiết H 0 là đúng hay đối thiết H1 là đúng.
b) Các bƣớc thực hiện
Lập mẫu ngẫu nhiên Wx X1 , X 2 ,..., X nx , Wy X1 , X 2 ,..., X ny
đối với X và Y . Chọn thống kê
S x2 / x2
F 2
S y / y2
2
2
Trong đó S x , S y lần lượt là thống kê nhận giá trị bằng phương sai
mẫu điều chỉnh của biến ngẫu nhiên X và Y .
Nếu giả thiết H 0 đúng thì F sẽ có luật phân phối Fisher với bậc tự do
n
x
1, ny 1 .
Miền bác bỏ được thành lập theo dạng F
W F1 nx 1, ny 1 ,
Với mẫu cụ thể w x x1 , x2 ,..., xnx , w y x1 , x2 ,..., xny
ta tính
được sx , s y là hai phương sai mẫu của hai biến ngẫu nhiên X và Y , khi đó
sx2
tính được giá trị quan sát thực tế của thống kê F là F0 2 .
sy
1.1.3 So sánh nhiều phƣơng sai
Khi phân tích phương sai một nhân tố, ta phải có điều kiện phương sai
của các nhân tố khác nhau không có ý nghĩa. Do đó ta phải kiểm định sự bằng
nhau các phương sai của nhân tố trước khi thực hiện bài toán phân tích
phương sai.
Giả sử có k tổng thể có phương sai lần lượt là i2 , i 1, 2,..., k chưa biết.
Chọn mẫu gồm ni phần tử cho tổng thể thứ i . Với mức ý nghĩa , ta cần
kiểm tra phương sai của các tổng thể có bằng nhau không. Có nhiều phương
pháp thực hiện kiểm định này như phương pháp Bartlett, Cochran, Levene,...
Luận văn này tôi trình bày phương pháp Levene, một phương pháp được thực
6
hiện đơn giản và phổ biến. Các bước thực hiện kiểm định bằng phương pháp
này giống như trường hợp tổng quát của bài toán kiểm định giả thiết thống kê,
trong đó
- Giả thiết H : 12 12 ... k2 ,
-
Đối thiết H : Không phải tất cả các phương sai đều bằng nhau.
Miền bác bỏ: W H ;k ;df ; .
-
Trong đó df n 1, n phần nguyên của
1 k
ni ; H ;k ;df là phân vị
k i 1
Hatley mức xác suất , bậc tự do k , df .
Giá trị quan sát hqs
Trong
2
S max
.
2
S min
2
2
Smax
max s12 , s22 ,..., sk2 , Smin
s12 , s22 ,..., sk2
đó
với
si2 , i 1, 2,..., k là phương sai mẫu của tổng thể thứ i .
Chú ý: Bài toán phân tích phương sai một nhân tố chỉ thực hiện được khi nó
thỏa các yêu cầu sau:
- Các nhóm so sánh phải được chọn một cách độc lập và được chọn một
cách ngẫu nhiên.
- Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để
được xem như tiệm cận phân phối chuẩn.
- Phương sai của các nhóm phải bằng nhau.
1.2 Phân tích phƣơng sai đơn biến một nhân tố
1.2.1 Bài toán
Giả sử có m mẫu chuẩn với cỡ mẫu n1 , n2 ,..., nm . Các dữ liệu lấy từ
N n1 n2 ... nm biến ngẫu nhiên độc lập X ij , j 1,..., n; i 1,..., m và
X ij
N i , 2 .
Mẫu
gồm
m
X
i1
, X i 2 ,..., X in1 , i 1, m tạo nên bởi một nhân tố A tác động
mức A1 , A2 ,..., Am được cho bởi bảng sau:
A1
A2
X 11
X 21
X 12
X 22
...
...
X 1n1
X 2 n2
...
...
...
...
...
7
Am
X m1
X m2
...
X mnm
Ta cần kiểm tra các mức của A có khác nhau không?
1.2.2 Vấn đề thực hiện
Để khảo sát sự ảnh hưởng của nhân tố A , ta xét sự ảnh hưởng của
từng mức A1 , A2 ,..., Am . Nếu tác động của từng mức A1 , A2 ,..., Am đến
X khác nhau, thì có nghĩa là A có ảnh hưởng tới X . Vì vậy bài toán được
đưa về so sánh các trung bình của các quan sát trong từng mức với nhau. Nếu
các trung bình này khác nhau thì có nghĩa là A có tác động đến X .
Kiểm định giả thiết:
H 0 : 1 2 3 ... m
H1 : Có ít nhất một cặp kỳ vọng khác nhau.
X
m
Xét
n1
i 1 j 1
X
ij
X
n1
m
2
i 1 j 1
m
n1
ij
Xi Xi X
m
n1
2
n1
m
X i X X ij X i 2 X i X X ij X i
i 1 j 1
n1
m
2
i 1 j 1
X i X
i 1 j 1
m
n1
X ij X
i 1 j 1
X
m
2
i 1 j 1
n X X X
m
2
i 1
i
n1
m
2
i
n1
i 1 j 1
ij X i
2
i 1 j 1
ij X i
2
2
(1.1)
Đẳng thức (1.1) được gọi là đẳng thức tổng bình phương. Trong đó
1
Xi
ni
n
X
j 1
ij
; i 1, m là trung bình mẫu thứ i ,
X 1 X 2 ... X m 1 m n1
X
X ij là trung bình của
m
N i 1 j 1
m
m
mẫu và N ni .
i 1
X ij
N 0,1 là các biến ngẫu nhiên độc
lập. Khi đó áp dụng công thức tổng bình phương cho Z ij , ta nhận được
Nếu H 0 đúng, ta có Zij
m
n1
m
m
i 1
i 1
Zij2 ni Z 2 ni Zi Z
i 1 j 1
Đặt
8
2
m
n1
Z ij Z i
i 1 j 1
.
2
ni
m
SS W X ij X i
i 1 j 1
m
SS B ni X i X
i 1
2
là tổng bình phương trong mẫu,
2
là tổng bình phương giữa các mẫu.
Từ định nghĩa độ tự do ta có
n1
m
Z
i 1
j 1
m
2
ij
có độ tự do bằng N ,
ni Z n1 n2 ... nm Z có độ tự do bằng 1,
2
2
i 1
m
ni Zi Z
i 1
m
n1
i 1 j 1
2
m
m
ni Zi ni Z có độ tự do bằng m 1,
2
i 1
Zij Zi
2
1
2
có độ tự do là N m .
Do đó, theo định lý Cochran khi H 0 đúng, ta có
Z
m
n1
i 1 j 1
m
n1
i 1 j 1
i
Z
Z ij Z i
2
2
m
1
2
i 1
X
m
1
ni X i X
2
n1
ij
2
SS B
Xi
i 1 j 1
2
m2 1
2
SS W
N2 m .
2
Khi đó
SS B
F m 1
SS W
N m
Fm 1, N m
* Tính chất xác định miền bác bỏ giả thiết H 0 :
m
Với SS B ni X i X
i 1
2
và SS W
m
ni
i 1 j 1
X ij X i
m
ni
SS B
2
i) E
i
m 1 i 1
m 1
SS W
2
ii ) E
N m
1 m
Trong đó
i N
m i 1
Chứng minh.
9
m
n .
i 1
i
2
2
thì
ni m
SS B
2
i) E
i
m 1 i 1
m 1
2
Ta có
2
y
n
i
i 1
Với y
y
y
n
2
i
i 1
my
(1.2)
1 n
yi , từ đó ta có
m i 1
m
SS B ni X i X
i 1
Với X
2
2
m
ni X i NX 2
2
(1.3)
i 1
1 m
Xi
m i 1
Vì X i
2
2 nên
E X i i ; D X i
.
N i ,
ni
ni
Mà D X i E X i2 E X i ,
2
Nên E X i
2
EXi
2
D X i i2
2
ni
.
(1.4)
Ta có
1 m
X X i và các X 1 , X 2 ,..., X m là độc lập nhau nên
m i 1
1 m ni
2
1 m
1 m
E X E X i i ; D X D X ij
m i 1
m i 1
N i 1 j 1
N
E X
2
EX
2
2
DX
Từ (1.3), (1.4) và (1.5) ta suy ra
m
2
N
E SS B ni E X i NE X
i 1
2
10
2
(1.5)
m
ni i2 m 2 N 2
2
i 1
m
m 1 2 ni i2 N
2
i 1
m
m 1 2 ni i
i 1
ni
SS B
2
E
i
m 1 i 1
m 1
m
.
2
.
2
SS W
2
ii ) E
N m
Ta có:
m
ni
SS W X ij X i
i 1 j 1
m
ni
2
m
X ni X i
i 1 j 1
ni
2
ij
2
i 1
E SS W E X ij2 ni E X i
m
i 1 j 1
m
i 1
2
m ni
m
2
i2 2 ni i2
ni
i 1 j 1
i 1
N 2 m 2 N m 2
SS W
2
Suy ra E
N m
Chú ý: Nếu giả thiết H 0 sai (tức tồn tại tham số i ), thì trung bình của tử
số thống kê F lớn hơn khi H 0 đúng, trong khi đó phân phối của mẫu số luôn
không đổi dù H 0 đúng hay sai.
Khi đó giả thiết H 0 bị bác bỏ ở mức nếu
m 1, N m
đó, F
F Fm1, N m trong
là phân vị Fisher mức .
1.3 Phân tích phƣơng sai đơn biến hai nhân tố
1.3.1 Bài toán
Giả sử hai nhân tố A, B tác động lên các đối tượng. Nhân tố A được
phân ra a mức là A1 , A2 ,..., Aa còn nhân tố B được phân làm b mức là
11
B1 , B2 ,..., Bb và mỗi ô i, j chịu tác động bởi Ai và B j có số quan sát như
nhau và bằng n với các quan sát
X ijk , i 1,..., a; j 1,..., b; k 1,..., n, X ij
B1
B2
A1
X111... X11n
X121... X12 n
A2
X 211... X 21n
X 221... X 22 n
...
...
...
A3
X a11... X a1n
X a 21... X a 2 n
N ij , 2 .
...
...
...
...
...
Bb
X1b1... X1bn
X 2b1... X 2bn
...
X ab1... X abn
Ta cần kiểm định trung bình tổng thể theo cột, hàng, sự tương tác giữa
hàng và cột.
1.3.2 Vấn đề thực hiện
Để kiểm tra tính tương tác hàng và cột, ta làm như sau:
Đặt
1 b
1 a
i ij ; j ij
b j 1
a i 1
1 a b
1 a
1 b
ij a
j
i
ab i 1 j 1
b i 1
i 1
i i
j j
ij ij i j
Ta có
ij i j ij
E X ijk ij i j ij
X ijk i j ij ijk
Trong đó
i sinh ra do Ai tác động, j sinh ra do B j tác động, ij sinh ra do sự
tác động chung của Ai B j .
ijk
sinh ra do tác động của các yếu tố ngẫu nhiên khác. Nó có phân
phối chuẩn với kỳ vọng bằng 0 và phương sai 2 .
12
Để biết được các nhân tố A, B có tác dụng đến X không và giữa
A, B có sinh ra lực tác dụng có ý nghĩa đến X không, ta đi đến bài toán kiểm
định ba giả thiết sau đây:
H 0t : 1 ... a 0,
H 0c : 1 ... b 0,
H 0int : ij 0.
Với
1 n
X ij X ijk : Trung bình các phần tử ở hàng i cột j ,
n k 1
Xi
1 b n
X ijk : Trung bình tất cả các phần tử trên hàng i ,
bn j 1 k 1
1 a n
X j X ijk : Trung bình tất cả các phần tử trên cột j ,
an i 1 k 1
1 a b n
X
X ijk trung bình tất cả các phần tử.
abn i 1 j 1 k 1
Ta viết
X X
X ijk X X i X X j X X ij X i X j X X ijk X ij
X
k
j
i
2
ijk
X X i X X j X X ij X X j
i
j k
ijk
2
X ij (1.6)
Vì
a
X X i X X X i a X 0
i 1 j 1 k 1
j 1 k 1
i 1
a
b
n
b
n
b
X
X
X
X
X
bX
j
i
0
i 1 j 1 k 1
i 1 k 1
j 1
a
b
n
a
n
a
a
X X ij X i X j X X X ij X j X i X 0
i 1 j 1 k 1
j 1 k 1
i 1
i 1
a
b
n
b
n
Chứng minh tương tự ta có tổng chéo còn lại bằng 0.
Từ (1.6) suy ra đẳng thức tổng bình phương
X ij2k X X i X X j X
2
i
j
k
i
j
k
i
j
k
2
i
j
X ij X i X j X X ijk X ij
i
j
2
k
i
13
j
k
k
2
(1.7)
2
Đặt
a
SSr bn X i X
i 1
b
SSc an X j X
j 1
a
b
i
j
2
2
tổng bình phương hàng,
tổng bình phương cột,
SSint n X ij X i X j X
SSe X ijk X ij
i
j
j
2
tổng bình phương tương tác,
tổng bình phương sai số,
k
SST X ijk X
i
2
2
tổng bình phương tổng cộng.
k
Đẳng thức (1.7) có thể viết
SST SSr SSc SSint SSe
(1.8)
Các thành phần trong (1.8) có độ tự do
2
nabX abn 1 độ tự do,
a
SSr bn X i X
i 1
b
SSc an X j X
j 1
2
2
a 1 độ tự do,
b 1 độ tự do,
SSe X ijk X ij ab n 1 độ tự do.
i
j
2
k
Kiểm định giả thiết không có tương tác hàng – cột là H 0int ij0i, j.
Chú ý: Dưới giả thiết H 0int các biến ngẫu nhiên Zijk
X ijk i j
và độc lập.
Các biến ngẫu nhiên sau có phân phối N 0,1
Z ij
Zi
Zj
X ij i j
X i i
1 b
j 0
0
b j 1
Xj j
1 a
0 a i 0
i 1
14
N 0,1
Z
X
Từ đó
Z ij Z i Z j Z
Z ijk Zij
Vì
Z
X ij X i X j X
X ijk X ij
2
nab
nên áp dụng đẳng thức tổng bình phương trong
2
ijk
(1.7) cho Z ijk , sau đó áp dụng định lý Cochran.
Khi H 0int đúng thì
SS r
2
SSc
SSint
2
2
SSe
2a 1
2b 1
2b1 a 1
2
ba
n 1
Khi đó, ta có thống kê kiểm định
2
Fr
SSr / a 1
SSe / ba n 1
Fint
F a 1,ba n1 , Fc
SSint / b 1 a 1
SSe / ba n 1
SSc / b 1
SSe / ba n 1
Fb1,ba n1
F a 1b1,ba n1 .
Muốn bác bỏ giả thiết H 0 ta dựa vào bảng sau:
Nguồn
biến động
Hàng
Bảng 1.1:Phân tích phƣơng sai hai nhân tố
MBB với mức
Tổng bình
Độ tự do
F
phương
ý nghĩa
SSr
SS r
a 1
a 1
Fr F ,a1,a1b1
Fr
SSe
a 1 b 1
Cột
SSc
b 1
Sai số
SSe
a 1b 1
SSc
b 1
Fc
SSe
a 1 b 1
15
Fc F ,b1, a1b1
*Tính chất xác định miền bác bỏ giả thiết H 0
Với
a
b
2
a
SSr bn X i X ; SSc an X j X
i 1
a
b
2
j 1
2
b
n
SSint n X ij X i X j X ; SSe X ijk X ij .
i 1 j 1
i 1 j 1 k 1
Ta có
nb a 2
SS
i) E r 2
i ,
a 1 i 1
a 1
na b 2
SSc
2
ii) E
i ,
b 1 j 1
b 1
a b
SSnt
n
2
iii) E
2j ,
a 1b 1 i1 j 1
a 1 b 1
SSe
2
iv) E
.
ab n 1
Chứng minh.
nb a 2
SS
i) E r 2
i
a 1 i 1
a 1
Ta có
a
SSr bn X i X
i 1
2
a
bn X i 2 X i X X
i 1
2
a
2
a 2
bn X i 2 X X i a X
i 1
i 1
b n
X
ij
k
a 2
a
2
bn X i 2 X j 1 k 1
aX
bn
i 1
i 1
a
bn X i 2nab X nab X
2
2
i 1
a
bn X i nab X .
2
2
i 1
Suy ra
16
2
2
2
- Xem thêm -