Bài tập thống kê
Họ và tên:
MSSV:
Lớp: KT1390A2
Nhóm: B04
BÀI TẬP NGUYÊN LÝ THỐNG KÊ
KINH TẾ
Giáo viên: Huỳnh Thị Kim Uyên
Phần I/ Phân tích phương sai (ANOVA)
I/ Phân tích phương sai một chiều.
Phân tích phương sai một chiều là phân tích dựa trên ảnh hưởng của một nhân
tố.
Anova một chiều là kiểm định về sự bằng nhau của nhiều trung bình tổng thể
có phân phối chuẩn, phương sai bằng nhau.
Bài tập 1:
Người ta tiến hành đo hàm lượng Alkaloid trung bình trong mướp đắng
(Alkaloid trong mướp đắng có công hiệu lợi niệu hoạt huyết, tiêu viêm thoái nhiệt) ở
3 vùng khác nhau có số liệu như sau:
Vùng 1: 7,5
6,8
7,1
7,5
6,8
6,6
7,8
Vùng 2: 5,8
5,6
6,1
6,0
5,7
Vùng 3: 6,1
6,3
6,5
6,4
6,5
6,3
Hỏi hàm lượng Alkaloid ở những vùng khác nhau có khác nhau hay không?
Với =5%.
Giải:
Bài tập này yêu cầu kiểm định về sự bằng và khác nhau giữa các trung bình tổng
thể dựa trên ảnh hưởng của hàm lượng Alkaloid nên giải theo phân tích phương sai
một chiều.
Cách 1: Cách thông thường (Tính tay)
Giả thuyết:
H 0 : Hàm lượng Alkaloid ở 3 vùng như nhau.
H 1 : Hàm lượng Alkaloid ở 3 vùng khác nhau.
Nj
Vùng 1
7,5
6,8
7,1
7,5
6,8
6,6
7,8
7
Vùng 2
5,8
5,6
6,1
6,0
5,7
Vùng 3
6,1
6,3
6,5
6,4
6,5
6,3
5
6
1
N=18
Bài tập thống kê
Tj
x
2
ij
50,1
359,79
29,2
170,7
38,1
242,05
T=117,4
xij2 = 772,54
i
(Với i là biến chạy của dòng, j là biến chạy của cột)
(117 ,4) 2
= 6,8311
18
(50,1) 2
( 29,2) 2
(38,1) 2
+
+
7
5
6
SST= 772,54 SSA=
-
(117 ,4) 2
18
= 5,326968
SSE= SST – SSA = 1,50414
Bảng ANOVA:
Nguồn
Yếu tố
Sai số
Tổng cộng
SS
5,326968
1,50414
6,8311
Df
2
15
17
MS
2,6635
0,1003
F
F k 1, n k ,
26,5615
3,68
Quyết định: Ta có F = 26,5615 > F k 1, n k , nên bác bỏ H 0 chấp nhận H 1 .
Kết luận: Với =5% hàm lượng Alkaloid có sai khác theo vùng.
Cách 2: Dùng Excel:
(Vì em dùng Excel 2003 nên sử dụng Excel 2003)
Nếu trong menu Tools chưa có mục Data Analysis… thì tiến hành cài Analysis
ToolPak như sau: Tools \ Add-Ins \ chọn Analysis ToolPak\ OK.
2
Bài tập thống kê
Chọn Tools\ Data Analysis..
Nhập dữ liệu:
3
Bài tập thống kê
Chọn: Anova: Single Facter:
Chọn các mục như hình:
4
Bài tập thống kê
Khi đó sẽ hiện ra bảng kết quả là:
Quyết định:
Cách 1: Ta so sánh cột F và F crit.
Vì F = 26,56148> F crit = 3,682316674 => Bác bỏ H 0 chấp nhận H 1 .
Cách 2: Đánh giá dựa vào P-value.
Ta có: p = 1,17756E-05 quá nhỏ => Bác bỏ H 0 chấp nhận H 1 .
Kết luận: Với =5% hàm lượng Alkaloid có sai khác theo vùng.
Bài tập 2:
So sánh kết quả tăng trọng trung bình (kg) của trẻ 3 nhóm tuổi khác nhau sau
khi sử dụng sản phẩm dinh dưỡng như nhau trong thời gian 1 năm
Nhóm 1: Trẻ từ 1 tháng tuổi đến 12 tháng tuổi.
1,0 1,2 1,4 1,1 0,8 0,6
Nhóm 2: Trẻ từ 12 tháng tuổi đến 24 tháng tuổi.
2,0 1,8 1,9 1,2 1,4 1,0 1,5 1,8
Nhóm 3: Trẻ từ 24 tháng tuổi đến 36 tháng tuổi.
0,4 0,6 0,7 0,2 0,3 0,1 0,2
Hãy so sánh kết quả tăng trọng của 3 nhóm tuổi trên có như nhau không với
=1%.
Giải:
Bài tập này yêu cầu kiểm định về sự bằng và khác nhau giữa các trung bình tổng
thể dựa trên sự tăng trọng của từng nhóm tuổi khi sử dụng cùng một sản phẩm dinh
dưỡng nên giải theo phân tích phương sai một chiều.
Giả thuyết:
H 0 : Kết quả tăng trọng của 3 nhóm tuổi là như nhau.
H 1 : Kết quả tăng trọng của 3 nhóm tuổi là khác nhau.
5
Bài tập thống kê
Nhóm 1
1,0
1,2
1,4
1,1
0,8
0,6
Nj
Tj
x
2
ij
Nhóm 2
2,0
1,8
1,9
1,2
1,4
1,0
1,5
1,8
8
12,6
20,74
5
6,1
6,61
Nhóm 3
0,4
0,6
0,7
0,2
0,3
0,1
0,2
7
2,5
1,19
i
N=21
T=21,2
xij2 =28,5
4
(Với i là biến chạy của dòng, j là biến chạy của cột)
( 21,2) 2
= 7,1381
21
(6,1) 2
(12,6) 2
( 2,5) 2
+
+
5
8
7
SST = 28,54 SSA =
-
( 21,2) 2
21
= 6,77795
SSE = SST – SSA = 0,36014
Bảng ANOVA:
Nguồn
Yếu tố
Sai số
Tổng cộng
SS
6,77795
0,36014
7,1381
Df
2
18
20
MS
3,38898
0,0200079
F
F k 1, n k ,
169,3816
6,01
Quyết định:
Ta có F = 169,3816 > F k 1, n k , = 6,01 nên bác bỏ H 0 chấp nhận H 1 .
Kết luận:
Với =1% kết quả tăng trọng của 3 nhóm tuổi là khác nhau.
II/ Phân tích phương sai hai nhân tố không lặp (phân tích phương sai hai
chiều có một quan sát trong cùng một ô)
Phân tích phương sai hai nhân tố không lặp nhằm đánh giá sợ ảnh hưởng của 2
nhân tố trên các giá trị quan sát, đây là trường hợp mở rộng của phân tích phương sai
một yếu tố.
Bài tập 1: Chiết suất từ hoa hồng bằng 3 phương pháp khác nhau và 5 loại
dung môi, ta có những kết quả sau:
6
Bài tập thống kê
Phương pháp chiết suất
Dung môi
A1
A2
A3
A4
A5
B1
B2
B3
120
120
130
150
110
60
70
60
70
75
60
50
50
60
54
Hãy xét ảnh hưởng của phương pháp chiết xuất và dung môi đến kết quả chiết
suất hoa hồng với =1%.
Giải:
Đề bài yêu cầu phân tích sự ảnh hưởng của 2 yếu tố phương pháp và dung môi
đến kết quả chiết suất. Ta áp dụng phân tích phương sai 2 nhân tố không lặp.
Cách 1: Tính thông thường.
Giả thiết:
- H 0 : Dung môi không ảnh hưởng đến kết quả chiết suất.
Phương pháp không ảnh hưởng đến kết quả chiết suất.
- H 1 : Dung môi ảnh hưởng đến kết quả chiết suất.
Phương pháp ảnh hưởng đến kết quả chiết suất.
B
B1
B2
B3
x
Ti
2
ij
j
A
A1
A2
A3
A4
A5
Tj
x
120
120
130
150
110
630
80300
2
ij
60
70
60
70
75
335
22625
60
50
50
60
54
274
15116
240
240
240
280
239
T=1239
21600
21800
23000
31000
20641
x =118041
2
ij
i, j
i
(Với i là biến chạy của dòng, j là biến chạy của cột)
T = 308321
T =584201
2
i
i
2
j
j
SST = 118041 -
(1239) 2
5 x3
= 155699,6
7
Bài tập thống kê
SSA =
SSB =
308321 (1239) 2
3
5 x3
584201
(1239) 2
5
5 x3
= 432,2667
= 14498,8
SSE = SST – SSA – SSB = 768,5333
Nguồn
Yếu tố A
Yếu tố B
Sai số
Tổng
SS
SSA=432,2667
SSB=14498,8
SSE=768,5333
SST= 155699,6
Df
4
2
8
14
MS
MSA=108,0667
MSB=7249,4
MSE=96,0667
F
F A = 1,1249
F B = 75,4622
Quyết định + kết luận:
F A = 1,1249 < F 4;8;1% = 7,006
=> Chấp nhận H 0
ð
Với =1%, dung môi không ảnh hưởng đến kết quả chiết suất.
F B = 75,4622 > F 2;8;1% = 8,649
=> Bác bỏ H 0
ð
Với =1%. Phương pháp ảnh hưởng đến kết quả chiết suất.
Cách 2: Excel
Nhập dữ liệu
Chọn Tools\Data Analysis…\Anova: Two-Factor without replication.
Làm theo các bước như hình:
8
Bài tập thống kê
Kết quả :
Anova: Two-Factor
Without Replication
- Kiểm định theo cột:
Giả thiết:
H 0 : Phương pháp không ảnh hưởng đến kết quả chiết suất.
Quyết định:
p=6,42093E-04% quá nhỏ => Bác bỏ H 0
Kết luận: Phương pháp ảnh hưởng đến kết quả chiết suất.
- Kiểm định theo hàng:
Giả thiết:
H 0 : Dung môi không ảnh hưởng đến kết quả chiết suất.
9
Bài tập thống kê
Quyết định:
p=40,9% quá lớn => Chấp nhận H 0 hoàn toàn.
Kết luận: Dung môi ảnh hưởng đến kết quả chiết suất.
Bài tập 2:
4 chuyên gia tài chính được yêu cầu dự đoán về tốc độ tăng trưởng (%) trong
năm tới của 5 công ty sản xuất bánh kẹo. Dự đoán được ghi nhận như sau:
Có thể nói rằng dự đoán tốc độ tăng trưởng trung bình là như nhau cho cả 5
công ty sản xuất bánh kẹo được không? =1%.
Giải:
Giả thiết:
H 0 : Các chuyên gia dự đoán tốc độ tăng trưởng là như nhau.
Các công ty sản xuất bánh kẹo đều có tốc độ tăng trưởng là như nhau.
H 1 : Các chuyên gia dự đoán tốc độ tăng trưởng khác nhau.
Các công ty sản xuất bánh kẹo đều có tốc độ tăng trưởng khác nhau.
Chuyên gia
Công ty
1
2
3
4
5
Tj
x
2
ij
A
B
C
D
Ti
8
14
11
9
12
54
606
12
10
9
13
10
54
594
8,5
9
12
10
10
49,5
497,25
13
11
10
13
10
57
659
41,5
44
42
45
42
T=214,5
x
j
449,25
498
446
519
444
x =2356,25
2
ij
i, j
i
(Với i là biến chạy của dòng, j là biến chạy của cột)
10
2
ij
Bài tập thống kê
( 214,5) 2
= 55,7375
20
9211,25
( 214,5) 2
= 2,3
4
20
11531,25
( 214,5) 2
= 5,7375
5
20
SST = 2356,25 SSA =
SSB =
SSE = SST – SSA – SSB = 47,7
Nguồn
Yếu tố A
Yếu tố B
Sai số
Tổng
SS
SSA=2,3
SSB=5,7375
SSE=47,7
SST= 55,7375
Df
4
3
12
19
MS
MSA=0,575
MSB=1,9125
MSE=3,975
F
F A = 0,1447
F B = 0,4811
Quyết định + Kết luận:
- F A = 0,1447 < F 4;12;1% = 5,41
=> Chấp nhận H 0
=> Với =1%. Các chuyên gia dự đoán tốc độ tăng trưởng là như nhau.
- F B = 0,4811 < F 3;12;1% = 5,95
=> Chấp nhận H 0
=> Với =1%. Các công ty sản xuất bánh kẹo có tốc độ tăng trưởng như nhau.
III/ Phân tích phương sai 2 nhân tố có lặp (có hơn một tham số trong một ô)
Trong phân tích phương sai 2 nhân tố có lặp, mỗi yếu tố cột và hàng có thể có
nhiều quan sát. Vậy nên ngoài việc kiểm định trung bình theo cột, hàng bằng nhau thì
chúng ta còn có thể xem xét sự tương tác giữa yếu tố hàng và cột có ảnh hưởng đến
hiện tượng nghiên cứu hay không.
Bài tập 1:
Hàm lượng cafein (mg) trong cà phê thu hái trong 2 mùa (mùa khô và mùa
mưa) mỗi mùa lấy mẫu 3 lần đầu – giữa – cuối mùa và từ 3 tỉnh ở Tây Nguyên (Kon
Tum, Gia Lai, Lâm Đồng) thu được kết quả sau:
Mùa
Khô
Mưa
Thời điểm
Đầu mùa
Giữa mùa
Cuối mùa
Đầu mùa
Giữa mùa
Cuối mùa
Kon Tum
2,4
2,4
2,5
2,5
2,5
2,6
11
Tỉnh
Gia Lai
2,1
2,2
2,2
2,2
2,3
2,3
Lâm Đồng
3,2
3,2
3,4
3,4
3,5
3,5
Bài tập thống kê
(Với i là biến chạy của dòng, j là biến chạy của cột)
Hãy cho biết hàm lượng cafein có khác nhau theo từng mùa hay không? Nếu
có thì yếu tố mùa và miền (tỉnh khác nhau) có sự tương tác với nhau hay không? Với
=0,05.
Giải:
Với đề bài cho hàng và cột có hơn 1 quan sát, yêu cầu xem xét sự tương tác
giữa các yếu tố (hàng và cột) có ảnh hưởng đến đối tượng nghiên cứu không, ta dùng
phân tích phương sai 2 yếu tố có lặp.
Cách 1: Giải thông thường
Giả thiết:
H0:
- Hàm lượng cafein trong cà phê của các tỉnh là như nhau.
- Hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa khô là như nhau.
- Không có sự tương tác giữa tỉnh và mùa màng đến hàm lượng cafein trong
cà phê.
H1 :
- Hàm lượng cafein trong cà phê của các tỉnh khác nhau.
- Hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa khô khác nhau.
- Có sự tương tác giữa tỉnh và mùa màng đến hàm lượng cafein trong cà phê.
Tỉnh
Kon Tum
Mùa
2,4
2,4
2,5
2,5
2,5
2,6
Khô
Mưa
T * j*
7,3
7,6
14,9
Gia Lai
2,1
2,2
2,2
3,2
3,2
3,4
6,5
6,8
13,3
Lâm Đồng
3,2
3,3
3,3
3,4
3,5
3,5
T i**
9,8
23,6
10,4
24,8
20,2
T=48,4
(Với i là biến chạy của dòng, j là biến chạy của cột)
x ijk
- i
= 134,64
, j ,k
2
-
T = 23,6 2 + 24,8 2 = 1172
-
T
-
T
2
i**
i
2
* j*
j
2
ij *
i, j
= 14,9 2 + 13,3 2 + 20,2 2 = 806,94
= 7,3 2 + 7,6 2 + 6,5 2 + 6,8 2 + 9,8 2 + 10,4 2 = 403,74
- T 2 = 2342,56
12
Bài tập thống kê
2342,56
= 4,4978
18
1172
2342,56
SSA = 9 = 0,08
18
806,94 2342,56
SSB =
= 4,3478
6
18
403,74
SSE= 134,64 0,06
3
SST = 134,64 -
SSAB = SST – SSA – SSB – SSE = 0,01
Bảng ANOVA
Nguồn
Yếu tố A (mùa)
Yếu tố B (tỉnh)
Tương tác AB
Sai số
Tổng
SS
0,08
4,3478
0,01
0,06
4,4978
Df
1
2
2
12
17
MS
0,08
2,1739
0,005
0,005
F
F A =16
F B =434,78
F AB =1
Quyết định + kết luận:
Ta có:
- F A =16 > F 1;12;5% = 4,7472
ð
Bác bỏ H 0
ð
Với =5%. Hàm lượng cafein khác nhau theo mùa.
- F B =434,78 > F 2;12;5% =3,8853
ð
Bác bỏ H 0
ð
Với =5%. Hàm lượng cafein khác nhau theo từng tỉnh thành.
- F AB =1 < F 2;12;5% = 3,8853
ð
Chấp nhận H 0
=> Với =5%. Không có sự tương tác giữa mùa và miền (tỉnh thành) đến hàm
lượng cafein trong cà phê.
Cách 2: Excel
* Nhập dữ liệu
* Chọn Tools\Data Analysis…\Anova: Two Factor With Replication
13
Bài tập thống kê
Chọn như hình:
Sau khi chạy chương trình máy tính sẽ hiện bảng ANOVA.
14
Bài tập thống kê
- Kiểm định theo cột:
+ Giả thiết:
H 0 : Hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa khô là như nhau.
H 1 : Hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa khô khác nhau.
+ Quyết định: Với =5% > p = 6,36194E-12 => Bác bỏ H 0
+ Kết luận: Với =5%, hàm lượng cafein trong cà phê ở 2 mùa mưa và mùa
khô khác nhau.
- Kiểm định theo hàng:
+ Giả thiết:
H 0 : Hàm lượng cafein trong cà phê ở các tỉnh thành là như nhau.
H 1 : Hàm lượng cafein trong cà phê ở các tỉnh thành khác nhau.
+ Quyết định: p = 0,001761696 quá nhỏ => Bác bỏ H 0 .
+ Kết luận: Với =5%, hàm lượng cafein trong cà phê ở các tỉnh thành khác
nhau.
- Kiểm định về sự tương tác:
+ Giả thiết:
H 0 : Không có sự tương tác giữa tỉnh và mùa màng đến hàm lượng cafein
trong cà phê.
H 1 : Có sự tương tác giữa tỉnh và mùa màng đến hàm lượng cafein trong cà
phê.
+ Quyết định: F = 0,396569457 < F 2;12;5% = 3,8853 => Chấp nhận H 0 .
+ Kết luận:
Với =5%, không có sự tương tác giữa tỉnh và mùa màng đến hàm lượng
cafein trong cà phê.
15
Bài tập thống kê
Bài tập 2:
Điều tra mức tăng trưởng chiều cao (cm) của cây lúa theo loại đất trồng và
loại phân bón khác nhau trong 1 tháng có kết quả:
Loại đất
Loại phân
A
B
1
2
3
4
5,5
5,5
6,0
5,6
7,0
7,0
4,5
4,5
4,0
5,0
5,5
5,0
3,5
4,0
3,0
4,0
5,0
4,5
6,0
5,0
4,0
5,5
4,5
6,0
Hỏi sự khác nhau của mức tăng trưởng về chiều cao của cây lúa theo từng loại
đất và phân bón. Với =5%.
Giải:
Giả thiết:
H0:
Mức tăng trưởng theo chiều cao của cây lúa theo loại đất trồng là như nhau.
Mức tăng trưởng theo chiều cao của cây lúa theo loại phân bón là như
nhau.
Không có sự tương tác giữa phân bón và loại đất đến sự tăng trưởng theo
chiều cao của cây lúa.
H1 :
Mức tăng trưởng theo chiều cao của cây lúa theo loại đất trồng khác nhau.
Mức tăng trưởng theo chiều cao của cây lúa theo loại phân bón là khác
nhau.
- Có sự tương tác giữa phân bón và loại đất đến sự tăng trưởng theo chiều cao
của cây lúa.
Đất
Phân
A
B
T * j*
1
5,5
5,5
6,0
5,6
7,0
7,0
2
17
19,6
36,6
4,5
4,5
4,0
5,0
5,5
5,0
3
3,5
4,0
3,0
4,0
5,0
4,5
13
15,5
28,5
10,5
13,5
24
16
4
6,0
5,0
4,0
5,5
4,5
6,0
31
T i**
15
55,5
16
64,6
T=120,1
Bài tập thống kê
(Với i là biến chạy của dòng, j là biến chạy của cột)
x ijk
- i
= 624,61
, j ,k
2
-
T = 7253,41
-
T
-
T
2
i**
i
2
* j*
j
2
ij *
i, j
= 3688,81
= 1855,91
- T 2 = 14424,01
14424,01
= 23,60958
24
7253,41 14424,01
SSA =
= 3,45042
12
24
3688,81 14424,01
SSB =
= 13,80125
6
24
1855,91
SSE= 624,61 = 5,9733
3
SST = 624,61 -
SSAB = SST – SSA – SSB – SSE = 0,38458
Bảng ANOVA
Nguồn
Yếu tố A (mùa)
Yếu tố B (tỉnh)
Tương tác AB
Sai số
Tổng
ð
ð
ð
ð
ð
SS
3,45042
13,80125
0,38458
5,9733
23,60958
Df
1
3
3
16
23
MS
3,45042
4,60042
0,1282
0,37333
F
F A =9,2423
F B =12,3227
F AB =0,3434
Quyết định + Kết luận:
- F A =9,2423 < F 1;16;5% =246,47
Chấp nhận H 0
Với =5%, mức tăng trưởng theo chiều cao của cây lúa theo loại phân bón
là như nhau.
- F B =12,3227 > F 3;16;5% = 8,69
Bác bỏ H 0
Với =5%, mức tăng trưởng theo chiều cao của cây lúa theo loại đất trồng
khác nhau
- F AB =0,3434 < F 3;16;5% = 8,69
Chấp nhận H 0
17
Bài tập thống kê
ð
Với =5%, không có sự tương tác giữa phân bón và loại đất đến sự tăng
trưởng theo chiều cao của cây lúa.
Phần II/ Kiểm định phi tham số
I/ Kiểm định Wilcoxon (Kiểm định T)
– Kiểm định sự bằng nhau của 2 trung bình tổng thể với mẫu từng cặp.
1/ Mẫu nhỏ (n<=20)
Bài tập:
Trong tháng trước và sau Tết Nguyên Đán, số lượng người mua giày dép tại
10 cửa hàng tại Cần Thơ được thống kê như sau:
Cửa hàng
Trước Tết
Sau Tết
1
50
45
2
60
55
3
65
68
4
100
90
5
80
80
6
90
85
7
77
80
8
85
75
9
40
48
10
67
60
Với mức ý nghĩa 5%, hãy kiểm định lượng người mua giày dép trước và sau
Tết có thực sự khác nhau không?
Giải:
Giả thiết:
H 0 : x - y = 0
H 1 : x - y 0
Giá trị kiểm định:
Cửa hàng
Trước Tết
Sau Tết
Chênh lệch
Hạng +
Hạng -
1
50
45
5
4
2
60
55
5
4
3
65
68
-3
4
100
90
10
8,5
5
80
80
0
1,5
6
90
85
5
4
7
77
80
-3
1,5
8
85
75
10
8,5
9
40
48
-8
7
10
67
60
7
6
T
36,5
8,5
T = min(T ,T ) = min(36,5;8,5)= 8,5
n =9
Quyết định:
T = 8,5 < T 9;5% = 9
=> Bác bỏ giả thuyết H 0 .
Kết luận:
Với =5%, lượng người mua giày dép trước và sau tết thực sự khác nhau.
2/ Mẫu lớn (n>20)
Bài tập:
18
Bài tập thống kê
Công ty sản xuất dầu gội đầu Sunsilk thực hiện một chiến dịch quảng cáo lớn
nhằm tăng lượng mua hàng trong cả nước. Để kiểm tra chiến dịch quảng cáo có hiệu
quả hay không, nhà sản xuất đã cử người điều tra trước và sau chiến dịch quảng cáo,
mẫu là 200 người ở mỗi địa bàn trong 50 địa bàn dân cư (xã, phường) của thành phố
Cần Thơ, những người được chọn sẽ được yêu cầu kể tên 5 loại dầu gội đầu.
Ở từng địa bàn, trước và sau khi thực hiện chiến dịch quảng cáo, số lần goohi
đầu dầu gội Sunsilk được ghi nhận lại. Chênh lệch trước và sau quảng cáo của số lần
gội cũng được tính toán, xếp hạng theo giá trị tuyệt đối của chúng (không có chênh
lệch 0). Tổng cộng hạng của các chênh lệch dương có giá trị nhỏ hơn và bằng 625.
Hãy xem xét xem sau chiến dịch quảng cáo dầu gội đầu Sunsilk có được khách hàng
biết đến nhiều hơn trước hay không với mức ý nghĩa 5%?
Giải:
Giả thiết:
H 0 : Khách hàng nhận biết nhãn hiệu gội đầu Sunsilk trước và sau quảng cáo
là như nhau.
H 1 : Sau chiến dịch quảng cáo, khách hàng biết đến dầu gội Sunsilk nhiều hơn.
Ta có: n=50>20
=> Sử dụng Wilcoxon với mẫu lớn
Theo đề ta có:
n=50, T=625
T =
T2 =
50 x (50 1)
= 637,5
4
50 x (50 1) x (50 x 2 1)
24
= 10731,25
=> T =103,5917
Z=
625 637,5
103,5917
= -0,12067s
Vì bài này là kiểm định 2 đuôi nên:
Ta có Z =0,12067 < Z 0, 025 = 1,96
ð
Chấp nhận H 0 .
Kết luận: Khách hàng nhận biết nhãn hiệu gội đầu Sunsilk trước và sau quảng
cáo là như nhau.
3/ Tài liệu tham khảo thêm về thực hiện kiểm định dấu và Wilcoxon trong
SPSS.
Ví dụ: Điều trị 10 bệnh nhân có ferritin máu cao, với lượng ferritin máu trước
và sau điều trị được ghi nhận trong bảng sau:
Bảng: Lượng ferritin máu (ng/ml) trước và sau điều trị:
19
Bài tập thống kê
Tổng hợp có:
7 (-): 7 trường hợp ferritin giảm sau điều trị.
2 (+): tăng ferritin sau điều trị.
1 trường hợp ferritin không thay đổi.
Thực hiện kiểm định dấu và Wilcoxon trong SPSS.
Nhập dữ liệu vào SPSS như sau:
Có 3 cột:
Cột 1: ID bệnh nhân.
Cột 2: Ferritin trước điều trị.
Cột 3: Ferritin sau điều trị.
20
- Xem thêm -