Mô tả:
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
BỘ MÔN KHOA HỌC ỨNG DỤNG
Bài Tập Lớn
Xác suất thống kê
Nhóm thực hiện: Nhóm VIII
Lớp
: DT01
Năm học 2008-2009
Danh sách sinh viên thực hiện:
1. Lê an thanh
2. Khâu thành lễ
3. Ngô văn thọ
4. Lưu trần sang
5. Nguyễn huy thỏa
6. Dương xuân hòa
7. Nguyễn quang tùng
8. Nguyễn anh hải
9. Nguyễn ngọc nam
10. Nguyễn ngô dũng tuyến
11. Nguyễn hải vương
12. Nguyễn quang tuyến
13. Huỳnh hải phận
60402156
40401317
40402988
60502350
G0074479
G0700824
20702855
80500760
80501753
40303222
60403234
80504318
40502026
-
-
Chọn chương trình Anova: two-Factor without replication trong hộp thoại
data analysis rồi nhấp nút OK
- Trong hộp thoại Anova: two-Factor without replication, lần lượt ấn định
các chi tiết
- Phạm vi đầu vào (input range)
- Nhãn dữ liệu (label in First Row/column)
- Ngưỡng tin cậy ( hoặc mức ý nghĩa): alpha
- Phạm vi đầu ra (output range)
- Sau đó so sánh kết quả và biện luận
4. Kết quả bài toán 1:
Áp dụng phương pháp tính toán thông thường:
Từ số liệu của bai toán ta có:
địa phương
mức độ đau mắt hột
T1
T2
T3
T4
A
47
189
807
1768
B
53
746
1387
946
C
16
228
438
115
2
Theo công thức ta tính được: X qs= 5.6
Tra bảng phân vị X2 ta có : X2= 16.8
Áp dụng MS-EXCEL:
Anova: Two-Factor Without
Replication
SUMMARY
A
B
C
T1
T2
T3
T4
Count
4
4
4
Sum
2811
3132
797
Average
702.75
783
199.25
Variance
613190.9167
308551.3333
32835.58333
3
3
3
3
116
1163
2632
2829
38.66666667
387.6666667
877.3333333
943
394.3333333
96682.33333
228860.3333
683109
MS
400477.5833
548865.5556
202856.1389
F
1.974195041
2.705688665
ANOVA
Source of
Variation
Rows
Columns
Error
SS
800955.1667
1646596.667
1217136.833
Total
3664688.667
df
2
3
6
11
Kết quả và biện luận:
P-value
0.219379
0.138374
F crit
10.92477
9.779538
FR=1.974195 < FCrit=10.92477: Bệnh đau mắt hột phụ thuộc vào từng thời kì.
FC=2.705688 < FCrit=9.779538: Bệnh đau mắt hột phụ thuộc vào từng vùng.
Bài 2
Một nhà tâm lý học nghiên cứu ảnh hưởng của quê quán đối với thời gian
(tính bằng phút) để 1 sinh viên có thể trả lời 1 câu đố. Bốn nhóm sinh viên từ 4
vùng khác nhau (nội thành, ngoại thành, thị trấn, nông thôn) được khỏa sát với kết
quả như sau:
Nội thành
16.5 5.2
12.1 14.3
Ngoại thành 10.9 5.2
10.8 8.9
16.1
Thị trấn
18.6 8.1
6.4
Nông thôn
14.2 24.5 14.8 24.9 5.1
Hãy lập bảng ANOVA cho số liệu trên:
Giải:
Áp dụng MS-EXCEL:
- Nhập dữ liệu vào bảng tính
- Áp dụng “Anova : single-Factor”
- Nhấp lần lượt đơn lệnh tools và lệnh Data analysis
- Chọn chương trình Anova: single-Factor trong hộp thoại data analysis rồi
nhấp nút OK
- Trong hộp thoại Anova: single-Factor, lần lượt ấn định các chi tiết
- Phạm vi đầu vào (input range)
- Cách sắp xếp theo hàng hay cột (Group by)
- Nhãn dữ liệu (label in First Row/column)
Anova: Single Factor
SUMMARY
Groups
16.5
10.9
18.6
14.2
Count
3
4
2
4
ANOVA
Source of Variation SS
Between Groups
177.2385256
Within Groups
373.0691667
Total
550.3076923
Sum
Average
Variance
31.6 10.53333333 22.54333333
41
10.25 20.61666667
14.5
7.25
1.445
69.3
17.325 88.22916667
df
MS
3 59.07950855
9 41.45212963
12
F
1.425246642
P-value
0.298396541
F crit
3.862548358
Bài 3: một trường đại học thu nhập các số liệu về chứng số chứng chỉ mà một sinh
viên theo học và số giờ học ở nhà của anh ta trong một tuần:
X
Y
20
12
25
13
30
12
50
15
20
16
23
16
ở đó X là số giờ học, Y là số chứng chỉ. Tìm hệ số tương quan giữa X và Y. ở mức
ý nghĩa 5%, có sự tương quan giữa hai biến tuyến tính nói trên không.
Bài giải:
Nhập dữ liệu:
x
y
20
25
30
50
20
23
12
13
12
15
16
16
Sữ dụng lệnh Tools và lệnh Data Analysis, chọn chương trình Regression
trong hộp thoại Data Analysis.
Và ta chọn lần lược các thuộc tính:
Phạm vi biến số Y
Phạm vi biến số X
Nhãn dữ liệu
Mức tin cậy 5%
Tọa độ đầu ra
Kết quả:
Phương trình hồi quy: Y = f(X1)
Yx1 = 2.73 + 0.04X1
(R2 = 0.01; S = 2.11)
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.101695
R Square
Adjusted R
Square
Standard
Error
Observations
0.010342
-0.23707
2.110323
6
ANOVA
F
Significanc
eF
0.0418
0.847983
t Stat
P-value
Lower 95%
2.472611
5.47039
4
0.082774
0.20445
0.00543
3
0.84798
3
df
SS
Regression
1
0.186154
Residual
4
17.81385
Total
5
18
Coefficient
s
Standard
Error
Intercept
13.52615
x
0.016923
MS
0.18615
4
4.45346
2
6.661086
-0.21289
Upper
95%
20.3912
2
Lower
95.0%
6.66108
6
Upper
95.0%
20.3912
2
0.24674
-0.21289
0.24674
Pv2 = 0.005 < 0.05
Không chấp nhận giả thiết H0.
Vậy cả hai hệ số 2.37 và 0.04 của phương trình hồi quy đều có ý nghĩa thống kê.
Kết luận: số giờ học có liên quantuyến tính với số chứng chỉ.
Bài 4: Một nhà xã hội học chọn ngẫu nhiên gồm 500 người để trao một bản thăm
dò với các câu hỏi như sau:
Ông bà có đi nhà thờ không?
Mức độ thành kiến về chủng tộc của ông (bà) thế nào?
Kết quả được ghi lại trong báng sau:
Mức độ thành kiến chủng tộc
cao
Đôi khi
không
Có
70
160
170
không
20
50
30
Với mức ý nghĩa 5% có nhận định gì về mối tương quan về việc đi nhà thờ và vấn
đề thành kiến củng tộc?
Bài làm:
1. Cơ sở lý thuyết:
Đây là bài toán kiểm định tính độc lập ( trang 112-113/sgk)
Cho X và Y là 2 dấu hiệu trên cùng 1 tổng thể. Từ một mẫu kích thước n ta có số
liệu:
Y
y1
y2
…
yh
ni
X
x1
n11
n12
…
n1h
n1
x2
n21
n22
…
n2h
n2
…
…
…
…
…
…
xk
nk1
nk2
…
nkh
nk
mj
m1
m2
…
mh
∑=n
Trong đó xi (i=1,…k) các dấu hiệu mà X nhận
yj (j=1,…h) các dấu hiệu mà Y nhận
ni (i=1,…k) số lần X nhận xi
mj (j=1,…h) số lần Y nhận yj
ni,j (i=1,…k; j=1,…h) số lần đồng thời X nhận xi và Y nhận yj
2. Thuật toán sử dụng:
Áp dụng lý thuyết theo sách giáo khoa phương pháp giải như sau:
2
− Tìm : bằng cách tra bảng χα
= [(h-1)(k-1)] từ bảng phân vị
− Tính theo công thức sau:
Đi nhà thờ
Nếu
Nếu
-
< : thì chấp nhận giả thuyết H
> : thì bác bỏ H
3. Áp dụng MS-EXCEL:
Nhập dữ liệu vào bảng tính
Áp dụng “Anova: two-Factor without replication”
Nhấp lần lượt đơn lệnh tools và lệnh Data analysis
-
Chọn chương trình Anova: two-Factor without replication trong hộp thoại
data analysis rồi nhấp nút OK
- Trong hộp thoại Anova: two-Factor without replication, lần lượt ấn định
các chi tiết
- Phạm vi đầu vào (input range)
- Nhãn dữ liệu (label in First Row/column)
- Ngưỡng tin cậy ( hoặc mức ý nghĩa): alpha
- Phạm vi đầu ra (output range)
- Sau đó so sánh kết quả và biện luận
4. Kết quả bài toán 4:
Áp dụng phương pháp tính toán thông thường:
Từ số liệu của bai toán ta có:
Y
cao
Đôi khi
không
n
X
có
70
160
170
400
không
20
50
30
100
m
90
210
200
500
2
Theo công thức ta tính được: χ qs = 5.308
Trang bảng phân vị
ta có
So sánh và kết luận việc đi nhà thờ phụ thuộc vào thành kiến chủng tộc
Áp dụng MS-EXCEL
Anova: Two-Factor Without Replication
có
không
3
3
Su
m
400
100
cao
đôi khi
không
2
2
2
90
210
200
SUMMARY
Count
ANOVA
Source of
Variation
Rows
Columns
Error
SS
15000
4433.333
2100
Total
21533.33
df
1
2
2
Average
133.3333
33.33333
Variance
3033.333
233.3333
45
105
100
1250
6050
9800
MS
15000
2216.667
1050
F
14.28571
2.111111
P-value
0.063414
0.321429
F crit
18.51282
19
5
• Kết quả và biện luận: FR =14.28 < Fcrit= 18.51 : => Việc đi nhà thờ phụ
thuộc vào mức độ thành kiến chủng tộc.
- Xem thêm -