Đăng ký Đăng nhập

Tài liệu Bài tập xác suất thống kê

.PDF
10
650
75

Mô tả:

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA BỘ MÔN KHOA HỌC ỨNG DỤNG  Bài Tập Lớn Xác suất thống kê Nhóm thực hiện: Nhóm VIII Lớp : DT01 Năm học 2008-2009 Danh sách sinh viên thực hiện: 1. Lê an thanh 2. Khâu thành lễ 3. Ngô văn thọ 4. Lưu trần sang 5. Nguyễn huy thỏa 6. Dương xuân hòa 7. Nguyễn quang tùng 8. Nguyễn anh hải 9. Nguyễn ngọc nam 10. Nguyễn ngô dũng tuyến 11. Nguyễn hải vương 12. Nguyễn quang tuyến 13. Huỳnh hải phận 60402156 40401317 40402988 60502350 G0074479 G0700824 20702855 80500760 80501753 40303222 60403234 80504318 40502026 - - Chọn chương trình Anova: two-Factor without replication trong hộp thoại data analysis rồi nhấp nút OK - Trong hộp thoại Anova: two-Factor without replication, lần lượt ấn định các chi tiết - Phạm vi đầu vào (input range) - Nhãn dữ liệu (label in First Row/column) - Ngưỡng tin cậy ( hoặc mức ý nghĩa): alpha - Phạm vi đầu ra (output range) - Sau đó so sánh kết quả và biện luận 4. Kết quả bài toán 1:  Áp dụng phương pháp tính toán thông thường: Từ số liệu của bai toán ta có: địa phương mức độ đau mắt hột T1 T2 T3 T4 A 47 189 807 1768 B 53 746 1387 946 C 16 228 438 115 2 Theo công thức ta tính được: X qs= 5.6 Tra bảng phân vị X2 ta có : X2= 16.8  Áp dụng MS-EXCEL: Anova: Two-Factor Without Replication SUMMARY A B C T1 T2 T3 T4 Count 4 4 4 Sum 2811 3132 797 Average 702.75 783 199.25 Variance 613190.9167 308551.3333 32835.58333 3 3 3 3 116 1163 2632 2829 38.66666667 387.6666667 877.3333333 943 394.3333333 96682.33333 228860.3333 683109 MS 400477.5833 548865.5556 202856.1389 F 1.974195041 2.705688665 ANOVA Source of Variation Rows Columns Error SS 800955.1667 1646596.667 1217136.833 Total 3664688.667 df 2 3 6 11  Kết quả và biện luận: P-value 0.219379 0.138374 F crit 10.92477 9.779538 FR=1.974195 < FCrit=10.92477: Bệnh đau mắt hột phụ thuộc vào từng thời kì. FC=2.705688 < FCrit=9.779538: Bệnh đau mắt hột phụ thuộc vào từng vùng. Bài 2 Một nhà tâm lý học nghiên cứu ảnh hưởng của quê quán đối với thời gian (tính bằng phút) để 1 sinh viên có thể trả lời 1 câu đố. Bốn nhóm sinh viên từ 4 vùng khác nhau (nội thành, ngoại thành, thị trấn, nông thôn) được khỏa sát với kết quả như sau: Nội thành 16.5 5.2 12.1 14.3 Ngoại thành 10.9 5.2 10.8 8.9 16.1 Thị trấn 18.6 8.1 6.4 Nông thôn 14.2 24.5 14.8 24.9 5.1 Hãy lập bảng ANOVA cho số liệu trên: Giải: Áp dụng MS-EXCEL: - Nhập dữ liệu vào bảng tính - Áp dụng “Anova : single-Factor” - Nhấp lần lượt đơn lệnh tools và lệnh Data analysis - Chọn chương trình Anova: single-Factor trong hộp thoại data analysis rồi nhấp nút OK - Trong hộp thoại Anova: single-Factor, lần lượt ấn định các chi tiết - Phạm vi đầu vào (input range) - Cách sắp xếp theo hàng hay cột (Group by) - Nhãn dữ liệu (label in First Row/column) Anova: Single Factor SUMMARY Groups 16.5 10.9 18.6 14.2 Count 3 4 2 4 ANOVA Source of Variation SS Between Groups 177.2385256 Within Groups 373.0691667 Total 550.3076923 Sum Average Variance 31.6 10.53333333 22.54333333 41 10.25 20.61666667 14.5 7.25 1.445 69.3 17.325 88.22916667 df MS 3 59.07950855 9 41.45212963 12 F 1.425246642 P-value 0.298396541 F crit 3.862548358 Bài 3: một trường đại học thu nhập các số liệu về chứng số chứng chỉ mà một sinh viên theo học và số giờ học ở nhà của anh ta trong một tuần: X Y 20 12 25 13 30 12 50 15 20 16 23 16 ở đó X là số giờ học, Y là số chứng chỉ. Tìm hệ số tương quan giữa X và Y. ở mức ý nghĩa 5%, có sự tương quan giữa hai biến tuyến tính nói trên không. Bài giải: Nhập dữ liệu: x y 20 25 30 50 20 23 12 13 12 15 16 16 Sữ dụng lệnh Tools và lệnh Data Analysis, chọn chương trình Regression trong hộp thoại Data Analysis. Và ta chọn lần lược các thuộc tính: Phạm vi biến số Y Phạm vi biến số X Nhãn dữ liệu Mức tin cậy 5% Tọa độ đầu ra Kết quả: Phương trình hồi quy: Y = f(X1) Yx1 = 2.73 + 0.04X1 (R2 = 0.01; S = 2.11) SUMMARY OUTPUT Regression Statistics Multiple R 0.101695 R Square Adjusted R Square Standard Error Observations 0.010342 -0.23707 2.110323 6 ANOVA F Significanc eF 0.0418 0.847983 t Stat P-value Lower 95% 2.472611 5.47039 4 0.082774 0.20445 0.00543 3 0.84798 3 df SS Regression 1 0.186154 Residual 4 17.81385 Total 5 18 Coefficient s Standard Error Intercept 13.52615 x 0.016923 MS 0.18615 4 4.45346 2 6.661086 -0.21289 Upper 95% 20.3912 2 Lower 95.0% 6.66108 6 Upper 95.0% 20.3912 2 0.24674 -0.21289 0.24674 Pv2 = 0.005 < 0.05 Không chấp nhận giả thiết H0. Vậy cả hai hệ số 2.37 và 0.04 của phương trình hồi quy đều có ý nghĩa thống kê. Kết luận: số giờ học có liên quantuyến tính với số chứng chỉ. Bài 4: Một nhà xã hội học chọn ngẫu nhiên gồm 500 người để trao một bản thăm dò với các câu hỏi như sau:  Ông bà có đi nhà thờ không?  Mức độ thành kiến về chủng tộc của ông (bà) thế nào? Kết quả được ghi lại trong báng sau: Mức độ thành kiến chủng tộc cao Đôi khi không Có 70 160 170 không 20 50 30 Với mức ý nghĩa 5% có nhận định gì về mối tương quan về việc đi nhà thờ và vấn đề thành kiến củng tộc? Bài làm: 1. Cơ sở lý thuyết: Đây là bài toán kiểm định tính độc lập ( trang 112-113/sgk) Cho X và Y là 2 dấu hiệu trên cùng 1 tổng thể. Từ một mẫu kích thước n ta có số liệu: Y y1 y2 … yh ni X x1 n11 n12 … n1h n1 x2 n21 n22 … n2h n2 … … … … … … xk nk1 nk2 … nkh nk mj m1 m2 … mh ∑=n Trong đó xi (i=1,…k) các dấu hiệu mà X nhận yj (j=1,…h) các dấu hiệu mà Y nhận ni (i=1,…k) số lần X nhận xi mj (j=1,…h) số lần Y nhận yj ni,j (i=1,…k; j=1,…h) số lần đồng thời X nhận xi và Y nhận yj 2. Thuật toán sử dụng: Áp dụng lý thuyết theo sách giáo khoa phương pháp giải như sau: 2 − Tìm : bằng cách tra bảng χα = [(h-1)(k-1)] từ bảng phân vị − Tính theo công thức sau: Đi nhà thờ Nếu Nếu - < : thì chấp nhận giả thuyết H > : thì bác bỏ H 3. Áp dụng MS-EXCEL: Nhập dữ liệu vào bảng tính Áp dụng “Anova: two-Factor without replication” Nhấp lần lượt đơn lệnh tools và lệnh Data analysis - Chọn chương trình Anova: two-Factor without replication trong hộp thoại data analysis rồi nhấp nút OK - Trong hộp thoại Anova: two-Factor without replication, lần lượt ấn định các chi tiết - Phạm vi đầu vào (input range) - Nhãn dữ liệu (label in First Row/column) - Ngưỡng tin cậy ( hoặc mức ý nghĩa): alpha - Phạm vi đầu ra (output range) - Sau đó so sánh kết quả và biện luận 4. Kết quả bài toán 4:  Áp dụng phương pháp tính toán thông thường: Từ số liệu của bai toán ta có: Y cao Đôi khi không n X có 70 160 170 400 không 20 50 30 100 m 90 210 200 500 2 Theo công thức ta tính được: χ qs = 5.308 Trang bảng phân vị ta có So sánh và kết luận việc đi nhà thờ phụ thuộc vào thành kiến chủng tộc  Áp dụng MS-EXCEL Anova: Two-Factor Without Replication có không 3 3 Su m 400 100 cao đôi khi không 2 2 2 90 210 200 SUMMARY Count ANOVA Source of Variation Rows Columns Error SS 15000 4433.333 2100 Total 21533.33 df 1 2 2 Average 133.3333 33.33333 Variance 3033.333 233.3333 45 105 100 1250 6050 9800 MS 15000 2216.667 1050 F 14.28571 2.111111 P-value 0.063414 0.321429 F crit 18.51282 19 5 • Kết quả và biện luận: FR =14.28 < Fcrit= 18.51 : => Việc đi nhà thờ phụ thuộc vào mức độ thành kiến chủng tộc.
- Xem thêm -

Tài liệu liên quan