Đăng ký Đăng nhập
Trang chủ Btl xac suat thong ke...

Tài liệu Btl xac suat thong ke

.PDF
53
123
101

Mô tả:

Tài liệu Bài tập lớn XSTK Bách Khoa HCM
MỤC LỤC Bài 1A: …...........................................................................................................2 1. Đề bài: ............................................................................................................2 2. Dạng bài:.........................................................................................................2 3. Cơ sở lý thuyết: ..............................................................................................2 4. Giải bài toán bằng phần mềm IBM SPSS: .....................................................4 Bài 1B: ...............................................................................................................8 1. Đề bài: ............................................................................................................8 2. Dạng bài:……………………………………………….................................8 3.Cơ sở lý thuyết:................................................................................................8 4. Giải bài toán bằng phần mềm IBM SPSS: ...................................................10 Bài 2:.................................................................................................................18 1. Đề bài: ..........................................................................................................18 2. Dạng bài .......................................................................................................18 3. Cơ sở lí thuyết:..............................................................................................18 4. Giải bài toán bằng phần mềm MS EXCEL: .................................................20 5. Giải bài toán bằng phần mềm IBM SPSS: ...................................................24 Bài 3:.................................................................................................................27 1. Đề bài: ..........................................................................................................27 2. Dạng bài:.......................................................................................................27 3. Cơ sở lý thuyết: ............................................................................................27 4. Giải bài toán bằng phần mềm IBM SPSS: ...................................................29 Bài 4: ................................................................................................................32 1. Đề bài: ..........................................................................................................32 2. Dạng bài:.......................................................................................................32 3. Cơ sở lý thuyết: ............................................................................................32 4. Giải bài toán bằng phần mềm IBM SPSS:....................................................35 BÀI 5: ...............................................................................................................40 1. Đề bài: ..........................................................................................................40 2. Dạng bài:.......................................................................................................40 3. Cơ sở lý thuyết: ............................................................................................40 4. Giải bài toán bằng phần mềm MS EXCEL: .................................................41 5. Giải bài toán bằng phần mềm IBM SPSS: ...................................................44 TÀI LIỆU THAM KHẢO.................................................................................55 1 Bài 1A: (Vd 10 trang 172 SGK XSTK) 1. Đề bài: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố: pH (A) nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố B Yếu tố A B1 B2 C2 C3 C4 C1 B3 B4 C1 9 14 C3 16 C4 A1 C2 12 15 C4 12 C1 A2 C3 13 14 C1 11 C2 A3 C4 10 11 C2 13 C3 A4 Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ? 12 10 14 13 2. Dạng bài: PHÂN TÍCH PHƯƠNG SAI BA YẾU TỐ. 3. Cơ sở lý thuyết: Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan sát G (i = 1, 2... r: yếu tố A; j = 1, 2...r: yếu tố B: k = 1, 2...r: yếu tố C). Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4: B C D A C D A B D A B C A B C D Mô hình vuông la tinh ba yếu tố được trình bày như sau: Yếu tố A Yếu tố B A2 A3 C3 Y313 C4 Y324 C1 Y331 C2 Y342 T3.. A4 T.i. C4 Y414 C1 Y421 C2 Y432 C3 Y443 T4.. A1 T.1. B2 C2 Y122 C3 Y223 T.2. 2 B3 C3 Y133 C4 Y234 Ti.. B4 C4 Y144 T1.. C1 Y241 T2.. B1 C1 Y111 C2 Y212 T.3. T.4. Bảng ANOVA: Nguồn sai số Tổng số bình phương Bậc tự do Bình phương trung bình Giá trị thống kê 𝑟 (r-1) Yếu tố A 𝑇2𝑖.. 𝑇2.. − 2 𝑟 𝑟 𝑖=1 𝑆𝑆𝑅 = ∑ (Hàng) 𝑀𝑆𝑅 = 𝑆𝑆𝑅 𝑟−1 𝑀𝑆𝐶 = 𝑆𝑆𝐶 𝑟−1 𝑟 Yếu tố B (r-1) 𝑇2𝑗.. 𝑇2.. 𝑆𝑆𝑅 = ∑ − 2 𝑟 𝑟 𝑗=1 (Cột) 𝑟 Yếu tố C (r-1) 𝑆𝑆𝑅 = ∑ 𝑘=1 Sai số (r-1)(r-2) Tổng cộng (r2-1) 𝑇2𝑘.. 𝑇2.. − 2 𝑟 𝑟 SSE = SST – (SSF+SSR+SSC) 𝐹= 𝑆𝑆𝐹 𝑟−1 𝐹= 𝑀𝑆𝑅 𝑀𝑆𝐸 𝐹= 𝑀𝑆𝐶 𝑀𝑆𝐸 𝐹= 𝑀𝑆𝐹 𝑀𝑆𝐸 MSE = SSE (r −1)(r − 2) Trắc nghiệm • Giả thiết: H0: μ1 = μ2 = ...= μk ↔ Các giá trị trung bình bằng nhau H1: μi  μj ↔ Có ít nhất hai giá trị trung bình khác nhau. • Giá trị thống k: FR, FC, F • Biện luận: Nếu FR< Fα[r-1,(r-1)(r-2)] → Chấp nhận H0 đối với yếu tố A. Nếu FC < Fα[r-1,(r-1)(r-2)] → Chấp nhận H0 đối với yếu tố B. Nếu F < Fα[r-1,(r1)(r-2)] → Chấp nhận H0 đối với yếu tố C. 3 4. Giải bài toán bằng phần mềm IBM SPSS: Bước 1: Gọi: - H1 là giả thiết: “Trung bình hiệu suất phần trăm (%) của các phản ứng ở các pH khác nhau là như nhau”. - H2 là giả thiết: “Trung bình hiệu suất phần trăm (%) các phản ứng ở các nhiệt độ khác nhau là như nhau”. - H3 là giả thiết: “Trung bình hiệu suất phần trăm (%) của các phản ứng với các chất xúc tác khác nhau là như nhau”. Đối giả thiết: ̅1 “Có ít nhất hai giá trị trung bình hiệu suất (%) của các -𝐻 phản ứng ở các pH khác nhau là khác nhau nhau”. ̅2 : “Có ít nhất hai giá trị trung bình hiệu suất (%) của các -𝐻 phản ứng ở các Nhiệt độ khác nhau là khác nhau nhau”. ̅3 : “Có ít nhất hai giá trị trung bình hiệu suất (%) của các -𝐻 phản ứng với các chất xúc tác khác nhau là khác nhau nhau”. Bước 2: Khai báo các biến dữ liệu trong cửa sổ Variable View. Bước 3: Nhập số liệu vào cửa sổ Data View. 4 Bước 4: Chọn Analyze →General Linear Model → Univariate Bước 5: Đưa biến Hieu_suat vào khung Dependent Variable; đưa các biến pH, Nhiet_do và Chat_xuc_tac vào khung Fixed Factor(s). 5 Bước 6: Chọn Model→Kick chọn Custom→đưa các biến pH, Nhiet_do và Chat_xuc_tac vào khung Model→Continue. Bước 7: Chọn Options→ Descriptive statistic→nhập mức ý nghĩa ở ô Significance level = 0,05→Continue. Cuối cùng chọn OK. 6 Bước 8: Kết quả và biện luận. - Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do [(r – 1, (r – 1)(r – 2)]= (3;6) ta được 𝐹0.05(3; 6) = 4,76 - Bảng Test of Between-Subjects Effects cho ta kết quả FR = FpH = 3,105 FC = FNhiet_do = 11,947 F = FChat_xuc_tac = 30,053 - Vì FR < F0,05 nên ta chấp nhận giả thiết H1 (pH) - Vì FC > F0,05 nên ta bác bỏ giả thiết H2 (nhiệt độ) - Vì F > F0,05 nên ta bác bỏ giả thiết H3 (chất xúc tác) ➢ Kết luận: Trung bình hiệu suất phần trăm (%) của các phản ứng ở các pH khác nhau là như nhau. Có ít nhất hai giá trị trung bình hiệu suất (%) của các phản ứng ở các nhiệt độ khác nhau là khác nhau nhau. Có ít nhất hai giá trị trung bình hiệu suất (%) của các phản ứng với chất xúc tác khác nhau là khác nhau nhau. Suy ra chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất. 7 Bài 1B: (Vd12 trang 181 SGK XSTK) 1. Đề bài: Người ta đã dùng ba mức nhiệt độ gồm 105, 120, 135℃ kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây: Thời gian (phút) X1 15 30 60 15 30 60 15 30 60 Nhiệt độ (℃) X2 105 105 105 120 120 120 135 135 135 Hiệu suất (%) Y 1.87 2.02 3.28 3.05 4.07 5.54 5.03 6.45 7.26 Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115℃ trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu? 2. Dạng bài: HỒI QUY TUYẾN TÍNH ĐA THAM SỐ. 3. Cơ sở lý thuyết: Chúng ta xem xét mối liên hệ tuyến tính giữa một biến phụ thuộc Y và các biến độc lập Xi (i = 1, 2,...k). Đồ thị phân tán giữa các biến là một gợi ý cho chúng ta loại hàm số toán học thích hợp để mô tả và tóm tắt các dữ liệu quan sát . Phương trình tổng quát: Y |𝑋0,𝑋1,…,𝑋𝑘 = B0 + 𝐵1𝑋1 + 𝐵2𝑋2+. . . +𝐵𝑘𝑋𝑘 8 Bảng ANOVA: Nguồn sai số Bậc tự do Tổng số bình phương k SSR=  (Y 'i − Y ' )2 n Hồi quy Bình phương trung bình _ MSR=SSR i =1 n Sai số F= MSR MSE _ SSE=  (Yi − Y ' )2 N-k-1 Giá trị thống kê MSE=SSE/(N-2) i =1 Tổng cộng N-1 I. Giá trị thống kê: -Giá trị R bình phương: -Giá trị R2 được hiệu chỉnh (Adjusted R square) R2 = SSR kF = SST (N− k − 1) + kF Giá trị R2 được hiệu chỉnh (Adjusted R square) R 2ii = (N− 1) R 2 − k k (1 − R 2 ) = R2 − N − k −1 (N− k − 1) ( Rii2 sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ) II. Độ lệch chuẩn: S= III. IV. SSE (S  0,30 là khá tốt) (N − k − 1) Trắc nghiệm thống kê: Đối với một phương trình hồi quy Y |𝑿 = 𝐁𝟎 + 𝐁𝐗, ý nghĩa thống kê của các hệ số Bi (B0 hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất thích hợp của phương trình Y |𝑿 = (𝑿) được đánh giá bằng trắc nghiệm F (phân bố Fischer). Trắc nghiệm t: + Giả thiết: H0: βi = 0 “Các hệ số hồi quy không có ý nghĩa” H0: βi ≠ 0 “Có ít nhất vài hệ số hồi quy có ý nghĩa” Bậc tự do của giá trị t: 𝛾 =N – k – 1. + Giá trị thống kê: t= Bi − i Sn2 ; Sn2 = S2  (Xi − X )2 Phân bố Student  = N – k – 1. + Biện luận: Nếu t < tα (N – k – 1)  chấp nhận giả thiết H0 9 V. Trắc nghiệm F: + giả thiết: H0: βi = 0 “Phương trình hồi quy không thích hợp”. H0: βi ≠ 0 “Phương trình hồi quy thích hợp” với ít nhất vài Bi. + Giá trị thống kê: F= MSR MSE Phân bố Fischer v1 = k, v2 = N – k –1. + Biện luận: Nếu F < Fα (k, N – k –1)  chấp nhận giả thiết H0 4. Giải bài toán bằng phần mềm IBM SPSS: • Bước 1: Gọi Ho là giả thiết: “Phương trình hồi quy không thích hợp” Đối giả thiết H̅0: “Phương trình hồi quy thích hợp” 5. • Bước 2: Khai báo các biến dữ liệu trong cửa sổ Variable View. • Bước 3: Nhập số liệu vào cửa sổ Data View. 10 • Bước 4: Chọn Analyze →Regression →Linear Regression. • Bước 5: Hộp thoại Linear Regression hiện lên, ta đưa biến phụ thuộc Y vào ô Dependent, biến độc lập X1, X2 vào ô Independent(s). • Bước 6: Chọn Statistics→kick chọn R squared chage và Descriptives...→Continue. Với mức ý nghĩa mặc định là 0,05 chọn OK. 11 • Bước 7: Vẽ đồ thị: trong cửa sổ Output chọn Graphs →Legacy Dialogs →Scatter/Dot... →Simple Scatter →Define • Bước 8: Chọn hai biến tương ứng hai trục X, Y →OK 12 • Bước 9: Kết quả và biện luận. ❖ Phương trình hồi quy: Y |𝑿𝟏 = (𝑿𝟏) 13 Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số : B0 = 2,73; B1 = 0,04 Suy ra phương trình hồi quy: Y |𝑋1 = 2,73 + 0,04𝑋1 (R2 = 0,102; S = 1,8112) Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (1; N-k-1) = (1; 7) ( N=9 và k=1 là số biến độc lập), ta được F0.05(1;7) = 5,59 Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 7 ( N=9 và k=1 là số biến độc lập), ta được t0.05 = 2,365 ▪ t0 = 2,129 < t0,05 = 2,365 (Hay Sig.=p-value = 0,071 > 𝛼 = 0,05) ➔ Chấp nhận giả thiết H0. ▪ t1 =1,38 < t0,05 = 2,365 (Hay Sig.=p-value = 0,21 > 𝛼 = 0,05) ➔ Chấp nhận giả thiết H0. ▪ F = 1,905 < F0,05 = 5,590 (Hay Sig.=Fs=0,21 > 𝛼 = 0,05) ➔ Chấp nhận giả thiết H0. ➢ Kết luận: Vậy các hệ số 2,37(B0); 0,04(B1) của phương trình hồi quy Ŷ|X1 = 2,73 + 0,04X1 đều không có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này không thích hợp. Suy ra yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp. 14 ❖ Phương trình hồi quy: Y |𝑿𝟐 = 𝒇(𝑿𝟐) 15 Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số : B0 = -11,14; B2 = 0,13 Suy ra phương trình hồi quy: 𝑌̂|𝑋1 = -11,14 + 0,13𝑋1 (R2 = 0,73; S = 0,9929) Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (1; N-k-1) = (1; 7) ( N=9 và k=1 là số biến độc lập), ta được F0.05(1;7) = 5,59 Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 7 ( N=9 và k=1 là số biến độc lập), ta được t0.05 = 2,365 ▪ t0 = 3,418 > t0,05 = 2,365 (Hay Sig.=p-value = 0,011 < 𝛼 = 0,05) ➔ Bác bỏ giả thiết H0. ▪ t2 =4,757 > t0,05 = 2,365 (Hay Sig.=p-value = 0,002 < 𝛼 = 0,05) ➔ Bác bỏ giả thiết H0. ▪ F = 22,631 > F0,05 = 5,590 (Hay Sig.=Fs=0,002 < 𝛼 = 0,05) ➔ Bác bỏ giả thiết H0. ➢ Kết luận: Vậy các hệ số -11,14(B0); 0,13(B2) của phương trình hồi quy Ŷ|X1 = -11,14 + 0,13X2 đều có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này thích hợp. Suy ra yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp. ❖ Phương trình hồi quy: Y |𝑿𝟏,𝑿𝟐 = 𝒇(𝑿𝟏, 𝑿𝟐) 16 Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số : B0 = -12,70; B1 = 0,04; B2 = 0,13 Suy ra phương trình hồi quy: 𝑌̂|𝑋1,𝑋2 = -12,70 + 0,04𝑋1 + 0,13𝑋2 (R2 = 0,97; S = 0,3297) Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (k; N-k-1) = (2; 6) ( N=9 và k=2 là số biến độc lập), ta được F0.05(2;6) = 5,14 Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 6( N=9 và k=2 là số biến độc lập), ta được t0.05 = 2,447. ▪ t0 = 11,528 > t0,05 = 2,447 (Hay Sig.=p-value = 2,26.10-5 < 𝛼 = 0,05) ➔ Bác bỏ giả thiết H0. ▪ t1 =7,583 > t0,05 = 2,447 (Hay Sig.=p-value = 2,74.10-4 < 𝛼 = 0,05) ➔ Bác bỏ giả thiết H0. ▪ t2 =14,328 > t0,05 = 2,447 (Hay Sig.=p-value =7,233.10-6 < 𝛼 = 0,05) ➔ Bác bỏ giả thiết H0. ▪ F = 131,392 > F0,05 = 5,140 (Hay Sig.=Fs=1,1.10-5 < 𝛼 = 0,05) ➔ Bác bỏ giả thiết H0. ➢ Kết luận: Vậy các hệ số -12,70(B0); 0,04(B1); 0,13(B2) của phương trình hồi quy Ŷ|X1,X2 = -12,70 + 0,04X1 + 0,13X2 đều có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này thích hợp. Suy ra hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ. -Nếu có thì điều kiện nhiệt độ 115℃ trong vòng 50 phút thì hiệu suất phản ứng sẽ là : Ŷ|50,115 =-12,7 +0.04*50 + 0.13*115= 2,45% 17 Bài 2: 1. Đề bài: Đo đường kính X và chiều cao Y của 20 cây ta thu được số liệu sau: X 2.3 2.5 2.6 3.1 3.4 3.7 7.3 3.9 4 4.1 4.1 4.2 4.4 4.7 5.1 5.5 5.8 6.2 6.9 6.9 Y 7 8 4 4 6 6 14 12 8 5 7 8 7 9 10 13 7 11 11 16 a) Tìm đường hồi quy của Y đối với X. b) Tính sai số tiêu chuẩn của đường hồi quy. c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính giữa Y với X. 2. Dạng bài: HỒI QUY TUYẾN TÍNH MỘT THAM SỐ. 3. Cơ sở lí thuyết: Chúng ta xem xét mối liên hệ tuyến tính giữa một biến phụ thuộc Y và một biến độc lập X. Đồ thị phân tán giữa hai biến là một gợi ý cho chúng ta loại hàm số toán học thích hợp để mô tả và tóm tắt các dữ liệu quan sát. Phương trình tổng quát: 18 GIÁ TRỊ THỐNG KÊ: - Giá trị R - bình phương (R- square): - Độ lệch chuẩn (Standard Error): (Sự phân tán của dữ liện càng ít thì giá trị của S càng gần zero). - Trắc nghiệm thống kê: Đối với một phương trình hồi quy , ý nghĩa thống kê của các hệ số Bi (B0 hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất thích hợp của phương trình được đánh giá bằng trắc nghiệm F (phân bố Fischer). - Trắc nghiệm t: + Giả thiết: H0: βi = 0 “Hệ số hồi quy không có ý nghĩa” H0: βi ≠ 0 “Hệ số hồi quy có ý nghĩa” + Giá trị thống kê: Phân bố Student + Biện luận: Nếu -> chấp nhận giả thiết H0. 19 4. Giải bài toán bằng phần mềm MS-Excel a) Tìm đường hồi quy: Bước1: Nhập bảng số liệu như sau: 20
- Xem thêm -

Tài liệu liên quan