Đăng ký Đăng nhập
Trang chủ Giáo dục - Đào tạo Cao đẳng - Đại học Công nghệ thông tin 34 Bài tập xử lý số liệu trên phần mềm R...

Tài liệu 34 Bài tập xử lý số liệu trên phần mềm R

.DOCX
54
893
60

Mô tả:

BỘ MÔN: THỰC HÀNH XỬ LÝ SỐ LIỆU THỰC NGHIỆM TRONG PHÒNG THÍ NGHIỆM BÀI TẬP TIN HỌC ỨNG DỤNG GVHD: PHẠM MINH TUẤN NHÓM: 4 LỚP: ĐHTP8B DANH SÁCH NHÓM STT 1 2 3 4 5 BÀI 1: HỌ VÀ TÊN Nguyễn Thị Vân Đặng Thị Nhung Lê Thị Hồng Liên Hoàng Hữu Trung Trương Công Vũ MSSV 12064671 12089271 12054971 12128641 12001685 BÀI TẬP TIN HỌC ỨNG DỤNG - p-value = 0.8701>0,05 cho thấy không có sự khác biệt về hiệu suất trích ly của 2 loại dung môi ở mức ý nghĩa α=5%. - Có thể chọn cả 2 loại dung môi này (diethyl eter, cồn) để trích ly polyphenol. Tuy nhiên theo ý kiến cá nhân, ta nên chọn cồn vì giá thành rẻ và không gây ảnh hưởng nhiều tới sức khỏe. PHỤ LỤC: >hieusuat<-c(68,63,74,66,75,52,84,58,84,62) >dungmoi<-gl(2,5) > data1<-data.frame(dungmoi,hieusuat) >plot(data1) > shapiro.test(hieusuat) # p-value = 0.7311 >0.05 nên hiệu suất trích ly của 2 dung môi tuân theo luật phân phối chuẩn. 2 BÀI TẬP TIN HỌC ỨNG DỤNG >var.test(hieusuat~dungmoi) # p-value =0.06226 >0.05 nên không có sự khác biệt về phương sai của hai loại dung môi. > t.test(hieusuat~dungmoi,var.equal=T) # p-value = 0.8701 BÀI 2: 11.4 thời gian bềền bọ t 11.3 11.2 11.1 11 10.9 10.8 1 2 3 4 5 6 7 8 9 10 mẫẫu thực phẩ m p-value = 1.319e-07 < 0.05 nên thời gian bền bọt hki sử dụng CMC có ý nghĩa thống kê ở mức 0.05. Khi sử dụng phụ gia, thời gian bền bọt của đạt 1.22h cao hơn thời gian bền bọt của mẫu đối chứng 0.05h. Nên phụ gia CMC có tác dụng kéo dài thời gian bền bọt. Vì vậy có thể sử dụng loại phụ gia này trong chế biến PHỤ LỤC: >dc=c(1.10,0.99,1.05,1.01,1.02,1.07,1.10,0.98,1.03, 1.12) >CMC=c(1.25,1.31,1.28,1.20,1.18,1.22,1.22,1.17,1.19, 1.21) > t.test(dc,CMC,paired=TRUE) 3 BÀI TẬP TIN HỌC ỨNG DỤNG Paired t-test data: dc and CMC t = -8.7467, df = 9, p-value = 1.078e-05 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.2215188 -0.1304812 sample estimates: mean of the differences -0.176 BÀI: 3 Loại Enzyme A B C D Lượng acid amin tổng số 18.17c +1.17 a 14.80 +0.84 c 19.00 +0.82 ab 16.25 +1.17 Chú thích: các kí tự a,b,c trên cùng một cột để chỉ sự khác biệt lượng acid amin tổng số trong nước mắm khi sử dụng các loại enzyme thủy phân khác nhau. 4 BÀI TẬP TIN HỌC ỨNG DỤNG Lượng acid amin tổ ng sốố (mg/kg) 20 18 16 14 12 10 8 6 4 2 0 1 2 3 4 Loại enzyme BIỂU ĐỒ: khả năng thủy phân của từng loại enzyme(Trong đó 1=A;2=B; 3=C;4=D) Qua kết quả p-value=7.463e-05<0.05 cho thấy lượng acid amin trong nước mắm có sự khác biệt theo thống kê ở mức anpha=0.05. lượng acid amin đạt cao nhất khi sử dụng enzyme C và hàm lượng này theo thống kê không có sự khác biệt khi sử dụng enzyme A, C nhưng lại có sự khác biệt khi sử dụng enzyme B,D. vì vậy để đạt hiệu quả cao chúng tôi đề nghị sử dụng enzyme C để thủy phân trong quá trình sản xuất nước mắm. PHỤ LỤC: >acidamin=c(17,18,17,20,19,18,14,15,16,15,14,19,20,18 , 19,16,15,16,18) >group=c(rep("A",6),rep("B",5),rep("C",4),rep("D",4)) > group=as.factor(group) > analysis=lm(acidamin~group) > anova(analysis) Analysis of Variance Table 5 BÀI TẬP TIN HỌC ỨNG DỤNG Response: acidamin Df Sum Sq Mean Sq F value group 3 50.564 16.8547 Residuals 15 16.383 Pr(>F) 15.431 7.463e-05 *** 1.0922 --Signif. codes: 0.1 ‘ ’ 1 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ > av=aov(acidamin~group) > TukeyHSD(av) diff lwr upr p adj B-A -3.3666667 -5.1905943 -1.5427391 0.0004459 C-A 0.8333333 -1.1109800 2.7776467 0.6151972 D-A -1.9166667 -3.8609800 0.0276467 0.0539882 C-B 4.2000000 2.1794103 6.2205897 0.0001307 D-B 1.4500000 -0.5705897 3.4705897 0.2079384 D-C -2.7500000 -4.8798886 -0.6201114 0.0098498 BÀI 4: Nồng độ phụ gia(%) 0.5 0.3 0.1 Đường kính của bánh 71.14 a +_ 6.89 63.71 ab +_ 6.63 61.14 b +_ 7.15 Chú thích: các kí tự a,b,c trên cùng một cột để chỉ sự khác biệt khả năng trương nở của bánh tại các nồng độ phụ gia sử dụng khác nhau 6 BÀI TẬP TIN HỌC ỨNG DỤNG 72 đ ường kính bánh (cm) 70 68 66 64 62 60 58 56 0.5 0.3 0.1 nốềng đ ộ phụ gia(%) Biểu đồ thể hiện sự phụ thuộc giữa khả năng trương nở và nồng độ phụ gia Theo kết quả ta thấy giá trị p-value=0.037<0.05 cho thấy mức độ trương nở của bánh là khác nhau khi sử dụng phụ gia ở các nồng độ khác nhau. Để đạt hiệu quả cao nhất khi sử dụng phụ gia chúng tôi đề nghị sử dụng phụ gia ở nồng độ 0.3% PHỤ LỤC: >phugia=c(68,80,69,76,68,77,60,71,62,58,74,65,59, 57,58,60,70,51,57,71,61) >group=gl(3,7) >group<- as.factor (group) >data<-data.frame(group,phugia) >analysis<-lm(phugia~group) >anova(analysis) # p- value =0.037<0.05 nên có sự khác biệt giữa 3 loại nồng độ phụ gia. >res<-aov(phugia~group) >TukeyHSD(res) 7 BÀI TẬP TIN HỌC ỨNG DỤNG 2-1 -7.428571 -16.83138 1.9742350 0.1369187 3-1 -10.000000 -19.40281 -0.5971936 0.0361071 3-2 -2.571429 -11.97423 6.8313778 0.7677005 BÀI 5: Dựa vào phép kiểm định t.test giữa mẫu thử nghiệm và mẫu đối chứng chúng ta có p-value = 4.327e-05 <,0.05 nên có sự khác biệt về ý nghĩa thống kê giữa hai yếu tố ở mức ý nghĩa thống kê anpha= 5%.Do đó,có sự khác biệt giữa hàm lượng izozym EST trong máu những người tiếp xúc lâu dài, trực tiếp với hóa chất với những người không tiếp xúc trực tiếp với hóa chất. PHỤ LỤC: >dc=c(3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3. 48,3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3.48, 3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3.48,3.4 5,3.58,3.59,3.62,3.59) >tn=c(3.57,3.57,3.59,3.58,3.67,3.69,3.74,3.58,3.74,3. 75,3.61,3.78,3.67,3.69,3.35,3.58,3.68,3.59,3.58,3.58, 3.68,3.59,3.58,3.74,3.75,3.61,3.78,3.67,3.69,3.74,3.5 8,3.68) >t.test(dc,tn) # p-value = 4.327e-05 BÀI 6: > khongthich=c(15,33) 8 BÀI TẬP TIN HỌC ỨNG DỤNG > thich=c(132,145) > t.test(khongthich,thich,paired=T) > # p-value = 0.0139 (<0.05) cho thấy sự khác biệt về mức độ cảm quan của mứt rau câu khi sử dụng 2 loại hương liệu (hương chanh dây và hương vani) có sự khác biệt có ý nghĩa thống kê ở mức ý nghĩa = 5% >data6=matrix(c(15,132,33,145),2,2,dimnames=list(c("K hongthich","Thich"),c("Huongchanhday","Huongvani"))) > barplot(data6,col="green") KẾT LUẬN: - Mức độ ưa thích đối với hương chanh dây: 132/ (15+132)*100 = 87,79% - Mức độ ưa thích đối với hương vani: 145/(33+145)*100 = 81.46% Suy ra chanh dây có mức độ yêu thích cao hơn nên sử dụng hương chanh dây. Biểu đồ thể hiện mức độ yêu thích giữa hương vani và hương chanh dây. 9 BÀI TẬP TIN HỌC ỨNG DỤNG Biểu đồ thể hiện mức độ yêu thích giữa hương chanh dây và hương vani qua số lượng người BÀI 7: VÙNG I II III Hàm lượng saponin (%) 7.19c +_ 0.43 a 4.22 +_ 2.88 b 5.48 +_ 2.42 Chú thích: các kí tự a,b,c trên cùng một cột để chỉ sự khác biệt hàm lượng saponin khi lấy nhân sâm ở các vùng khác nhau Qua giá trị p-value=0.584> 0.05 cho thấy có sự khác biệt về hàm lượng saponin thu được giữa 3 vùng ở mức ý nghĩa 0.05. để thu được hàm lượng saponin cao nhất và hiệu quả nhất chúng tôi đề nghị lấy nhân sâm ở vùng I 10 BÀI TẬP TIN HỌC ỨNG DỤNG Hàm lượng saponin (%) 8 7 6 5 4 3 2 1 0 1 2 3 VÙNG Biểu đồ thể hiện hàm lượng trung bình của nhân sâm tùy vào từng vùng trồng PHỤ LỤC: >saponin=c(7.53,6.87,7.12,7.53,6.84,6.67,7.81,5.87, 5.64,6.14,6.07,5.79,6.13,6.35,6.5,6.49,6.55,6.63) >group<- as.factor (rep(1:3,c(7,5,6))) > data3<-data.frame(group,saponin) >shapiro.test(saponin) # p-value = 0.584> 0.05 nên bảng số liệu tuân theo phân phối chuẩn. >analysis<-lm(saponin~group) >anova(analysis) # p- value <0.05 nên có sự khác nhau về hàm lượng saponi gữa các vùng. >res<-aov(saponin~group) >TukeyHSD(res) diff lwr upr p adj 2-1 -1.2937143 -1.76514063 -0.8222879 0.0000098 3-1 -0.7540476 -1.20197156 -0.3061237 0.0014894 3-2 0.5396667 0.05214608 1.0271873 0.0293357 11 BÀI TẬP TIN HỌC ỨNG DỤNG BÀI 8: Nếu tôi là nhân viên R & D tôi sẽ chọn các tính chất sau Độ trong sản phẩm 1 Độ màu sản phẩm 1 Hương sản phẩm 1 hoặc Hương sản phẩm 2 Vị mặn sản phẩm 2 PHỤ LỤC: > dotrong1 = c(7,6,7,8,9,7,8,9,7,8) > dotrong2= c(6,5,5,6,4,5,6,7,5,6) >t.test(dotrong1,dotrong2) # p-value = 6.895e-05 <0.05 ,có sự khác biệt giữa dotrong1 và ddootrong2 ở mức ý nghĩa anpha = 5%.Bên cạnh đó trung bình cua dotrong1 =7.6 >trung bình của dotrong2 =5.5. Nên tôi chọn dotrong1(độ trong của sản phẩm 1) > domau1 <- c(8,7,8,9,9,8,6,7,8,7) > domau2 <- c(5,6,5,7,5,4,6,5,6,5) >t.test(domau1,domau2) # p-value = 2.074e-05 <0.05.có sự khác biệt có ý nghĩa ở mức anpha= 5% giữa domau1 và đomau2.Mặt khác trung bình của domau1= 7.7> trung bình của domau2= 5.4 nên tôi chọn domau1(độ màu của sản phẩm 1). > huong1 <- c(8,7,8,7,6,7,7,8,8,9) 12 BÀI TẬP TIN HỌC ỨNG DỤNG > huong2 <- c(7,8,6,5,5,7,8,9,8,8) >t.test(huong1,huong2) #p-value = 0.445 >0.05 không có sự khác biệt có ý nghĩa thống kê ở mức ý nghĩa anpha 5% giữa huong1 và huong2 .Vậy chọn huong1 hoặc huong2 đều được. > viman1 <- c(8,6,7,6,7,8,7,6,7,6) > viman2 <- c(7,8,7,8,9,7,8,8,9,8) >t.test(viman1,viman2) #p-value = 0.004765 <0.05 có sự khác biệt có ý nghĩa ở mức anpha= 5% giữa viman1 va viman2. Mặt khác trung bình của viman1= 6.8< trung bình của viman2= 7.9 nên tôi chọn viman2(vị mặn của sản phẩm 2). BÀI 9: A<- matrix(c(124,107,26,43),nrow=2,byrow=T) >chisq.test(A) data: A X-squared = 4.8184, df = 1, p-value = 0.02816 Kết luận: p-value =0.0286< 0.05,có sự khác nhau ở mức ý nghĩa 5% giữa hai sản phẩm A,B.tôi nhận thấy SP A có tỷ lệ người hài lòng trên tổng số là 0.83> 0.71 là tỷ lệ người yêu thích SP B,nên tôi sẽ chọn SP A để sử dụng. BÀI 10: Qua giá trị p value=0.1066>0.05 ta thấy không có sự khác biệt giữa sản phẩm đang bán và sản phẩm cải 13 BÀI TẬP TIN HỌC ỨNG DỤNG tiến. Công ty không nên tung sản phẩm cải tiến ra thị trường. PHỤ LỤC: db<-c(6,8,7,8,8,9,7,5,6,7,7) ct<-c(8,8,9,7,8,7,7,9,8,9,8) >t.test(ban,caitien, pair=T) # p-value = 0.1066 BÀI 11: Nhóm 1(55 phút) 17.72a +- 0.90 Nhóm 2(70 phút) 21.07b +- 0.58 Nhóm 3(85 phút) 23.3b +- c 1.31 Nhóm4(100 phút) 24.38c +- 0.49 Nhóm5(115 phút) 24.98c +- 0.74 Chú thích: các kí tự a,b,c trên cùng 1 cột để chỉ sự khác biệt hiệu suất trích ly khi sử dụng enzyme ở các thời gian khác nhau. Qua giá trị Pr(>F)=6.491e-06 < 0.05 ta thấy có sự khác biệt hiệu suất trích ly khi thời gian trích ly khác nhau. Hiệu suất trích ly thu được không có sự khác biệt khi thời gian trích ly là 100, 115 phút nhưng lại có sự khác biệt khi thời gian là 55, 70, 85 phút. Để hiệu suất trích ly hiệu quả chúng tôi đề nghị sử dụng enzyme với thời gian trích ly là 100 phút PHỤ LỤC : >group =c(1,1,1,2,2,2,3,3,3,4,4,4,5,5,5) 14 BÀI TẬP TIN HỌC ỨNG DỤNG >y=c(16.77,18.56,17.83,21.52,20.42,21.27,22.16,24.73, 23.01,24.92,24.27,23.96,24.73,24.41,25.82) >group<- as.factor(group) >analysis<- lm(y~group) >anova(analysis) # p-value= 6.491e-06< 0.05.Có sự khác biệt giữa các nhóm thời gian ở mức ý nghĩa anpha=5%. >res<- aov(y~group) >TukeyHSD(res) diff lwr upr p adj 2-1 3.3500000 1.05617893 5.643821 0.0050152 3-1 5.5800000 3.28617893 7.873821 0.0000889 4-1 6.6633333 4.36951226 8.957154 0.0000185 5-1 7.2666667 4.97284560 9.560488 0.0000084 3-2 2.2300000 -0.06382107 4.523821 0.0576303 4-2 3.3133333 1.01951226 5.607154 0.0054137 5-2 3.9166667 1.62284560 6.210488 0.0016040 4-3 1.0833333 -1.21048774 3.377154 0.5541443 5-3 1.6866667 -0.60715440 3.980488 0.1868802 5-4 0.6033333 -1.69048774 2.897154 0.9030810 15 BÀI TẬP TIN HỌC ỨNG DỤNG 30 Hiệu suẫốt trích ly 25 20 15 10 5 0 55 70 85 100 115 thời gian Biểu đồ thể hiện hiệu suất trích ly phụ thuộc vào thờigian trích ly. BÀI 12: GIỐNG LÚA Năng suất 1 7,00 c +c 2 8,60 +3 4,60 a +ab 4 4,80 +Chú thích: các kí tự a,b,c trên cùng 1 cột để 1,00 1,14 1,14 0,84 chỉ sự khác biệt năng suất lúa khi trồng các giống lúa khác nhau KẾT LUẬN: Năng suất cửa các giống khác nhau không phải do ngẫu nhiên mà do phẩm chất giống( do Pr(>F)= 3.229e-05).năng suất lúa không có sự khác biệt ở giống 1, 2 nhưng lại có sự khác biệt ở giống 3,4. Để đạt được hiệu quả tốt nhất, chúng tôi đề nghị chọn giống 2 để phổ biến rộng rãi trong sản xuất 16 BÀI TẬP TIN HỌC ỨNG DỤNG 10 9 Năng suẫốt (kg thóc/đốn vị diện tch 8 7 6 5 4 3 2 1 0 1 2 3 4 Giốống lúa BIỂU ĐỒ: biểu hiện năng suất trung bình của các giống lúa. PHỤ LỤC: > thi.nghiem=gl(4,5) >giong.lua=c(8,7,6,6,8,9,10,7,9,8,5,5,4,3,6,5,4,5,4,6 ) > bai12=data.frame(thi.nghiem,giong.lua) > group=as.factor(thi.nghiem) > analysis=lm(giong.lua~group) > anova(analysis) Df Sum Sq Mean Sq F value group 3 54.55 18.183 Pr(>F) 16.915 3.229e-05 *** > av=aov(giong.lua~group) > TukeyHSD(av) 17 BÀI TẬP TIN HỌC ỨNG DỤNG diff 2-1 lwr 1.6 -0.2760962 upr p adj 3.4760962 0.1091981 3-1 -2.4 -4.2760962 -0.5239038 0.0102311 4-1 -2.2 -4.0760962 -0.3239038 0.0189329 3-2 -4.0 -5.8760962 -2.1239038 0.0000822 4-2 -3.8 -5.6760962 -1.9239038 0.0001458 4-3 0.2 -1.6760962 2.0760962 0.9897700 BÀI 13: Nồng độ enzyme 0 Hàm lượng vitamin C 49.83 a +_ 2.03 0.05 78.12a +_ 1.51 b 0.1 89.03 +_ 1.33 b,c 0.15 91.74 +_ 0.90 c,d o.2 94.32 +_ 0.72 d 0.25 96.75 +_ 1.38 d 0.3 97.57 +_ 1.16 Chú thích:các kí tự a,b,c trên cùng 1 cột để chỉ sự khác biệt hàm lượng vitamin C((mg/g) tính theo hàm lượng chất khô) thu được khi sử dụng các nồng độ enzyme(%)khác nhau. Qua kết quả p-value=2.389*10-15<0.05 cho thấy hàm lượng vitaminC (mg/g) ở các nồng độ chế phẩm có sự khác biệt theo thống kê ở mức alpha =5%. Hàm lượng vitamin C đạt giá trị cao nhất(theo chất khô) khi sử 18 BÀI TẬP TIN HỌC ỨNG DỤNG dụng chế phẩm ở nồng độ 0.3% và hàm lượng này theo thống kê không có sự khác biệt khi sử dụng chế phẩm ở các nồng độ (0.15%, 0.2%, 0.25%, 0.3%)tuy nhiên lại có sự khác biệt so với khi sử dụng ở các nồng độ (0.05%,0.1%). Vì vậy để hàm lượng Vitamin C đạt hiệu quả chúng tôi đề nghị chọn nồng độ là 0.15% PHỤ LỤC: >vtm=c(49.02,48.33,52.14,76.43,78.64,79.31,88.65,90.5 2,87.94,90.75,92.51,91.96,93.56,94.42,94.99,95.23,97. 12,97.91,96.41,97.56,98.73) >group= c(gl(7,3)) >group<- as.factor (group) >data<-data.frame(group,vtm) >analysis<-lm(vtm~group) >anova(analysis) #P-value= 2.389e-15 Có sự khác nhau ở mức ý nghĩa 5% giữa các nhóm >res<-aov(vtm~group) >TukeyHSD(res) $group diff lwr upr p adj 2-1 28.2966667 24.5355155 32.057818 0.0000000 3-1 39.2066667 35.4455155 42.967818 0.0000000 4-1 41.9100000 38.1488488 45.671151 0.0000000 5-1 44.4933333 40.7321822 48.254484 0.0000000 6-1 46.9233333 43.1621822 50.684484 0.0000000 7-1 47.7366667 43.9755155 51.497818 0.0000000 3-2 10.9100000 7.1488488 14.671151 0.0000018 4-2 13.6133333 9.8521822 17.374484 0.0000001 19 BÀI TẬP TIN HỌC ỨNG DỤNG 5-2 16.1966667 12.4355155 19.957818 0.0000000 6-2 18.6266667 14.8655155 22.387818 0.0000000 7-2 19.4400000 15.6788488 23.201151 0.0000000 4-3 2.7033333 -1.0578178 6.464484 0.2468338 5-3 5.2866667 1.5255155 9.047818 0.0040668 6-3 7.7166667 3.9555155 11.477818 0.0000992 7-3 8.5300000 4.7688488 12.291151 0.0000325 5-4 2.5833333 -1.1778178 6.344484 0.2892414 6-4 5.0133333 1.2521822 8.774484 0.0063632 7-4 5.8266667 2.0655155 9.587818 0.0017029 6-5 2.4300000 -1.3311512 6.191151 0.3506392 7-5 3.2433333 -0.5178178 7.004484 0.1131016 7-6 0.8133333 -2.9478178 4.574484 0.9873690 2. Vẽ đồ thị Hàm lượng vitamin C (mg/g) 120 100 80 60 40 20 0 0 0.05 0.1 0.15 0.2 0.25 0.3 nong đ ộ chềố phẩ m (%v/w) BIỂU ĐỒ ẢNH NÔNG ĐỘ ENZYME ĐẾN HÀM LƯỢNG VITAMIN C BÀI 14: >ngươi=c(245,145,367,170,270,48) 20
- Xem thêm -

Tài liệu liên quan