Đăng ký Đăng nhập

Tài liệu Toán thống kê

.PDF
157
111
139

Mô tả:

thống kê sinh học
Thống kê sinh học PGS. TS. Nguyễn Ngọc Chiến Viện Công nghệ Dược phẩm Quốc gia Bộ môn Công Nghiệp Dược Trường Đại học Dược Hà nội Mục đích 1. Sử dụng đúng phương pháp thống kê để xử lý một bộ dữ liệu. 2. Đọc được kết quả thống kê. 3. Phân tích và kiểm tra được các giả định của thống kê. 4. Viết được các kết luận thống kê. Lượng giá – Chú ý thi 1. Lượng giá: 1.1. Kiểm tra thường kỳ: + T. Dũng: 10% + T. Chiến: 9% (đối với cao học) hoặc 8% (CK 2) 1.2. Kiểm tra cuối kỳ: 80% 1.3. Bài tập (1 hoặc 2%): Mỗi học viên chọn 1 bộ (3.31.; 5.24 và bài tập 8-tự tạo dữ liệu) hoặc (3.33.; 5.25. và 8.23.-tự tạo dữ liệu) để làm. Nộp vào sau khi thực tập 5 ngày. 2. Chú ý thi: - Lớp trưởng kiểm tra với phòng Sau đại học về bảng được phép mang vào phòng thi (T. Chiến): Phân bố t, phân bố F, bảng kiểm định Wilcoxon dấu-xếp hạng, bảng kiểm định tổng xếp hạng Wilcoxon. Chương 1: Một số khái niệm Quần thể: không biết Mẫu: tính được Trung bình : trung bình cộng, Y • Trung vị: vị trí ở giữa. • Cách tính: k=(n+1)/2. Nếu k là một số nguyên, trung vị = số ở vị trí k. Nếu k ở giữa 2 nguyên, trung vị = trung bình cộng của 2 số ở giữa. 3. Phân bố bình thường (chuẩn): 3. Phân bố bình thường (chuẩn): Trung bình cộng = trung vị Trung bình cộng = trung vị 4. Độ lệch chuẩn: s 4. Độ lệch chuẩn: σ 5. Phân bố quần thể có thể 5. Phân bố mẫu có thể chuẩn hoặc chuẩn hoặc không không 6. Phân bố trung bình sẽ là chuẩn, nếu cỡ mẫu lớn. • Trung bình: trung bình cộng, µ Trung vị: vị trí ở giữa. • Chương 1: Một số khái niệm 2. Đặc điểm của phân bố bình thường (chuẩn) - Phân bố hình chuông, đặc biệt phân bố chuẩn µ=0, σ =1. µ ± σ chứa ~ 68% dữ liệu µ ± 2σ chứa ~ 95% dữ liệu µ ± 3 σ chứa ~ hầu hết các dữ liệu. 3. Các loại trung bình khác: dùng cho phân bố không chuẩn: - Trung bình logarit: (Geometric mean): dùng cho các thông số dược động học như Cmax, AUC… Trung bình: harmonic mean: dùng cho nửa đời (halflife) 4. p-value (=p) xác xuất thu được giá trị lớn hơn giá trị tuyệt đối tính được ở mỗi kiểm định. 5. Các phương pháp thống kê thông thường chỉ có ý nghĩa khi phân bố mẫu bình thường (chuẩn). Chương 1: Ví dụ về phân bố chuẩn Chương 1: Các kết luận rút ra từ mẫu NC Cách phân chia các đơn vị nghiên cứu Ngẫu nhiên Ngẫu nhiên (NN) Không ngẫu nhiên Một mẫu NN được lựa chọn từ một quần thể; → phân các đơn vị tới các nhóm nghiên cứu một cách ngẫu nhiên Các mẫu ngẫu nhiên được lựa chọn từ một quần thể đã biết. Không Đã tồn tại các đơn vị nghiên ngẫu (NC) cứu; sau đó các đơn vị nhiên NC được phân tới các nhóm NC một cách ngẫu nhiên. Có thể rút ra kết luận nguyên nhân và kết quả Đã tồn tại các đơn vị nghiên cứu ở các nhóm đã tồn tại. Kết luận có thể suy ra quần thể Chương 1: Các kết luận rút ra từ mẫu NC Cách phân chia các đơn vị nghiên cứu Ngẫu nhiên (NN) Ngẫu nhiên Lấy mẫu ngẫu nhiên Phân chia mẫu ngẫu nhiên Không ngẫu nhiên Lấy mẫu không ngẫu nhiên. Không Lấy mẫu KHÔNG ngẫu nhiên Cả 2 đều không ngẫu Phân chia mẫu ngẫu nhiên ngẫu nhiên nhiên Có thể rút ra kết luận nguyên nhân và kết quả khi phân chia ngẫu nhiên đơn vị thí nghiệm vào các nhóm nghiên cứu Kết luận suy ra quần thể khi lấy mẫu ngẫu nhiên từ quần thể Chương 1: Một số khái niệm 1. Câu hỏi 1: Tại sao cần phân bố bình thường (chuẩn)? - Khi so sánh các mẫu, thường dùng trung bình mẫu. Trung bình mẫu chỉ đại diện cho mỗi mẫu khi và chỉ khi mẫu/hoặc trung bình mẫu phân bố chuẩn. Ví dụ: Ở 1 công ty, lương TB 90% cán bộ là 5 triệu /tháng, 10% cán bộ là 50 triệu/ tháng, hỏi lương TB công ty là bao nhiêu? Trả lời: Lương TB = 0.9*5+50*0.1=9,5 triệu có đại diện cho lương TB của công ty không? 2. Câu hỏi 2: Nếu khi mẫu/trung bình mẫu không phân bố chuẩn thì làm như thế nào? - Chuyển dạng dữ liệu mẫu để có được phân bố mẫu chuẩn. Loại bỏ yếu tố ngoại lai. Nếu giữ yếu tố ngoại lai, phải dữ liệu nhiều, phải tìm hiểu về chúng. Chương 1: Một số khái niệm 3. Câu hỏi 3: Tại sao lại quan tâm thí nghiệm ngẫu nhiên? - Thí nghiệm ngẫu nhiên sẽ phân bố ngẫu nhiên và cân bằng các yếu tố gây nhiễu vào mỗi nhóm, do vậy giảm sai số chủ quan hoặc cố tình gây ra. Chỉ có thí nghiệm ngẫu nhiên mới rút ra kết luận nguyên nhân và kết quả. Chỉ có lấy mẫu ngẫu nhiên từ quần thể mới ngoại suy kết luận ra ngoài quần thể. 4. Câu hỏi 4: Đơn vị thí nghiệm là gì? Đơn vị thí nghiệm là 1 đơn vị nhỏ nhất được áp dụng nghiên cứu, thay đổi nghiên cứu trên đơn vị đó. Câu hỏi 1. Một thí nghiệm ngẫu nhiên là: A. Phân bố chủ ý các đơn vị thí nghiệm vào các nhóm B. Phân bố ngẫu nhiên các đơn vị thí nghiệm vào các nhóm C. Lấy ngẫu nhiên các đơn vị thí nghiệm từ quần thể D. Lấy chủ ý các đơn vị thí nghiệm từ quần thể. 2. Một mẫu ngẫu nhiên là: A. Phân bố chủ ý các đơn vị thí nghiệm vào các nhóm B. Phân bố ngẫu nhiên các đơn vị thí nghiệm vào các nhóm C. Lấy ngẫu nhiên các đơn vị thí nghiệm từ quần thể D. Lấy chủ ý các đơn vị thí nghiệm từ quần thể. 3. Chỉ có thể rút ra kết luận nguyên nhân và kết quả khi lấy mẫu ngẫu nhiên. Đ/S 4. Chỉ có thể ngoại suy kết luận ra ngoài quần thể khi phân bố ngẫu nhiên các đơn vị thí nghiệm vào mỗi nhóm. Đ/S Câu hỏi 5. Một thí nghiệm quan sát: A. Không lấy mẫu ngẫu nhiên từ quần thể B. Không phân bố ngẫu nhiên các đơn vị thí nghiệm vào các nhóm C. Không có ý nào đúng D. Cả A và B. 6. Có thể rút ra kết luận nguyên nhân và kết quả khi: A. Lấy mẫu ngẫu nhiên và phân chia mẫu không ngẫu nhiên B. Lấy mẫu không ngẫu nhiên và phân chia mẫu ngẫu nhiên C. Lấy mẫu và phân chia mẫu không ngẫu nhiên. D. Không ý nào đúng. 7. Tại sao phân bố không chuẩn (bình thường), thì trung bình không đại diện cho mẫu. 8. Thế nào là yếu tố ngoại lai. Câu hỏi 9. Đối với phân bố chuẩn, có thể dùng đại lượng nào để so sánh các nhóm với nhau: A. Trung bình C. Không ý nào đúng B. Trung vị D. Hoặc A hoặc B. 10. Có thể ngoại suy kết luận ra ngoài quần thể khi: A. Lấy mẫu ngẫu nhiên và phân chia mẫu không ngẫu nhiên B. Lấy mẫu không ngẫu nhiên và phân chia mẫu ngẫu nhiên C. Lấy mẫu và phân chia mẫu không ngẫu nhiên. D. Không ý nào đúng. 11. Khi trung bình không đại diện cho mẫu, đó là phân bố gì? 12. p-value (p) dùng thay thế cho đại lượng thống kê nào? Câu hỏi 13. Đánh số ngẫu nhiên sinh viên 1 lớp 40 sinh viên, 4 người bốc ngẫu nhiên 10 số để chia lớp này thành 4 nhóm, đây là: A. Một thí nghiệm ngẫu nhiên B. Một mẫu ngâu nhiên từ quần thể. C. Cả A và B D. Không có ý nào đúng. 14. Sau so sánh huyết áp 4 nhóm, có thể: A. Rút ra kết luận nguyên nhân và kết quả B. Ngoại suy kết luận ra quần thể C. Cả A và B D. Không có ý nào đúng. Câu hỏi 15. Đánh số ngẫu nhiên thanh niên trong độ tuổi 18-25 trên toàn nước, dùng phần mềm lựa chọn ngẫu nhiên 100000 thanh niên, đây là: A. Một thí nghiệm ngẫu nhiên B. Một mẫu ngâu nhiên từ quần thể. C. Cả A và B D. Không có ý nào đúng. 16. Phân chia ngẫu nhiên 100000 thanh niên lấy được trong bài 15 thành 10 nhóm, sau thí nghiêm có thể: A. Rút ra kết luận nguyên nhân và kết quả B. Ngoại suy kết luận ra quần thể C. Cả A và B D. Không có ý nào đúng. Ch−¬ng 1 Thí nghiệm ngẫu nhiên có 2 nhóm NC Lấy mẫu ngẫu nhiên từ các quần thể Chương 2: So sánh 2 mẫu độc lập Case study 01: • Một nghiên cứu so sánh khối lượng khi sinh của 15 trẻ có mẹ không hút thuốc lá (Mẫu 1) so với 14 trẻ có mẹ hút thuốc lá (Mẫu 2) (Giáo trình TS. Lê Cự Linh, trang 84). • Câu hỏi: 1. Có sự khác nhau giữa khối lượng khi sinh giữa 2 nhóm trẻ này hay không? Giả thiết Ho: Trung bình (mẫu 1) = TB (mẫu 2) Giả thiết Ha: Trung bình (mẫu 1) ≠ TB (mẫu 2) 2. Có thể kết luận là mẹ hút thuốc lá dẫn đến trẻ khi sinh có khối lượng khác với trẻ khi sinh ở mẹ không hút thuốc? Chương 2: So sánh 2 mẫu độc lập Khái niệm hai mẫu độc lập: - Lấy mẫu độc lập: Phân chia đơn vị nghiên cứu vào nhóm này độc lập với phân chia đơn vị nghiên cứu vào nhóm kia. - Đánh giá độc lập: Đánh giá chỉ tiêu nghiên cứu trên từng đơn vị nghiên cứu của nhóm này độc lập với nhóm kia. - Các yếu tố khác độc lập với nhau: Chương 2: So sánh 2 mẫu độc lập Các giả thiết Đối với 1 mẫu: • Ho µ = µ0 bậc tự do n- 1 • Ha µ > µ0 (upper tail alternative) tương ứng t > tα µ < µ0 (lower tail al.) tương ứng t < - tα µ ≠ µ0 (two-tailed al.) tương ứng /t/ > tα/2 So sánh hai mẫu: • Ho µ1 – µ2 = D0 (D0=0 hoặc ≠ 0) bậc tự do n1+n2-2 • Ha µ1 – µ2 > D0 (upper tail al.) tương ứng t > tα µ1 – µ2 < D0(lower tail al.) tương ứng t < - tα µ1 – µ2 ≠ D0 (two-tailed al.) tương ứng /t/ > tα/2 Chương 2: So sánh 2 mẫu độc lập (two-sample t-test) 1.Tính các giá trị trung bình, Y1 và độ lệch chuẩn S1 và S2 2. Tính S p = (n1 − 1) S12 + ( n2 − 1) S 22 (n1 + n 2 − 2) SE (Y2 − Y 1 ) = S p Y2 Bậc độ tự do là n1+n2-2 1 1 + n1 n2 3. Giả thiết Ho: µ1 = µ2; tính p-value t − statistic = (Y2 − Y 1 ) − ( µ 2 − µ1 ) SE (Y2 − Y 1 ) 4. 95% khoảng tin cậy: Y 2 − Y 1 ± t 0.025,n1 + n2 − 2 * SE (Y 2 − Y 1 )
- Xem thêm -

Tài liệu liên quan