Mô tả:
thống kê sinh học
Thống kê sinh học
PGS. TS. Nguyễn Ngọc Chiến
Viện Công nghệ Dược phẩm Quốc gia
Bộ môn Công Nghiệp Dược
Trường Đại học Dược Hà nội
Mục đích
1. Sử dụng đúng phương pháp thống kê
để xử lý một bộ dữ liệu.
2. Đọc được kết quả thống kê.
3. Phân tích và kiểm tra được các giả
định của thống kê.
4. Viết được các kết luận thống kê.
Lượng giá – Chú ý thi
1. Lượng giá:
1.1. Kiểm tra thường kỳ:
+ T. Dũng: 10%
+ T. Chiến: 9% (đối với cao học) hoặc 8% (CK 2)
1.2. Kiểm tra cuối kỳ: 80%
1.3. Bài tập (1 hoặc 2%): Mỗi học viên chọn 1 bộ (3.31.; 5.24 và
bài tập 8-tự tạo dữ liệu) hoặc (3.33.; 5.25. và 8.23.-tự tạo
dữ liệu) để làm. Nộp vào sau khi thực tập 5 ngày.
2. Chú ý thi:
- Lớp trưởng kiểm tra với phòng Sau đại học về bảng được
phép mang vào phòng thi (T. Chiến): Phân bố t, phân bố
F, bảng kiểm định Wilcoxon dấu-xếp hạng, bảng kiểm
định tổng xếp hạng Wilcoxon.
Chương 1: Một số khái niệm
Quần thể: không biết
Mẫu: tính được
Trung bình : trung bình
cộng, Y
•
Trung vị: vị trí ở giữa.
•
Cách tính: k=(n+1)/2.
Nếu k là một số nguyên,
trung vị = số ở vị trí k.
Nếu k ở giữa 2 nguyên, trung
vị = trung bình cộng của 2 số
ở giữa.
3. Phân bố bình thường (chuẩn): 3. Phân bố bình thường (chuẩn):
Trung bình cộng = trung vị
Trung bình cộng = trung vị
4. Độ lệch chuẩn: s
4. Độ lệch chuẩn: σ
5. Phân bố quần thể có thể
5. Phân bố mẫu có thể chuẩn hoặc
chuẩn hoặc không
không
6. Phân bố trung bình sẽ là chuẩn,
nếu cỡ mẫu lớn.
•
Trung bình: trung bình
cộng, µ
Trung vị: vị trí ở giữa.
•
Chương 1: Một số khái niệm
2. Đặc điểm của phân bố bình thường (chuẩn)
-
Phân bố hình chuông, đặc biệt phân bố chuẩn µ=0, σ =1.
µ ± σ chứa ~ 68% dữ liệu
µ ± 2σ chứa ~ 95% dữ liệu
µ ± 3 σ chứa ~ hầu hết các dữ liệu.
3. Các loại trung bình khác: dùng cho phân bố không
chuẩn:
-
Trung bình logarit: (Geometric mean): dùng cho các
thông số dược động học như Cmax, AUC…
Trung bình: harmonic mean: dùng cho nửa đời (halflife)
4. p-value (=p) xác xuất thu được giá trị lớn hơn giá trị
tuyệt đối tính được ở mỗi kiểm định.
5. Các phương pháp thống kê thông thường chỉ có ý
nghĩa khi phân bố mẫu bình thường (chuẩn).
Chương 1: Ví dụ về phân bố chuẩn
Chương 1: Các kết luận rút ra từ mẫu NC
Cách phân chia các đơn vị nghiên cứu
Ngẫu
nhiên
Ngẫu nhiên (NN)
Không ngẫu nhiên
Một mẫu NN được lựa chọn
từ một quần thể; → phân các
đơn vị tới các nhóm nghiên
cứu một cách ngẫu nhiên
Các mẫu ngẫu
nhiên được lựa
chọn từ một quần
thể đã biết.
Không Đã tồn tại các đơn vị nghiên
ngẫu
(NC) cứu; sau đó các đơn vị
nhiên NC được phân tới các nhóm
NC một cách ngẫu nhiên.
Có thể rút ra kết luận
nguyên nhân và kết quả
Đã tồn tại các đơn
vị nghiên cứu ở
các nhóm đã tồn
tại.
Kết luận
có thể
suy ra
quần thể
Chương 1: Các kết luận rút ra từ mẫu NC
Cách phân chia các đơn vị nghiên cứu
Ngẫu nhiên (NN)
Ngẫu
nhiên
Lấy mẫu ngẫu nhiên
Phân chia mẫu ngẫu nhiên
Không ngẫu nhiên
Lấy mẫu không
ngẫu nhiên.
Không Lấy mẫu KHÔNG ngẫu nhiên Cả 2 đều không
ngẫu
Phân chia mẫu ngẫu nhiên
ngẫu nhiên
nhiên
Có thể rút ra kết luận nguyên nhân và kết quả
khi phân chia ngẫu nhiên đơn vị thí nghiệm vào
các nhóm nghiên cứu
Kết luận
suy ra quần
thể khi lấy
mẫu ngẫu
nhiên từ
quần thể
Chương 1: Một số khái niệm
1. Câu hỏi 1: Tại sao cần phân bố bình thường (chuẩn)?
-
Khi so sánh các mẫu, thường dùng trung bình mẫu.
Trung bình mẫu chỉ đại diện cho mỗi mẫu khi và chỉ khi
mẫu/hoặc trung bình mẫu phân bố chuẩn.
Ví dụ: Ở 1 công ty, lương TB 90% cán bộ là 5 triệu
/tháng, 10% cán bộ là 50 triệu/ tháng, hỏi lương TB công
ty là bao nhiêu?
Trả lời: Lương TB = 0.9*5+50*0.1=9,5 triệu có đại diện
cho lương TB của công ty không?
2. Câu hỏi 2: Nếu khi mẫu/trung bình mẫu không phân
bố chuẩn thì làm như thế nào?
-
Chuyển dạng dữ liệu mẫu để có được phân bố mẫu
chuẩn.
Loại bỏ yếu tố ngoại lai.
Nếu giữ yếu tố ngoại lai, phải dữ liệu nhiều, phải tìm
hiểu về chúng.
Chương 1: Một số khái niệm
3. Câu hỏi 3: Tại sao lại quan tâm thí nghiệm ngẫu
nhiên?
-
Thí nghiệm ngẫu nhiên sẽ phân bố ngẫu nhiên và cân
bằng các yếu tố gây nhiễu vào mỗi nhóm, do vậy giảm sai
số chủ quan hoặc cố tình gây ra.
Chỉ có thí nghiệm ngẫu nhiên mới rút ra kết luận nguyên
nhân và kết quả.
Chỉ có lấy mẫu ngẫu nhiên từ quần thể mới ngoại suy kết
luận ra ngoài quần thể.
4. Câu hỏi 4: Đơn vị thí nghiệm là gì?
Đơn vị thí nghiệm là 1 đơn vị nhỏ nhất được áp dụng
nghiên cứu, thay đổi nghiên cứu trên đơn vị đó.
Câu hỏi
1. Một thí nghiệm ngẫu nhiên là:
A. Phân bố chủ ý các đơn vị thí nghiệm vào các nhóm
B. Phân bố ngẫu nhiên các đơn vị thí nghiệm vào các nhóm
C. Lấy ngẫu nhiên các đơn vị thí nghiệm từ quần thể
D. Lấy chủ ý các đơn vị thí nghiệm từ quần thể.
2. Một mẫu ngẫu nhiên là:
A. Phân bố chủ ý các đơn vị thí nghiệm vào các nhóm
B. Phân bố ngẫu nhiên các đơn vị thí nghiệm vào các nhóm
C. Lấy ngẫu nhiên các đơn vị thí nghiệm từ quần thể
D. Lấy chủ ý các đơn vị thí nghiệm từ quần thể.
3. Chỉ có thể rút ra kết luận nguyên nhân và kết quả khi lấy
mẫu ngẫu nhiên.
Đ/S
4. Chỉ có thể ngoại suy kết luận ra ngoài quần thể khi phân bố
ngẫu nhiên các đơn vị thí nghiệm vào mỗi nhóm.
Đ/S
Câu hỏi
5. Một thí nghiệm quan sát:
A. Không lấy mẫu ngẫu nhiên từ quần thể
B. Không phân bố ngẫu nhiên các đơn vị thí nghiệm vào các
nhóm
C. Không có ý nào đúng
D. Cả A và B.
6. Có thể rút ra kết luận nguyên nhân và kết quả khi:
A. Lấy mẫu ngẫu nhiên và phân chia mẫu không ngẫu nhiên
B. Lấy mẫu không ngẫu nhiên và phân chia mẫu ngẫu nhiên
C. Lấy mẫu và phân chia mẫu không ngẫu nhiên.
D. Không ý nào đúng.
7. Tại sao phân bố không chuẩn (bình thường), thì trung bình
không đại diện cho mẫu.
8. Thế nào là yếu tố ngoại lai.
Câu hỏi
9. Đối với phân bố chuẩn, có thể dùng đại lượng nào để so sánh
các nhóm với nhau:
A. Trung bình
C. Không ý nào đúng
B. Trung vị
D. Hoặc A hoặc B.
10. Có thể ngoại suy kết luận ra ngoài quần thể khi:
A. Lấy mẫu ngẫu nhiên và phân chia mẫu không ngẫu nhiên
B. Lấy mẫu không ngẫu nhiên và phân chia mẫu ngẫu nhiên
C. Lấy mẫu và phân chia mẫu không ngẫu nhiên.
D. Không ý nào đúng.
11. Khi trung bình không đại diện cho mẫu, đó là phân bố gì?
12. p-value (p) dùng thay thế cho đại lượng thống kê nào?
Câu hỏi
13. Đánh số ngẫu nhiên sinh viên 1 lớp 40 sinh viên, 4 người bốc
ngẫu nhiên 10 số để chia lớp này thành 4 nhóm, đây là:
A. Một thí nghiệm ngẫu nhiên
B. Một mẫu ngâu nhiên từ quần thể.
C. Cả A và B
D. Không có ý nào đúng.
14. Sau so sánh huyết áp 4 nhóm, có thể:
A. Rút ra kết luận nguyên nhân và kết quả
B. Ngoại suy kết luận ra quần thể
C. Cả A và B
D. Không có ý nào đúng.
Câu hỏi
15. Đánh số ngẫu nhiên thanh niên trong độ tuổi 18-25 trên toàn
nước, dùng phần mềm lựa chọn ngẫu nhiên 100000 thanh
niên, đây là:
A. Một thí nghiệm ngẫu nhiên
B. Một mẫu ngâu nhiên từ quần thể.
C. Cả A và B
D. Không có ý nào đúng.
16. Phân chia ngẫu nhiên 100000 thanh niên lấy được trong bài
15 thành 10 nhóm, sau thí nghiêm có thể:
A. Rút ra kết luận nguyên nhân và kết quả
B. Ngoại suy kết luận ra quần thể
C. Cả A và B
D. Không có ý nào đúng.
Ch−¬ng 1
Thí nghiệm ngẫu nhiên có 2 nhóm NC
Lấy mẫu ngẫu nhiên từ các quần thể
Chương 2: So sánh 2 mẫu độc lập
Case study 01:
•
Một nghiên cứu so sánh khối lượng khi sinh của 15 trẻ có
mẹ không hút thuốc lá (Mẫu 1) so với 14 trẻ có mẹ hút
thuốc lá (Mẫu 2) (Giáo trình TS. Lê Cự Linh, trang 84).
•
Câu hỏi:
1. Có sự khác nhau giữa khối lượng khi sinh giữa 2 nhóm
trẻ này hay không?
Giả thiết Ho: Trung bình (mẫu 1) = TB (mẫu 2)
Giả thiết Ha: Trung bình (mẫu 1) ≠ TB (mẫu 2)
2. Có thể kết luận là mẹ hút thuốc lá dẫn đến trẻ khi sinh
có khối lượng khác với trẻ khi sinh ở mẹ không hút
thuốc?
Chương 2: So sánh 2 mẫu độc lập
Khái niệm hai mẫu độc lập:
- Lấy mẫu độc lập: Phân chia đơn vị nghiên cứu vào
nhóm này độc lập với phân chia đơn vị nghiên cứu vào
nhóm kia.
- Đánh giá độc lập: Đánh giá chỉ tiêu nghiên cứu trên
từng đơn vị nghiên cứu của nhóm này độc lập với
nhóm kia.
- Các yếu tố khác độc lập với nhau:
Chương 2: So sánh 2 mẫu độc lập
Các giả thiết
Đối với 1 mẫu:
• Ho µ = µ0 bậc tự do n- 1
• Ha µ > µ0 (upper tail alternative) tương ứng t > tα
µ < µ0 (lower tail al.) tương ứng t < - tα
µ ≠ µ0 (two-tailed al.) tương ứng /t/ > tα/2
So sánh hai mẫu:
• Ho µ1 – µ2 = D0 (D0=0 hoặc ≠ 0) bậc tự do n1+n2-2
• Ha µ1 – µ2 > D0 (upper tail al.) tương ứng t > tα
µ1 – µ2 < D0(lower tail al.) tương ứng t < - tα
µ1 – µ2 ≠ D0 (two-tailed al.) tương ứng /t/ > tα/2
Chương 2: So sánh 2 mẫu độc lập
(two-sample t-test)
1.Tính các giá trị trung bình, Y1
và độ lệch chuẩn S1 và S2
2. Tính S p =
(n1 − 1) S12 + ( n2 − 1) S 22
(n1 + n 2 − 2)
SE (Y2 − Y 1 ) = S p
Y2
Bậc độ tự do là n1+n2-2
1
1
+
n1 n2
3. Giả thiết Ho: µ1 = µ2; tính p-value
t − statistic =
(Y2 − Y 1 ) − ( µ 2 − µ1 )
SE (Y2 − Y 1 )
4. 95% khoảng tin cậy: Y 2 − Y 1 ± t 0.025,n1 + n2 − 2 * SE (Y 2 − Y 1 )
- Xem thêm -