I HÅC QUÈC GIA H NËI
TR×ÍNG I HÅC KHOA HÅC TÜ NHIN
- - - - - - O0O - - - - - -
Nguy¹n Huy·n Trang
KT LUN THÈNG K
V NHU CU CHM SÂC
SÙC KHÄE Ð HI D×ÌNG
Chuy¶n ng nh:
X¡c su§t v Thèng k¶ to¡n håc
M¢ sè:
60 46 15
LUN VN THC S KHOA HÅC TON HÅC
Ng÷íi h÷îng d¨n khoa håc:
PGS.TS. Hç «ng Phóc
H Nëi - 2011
Möc löc
Líi nâi ¦u
3
1 Ph÷ìng ph¡p ph¥n t½ch hçi quy logistic
6
1.1
Sè ch¶nh v t sè ch¶nh
. . . . . . . . . . . . . . . . . .
7
1.2
Hçi quy Logistic . . . . . . . . . . . . . . . . . . . . . . .
8
1.3
Mæ h¼nh hçi quy Logistic . . . . . . . . . . . . . . . . . .
11
1.4
1.3.1
×îc l÷ñng c¡c tham sè cõa mæ h¼nh hçi quy logistic 12
1.3.2
Kiºm ành sü phò hñp cõa mæ h¼nh hçi quy logistic
Mæ h¼nh hçi quy Logistic bëi . . . . . . . . . . . . . . . .
16
1.4.1
×îc l÷ñng mæ h¼nh hçi quy Logistic bëi . . . . . .
19
1.4.2
Kiºm ành sü phò hñp cõa mæ h¼nh hçi quy logistic
bëi . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5
13
Þ ngh¾a h» sè cõa mæ h¼nh hçi quy Logistic
. . . . . . .
2 Mæ h¼nh nhi·u mùc cho dú li»u nhà ph¥n
21
23
27
2.1
Mæ h¼nh tuy¸n t½nh nhi·u mùc . . . . . . . . . . . . . . .
28
2.2
Mæ h¼nh nhi·u mùc cho dú li»u nhà ph¥n . . . . . . . . .
30
2.3
Giîi thi»u ph¦n m·m xû lþ sè li»u SPSS v STATA
33
1
. . .
3 K¸t luªn thèng k¶ v· nhu c¦u ch«m sâc sùc khäe ð H£i
D֓ng
36
3.1
Mæ t£ sè li»u
. . . . . . . . . . . . . . . . . . . . . . . .
3.2
Ph¥n t½ch sè li»u m¨u 1
. . . . . . . . . . . . . . . . . .
42
3.3
Ph¥n t½ch sè li»u m¨u 2
. . . . . . . . . . . . . . . . . .
51
3.4
K¸t luªn . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
T i li»u tham kh£o
36
64
2
Líi nâi ¦u
Thèng k¶ to¡n håc l cæng cö nghi¶n cùu ÷ñc sû döng rëng r¢i trong
h¦u h¸t c¡c ng nh khoa håc thüc nghi»m nh§t l trong y håc, sinh håc,
x¢ hëi håc, kinh t¸ v mæi tr÷íng. . . Thèng k¶ to¡n håc gióp cho c¡c
ng nh khoa håc kh¡m ph¡ ra tø c¡c sè li»u thüc nghi»m c¡c quy luªt
nëi t¤i cõa c¡c hi»n t÷ñng trong tü nhi¶n v trong x¢ hëi.
C¡c nghi¶n cùu v· y t¸ cëng çng công ái häi sû döng c¡c cæng cö
cõa thèng k¶ to¡n håc º gi£i ¡p c¡c c¥u häi li¶n quan ¸n h» thèng
ch«m sâc sùc khäe to n d¥n, ÷a ra c¡c b¬ng chùng gióp x¥y düng c¡c
chõ tr÷ìng, ch½nh s¡ch li¶n quan ¸n m¤ng l÷îi cung c§p c¡c dàch vö
ch«m sâc sùc khäe, n¥ng cao hi»u qu£ phöc vö cõa h» thèng y t¸.
Nghi¶n cùu n y câ möc ½ch ¡nh gi¡ c¡c y¸u tè £nh h÷ðng ¸n nhu
c¦u kh¡m chúa b»nh t¤i nh èi vîi hai nhâm èi t÷ñng ng÷íi trong ë
tuêi lao ëng v tr´ em d÷îi 16 tuêi, thæng qua vi»c ¡p döng mæ h¼nh
hçi quy logistic nhi·u mùc ph÷ìng ph¡p thèng k¶ hi»n ¤i ang ÷ñc
sû döng rëng r¢i trong nghi¶n cùu ð nhi·u n÷îc tr¶n th¸ giîi v b÷îc
¦u ÷ñc sû döng t¤i Vi»t Nam.
Luªn v«n K¸t luªn thèng k¶ v· nhu c¦u ch«m sâc sùc khäe ð H£i
D÷ìng bao gçm 3 ch÷ìng v danh möc t i li»u tham kh£o.
Ch÷ìng 1 tr¼nh b y c¡c v§n · cì b£n v· ph÷ìng ph¡p ph¥n t½ch hçi
3
quy logistic v mæ h¼nh hçi quy logistic bëi.
Ch÷ìng 2 giîi thi»u ph÷ìng ph¡p ph¥n t½ch thèng k¶ ÷ñc dòng trong
nghi¶n cùu n y l mæ h¼nh nhi·u mùc cho dú li»u nhà ph¥n, °c bi»t l
mæ h¼nh hçi quy logistic nhi·u mùc.
Düa tr¶n cì sð lþ thuy¸t cõa hai ch÷ìng ¦u, Ch÷ìng 3 ÷a ra c¡c
k¸t qu£ ph¥n t½ch £nh h÷ðng cõa c¡c y¸u tè kinh t¸ - x¢ hëi ¸n nhu c¦u
kh¡m chúa b»nh t¤i nh cõa hai nhâm èi t÷ñng ng÷íi trong ë tuêi
lao ëng v tr´ em d÷îi 16 tuêi. Ph¦n cuèi cõa ch÷ìng 3 ÷a ra mët sè
þ ki¸n v· x¥y düng v ph¡t triºn mæ h¼nh y t¸ gia ¼nh nh¬m n¥ng cao
ch§t l÷ñng y t¸ cëng çng.
Tr÷îc ti¶n, tæi xin ÷ñc b y tä láng bi¸t ìn s¥u sc tîi th¦y gi¡o
h÷îng d¨n PGS. TS Hç «ng Phóc Vi»n To¡n håc Vi»n Khoa håc
v Cæng ngh» Vi»t Nam, ng÷íi th¦y ¢ luæn ëng vi¶n, gióp ï v ch¿
d¨n nhi»t t¼nh cho tæi trong suèt qu¡ tr¼nh nghi¶n cùu.
Tæi xin tr¥n trång c£m ìn c¡c th¦y gi¡o trong khoa To¡n Cì Tin,
°c bi»t c¡c th¦y trong tê Bë mæn X¡c su§t v Thèng k¶ Tr÷íng ¤i
håc Khoa håc Tü nhi¶n ¢ cung c§p cho tæi c¡c ki¸n thùc chuy¶n ng nh
c¦n thi¸t º thüc hi»n · t i. Tæi công xin ch¥n th nh c£m ìn c¡c th¦y
cæ Pháng Sau ¤i håc ¢ nhi»t t¼nh gióp ï tæi trong suèt thíi gian håc
tªp. Tæi xin gûi líi c£m ìn ¸n c¡c anh chà em trong lîp Cao håc Lþ
thuy¸t X¡c su§t v Thèng k¶ 2009 2011, còng c¡c b¤n çng nghi»p v
gia ¼nh ¢ nhi»t t¼nh âng gâp þ ki¸n, ëng vi¶n, gióp ï tæi trong suèt
qu¡ tr¼nh l m luªn v«n.
°c bi»t tæi xin ch¥n th nh c£m ìn s¥u sc tîi sð y t¸ H£i D÷ìng ¢
nhi»t t¼nh v nghi¶m tóc cung c§p nhúng dú li»u ch½nh x¡c v quþ b¡u,
4
m n¸u thi¸u nguçn sè li»u n y tæi khæng thº thüc hi»n ÷ñc.
Tuy ¢ câ nhi·u cè gng nh÷ng b£n luªn v«n n y công khæng tr¡nh
khäi nhúng thi¸u xât, t¡c gi£ r§t mong câ sü tham gia âng gâp þ ki¸n
cõa c¡c th¦y cæ gi¡o, c¡c nh nghi¶n cùu X¡c su§t Thèng k¶ , nghi¶n
cùu y t¸ v c¡c ëc gi£ quan t¥m tîi luªn v«n n y.
H Nëi, ng y 12 th¡ng 1 n«m 2012
Håc vi¶n:
5
Nguy¹n Huy·n Trang
Ch֓ng 1
Ph÷ìng ph¡p ph¥n t½ch hçi quy
logistic
Trong nghi¶n cùu y khoa v khoa håc thüc nghi»m nâi chung th÷íng
câ nhu c¦u ph¥n t½ch mèi quan h» giúa mët (hay nhi·u ) y¸u tè nguy cì
v kh£ n«ng x£y ra mët sü cè(bi¸n cè) n o â, ch¯ng h¤n nh÷ èi vîi
mët nghi¶n cùu v· mèi quan h» giúa thâi quen hót thuèc l¡ v ÷ng th÷
phêi, th¼ y¸u tè nguy cì ð ¥y l thâi quen hót thuèc l¡ v sü cè c¦n
quan t¥m l hi»n t÷ñng b»nh ung th÷ phêi. Trong c¡c nghi¶n cùu n y
èi t÷ñng ph¥n t½ch th÷íng ÷ñc thº hi»n qua c¡c bi¸n sè nhà ph¥n, tùc
l câ/ khæng, mc b»nh/ khæng mc b»nh, ch¸t/ sèng, . . . .Y¸u tè nguy
cì câ thº l c¡c bi¸n sè li¶n töc, c¡c bi¸n nhà ph¥n hay c¡c bi¸n mang
°c t½nh thù bªc.
V§n · °t ra cho c¡c nghi¶n cùu d¤ng n y l l m c¡ch n o º ÷îc
t½nh mùc ë li¶n quan giúa y¸u tè nguy cì v kh£ n«ng x£y ra sü cè.
C¡c ph÷ìng ph¡p ph¥n t½ch nh÷ mæ h¼nh hçi quy tuy¸n t½nh khæng thº
¡p döng ÷ñc bði v¼ bi¸n phö thuëc khæng ph£i l bi¸n li¶n töc m l
bi¸n nhà ph¥n. Ph÷ìng ph¡p phê bi¸n nh§t sû döng º ph¥n t½ch c¡c dú
6
li»u vîi c¡c bi¸n ph£n ùng l÷ïng ph¥n l hçi quy Logistic.
1.1 Sè ch¶nh v t sè ch¶nh
Trong nghi¶n cùu dàch t¹ ng÷íi ta th÷íng so s¡nh t¦n su§t mc b»nh
giúa hai têng thº phìi nhi¹m (thû) v khæng phìi nhi¹m (chùng).
V½ dö: Khi nghi¶n cùu b»nh phêi, c¦n so s¡nh t¦n su§t mc b»nh phêi
cõa nhâm ng÷íi hót thuèc l¡ v nhâm ng÷íi khæng hót thuèc l¡.
Khi t¦n su§t ang x²t l lîn câ thº xem x²t hi»u cõa hai t¦n su§t.
N¸u hi»u sè â kh¡c 0 câ þ ngh¾a th¼ câ thº k¸t luªn t¦n su§t cõa nhâm
thû kh¡c t¦n su§t cõa nhâm chùng.
Tuy nhi¶n khi hai t¦n su§t r§t nhä th¼ vi»c so s¡nh hi»u cõa chóng
r§t khâ, c¦n so s¡nh b¬ng th÷ìng (t sè) giúa hai t¦n su§t. T sè n y
÷ñc gåi l t sè t¦n su§t( hay ë rõi ro t÷ìng èi). N¸u t sè â kh¡c
1 câ þ ngh¾a th¼ câ thº k¸t luªn t¦n su§t cõa nhâm thû kh¡c t¦n su§t
cõa nhâm chùng.
B¶n c¤nh t sè t¦n su§t c¡c nh nghi¶n cùu th÷íng dòng sè ch¶nh(odds)
v t sè ch¶nh (odds ratio) º so s¡nh nhâm chùng vîi nhâm thû.
Sè ch¶nh cõa mët sè sü ki»n x£y ra ÷ñc ành ngh¾a l t¿ sè cõa sè
l¦n x£y ra sü ki»n v sè l¦n khæng x£y ra sü ki»n.
T sè ch¶nh l t sè cõa hai sè ch¶nh. T sè n y g¦n 1 th¼ hai nhâm
khæng câ sü kh¡c bi»t. Ng÷ñc l¤i t sè ch¶nh n y c ng xa 1 th¼ c ng thº
hi»n sü kh¡c bi»t giúa hai nhâm.
7
Phìi nhi¹m
Khæng phìi nhi¹m
Mc b»nh
a
b
Khæng mc b»nh
c
d
b
a
+ T§n su§t
a+c
v
b+d
a/(a + c)
+ T sè t§n su§t
a
+ Sè ch¶nh
c
b/(b + d)
b
v
d
a/c
+ T sè ch¶nh
b/d
1.2 Hçi quy Logistic
Ph¥n t½ch hçi quy nghi¶n cùu mèi quan h» phö thuëc cõa mët bi¸n
(gåi l bi¸n phö thuëc ho°c bi¸n ÷ñc gi£i th½ch) vîi mët hay nhi·u bi¸n
kh¡c (÷ñc gåi l bi¸n ëc lªp hay bi¸n gi£i th½ch). Chóng ta sû döng
c¡c kþ hi»u sau:
Y
Xi
l bi¸n phö thuëc (hay bi¸n ÷ñc gi£i th½ch);
l bi¸n ëc lªp (hay bi¸n gi£i th½ch thù i).
Mët trong nhi·u v§n · m ph¥n t½ch hçi quy gi£i quy¸t l ÷îc l÷ñng
gi¡ trà trung b¼nh cõa bi¸n phö thuëc ùng vîi gi¡ trà ¢ cho cõa bi¸n ëc
lªp
E(Y /Xi )
.
Nâi chung,
E(Y /Xi )
l mët h m cõa
Xi
sao cho:
E(Y /Xi ) = f (Xi )
8
f (Xi )
÷ñc gåi l h m hçi quy têng qu¡t. Khi â
+ H m hçi quy têng qu¡t câ mët bi¸n ëc lªp ÷ñc gåi l h m hçi
quy ìn.
+ N¸u h m hçi quy têng qu¡t câ nhi·u hìn mët bi¸n ëc lªp th¼ ÷ñc
gåi l h m hçi quy bëi.
+ N¸u h m hçi quy têng qu¡t câ d¤ng
β0 , β1
f (Xi ) = β0 + β1 X ,
l c¡c h» sè ch÷a bi¸t, nh÷ng cè ành, th¼
hçi quy tuy¸n t½nh ìn v
β0 , β1
f (Xi )
trong â
÷ñc gåi l h m
gåi l h» sè hçi quy.
Mæ h¼nh hçi quy Logistic kh¡c vîi mæ h¼nh hçi quy tuy¸n t½nh thæng
th÷íng ð ché bi¸n phö thuëc cõa mæ h¼nh Logistic l mët bi¸n l÷ïng
ph¥n m khæng ph£i l bi¸n ành l÷ñng li¶n töc. º thuªn ti»n trong
qu¡ tr¼nh t½nh to¡n ta th÷íng m¢ hâa hai gi¡ trà cõa bi¸n phö thuëc l
1 v 0. Khi â bi¸n l÷ïng ph¥n ÷ñc gåi l bi¸n nhà ph¥n. N¸u khæng
câ ghi chó g¼ °c bi»t, trong luªn v«n n y chóng ta luæn x²t bi¸n phö
thuëc l bi¸n nhà ph¥n.
Hçi quy logistic l hçi quy phi tuy¸n trong â bi¸n ëc lªp l ành t½nh
ho°c ành l÷ñng, bi¸n phö thuëc l nhà ph¥n.
V§n · ÷ñc °t ra l : Trong tr÷íng hñp bi¸n phö thuëc l nhà ph¥n
th¼ h m hçi quy
π(x)
ph£i câ d¤ng nh÷ th¸ n o? .
Câ nhi·u d¤ng h m kh¡c nhau ¢ ÷ñc nhi·u t¡c gi£ · xu§t º x¥y
düng mæ h¼nh to¡n håc cho b i to¡n hçi quy n y. Trong sè c¡c t¡c gi£
â, Cox (1970) ¢ ÷a ra h m logistic. Câ hai lþ do º bi»n minh cho
vi»c chån h m logistic ÷a v o mæ h¼nh hçi quy câ bi¸n phö thuëc l nhà
ph¥n, â l :
9
- T½nh m·m d´o to¡n håc, thuªn ti»n trong t½nh to¡n;
- Cung c§p ÷ñc c¡c gi£i th½ch ¦y õ v· þ ngh¾a sinh håc cõa mæ
h¼nh.
Gi£ sû bi¸n ng¨u nhi¶n Y l mët bi¸n nhà ph¥n, cán X l mët bi¸n
ëc lªp vîi c¡c gi¡ trà t§t ành ÷ñc cho tr÷îc. Khi â, º di¹n t£ mèi
quan h» giúa bi¸n Y v bi¸n X , công nh÷ ¡nh gi¡ kh£ n«ng xu§t hi»n
c¡c gi¡ trà cõa bi¸n Y theo c¡c gi¡ trà ¢ bi¸t cõa X , ta câ thº ÷a ra
mët ành ngh¾a cõa mæ h¼nh hçi quy logistic d¤ng ìn gi£n nh§t nh÷
sau:
ành ngh¾a 1.
H m hçi quy logistic ìn cõa hai bi¸n X v Y câ d¤ng:
eβ0 +β1 X
E(Y /X) =
1 + eβ0 +β1 X
(1.2.1)
Trong â
β0
l h» sè tü do (hay h» sè ch°n),
β1
l h» sè dèc,
X l bi¸n ëc lªp, Y l bi¸n phö thuëc.
eβ0 +β1 X
Kþ hi»u
π(x) = E(Y /X) =
1 + eβ0 +β1 X
l k¼ vång câ i·u ki»n cõa
bi¸n phö thuëc Y ÷ñc cho bði gi¡ trà x cõa bi¸n ëc lªp X. Tø (1.2.1)
ta câ:
π(x).(1 + eβ0 +β1 X ) = eβ0 +β1 X
π(x) = (1 − π(x)).eβ0 +β1 X
π(x)
1 − π(x)
= eβ0 +β1 X
10
ành ngh¾a 2.
Ph²p bi¸n êi sau ÷ñc gåi l ph²p bi¸n êi logit:
π(x)
g(x) = ln
1 − π(x)
(1.2.2)
Nhªn x²t:
+
g(x) = β0 + β1 x
+
0 ≤ π(x) ≤ 1
l h m tuy¸n t½nh cõa
x
vîi
x ∈ (−∞, +∞).
vîi måi gi¡ trà cõa x.
+ Gi£ sû gi¡ trà quan s¡t y cõa bi¸n phö thuëc Y câ d¤ng y
, trong â
ε
gåi l sai sè (hi»u gi¡ trà quan s¡t v k¼ vång câ i·u ki»n
cõa bi¸n phö thuëc). Khi â
ε
N¸u
y=1
th¼
ε = 1 − π(x)
N¸u
y=0
th¼
ε = −π(x)
Tø â,
= π(x)+ε
nhªn hai gi¡ trà sau:
vîi x¡c su§t
vîi x¡c su§t
π(x).
1 − π(x).
ε câ ph¥n phèi nhà thùc vîi E (ε) = 0 v V ar (ε) = V ar (Y ) =
π (x) . [1 − π (x)].
1.3 Mæ h¼nh hçi quy Logistic
X²t bi¸n phö thuëc l bi¸n nhà ph¥n Y v
X1 , X2 , ..., Xk
bi¸n ëc lªp.
Muèn dü o¡n t¦n su§t xu§t hi»n gi¡ trà 1 cõa bi¸n Y theo c¡c bi¸n ëc
lªp, câ thº lªp ph÷ìng tr¼nh hçi quy:
T¦n su§t
= a1 X1 + a2 X2 + · · · + ak Xk + b
H¤n ch¸ cõa mæ h¼nh tr¶n: t¦n su§t ð v¸ tr¡i ch¿ nhªn c¡c gi¡ trà lîn
hìn 0 nhä hìn 1 trong khi v¸ ph£i câ thº nhªn gi¡ trà ¥m d÷ìng b§t k¼.
11
Do â ph£i lªp mæ h¼nh th½ch hñp hìn:
log
T¦n su§t/(1 - T¦n su§t)
= a1 X 1 + a2 X 2 + · · · + ak X k + b
Tø ph÷ìng tr¼nh:
p
log
1−p
= a1 X1 + a2 X2 + ... + ak Xk + b
Ta câ thº chuyºn th nh:
Sè ch¶nh
= exp(a1 X1 + a2 X2 + · · · + ak Xk + b)
Tùc l :
Sè ch¶nh
= exp(b). exp(a1 X1 ). exp(a2 X2 ) . . . exp(ak Xk )
1.3.1 ×îc l÷ñng c¡c tham sè cõa mæ h¼nh hçi quy logistic
º x¡c ành ÷ñc mæ h¼nh ta c¦n ÷îc l÷ñng c¡c tham sè cõa mæ h¼nh
thæng qua sè li»u thu ÷ñc trong m¨u quan s¡t. Câ nhi·u ph÷ìng ph¡p
÷îc l÷ñng tham sè, ð ¥y chóng ta x²t ph÷ìng ph¡p ÷îc l÷ñng hñp lþ
cüc ¤i. Gi£ sû m¨u câ n quan s¡t ëc lªp
l gi¡ trà cõa bi¸n phö thuëc v
s¡t thù
i
xi
(xi , yi ), i = 1, 2, . . . , n,
vîi
yi
l gi¡ trà cõa bi¸n ëc lªp t¤i quan
. Vi»c ÷îc l÷ñng c¡c tham sè cõa mæ h¼nh b¬ng ph÷ìng ph¡p
hñp lþ cüc ¤i ÷ñc thüc hi»n theo quy tr¼nh nh÷ sau:
a. Ta câ
vªy
Y
P (Y = 1 |x) = π (x),
nhªn gi¡ trà
su§t b¬ng
1
P (Y = 0 |x) = 1 − π (x).
do â
vîi x¡c su§t b¬ng
π(xi )
v nhªn gi¡ trà
1 − π (xi ) , i = 1, ..., n.
Vîi méi c°p
(xi , yi ), i = 1, 2, . . . , n
°t
ξ(xi ) = π(xi )yi [1 − π(xi )]1−yi
12
0
Nh÷
vîi x¡c
b. Vîi m¨u n quan s¡t ëc lªp
(xi , yi ), i = 1, 2, . . . , n
ta th nh lªp
h m hñp lþ câ d¤ng
l(β) =
n
Y
ξ(xi ) =
i=1
L§y logarit h m hñp lþ
L(β) =
n
X
n
Y
π(xi )yi [1 − π(xi )]1−yi
(1.3.3)
i=1
??)
(
ta nhªn ÷ñc h m sè câ d¤ng
(yi ln(π(xi )) + (1 − yi ) ln(1 − π(xi )))
(1.3.4)
i=1
c. L§y ¤o h m cõa h m
L(β)
theo
β0
v
β1
ta câ h» ph÷ìng tr¼nh
hñp lþ:
n
P
[yi − π(xi )]
i=1
n
P
=0
(1.3.5)
xi [yi − π(xi )] = 0
i=1
d. Gi£i h»
(1.3.5)
ta câ nghi»m cõa h» ph÷ìng tr¼nh hñp lþ l ÷îc
l÷ñng hñp lþ cüc ¤i cõa c¡c tham sè
l÷ñng hñp lþ cüc ¤i cõa
β = (β0 , β1 ).
Ta kþ hi»u
β̂
l ֔c
β.
1.3.2 Kiºm ành sü phò hñp cõa mæ h¼nh hçi quy logistic
Vi»c kiºm ành sü phò hñp cõa mæ h¼nh, nh¬m tr£ líi c¥u häi: Mæ
h¼nh chùa bi¸n ëc lªp cho chóng ta thæng tin v· bi¸n phö thuëc nhi·u
hìn mët c¡ch ¡ng kº (câ þ ngh¾a thèng k¶) so vîi mæ h¼nh khæng chùa
bi¸n ëc lªp hay khæng?
Kiºm ành t sè h m hñp lþ
º ¡nh gi¡ þ ngh¾a sü câ m°t cõa bi¸n ëc lªp trong mæ h¼nh, ta c¦n
x²t sü thay êi ë l»ch cõa hai mæ h¼nh khi khæng câ bi¸n ëc lªp v
13
khi câ bi¸n ëc lªp.
ành ngh¾a 3.
ë l»ch cõa mæ h¼nh hçi quy logistic, kþ hi»u l D, câ
d¤ng
h m
D = −2 ln
hñp l½ logistic
(1.3.6)
h m hñp l½ b¢o háa
π̂i = π̂(xi ) v tø (1.3.3) ta th§y (1.3.6) câ d¤ng
yi
π̂
1 − π̂
1−yi
n
n
Y
X
i
i
π̂i (1 − π̂i )
D = −2 ln
=
−2
y
ln
+
(1
−
y
)
ln
yi
i
i
1−yi
y
(1
−
y
)
y
1
−
y
i
i
i
i
i=1
i=1
K½ hi»u
Nh÷ vªy, ë l»ch D cõa mæ h¼nh hçi quy logistic l gi¡ trà so s¡nh
giúa logarit h m hñp lþ cõa mæ h¼nh hçi quy logistic v logarit h m hñp
lþ b¢o háa (mæ h¼nh b¢o háa l mæ h¼nh câ sè h» sè b¬ng sè quan s¡t).
ành ngh¾a 4.
Hi»u ë l»ch cõa hai mæ h¼nh khæng câ bi¸n ëc lªp v
câ bi¸n ëc lªp ÷ñc gåi l ti¶u chu©n t l» hñp lþ, kþ hi»u l G:
G =D (mæ h¼nh khæng câ bi¸n ëc lªp) D (mæ h¼nh câ bi¸n ëc lªp).
V¼ hai mæ h¼nh n y câ chung h m hñp lþ b¢o háa n¶n ta câ:
h m
G = −2 ln
hñp l½ logistic khæng câ bi¸n ëc lªp
h m hñp l½ logistic câ bi¸n ëc lªp
Ta kiºm tra sü phò hñp cõa mæ h¼nh hçi quy logistic ìn b¬ng c¡c
kiºm ành gi£ thuy¸t H:
β1 = 0, vîi èi thuy¸t K: β1 6= 0 , tùc l x²t xem
bi¸n ëc lªp X thüc sü câ t¡c ëng tîi bi¸n phö thuëc Y hay khæng.
X²t m¨u câ n quan s¡t, gi£i ph÷ìng tr¼nh hñp l½ khi mæ h¼nh khæng
β1 = 0, ta câ:
" n n
#
X
X
β̂0 = ln
yi
(1 − yi )
câ bi¸n ëc lªp, tùc l
i=1
i=1
14
°t
n1 =
n
P
yi , n0 =
i=1
n
P
(1 − yi ),
ta câ
β0 =
i=1
n1
n0
. Khi â gi¡ trà cõa G
câ d¤ng:
n1
G = −2 ln
n
G=2
n
X
!n1
n0
!n 0
n
n
Y
!
π̂iyi (1 − π̂i )1−yi
i=1
yi ln(π̂i ) + (1 − yi ) ln(1 − π̂i )
i=1
− n1 ln(n1 ) + n0 ln(n0 ) − n ln(n)
!
ành lþ 1. Khi gi£ thuy¸t β1 = 0 óng th¼ ti¶u chu©n thèng k¶ G câ
ph¥n phèi ti»m cªn ph¥n phèi
χ2
vîi bªc tü do b¬ng 1.
Theo hi»u lüc cõa ành lþ tr¶n, º thüc hi»n kiºm ành sü phò hñp
cõa mæ h¼nh hçi quy logistic ìn ta câ thº ti¸n h nh c¡c b÷îc sau:
- T½nh ti¶u chu©n t¿ l» hñp lþ G v gi¡ trà 2logarit h m hñp lþ cõa
mæ h¼nh câ
- Vîi
β1 6= 0
χ2 (1)
, °t gi¡ trà §y b¬ng
α
.
l bi¸n ng¨u nhi¶n câ ph¥n phèi Khi - b¼nh ph÷ìng mët
bªc tü do,t½nh x¡c su§t þ ngh¾a
- So s¡nh
−2l
vîi mùc þ ngh¾a
α = P [χ2 (1) > −2l].
α0
cho tr÷îc (th÷íng ÷ñc §n ành b¬ng
0.001 ho°c b¬ng 0.05)
+ N¸u
α ≤ α0
, ta b¡c bä H (vîi mùc þ ngh¾a
+ N¸u
α > α0
, ta ch§p nhªn H (vîi mùc ë tin cªy
15
α0
)
100(1 − α0 )%)
Kiºm ành theo ti¶u chu©n Wald
B¶n c¤nh ph÷ìng ph¡p kiºm ành t l» h m hñp lþ, ta câ thº sû döng
ph²p kiºm ành thèng k¶ Wald.
ành ngh¾a 5.
Ti¶u chu©n thèng k¶ Wald l t sè
W =
Vîi
β̂1
β̂1
SE(β̂1 )
l gi¡ trà ÷îc l÷ñng cõa tham sè
hñp l½ cüc ¤i,
SE(β̂1 )
ành ngh¾a 6.
β1
theo ph÷ìng ph¡p ÷îc l÷ñng
l sai sè chu©n cõa ÷îc l÷ñng
Vîi gi£ thuy¸t
β1 = 0
β1 .
th¼ ti¶u chu©n thèng k¶ W câ
ph¥n phèi ti»m cªn chu©n N(0.1).
Vîi ành l½ tr¶n ph²p kiºm ành theo ti¶u chu©n Wald vîi gi£ thuy¸t
H:
β1 = 0
v èi thuy¸t K:
β1 6= 0
câ thº thüc hi»n theo c¡c b÷îc sau:
- T½nh ti¶u chu©n thèng k¶ Wald
- Vîi Z l bi¸n ng¨u nhi¶n câ ph¥n phèi chu©n N(0,1) t½nh x¡c su§t
þ ngh¾a
α = P [|Z| > W ].
- So s¡nh
α
vîi gi¡ trà
α0
cho tr֔c:
+ N¸u
α ≤ α0
ta b¡c bä H (vîi mùc þ ngh¾a
+ N¸u
α > α0
ta ch§p nhªn H ( vîi ë tin cªy
α0 )
100(1 − α0 )%)
1.4 Mæ h¼nh hçi quy Logistic bëi
X²t tªp p bi¸n ëc lªp X1 , X2 , ....., Xp . Kþ hi»u vecto X
= (X1 , X2 , ....., Xp ).
X¡c su§t i·u ki»n bi¸n phö thuëc Y theo c¡c gi¡ trà cõa bi¸n ëc lªp X
16
câ d¤ng:
P (Y = 1/x) = π(x)
P (Y = 0/x) = 1 − π(x)
Khi â h m Logit cõa mæ h¼nh hçi quy Logistic bëi ÷ñc biºu di¹n qua
c¡c bi¸n ëc lªp b¬ng ph÷ìng tr¼nh:
g(x) = β0 + β1 x1 + · · · + βp xp
Trong â,
βi , i = 1, p
ành ngh¾a7.
l c¡c h» sè ch÷a bi¸t cán
β0
l h» sè ch°n.
Mæ h¼nh hçi quy Logistic bëi câ d¤ng:
eg(x)
π(x) =
1 + eg(x)
Trong mët sè tr÷íng hñp bi¸n ëc lªp l ríi r¤c ho°c l bi¸n ành t½nh
º ÷a nhúng bi¸n n y v o mæ h¼nh ta sû döng ph÷ìng ph¡p thi¸t k¸
bi¸n (hay lªp bi¸n gi£).
Trong tr÷íng hñp têng qu¡t, khi bi¸n ëc lªp câ thº nhªn k gi¡ trà,
thi¸t k¸
k − 1 bi¸n gi£ D1 , D2 , . . . , D( k − 1), méi bi¸n nhªn gi¡ trà 0 ho°c
1 tòy thuëc v o gi¡ trà cö thº cõa bi¸n ëc lªp ban ¦u. Ta câ c¡ch m¢
hâa l¤i nh÷ trong b£ng sau:
B£ng thi¸t k¸ bi¸n gi£ èi vîi bi¸n nhªn nhi·u gi¡ trà
17
1
Khi t÷ìng ùng vîi kh£ n«ng thù nh§t
0
Khi t÷ìng ùng vîi kh£ n«ng thù nh§t
1
Khi t÷ìng ùng vîi kh£ n«ng thù hai
0
Khi t÷ìng ùng vîi kh£ n«ng thù hai
D1 =
D2 =
...
...
...
1
Khi t÷ìng ùng vîi kh£ n«ng thù
k−1
0
Khi t÷ìng ùng vîi kh£ n«ng thù
k−1
Dk−1 =
T÷ìng ùng vîi kh£ n«ng thù k th¼
Di = 0
vîi
i = 1, . . . , k − 1.
Ta
th÷íng chån kh£ n«ng thù k t÷ìng ùng vîi nhâm chùng, l nhâm dòng
l m chu©n º so s¡nh vîi c¡c nhâm cán l¤i.
Trong mët sè tr÷íng hñp, chóng ta câ thº x¥y düng bi¸n gi£ tø mët
bi¸n li¶n töc. Khi x¥y düng bi¸n gi£ tø mët bi¸n li¶n töc ta c¦n chó þ
mët sè i·u sau:
- Kho£ng c¡ch giúa c¡c nhâm l b¬ng nhau,
- Cï c¡c nhâm l b¬ng nhau,
- C¥n nhc tîi chõ · cõa èi t÷ñng ph¥n nhâm.
Gi£ sû bi¸n ëc lªp thù j l ành t½nh câ
bi¸n gi£
Dju
vîi
u = 1, kj − 1.
mæ h¼nh hçi quy l
βju
kj
kh£ n«ng, khi â câ
kj − 1
Ta gåi h» sè cõa c¡c bi¸n gi£ n y trong
. Ta câ h m Logit cõa mæ h¼nh hçi quy Logistic
t÷ìng ùng câ d¤ng:
kj −1
g(x) = β0 + β1 x1 + · · · +
X
βju Dju + · · · + βp xp
(1.4.7)
u=1
Mæ h¼nh hçi quy Logistic vîi h m logit d¤ng
trong c¡c b i to¡n thüc t¸.
18
(1.4.7) ÷ñc sû döng nhi·u
1.4.1 ×îc l÷ñng mæ h¼nh hçi quy Logistic bëi
º ÷îc l÷ñng mæ h¼nh hçi quy Logistic bëi ta ph£i ÷îc l÷ñng vectì h»
sè
β = (β0 , β1 , . . . , βp ). T÷ìng tü nh÷ trong mæ h¼nh hçi quy Logistic ìn,
ta sû döng ph÷ìng ph¡p ÷îc l÷ñng hñp l½ cüc ¤i. Gi£ sû
(xi1 , . . . , xin ), i = 1, p
(xi , yi ), xi =
l m¨u gçm n quan s¡t ëc lªp. Quy tr¼nh ti¸n
h nh ÷îc l÷ñng vectì h» sè cõa mæ h¼nh ÷ñc thüc hi»n nh÷ sau:
a. Lªp h m hñp l½ v logarit h m hñp l½ cõa m¨u n câ d¤ng:
l(β) =
n
Y
L(β) =
π(xi )yi [1 − π(xi )]1−yi
i=1
n
X
yi ln π(xi ) + (1 − yi ) ln[1 − π(xi )]
i=1
b. ¤o h m logarit h m hñp l½ theo p+1 tham sè
β0 , β1 , . . . , βp
ta câ
h» ph÷ìng tr¼nh hñp l½ gçm p+1 ph÷ìng tr¼nh:
n
P
[yi − π(xi )]
=0
i=1
n
P
xi1 [yi − π(xi )] = 0
i=1
...
n
P
xip [yi − π(xi )] = 0
i=1
c. Gi£i h» ph÷ìng tr¼nh hñp l½ tr¶n ta câ nghi»m l ÷îc l÷ñng hñp l½ cüc
¤i cõa vectì h» sè
β = (β0 , β1 , . . . , βp ),
k½ hi»u l
β̂ = (β̂0 , β̂1 , . . . , β̂p ).
L§y ¤o h m ri¶ng c§p hai logarit h m hñp l½ theo c¡c
β0 , β1 , . . . , βp
câ:
∂ 2 L(β)
∂βj2
=−
n
X
i=1
x2ij πi (1
∂ 2 L(β)
− πi );
∂βi ∂βj
19
=−
n
X
i=1
xij xiu πi (1 − πi )
ta
- Xem thêm -