Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
CHÖÔNG 6: XÖÕ LYÙ VAØ PHAÂN TÍCH DÖÕ LIEÄU
1. Kieåm tra döõ lieäu (Explore)
Coâng vieäc ñaàu tieân raát quan troïng vaø caàn phaûi thöïc hieän moät caùch caån
thaän tröôùc khi ñi vaøo caùc böôùc moâ taû hay caùc phaân tích thoâng keâ phöùc taïp
sau naøy laø tieán haønh xem xeùt döõ lieäu moät caùch caån thaän. SPSS cung caáp
cho coâng cuï Explore ñeå xem xeùt vaø kieåm tra döõ lieäu:
-
Phaùt hieän caùc sai soùt
-
Nhaän daïng döõ lieäu ñeå tìm phöông phaùp phaân tích thích hôïp vaø
chuaån bò cho vieäc kieåm tra giaû thuyeát
Ñeå nhaän daïng vaø phaùt hieän sai soùt trong döõ lieäu, ta coù ba caùch hieãn thò döõ
lieäu nhö sau
-
Bieåu ñoà Histogram
-
Sô ñoà caønh vaø laù Stem-and-leaf plot
-
Sô ñoà hoäp Boxplot
Ñeå öôùc löôïng caùc giaõ ñònh ñöôïc duøng cho vieäc kieåm nghieäm caùc giaû
thuyeát, ta duøng caùc pheùp kieåm tra sau:
-
Kieåm tra levene: Kieåm tra tính ñoàng ñeàu cuûa phöông sai
-
Kieåm tra K-S Lilliefors: Kieåm tra tính chuaån taéc cuûa toång theå, xem
döõ lieäu coù ñöôïc laáy töø moät phaân boá chuaån hay khoâng
Chuùng ta thöôøng duøng giaù trò trung bình soá hoïc ñeå öôùc löôïng ñoä hoäi tuï cuûa
döõ lieäu. Tuy nhieân vì giaù trò trung bình bò aûnh höôûng bôûi taát caû caùc giaù trò
quan saùt. Ñeå giaûm thieåu nhöõng aûnh höôûng cuûa caùc giaù trò baát thöôøng (quaù
lôùn hoaëc quaù beù), ngöôøi ta thöôøng loaïi boû caùc giaù trò lôùn nhaát vaø caùc giaù
trò nhoû nhaát (Outliers) theo cuøng moät tyû leä naøo ñoù. Khi ñoù giaù trò trung bình
ñöôïc goïi laø giaù trò trung bình giaõn löôïc (Timmed-mean).
Moät caùch laøm khaùc laø gaùn caùc troïng soá khaùc nhau cho caùc giaù trò quan saùt
tuøy theo khoaûng caùch cuûa noù ñeán giaù trò trung bình, caøng xa troïng soá caøng
nhoû. Caùc trong soá naøy goïi laø M-estimators. Coù 4 loaïi troïng soá laø Huber,
Turkey, Hampel, vaø Andrew. Döïa vaøo troïng soá naøy ta öôùc löôïng laïi giaù trò
trung bình cho döõ lieäu.
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
33
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
Ñeå kieåm tra döõ lieäu, choïn treân menu Statistic/Summarize/Explore… ñeå
môû hoäp thoaïi Explore nhö Hình 6-1:
Hình 6-1
Caùc bieán trong taäp döõ lieäu xuaát hieän trong hoäp beân traùi. Choïn moät hay
nhieàu bieán ñöa vaøo oâ Dependent list, caùc bieán caàn quan saùt seõ ñöôïc lieät
keâ rong oâ naøy. Chuùng ta cuõng coù theå taùch caùc quan saùt thaønh caùc nhoùm
nhoû rieâng bieät ñeå kieåm tra döïa vaøo caùc giaù trò cuûa caùc bieán kieåm soaùt seõ
ñöôïc ñöa vaøo oâ Factor List. Ví duï nhö kieåm tra bieán möùc ñoä ñaùnh giaù noùi
chung döïa vaøo bieán nhaõn hieäu ñang söû duïng. Coù theå laàn ra caùc quan saùt
naøy baèng caùch gaùn nhaõn cho noù baèng gía trò cuûa moät bieán naøo ñoù, bieán
naøy seõ ñöôïc ñöa vaøo trong oâ label cases by. Ví duï muoán bieát nhöõng giaù trò
di thöôøng trong bieán möùc ñoä ñaùnh giaù noùi chung theo nhaõn hieäu TV ñang
duøng. Ta gaùn nhaõn cho caùc quan saùt naøy baèng caùc giaù trò trong bieán soá
baûng caâu hoûi. Luùc naøy neáu coù caùc giaù trò dò thöôøng ta deã daøng laàn ra noù
baèng soá baûng caâu hoûi keøm theo
OÂ Display, cho pheùp chuùng ta choïn caùch hieãn thò keát quaû, caùc tham soâ
thoáng keâ (Statistic), hoaëc ñoà thò (Plot), SPSS maëc ñònh laø hieãn thò caû hai
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
34
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
Söû duïng coâng cuï Statistics cho pheùp ta löïa choïn caùc thoáng keâ hieãn thò nhö
hoäp thoaïi Hình 6-2:
Hình 6-2
-
Descriptives: Cho pheùp ta hieãn thò caùc giaù trò thoáng keâ nhö giaù trò
trung bình, khoaûng tin caäy, trung vò, trung bình giaõn löôïc, giaù trò
nhoû nhaát, lôùn nhaát, khoaûng bieán thieân, caùc baùch phaân vò
-
M-estimators: Hieãn thò caùc giaù trò trung bình theo 4 loaïi troïng soá
-
Outliers: Hieãn thò caùc quan saùt coù 5 giaù trò nhoû nhaát vaø 5 giaù trò lôùn
nhaát, goïi laø Extreme Values
-
Percentiles: Hieån thò caùc giaù trí baùch vò phaân
Söû duïng coâng cuï Plots (Hình 6-3), ñeå löïa choïn hieãn thò daïng ñoà thò
(Histogram), bieåu ñoà chænh taéc, caùc pheùp kieåm tra veà phaân phoái chuaån,
tính ñoàng ñeàu cuûa phöông sai
Hình 6-3
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
35
Phaân tích döõ lieäu baèng SPSS
-
ĐH Kinh Tế TPHCM
Boxplots: Ñieàu kieän ñeå hieãn thò cuûa Boxplots laø ta phaûi ñang quan
saùt nhieàu hôn moät bieán phuï thuoäc (hieãn thò trong oâ dependent list).
o Factor levels together ñöa ra moät hieån thò rieâng bieät cho
moãi bieán phuï thuoäc. Trong phaïm vi moät hieån thò,
Boxplots ñöôïc hieån thò cho moãi moät nhoùm ñöôïc phaân ra
theo giaù trò cuûa bieán ñieàu khieån (factor variable).
Dependents together ñöa ra moät hieån thò rieâng bieät theo
moãi nhoùm ñöôïc phaân theo caùc giaù trò trong bieán ñieàu
khieån. Trong phaïm vi cuûa hieãn thò, boxplots ñöôïc ñöa ra
laàn löôït cho moãi bieán phuï thuoäc
-
Descriptive: Cho pheùp löïa choïn hieån thò daïng ñoà thò Histogram
hay daïng caønh laù (stem-and-leaf plots)
-
Normality plots with tests. Ñöa ra caùc daïng ñoà thò veà phaân phoái
chuaån. Ñoàng thôøi cung caáp moät kieåm nghieäm thoáng keâ
Kolmogorov-Smirnov statistic, vôùi möùc tin caäy Lilliefors duøng ñeå
kieåm nghieän tính chuaån cuûa phaân phoái maãu ñang quan saùt. Moät
kieåm nghieäm khaùc laø thoáng keâ Shapiro-Wilk ñöôïc söû duïng cho maãu
coù kích côû nhoû hôn hoaëc baèng 50 maãu.
-
Spread vs. Level with Levene Test. Cho pheùp chuùng ta kieåm tra
tính ñoàng ñeàu cuûa phöông sai giöõa caùc maãu trong döõ lieäu goác hay
döõ lieäu ñaõ ñöôïc bieán ñoåi. Ñeå thöïc hieän pheùp thoáng keâ Levene ñoøi
hoûi phaûi coù khai baùo bieán ñieàu khieån trong khuoân Factor lists,
Thoàng thöôøng ta thöôøng laøm vieäc treân döõ lieäu goác do ñoù löïa choïn
Untransformed trong khung Spread vs Level with Levene test
Kieåm nghieäm Kolmogorov-Smirnov (Lilliefors)
Kieåm nghieäm Lilliefors laø moät daïng kieåm nghieäm Kolmogorov-Smirnov,
duøng ñeå kieåm nghieäm tính chuaån taéc cuûa moät maãu hay hai maãu. Vôùi
giaù trò sig. nhoû hôn möùc yù nghóa (0.05) laø keát quaû baùc boû giaû thuyeát
phaân phoái maãu laø phaân phoái chuaån. Pheùp kieåm nghieäp Shapiro-Wilk
chæ duøng trong nhöõng tröôøng hôïp soá maãu nhoû hôn 40.
Kieåm nghieäm Levene
Tröôùc khi ñi vaøo caùc kieåm nghieäm trung bình ta caàn phaûi tham khaûo
moät kieåm nghieäm khaùc maø keát quaû cuûa noù laø raát quan troïng cho caùc
kieåm nghieäm trung bình sau naøy. Kieåm nghieäm Levene laø pheùp kieåm
nghieäm tính ñoàng nhaát cuûa phöông sai. ÔÛ ñaây ta kieåm nghieäm giaû
thuyeát cho raèng phöông sai cuûa giöõa caùc maãu quan saùt laø baèng nhau.
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
36
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
Kieåm nghieäm cho ta keát quaû Sig. nhoû hôn möùc tin caäy (5%) ta keát luaän
khoâng chaáp nhaän giaû thuyeát cho raèng phöông sai maãu thì baèng nhau.
Chuù yù trong moät soá kieåm nghieäm nhö ANOVA, kieåm nghieäm t, … Ñoøi
hoûi phaûi kieåm nghieäm thoâng keâ Levene tröôùc ñeå xaùc ñònh tinh caân
baèng hay khoâng caân baèng cuûa caùc phöông sai maãu. Keát quaû naøy seõ
aûnh höôûng ñeán vieäc löïa choïn caùc kieåm nghieäm trung bình khaùc (Kieåm
nghieäp trung bình vôùi phöông sai maãu baèng nhau hoaëc kieåm nghieäm
trung bình vôùi phöông sai maãu khoâng baèng nhau)
2. Laäp baûng phaân boá taàn suaát cho bieán moät traû lôøi (Frequencies)
Coâng cuï Frequencies söû duïng caùc tham soá thoáng keâ ñeå moâ taû cho nhieàu
loaïi bieán, ñaây cuõng laø moät coâng cuï höõu ích ñeå ta khaûo saùt döõ lieäu tìm loãi
cho döõ lieäu.
Chuùng ta coù theå khaûo saùt döõ lieäu thoâng qua caùc coâng cuï nhö: Taàn suaát
xuaát hieän, phaàn traêm, phaàn traêm tích luõy. Ngoaøi ra noù coøn cung caáp cho
ta caùc pheùp ño löôøng thoâng keâ nhö ñoä taäp trung (central tendency
measurement), ñoä phaân taùn (dispersion), töù phaân vò (Quartiles) vaø caùc
baùch phaân vò (percentiles), phaân phoái döõ lieäu (distribution).
Laäp baûng naøy ngoaøi vieäc toùm taét döõ lieäu, noù coøn giuùp ta phaùt hieän nhöõng
sai soùt trong döõ lieäu nhö, nhöõng giaù trò baát thöôøng (quaù lôùn hay quaù nhoû)
coù theå laøm sai leäch keát quaû phaân tích thoáng keâ, nhöõng giaù trò maõ hoùa baát
thöôøng do sai soùt vieäc nhaäp lieäu hay maõ hoùa
Ñeå
tieán
haønh
laäp
baûng
ñôn
ta
choïn
coâng
Statistic/sumarize/frequencies ta coù hoäp thoaïi nhö Hình 6-4:
cuï
Hình 6-4
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
37
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
Chuyeån bieán caàn moâ taû sang hoäp thoaïi variable(s, ta coù theå löïa choïn
nhieàu bieán caàn quan saùt cuøng moät luùc.
Coâng cuï Charts ñöôïc duøng ñeå veõ ñoà thò cho döõ lieäu, vaø coâng cuï Format
ñöôïc söû duïng ñònh ra kieåu hieån thò cuûa döõ lieäu, theo thöù töï taêng daàn hoaëc
giaõm daàn.
Coâng cuï statistics ñeå truy suaát hoäp thoaïi nhö Hình 6-5. Trong hoäp thoaïi
statistics naøy seõ bao goàm caùc coâng cuï ñeå ño löôøng caùc giaù trò thoáng keâ cuûa
döõ lieäu nhö vò trí töông ñoái cuûa caùc nhoùm giaù trò hay coøn goïi laø caùc phaân
vò, maät ñoä taäp trung vaø phaân taùn cuûa döõ lieäu, nhöõng ñaëc tính veà phaân
phoái cuûa döõ lieäu (Distribution)
Hình 6-5
-
Giaù trò baùch phaân vò (percentile values): Ñöôïc duøng ñeå xaùc ñònh
caùc ranh giôùi töông ñoái cuûa caùc nhoùm töø maãu quan saùt, ñieàu löu yù
laø döõ lieäu caàn quan saùt ñaõ ñöôïc xaép xeáp thep thöù töï töø thaáp ñeán
cao.
o Ta coù coâng cuï phaân nhaùnh döõ lieäu thaønh 4 phaàn baèng
nhau goïi laø töù phaân vò (quartiles).
o Hoaëc ta coù theå chia döõ lieäu theo caùc phaàn baèng nhau cuï
theå baèng caùch goõ soá phaàn muoán chia vaøo coâng cuï cuts
points for equal groups.
o Hoaëc ta coù theå xem giaù trò ôû phaân nhaùnh cuï theå naøo ñoù töø
coâng cuï percentile(s).
Söû duïng thanh Add ñeå xaùc nhaän soá thöù töï phaân vò caàn quan saùt, söû
duïng thanh Remove vaø Change ñeå loaïi boû hoaëc thay ñoåi söï xaùc
nhaän ban ñaàu.
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
38
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
Ví duï nhö ñoái vôùi bieán chöùa caùc caâu traû lôøi tröïc tieáp veà soá tuoåi cuûa
ngöôøi traû lôøi trong moät cuoäc khaûo saùt daân soá (tuoåi ngöôøi traû lôøi ñöôïc
ghi tröïc tieáp töø 18 – 89 tuoåi) ta coù theå duøng coâng cuï phaân vò döõ lieäu
ñeå phaân caùc ñoä tuoåi naøy thaønh caùc nhoùm nhoû, ví duï nhö ta phaân
caùc ñoä tuoåi naøy baèng phöông phaùp töù phaân vò (quartiles). Luùc ñoù
tuoåi cuûa ngöôøi traû lôøi seõ ñöôïc phaân thaønh 4 phaàn sao cho moãi nhoùm
tuoåi ñöôïc phaân chieám 25% soá laàn xuaát hieän (taàn suaát xuaát hieän).
-
Ñaëc tính phaân phoái (Distribution): Coù hai ñaïi löôïng ño löôøng
nhöõng ñaëc tính cuûa söï phaân phoái döõ lieäu laø
(1) Heä soá ñoái xöùng Skewness (Cs) cho ta bieát daïng phaân phoái cuûa
caùc giaù trò quan saùt Standard Error of Skewness coù theå ñöôïc söû duïng
ñeå kieåm nghieäm tính phaân phoái chuaån. Moät phaân phoái Skewness
khoâng ñöôïc xem laø phaân phoái chuaån khi Statndard error cuûa noù nhoû
hôn –2 hoaëc lôùn hôn 2. Moät giaù trò döông lôùn cuûa Statndard error
cho thaáy nhaùnh cuûa phaân phoái naøy daøi qua beân phaûi vaø ngöôïc laïi
moät trò aâm chæ ra nhaùnh cuûa phaân phoái naøy daøi qua beân traùi
-
Cs = 0: Caùc quan saùt ñöôïc phaân phoái moät caùc ñoái xöùng xung
quanh giaù trò trung bình
-
Cs > 0: Caùc quan saùt taäp trung chuû yeáu vaøo caùc giaù trò nhoû
nhaát
-
Cs < 0: Caùc quan saùt taäp trung chuû yeáu vaøo caùc giaù trò lôùn
nhaát
(2) Heä soá taäp trung Kurtosis (Cc) duøng ñeå so saùnh ñöôøng cong quan
saùt vôùi daïng ñöôøng cong phaân phoái chuaån. Standard Error of
Kurtosis coù theå ñöôïc söû duïng ñeå kieåm nghieäm tính phaân phoái
chuaån. Moät phaân phoái Kurtosis khoâng ñöôïc xem laø phaân phoái chuaån
khi Statndard error cuûa noù nhoû hôn –2 hoaëc lôùn hôn 2. Moät giaù trò
döông lôùn cuûa Statndard error cho ta bieát hai nhaùnh cuûa phaân phoái
naøy daøi hôn nhaùnh cuûa phaân phoái chuaån vaø ngöôïc laïi moät trò aâm
chæ ra hai nhaùnh cuûa phaân phoái ngaén hôn phaân phoái chuaàn
-
Cc > 0: Cho thaáy xu höôùng taïp trung maïnh cuûa caùc quan saùt
xung quanh giaù trò trung bình
-
Cc < 0: Cho thaáy ñöôøng cong coù daïng heïp hôn.
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
39
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
3. Laäp baûng moâ taû (Descriptive)
Söû duïng Statisticts\Summaries\Descriptives ñeå môû hoäp thoaïi moâ taû
thoáng keâ nhö Hình 6-6:
Hình 6-6
Ñaây laø moät daïng coâng cuï khaùc coù theå ñöôïc duøng ñeå toùm taéc döõ lieäu vaø
chæ cho pheùp thao taùc treân daïng döõ lieäu ñònh löôïng (thang ño khoaûng caùch
vaø tyû leä). Ñöôïc duøng ñeå theå hieän xu höôùng taäp trung cuûa döõ lieäu (central
tendency) thoâng qua giaù trò trung bình cuûa caùc giaù trò trong bieán (mean),
vaø moâ taû söï phaân taùn cuûa döõ lieäu thoâng qua phöông sai vaø ñoä leäch chuaån.
Chuyeån caùc bieán caàn toùm taéc vaøo hoäp thoaïi variables vaø nhaáp thanh
options ñeå löïa choïn caùc thoâng soá thoáng keâ caàn moâ taû, nhö giaù trò trung
bình–mean, giaù trò toái thieåu, giaù trò toái ña, phöông sai vaø ñoä leäch chuaån,…
(Hình 6-7)
Hình 6-7
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
40
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
4. Laäp baûng nhieàu chieàu cho caùc bieán moät traû lôøi (Crosstabs)
Baûng nhieàu chieàu laø daïng baûng cheùo theå hieän taàn suaát xuaát hieän cuûa moät
bieán naøy trong moái quan heä vôùi moät hay nhieàu bieán khaùc. Baûng cheùo coøn
cung caáp nhieàu loaïi kieåm nghieäm thoáng keâ vaø ño löôøng moái quan heä vaø
töông quan giöõa caùc bieán trong baûng. Caáu truùc cuûa baûng vaø loaïi döõ lieäu
(loaïi thang ñoù) seõ quyeát ñònh loaïi coâng cuï naøo ñöôïc söû duïng ñeå ño löôøng.
Ngoaøi vieäc theå hieän moái lieân heä giöõa caùc bieán. Baûng nhieàu chieàu coøn
giuùp ta phaùt hieän nhöõng sai soùt trong döõ lieäu töø vieäc phaùt hieän ra nhöõng
moái quan heä voâ lyù vaø baát thöôøng giöõa hai bieán. Choïn treân menu
Statistics/Summaries/Crosstabs ñeå môû hoäp thoaïi nhö Hình 6-8:
Hình 6-8
Caùc bieán trong taäp döõ lieäu ñöôïc hieån thò beân hoäp beân traùi. Choïn caùc bieán
haøng ñöa vaùo hoäp Row(s) vaø caùc bieán coät ñöa vaøo hoäp Column(s). Thoâng
thöôøng bieán phuï thuoäc hay bieán caàn quan saùt thöôøng ñöôïc ñöa vaø haøng
(rows) vaø bieán ñoäc laäp hay bieán kieåm soaùt ñöôïc ñöa vaø coät (columns).
Vieäc löïa choïn caùc phaân tích theo caùc tyû leä phaàn traêm, %row vaø %column
cuõng nhö %total tuyø thuoäc vaøo yeâu caàu nghieân cöùu.
Ngoaøi ra, chuùng ta coù theå ñöa theâm vaøo baûng cheùo caùc lôùp bieán ñieàu
khieån (layer) ñeå taïo ra caùc baûng bieán cheùo nhieàu chieàu. Moãi baûng cheùo
rieâng bieät seõ ñöôïc taïo ra öùng vôùi moãi giaù trò cuûa moãi bieán ñieàu khieån. Moãi
lôùp ñieàu khieån seõ chia baûng cheùo thaønh nhieàu nhoùm nhoû hôn. Coù theå
theâm toái ña 8 bieán ñieàu khieån, duøng caùc thanh Next vaø previous ñeå di
chuyeån giöõa caùc bieán ñieàu khieån naøy. Vieäc ñöa vaøo caùc bieán ñieàu khieån
naøy cho pheùp ta xem xeùt caùc moái quan heä maø luùc ban ñaàu khoâng theå thaáy
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
41
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
ngay. Caùc coâng cuï thoáng keâ seõ cho ra caùc keát quaû rieâng bieát ñoái vôùi töøng
giaù trò cuûa bieán ñieàu khieån.
Coâng cuï Cells trong hoäp thoaïi cho pheùp ta tính toaùn caùc heä soá ño löôøng
moái quan heä giöõa caùc bieán ñoù nhö % haøng, % coät, % Total.
Coâng cuï Exact cung caáp cho chuùng ta hai phöông phaùp ñeå tính ra möùc ñoä
tin caäy cho caùc pheùp kieåm nghieäm söû duïng trong baûng cheùo, hoaëc caùc
pheùp thöû phi tham soá (nonparametric). Hai phöông phaùp naøy bao goàm
phöông phaùp Exact vaø phöông phaùp Monte Carlo ñöôïc söû duïng nhö coâng
cuï ñeå thu ñöôïc nhöõng keát quaû chính xaùc trong tröôøng hôïp döõ lieäu cuûa
chuùng ta khoâng ñaùp öùng ñöôïc nhöõng giaû thuyeát caàn thieát cho moät keát quaû
ñaùng tin caäy khi söû duïng phöông phaùp tieäm caän tieâu chuaån (Standard
asymptonic) phöông phaùp maø keøm theo noù döõ lieäu cuûa chuùng ta ñoøi hoûi
phaûi thoaû maõn nhöõng ñieàu kieän sau:
-
Döõ lieäu söû duïng coù phaân phoái chuaån, hoaëc kích côû maãu phaûi ñuû lôùn
(n>=30)
-
Khoâng toàn taïi taàn suaát mong muoán naøo cuûa baát kyø giaù trò naøo trong
baûng cheùo nhoû hôn 5.
Ñoái vôùi tröôøng hôïp döõ lieäu khoâng gaëp ñöôïc nhöõng yeâu caàu nhö treân.
Phöông phaùp exact hoaëc Monte Carlo veà ñoä tin caäy luoân luoân cho ta keát
quaû ñaùng tin caäy maø khoâng caàn quan taâm ñeán kích côû maãu, phaân phoái
cuûa caùc quan saùt cuõng nhö söï caân baèng cuûa döõ lieäu (caân baèng veà soá löôïng
caùc giaù trò khaùc nhau trong bieán). Choïn coâng cuï Exact trong hoäp thoaïi
Crosstabs ta coù hoäp thoaïi con nhö Hình 6-9.
Hình 6-9
SPSS maëc ñònh laø söû duïng phöông phaùp tieäm caän thoâng thöôøng
(Asymptotic). Neáu ta söû duïng phöông phaùp exact hoaëc mote carlo ñeå xaùc
ñònh tính ñoä tin caäy thì caàn chuù yù caùc ñieåm sau:
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
42
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
-
Neáu ta löïa choïn phöông phaùp Monte Carlo, goû khoaûng tin caäy mong
muoán vaøo coâng cuï Confidence level, ñoàng thôøi cho bieát kích côû
maãu ñöôïc söõ duïng. Söû duïng phöông phaùp cho ta keát quaû nhanh
hôn phöông phaùp exact
-
Neáu löïa choïn phöông phaùp Exact, nhaäp vaøo thôøi gian giôùi haïn toái
ña cho vieäc tính toaùn cho moãi pheùp thöû. Neáu moät pheùp kieåm
nghieäm vöôït quaù thôøi gian giôùi haïn toái ña 30 phuùt, caùch toát hôn neân
söû duïng laø Moten Carlo
Coâng cuï Statistics cho pheùp ta tính caùc kieåm nghieäm giaû thuyeát veà tính
ñoäc laäp cuûa caùc bieán, vaø moái lieân heä giöõa caùc caùc bieán, heä soá töông quan,
cuõng nhö ño löôøng caùc moái quan heä ñoù. (Xem Hình 6-10)
Hình 6-10
Caùc kieåm nghieäm thoáng keâ – kieåm nghieäm moái quan heä vaø
töông quan giöõa caùc bieán söû duïng trong baûng cheùo
Kieåm nghieäp Chi-square:
-
Laø moät coâng cuï thoâng keâ söû duïng ñeå kieåm nghieäp giaû thuyeát cho
raèng caùc bieán trong haøng vaø coät thì ñoäc laäp vôùi nhau (H0). Phöông
phaùp kieåm nghieäm naøy chæ cho ta bieát ñöôïc lieäu moät bieán naøy coù
quan heä hay khoâng vôùi moät bieán khaùc, tuy nhieân phöông phaùp
kieåm nghieäp naøy khoâng chæ ra cöôøng ñoä cuûa moái quan heä giöõa hai
bieán maïnh hay yeáu (neáu coù quan heä), cuõng nhö khoâng chæ ra höôùng
thuaän hay nghòch cuûa moái quan heä naøy (neáu coù quan heä).
-
Ñeå kieåm nghieäp tính ñoäc laäp giöõa hai bieán coät vaø haøng, kieåm
nghieäp Chi-square seõ cho ra caùc keát quaû kieåm nghieäp nhö sau:
Pearson chi-square, likelihood-ratio chi-square, and linear-by-linear
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
43
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
association chi-square moãi caùi seõ ñöôïc söû duïng trong nhöõng tröôøng
hôïp cuï theå
-
Theo ñònh nghóa hai bieán trong baûng laø ñoäc laäp vôùi nhau neáu nhö
xaùc suaát sao cho moät tröôøng hôïp quan saùt (case) rôi vaøo moät tröôøng
hôïp cuï theå (ví duï nhö giôùi tính laø Nam vaø ñang thaát nghieäp) laø ñöôïc
taïo ra töø caùc xaùc suaát bieân (xaùc suaát coät vaø xaùc suaát haøng). Ví duï ta
coù xaùc suaát moät ñoái töôïng quan saùt laø thaát nghieäp laø 35/923. Vaø xaùc
suaát ñeå ñoái töôïng quan saùt laø Nam giôùi laø 452/923. Do hai bieán laø
ñoäc laäp, theo lyù thuyeát xaùc suaát ñeå moät tröôøng hôïp quan saùt vöøa laø
Nam giôùi vöøa laø Thaát nghieäp thì xaùc suaát trong tröôøng hôïp naøy phaûi
laø (452/923) x (35/923) vaø baèng 0.018. Xaùc suaát naøy seõ ñöôïc söû
duïng ñeå öôùc löôïng (estimate) soá löôïng caùc tröôøng hôïp quan saùt
mong ñôïi trong töøng phaàn giao nhau giöõa hai bieán treân baûng cheùo
döôùi ñieàu kieän hai bieán laø ñoäc laäp vôùi nhau. Do ñoù ñeå tính toaùn
ñöôïc soá löôïng quan saùt mong ñôïi laø Nam giôùi vaø thaát nghieäp ta chæ
vieäc nhaân xaùc suaát vöøa tìm ñöôïc vôùi toång soá maãu quan saùt (0.018 x
923). (Xem baûng phía cheùo phía döôùi)
Tinh trang cong viec * Gioi tinh nguoi tra loi Crosstabulation
Tinh
trang
cong
viec
Lam viec toan thoi gian
Lam viec ban thoi gian
Tam thoi khong di lam
That nghiep
Khac
Total
-
Count
Expected Count
% of Total
Count
Expected Count
% of Total
Count
Expected Count
% of Total
Count
Expected Count
% of Total
Count
Expected Count
% of Total
Count
Expected Count
% of Total
Gioi tinh nguoi tra loi
Nam
Nu
379
308
336.4
350.6
41.1%
33.4%
32
94
61.7
64.3
3.5%
10.2%
8
22
14.7
15.3
.9%
2.4%
25
10
17.1
17.9
2.7%
1.1%
8
37
22.0
23.0
.9%
4.0%
452
471
452.0
471.0
49.0%
51.0%
Total
687
687.0
74.4%
126
126.0
13.7%
30
30.0
3.3%
35
35.0
3.8%
45
45.0
4.9%
923
923.0
100.0%
Ñeå kieåm nghieäm tính ñoäc laäp giöõa hai bieán, ngöôøi ta söû duïng phaân
phoái ngaãu nhieân Chi bình phöông (χ2) vôùi tham soá thoáng keâ
Pearson chi bình phöông ñeå tieán haønh so saùnh soá löôïng caùc tröôøng
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
44
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
hôïp quan saùt ñöôïc vôùi soá löôïng caùc tröôøng hôïp mong ñôïi baèng coâng
thöùc sau:
r
c
X 2 = ∑∑
i =1 j =1
(Oij − E ij ) 2
E ij
-
Khi keát quaû thoáng keâ Chi bình phöông (χ2) ñuû lôùn (Döïa vaøo lyù
thuyeát phaân phoái Chi bình phöông vôùi ñoä tin caäy xaùc ñònh, kích côû
maãu laø n, baät töï do-degree of freedom laø df=(r-1)(c-1)) ta coù theå keát
luaän baùc boû giaû thuyeát ñoäc laäp giöõa hai bieán (H0). Hoaëc söû duïng giaù
trò P (P-value hay Asymtotic Significance) so saùnh vôùi möùc yù nghóa
(Significance level) thöôøng laø α = 0.05 töông öùng vôùi 95% ñoä tin
caäy, ta coù theå keát luaän baùc boû H0 khi p-value nhoû hôn hoaëc baèng
möùc yù nghóa vaø ngöôïc laïi chaáp nhaän H0 khi p-value lôùn hôn möùc yù
nghóa.
-
Tuy nhieân ñeå vieäc kieåm nghieäm naøy laø ñaùng tin caäy thì caùc soá lieäu
trong baûng cheùo giöõa hai bieán ñang khaûo saùt phaûi thoûa maõn moät soá
ñieàu kieän nhaát ñònh sau:
o Khoâng toàn taïi ôû baát kyø oâ giao nhau giöõa hai bieán coù giaù trò
mong ñôïi nhoû hôn 1.
o Khoâng vöôït quaù 20% löôïng oâ giao nhau giöõa hai bieán
ñang khaûo saùt trong baûng cheùo coù giaù trò nhoû hôn 5 (ñoái
vôùi baûng 2x2-baûng maø moãi bieán trong baûng cheùo chæ coù
hai giaù trò, phaàn traêm giôùi haïn naøy laø 0%)
- Neáu khoâng thoûa maõn caùc ñieàu kieän treân ta phaûi tieán haønh loaïi boû
bôùt caùc giaù trò trong moät bieán maø döõ lieäu giao nhau cuûa noù laø khoâng
ñaùng keå (quaù nhoû)
-
Ñeå kieåm nghieäm tính ñoäc laäp giöõa hai bieán coät vaø haøng trong baûng
cheùo, kieåm nghieäp Chi-square seõ cho ra caùc keát quaû kieåm nghieäp
khaùc nhau nhö sau: Pearson chi-square, likelihood-ratio chisquare, vaø linear-by-linear association chi-square.
-
Thoâng thöôøng ñeå xaùc ñònh moái quan heä giöõa hai bieán trong baûng
cheùo, vieäc söû duïng chæ soá naøo ñeå kieåm nghieäm tích ñoäc laäp giöõa hai
bieán phuï thuoäc vaøo soá löôïng coät vaø haøng trong baûng, soá maãu nghieân
cöùu, taàn suaát xuaát hieän mong muoán cuûa moät giaù trò trong bieán trong
ñieàu kieän cuûa bieán khaùc, daïng ño löôøng cuûa caùc bieán trong baûng
(daïng thang ño). Ta coù:
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
45
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
o Döïa vaøo caùc heä soá Pearson Chi-square vaø Likelihood Ratio
ta coù theå kieåm nghieäp moái lieân heä giöõa hai bieán maø khoâng
caàn quan taâm ñeán soá löôïng haøng vaø coät trong baûng.
o Hoaëc ta coù theå duøng chæ soá Linear-by-linear association khi
maø caùc bieán trong baûng laø bieán ñònh löôïng.
o Ñoái vôùi daïng baûng cheùo coù hai coät vaø hai doøng (2X2 tables)
– moãi bieán trong baûng chæ coù hai giaù trò, ta duøng caùc chæ soá
Yate’s corrected chi-square hay coøn goïi laø Continuity
Correction ñaùnh giaù moái töông quan giöõa hai bieán trong
baûng.
o Söû duïng chæ soá Fisher’s exact test khi maø soá maãu nghieân cöùu
vaø caùc giaù trò mong ñôïi nhoû, thoâng thöôøng ta seõ söû duïng chæ
soá naøy khi maãu trong baûng nhoû hôn hoaëc baèng 20 hoaëc taàn
suaát xuaát hieän mong muoán trong moät phaàn giao nhau giöõa hai
bieán trong baûng (cell) nhoû hôn 5.
-
Ñeå keát luaän moái lieân heä giöõa hai bieán laø ñoäc laäp hay phuï thuoäc vaøo
nhau (coù hay khoâng coù töông quan) ngöôøi ta döïa vaøo Asymptotic
Significance vôùi soá maãu ñuû lôùn hoaëc phaân phoái laø phaân phoái chuaån.
Ñaây laø chæ soá thoáng keâ ñeå ño löôøng vôùi möùc yù nghóa (thöôøng laø 5%)
nhaèm ñöa ra keát luaän phaûn baùt hay chaáp nhaän giaû thuyeát ban ñaàu
(Hai bieán laø ñoäc laäp vôùi nhau). Ta coù theå keát luaän giöõa hai bieán toàn
taïi moät moái quan heä vôùi nhau khi maø Asym. Sig. nhoû hôn möùc yù
nghóa vaø ngöôïc laïi.
-
Ñoái vôùi kieåm nghieäm Chi-square ta chæ coù theå xaùc ñònh giöõa hai
bieán coù hay khoâng toàn taïi moät moái quan heä. Tuy nhieân ñeå ño löôøng
cöôøng ñoä cuûa caùc moái quan heä naøy ñoøi hoûi caùc coâng cuï thoáng keâ
khaùc seõ ñöôïc ñeà caäp sau ñaây.
Correlation:
-
Duøng ñeå ño löôøng moái töông quan giöõa hai bieán thöù tö hoaëc khoaûng
caùchï. Vieäc ño löôøng moái töông quan giöõa hai bieán thöù töï naøy chuû
yeáu döï vaøo hai heä soá Spearman’s correlation coefficient rho vaø
Pearson correlation coefficient. Trong ñoù:
o Spearman’s rho ñöôïc duøng ñeå ño löôøng moái quan heä giöõa hai
bieán thöù töï (caùc bieán naøy haàu heát ñeàu ñöôïc xaép xeáp töø thaáp
nhaát ñeán cao nhaát).
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
46
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
o Khi caùc bieán trong baûng laø caùc bieán ñònh löôïng ta söû duïng heä
soá Pearson correlation coefficient ñeå ño löôøng moái quan heä
tuyeán tính giöõa caùc bieán naøy.
-
Caùc giaù trò cuûa heä soá töông quan bieán thieân töø –1 ñeán 1, daáu coäng
hoaëc tröø chæ ra höông töông quan giöõa caùc bieán (thuaän hay nghòch),
giaù trò tuyeät ñoái cuûa chæ soá naøy cho bieát cöôøng ñoä töông quan giöõa
hai bieán, giaù trò naøy caøng lôùn moái töông quan caøng maïnh.
Moät soá ño löôøng moái töông quan khaùc giöõa hai bieán
• Giöõa hai bieán ñònh danh:
-
Ñeå ño löôøng moái quan heä giöõa hai bieán bieåu danh. Söû duïng caùc
heä soá Phi (coefficient) vaø Craémr’s V, Contingency coefficient
ñeå ño löôøng neáu döïa vaøo keát quaû kieåm nghieäm Chi-bình phöông.
ÔÛ ñaây caùc heä soá naøy seõ baèng 0 neáu vaø chæ neáu heä soá Pearson
chi bình phöông baèng 0. Do ñoù ngöôøi ta söû duïng caùc thoâng soá
naøy ñeå kieåm nghieäm giaû thuyeát cho raèng caùc heä soá naøy ñeàu
baèng 0 - ñieàu naøy töông ñöông vôùi giaû thuyeát ñoäc laäp giöõa hai
bieán, hay hai bieán khoâng coù moâí quan heä vôùi nhau. Ta seõ töø choái
giaû thuyeát naøy
-
Phi: Chæ duøng cho daïng baûng 2x2 tables, heä soá phi coefficient
naøy bieán thieân töø -1 ñeán +1. Do ñoù heä soá naøy ngoaøi khaû naêng
chæ ra moái quan heä vaø cöôøng ñoä cuûa moái quan heä noù coøn chæ ra
höôùng cuûa moái quan heä ñoù
-
Cramer's V vaø Contingency coefficient (heä soá ngaãu hieân): Ñöôïc
söû duïng cho baûng maø soá coät vaø haøng laø baát kyø, giaù trò kieåm
nghieäm bieán thieân töø 0 ñeán 1, vôùi giaù trò 0 chæ ra khoâng coù moái
quan heä giöõa caùc bieán
-
Ngoaøi ra coøn coù caùc heä soá ño löôøng tröïc tieáp nhö Lambda
(symmetric and asymmetric lambdas and Goodman and
Kruskal’s tau), vaø Uncertainty coefficient. Laø caùc ño löôøng
khoâng döïa vaøo giaù trò Chi-square ñeå tính toaùn, vaø khoâng quan
taâm ñeán tính ñoái xöùng cuûa phaân phoái chuaån. Caùc giaù trò cuûa heä
soá naøy cuõng bieán thieân töø 0 ñeá 1 vaø ñöôïc duøng ñeå ño löôøng khaû
naêng döï baùo cuûa moät bieán (bieán ñoäc laäp) ñoái vôùi moät bieán khaùc
(bieán phuï thuoäc). Vôùi giaù trò 0 nhaän ñöôïc coù yù nghóa raèng nhöõng
kieán thöùc veà bieán ñoäc laäp khoâng giuùp ích gì cho vieäc döï baùo
nhöõng khaû naêng xaûy ra cuûa bieán phuï thuoäc, vaø giaù trò 1 cho bieát
khi ta bieát ñöôïc nhöõng thoâng tin veà bieán ñoäc laäp thì noù seõ giuùp
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
47
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
ta xaùc ñònh ñöôïc moät caùch hoaøn haûo caùc khaû naêng xaûy ra cho
bieán phuï thuoäc.
-
Vieäc löïa choïn bieán naøo laø bieán ñoäc laäp vaø bieán naøo laø bieán phuï
thuoäc tuøy thuoäc vaøo vaán ñeà cuï theå maø ta ñang khaûo saùt
-
Heä soá Asymptotic Std. Error coù theå ñöôïc duøng ñeå ñònh ra
khoaûng tin caäy (95%) cho caùc tham soá ño löôøng (Value +(-)
2*Asymptotic std. Error)
• Söû duïng Odds Ratio cho baûng hai coät hai haøng (2x2 tables)
-
Ñeå ño löôøng moái töông quan giöõa hai bieán cho loaïi baûng naøy
ngöôøi ta coù theå söû duïng caùc keát quaû thoáng keâ Yates’ corrected
chi – bình phöông vaø Fisher’s exact test. Caùc keát quaû naøy ñöôïc
duøng ñeå kieåm nghieäm giaû thuyeát cho raèng caùc tyû leä giöõa caùc giaù
trò trong hai bieán naøy laø ngang baèng nhau (ví duï nhö tyû leä ngöôøi
nam ñi baûo taøng thì ngang baèng vôùi tyû leä ngöôøi nöõ ñi baûo taøng),
töông töï vôùi caùc keát quaû thoáng keâ chi – bình phöông khaùc ta seõ
töø choái giaû thuyeát H0 khi p-value nhoû hôn möùc tin caäy.
-
Ngoaøi phöông phaùp treân ta coøn coù theå söû duïng phöông phaùp
odds ratio vaø relative risk ñeå ño löôøng moái lieân heä giöõa hai ñaëc
tính. Thoâng thöôøng moät trong hai ñaëc tính ñoù xuaát hieän tröôùc (ví
duï nhö bieán chöùa ñaëc tính coù huùt thuoác hay khoâng) vaø sau ñoù laø
seõ daãn ñeán moät ñaëc tính khaùc xuaát hieän theo sau (ví duï bieán
chöùa ñaëc tính coù bò beänh lao phoåi hay khoâng). Ta goïi bieán chöùa
ñaëc tính xuaát hieän tröôùc laø bieán nhaân toá (factor) vaø bieán theo sau
laø bieán söï kieän (event). Ta coù hai phöông phaùp tính nhö sau:
(1) Relative risk:
Bieán söï kieän
Bieán nhaân toá
Bieân soaïn: Ñaøo Hoaøi Nam
Yes
No
Tyû leä ruûi
ro risk
Tyû leä ruûi
ro töông
ñoái
Relative
risk
Yes
a
b
a/(a+b)
a(c+d)
No
c
d
c/(c+d)
c(a+b)
http://www.ebook.edu.vn
48
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
Phöông phaùp naøy baét ñaàu vôùi bieán nhaân toá vaø theo sau ñoù ta
ñeám soá moãi söï kieän xuaát hieän trong moãi nhoùm nhaân toá. Tyû leä ruûi
ro ñöôïc tính rieâng bieät cho töøng nhoùm nhaân toá vaø tyû leä ruûi ro
töông öùng laø tyû soá giuõa hai tyû leä ruûi ro cuûa töøng nhoùm nhaân toá
(2) Odds ratio:
Bieán nhaân toá
Bieán söï kieän
Yes
No
odds
Tyû leä odds
Yes
a
b
a/b
ad
No
c
d
c/d
cb
Phöông phaùp naøy baét ñaàu vôùi bieán söï kieän. Vôùi moät söï kieän (ví
duï bò beänh lao phoåi) thì tyû leä giöõa ngöôøi huùt thuoác ñoái vôùi ngöôøi
khoâng huùt thuoác laø bao nhieâu, goïi laø odd. Sau ñoù ta laäp tyû leä caùc
odds naøy.
-
Caû hai phöông phaùp naøy ñeàu coù caùch kieåm nghieäp keát quaû
gioáng nhau. Caû Tyû leä Odds vaø relative risk ñeàu nhaän giaù trò 1 khi
caùc tyû leä naøy laø gioáng nhau. Vaø ñeå kieåm nghieäm giaõ thuyeát ban
ñaàu cho raèng caùc tyû soá naøy laø nhö nhau (H0) - töø choái hay chaáp
nhaän ta döïa vaøo khoaûng tin caäy (95%) xem xem giaù trò 1 coù naèm
trong khoaûng tin caäy ñoù hay khoâng. Neáu giaù trò 1 khoâng naèm
trong khoaûng tin caäy 95% ta töø choái giaû thuyeát H0, vaø coù theå
xem giaù trò trong oâ (value) laø tyû soá dieãn giaûi. Neáu giaù trò 1 naèm
trong khoaûng tin caäy 95%, khoâng caàn quan taâm ñeán caùc giaù trò
trong coät value, bôûi vì kieåm nghieäm cho ta keát quaû chaáp nhaän
giaû thuyeát hai tæ leä odds hoaëc relative cuûa hai giaù trò laø nhö nhau
-
Chuù yù phöông phaùp Odds ratio luoân luoân laáy tyû soá odd ôû haøng
thöù nhaát chia cho haøng thöù hai, vaø söï kieän caàn quan taâm luoân
luoân naèm ôû coät thöù nhaát. Coøn ñoái vôùi phöông phaùp Relative risk
baát cöù coät naøo cuõng coù theå ñaïi dieän cho söï kieän caàn quan taâm
(SPSS seõ ñöa ra caùc keát quaû khaùc nhau ñeå öôùc löôïng cho moãi caùi
• Duøng Kappa ñeå ño löôøng söï ñoàng yù giöõa hai bieán trong moät baûng
coù cuøng soá löôïng haøng vaø coät
-
Kappa duøng ñeå ño löôøng möùc ñoä ñoàng yù giöõa nhöõng ño löôøng
cuûa hai nhoùm ñaùnh giaù ñoái vôùi cuøng moät tieâu chí naøo ñoù. Giaù trò
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
49
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
1 chæ ra söï hoaøn toaøn ñoàng yù giöõa hai nhoùm, giaù trò 0 chæ ra söï
ñoàng yù chæ laø moät söï ngaãu hieân.Hoaëc ta duøng p-value ñeå kieåm
nghieäm giaû thuyeát ban ñaàu H0 cho raèng caùc giaù trò ño löôøng naøy
laø baèng khoâng. Kappa chæ thích öùng vôùi nhöõng baûng maø caùc
bieán ñöôïc söû duïng trong baûng coù cuøng soá giaù trò trong bieán.
• Ño löôøng moái töông quan giöõa caùc bieán thöù töï vaø bieán ñònh löôïng
(1) Nominal by Interval: Duøng ño löôøng moái töông quan giöõa bieán
bieåu danh vaø bieán ñònh löôïng trong baûng cheùo. Söû duïng heä soá
Eta.
(2) Correlation: Duøng ñeå ño löôøng moái töông quan giöõa hai bieán
thöù tö hoaëc khoaûng caùchï. Vieäc ño löôøng moái töông quan giöõa
hai bieán thöù töï naøy chuû yeáu döï vaøo hai heä soá Spearman’s
correlation coefficient rho vaø Pearson correlation coefficient.
Trong ñoù Spearman’s rho ñöôïc duøng ñeå ño löôøng moái quan heä
giöõa hai bieán thöù töï (caùc bieán naøy haàu heát ñeàu ñöôïc xaép xeáp töø
thaáp nhaát ñeán cao nhaát). Khi caùc bieán trong baûng laø caùc bieán
ñònh löôïng ta söû duïng heä soá Pearson correlation coefficient ñeå
ño löôøng moái quan heä tuyeán tính giöõa caùc bieán naøy. Caùc giaù trò
cuûa heä soá töông quan bieán thieân töø –1 ñeán 1, daáu coäng hoaëc tröø
chæ ra höông töông quan giöõa caùc bieán (thuaän hay nghòch), giaù
trò tuyeät ñoái cuûa chæ soá naøy cho bieát cöôøng ñoä töông quan giöõa
hai bieán, giaù trò naøy caøng lôùn moái töông quan caøng maïnh.
(3) Ordinal: Duøng ño löôøng moái töông quan giöõa caùc bieán trong
baûng cheùo trong ñoù caùc bieán ôû coät vaø doøng laø caùc bieán thöù töï,
bao goàm caùc heä soá sau:
(1) Somers' d: Ño löôøng moái töông quan phi ñoái xöùng giöõa hai
bieán thöù töï, giaù trò bieán thieân töø –1 ñeán 1.
(2) Gamma: Ño löôøng moái töông quan ñoái xöùng giöõa hai bieán
thöù töï, giaù trò bieán thieân töø –1 ñeán 1.
(3) Kendall's tau-b vaø Kendall's tau-c: Ño löôøng caùc moái
quan heä phi tham soá giöõa hai bieán thöù töï, bieán thieân töø –1
ñeá 1
Phaàn naøy coù theå xem theâm ví duï trong phaàn phuï luïc
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
50
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
5. Laäp baûng cho bieán nhieàu traû lôøi:
5.1. Ñònh nghóa nhoùm bieán nhieàu traû lôøi (define multi response sets)
Trong caâu hoûi nhieàu traû lôøi seõ bao goàm nhieàu bieán chöùa ñöïng caùc traû lôøi
coù theå coù, nhöõng bieán naøy goïi laø bieán sô caáp. Do ñoù ñeå xöõ lyù, chuùng ta
phaûi goäp caùc bieán sô caáp naøy thaønh moät bieán goäp chöùa caùc bieán sô caáp.
Sau ñoù trong caùc phaân tích thoáng keâ lieân quan ñeán caâu hoûi nhieàu traû lôøi,
chuùng ta seõ duøng bieán goäp naøy thay theá cho taát caû caùc bieán sô caáp. Bieán
goäp chöùa ñöïng toaøn boä caùc giaù trò trong caùc bieán sô caáp cuûa moät caâu hoûi
nhieàu traû lôøi. Ví duï nhö caâu hoûi veà nhaän bieát saûn phaåm, ngöôøi tra lôøi coù
theå lieät keâ ra nhieàu nhaõn hieäu maø hoï bieát, do ñoù ta phaûi khai baùo ñuû
löôïng bieán ñeå chöùa ñöïng caùc nhaõn hieäu ñöôïc lieät keâ töø ngöôøi traû lôøi, ñaây
laø caùc bieán sô caáp. Tuy nhieân khi xöõ lyù ta khoâng theå xöõ lyù rieâng bieät caùc
bieán naøy, vì noù khoâng ñaïi dieän ñaày ñuû cho taát caû caùc nhaõn hieäu ñöôïc
nhaän bieát. Do ñoù khi tieán haønh phaân tích caâu hoûi nhaän bieát saûn phaåm
naøy ta phaûi tieán haønh goäp caùc bieán sô caáp thaønh moät bieán goäp chöùa ñöïng
taát caû caùc nhaõn hieäu ñöôïc lieät keâ.
Ñeå tieán haønh goäp caùc bieán sô caáp naøy ta choïn menu Statistics/Multiple
Response/Define sets… ñeå môû hoäp thoaïi Define Multiple Response Sets
nhu Hình 6-11:
Hình 6-11
Choïn taát caû nhöõng bieán sô caáp lieân quan ñeán moät caâu hoûi nhieàu traû lôøi ôû
hoäp thoaïi Set Definition beân traùi chuyeån sang hoäp thoaïi Variables in Set
beân phaûi, ví duï ta coù 10 bieán ñôn chöùa ñöïng caùc nhaõn hieäu ñöôïc nhaän
bieát, ta phaûi choïn taát caû 10 bieán naøy töø hoäp thoaïi Set Definition vaø
chuyeån sang hoäp thoaïi Variable in Set. Sau ñoù chæ ñònh caùch maõ hoùa caùc
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
51
Phaân tích döõ lieäu baèng SPSS
ĐH Kinh Tế TPHCM
bieán ñoù (dichotomy hay category); daõy giaù trò maõ hoùa (Range …Through)
xaùc ñònh khoaûng bieán thieân cho caùc giaù trò trong bieán goäp; xaùc ñònh teân
vaø gaùn nhaõn cho bieán goäp. Sau ñoù aán thanh Add ñeå ñöa teân nhoùm vöøa
xaùc ñònh vaøo hoäp Multi Response Sets. Sau khi tieán haønh khai baùo bieán
goäp xong moïi söû lyù phaân tích caùc bieán nhieàu traû lôøi seõ ñöôïc tieán haønh
treân caùc bieán goäp ñaõ ñöôïc khai baùo trong Multi Response Sets.
Trong khung Variable Are Code As, chuùng ta coù theå choïn moät hay hai muïc
sau ñaây tuøy theo phöông phaùp maõ hoùa:
-
Dichotomies: Ñaây laø traïng thaùi maëc ñònh, vaø chuùng ta nhaäp giaù trò
caàn ñeám vaøo hoäp Counted Value. Keát quaû chæ hieãn thò duy nhaát giaù
trò ñeám vöøa khai baùo
-
Category: Moãi bieán sô caáp coù nhieàu hôn hai giaù trò, vaø chuùng ta
nhaäp caùc giaù trò nhoû nhaát vaø lôùn nhaát cuûa daõy giaù trò maõ hoùa vaøo
caùc oâ Range vaø thourgh (neân khai baùo moät khoaûng caùch caøng roäng
caøng toát)
Chuùng ta ñaët teân cho nhoùm ña bieán (toái ña 7 kyù töï) vaø nhaõn (toái ña 40 kyù
töï) vaøo caùc hoäp Name vaø Label. Löu yù laø teân cuûa caùc nhoùm ña bieán chæ
ñöôïc söû duïng trong caùc thuû tuïc xöõ lyù bieán nhieàu traû lôøi maø thoâi. Ñeå loaïi
boû vaø söõa ñoåi vieäc ñònh nghóa moät nhoùm bieán ña traû lôøi naøo ñoù ta di
chuyeån veät saùng ñeán teân nhoùm ñoù vaø nhaán thanh remove ñeå loaïi boû vaø
thanh Change ñeå thay ñoåi.
5.2. Laäp baûng cho bieán nhieàu traû lôøi
Ñeå tieán haønh laäp baûng cho caùc bieán nhieàu traû lôøi, ta söû duïng caùc teân
nhoùm ña bieán ñaõ ñöôïc ñònh nghóa baèng coâng cuï Define Multi Response
Sets ñaõ ñöôïc ñeà caäp ôû phaàn treân sau ñoù vaøo Statistics\Multiple response
vaø choïn Frequencies hoaëc Crosstabs tuøy theo nhu caàu laäp baûng moät chieàu
hay ña chieàu. Tuy nhieân trong caùc coâng cuï Frequencies vaø Crosstabs söû
duïng cho bieán nhieàu traû lôøi chæ moâ taû taàn suaát xuaát hieän cuûa caùc giaù trò
trong bieán goäp vaø caùc tyû leä % nhöng khoâng coù caùc phöông phaùp kieåm
nghieäm thoáng keâ keøm theo.
6. Custom Table
Ngoaøi ra khi chuùng ta tieán haønh laäp baûng moâ taû thoáng keâ cho keát quaû cuoái
cuøng cuûa vaán ñeà nghieân cöùu coù theå duøng caùc coâng cuï trong
statistics\custom table ñeå taïo ra caùc baûng bieåu, coù theå laø baûng moät
chieàu, baûng nhieàu chieàu hoaëc caùc baûng bieåu moâ taû thoáng keâ tuøy theo yeâu
caàu cuûa vaán ñeà nghieân cöùu.
Bieân soaïn: Ñaøo Hoaøi Nam
http://www.ebook.edu.vn
52
- Xem thêm -