TRƯỜNG ĐẠI HỌC THỦY LỢI
BỘ MÔN KINH TẾ
*****
BÀI GIẢNG
TIN HỌC ỨNG DỤNG TRONG KINH TẾ
Biên soạn: Th.S Trần Văn Khiêm
Th.S Nguyễn Phương Mạnh
Hà Nội, 2015
Bài giảng Tin học ứng dụng trong kinh tế
Nội dung
Phần 1: Thông tin môn học .......................................................................................................... 4
Thông tin cơ bản ....................................................................................................................... 4
Mục tiêu, vai trò môn học......................................................................................................... 4
Người dạy ................................................................................................................................. 4
Thời gian và thời lượng học kì vọng ........................................................................................ 4
Cách kiểm tra ............................................................................................................................ 5
Phần 2: Nội dung môn học ........................................................................................................... 5
1. Giới thiệu chung ................................................................................................................ 5
2. Giới thiệu Stata .................................................................................................................. 6
Làm quen với Stata ............................................................................................................... 6
Giới thiệu Stata ..................................................................................................................... 9
Giao diện của Stata, do file, log file, dta file ...................................................................... 10
Sử dụng công cụ hướng dẫn trong Stata ............................................................................. 22
Cấu trúc lệnh trong Stata .................................................................................................... 22
Tài liệu học Stata ................................................................................................................ 25
3. Dữ liệu trong Stata ........................................................................................................... 25
Dữ liệu trong St t .............................................................................................................. 25
Nh p ữ liệu gộp ữ liệu x
Tạo i n th y
ữ liệu ............................................................................... 28
i i n ....................................................................................................... 32
Mô tả dữ liệu....................................................................................................................... 33
Mô tả tương qu n c c i n ................................................................................................. 35
Làm việc với
th trong St t .......................................................................................... 36
4. Mô hình tuy n tính với Stata ........................................................................................... 38
Ph n t ch trước ph n t ch h i quy ....................................................................................... 38
Ph n t ch h i quy ................................................................................................................ 39
Tính fitted value, phần ư thực hiện ư o n .................................................................... 41
T nh t c ộng ri ng củ
Kiểm
i n ộc l p.................................................................................. 43
nh giả thuy t .......................................................................................................... 44
H i quy với i n c t goric l .............................................................................................. 44
Mở rộng mô h nh sử ụng i n
Kiểm
nh phương i n tương t c ......................................... 45
nh giả thi t của mô hình h i quy tuy n t nh cơ ản .............................................. 45
1
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Mô h nh GLS ..................................................................................................................... 49
Mô h nh tuy n tính với Instrumental variable .................................................................... 50
5.
Phân tích chuỗi thời gian với Stata ................................................................................. 51
Quản lý dữ liệu thời gian trên Stata ................................................................................... 51
Mô hình tuy n tính với dữ liệu thời gian ........................................................................... 52
Phân tích breakpoint trên dữ liệu chuỗi thời gian .............................................................. 53
Công cụ phân tích Box-Jenkins.......................................................................................... 54
Mô hình VAR..................................................................................................................... 56
6.
Mô hình cho bi n phụ thuộc không liên tục với Stata .................................................... 57
Mô h nh x c suất tuy n t nh với bi n phụ thuộc binary ..................................................... 57
Mô h nh Pro it v logit với bi n phụ thuộc hai lựa chọn .................................................. 58
Dự
o k t quả ................................................................................................................... 58
T nh t c ộng t ng phần .................................................................................................... 58
Kiểm
nh ........................................................................................................................... 59
Mô hình probit và logit với bi n phụ thuộc dạng khác (ordered và multinomial) ............. 59
7.
Giới thiệu R ..................................................................................................................... 59
Làm quen với R .................................................................................................................. 59
Kh i niệm v l ch sử R ....................................................................................................... 65
iểm mới củ R so với St t .............................................................................................. 65
Gi o iện v c c công cụ hỗ trợ R ..................................................................................... 66
T m ki m trợ gi p tr n R ................................................................................................... 76
C ch R hoạt ộng v xử l lỗi ............................................................................................ 76
Thông tin kh c v R ........................................................................................................... 77
8.
Ki n thức cơ ản v R ..................................................................................................... 79
C c ạng ữ liệu trong R ................................................................................................... 79
C c ối tượng lưu trữ dữ liệu cơ ản ................................................................................. 80
L p tr nh
nh hướng ối tượng trong R ............................................................................ 90
Vi t phương tr nh tr n R .................................................................................................... 91
C u lệnh kiểm so t control st t m nt .............................................................................. 93
9.
Một số thủ thu t data tidying với R ................................................................................ 96
Nh p dữ liệu bảng t file.................................................................................................... 96
Hoạt ộng data tidying ....................................................................................................... 99
2
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Một số thủ thu t làm sạch dữ liệu với R........................................................................... 101
10.
Khám phá dữ liệu ....................................................................................................... 105
ôi n t v kh m ph
V s on n
ng
ữ liệu ............................................................................................. 105
th khi kh m ph
ữ liệu ................................................................... 106
C c hệ thống
th trong R .............................................................................................. 107
Sử ụng
ể kh m ph
11.
th
ữ liệu ................................................................................. 112
Phân tích h i quy ....................................................................................................... 113
H i quy tuy n t nh ............................................................................................................ 113
Sử ụng k t quả h i quy ................................................................................................... 114
Thực hiện kiểm
nh tr n R .............................................................................................. 115
Lưu v công thức trong lệnh lm( ) ................................................................................. 117
Phân tích chuỗi thời gi n với R ........................................................................................ 118
12.
L p trình phục vụ nghiên cứu kinh t ........................................................................ 120
Một số
nh hướng khi vi t một chương tr nh m y t nh .................................................. 120
Vi t chương tr nh ph n t ch mô h nh h i quy .................................................................. 123
Mở rộng chương tr nh....................................................................................................... 123
Phần 3: Tài liệu tham khảo ....................................................................................................... 124
Phần 4: Một số thu t ngữ hữu ích............................................................................................. 124
3
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Phần 1: Thông tin môn học
Thông tin cơ ản
-
Mã số môn học: AIBA315
-
Số tín chỉ: 3
-
Môn học trước: Kinh t lượng I, Tin học ại cương.
Mục tiêu, vai trò môn học
-
T ng quan môn học:
y l môn học cơ ản v ứng dụng tin học trong kinh t
ược
thi t k cho sinh viên với ki n thức cơ ản v kinh t lượng và sử dụng máy tính. So với
môn học tin học ại cương môn học này t p trung vào cách sử dụng một số phần m m
ể xử lý, phân tích dữ liệu phục vụ nghiên cứu kinh t .
-
Mục tiêu học: Thứ nhất, sinh viên nắm ược cách sử dụng phần m m St t v R ể nh p
dữ liệu, xử lý dữ liệu, phân tích dữ liệu, kiểm
nh giả thuy t
ư
ự o n. Thứ hai, sinh
viên bi t cách tìm hiểu v công cụ phân tích dữ liệu trên máy tính thông qua các lệnh tìm
ki m trợ giúp. Thứ ba, sinh viên học ược một số thủ thu t trong l p trình trên R.
-
Liên k t với các môn học khác: Môn học gi p người học áp dụng các ki n thức lý thuy t
kinh t lượng vào phân tích dữ liệu thực t , chuẩn b cho người học những kĩ năng cần
thi t ể học sâu thêm v kinh t lượng, thống kê, l p tr nh. Kĩ năng c
ược trong môn
học là cần thi t trong quá trình làm nghiên cứu khoa học và vi t khóa lu n của sinh viên.
- Cơ hội ngh nghiệp: Lượng dữ liệu m con người cần xử l
nh nh
ng thời việc sử dụng dữ liệu trong dự báo, quản l
v y kĩ năng sử dụng các phần m m
ng tăng trưởng ngày càng
ng ng y c ng ph bi n. Vì
xử lý và phân tích dữ liệu kĩ năng l m qu n với
một phần m m mới là rất quan trọng. Ngày nay, nhi u công việc yêu cầu người làm việc
phải bi t sử dụng một trong các phần m m phân tích dữ liệu thông dụng như St t R.
Người dạy
-
Giảng viên bộ môn Kinh t
Thời gian và thời lượng học kì vọng
-
Thời gian diễn ra các bu i học: xem thời khóa biểu.
-
Thời lượng các bu i học:
45 giờ
-
Tự học trước và sau bu i học:
60 giờ
-
Chuẩn b cho kiểm tra giữa kỳ:
15 giờ
-
Chuẩn b cho kiểm tra cuối kì:
20 giờ
4
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
T ng cộng:
140 giờ.
Cách kiểm tra
iểm
-
nh: iểm danh trong các bu i học
-
Kiểm tra giữa kì: Làm bài trên giấy, có sử dụng máy vi tính
-
Thi cuối kì: Làm bài trên giấy, có sử dụng máy vi tính
Phần 2: Nội dung môn học
1. Giới thiệu chung
y l môn học cơ ản v ứng dụng tin học trong kinh tế
ược thi t k cho sinh viên với ki n
thức cơ ản v kinh t lượng và sử dụng máy tính. So với môn học tin học ại cương môn học
này t p trung vào cách sử dụng một số phần m m ể xử lý, phân tích dữ liệu phục vụ nghiên cứu
kinh t .
Thu t ngữ “tin học”: Tin học là một ngành khoa học chuyên nghiên cứu quá trình tự ộng hóa
việc t chức lưu trữ và xử lý thông tin của một hệ thống máy tính. Với cách hiểu hiện nay, tin
học bao hàm tất cả các nghiên cứu và kỹ thu t c li n qu n
n việc mô phỏng, bi n
i và tái
tạo thông tin.
Máy tính, hệ thống máy tính bao g m các thi t b
ược l p tr nh ể có thể thực hiện các phép
toán một cách tự ộng. V y các thi t b như m y vi t nh m y t nh ỏ t i
lạnh, một số n i cơm iện, một số quạt iện…
iện thoại i ộng, tủ
u là máy tính. Trong môn này, chúng ta ứng
dụng các phần m m xử lý và phân tích dữ liệu trong hoạt ộng phân tích dữ liệu kinh t , nghiên
cứu kinh t .
y l một phần nhỏ trong ứng dụng tin học trong kinh t .
Vì sao phải sử dụng máy tính: Máy tính thực hiện ược những hoạt ộng lặp i lặp lại một cách
chính xác, nhanh chóng và ti t kiệm hơn con người nhi u lần. Ví dụ: một máy tính bỏ túi thực
hiện một ph p t nh như ^ trong nháy mắt r
năng lượng không
p số cụ thể
n 1/1000000 (hoặc hơn v tốn
ng kể. Một người thực hiện phép tính này có thể mất vài chục phút, phải sử
dụng bảng tra cứu, giấy nháp, và tốn năng lượng hơn m y t nh nhi u lần. Trong quá trình nghiên
cứu kinh t , lợi th của máy tính sẽ ược thể hiện khi chúng ta phải xử lý dữ liệu với h ng trăm
quan sát trở lên. Ngày nay, khả năng t nh to n của máy tính là không thể thi u ối với hầu h t
các hoạt ộng phân tích và xử lý dữ liệu.
Máy tính không thể l m i u gì trong nghiên cứu kinh t : Chúng ta sẽ thấy rằng c c chương
tr nh như St t R không thể tự thu th p dữ liệu, không bi t bi n mục tiêu và bi n ộc l p là bi n
5
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
nào, không bi t chọn mô h nh n o ể phân tích dữ liệu. Các hoạt ộng n y o người sử dụng
chương tr nh thực hiện. Tuy nhi n con người
liệu, vì chúng có thể thực hiện việc n y
ng ph t triển các máy tính chuyên thu th p dữ
u ặn, tốn t năng lượng, có thể gửi dữ liệu với
nh
dạng chuẩn tới nơi xử lý ngay l p tức. Các nhà tâm lý học sử dụng m y t nh ể o lường ộ thỏa
dụng củ c nh n. C c chương tr nh m y tính tự chọn mô hình phân tích dữ liệu khi bi t bi n
mục ti u
ng trở nên ph bi n. Trong hiện tại, việc o c i g
người quy t
i n mục ti u l g … vẫn do con
nh. Tuy nhi n trong tương l i c thể m y t nh cũng thực hiện cả những hoạt ộng
này.
Trong chương tr nh học ại học ch ng t
cứu xuất phát t vấn
ược làm quen với quy tr nh như s u: người nghiên
kinh t xã hội, ư r chủ
th p dữ liệu, xử lý và phân tích dữ liệu
nghiên cứu, l p k hoạch và thực hiện thu
ư r k t lu n v
xuất chính s ch phương n.
Chương tr nh m y t nh th m gi v o công oạn xử lý và phân tích dữ liệu. Nhi u phần m m có
thể ược sử dụng, ví dụ như St t
R SPSS Evi ws St tgr phics MATLAB SAS…. Trong
môn học này, chúng ta tìm hiểu Stata và R. Tuy nhi n người học cần hiểu
y không phải hai
chương tr nh xử lý và phân tích dữ liệu duy nhất, vì v y cần học sâu thêm v St t R cũng như
tìm hiểu thêm v c c chương tr nh m y t nh kh c.
2. Giới thiệu Stata
Làm quen với Stata
C ch ơn giản nhất ể mở chương tr nh St t ở một số m y t nh l click
p v o iểu tượng
Stata, có hình dạng như s u:
Hình: Biểu tượng cho chương tr nh St t phi n ản 12. C c chương tr nh St t phi n ản khác
có biểu tượng với hình dạng tương tự.
ể tắt chương tr nh St t
ch ng t c thể click vào biểu tượng dấu X ở góc trên, bên phải của
cửa s Stata (xem hình minh họa).
6
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Hình: click vào dấu X ể
ng chương tr nh St t
Một số lệnh ể làm quen với Stata:
Trong cửa s Stata, chúng ta click vào cửa s con Command (khoảng trắng ở phần giữa, phía
ưới cửa s Stata – xem hình minh họa).
Hình: cửa s con Command trong cửa s chương tr nh St t
7
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Chúng ta nh p lần lượt t ng lệnh trong các lệnh sau, r i nhấn Enter:
sysuse auto.dta
d
sum
hist price
hist mpg
scatter mpg price
Các hình ảnh sau sẽ xuất hiện khi chúng ta nh p các lệnh:
Hình: Lệnh sysuse auto.dta
8
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Hình: lệnh hist price
Chúng ta v a thực hiện một số thao tác phân tích dữ liệu cơ ản, bao g m mở dữ liệu, tìm hiểu
thông tin v các bi n trong bộ dữ liệu, tính thống kê t ng bi n, dựng một số
th
ể hiểu thêm
v phân phối của một số bi n. Cụ thể: Lệnh sysuse auto.dta nhằm mở một bộ dữ liệu;
Lệnh d nhằm mô tả các bi n; Lệnh sum tính các thống kê cho các bi n trong bộ dữ liệu; Lệnh
hist price nhằm dựng
th histogram v bi n price; Lệnh hist mpg dựng
histogram v bi n mpg; Lệnh scatter mpg price dựng
th
th mpg theo price.
Giới thiệu Stata
Stata là một phần m m phân tích dữ liệu ược vi t và bán bởi St t Corp. St t c c c t nh năng
cho ph p người dùng quản lý dữ liệu, phân tích dữ liệu, xây dựng
th , giả l p, ước lượng mô
hình h i quy v cũng hỗ trợ l p trình.
St t
ược thi t k thân thiện với người dùng là nhà nghiên cứu xã hội: kinh t , khoa học chính
tr , khoa học xã hội, sức khỏe cộng
ng…. Gi o iện củ St t cho ph p người dùng với ít ki n
thức tin học có thể thực hiện các hoạt ộng phân tích dữ liệu cần thi t.
Gi
ể mua Stata bản 14 (bản mới nhất) trong một năm cho người Việt Nam là t 300 USD
450 USD. Gi
ể mua một phiên bản Stata trọn ời l 600
n
n 900 USD.
9
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
StataCorp thường cho ra mắt các phiên bản mới 2 năm một lần. Phiên bản mới nhất là phiên bản
Stata 14, ra mắt vào 07/4/2015. Các phiên bản St t thường c t nh
ng nhất v lệnh, tức là
lệnh vi t ở phiên bản cũ c thể chạy ược trên phiên bản Stata mới (trong khi có một số lệnh ở
phiên bản mới chư c ở phiên bản cũ . Ch ng t
Trên th giới St t
ng sử dụng phiên bản Stata 12.
ược sử dụng bởi nhi u t chức giáo dục, t chức chính phủ, t chức quốc
t .
Hình: Website Stata.com
Giao diện của Stata, do file, log file, dta file
Giao diện mặc định của Stata có thanh thực ơn th nh công cụ và 5 cửa s thành phần sau:
Cửa s Command: Cửa s
ể chúng ta gõ lệnh của mình. Lệnh sẽ ược phần m m thực hiện;
Cửa s Results: Khi lệnh ược phần m m thực hiện, k t quả và các thông báo sẽ ược hiển th ở
cửa s này; Cửa s Review: Bao g m danh sách các lệnh m ch ng t
s làm việc của Stata. Chúng ta có thể ch nh ược
ã thực hiện t khi mở cửa
nh s ch n y x
i c c lệnh không cần
thi t); Cửa s Variables: Bao g m tên các bi n trong bộ dữ liệu m ch ng t
ng sử dụng; Cửa
s Properties: Thuộc tính của một bi n thuộc bộ dữ liệu.
10
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Hình: cửa s chính của Stata, bao g m các cửa s con.
Thanh thực đơn của Stata bao gồm các lựa chọn sau: File: Bao g m các thao tác liên quan
n file dữ liệu và file log; Edit: Bao g m c c th o t c li n qu n
cửa s r sults v
th …; Data: Bao g m c c th o t c li n qu n
Graphics: Bao g m các thao tác dựng
n cửa s Results, tùy chỉnh
n xử lý dự liệu, tạo dữ liệu;
th ; Statistics: Bao g m các thao tác phân tích dữ liệu;
User: Người dùng có thể tự thi t k nội dung trong lựa chọn này (ch ng t chư cần quan tâm
tới lựa chọn này); Window: Cho ph p người
ng i u chỉnh các cửa s thành phần và mở cửa
s tiện ích mới; Help: Các ngu n trợ giúp cho người dùng, thông tin v phần m m St t
ng sử
dụng.
Hình: Thanh thực ơn của Stata
11
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Lựa chọn file trong thanh thực đơn bao g m: Open: Mở file dữ liệu uôi . t ; Save: Lưu
chỉnh sửa dữ liệu làm việc; Save As: Lưu ữ liệu làm việc vào file mới; View…:
ọc nội dung
file (chúng ta ít dùng lựa chọn này); Do…: Thực thi ngầm các lệnh trong một file .do;
Filename…: Lấy
a chỉ ầy ủ của một file; Change Working Directory…: Th y
i
a chỉ thư
mục làm việc của Stata; Log: Bao g m các thao tác nhằm lưu giữ nội dung trong cửa s k t quả;
Import: Nh p dữ liệu t ngu n khác không phải file .dta; Export: Xuất dữ liệu ra dạng file khác
.dta; Print: In nội dung trong cửa s Result; Example Datasets…: Thao tác dẫn
liệu ví dụ; Recent Datasets: Các bộ dữ liệu mở gần
n các bộ dữ
y; Exit: Thoát Stata.
Hình: lựa chọn File trong thanh thực ơn
Lựa chọn edit trên thanh thực đơn bao g m: Copy: s o ch p oạn kí tự ược lựa chọn trên
cửa s R sults lưu trong ộ nhớ clip o r
ưới dạng kí tự); Copy Table: S o ch p oạn ký tự
lưu trong ộ nhớ ưới dạng bảng); Copy Table as HTML: S o ch p oạn ký tự lưu trong ộ
nhớ ưới dạng bảng, vi t theo kiểu html); Copy as Picture: S o ch o oạn kí tự lưu trong ộ
nhớ ưới dạng hình ảnh); Paste: ư c c nội ung lưu trữ trong clipboard vào cửa s command;
Clear Results: xóa nội dung trong cửa s Results; Find: tìm nội dung trong cửa s Results; Find
12
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Next: Ti p tục tìm trong cửa s Results; Table Copy Options: tùy chỉnh khi sao chép k t quả t
cửa s Results; Preferences: tùy chỉnh giao diện Stata, giao diện cửa s
th , sử dụng v lưu
giao diện mẫu, Chỉnh cách mở file .dta, log file, .do file.
Hình: Lựa chọn edit trên trang thực ơn
Lựa chọn data trên trang thực đơn: Lựa chọn này bao g m nhi u th o t c
ng ể xử lý dữ
liệu. Một số thao tác chính: Describe data: bao g m các lệnh mô tả bi n, mô tả nội dung dữ liệu;
Data Editor: Mở cửa s data editor. Có hai dạng cửa s : cửa s
ể xem dữ liệu và cửa s
ể
chỉnh sửa dữ liệu; Create or Change data: chứa t p hợp các thao tác có thể sử dụng ể tạo hoặc
th y
i dữ liệu; Variable Manager: Mở cửa s variable manager –
ng ể chỉnh tên bi n,
nhãn…; Data Utilities: Thao tác cho phép chỉnh sửa tên, nhãn dữ liệu (giá tr , bi n, bộ dữ liệu).
Hữu ch cho người xử lý dữ liệu thô; Sort: sắp x p dữ liệu; Combine Datasets: k t hợp nhi u bộ
dữ liệu vào với nhau; Matrices, Mata language và Matrices, ado language: lựa chọn liên quan
n phép toán ma tr n; Other utilities: Các tiện ch kh c như l p dữ liệu thời gian biểu, tính
ph p t nh….
13
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Hình: lựa chọn data trên thanh thực ơn
Lựa chọn Graphic trên thanh thực đơn: Lựa chọn Graphics bao g m các công cụ xây dựng
th . Các công cụ chính bao g m: Twoway graph: xây dựng
th cơ ản nhất, có hai trục;
Bar chart, Dot Chart, Pie Chart, Histogram, Box plot: Tùy chọn ể xây dựng c c
nhau (phụ thuộc vào tên của lựa chọn); Contour plot: lựa chọn ể xây dựng dạng
(thể hiện 3 bi n); Scatter plot matrix: c c
tr n; Các lựa chọn ể dựng
mô hình h i quy
th khác
th Contour
th sc tt r plot ược x p ưới trên trang dạng ma
th phục vụ thống k
th thể hiện phân phối
th phân tích
th cho chuỗi thời gi n… ; Table of Graphs: k t hợp nhi u
th với nhau;
14
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Manage Graphs: quản l
thước, hình ảnh một
th
lưu
th , sử t n… ; Change scheme/size: th y
i kích
th .
Hình: Lựa chọn Graphic trên thanh thực ơn
Lựa chọn Statistic trên thanh thực đơn: Lựa chọn Statistics là nội dung chính của Stata, bao
g m các lựa chọn cho phép chúng ta phân tích dữ liệu sử dụng các lệnh thống kê và các mô hình
h i quy, thực hiện ph n t ch s u ước lượng h i quy; Chúng ta có thể thấy c ch ặt tên các lựa
chọn phù hợp với người học v kinh t lượng: lựa chọn chia thành các chủ như mô h nh tuy n
15
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
tính, bi n phụ thuộc là bi n
m, mô hình với chuỗi thời gian, panel
t …; Nội dung cụ thể của
lựa chọn này sẽ ược giới thiệu trong các bài học sau.
Hình: Lựa chọn Statistics trên thanh thực ơn
Lựa chọn Window trên thanh thực đơn bao g m: Command, Results, Review, Variables,
Properties: lần lượt là các lựa chọn ể mở các cửa s thành phần với t n tương ứng. Các lệnh
này hữu ích n u chúng ta cần mở lại cửa s
ã
ng; Graph: lựa chọn ể quản lý các cửa s
16
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
th
ng hoạt ộng; Viewer: lựa chọn ể quản lý các cửa s vi w r
ng hoạt ộng; Data
editor, do-file editor, Variables Manager: mở (hoặc quản lý) các cửa s data editor, do-file
editor, variables manager.
Lựa chọn Help trên thanh thực đơn bao g m: PDF Documentation: Mở file PDF chứ hướng
dẫn sử dụng Stata; Advice và Contents: truy c p vào các nội ung hướng dẫn; Search: tìm ki m
hướng dẫn bằng t khóa; Stata Command: tìm ki m hướng dẫn v một lệnh trên Stata; News:
C c tin li n qu n
li n qu n
n Stata (tin của StataCorp, khóa học v St t … ; Resources: các tài nguyên
n Stata; SJ and User-written Programs: thông tin v các công cụ mở rộng Stata do
người dùng vi t; What’s New?: Sự
i mới của phiên bản Stata bạn
ng c ; Check for Updates
(không sử dụng): tìm bản c p nh t cho Stata; About Stata: thông tin chung v phần m m Stata.
Thanh công cụ trên cửa sổ Stata: Thanh công cụ chứa những lựa chọn cơ ản nhất: mở file dữ
liệu mới; lưu fil
ữ liệu, in k t quả ở cửa s Results; mở và quản lý log file; mở cửa s viewer;
quản lý các cửa s
th ; mở do-file editor; mở cửa s data editor (dạng chỉnh sử
ược); mở
cửa s data editor (dạng chỉ xem); mở cửa s quản lý bi n Variables manager; Clear –more–
Condition: xem toàn bộ nội ung ược tạo ra ở cửa s Results; Break: D ng lệnh
ng ược
thực hiện.
Hình: Thanh công cụ trên Stata
Các file tiện ích cho Stata: Chúng ta tìm hiểu 3 dạng file tiện ích cho stata: Do file, log file, dta
file. Chúng lần lượt ược sử dụng ể lưu trữ lệnh lưu trữ k t quả lưu trữ dữ liệu. Ngoài 3 dạng
fil tr n St t còn lưu
th và k t quả ước lượng trong dạng file riêng.
Do file: “. o” file là một dạng fil t xt ược sử dụng ể lưu trữ các lệnh Stata. Tên file có dạng
x mpl . o. Fil
ược mở bằng Stata do-fil
chỉnh sử fil t xt như Not p
itor như h nh ưới) hoặc phần m m ọc và
. File .do có thể ược lưu ở mọi nơi t y th ch khi làm việc với
m y t nh nh trường, chúng ta có thể tạo một thư mục ở các
lưu trữ dữ liệu c nh n
ĩ không
reset ( :D, thi t b
ể lưu fil . o .
17
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
Cách tạo .do file: Cách 1: mở do-file editor (một . o fil
phép bạn vi t nội ung fil . Khi
ược tạo ra trong bộ nhớ tạm thời, cho
ng o-file editor, bạn sẽ ược lựa chọn liệu c lưu fil
không); Cách 2: sử dụng khi bạn muốn lưu một số lệnh St t
ã
ng: chọn một số lệnh trong
phần review, click chuột phải, chọn send to do-file editor.
Hình: .do file editor
Cách mở và sử dụng .do file editor: Chúng ta mở do file bằng cách vào Stata, chọn .do file
editor. Tại cửa s Do-file editor, chọn Open (thông qua kí hiệu open ở thanh công cụ hoặc
File>open hoặc nhấn Ctrl + O . S u khi fil
ược mở, chúng ta có thể thực hiện c c th o t c như
chạy một số lệnh, hoặc chỉnh sử v lưu c p nh t vào . o fil
ã chọn. C ch ơn giản nhất ể
chạy một số lệnh là chọn các lệnh và nhấn Ctrl + D tương ương với “thực hiện các lệnh ã
chọn” . N u chúng ta muốn chạy các lệnh mà không hiện k t quả ra cửa s Result, chọn các lệnh
và nhấn Ctrl + R. Ngo i r
ể chỉnh sửa nội dụng . o fil ch ng t cũng c thể
ng c c phương
pháp chỉnh sửa file text khác (các bạn có thể sử dụng phần m m text editor, hoặc vi t chương
tr nh m y t nh ể vi t ra .do file).
Chúng ta cần phân biệt giữa .do file và .ado file: Stata có cung cấp một dạng fil t xt kh c ể
lưu trữ các lệnh l . o fil
fil c
uôi . o . Fil . o v fil . o ược sử dụng cho hai mục
18
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
Bài giảng Tin học ứng dụng trong kinh tế
ch kh c nh u: Fil . o ược lưu trong thư viện .ado file của Stata. Khi chúng ta sử dụng một
lệnh mà Stata không có sẵn chương tr nh sẽ t m trong thư viện .ado file một fil c t n như lệnh.
N u có, file sẽ ược thực hiện. Fil . o ược lưu ở nơi ph hợp thói quen người dùng. Khi
chúng ta cần xem và thực hiện các lệnh ược lưu trong . o fil ch ng t tự mở fil tương ứng.
Log file là dạng file (có thể l fil c
dụng log fil
nh dạng, hoặc là file chỉ có kí tự (file text) ). Chúng ta sử
ể lưu trữ k t quả trong cửa s Results của Stata. Có hai dạng log file: Dạng uôi
.log là dạng log fil lưu trữ k t quả ưới dạng chuỗi kí tự không c
.smcl là dạng log fil lưu trữ k t quả ưới dạng c
nh dạng, còn dạng uôi
nh dạng (giống như
nh dạng k t quả trên
cửa s Results).
Hình: Log file ở dạng smcl
ể tạo log file, chúng ta có thể chọn log begin (và tạo file hoặc ghi è l n fil log ã c : C ch
1: Stata > File > Log > Begin; Cách 2: Sử dụng biểu tượng trên toolbar; Cách 3: Sử dụng lệnh,
ví dụ như: log using “D:\stata\example.smcl”.
19
------------------------------------------------------------------------------------------------------------------
Bộ môn Kinh tế- ĐHTL
- Xem thêm -