ỦY BAN NHÂN DÂN TỈNH BÌNH DƯƠNG
TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT
NGUYỄN TIẾN ĐẠT
BIỂU DIỄN VÀ PHÂN TÍCH TRỰC QUAN DỮ LIỆU KINH
DOANH CỦA MỘT DOANH NGHIỆP SẢN XUẤT ĐỒ NỘI THẤT
CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN
MÃ SỐ: 8 48 01 04
LUẬN VĂN THẠC SỸ
BÌNH DƯƠNG – 2020
ỦY BAN NHÂN DÂN TỈNH BÌNH DƯƠNG
TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT
NGUYỄN TIẾN ĐẠT
BIỂU DIỄN VÀ PHÂN TÍCH TRỰC QUAN DỮ LIỆU KINH
DOANH CỦA MỘT DOANH NGHIỆP SẢN XUẤT ĐỒ NỘI THẤT
CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN
MÃ NGÀNH: 8 48 01 04
LUẬN VĂN THẠC SỸ
NGƯỜI HƯỚNG DẪN: PGS.TS TRẦN VĨNH PHƯỚC
BÌNH DƯƠNG - 2020
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của cá nhân tôi, xuất phát từ
nhu cầu thực tế trong quá trình học tập, nghiên cứu cũng như công tác tại doanh
nghiệp sản xuất đồ nội thất ở Bình Dương. Dữ liệu sử dụng trong nghiên cứu
được thu thập tại doanh nghiệp sản xuất đồ nội thất đã được sự chấp thuận, cho
phép sử dụng bằng văn bản của lãnh đạo doanh nghiệp trên.
Tất cả các tham khảo từ các nghiên cứu liên quan đều được dẫn nguồn cụ
thể, rõ ràng. Nội dung, kết quả nghiên cứu luận văn là nỗ lực của bản thân và
chưa từng được công bố trong các công trình nghiên cứu khoa học nào khác.
Tác giả
Nguyễn Tiến Đạt
i
LỜI CẢM ƠN
Trong quá trình học tập, nghiên cứu và thực hiện luận văn “Biểu diễn và
phân tích trực quan dữ liệu kinh doanh của một doanh nghiệp sản xuất đồ nội
thất”, tôi đã nhận được nhiều sự hỗ trợ, giúp đỡ từ phía gia đình, thầy cô, các cá
nhân và tổ chức sau:
Trước hết, tôi xin chân thành cảm ơn sâu sắc đến Thầy PGS.TS. Trần
Vĩnh Phước đã tận tâm dìu dắt, hướng dẫn, góp ý, chỉnh sửa để tôi hoàn thành
luận văn này. Tôi xin cảm ơn và tri ân đến Thầy PGS.TS Lê Tuấn Anh trường
Đại học Thủ Dầu Một đã luôn dõi theo động viên, dẫn dắt tôi và các bạn đồng
môn hướng cho chúng tôi tiếp cận các lĩnh vực nghiên cứu mới vừa khoa học,
vừa gần gũi thực tiễn cuộc sống.
Tôi xin được gửi lời cảm ơn đến Ban Giám hiệu nhà trường, Phòng đào
tạo Sau Đại học, các Thầy, Cô trong Khoa Kĩ thuật - Công nghệ, Trường Đại
Học Thủ Dầu Một đã tạo mọi điều kiện và môi trƣờng học tập, nghiên cứu thuận
lợi nhất. Xin cảm ơn tất cả Thầy, Cô là giảng viên thỉnh giảng đã tâm huyết
không ngại đường xa để truyền đạt cho chúng tôi những kiến thức và kinh
nghiệm vô cùng quý giá trong học tập và nghiên cứu khoa học.
Tôi cũng trân trọng cảm ơn các đồng nghiệp, cảm ơn các lãnh đạo của
doanh nghiệp sản xuất đồ nội thất đã hỗ trợ, giúp đỡ nhiệt tình trong việc thu
thập dữ liệu và chia sẻ các kiến thức về chuyên môn trong công tác xây dựng,
phân tích sản xuất, kinh doanh của doanh nghiệp. Cám ơn ba mẹ đã động viên và
hỗ trợ tinh thần cho tôi. Một lần nữa xin tri ân và trân trọng cảm ơn tất cả mọi
người đã giúp đỡ, hỗ trợ tôi hoàn thành luận văn này.
Tác giả
Nguyễn Tiến Đạt
ii
MỤC LỤC
LỜI CAM ĐOAN ................................................................................................... i
LỜI CẢM ƠN ........................................................................................................ ii
MỤC LỤC ............................................................................................................. iii
DANH MỤC CHỮ VIẾT TẮT............................................................................. vi
DANH MỤC CÁC BẢNG BIỂU ....................................................................... viii
DANH SÁCH CÁC HÌNH ................................................................................... ix
MỞ ĐẦU ................................................................................................................ 1
1. Giới thiệu: .................................................................................................... 1
2. Tổng quan về tỉnh Bình Dương: .................................................................. 1
3. Tổng quan về ngành sản xuất & chế biến gỗ ở Bình Dương: ...................... 2
4. Đặt vấn đề: ................................................................................................... 2
5. Mục tiêu nghiên cứu: ................................................................................... 3
6. Phạm vi nghiên cứu: .................................................................................... 3
7. Phương pháp nghiên cứu: ............................................................................ 4
8. Cấu trúc luận văn: ........................................................................................ 4
CHƯƠNG I: CƠ SỞ LÝ THUYẾT ....................................................................... 5
1.1.
Tổng quan về trực quan hóa: .................................................................... 5
1.2.
Lý thuyết về trực quan hóa: ...................................................................... 5
1.3.
Các nghiên cứu liên quan: ........................................................................ 6
1.4.
Trực quan hóa bằng ngôn ngữ lập trình python: ...................................... 7
1.4.1.
Thư viện Matplotlib: .......................................................................... 7
1.4.2.
Thư viện Basemap: ............................................................................ 9
CHƯƠNG II: NỘI DUNG VÀ PHƯƠNG PHÁP THỰC HIỆN ........................ 10
iii
2.1.
Đặt vấn đề: .............................................................................................. 10
2.1.1.
Khái niệm:........................................................................................ 10
2.1.2.
Ý nghĩa:............................................................................................ 10
2.1.3.
Chức năng sản xuất của doanh nghiệp: ........................................... 11
2.1.4.
Nhiệm vụ của phân tích tình hình sản xuất: .................................... 11
2.2.
Nội dung nghiên cứu: ............................................................................. 11
2.2.1.
Xác định các biến và mô tả: ............................................................. 12
2.2.2.
Phân tích mối quan hệ giữa các biến: .............................................. 23
2.2.3.
Sơ đồ quan hệ giữa các biến: ........................................................... 28
2.2.4.
Các hàm toán học giữa các biến (Phương pháp đại số): .................. 30
2.3.
Lập trình (Phương pháp hình học và đồ họa): ........................................ 35
2.3.1.
Biểu đồ cột trong không gian 3 chiều: ............................................. 35
2.3.2.
Biểu đồ cột chồng trong không gian 3 chiều: .................................. 36
2.3.3.
Biểu đồ cột trong không gian bản đồ: .............................................. 37
2.3.4.
Biểu đồ cột chồng trong không gian bản đồ: ................................... 38
2.4.
Thể hiện bằng phương pháp trực quan hóa: ........................................... 38
2.4.1.
Thể hiện trong không gian 3 chiều: ................................................. 39
2.4.2.
Thể hiện trong không gian bản đồ: .................................................. 40
CHƯƠNG III: CÂU HỎI PHÂN TÍCH .............................................................. 42
3.1.
Câu hỏi phân tích: ................................................................................... 42
3.1.1.
Phân loại câu hỏi: ............................................................................. 42
3.2.
Phân tích và trả lời câu hỏi bằng phương pháp trực quan hóa: .............. 44
3.3.
Phân tích bằng phương pháp chuyên gia: ............................................... 50
3.3.1.
Phân tích kết quả hoạt động sản xuất-kinh doanh: .......................... 50
iv
5. Phân tích bằng hồi quy tuyến tính: ............................................................ 56
5.1.
Kiểm tra sự tương quan giữa các biến: ............................................... 57
5.2.
Bảng model summary: ........................................................................ 59
5.3.
Bảng Anova: ........................................................................................... 59
5.4.
Bảng Coefficients: .................................................................................. 60
5.5.
Biểu đồ tần số phần dư chuẩn hóa Histogram: ....................................... 61
5.6.
Biểu đồ Scatter Plot kiếm tra giả định liên hệ tuyến tính: ...................... 61
KẾT LUẬN .......................................................................................................... 62
1. Kết quả nghiên cứu đạt được: .................................................................... 62
2. So sánh với các phương pháp phân tích thông thường: ............................. 62
3. Nhận xét: .................................................................................................... 63
4. Định hướng trong tương lai: ...................................................................... 63
TÀI LIỆU THAM KHẢO .................................................................................... 65
v
DANH MỤC CHỮ VIẾT TẮT
TÊN VIẾT TẮT
KÍ HIỆU
TÊN BIẾN
BH
IE
Bảo hiểm
CPBH
ES
Chi phí bán hàng
CPK
EO
Chi phí khác
CPQL
EG
Chi phí quản lý doanh nghiệp
CPSX
CO
Chi phí sản xuất chung
CPTC
EF
Chi phí tài chính
CPVL
CM
Chi phí nguyên vật liệu
DTBH
RG
Doanh thu
DTT
RN
Doanh thu thuần
DTTC
RF
Doanh thu hoạt động tài chính
GT
CP
Giá thành sản phẩm
GTDT
RD
Các khoản giảm trừ doanh thu
GVHB
CS
Giá vốn hàng bán
KG
S
Không gian
KH
CI
Khách hàng
LNG
PG
Lợi nhuận gộp
LNK
PO
Lợi nhuận khác
LNR
PN
Lợi nhuận ròng
LNT
PB
Lợi nhuận thuần từ hoạt động kinh doanh
vi
LNTT
PT
Lợi nhuận trước thuế
NC
EQ
Nhân công
NCC
VI
Nhà cung cấp nguyên vật liệu
SL
PQ
Sản lượng sản xuất
SLHB
SQ
Số lượng hàng bán ra theo container
TDN
TP
Tiền thuế thu nhập doanh nghiệp
TG
ER
Tỷ giá
TGLV
WH
Thời gian làm việc
TKTP
IP
Tồn kho thành phẩm
TKVL
IM
Tồn kho nguyên vật liệu
TL
CL
Lương
TNK
IO
Thu nhập khác
TSCD
AF
Tài sản cố định
TTVL
CQ
Tiêu thụ nguyên vật liệu
vii
DANH MỤC CÁC BẢNG BIỂU
Bảng 2.1: Bảng phân loại các biến. ...................................................................... 12
Bảng 2.2: Bảng tỷ lệ trích đóng các khoản bảo hiểm. ......................................... 27
Bảng 3.1: Tình hình Nhập-Xuất-Tồn thành phẩm của Doanh Nghiệp. ............... 51
Bảng 3.2: Kết quả hoạt động sản xuất-kinh doanh qua hai năm 2017- 2018 ...... 52
Bảng 3.3: Kết quả hoạt động sản xuất-kinh doanh qua hai năm 2018- 2019. ..... 53
viii
DANH SÁCH CÁC HÌNH
Hình 2.1: Sơ đồ quan hệ các biến......................................................................... 30
Hình 2.2: Bảng chức năng chọn thông tin............................................................ 35
Hình 2.3: Biểu đồ cột trong không gian 3 chiều. ................................................. 36
Hình 2.4: Biểu đồ cột chồng trong không gian 3 chiều. ...................................... 37
Hình 2.5: Biểu đồ cột trong không gian bản đồ. .................................................. 37
Hình 2.6: Biểu đồ cột chồng trong không gian bản đồ. ....................................... 38
Hình 2.7: Biểu đồ cột thể hiện trong không gian 3 chiều. ................................... 39
Hình 2.8: Biểu đồ cột chồng thể hiện trong không gian 3 chiều. ........................ 40
Hình 2.9: Biểu đồ cột thể hiện trong không gian bảng đồ. .................................. 40
Hình 2.10: Biểu đồ cột chồng thể hiện trong không gian bảng đồ. ..................... 41
Hình 3.1: Biểu đồ thể hiện tiền thuế doanh nghiệp trong 3 năm 2017-2019. ...... 44
Hình 3.2: Biểu đồ các loại chi phí của doanh nghiệp trong 3 năm 2017-2019. ... 45
Hình 3.3: Biểu đồ Thu-Chi của doanh nghiệp trong 3 năm 2017-2019. ............. 46
Hình 3.4: Biểu đồ Thu-Chi của doanh nghiệp trong 3 năm 2017-2019. ............. 47
Hình 3.5: Biểu đồ thu mua các loại nguyên vật liệu của doanh nghiệp. .............. 48
Hình 3.6: Biểu đồ tương quan SLSX – SLHB trong 3 năm (2017-2019). .......... 49
ix
MỞ ĐẦU
1. Giới thiệu:
Hiện nay, tình hình kinh doanh của doanh nghiệp là vấn đề cấp thiết
không những được quan tâm bởi các nhà quản lý mà còn của rất nhiều đối tượng
khác nhau. Đối với chủ doanh nghiệp thì mục đích quan tâm đến tình hình kinh
doanh để biết chính xác đến thực trạng kinh doanh của doanh nghiệp mình, từ đó
đưa ra các chiến lược kinh doanh, đối với các chủ đầu tư là để có thể đưa ra các
quyết định đầu tư, đối với các đối tác là có nên hợp tác hay không… Nhưng nhìn
chung đều với mục đích muốn biết hiệu quả sản xuất kinh doanh tình hình phát
triển và sức cạnh tranh của doanh nghiệp.
Để đáp ứng nhu cầu mang tính chiến lược đó, các nhà quản lý cần tham
chiếu lại dữ liệu sản xuất kinh doanh các năm trước rồi tiến hành phân tích đánh
giá để đưa ra quyết định cho các năm sau. Mặt khác bộ não con người xử lý hình
ảnh nhanh hơn từ ngữ, nên phương pháp trực quan hóa dữ liệu có thể giúp ta biến
thông tin thành quyết định kinh doanh, giúp các nhà lãnh đạo đánh giá chính xác
sức mạnh và đưa ra quyết định nhanh chóng, từ đó phát triển những lợi thế và tìm
những ra khó khăn để kịp thời khắc phục nhằm nâng cao hiệu quả sản xuất kinh
doanh, cũng như tránh những rủi ro trong tương lai của doanh nghiệp.
Nhận thấy được tầm quan trọng của vấn đề nêu trên, tôi quyết định chọn
đề tài: “Biểu diễn và phân tích trực quan dữ liệu kinh doanh của một doanh
nghiệp sản xuất đồ gỗ” làm đề tài cho khóa luận của mình.
2.
Tổng quan về tỉnh Bình Dương:
Toàn tỉnh Bình Dương hiện nay có 28 khu công nghiệp (KCN) với tổng
diện tích quy hoạch 9,093.25 ha, phân bố ở 5 thị xã/huyện. Thị xã Dĩ An có 6
KCN với diện tích 854.1 ha. Thị xã Thuận An có 3 KCN với diện tích 694.18 ha.
Huyện Bến Cát có 9 KCN với diện tích 4,112.93 ha. Huyện Tân Uyên có 3 KCN
với diện tích 1,839.84 ha và Thị xã Thủ Dầu Một có 7 KCN (thuộc Khu liên hợp
Công nghiệp - Dịch vụ - Đô thị Bình Dương) với diện tích 1,730.91 ha.
1
Về quy mô KCN, diện tích bình quân khoảng 324 ha/KCN. KCN lớn nhất
là KCN VSIP II-A thuộc huyện Tân Uyên với diện tích 1,008 ha, KCN nhỏ nhất
là KCN Bình Đường với diện tích là 16,5 ha. Hiện nay đã có 24 KCN đi vào hoạt
động chính thức với tổng diện tích 7,308.85 ha, 4 KCN còn lại đang trong giai
đoạn xây dựng cơ bản (Thới Hòa, An Tây, Mapletree, VSIP II–A) với tổng diện
tích 1,784.4 ha.
[Trích nguồn báo sở công thương: Tình hình xây dựng và phát triển các
khu công nghiệp tỉnh Bình Dương đến nay. (25-04-2019)]
3.
Tổng quan về ngành sản xuất & chế biến gỗ ở Bình Dương:
Trong những năm qua, ngành chế biến gỗ xuất khẩu trên địa bàn tỉnh Bình
Dương luôn duy trì mức tăng trưởng cao và ổn định (trung bình 12 - 15%/năm),
là một trong những ngành chiếm tỷ trọng cao nhất trong tổng kim ngạch xuất
khẩu của tỉnh (chiếm từ 12 – 14%). Bình Dương luôn là một trong những địa
phương hàng đầu của cả nước về xuất khẩu đồ gỗ (chiếm trung bình 35% – 40%).
Cụ thể trong giai đoạn 2011-2015 giá trị sản xuất công nghiệp ngành gỗ tăng
15.9%. Riêng năm 2018, kim ngạch xuất khẩu ngành chế biến gỗ đạt hơn 3 tỷ
USD, tăng 15.6% so với năm 2017, chiếm 12% kim ngạch xuất khẩu toàn tỉnh và
chiếm gần 40% tổng kim ngạch xuất khẩu ngành gỗ cả nước. Toàn tỉnh có
khoảng 1,215 doanh nghiệp chế biến gỗ đang hoạt động sản xuất kinh doanh,
trong đó: 905 doanh nghiệp trong nước (tổng vốn đăng ký 10,839 tỷ đồng); 310
doanh nghiệp nước ngoài (tổng vốn đăng ký 2.3 tỷ USD). Thị trường chính của
ngành là Mỹ, EU, Nhật, Hàn Quốc, ngoài ra ngành chế biến gỗ còn phát triển
thêm được các thị trường xuất khẩu mới như Trung Đông, Bắc Mỹ…
[Trích nguồn báo sở công thương: Chế biến gỗ xuất khẩu – Điểm sáng
trong bức tranh công nghiệp Bình Dương. (27-03-2019)]
4.
Đặt vấn đề:
Những thách thức mà ngành gỗ Bình Dương cũng như doanh nghiệp đang
gặp phải như: Tình hình giá nguyên liệu gỗ, các phụ kiện ngành gỗ biến động
khó lường, có khi tăng đột biến ảnh hưởng đến hiệu quả sản xuất kinh doanh của
2
doanh nghiệp, nguồn lực lao động không đáp ứng hoặc kĩ năng tay nghề không
có chuyên môn, công tác quản lý còn chưa tốt, phúc lợi cho người lao động trong
ngành không được đáp ứng, máy móc, thiết bị không đầy đủ, chuyên nghiệp…
Do hầu hết các doanh nghiệp chế biến gỗ Việt Nam đều là doanh nghiệp vừa và
nhỏ, quy mô sản xuất trung bình và khá phân tán, thiếu chuyên môn hoá, dẫn đến
khả năng tiếp cận khách hàng hạn chế, khả năng tiếp nhận những đơn hàng lớn
khó khăn làm giảm sức cạnh tranh cũng như đảm bảo tính ổn định của sản xuất.
Thêm vào đó, ngành chế biến gỗ chưa phát triển mạnh về kỹ năng thiết kế, phát
triển mẫu mã sản phẩm mới để đáp ứng thị hiếu và bị động trong việc tiếp cận
nhu cầu của thị trường thế giới...
Vì thế tôi hy vọng, luận văn này có thể giúp cho các nhà quản lý doanh
nghiệp nhận ra và đánh giá được thực trạng, tình hình kinh doanh của doanh
nghiệp. Từ đó, đưa ra chiến lược quản lý, phát triển kĩ thuật, công nghệ, con
người để góp phần tăng năng suất, sản lượng, hiệu quả công việc và chất lượng
sản phẩm để đưa doanh nghiệp phát triển, giúp tỉnh nhà, đất nước giàu mạnh.
5.
Mục tiêu nghiên cứu:
Thực hiện phân tích và biểu diễn trực quan dữ liệu kinh doanh của doanh
nghiệp sản xuất đồ gỗ qua 3 năm 2017- 2019.
6.
Phạm vi nghiên cứu:
Phạm vi không gian:
Dữ liệu nghiên cứu được thu thập tại một công ty ở Bình dương. Lĩnh vực
của doanh nghiệp là mua bán, chế biến sản xuất các sản phẩm từ gỗ như đồ nội
thất. Số liệu thu thập bao gồm: Các báo cáo, dữ liệu trong 3 năm (2017-2019) về
hoạt động kinh doanh, sản xuất, nhân công, mua bán, tài chính, kế toán… và các
thuyết minh báo cáo của công ty.
Phạm vi thời gian:
Dữ liệu nghiên cứu được lấy trong khoảng thời gian từ ngày 01 tháng 01
năm 2017 đến ngày 31 tháng 12 năm 2019.
3
Phương pháp nghiên cứu:
7.
-
Phương pháp phân tích: để phân tích các biến, các mối quan hệ và thiết
lập sơ đồ quan hệ.
-
Phương pháp khảo sát: để khảo sát tập dữ liệu.
-
Phương pháp lập trình: dùng ngôn ngữ python để lập trình ra đồ thị trực
quan.
Cấu trúc luận văn:
8.
Luận văn gồm 5 phần:
-
Giới thiệu tổng quan.
-
Chương I: Cơ sở lý thuyết.
-
Chương II: Nội dung và phương pháp thực hiện.
-
Chương III: Câu hỏi Phân tích.
-
Kết luận.
4
CHƯƠNG I: CƠ SỞ LÝ THUYẾT
1.1.
Tổng quan về trực quan hóa:
Trực quan hóa thường được sử dụng sau khi có kết quả phân tích dữ liệu,
tức có được thông tin trích xuất từ dữ liệu để trình bày cho người đọc, người xem.
Ngoài ra, trực quan hóa có thể được sử dụng trước khi dữ liệu được đưa vào giai
đoạn phân tích. Ví dụ: Các chuyên gia muốn tìm hiểu trước về các biến dữ liệu,
mối quan hệ giữa chúng là gì để suy nghĩ về các mô hình dự báo, họ có thể vẽ
trước các đồ thị để xem xét. Đây gọi là giai đoạn khám phá dữ liệu hoặc phương
pháp tóm tắt trình bày dữ liệu trong thống kê. Nói một cách đơn giản, đây là việc
tạo ra các biểu đồ, đồ thị hay sử dụng các phương pháp, công cụ khác nhau để
trực quan hóa và minh họa dữ liệu.
1.2.
Lý thuyết về trực quan hóa:
Ý nghĩa của trực quan hóa là biến các nguồn dữ liệu thành những thông tin
được thể hiện một cách trực quan, dễ quan sát, dễ hiểu để truyền đạt rõ ràng
những hiểu biết đầy đủ từ dữ liệu đến người xem, người đọc. Trực quan hóa
không chỉ giúp người đọc, người xem nắm bắt thông tin mà còn giúp nhà phân
tích khai thác dữ liệu một cách tối ưu. Phương pháp tóm tắt, trình bày dữ liệu
trong thống kê là một phần nằm trong trực quan hóa vì nó liên quan đến việc thể
hiện, mô tả dữ liệu (các biến) định tính, định lượng dưới dạng các đồ thị phù hợp,
đây cũng là một dạng trực quan dữ liệu. Tóm tắt và trình bày, mô tả dữ liệu trong
thống kê được chia làm 2 dạng phụ thuộc vào tính chất của dữ liệu, đó chính là
dữ liệu định tính và dữ liệu định lượng.
Các dạng biểu đồ, đồ thị thường dùng trong trực quan hóa:
-
Biểu đồ cột/ cột chồng.
-
Biểu đồ đường.
-
Biểu đồ Pareto.
-
Biểu đồ tròn.
-
Biểu đồ phân tán (Scatter plot).
-
Biểu đồ Bubble.
5
-
Biểu đồ Area.
-
Biểu đồ thác nước (Waterfall).
-
Biểu đồ phễu (Funnel).
-
Biểu đồ nhiệt (Heat).
-
Biểu đồ hộp và râu (Box-plot).
1.3.
Các nghiên cứu liên quan:
Nghiên cứu 1: Tiếp cận nhận thức thị giác của con người để thiết kế
hình ảnh, đồ thị trong trực quan hóa dữ liệu.
Nghiên cứu này nghiên cứu các đặc điểm nhận thức bằng thị giác của con
người, mối quan hệ giữa các dữ liệu với các biến của tập dữ liệu để tạo thành các
mô hình khối đại diện cho tập dữ liệu dưới dạng một biểu đồ trên khối lập
phương. Nghiên cứu đề xuất quy trình thiết kế đồ thị đa chiều giống như đồ thị
có cấu trúc dựa trên mô hình khối lập phương để biểu diễn dữ liệu đa biến. Biểu
đồ cấu trúc được thiết kế dựa trên mối quan hệ giữa các biến dữ liệu và nhận thức
thị giác của con người. Sau khi ánh xạ đồ thị kết cấu lên màn hình máy tính, đồ
thị được tích hợp thêm các biến võng mạc để cải thiện các đặc điểm thị giác
khách quan và phản hồi một cách chủ quan nhận thức của con người về thị giác.
Nghiên cứu 2: Tích hợp các biến võng mạc vào Biểu đồ Hình ảnh hóa
Dữ liệu Đa biến để tăng các tính năng trực quan.
Hiệu quả của biểu đồ hiển thị dữ liệu đa biến không chỉ được đánh giá chủ
quan bằng nhận thức thị giác của con người mà còn được ước tính một cách
khách quan bằng các tính năng trực quan của đồ thị. Với một đồ thị được thiết kế,
cần cải thiện các tính năng trực quan để cho phép người đọc trích xuất thông tin
tốt hơn từ dữ liệu. Tích hợp các biến võng mạc vào biểu đồ là một cách để tăng
các tính năng trực quan của đồ thị. Trong nghiên cứu này, các thành phần của đồ
thị được nhóm thành các lớp và đánh dấu bằng các đặc điểm định tính và định
lượng. Các biến võng mạc được nghiên cứu để tích hợp vào các lớp. Một quá
trình gồm năm bước được đề xuất để tăng các tính năng thị giác bằng cách tích
6
hợp các biến võng mạc vào đồ thị. Quá trình này được minh họa bằng hai nghiên
cứu điển hình: Tăng đặc tính trực quan của bản đồ không gian-thời gian xe buýt
với các lớp định lượng; Tăng đặc tính trực quan của biểu đồ thể hiện dữ liệu dịch
tay-chân-miệng ở Bình Dương với các lớp định tính và định lượng.
Nghiên cứu 3: Hình ảnh hóa có quan trọng không? Vai trò của trực
quan hóa dữ liệu để tạo cảm giác thông tin.
Là một phần của công nghệ phân tích kinh doanh (BA), báo cáo và trực
quan hóa đóng vai trò thiết yếu trong việc giảm thiểu các hạn chế của người đọc
như: thiếu kinh nghiệm, kiến thức hạn chế và thông tin cần đơn giản hóa. Trực
quan hóa có giúp nâng cao khả năng tiếp nhận thông tin và cho phép người đọc
tập trung nhiều hơn vào thông điệp của thông tin hơn là phân tích số. Để hiểu rõ
hơn về vai trò của bài nghiên cứu và trực quan hóa trong môi trường được ngữ
cảnh hóa, bài viết nghiên cứu việc sử dụng tương tác trực quan hóa dữ liệu (IDV)
trong kế toán. Nghiên cứu tìm hiểu liệu IDV có thể giúp các nhà đầu tư không
chuyên nghiệp nâng cao khả năng thực hiện các phân tích báo cáo tài chính cơ
bản. Nghiên cứu này đã tiến hành một thử nghiệm sử dụng mẫu gồm 324 nhà đầu
tư không chuyên nghiệp. Phát hiện chỉ ra rằng các nhà đầu tư không chuyên sử
dụng IDV có kinh nghiệm hơn những người không chuyên không sử dụng IDV.
Những phát hiện này bổ sung thêm lý thuyết về sử dụng phân tích kinh doanh
trong việc ra quyết định kế toán. Kết quả của nghiên cứu cũng đề xuất một số các
khóa học, chẳng hạn như thúc đẩy việc sử dụng và tạo ra IDV hợp lý rộng rãi
hơn, đặc biệt là cho các nhà đầu tư không chuyên nghiệp.
1.4.
Trực quan hóa bằng ngôn ngữ lập trình python:
1.4.1. Thư viện Matplotlib:
a. Giới thiệu:
Matplotlib là một thư viện giống như GNUplot. Ưu điểm chính so với
GNUplot đó là Matplotlib là một module của Python. Do mức độ phổ biến của
python ngày càng tăng, nên matplotlib cũng nhận được sự quan tâm tương tự.
7
Matplotlib có thể được sử dụng để tạo ra những figures đủ chất lượng cho một
loạt các định dạng và môi trường tương tác trên nền tảng. Người dùng thường rất
nhanh làm quen với thư viện khi bắt đầu.
Matplotlib có các interfaces để tương tác như: Object-Oriented API, The
Scripting Interface (pyplot), The MATLAB Interface (pylab). Pyplot và pylab
đều là lightweight interfaces, tuy nhiên Pyplot cung cấp một giao diện các thư
viện để vẽ hướng đối tượng trong matplotlib. Các lệnh vẽ được thiết kế tương tự
với Matlab cả về cách đặt tên và ý nghĩa các đối số. Cách thiết kế này giúp cho
việc sử dụng pyplot dễ dàng và dễ hiểu hơn.
b. Khái niệm:
Matplotlib cung cấp các hàm đơn giản để thêm các thành phần plot như
lines, images, text... vào các axes trong figure. Một Matplotlib figure có thể được
phân loại thành nhiều phần như dưới đây:
-
Figure: Cửa sổ hiển thị biểu đồ.
-
Axes: Gồm các axes (những khung nhỏ hơn). Một figure có thể chứa một
hoặc nhiều axes. Mặt khác, figure là khung chứa, axes là nơi hiển thị biểu
đồ.
-
Axis: Là dòng và có nhiệm vụ giới hạn biểu đồ.
-
Artist: Hiển thị trên Textobjects, Line2D objects, collection objects. Hầu
hết các Artists được gắn với Axes.
c. Các dạng biểu đồ trong thư viện Matplotlib:
-
Biểu đồ thanh.
-
Biểu đồ tròn.
-
Biểu đồ Histogram.
-
Sơ đồ phân tán và 3 chiều.
8
1.4.2. Thư viện Basemap:
Dữ liệu địa lý là một dạng thông tin phổ biến trong khoa học dữ liệu.
Công cụ chính của Matplotlib cho kiểu hiển thị này là bộ công cụ Basemap, một
bộ công cụ Matplotlib tồn tại dưới không gian tên mpl_toolkits. Tuy nhiên,
basemap khá tốn dung lượng và thời gian, thậm chí cả hình ảnh đơn giản cũng
mất nhiều thời gian để vẽ. Các giải pháp hiện đại hơn như leaflet hoặc Google
Maps API có thể là sự lựa chọn tốt hơn cho việc map visualization chuyên sâu.
Tuy nhiên, Basemap là một công cụ ảo hữu ích cho người dùng Python.
Map được trình bày ở đây không phải là một hình ảnh đơn thuần, nó là
một trục Matplotlib đầy đủ chức năng mà hiểu được các tọa độ hình cầu và dễ
dàng cho phép đưa dữ liệu trên bản đồ. Điều này cho phép có một cái nhìn ngắn
gọn về các hình ảnh trực quan địa lý có thể với chỉ một vài dòng lệnh Python.
Các phép chiếu bản đồ đơn giản nhất là các hình trụ, trong đó các đường vĩ độ và
kinh độ liên tục được ánh xạ tới các đường ngang và dọc. Loại bản đồ này đại
diện cho vùng xích đạo khá tốt, nhưng lại làm biến dạng các vùng gần cực.
Trên thực tế ta đã quen với việc không thể chiếu một bản đồ hình cầu, như
Trái Đất, lên một bề mặt phẳng mà không làm phá vỡ sự liên tục của nó. Những
bản đồ chiếu này đã được phát triển trong quá trình lịch sử nhân loại, và có rất
nhiều lựa chọn. Tùy thuộc vào mục đích sử dụng của bản đồ chiếu, có một số
tính năng bản đồ nhất định (Ví dụ: chỉ đường, diện tích, khoảng cách, hình dạng
hoặc các cân nhắc khác) chúng rất hữu ích để duy trì.
9
- Xem thêm -