ĈҤI HӐC QUӔC GIA TP.HCM
75ѬӠ1*ĈҤI HӐC BÁCH KHOA
KHOA KHOA HӐC & KӺ THUҰT MÁY TÍNH
LUҰ19Ă17ӔT NGHIӊ3ĈҤI HӐC
XÂY DӴNG Hӊ THӔNG TRÍ TUӊ KINH DOANH
CHO DOANH NGHIӊP ÁP DӨNG VÀO CÔNG TY
SҦN XUҨT HOҺ&7+ѬѪ1*0ҤI
NGÀNH: KHOA HӐC MÁY TÍNH
HӜ,ĈӖNG : HӜ,ĈӖNG 7 KHOA HӐC MÁY TÍNH
GVHD
: PGS. TS. TRҪN MINH QUANG
GVPB
: THS. NGUYӈN THӎ ÁI THҦO
---o0o---
SVTH 1
7UѭѫQJ*LD%ҧo (1710019)
SVTH 2
: Cao NguyӋt Minh (1710188)
SVTH 3
: NguyӉn Ngӑc Phát (1710228)
TP. HӖ CHÍ MINH, 08/2021
2
3
4
/Ӡ,&$0Ĉ2$1
Chúng tôi [LQFDPÿRDQÿk\OjF{QJWUuQKQJKLrQFӭu cӫa riêng chúng tôi Gѭӟi sӵ
JLiPViWYjKѭӟng dүn cӫa PGS. TS. Trҫn Minh Quang. Nӝi dung nghiên cӭu và các kӃt
quҧ ÿӅu là trung thӵFYjFKѭDWӯQJÿѭӧc công bӕ WUѭӟFÿk\&iFVӕ liӋXÿѭӧc sӱ dөng
cho quá trình phân tích, nhұQ[pWÿѭӧc chính chúng tôi thu thұp tӯ nhiӅu nguӗn khác nhau
Yjÿѭӧc ghi rõ trong phҫn tài liӋu tham khҧo.
Ngoài ra, chúng tôi FNJQJFyVӱ dөng mӝt sӕ nhұQ[pWÿiQKJLiYjVӕ liӋu cӫa các
tác giҧ NKiFFѫTXDQWә chӭc khác. Tҩt cҧ ÿӅu có trích dүn và chú thích nguӗn gӕc.
NӃu phát hiӋn có bҩt kì sӵ gian lұn nào, chúng tôi xin hoàn toàn chӏu trách nhiӋm
vӅ nӝi dung LuұQYăQWӕt nghiӋSĈҥi hӑc cӫDPuQKĈҥi hӑc Bách Khoa - Ĉҥi hӑc Quӕc
Gia TPHCM NK{QJOLrQTXDQÿӃn nhӳng vi phҥm tác quyӅn, bҧn quyӅn do chúng tôi gây
ra trong quá trình thӵc hiӋn.
TP. Hӗ Chí Minh, Ngày 26 tháng 07 QăP
5
/Ӡ,&Ҧ0Ѫ1
Qua thӡi gian hӑc tұp và rèn luyӋn tҥi TUѭӡQJĈҥi hӑc Bách Khoa - Ĉҥi hӑc Quӕc
Gia TP. HCM, chúng tôi ÿѭӧc sӵ chӍ bҧo và giҧng dҥy nhiӋt tình cӫa quý thҫ\F{ÿһc
biӋt là quý thҫy cô khoa Khoa hӑFYj.ƭWKXұW0i\WtQKÿmWUX\ӅQÿҥt cho nhӳng kiӃn
thӭc vӅ lý thuyӃt và thӵc hành trong suӕt thӡi gian hӑc tұp ӣ WUѭӡng.
Chúng tôi vӟi mӑi sӵ nӛ lӵc cӫa bҧQWKkQÿmKRjQWKjQKLuұQYăQWӕt nghiӋp cӫa
mình. Chúng tôi [LQFKkQWKjQKFiPѫQTXêWKҫ\F{WUѭӡQJĈҥi hӑc Bách Khoa - Ĉ+4*
73+&0ÿmWUX\ӅQÿҥt cho chúng tôi nhӳng kiӃn thӭc bә ích trong thӡi gian qua. Chúng
tôi tӓ lòng biӃWѫQVkXVҳFÿӃn PGS.TS. TrҫQ0LQK4XDQJÿmKѭӟng dүn và hӛ trӧ tұn
tình chúng tôi trong quá trình nghiên cӭu.
Trong quá trình làm luұQYăQ, do kiӃn thӭc còn hҥn hҽp, chúng tôi không tránh
khӓi có nhӳng thiӃu sót trong cách trình bày và diӉQÿҥt, và nhӳng công viӋc yêu cҫu
FKѭDKRjQWKjQK. Chúng tôi rҩt mong nhұQÿѭӧc sӵ ÿyQJJySêNLӃn cӫa quý thҫy cô ÿӇ
báo cáo luұQYăQWӕt nghiӋSÿҥWÿѭӧc kӃt quҧ tӕt nhҩt.
Cuӕi cùng, chúng tôi kính chúc các quý thҫy cô dӗi dào sӭc khoҿ, thành công trên
FRQÿѭӡng phát triӇn sӵ nghiӋp giáo dөc ÿҫ\êQJKƭD và cao quý.
6
7Ï07Ҳ7Ĉӄ7¬,
Ngày nay, viӋc áp dөng công nghӋ WK{QJWLQYjRODRÿӝng và sҧn xuҩt ÿmWUӣ thành
[XKѭӟng và hҫu hӃt các doanh nghiӋp bҳWÿҫu chuyӇQÿәi tҩt cҧ các bҧn ghi trên giҩy
sang các tӋp máy tính kӻ thuұt sӕ. Qua thӡi gian, doanh nghiӋp xuҩt hiӋn nhu cҫu cҩp
thiӃt là làm sao phân tích tӯ kho dӳ liӋu khәng lӗ ÿyÿӇ xem xétÿiQKJLá lҥi mӑi thӭ hӑ
ÿmlàm, tӯ hӋ thӕng nӝi bӝ ÿӃQWѭѫQJWiFFӫa khách hàng. Tӯ ÿyGRDQKQJKLӋp có thӇ
WKD\ÿәi quy trình cӫa mình theo cách cho phép ra quyӃWÿӏnh tӕWKѫQKLӋu quҧ KѫQnâng
cao trҧi nghiӋm khách hàng vӟi nhiӅXWtQKFiQKkQKyDKѫQQӳa.
Nhóm ÿmchӑn ÿӅ tài "XÂY DӴNG Hӊ THӔNG TRÍ TUӊ KINH DOANH
CHO DOANH NGHIӊP ÁP DӨNG VÀO CÔNG TY SҦN XUҨT HOҺ&7+ѬѪ1*
MҤI" vӟi sӵ Kѭӟng dүn cӫa thҫy PGS. TS. Trҫn Minh Quang làm luұQYăQWӕt nghiӋp
Ĉҥi hӑc ÿӇ giҧi quyӃt nhӳQJNKyNKăQQKXFҫu cӫa doanh nghiӋp. ĈӅ tài nghiên cӭu và
phát triӇn ӭng dөng hӛ trӧ doanh nghiӋp xây dӵng kho dӳ liӋu (Data Warehouse) và trí
tuӋ kinh doanh (Business Intelligence). HӋ thӕQJQj\ÿѭӧc kì vӑng là có khҧ QăQJKӛ trӧ
các doanh nghiӋp quҧn lý nguӗn dӳ liӋXYjÿѭDUDQKӳng lӡLNKX\rQÿӇ doanh nghiӋSÿѭD
ra nhӳng quyӃWÿӏnh mang tính quyӃWÿӏnhÿѭDUDQKӳng trҧi nghiӋm tӕt nhҩt cho khách
hàng. HӋ thӕng có thӇ tùy chӍnh phù hӧp cho nhiӅu doanh nghiӋp vӟi trӑng tâm là doanh
nghiӋp sҧn xuҩt và doanh nghiӋSWKѭѫQJPҥi.
7URQJÿӅ tài luұn YăQ, nhóm tác giҧ tìm hiӇu vӅ kho dӳ liӋu, quá trình trích xuҩt,
biӃQÿәi dӳ liӋu và trӵc quan hoá dӳ liӋu trong trí tuӋ NLQKGRDQKÿӅ xuҩWSKѭѫQJSKiS
xây dӵng kho dӳ liӋXFѫFKӃ ETL và công cө phân tích dӳ liӋu, hiӋn thӵFSKѭѫQJSKiS
ÿӅ xuҩt. 6DXÿyQhóm xây dӵng nhӳng quy trình chung và tәng quan nhҩt mà các doanh
nghiӋp sҧn xuҩt và doanh nghiӋSWKѭѫQJPҥi mong muӕn khi xây dӵng và sӱ dөng mӝt
hӋ thӕng kho dӳ liӋu. Nhӳng quy trình này ÿѭӧc nhóm tác giҧ trích xuҩt tӯ các nghiên
cӭu cӫa nhóm vӅ doanh nghiӋSWKѭѫQJPҥi và sҧn xuҩt. Cuӕi cùng, các quy trình mà
nhóm tác giҧ sӁ tұp trung phát triӇn bao gӗm quy trình bán hàng (Sales), Nhұp hàng
(Procurement), Kho OѭXWUӳ hàng hoá (Product Inventory) và quҧn lý quan hӋ khách hàng
(Customer Relationship Management).
7
0Ө&/Ө&
LӠI &$0Ĉ2$1 ...................................................................................................................... 2
LӠI CҦ0Ѫ1............................................................................................................................ 6
TÓM TҲ7Ĉӄ TÀI ................................................................................................................... 7
MӨC LӨC ................................................................................................................................. 8
DANH MӨC HÌNH ................................................................................................................ 12
DANH MӨC BҦNG ............................................................................................................... 14
DANH MӨC THUҰT NGӲ - TӮ VIӂT TҲT ....................................................................... 15
&+ѬѪ1**,ӞI THIӊU ..................................................................................................... 16
GIӞI THIӊU Ĉӄ TÀI .................................................................................................... 16
MӨ&7,Ç8Ĉӄ TÀI ...................................................................................................... 16
GIӞI HҤ1Ĉӄ TÀI ....................................................................................................... 17
CҨU TRÚC LUҰ19Ă1 .............................................................................................. 18
&+ѬѪ1*&Ѫ6Ӣ LÝ THUYӂT VÀ CÁC NGHIÊN CӬU LIÊN QUAN ....................... 19
ĈӔ,7ѬӦNG DOANH NGHIӊP .................................................................................. 19
2.1.1 DOANH NGHIӊ37+ѬѪ1*0ҤI ....................................................................... 19
2.1.2 DOANH NGHIӊP SҦN XUҨT ............................................................................. 20
KHO DӲ LIӊU (DATA WAREHOUSE) ..................................................................... 20
Ĉӎ1+1*+Ƭ$ ........................................................................................................ 20
2.2.2 CÁCH XÂY DӴNG KHO DӲ LIӊU .................................................................... 20
2.2.3 CÁCH TIӂP CҰN KIMBALL (BOTTOM-UP) .................................................... 21
ĈÈ1+*,È&+81*9ӄ CÁCH TIӂP CҰN CӪA KIMBALL ........................... 22
CÁC KHÁI NIӊM TRONG MÔ HÌNH CHIӄU DӲ LIӊU.......................................... 22
3+ѬѪ1*3+È37+,ӂT Kӂ MÔ HÌNH CHIӄU DӲ LIӊU ................................ 22
2.3.2 BҦNG SӴ THҰT (FACT) ..................................................................................... 23
2.3.3 BҦNG CHIӄU (DIMENSION).............................................................................. 23
2.3.4 BUS MATRIX ........................................................................................................ 23
2.3.5 SCD (SLOWLY CHANGE DIMENSION) ........................................................... 23
2.3.6 MÔ HÌNH NGÔI SAO (STAR SCHEMA) ........................................................... 25
TRÍ TUӊ KINH DOANH .............................................................................................. 25
Ĉӎ1+1*+Ƭ$ ........................................................................................................ 25
2.4.2 TRÍ TUӊ KINH DOANH KӂT HӦP VӞI KHAI PHÁ DӲ LIӊ89¬.Ƭ7+8ҰT
HӐC MÁY ...................................................................................................................... 26
ETL PIPELINE (EXTRACT ± TRANSFORM - LOAD) ............................................. 27
2.5.1 KHÁI NIӊM ........................................................................................................... 27
2.5.2 THÀNH PHҪN CHÍNH TRONG TIӂN TRÌNH ETL .......................................... 27
8
SӔ LIӊU HOÁ (DIGITIZATION) ................................................................................ 28
2.6.Ĉӎ1+1*+Ƭ$ ........................................................................................................ 28
2.6.2 SӔ LIӊU HOÁ (DIGITIZATION) VÀ SӔ HOÁ (DIGITALIZATION) .............. 28
NHҰN DҤNG KÝ TӴ QUANG HӐC (OCR) ............................................................. 29
2.7.1 KHÁI NIӊM ........................................................................................................... 29
ĈӐ&+2ÈĈѪ1BÁN HÀNG BҴNG CÔNG NGHӊ OCR ................................ 29
CÁC NGHIÊN CӬU, SҦN PHҬM LIÊN QUAN ........................................................ 31
2.8.1 CÁC NGHIÊN CӬU .............................................................................................. 31
2.8.2 CÁC SҦN PHҬM .................................................................................................. 32
&+ѬѪ1*3+Æ17Ë&+9¬7+,ӂT Kӂ Hӊ THӔNG....................................................... 33
VҨ1Ĉӄ CҪN GIҦI QUYӂT ....................................................................................... 33
.+Ï.+Ă1 .................................................................................................................. 33
GIҦI PHÁP .................................................................................................................... 34
PHÂN TÍCH Hӊ THӔNG ............................................................................................. 34
3.4.1 YÊU CҪU CHӬ&1Ă1* ...................................................................................... 34
3.4.2 YÊU CҪU PHI CHӬ&1Ă1* .............................................................................. 35
6ѪĈӖ UML VÀ MÔ TҦ CHӬ&1Ă1*+ӊ THӔ1*Ĉӄ XUҨT ..................... 36
KIӂN TRÚC Hӊ THӔNG ............................................................................................. 40
THIӂT Kӂ KHO DӲ LIӊU ........................................................................................... 42
%860$75,;Ĉӄ XUҨT ..................................................................................... 42
&È&)$&702'(/Ĉӄ XUҨT ........................................................................... 42
THIӂT Kӂ &Ѫ&+ӂ ETL .............................................................................................. 49
3.7.1 KIӂN TRÚC ........................................................................................................... 49
3.7.2 PHÂN TÍCH CHӬ&1Ă1*&Ѫ&+ӂ ETL .......................................................... 51
7+$<ĈӘI CҨU TRÚC BҦNG HIӊN CÓ .......................................................... 54
&Ѫ&+ӂ ĈӎNH THӠI ............................................................................................ 57
CÔNG CӨ PHÂN TÍCH DӲ LIӊU .............................................................................. 58
3.8.1 NHӲ1*/Ƭ1+9ӴC CҪN PHÂN TÍCH .............................................................. 58
3.8.2 PHÂN TÍCH YÊU CҪU CHUNG CӪ$1*ѬӠI QUҦN LÝ ............................... 58
3.8.3 ӬNG DӨNG MÔ HÌNH TRÍ TUӊ NHÂN TҤO .................................................. 62
3.8.4 CÔNG CӨ TRӴC QUAN HOÁ DӲ LIӊU ........................................................... 63
ĈҬY MҤNH KHҦ 1Ă1*6Ӕ LIӊU HOÁ VÀ THU THҰP THÔNG TIN ............... 64
.+Ï.+Ă1&ӪA DOANH NGHIӊP TRONG QUÁ TRÌNH SӔ HOÁ ............. 64
3+ѬѪ1*3+È36Ӕ HOÀ DӲ LIӊU BҴNG CÔNG NGHӊ OCR ..................... 65
&+ѬѪ1*+,ӊN THӴC Hӊ THӔNG ................................................................................ 67
XÂY DӴNG KHO DӲ LIӊU ....................................................................................... 67
9
4.1.1 CÁC LOҤI MÔ HÌNH DӲ LIӊ8ĈҪU VÀO....................................................... 67
4.1.2 MӔI QUAN Hӊ (RELATIONSHIPS) ................................................................... 68
7ѬѪ1*7È&9ӞI CÁC BҦNG TRONG MÔ HÌNH CHIӄU ............................. 68
4.1.4 CÁC THUӜC TÍNH CӪA BҦNG TRONG MÔ HÌNH CHIӄU .......................... 69
HIӊN THӴ&&Ѫ&+ӂ ETL .......................................................................................... 70
4.2.1 TRÍCH XUҨT DӲ LIӊU (EXTRACT DATA, DATA INGESTION) ................. 70
4.2.2 CÁC PHÉP BIӂ1ĈӘI DӲ LIӊU (DATA TRANSFORM) ................................. 72
4.2.3 TҦI DӲ LIӊU VÀO KHO DӲ LIӊU (LOAD DATA) ......................................... 76
&Ѫ&+ӂ ĈӎNH THӠI ............................................................................................ 77
CÔNG CӨ PHÂN TÍCH DӲ LIӊU .............................................................................. 78
4.3.1 MÔ HÌNH AI PHÂN TÍCH PHÂN KHÚC KHÁCH HÀNG ............................... 78
4.3.2 TRӴC QUAN HOÁ DӲ LIӊU .............................................................................. 78
4.3.3 PHÂN TÍCH DӲ LIӊU BҴNG CÁC CÔNG CӨ BÊN THӬ BA ........................ 80
3+ѬѪ1*3+È36Ӕ HOÁ BҴNG CÔNG NGHӊ OCR .............................................. 81
&+ѬѪ1*7ӘNG KӂT VÀ CÔNG VIӊ&7521*7ѬѪ1*/$, .................................... 87
KӂT QUҦ ĈҤ7ĈѬӦC ................................................................................................ 87
Ѭ89¬1+ѬӦ&Ĉ,ӆ03+ѬѪ1*3+È3Ĉӄ XUҨT................................................. 87
Ѭ8Ĉ,ӆM ............................................................................................................... 87
5.2.2 HҤN CHӂ............................................................................................................... 88
5.2.3 GIҦI PHÁP CҦI TIӂN........................................................................................... 88
+ѬӞNG MӢ RӜ1*7ѬѪ1*/$, .............................................................................. 89
ĈÈNH GIÁ .................................................................................................................... 89
ĈÈ1+*,È75Ç1<Ç8&Ҫ81*ѬӠI DÙNG .................................................... 89
ĈÈ1+*,È+,ӊU XUҨT TҦI TRANG GIAO DIӊ11*ѬӠI DÙNG ............... 91
ĈÈ1+*,È7+ӠI GIAN THӴC HIӊN ETL CHO CÁC FACT MODEL ........... 92
ĈÈ1+*,È9ӄ CHI PHÍ ....................................................................................... 94
ĈÈ1+*,È&+,3+Ë7521*75ѬӠNG HӦP CӨ THӆ .................................... 97
TÀI LIӊU THAM KHҦO................................................................................................... 100
&+ѬѪ1*3+Ө LӨC ........................................................................................................ 104
LÝ THUYӂT LIÊN QUAN......................................................................................... 104
6.1.1 KHÁI NIӊM DATA WAREHOUSE THEO INMON (TOP-DOWN)................ 104
ĈÈ1+*,È&+81*9ӄ 2 CÁCH TIӂP CҰN XÂY DӴNG KHO DӲ LIӊU .. 104
MÔ TҦ CÁC BҦNG CHIӄU DÙNG CHUNG .......................................................... 106
6.2.1 DATE DIMENSION ............................................................................................ 106
6.2.2 PRODUCT DIMENSION .................................................................................... 106
6.2.3 STORE DIMENSION .......................................................................................... 107
10
6.2.4 WAREHOUSE DIMENSION .............................................................................. 107
6.2.5 CUSTOMER DIMENSION ................................................................................. 108
6.2.6 PROMOTION DIMENSION ............................................................................... 108
6.2.7 PAYMENT METHOD DIMENSION ................................................................. 109
6.2.8 INVENTORY TRANSACTION TYPE DIMENSION ....................................... 109
6.2.9 CONTRACT TERM DIMENSION ..................................................................... 109
6.2.10 VENDOR DIMENSION .................................................................................... 109
6.2.11 PROCUREMENT DIMENSION ....................................................................... 110
6.2.12 RESELLER DIMENSION ................................................................................. 110
6.2.13 SHIP METHOD DIMENSION .......................................................................... 110
6.2.14 MARKET DIMENSION .................................................................................... 111
PHIӂU KHҦ26È7ĈÈ1+*,È<Ç8&ҪU CӪA NHÀ QUҦN LÝ ....................... 111
CÔNG NGHӊ SӰ DӨNG ........................................................................................... 113
6.4.1 NGÔN NGӲ LҰP TRÌNH ................................................................................... 113
6.4.2 NӄN TҦ1*9¬7+Ѭ9,ӊN SӰ DӨNG ............................................................ 114
6.4.3 GOOGLE CLOUD PLATFORM ......................................................................... 114
+ѬӞNG DҮ1&¬,ĈҺT Hӊ THӔNG ....................................................................... 115
6.5.1 YÊU CҪU Vӄ PHҪN CӬNG .............................................................................. 115
6.5.2 MÔ,75ѬӠ1*&¬,ĈҺT Hӊ THӔNG .............................................................. 115
&¬,ĈҺT Hӊ THӔNG ......................................................................................... 115
+ѬӞNG DҮN SӰ DӨNG .......................................................................................... 118
6.6.1 KӂT NӔ,&Ѫ6Ӣ DӲ LIӊU DOANH NGHIӊP ................................................. 118
6.6.2 TҤO KHO DӲ LIӊU ........................................................................................... 119
6.6.3 THÊM NGUӖN DӲ LIӊU (DATA SOURCE) ................................................... 119
6.6.4 TҤO DATAMART .............................................................................................. 120
6.6.5 TҤO FACT-MODEL ........................................................................................... 122
6.6.6 THÊM / XOÁ BҦNG SӴ THҰT ......................................................................... 124
6.6.7 THÊM / XOÁ BҦNG BҦNG CHIӄU ................................................................. 126
6.6.8 THÊM / XOÁ MӜ775ѬӠNG TRONG BҦNG ................................................ 129
6.6.9 CҨ8+Î1+&Ѫ&+ӂ ETL CHO BҦNG ............................................................. 129
6.6.10 TÁC VӨ CRUD LIÊN KӂT GIӲA CÁC BҦNG TRONG NGUӖN DӲ LIӊU129
6.6.11 TÁC VӨ CRUD LIÊN KӂT GIӲA CÁC BҦNG TRONG FACT-MODEL .... 130
6.6.12 CҨ8+Î1+&Ѫ&+ӂ ĈӎNH THӠI ETL ........................................................... 131
6.6.13 THÊM / XOÁ MӜT BIӆ8ĈӖĈӖ THӎ ........................................................... 132
6.6.14 CHӌNH SӰA MӜT BIӆ8ĈӖĈӖ THӎ ........................................................... 134
6.6.15 CHӌNH SӰ$&¬,ĈҺT GOOGLE CLOUD PLATFORM ............................... 135
11
'$1+0Ө&+Î1+
HÎNH 1: KIӂN TRÚC DW/BI CӪA KIMBALL ................................................................... 22
HÎNH 2: VÍ DӨ MINH HOҤ SCD LOҤI 1 [9] ..................................................................... 24
HÎNH 3: VÍ DӨ MINH HOҤ SCD LOҤI 2 [9] ..................................................................... 24
HÎNH 4: STAR SCHEMA ...................................................................................................... 25
HÎNH 5: CÁCH HIӆ8ĈѪ1*,ҦN Vӄ BI (JAYANTHI RANJAN 2005) [13] ................... 26
HÎNH 6: MÔ HÌNH CHUYӆ1ĈӘI SӔ [17] ......................................................................... 29
HÎNH 7: CÔNG NGHӊ OCR [18] .......................................................................................... 29
HÎNH 8: VÍ DӨ MINH HOҤ OCR......................................................................................... 30
HÎ1+2&53,3(/,1(&Ѫ%ҦN [19] ................................................................................ 30
HÎNH 10: VҨ1Ĉӄ CҪN GIҦI QUYӂT THEO TӮ1**,$,Ĉ2ҤN.................................. 33
HÎ1+6ѪĈӖ USER CASE Hӊ THӔNG ........................................................................ 36
HÎNH 12: QUҦN LÝ DATA SOURCE ................................................................................. 37
HÎNH 13: THÊM MӞI DATA SOURCE ............................................................................... 37
HÎNH 14: CҰP NHҰT THÔNG TIN DATA SOURCE......................................................... 37
HÎNH 15: TRANG QUҦN LÝ DATAWAREHOUSE .......................................................... 38
HÎ1+75$1*ĈӎNH THӠI ............................................................................................. 38
HÎNH 17: THÊM MӞ,ĈӎNH THӠI ...................................................................................... 39
HÎNH 18: TRANG DASHBOARD ........................................................................................ 39
HÎNH 19: THÊM BIӆ8ĈӖ MӞI ........................................................................................... 39
HÎ1+6ѪĈӖ KIӂN TRÚC Hӊ THӔNG......................................................................... 40
HÎNH 21: MÔ HÌNH GIAO TIӂP GIӲA CÁC THÀNH PHҪN TRONG Hӊ THӔNG ....... 41
HÎNH 22: BUS MATRIX CHO QUY TRÌNH DOANH NGHIӊP ........................................ 42
HÎNH 23: RETAIL SALES FACT MODEL .......................................................................... 43
HÎNH 24: RESELLER SALES FACT MODEL ..................................................................... 44
HÎNH 25: WAREHOUSE INVENTORY TRANSACTION FACT MODEL ....................... 45
HÎNH 26: STORE INVENTORY SNAPSHOT FACT MODEL ........................................... 46
HÎNH 27: PROCUREMENT TRANSACTION FACT MODEL........................................... 46
HÎNH 28: VENDOR PERFORMANCE FACT MODEL ...................................................... 47
HÎNH 29: PROFITABILITY CM FACT MODEL ................................................................. 49
HÎ1+&Ѫ&+ӂ ETL TӘNG QUAN ................................................................................ 50
HÎ1+&Ѫ&+ӂ ETL CHI TIӂT........................................................................................ 51
HÎNH 32: CҨU TRÚC BҦNG BATCH EXTRACT JOB ..................................................... 52
HÎNH 33: QUÁ TRÌNH BIӂ1ĈӘI BҦNG CHIӄU TRÊN DATAFLOW ........................... 53
12
HÎNH 34: BҦ1*ĈË&+75ѬӞC KHI TҦ,7Ă1*7,ӂN ..................................................... 54
HÎNH 35: BҦNG TҤ0'Ô1*Ĉӆ TҦ,7Ă1*7,ӂN .......................................................... 54
HÎNH 36: SAU KHI TҦ,7Ă1*7,ӂN SCD1 ....................................................................... 54
HÎNH 37: SAU KHI TҦ,7Ă1*7,ӂN SCD2 ....................................................................... 54
HÎ1+2&53,3(/,1(&Ѫ%ҦN [19] ............................................................................. 65
HÎNH 39: AIRFLOW DAGS CHO CÁC FACTMODEL ...................................................... 77
HÎNH 40: LUӖNG THӴC THI CӪA MÔ HÌNH PHÂN KHÚC KHÁCH HÀNG .............. 78
HÎNH 41: CҨU HÌNH MӜT BIӆ8ĈӖ ĈӖ THӎ ................................................................. 79
HÎNH 42: MEASURE EDIT ................................................................................................... 80
HÎNH 43: DIMENSION EDIT ............................................................................................... 80
HÎNH 44: MÔ HÌNH TRÍCH XUҨT DӲ LIӊU ÁP DӨNG CÔNG NGHӊ OCR ................ 81
HÎNH 45 Ҧ1+ĈҪU VÀO CHO QUÁ TRÌNH OCR............................................................ 82
HÎNH 46: THÊM BOX CHO ҦNH ........................................................................................ 83
HÎNH 47: LӐC VÀ SҲP XӂP LҤI KӂT QUҦ TӮ TEXT RECOGNITION ........................ 84
HÎNH 48: TҰP TIN THIӂT LҰP CHO QUÁ TRÌNH TRÍCH XUҨ7+2ÈĈѪ1 ............... 85
HÎNH 49: KӂT QUҦ TRÍCH XUҨ7+2ÈĈѪ1%ҴNG CÔNG NGHӊ OCR .................... 86
HÎNH 50: MӬC DӲ LIӊU TRONG KIӂN TRÚC INMON ................................................ 105
HÎNH 51: KIӂN TRÚC DW/BI CӪA INMON .................................................................... 105
HÎNH 52: DATE DIMENSION ............................................................................................ 106
HÎNH 53: PRODUCT DIMENSION .................................................................................... 107
HÎNH 54: STORE DIMENSION .......................................................................................... 107
HÎNH 55: WAREHOUSE DIMENSION.............................................................................. 108
HÎNH 56: CUSTOMER DIMENSION ................................................................................. 108
HÎNH 57: PROMOTION DIMENSION ............................................................................... 109
HÎNH 58: PAYMENT METHOD DIMENSION ................................................................. 109
HÎNH 59: CONTRACT TERM DIMENSION ..................................................................... 109
HÎNH 60: VENDOR DIMENSION ...................................................................................... 110
HÎNH 61: PROCUREMENT TRANSACTION TYPE DIMENSION ................................. 110
HÎNH 62: RESELLER DIMENSION ................................................................................... 110
HÎNH 63: SHIP METHOD DIMENSION ............................................................................ 110
HÎNH 64: MARKET DIMENSION ...................................................................................... 111
13
'$1+0Ө&%Ҧ1*
BҦNG 1: TӘNG QUÁT Vӄ CÁC LOҤI SCD (KIMBALL 2002) [10] ................................ 24
BҦNG 2: MӬC DӲ LIӊU CӪA CÁC BҦNG FACTS .......................................................... 43
BҦNG 3: KHҦO SÁT NHU CҪU BÁO CÁO Vӄ NGHIӊP VӨ BÁN HÀNG .................... 59
BҦNG 4: KHҦO SÁT NHU CҪU BÁO CÁO Vӄ NGHIӊP VӨ MUA HÀNG ................... 60
BҦNG 5: KHҦO SÁT NHU CҪU Vӄ NGHIӊP VӨ /Ѭ8.+2+¬1*+2È ................... 60
BҦNG 6: KHҦO SÁT NHU CҪU Vӄ NGHIӊP VӨ CRM ................................................... 61
BҦNG 7: KIӆU DӲ LIӊ848<ĈӎNH TRONG VIÊC BIӂ1ĈӘI DӲ LIӊU ..................... 73
BҦNG 8: HÀM TӘNG QUÁT ............................................................................................... 74
BҦNG 9: HÀM TOÁN HӐC .................................................................................................. 74
BҦNG 10: HÀM XӰ LÝ CHUӚI .......................................................................................... 74
BҦNG 11: HÀM XӰ LÝ THӠI GIAN................................................................................... 74
BҦ1*ĈÈ1+*,È+ӊ THӔNG Vӄ NGHIӊP VӨ BÁN HÀNG ................................... 89
BҦ1*ĈÈ1+*,È+ӊ THӔNG Vӄ NGHIӊP VӨ MUA HÀNG .................................. 90
BҦ1*ĈÈ1+*,È+ӊ THӔNG Vӄ NGHIӊP VӨ /Ѭ8.+2+¬1*+2È................ 90
BҦ1*ĈÈ1+*,È+ӊ THӔNG Vӄ NGHIӊP VӨ CRM ............................................... 90
BҦNG 16: KӂT QUҦ TҦI TRANG GIAO DIӊ11*ѬӠI DÙNG ....................................... 91
BҦNG 17ĈÈ1+*,È7+ӠI GIAN THӴC THI FM_SALES ............................................. 93
BҦ1*ĈÈ1+*,È7+ӠI GIAN THӴC THI FM_VENDORRATING ......................... 93
BҦNG 19ĈÈ1+*,È7+ӠI GIAN THӴC THI FM_INVENTROY_PRODUCT ............. 93
BҦNG 20ĈÈ1+*,È7+ӠI GIAN THӴC THI FM_PROCUREMENTTRANSACTION93
BҦ1*ĈÈ1+*,Á THӠI GIAN THӴC THI FM_SALES BRAZIL OLIST ................. 94
BҦNG 22: TӘNG HӦP CHI PHÍ CHO 1 LҪN CHҤ</Ѭ875Ӳ TRONG 1 THÁNG ...... 99
BҦNG 23: PHIӂU KHҦO SÁT NGHIӊP VӨ BÁN HÀNG ............................................... 111
BҦNG 24: PHIӂU KHҦO SÁT NGHIӊP VӨ NHҰP HÀNG ............................................. 111
BҦNG 25: PHIӂU KHҦO SÁT NGHIӊP VӨ QUҦN LÝ KHO ......................................... 112
BҦNG 26: PHIӂU KHҦO SÁT NGHIӊP VӨ QUҦN LÝ QUAN Hӊ KHÁCH HÀNG .... 112
14
'$1+0Ө&7+8Ұ71*Ӳ7Ӯ9,ӂ77Ҳ7
Cөm tӯ ÿҫ\ÿӫ
Chӳ cái viӃt tҳt
BI
Business Intelligence
BQ
Bigquery
CRM
Customer Relationship Management
DAG
Directed Acyclic Graph
DB
Database
DD
Degenerate Dimension
DM
Data Mart
DW
Data Warehouse
ETL
Extract, Transform, Load
ERM
Entity-Relationship Model
FK
GCP
Google Cloud Platform
IDC
International Data Corporation
OCR
Optical Character Recognition
OLAP
Online Analytical Processing
UDF
User Defined Function
UML
Unified Modeling Language
PK
SQL
15
Foreign Key
Primary Key
Structured Query Language
&+ѬѪ1* GIӞI THIӊU
7URQJFKѭѫQJQj\WiFJLҧ giӟi thiӋXÿӅ tài, mөc tiêu và nӝLGXQJÿӅ tài, giӟi hҥn
ÿӅ WjLFNJQJQKѭFҩu trúc luұQYăQ
GIӞI THIӊ8Ĉӄ TÀI
Trong khҧRViWQăPFӫa IDC, chuyӇQÿәi sӕ 'LJLWDO7UDQVIRUPDWLRQÿDQJ
trӣ thành chiӃQOѭӧc tҥi các doanh nghiӋp, tә chӭc cӫa cuӝc cách mҥng công nghiӋp lҫn
thӭ WѭNhӡ hӋ thӕng báo cáo thông suӕt kӏp thӡi, chuyӇQÿәi sӕ mang lҥi nhiӅu lӧi ích QKѭFҳt
giҧm chi phí vұn hành, tiӃp cұQÿѭӧc nhiӅXSKkQNK~FNKiFKKjQJJL~SOmQKÿҥo ra quyӃt
ÿӏnh nhanh chóng và chính xác KѫQ [1]
Trong quá trình phát triӇn, các công ty vӅ WKѭѫQJPҥi và sҧn xuҩt quan sát thҩy
ÿѭӧc các dӳ liӋXOѭXWUӳ cӫa công ty ngày mӝt lӟn dҫn, (mӑi thông tin dӳ liӋu tӯ viӋc
nhұp/xuҩt hàng, sӕ giao dӏch, thông tin sҧn phҭm, nhân sӵ, thông tin khách hàng, «).
Nhӳng dӳ liӋu này ÿӅXÿѭӧFOѭXWUӳ trên nӅn tҧng công nghӋ QKѭFiFWұp tin thӕng kê
([FHOYjFѫVӣ dӳ liӋXQKѭQJ dӳ liӋu thu thұp FKѭDÿѭӧc khai thác giá trӏ triӋWÿӇ. Công
ty chӍ ÿӑc dӳ liӋu cho các hoҥWÿӝng có tính chu kǤ QKѭYLӃWEiRFiRWKDQKWRiQKRiÿѫQ
cұp nhұt thông tin sҧn phҭPNKiFKKjQJ«. Dӳ liӋXÿѭӧFOѭXWUӳ lҥLQKѭPӝWSKѭѫQJ
tiӋQJKLFKpSÿѫQWKXҫn và không mang lҥi lӧi ích thұt sӵ cho công ty.
Tuy nhiên, dӳ liӋu là mӝWFѫVӣ ÿiQJWLQFұ\ÿӇ ÿѭDUDFiFJLҧ ÿӏnh, nhұn xét và tӯ
ÿyÿѭDUDTX\ӃWÿӏnh chiӃQOѭӧc cho công ty. ViӋc khai thác dӳ liӋXÿHPOҥi cho công ty
nhiӅu lӧLtFKQKѭELӃWÿѭӧc xu thӃ cӫa QJѭӡi dùng, giҧi quyӃt vҩQÿӅ khi xuҩt hiӋn sӵ
chұm trӉ trong khâu phân phӕLFyÿѭӧc lӧi thӃ cҥnh tranh trên thӏ WUѭӡng nhӡ viӋFÿѭD
UDÿѭӧc quyӃWÿӏnh nhanh chóng, cҧi thiӋn quy trình hoҥWÿӝng công ty hiӋu quҧ KѫQ«
Vӟi mӝt thӏ WUѭӡQJV{Lÿӝng, rӝng lӟn QKѭKLӋn nay, viӋFÿѭDUDÿѭӧc quyӃWÿӏnh nhanh
chóng và chính xác có thӇ ÿHPOҥi cho công ty lӧi thӃ Yѭӧt trӝLKѫQFiFÿӕi thӫ khác.
Nhұn thӭFÿѭӧc nhu cҫXQj\ÿӅ tài xây dӵng hӋ thӕng Trí tuӋ kinh doanh và kho
dӳ liӋu doanh nghiӋp ÿѭӧc phát triӇn vӟi mөFÿtFKQKҵm cung cҩSP{LWUѭӡng làm viӋc
cho nhà phân tích dӳ liӋu. Trí tuӋ kinh doanh có thӇ cung cҩp cho nhà phân tích cách nhìn
tәng quan vӅ dӳ liӋXPjF{QJW\ÿDQJFyÿӗng thӡi hӛ trӧ QKjSKkQWtFKÿѭDUDTX\ӃWÿӏnh
chính xác và kӏp thӡi thông qua các công cө xây dӵng và phân tích dӳ liӋu.
MӨ&7,Ç8Ĉӄ TÀI
NӝLGXQJÿӅ tài bao gӗm các mөFWLrXVDXÿk\
x Tìm hiӇu, nghiên cӭu vӅ kho dӳ liӋu (Data Warehouse), trí tuӋ kinh doanh
(Business Intelligence).
16
x Xây dӵng mӝt sӕ khuôn mүu (Template) hӛ trӧ viӋc xây dӵng Kho dӳ liӋu ÿѭӧc
nhanh chóng và dӵa trên các nghiӋp vө trӑQJÿLӇm ÿmSKkQWtFKFKR công ty vӅ
OƭQKYӵc sҧn xuҩt và WKѭѫQJPҥi.
x Tìm hiӇu, nghiên cӭXYjÿӅ xuҩt FѫFKӃ ETL phù hӧp trong viӋc xây dӵng kho dӳ
liӋu.
x Tìm hiӇu và sӱ dөng các công nghӋ ÿӇ hiӋn thӵc FѫFKӃ ETL, kho dӳ liӋu, Trí tuӋ
kinh doanh cho giҧLSKiSÿӅ xuҩt.
x Tìm hiӇu vӅ các công nghӋ trí tuӋ nhân tҥo, khai phá dӳ liӋu ÿӇ phân tích dӵ báo,
trҧi nghiӋm khách hàng hoһc áp dөng tӕLѭXKRiVҧn xuҩt, quҧn lý vұWWѭ«
x HiӋn thӵc hӋ thӕng FѫFKӃ ETL, kho dӳ liӋu (Data Warehouse), trí tuӋ kinh doanh
(Business Intelligence) bҵng các công nghӋ ÿm tìm hiӇXÿѭӧc.
x Thu thұp các dӳ liӋu mô phӓng cho doanh nghiӋp sҧn xuҩt hoһc doanh nghiӋp
WKѭѫQJPҥi.
x TiӃn hành tích hӧp, thӵc nghiӋm trên tұp dӳ liӋu mô phӓQJYjÿiQKJLiNKҧ QăQJ
ÿiSӭng cӫa toàn bӝ hӋ thӕQJÿӅ xuҩWÿӕi vӟi tұp dӳ liӋu.
GIӞI HҤ1Ĉӄ TÀI
Trong phҥm vi nghiên cӭu, ÿӅ WjLÿѭӧc giӟi hҥn ӣ Eѭӟc hӛ trӧ xây dӵng kho dӳ
liӋu, có tích hӧp sҹn chӭFQăQJWUtWXӋ kinh doanh bao gӗm trӵc quan hoá dӳ liӋXĈӅ tài
tìm hiӇu vӅ các khái niӋm vӅ kho dӳ liӋXFѫFKӃ ETL, các chӭFQăQJFӫa trí tuӋ kinh
doanh hӛ trӧ phân tích dӳ liӋu. Tӯ ÿy, nhóm tác giҧ ÿӅ xuҩt nhӳng giҧi pháp hӛ trӧ xây
dӵng kho dӳ liӋu dӵa trên yêu cҫu chung và tәng quát nhҩt cӫa các công ty sҧn xuҩt hoһc
công ty WKѭѫQJPҥi.
Các yêu cҫu chung nhҩt cӫa công ty sҧn xuҩt hoһFF{QJW\WKѭѫQJPҥi mà nhóm
tác giҧ tұp trung phát triӇn trong quá trình nghiên cӭu bao gӗm ӣ các quy trình bán hàng
(Sales), nhұp hàng (Procurement), kho hàng (Product Inventory) và quҧn lý quan hӋ
khách hàng (Customer Relationship Management). Vӟi mӛLTX\WUuQKQKѭYұy, nhóm tác
giҧ sӁ ÿӅ xuҩt ít nhҩt là mӝt khuôn mүu (Template) cho viӋc xây dӵQJTX\WUuQKWѭѫQJ
ӭng. HӋ thӕng cung cҩSFѫFKӃ ETL bao gӗm tұp các phép biӃQÿәi phә biӃn mà nhóm
tác giҧ tìm hiӇXÿѭӧc trong quá trình nghiên cӭXÿӅ tài.
Tích hӧp, thӱ nghiӋPYjÿiQKJLikhҧ QăQJÿiSӭng cӫa hӋ thӕQJÿӅ xuҩt. Tìm
hiӇu vӅ mӝt sӕ kӻ thuұt trí tuӋ nhân tҥo có tác dөng phân tích dӵ báo. Cuӕi cùng là nghiên
cӭXYjÿӅ xuҩt giҧLSKiSÿҭy mҥnh khҧ QăQJVӕ hoá, thu thұp dӳ liӋu nhҵm phөc vө phân
tích dӵ báo và trí tuӋ kinh doanh.
9u ÿӅ tài tұp trung phát triӇn hӋ thӕng trí tuӋ kinh doanh áp dөng vào công ty
WKѭѫQJPҥi hoһc sҧn xuҩt, các quy trình nghiӋp vө PjÿӅ tài tұp trung phát triӇn chӍ là
mӝt phҫn trong sӕ các quy trình cӫa 2 loҥi công ty nêu trên. Ĉӗng thӡLÿӕLWѭӧng doanh
nghiӋp mà nhóm tác giҧ tұp trung phát triӇQOjF{QJW\WKѭѫQJPҥi.
17
CҨU TRÚC LUҰ19Ă1
&KѭѫQJ
Nӝi dung
&KѭѫQJ Giӟi thiӋu chung vӅ ÿӅ tài, mөc tiêu và nӝLGXQJÿӅ tài, giӟi hҥQÿӅ tài
FNJQJQKѭ cҩu trúc luұQYăQ.
&KѭѫQJ &ѫVӣ lý thuyӃt cӫa doanh nghiӋSWKѭѫQJPҥi và doanh nghiӋp sҧn xuҩt,
kho dӳ liӋu (Data Warehouse), trí tuӋ kinh doanh. Các khái niӋm liên
TXDQÿӃn viӋc xây dӵng, phát triӇn kho dӳ liӋu theo mô hình chiӅu dӳ
liӋu cӫa Kimball.
&KѭѫQJ3 ThiӃt kӃ hӋ thӕng, mô hình hӋ thӕng, SKѭѫQJSKiSÿӅ xuҩt tӯ các vҩn
ÿӅ cҫn giҧi quyӃt ÿӇ xây dӵng hӋ thӕng trí tuӋ kinh doanh cho công ty
sҧn xuҩt và công ty WKѭѫQJPҥi.
&KѭѫQJ4 HiӋn thӵc hӋ thӕng. 7URQJFKѭѫQJQj\QKyPWiFJLҧ tұp trung nói vӅ
cách thӭc hiӋn thӵc hӋ thӕng gӗm các chӭFQăQJF{QJGөQJÿѭӧc hӛ trӧ,
tұp dӳ liӋu thӱ nghiӋm, giao diӋn hӋ thӕng và mӝt sӕ kӃt quҧ ÿҥWÿѭӧc.
&KѭѫQJ5 Tәng kӃt. 7URQJFKѭѫQJQj\QKyPWiFJLҧ ÿӅ cұSÿӃn kӃt quҧ ÿҥWÿѭӧc,
ѭXYjQKѭӧFÿLӇm cӫa giҧi SKiSÿӅ xuҩt, SKѭѫQJKѭӟng phát triӇn trong
WѭѫQJOҥi và mӝt sӕ ÿiQKJLivӅ sҧn phҭm, vӅ mһt chi phí và mһt kӻ thuұt.
&KѭѫQJ6 Phө lөc. &KѭѫQJQj\ cung cҩSFKRQJѭӡLÿӑc các thông tin hӳu ích khác,
góp phҫn hiӇu rõ vӅ ÿӅ tài bao gӗm các kiӃn thӭc liên quan, các công
nghӋ ÿѭӧc sӱ dөng, Kѭӟng dүn FjLÿһt và sӱ dөng hӋ thӕng.
18
&+ѬѪ1* &Ѫ6Ӣ LÝ THUYӂT VÀ CÁC NGHIÊN CӬU LIÊN QUAN
Trong phҥPYLÿӅ tài, nhóm sӱ dөQJFiFFѫVӣ lý thuyӃWÿѭӧFWUuQKEj\VDXÿk\ÿӇ
OjPFѫVӣ nӅn tҧng cho viӋc giҧi quyӃt bài toán, phân tích và thiӃt kӃ hӋ thӕng ÿӅ xuҩt.
ĈӔ,7ѬӦNG DOANH NGHIӊP
Trong phҫn này, nhóm sӁ SKkQ WtFK KDL ÿӕL Wѭӧng nghiên cӭu là doanh nghiӋp
WKѭѫQJPҥi và doanh nghiӋp sҧn xuҩt. Tӯ ÿyQKyPWiFJLҧ sӁ phân tích, thiӃt kӃ báo cáo
FKRQJѭӡi phân tích dӳ liӋu.
2.1.1 DOANH NGHIӊ37+ѬѪ1*0ҤI
2.1.1.1 Ĉӎ1+1*+Ƭ$
Doanh nghiӋSWKѭѫQJPҥi là nhӳQJÿѫQYӏ NLQKGRDQKÿѭӧc thành lұp vӟi mөc
ÿtFKWKӵc hiӋn các hoҥWÿӝQJWURQJNLQKGRDQKWKѭѫQJPҥi, tә chӭc mua bán hàng hóa
nhҵm mang lҥi lӧi nhuұn. [2]
2.1.1.2 CÁC LOҤI HÌNH DOANH NGHIӊ37+ѬѪ1*0ҤI
Doanh nghiӋSWKѭѫQJPҥLÿѭӧc chia thành nhӳng loҥi hình sau: [2]
x
x
x
x
x
Doanh nghiӋp kinh doanh chuyên môn hóa: là doanh nghiӋSWKѭѫQJPҥi chuyên kinh
doanh mӝt loҥi hàng hóa cө thӇ có cùng công dөQJWURQJÿӡi sӕng và sҧn xuҩt cө thӇ.
Doanh nghiӋp kinh doanh tәng hӧp: kinh doanh nhiӅu loҥLKjQJKyDFyÿһFÿLӇm và tính
chҩt khác nhau.
Doanh nghiӋSNLQKGRDQKÿDGҥng hóa: kinh doanh cҧ sҧn xuҩt và cҧ kinh doanh hàng
hóa và thӵc hiӋn các hoҥWÿӝQJWKѭѫQJPҥi.
Các doanh nghiӋSWKѭѫQJPҥLÿѭӧc thành lұp và quҧn lý bӣLFiFFѫTXDQQKjQѭӟc.
Các doanh nghiӋSWKѭѫQJPҥLÿѭӧc thành lұp bӣi các cá nhân, tә chӭFWK{QJWKѭӡng.
2.1.1.3 CHӬ&1Ă1*&+Ë1+&ӪA DOANH NGHIӊ37+ѬѪ1*0ҤI
Doanh nghiӋSWKѭѫQJPҥLOjÿѫQYӏ cung ӭQJÿiSӭng nhӳng nhu cҫu cӫDQJѭӡi tiêu
dùng, khách hàng bҵng sҧn phҭPKjQJKyDGRÿyhӑ cҫn phҧLTXDQWkPÿӃn giá trӏ sӱ dөng cӫa
KjQJKyDYjFKLSKtOѭXWK{QJKjQJKyD7ӯ ÿyGRDQKQJKLӋp sӁ Fyÿѭӧc mӭc giá bán hӧp lý mà
hӑ có thӇ chҩp nhұQÿѭӧc và cung cҩp sӕ Oѭӧng phù hӧp vӟi nhu cҫu thӏ WUѭӡng. ĈӇ viӋFOѭX
thông hàng hóa/sҧn phҭPÿѭӧc hiӋu quҧ và chuyên nghiӋp, các tә chӭc doanh nghiӋSWKѭѫQJ
mҥLFNJQJVӁ ÿҫXWѭTXiWUuQKOѭXWK{QJVDRFKRYӯa nhanh chóng và vӯDÿҧm bҧo rҵng nó có thӇ
lҩ\ÿѭӧc sӵ hài lòng cӫa khách hàng. [3]
Doanh nghiӋSWKѭѫQJPҥi sӁ thӵc hiӋn mua bán hàng hóa nhҵm kӏp thӡLÿiSӭQJÿѭӧc
nhu cҫu cӫDQJѭӡi tiêu dùng tӯ sӕ OѭӧQJFKRÿӃn chҩWOѭӧng và cҧ lӧi nhuұn mà doanh nghiӋp
WKXÿѭӧF7X\QKLrQÿӇ thӵc hiӋQÿѭӧc chӭFQăQJQj\ÿLӅXÿyFòn tùy thuӝc vào quy mô cӫa
doanh nghiӋSWKѭѫQJPҥi và hӋ thӕng mҥQJOѭӟi (kho, trҥm, cӱa hàng, siêu thӏ, quҫ\KjQJÿҥi
lý...) cӫa tӯng tә chӭc.
Doanh nghiӋSWKѭѫQJPҥi có hoҥWÿӝng quҧn trӏ vӟi mӝt sӕ ÿѫQYӏ OLrQTXDQQKѭQKj
cung cҩp, bӝ phұn mua hàng, nhұSNKRYjÿӕi tác phân phӕL9jÿѭѫQJQKLrQNKkXPXDKjQJ
FKtQKOjNKkXÿҫXWLrQYjFNJQJlà khâu FѫEҧn nhҩt ÿӕi vӟi bҩt cӭ mӝWÿѫQYӏ hoҥWÿӝng kinh
GRDQKĈӗng thӡLQyFNJQJOjÿLӅu kiӋQÿӝng lӵc duy trì và phát triӇn tә chӭc. ViӋc bán hàng
thuұn lӧi vӯa là chӭFQăQJvӯa là mөc tiêu chính cӫa doanh nghiӋSWKѭѫQJPҥi. [3]
19
2.1.2 DOANH NGHIӊP SҦN XUҨT
2.1.2.1 Ĉӎ1+1*+Ƭ$
Doanh nghiӋp sҧn xuҩt là doanh nghiӋp chuyên tiӃn hành các hoҥWÿӝng sҧn xuҩt hàng
hóa nhҵm cung cҩp ra thӏ WUѭӡng. Nhӳng doanh nghiӋp này ÿyQJYDLWUz then chӕt trong viӋc tҥo
ra các sҧn phҭPKjQJKyDÿӇ cung cҩSFKRQJѭӡi tiêu dùng YjQyFNJQJ ÿyQJYDLWUò quan trӑng
trong nӅn kinh tӃ cӫa mӛi quӕc gia và khu vӵc. [4]
2.1.2.2 ĈҺ&Ĉ,ӆM CӪA DOANH NGHIӊP SҦN XUҨT
Doanh nghiӋp sҧn xuҩt có nhӳQJÿһFÿLӇm sau: [5]
x
x
x
x
QuyӃWÿӏnh hoҥWÿӝng cӫa doanh nghiӋp: dӵa trên nhӳng yêu cҫXÿzLKӓi cӫa thӏ WUѭӡng
ÿӇ ÿѭDUDQKӳng quyӃWÿӏnh trong viӋc sҧn xuҩt các mһWKjQJWLrXGQJÿӇ cân bҵng giӳa
cung và cҫu trên thӏ WUѭӡng.
Quy trình sҧn xuҩt: quá trình dӵa trên mӝt chuӛi kӃt hӧp giӳa nguyên vұt liӋu thô, nhân
công và các trang thiӃt bӏ ÿӇ tҥo nên sҧn phҭm.
Chi phí sҧn xuҩt: là chi phí phát sinh trong quá trình sҧn xuҩt hàng hóa, gӗm chi phí nhân
công và nguyên vұt liӋXKjQJKyDÿӇ phөc vө cho viӋc sҧn xuҩt hàng hóa.
Giá thành sҧn phҭm: toàn bӝ FKLSKtÿӇ hoàn thành mӝt sӕ Oѭӧng hàng hóa nhҩWÿӏnh
trong thӡLJLDQTX\ÿӏnh.
KHO DӲ LIӊU (DATA WAREHOUSE)
2.2.1 Ĉӎ1+1*+Ƭ$
Kho dӳ liӋXOjFiFFѫVӣ dӳ liӋXÿѭӧc các nhà ra quyӃWÿӏnh sӱ dөQJÿӇ phân tích tình
trҥng và sӵ phát triӇn trong nӝi bӝ công ty. Kho dӳ liӋu dӵDWUrQOѭӧng dӳ liӋu lӟQÿѭӧc tích hӧp
tӯ nhiӅu nguӗQNKiFQKDXYjRFѫVӣ dӳ liӋu dҥQJÿDFKLӅu (Multidimensional Database). CiFFѫ
sӣ dӳ liӋXQj\ÿѭӧc tӕLѭXKRiQKҵm truy cұp dӳ liӋu mӝt cách tӵ nhiên nhҩt cho các nhà phân
tích. [6] [7] [8]
Kho dӳ liӋu (Data Warehouse) là mӝt cѫVӣ dӳ liӋu WUXQJWkPÿѭӧc sӱ dөng nhҵm thӵc
hiӋn các phân tích và ÿѭDUDFiFTX\ӃWÿӏnh. Dӳ liӋu cӫa Kho dӳ liӋu ÿѭӧc tәng hӧp tӯ nhiӅu hӋ
thӕng giao dӏch (Transactional System), hӋ thӕQJFѫVӣ dӳ liӋu và nhiӅu nguӗn dӳ liӋu khác sau
ÿyÿѭӧFÿӏnh dҥng, làm sҥch, xác thӵc, tәng hӧp và tә chӭc lҥi. Dӳ liӋu có thӇ ÿѭӧFOѭXWUӳ Gѭӟi
dҥng chi tiӃt nhҩt, phөc vө cho công viӋc phân tích và báo cáo. Chuyên viên phân tích dӳ liӋu
(Data Analyst), kӻ VѭGӳ liӋu (Data Engineer), nhà khoa hӑc dӳ liӋu (Data Scientist) truy xuҩt
dӳ liӋu thông qua các công cө SQL, hӋ thӕng trí tuӋ kinh doanh và các ӭng dөng phân tích khác.
Kho dӳ liӋu cho phép các tә chӭc có thӇ thӵc hiӋn các phân tích trên dӳ liӋu khәng lӗ PjFѫVӣ
dӳ liӋXWK{QJWKѭӡng không thӵc hiӋQÿѭӧc vӟi hiӋu suҩWWѭѫQJWӵ.
Cҩu trúc cӫa Kho dӳ liӋu WK{QJWKѭӡng bao gӗm ba tҫng:
x
x
x
TҫQJGѭӟi: TҫQJGѭӟi bao gӗm mӝt máy chӫ Kho dӳ liӋuWKѭӡng sӱ dөng hӋ thӕQJFѫ
sӣ dӳ liӋu quan hӋ, nó thu gom dӳ liӋu tӯ nhiӅu nguӗQYjVDXÿyOjPVҥch và biӃQÿәi
thông qua mӝWTXiWUuQKÿѭӧc gӑi là Extract - Transform - Load (ETL).
Tҫng giӳa: Tҫng giӳa bao gӗm mӝt máy chӫ 2/$3FKRSKpSWăQJWӕFÿӝ truy vҩn.
Tҫng trên: Tҫng trên là giao diӋQQJѭӡi dùng hoһc các công cө EiRFiRFKRSKpSQJѭӡi
sӱ dөng có thӇ sӱ dөng các phân tích ad-hoc trên dӳ liӋu.
2.2.2 CÁCH XÂY DӴNG KHO DӲ LIӊU
.KLQyLÿӃn cách xây dӵng kiӃn trúc Kho dӳ liӋu, có hai cách tiӃp cұn phә biӃn hiӋn này
ÿyOjFiFKWLӃp cұn theo Inmon và cách tiӃp cұn theo Kimball. Cҧ hai cách tiӃp cұQÿӅXÿӗng ý ӣ
viӋc Data Warehouse là mӝt kho dӳ liӋu trung tâm cho doanh nghiӋp, mөFÿtFKFKtQKOjSKөc vө
20
- Xem thêm -