ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
ĐÀO THỌ THIỆN
ỨNG DỤNG KHAI PHÁ DỮ LIỆU CHO DỰ BÁO
ĐỒ THỊ PHỤ TẢI
APPLICATION DATA MINING FOR LOAD FORECAST
Chuyên ngành: Kỹ thuật điện
Mã số ngành: 60520202
LUẬN VĂN THẠC SĨ
TP. HỒ CHÍ MINH, tháng 01 năm 2021
Công trình được hoàn thành tại: Trường Đại Học Bách Khoa – Đại Học Quốc Gia
Tp.HCM
Cán bộ hướng dẫn khoa học: PGS.TS. Phan Thị Thanh Bình
Cán bộ chấm nhận xét 1: PGS.TS. Phạm Đình Anh Khôi
Cán bộ chấm nhận xét 2: TS. Lê Văn Đại
Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp. HCM ngày
23 tháng 01 năm 2021.
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1. Chủ tịch hội đồng: PGS.TS Hồ Văn Nhật Chương
2. Thư ký hội đồng: TS. Huỳnh Quốc Việt
3. Uỷ viên phản biện 1: PGS.TS. Phạm Đình Anh Khôi
4. Uỷ viên phản biện 2: TS. Lê Văn Đại
5. Uỷ viên hội đồng: PGS.TS Vũ Phan Tú
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành
sau khi luận văn đã được sửa chữa
CHỦ TỊCH HỘI ĐỒNG
TRƯỞNG KHOA ĐIỆN-ĐIỆN TỬ
i
ĈҤI HӐC QUӔC GIA TP.HCM
75ѬӠ1*ĈҤI HӐC BÁCH KHOA
CӜNG HÒA XÃ HӜI CHӪ 1*+Ƭ$9,ӊT NAM
Ĉӝc lұp - Tӵ do - Hҥnh phúc
NHIӊM VӨ LUҰ19Ă17+Ҥ&6Ƭ
Hӑ và tên hӑc viên: Ĉ¬27+Ӑ THIӊN.
MSHV: 1770351
1Jj\WKiQJQăPVLQK12/09/1994
1ѫLVLQKQuҧng Bình
Chuyên ngành: Kӻ thuұWÿLӋn
Mã sӕ: 60520202
,7Ç1Ĉӄ TÀI:
ӬNG DӨNG KHAI PHÁ DӲ LIӊU CHO DӴ %È2ĈӖ THӎ PHӨ TҦI
APPLICATION DATA MINING FOR LOAD FORECAST
NHIӊM VӨ VÀ NӜI DUNG:
-
Tìm hiӇu vӅ thuұt toán phân cөm K-means
-
Tìm hiӅu vӅ thuұt toán Multi Layer Perceptron (MLP) và kӻ thuұt lan truyӅn
QJѭӧc
-
Áp dөng thuұt toán phân cөm K-means, thuұt toán Multi Layer Perceptron
(MLP) và kӻ thuұt lan truyӅQQJѭӧFÿӇ ӭng dөng vào bài toán dӵ EiRÿӗ thӏ
phө tҧi ngày cho mӝt trҥm
-
Ӭng dөQJ0DWODEÿӇ thӵc hiӋn nhiӋm vө cӫa luұQYăQ
II. NGÀY GIAO NHIӊM VӨ: 21/09/2020
III. NGÀY HOÀN THÀNH NHIӊM VӨ: 03/01/2021
IV. CÁN BӜ +ѬӞNG DҮN: PGS.TS. Phan Thӏ Thanh Bình
7S+&0QJj\«WKiQJ«QăP
CÁN BӜ +ѬӞNG DҮN
CHӪ NHIӊM BӜ 0Ð1Ĉ¬27ҤO
PGS. TS. PHҤN THӎ THANH BÌNH
75ѬӢ1*.+2$Ĉ,ӊN - Ĉ,ӊN TӰ
ii
LӠI CҦ0Ѫ1
ĈӇ có thӇ KRjQWKjQKÿӅ tài luұQYăQWKҥFVƭPӝt cách hoàn chӍnh, bên cҥnh
sӵ nӛ lӵc cӕ gҳng cӫa bҧn thân còn có sӵ Kѭӟng dүn nhiӋt tình cӫa quý Thҫy Cô,
FNJQJQKѭVӵ ÿӝng viên ӫng hӝ cӫDJLDÿuQKYjEҥn bè trong suӕt thӡi gian hӑc tұp
nghiên cӭu và thӵc hiӋn luұQYăQWKҥFVƭ
Em xin chân thành bày tӓ lòng biӃW ѫQ ÿӃn Cô PGS.TS. Phan Thӏ Thanh
%uQK QJѭӡL ÿm KӃW OzQJ JL~S ÿӥ và tҥo mӑL ÿLӅu kiӋn tӕt nhҩt cho em hoàn thành
luұQ YăQ Qj\ ;LQ FKkQ WKjQK Ej\ Wӓ lòng biӃW ѫQ ÿӃn toàn thӇ quý thҫy cô trong
NKRDĈLӋn ± ĈLӋn Tӱ, Ngành Kӻ ThuұWĈLӋn ± 7UѭӡQJĈҥi hӑc Bách Khoa TPHCM
ÿmWұn tình truyӅQÿҥt nhӳng kiӃn thӭFTXêEiXFNJQJQKѭWҥo mӑLÿLӅu kiӋn thuұn lӧi
nhҩt cho em trong suӕt quá trình hӑc tұp nghiên cӭXYjFKRÿӃn khi thӵc hiӋQÿӅ tài
luұQYăQ;LQFKkQWKjQKEj\Wӓ lòng biӃWѫQÿӃn Trҥm An Biên ± .LrQ*LDQJÿm
cung cҩp các dӳ liӋu vӅ ÿӗ thӏ phө tҧLÿӇ FKRHPFyFѫVӣ dӳ liӋXÿӇ phân tích và dӵ
báo.
Em xin chân thành cҧPѫQÿӃQJLDÿuQKFiFDQKFKӏ và các bҥQÿӗng nghiӋp
ÿmKӛ trӧ cho em rҩt nhiӅu trong suӕt quá trình hӑc tұp, nghiên cӭu và thӵc hiӋQÿӅ
tài luұQYăQWKҥFVƭPӝt cách hoàn chӍnh.
Cuӕi cùng, em xin kính chúc các thҫy, cô, các anh, chӏ và bҥn bè thұt nhiӅu
sӭc khoҿ và thành công
73+&0WKiQJQăP
Hӑc viên thӵc hiӋn
ĈjR7Kӑ ThiӋn
iii
TÓM TҲT LUҰ19Ă17+Ҥ&6Ƭ
Kinh tӃ ngày càng phát triӇn thì nhu cҫu vӅ ÿLӋQFNJQJSKiWWULӇn theo. ViӋc dӵ
ÿRiQÿѭӧc phө tҧi cӫa hӋ thӕQJÿLӋn sӁ góp phҫn cho viӋc quy hoҥFKÿҫXWѭSKiW
triӇn nguӗQÿLӋn và vұn hành hӋ thӕQJÿLӋQ4XDÿyQkQJFDRÿӝ tin cұy, chҩWOѭӧng
phөc vө cӫa hӋ thӕQJÿLӋn ViӋt Nam. Vì vұ\ÿӅ WjLÿѭӧc tiӃn hành:
ӬNG DӨNG KHAI PHÁ DӲ LIӊU CHO DӴ %È2ĈӖ THӎ PHӨ TҦI
ABSTRACT
As the economy grows, so does the demand for electricity. Predicting the load
of the electricity system will contribute to the planning, investment, development of
power sources and operation of the electricity system. Thereby, improving the
reliability and service quality of Vietnam's electricity system. So the topic proceeds:
APPLICATION DATA MINING FOR LOAD FORECAST
iv
LӠ,&$0Ĉ2$1
LuұQYăQQj\OjF{QJWUuQKQJKLrQFӭu cӫDFiQKkQW{Lÿѭӧc thӵc hiӋn
Gѭӟi sӵ Kѭӟng dүn cӫa cô PGS.TS. Phan Thӏ Thanh Bình. Các sӕ liӋu, kӃt quҧ
và nhӳng kӃt luұn nêu trong luұQYăQQj\OjWUXQJWKӵFYjFKѭDÿѭӧc công bӕ
trong các công trình khác.
NӃXNK{QJÿ~QJQKѭÿmQrXWUrQW{LKRjQWRjQFKӏu trách nhiӋm vӅ ÿӅ
tài cӫa mình.
Tp. Hӗ &Kt0LQKWKiQJQăP
1JѭӡLFDPÿRDQ
ĈjR7Kӑ ThiӋn
v
MӨC LӨC
NHIӊM VӨ LUҰ19Ă17+Ҥ&6Ƭ ........................................................................................................ i
LӠI CҦ0Ѫ1 .......................................................................................................................................... ii
TÓM TҲT LUҰ19Ă17+ҤC 6Ƭ ........................................................................................................iii
ABSTRACT ............................................................................................................................................iii
LӠ,&$0Ĉ2$1 ................................................................................................................................... iv
DANH MӨC BҦNG .............................................................................................................................. vii
DANH MӨC HÌNH ҦNH ....................................................................................................................viii
DANH MӨC VIӂT TҲT ....................................................................................................................... xi
PHҪN MӢ ĈҪU ...................................................................................................................................... 1
&+ѬѪ1*%¬,72È1'Ӵ %È29¬3+ѬѪ1*3+È3'Ӵ BÁO ................................................. 5
1.1 Tәng quan vӅ các kӻ thuұt dӵ báo....................................................................................................... 5
1.1.1 Khái niӋm mô hình dӵ báo ............................................................................................................... 5
1.1.2 Tҫm quan trӑng cӫa dӳ liӋu ............................................................................................................. 6
1.1.3 Các ӭng dөng vӅ phân tích dӵ báo ................................................................................................... 7
1.2 Các kӻ thuұt mô hình hóa dӵ báo........................................................................................................ 9
1.2.1 Giӟi thiӋu tәng quát ......................................................................................................................... 9
1.2.2 Sӵ hình thành cӫa mӝt mô hình dӵ báo ......................................................................................... 10
&iFSKѭѫQJSKiSGӵ báo................................................................................................................ 12
1.2.4 Linear Regression ± Hӗi quy tuyӃn tính......................................................................................... 13
1.2.5 Hӗi quy Logistic............................................................................................................................. 16
1.2.6 Phân tích phân loҥi tuyӃn tính ........................................................................................................ 17
1.2.7 Cây phân loҥi và hӗi quy................................................................................................................ 17
1.2.8 Naive Bayes ................................................................................................................................... 18
1.2.9 K ± Nearest Neighbors ± KNN ...................................................................................................... 19
1.2.10 Multi-layer Perceptron ± MLP ..................................................................................................... 20
&+ѬѪ1*.-MEANS TRONG VIӊC PHÂN CӨM DӲ LIӊU ................................................... 22
2.1 Giӟi thiӋu .......................................................................................................................................... 22
2.2 Phân tích toán hӑc ............................................................................................................................. 22
2.3 Giҧi thuұt phân cөm K-Means trong Matlab..................................................................................... 26
2.4 Sӵ cҫn thiӃt cӫa viӋc xây dӵng biӇXÿӗ phө tҧLWѭѫQJÿӕLÿLӇn hình ................................................ 28
2.5 Dùng biӇXÿӗ 6LOKRXHWWHÿӇ tìm sӕ cөm k tӕLѭXWURQJEjLWRiQSKkQFөm K-Means ....................... 30
2.6. Ӭng dөng K-means trong xây dӵQJÿӗ thӏ phө tҧLWѭѫQJÿӕLÿLӇn hình ngày.................................. 46
vi
&+ѬѪ1*08/7,/$<(53(5&(375210/39¬3523$*$7,21/$1758<ӄN
1*ѬӦC) TRONG BÀI TOÁN DӴ BÁO PHӨ TҦI .......................................................................... 49
3.1 Giӟi thiӋu .......................................................................................................................................... 49
3.2 Các ký hiӋu và khái niӋm .................................................................................................................. 49
3.2.1 Layers (sӕ lӟp) ............................................................................................................................... 49
3.2.2 Units ............................................................................................................................................... 50
3.2.3 Weights và Biases .......................................................................................................................... 50
3.2.4 Activation functions ....................................................................................................................... 51
3.3 Lan truyӅQQJѭӧc ± Backpropagation ............................................................................................... 53
&iFEѭӟc Backpropagation cho Stochastic Gradient Descent ....................................................... 56
3.4 Xây dӵQJFKѭѫQJWUuQKGӵ EiRÿӗ thӏ phө tҧLÿӍnh bҵng phҫn mӅm Matlab .................................... 57
3.4.1 Các yӃu tӕ ҧQKKѭӣQJÿӃn phө tҧi .................................................................................................. 57
3.4.2 Xây dӵng bài toán .......................................................................................................................... 59
3.4.3 7KӵF KLӋQ bҵng phҫn mӅm Matlab................................................................................................. 61
&+ѬѪ1*ӬNG DӨNG THUҰT TOÁN PHÂN CӨ0.0($169¬0/3Ĉӆ DӴ BÁO
ĈӖ THӎ PHӨ TҦI NGÀY .................................................................................................................... 69
/ѭXÿӗ giҧi thuұt dӵ EiRÿӗ thӏ phө tҧi ngày ................................................................................... 69
4.2. KӃt quҧ dӵ báo phө tҧi ngày ............................................................................................................ 70
&+ѬѪ1*6Ӱ DӨ1*&+ѬѪ1*75Î1+0$7/$%&Ï7521*Ĉӄ TÀI .............................. 76
5.1 &KѭѫQJWUuQKGӵ EiRÿӗ thӏ phө tҧi 24h ............................................................................................ 76
5.2 VӁ ÿӗ thӏ phө tҧi ngày dӵ báo ........................................................................................................... 78
5.3 &KѭѫQJWUuQKWuPVӕ cөm k tӕLѭXFKREjLWRiQSKkQFөm K-Means ................................................ 79
KӂT LUҰN VÀ KIӂN NGHӎ .............................................................................................................. 81
TÀI LIӊU THAM KHҦO .................................................................................................................... 83
PHӨ LӨC 1: BҦN*ĈӖ THӎ PHӨ TҦI VÀ NHIӊ7ĈӜ .................................................................. 85
PHӨ LӨ&&+ѬѪ1*75Î1+0$7/$% ....................................................................................... 99
PHӨ LӨC 3: CÁC KӂT QUҦ DӴ BÁO ........................................................................................... 108
LÝ LӎCH TRÍCH NGANG ................................................................................................................ 132
4Ò$75Î1+Ĉ¬27ҤO..................................................................................................................... 132
QUÁ TRÌNH CÔNG TÁC ................................................................................................................. 132
vii
DANH MӨC BҦNG
%̫QJ-1: 3KͭW̫Lÿ͑QKGEiRFiFQJj\WKͱ ................................................................. 70
%̫QJ-2: 3KͭW̫Lÿ͑QKGEiRFiFQJj\WKͱ ................................................................. 70
%̫QJ-3: 3KͭW̫Lÿ͑QKGEiRFiFQJj\WKͱ ................................................................. 70
%̫QJ-3KͭW̫Lÿ͑QKGEiRFiFQJj\WKͱ ................................................................. 70
%̫QJ-5: 3KͭW̫Lÿ͑QKGEiRFiFQJj\WKͱ ................................................................. 71
%̫QJ-6: 3KͭW̫Lÿ͑QKGEiRFiFQJj\WKͱ ................................................................. 71
%̫QJ-7: 3KͭW̫Lÿ͑QKGEiRFiFQJj\FKͯQK̵W ........................................................... 71
viii
DANH MӨC HÌNH ҦNH
Hình 1-%L͋XGL͍QKDLFKL͉XY͉FiFWKX͡FWtQKFͯDNKiFKKjQJ .................................... 11
Hình 1-9tGͭ\ %%
[ ...................................................................................... 13
Hình 1-9tGͭY͉K͛LTX\ORJLVWLF .................................................................................... 16
Hình 1-0{KuQKGHFLVLRQWUHHFk\TX\͇Wÿ͓QK ............................................................ 18
Hình 1-5: Mô hình Navie Bayes......................................................................................... 19
Hình 1-6: Mô hình K ± Nearest Neighbors - KNN ........................................................... 20
Hình 1-7: Multi-layer Perceptron ...................................................................................... 21
Hình 2-9tGͭY͉EjLWRiQSKkQFͭP............................................................................ 22
Hình 2-%L͋Xÿ͛JLiWU͓SKͭW̫LW˱˯QJÿ͙LFiFQJj\WKͱ ............................................. 29
Hình 2-%L͋Xÿ͛JLiWU͓SKͭW̫LW˱˯QJÿ͙LFiFQJj\WKͱ ............................................. 29
Hình 2-%L͋Xÿ͛JLiWU͓SKͭW̫LW˱˯QJÿ͙LFiFQJj\&Kͯ1K̵W ...................................... 30
Hình 2-5: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ............................. 33
Hình 2-6: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ............................. 33
Hình 2-%L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ............................. 34
Hình 2-8: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ............................. 35
Hình 2-9: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ............................. 35
Hình 2-10: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 36
Hình 2-11: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 37
Hình 2-%L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 37
Hình 2-13: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 38
Hình 2-%L͋Xÿ͛KuQKEyQJ YͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 39
Hình 2-15: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 39
Hình 2-16: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 40
ix
Hình 2-17: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 41
Hình 2-18: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 41
Hình 2-%L͋Xÿ͛KuQKEyQJ YͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 42
Hình 2-20: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 43
Hình 2-21: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 43
Hình 2-22: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN ........................... 44
Hình 2-23: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\FKͯQK̵WYjV͙FͭPN ..................... 45
Hình 2-24: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\FKͯQK̵WYjV͙FͭPN ..................... 45
Hình 2-25: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\FKͯQK̵WYjV͙FͭPN ..................... 46
Hình 2-26: &iFE˱ͣF[k\GQJÿ͛WK͓SKͭW̫LW˱˯QJÿ͙LÿL͋QKuQK ................................. 47
Hình 3-1: 0/3YͣLKLGGHQOD\HUV ................................................................................... 49
Hình 3-2: &iFNêKL͏XV͵GͭQJWURQJ0XOWL/D\HU3HUFHSWURQ0/3 ............................ 50
Hình 3-3: Ĉ͛WK͓FͯDKjPVLJQ........................................................................................... 52
Hình 3-4: Ĉ͛WK͓KjP5H/8 ............................................................................................... 52
Hình 3-5: Hàm sigmoid ...................................................................................................... 53
Hình 3-6: Mô SK͗QJFiFKWtQKEDFNSURSDJDWLRQ.............................................................. 55
Hình 3-Ĉ͛WK͓SKͭW̫LFͯDQJj\WKͱFiFWX̯QNKiFQKDX .......................................... 58
Hình 3-*LiWU͓SKͭW̫Lÿ͑QKYjQ͉QQKL͏WWͳWKiQJÿ͇QWKiQJWU̩P$Q%LrQ± Kiên
Giang ................................................................................................................................... 58
Hình 3-9: Ĉ͛WK͓KjPVLJPRLG ........................................................................................... 64
Hình 3-10: Ĉ̯XYjRYjÿ̯XUDP̩QJ1HXWUDl ................................................................... 65
Hình 3-11: 4XiWUuQKKX̭QOX\͏QP̩QJQRWURQ ................................................................ 66
Hình 3-12: 6͙YzQJO̿SFKRQJj\WKͱ ............................................................................. 67
Hình 4-/˱Xÿ͛JL̫LWKX̵WFKRFK˱˯QJWUuQKGEiRÿ͛WK͓SKͭW̫LQJj\ ..................... 69
Hình 4-2: Ĉ͛WK͓SKͭW̫LWKFW͇YjGEiRWKͱQJj\ ................................ 72
x
Hình 4-3: Ĉ͛WK͓SKͭW̫LWKFW͇YjGEiRWKͱQJj\ ................................. 72
Hình 4-4: Ĉ͛WK͓SKͭW̫LWKFW͇YjGEiRWKͱQJj\ ................................ 73
Hình 4-Ĉ͛WK͓SKͭW̫LWKFW͇YjGEiRWKͱQJj\ ................................ 73
Hình 4-6: Ĉ͛WK͓SKͭW̫LWKFW͇YjGEiRWKͱQJj\ ................................ 74
Hình 4-7: Ĉ͛WK͓SKͭW̫LWKFW͇YjGEiRWKͱQJj\ ................................ 74
Hình 4-8: Ĉ͛WK͓SKͭW̫LWKFW͇YjGEiRFKͯQK̵WQJj\ .......................... 75
Hình 5-1: 0HQXFK͕QQJj\FKR FK˱˯QJWUuQKGEiRÿ͛WK͓SKͭW̫L ............................... 76
Hình 5-2: .͇WTX̫ÿ͛WK͓SKͭW̫LQJj\GEiRNKLFK͕QQJj\WKͱ ................................. 77
Hình 5-3: &K͕QQJj\ÿ͋Yͅÿ͛WK͓SKͭW̫L ......................................................................... 78
Hình 5-4: %L͋Xÿ͛SKͭW̫LQJj\GEiRYjWKFW͇NKLFK͕QQJj\WKͱQK̭W ..................... 78
Hình 5-5: &K͕QWKͱF̯QWuPV͙FͭP ................................................................................... 79
Hình 5-6: 1K̵SV͙FͭPN.................................................................................................... 80
Hình 5-7: %L͋Xÿ͛KuQKEyQJYͣLN .............................................................................. 80
xi
'$1+0Ө&9,ӂ77Ҳ7
x
MLP
: Multi Layer Perceptron
x
EVN
: TұSĈRjQĈLӋn Lӵc ViӋt Nam
x
IPP
: Các nguӗQSKiWÿLӋQÿӝc lұp
x
KNN
: K ± Nearest Neighbor
x
SVM
: Space Vector Machine
1
PHҪN MӢ ĈҪU
I. /êGRFKӑQÿӅWjL
1JjQKÿLӋQÿѭӧc coi là mӝt trong nhӳng ngành then chӕt, nhұQÿѭӧc nhiӅu sӵ
quan tâm cӫa QKj Qѭӟc, phҩQ ÿҩX ÿҭy nhanh tӕF ÿӝ WăQJ WUѭӣng bình quân hàng
QăPFӫDQJjQKÿLӋn xҩp xӍ gҩp 2 lҫn tӕFÿӝ WăQJWUѭӣng GDP chung cӫa cҧ Qѭӟc.
Mһc dù các công ty trong ngành ÿLӋQÿmKRҥWÿӝng hӃt công suҩWQKѭQJYүn không
ÿiSӭQJÿӫ nhu cҫXWLrXGQJÿLӋn trong Qѭӟc. Tình trҥng thiӃXÿLӋn vүn tiӃp diӉn
do mӝt sӕ dӵ án phát triӇn nguӗQÿLӋn mӟi bӏ chұm tiӃQÿӝÿӗng thӡi sӵ cӕ xҧy ra
OjPFiFQKjPi\ÿDQJYұn hành dүQÿӃn phҧLQJѭQJKRҥWÿӝng dүn tӟi sҧQOѭӧng
ÿLӋn sҧn xuҩWNK{QJÿҥt so vӟi kӃ hoҥch. SҧQOѭӧQJÿLӋn sҧn xuҩt cӫa cҧ Qѭӟc trong
nhӳQJ QăP JҫQ ÿk\ WăQJ QKDQK FKyQJ Wӯ 26,7 triӋu MWh tӯ QăP ÿӃQ QăP
2008 sҧQ OѭӧQJ ÿLӋn sҧn xuҩW ÿҥt tӟi 77 triӋu MWh. Ngành ÿLӋn có tӕF ÿӝ WăQJ
WUѭӣng sҧQOѭӧQJÿLӋQWKѭѫQJSKҭm trung bình mӛLQăPWURQJ JLDLÿӑan tӯ
2000-2008. ĈӇ tình trҥng thiӃXÿLӋn không còn tiӃp diӉn khi nhu cҫXÿLӋn ngày càng
WăQJNKRҧng 17% KjQJQăPYLӋFWăQJF{QJVXҩt tӕLÿDFiFQKjPi\SKiWÿLӋQFNJQJ
nKѭ [k\ Gӵng các nhà máy ÿLӋn mӟi hӃt sӭc cҫn thiӃt. Tuy nhiên, viӋc xây dӵng
mӝWQKjPi\ÿLӋn mӟLÿzLKӓi vӕQÿҫu WѭUҩt lӟn, thӡi gian xây dӵng dài nên trong
ngҳn hҥn cҫn tұSWUXQJWăQJWӕLÿDF{QJVXҩt cӫa FiFQKjPi\SKiWÿLӋQÿDQJKRҥt
ÿӝng nhҵPÿiSӭng nhu cҫXWăQJWUѭӣQJWUѭӟc mҳt cӫa QJjQKÿLӋn.
1JjQK ÿLӋn tҥi ViӋW 1DP ÿѭӧF [HP QKѭ QJjQK PDQJ WtQK ÿӝc quyӅn cao vӟi
TұSÿRjQÿLӋn lӵF(91OjQJѭӡLPXDYjQJѭӡLEiQÿLӋn duy nhҩWÿӃQQJѭӡi tiêu
dùng. Các công ty sҧn xuҩt ÿLӋQNK{QJÿѭӧc bán trӵc tiӃp FKRQJѭӡi tiêu dùng mà
bán cho EVN theo hӧSÿӗQJGRÿyVӵ cҥnh tranh giӳa các công ty sҧn xuҩWÿLӋn là
NK{QJFy*LiÿLӋn mà EVN mua theo giá thӓa thuұn vӟi tӯQJQKj Pi\WKD\ÿәi
theo tӯng mùa vө6DXNKLPXDÿLӋn cӫa các nhà máy phát ÿLӋn, EVN sӁ truyӅn tҧi
và cung cҩSÿLӋQÿӃQQJѭӡi tiêu dùng theo biӇXJLiTX\ÿӏnh. 1JjQKÿLӋn là ngành
chӏu ҧQKKѭӣng ít nhҩt tӯ nhӳng biӃQÿӝng thӏ WUѭӡng tài chính trong thӡi gian qua
so vӟi các ngành kinh tӃ khác, do khҧ QăQJFXQJFҩSÿLӋn hiӋn nay vүQFKѭD ÿiS
2
ӭQJÿҫy ÿӫ nhu cҫu vӅ ÿLӋn cӫDQJѭӡi tiêu dùng. Tuy nhiên, có mӝt sӕ công ty chӏu
ҧnh Kѭӣng lӟn vӅ biӃQÿӝng tӹ giá do vay vӕn tӯ các tә chӭc tín dөQJÿӇ xây dӵng
nhà máy và các công ty nhiӋWÿLӋn chҥy dҫu chӏu rӫi ro do sӵ biӃQÿӝng vӅ giá dҫu.
VӅ Fѫ Fҩu nguӗQ ÿLӋn, sҧQ OѭӧQJ ÿLӋQ ÿѭӧc sҧn xuҩt chӫ yӃu tӯ các nhà máy
thӫ\ ÿLӋn và nhiӋW ÿLӋn than, dҫu, tuabin khí dҫu và các nguӗQ SKiW ÿLӋQ ÿӝc lұp
,337URQJFѫFҩu nguӗQÿLӋQWtQKÿӃn cuӕLQăPWKӫ\ÿLӋn chiӃm 37% và
nhiӋWÿLӋn chiӃm 56% và nhiӋt ÿLӋn vүn chiӃm tӹ trӑng lӟn nhҩW7ѭѫQJODLWURQJFѫ
cҩu nguӗQÿLӋn sӁ vүn tiӃp tөc nâng dҫn tӹ trӑng các nguӗn phi thӫ\ÿLӋn. Theo kӃ
hӑDFK ÿӃQ QăP WKXӹ ÿLӋn chӍ chiӃm 28,5%; nhiӋW ÿLӋn dҫu và khí chiӃm
26,7%; nhiӋWÿLӋn than chiӃm 30,2%; nhұp khҭu 5,8%.
'RÿyÿӅ tài ӭng dөng khai phá dӳ liӋXÿӇ dӵ EiRÿӗ thӏ phө tҧLÿѭӧc thӵc hiӋn
nhҵm góp phҫn vào viӋc dӵ báo phө tҧi mӝW FiFK FKtQK [iF ÿӇ chӫ ÿӝng nguӗn
FXQJ FNJQJ QKѭ Oj YLӋc quy hoҥFK ÿҫX Wѭ SKiW WULӇn nguӗQ ÿLӋn và vұn hành hӋ
thӕQJÿLӋn. Nhu cҫu tiêu thө ÿLӋQQăQJSKө thuӝc vào khҧ QăQJSKiWWULӇn cӫa nӅn
kinh tӃ cӫa mӝt quӕc gia, nӃu mà dӵ báo phө tҧi quá thҩp so vӟi nhu cҫu phө tҧi thì
sҿ dҭQÿӃn kӃt quҧ có nguӗn dӵ phòng thҩSNK{QJÿiSӭQJÿѭӧc các nhu cҫu sҧn
xuҩt, sinh hoҥt, nӃu dӵ báo phө tҧi quá cao thì gây nên mӝt nguӗQQăQJOѭӧng lãng
SKtFKRQѭӟc nhà.
II. 0өFWLrXQJKLrQFӭX
Mөc tiêu tәng quát: Tìm ra các giҧLSKiSÿӇ dӵ EiRÿӗ thӏ phө tҧi mӝt cách chính
xác.
Mөc tiêu cө thӇ:
Tìm hiӇu vӅ nhu cҫu dӵ EiRÿӗ thӏ phө tҧi
Tìm hiӇu vӅ khái niӋm khai phá dӳ liӋu (Data Mining)
+ ĈӏQKQJKƭDNKDLSKiGӳ liӋu là gì
+ Quá trình khai phá dӳ liӋu
+ Các bài toán vӅ khai phá dӳ liӋu
+ Các ӭng dөng cӫa khai phá dӳ liӋu
3
Giӟi thiӋu các giҧi thuұWÿLӇn hình trong khai phá dӳ liӋu
Ӭng dөng mӝt sӕ giҧi thuұt cӫa khai phá dӳ liӋu ÿӇ dӵ báo biӇXÿӗ phө tҧi
III. ĈӕLWѭӧQJYjSKҥPYLQJKLrQFӭX
ĈӕL Wѭӧng nghiên cӭu: Nghiên cӭu vӅ kӻ thuұt phân cөm K-means, thuұt toán
Multi- Layer Perceptron (MLP) và kӻ thuұt Propagation (lan truyӅQQJѭӧc).
Phҥm vi nghiên cӭu:
Nghiên cӭu vӅ thuұt toán MLP và kӻ thuұW3URSDJDWLRQÿӇ dӵ báo phө tҧLÿӍnh cho
phө tҧi trҥP³$Q%LrQ´
Nghiên cӭu vӅ kӻ thuұt phân cөm K-PHDQV ÿӇ thành lұS ÿӗ thӏ phө tҧL WѭѫQJ ÿӕi
ÿLӇn hình.
IV. 3KѭѫQJSKiSQJKLrQFӭX
Thu thұp dӳ liӋu vӅ ÿӗ thӏ phө tҧi 24h cӫa trҥm An Biên ± Kiên Giang trong 4
WKiQJ7KiQJQăP
Thu thұp dӳ liӋu vӅ thӡi tiӃt cӫa Kiên Giang trong 4 tháng (Tháng 7, 8, 9, 10)
QăP
Áp dөng thuұt toán Multi- Layer Perceptron (MLP) và kӻ thuұt Propagation (Lan
truyӅQQJѭӧFÿӇ dӵ báo phө tҧLÿӍnh cӫa ngày dӵ báo
Áp dөng kӻ thuұt phân cөm K-PHDQVÿӇ xây dӵQJÿӗ thӏ phө tҧLWѭѫQJÿӕLÿLӇn
hình cӫa ngày dӵ báo
Tӯ kӃt quҧ cӫa phө tҧLÿӍnh dӵ EiRYjÿӗ thӏ phө tҧLWѭѫQJÿӕLÿLӇn hình suy ra
ÿӗ thӏ phө tҧi ngày dӵ báo
Sӱ dөng phҫn mӅm Matlab tính toán và hiӇn thӏ ra kӃt quҧ
V. éQJKƭDNKRDKӑFYjWKӵFWLӉQ
Giӟi thiӋu và tìm hiӇu các thuұt toán vӅ dӵ báo
Ӭng dөQJÿӇ nҳPÿѭӧc tәng quan vӅ ÿӗ thӏ phө tҧi cӫDFiFQJj\ÿһFWUѭQJÿӗ thӏ
phө tҧi cӫa các ngày
Ӭng dөQJÿӇ dӵ EiRÿӗ thӏ phө tҧLFKRF{QJWiFÿLӅXÿӝ và sҧn xuҩt
'QJFKRF{QJWiFÿjRWҥo
4
VI. NӝLGXQJOXұQYăQ
Mӣ ÿҫu
Lý do chӑQÿӅ tài
Mөc tiêu nghiên cӭu
ĈӕLWѭӧng và phҥm vӏ nghiên cӭu
3KѭѫQJSKiSQJKLrQFӭu
éQJKƭDNKRD hӑc và thӵc tiӉn
&KѭѫQJ Bài toán dӵ EiRYjSKѭѫQJSKiSGӵ báo
&KѭѫQJ K-means trong viӋc phân cөm dӳ liӋu
&KѭѫQJ 3: Multi Layer Perceptron (MLP) và Propagation (lan truyӅQQJѭӧc) trong
bài toán dӵ báo phө tҧi
&KѭѫQJӬng dөng thuұt toán phân cөm K-PHDQVYj0/3ÿӇ dӵ EiRÿӗ thӏ phө
tҧi ngày
&KѭѫQJ &KѭѫQJWUuQK0DWODEFyWURQJÿӇ tài
KӃt luұn và kiӃn nghӏ
5
&+ѬѪ1* %¬,72È1'Ӵ%È29¬3+ѬѪ1*3+È3'Ӵ%È2
Có th͋ nói r̹QJÿk\OjJLDLÿR̩QORjLQJ˱ͥLÿDQJE˱ͣc vào kͽ nguyên cͯa khoa
h͕c dͷ li͏u. N͇u thi͇u v̷ng các công cͭ phân tích b̹ng d báo chúng ta sͅ b͓ tràn
ng̵p trong dͷ li͏u mà thi͇u thông tin, không bi͇t nhͷQJJuÿm[̫y ra ho̿c nhͷng gì
sͅ x̫y ra ti͇p theo.
1.1 Tәng quan vӅ các kӻ thuұt dӵ báo
Nhu cҫu hiӇu biӃt các sӵ kiӋn trong quá khӭ cӫa chúng ta dӵa vào nhӳng dӳ
kiӋQÿm[ҧ\UDWUѭӟFÿyGүQÿӃn mӝt chӫ ÿӅ WURQJOƭQKYӵc khoa hӑc dӳ liӋXÿyOjNӻ
thuұt dӵ báo. Nó FKRSKpSFK~QJWDÿѭDUDFiFTX\ӃWÿӏnh dӵa vào sӕ liӋu thӕng kê
WKXÿѭӧc tӯ dӳ liӋu trong quá khӭ ÿӇ giҧi quyӃWFiFEjLWRiQWѭѫQJWӵ xҧy ra QKѭGӵ
báo khách hàng rӡi bӓ dӏch vө, dӵ báo gian lұn, thӕng kê quá trình kinh doanh. ĈӇ
làm sáng tӓ ÿLӅXQj\WUѭӟc tiên chúng ta cҫn làm rõ các khái niӋm: mô hình dӵ báo,
tҫm quan trӑng cӫa dӳ liӋu trong dӵ báo, các ӭng dөng cӫa kӻ thuұt dӵ báo.
1.1.1 Khái niӋm mô hình dӵ báo
Mô hình dӵ báo có thӇ hiӇu là mӝt hàm toán hӑc có thӇ ánh xҥ giӳa mӝt tұp
cӫa các biӃn dӳ liӋXÿҫXYjRWKѭӡQJÿѭӧFÿyQJJyLWURQJPӝt bҧn ghi vào mӝt biӃn
ÿiS ӭng hay biӃQÿtFKWӟi mӝt biӃn dӵ EiRQjRÿy7URQJWKӵc tӃ, mӝt mô hình dӵ
báo cҫn phҧi có rҩt nhiӅu các biӃQÿӝc lұSÿѭӧc chӑn lӵa tӯ bӝ dӳ liӋu, bên cҥQKÿy
là các qui trình, chính sách ÿһFWUѭQJFKRWӯng ngành khoa hӑc chung phҧLÿѭӧc kӃt
hӧp sӱ dөng trong mô hình dӵ báo. Mô hình dӵ báo có thӇ ÿѭӧc chia làm hai loҥi
WKHRTXDQÿLӇm cӫa các nhà khai phá dӳ liӋu, thӭ nhҩt là hӑc có giám sát, còn lҥi
ÿѭӧc gӑi là hӑc không có giám sát.
Khi chúng ta nói quá trình hӑc này là có giám sátQJKƭDOjWURQJTXiWUuQK
huҩn luyӋn, dӳ liӋX ÿѭӧc trình bày theo mӝt mô hình dӵ báo vӟi các dӳ liӋX ÿҫu
YjRÿҫu ra hay kӃt quҧ mong muӕn. ViӋc huҩn luyӋQÿѭӧc lһp lҥLFKRÿӃn khi mô
hình hӑFÿѭӧc hàm ánh xҥ giӳDFiFÿҫXYjRÿmFKRYj ÿҫu ra mong muӕn. Các ví dө vӅ
các mô hình dӵ EiR ÿDQJ Vӱ dөng viӋc hӑc tұp có giám sát bao gӗm các mҥng thҫn
kinh lan truyӅn - QJѭӧc (ANN back propagation: Artificial Neural Network back
propagation), các Space Vector Machine và các cây quyӃWÿӏnh (Decision Trees).
6
Mӝt mô hình dӵ EiR FNJQJ Fy WKӇ sӱ dөng viӋc hӑc không giám sát. Trong
WUѭӡng hӧp này, nó chӍ ÿѭӧc trình bày vӟi dӳ liӋXÿҫXYjR6DXÿyQKLӋm vө cӫa nó
là tìm ra các bҧn ghi dӳ liӋX ÿҫu vào khác nhau liên quan vӟL QKDX QKѭ WKӃ nào.
Phân cөm (Clustering) là kiӇu mô hình dӵ EiRÿѭӧc sӱ dөng phә biӃn nhҩt, có sӱ
dөng cách hӑc tұp không giám sát.
1.1.2 Tҫm quan trӑng cӫa dӳ liӋu
Trong các bài toán dӵ báo, vai trò cӫa dӳ liӋu là rҩt quan trӑng, bӣi vì không
có dӳ liӋXWKuNK{QJFySKkQWtFKYjFNJQJFKҷng có phân tích dӵ báo. Trong khoa
hӑc khai phá dӳ liӋu, nhiӅu doanh nghiӋp rҩt có chú ý tӟi viӋc tìm kiӃm mӝt giҧi
pháp phân tích dӵ báo cho công ty cӫa hӑ. Mһc dù hӑ biӃt rҵng phân tích dӵ báo có
thӇ giúp cҧi thiӋn kӃt quҧ kinh doanh cӫa hӑQKѭQJKӑ lҥLNK{QJFyÿӫ dӳ liӋu cho
mӝt nhà khoa hӑc dӳ liӋXÿӇ thӵc sӵ huҩn luyӋn mӝWP{KuQKFyêQJKƭD7URQJNӹ
nguyên cӫa dӳ liӋu lӟQ%LJ'DWDÿLӅXÿyWKӵc sӵ hay xҧ\UDÿӃn mӭc có thӇ làm
cho bҥn ngҥFQKLrQĈӕi vӟi mӝt sӕ mô hình dӵ EiRÿӇ có thӇ hӑc và tәng quát hóa,
phҧi cҫn ÿӃn hàng ngàn bҧn ghi và nhiӅXKѫQWKӃ.
Theo công bӕ cӫa nhóm nghiên cӭu dӳ liӋu cӫa IBM, nhóm cӫa các nhà
nghiên cӭXQj\ÿm ÿѭӧc giao nhiӋm vө xây dӵng mӝt mô hình ÿӇ dӵ báo xem mӝt
quy trình sҧn xuҩWQjRÿyVӁ dүQÿӃn thành công hay thҩt bҥi. Quá trình sҧn xuҩt này
mҩt khoҧng 8 giӡ ÿӇ hoàn thành và tiêu thө nhiӅu tài nguyên. ChӍ VDXNKLÿmKRjQ
thành, các kӻ Vѭÿҧm bҧo chҩWOѭӧng cӫa công ty mӟi có thӇ [iFÿӏQK[HPFyÿLӅu
gì không әn diӉn ra trong quá trình sҧn xuҩt không. NӃu có, toàn bӝ lô sҧn phҭm
này phҧi bӏ loҥi bӓ và mӝt lô mӟLÿѭӧc bҳWÿҫu lҥi tӯ ÿҫXéWѭӣng ӣ ÿk\OjFK~QJWD
có thӇ xem xét dӳ liӋX WKX ÿѭӧc trong quá khӭ cho tҩt cҧ FiF JLDL ÿRҥn cӫa quy
trình Qj\ ÿӕi vӟL FiF O{ ÿm NӃt cөc là tӕt hoһc xҩX 6DX ÿy FK~QJ WD Fy WKӇ huҩn
luyӋn mӝt mô hình ÿӇ phát hiӋn ngay khi mӑi thӭ bҳWÿҫu có vҿ xҩXÿLWӯ EDQÿҫu
trong quy trình này. Mӝt sӵ thұt là, thӵc tӃ, trong khoҧng thӡLJLDQÿyKӑ FKѭD[k\
dӵng bҩt cӭ mô hình nào. Trong quá trình phân tích dӳ liӋu, hӑ ÿmSKiWKLӋn ra rҵng
dӳ liӋXÿmEӏ hӓng hoһc tӋ KѫQEӏ bӓ sót trong mӝt sӕ JLDLÿRҥn sҧn xuҩt then chӕt.
Quan trӑQJKѫQKӑ không thӇ tìm ra kӃt quҧ ÿҫu ra hay là các thông tin sӁ cho phép
chúng tôi phân biӋt các lô tӕt vӟi các lô xҩX ĈLӅX ÿy Fy QJKƭD Oj QKyP FiF QKj
7
nghiên cӭu này sӁ không thӇ sӱ dөng mӝt kӻ thuұt hӑc có giám sát. ViӋc thiӃu các
phҫn quan trӑng cӫa dӳ liӋXÿҫXYjRÿmOjKLӇm hӑDÿӕi vӟi viӋc sӱ dөng mӝt kӻ
thuұt hӑc không giám sát. Tóm lҥi, dӳ liӋu có thӇ tӵ nó trӣ thành giá trӏ dӵ báo nӃu
QKѭQyOjPӝt dӳ liӋu tӕt.
1.1.3 Các ӭng dөng vӅ phân tích dӵ báo
Khi nghiên cӭu vӅ phân tích dӵ báo, các tác giҧ cӫa mӝt cuӕn sách (Duda,
+DUW Yj 6WRUN Fy QKDQ ÿӅ ³phân lo̩i m̳u´ ÿm [k\ Gӵng mӝt hӋ thӕng phân loҥi
mүu cho mӝt nhà máy chӃ biӃn cá. Trong nhà máy này, hӑ sӱ dөng mӝt giҧi pháp
dӵ báo ÿӇ phân loҥLFiÿѭDYjRWKjQKFiKӗLKD\OjFiYѭӧc biӇn phө thuӝFYjRFiFÿһc
WtQKÿҫXYjRQKѭFKLӅu dài và mұWÿӝ cӫa vҧy cá. Trong nghiên cӭu vӅ sӵ trung thành
cӫa khách hàng ngân hàng, hoһc khách hàng là các khách hàng sӱ dөng dӏch vө ÿLӋn
thoҥi, nhóm tác giҧ ÿmVӱ dөng chính sӵ bӓ ÿLFӫa khách hàng làm biӃn dӵ báo.
Mӝt ӭng dөng vӅ phân tích dӵ báo vӕQ ÿm Uҩt thành công trong nhiӅX QăP
nay là phát hiӋn gian lұn. Mӛi khi bҥn quҽt thҿ tín dөng cӫa mình hoһc sӱ dөng nó
trên mҥng, rҩt có thӇ là giao dӏch cӫa bҥQÿDQJÿѭӧc phân tích trong thӡi gian thӵc
ÿӇ biӃt khҧ QăQJJLDQOұn ra sao. Tùy thuӝFYjRQJX\FѫÿmQKұn biӃWÿѭӧc, hҫu hӃt
các tә chӭc thӵc hiӋn mӝt tұp hӧp các quy tҳc nghiӋp vө thұm chí có thӇ tӯ chӕi mӝt
giao dӏFKFyQJX\FѫFDRĈk\OjÿtFKFXӕi cùng cӫa phân tích dӵ báo trong cuӝc
chiӃn chӕng tӝi phҥPÿyOjQJăQNK{QJFKRQy[ҧy ra ngay tӯ ÿҫu.
Có rҩt nhiӅu ӭng dөng quan trӑng cӫa phân tích dӵ EiRWURQJOƭQKYӵc y tӃ,
quân sӵ, tài chính, ngân hàng và nhiӅXFiFOƭQKYӵc khác. Gian lұn vӅ y tӃ và ngân
hàng hҫXQKѭFKҳc chҳQÿӭQJÿҫu danh sách các gian lұn, tuy nhiên, viӋc sӱ dөng
phân tích dӵ EiR ÿӇ thӵc hiӋQ FKăP VyF SKzQJ QJӯa có hiӋu quҧ FNJQJ FKѭD ÿѭӧc
thӵc sӵ TXDQWkPYjÿѭDYjR ӭng dөng bӣi các nhà lãnh ÿҥo cҩp cao trong tӯQJOƭQK
vӵc liên quan. Nhӡ biӃWÿѭӧc bӋQKQKkQQjRFyQJX\FѫSKiWWULӇn cao vӅ mӝWFăQ
bӋQKQjRÿyFK~QJWDFyWKӇ áp dөng các biӋn pháp phòng ngӯDÿӇ giҧm thiӇu nguy
FѫYjFXӕLFQJOjÿӇ cӭu sӕQJQJѭӡi bӋnh. GҫQÿk\SKkQWtFKGӵ EiRÿmOjWUXQJ
tâm chú ý cӫa mӝt cuӝc tranh luұQF{QJNKDLWURQJÿyGӳ liӋu lӏch sӱ ÿѭӧc sӱ dөng
ÿӇ làm giҧm sӕ Oѭӧng bӋnh nhân nhұp viӋn lҥi.
- Xem thêm -