Đăng ký Đăng nhập
Trang chủ Ứng dụng khai phá dữ liệu cho dự báo đồ thị phụ tải đào thọ thiện. tp. hồ ch...

Tài liệu Ứng dụng khai phá dữ liệu cho dự báo đồ thị phụ tải đào thọ thiện. tp. hồ chí minh đại học bách khoa, 2021. . b

.PDF
145
1
53

Mô tả:

ĐẠI HỌC QUỐC GIA TP. HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐÀO THỌ THIỆN ỨNG DỤNG KHAI PHÁ DỮ LIỆU CHO DỰ BÁO ĐỒ THỊ PHỤ TẢI APPLICATION DATA MINING FOR LOAD FORECAST Chuyên ngành: Kỹ thuật điện Mã số ngành: 60520202 LUẬN VĂN THẠC SĨ TP. HỒ CHÍ MINH, tháng 01 năm 2021 Công trình được hoàn thành tại: Trường Đại Học Bách Khoa – Đại Học Quốc Gia Tp.HCM Cán bộ hướng dẫn khoa học: PGS.TS. Phan Thị Thanh Bình Cán bộ chấm nhận xét 1: PGS.TS. Phạm Đình Anh Khôi Cán bộ chấm nhận xét 2: TS. Lê Văn Đại Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp. HCM ngày 23 tháng 01 năm 2021. Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: 1. Chủ tịch hội đồng: PGS.TS Hồ Văn Nhật Chương 2. Thư ký hội đồng: TS. Huỳnh Quốc Việt 3. Uỷ viên phản biện 1: PGS.TS. Phạm Đình Anh Khôi 4. Uỷ viên phản biện 2: TS. Lê Văn Đại 5. Uỷ viên hội đồng: PGS.TS Vũ Phan Tú Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA ĐIỆN-ĐIỆN TỬ i ĈҤI HӐC QUӔC GIA TP.HCM 75ѬӠ1*ĈҤI HӐC BÁCH KHOA CӜNG HÒA XÃ HӜI CHӪ 1*+Ƭ$9,ӊT NAM Ĉӝc lұp - Tӵ do - Hҥnh phúc NHIӊM VӨ LUҰ19Ă17+Ҥ&6Ƭ Hӑ và tên hӑc viên: Ĉ¬27+Ӑ THIӊN. MSHV: 1770351 1Jj\WKiQJQăPVLQK12/09/1994 1ѫLVLQKQuҧng Bình Chuyên ngành: Kӻ thuұWÿLӋn Mã sӕ: 60520202 ,7Ç1Ĉӄ TÀI: ӬNG DӨNG KHAI PHÁ DӲ LIӊU CHO DӴ %È2ĈӖ THӎ PHӨ TҦI APPLICATION DATA MINING FOR LOAD FORECAST NHIӊM VӨ VÀ NӜI DUNG: - Tìm hiӇu vӅ thuұt toán phân cөm K-means - Tìm hiӅu vӅ thuұt toán Multi Layer Perceptron (MLP) và kӻ thuұt lan truyӅn QJѭӧc - Áp dөng thuұt toán phân cөm K-means, thuұt toán Multi Layer Perceptron (MLP) và kӻ thuұt lan truyӅQQJѭӧFÿӇ ӭng dөng vào bài toán dӵ EiRÿӗ thӏ phө tҧi ngày cho mӝt trҥm - Ӭng dөQJ0DWODEÿӇ thӵc hiӋn nhiӋm vө cӫa luұQYăQ II. NGÀY GIAO NHIӊM VӨ: 21/09/2020 III. NGÀY HOÀN THÀNH NHIӊM VӨ: 03/01/2021 IV. CÁN BӜ +ѬӞNG DҮN: PGS.TS. Phan Thӏ Thanh Bình 7S+&0QJj\«WKiQJ«QăP CÁN BӜ +ѬӞNG DҮN CHӪ NHIӊM BӜ 0Ð1Ĉ¬27ҤO PGS. TS. PHҤN THӎ THANH BÌNH 75ѬӢ1*.+2$Ĉ,ӊN - Ĉ,ӊN TӰ ii LӠI CҦ0Ѫ1 ĈӇ có thӇ KRjQWKjQKÿӅ tài luұQYăQWKҥFVƭPӝt cách hoàn chӍnh, bên cҥnh sӵ nӛ lӵc cӕ gҳng cӫa bҧn thân còn có sӵ Kѭӟng dүn nhiӋt tình cӫa quý Thҫy Cô, FNJQJQKѭVӵ ÿӝng viên ӫng hӝ cӫDJLDÿuQKYjEҥn bè trong suӕt thӡi gian hӑc tұp nghiên cӭu và thӵc hiӋn luұQYăQWKҥFVƭ Em xin chân thành bày tӓ lòng biӃW ѫQ ÿӃn Cô PGS.TS. Phan Thӏ Thanh %uQK QJѭӡL ÿm KӃW OzQJ JL~S ÿӥ và tҥo mӑL ÿLӅu kiӋn tӕt nhҩt cho em hoàn thành luұQ YăQ Qj\ ;LQ FKkQ WKjQK Ej\ Wӓ lòng biӃW ѫQ ÿӃn toàn thӇ quý thҫy cô trong NKRDĈLӋn ± ĈLӋn Tӱ, Ngành Kӻ ThuұWĈLӋn ± 7UѭӡQJĈҥi hӑc Bách Khoa TPHCM ÿmWұn tình truyӅQÿҥt nhӳng kiӃn thӭFTXêEiXFNJQJQKѭWҥo mӑLÿLӅu kiӋn thuұn lӧi nhҩt cho em trong suӕt quá trình hӑc tұp nghiên cӭXYjFKRÿӃn khi thӵc hiӋQÿӅ tài luұQYăQ;LQFKkQWKjQKEj\Wӓ lòng biӃWѫQÿӃn Trҥm An Biên ± .LrQ*LDQJÿm cung cҩp các dӳ liӋu vӅ ÿӗ thӏ phө tҧLÿӇ FKRHPFyFѫVӣ dӳ liӋXÿӇ phân tích và dӵ báo. Em xin chân thành cҧPѫQÿӃQJLDÿuQKFiFDQKFKӏ và các bҥQÿӗng nghiӋp ÿmKӛ trӧ cho em rҩt nhiӅu trong suӕt quá trình hӑc tұp, nghiên cӭu và thӵc hiӋQÿӅ tài luұQYăQWKҥFVƭPӝt cách hoàn chӍnh. Cuӕi cùng, em xin kính chúc các thҫy, cô, các anh, chӏ và bҥn bè thұt nhiӅu sӭc khoҿ và thành công 73+&0WKiQJQăP Hӑc viên thӵc hiӋn ĈjR7Kӑ ThiӋn iii TÓM TҲT LUҰ19Ă17+Ҥ&6Ƭ Kinh tӃ ngày càng phát triӇn thì nhu cҫu vӅ ÿLӋQFNJQJSKiWWULӇn theo. ViӋc dӵ ÿRiQÿѭӧc phө tҧi cӫa hӋ thӕQJÿLӋn sӁ góp phҫn cho viӋc quy hoҥFKÿҫXWѭSKiW triӇn nguӗQÿLӋn và vұn hành hӋ thӕQJÿLӋQ4XDÿyQkQJFDRÿӝ tin cұy, chҩWOѭӧng phөc vө cӫa hӋ thӕQJÿLӋn ViӋt Nam. Vì vұ\ÿӅ WjLÿѭӧc tiӃn hành: ӬNG DӨNG KHAI PHÁ DӲ LIӊU CHO DӴ %È2ĈӖ THӎ PHӨ TҦI ABSTRACT As the economy grows, so does the demand for electricity. Predicting the load of the electricity system will contribute to the planning, investment, development of power sources and operation of the electricity system. Thereby, improving the reliability and service quality of Vietnam's electricity system. So the topic proceeds: APPLICATION DATA MINING FOR LOAD FORECAST iv LӠ,&$0Ĉ2$1 LuұQYăQQj\OjF{QJWUuQKQJKLrQFӭu cӫDFiQKkQW{Lÿѭӧc thӵc hiӋn Gѭӟi sӵ Kѭӟng dүn cӫa cô PGS.TS. Phan Thӏ Thanh Bình. Các sӕ liӋu, kӃt quҧ và nhӳng kӃt luұn nêu trong luұQYăQQj\OjWUXQJWKӵFYjFKѭDÿѭӧc công bӕ trong các công trình khác. NӃXNK{QJÿ~QJQKѭÿmQrXWUrQW{LKRjQWRjQFKӏu trách nhiӋm vӅ ÿӅ tài cӫa mình. Tp. Hӗ &Kt0LQKWKiQJQăP 1JѭӡLFDPÿRDQ ĈjR7Kӑ ThiӋn v MӨC LӨC NHIӊM VӨ LUҰ19Ă17+Ҥ&6Ƭ ........................................................................................................ i LӠI CҦ0Ѫ1 .......................................................................................................................................... ii TÓM TҲT LUҰ19Ă17+ҤC 6Ƭ ........................................................................................................iii ABSTRACT ............................................................................................................................................iii LӠ,&$0Ĉ2$1 ................................................................................................................................... iv DANH MӨC BҦNG .............................................................................................................................. vii DANH MӨC HÌNH ҦNH ....................................................................................................................viii DANH MӨC VIӂT TҲT ....................................................................................................................... xi PHҪN MӢ ĈҪU ...................................................................................................................................... 1 &+ѬѪ1*%¬,72È1'Ӵ %È29¬3+ѬѪ1*3+È3'Ӵ BÁO ................................................. 5 1.1 Tәng quan vӅ các kӻ thuұt dӵ báo....................................................................................................... 5 1.1.1 Khái niӋm mô hình dӵ báo ............................................................................................................... 5 1.1.2 Tҫm quan trӑng cӫa dӳ liӋu ............................................................................................................. 6 1.1.3 Các ӭng dөng vӅ phân tích dӵ báo ................................................................................................... 7 1.2 Các kӻ thuұt mô hình hóa dӵ báo........................................................................................................ 9 1.2.1 Giӟi thiӋu tәng quát ......................................................................................................................... 9 1.2.2 Sӵ hình thành cӫa mӝt mô hình dӵ báo ......................................................................................... 10 &iFSKѭѫQJSKiSGӵ báo................................................................................................................ 12 1.2.4 Linear Regression ± Hӗi quy tuyӃn tính......................................................................................... 13 1.2.5 Hӗi quy Logistic............................................................................................................................. 16 1.2.6 Phân tích phân loҥi tuyӃn tính ........................................................................................................ 17 1.2.7 Cây phân loҥi và hӗi quy................................................................................................................ 17 1.2.8 Naive Bayes ................................................................................................................................... 18 1.2.9 K ± Nearest Neighbors ± KNN ...................................................................................................... 19 1.2.10 Multi-layer Perceptron ± MLP ..................................................................................................... 20 &+ѬѪ1*.-MEANS TRONG VIӊC PHÂN CӨM DӲ LIӊU ................................................... 22 2.1 Giӟi thiӋu .......................................................................................................................................... 22 2.2 Phân tích toán hӑc ............................................................................................................................. 22 2.3 Giҧi thuұt phân cөm K-Means trong Matlab..................................................................................... 26 2.4 Sӵ cҫn thiӃt cӫa viӋc xây dӵng biӇXÿӗ phө tҧLWѭѫQJÿӕLÿLӇn hình ................................................ 28 2.5 Dùng biӇXÿӗ 6LOKRXHWWHÿӇ tìm sӕ cөm k tӕLѭXWURQJEjLWRiQSKkQFөm K-Means ....................... 30 2.6. Ӭng dөng K-means trong xây dӵQJÿӗ thӏ phө tҧLWѭѫQJÿӕLÿLӇn hình ngày.................................. 46 vi &+ѬѪ1*08/7,/$<(53(5&(37521 0/3 9¬3523$*$7,21 /$1758<ӄN 1*ѬӦC) TRONG BÀI TOÁN DӴ BÁO PHӨ TҦI .......................................................................... 49 3.1 Giӟi thiӋu .......................................................................................................................................... 49 3.2 Các ký hiӋu và khái niӋm .................................................................................................................. 49 3.2.1 Layers (sӕ lӟp) ............................................................................................................................... 49 3.2.2 Units ............................................................................................................................................... 50 3.2.3 Weights và Biases .......................................................................................................................... 50 3.2.4 Activation functions ....................................................................................................................... 51 3.3 Lan truyӅQQJѭӧc ± Backpropagation ............................................................................................... 53 &iFEѭӟc Backpropagation cho Stochastic Gradient Descent ....................................................... 56 3.4 Xây dӵQJFKѭѫQJWUuQKGӵ EiRÿӗ thӏ phө tҧLÿӍnh bҵng phҫn mӅm Matlab .................................... 57 3.4.1 Các yӃu tӕ ҧQKKѭӣQJÿӃn phө tҧi .................................................................................................. 57 3.4.2 Xây dӵng bài toán .......................................................................................................................... 59 3.4.3 7KӵF KLӋQ bҵng phҫn mӅm Matlab................................................................................................. 61 &+ѬѪ1*ӬNG DӨNG THUҰT TOÁN PHÂN CӨ0.0($169¬0/3Ĉӆ DӴ BÁO ĈӖ THӎ PHӨ TҦI NGÀY .................................................................................................................... 69 /ѭXÿӗ giҧi thuұt dӵ EiRÿӗ thӏ phө tҧi ngày ................................................................................... 69 4.2. KӃt quҧ dӵ báo phө tҧi ngày ............................................................................................................ 70 &+ѬѪ1*6Ӱ DӨ1*&+ѬѪ1*75Î1+0$7/$%&Ï7521*Ĉӄ TÀI .............................. 76 5.1 &KѭѫQJWUuQKGӵ EiRÿӗ thӏ phө tҧi 24h ............................................................................................ 76 5.2 VӁ ÿӗ thӏ phө tҧi ngày dӵ báo ........................................................................................................... 78 5.3 &KѭѫQJWUuQKWuPVӕ cөm k tӕLѭXFKREjLWRiQSKkQFөm K-Means ................................................ 79 KӂT LUҰN VÀ KIӂN NGHӎ .............................................................................................................. 81 TÀI LIӊU THAM KHҦO .................................................................................................................... 83 PHӨ LӨC 1: BҦN*ĈӖ THӎ PHӨ TҦI VÀ NHIӊ7ĈӜ .................................................................. 85 PHӨ LӨ&&+ѬѪ1*75Î1+0$7/$% ....................................................................................... 99 PHӨ LӨC 3: CÁC KӂT QUҦ DӴ BÁO ........................................................................................... 108 LÝ LӎCH TRÍCH NGANG ................................................................................................................ 132 4Ò$75Î1+Ĉ¬27ҤO..................................................................................................................... 132 QUÁ TRÌNH CÔNG TÁC ................................................................................................................. 132 vii DANH MӨC BҦNG %̫QJ-1: 3KͭW̫Lÿ͑QKG͹EiRFiFQJj\WKͱ ................................................................. 70 %̫QJ-2: 3KͭW̫Lÿ͑QKG͹EiRFiFQJj\WKͱ ................................................................. 70 %̫QJ-3: 3KͭW̫Lÿ͑QKG͹EiRFiFQJj\WKͱ ................................................................. 70 %̫QJ-3KͭW̫Lÿ͑QKG͹EiRFiFQJj\WKͱ ................................................................. 70 %̫QJ-5: 3KͭW̫Lÿ͑QKG͹EiRFiFQJj\WKͱ ................................................................. 71 %̫QJ-6: 3KͭW̫Lÿ͑QKG͹EiRFiFQJj\WKͱ ................................................................. 71 %̫QJ-7: 3KͭW̫Lÿ͑QKG͹EiRFiFQJj\FKͯQK̵W ........................................................... 71 viii DANH MӨC HÌNH ҦNH Hình 1-%L͋XGL͍QKDLFKL͉XY͉FiFWKX͡FWtQKFͯDNKiFKKjQJ .................................... 11 Hình 1-9tGͭ\ %% [ ...................................................................................... 13 Hình 1-9tGͭY͉K͛LTX\ORJLVWLF .................................................................................... 16 Hình 1-0{KuQKGHFLVLRQWUHH Fk\TX\͇Wÿ͓QK ............................................................ 18 Hình 1-5: Mô hình Navie Bayes......................................................................................... 19 Hình 1-6: Mô hình K ± Nearest Neighbors - KNN ........................................................... 20 Hình 1-7: Multi-layer Perceptron ...................................................................................... 21 Hình 2-9tGͭY͉EjLWRiQSKkQFͭP............................................................................ 22 Hình 2-%L͋Xÿ͛JLiWU͓SKͭW̫LW˱˯QJÿ͙LFiFQJj\WKͱ ............................................. 29 Hình 2-%L͋Xÿ͛JLiWU͓SKͭW̫LW˱˯QJÿ͙LFiFQJj\WKͱ ............................................. 29 Hình 2-%L͋Xÿ͛JLiWU͓SKͭW̫LW˱˯QJÿ͙LFiFQJj\&Kͯ1K̵W ...................................... 30 Hình 2-5: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ............................. 33 Hình 2-6: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ............................. 33 Hình 2-%L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ............................. 34 Hình 2-8: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ............................. 35 Hình 2-9: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ............................. 35 Hình 2-10: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 36 Hình 2-11: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 37 Hình 2-%L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 37 Hình 2-13: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 38 Hình 2-%L͋Xÿ͛KuQKEyQJ YͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 39 Hình 2-15: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 39 Hình 2-16: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 40 ix Hình 2-17: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 41 Hình 2-18: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 41 Hình 2-%L͋Xÿ͛KuQKEyQJ YͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 42 Hình 2-20: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 43 Hình 2-21: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 43 Hình 2-22: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\WKͱYjV͙FͭPN  ........................... 44 Hình 2-23: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\FKͯQK̵WYjV͙FͭPN  ..................... 45 Hình 2-24: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\FKͯQK̵WYjV͙FͭPN  ..................... 45 Hình 2-25: %L͋Xÿ͛KuQKEyQJYͣLGͷOL͏XQJj\FKͯQK̵WYjV͙FͭPN  ..................... 46 Hình 2-26: &iFE˱ͣF[k\G͹QJÿ͛WK͓SKͭW̫LW˱˯QJÿ͙LÿL͋QKuQK ................................. 47 Hình 3-1: 0/3YͣLKLGGHQOD\HUV ................................................................................... 49 Hình 3-2: &iFNêKL͏XV͵GͭQJWURQJ0XOWL/D\HU3HUFHSWURQ 0/3 ............................ 50 Hình 3-3: Ĉ͛WK͓FͯDKjPVLJQ........................................................................................... 52 Hình 3-4: Ĉ͛WK͓KjP5H/8 ............................................................................................... 52 Hình 3-5: Hàm sigmoid ...................................................................................................... 53 Hình 3-6: Mô SK͗QJFiFKWtQKEDFNSURSDJDWLRQ.............................................................. 55 Hình 3-Ĉ͛WK͓SKͭW̫LFͯDQJj\WKͱFiFWX̯QNKiFQKDX .......................................... 58 Hình 3-*LiWU͓SKͭW̫Lÿ͑QKYjQ͉QQKL͏WWͳWKiQJÿ͇QWKiQJWU̩P$Q%LrQ± Kiên Giang ................................................................................................................................... 58 Hình 3-9: Ĉ͛WK͓KjPVLJPRLG ........................................................................................... 64 Hình 3-10: Ĉ̯XYjRYjÿ̯XUDP̩QJ1HXWUDl ................................................................... 65 Hình 3-11: 4XiWUuQKKX̭QOX\͏QP̩QJQRWURQ ................................................................ 66 Hình 3-12: 6͙YzQJO̿SFKRQJj\WKͱ ............................................................................. 67 Hình 4-/˱Xÿ͛JL̫LWKX̵WFKRFK˱˯QJWUuQKG͹EiRÿ͛WK͓SKͭW̫LQJj\ ..................... 69 Hình 4-2: Ĉ͛WK͓SKͭW̫LWK͹FW͇YjG͹EiRWKͱQJj\ ................................ 72 x Hình 4-3: Ĉ͛WK͓SKͭW̫LWK͹FW͇YjG͹EiRWKͱQJj\ ................................. 72 Hình 4-4: Ĉ͛WK͓SKͭW̫LWK͹FW͇YjG͹EiRWKͱQJj\ ................................ 73 Hình 4-Ĉ͛WK͓SKͭW̫LWK͹FW͇YjG͹EiRWKͱQJj\ ................................ 73 Hình 4-6: Ĉ͛WK͓SKͭW̫LWK͹FW͇YjG͹EiRWKͱQJj\ ................................ 74 Hình 4-7: Ĉ͛WK͓SKͭW̫LWK͹FW͇YjG͹EiRWKͱQJj\ ................................ 74 Hình 4-8: Ĉ͛WK͓SKͭW̫LWK͹FW͇YjG͹EiRFKͯQK̵WQJj\ .......................... 75 Hình 5-1: 0HQXFK͕QQJj\FKR FK˱˯QJWUuQKG͹EiRÿ͛WK͓SKͭW̫L ............................... 76 Hình 5-2: .͇WTX̫ÿ͛WK͓SKͭW̫LQJj\G͹EiRNKLFK͕QQJj\WKͱ ................................. 77 Hình 5-3: &K͕QQJj\ÿ͋Yͅÿ͛WK͓SKͭW̫L ......................................................................... 78 Hình 5-4: %L͋Xÿ͛SKͭW̫LQJj\G͹EiRYjWK͹FW͇NKLFK͕QQJj\WKͱQK̭W ..................... 78 Hình 5-5: &K͕QWKͱF̯QWuPV͙FͭP ................................................................................... 79 Hình 5-6: 1K̵SV͙FͭPN.................................................................................................... 80 Hình 5-7: %L͋Xÿ͛KuQKEyQJYͣLN  .............................................................................. 80 xi '$1+0Ө&9,ӂ77Ҳ7 x MLP : Multi Layer Perceptron x EVN : TұSĈRjQĈLӋn Lӵc ViӋt Nam x IPP : Các nguӗQSKiWÿLӋQÿӝc lұp x KNN : K ± Nearest Neighbor x SVM : Space Vector Machine 1 PHҪN MӢ ĈҪU I. /êGRFKӑQÿӅWjL 1JjQKÿLӋQÿѭӧc coi là mӝt trong nhӳng ngành then chӕt, nhұQÿѭӧc nhiӅu sӵ quan tâm cӫa QKj Qѭӟc, phҩQ ÿҩX ÿҭy nhanh tӕF ÿӝ WăQJ WUѭӣng bình quân hàng QăPFӫDQJjQKÿLӋn xҩp xӍ gҩp 2 lҫn tӕFÿӝ WăQJWUѭӣng GDP chung cӫa cҧ Qѭӟc. Mһc dù các công ty trong ngành ÿLӋQÿmKRҥWÿӝng hӃt công suҩWQKѭQJYүn không ÿiSӭQJÿӫ nhu cҫXWLrXGQJÿLӋn trong Qѭӟc. Tình trҥng thiӃXÿLӋn vүn tiӃp diӉn do mӝt sӕ dӵ án phát triӇn nguӗQÿLӋn mӟi bӏ chұm tiӃQÿӝÿӗng thӡi sӵ cӕ xҧy ra OjPFiFQKjPi\ÿDQJYұn hành dүQÿӃn phҧLQJѭQJKRҥWÿӝng dүn tӟi sҧQOѭӧng ÿLӋn sҧn xuҩWNK{QJÿҥt so vӟi kӃ hoҥch. SҧQOѭӧQJÿLӋn sҧn xuҩt cӫa cҧ Qѭӟc trong nhӳQJ QăP JҫQ ÿk\ WăQJ QKDQK FKyQJ Wӯ 26,7 triӋu MWh tӯ QăP  ÿӃQ QăP 2008 sҧQ OѭӧQJ ÿLӋn sҧn xuҩW ÿҥt tӟi 77 triӋu MWh. Ngành ÿLӋn có tӕF ÿӝ WăQJ WUѭӣng sҧQOѭӧQJÿLӋQWKѭѫQJSKҭm trung bình mӛLQăPWURQJ JLDLÿӑan tӯ 2000-2008. ĈӇ tình trҥng thiӃXÿLӋn không còn tiӃp diӉn khi nhu cҫXÿLӋn ngày càng WăQJNKRҧng 17% KjQJQăPYLӋFWăQJF{QJVXҩt tӕLÿDFiFQKjPi\SKiWÿLӋQFNJQJ nKѭ [k\ Gӵng các nhà máy ÿLӋn mӟi hӃt sӭc cҫn thiӃt. Tuy nhiên, viӋc xây dӵng mӝWQKjPi\ÿLӋn mӟLÿzLKӓi vӕQÿҫu WѭUҩt lӟn, thӡi gian xây dӵng dài nên trong ngҳn hҥn cҫn tұSWUXQJWăQJWӕLÿDF{QJVXҩt cӫa FiFQKjPi\SKiWÿLӋQÿDQJKRҥt ÿӝng nhҵPÿiSӭng nhu cҫXWăQJWUѭӣQJWUѭӟc mҳt cӫa QJjQKÿLӋn. 1JjQK ÿLӋn tҥi ViӋW 1DP ÿѭӧF [HP QKѭ QJjQK PDQJ WtQK ÿӝc quyӅn cao vӟi TұSÿRjQÿLӋn lӵF (91 OjQJѭӡLPXDYjQJѭӡLEiQÿLӋn duy nhҩWÿӃQQJѭӡi tiêu dùng. Các công ty sҧn xuҩt ÿLӋQNK{QJÿѭӧc bán trӵc tiӃp FKRQJѭӡi tiêu dùng mà bán cho EVN theo hӧSÿӗQJGRÿyVӵ cҥnh tranh giӳa các công ty sҧn xuҩWÿLӋn là NK{QJFy*LiÿLӋn mà EVN mua theo giá thӓa thuұn vӟi tӯQJQKj Pi\WKD\ÿәi theo tӯng mùa vө6DXNKLPXDÿLӋn cӫa các nhà máy phát ÿLӋn, EVN sӁ truyӅn tҧi và cung cҩSÿLӋQÿӃQQJѭӡi tiêu dùng theo biӇXJLiTX\ÿӏnh. 1JjQKÿLӋn là ngành chӏu ҧQKKѭӣng ít nhҩt tӯ nhӳng biӃQÿӝng thӏ WUѭӡng tài chính trong thӡi gian qua so vӟi các ngành kinh tӃ khác, do khҧ QăQJFXQJFҩSÿLӋn hiӋn nay vүQFKѭD ÿiS 2 ӭQJÿҫy ÿӫ nhu cҫu vӅ ÿLӋn cӫDQJѭӡi tiêu dùng. Tuy nhiên, có mӝt sӕ công ty chӏu ҧnh Kѭӣng lӟn vӅ biӃQÿӝng tӹ giá do vay vӕn tӯ các tә chӭc tín dөQJÿӇ xây dӵng nhà máy và các công ty nhiӋWÿLӋn chҥy dҫu chӏu rӫi ro do sӵ biӃQÿӝng vӅ giá dҫu. VӅ Fѫ Fҩu nguӗQ ÿLӋn, sҧQ OѭӧQJ ÿLӋQ ÿѭӧc sҧn xuҩt chӫ yӃu tӯ các nhà máy thӫ\ ÿLӋn và nhiӋW ÿLӋn than, dҫu, tuabin khí dҫu và các nguӗQ SKiW ÿLӋQ ÿӝc lұp ,33 7URQJFѫFҩu nguӗQÿLӋQWtQKÿӃn cuӕLQăPWKӫ\ÿLӋn chiӃm 37% và nhiӋWÿLӋn chiӃm 56% và nhiӋt ÿLӋn vүn chiӃm tӹ trӑng lӟn nhҩW7ѭѫQJODLWURQJFѫ cҩu nguӗQÿLӋn sӁ vүn tiӃp tөc nâng dҫn tӹ trӑng các nguӗn phi thӫ\ÿLӋn. Theo kӃ hӑDFK ÿӃQ QăP  WKXӹ ÿLӋn chӍ chiӃm 28,5%; nhiӋW ÿLӋn dҫu và khí chiӃm 26,7%; nhiӋWÿLӋn than chiӃm 30,2%; nhұp khҭu 5,8%. 'RÿyÿӅ tài ӭng dөng khai phá dӳ liӋXÿӇ dӵ EiRÿӗ thӏ phө tҧLÿѭӧc thӵc hiӋn nhҵm góp phҫn vào viӋc dӵ báo phө tҧi mӝW FiFK FKtQK [iF ÿӇ chӫ ÿӝng nguӗn FXQJ FNJQJ QKѭ Oj YLӋc quy hoҥFK ÿҫX Wѭ SKiW WULӇn nguӗQ ÿLӋn và vұn hành hӋ thӕQJÿLӋn. Nhu cҫu tiêu thө ÿLӋQQăQJSKө thuӝc vào khҧ QăQJSKiWWULӇn cӫa nӅn kinh tӃ cӫa mӝt quӕc gia, nӃu mà dӵ báo phө tҧi quá thҩp so vӟi nhu cҫu phө tҧi thì sҿ dҭQÿӃn kӃt quҧ có nguӗn dӵ phòng thҩSNK{QJÿiSӭQJÿѭӧc các nhu cҫu sҧn xuҩt, sinh hoҥt, nӃu dӵ báo phө tҧi quá cao thì gây nên mӝt nguӗQQăQJOѭӧng lãng SKtFKRQѭӟc nhà. II. 0өFWLrXQJKLrQFӭX Mөc tiêu tәng quát: Tìm ra các giҧLSKiSÿӇ dӵ EiRÿӗ thӏ phө tҧi mӝt cách chính xác. Mөc tiêu cө thӇ:  Tìm hiӇu vӅ nhu cҫu dӵ EiRÿӗ thӏ phө tҧi  Tìm hiӇu vӅ khái niӋm khai phá dӳ liӋu (Data Mining) + ĈӏQKQJKƭDNKDLSKiGӳ liӋu là gì + Quá trình khai phá dӳ liӋu + Các bài toán vӅ khai phá dӳ liӋu + Các ӭng dөng cӫa khai phá dӳ liӋu 3  Giӟi thiӋu các giҧi thuұWÿLӇn hình trong khai phá dӳ liӋu  Ӭng dөng mӝt sӕ giҧi thuұt cӫa khai phá dӳ liӋu ÿӇ dӵ báo biӇXÿӗ phө tҧi III. ĈӕLWѭӧQJYjSKҥPYLQJKLrQFӭX ĈӕL Wѭӧng nghiên cӭu: Nghiên cӭu vӅ kӻ thuұt phân cөm K-means, thuұt toán Multi- Layer Perceptron (MLP) và kӻ thuұt Propagation (lan truyӅQQJѭӧc). Phҥm vi nghiên cӭu: Nghiên cӭu vӅ thuұt toán MLP và kӻ thuұW3URSDJDWLRQÿӇ dӵ báo phө tҧLÿӍnh cho phө tҧi trҥP³$Q%LrQ´ Nghiên cӭu vӅ kӻ thuұt phân cөm K-PHDQV ÿӇ thành lұS ÿӗ thӏ phө tҧL WѭѫQJ ÿӕi ÿLӇn hình. IV. 3KѭѫQJSKiSQJKLrQFӭX  Thu thұp dӳ liӋu vӅ ÿӗ thӏ phө tҧi 24h cӫa trҥm An Biên ± Kiên Giang trong 4 WKiQJ 7KiQJ QăP  Thu thұp dӳ liӋu vӅ thӡi tiӃt cӫa Kiên Giang trong 4 tháng (Tháng 7, 8, 9, 10) QăP  Áp dөng thuұt toán Multi- Layer Perceptron (MLP) và kӻ thuұt Propagation (Lan truyӅQQJѭӧF ÿӇ dӵ báo phө tҧLÿӍnh cӫa ngày dӵ báo  Áp dөng kӻ thuұt phân cөm K-PHDQVÿӇ xây dӵQJÿӗ thӏ phө tҧLWѭѫQJÿӕLÿLӇn hình cӫa ngày dӵ báo  Tӯ kӃt quҧ cӫa phө tҧLÿӍnh dӵ EiRYjÿӗ thӏ phө tҧLWѭѫQJÿӕLÿLӇn hình suy ra ÿӗ thӏ phө tҧi ngày dӵ báo  Sӱ dөng phҫn mӅm Matlab tính toán và hiӇn thӏ ra kӃt quҧ V. éQJKƭDNKRDKӑFYjWKӵFWLӉQ  Giӟi thiӋu và tìm hiӇu các thuұt toán vӅ dӵ báo  Ӭng dөQJÿӇ nҳPÿѭӧc tәng quan vӅ ÿӗ thӏ phө tҧi cӫDFiFQJj\ÿһFWUѭQJÿӗ thӏ phө tҧi cӫa các ngày  Ӭng dөQJÿӇ dӵ EiRÿӗ thӏ phө tҧLFKRF{QJWiFÿLӅXÿӝ và sҧn xuҩt  'QJFKRF{QJWiFÿjRWҥo 4 VI. NӝLGXQJOXұQYăQ Mӣ ÿҫu  Lý do chӑQÿӅ tài  Mөc tiêu nghiên cӭu  ĈӕLWѭӧng và phҥm vӏ nghiên cӭu  3KѭѫQJSKiSQJKLrQFӭu  éQJKƭDNKRD hӑc và thӵc tiӉn &KѭѫQJ Bài toán dӵ EiRYjSKѭѫQJSKiSGӵ báo &KѭѫQJ K-means trong viӋc phân cөm dӳ liӋu &KѭѫQJ 3: Multi Layer Perceptron (MLP) và Propagation (lan truyӅQQJѭӧc) trong bài toán dӵ báo phө tҧi &KѭѫQJӬng dөng thuұt toán phân cөm K-PHDQVYj0/3ÿӇ dӵ EiRÿӗ thӏ phө tҧi ngày &KѭѫQJ &KѭѫQJWUuQK0DWODEFyWURQJÿӇ tài KӃt luұn và kiӃn nghӏ 5 &+ѬѪ1* %¬,72È1'Ӵ%È29¬3+ѬѪ1*3+È3'Ӵ%È2 Có th͋ nói r̹QJÿk\OjJLDLÿR̩QORjLQJ˱ͥLÿDQJE˱ͣc vào kͽ nguyên cͯa khoa h͕c dͷ li͏u. N͇u thi͇u v̷ng các công cͭ phân tích b̹ng d͹ báo chúng ta sͅ b͓ tràn ng̵p trong dͷ li͏u mà thi͇u thông tin, không bi͇t nhͷQJJuÿm[̫y ra ho̿c nhͷng gì sͅ x̫y ra ti͇p theo. 1.1 Tәng quan vӅ các kӻ thuұt dӵ báo Nhu cҫu hiӇu biӃt các sӵ kiӋn trong quá khӭ cӫa chúng ta dӵa vào nhӳng dӳ kiӋQÿm[ҧ\UDWUѭӟFÿyGүQÿӃn mӝt chӫ ÿӅ WURQJOƭQKYӵc khoa hӑc dӳ liӋXÿyOjNӻ thuұt dӵ báo. Nó FKRSKpSFK~QJWDÿѭDUDFiFTX\ӃWÿӏnh dӵa vào sӕ liӋu thӕng kê WKXÿѭӧc tӯ dӳ liӋu trong quá khӭ ÿӇ giҧi quyӃWFiFEjLWRiQWѭѫQJWӵ xҧy ra QKѭGӵ báo khách hàng rӡi bӓ dӏch vө, dӵ báo gian lұn, thӕng kê quá trình kinh doanh. ĈӇ làm sáng tӓ ÿLӅXQj\WUѭӟc tiên chúng ta cҫn làm rõ các khái niӋm: mô hình dӵ báo, tҫm quan trӑng cӫa dӳ liӋu trong dӵ báo, các ӭng dөng cӫa kӻ thuұt dӵ báo. 1.1.1 Khái niӋm mô hình dӵ báo Mô hình dӵ báo có thӇ hiӇu là mӝt hàm toán hӑc có thӇ ánh xҥ giӳa mӝt tұp cӫa các biӃn dӳ liӋXÿҫXYjRWKѭӡQJÿѭӧFÿyQJJyLWURQJPӝt bҧn ghi vào mӝt biӃn ÿiS ӭng hay biӃQÿtFKWӟi mӝt biӃn dӵ EiRQjRÿy7URQJWKӵc tӃ, mӝt mô hình dӵ báo cҫn phҧi có rҩt nhiӅu các biӃQÿӝc lұSÿѭӧc chӑn lӵa tӯ bӝ dӳ liӋu, bên cҥQKÿy là các qui trình, chính sách ÿһFWUѭQJFKRWӯng ngành khoa hӑc chung phҧLÿѭӧc kӃt hӧp sӱ dөng trong mô hình dӵ báo. Mô hình dӵ báo có thӇ ÿѭӧc chia làm hai loҥi WKHRTXDQÿLӇm cӫa các nhà khai phá dӳ liӋu, thӭ nhҩt là hӑc có giám sát, còn lҥi ÿѭӧc gӑi là hӑc không có giám sát. Khi chúng ta nói quá trình hӑc này là có giám sátQJKƭDOjWURQJTXiWUuQK huҩn luyӋn, dӳ liӋX ÿѭӧc trình bày theo mӝt mô hình dӵ báo vӟi các dӳ liӋX ÿҫu YjRÿҫu ra hay kӃt quҧ mong muӕn. ViӋc huҩn luyӋQÿѭӧc lһp lҥLFKRÿӃn khi mô hình hӑFÿѭӧc hàm ánh xҥ giӳDFiFÿҫXYjRÿmFKRYj ÿҫu ra mong muӕn. Các ví dө vӅ các mô hình dӵ EiR ÿDQJ Vӱ dөng viӋc hӑc tұp có giám sát bao gӗm các mҥng thҫn kinh lan truyӅn - QJѭӧc (ANN back propagation: Artificial Neural Network back propagation), các Space Vector Machine và các cây quyӃWÿӏnh (Decision Trees). 6 Mӝt mô hình dӵ EiR FNJQJ Fy WKӇ sӱ dөng viӋc hӑc không giám sát. Trong WUѭӡng hӧp này, nó chӍ ÿѭӧc trình bày vӟi dӳ liӋXÿҫXYjR6DXÿyQKLӋm vө cӫa nó là tìm ra các bҧn ghi dӳ liӋX ÿҫu vào khác nhau liên quan vӟL QKDX QKѭ WKӃ nào. Phân cөm (Clustering) là kiӇu mô hình dӵ EiRÿѭӧc sӱ dөng phә biӃn nhҩt, có sӱ dөng cách hӑc tұp không giám sát. 1.1.2 Tҫm quan trӑng cӫa dӳ liӋu Trong các bài toán dӵ báo, vai trò cӫa dӳ liӋu là rҩt quan trӑng, bӣi vì không có dӳ liӋXWKuNK{QJFySKkQWtFKYjFNJQJFKҷng có phân tích dӵ báo. Trong khoa hӑc khai phá dӳ liӋu, nhiӅu doanh nghiӋp rҩt có chú ý tӟi viӋc tìm kiӃm mӝt giҧi pháp phân tích dӵ báo cho công ty cӫa hӑ. Mһc dù hӑ biӃt rҵng phân tích dӵ báo có thӇ giúp cҧi thiӋn kӃt quҧ kinh doanh cӫa hӑQKѭQJKӑ lҥLNK{QJFyÿӫ dӳ liӋu cho mӝt nhà khoa hӑc dӳ liӋXÿӇ thӵc sӵ huҩn luyӋn mӝWP{KuQKFyêQJKƭD7URQJNӹ nguyên cӫa dӳ liӋu lӟQ %LJ'DWD ÿLӅXÿyWKӵc sӵ hay xҧ\UDÿӃn mӭc có thӇ làm cho bҥn ngҥFQKLrQĈӕi vӟi mӝt sӕ mô hình dӵ EiRÿӇ có thӇ hӑc và tәng quát hóa, phҧi cҫn ÿӃn hàng ngàn bҧn ghi và nhiӅXKѫQWKӃ. Theo công bӕ cӫa nhóm nghiên cӭu dӳ liӋu cӫa IBM, nhóm cӫa các nhà nghiên cӭXQj\ÿm ÿѭӧc giao nhiӋm vө xây dӵng mӝt mô hình ÿӇ dӵ báo xem mӝt quy trình sҧn xuҩWQjRÿyVӁ dүQÿӃn thành công hay thҩt bҥi. Quá trình sҧn xuҩt này mҩt khoҧng 8 giӡ ÿӇ hoàn thành và tiêu thө nhiӅu tài nguyên. ChӍ VDXNKLÿmKRjQ thành, các kӻ Vѭÿҧm bҧo chҩWOѭӧng cӫa công ty mӟi có thӇ [iFÿӏQK[HPFyÿLӅu gì không әn diӉn ra trong quá trình sҧn xuҩt không. NӃu có, toàn bӝ lô sҧn phҭm này phҧi bӏ loҥi bӓ và mӝt lô mӟLÿѭӧc bҳWÿҫu lҥi tӯ ÿҫXéWѭӣng ӣ ÿk\OjFK~QJWD có thӇ xem xét dӳ liӋX WKX ÿѭӧc trong quá khӭ cho tҩt cҧ FiF JLDL ÿRҥn cӫa quy trình Qj\ ÿӕi vӟL FiF O{ ÿm NӃt cөc là tӕt hoһc xҩX 6DX ÿy FK~QJ WD Fy WKӇ huҩn luyӋn mӝt mô hình ÿӇ phát hiӋn ngay khi mӑi thӭ bҳWÿҫu có vҿ xҩXÿLWӯ EDQÿҫu trong quy trình này. Mӝt sӵ thұt là, thӵc tӃ, trong khoҧng thӡLJLDQÿyKӑ FKѭD[k\ dӵng bҩt cӭ mô hình nào. Trong quá trình phân tích dӳ liӋu, hӑ ÿmSKiWKLӋn ra rҵng dӳ liӋXÿmEӏ hӓng hoһc tӋ KѫQEӏ bӓ sót trong mӝt sӕ JLDLÿRҥn sҧn xuҩt then chӕt. Quan trӑQJKѫQKӑ không thӇ tìm ra kӃt quҧ ÿҫu ra hay là các thông tin sӁ cho phép chúng tôi phân biӋt các lô tӕt vӟi các lô xҩX ĈLӅX ÿy Fy QJKƭD Oj QKyP FiF QKj 7 nghiên cӭu này sӁ không thӇ sӱ dөng mӝt kӻ thuұt hӑc có giám sát. ViӋc thiӃu các phҫn quan trӑng cӫa dӳ liӋXÿҫXYjRÿmOjKLӇm hӑDÿӕi vӟi viӋc sӱ dөng mӝt kӻ thuұt hӑc không giám sát. Tóm lҥi, dӳ liӋu có thӇ tӵ nó trӣ thành giá trӏ dӵ báo nӃu QKѭQyOjPӝt dӳ liӋu tӕt. 1.1.3 Các ӭng dөng vӅ phân tích dӵ báo Khi nghiên cӭu vӅ phân tích dӵ báo, các tác giҧ cӫa mӝt cuӕn sách (Duda, +DUW Yj 6WRUN  Fy QKDQ ÿӅ ³phân lo̩i m̳u´ ÿm [k\ Gӵng mӝt hӋ thӕng phân loҥi mүu cho mӝt nhà máy chӃ biӃn cá. Trong nhà máy này, hӑ sӱ dөng mӝt giҧi pháp dӵ báo ÿӇ phân loҥLFiÿѭDYjRWKjQKFiKӗLKD\OjFiYѭӧc biӇn phө thuӝFYjRFiFÿһc WtQKÿҫXYjRQKѭFKLӅu dài và mұWÿӝ cӫa vҧy cá. Trong nghiên cӭu vӅ sӵ trung thành cӫa khách hàng ngân hàng, hoһc khách hàng là các khách hàng sӱ dөng dӏch vө ÿLӋn thoҥi, nhóm tác giҧ ÿmVӱ dөng chính sӵ bӓ ÿLFӫa khách hàng làm biӃn dӵ báo. Mӝt ӭng dөng vӅ phân tích dӵ báo vӕQ ÿm Uҩt thành công trong nhiӅX QăP nay là phát hiӋn gian lұn. Mӛi khi bҥn quҽt thҿ tín dөng cӫa mình hoһc sӱ dөng nó trên mҥng, rҩt có thӇ là giao dӏch cӫa bҥQÿDQJÿѭӧc phân tích trong thӡi gian thӵc ÿӇ biӃt khҧ QăQJJLDQOұn ra sao. Tùy thuӝFYjRQJX\FѫÿmQKұn biӃWÿѭӧc, hҫu hӃt các tә chӭc thӵc hiӋn mӝt tұp hӧp các quy tҳc nghiӋp vө thұm chí có thӇ tӯ chӕi mӝt giao dӏFKFyQJX\FѫFDRĈk\OjÿtFKFXӕi cùng cӫa phân tích dӵ báo trong cuӝc chiӃn chӕng tӝi phҥPÿyOjQJăQNK{QJFKRQy[ҧy ra ngay tӯ ÿҫu. Có rҩt nhiӅu ӭng dөng quan trӑng cӫa phân tích dӵ EiRWURQJOƭQKYӵc y tӃ, quân sӵ, tài chính, ngân hàng và nhiӅXFiFOƭQKYӵc khác. Gian lұn vӅ y tӃ và ngân hàng hҫXQKѭFKҳc chҳQÿӭQJÿҫu danh sách các gian lұn, tuy nhiên, viӋc sӱ dөng phân tích dӵ EiR ÿӇ thӵc hiӋQ FKăP VyF SKzQJ QJӯa có hiӋu quҧ FNJQJ FKѭD ÿѭӧc thӵc sӵ TXDQWkPYjÿѭDYjR ӭng dөng bӣi các nhà lãnh ÿҥo cҩp cao trong tӯQJOƭQK vӵc liên quan. Nhӡ biӃWÿѭӧc bӋQKQKkQQjRFyQJX\FѫSKiWWULӇn cao vӅ mӝWFăQ bӋQKQjRÿyFK~QJWDFyWKӇ áp dөng các biӋn pháp phòng ngӯDÿӇ giҧm thiӇu nguy FѫYjFXӕLFQJOjÿӇ cӭu sӕQJQJѭӡi bӋnh. GҫQÿk\SKkQWtFKGӵ EiRÿmOjWUXQJ tâm chú ý cӫa mӝt cuӝc tranh luұQF{QJNKDLWURQJÿyGӳ liӋu lӏch sӱ ÿѭӧc sӱ dөng ÿӇ làm giҧm sӕ Oѭӧng bӋnh nhân nhұp viӋn lҥi.
- Xem thêm -

Tài liệu liên quan