Đăng ký Đăng nhập
Trang chủ Xây dựng phần mềm ứng dụng vào dự báo nhu cầu sử dụng điện trên địa bàn thị xã t...

Tài liệu Xây dựng phần mềm ứng dụng vào dự báo nhu cầu sử dụng điện trên địa bàn thị xã thủ dầu một

.DOCX
77
1
103

Mô tả:

i MỤC LỤC MỤC LỤC..................................................................................................................................i DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT..............................................................iii DANH MỤC CÁC BẢNG........................................................................................................v DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ.............................................................................vi MỞ ĐẦU...................................................................................................................................1 Chương 1: TỔNG QUAN.........................................................................................................5 1.1. TỔNG QUAN VỀ NĂNG LƯỢNG ĐIỆN......................................................................5 1.1.1. Khái niệm về điện năng..........................................................................................5 1.1.2. Thực trạng thị trường điện lực Việt Nam...............................................................5 1.1.3. Phương hướng xây dựng mô hình thị trường điện lực tại Việt Nam......................6 1.1.4. Tình hình sản xuất kinh doanh trên địa bàn tỉnh Bình Dương...............................7 1.2. KHẢO SÁT CÁC CÔNG TRÌNH, BÀI BÁO ĐÃ ĐĂNG TẢI LIÊN QUAN ĐẾN ĐỀ TÀI.............................................................................................................................7 1.2.1.Các thuật toán di truyền và tiến hóa dùng dự báo chuỗi thời gian..........................8 1.2.2. Sử dụng thuật giải di truyền đa cấp dự báo chuỗi thời gian.................................11 1.2.3. Giải thuật lai cho bài toán sắp hàng đa trình tự sinh học......................................15 1.3. CÁC MÔ HÌNH THƯỜNG ÁP DỤNG TRONG DỰ BÁO, ĐÁNH GIÁ....................17 1.3.1. Khái niệm về dự báo, đánh giá.............................................................................17 1.3.2. Các mô hình dự báo..............................................................................................17 1.3.3. Mô hình dự báo dựa trên chuỗi thời gian.............................................................18 1.4. KẾT LUẬN CHƯƠNG..................................................................................................19 Chương 2: CƠ SỞ LÝ THUYẾT............................................................................................20 2.1. GIẢI THUẬT LUYỆN KIM (SA:SIMULATED ANNEALING)................................20 2.1.1. Giới thiệu chung về giải thuật luyện kim.............................................................20 2.1.2. Hàm nhiệt độ và quá trình hoạt động...................................................................24 2.1.3. Hàm chi phí và hàm mục tiêu...............................................................................27 2.1.4. Cấu trúc của lời giải lân cận.................................................................................27 2.1.5. Các bước của bài toán SA và điều kiện dừng.......................................................28 2.1.6. Ưu điểm và khuyết điểm......................................................................................29 2.2. GIẢI THUẬT DI TRUYỀN (GA: GENETIC ALGORITHMS)...................................29 2.2.1. Giới thiệu chung về giải thuật di truyền...............................................................29 2.2.2. Thực hiện giải thuật di truyền...............................................................................33 2.2.3. Chương trình tổng quát.........................................................................................38 2.3. CHUỖI THỜI GIAN VÀ MÔ HÌNH TỰ HỒI QUY....................................................40 2.3.1. Thế nào là chuỗi thời gian....................................................................................40 2.3.2. Dự báo chuỗi thời gian.........................................................................................41 2.3.3. Mô hình tự hồi quy...............................................................................................42 2.3.4. Mô hình trung bình trượt......................................................................................43 2.3.5. Quá trình tự hồi quy trung bình trượt cấp p,q: ARMA(p,q).................................43 2.4. KẾT LUẬN CHƯƠNG..................................................................................................44 Chương 3: XÂY DỰNG VÀ THỰC NGHIỆM MÔ HÌNH DỰ BÁO...................................45 3.1. PHÂN TÍCH CHỈ TIÊU ĐÁNH GIÁ HIỆU QUẢ CỦA MÔ HÌNH............................45 3.2. CẤU TRÚC BẢNG DỮ LIỆU.......................................................................................46 3.3. MÔ HÌNH ARMA..........................................................................................................46 3.3.1. Mục đích của việc kết hợp hai mô hình................................................................46 3.3.2. Mô tả giải thuật.....................................................................................................47 3.4. KẾT LUẬN CHƯƠNG..................................................................................................50 Chương 4: KẾT QUẢ THỰC NGHIỆM.................................................................................51 4.1. THỬ NGHIỆM MÔ HÌNH ARMA TRÊN CÁC CHUỖI DỮ LIỆU MẪU LẤY TỪ TIME SERIES DATA LIBRARY................................................................................51 4.1.1. Các chỉ tiêu đạt được trên mô hình ARMA.........................................................51 4.1.2. Thực nghiệm mô hình ARMA trên chuỗi dữ liệu mẫu lấy từ TS Library............52 4.1.3. Nhận định kết quả.................................................................................................57 4.2. THỰC NGHIỆM MÔ HÌNH ARMA CHO CÁC CHUỖI DỮ LIỆU TRONG LĨNH VỰC NGÀNH ĐIỆN..........................................................................................58 4.2.1. Dự báo nhu cầu sử dụng điện theo từng khu vực huyện, thị trong tỉnh:..............58 4.2.2. Dự báo nhu cầu sử dụng điện theo từng nhóm ngành nghề trong tỉnh:................59 KẾT LUẬN.............................................................................................................................63 KIẾN NGHỊ CÁC HƯỚNG NGHIÊN CỨU TIẾP THEO.....................................................63 DANH MỤC TÀI LIỆU THAM KHẢO................................................................................64 PHỤ LỤC................................................................................................................................ 66 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Viết tắt Tiếng Anh Tiếng Việt ARMA AutoRegressive Moving Average Trung bình trượt tự hồi quy ARIMA AutoRegressive ES Moving Average Exponential Smoothing San bằng số mũ GA Genetic Algorithm Giải thuật di truyền SA Simulated Annealing Giải thuật luyện kim NN Neural Network Mạng nơ-ron FL Fuzzy Logic Logic mờ EVN The Electricity of Vietnam Tổng Công ty Điện lực Việt Nam TS Time series Chuỗi thời gian GEAs Genetic SSE Algorithms Sum Squared Error Sai số tổng bình phương RMSE Root Mean Squared Error Sai số căn của trung bình bình phương NMSE Normalized Mean Square Error .Sai số trung bình bình phương chuẩn TSF Time series forecasting Dự báo chuỗi thời gian RVR Real-Valued Representation Biểu diễn giá trị thực BIC Bayesian Information Criterion STW Sliding Time Window Cửa sổ thời gian trượt STWs Sliding Time Window Các cửa sổ thời gian trượt and Intergrated Trung bình trượt tích hợp tự hồi qui Evolutionary Thuật toán di truyền và tiến hóa Meta-GAs Meta-Genetic Algorithm Thuật giải di truyền đa cấp SA-GA Simulated Annealing - Genetic Thuật giải luyện kim kết hợp thuật Algorithm giải di truyền AutoRegressive Tự hồi quy AR MA Moving Average ARCH AutoRegressive Trung bình trượt Conditional Phương sai sai số thay đổi có điều Heteroskedasticity GARCH Generalized - kiện tự hồi quy AutoRegressive Conditional Heteroskedasticity Phương sai sai số thay đổi có điều kiện tự hồi quy mở rộng TBA Trạm biến áp CN-XD Công nghiệp - Xây dựng NL-TS Nông lâm - Thuỷ sản KS-NH Khách sạn - Nhà hàng CQ-QL Cơ quan - Quản lý Điện TP ĐT (Tr.đ) Điện Thương phẩm Đầu tư (Triệu đồng) DANH MỤC CÁC BẢNG Bảng 1.1: Time Series Data Library...........................................................................9 Bảng 1.2: So sánh giữa các phương pháp TSF khác nhau........................................11 Bảng 1.3: Đặt giá trị tham số thuật toán Meta-GAs.................................................14 Bảng 1.4: Mô hình ARMA tối ưu thu được bởi thuật toán Meta-GAs...................14 Bảng 1.5: So sánh phương pháp Meta-GAs với các phương pháp truyền thống.....14 Bảng 2.1: So sánh tương quan giữa luyện kim vật lý và giải thuật luyện kim..........21 Bảng 2.2: So sánh giải thuật di truyền với các phương pháp truyền thống...............32 Bảng 2.3. Chọn lọc dùng bánh xe............................................................................34 Bảng 2.4. Sự tương ứng các số ngẫu nhiên và chuỗi nhiễm sắc thể.........................35 Bảng 4.1: So sánh phương pháp SA-GA với các phương pháp truyền thống..........51 DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ Hình 1.1: Ví dụ về giải mã thuật toán Meta-GAs.....................................................12 Hình 1.2: The Meta-Ecolutionary Approach............................................................13 Hình 1.3: Biểu đồ mô tả mức độ ổn định của nghiệm được chọn............................16 Hình 2.1: Sơ đồ không gian lời giải.........................................................................21 Hình 2.2: Lưu đồ biểu diễn giải thuật luyện kim.....................................................24 Hình 2.3: Biểu diễn quá trình hoạt động của hàm nhiệt độ......................................25 Hình 2.4: Biểu diễn quan hệ giữa hàm chi phí và hàm mục tiêu..............................27 Hình 2.5: Sơ đồ tổng quát của giải thuật di truyền...................................................31 Hình 2.6: Bánh xe Roulette......................................................................................35 Hình 2.7: Lai ghép...................................................................................................36 Hình 2.8: Lai ghép biểu diễn theo cây......................................................................37 Hình 2.9: Giải thuật di truyền...................................................................................40 Hình 2.10: Phân tích chuỗi số liệu trong dự báo......................................................42 Hình 2.11: Phương pháp luận dự báo chuỗi thời gian..............................................42 Hình 3.1: Cấu trúc lời giải của phương pháp SA-GA..............................................46 Hình 3.2: Giải thuật SA-GA cho mô hình ARMA..................................................48 Hình 4.1. Giao diện chính........................................................................................52 Hình 4.2: Đồ thị biểu diễn chuỗi Passengers............................................................53 Hình 4.3: Đồ thị biểu diễn chuỗi Paper....................................................................54 Hình 4.4: Đồ thị biểu diễn chuỗi Deaths..................................................................54 Hình 4.5: Đồ thị biểu diễn chuỗi Maxtemp..............................................................55 Hình 4.6: Đồ thị biểu diễn chuỗi Chemical..............................................................55 Hình 4.7: Đồ thị biểu diễn chuỗi Prices...................................................................56 Hình 4.8: Đồ thị biểu diễn chuỗi Sunspots...............................................................57 Hình 4.9: Đồ thị biểu diễn chuỗi Kobe.....................................................................57 Hình 4.10: Đồ thị biểu diễn chuỗi TDM.................................................................59 Hình 4.11: Đồ thị biểu diễn chuỗi NLT...................................................................59 Hình 4.12: Đồ thị biểu diễn chuỗi CN-XD...............................................................60 Hình 4.13: Đồ thị biểu diễn chuỗi KD-DV..............................................................61 Hình 4.14: Đồ thị biểu diễn chuỗi AS......................................................................61 Hình 4.15: Đồ thị biểu diễn chuỗi KHAC................................................................62 1 MỞ ĐẦU 1. Đặt vấn đề Những năm gần đây tình hình phát triển kinh tế xã hội gia tăng, nhu cầu sử dụng nguồn năng lượng điện cũng tăng nhất là trong sản xuất và đời sống. Việc thiếu điện sinh hoạt và sản xuất do nhiều nguyên nhân như sử dụng không tiết kiệm, thiếu nguồn nước để vận hành nhà máy điện, không có kế hoạch cho việc cân đối giữa cung và cầu… Do đó, dự báo nhu cầu tiêu thụ điện là bài toán hết sức cần thiết trong quá trình vận hành, quy hoạch, phát triển, điều khiển tối ưu chế độ mạng điện … Hầu hết các bài toán dự báo phụ tải đều dựa trên cơ sở các mô hình toán học hoặc các mô hình thực nghiệm nhằm tìm ra các quy luật biến đổi của phụ tải điện trong chu kỳ xét, đưa ra những kế hoạch sản xuất và tiêu thụ điện hợp lý tránh tình trạng thiếu điện trong sản xuất và đời sống như hiện nay. Dự báo là một khoa học và nghệ thuật tiên đoán những sự việc sẽ xảy ra trong tương lai, trên cơ sở phân tích khoa học về các dữ liệu đã thu thập được và có thể nói rằng không có những dự báo khoa học thì những dự định tương lai mà con người vạch ra sẽ không có sự thuyết phục đáng kể. Khi tiến hành dự báo căn cứ vào việc thu thập xử lý số liệu trong quá khứ và hiện tại để xác định xu hướng vận động của các hiện tượng trong tương lai nhờ vào một số mô hình toán học. Các phần mềm máy tính giúp xây dựng các mô hình mô tả các dữ liệu theo một quy luật nhất định dựa trên việc xử lý các dữ liệu đầu vào. Nhờ vào các công nghệ của khoa học máy tính mà các nhà nghiên cứu có thể phát triển các mô hình phức tạp áp dụng vào thực tế phục vụ cho việc hỗ trợ ra quyết định trong việc quản lý, định hướng phát triển và sử dụng năng lượng điện. Đề tài “Xây dựng phần mềm ứng dụng vào dự báo nhu cầu sử dụng điện trên địa bàn Thị xã Thủ Dầu Một ” sẽ góp phần nhỏ tham khảo cho việc định hướng phát triển ngành điện những năm tới. 2. Mục tiêu của đề tài - Khảo sát xây dựng cơ sở dữ liệu về tình hình sử dụng năng lượng điện, thống kê, xử lý dữ liệu số kw điện hàng tháng trong những năm trước để làm dữ liệu đầu vào cung cấp thông tin hỗ trợ ra quyết định trong việc quản lý, định hướng phát triển và sử dụng năng lượng điện - Nghiên cứu, phân tích chuỗi dữ liệu thời gian để xác định bản chất của chuỗi dữ liệu, dự báo các giá trị tương lai dựa trên các cơ chế phát sinh chuỗi - Xây dựng phần mềm trên cơ sở kết hợp giải thuật luyện kim SA (Simulated Annealing) và giải thuật di truyền GA (Genetic Algorithms) để dự báo chuỗi dữ liệu thời gian - Thực nghiệm các số liệu thực tế đầu vào thống kê được trên phần mềm để đưa ra kết quả dự báo nhu cầu sử dụng điện - Phục vụ công tác giảng dạy và nghiên cứu khoa học trong khoa Công nghệ Thông tin 3. Tình hình nghiên cứu có liên quan đến lĩnh vực nghiên cứu của đề tài 3.1 Các thuật toán di truyền và tiến hóa dùng dự báo chuỗi thời gian (Genetic and Evolutionary Algorithms Time Series Forecasting) của Paulo Cortez, Miguel Rocha, and Jose1 Neves [12] 3.2 Sử dụng thuật giải di truyền đa cấp dự báo chuỗi thời gian (A Meta-Genetic Algorithms for Time Series Forecasting) của P.Cortez, M. Rocha, J.Neves [11] 3.3 Giải thuật lai cho bài toán sắp hàng đa trình tự sinh học [8] Trong nước, có một số nghiên cứu liên quan đến lĩnh vực về dự báo nhưng theo những hướng khác nhau, chưa có nghiên cứu nào theo hướng đã trình bày của đề tài về dự báo tình hình sử dụng điện tại Thị xã Thủ Dầu Một 4. Cách tiếp cận - Phân tích chuỗi dữ liệu thời gian nhằm hai mục đích: + Xác định bản chất của chuỗi dữ liệu + Dự báo các giá trị tương lai dựa trên các cơ chế phát sinh chuỗi - Thu thập số liệu về kw điện sử dụng trên địa bàn Thị xã Dầu Một 5. Phương pháp nghiên cứu: 5.1. Phương pháp nghiên cứu lý thuyết: - Nghiên cứu giải thuật di truyền SA (Simulated Annealing) - Nghiên cứu giải thuật luyện kim GA (Genetic Algorithms) - Nghiên cứu mô hình ARMA (AutoRegressive Moving Average model) phân tích và dự báo chuỗi dữ liệu thời gian. 5.2. Phương pháp thu thập dữ liệu: - Thu thập số liệu về kw điện sử dụng trên địa bàn Thị xã - Phân loại các đơn vị sử dụng điện theo thuộc tính ngành nghề 5.3. Phương pháp thực nghiệm: - Thực nghiệm số liệu thống kê được trên phần mềm để có kết quả dự báo tình hình sử dụng điện 6. Đối tượng và phạm vi nghiên cứu 6.1. Đối tượng nghiên cứu: Nghiên cứu các thuật toán tối ưu ứng dụng xây dựng phần mềm dự báo 6.2. Phạm vi nghiên cứu: Đề tài xây dựng phần mềm dựa trên nghiên cứu các giải thuật tối ưu và kết hợp các giải thuật ứng dụng vào mô hình ARMA để dự báo mức tiêu thụ điện, từ kết quả dự báo tiến hành đánh giá tình hình sử dụng điện trên địa bàn tỉnh Bình Dương. Do các ảnh hưởng phụ đến tình hình sử dụng điện như tình hình kinh tế, chính trị, xã hội trong nước, tình hình phát triển mới các khu công nghiệp, trường học, tăng dân số cơ học… rất khó xác định cả về định tính lẫn định lượng và không dễ thu thập dữ liệu một cách đầy đủ trong thời gian ngắn, nên đề tài chỉ tập trung trong phạm vi nghiên cứu chuỗi thời gian dự báo chỉ số sử dụng năng lượng điện trên cơ sở chuỗi dữ liệu của những năm trước dự báo năm tiếp theo. 7. Nội dung nghiên cứu - Nghiên cứu các công trình có liên quan - Nghiên cứu các giải thuật di truyền và giải thuật luyện kim, mô hình ARMA - Thu thập dữ liệu, phân loại sử dụng điện theo thuộc tính ngành nghề. - Xây dựng phần mềm, cài đặt thử nghiệm và đưa ra kết quả dự báo nhu cầu sử dụng điện trên địa bàn Thị xã Thủ Dầu Một MỞ ĐẦU Chương 1: TỔNG QUAN Chương 2: CƠ SỞ LÝ THUYẾT Chương 3: XÂY DỰNG PHẦN MỀM DỰ BÁO Chương 4: KẾT QUẢ THỰC NGHIỆM KẾT LUẬN KIẾN NGHỊ CÁC HƯỚNG NGHIÊN CỨU TIẾP THEO TÀI LIỆU THAM KHẢO PHỤ LỤC Chương 1 TỔNG QUAN Chương một giới thiệu sơ lược về nguồn năng lượng điện, thực trạng nguồn cung cấp điện ở Việt Nam nói chung và Bình Dương nói riêng, phương hướng phát triển ngành điện trong nước. Đồng thời khảo sát, phân tích một số công trình nghiên cứu có liên quan để làm nền tảng nghiên cứu của đề tài. 1.1. TỔNG QUAN VỀ NĂNG LƯỢNG ĐIỆN 1.1.1. Khái niệm về điện năng [20] Điện là một dạng năng lượng, là dòng chuyển dời có hướng của các electron. Tất cả vật chất đều được cấu tạo bởi các nguyên tử, trong nguyên tử khi sự cân bằng lực giữa proton và electron bị phá vỡ bởi tác dụng của ngoại lực, các electron thoát ra khỏi nguyên tử, sự chuyển dịch tự do của các electron cấu tạo nên dòng điện. Điện năng là dạng năng lượng thứ cấp, điện được tạo ra bằng cách chuyển hóa từ các nguồn năng lượng sơ cấp như dầu mỏ, nguồn nước, năng lượng nguyên tử và từ các nguồn năng lượng sơ cấp khác. Vào những năm giữa thế kỉ XIX, Thomas Edison đã làm thay đổi cuộc sống mọi người bằng phát minh ra bóng đèn điện. Phát minh của Edison đã sử dụng điện năng để mang ánh sáng vào từng gia đình. Điện năng là một loại hàng hoá đặc biệt. Quá trình kinh doanh điện năng bao gồm 3 khâu liên hoàn: Sản xuất - Truyền tải - Phân phối điện năng xảy ra đồng thời, không qua một khâu thương mại trung gian nào. Điện năng được sản xuất ra khi đủ khả năng tiêu thụ vì đặc điểm của hệ thống điện là ở bất kỳ thời điểm nào cũng có sự cân bằng giữa công suất phát ra và công suất tiêu thụ (không để tồn đọng). 1.1.2. Thực trạng thị trường điện lực Việt Nam [13] 1.1.2.1. Sản xuất và phân phối điện năng - Về nguồn điện: Hiện tại, tổng công suất lắp đặt khả dụng 8.454 MW tập trung chủ yếu vào các nhà máy thuộc Tập đoàn Điện lực Việt Nam (EVN: The Electricity of VietNam) - Về lưới điện: EVN đã tập trung nhiều vào việc cải tạo nâng cấp hệ thống lưới điện truyền tải. Hiện tại lưới điện truyền tải cao áp toàn quốc bao gồm (1531 km đường dây, 2700 Trạm biến áp (TBA) 500KV; 3839 km đường dây, 8474 TBA 220KV; 7703 km đường dây, 11004 TBA 110KV) do 4 Công ty Truyền tải điện quản lý vận hành. 1.1.2.2. Phương thức tổ chức kinh doanh điện năng Mô hình quản lý sản xuất kinh doanh của EVN vẫn đang thực hiện theo mô hình Nhà nước độc quyền quản lý các khâu của quá trình: Sản xuất- Truyền tải - Phân phối điện năng. Mô hình này dẫn đến nhiều hạn chế về quản lý cũng như hiệu quả đầu tư, không thúc đẩy phát triển sản xuất kinh doanh điện năng. 1.1.3. Phương hướng xây dựng mô hình thị trường điện lực tại Việt Nam[13] 1.1.3.1. Định hướng phát triển hoạt động sản xuất kinh doanh điện năng - Về nguồn điện: Tập trung xây dựng các nhà máy thuỷ điện tại hầu hết những nơi có khả năng xây dựng. - Về lưới điện: Sẽ phát triển nhanh hệ thống truyền tải 220kV, 500 kV nhằm nâng cao độ tin cậy và giảm tổn thất điện năng trên lưới truyền tải; phát triển lưới điện 110kV thành lưới điện cung cấp trực tiếp cho phụ tải. - Về cơ cấu bộ máy tổ chức của EVN: Thực hiện đề án của Chính phủ về việc thí điểm thành lập tập đoàn điện lực, EVN tiếp tục đẩy nhanh quá trình cổ phần hoá các đơn vị trực thuộc trong đó có các nhà máy điện, công ty phân phối điện năng phục vụ cho việc phát triển thị trường điện. 1.1.3.2. Mô hình thị trường điện lực Việt Nam - Đối với EVN: Cần chủ động điều tiết nguồn phát đảm bảo cân bằng hệ thống - Đối với các nhà máy điện: Từng bước thực hiện cổ phần hoá các nhà máy điện, chuyển các nhà máy điện thuộc EVN thành các nhà máy điện độc lập. - Đối với các công ty truyền tải: Với bản chất là độc quyền tự nhiên, do vậy Nhà nước vẫn nắm giữ thực hiện các hoạt động truyền tải điện từ người mua duy nhất (EVN) đến các công ty điện lực. - Đối với các công ty phân phối điện năng: Thực hiện chuyển đổi trở thành đơn vị độc lập với EVN dưới hình thức Công ty mẹ - Công ty con. - Do cần đảm bảo tính phù hợp của một số hoạt động độc quyền trong mô hình như: EVN độc quyền mua điện từ các nhà máy điện độc lập, độc quyền bán điện cho các công ty phân phối điện năng, các công ty phân phối độc quyền bán điện cho khách hàng, do vậy cần thiết phải có một cơ quan đứng ra kiểm soát hoạt động này với tư cách hoàn toàn độc lập. - Đối với khách hàng: Tiếp tục chịu mua điện từ một công ty phân phối điện duy nhất. Tuy nhiên đối với các khách hàng cần phụ tải lớn có thể mua điện trực tiếp từ các nhà máy điện hoặc thông qua lưới truyền tải của EVN. 1.1.4. Tình hình sản xuất kinh doanh trên địa bàn tỉnh Bình Dương (Phụ lục1) 1.2. KHẢO SÁT CÁC CÔNG TRÌNH, BÀI BÁO ĐÃ ĐĂNG TẢI LIÊN QUAN ĐẾN ĐỀ TÀI Trong lĩnh vực dự báo thực trạng nhu cầu sử dụng điện dùng các phương pháp tối ưu để xử lý số liệu thống kê, nhiều mô hình có thể sử dụng trong đó mô hình trung bình trượt tự hồi quy ARMA luôn thể hiện là một trong những phương pháp phân tích hiệu quả nhất và thu hút được nhiều công trình nghiên cứu trong lĩnh vực phân tích và dự báo chuỗi thời gian để đánh giá. Có nhiều nghiên cứu liên quan đến chuỗi thời gian, đáng chú ý là một số phương pháp sau: - Dùng các thuật toán di truyền và tiến hóa để dự báo chuỗi thời gian. - Sử dụng thuật giải di truyền đa cấp dự báo chuỗi thời gian. - Giải thuật lai cho bài toán sắp hàng đa trình tự sinh học. - Dự báo chuỗi dữ liệu kinh tế vĩ mô dùng thuật giải di truyền tuyến tính. - Dự báo chuỗi dữ liệu thời gian bởi thuật giải di truyền kết hợp với các hàm thống kê và các hàm lượng giác. Phân tích một số công trình liên quan đến lĩnh vực đề tài đang nghiên cứu, để có cơ sở khoa học đáng tin cậy cho việc nghiên cứu, đề tài chọn ba công trình có liên quan mật thiết nhất để phân tích và làm cơ sở nghiên cứu như sau: 1.2.1. Các thuật toán di truyền và tiến hóa dùng dự báo chuỗi thời gian (Genetic and Evolutionary Algorithms Time Series Forecasting) của Paulo Cortez, Miguel Rocha, and Jose1 Neves [12] Bài báo phân tích những khái niệm cơ bản về chuỗi thời gian (TS: time series), thuật toán di truyền và tiến hóa (GEAs: Genetic and Evolutionary Algorithms) sau đó mô tả các mô hình khác nhau và đưa ra các kết quả thực nghiệm. Cuối cùng, kết quả được trình bày và so sánh với các phương pháp dự báo chuỗi thời gian truyền thống. Một chuỗi dữ liệu thời gian là tập hợp các quan sát theo thứ tự thời gian và được ghi lại tại một khoảng thời gian cụ thể. Một mô hình chuỗi thời gian xt giả định rằng mô hình quá khứ sẽ tái diễn trong tương lai gần. Trong đó có sự khác biệt giữa giá trị thực tế và giá trị dự báo gọi là sai số dự báo thể hiện bằng công thức: Với et là sai số dự báo (1.1) Hiệu suất tổng thể của mô hình dự báo được đánh giá bởi thước đo chính xác, cụ thể là Sum Squared Error (SSE), Root Mean Squared Error (RMSE) và Normalized Mean Square Error (NMSE), các chỉ tiêu trên được tính toán như sau: (1.2) l là số mẫu dự báo ; là trọng số của chuỗi dữ liệu. Một phương pháp dự báo chuỗi thời gian (TSF: Time series forecasting) khá thành công là phương pháp san bằng số mũ ES, dựa trên một số mẫu cơ bản phân biệt với giá trị ngẫu nhiên bởi trung bình các giá trị trước đó. Những lợi thế của mô hình này như sử dụng đơn giản, giảm tính toán, tính chính xác cao của dự báo, đặc biệt với chuỗi thời gian theo mùa. Mô hình trung bình trượt tích hợp tự hồi quy ARIMA là một phương pháp quan trọng để dự báo chuỗi thời gian. Ưu điểm chính của phương pháp này là dựa vào sự chính xác trên một miền rộng lớn của những chuỗi thời gian, nhưng phức tạp hơn về khả năng sử dụng và hiệu quả tính toán so với ES. Mô hình dựa trên sự kết hợp tuyến tính của giá trị trong quá khứ. Mô hình có thể mặc nhiên công nhận như một mô hình trung bình trượt tự hồi quy ARMA(P, Q), được đưa ra với hình thức: Trong đó P biểu thị bậc của AR và Q biểu thị bậc của MA, Ai và Mj là các hệ số của AR và MA,  một giá trị không đổi. Cả hai liên tục và các hệ số của mô hình được ước tính bằng cách sử dụng phương pháp tiếp cận thống kê. Bài báo này dùng bảng dữ liệu từ Time Series Data Library[16] ở bảng 1.1: Bảng 1.1: Time Series Data Library [16] Series Type Passengers Seasonal & Paper Trended Deaths Seasonal maxtemp Chemical Trended Prices Lynx Nonlinear kobe Domain Tourism Sales Traffic Meteorology Chemical Economy Ecology Geology Description Monthly international airline passengers Monthly sales of French paper Monthly deaths & injuries in UK roads Maximum temperature in Melbourne Chemical concentration readings Daily IBM common stock closing prices Annual number of lynx Seismogragh of the Kobe earthquake Các thí nghiệm được trình bày trong bài báo này, một bộ tám các chuỗi thời gian được lựa chọn (Bảng 1.1) từ Time Series Data Library lấy từ nhiều nguồn khác nhau, có liên quan với các vấn đề thực tế. Tất cả chuỗi thời gian được phân thành bốn loại chính gồm tất cả các chuỗi thời gian: theo mùa và xu hướng (Seasonal and Trended), theo mùa (Seasonal), theo xu hướng (Trended) và phi tuyến (Nonlinear). Các GEAs sử dụng một giải thuật nhị phân, một vấn đề nhất định được mã hóa thành một tập ký tự {0,1}. Tuy nhiên, một số tác giả đã cho rằng còn có những vấn đề mà các tham số được đưa ra bởi giá trị thực, chiến lược tối ưu là sử dụng một biểu diễn giá trị thực (RVR: Real-Valued Representation.) Trong bài báo này, hai cách tiếp cận để dự báo, cả hai đều dựa trên GEAs với RVR. Trong các mô hình dự báo là sự kết hợp tuyến tính của các giá trị trước đó. Hai mô hình được quan tâm trong bài báo này đưa ra là: G1- Tuyến tính kết hợp dựa trên GEAs là: gi là viết tắt gen thứ i của nhiễm sắc thể của các phần tử; n là kích thước phần tử. G2- ARMA dựa trên GEAs là: Một giải pháp thay thế là sử dụng chỉ tiêu Bayesian Information Criterion (BIC). Với N là số mẫu huấn luyện và p là số lượng tham số mô hình, chỉ tiêu này giúp chọn mô hình dự báo tối ưu. Bảng so sánh mô hình tiến hóa và mô hình thông thường đưa ra trong (Bảng1.2). Các giá trị sai số thử nghiệm dựa trên hai tiêu chuẩn là RMSE và NMSE. Bảng 1.2 : So sánh giữa các phương pháp TSF khác nhau [12] Series Passengers Paper Deaths Maxtemp Chemical Prices Lynx Kobe ES 16.7 (0.71%) 41.0 (3.1%) 145 (43%) 0.917 (4.1%) 0.354 (51%) 7.50 (0.39%) 876 (57%) 3199 (105%) ARIMA 17.8 (0.81%) 61.0 (6.8%) 144 (42%) 1.068 (5.6%) 0.361 (53%) 7.72 (0.41%) 504 (19%) 582 (4%) GEA 20.9 (1.12%) 56,3 (5.8%) 134 (37%) 0.915 (4.1%) 0.343 (48%) 7.48 (0.38%) 262 (5%) 524 (3%) Các kết quả của phương pháp tiến hóa rất tốt, với 6 trong 8 dòng dữ liệu chuỗi thời gian được dự báo tốt. Trong điều kiện các loại hình khác nhau của các chuỗi thời gian, phương pháp được đề xuất có kết quả không tốt trong 2 dòng dữ liệu dạng theo mùa và xu hướng (Passengers, Paper), nơi mà ES chiếm ưu thế. Trong tất cả các loại khác kết quả rất tốt, đặc biệt trong các chuỗi phi tuyến tính (Lynx, Kobe). Các kết quả của việc áp dụng các GEAs trong lĩnh vực TSF là đáng khích lệ. Trong tương lai, việc lựa chọn mô hình được tự động hóa cụ thể là quá trình lựa chọn các cửa sổ thời gian trượt (STWs: Sliding Time Window) tối ưu. Việc mở rộng những số liệu tìm kiếm khác nhau của STWs trong không gian tìm kiếm là cách tốt hơn. Vì đây là một nhiệm vụ tối ưu hóa , việc sử dụng GEAs có thể thuận lợi, tạo một kiến trúc hai cấp. Ngoài ra có thể dựa vào các chương trình làm tốt hơn các mô hình dự báo, bằng cách tích hợp các chức năng phi tuyến (ví dụ: logarit hay lượng giác) 1.2.2. Sử dụng thuật giải di truyền đa cấp dự báo chuỗi thời gian (A MetaGenetic Algorithms for Time Series Forecasting) của P. Cortez, M. Rocha, and J. Neves [11] Bài báo này trình bày một phương pháp dự báo chuỗi thời gian bằng mô hình tự hồi quy trung bình trượt ARMA sử dụng thuật giải di truyền ở 2 cấp bậc, ở cấp thuật giải GA nhị phân sẽ tìm kiếm mô hình ARMA dự báo tối ưu và GA thập phân sẽ giúp tìm ra bộ giá trị tham số tương ứng. Bài báo này được phát triển từ bài báo (mục 1.2.1). Do đó hàm đánh giá mô hình cũng tương tự bài báo trên. Đối với các thí nghiệm được trình bày trong bài báo này, cũng gồm một bộ tám các chuỗi thời gian nhưng chuỗi dữ liệu Lynx được thay bằng Sunspots. Việc sử dụng cửa sổ thời gian trượt lớn có thể tăng độ phức tạp hệ thống, giảm bớt hiệu quả của các mô hình, trong khi cửa sổ thời gian trượt nhỏ có thể chứa thông tin không đầy đủ Thuật giải di truyền đa cấp (Meta-Gas: Meta-Genetic Algorithm) được sử dụng cho việc tối ưu hóa các tham số GA. Trong bài báo này, sử dụng thuật giải di truyền 2 cấp, bao gồm cấp cao (meta-level) GA sử dụng tìm kiếm mô hình ARMA dự báo tối ưu và cấp thấp (low-level) GA giúp tìm ra bộ tham số tương ứng. Đại diện cho mô hình là Meta-GAs nhị phân, mỗi gen đại diện cho một hệ số nếu giá trị của nó là 1, nếu là 0 thì nó không được xem xét (Hình 1.1) PQ 1010100101000 Meta-Level Low-Level  A2 A4 M1 M3 Hình 1.1 : Ví dụ về giải mã thuật toán Meta-GAs [11] Mô hình này được tối ưu hóa bằng cách chạy một thuật toán di truyền RVR cấp thấp, với mỗi gen mã hóa một hệ số của mô hình ARMA, được cho bởi phương trình (1.9). Mỗi cá thể, được đánh giá bởi chỉ tiêu RMSE trong tập huấn luyện. Mặt khác, các hàm mục tiêu của mỗi cá thể trong meta-level thu được bằng cách giải mã nhiễm sắc thể của nó vào low-level GA chạy và cuối cùng tính toán giá trị BIC của mô hình tối ưu. Hệ thống tổng thể được mô tả hình (1.2). (1.9) Các đề xuất của thuật toán Meta-GA đã được thử nghiệm trên các chuỗi dữ liệu thời gian từ bảng (1.1). Chuỗi dữ liệu thời gian được chia 90% giá trị đầu tiên thành tập huấn luyện và 10% giá trị sau là tập thử nghiệm. Chỉ có các tập huấn luyện được sử dụng để lựa chọn mô hình và tối ưu hóa các thông số. Các tập thử nghiệm được sử dụng để so sánh các phương pháp tiếp cận được đề xuất. Meta-GA làm việc như một thủ tục tối ưu hóa thứ hai, do đó thuật toán áp dụng một quy mô 100 cá thể, với sự tái tổ hợp di truyền cung cấp bởi lai chéo hai điểm đột biến nhị phân Hình 1.2 : The Meta-Ecolutionary Approach [11]
- Xem thêm -

Tài liệu liên quan