BỘ NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN
TRêng ®¹i häc thñy lîi
THUYẾT MINH ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ PHÁT TRIỂN CÔNG NGHỆ
Tên đề tài: Nghiên cứu, xây dựng phần mềm dự
báo dòng chảy dựa trên các phương pháp học
máy tiên tiến
Chủ nhiệm đề tài: ThS. Phạm Thị Hoàng Nhung
HÀ NỘI - 2009
B1-2-TMKHCN
THUYẾT MINH ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ PHÁT TRIỂN CÔNG NGHỆ1
I. THÔNG TIN CHUNG VỀ ĐỀ TÀI
1
Tên đề tài
2
Mã số
Nghiên cứu, xây dựng phần mềm dự báo dòng chảy
dựa trên các phương pháp học máy tiên tiến
3
5
Thời gian thực hiện: 12 tháng
(Từ tháng 1/2010 đến tháng 12/2010)
4
Cấp quản lý
Nhà nước
Bộ
Tỉnh
Cơ sở
Kinh phí 90 triệu đồng, trong đó:
Tổng số (triệu đồng)
Nguồn
- Từ Ngân sách sự nghiệp khoa học
90
- Từ nguồn tự có của cơ quan
0
- Từ nguồn khác
Thuộc Chương trình (ghi rõ tên chương trình, nếu có)
6
0
Thuộc Dự án KH&CN 2 (ghi rõ tên dự án KH&CN, nếu có)
Đề tài độc lập
7
Lĩnh vực khoa học
Tự nhiên;
Kỹ thuật (Công nghiệp, XD, GT, ...);
8
Nông, lâm, ngư nghiệp;
Y dược.
Chủ nhiệm đề tài
Họ và tên:
Năm sinh:
Nam/Nữ:
Phạm Thị Hoàng Nhung
1979
Nữ
Mẫu Thuyết minh này dùng cho đề tài nghiên cứu ứng dụng và triển khai thực nghiệm thuộc các lĩnh vực khoa
học đã nêu tại mục 7, trang 1 của Thuyết minh. Thuyết minh được trình bày và in ra trên khổ giấy A4.
2
Theo Quy định tạm thời về việc xây dựng và quản lý các dự án khoa học và công nghệ (Quyết định số
11/2005/QĐ-BKHCN ngày 25/8/2005 của Bộ trưởng Bộ KH&CN)
1
3
Học hàm:
Học vị: Thạc sỹ
Năm được phong học hàm:
Năm đạt học vị: 2007
Chức danh khoa học: ThS, GV
Chức vụ:
Điện thoại:
Cơ quan: 04. 35637021 Nhà riêng: 04.36414138
Mobile: 0988.133.655
Fax: .................................................. E-mail:
[email protected]
Tên cơ quan đang công tác: Khoa CNTT, Trường Đại học Thủy Lợi
...............................................................................................................................................
Địa chỉ cơ quan: 175 Tây Sơn, Đống Đa, Hà Nội
...............................................................................................................................................
Địa chỉ nhà riêng: P1102, OCT2, ĐN1, Bắc Linh Đàm- Hà Nội
...............................................................................................................................................
9
Cơ quan chủ trì đề tài
Tên cơ quan chủ trì đề tài: Trường Đại học Thủy Lợi
...............................................................................................................................................
Điện thoại: 04.38522201
Fax: 04.35633315
E-mail: ...................................................................................................................................
Website: http://www.wru.edu.vn
Địa chỉ: 175 Tây Sơn, Đống Đa, Hà Nội
...............................................................................................................................................
Họ và tên thủ trưởng cơ quan: Nguyễn Quang Kim
Số tài khoản: ..........................................................................................................................
Ngân hàng: ............................................................................................................................
Tên cơ quan chủ quản đề tài: Bộ NN & PTNT, Vụ KHCN
II. NỘI DUNG KHOA HỌC VÀ CÔNG NGHỆ CỦA ĐỀ TÀI
10
Mục tiêu của đề tài (bám sát và cụ thể hoá mục tiêu đặt hàng - nếu có đặt hàng)
- Nghiên cứu các phương pháp học máy tiên tiến, so sánh, đánh giá để tìm ra phương pháp
phù hợp giải quyết bài toán dự báo dòng chảy.
- Xây dựng phần mềm dự báo.
11
Tổng quan tình hình nghiên cứu và luận giải sự cần thiết phải nghiên cứu đề tài
(Trên cơ sở đánh giá tổng quan tình hình nghiên cứu trong và ngoài nước, phân tích những
công trình nghiên cứu có liên quan đến đề tài, những kết quả nghiên cứu mới nhất trong lĩnh vực
nghiên cứu đề tài, đánh giá những khác biệt về trình độ KH&CN trong nước và thế giới, nêu
được những gì đã giải quyết rồi, những gì còn tồn tại, chỉ ra những hạn chế cụ thể, từ đó nêu
4
được hướng giải quyết - luận giải, cụ thể hoá được tính cấp thiết của đề tài và những vấn đề mới
về KH&CN mà đề tài đặt ra nghiên cứu)
11.1. Tình trạng đề tài
Mới
Kế tiếp (tiếp tục hướng nghiên cứu của chính
nhóm tác giả)
11.2. Đánh giá tổng quan tình hình nghiên cứu thuộc lĩnh vực của đề tài
Ngoài nước (phân tích, đánh giá được những công trình nghiên cứu có liên quan đến đề tài,
những kết quả nghiên cứu mới nhất trong lĩnh vực nghiên cứu đề tài; nêu được những khác biệt
về trình độ KH&CN trong nước và thế giới):
......................................................................................................................................................
Hiện nay, có rất nhiều phương pháp dự báo dòng chảy đã được đưa ra dựa trên các mô
hình vật lý và toán học. Trong nhiều trường hợp, kết quả dự báo theo các mô hình nói trên đã đạt
được một số thành công đáng ghi nhận. Tuy nhiên, vấn đề tìm kiếm phương pháp đủ tốt để giải
quyết bài toán dự báo vẫn là nội dung nghiên cứu thời sự hiện nay. Trong những năm gần đây
việc nghiên cứu, sử dụng các phương pháp học máy tiên tiến như: mạng nơron nhân tạo
(Artificial Neural Network - ANN), giải thuật di truyền (Genetic Algorithm - GA),... trong bài
toán dự báo chuỗi thời gian nói chung và dự báo dòng chảy nói riêng [5-7,12-14, 19] là một
hướng tiếp cận được sự quan tâm đặc biệt của một số nhóm nghiên cứu trên thế giới. Đây được
coi là những công cụ rất mạnh để giải quyết các bài toán có tính phi tuyến, phức tạp và đặc biệt
trong các trường hợp mà mối quan hệ giữa các quá trình không dễ thiết lập một cách tường
minh.
Demetris F. Lekkas [12] cung cấp một khung nhìn phương pháp luận về các phương pháp
dự báo dòng chảy. Ibrahim Can cùng các cộng sự [5] và Cristiane Medina Finzi Quintao và các
cộng sự [19] công bố một số kết quả nghiên cứu cập nhật về dự báo dòng chảy của một số dòng
sông tại Thổ Nhĩ Kỳ và Brazin. Đặc biệt, các công trình này đã cung cấp cách thức đánh giá kết
quả thực nghiệm các phương pháp dự báo thủy văn được đề cập. Các công trình nghiên cứu
khác về mạng nơ-ron nhân tạo, giải thuật di truyền và kết hợp chúng đã khẳng định rằng đây là
một hướng nghiên cứu có thể giải quyết các bài toán dự báo nói chung trong đó có dự báo dòng
chảy.
......................................................................................................................................................
Trong nước: (Phân tích, đánh giá tình hình nghiên cứu trong nước thuộc lĩnh vực nghiên
cứu của đề tài, đặc biệt phải nêu cụ thể được những kết quả KH&CN liên quan đến đề tài mà các
cán bộ tham gia đề tài đã thực hiện; nếu có các đề tài cùng bản chất đang thực hiện hoặc đăng ký
5
nghiên cứu ở cấp khác, nơi khác của nhóm nghiên cứu phải giải trình rõ các nội dung kỹ thuật
liên quan đến đề tài này; nếu phát hiện có đề tài đang tiến hành mà đề tài này có thể phối hợp
nghiên cứu được thì cần ghi cụ thể Tên đề tài, tên Chủ nhiệm đề tài và Cơ quan chủ trì đề tài đó)
......................................................................................................................................................
Tác giả Lê Xuân Cầu và Nguyễn Văn Chương [1] đã sử dụng mạng thần kinh nhân tạo để
xây dựng dự báo lũ sông Cầu, sông Trà Khúc và sông Vệ đã đạt được những kết quả rất khả
quan.
Năm 2003, GS Huỳnh Ngọc Phiên (Viện Công nghệ châu Á – AIT) [2] đã ứng dụng mạng
nơ ron nhân tạo để dự báo mực nước tại các trạm Tạ Bú trên sông Đà, Yên Bái trên sông Thao
và Gềnh Gà trên sông Lô với thời gian dự báo 6h cho kết quả tốt, tuy nhiên nếu thời gian dự báo
tăng lên 18h thì hiệu quả của mô hình giảm.
......................................................................................................................................................
11.3. Liệt kê danh mục các công trình nghiên cứu có liên quan đến đề tài đã nêu trong
phần tổng quan (tên công trình, tác giả, nơi và năm công bố - chỉ ghi những công trình tác giả
thật tâm đắc và đã trích dẫn để luận giải cho sự cần thiết nghiên cứu đề tài)
......................................................................................................................................................
[1].
Lê Xuân Cầu, Nguyễn Văn Chương (2000), Dự báo lũ sông Cầu, sông Trà Khúc và sông
Vệ bằng mạng thần kinh nhân tạo, Hội nghị khoa học và công nghệ dự báo khí tượng thủy văn,
202-210.
[2].
Huynh Ngoc Phien and Nguyen Duc Anh Kha (2003), Flood forecasting for the upper
reach of the Red river basin, North Vietnam, Water SA, vol. 29, no3, p.267-272.
[3].
Viện Khí tượng Thủy văn. Danh sách các đề tài, dự án nghiên cứu khoa học công nghệ.
http://www.imh.ac.vn/c_tt_chuyen_nganh/ce_detai_duan/.
[4].
Thomas Back (1996), Evolutionary Algorithm in Theory and Practice, Oxford University
Press.
[5].
Ibrahim Can, Cahit Yerdelen, Ercan Kahya1 (2007), Stochastic modeling of Karasu
River (Turkey) using the methods of Artificial Neural Networks, Proceeding of the AGU
Hydrology Days 2007, March 19 - March 21, 2007, Colorado State University, Fort Collins,
Colorado, USA, 138-144.
[6].
Paulin Coulibaly, Francois Anctil, and Bernard Bobee (2001), Multivariate Reservoir
Inflow Forecasting Using Temporal Neural Networks, Journal of Hydrologic Engineering, 6(5),
367-376.
[7].
Oscar R. Dolling, Eduardo A. Varas (2002), Artificial neural networks for stream flow
prediction, Journal of Hydraaulic research, 40(5), 547-554.
6
[8].
D.E. Goldberg (1989), Genetic Algorithm in Search, Optimization and Machine
Learning, Addison Wesley, Reading, MA.
[9].
J. Hertz, A. Krogh, and R.G. Palmer. (1991), Introduction to the Theory of Neural
Computation, New York: Addison-Wesley.
[10].
Ismail Kilinş, Kerem Ciğizouğlu (2005), Reservoir Management Using Artificial Neural
Networks, 14th. Reg. Directorate of DSI (State Hydraulic Works), Istanbul, Turkey.
[11].
Steve Lawrence and C. Lee Giles (2000), Overfitting and Neural Networks: Conjugate
Gradient and Backpropagation, International Joint onference on Neural Networks, Como, Italy,
July 24–27, 114–119, 2000.
[12].
D.R. Legates, G.J. McCabe Jr. (1998), Evaluating the Use of "Goodness-of-Fit"
Measures in Hydrologic and Hydroclimatic Model Validation; Water Resour. Res.
1998WR900018, 35(1): 233.
[13].
Demetris F. Lekkas (2002), Development and Comparison of Data-Based
Flow
Forecasting Methods, PhD Thesis, Department of Civil and Environmental Engineering,
Imperial College of Science, Technology and Medicine, London.
[14].
Lekkas D.F., Onof C (2005), Improved flow forecasting using artificial neural networks,
9th International Conference on Environmental and Technology, Rhodes Island, Greece, 1-3
September 2005, 877-884.
[15].
Chin-Teng Lin, C.S. George Lee (1996), Neural fuzzy systems: a neuro-fuzzy
synergism to intelligent systems, Prentice-Hall Inc.
[16].
D. Montana and L. Davis (1989), Training feedforward neural networks using genetic
algorithms, In Proceedings of the Eleventh International Joint Conference on Artificial
Intelligence, 762-767, Morgan Kaufmann, San Mateo, CA.
[17].
Nelson, M.C. and Illingworth, W.T. (1991), A Practical Guide to Neural Nets, Reading,
MA: Addison-Wesley.
[18].
L.Wessels, E.Barnard (1992), Avoiding False Local Minima by Proper Initialization of
Connections, IEEE Trans. on Neural Networks.
[19].
Cristiane Medina Finzi Quintao, Walmir Matos Caminhas, Selenio Rocha Silva, Bruno
Rabelo Versiani (2004), Neo Fuzzy Neuron and its applications to Prediction flood and wind in
Brazil, Workshop on Modelling and Control for Participatory Planning and Managing Water
Systems, September 29-October 1, 2004 (Poster), Venice, Italia.
7
11.4. Phân tích, đánh giá cụ thể những vấn đề KH&CN còn tồn tại, hạn chế của sản phẩm,
công nghệ nghiên cứu trong nước và các yếu tố, các nội dung cần đặt ra nghiên cứu, giải
quyết ở đề tài này (nêu rõ, nếu thành công thì đạt được những vần đề gì)
......................................................................................................................................................
Tại Việt Nam cũng có một số nghiên cứu thử nghiệm khá thành công dự báo dòng chảy sử
dụng mạng nơron nhân tạo. Tuy nhiên các tác giả chỉ sử dụng mạng nơ ron nhân tạo như một
công cụ để thực hiện nghiên cứu, chưa có những thay đổi về bản chất của mạng giúp chúng có
thể thực thi hiệu quả hơn. Ví dụ các tác giả thường sử dụng mạng nơ ron nhiều lớp truyền thẳng
(Multilayer Perceptron) với thuật toán học lan truyền ngược sai số (error back propagation). Đây
là một phương pháp học của mạng nơ-ron nhân tạo, nó cho phép điều chỉnh trọng số của mạng
để tối thiểu hoá hàm sai số. Giải thuật này hoạt động dựa trên cơ chế giảm gradient, với những
hàm đơn giản có một cực trị thì phương pháp giảm gradient đưa ta đến cực trị toàn cục. Tuy
nhiên, chúng ta biết rằng hàm sai số trong mạng nơ-ron nhiều lớp là một hàm có bề mặt rất phức
tạp với rất nhiều cực trị địa phương, do đó phương pháp này không thể đảm bảo cho ta tìm thấy
được một cực trị toàn cục trên bề mặt hàm giá này. Chính vì vậy, để cải thiện giải thuật, người ta
thường tìm cách thay đổi hằng số học hoặc thêm vào đó thành phần quán tính để cho phép có
thể vượt qua những cực trị địa phương trong quá trình tìm kiếm. Việc lựa chọn hằng số học và
hằng số quán tính cũng là một vấn đề rất khó khăn, bởi vì nếu chúng quá lớn đôi khi dẫn đến
tình trạng không ổn định của quá trình tìm kiếm, còn nếu chọn quá nhỏ thì lại dẫn đến tốc độ
học chậm và khả năng vượt qua các cực trị địa phương thấp. Quá trình tìm kiếm trên những hàm
giá như thế này đã được chứng minh là một bài toán NP đầy đủ nghĩa là ta không thể sử dụng
được một giải pháp tổng quát có độ phức tạp đa thức để đạt đến kết quả. Đề tài này đi sâu vào
nghiên cứu bản chất của mạng nơ ron nhân tạo, cải tiến thuật toán học giúp việc áp dụng chúng
vào bài toán dự báo dòng chảy hiệu quả hơn.
Ngoài ra, những công trình nghiên cứu trong nước thường sử dụng các phần mềm của nước
ngoài, ví dụ như WinNN. Việc sử dụng phần mềm của nước ngoài có một số nhược điểm như:
thiếu linh động, không thể thay đổi hoặc thêm các thuật toán mới. Ngoài ra, chúng ta còn phải
trả tiền bản quyền khi sử dụng.
12
Cách tiếp cận
8
(Luận cứ rõ việc lựa chọn cách tiếp cận phù hợp đối tượng nghiên cứu để đạt mục tiêu đặt
ra) ......................................................................................................................................................
1. Tiếp cận một số giải pháp đã có. Phân tích những ưu nhược điểm của mỗi phương pháp.
2. Tham khảo tài liệu về các giải pháp trên thế giới.
3. Tập hợp và tranh thủ các góp ý của cá nhân, tổ chức trong lĩnh vực thuỷ văn và công
nghệ thông tin.
......................................................................................................................................................
Nội dung nghiên cứu ứng dụng và triển khai thực nghiệm
(Liệt kê và mô tả những nội dung nghiên cứu ứng dụng và triển khai thực nghiệm cần tiến
hành để đạt được mục tiêu đặt ra, trong đó, chỉ rõ những nội dung mới, nội dung quan
trọng nhất để tạo ra sản phẩm, công nghệ chủ yếu; những hoạt động để chuyển giao kết
quả nghiên cứu đến người sử dụng; dự kiến những nội dung có tính rủi ro và giải pháp
khắc phục - nếu có)
13
......................................................................................................................................................
Nội dung 1: Thu thập tài liệu
-
Báo cáo thu thập các số liệu đo đạc thủy văn của một số trạm đo trên lưu vực sông Đà.
Nội dung 2: Tài liệu nghiên cứu các công nghệ liên quan
-
Tài liệu về mạng nơ ron nhân tạo
Tài liệu về giải thuật di truyền
Nội dung 3: Tài liệu về phương pháp đề xuất
- Tài liệu nghiên cứu về việc kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai
số để luyện mạng nơ ron nhân tạo.
Nội dung 4: Xây dựng phần mềm
-
Xây dựng môđun mạng nơ ron nhân tạo với giải thuật lan truyền ngược sai số.
Xây dựng môđun giải thuật di truyền.
Xây dựng môđun kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số.
9
Nội dung 5: Thử nghiệm
- Tài liệu về việc sử dụng phương pháp đề xuất trong dự báo dòng chảy.
Nội dung 6: Viết tài liệu hướng dẫn sử dụng
-
Viết tài liệu hướng dẫn sử dụng
Nội dung 7: Tổng kết báo cáo đề tài
.................................................................................................................................. ................. .
Phương pháp nghiên cứu, kỹ thuật sử dụng
14
(Luận cứ rõ việc lựa chọn các phương pháp nghiên cứu, kỹ thuật sử dụng phù hợp với từng
nội dung của đề tài; làm rõ tính mới, sáng tạo, độc đáo của các phương pháp nghiên cứu và kỹ
thuật sử dụng)
......................................................................................................................................................
Phương pháp nghiên cứu:
-
Sử dụng những kỹ thuật mới nhất của ngành Khoa học máy tính về trí tuệ nhân tạo, tính
toán thông minh.
-
Dựa vào tài liệu, kết quả thử nghiệm để đề xuất xây dựng phần mềm phù hợp.
Kĩ thuật sử dụng:
-
Mạng nơ ron nhân tạo.
-
Giải thuật di truyền.
-
Kỹ thuật lập trình trên Windows.
......................................................................................................................................................
15
Hợp tác quốc tế
Đã
hợp tác
Tên đối tác
(Người và tổ chức
khoa học và công
nghệ)
Nội dung hợp tác
(Ghi rõ nội dung, lý do, hình thức hợp tác,
kết quả thực hiện hỗ trợ cho đề tài này)
10
Dự kiến
hợp tác
Tên đối tác
(Người và tổ chức
khoa học và công
nghệ)
Nội dung hợp tác
(Ghi rõ nội dung cần hợp tác; lý do hợp tác; hình thức
thực hiện; dự kiến kết quả hợp tác đáp ứng yêu cầu của đề
tài)
16 Tiến độ thực hiện (phù hợp với những nội dung đã nêu tại mục 13)
Các nội dung, công việc
chủ yếu cần được thực
hiện
(các mốc đánh giá chủ
yếu)
1
Sản phẩm
phải đạt
Thời gian
(bắt đầu,
kết thúc)
Người,
cơ quan
thực hiện
3
4
5
2
1
Thu thập tài liệu
- Báo cáo thu thập các số liệu đo T1/2010
đạc thủy văn của một số trạm đến
đo trên lưu vực sông Đà.
T2/2010
Khoa
CNTT
2
Nghiên cứu các công
nghệ liên quan
- Tài liệu về mạng nơ ron nhân T3/2010
tạo
đến
- Tài liệu về giải thuật di truyền
T4/2010
Khoa
CNTT
3
Nghiên cứu giải pháp đề
xuất cho việc luyện mạng
nơ ron nhân tạo
- Tài liệu nghiên cứu về việc kết T5/2010
hợp giải thuật di truyền và giải đến
thuật lan truyền ngược sai số để T6/2010
luyện mạng nơ ron nhân tạo.
Khoa
CNTT
4
Xây dựng phần mềm
- Phần mềm có khả năng xây mô T7/2010
phỏng mạng nơ ron nhân tạo đến
với các giải thuật học: lan T10/2010
truyền ngược sai số, giải thuật
di truyền và giải thuật đề xuất
Khoa
CNTT
5
Thử nghiệm
- Thử nghiệm phần mềm trong T10/2010
việc dự báo dòng chảy tại lưu đến
vực sông Đà. Đánh giá, so sánh T11/2010
các chỉ tiêu dự báo.
Khoa
CNTT
6
Viết tài liệu sử dụng
- Giúp người sử dụng có thể dễ T11/2010
dàng cài đặt, vận hành, khai
thác phần mềm một cách hiệu
quả.
Khoa
CNTT
7
Tổng kết báo cáo đề tài
T12/2010
11
Khoa
CNTT
III. DỰ KIẾN KẾT QUẢ CỦA ĐỀ TÀI
Dạng kết quả dự kiến của đề tài
17
Dạng kết quả I
Dạng kết quả II
Mẫu (model,
maket)
Nguyên lý ứng
dụng
Sản phẩm (có thể
trở thành hàng hoá,
để thương mại hoá)
Phương pháp
Vật liệu
Tiêu chuẩn
Thiết bị, máy móc
Quy phạm
Dây chuyền công
nghệ
Giống cây trồng
Giống vật nuôi
Dạng kết quả IV
Sơ đồ, bản đồ
Bài báo
Số liệu, Cơ sở dữ
liệu
Sách chuyên
khảo
Báo cáo phân tích
Tài liệu dự báo
(phương pháp, quy
trình, mô hình,...)
Phần mềm máy
tính
Đề án, qui hoạch
Bản vẽ thiết kế
Luận chứng kinh
tế-kỹ thuật, báo cáo
nghiên cứu khả thi
Kết quả tham gia
đào tạo sau đại học
Sản phẩm đăng
ký bảo hộ sở hữu trí
tuệ
Quy trình công
nghệ
Khác
18
Dạng kết quả III
Khác
Khác
Khác
Yêu cầu chất lượng và số lượng về kết quả, sản phẩm KH&CN dự kiến tạo ra
(Kê khai đầy đủ, phù hợp với những dạng kết quả đã nêu tại mục 17)
18.1 Yêu cầu kỹ thuật, chỉ tiêu chất lượng đối với sản phẩm dự kiến tạo ra (dạng kết quả
I)
1
Tên sản phẩm cụ thể và
chỉ tiêu chất lượng chủ
yếu của sản phẩm
Đơn
vị
đo
Cần
đạt
2
3
4
12
Mức chất lượng
Mẫu tương tự
(theo các
tiêu chuẩn mới nhất)
Trong nước
Thế giới
5
6
Dự kiến
số lượng,
quy mô
sản phẩm
tạo ra
7
18.2 Yêu cầu khoa học đối với sản phẩm dự kiến tạo ra (dạng kết quả II, III)
Tên sản phẩm
Yêu cầu khoa học dự kiến đạt được
Ghi chú
2
3
4
1
Sản phẩm phần mềm
- Có khả năng mô phỏng hoạt động của
mạng nơ ron nhân tạo.
- Có thể thực hiện các thuật toán luyện
mạng khác nhau.
- Có khả năng hiển thị trực tiếp các chỉ
tiêu về dự báo dòng chảy trong quá trình
chạy.
2
Tài liệu hướng dẫn
- Giúp người sử dụng có thể dễ dàng cài
đặt, vận hành, khai thác phần mềm một
cách hiệu quả.
3
Báo cáo phân tích
- Báo cáo thu thập các số liệu đo đạc thủy
văn của một số trạm đo trên lưu vực sông
Đà.
- Tài liệu về mạng nơ ron nhân tạo, tài liệu
về giải thuật di truyền, tài liệu về phương
pháp đề xuất.
- Tài liệu về quá trình thiết kế phần mềm.
- Tài liệu về việc sử dụng phương pháp đề
xuất trong dự báo dòng chảy.
4
5
18.3 Dự kiến công bố kết quả tạo ra (dạng kết quả IV)
1
Tên sản phẩm
Tạp chí, Nhà xuất bản
Ghi chú
2
3
4
1 Bài báo khoa học
Tạp chí Khoa học Thuỷ lợi và Môi trường
13
18.4. Đánh giá một số chỉ tiêu kinh tế-kỹ thuật của các sản phẩm, công nghệ nghiên
cứu, đặc biệt là của sản phẩm, công nghệ chủ yếu dự kiến tạo ra của đề tài so với các sản
phẩm tương tự trong và ngoài nước; so sánh với các phương án nhập công nghệ hoặc mua
sản phẩm tương tự để đánh giá hiệu quả của đề tài (trình độ KH&CN, tính phù hợp, hiệu quả
kinh tế, ...)
......................................................................................................................................................
Về kĩ thuật:
Các kĩ thuật đề xuất áp dụng vào đề tài đều là những kĩ thuật tiên tiến của ngành Khoa
-
học máy tính: Mạng nơ ron nhân tạo, giải thuật di truyền.
Về kinh tế:
Áp dụng thành công phần mềm dự báo dòng chảy mang lại nhiều lợi ích kinh tế cho các
-
ngành thủy điện, tưới tiêu,…
Xây dựng thành công phần mềm mạng nơ ron nhân tạo với các phương pháp học tiên
-
tiến giúp chúng ta làm chủ công nghệ, giảm thiểu kinh phí mua phần mềm nước ngoài.
......................................................................................................................................................
19
Khả năng và phương thức chuyển giao kết quả nghiên cứu
19.1. Khả năng về thị trường (nhu cầu thị trường trong và ngoài nước, nêu tên và nhu cầu
của khách hàng cụ thể nếu có; khi nào có thể đưa sản phẩm của đề tài ra thị trường?);
......................................................................................................................................................
Khả năng thị trường là rất lớn vì nước ta có mạng lưới sông ngòi dày đặc, nhu cầu về dự
báo dòng chảy chính xác là rất lớn.
19.2. Khả năng về kinh tế (khả năng cạnh tranh về giá thành và chất lượng của sản phẩm)
......................................................................................................................................................
Sản phẩm nếu thành công sẽ có lợi thế lớn về giá thành, tính năng so với các sản phẩm cạnh
tranh.
......................................................................................................................................................
19.3. Khả năng liên doanh liên kết với các doanh nghiệp ngay trong quá trình nghiên cứu
......................................................................................................................................................
Có khả năng liên doanh liên kết với các doanh nghiệp trong quá trình nghiên cứu giải
quyết các bài toán dự báo chuỗi thời gian.
......................................................................................................................................................
19.4. Mô tả phương thức chuyển giao
(chuyển giao công nghệ trọn gói, chuyển giao công nghệ có đào tạo, chuyển giao theo hình thức
14
trả dần theo tỷ lệ % của doanh thu, liên kết với doanh nghiệp để sản xuất hoặc góp vốn (với đơn
vị phối hợp nghiên cứu hoặc với cơ sở sẽ áp dụng kết quả nghiên cứu) theo tỷ lệ đã thoả thuận
để cùng triển khai sản xuất, tự thành lập doanh nghiệp trên cơ sở kết quả nghiên cứu tạo ra, ...)
......................................................................................................................................................
Mô hình thích hợp nhất đối với các kết quả của đề tài là chuyển giao công nghệ có đào tạo.
20
Các lợi ích mang lại và các tác động của kết quả nghiên cứu
20.1. Đối với lĩnh vực KH&CN có liên quan
(Ghi những dự kiến đóng góp vào các thành tựu nổi bật trong khoa học quốc tế, đóng góp vào
tiêu chuẩn quốc tế; triển vọng phát triển theo hướng nghiên cứu của đề tài; ảnh hưởng về lý luận
đến phát triển ngành khoa học, đến sáng tạo trường phái khoa học mới; ...)
......................................................................................................................................................
Là một trong những đề tài khởi đầu trong việc cải tiến bản chất của mạng nơ ron nhân tạo
áp dụng trong việc dự báo dòng chảy. Xây dựng được phần mềm linh hoạt, khả năng tùy biến
cao, có giao diện thân thiện.
Sản phẩm của đề tài là tài liệu giảng dạy, hướng dẫn Nghiên cứu khoa học và Đồ án tốt
nghiệp cho sinh viên các ngành công nghệ thông tin, thủy văn tài nguyên nước.
20.2. Đối với nơi ứng dụng kết quả nghiên cứu
Xây dựng được phần mềm dự báo có độ chính xác cao. Nếu ứng dụng thành công sẽ có thể
nhân rộng trên toàn quốc.
20.3. Đối với kinh tế - xã hội và môi trường
(Nêu những tác động dự kiến của kết quả nghiên cứu đối với sự phát triển kinh tế - xã hội:
những luận cứ khoa học của đề tài có khả năng ảnh hưởng đến chủ trương chính sách, cơ chế
quản lý cụ thể của Đảng và Nhà nước; khả năng nâng cao tiêu chuẩn văn hoá của xã hội; ảnh
hưởng đến môi trường; khả năng ảnh hưởng đến sự nghiệp chăm sóc sức khoẻ cộng đồng, hoặc
tạo ra sản phẩm hàng hoá đáp ứng nhu cầu thị trường, góp phần tạo công ăn việc làm, nâng cao
hiệu quả sản xuất, v.v...)
......................................................................................................................................................
Việc xây dựng thành công sản phẩm là bước khởi đầu trong việc nội địa hóa phần mềm
trong lĩnh vực tài nguyên nước.
IV. CÁC TỔ CHỨC, CÁ NHÂN THAM GIA THỰC HIỆN ĐỀ TÀI
Hoạt động của các tổ chức phối hợp chính tham gia thực hiện đề tài
(Ghi các tổ chức phối hợp chính tham gia thực hiện đề tài và nhiệm vụ được giao thực hiện
trong đề tài, kể cả các đơn vị sản xuất hoặc những người sử dụng kết quả nghiên cứu - Những dự
kiến phân công này sẽ được thể hiện bằng các hợp đồng thực hiện giữa chủ nhiệm đề tài và cơ
quan chủ trì đề tài với các đơn vị, tổ chức nói trên - khi được giao nhiệm vụ chính thức hoặc sau
khi trúng tuyển)
21
Tên tổ chức,
Địa chỉ
15
Nhiệm vụ được giao
Dự kiến
thủ trưởng của tổ chức
1
Khoa CNTT
thực hiện trong đề tài
175 Tây Sơn –Đống Đa
– Hà Nội
kinh phí
- Nghiên cứu thuật
toán
- Xây dựng phần
mềm
Cán bộ thực hiện đề tài
(Ghi những người dự kiến đóng góp khoa học chính thuộc tổ chức chủ trì
và cơ quan phối hợp tham gia thực hiện đề tài, không quá 10 người kể cả chủ
nhiệm đề tài - mỗi người có tên trong danh sách này cần khai báo lý lịch khoa
học theo Biểu B1-4-LLCN.SĐ)
22
Họ và tên
3
1
ThS. Phạm Thị Hoàng Nhung
2
PGS. TS. Nguyễn Đăng Tộ
3
CN. Phạm Văn Tùng
ThS. Dương Đức Toàn
4
KS. Nguyễn Thị Ngọc Hà
5
ThS. Trần Thị Minh Hoàn
6
Cơ quan công
tác
Thời gian làm
việc cho đề tài
Nhiệm vụ dự kiến
(Số tháng quy
đổi 3)
Khoa CNTT,
ĐHTL
Khoa CNTT,
ĐHTL
Khoa CNTT,
Thủy văn, ĐHTL
12
Phụ trách chung
10
Phụ trách chung
10
Khoa CNTT,
ĐHTL
Khoa CNTT,
ĐHTL
8
ThS. Đỗ Văn Hải
Khoa CNTT,
ĐHTL
3
7
ThS. Vũ Anh Dũng
8
8
CN. Vũ Tiến Thái
9
KS. Phạm Trí Công
Khoa CNTT,
ĐHTL
Khoa CNTT,
ĐHTL
Khoa CNTT,
Thu thập tài liệu
Nghiên cứu về
mạng nơ ron nhân
tạo
Nghiên cứu về giải
thuật di truyền
Nghiên cứu về giải
thuật di truyền áp
dụng vào bài toán
luyện mạng nơ ron
nhân tạo
Nghiên cứu giải
thuật cải tiến tăng
hiệu quả luyện
mạng nơ ron nhân
tạo
Xây dựng phần
mềm
Xây dựng phần
mềm
Xây dựng phần
6
8
8
Một (01) tháng quy đổi là tháng gồm 22 ngày làm việc, mỗi ngày làm việc gồm 08 tiếng.
16
10
ThS. Dương Đức Toàn
ĐHTL
Khoa Thủy văn
Tài nguyên nước,
ĐHTL
17
8
mềm
Thử nghiệm
V. KINH PHÍ THỰC HIỆN ĐỀ TÀI VÀ NGUỒN KINH PHÍ
(Giải trình chi tiết xem phụ lục kèm theo)
Đơn vị: đồng
23 Kinh phí thực hiện đề tài phân theo các khoản chi
S
Trong đó
T
Mục chi
Kinh phí
Sự nghiệp khoa học
T
1 Mục 6050: Xây dựng đề cương
2.000.000
2.000.000
2 Mục 6100: Phụ cấp chủ nhiệm đề tài
3.600.000
3.600.000
3
Mục 6550: Chi phí văn phòng phẩm
4
5
6
Khác
0
0
500.000
500.000
0
Mục 6650: Hội thảo, hội nghị
Mục 7000: Chi phí nghiệp vụ chuyên
môn
3.500.000
71.400.000
3.500.000
71.400.000
0
Kinh phí quản lý (cơ quan chủ quản)
Tổng
9.000.000
9.000.000
0
90.000.000
90.000.000
0
Bằng chữ: Chín mươi triệu đồng chẵn.
Hà Nội, ngày 24 tháng 12 năm 2009
Chủ nhiệm đề tài
Phòng Khoa học Công nghệ
Phòng Tài vụ
Hiệu trưởng Trường Đại học Thuỷ Lợi
18
0
BỘ NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN
TRƯỜNG ĐẠI HỌC THỦY LỢI
THUYẾT MINH ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ PHÁT TRIỂN CÔNG NGHỆ
Tên đề tài: Nghiên cứu, xây dựng phần mềm dự
báo dòng chảy dựa trên các phương pháp học
máy tiên tiến
(Phần Giải thuật đề xuất)
CƠ QUAN CHỦ QUẢN:
BỘ NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN
CƠ QUAN CHỦ TRÌ:
TRƯỜNG ĐẠI HỌC THỦY LỢI
CHỦ NHIỆM ĐỀ TÀI:
THS. PHẠM THỊ HOÀNG NHUNG
1
MỤC LỤC
Chương 1. Ứng dụng giải thuật di truyền vào bài toán tối ưu hoá trọng số của mạng nơ-ron
nhân tạo ...................................................................................................................................... 3
1.2 Xây dựng hàm giá ............................................................................................................ 3
1.2 Mã hoá nhiễm sắc thể ....................................................................................................... 3
1.2 Lai ghép ............................................................................................................................ 5
1.2 Đột biến ............................................................................................................................ 6
1.2 Thử nghiệm ...................................................................................................................... 6
1.2 Giải thuật đề xuất ........................................................................................................... 11
Chương 2. Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số để tối ưu hoá
trọng số mạng nơ-ron nhân tạo................................................................................................. 13
2.1 Đặt vấn đề....................................................................................................................... 13
2.2 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số ................................. 14
Kết luận ................................................................................................................................ 16
Tài liệu tham khảo .................................................................................................................... 18
2
Chương 1. Ứng dụng giải thuật di
truyền vào bài toán tối ưu hoá trọng
số của mạng nơ-ron nhân tạo
Như chúng ta đã biết sử dụng giải thuật lan truyền ngược sai số để tối ưu hoá trọng số của
mạng nơ-ron nhân tạo đang được sử dụng rộng rãi hiện nay. Tuy nhiên, giải thuật này hoạt
động theo cơ chế giảm gradient nên nó khó có thể tìm ra được cực trị toàn cục. Trong nghiên
cứu của mình tôi sử dụng giải thuật di truyền để tối ưu hoá trọng số của mạng giúp quá trình
học của mạng được tốt hơn.
Để có thể sử dụng được giải thuật di truyền vào việc học của mạng nơ-ron cần phải thực hiện
một số bước như sau:
•
Xây dựng hàm giá
•
Mã hoá nhiễm sắc thể
•
Thực hiện giải thuật di truyền
1.2 Xây dựng hàm giá
Hàm giá này sẽ được sử dụng để tạo nên độ phù hợp của các cá thể và của cả quần thể
trong GA. Trong nghiên cứu này tôi sử dụng hàm sai số căn quân phương RMSE của tập mẫu
học.
1 p n
∑∑ ( yij − dij )
pn=i 1 =j 1
=
RMSE
2
(2.1)
Trong đó:
-
y ij , d ij là đầu ra của mạng và đầu ra mong muốn của đầu ra thứ j tại mẫu học
thứ i
-
n là số đầu ra của mạng
-
p là số mẫu học
Trong quá trình tiến hoá của toàn bộ quần thể, hàm giá này sẽ dần dần đạt tới cực tiểu toàn
cục.
1.2 Mã hoá nhiễm sắc thể
Mỗi cá thể trong GA sẽ thay mặt cho một bộ trọng số của mạng nơ-ron. Ở đây ta không
cần phải phân biệt trọng số nào ở lớp nào mà ta chỉ cần trải tất cả các trọng số lên sơ đồ gen của
nhiễm sắc thể.
a. Mã hoá nhị phân
3