ứng dụng mạng kohonen cho khảo sát, đánh giá, thống kê tình hình của trường cao đẳng nghề
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
ĐỖ THỊ HỒNG
ỨNG DỤNG MẠNG KOHONEN CHO KHẢO SÁT,
ĐÁNH GIÁ, THỐNG KÊ TÌNH HÌNH CỦA
TRƢỜNG CAO ĐẲNG NGHỀ
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên - 2013
1
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
ĐỖ THỊ HỒNG
ỨNG DỤNG MẠNG KOHONEN CHO KHẢO SÁT,
ĐÁNH GIÁ, THỐNG KÊ TÌNH HÌNH CỦA
TRƢỜNG CAO ĐẲNG NGHỀ
CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
MÃ SỐ: 60 48 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƢỜI HƢỚNG DẪN KHOA HỌC
P G S . TS LÊ BÁ DŨNG
Thái Nguyên - 2013
Số hóa bởi Trung tâm Học liệu
http://lrc.tnu.edu.vn
2
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn là công trình nghiên cứu của riêng cá nhân tôi, không
sao chép của ai do tôi tự nghiên cứu, đọc, dịch tài liệu, tổng hợp và thực hiện. Nội dung
lý thuyết trong trong luận văn tôi có sử dụng một số tài liệu tham khảo như đã trình bày
trong phần tài liệu tham khảo. Các số liệu, chương trình phần mềm và những kết quả
trong luận văn là trung thực và chưa được công bố trong bất kỳ một công trình nào
khác.
Thái Nguyên, tháng 9 năm 2013
Học viên thực hiện
Đỗ Thị Hồng
Số hóa bởi Trung tâm Học liệu
http://lrc.tnu.edu.vn
3
LỜI CẢM ƠN
Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến PGS.TS Lê Bá Dũng người đã tận
tình hướng dẫn, chỉ bảo, giúp đỡ em trong suốt quá trình làm luận văn.
Em cũng xin gửi lời cảm ơn đến các thầy cô giáo trường Đại học Công nghệ thông
tin và Truyền thông - Đại học Thái Nguyên, các thầy cô Viện Công nghệ thông tin đã
truyền đạt những kiến thức và giúp đỡ em trong suốt quá trình học của mình.
Tôi cũng xin gửi lời cảm ơn tới các đồng nghiệp, gia đình và bạn bè những người
đã ủng hộ, động viên tạo mọi điều kiện giúp đỡ để tôi có thể hoàn thành tốt luận văn.
Tôi cũng xin gửi lời cảm ơn tới Ban giám hiệu trường Cao đẳng nghề LICOGI đã
tạo điều kiện thuận lợi cho tôi tham gia khóa học và trong suốt quá trình hoàn thành
luận văn.
Một lần nữa, xin chân thành cảm ơn.
Thái Nguyên, tháng 9 năm 2013
Học viên
Đỗ Thị Hồng
Số hóa bởi Trung tâm Học liệu
http://lrc.tnu.edu.vn
i
MỤC LỤC
LỜI CAM ĐOAN
LỜI CẢM ƠN
MỤC LỤC ...................................................................................................................i
DANH MỤC CÁC KÍ HIỆU, CHỮ CÁI VIẾT TẮT ...........................................iv
DANH MỤC CÁC BẢNG ........................................................................................ v
DANH MỤC CÁC HÌNH ........................................................................................vi
MỞ ĐẦU .................................................................................................................... 1
CHƢƠNG 1. MẠNG NƠRON KOHONEN VÀ BÀI TOÁN PHÂN CỤM ........ 2
1.1. Cấu trúc và mô hình mạng Nơron ................................................................... 2
1.1.1. Giới thiệu về mạng Nơron ........................................................................ 2
1.1.2. Mô hình một Nơron sinh học ................................................................... 2
1.1.2.1. Cấu trúc một nơron sinh học ............................................................. 2
1.1.2.2. Hoạt động của nơron sinh học .......................................................... 3
1.1.3. Mô hình Nơron nhân tạo .......................................................................... 4
1.1.3.1. Cấu trúc và mô hình của một nơron nhân tạo ................................... 4
1.1.3.2. Mô hình mạng Nơron nhân tạo ......................................................... 7
1.1.3.3. Các luật học ....................................................................................... 9
1.2. Mạng Kohonen và bài toán phân cụm ...........................................................12
1.2.1. Giới thiệu về mạng nơron Kohonen (SOM - Self-Organizing Maps) ...12
1.2.2. Bài toán phân cụm ..................................................................................13
1.2.2.1. Khái niệm ........................................................................................13
1.2.2.2. Mục đích của phân cụm dữ liệu ......................................................14
1.2.2.3. Ứng dụng của bài toán phân cụm ...................................................15
1.2.2.4. Các yêu cầu khi phân cụm ..............................................................15
1.2.2.5. Các kiểu dữ liệu và các thuộc tính trong phân cụm ........................16
1.3. Các hướng tiếp cận của bài toán phân cụm ...................................................18
1.3.1. Phương pháp phân cụm phân cấp ......................................................18
1.3.2. Phương pháp phân cụm phân hoạch ..................................................19
Số hóa bởi Trung tâm Học liệu
http://lrc.tnu.edu.vn
ii
1.3.3. Phương pháp phân cụm dựa trên mật độ ...........................................19
1.3.4. Phân cụm dữ liệu dựa trên lưới ..........................................................19
1.3.5. Phân cụm dữ liệu dựa trên sự ràng buộc ............................................20
CHƢƠNG 2. MỘT SỐ VẤN ĐỀ VỀ PHÂN CỤM DỮ LIỆU BẰNG MẠNG
KOHONEN ..............................................................................................................22
2.1. Thuật toán phân cụm dữ liệu .........................................................................22
2.2. Một số thuật toán cơ bản trong phân cụm dữ liệu .........................................23
2.2.1. Thuật toán phân cụm phân cấp ..........................................................23
2.2.2. Thuật toán phân cụm phân hoạch (Thuật toán K-means) ..................24
2.2.3. Thuật toán phân cụm dựa trên mật độ (Thuật toán DBSCAN)..............26
2.2.4. Thuật toán phân cụm dựa trên lưới (Thuật toán STING) ..................28
2.2.5. Các thuật toán phân cụm dựa trên mô hình (Thuật toán EM) ...........29
2.3. Thuật toán phân cụm bằng mạng Kohonen ...................................................30
2.3.1 .Mạng Kohonen là gì? .............................................................................30
2.3.2. Cấu trúc mô hình mạng Kohonen ..........................................................30
2.3.3. Thuật toán phân cụm bằng mạng Kohonen ............................................31
2.4. Một số vấn đề phân cụm bằng mạng Kohonen .............................................36
2.4.1. Khởi tạo mạng Kohonen (SOM) ............................................................36
2.4.2. Huấn luyện mạng Kohonen ....................................................................37
2.4.3. Tỉ lệ học ..................................................................................................38
2.4.4. Cập nhật lại trọng số ...............................................................................39
2.4.5. Xác định nơron chiến thắng ...................................................................40
2.5. Kohonen (SOM) sử dụng trong phân cụm dữ liệu ........................................40
2.5.1. SOM phân cụm với bản đồ một chiều ....................................................41
2.5.2. SOM phân cụm với bản đồ 2 chiều ........................................................41
2.5.3. Xác định ranh giới các cụm ....................................................................42
2.5.4. Trực quan mạng......................................................................................43
2.5.5. Số lượng nhóm khi phân cụm ................................................................44
Số hóa bởi Trung tâm Học liệu
http://lrc.tnu.edu.vn
iii
CHƢƠNG 3. ỨNG DỤNG MẠNG KOHONEN VÀO BÀI TOÁN PHÂN CỤM
DỮ LIỆU MÔN HỌC CỦA HSSV TRƢỜNG CAO ĐẲNG NGHỀ LICOGI
QUA VIỆC KHẢO SÁT, THỐNG KÊ KẾT QUẢ HỌC CÁC MÔN ĐỂ ĐÁNH
GIÁ CHẤT LƢỢNG ĐÀO TẠO NGHỀ CỦA NHÀ TRƢỜNG ........................45
3.1. Phát biểu bài toán...........................................................................................45
3.2. Khảo sát, đánh giá, thống kê tình hình học tập của học sinh sinh viên trường
Cao đẳng nghề LICOGI. ...........................................................................................45
3.2.1. Thu thập dữ liệu......................................................................................45
3.2.2. Phân tích dữ liệu .....................................................................................50
3.3. Thử nghiệm sử dụng mô hình mạng Kohonen để khảo sát, đánh giá, thống kê
tình hình học tập của HSSV trường Cao đẳng nghề LICOGI...................................55
3.3.1. Các chức năng của chương trình ............................................................55
3.3.2. Giao diện chương trình ...........................................................................55
3.3.3. Kết quả và phân tích kết quả sau khi huấn luyện mô hình mạng
Kohonen ....................................................................................................................57
3.3.3.1. Kết quả phân cụm môn học, mô đun ..............................................57
3.3.3.2. Kết quả phân cụm học sinh theo kết quả thi kết thúc môn học, mô
đun ................................................................................................................64
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN .............................................................68
TÀI LIỆU THAM KHẢO ......................................................................................69
Số hóa bởi Trung tâm Học liệu
http://lrc.tnu.edu.vn
iv
DANH MỤC CÁC KÍ HIỆU, CHỮ CÁI VIẾT TẮT
HSSV:
Học sinh, sinh viên
CSDL:
Cơ sở dữ liệu
KPDL:
Khai phá dữ liệu
PCDL :
Phân cụm dữ liệu
SOM(Self Organizing Maps):
Mạng nơron tự tổ chức
PE (Processing element):
Phần tử xử lý
BMU(Best - Matching unit):
Đơn vị phù hợp nhất
U-matrix (unified distance matrix):
Ma trận thống nhất khoảng cách
EM (Expectation maximization):
Thuật toán tối đa hóa
STING (STatistical INformation Grid ): Thuật toán thống kê thông tin lưới
DBSCAN (Density Based Spatial : Phân cụm dữ liệu dựa trên không
Clustering of Applications with Noise)
Số hóa bởi Trung tâm Học liệu
gian mật độ ứng với nhiễu
http://lrc.tnu.edu.vn
v
DANH MỤC CÁC BẢNG
Bảng 3.1. Dữ liệu thống kê phân cụm môn học, mô đun ...................................... 52
Bảng 3.2. Dữ liệu thống kê phân cụm học sinh
theo điểm thi kết thúc môn học, mô đun ............................................... 53
Bảng 3.3. Kết quả các cụm môn sau khi huấn luyện mạng Kohonen.................... 58
Bảng 3.4. Kết quả các cụm học sinh sau khi huấn luyện mạng Kohonen ............ 67
Số hóa bởi Trung tâm Học liệu
http://lrc.tnu.edu.vn
vi
DANH MỤC CÁC HÌNH
Hình 1.1. Cấu tạo mô hình nơron sinh học ............................................................. 3
Hình 1.2. Cấu trúc mô hình một nơron nhân tạo cơ bản ........................................ 4
Hình 1.3. Đồ thị các dạng hàm chuyển ................................................................... 7
Hình 1.4. Mô hình mạng nơron 3 lớp ..................................................................... 8
Hình 1.5. Cấu trúc huấn luyện mạng nơron ............................................................ 9
Hình 1.6. Học có giám sát ....................................................................................... 10
Hình 1.7. Học không có giám sát ............................................................................ 10
Hình 1.8. Sơ đồ cấu trúc chung của quá trình học .................................................. 11
Hình 1.9. Các cách phân cụm phân cấp .................................................................. 18
Hình 1.10. Cấu trúc phân cụm dựa trên lưới điểm .................................................. 20
Hình 1.11. Cấu trúc phân cụm dựa trên sự ràng buộc ............................................. 21
Hình 2.1. Các thiết lập để xác định ranh giới các cụm ban đầu .............................. 24
Hình 2.2. Tính toán trọng tâm của các cụm mới ..................................................... 25
Hình 2.3. Hình dạng các cụm được khám phá bởi thuật toán DBSCAN ................ 27
Hình 2.4. Cấu trúc mạng Kohonen ................................................................................... 31
Hình 2.5. Phần tử nơron chiến thắng BMU...................................................................... 31
Hình 2.6. Các vùng lân cận .............................................................................................. 32
Hình 2.7. U-Matrix biểu diễn cho SOM .......................................................................... 34
Hình 2.8. Những bức tường trong Kohonen ................................................................... 35
Hình 2.9: Hàm tỉ lệ học theo thời gian .................................................................... 39
Hình 3.1. Kết quả phân cụm môn học, mô đun sử dụng
phương pháp trực quan U-Matrix ........................................................................... 57
Hình 3.2.Kết quả phân cụm sử dụng phương pháp
trực quan các bản đồ thành phần .............................................................................. 61
Hình 3.3. Kết quả phân cụm học sinh theo môn học, mô đun sử dụng phương pháp
trực quan U-Matrix .................................................................................................. 65
Số hóa bởi Trung tâm Học liệu
http://lrc.tnu.edu.vn
1
MỞ ĐẦU
Ngày nay, cùng với sự phát triển của mô hình dữ liệu, chúng ta ngày càng có
nhiều kho dữ liệu với lượng dữ liệu rất lớn. Để khai thác có hiệu quả những dữ liệu
khổng lồ này, đòi hỏi chúng ta - những người sử dụng - phải biết khai thác và chọn
lọc dữ liệu có ích cho mình. Đó cũng chính là lý do mà Data Mining (DM) ra đời và
đã được áp dụng trong thực tế theo nhiều hướng quan trọng và một trong các hướng
đó là phân cụm dữ liệu (Data Clustering).
Thông tin giáo dục đào tạo của các trường hiện nay hầu hết được lưu trữ trong
máy tính và chúng ta cần phải tìm ra những thông tin hữu ích từ cơ sở dữ liệu đó để
có các biện pháp phù hợp, cần thiết cho việc cải cách, nâng cao chất lượng giáo dục
đào tạo thông qua việc khảo sát, đánh giá, thống kê, báo cáo.
Luận văn với đề tài “Ứng dụng Mạng Kohonen cho khảo sát, đánh giá,
thống kê tình hình của trƣờng Cao đẳng nghề” khảo sát lĩnh vực KPDL dùng
mạng nơron. Luận văn tập trung vào tìm hiểu về mạng nơron Kohonen (SOM) và
dùng thuật toán SOM để giải quyết bài toán phân cụm dữ liệu theo mô hình
mạng nơron.
Nội dung luận văn gồm có 3 chương:
Chương I. Mạng Kohonen và bài toán phân cụm
Chương II. Một số vấn đề về phân cụm bằng Kohonen
Chương III. Ứng dụng mạng Kohonen vào bài toán phân cụm dữ liệu môn học
của HSSV trường Cao đẳng nghề LICOGI qua việc khảo sát, thống kê kết quả học
các môn để đánh giá chất lượng đào tạo nghề của nhà trường
Do thời gian nghiên cứu và trình độ có hạn, luận văn không tránh khỏi hạn chế
và thiếu xót. Em rất mong nhận được sự chỉ bảo, đóng góp ý kiến của các thầy, cô
giáo cũng như bạn bè và đồng nghiệp.
Em xin chân thành cảm ơn!
Thái Nguyên, tháng 9 năm 2013
Ngƣời viết luận văn
Đỗ Thị Hồng
2
CHƢƠNG 1
MẠNG NƠRON KOHONEN VÀ BÀI TOÁN PHÂN CỤM
1.1. Cấu trúc và mô hình mạng Nơron
1.1.1. Giới thiệu về mạng Nơron
Trong những năm gần đây người ta thường nhắc đến “Trí tuệ nhân tạo” như là
một phương thức mô phỏng trí thông minh của con người từ việc lưu trữ đến xử lý
thông tin. Và nó thực sự trở thành nền tảng cho việc xây dựng các thế hệ máy tính
thông minh hiện đại. Cùng với mục đích đó, nhưng dựa trên quan điểm hoàn toàn
khác, một môn khoa học đã ra đời mang tên “Lý thuyết mạng Nơron”.
Mạng Nơron nhân tạo là sự mô phỏng xử lý thông tin, được nghiên cứu ra từ
hệ thần kinh của sinh vật cũng như bộ não của con người. Nó bao gồm số lượng lớn
các mối gắn kết cấp cao để xử lý các yếu tố làm việc trong mối liên hệ giải quyết rõ
ràng. Mạng nơron cũng giống như con người được học hỏi bởi kinh nghiệm, lưu
những kinh nghiệm hiểu biết và sử dụng chúng trong những tình huống phù hợp.
Mạng Nơron nhân tạo áp dụng thành công trong nhiều lĩnh vực khác nhau như
tài chính, ngân hàng, điện tử, kỹ thuật….và mới nhất là nghiên cứu ứng dụng trong
lĩnh vực quản lý dự án xây dựng. Ngoài ra, mạng Nơron nhân tạo là công cụ tốt
nhất trong việc giải quyết các bài toán như phân lớp đối tượng, xấp xỉ hàm số, tối
ưu hóa, định hướng vectơr, phân cụm dữ liệu…Nó thay thế hiệu quả các công cụ
tính toán truyền thống.
1.1.2. Mô hình một Nơron sinh học
1.1.2.1. Cấu trúc một nơron sinh học
Theo các nghiên cứu sinh học về bộ não, hệ thống thần kinh của con người bao
gồm khoảng 100 tỷ tế bào thần kinh, thường được gọi là nơron. Mỗi tế bào thần
kinh nơron bao gồm 03 thành phần:
- Thân nơron (gọi là Soma) với nhân bên trong là nơi tiếp nhận hay phát ra các
xung động thần kinh.
3
- Một hệ thống mạng các dây thần kinh vào (gọi là Dendrites) truyền tín hiệu
(dưới dạng xung điện) tới nhân nơron để xử lý. Các dây thần kinh vào tạo thành một
lưới dày đặc xung quanh thân nơron, chiếm diện tích khoảng 0,25mm2, bên trong
thân các dữ liệu đó được tổng hợp lại.
- Đầu dây thần kinh (gọi là sợi trục Axon) phân nhánh dạng hình cây, có thể
dài từ 1cm đến hàng mét. Chúng nối với các dây thần kinh vào hoặc trực tiếp với
nhân tế bào của các nơron khác thông qua các khớp nối (gọi là Synapse). Thông
thường mỗi nơron có thể có từ vài chục cho tới hàng trăm ngàn khớp nối để nối với
các nơron khác. Có hai loại khớp nối, khớp nối kích thích (excitatory) sẽ cho tín
hiệu qua nó để tới nơron còn khớp nối ức chế (inhibitory) có tác dụng làm cản tín
hiệu tới nơron. Người ta ước tính mỗi nơron trong bộ não của con người có khoảng
104 khớp nối (hình 1.1).
Hình 1.1. Cấu tạo mô hình nơron sinh học
1.1.2.2. Hoạt động của nơron sinh học
Các tín hiệu đưa ra bởi một khớp nối và được nhận bởi các dây thần kinh vào
là kích thích điện tử. Việc truyền tín hiệu như trên liên quan đến quá trình hóa học
phức tạp mà trong đó các chất truyền đặc trưng được giải phóng từ phía gửi của nơi
tiếp nối. Điều này làm tăng hay giảm điện thế bên trong thân của noron nhận. Nơron
nhận tín hiệu sẽ kích hoạt nếu điện thế vượt ngưỡng nào đó. Và một điện thế hoạt
động với cường độ cùng thời gian tồn tài cố định được gửi ra ngoài thông qua đầu
4
dây thần kinh tới phần dây thần kinh vào rồi tới chỗ khớp nối để đến nơron khác.
Sau khi kích hoạt, noron sẽ chờ trong một khoảng thời gian được gọi là chu kỳ cho
đến khi nó có thể được kích hoạt lại.
Có hai loại khớp nối là khớp nối kích thích và khớp nối ức chế. Khớp nối kích
thích sẽ cho tín hiệu qua nó để tới nơron, còn khớp nối ức chế có tác dụng làm cản
tín hiệu của noron.
Cấu trúc mạng noron luôn thay đổi và phát triển, các thay đổi có khuynh
hướng chủ yếu là làm tăng hay giảm độ mạnh các mối liên kết thông qua các khớp
nối. Các khớp nối đóng vai trò rất quan trọng trong sự học tập. Khi chúng ta học tập
thì hoạt động của cácg khớp nối được tăng cường, tạo nên nhiều liên kết mạnh giữa
các nơron. Có thể nói rằng người nào học càng giỏi thì càng có nhiều khớp nối và
các khớp ấy càng mạnh mẽ, hay nói cách khác, thì liên kết giữa các nơron càng
nhiều, càng nhạy bén.
1.1.3. Mô hình Nơron nhân tạo
1.1.3.1. Cấu trúc và mô hình của một nơron nhân tạo
Năm 1943, Warren MuCulloch và Walter Pitts đã đề xuất mô hình nơron nhân
tạo đầu tiên thường được gọi là nơron M-P, nó còn được gọi là phần tử xử lý và
được ký hiệu là PE (Processing Element).
Mô hình nơron nhân tạo cơ bản có n đầu vào x1, x2, ..., xn, và một đầu ra yi như
sau:
x1
w
i1
Hàm chuyển
x2
w
f()
.
.
.
.
xm
i2
.
.
.
w
Đầu ra
Hàm tổng
im
i
Đầu
Trọng số liên kết
Ngưỡng
Hình 1.2. Cấu trúc mô hình một nơron nhân tạo cơ bản
vào
yi
5
Một nơron thực hiện nhiệm vụ rất đơn giản là: nó nhận tín hiệu từ các đơn vị
phía trước hay một nguồn bên ngoài và sử dụng chúng để tính tín hiệu ra sẽ được
lan truyền sang các đơn vị khác. Trong đó:
- Tập các đầu vào, được ký hiệu là xi , là các tín hiệu vào của nơron, các tín
hiệu này thường được đưa vào dưới dạng một vector n chiều.
- Tập các liên kết (các trọng số) tương ứng với các đầu vào, những trọng số
này tương ứng với các Synapse trong noron sinh học. Mỗi liên kết được thể hiện bởi
một trọng số (thường được gọi là trọng số liên kết). Trọng số liên kết giữa tín hiệu
vào thứ j cho nơron i thường được ký hiệu là wij. Thông thường các trọng số này
được khởi tạo ngẫu nhiên ở thời điểm khởi tạo mạng và được cập nhật liên tục trong
quá trình học mạng. Nếu w > 0 thì nơron đang ở trạng thái kích thích, ngược lại w <
0 thì nơron đang ở trạng thái kiềm chế.
- Độ lệch hay ngưỡng, được ký hiệu là b, là tham số điều chỉnh vô hướng của
nơron. Thường được đưa vào như là một thành phần của hàm chuyển.
Ta thấy w và b đều là các tham số điều chỉnh vô hướng của nơron. Ý tưởng cơ
bản của mạng nơron là điều chỉnh các tham số này để mạng đạt được mục đích
mong muốn.
- Hàm tổng, được ký hiệu là ∑ , thường dùng để tính tổng của tích các đầu vào
với trọng số liên kết của nó.
- Hàm kích hoạt hay còn gọi là hàm chuyển, được ký hiệu là f, hàm này dùng
để giới hạn phạm vi đầu ra của mỗi nơron. Nó nhận đầu vào là kết quả của hàm
tổng và ngưỡng đã cho. Thông thường, phạm vi đầu ra của mỗi nơron được giới
hạn trong đoạn [0,1] hoặc [-1,1]. Các hàm chuyển rất đa dạng, có thể là các hàm
tuyến tính hoặc phi tuyến. Việc lựa chọn hàm chuyển tùy thuộc vào từng bài toán và
kinh nghiệm của người thiết kế mạng.
- Đầu ra, được ký hiệu là y: Là tín hiệu đầu ra của một nơron, với mỗi nơron sẽ
có tối đa một đầu ra.
Tổng quát ta có với vector nhập x = (x1, x2,…xn), trọng số
6
w = (w11, w12,…,w1n), ngưỡng b và hàm chuyển f. Tổng đối số và ngưỡng tạo
ở đầu ra m là:
m = w11*x1 + w12*x2+…+w1n*x+b
(1.1)
Hay m = w*x+b
(1.2)
Vậy véctơ đầu ra có giá trị: yi = f(w*x+b)
(1.3)
Hàm chuyển hay còn gọi là hàm phi tuyến, chuyển đổi một tổ hợp tuyến tính
của tất cả các tín hiệu đầu vào thành tín hiệu đầu ra. Hàm chuyển này đảm bảo tính
chất phi tuyến cho tính toán mạng nơron. Nó được xem như là một hàm giới hạn, nó
giới hạn phạm vi biên độ cho phép của tín hiệu đầu ra trong một khoảng giá trị hữu
hạn.
Một số dạng hàm chuyển thường được sử dụng:
Hàm bước nhảy
1 khi x 0
0 khi x 0
f ( x)
(1.4)
Hàm giới hạn chặt (hay còn gọi là hàm bước)
1 khi x 0
1 khi x 0
f ( x) sgn( x)
(1.5)
Hàm bậc thang
f ( x) sgn( x)
1 khi
x 1
x khi 0 x 1
0 khi
x
(1.6)
0
Hàm ngưỡng đơn cực
f ( x)
1
1 e
x
với λ>0
(1.7)
với λ>0
(1.8)
Hàm ngưỡng hai cực
f ( x)
2
1 e
x
1
7
* Đồ thị các dạng hàm chuyển được biểu diễn như sau:
Hình 1.3. Đồ thị các dạng hàm chuyển
1.1.3.2. Mô hình mạng Nơron nhân tạo
Mạng nơron gồm một số lượng lớn các đơn vị xử lý kết nối với nhau hoạt
động song song và cấu hình nên kiểu kiến trúc của hệ thống. Do mô phỏng cách
thức hoạt động của nơron thần kinh, nên mạng nơron có khả năng học, tái tạo, tổng
quát hóa từ dữ liệu đã được huấn luyện.
Đơn vị tạo nên mạng nơron là các nút. Các nút này sẽ nằm ở các lớp (Layer)
khác nhau. Mỗi lớp có một nhiệm vụ riêng:
- Lớp vào (Input layer): nhận dữ liệu đầu vào, các nút thuộc lớp vào gọi là nút
vào.
- Lớp ra (Output layer): kết xuất dữ liệu, các nút thuộc lớp ra gọi là nút ra.
- Lớp ẩn (Hidden layer): lớp này có thể có hoặc không, tùy loại mạng. Số
lượng lớp ẩn của một nơron cũng tùy theo người thiết kế mạng. Các nút thuộc lớp
ẩn gọi là nút ẩn.
8
x1
y2
x2
y3
x3
Lớp vào
Lớp ẩn
Lớp ra
Hình 1.4. Mô hình mạng nơron 3 lớp
Mỗi nút trong lớp vào nhận giá trị của biến độc lập và chuyển vào mạng. Các
nút trong lớp ẩn nhận dữ liệu từ nút vào “tổng trọng hóa” chuyển tín hiệu cho lớp
ra. Các nút tại lớp xuất cũng tổng trọng hóa tín hiệu nhận từ lớp ẩn. Mỗi nút trong
lớp ra tương ứng với một biến phụ thuộc. Mỗi cung liên kết trong mạng nơron đều
có một trọng số riêng.
Số lượng biến độc lập, biến phụ thuộc mà nơron cho phép là tùy ý. Đồng thời,
mạng nơron làm việc được trên cả biến định lượng lẫn các biến lớp. Mạng nơron
hoạt động ở hai trạng thái:
- Học
- Ánh xạ
Trong trạng thái học, tập dữ liệu mẫu đưa vào mạng bao gồm cả giá trị đầu vào
lẫn giá trị kết xuất của các biến phụ thuộc. Thông tin nhập được đưa vào mạng. Các
dữ liệu được tính toán và cho ra kết quả xuất. Kết quả xuất này của mạng được so
sánh với kết quả xuất thực được cho trong tập mẫu để rút ra sai số. Sai số này được
lan truyền ngược trở lại các nút ra, nút ẩn, để các nút này điều chỉnh lại các trọng số
của mình. Quá trình lan truyền theo hai chiều này được tiến hành nhiều lần, cho đến
khi sai số chấp nhận được: nghĩa là trọng số các nút trong mạng đã đúng: mạng
được luyện xong.
Khi mạng được huấn luyện xong, thì người ta có thể dùng mạng cho các mục
đích của mình. Nghĩa là bây giờ, đưa dữ liệu các biến độc lập vào mạng sẽ cho giá
trị các biến phụ thuộc cần xác định.
9
1.1.3.3. Các luật học
Thông thường, mạng nơron được điều chỉnh hoặc được huấn luyện để hướng
các đầu vào riêng biệt đến đích ở đầu ra. Cấu trúc huấn luyện mạng được chỉ ra ở
hình dưới. Ở đây, hàm trọng số của mạng được điều chỉnh trên cơ sở so sánh đầu ra
với đích mong muốn (taget), cho tới khi đầu ra của mạng phù hợp với đích. Những
cặp vào/đích (input/taget) được dùng để giám sát cho sự huấn luyện mạng.
Đích
ANN
Dữ
liệu
vào
Trọng số
wi
So sánh
Điều chỉnh
Hình 1.5. Cấu trúc huấn luyện mạng nơron
Để có được một số cặp vào/ra, ở đó mỗi giá trị vào được gửi đến mạng và giá
trị ra tương ứng được thực hiện bằng mạng là sự xem xét và so sánh với giá trị
mong muốn. Bình thường, nó sẽ tồn tại một sai số vì giá trị mong muốn không hoàn
toàn phù hợp với giá trị thực. Sau mỗi lần chạy, ta có tổng bình phương của tất cả
các sai số. Sai số này được sử dụng để xác định các hàm trọng số mới.
Sau mỗi lần chạy, hàm trọng số của mạng được sửa đổi với đặc tính tốt hơn
tương ứng với đặc tính mong muốn. Từng cặp giá trị vào/ra phải được kiểm tra và
trọng số được điều chỉnh một vài lần. Sự thay đổi các hàm trọng số của mạng sẽ
được dừng lại, nếu tổng các bình phương sai số nhỏ hơn một giá trị đặt trước, hoặc
đã chạy đủ một số lần chạy xác định (trong trường hợp này, mạng có thể không
thoả mãn yêu cầu đặt ra do sai lệch còn cao). Có hai kiểu học:
- Học tham số: là các tham số về trọng số cập nhật kết nối giữa các nơron.
- Học cấu trúc: trọng tâm là sự biến đổi cấu trúc của các mạng nơron gồm số
lượng nút và các loại liên kết.
Giả sử ma trận trọng số bao gồm tất cả các phần tử thích ứng của mạng nơron.
Nhiệm vụ của việc học tham số là tìm ra được ma trận chính xác mong muốn từ ma
10
trận giả thiết ban đầu (với cấu trúc của mạng nơron có sẵn). Để làm được điều này
thì mạng nơron phải sử dụng các trọng số điều chỉnh, với nhiều phương pháp học
khác nhau để có thể tính toán gần đúng ma trận W cần tìm đặc trưng cho mạng. Sau
đây là 3 phương pháp học:
Học có giám sát
Học có giám sát: là quá trình học có tín hiệu chỉ đạo bên ngoài d (Hình 1.6).
Trong học có giám sát, thì tại mỗi thời điểm khi đầu vào được cung cấp tới mạng
nơron, phản ứng đầu ra mong muốn d tương ứng của hệ thống được đưa ra. Ở hình
(1.6), khi mỗi đầu vào x(k) được đặt vào mạng, đầu ra mong muốn tương ứng d(k)
cũng được cung cấp tới mạng. Hiệu giữa đầu ra thực y(k) và đầu ra mong muốn d(k)
được đo trong máy phát tín hiệu lỗi. Máy này sẽ tạo ra tín hiệu lỗi cho mạng để hiệu
chỉnh các trọng số của mạng, và với các hiệu chỉnh này thì đầu ra thực sẽ tiến sát
với đầu ra mong muốn.
Hình 1.6. Học có giám sát
Học không có giám sát
Hình 1.7. Học không có giám sát
Trong phần học không có giám sát, sẽ không có thầy hướng dẫn, tức là không
có tín hiệu d cung cấp tới mạch phản hồi. Điều này cho thấy, ta sẽ không biết đầu ra
đạt giá trị gì. Với loại này, thì các nơron tự xoay xở với các dữ liệu mẫu mà nó có
được, chứ không có “thầy” gợi ý cần luyện theo hướng nào. Mạng phải tự khám phá
mẫu, đặc tính, sự tương quan hay loại đầu vào. Trong khi khám phá những đặc tính
- Xem thêm -