NGUYỄN XUÂN THỊNH – NGÀNH CÔNG NGHỆ THÔNG TIN – KHÓA 2003
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
------------------------------------------------------
LUẬN VĂN THẠC SỸ KHOA HỌC
XÂY DỰNG HỆ SUY DIỄN MỜ TRÊN CƠ SỞ
MẠNG THÍCH NGHI
NGÀNH: CÔNG NGHỆ THÔNG TIN
NGUYỄN XUÂN THỊNH
HÀ NỘI - 2005
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
------------------------------------------------------
LUẬN VĂN THẠC SỸ KHOA HỌC
XÂY DỰNG HỆ SUY DIỄN MỜ TRÊN CƠ SỞ
MẠNG THÍCH NGHI
NGÀNH: CÔNG NGHỆ THÔNG TIN
NGUYỄN XUÂN THỊNH
Người hướng dẫn khoa học: TS.TRẦN ĐÌNH KHANG
HÀ NỘI - 2005
LỜI CẢM ƠN
Trước tiên, em xin chân thành cảm ơn Ban giám hiệu, các thầy cô trường
ĐHBK Hà Nội, đặc biệt các thầy cô khoa Công Nghệ Thông Tin và Trung tâm đào
tạo sau đại học đã tận tình dạy dỗ và giúp đỡ chúng em trong suốt những năm học
qua.
Tiếp đến, em xin gửi lời cảm ơn chân thành nhất đến thầy giáo, Ts. Trần
Đình Khang. Thầy đã cho em một định hướng đúng đắn cho đề tài của mình và
luôn tận tình theo dõi, hướng dẫn em trong quá trình thực hiện đề tài.
Cuối cùng, em xin gửi lời cảm ơn sâu sắc tới gia đình, người thân, bạn bè,
những người đã luôn ủng hộ và tạo mọi điều kiện cho em hoàn thành luận văn này.
Hà Nội, tháng 11/2005
Học viên
Nguyễn Xuân Thịnh
2
MỤC LỤC
LỜI CẢM ƠN ..........................................................................................................1
MỤC LỤC................................................................................................................2
DANH MỤC BẢNG ................................................................................................3
DANH MỤC HÌNH VẼ ..........................................................................................3
MỞ ĐẦU .................................................................................................................5
CHƯƠNG I – TỔNG QUAN VỀ HỆ MỜ ............................................................8
1.1 Lịch sử phát triển ..........................................................................................8
1.2 Các khái niệm cơ bản dùng trong logic mờ ...................................................9
1.2.1 Định nghĩa tập mờ ......................................................................................9
1.2.2 Các phép toán đại số trên tập mờ .............................................................10
1.2.3 Biểu diễn các hàm thuộc ..........................................................................11
1.2.4. Các phép toán mở rộng của tập mờ.........................................................13
1.2.5 Số mờ ......................................................................................................15
1.2.6 Nguyên lý suy rộng của Zadeh ................................................................15
1.3 Suy luận xấp xỉ .............................................................................................16
1.3.1 Biến ngôn ngữ ..........................................................................................16
1.3.2 Luật mờ IF-THEN....................................................................................17
1.3.3 Giải mờ .....................................................................................................18
1.4 Hệ suy diễn mờ ..............................................................................................20
1.4.1
Hệ suy diễn mờ Mamdani ...................................................................24
1.4.2
Hệ suy diễn mờ Tsukamoto ................................................................25
1.4.3
Hệ suy diễn mờ Takagi-Sugeno ..........................................................26
1.4.4
Đặc tính và phạm vi ứng dụng ............................................................28
1.5 Kết luận ......................................................................................................29
CHƯƠNG II - MẠNG NƠNRON NHÂN TẠO ................................................30
2.1 Mạng nơron ..................................................................................................30
2.1.1
Mô hình một nơron sinh học ...............................................................31
2.1.2
Mô hình một nơron nhân tạo...............................................................32
2.2 Mạng nơron nhân tạo ....................................................................................34
2.2.1
Lớp mạng ............................................................................................34
2.2.2
Cấu trúc của mạng nơron nhân tạo .....................................................35
2.2.3
Thủ tục học của mạng .........................................................................37
2.3 Sức mạnh của mô hình mạng nơron...............................................................40
2.4 Các phạm vi ứng dụng ...................................................................................40
2.5 Mạng thích nghi..........................................................................................41
2.5.1 Kiến trúc và luật học cơ sở.......................................................................42
2.5.2 Luật học lai - Học gián tiếp (Off-Line Learning ) ...................................44
2.5.3 Luật học lai - Học trực tiếp (On-Line Learning) .....................................48
2.6 Kết luận ........................................................................................................48
CHƯƠNG III – TÍCH HỢP MẠNG NƠRON VÀ HỆ MỜ..............................50
3.1 So sánh hệ mờ và mạng nơron, lý do tích hợp ................................................50
3
3.2 Các hướng tiếp cận kết hợp mạng nơron với hệ mờ ......................................52
3.2.1
Mạng nơron mờ...................................................................................53
3.2.2
Mô hình nơron-mờ hợp tác .................................................................57
3.2.3
Mô hình nơron-mờ lai .........................................................................58
3.3 Mô hình nơron-mờ trên cơ sở hệ suy diễn mờ. ..........................................60
3.3.1 Hệ nơron-mờ trên cơ sở hệ suy diễn mờ Mamdani ................................60
3.3.2 Hệ nơron-mờ trên cơ sở hệ suy diễn mờ Takegi-Sugeno .......................62
3.4 Mạng ANFIS ..............................................................................................63
3.4.1
Kiến trúc hệ suy diễn mờ dựa trên mạng thích nghi ...........................64
3.4.2
Thuật toán học lai................................................................................68
3.4.3
Xác định các tham số học thích nghi ..................................................70
3.5 Kết luận ...........................................................................................................71
CHƯƠNG IV - ỨNG DỤNG HỆ SUY DIỄN MỜ TRÊN CƠ SỞ MẠNG
THÍCH NGHI TRONG BÀI TOÁN PHÂN LỚP..............................................72
4.1 Phát biểu bài toán ............................................................................................72
4.2 Ứng dụng hệ ANFIS trong bài toán phân lớp. ................................................75
4.2.2 Giới thiệu chương trình mô phỏng hệ ANFIS .........................................76
4.2.3 Xây dựng hệ thống ...................................................................................80
4.2.4 Kết quả thử nghiệm ..................................................................................81
4.2.5 Đánh giá hệ thống ....................................................................................83
4.3 Kết luận ...........................................................................................................84
KẾT LUẬN ............................................................................................................85
TÀI LIỆU THAM KHẢO ....................................................................................87
DANH MỤC BẢNG
Bảng 3.1 So sánh hệ mờ và mạng nơron ...................................................................51
Bảng 3.2 Hai pha trong thủ tục học lai cho hệ ANFIS. ...........................................69
DANH MỤC HÌNH VẼ
Hình 1.1 Hàm thuộc: (a) Tam giác, (b) Hình thang ..................................................11
Hình 1.2 Hàm thuộc hình chuông .............................................................................12
Hình 1.3: Các tập mờ điển hình dùng để định nghĩa biến ngôn ngữ tuổi đời ...........17
Hình 1.4
Phương pháp giải mờ điểm cực đại ....................................................19
Hình 1.5 Phương pháp giải mờ điểm trọng tâm ........................................................19
Hình 1.6: Hệ suy diễn mờ .........................................................................................20
Hình 1.7: Sơ đồ hoạt động suy diễn của một hệ suy diễn mờ...................................22
Hình 1.8: Hệ suy diễn mờ điển hình sử dụng min và max lần lượt cho các phép
toán AND và OR mờ .........................................................................................23
Hình 1.9: Hệ suy diễn mờ sử dụng phép hợp thành Product-Max lần lượt cho phép
toán AND và OR mờ .........................................................................................24
Hình 1.10: Hệ suy diễn mờ Tsukamoto ....................................................................25
Hình 1.11: Hệ suy diễn mờ Takagi - Sugeno ............................................................26
Hình 1.12: Sử dụng các luật mờ if-then và kỹ thuật suy luận mờ ............................27
4
Hình 2.1 Cấu tạo của một nơron sinh học ................................................................31
Hình 2.2 Một nơron nhân tạo .................................................................................32
Hình 2.3: Ví dụ về một lớp có 5 nơron .....................................................................35
Hình 2.4: Mạng nơron nhiều lớp ...............................................................................35
Hình 2.5 Mạng hồi quy ............................................................................................36
Hình 2.6: Sơ đồ học có giám sát ...............................................................................38
Hình 2.7: Sơ đồ học tăng cường................................................................................39
Hình 2.8: Sơ đồ học không có giám sát ....................................................................39
Hình 2.9: Mạng thích nghi ........................................................................................42
Hình 3.1 Cấu trúc hệ nơron-mờ Mamdani ..............................................................60
Hình 3.2 Cấu trúc hệ nơron-mờ Takegi-Sugeno .......................................................62
Hình 3.3: Lập luận mờ ..............................................................................................65
Hình 3.4: Kiến trúc hệ ANFIS ..................................................................................65
Hình 3.5 (a) Mạng ANFIS với 9 luật; (b) Tương ứng với không gian mờ ...............68
Hình 3.6: Hai luật heuristic cho cập nhật kích thước k .............................................70
Hình 4.1: Lược đồ chung của mô hình nhận dạng ....................................................73
Hình 4.2: Hộp thoại cho phép mô tả hệ ANFIS ........................................................77
Hình 4.3: Kết quả phân lớp của hệ ANFIS ...............................................................78
Hình 4.4: Hộp thoại cho phép ta lựa chọn số hàm thuộc, loại hàm thuộc cho các
biến ....................................................................................................................78
Hình 4.5: Cấu trúc của một hệ ANFIS ......................................................................79
Hình 4.6: Cấu trúc các luật của một hệ ANFIS ........................................................79
Hình 4.7: Biểu diễn các tập mờ của biến đầu vào .....................................................79
Hình 4.8: Kết quả phân lớp bộ số liệu IRIS ..............................................................82
Hình 4.9: Kết quả phân loại bộ số liệu WBC............................................................83
5
MỞ ĐẦU
Chúng ta đều biết rằng bộ não con người là một sản phẩm hoàn hảo của tạo
hóa, nó có khả năng tư duy và sáng tạo cao. Hiện nay con người đang cố gắng tiếp
cận bộ não của mình theo nhiều phương pháp khác nhau. Để mô phỏng khả năng
học, người ta đưa ra mô hình mạng nơron nhân tạo (nghiên cứu về mặt số học – chỉ
các đặc tính sinh lý của bộ não). Nhằm diễn tả khả năng tư duy của bộ não, người ta
sử dụng các hệ mờ trên cơ sở logic mờ để suy diễn (tìm hiểu việc sử dụng ngôn ngữ
tự nhiên - chỉ các đặc tính tâm lý của bộ não).
Từ hai thập kỷ gần đây, lý thuyết mờ và mạng nơron nhân tạo đã phát triển rất
nhanh và đa dạng. Công nghệ mờ và công nghệ mạng nơron đã cung cấp những giải
pháp mới cho các ngành công nghiệp làm ra nhiều sản phẩm thông minh, đáp ứng
nhu cầu thị trường cần có những bộ điều khiển linh hoạt hơn, những thiết bị “biết”
làm việc với những bài toán khó, phải xử lý nhiều thông tin mập mờ, không đầy đủ,
thiếu chính xác và là hai trụ cột chính của công nghệ tính toán mềm.
Cả hai kỹ thuật này đều có những ưu điểm và nhược điểm riêng, do đó một
cách tiếp cận đầy hứa hẹn sẽ thu được nhiều ưu điểm của các hệ mờ và mạng nơron
là kết hợp chúng lại thành một hệ tích hợp. Có nhiều cách tiếp cận để tích hợp mạng
nơron với hệ mờ, tùy thuộc vào từng ứng dụng và quan điểm của các chuyên gia –
điều này vẫn chưa được thống nhất với nhau. Nhưng về cơ bản sự hợp nhất của hai
kỹ thuật này có thể thực hiện theo ba hướng chính sau:
Các hệ mờ nơron (Neural fuzzy systems): Mục đích của các hệ này hướng
vào việc cung cấp cho hệ mờ các khả năng điều chỉnh tự động. Mạng nơron
dùng để học và điều chỉnh các tham số (luật, trọng số luật, các hàm thuộc)
của hệ mờ. Kỹ thuật học mạng nơron làm giảm đáng kể thời gian và chi phí
phát triển của hệ mờ, đồng thời làm tăng hiệu năng của hệ mờ.
Mạng nơron mờ (Fuzzy neural networks): Là mô hình sử dụng các phương
thức mờ để tăng cường khả năng học và hiệu suất của mạng nơron. Thực
chất, mạng nơron mờ là một mạng nơron được mờ hóa. Mỗi phần của mạng
6
nơron (các hàm kích hoạt, hàm kết hợp, các trọng số, dữ liệu vào ra..), mỗi
mô hình mạng nơron, và các giải thuật học mạng nơron đều có thể được mờ
hóa. Trong mạng nơron mờ các tham số điều khiển và các trọng số liên kết
có thể được thay thế bằng các tham số mờ. Mạng nơron mờ có tốc độ huấn
luyện cao hơn, và mạnh mẽ hơn mạng nơron thông thường.
Các hệ nơron-mờ lai (Hybrid neuro-fuzzy systems): Đây là kiến trúc mới
trong đó mạng nơron và hệ mờ được kết hợp trong một kiến trúc thuần nhất.
Kiến trúc này có nhiều mô hình khác nhau. Một số mô hình dùng kiểu học
tăng cường (reinfocement learning), thích hợp cho các nhiệm vụ điều khiển.
Một số khác dùng giải thuật học có giám sát (supervised learning), thích hợp
cho các bài toán phân tích dữ liệu.
Các nghiên cứu về sự tích hợp mạng nơron với hệ mờ vẫn còn là một vấn đề
mở và thời sự. Vì vậy luận văn đi vào tìm hiểu, nghiên cứu các hướng kết hợp chính
giữa hai công nghệ. Trong đó tập trung đi sâu nghiên cứu, phân tích những ưu điểm
và hạn chế của hệ suy diễn mờ và mạng thích nghi làm cơ sở để xây dựng hệ suy
diễn mờ trên cơ sở mạng thích nghi. Phần cuối trình bày một ứng dụng của hệ suy
mờ trên cơ sở mạng thích nghi trong bài toán phân lớp .
Báo cáo sẽ được trình bày trong 4 chương như sau:
Chương I - Tổng quan về hệ mờ.
Chương này sẽ giới thiệu những kiến thức cơ bản về lý thuyết tập mờ và đi
sâu tìm hiểu hệ suy diễn mờ cùng các đặc tính và ứng dụng của hệ.
Chương II - Mạng nơ ron nhân tạo
Hệ thống lại những kiến thức cơ bản về mạng nơron, các kiến trúc, thuộc
tính, khả năng học và các ứng dụng của mạng cùng các thuật toán học. Trong
đó, chúng ta tập trung vào mô tả cấu trúc và các thuật toán học của mạng
thích nghi.
• Chương III – Tích hợp mạng nơron và hệ mờ
7
Chương này ta sẽ phân tích các ưu, nhược điểm của hệ mờ và mạng nơron, lý
do tích hợp, giới thiệu một số mô hình nơron-mờ: mạng nơơrron mờ, hệ
nơron- mờ hợp tác, hệ nơron-mờ lai. Trọng tâm chính của chương là nghiên
cứu xây dựng hệ suy diễn mờ trên cơ sở mạng thích nghi cùng thuật toán học
lai của hệ.
• Chương IV - Ứng dụng hệ suy diễn mờ trên cơ sở mạng thích nghi trong
bài toán phân lớp
Chương này sẽ đi tập trung vào việc mô tả một ứng dụng của hệ suy diễn mờ
trên cơ sở mạng thích nghi trong việc giải quyết bài toán phân lớp dữ liệu.
Luận văn tốt nghiệp
8
Chương I: Tổng quan về hệ mờ
CHƯƠNG I – TỔNG QUAN VỀ HỆ MỜ
Chương này nhằm hệ thống lại một số kiến thức về lý thuyết tập mờ, trong
đó, đi sâu tìm hiểu hệ suy diễn mờ. Những kiến thức này được sử dụng trong
chương III của luận văn tốt nghiệp và có thể tìm thấy trong các tài liệu về hệ mờ
[1], [2], [5].
1.1
Lịch sử phát triển
Năm 1965, Lotfi Zadeh, giáo sư về lý thuyết hệ thống, trường Đại học
Berkeley, bang California công bố bài báo đầu tiên về Logic mờ ở Mỹ. Từ đó lịch
sử phát triển của lý thuyết mờ theo trình tự phát minh ở Mỹ, xây dựng và hoàn
chỉnh ở châu Âu và ứng dụng vào thị trường Nhật Bản.
Các ứng dụng của logic mờ trong công nghiệp đầu tiên ở châu Âu. Năm
1970, ở Anh, Ebrahim Mamdani sử dụng logic mờ điều khiển máy phát chạy bằng
hơi nước, mà trước đây không thể điều khiển bằng phương pháp kinh điển được. Ở
Đức, Hans Zimmerman bắt đầu sử dụng logic mờ trong các hệ thống hỗ trợ ra quyết
định. Năm 1980, lý thuyết mờ được ứng dụng nhiều trong phân tích dữ liệu và hỗ
trợ ra quyết định ở châu Âu.
Dù châu Âu có những ứng dụng lý thuyết mờ đầu tiên, nhưng người Nhật lại
dẫn đầu về thương mại hoá các ứng dụng lý thuyết mờ, đặc biệt là trong lĩnh vực kỹ
thuật điều khiển kể từ năm 1980. Năm 1983, công ty Fuji Electric ứng dụng lý
thuyết mờ trong nhà máy xử lý nước. Năm 1987, công ty Hitachi ứng dụng trong hệ
thống xe điện ngầm. Lý thuyết mờ phát triển mạnh ở Nhật vì lý thuyết này hỗ trợ
việc tạo ra các mô hình nguyên mẫu nhanh, dễ dàng tối ưu hoá, hệ thống mờ đơn
giản, dễ hiểu, hơn nữa lại được sự quan tâm hỗ trợ của Chính phủ. Với các kết quả
nghiên cứu ứng dụng, lý thuyết mờ được sử dụng trong mọi lĩnh vực về xử lý số
liệu, điều khiển thông minh, trong các hệ thống hỗ trợ ra quyết định.
Các nghiên cứu gần đây về việc kết hợp giữa mạng nơron và logic mờ là
bước phát triển tiếp theo của công nghệ này và mở ra nhiều ứng dụng.
Luận văn tốt nghiệp
1.2
9
Chương I: Tổng quan về hệ mờ
Các khái niệm cơ bản dùng trong logic mờ
1.2.1 Định nghĩa tập mờ
Trong mục này chúng tôi sẽ giới thiệu những khái niệm cơ bản và các ký
hiệu toán học của lý thuyết tập mờ. Trước hết ta hãy quan niệm rằng những tập mờ
như là một sự tổng quát hoá những tập rõ cổ điển bằng cách chuyển miền giá trị của
hàm thuộc từ {0,1} thành đoạn đơn vị [0,1].
Một tập (rõ) cổ điển là một tập hợp các đối tượng riêng biệt. Nó được định
nghĩa theo cách chia đôi các phần tử của một không gian nền cho trước thành hai
nhóm: nhóm thành viên và nhóm không thành viên. Từ đó, một tập hợp rõ có thể
được định nghĩa bởi một hàm đặc trưng của tập hợp đó.
Gọi U là không gian nền. Hàm đặc trưng µ A (x) của một tập hợp rõ A trên U
nhận giá trị 0 hoặc 1, nó nhận giá trị 1 nếu x là một phần tử của A ( x ∈ A ) và nhận
giá trị 0 trong trường hợp ngược lại. Nghĩa là:
1
0
µ A ( x) =
if
if
x∈ A
x∉ A
(1.1)
Như vậy biên của một tập hợp rõ là hoàn toàn xác định khi chúng ta định
nghĩa nó, và không gian nền U luôn là một tập rõ.
Một tập mờ, trái lại, biểu diễn sự mập mờ bằng cách thay thế biên xác định
của tập hợp rõ (ranh giới phân tách giữa nhóm thành viên và nhóm không thành
viên). Vì thế sự chuyển tiếp giữa tính chất thành viên và không thành viên không
phải đột ngột mà biến đổi từ từ. Chính vì vậy mà tập mờ có thể được xem như là
một sự mở rộng những ý tưởng cơ bản của tập hợp rõ.
Định nghĩa 1.1
Tập mờ A trên không gian nền U nếu A được xác định bởi hàm
µ A : X → [0,1]
µ A gọi là hàm thuộc (membership function) còn µ A (x) gọi là độ thuộc của x vào
tập mờ A.
Kí hiệu tập mờ A trên không gian nền U như sau:
Luận văn tốt nghiệp
Chương I: Tổng quan về hệ mờ
10
A = {( µ A ( x) | x) : x ∈ U }
(1.2)
Ví dụ 1.1:
Gọi không gian nền U là tập số thực R và A là tập các số thực lớn hơn hoặc bằng 5,
A là một tập hợp rõ. Khi đó chúng ta có:
A = {( µ A ( x) | x) : x ∈ U },
trong đó hàm đặc trưng là:
0
1
µ A ( x) =
x<5
x≥5
B là tập các số thực gần 5, B là một tập mờ. Khi đó chúng ta có:
B = {( µ B ( x) | x) : x ∈ U }
trong đó hàm liên thuộc là:
µ B ( x) =
1
1 + 10( x − 5) 2
1.2.2 Các phép toán đại số trên tập mờ
Định nghĩa 1.2: Cho A và B là hai tập mờ trên không gian nền U, có các hàm thuộc
µ A , µ B . Khi đó phép hợp A∪ B , phép giao A∩ B là hai tập mờ với các hàm thuộc
Phép hợp:
µ A ∪ B ( x) = max { µ A ( x), µ B ( x)} = µ A ( x) ∨ µ B ( x)
ở đây
(1.3)
là kí hiệu phép toán max, và ta có:
Phép giao:
µ A ∩ B ( x) = min { µ A ( x), µ B ( x)}= µ A ( x) ∧ µ B ( x)
ở đây
(1.4)
là kí hiệu phép toán min, và ta có:
Phép lấy phần bù A C là tập mờ với hàm thuộc:
µ A ( x) =1 − µ A ( x)
(1.5)
C
Phép tương đương:
và
là tương đương khi và chỉ khi
Luận văn tốt nghiệp
11
Chương I: Tổng quan về hệ mờ
(1.6)
Tập con: A là tập con của B, kí hiệu A ⊆ B khi và chỉ khi
(1.7)
1.2.3 Biểu diễn các hàm thuộc
Để biểu diễn các hàm thuộc chúng ta có thể sử dụng các hàm tham số sau:
- Hàm thuộc dạng tam giác: Hàm thuộc dạng tam giác là một hàm thuộc với ba
tham số định nghĩa bởi
Hình 1.1(a) là hàm thuộc dạng tam giác với các tham số (x,20,60,80)
- Hàm thuộc dạng hình thang: Hàm thuộc dạng hình thang là hàm với bốn tham
số được định nghĩa bởi
Hình 1.1(b) là hàm thuộc dạng hình thang với các tham số (x,10,20,60,95)
Theo hình vẽ này chúng ta có thể thấy hàm thuộc dạng tam giác là một dạng đặc
biệt của hàm thuộc dạng hình thang, cả hai hàm thuộc dạng này đều hay được sử
dụng trong thực tế
Hình 1.1 Hàm thuộc: (a) Tam giác, (b) Hình thang
- Hàm thuộc Gauss: Hàm thuộc Gauss là hàm thuộc với 2 tham số được định nghĩa
bởi:
Luận văn tốt nghiệp
ở đây
là tâm và
12
Chương I: Tổng quan về hệ mờ
là trọng số của hàm thuộc
- Hàm thuộc hình chuông: Hàm thuộc hình chuông là hàm với hai tham số định
nghĩa bởi:
ở đây tham số b thường là dương. Giá trị của tất cả các tham số được miêu tả trong
hình 1.2
Hình 1.2 Hàm thuộc hình chuông
- Hàm thuộc sigmoid: Hàm thuộc sigmoid là một hàm với hai tham số được định
nghĩa bởi:
ở đây tham số a>0 hàm được mở sang bên phải, mặt khác nếu a<0 hàm lại được mở
sang bên trái, do vậy hàm này có thể được dùng để miêu tả các khái niệm như “rất
to” hoặc “rất nhỏ”. Hàm sigmoid thường được sử dụng trong mạng nơron như hàm
cập nhật.
Tiếp theo ta sẽ đề cập đến một số phép toán mở rộng của tập mờ.
Luận văn tốt nghiệp
13
Chương I: Tổng quan về hệ mờ
1.2.4. Các phép toán mở rộng của tập mờ
Phần này chúng ta sẽ nghiên cứu hai phép toán mở rộng là phép hội và phép
tuyển của hai tập mờ và thường được gọi là triagular norms (t-norm) và triagular
conorms (t-conorm)
• Phép hội
Phép hội (hay phép AND - conjunction) là một trong các phép toán logic cơ
bản nhất. Nó cũng là cơ sở để định nghĩa phép giao của hai tập mờ.
Để diễn đạt phép hội mờ (fuzzy conjunction) như một hàm T:[0,1]2→[0,1]
thì chúng ta định nghĩa như sau:
Định nghĩa 1.3
Hàm T: [0,1]2 → [0,1] là một t-chuẩn (chuẩn tam giác hay t-norm) nếu thỏa
mãn các điều kiện sau:
a) T (1, x) = x , với mọi 0 ≤ x ≤ 1
b) T có tính giao hoán, tức là T (x, y) = T (y, x), với mọi 0 ≤ x, y ≤ 1
c) T không giảm theo nghĩa T (x, y) ≤ T (u, v), với mọi x ≤ u, y ≤ v
d) T có tính kết hợp: T (x, T (y,z)) =T (T(x,y), z), 0 ≤ x, y , z ≤ 1
Ví dụ 1.2:
a) Dạng min (Zadeh, 1965), T(x,y) = min(x,y)
b) Dạng tích, T(x,y) = xy
c) t- chuẩn Lukasiewicz, T(x,y) = max{x+y-1,0)
min( x, y ) khi m ax( x, y ) = 1,
khi max( x, y ) < 1
0
d) t-chuẩn yếu nhất, Z ( x, y ) =
Không khó khăn để chứng minh được rằng với mỗi t- chuẩn T thì
Z(x,y) ≤ T(x,Y) ≤ min(x,y), với mọi x, y ∈ [0,1]
Định nghĩa tổng quát phép giao của hai tập mờ
Cho hai tập mờ A, B trên cùng không gian nền X với hàm thuộc
µ A ( x), µ B ( x) . Cho T là một t- chuẩn.
Định nghĩa 1.4:
Luận văn tốt nghiệp
14
Chương I: Tổng quan về hệ mờ
Ứng với t- chuẩn T, tập giao (tổng quát) của tập mờ A, B là một tập mờ
( A ∩T B ) trên X với hàm thuộc cho bởi công thức:
µ A∩ B ( x) = T ( µ A ( x), µ B ( x)) ,
T
(1.8)
với mọi x ∈ X
Việc lựa chọn phép giao nào, tức là chọn t-chuẩn nào để làm việc và tính
toán hoàn toàn phụ thuộc vào từng bài toán cụ thể mà chúng ta quan tâm.
• Phép tuyển
Giống như phép hội, phép tuyển cũng là cơ sở để định nghĩa phép hợp của
hai tập mờ. Để diễn đạt phép tuyển hay toán tử logic OR (disjunction) thông
thường cần thoả mãn các tiên đề sau:
Định nghĩa 1.5:
Hàm S: [0,1]2 → [0,1] gọi là phép tuyển (OR suy rộng) hay là t-đối chuẩn (tconorm) nếu thỏa mãn các tiên đề sau:
a) S(0, x) = x với mọi 0 ≤ x, y ≤ 1
b) S có tính giao hoán: S(x, y) = S(y, x), với 0 ≤ x, y ≤ 1
c) S không giảm : S(x, y) ≤ S(u, v), 0 ≤ x ≤ u ≤ 1 và 0 ≤ y ≤ v ≤ 1
d) S có tính kết hợp: S(x, S(y, z)) =S(S(x, y), z), với mọi 0 ≤ x, y , z ≤ 1
Định nghĩa tổng quát phép hợp của hai mệnh để
Định nghĩa 1.6
Cho X là không gian nền, A, B là hai tập mờ trên X với hàm thuộc
µ A ( x), µ B ( x) . S là t-đối chuẩn, phép hợp ( A ∪ S B ) trên X của hai tập mờ là
một tập mờ với hàm thuộc:
µ A∪ B ( x) = S ( µ A ( x), µ B ( x)) ,
S
(1.9)
với mọi x ∈ X.
Việc lựa chọn phép nào, tức là chọn t-đối chuẩn nào để xác định hàm thuộc
tương ứng phụ thuộc vào bài toán đang nghiên cứu.
Nếu chúng ta giả sử rằng T là tích đại số, S là tổng đại số chúng ta có thể
định nghĩa trường hợp đặc biệt cho hai phép toán trong (1.8) và (1.9):
Luận văn tốt nghiệp
15
Chương I: Tổng quan về hệ mờ
Và nếu T là phép toán min, S là phép toán max thì ta có:
1.2.5 Số mờ
Số mờ hay khoảng mờ dùng diễn tả khái niệm một số hay một khoảng xấp xỉ
hay gần bằng một số thực hay một khoảng số thực cho trước. Số mờ hay khoảng mờ
là tập mờ xác định trên tập số thực, ta sẽ dùng các số mờ theo định nghĩa sau:
Định nghĩa 1.7
Tập mờ M trên đường thẳng số thực R1 là một số mờ nếu:
a) M chuẩn hóa, tức là có điểm x’ sao cho µ M ( x' ) = 1
b) Ứng với mỗi α ∈ R 1 , tập mức {x : µ M ( x) ≥ α } là đoạn đóng trên R 1 .
Người ta thường dùng các số mờ dạng tam giác, hình thang và dạng hàm Gauss.
1.2.6 Nguyên lý suy rộng của Zadeh
Để làm việc với hệ thống nhiều biến vào, nguyên lý suy rộng sau đây của
Zadeh là rất quan trọng.
Định nghĩa 1.8:
Cho Ai là tập mờ với hàm thuộc µ A trên không gian nền X i với (i = 1, 2,…n).
Khi ấy tích A = A1 × ...× An là tập mờ trên không gian nền X = X 1 × ...× X n với hàm
thuộc µ A ( x) = min {µ A ( x1 ), ...., µ A ( x n ) } trong đó x = ( x1 , x 2 ,......, x n )
1
n
Xét hệ thống như hình vẽ sau:
x1 là A1
x n là A n
f
y là B
Luận văn tốt nghiệp
16
Chương I: Tổng quan về hệ mờ
Nguyên lý suy rộng của Zadeh:
Giả sử mỗi biến vào x i lấy giá trị là A i (i=1,..n) với A i là tập mờ trong không
gian X i với hàm thuộc µ A (x) . Hàm f: X → Y chuyển các giá trị đầu vào A i thành
giá trị đầu ra B. Khi đó B sẽ là tập mờ trên Y với hàm thuộc µ B (x) được tính theo
công thức sau:
max{min(µ A1 ( x),..., µ An ( x n )) : x ∈ f
µ B ( x) =
0
−1
( y )}
if f −1 ( y ) ≠ φ
if f −1 ( y ) = φ
(1.10)
trong đó
f
1.3
−1
( y ) = { x = ( x1 , x 2 ,..., x n ) ∈ X : f ( x) = y}
(1.11)
Suy luận xấp xỉ
Suy luận xấp xỉ là quá trình suy ra những kết luận mờ dưới dạng các mệnh
đề mờ trong điều kiện các quy tắc, các luật, các dữ liệu đầu vào cho trước cũng
không hoàn toàn xác định. Chúng ta sẽ lần lượt nghiên cứu các khái niệm dùng
trong suy luận xấp xỉ.
1.3.1 Biến ngôn ngữ
Một khái niệm cơ bản được đưa ra là biến ngôn ngữ (linguistic variables).
Biến ngôn ngữ là biến nhận các giá trị ngôn ngữ chẳng hạn như “già”, “trẻ”,
“trung niên”, trong đó, mỗi giá trị ngôn ngữ thực chất là một tập mờ xác định bởi
một hàm thuộc và khoảng giá trị số tương ứng, chẳng hạn giá trị ngôn ngữ “trung
niên” là một tập mờ có hàm thuộc dạng hình thang cân xác định trong khoảng độ
tuổi [30,60]. Logic mờ cho phép các tập này có thể xếp phủ lên nhau (chẳng hạn,
một người ở tuổi 58 có thể trực thuộc cả tập mờ “trung niên” lẫn tập mờ “già”, với
mức độ trực thuộc với mỗi tập là khác nhau). Hình 1.3 minh hoạ biến ngôn ngữ tuổi
đời định nghĩa bởi các giá trị ngôn ngữ thành phần là “rất trẻ”(very young),” trẻ”
(young),” trung niên” (Middle-aged),” già”(old) và “rất già” (very old).
Luận văn tốt nghiệp
17
Chương I: Tổng quan về hệ mờ
Hình 1.3: Các tập mờ điển hình dùng để định nghĩa biến ngôn ngữ tuổi đời
Một dạng suy rộng khác trong cơ sở tri thức của nhiều hệ mờ thực tiễn (ví dụ
trong các hệ điều khiển mờ) có thể được phát biểu như sau:
Cho x1 , x 2 ,..., x m là các biến vào của hệ thống, y là biến ra. Các tập
Aij , B j với i = 1, 2 ,..., m ,
j = 1,...., n là các tập mờ trong các không gian nền tương
ứng của các biến vào và các biến ra. R j là các suy diễn mờ (các luật mờ) dạng “ If
… then…”
R1 : If x1 is A1,1 and ... and x m is Am ,1 then y is B1
R2 : If x1 is A1, 2 and ... and x m is Am , 2 then y is B2
…..
Rn : If x1 is A1,n and ... and x m is Am ,n then y is Bn
Bài toán:
Cho :
Tính :
If x1 is e1* and ... and x m is em*
Giá trị y is u *
Chúng ta có thể nhận thấy rằng cốt lõi của nhiều hệ mờ cho bởi cơ sở tri thức
dạng R = {các luật Ri} là các cơ chế suy diễn cài đặt trong mô tơ suy diễn.
1.3.2 Luật mờ IF-THEN
Luật mờ if-then hay trạng thái điều kiện mờ được diễn tả theo dạng IF A
THEN B ở đây A và B là các nhãn nếu các tập mờ đặc trưng bởi các hàm thuộc xấp
xỉ. Do đó, đây là dạng viết tắt của chúng, luật mờ if-then thường được dùng để diễn
Luận văn tốt nghiệp
18
Chương I: Tổng quan về hệ mờ
tả những lập luận mơ hồ và đưa ra những quyết định trong môi trường không chắc
chắn và mập mờ như khả năng suy luận của con người. Ví dụ:
If “chiều dài là lớn” then “diện tích là rộng”
Ở đây chiều dài và diện tích là các biến ngôn ngữ, lớn và rộng là các giá trị
ngôn ngữ hoặc nhãn được đặc trưng bởi hàm thuộc.
Một dạng khác của luật mờ if-then được Takagi và Sugenno đưa ra là các tập
mờ chỉ liên quan đến phần đầu (giả thiết). Bằng việc sử dụng luật mờ if-then của
Takagi và Sugeno, chúng ta có thể mô tả một ví dụ sau:
ở đây high trong phần giả thiết là một nhãn ngôn ngữ đặc trưng bởi một hàm thuộc.
Tuy nhiên phần hậu luật được mô tả một phương trình không mờ của biến đầu ra.
Cả hai loại luật mờ này đều được sử dụng rộng rãi trong các mô hình và điều
khiển. Đây là thành phần chính trong các hệ suy diễn mờ sẽ được trình bày chi tiết
trong chương III của luận văn.
1.3.3 Giải mờ
Sau khi thực hiện xong việc tính giá trị luật hợp thành, chúng ta thu được kết
quả là tập mờ. Kết quả đó có nhiều lúc chưa phải là một giá trị thích hợp. Chẳng
hạn trong bài toán điều khiển xe máy, tuy rằng đã xác định được kết quả của luật
điều khiển là một tập mờ nhưng ta vẫn không biết được phải điều chỉnh tay ga như
thế nào, nói cách khác ta vẫn chưa biết được phải quay tay ga một góc là bao nhiêu.
Công việc xác định một góc mở cụ thể, hay nói một cách tổng quát, việc xác
định một giá trị rõ y0 từ một tập mờ µ R ( y ) , được gọi là giải mờ. Giá trị rõ tìm được
có thể xem như "phần tử đại diện xứng đáng" cho tập mờ.
Căn cứ theo những quan điểm khác nhau về phần tử đại diện xứng đáng mà
ta sẽ có các phương pháp giải mờ khác nhau. Trong điều khiển người ta thường sử
dụng hai phương pháp giải mờ chính, đó là:
• Phương pháp điểm cực đại
• Phương pháp điểm trọng tâm
- Xem thêm -