1
LUẬN VĂN THẠC SỸ
LỜI CAM ĐOAN
Tôi xin cam đoan bản luận văn này là kết quả nghiên cứu của bản thân
tôi dưới sự hướng dẫn của Ts.Trần Đình Khang. Nếu có gì sai phạm tôi xin
hoàn toàn chịu trách nhiệm.
Người làm cam đoan
Vũ Minh Yến
Vò minh yÕn - cntt 2003-2005
1
2
LUẬN VĂN THẠC SỸ
MỤC LỤC
Trang
DANH SÁCH BẢNG ....................................................................................... 5
DANH SÁCH HÌNH VẼ .................................................................................. 6
LỜI NÓI ĐẦU .................................................................................................. 7
LỜI CẢM ƠN ................................................................................................... 9
Chương 1. TỔNG QUAN VỀ LOGIC MÔ TẢ
1.1. Giới thiệu........................................................................................... 10
1.2. Cú pháp logic mô tả .......................................................................... 11
1.3. Ngữ nghĩa .......................................................................................... 15
1.4. Cơ sở tri thức và chuẩn hoá............................................................... 16
1.4.1. Bộ thuật ngữ (TBox) .............................................................. 17
1.4.2. Bộ quan hệ (RBox) ................................................................ 20
1.4.3. Bộ khẳng định (ABox) ........................................................... 22
1.4.4. Cơ sở tri thức .......................................................................... 22
1.5. Kiến trúc hệ logic mô tả .................................................................... 23
1.6. Các thủ tục quyết định trong logic mô tả .......................................... 24
1.7. Giải thuật tableaux ............................................................................ 27
1.8. Tổng kết chương ............................................................................... 31
Chương 2. LOGIC MÔ TẢ ỨNG DỤNG TRONG WEB NGỮ NGHĨA
2.1. Tổng quan về web ngữ nghĩa ............................................................ 33
2.1.1. Nguồn gốc và mục tiêu của web ngữ nghĩa ........................... 33
2.1.2. Web ngữ nghĩa là gì? ............................................................. 35
2.1.3. Kiến trúc của web ngữ nghĩa ................................................. 39
2.2. Nội dung xây dựng web ngữ nghĩa ................................................... 44
Vò minh yÕn - cntt 2003-2005
2
LUẬN VĂN THẠC SỸ
3
2.2.1. Chuẩn hoá các ngôn ngữ biểu diễn dữ liệu (XML) và
các siêu dữ liệu (RDF) trên Web ........................................... 44
2.2.2. Chuẩn hoá các ngôn ngữ biểu diễn Ontology cho Web
ngữ nghĩa ................................................................................ 45
2.2.3. Phát triển nâng cao Web ngữ nghĩa ....................................... 45
2.3. Logic mô tả là cơ sở logic của web ngữ nghĩa ................................. 46
2.3.1. Tại sao lại là Logic mô tả? .................................................... 48
2.3.2. Logic mô tả là cơ sở của ngôn ngữ Ontology ....................... 52
2.4. Tổng kết chương ............................................................................... 55
Chương 3. NGÔN NGỮ OWL DL
3.1. Khái niệm về ontology ...................................................................... 56
3.2. Ngôn ngữ SHOIN(D) ........................................................................ 60
3.2.1. Miền cụ thể............................................................................. 60
3.2.2. Cú pháp .................................................................................. 61
3.2.3. Ngữ nghĩa ............................................................................... 64
3.3. Ngôn ngữ OWL DL .......................................................................... 66
3.3.1. Cú pháp .................................................................................. 67
3.3.2. Ngữ nghĩa ............................................................................... 70
3.4. Tổng kết chương ............................................................................... 70
Chương 4. VÍ DỤ MINH HOẠ
4.1. Giới thiệu về công cụ PROTÉGÉ và bộ lập luận RACER .............. 71
4.1.1. Công cụ PROTÉGÉ .............................................................. 71
4.1.2. Bộ lập luận RACER .............................................................. 72
4.2. Sử dụng công cụ Protégé và bộ lập luận RACER để hỗ trợ
phát triển Web ngữ nghĩa trên cơ sở logic mô tả ............................ 73
4.2.1. Hỗ trợ xây dựng Ontology .................................................... 73
4.2.2. Truy vấn Ontology và ứng dụng trong Web ngữ nghĩa ........ 77
Vò minh yÕn - cntt 2003-2005
3
LUẬN VĂN THẠC SỸ
4
4.3. Tổng kết chương .............................................................................. 79
KẾT LUẬN .................................................................................................... 80
DANH SÁCH THUẬT NGỮ ....................................................................... 81
TÀI LIỆU THAM KHẢO ............................................................................ 83
Vò minh yÕn - cntt 2003-2005
4
5
LUẬN VĂN THẠC SỸ
DANH SÁCH BẢNG
Tên bảng
Trang
1.1. Cú pháp ngôn ngữ thuộc tính AL
12
1.2. Một số luật bổ sung
13
1.3. Các khái niệm trong gia đình
13
1.4. Cú pháp ngôn ngữ S
14
1.5. Ngữ nghĩa của các khái niệm ngôn ngữ S
15
1.6. Mở rộng các khái niệm trong gia đình
19
1.7. Luật chuyển về dạng chuẩn phủ định
27
1.8. Các luật lan truyền của ALC
28
1.9. Các luật lan truyền của ngôn ngữ S
30
3.1. Cú pháp ngôn ngữ SHOIN(D)
63
3.2. Cơ sở tri thức của SHOIN(D)
64
3.3. Ngữ nghĩa của các khái niệm SHOIN(D)
65
3.4. Các mô tả thuộc tính đối tượng OWL DL
67
3.5. Các mô tả thuộc tính lớp OWL DL
68
3.6. Các tiên đề và các sự kiện của OWL DL
69
3.7. Một Ontology ví dụ trong cú pháp trừu tượng của OWL DL
69
Vò minh yÕn - cntt 2003-2005
5
6
LUẬN VĂN THẠC SỸ
DANH SÁCH HÌNH VẼ
Hình vẽ
Trang
1.1. Kiến trúc hệ logic mô tả
23
2.1. Một đề xuất nguồn gốc Web với CERN
36
2.2. Sơ đồ phát triển tính thông minh của dữ liệu
37
2.3. Kiến trúc của Web ngữ nghĩa
39
2.4. Bộ ba RDF
41
2.5. Đồ thị RDF gồm hai mệnh đề
42
4.1. Các khái niệm của Ontology Dongvat
73
4.2. Sự phân cấp các khái niệm
74
4.3. Các thuộc tính của Ontology Dongvat
74
4.4. Các cá thể của Ontology Dongvat
74
4.5. Kiểm tra tính thoả của Ontology Dongvat
75
4.6. Thứ bậc các khái niệm trước và sau khi phân lớp
76
Vò minh yÕn - cntt 2003-2005
6
7
LUẬN VĂN THẠC SỸ
LỜI NÓI ĐẦU
Trong thời gian gần đây, logic mô tả được nhắc đến như một loại hình
biểu diễn tri thức hiệu quả. Logic mô tả cung cấp khả năng biểu diễn tri thức
thông qua các khái niệm, các quan hệ và các luật cú pháp tương ứng với khả
năng của từng ngôn ngữ. Logic mô tả ngày càng được phát triển và ứng dụng
rộng rãi trong các hệ thống ứng dụng thông minh. Một trong số những hướng
nghiên cứu chính được quan tâm dựa trên ý tưởng biểu diễn tri thức theo lĩnh
vực và phải được đặc trưng hóa thành các lớp đối tượng và mối quan hệ giữa
chúng, các lớp được sử dụng để mô tả lĩnh vực quan tâm được tổ chức theo
cấu trúc phân cấp. Bên cạnh khả năng hỗ trợ biểu diễn thông tin một cách
hiệu quả, logic mô tả còn cho phép thực hiện các dịch vụ suy diễn với độ
phức tạp tính toán phù hợp.
Cùng với các ứng dụng trong nhiều lĩnh vực như: mô hình hoá, xử lý
ngôn ngữ tự nhiên, công nghệ phần mền, y học, ... logic mô tả đang rất được
các nhà nghiên cứu quan tâm ứng dụng trong quá trình phát triển Web ngữ
nghĩa. Web ngữ nghĩa là một hệ thống Web mới đang được xây dựng với ý
tưởng quản lý hiệu quả nguồn tài nguyên khổng lồ của World Wide Web
hiện tại và trong tương lai, cho phép máy có thể hiểu được các tài nguyên và
có thể xử lý một cách tự động. Logic mô tả hỗ trợ thiết kế, tích hợp và triển
khai Ontology, mà Ontology có thể hiểu là một bộ từ vựng để biểu diễn ngữ
nghĩa tài liệu Web. Ontology có vai trò then chốt để máy có thể hiểu được tài
nguyên trên Web. Logic mô tả đóng vai trò là nền tảng logic để xây dựng các
ngôn ngữ biểu diễn Ontology và khả năng lập luận mạnh của nó đảm bảo chất
lượng của các Ontology ứng dụng trong Web ngữ nghĩa. Hiện nay đã có một
số hệ thống thử nghiệm nhằm biểu diễn ngữ nghĩa tài nguyên Web trên cơ sở
logic mô tả như: RACER, FACT, PROPÉTÉ, ...
Vò minh yÕn - cntt 2003-2005
7
8
LUẬN VĂN THẠC SỸ
Trong luận văn này, em đã tìm hiểu về logic mô tả và khả năng ứng
dụng của nó trong Web ngữ nghĩa theo bố cục như sau:
Chương 1. Tổng quan về logic mô tả. Chương này em trình bày về các
nội dung cơ bản liên quan đến logic mô tả như: cú pháp, ngữ nghĩa của các
ngôn ngữ logic mô tả cơ sở như AL, ALC, S; kiến trúc một hệ logic mô tả;
các bài toán quyết định trong logic mô tả và các thuật toán tableaux cho bài
toán thoả của ngôn ngữ ALC và ngôn ngữ S.
Chương 2. Logic mô tả ứng dụng trong Web ngữ nghĩa. Chương này
trình bày tổng quan về Web ngữ nghĩa như: nguồn gốc, vai trò, mục tiêu của
Web ngữ nghĩa; bản chất của Web ngữ nghĩa là gì; các nội dung xây dựng
Web ngữ nghĩa. Tiếp theo, là trình bày về vai trò của logic mô tả trong quá
trình xây dựng Web ngữ nghĩa.
Chương 3. Ngôn ngữ OWL. Chương này giới thiệu một ngôn ngữ biểu
diễn Ontology trên Web ngữ nghĩa (OWL DL), ngôn ngữ này sử dụng nền
tảng cơ sở là logic mô tả SHOIN(D).
Chương 4. Ví dụ minh hoạ. Chương này em đưa ra một ví dụ về hỗ trợ
của logic mô tả trong việc xây dựng, phát triển Ontology, và ứng dụng trong
Web ngữ nghĩa trên công cụ Protégé có kết hợp với bộ lập luận RACER.
Do thời gian tìm hiều và nghiên cứu về logic mô tả và về Web ngữ
nghĩa còn hạn chế nên trong luận văn còn có những thiếu sót. Em rất mong
được sự đánh giá và góp ý bổ sung của các thầy giáo, cô giáo và các bạn để
luận văn được hoàn thiện hơn.
Hà nội, ngày
tháng 11 năm 2005
HỌC VIÊN THỰC HIỆN
Vũ Minh Yến
Vò minh yÕn - cntt 2003-2005
8
9
LUẬN VĂN THẠC SỸ
LỜI CẢM ƠN
Em xin chân thành gửi lời cảm ơn đến các thày cô giáo khoa Công
nghệ thông tin trường Đại học Bách khoa Hà Nội đã giảng dạy, giúp đỡ em
trong suốt quá trình học tập tại trường.
Em xin gửi lời cảm ơn sâu sắc tới thầy giáo, Ts. Trần Đình Khang,
người đã trực tiếp hướng dẫn, chỉ bảo, giúp đỡ em hoàn thành luận văn này.
Em xin chân thành cảm ơn!
Vò minh yÕn - cntt 2003-2005
9
10
LUẬN VĂN THẠC SỸ
Chương 1
TỔNG QUAN VỀ LOGIC MÔ TẢ
1.1. Giới thiệu
Logic mô tả đầu tiên được phát triển nhằm cung cấp ý nghĩa cho các
mạng ngữ nghĩa, đã đưa ra các biểu diễn được cấu trúc và các biểu diễn này
có thể được kết hợp với các công cụ lập luận cho hiệu quả cao.
Trước đây, "logic mô tả" được đề cập đến dưới các tên khác như "ngôn
ngữ biểu diễn tri thức thuật ngữ" hay "ngôn ngữ khái niệm". Tương ứng với
từng tên là những sự quan tâm khác nhau. Với "ngôn ngữ biểu diễn tri thức
thuật ngữ", người ta muốn nói đến ngôn ngữ dùng để biểu diễn các tri thức
thông qua việc xây dựng các thuật ngữ trong miền ứng dụng. Hay với "ngôn
ngữ khái niệm", người ta lại nói tới ngôn ngữ để hình thành khái niệm. Hiện
nay, khi những chú ý được chuyển vào các tính chất nằm trong các hệ logic
thì cái tên logic mô tả đã trở nên quen thuộc.
Logic mô tả được ứng dụng đặc biệt hiệu quả trong các hệ thống thông
minh, và gần đây với ý tưởng xây dựng hệ thống web thế hệ mới: web ngữ
nghĩa, với mục đích tăng khả năng liên kết giữa các trang web và khả năng
hiểu nội dung các tài liệu web của máy tính, logic mô tả đóng vai trò là nền
tảng logic để bổ sung ngữ nghĩa và đã thu hút được sự quan tâm của rất nhiều
nhà nghiên cứu trong lĩnh vực này.
Logic mô tả cung cấp khả năng biểu diễn tri thức và suy diễn để rút ra
được các tri thức đúng đắn trong miền ứng dụng. Việc biểu diễn tri thức được
xây dựng từ các khái niệm, các quan hệ nguyên thuỷ và các luật xây dựng
khái niệm. Các luật này được gọi là ngôn ngữ xây dựng khái niệm. Bên cạnh
các khái niệm và các quan hệ còn có các khẳng định, thể hiện mối quan hệ
Vò minh yÕn - cntt 2003-2005
10
LUẬN VĂN THẠC SỸ
11
giữa các khái niệm, các quan hệ với các cá thể hay giữa các cá thể với nhau.
Logic mô tả còn cung cấp khả năng lập luận và suy diễn các tri thức được
biểu diễn ở trên. Khả năng biểu diễn tri thức tỉ lệ thuận với độ phức tạp tính
toán của các dịch vụ suy diễn của hệ logic mô tả tương ứng. Để xây dựng một
hệ thống logic mô tả người ta đã tổng kết lại ba bước quan trọng sau:
- Xác định các khái niệm từ các khái niệm nguyên thuỷ, các quan hệ
nguyên thuỷ và các cá thể ban đầu.
- Sử dụng một ngôn ngữ xây dựng khái niệm để hình thành những khái
niệm phức tạp.
- Sử dụng các thủ tục suy luận để rút ra những tri thức đúng đắn về các
khái niệm và các cá thể nếu có thể. Chủ yếu là quan hệ bao hàm giữa hai khái
niệm hoặc quan hệ giữa các cá thể và khái niệm hay giữa một cặp cá thể và
một quan hệ.
Tóm lại, logic mô tả là họ của các hệ hình thức biểu diễn tri thức cơ sở
logic, được thiết kế để biểu diễn và lập luận tri thức của một miền ứng dụng
bằng phương pháp có cấu trúc. Chúng dựa trên một họ ngôn ngữ chung được
gọi là ngôn ngữ mô tả, cung cấp một tập các toán tử để xây dựng các khái
niệm (tương ứng là các lớp) và các mô tả quan hệ (hay thuộc tính). Các mô tả
đó có thể được sử dụng trong các tiên đề và các khẳng định của cơ sở tri thức
logic mô tả và có thể được lập luận về cơ sở tri thức logic mô tả bằng các hệ
thống logic mô tả.
1.2. Cú pháp logic mô tả
Cơ sở của logic mô tả là các mô tả khái niệm và mô tả quan hệ, thường
gọi tắt là khái niệm và quan hệ. Một cách trực quan, một khái niệm biểu diễn
một lớp các đối tượng có chung một số đặc trưng, một quan hệ biểu diễn một
Vò minh yÕn - cntt 2003-2005
11
12
LUẬN VĂN THẠC SỸ
quan hệ hai ngôi giữa các đối tượng hoặc giữa các đối tượng với các giá trị dữ
liệu. Ví dụ: ConNguoi là một khái niệm, Cocon là một quan hệ.
Một ngôn ngữ mô tả bao gồm: các khái niệm (kí hiệu: C), các quan hệ
(kí hiệu:R) và các cá thể (kí hiệu: I), cùng với một tập các toán tử (các luật cú
pháp) để xây dựng các mô tả khái niệm và quan hệ còn gọi là các khái niệm,
các quan hệ phức. Như vậy, ta có thể xây dựng các khái niệm phức, các quan
hệ phức từ các khái niệm, các quan hệ cơ sở ban đầu, các khái niệm và các
quan hệ cơ sở này được gọi là các khái niệm nguyên thuỷ và các quan hệ
nguyên thuỷ. Các khái niệm và các quan hệ phức có thể được đặt tên là một
xâu vắn tắt để tiện sử dụng.
Các ngôn ngữ mô tả phân biệt với nhau bằng các luật cú pháp mà
chúng cung cấp. Ngôn ngữ mô tả đầu tiên được gọi là ngôn ngữ thuộc tính
AL, là ngôn ngữ mô tả có các luật cú pháp đơn giản nhất.
Ngôn ngữ thuộc tính AL
Họ ngôn ngữ mô tả ban đầu xuất phát từ ngôn ngữ mô tả đơn giản nhất
là ngôn ngữ thuộc tính AL. Các luật cú pháp của ngôn ngữ AL bao gồm:
C, D A
Khái niệm nguyên thuỷ
Т
Khái niệm đỉnh
Khái niệm đáy
A
Phủ định khái niệm
C⊓D
Giao khái niệm
R.C
Lượng từ với mọi
R.Т
Lượng từ tồn tại
Bảng 1.1. Cú pháp ngôn ngữ thuộc tính AL
Vò minh yÕn - cntt 2003-2005
12
13
LUẬN VĂN THẠC SỸ
Để tăng khả năng xây dựng các khái niệm phức tạp, người ta mở rộng
ngôn ngữ AL bằng cách bổ sung thêm các luật cú pháp, và mỗi luật cú pháp
mới được kí hiệu là một chữ cái được viết sau AL, khi đó ngôn ngữ mô tả mở
rộng có dạng: AL[U][][N[C].
Dạng viết
Kí hiệu
Hợp khái niệm
C⊔D
U
Lượng từ tồn tại đầy đủ
R.C
nR hoặc nR
N
C
C
Tên
Giới hạn số
Phủ định bất kỳ
Bảng 1.2. Một số luật bổ sung
Ví dụ 1.1. Mô tả lại cách sử dụng các luật cú pháp trên để xây dựng các
khái niệm phức hợp, đó là các khái niệm trong gia đình. Trong đó, có sử dụng
hai khái niệm nguyên thuỷ là con người "ConNguoi", giống cái "GiongCai"
và sử dụng một quan hệ nguyên thuỷ là có con "cocon".
Nu
ConNguoi ⊓ GiongCai
Nam
ConNguoi ⊓ Nu
Me
Nu ⊓ cocon.ConNguoi
Cha
Nam ⊓ cocon.ConNguoi
ChaMe Cha ⊔ Me
⊓
Ba
Me ⊓ cocon.ChaMe
Ong
Cha ⊓ cocon.ChaMe
Bảng 1.3. Các khái niệm trong gia đình
Vò minh yÕn - cntt 2003-2005
13
14
LUẬN VĂN THẠC SỸ
Ngôn ngữ S
Trong các ngôn ngữ logic mô tả gần đây, người ta coi ngôn ngữ S
thường được sử dụng như là ngôn ngữ tối thiểu, nó tương đương với ngôn
ngữ ALCR+ theo quy ước ở trên. Có nghĩa là ngôn ngữ S có các luật cú pháp
của ALC và có bổ sung thêm các tiên đề quan hệ bắc cầu.
Cú pháp của ngôn ngữ S như sau:
C, D A
Khái niệm nguyên thuỷ
Т
Khái niệm đỉnh
Khái niệm đáy
C (C)
Phủ định bất kỳ
C⊓D
Giao khái niệm
C⊔D (U)
Hợp khái niệm
R.C
R.C ()
Lượng từ với mọi
Lượng từ tồn tại đầy đủ
Bảng 1.4. Cú pháp ngôn ngữ S
Các khái niệm trong Bảng 1.3 cũng thuộc ngôn ngữ S.
Ngôn ngữ S cho phép xây dựng các khái niệm từ các quan hệ nguyên
thuỷ và các khái niệm nguyên thuỷ nhưng không cung cấp các toán tử để xây
dựng những quan hệ phức hợp của S. Các ngôn ngữ được mở rộng từ ngôn
ngữ S bằng cách bổ sung thêm các luật cú pháp để tăng khả năng biểu diễn
của ngôn ngữ mô tả, và các ngôn ngữ đó được gọi là họ ngôn ngữ S. Họ ngôn
ngữ S bao gồm: SH, mở rộng với các tiên đề bao hàm quan hệ; SHI, mở rộng
Vò minh yÕn - cntt 2003-2005
14
15
LUẬN VĂN THẠC SỸ
từ SH và bổ sung thêm các quan hệ đảo; SHf: mở rộng từ SH với các tiên đề
quan hệ hàm (f); SHIO, mở rộng từ SH với các nominal (O) và các quan hệ
đảo (I); SHOIN, mở rộng từ SHIO với các lượng tử số (N), ...
1.3. Ngữ nghĩa
Bên cạnh việc định nghĩa ra các khái niệm, ta cũng cần phải có một
cách hiểu "có ngữ nghĩa" về từng khái niệm được tạo ra. Ngữ nghĩa của khái
niệm trong logic mô tả có được nhờ vào các phép thông dịch.
Định nghĩa 1.1. Mỗi phép thông dịch, kí hiệu là I, là một cặp ( I , .I). Trong
đó, I là một tập khác rỗng, còn .I là một hàm dịch. Hàm dịch .I biến mỗi
khái niệm A thành một tập AI I, biến mỗi quan hệ hai ngôi R thành một
quan hệ RI I I, biến một cá thể i thành iI là một phần tử thuộcI.
Đối với các khái niệm phức tạp trong ngôn ngữ S, hàm dịch được định
nghĩa như sau:
Cú pháp
Ngữ nghĩa
Т
I
A
AI I
C (C)
I \ CI
C⊓D
C⊔D (U)
R.C
CI DI
CI DI
{xI | y. RI yCI}
R.C () {xI | y. RI yCI}
Bảng 1.5. Ngữ nghĩa của các khái niệm ngôn ngữ S
Bảng 1.5 chỉ ra cách hàm dịch được mở rộng để đưa lại ngữ nghĩa cho
các khái niệm ngôn ngữ S.
Vò minh yÕn - cntt 2003-2005
15
16
LUẬN VĂN THẠC SỸ
Ví dụ 1.2: Diễn dịch một khái niệm ngôn ngữ S.
Cho khái niệm nguyên thuỷ: Thucvat (thực vật) và các quan hệ nguyên
thuỷ: an (ăn), motphancua(một phần của), thuộc ngôn ngữ S. Từ Bảng 1.4 ta
có an. ( Thucvat ⊔ motphancua.Thucvat) là một khái niệm của S.
Cho I(I, .I) là mô hình của: an. (Thucvat ⊔ motphancua. Thucvat)
với I={Ganesh, Balavan, co, qua} và hàm dịch .I được định nghĩa bởi:
Thucvat I ={co1}
anI ={, }
motphancuaI =
Chúng ta sẽ tìm ngữ nghĩa cho khái niệm
an. (Thucvat ⊔ motphancua. Thucvat)
Áp dụng Bảng 1.5 ta có:
( motphancua. Thucvat)I =
(Thucvat ⊔ motphancua.Thucvat)I = ThucvatI ( motphancua.Thucvat)I = {co1}
an.(Thucvat ⊔ motphancua.Thucvat)I={ Ganesh, Balavan, co1, qua1}
Lưu ý rằng Blavan, co, qua không quan hệ với bất kỳ cái gì thông qua
quan hệ an, theo định nghĩa của lượng tử với mọi đầy đủ (bảng 1.4) tất cả
chúng là các cá thể thuộc khái niệm an. (Thucvat ⊔ motphancua. Thucvat).
1.4. Cơ sở tri thức và chuẩn hoá
Đặc trưng của một cơ sở tri thức gồm hai thành phần là: tri thức nội
hàm ( bộ thuật ngữ và bộ quan hệ - TBox và RBox) và tri thức mở rộng (bộ
khẳng định - ABox). Tri thức nội hàm là tri thức tổng quát về các khái niệm,
Vò minh yÕn - cntt 2003-2005
16
LUẬN VĂN THẠC SỸ
17
các quan hệ, các luật cú pháp để xây dựng các khái niệm và quan hệ phức của
miền ứng dụng. Còn tri thức mở rộng là tri thức về các tình huống cụ thể.
1.4.1. Bộ thuật ngữ (TBox)
Một cách trực quan, một TBox là một tập các mệnh đề biểu diễn mối
quan hệ của các khái niệm với nhau. Ví dụ:
(ConNguoi ⊓ GiongCai ⊓ cocon.ConNguoi ) ⊐ Chame
Một TBox được định nghĩa một cách hình thức như sau:
Định nghĩa 1.2. Cho L là một hệ logic mô tả, C, D là các khái niệm của L,
một TBox (T) là một tập hữu hạn, có thể rỗng của các mệnh đề có dạng C ⊐
D, được gọi là các bao hàm khái niệm.Và CD được gọi là tương đương khái
niệm, là sự ước lược của C ⊐ D và D ⊐ C. Các mệnh đề trong T được gọi là
các tiên đề thuật ngữ.
Một tương đương khái niệm nếu vế trái là một tên khái niệm mới, chỉ
xuất hiện không quá một lần bên vế trái (được gọi là ký hiệu tên) trong các
tiên đề của TBox và vế phải là một biểu thức các khái niệm (ký hiệu gốc) thì
được gọi là một định nghĩa khái niệm.
Về mặt ngữ nghĩa: Một diễn dịch I được gọi là thoả bao hàm khái
niệm C ⊐ D hay I là mô hình của C ⊐ D (kí hiệu là I |= C ⊐ D) nếu CI DI
và I thoả một tương đương khái niệm CD nếu CI=DI. Một diễn dịch I thoả
một TBox T (kí hiệu: I |= T) nếu nó thoả mãn tất cả các tiên đề thuật ngữ
trong T, I là mô hình của TBox.
Thuật ngữ trong TBox có thể chứa chu trình. Một chu trình thuật ngữ
trong một TBox là một bao hàm khái niệm đệ quy, ví dụ:
Connguoi ⊐ Cochame.Connguoi hay một hoặc nhiều bao hàm khái niệm
Vò minh yÕn - cntt 2003-2005
17
18
LUẬN VĂN THẠC SỸ
đệ quy như: {Connguoi ⊐ Cochame.Me, Me ⊐ Cocon.Connguoi}. Tuy
nhiên, nếu ta có hai khái niệm A,B C và {A⊐B, B⊐A} thì đây không phải là
chu trình thuật ngữ mà tương đương với một tương đương khái niệm AB.
Lập luận của một cơ sở tri thức với sự có mặt của TBox sẽ phức tạp
hơn nhiều khi không có mặt của TBox, đặc biệt là TBox có chứa chu trình.
Xét TBox không chứa chu trình, để lập luận được dễ dàng hơn, người
ta thực hiện chuẩn hoá TBox.
Chuẩn hoá TBox
Một TBox được chuẩn hoá khi tất cả các tiên đề trong TBox đều ở dạng
định nghĩa khái niệm. Như vậy, để TBox được chuẩn hoá, ta thay các bao
hàm khái niệm bằng các định nghĩa khái niệm. Cụ thể, nếu có bao hàm khái
niệm C ⊐ D ta sẽ thay bằng một định nghĩa khái niệm C C ⊓D với C là một
khái niệm nguyên thuỷ mới được thêm vào.
Ví dụ 1.3:
Giả sử ta có một bao hàm khái niệm: Nu ⊐ Connguoi, ta thay bằng
một định nghĩa khái niệm:
Nu= Nu ⊓ Connguoi , trong đó khái niệm Nu là
một khái niệm nguyên thuỷ mới được thêm vào, đặc trưng cho những tính
chất để có thể phân biệt một người phụ nữ (ứng với khái niệm Nu) trong các
đối tượng là con người (tương ứng với khái niệm Connguoi), do đó khái niệm
Nu có thể đặt lại là Giongcai, khi đó ta có:
Nu=Giongcai
⊓ Connguoi, và
khái niệm Giongcai là khái niệm nguyên thuỷ mới được thêm vào.
Đối với một TBox không chứa chu trình, quá trình chuẩn hoá sẽ dừng
sau một số hữu hạn bước và quá trình này cũng được gọi là quá trình mở rộng
Vò minh yÕn - cntt 2003-2005
18
19
LUẬN VĂN THẠC SỸ
bộ thuật ngữ. Việc mở rộng bộ thuật ngữ là đúng đắn nếu bộ thuật ngữ sau
tương đương với bộ thuật ngữ ban đầu và thoả mãn các mệnh đề sau:
Mệnh đề 1.1
Gọi T là một bộ thuật ngữ không chứa chu trình và T' là bộ thuật ngữ
mở rộng của nó, khi đó:
- T và T' có cùng các ký hiệu tên và các ký hiệu gốc.
- T và T' tương đương nhau.
Ví dụ 1.4: Mở rộng bộ thuật ngữ trong Bảng 1.3.
Nu
ConNguoi ⊓ GiongCai
Nam
ConNguoi ⊓
Me
Cha
(ConNguoi ⊓ GiongCai)
(ConNguoi ⊓ GiongCai) ⊓ cocon.ConNguoi
ConNguoi ⊓ (ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi
ChaMe (ConNguoi ⊓
(ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi) ⊔ ((ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi)
Ba
(ConNguoi ⊓ GiongCai) ⊓ cocon.ConNguoi ⊓
cocon. ((ConNguoi ⊓
(ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi) ⊔ ((ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi))
Ong
ConNguoi ⊓
(ConNguoi ⊓ GiongCai) ⊓
cocon.ConNguoi ⊓ cocon. ((ConNguoi ⊓
Bảng
1.5. Mở rộng
các khái niệm
gia đình
(ConNguoi
⊓ GiongCai)
⊓ trong
cocon.ConNguoi)
⊔
((ConNguoi ⊓ GiongCai) ⊓ cocon.ConNguoi))
Bảng 1.6. Mở rộng các khái niệm trong gia đình
Vò minh yÕn - cntt 2003-2005
19
LUẬN VĂN THẠC SỸ
20
Cơ sở lý thuyết để đảm bảo sự đúng đắn về ngữ nghĩa cho quá trình
chuẩn hoá được thể hiện trong mệnh đề sau
Mệnh đề 1.2. Gọi T là một bộ thuật ngữ không có chu trình và T là bộ thuật
ngữ chuẩn hoá của nó, khi đó:
- Mọi mô hình của T cũng là mô hình của T
- Với mỗi mô hình I của T có một mô hình I của T mà có cùng miền
với I và chấp nhận I về các khái niệm và các luật trong T.
1.4.2. Bộ quan hệ (RBox)
Một cách trực quan, một bộ quan hệ (RBox) là một tập các mệnh đề về
các đặc trưng của các quan hệ. Một RBox có thể bao gồm các mệnh đề xác
nhận rằng một quan hệ là hàm, hoặc bắc cầu hay trong một mối quan hệ bao
hàm. Ví dụ: một người thì có nhiều nhất một người cha, ta có thể nói quan hệ
Cocha là một quan hệ hàm; giả sử ta có: "x có tổ tiên là y, y có tổ tiên là z, do
đó x có tổ tiên là z", khi đó ta nói quan hệ cototien là quan hệ bắc cầu; tương
tự ta có một tiên đề quan hệ bao hàm như: coCha⊐ cototien.
Một bộ quan hệ được định nghĩa một cách hình thức như sau:
Định nghĩa 1.3. Cho L là một logic mô tả, N, S R là các quan hệ nguyên
thuỷ, R1, R2 là các quan hệ của L, một RBox (R) là một tập hữu hạn có thể
rỗng các mệnh đề có dạng:
- Func(N) hoặc N F, trong đó F R là một tập các quan hệ hàm,
hoặc
- Trans(S) hoặc S R+ , trong đó R+ R là một tập các quan hệ bắc
cầu, hoặc
Vò minh yÕn - cntt 2003-2005
20
- Xem thêm -