Đăng ký Đăng nhập
Trang chủ Giáo dục - Đào tạo Cao đẳng - Đại học Kiến trúc xây dựng ứng dụng hệ trợ giúp quyết định dự báo lượng khán giả xem truyền hình tại tiền g...

Tài liệu ứng dụng hệ trợ giúp quyết định dự báo lượng khán giả xem truyền hình tại tiền giang

.PDF
83
9
116

Mô tả:

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG TRẦN NAM HÙNG ỨNG DỤNG HỆ TRỢ GIÚP QUYẾT ĐỊNH DỰ BÁO LƯỢNG KHÁN GIẢ XEM TRUYỀN HÌNH TẠI TIỀN GIANG LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2017 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG TRẦN NAM HÙNG ỨNG DỤNG HỆ TRỢ GIÚP QUYẾT ĐỊNH DỰ BÁO LƯỢNG KHÁN GIẢ XEM TRUYỀN HÌNH TẠI TIỀN GIANG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT Người hướng dẫn khoa học: PGS.TS. PHAN HUY KHÁNH Đà Nẵng - Năm 2017 i LỜI CAM ĐOAN Tôi xin cam đoan: Những nội dung trong luận văn này được thực hiện dưới sự hướng dẫn trực tiếp của thầy PGS.TS Phan Huy Khánh. Mọi tham khảo đều được trích dẫn rõ ràng và trung thực,bao gồm: tên tác giả, tên công trình, thời gian, địa điểm công bố. Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo tôi xin chịu trách nhiệm. Tác giả Trần Nam Hùng ii TÓM TẮT LUẬN VĂN ỨNG DỤNG HỆ TRỢ GIÚP QUYẾT ĐỊNH DỰ BÁO LƯỢNG KHÁN GIẢ XEM TRUYỀN HÌNH TẠI TIỀN GIANG Trần Nam Hùng, học viên cao học khóa 31, chuyên ngành Khoa học máy tính Tóm tắt – Truyền hình ngày nay phát triển vượt bậc, từ công nghệ sản xuất chương trình đến các hạ tầng phát sóng nhằm đưa các chương trình truyền hình tiếp cận với khán giả một cách dễ dàng. Tuy nhiên, việc thống kê và dự đoán lượng khán giả xem một chương trình cụ thể và khung giờ nhất định luôn gặp khó khăn. Điều này đã cản trở việc tiếp cận các nguồn tài trợ, quảng cáo đồng thời không xác định được khung giờ phát sóng hiệu quả cho một chương trình nhất định. Hiện nay, có một vài công ty sử dụng phần cứng gắn trực tiếp vào máy thu hình của hộ gia đình, nhược điểm chi phí lớn, số lượng thiết bị đo chỉ lắp đặt tại các thành phố lớn với số lượng ít. Nghiên cứu này đề xuất ý tưởng việc đo lường khán giả một cách ít tốn kém, dành cho các đài truyền hình địa phương bằng cách dựa trên thói quen, sở thích và độ tuổi của khán giả. Hệ trợ giúp quyết định sẽ đưa ra các trợ giúp bằng số liệu thực tế cho từng chương trình vào giờ phát cụ thể để đội ngũ biên tập quyết định hợp lý. Tác giả khảo sát thực tế và ghi nhận các số liệu cần thiết để xây dựng hệ trợ giúp quyết định và đã có kết quả khả quan. Tin rằng, đây là bước đầu xây dựng một hệ thống trợ giúp cho đài truyền hình địa phương có lịch phát sóng tối ưu một cách tiết kiệm. Từ khóa – dự đoán; hệ trợ giúp quyết định; khán giả; chương trình truyền hình; đo lường. APPLICATION THE DECISION SUPPORT SYSTEM (DSS) TO FORECAST THE NUMBER OF AUDIENCE WATCHING TELEVISION IN TIEN GIANG PROVINCE Summary: Today, Television is developing very fast, from Production technology program to Broadcast. Infrastructure, which bring TV programs to audience watching television easily. However, the Statistic and prediction of TV viewers of a program and a fixed time lot are very difficult that have hindered the collection of funding sources, Advertisement and not define the effective fixed time lot for a program. Nowadays, there are many companies use the hardware fixing direct to the home TV to do that. But it costs a lot of money. It’s just fixed in many big cities with a few. In this Essay, I propose ideas for audience measurement in less expensive for local television stations base on habit, hobby and age of the audience watching television. This system will give many help methods base on the real number of the audience watching television with every program that broadcast on the fixed time lot for the editor team making change for suitable. In order to do that, I surveyed and recorded real numbers in my local to provide the decision support system and I also received reliable results. I sure that this is the first step to build the decision support system for local television stations which has the best schedule to attractive the audience watching television. Key words: forecast, decision support system, audience watching television, Television program, measure. iii MỤC LỤC LỜI CAM ĐOAN......................................................................................................... i TÓM TẮT LUẬN VĂN .............................................................................................ii MỤC LỤC ................................................................................................................. iii DANH MỤC CÁC TỪ VIẾT TẮT............................................................................. v DANH MỤC CÁC BẢNG ......................................................................................... vi DANH MỤC CÁC HÌNH .........................................................................................vii MỞ ĐẦU ..................................................................................................................... 1 1. Tính cấp thiết của đề tài ...................................................................................... 1 2. Mục tiêu nghiên cứu ........................................................................................... 2 3. Đối tượng và phạm vi nghiên cứu ...................................................................... 2 4. Phương pháp nghiên cứu .................................................................................... 2 5. Bố cụ luận văn .................................................................................................... 3 6. Tổng quan tài liệu nghiên cứu ............................................................................ 4 CHƯƠNG 1. TÌM HIỂU CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG HỆ HỖ TRỢ QUYẾT ĐỊNH ................................................................................................... 5 1.1. Tìm hiểu tri thức và biểu diễn tri thức ............................................................. 5 1.1.1. Khái niệm về tri thức .............................................................................. 5 1.1.2. Tìm hiểu Hệ chuyên gia ......................................................................... 8 1.1.3. Biểu diễn tri thức trong hệ chuyên gia ................................................ 11 1.1.4. Các đặc trưng và ưu điểm của hệ chuyên gia ...................................... 16 1.2. Kho dữ liệu (Data warehouse) ....................................................................... 18 1.2.1. Khái niệm ............................................................................................. 18 1.2.2. Cấu trúc của một hệ thống kho dữ liệu ................................................ 18 1.2.3. Hệ thống cập nhật, quản lý kho dữ liệu ................................................ 19 1.3. Khai phá dữ liệu ............................................................................................. 19 1.3.1. Khái niệm ............................................................................................. 19 1.3.2. Ứng dụng của khai phá dữ liệu ............................................................ 21 1.3.3. Các chức năng chính của khai phá dữ liệu ........................................... 22 1.4. Hệ trợ giúp quyết định ................................................................................... 22 1.4.1. Ý nghĩa ................................................................................................. 22 1.4.2. Lý do dùng DSS ................................................................................... 23 1.4.3. Năng lực của DSS ................................................................................ 24 1.4.4. Các thành phần của DSS ...................................................................... 26 CHƯƠNG 2. PHÂN TÍCH HIỆN TRẠNG KHAI THÁC CHƯƠNG TRÌNH TRUYỀN HÌNH ĐÀI TIỀN GIANG........................................................................ 28 iv 2.1. Phát biểu vấn đề ............................................................................................. 28 2.1.1. Một số khái niệm .................................................................................. 28 2.1.2. Nền tảng cho đề tài ............................................................................... 30 2.1.3. Các đài truyền hình có phủ sóng tại Tiền Giang .................................. 33 2.1.4. Giải pháp của Hệ trợ giúp quyết định................................................... 34 2.2. Nhu cầu và thói quen của khán giả truyền hình ............................................. 36 2.2.1. Đối tượng.............................................................................................. 36 2.2.2. Phân loại khán giả ................................................................................ 36 2.3. Đài PT-TH Tiền giang và các đài cạnh tranh ................................................ 38 2.3.1. Khảo sát khán giả Tiền Giang về thói quen xem truyền hình .............. 38 2.3.2. Đánh giá về khung giờ cho chương trình: ............................................ 39 2.4. Giải pháp suy luận bài toán ............................................................................ 40 2.5. Ví dụ về dự đoán một khung giờ .................................................................. 43 CHƯƠNG 3. CÀI ĐẶT THỬ NGHIỆM CHƯƠNG TRÌNH DỰ ĐOÁN LƯỢNG KHÁN GIẢ TRUYỀN HÌNH TẠI TIỀN GIANG ................................................... 47 3.1. Dữ liệu cho bài toán ....................................................................................... 47 3.1.1. Nguồn dữ liệu tư vấn ............................................................................ 47 3.1.2. Nhu cầu cần trợ giúp của ban biên tập ................................................. 47 3.1.3. Nhu cầu cần trợ giúp của bộ phận kinh doanh ..................................... 47 3.1.4. Các nội dung đề xuất của bộ phận sản xuất chương trình .................... 48 3.1.5. Mô hình dữ liệu cho bài toán............................................................... 49 3.2. Xây dựng hệ thống ......................................................................................... 50 3.3. Cài đặt chương trình ...................................................................................... 53 3.3.1. Môi trường phát triển ........................................................................... 53 3.3.2. Cài đặt chương trình ............................................................................. 54 3.3.3. Chạy chương trình ................................................................................ 58 3.3.4. Kịch bản sử dụng .................................................................................. 60 3.4. ĐÁNH GIÁ KẾT QUẢ ................................................................................. 61 KẾT LUẬN ............................................................................................................... 64 TÀI LIỆU THAM KHẢO ......................................................................................... 65 PHỤ LỤC QUYẾT ĐỊNH GIAO ĐỀ TÀI. BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN. v DANH MỤC CÁC TỪ VIẾT TẮT Tiếng Việt Chữ viết tắt STT Nghĩa từ viết tắt 1 HCG Hệ chuyên gia 2 CSDL Cơ sở dữ liệu 3 THTG Truyển hình Tiền Giang 4 VTV Truyền hình Việt Nam 5 HTV Truyền hình TP.Hồ Chí Minh 6 THVL Truyền hình Vĩnh Long 7 CTTH Chương trình truyền hình Tiếng Anh STT Chữ viết tắt Chữ đầu đủ Dịch nghĩa 1 2 KB DW Knowledge base Data wasehouse Cơ sở tri thức Kho dữliệu 3 AI Artifical intelligent Trí tuệ nhân tạo 4 KDD 5 DSS 6 1 DM KB Knowlegde Discovery Phát hiện tri thức trong in Data CSDL Decision support system Data mining Knowledge base Hệ thống trợ giúp quyết định Khai phá dữ liệu Cơ sở tri thức vi DANH MỤC CÁC BẢNG Số hiệu Tên bảng bảng 1.1. 1.2. 2.1. Một số lĩnh vực ứng dụng diện rộng của các hệ chuyên gia Đối sánh giữa DSS và EDP(electronic data processing) (Alter 1980) Số liệu về dân số và diện tích các huyện thị thành trên địa bàn tỉnh Tiền Giang Trang 10 23 30 3.1. Vài chương trình có khán giả đặc trưng 48 3.2. Bảng tập huấn luyện dữ liệu 49 3.3. Bảng mô tả trường dữ liệu sau khi xử lý 50 3.4. Dữ liệu lượng khán giả xem truyền hình khung giờ 18h3020h30 50 3.5. Tập dữ liệu huấn luyện khung giờ 18h30-20h30 51 3.6. Tri thức kết hợp khung giờ 18h30-20h30 52 3.7. Lựa chọn thể loại phát của chuyên viên 62 vii DANH MỤC CÁC HÌNH Số hiệu Tên hình Trang hình 1.1. Sơ đồ tổng quát hệ chuyên gia 6 1.2. Thành phần hệ chuyên gia 8 1.3. Hệ chuyên gia nhận dạng 9 1.4. Nền tảng của công nghệ hệ chuyên gia dựa trên luật hiện đại 13 1.5. Sai sót trong khi phát triển hệ chuyên gia 14 1.6. Những thành phần cơ bản của một hệ chuyên gia 15 1.7. Quan hệ giữa máy suy diễn và cơ sở tri thức 16 1.8. Mô hình data warehouse 3 lớp 19 1.9. Các bước trong Data Mining & KDD 21 1.10. Hệ trợ giúp quyết định 24 1.11. Thành phần hệ hỗ trợ giúp quyết định 26 2.1. 2.2. Bản đồ hành chính tỉnh Tiền Giang Mô hình cho bài toán Hệ trợ giúp quyết định Dự báo lượng khán giả xem truyền hình 30 40 2.3. Biểu độ đo lượng khán giả lý tưởng 43 2.4. Biểu độ đo lượng khán giả thực tế 45 2.5. Biểu độ đo thành phần khán giả 46 3.1. Mô hình cas sử dụng hệ trợ giúp 47 3.2. Hệ thống giao tiếp người dùng với hệ trợ giúp 53 3.3. Nạp dữ liệu vào Weka 54 3.4. Giao diện tư vấn THTG nếu VTV chiếu phim Trung quốc 59 3.5. 3.6. 3.7. Giao diện tư vấn THTG nếu VTV chiếu cai lương; THVL chiếu phim Trung quốc Giao diện tư vấn THTG nếu VTV phim việt nam; THVL chiếu phim Việt Nam Giao diện tư vấn THTG nếu VTV chiếu cai lương; THVL chiếu ca nhạc 59 60 60 1 MỞ ĐẦU 1. Tính cấp thiết của đề tài Truyền hình đã trở thành phương tiện truyền thông không thể thiếu đối với hầu hết các hộ gia đình (HGĐ) ở khu vực thành thị cho đến nông thôn. Tỉ lệ HGĐ sở hữu ít nhất một máy truyền hình vẫn vượt xa các phương tiện truyền thông khác như: máy radio, đầu chơi băng/đĩa, dàn nghe nhạc… Tuy nhiên trong những năm gần đây, các Đài truyền hình trong khu vực nói chung và đặt biệt là Đài truyền hình tỉnh Tiền Giang (THTG) nói riêng phải cạnh tranh từ các Đài truyền hình xung quanh về chất lượng chương trình và nguồn thu từ quảng cáo. Đã có nhiều cuộc nghiên cứu và đo nhu cầu xem truyền hình bằng thiết bị phần cứng từng hộ gia đình của cả nước đặc biệt ở các thành phố lớn như Hà Nội, Hồ Chí Minh, Đà Nẵng hay Cần Thơ để cho ra cái nhìn tổng quát trong việc xây dựng các chương trình truyền hình phù hợp. Các phương thức khảo sát này luôn tốn kém vì vậy đối với các Đài địa phương cấp tỉnh đây là chi phí rất lớn. Đối với Đài phát thanh và truyền hình Tiền Giang (THTG) cũng nằm trong tình trạng tương tự. Với việc ngành công nghệ thông tin đã có nhiều ứng dụng rộng rãi trong tất cả các ngành của xã hội. Việc ứng dụng công nghệ thông tin để phân tích, dự đoán lượng người xem truyền hình đã trở nên dễ dàng và giảm chi phí hơn. Đây cũng là một ứng dụng mới mà hiện nay chưa được chú trọng tại các đài phát thanh và truyền hình ở Việt Nam. Phương thức được tổng quát như sau, khảo sát bằng biểu mẫu dựa trên thói quen, nhu cầu, vị trí, công việc và độ tuổi từ đó suy diễn các khung giờ cho các chương trình truyền hình. 2 2. Mục tiêu nghiên cứu - Đưa ra một hệ trợ giúp quyết định dự báo lượng khán giả xem truyền hình và đưa ra chương trình phát sóng có lượng khán giả tốt nhất. - Tìm hiểu các thể loại truyền hình, khung giờ phát sóng, cách thức sản xuất chương trình truyền hình ... - Tìm hiểu về nhu cầu, thói quen khán giả cho từng độ tuổi, vị trí địa lý, nghề nghiệp. - Nghiên cứu về Hệ trợ giúp quyết định, hệ thống dữ liệu, công cụ lập trình... - Tìm hiểu giải pháp và xây dựng. - Cài đặt thử nghiệm. - Đánh giá, nhận xét. 3. Đối tượng và phạm vi nghiên cứu 3.1. Đối tượng nghiên cứu: - Thu thập dữ liệu bằng biểu mẫu từ khán giả tại địa bàn Tiền Giang.. - Nghiên cứu thói quen, sở thích, vị trí địa lý, học vấn, nghề nghiệp khán giả xem truyền hình. - Thông tin cơ bản về các chương trình truyền hình (CTTH): 3.2. Phạm vi nghiên cứu - Đề tài được nghiên cứu và xây dựng trên địa bàn Tiền Giang nhằm đáp ứng nhu cầu của Đài PT-TH Tiền Giang. - Nghiên cứu Hệ trợ giúp quyết định và công cụ lập trình. 4. Phương pháp nghiên cứu 4.1. Phương pháp nghiên cứu tài liệu - Tham khảo và nghiên cứu tài liệu khai phá tri thức, trích rút thông tin, hỗ trợ ra quyết định. - Sử dụng hệ thống cơ sở dữ liệu của THTG. - Tham khảo các công cụ: Weka, MS Exel, C#, MS SQL Server 2008 express … 3 4.2. Phương pháp thực nghiệm - Khảo sát biểu mẫu, phân tích các phương pháp khảo sát và dự đoán lượng khác giả. - Lập biểu mẫu và khảo sát. - Xây dựng giải pháp và thiết kế phần mềm. 5. Bố cụ luận văn MỞ ĐẦU CHƯƠNG 1. TÌM HIỂU HỆ TRỢ GIÚP QUYẾT ĐỊNH VÀ ỨNG DỤNG - Tìm hiểu cơ sở tri thức và ứng dụng vào một số lĩnh vực - Kho tri thức, quản lý và cập nhật kho tri thức, khai phá dữ liệu, hệ trợ giúp ra quyết định CHƯƠNG 2. TÌM HIỂU VÀ PHÂN TÍCH CÁC THÓI QUEN, SỞ THÍCH KHÁN GIẢ VÀ CHƯƠNG TRÌNH TRUYỀN HÌNH ĐÀI TIỀN GIANG - Phát biểu bài toán. - Tìm hiểu tri thức về nhu cầu khán giả - Vận dụng công nghệ tri thức để giải quyết vấn đề - Mô tả ứng dụng và mô hình dữ liệu hoạt động - Xây dựng các luật và câu truy vấn CHƯƠNG 3. CÀI ĐẶT VÀ THỬ NGHIỆM HỆ TRỢ GIÚP ỨNG DỤNG DỰ ĐOÁN LƯỢNG KHÁN GIẢ XEM TRUYỀN HÌNH TẠI TIỀN GIANG - Phân tích thiết kế hệ trợ giúp - Môi trường công cụ cài đặt - Đánh giá kết quả chương trình KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN. Tham khảo, đối chiếu và đưa ra các nhận xét về hệ thống. Giải quyết các vấn đề còn tồn tại đồng thời đưa ra hướng phát triển của đề tài trong tương lai. 4 6. Tổng quan tài liệu nghiên cứu Đề tài “Ứng dụng hệ trợ giúp quyết định dự báo lượng khán giả xem truyền hình tại Tiền Giang” cần phải tìm hiểu về các thể loại chương trình truyền hình, độ thu hút khán giả, các khung giờ phát, độ phủ sóng, cơ sở tri thức, cơ sở dữ liệu... Tuy nhiên các tài liệu về đo lường khán giả truyền hình còn hạn chế vì đây là các tài liệu được giữ kín trong kinh doanh của các nhà Đài nên yêu cầu phải trực tiếp khảo sát và ghi chú lịch phát sóng của các Đài có phát sóng trong địa bàn. Các tài liệu về hệ thống trợ giúp ra quyết định, kho dữ liệu, khai phá dữ liệu, ... sẽ được trích dẫn từ giáo trình của các thầy trường đại học Đà Nẵng và tài liệu trên internet. 5 CHƯƠNG 1 TÌM HIỂU CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG HỆ HỖ TRỢ QUYẾT ĐỊNH Chương này là cơ sở lý thuyết liên quan đến đề tài, ứng dụng cần được áp dụng. Tìm hiểu về khái niệm công nghệ tri thức, hệ chuyên gia và hệ hỗ trợ quyết định. Giới thiệu về một số ứng dụng để xây dựng hệ chuyên gia trong đó có các kỹ thuật suy luận để biểu diễn tri thức và xây dựng luật. 1.1. Tìm hiểu tri thức và biểu diễn tri thức 1.1.1. Khái niệm về tri thức Công nghệ tri thức (Knowledge Engineering): có thể xem là một nhánh nghiên cứu của trí tuệ nhân tạo, phân tích tri thức lĩnh vực và chuyển nó thành những mô hình tính toán đưa vào máy tính để phục vụ những nhu cầu cần thiết. Công nghệ tri thức: là các phương pháp, kỹ thuật được những kỹ sư tri thức (knowledge engineers) dùng để xây dựng những hệ thống thông minh như: hệ chuyên gia, hệ cơ sở tri thức, hệ hỗ trợ quyết định, v.v Công nghệ tri thức là những phương pháp, kỹ thuật dùng để:  Tiếp nhận, biểu diễn tri thức.  Xây dựng các hệ cơ sở tri thức  Khám phá tri thức Công nghệ tri thức đóng vai trò hết sức quan trọng trong việc phát triển Công nghệ thông tin, nâng cao sự hữu dụng của máy tính, giúp con người gần gũi với máy tính hơn. Công nghệ tri thức còn góp phần thúc đẩy nhiều ngành khoa học khác phát triển, khả năng phát triển khoa học dựa trên tri thức liên ngành. Một hệ chuyên gia gồm ba thành phần chính là: + Cơ sở tri thức (knowledge base). + Máy suy diễn hay môtơ suy diễn (inference engine). + Hệ thống giao tiếp với người sử dụng (user - interface). 6 MÁY TÍNH ĐẦU VÀO TIẾP NHẬN, BIỂU DIỄN, TỐI ƯU CƠ SỞ TRI THỨC ĐẦU RA CÁC HỆ KHAI THÁC DỮ LIỆU, CƠ SỞ TRI THỨC KHÁM PHÁ TRI THỨC Hình 1.1. Sơ đồ tổng quát hệ chuyên gia  Quản lý tri thức (knowledge management): bao gồm tiếp nhận, biểu diễn và tối ưu hóa cơ sở tri thức…  Các hệ cơ sở tri thức (knowledge-based systems): tìm hiểu cấu trúc bên trong của một hệ cơ sở tri thức, phân loại các hệ cơ sở tri thức, và một số hệ cơ sở tri thức điển hình.  Khai thác dữ liệu, khám phá tri thức (Data mining, knowledge discovery): nghiên cứu về phương pháp, kỹ thuật để khai phá dữ liệu và khám phá tri thức. Khi tiếp nhận tri thức có thể chia làm 2 cách: - Thụ động: . Gián tiếp: những tri thức kinh điển. . Trực tiếp: những tri thức kinh nghiệm (không kinh điển) do “chuyên gia lĩnh vực” đưa ra. - Chủ động: Đối với những tri thức tiềm ẩn, không rõ ràng hệ thống phải tự phân tích, suy diễn, khám phá để có thêm tri thức mới . - Phân loại và quản lý tri thức a. Tri thức thủ tục (producedural knowledge) là tri thức mô tả cách giải quyết một vấn đề, quy trình xử lý các công việc, lịch trình tiến hành các thao tác … Các dạng của tri thức thủ tục thường dùng là các luật, chiến lược, lịch trình… 7 VD: - Các bước giải một phương trình bậc 2; cách sử dụng một chiếc xe, cách mua 1 vé tàu … b. Tri thức mô tả (Descriptive knowledge) là một khẳng địng về một sự kiện, hiện tượng hay một khái niệm nào đó trong một hoàn cảnh không gian hoặc thời gian nhất định. Ví dụ: khẳng định về hiện tượng: ”Mặt trời lặn ở phương Tây”. Trà Vinh là tỉnh ở khu vực miền Tây nam bộ, Đà Nẵng là thủ phủ của miền Trung… c. Tri thức hiện(Explicit knowledge) là những tri thức được giải thích và mã hóa dưới dạng văn bản, tài liệu, âm thanh, phim, ảnh,… thông qua ngôn ngữ Đây là những tri thức đã được thể hiện ra ngoài và dễ dàng chuyển giao, thường được tiếp nhận qua hệ thống giáo dục và đào tạo chính quy. d. Tri thức ẩn( implicit knowledge) là những tri thức thu được từ sự trải nghiệm thực tế, dạng tri thức này thường ẩn trong mỗi cá nhân và rất khó “mã hóa” và chuyển giao, thường bao gồm: niềm tin, giá trị, kinh nghiệm, bí quyết, kỹ năng... VD: thông tin về biến động thị trường, độ cuốn hút khán giả về một bộ phim, độ lôi cuốn về một chương trình truyền hình… e. Tri thức chắc chắn (certain knowledge): là những tri thức chắc chắn đúng. VD: Nếu hết xăng thì xe máy không hoạt động được. f. Tri thức không chắc chắn(uncertain knowledge): là những khẳng định, luật suy diễn không chắc chắn đúng. VD: Nếu phim không hay và phát vào giờ không hợp lý thì không có quảng cáo. Nếu thực hiện quay phim ngoài trời mà trời mưa hoặc máy hỏng thì phải dừng… Quản lý và sử dụng tri thức là phương thức quản lý từ nền tảng quản lý thông tin đã được tập hợp, xử lý, lưu trữ, chia sẻ và sử dụng. 8 1.1.2. Tìm hiểu Hệ chuyên gia Khái niệm về hệ chuyên gia Hệ chuyên gia, còn gọi là hệ thống dựa tri thức, là một chương trình máy tính chứa một số tri thức đặc thù của một hoặc nhiều chuyên gia con người về một chủ đề cụ thể nào đó. Bộ xử lý ngôn ngữ tự nhiên Giải thích Cơ sơ tri thức Động cơ suy diễn Tìm kiếm Điều khiển Vùng nhớ làm việc Sự kiện Tiếp nhận tri thức Luật Người chuyên gia Hình 1.2. Thành phần hệ chuyên gia Trong đó 2 thành phần quan trọng nhất là Cơ sở tri thức và động cơ suy diễn. - Cơ sở tri thức là nơi lưu trữ biểu diễn các tri thức mà hệ đảm nhận, làm cơ sở cho các hoạt động của hệ. Cơ sở tri thức bao gồm các sự kiện và các luật. - Động cơ suy diễn: là quá trình trong hệ chuyên gia cho phép khớp các sự kiện trong vùng nhớ làm việc với các tri thức về các lĩnh vực trong cơ sở tri thức, để rút ra các kết luận về các vấn đề đang giải quyết. Ngoài ra còn có các bộ xử lý ngôn ngữ tự nhiên, bộ giải thích WHY-HOW, vùng nhớ làm việc, bộ tiếp nhận tri thức và người chuyên gia (kĩ sư tri thức).  Một ví dụ về chuyên gia: nhân diện dạng động vật Hệ nhận dạng một số động vật sử dụng cơ sở tri thức người dùng dựa trên các sự kiện người dùng đưa vào thông qua các phiên hỏi đáp. Hệ chuyên gia sẽ sử dụng 9 một động cơ suy diễn thích hợp để kết hợp các sự kiện người dùng đưa vào đó với các luật đã được xây dựng sẵn để tìm được mục tiêu thích hợp. Có thể xây dựng một kiến trúc như sau: Cơ sở tri thức Máy suy diễn Bộ câu UI hỏi Yêu cầu của người dùng Hình 1.3. Hệ chuyên gia nhận dạng Một cas làm việc gồm: - Mục tiêu cần giải quyết - Danh sách các câu hỏi cần được trả lời cho đến khi vấn đề được giải quyết. - Phản hồi từ người dùng. Phản hồi từ người dùng là sự lựa chọn câu trả lời có hoặc không có sự kiện đó cho câu hỏi đang được hỏi Mô hình suy diễn Hệ nhận dạng động vật đưa ra kết luận đó là động vật gì dựa trên các đặc điểm (thuộc tính) nổi bật của nó. (Các thuộc tính này được xây dựng sẵn trong phần cơ sở tri thức). Đối với mỗi thuộc tính, hệ sẽ ghi nhận giá trị có hay không có thuộc tính đó thông qua câu trả lời của người dùng, và đưa ra kết luận về con vật đó dựa trên các đặc tính mà nó có. Hệ sử dụng suy diễn tiến dựa trên các luật để tìm được đáp án. Biểu diễn tri thức: Tri thức của hệ nhận dạng động vật gồm tập các sự kiện (gồm các đặc điểm của động vật), tập luật và các câu hỏi cho người dùng. Ví dụ cho các sự kiện:”Da nó không có vảy”; “Nó biết nhảy”; “Nó có vảy tròn”; “Nó không có vảy tròn”… 10 Các luật được biểu diễn gồm 2 mệnh đề mỗi luật, dạng luật dẫn if….then. Ví dụ, con vật đó là tê giác nếu nó thỏa mãn các sự kiện: nó là động vật máu nóng , nó là động vật uống sữa, nó không ăn thịt, nó có móng guốc, nó không có móng guốc và móng có lớp mạ bảo vệ . Các câu hỏi cho người dùng để lấy các sự kiện được xây dựng sẵn dựa trên luật. Cách thức suy diễn Bằng cách chứng minh đó là con vật nào là dựa trên cơ sở tri thức và sự lựa chọn có hay không thuộc tính mà thỏa mãn yêu cầu của người dùng. Một số lĩnh vực ứng dụng của hệ chuyên gia Cho đến nay, hàng trăm hệ chuyên gia đã được xây dựng và đã được báo cáo thường xuyên trong các tạp chí, sách, báo và hội thảo khoa học. Ngoài ra còn các hệ chuyên gia được sử dụng trong các công ty, các tổ chức quân sự mà không được công bố vì lý do bảo mật. Bảng 1.1. Một số lĩnh vực ứng dụng diện rộng của các hệ chuyên gia Lĩnh vực Ứng dụng diện rộng Cấu Tập hợp thích đáng những thành phần của một hệ thống hình(Configuration) theo cách riêng Chẩn đoán (Diagnosis) Lập luận dựa trên những chứng cứ quan sát được Truyền đạt (Instruction) Giải thích(Interpretation) Kiểm tra (Monitoring) Lập kế hoạch(Planning) Dạy học kiểu thông minh sao cho sinh viên có thể hỏi vì sao (why?), như thế nào (how?) và cái gì nếu (what if?) giống như hỏi một người thầy giáo Giải thích những dữ liệu thu nhận được So sánh dữ liệu thu lượm được với dữ liệu chuyên môn để đánh giá hiệu quả Lập kế hoạch sản xuất theo yêu cầu Dự đoán (Prognosis) Dự đoán hậu quả từ một tình huống xảy ra Chữa trị (Remedy) Chỉ định cách thụ lý một vấn đề Điều khiển (Control) Điều khiển một quá trình, đòi hỏi diễn giải, chẩn đoán, kiểm tra,lập kế hoạch, dự đoán và chữa trị 11 1.1.3. Biểu diễn tri thức trong hệ chuyên gia a. Biểu diễn tri thức bởi các luật - Hầu hết các hệ chuyên gia đều là các hệ thống dựa trên luật. - Luật là một kiểu sản xuất được nghiên cứu từ những năm 1940. Trong một hệ thống dựa trên luật, công cụ suy luận sẽ xác định những luật nào là tiên đề thỏa mãn các sự việc. - Các luật sản xuất thường được viết dưới dạng IF THEN. - Có hai dạng: IF <điều kiện> THEN Hoặc IF <điều kiện> THEN DO - Tùy theo hệ chuyên gia cụ thể mà mỗi luật có thể được đặt tên. Chẳng hạn Rule: tên. Sau phần tên là phần IF của luật. - Phần giữa IF và THEN là phần trái luật, được gọi theo nhiều tên như tiền đề, điều kiện, mẫu so khớp. - Phần sau THEN là kết luận hay hậu quả. Một số hệ chuyên gia có thêm phần hành động gọi là phần phải luật. Ví dụ: IF . Phim phát giờ không hợp lý OR . Phim ít người xem, AND . Ít quảng cáo THEN - Không có doanh thu DO quảng bá chương trình và xem lại giờ phát sóng. b. Biểu diễn tri thức nhờ mệnh đề logic - Người ta sử dụng các ký hiệu để thể hiện tri thức và các phép toán logic tác động lên các ký hiệu để thể hiện suy luận logic. Kỹ thuật chủ yếu thường được sử dụng là logic vị từ. Ví dụ: Phim truyện là thể loại giải trí. Vị từ : GIAITRI(phim) c. Biểu diễn tri thức nhờ mạng ngữ nghĩa
- Xem thêm -

Tài liệu liên quan