Đăng ký Đăng nhập
Trang chủ Hoang thi thao tien...

Tài liệu Hoang thi thao tien

.PDF
68
288
101

Mô tả:

Nghiên cứu hệ thống gợi ý theo ngữ cảnh và ứng dụng
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC HOÀNG THỊ THẢO TIÊN NGHIÊN CỨU HỆ THỐNG GỢI Ý THEO NGỮ CẢNH VÀ ỨNG DỤNG CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC ĐỊNH HƯỚNG NGHIÊN CỨU NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS. LÊ MẠNH THẠNH Thừa Thiên Huế, 2016 LỜI CAM ĐOAN Tôi cam đoan các kết quả nghiên cứu đưa ra trong luận văn này dựa trên các kết quả thu được trong quá trình nghiên cứu của riêng tôi, không sao chép bất kỳ kết quả nghiên cứu nào của các tác giả khác. Nội dung của luận văn có tham khảo và sử dụng một số thông tin, tài liệu từ các nguồn sách, tạp chí được liệt kê trong danh mục các tài liệu tham khảo. Học viên Hoàng Thị Thảo Tiên LỜI CẢM ƠN Tôi xin chân thành cảm ơn PGS.TS. Lê Mạnh Thạnh đã trực tiếp tận tình hướng dẫn, giúp đỡ, tạo mọi điều kiện thuận lợi cho tôi trong suốt quá trình nghiên cứu. Tôi xin gởi lời cảm ơn Quý Thầy Cô trong khoa Công nghệ thông tin trường Đại học Khoa học Huế, đã cung cấp, truyền đạt kiến thức cho tôi trong suốt quá trình học tập tại trường. Xin chân thành cảm ơn các anh chị em lớp cao học Khoa học máy tính khoá 2014-2016 và các bạn bè đã luôn bên cạnh, động viên, khuyến khích trong suốt thời gian học tập và thực hiện đề tài. Cuối cùng, tôi xin được bày tỏ lòng biết ơn sâu sắc tới toàn thể gia đình, bạn bè đã luôn động viên, khích lệ tinh thần để tôi có đủ nghị lực hoàn thành luận văn. Xin chân thành cảm ơn! Huế, tháng 7 năm 2016 Học viên Hoàng Thị Thảo Tiên MỤC LỤC Trang Lời cam đoan .............................................................................................................. Lời cảm ơn ................................................................................................................... Mục lục ......................................................................................................................... Danh mục các bảng ..................................................................................................... Danh mục các hình...................................................................................................... Danh mục các chữ viết tắt .......................................................................................... MỞ ĐẦU ....................................................................................................................1 CHƯƠNG 1.TỔNG QUAN VỀ HỆ THỐNG GỢI Ý ............................................5 1.1. HỆ THỐNG GỢI Ý .........................................................................................5 1.1.1. Giới thiệu hệ thống gợi ý ......................................................................5 1.1.2. Dữ liệu của hệ thống gợi ý....................................................................7 1.1.3. Chức năng hệ thống gợi ý...................................................................10 1.1.4. Các phương pháp được sử dụng trong hệ thống gợi ý .......................13 1.1.5. Ứng dụng ............................................................................................17 1.2. PHƯƠNG PHÁP LỌC CỘNG TÁC.............................................................19 1.2.1. Tổng quan về lọc cộng tác ..................................................................19 1.2.2. Ưu điểm của lọc cộng tác ...................................................................20 1.2.3. Các hình thức tiếp cận ........................................................................22 1.3. TIỂU KẾT CHƯƠNG 1.....................................................................................24 CHƯƠNG 2. XÂY DỰNG HỆ THỐNG GỢI Ý THEO NGỮ CẢNH...............25 2.1. HỆ THỐNG GỢI Ý THEO NGỮ CẢNH .....................................................25 2.1.1. Ngữ cảnh trong hệ thống gợi ý ...........................................................25 2.1.2. Mô hình hoá thông tin theo ngữ cảnh trong hệ thống gợi ý ...............28 2.1.3. Cách thu thập thông tin theo ngữ cảnh ...............................................31 2.1.4. Các phương pháp tiếp cận trong hệ thống gợi ý đa chiều ..................32 2.2. PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG GỢI Ý THEO NGỮ CẢNH .35 2.2.1. Xử lý thông tin ngữ cảnh đầu vào ......................................................35 2.2.2. Kỹ thuật phân rã ma trận ....................................................................37 2.2.3. Xử lý thông tin ngữ cảnh đầu ra .........................................................42 2.2.4. Kết hợp các phương pháp gợi ý theo ngữ cảnh ..................................44 2.3. TIỂU KẾT CHƯƠNG 2 ................................................................................46 CHƯƠNG 3. HỆ THỐNG GỢI Ý TRA CỨU KHÁCH SẠN THEO NGỮ CẢNH...47 3.1. MÔ TẢ HỆ THỐNG .....................................................................................47 3.2. PHÂN TÍCH, THIẾT KẾ, XÂY DỰNG HỆ THỐNG GỢI Ý TRA CỨU KHÁCH SẠN THEO NGỮ CẢNH .....................................................................49 3.2.1. Sơ đồ ngữ cảnh ...................................................................................49 3.2.2. Biểu đồ phân rã chức năng .................................................................49 3.2.3. Biểu đồ luồng dữ liệu .........................................................................50 3.2.4. Cơ sở dữ liệu hệ thống........................................................................52 3.2.5. Một vài giao diện minh hoạ cho hệ thống ..........................................53 3.3. ĐÁNH GIÁ....................................................................................................56 3.4. TIỂU KẾT CHƯƠNG 3 ................................................................................58 KẾT LUẬN ..............................................................................................................59 TÀI LIỆU THAM KHẢO ......................................................................................60 DANH MỤC CÁC BẢNG Trang Bảng 1.1. Ví dụ ma trận người dùng x sản phẩm ....................................................15 Bảng 2.1. Minh hoạ tập dữ liệu với ngữ cảnh .........................................................36 Bảng 2.2. Tập dữ liệu sau khi sử dụng phương pháp xử lý ngữ cảnh đầu vào .......37 Bảng 2.3. Hậu xử lý trên kết quả dự đoán ...............................................................44 Bảng 3.1. Kết quả đánh giá dựa trên công thức RMSE...........................................57 DANH MỤC CÁC HÌNH Trang Hình 1.1. Minh hoạ hệ thống gợi ý ......................................................................... 6 Hình 1.2. Minh họa phương pháp gợi ý dựa trên nội dung .....................................14 Hình 1.3. Minh họa phương pháp gợi ý dựa trên lọc cộng tác................................16 Hình 1.4. Gợi ý theo lọc cộng tác của Amazon.......................................................19 Hình 1.5. Quy trình của hệ thống gợi ý dựa trên lọc cộng tác ................................20 Hình 2.1. Minh hoạ cho không gian gợi ý ba chiều ................................................30 Hình 2.2. Mô hình kết hợp ngữ cảnh trong hệ thống gợi ý .....................................33 Hình 2.3. Quy trình gợi ý theo ngữ cảnh.................................................................35 Hình 2.4. Sử dụng phương pháp xử lý ngữ cảnh đầu vào .......................................36 Hình 2.5. Minh họa kỹ thuật phân rã ma trận..........................................................38 Hình 2.6. Minh hoạ dự đoán người dùng thứ 3 cho item thứ 3...............................41 Hình 2.7. Xử lý thông tin ngữ cảnh đầu ra ..............................................................43 Hình 3.1. Sơ đồ kiến trúc của hệ thống ...................................................................48 Hình 3.2. Sơ đồ ngữ cảnh ........................................................................................49 Hình 3.3. Sơ đồ chức năng hệ thống .......................................................................50 Hình 3.4. Sơ đồ luồng dữ liệu mức 0 ......................................................................50 Hình 3.5. Sơ đồ luồng dữ liệu mức 1 ......................................................................51 Hình 3.6. Sơ đồ luồng dữ liệu mức 2 ......................................................................51 Hình 3.7. Sơ đồ luồng dữ liệu mức 3 ......................................................................52 Hình 3.8. Biểu đồ cơ sở dữ liệu...............................................................................52 Hình 3.9. Giao diện chính của website....................................................................53 Hình 3.10. Giao diện mô tả chi tiết khách sạn ........................................................53 Hình 3.11. Giao diện vị trí khách sạn......................................................................54 Hình 3.12. Giao diện đánh giá người dùng .............................................................54 Hình 3.13. Giao diện gợi ý cho người dùng mới theo thể loại và sao.....................55 Hình 3.14. Giao diện gợi ý theo ngữ cảnh và vị trí .................................................56 Hình 3.15. Giao diện kết quả gợi ý theo ngữ cảnh và vị trí ....................................56 DANH MỤC CÁC CHỮ VIẾT TẮT C Ngữ cảnh (Context) CF Collaborative filtering (Lọc cộng tác) I Item (Các mục tin) IF Information filtering (Lọc thông tin) IR Information retrieval(Thu thập thông tin) MF Matrix Factorization(Kỹ thuật phân rã ma trận) R Rating (Đánh giá) RS Recommender Systems (Hệ thống gợi ý) SGD Stochastic Gradient Descent (Giảm độ lêch ngẫu nhiên) U Users( Người dùng) MỞ ĐẦU 1. Lý do chọn đề tài Với sự phát triển về công nghệ thông tin thì nhu cầu tìm kiếm thông tin trên Internet ngày càng trở nên phổ biến nên một lượng lớn thông tin được đưa lên Internet hằng ngày. Vì thế một nhu cầu mới đặt ra là một thông tin nên hay không nên được đọc, chia sẻ đến cho một đối tượng người sử dụng Internet? Thông tin nào sẽ có khả năng được đánh giá cao bởi một đối tượng người sử dụng? Và làm thế nào để xác định được là thông tin đó có khả năng được người dùng đánh giá cao hay thấp? Để giải quyết vấn đề trên nhiều nghiên cứu đưa ra một Hệ thống gợi ý( Recommender Systems) phù hợp nhất. Hệ thống gợi ý là một dạng kỹ thuật trong lọc thông tin, RS đang được sử dụng rộng rãi trong nhiều lĩnh vực ( như thương mại điện tử, giải trí, giáo dục…) nhằm dự đoán sở thích của người dùng nhờ vào thông tin cá nhân hoặc những phản hồi (đánh giá) từ họ. Hệ thống gợi ý học từ khách hàng và gợi ý sản phẩm tốt nhất trong số các sản phẩm phù hợp. Các hệ thống gợi ý thường dùng trong các ứng dụng chỉ có hai thực thể đó là người sử dụng và các mặt hàng mà nó không đặt chúng vào một ngữ cảnh khi cung cấp các gợi ý. Nói cách khác hệ thống gợi ý đa số tập trung vào giới thiệu các mặt hàng phù hợp nhất với người dùng cá nhân mà không xem xét đến thông tin ngữ cảnh của người dùng như thời gian, địa điểm… Để hệ thống gợi ý có thể dự đoán chính xác về các sở thích của người dùng thì nó phụ thuộc vào mức độ mà hệ thống gợi ý đã kết hợp các thông tin theo ngữ cảnh. Trong nhiều ứng dụng thì việc kết hợp các thông tin theo ngữ cảnh vào các gợi ý nhằm giới thiệu các mặt hàng để sử dụng trong tình huống nhất định cũng rất quan trọng. Việc tìm kiếm các khách sạn ở Huế đối với khách du lịch thường phải nhờ đến sự trợ giúp của hướng dẫn viên du lịch hoặc ít nhất là phải dựa vào sách hướng dẫn hay bản đồ để có được những thông tin về các địa điểm như khách sạn. Tuy nhiên những sự trợ giúp này cũng có những hạn chế nhất định như: Khách du lịch sẽ có thể khó tìm thấy những thông tin chi tiết về những khách sạn. Hoặc là, họ sẽ được ở 1 những khách sạn theo tour du lịch đã được định sẵn. Như vậy làm thế nào để hỗ trợ khách có thể tìm thấy những khách sạn phù hợp với họ, phù hợp với những điều kiện ngữ cảnh xung quanh (như thời tiết, người đi cùng, vị trí, khoảng cách…) Để đáp ứng những đòi hỏi trên, việc ứng dụng các công nghệ trong hệ thống gợi ý với các yếu tố ngữ cảnh có thể sẽ cho một kết quả phù hợp. Và để đem lại sự tiện ích cho người dùng, tôi đã nghiên cứu “ Nghiên cứu hệ thống gợi ý theo ngữ cảnh và ứng dụng”. Hệ thống được vận hành ở trên nền Web để hỗ trợ mọi người nhằm đem lại sự thoải mái và sự tiện dụng tối đa cho họ khi tham gia vào hệ thống. 2. Tổng quan tài liệu Hiện cũng đã có nhiều nghiên cứu các kỹ thuật để xây dựng hệ thống gợi ý như là sử dụng phương pháp lọc theo nội dung, lọc cộng tác, kết hợp cả 2 phương pháp trên như bài báo Recommender Systems Handbook của tác giả Francesco Ricci, Lior Rokach, Bracha Shapira, Paul B. Kantor (2011) [3]; Amazon.com recommendations: Item - item collaborative filtering của G.Linden, B. Smith and J. York [5] và A Survey of Collaborative Filtering Techniques của X. Su, T. M. Khoshgoftaar (2009) [9]. Ngoài ra cũng có nhiều bài viết nghiên cứu về hệ thống gợi ý theo ngữ cảnh và các kỹ thuật để xây dựng chúng như “Context-aware recommender systems” của Gediminas Adomavicius and Alexander Tuzhilin (2008) [4]; Matrix factorization techniques for recommender systems của Yehuda Koren, Robert Bell and Chris Volinsky (2009) [7] và A context‐ aware preference database system của Kostas Stefanidis, Evaggelia Pitoura, Panos Vassiliadis (2007) [8]. Hệ thống gợi ý cũng đã được nghiên cứu và phát triển mạnh mẽ. Hệ thống gợi ý đã và đang được ứng dụng ngày một nhiều ở các lĩnh vực khác nhau. Ở lĩnh vực về du lịch cũng có nhiều bài báo nghiên cứu cả trong nước và ngoài nước như “Một tiếp cận trong xây dựng hệ thống gợi ý theo ngữ cảnh” của Lư Chân Thiện và Nguyễn Thái Nghe (2015) [1]; “A Mobile 3D-GIS Hybrid Recommender System for Tourism” của José M. Noguera, Manuel J. Barranco, Rafael J. Segura, Luís 2 Martínez (2012) [6]; “Mobile recommender systems in tourism, Journal of Network and Computer Application” của Damianos Gavalas, Charalampos Konstantopoulos, Konstantinos Mastakas, Grammati Pantziou (2014)[2]. Luận văn này tôi tập trung nghiên cứu hệ thống gợi ý ngữ cảnh tích hợp các phương pháp xây dựng hệ thống bằng cách kết hợp phương pháp gợi ý dựa trên ngữ cảnh đầu vào, tích hợp với kỹ thuật phân rã ma trận, và xử lý ngữ cảnh đầu ra để ứng dụng xây dựng hệ thống gợi ý khách sạn ở Huế. 3. Mục tiêu nghiên cứu - Nghiên cứu lý thuyết và kỹ thuật xây dựng hệ thống gợi ý dựa vào ngữ cảnh của người dùng. Tìm hiểu thuật toán dựa vào phương pháp gợi ý theo ngữ cảnh. - Đề tài luận văn sẽ chọn đối tượng dùng để gợi ý là khách sạn ở Huế. 4. Đối tượng nghiên cứu - Lý thuyết và các kỹ thuật gợi ý theo ngữ cảnh. - Thông tin các khách sạn 5. Phương pháp nghiên cứu - Tổng hợp và phân tích các nội dung và kỹ thuật từ các nguồn như: thư viện, các bài báo khoa học của các viện nghiên cứu, các trường Đại học hoặc trên mạng Internet. Trên cơ sở đó nắm vững lý thuyết và các bước tiến hành xây dựng hệ thống gợi ý theo ngữ cảnh thử nghiệm. - Tìm hiểu thực tế, tổng hợp số liệu từ Internet, tham gia thêm ý kiến của các nhà chuyên môn. - Sử dụng các kỹ thuật tìm hiểu để xây dựng một hệ thống thử nghiệm. 6. Phạm vi nghiên cứu - Tập trung vào các khái niệm, lý thuyết tổng quan về hệ thống gợi ý, lọc cộng tác và một số kỹ thuật thông dụng, đơn giản. 3 - Ứng dụng cho hệ thống khách sạn trong phạm vi thành phố Huế và được đưa lên Internet. 7. Cấu trúc luận văn 7.1. Phần mở đầu - Tính cấp thiết của đề tài. - Mục tiêu của đề tài. - Phương pháp nghiên cứu. - Đối tượng và phạm vi nghiên cứu. 7.2. Phần nội dung Chương 1: Trình bày tổng quan về hệ thống gợi ý, nêu các khái niệm cơ bản, chức năng, các phương pháp xây dựng và một số ứng dụng của hệ thống gợi ý. Ngoài ra chương này còn giới thiệu sơ lược về lọc cộng tác. Chương 2: Trình bày về hệ thống gợi ý theo ngữ cảnh và các phương pháp tiếp cận xây dựng hệ thống gợi ý theo ngữ cảnh. Chương 3: Xây dựng hệ thống gợi ý tra cứu khách sạn dựa vào ngữ cảnh. 7.3. Phần kết luận - Nhận xét, đánh giá kết quả đạt được trong luận văn - Hướng phát triển trong tương lai Do thời gian có hạn và bản thân chỉ mới bước đầu thực hiện đề tài nghiên cứu lĩnh vực này nên không tránh khỏi những thiếu sót. Kính mong sự giúp đỡ, góp ý thêm của quý Thầy, Cô và các bạn để hoàn thiện luận văn. 4 CHƯƠNG 1. TỔNG QUAN VỀ HỆ THỐNG GỢI Ý 1.1. HỆ THỐNG GỢI Ý 1.1.1. Giới thiệu hệ thống gợi ý Hệ thống gợi ý là một dạng của hệ hỗ trợ ra quyết định. Hệ thống bao gồm các kỹ thuật và công cụ phần mềm nhằm đưa ra những gợi ý cho người sử dụng, đáp ứng nhu cầu của họ về một sản phẩm, dịch vụ nào đó trên Internet. Những gợi ý được cung cấp nhằm hỗ trợ người sử dụng đưa ra quyết định lựa chọn những sản phẩm, dịch vụ phù hợp với nhu cầu và thị hiếu của mình, chẳng hạn như: mua sản phẩm nào, nghe thể loại nhạc gì hay tin tức trực tuyến nào nên đọc, ... Hệ thống gợi ý thông thường sẽ tập trung vào một mục tin hay sản phẩm( item) cụ thể nào đó (CD, tin tức) theo thiết kế và giao diện đồ họa người dùng kết hợp với kỹ thuật, thuật toán gợi ý nhằm sinh ra các gợi ý tuỳ chỉnh, cung cấp những gợi ý có ích và hiệu quả cho sản phẩm đó . Hệ thống gợi ý nhằm hướng dẫn những người dùng thiếu kinh nghiệm hoặc chưa đủ thẩm quyền để đánh giá số lượng áp đảo các Item thay thế. Ví dụ, hệ thống gợi ý giúp người dùng lựa chọn sách trên trang web của Amazon đã sử dụng hệ thống gợi ý để cá nhân hoá các cửa hàng trực tuyến cho từng khách hàng (User). Khi hệ thống gợi ý được cá nhân hoá thì mọi người dùng hay nhóm người dùng sẽ nhận được các gợi ý khác nhau từ những cá nhân khác. Mô hình đơn giản nhất của hệ thống gợi ý khi được cá nhân hoá là danh sách xếp hạng các sản phẩm. Khi thực hiện bảng xếp hạng này, hệ thống gợi ý sẽ thử dự đoán những sản phẩm hoặc dịch vụ phù hợp nhất với người dùng dựa trên sở thích và nhu cầu của họ. Để thực hiện được nhiệm vụ đó, hệ thống gợi ý thu thập sở thích của người dùng được thể hiện qua hệ thống(xếp hạng cho các sản phẩm) hoặc suy ra từ cách giải thích hành động của người dùng - là một tính năng ẩn có ưu tiên cho phần hiển thị của trang hoặc xem xét chuyển hướng đến một trang khác.Ví dụ minh họa cho hệ thống gợi ý: Một người dùng đăng nhập vào một hệ thống website đọc sách, người này cần xem 1 quyển sách về văn học nhưng không biết là nên xem 5 quyển sách nào, hệ thống website cần gợi ý cho người đó xem một hoặc vài quyển sách mà dự đoán rằng người này sẽ thích quyển sách mà được hệ thống gợi ý. Để gợi ý được cho người dùng, hệ thống cần thu thập các thông tin về người dùng và các người dùng khác, thông tin các quyển sách. Có một vài cách gợi ý truyền thống đơn giản nhất như, chọn những quyển sách được nhiều người ưa thích nhất, hoặc chọn những quyển mới nhất để gợi ý. Tuy nhiên để nâng cao chất lượng của gợi ý cho người dùng, hệ thống gợi ý cần sử dụng các thông tin của tất cả những người dùng và thông tin của tất cả các sản phẩm, sử dụng các thuật toán để đưa ra gợi ý phù hợp nhất cho người dùng. Hình 1.1 Minh hoạ hệ thống gợi ý Một số trang web về hệ thống gợi ý như: gợi ý sản phẩm của Amazon, hệ gợi ý phim của NetFlix. Hệ thống gợi ý đã chứng minh được ý nghĩa to lớn trong việc giúp người sử dụng trực tuyến đối phó với tình trạng quá tải thông tin. Chính vì vậy, hệ thống gợi ý trở thành một trong những công cụ mạnh mẽ và phổ biến trong thương mại điện tử và trên nhiều lĩnh vực khác. 6 Trong hầu hết các trường hợp, bài toán gợi ý được coi là bài toán ước lượng xếp hạng (rating) của các item (phim, cd, nhà hàng…) chưa được người dùng xem xét. Việc ước lượng này thường dựa trên những đánh giá đã có của chính người dùng đó hoặc từ những người dùng khác. Những item có xếp hạng cao nhất sẽ được dùng để gợi ý. Từ đó người dùng có những lựa chọn thích hợp với nhu cầu và thị hiếu của mình. 1.1.2. Dữ liệu của hệ thống gợi ý Trong hệ thống gợi ý có 3 đối tượng dữ liệu chính được sử dụng là: các mục tin trên hệ thống (Items), người sử dụng (Users) và các giao dịch (Transactions -liên quan giữa các item và user) 1.1.2.1. Các mục tin(Item) Items là những đối tượng được để ý. Các mục tin có đặc tính phức tạp và có giá trị hữu ích. Giá trị của một item có thể là tích cực nếu nó có ích cho người sử dụng hoặc tiêu cực nếu nó không phù hợp khi người có lựa chọn sai. Lưu ý rằng khi người dùng nhận một item nào đó thì anh ta phải chịu một chi phí bao gồm việc tìm kiếm các item và chi phí thực để trả tiền cho item đó. Khi đó, các nhà thiết kế hệ thống gợi ý phải đưa sự phức tạp này của item vào tài khoản người dùng, ví dụ về cấu trúc, văn bản đại diện và thời gian phụ thuộc sự quan trọng của bất kì một item tin tức nào. Nhưng đồng thời các nhà thiết kế phải hiểu rằng thậm chí khi người dùng không trả tiền để đọc tin tức thì luôn có một chi phí nhận thức liên quan đến tìm kiếm và đọc các mục tin. Nếu một sản phẩm được chọn có liên quan đến người dùng chi phí này được chi phối bởi các lợi ích của việc có nên mua lại một thông tin hữu ích nào đó hay không, trong khi đó nếu các item không liên quan đến giá trị thực của sản phẩm thì khi được đề nghị nó sẽ là item tiêu cực. Trong các lĩnh vực khác như xe hơi, đầu tư tài chính thì chi phí tiền tệ thực của sản phẩm trở thành một yếu tố quan trọng để xem xét khi lựa chọn các phương pháp gợi ý thích hợp nhất. Một số item được phân loại theo giá trị và chức năng như sau: 7 - Các item phức tạp có giá trị thấp: tin tức, trang web, sách, đĩa CD, phim ảnh. - Các item phức tạp có giá trị cao: máy ảnh kĩ thuật số, điện thoại di động, máy tính,... - Các item phức tạp nhất là những chính sách bảo hiểm, đầu tư tài chính, phương tiện đi lại, việc làm. Công nghệ cốt lõi của hệ thống gợi ý là sử dụng một loạt các tính chất và tính năng của các item. Ví dụ như trong hệ thống gợi ý phim bao gồm: thể loại (hài, kinh dị, ...), đạo diễn, diễn viên,... để mô tả một bộ phim và tìm hiểu các tiện ích của một item phụ thuộc vào tính năng của nó. Các item được đại diện bằng cách sử dụng thông tin và đại diện các cách tiếp cận khác nhau, chẳng hạn như một mã ID duy nhất … 1.1.2.2. Người sử dụng(user) Như đã đề cập ở trên, người sử dụng trong hệ thống gợi ý là đối tượng để gợi ý có những mục tiêu và đặc điểm rất đa dạng. Để cá nhân hoá các gợi ý và tương tác người - máy, hệ thống gợi ý khai thác một loạt các thông tin về người sử dụng. Những thông tin này có thể được cấu trúc theo nhiều các khác nhau và việc chọn thông tin phụ thuộc vào kỹ thuật gợi ý. Ví dụ, trong lọc cộng tác người dùng được mô hình hóa dưới dạng danh sách đơn giản chứa các xếp hạng được cung cấp bởi người sử dụng đối với một số item. Trong hệ thống gợi ý nhân khẩu học, các thuộc tính được sử dụng là tuổi, giới tính, nghề nghiệp, trình độ học vấn. Từ đó, các dữ liệu người dùng sẽ tạo nên mô hình cá nhân người dùng để mã hóa sở thích và nhu cầu của người đó. Người sử dụng cũng có thể được mô tả bằng mô hình hành vi của họ, ví dụ trong mô hình trình duyệt (hệ thống gợi ý Website), mô hình tìm kiếm du lịch (hệ thống gợi ý du lịch). Ngoài ra, dữ liệu người dùng còn có thể bao gồm mối quan hệ giữa người sử dụng như mức độ tin cậy của các mối quan hệ giữa các người dùng. Hệ thống gợi ý có thể sử dụng thông tin này để giới thiệu các item từ một người dùng đáng tin cậy khác đã thích item này. 8 1.1.2.3. Giao dịch (Transactions) Chúng ta đề cập chung đến một giao dịch là bản ghi tương tác giữa người sử dụng và hệ thống gợi ý. Giao dịch là dữ liệu đăng nhập chứa các thông tin quan trọng được tạo ra trong quá trình tương tác người - máy và nó giúp ích cho thuật toán gợi ý mà hệ thống đang sử dụng. Trong trường hợp này, một bản ghi giao dịch có thể chứa một tham chiếu đến các sản phẩm được chọn bởi người sử dụng và mô tả ngữ cảnh (mục tiêu sử dụng/truy vấn) cho hệ thống gợi ý. Trên thực tế, hình thức phổ biến nhất của dữ liệu giao dịch mà hệ thống gợi ý thu thập là các xếp hạng. Những đánh giá này có thể được thu thập một cách rõ ràng hoặc dưới dạng các biến ẩn. Trong trường hợp các xếp hạng là rõ ràng, người dùng sẽ được yêu cầu cung cấp ý kiến của mình về một mục trên thang điểm đánh giá. Các xếp hạng có thể ở các hình thức sau: - Xếp hạng từ số 1 đến 5 sao (hệ thống gợi ý sách trên Amazon.com). - Xếp hạng thứ tự chẳng hạn như: hoàn toàn đồng ý, đồng ý, trung lập, không đồng ý. Ở đây, người dùng được yêu cầu chọn thuật ngữ tốt nhất cho ý kiến của mình. - Xếp hạng nhị phân lựa chọn mô hình trong đó người dùng chỉ việc chọn mục nào đó tốt hay xấu. - Xếp hạng Unary có thể chỉ ra được người dùng đã quan sát hoặc mua một item nào đó hoặc đánh giá trực tiếp trên item đó. Trong trường hợp này, sự vắng mặt của đánh giá cho thấy chúng ta không có thông tin liên quan giữa người dùng với item (có thể người đó đã mua ở chỗ khác). Một hình thức khác để đánh giá là gộp tất cả các thẻ liên quan giữa người dùng với các item của hệ thống. Ví dụ, trong hệ thống gợi ý của MovieLens các thẻ biểu diễn việc người dùng cảm thấy thế nào sau khi xem một bộ phim, có thể là "quá dài" hoặc "hành động". Trong các giao dịch xếp hàng dưới dạng ẩn, mục đích của hệ thống là để 9 đưa ra ý kiến người dùng dựa trên cảc hành động của người dùng đó. Ví dụ, nếu người dùng nhập từ khóa "Yoga" ở Amazon thì anh ta sẽ được cung cấp một danh sách dài các cuốn sách có liên quan. Mặt khác, người dùng có thể click vào một cuốn sách nào đó trong danh sách để nhận được thêm thông tin. Ở điểm này, hệ thống có thể suy ra được người dùng có phần quan tâm đến cuốn sách đó. Với các hệ thống đàm thoại (hệ thống hỗ trợ một quá trình tương tác) mô hình giao dịch sẽ tinh tế hơn (dùng các yêu cầu bằng hành động). Với các khái niệm trên thì bài toán gợi ý được mô tả như sau: Gọi U là tập tất cả người dùng (users), V là tập tất cả cảc sản phẩm (items) có thể gợi ý. Tập V có thể rất lớn, từ hàng trăm ngàn (sách,cd..) đến hàng triệu (như website). Hàm r(u,v) đo độ phù hợp (hay hạng) của sản phẩm v với người dùng u: r:U  V  R. Trong đó R là tập các đánh giá (rating) được sắp thứ tự. Với mỗi người dùng u  U cần tìm sản phẩm v  V sao cho hàm r(u,v) đạt giá trị lớn nhất. 1.1.3. Chức năng hệ thống gợi ý Hệ thống gợi ý đề xuất cho người dùng những sản phẩm, dịch vụ mà họ có thể muốn sử dụng. Ngoài ra, người dùng muốn sử dụng hệ thống gợi ý nếu hệ thống hỗ trợ hiệu quả nhiệm vụ hoặc mục tiêu của họ. Do đó một hệ thống gợi ý phải cân bằng nhu cầu của hai nhóm người dùng này và cung cấp dịch vụ có hiệu quả cho cả hai. Một số chức năng của hệ thống gợi ý đối với nhà cung cấp: Tăng số lượng các mặt hàng bán ra cho các hệ thống thương mại điện tử: Đây có lẽ là chức năng quan trọng nhất của hệ thống gợi ý. Thay vì người dùng chỉ mua một sản phẩm mà họ cần, họ được gợi ý mua những sản phẩm ‘có thể họ cũng quan tâm’ mà bản thân họ không nhận ra. Hệ thống gợi ý tìm ra những ‘mối quan tâm ẩn’. Bằng cách đó, hệ thống gợi ý làm gia tăng nhu cầu của người dùng và gia tăng số lượng mặt hàng bán ra. Tương tự đối với các hệ thống phi thương mại (như 10 các trang báo), hệ thống gợi ý sẽ giúp người dùng tiếp cận với nhiều đối tượng thông tin mang tính đa chiều và được nhiều người quan tâm hơn. Bán các mặt hàng đa dạng hơn trên các hệ thống thương mại điện tử: Đây là chức năng quan trọng thứ hai của hệ thống gợi ý. Hầu hết các hệ thống thương mại đều có các mặt hàng hết sức là đa dạng và phong phú. Khi nắm bắt được nhu cầu của người dùng, hệ thống gợi ý dễ dàng mang đến sự đa dạng trong sự lựa chọn hàng hóa. Từ đó đòi hỏi các hệ thống thương mại điện tử cung cấp nhiều mặt hàng đa dạng và phù hợp với người sử dụng hơn. Tăng sự hài lòng người dùng: Vai trò chủ đạo của hệ thống gợi ý là hiểu nhu cầu của người dùng, gợi ý cho họ những thứ họ cần...Chính vì vậy hệ thống gợi ý tăng sự hài lòng của người dùng trên hệ thống và lựa chọn ưu tiên khi họ có những băn khoăn hoặc khi chưa có kiến thức về sản phẩm. Tăng độ tin cậy, độ trung thực của người dùng: Một khi hệ thống gợi ý cho người dùng những lựa chọn và họ hài lòng về những gợi ý đó thì lòng tin của họ đối với hệ thống (nơi mà giúp họ tìm ra những thứ họ thực sự quan tâm) được nâng lên một cách đáng kể. Đây thật sự là một điều thích thú và thu hút người dùng. Có một điểm quan trọng là hệ thống gợi ý hoạt động dựa trên những xếp hạng thật từ chính bản thân người dùng trong quá khứ. Do đó, khi người dùng càng tin cậy vào hệ thống, đưa ra những đánh giá trung thực cho các sản phẩm, hệ thống sẽ mang lại cho người dùng nhiều gợi ý chính xác hơn, phù hợp với nhu cầu, sở thích của họ. Hiểu rõ những gì người dùng muốn: Đây là một chức năng quan trọng khác của hệ thống gợi ý được thừa kế từ nhiều ứng dụng khác nhau là thu thập hoặc dự đoán sở thích người dùng thông qua hệ thống. Điều này giúp cho các nhà phát triển dịch vụ có thể quyết định tái sử dụng các item theo mục tiêu cải thiện quản lý cửa hàng hoặc tiến hành sản xuất. Các chức năng của hệ thống gợi ý đối với người sử dụng như sau: Tìm một số nhóm hàng tốt: Gợi ý cho người dùng một số mặt hàng dưới dạng một danh sách xếp hạng cùng với dự đoán bao nhiêu người dùng muốn sử dụng. 11 Tìm tất cả các mặt hàng tốt: Gợi ý tất cả các mặt hàng có thể đáp ứng một số nhu cầu của người sử dụng. Trong những trường hợp như vậy, nó không chỉ là tìm thấy các mặt hàng tốt. Điều này đặc biệt đúng khi số lượng mặt hàng là tương đối nhỏ. Chú thích trong ngữ cảnh: Tùy vào ngữ cảnh nhất định sẽ có một danh sách nhấn mạnh các mặt hàng cụ thể nào đó tùy thuộc vào nhu cầu và sở thích của số đông người dùng. Ví dụ, một hệ thống gợi ý truyền hình có thể chú thích chương trình lịch phát sóng là đáng xem. Gợi ý một chuỗi các mặt hàng: Thay vì tập trung vào một gợi ý duy nhất, ý tưởng của hệ thống gợi ý là để giới thiệu một chuỗi các mặt hàng sẽ thu hút hơn. Ví dụ điển hình như giới thiệu một loạt phim truyền hình, một cuốn sách về hệ gợi ý sau khi đã giới thiệu một cuốn sách về khai thác dữ liệu. Gợi ý một gói hàng: Gợi ý một nhóm các mặt hàng phù hợp với nhau. Ví dụ: một kế hoạch du lịch có thể bao gồm các điểm tham quan khác nhau, điểm đến, phương thức giải trí, dịch vụ ăn nghỉ… Gợi ý chỉ xem: Trong chức năng này, người dùng duyệt các mặt hàng mà không có bất kỳ ý định mua một món hàng nào. Nhiệm vụ của hệ thống gợi ý là giúp cho người dùng duyệt qua các mặt hàng có nhiều khả năng người dùng yêu thích nhất. Tìm gợi ý đáng tin cậy: Một số người dùng không tin tưởng vào hệ thống gợi ý, họ thử nghiệm với chính họ để xem nó tốt như thế nào trong việc đưa ra các gợi ý. Do đó, một số hệ thống cũng có thể cung cấp các chức năng cụ thể để cho phép người sử dụng kiểm tra hoạt động của nó ngoài những yêu cầu để có được gợi ý. Giúp đỡ người khác: Một số người dùng hài lòng với việc đóng góp thông tin, ví dụ như: đánh giá cho các mặt hàng (Ratings), bởi vì họ tin rằng đóng góp của họ sẽ có ích. Điều này có thể là một động lực lớn để nhập thông tin thành một hệ thống gợi ý. Ví dụ: với một hệ gợi ý về xe, một người dùng đã mua một chiếc xe mới thì họ nhận thức được rằng ý kiến đánh giá của mình về chiếc xe đó có thể sẽ hữu ích cho người khác. 12
- Xem thêm -

Tài liệu liên quan