Tài liệu Xây dựng kho dữ liệu khách hàng sử dụng dịch vụ viễn thông phục vụ công tác quản lý

  • Số trang: 20 |
  • Loại file: PDF |
  • Lượt xem: 176 |
  • Lượt tải: 3
nganguyen

Đã đăng 34345 tài liệu

Mô tả:

1 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- TRẦN NAM QUỲNH XÂY DỰNG KHO DỮ LIỆU KHÁCH HÀNG SỬ DỤNG DỊCH VỤ VIỄN THÔNG PHỤC VỤ CÔNG TÁC QUẢN LÝ CHUYÊN NGÀNH: TRUYỀN DỮ LIỆU VÀ MẠNG MÁY TÍNH MÃ SỐ: 60.48.15 Người hướng dẫn khoa học: PGS.TS. LÊ HỮU LẬP TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2011 2 MỞ ĐẦU 1. Lý do chọn đề tài Việc áp dụng công nghệ thông tin vào thực tiễn sản xuất kinh doanh đã mang lại những hiệu quả và lợi ích to lớn. Các hệ thống thông tin từ chỗ chỉ giải quyết những xử lý công việc hàng ngày nay đã tiến tới đáp ứng được những yêu cầu ở mức độ cao hơn. Các nhà quản lý điều hành không những biết được công việc đang diễn ra như thế nào mà còn biết cái gì sẽ xảy ra sau đó, có nghĩa là thông tin mang tính phân tích và hệ thống thông tin có khả năng hỗ trợ quyết định. Tuy nhiên việc xây dựng một hệ thống như thế vấp phải một số hạn chế về mặt kỹ thuật, đặc biệt là khi kích thước cũng như độ phức tạp của môi trường thông tin tăng lên. Lưu trữ phân tán ở nhiều dạng không tương thích với nhau, thậm chí còn ở những dạng phi cấu trúc. Nhiều hệ CSDL đã được xây dựng không tương thích với nhau và không tương thích với những hệ thông tin mới được xây dựng. Nhiều khách hàng không thoả mãn với những hệ thống thông tin hiện thời. Một cách tiếp cận được đề xướng bởi B.Inmon là sự kết hợp của một số giải pháp kỹ thuật và được đặt tên là Data Warehoushing - kỹ thuật xây dựng các kho dữ liệu. Data Warehouse được định nghĩa như một tập hợp các phương tiện cho phép hình dung dữ liệu một cách tổng thể, hướng đối tượng để giúp cho việc phân tích và ra quyết định. 2. Mục đích của đề tài: Tiếp cận các phương pháp khai phá dữ liệu để tích hợp dữ liệu và các siêu dữ liệu từ nhiều nguồn thành một nguồn mang tính lôgic duy nhất nhằm cung cấp thông tin trợ giúp cho việc phân tích và ra quyết định. 3. Đối tượng và phạm vi nghiên cứu: Việc nghiên cứu sẽ tập trung xây dựng các báo cáo dựa trên kho dữ liệu tích hợp từ các nguồn dữ liệu hiện có với các ứng dụng quản lý điều hành sản xuất kinh doanh của VNPT Quảng Ninh. 4. Phương pháp nghiên cứu: Tìm hiểu các tài liệu liên quan đến Data Warehouse các kỹ thuật truy cập, phân tích và khai phá dữ liệu. 3 5. Kết cấu của luận văn Luận văn bao gồm 3 chương: Chương 1: Tổng quan về Kho dữ liệu và Khai phá dữ liệu Tìm hiểu về kho dữ liệu, đặc điểm, phân loại, sử dụng đồng thời nghiên cứu và trình bày về Khai phá dữ liệu. Chương 2: Xây dựng kho dữ liệu. Chương này phân tích các yêu cầu xây dựng kho dữ liệu; Các mô hình dữ liệu; Cấu trúc, kiến trúc trong việc xây dựng kho dữ liệu. Chương 3: Xây dựng kho dữ liệu khách hàng sử dụng dịch vụ viễn thông phục vụ công tác quản lý. CHƯƠNG I TỔNG QUAN VỀ KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 1.1 Tổng quan về kho dữ liệu Ngày nay, thông tin trở thành một yếu tố quan trọng cần được quản lý và khai thác hiệu quả bởi chính việc quản lý và khai thác thông tin này sẽ mang lại một phần lợi ích không nhỏ trong việc tổ chức và quản lý của các tổ chức kinh tế. Hơn thế, các yêu về khả năng lưu trữ thông tin khối lượng lớn, xử lý thông tin nhanh chóng ngày càng trở nên phổ biến. Điều này dẫn đến sự ra đời của Data Warehouse. Data Warehouse không chỉ đáp ứng những nhu cầu về việc lưu trữ và quản lý thông tin mà nó còn là nền tảng để người dùng có thể sử dụng những kỹ thuật hỗ trợ trực tuyến OLAP và đặc biệt là nó tạo một nền tảng thuận lợi để người dùng có thể khai thác, phân tích và dự đoán về số liệu của mình thông qua những kỹ thuật khai phá dữ liệu (data mining). 1.1.1 Định nghĩa Kho dữ liệu (Data Warehouse – DW) không phải là một khái niệm mới và đã được định nghĩa theo rất nhiều cách khác nhau, vì vậy khó có thể định nghĩa chuẩn xác được. Theo một nghĩa nào đó thì kho dữ liệu được xem như là một cơ sở dữ liệu được duy trì riêng biệt từ nhiều nguồn cơ sở dữ liệu (CSDL) tác 4 nghiệp khác nhau, hỗ trợ phân tích trên cơ sở các dữ liệu lịch sử và các công cụ truy vấn dữ liệu mạnh. 1.1.2 Đặc điểm Một kho dữ liệu được xác định là một cơ sở dữ liệu trong đó có chứa bốn đặc tính sau: hướng chủ đề, tính ổn định, được tích hợp, gắn với thời gian. 1.1.3 Phân loại Tùy thuộc vào quy mô tổ chức, cách tổ chức và vị trí của Data Warehouse mà người ta chia Data Warehouse nói chung ra thành hai loại là: Data Mart và Enterprise Data Warehouse. 1.1.3.1. Khái niệm Enterprise Data Warehouse Nếu như một Enterprise Data Warehouse là một cơ sở dữ liệu bao gồm dữ liệu về nhiều đối tượng khác nhau, trên toàn bộ cơ quan và thường được xây dựng tập trung. 1.1.3.2. Khái niệm Data Mart Data Mart cũng là một cơ sở dữ liệu có những đặc điểm giống với kho dữ liệu nhưng quy mô của nó nhỏ hơn và lưu trữ dữ liệu về một lĩnh vực, một chuyên ngành cụ thể. 1.1.3.3. Phân loại Data Mart - DM phụ thuộc. - DM độc lập. 1.1.3.4. Siêu dữ liệu (Metadata) Metadata là một loại “dữ liệu về dữ liệu”, nó được xây dựng nhằm mục đích mô tả cấu trúc nội dung về dữ liệu bên trong cơ sở dữ liệu. Metadata có ý nghĩa đặc biệt quan trọng trong việc xây dựng và tổ chức lưu trữ dữ liệu của Data Warehouse. 5 1.1.4. Các phương pháp sử dụng kho dữ liệu 1.1.4.1. Cách sử dụng truyền thống Trong cách sử dụng này việc khai thác thông tin dựa trên các công cụ truy vấn và báo cáo. Nhờ có việc trích lọc, tích hợp và chuyển đổi các dữ liệu thô sang dạng dữ liệu có chất lượng cao và có tính ổn định. 1.1.4.2. Hỗ trợ trực tuyến (OLAP) Nếu ngôn ngữ truy vấn chuẩn SQL và các công cụ làm báo cáo truyền thống chỉ có thể miêu tả những gì có trong cơ sở dữ liệu thì phân tích trực tuyến có khả năng phân tích dữ liệu, xem xét xem giả thuyết là đúng hay sai. Tuy nhiên phân tích trực tuyến lại không có khả năng đưa ra giả thuyết. Do kích thước quá lớn và có tính chất phức tạp nên khó có thể sử dụng Data Warehouse cho mục đích này. 1.1.4.3. Công nghệ khai phá dữ liệu (Data mining) Trong hoàn cảnh hiện nay sự phát triển của dữ liệu đặt ra yêu cầu phải lưu trữ dữ liệu phức tạp và có kích thước lớn. Việc khai phá dữ liệu trở thành một nhu cầu khoa học và trong hoạt động thực tiễn. 1.2. Khai phá dữ liệu 1.2.1. Định nghĩa Khai phá dữ liệu (data mining): là quá trình trích xuất các thông tin có giá trị tiềm ẩn bên trong lượng lớn dữ liệu được lưu trữ trong các CSDL, kho dữ liệu… 1.2.2. Vị trí của khai phá dữ liệu 1.2.2.1. Quá trình khám phá tri thức Trên thực tế, nhiều người coi khai phá dữ liệu và một thuật ngữ thông dụng khác là khám phá tri thức trong CSDL là như nhau. Một số người khác quan niệm khai phá dữ liệu chỉ là một bước thiết yếu trong quá trình Khám phá tri thức trong CSDL. Quá trình này gồm một số bước lặp đi lặp lại, và được thể hiện trong hình 1.2: 6 Người dùng Ước lượng và biểu diễn Tri thức Lựa chọn và chuyển đổi dữ liệu Mẫu DL Khai phá dữ liệu Làm sạch và tích hợp Kho chứa dữ liệu Cơ sở DL Các file DL Hình 1.2: Khai phá dữ liệu trong quá trình Khám phá tri thức 1.2.2.2. Hệ ra quyết định Khai phá dữ liệu chiếm một vị trí quan trọng và nằm ở trung tâm của quá trình Khám phá tri thức từ cơ sở dữ liệu. Nó có mối liên hệ chặt chẽ với hệ ra quyết định như trong sơ đồ sau: Hình 1.3: Khai phá dữ liệu với Hệ ra quyết định Nhưng trên thực tế, thuật ngữ khai phá dữ liệu thông dụng và được sử dụng rộng rãi hơn nhiều so với thuật ngữ khám phá tri thức trong CSDL (KDD). 7 Kiến trúc của một hệ thống khai phá dữ liệu thường gồm những thành phần chính thể hiện trong hình 1.4. Giao diện đồ hoạ người dùng Đánh giá mẫu Cơ sở tri thức Máy khai phá dữ liệu Máy chủ CSDL hoặc kho dữ liệu Làm sạch dữ liệu Tích hợp dữ liệu Lọc CSDL Kho dữ liệu Hình 1.4 1.2.3. So sánh Khai phá dữ liệu với các giải pháp dữ liệu truyền thống Chúng ta có thể so sánh trực tiếp khai phá dữ liệu với một số phương pháp truyền thống để thấy cụ thể hơn: - Học máy. - Phương pháp hệ chuyên gia. - Phát kiến khoa học. - Phương pháp thống kê. 1.3. Kết luận chương Từ những lý thuyết cơ sở của Data Warehouse, với mục đích cơ bản của việc xây dựng Data Warehouse là tạo thuận lợi tối đa khi phân tích dữ liệu. Khi xây dựng Data Warehouse mang lại cho chúng ta rất nhiều lợi ích: Tích hợp dữ 8 liệu và các siêu dữ liệu từ nhiều nguồn thành một nguồn mang tính lôgic duy nhất nhằm cung cấp thông tin mềm dẻo từ các nguồn khác nhau và thỏa mãn nhiều loại người dùng khác nhau. Nâng cao chất lượng dữ liệu bằng các phương pháp làm sạch dữ liệu và tinh lọc dữ liệu theo những hướng chủ đề nhất định nên dữ liệu sẽ rõ ràng, thống nhất hơn. Sử dụng các phương pháp, kỹ thuật Khai phá dữ liệu nêu trên một cách hợp lý sẽ giúp chúng ta có được những thông tin quan trọng, cần thiết và có giá trị cao trong hoạt động quản lý điều hành, sản xuất kinh doanh cũng như trong các lĩnh vực khác của đời sống xã hội. 9 CHƯƠNG II XÂY DỰNG KHO DỮ LIỆU 2.1. Các yêu cầu của kho dữ liệu 2.1.1. Lập kế hoạch Gồm các bước: - Bước 1. Xác định chiến lược cài đặt - Bước 2. Lựa chọn phương pháp và mô hình phát triển kho dữ liệu 2.1.2. Phân tích các yêu cầu của hệ thống Bao gốm các bước sau: - Bước 1. Xác định các yêu cầu của chủ sở hữu và công tác -quản lý - Bước 2. Yêu cầu về kiến trúc: - Bước 3. Xác định yêu cầu của người phát triển hệ thống 2.2. Công nghệ và cấu trúc chung kho dữ liệu 2.2.1. Công nghệ Bảng 2.1 Các giải pháp công nghệ cho Dataware House STT Công nghệ Diễn giải Giải pháp Microsoft .NET 1. 2. Ngôn ngữ lập Một trong những ngôn ngữ lập trình chính, phổ biến trên trình C# MS .NET. WinForm Công nghệ xây dựng ứng dụng người sử dụng chuẩn trên nền MS .NET 3. SmartClient Công nghệ phân tán ứng dụng dạng WinForm, một giải /OneClick pháp xây dựng ứng dụng mới bên cạnh các dạng công Deployment nghệ có quá nhiều nhược điểm như thin-client (WEB: dễ Solution triển khai, khó phát triển), thick-client (desktop-client: phát triển nhanh, khó triển khai, khó bảo trì). 4. 5. Internet Trình duyệt (Web browser) chuẩn, miễn phí của Explorer Microsoft ASP.NET Công nghệ xây dựng ứng dụng WEB trên nền .NET 10 6. Remoting/SOAP Một trong hai công nghệ xây dựng ứng dụng phân tán cấp doanh nghiệp chuẩn của Microsoft (công nghệ còn lại là XML-Webservice). Công nghệ này cung cấp nhiều tùy chọn khi cần hosting các đối tượng doanh nghiệp ở khối “Business Object Server”, ở đây, do yêu cầu về hiệu năng, sẽ chọn các thông số như sau:  Chanel: TCP:  Formatter: binary Nếu khi hosting ta chọn thêm Formatter là SOAP thì chúng ta cũng có đồng thời giao diện SOAP cho các Business Object. Điều này là rất tiện lợi cho quá trình tích hợp hệ thống sau này. 7. ADO.NET - Chuẩn công nghệ truy cập CSDL trên nền .NET. Hai engine thực hiện theo chuẩn này được lựa chọn sử dụng là:  ODP.NET: là engine của Oracle; được khối “Business Object Server” sử dụng để truy cập CSDL Oracle.  MS ADO.NET Driver for Oracle: là engine của Microsoft; được khối “Report Server” sử dụng để truy cập CSDL Oracle. Giải pháp Crystal Decision Support 8. Report Theo giải pháp này, các báo biểu được hosting lên máy Application chủ RAS, các client (Application hoặc WEB) truy xuất Server (RAS) báo biểu theo cùng một công nghệ, một cách thức Giải pháp Oracle DBMS 9. Oracle CSDL quan hệ mạnh & phổ biến nhất hiện nay 11 2.2.2. Cấu trúc chung thành phần truy cập dữ liệu • Các công cụ truy cập Cấu trúc chung của thành phần truy cập dữ liệu được mô tả tại hình 2.1: Enquiry Data Access Translate to SQL Response Split Translate query to DB API Control and administration Combine Translate Translate to results to API relational Data source 1 Data source 2 Data Transfer Hình 2.1: Cấu trúc chung của thành phần truy cập dữ liệu Cấu trúc tổng thể của kho dữ liệu, kho dữ liệu tác nghiệp và các chức năng quản lý, xử lý phân tích dữ liệu có thể tổ chức như hình 2.2: • Các công cụ thu nạp, làm sạch, ánh xạ và chuyển đổi dữ liệu Lựa chọn dữ liệu từ ODS để đưa vào kho, đặt chúng các format thích hợp. việc này có thể thực hiện bằng các công cụ: Các chương trình ứng dụng, Các lệnh hay ngôn ngữ điều khiển như MVS Job Control Language, Unix Script, SQL DDL, Oracle Warehouse Builder… 2.3. Xu hướng kho dữ liệu 2.3.1. Dữ liệu phi cấu trúc Dữ liệu có cấu trúc thường dùng để chỉ dữ liệu lưu trữ trong các hệ quản trị cơ sở dữ liệu quan hệ như Oracle, MS SQL Server, MySQL,… 2.3.2. Tìm kiếm Phần này câu trả lời câu hỏi thứ hai, làm thế nào để bạn nhận được những thông tin ra? Câu trả lời là bằng cách tìm kiếm (Search). Để có được thông tin từ dữ liệu có cấu trúc, bạn có thể sử dụng các câu truy vấn như báo cáo, hoặc câu truy vấn tự xây dựng… 12 2.3.3. Kiến trúc hướng dịch vụ Kiến trúc hướng dịch vụ SOA là một hướng tiếp cận với việc thiết kế và tích hợp các phần mềm, chức năng, hệ thống theo dạng module, trong đó mỗi module đóng vai trò là một dịch vụ và có khả năng truy nhập thông qua môi trường mạng. 2.3.4. Kho dữ liệu thời gian thực DWH ngày nay thông thường được cập nhật từng ngày, từng tuần, từng tháng,...Có một số yêu cầu của những người sử dụng muốn nhìn thấy dữ liệu trong kho dữ liệu được cập nhật cứ hai phút một lần hay thậm chí thời gian thực. 2.4. Kiến trúc kho dữ liệu DWH và kiến trúc của nó tùy thuộc vào vị trí của từng tổ chức. Có ba kiến trúc phổ biến của DWH:  Kiến trúc DWH cơ bản: Hình 2.3: Kiến trúc DWH cơ bản  Kiến trúc DWH với Staging Area: Hình 2.4: Kiến trúc DWH với Staging Area 13  Kiến trúc DWH với Staging Area và Data Mart: Hình 2.5: Kiến trúc kho dữ liệu với Staging Area và Data Mart 2.5. Tổ chức dữ liệu logic 2.5.1. Lược đồ kho dữ liệu Lược đồ là một tập hợp các đối tượng cơ sở dữ liệu bao gồm bảng, view, index,…Lược đồ kho dữ liệu hay được sử dụng: lược đồ hình sao, lược đồ bông tuyết rơi, lược đồ kết hợp,… a. Lược đồ hình sao Hình 2.6: Lược đồ hình sao b. Lược đồ bông tuyết rơi Hình 2.7: Lược đồ bông tuyết rơi c. Lược đồ kết hợp Là kết hợp giữa sơ đồ hình sao và sơ đồ hình tuyết rơi. 2.5.2. Mô hình dữ liệu đa chiều Hình 2.8 thể hiện câu truy vấn theo bốn chiều: khách hàng, dịch vụ, thời gian. 14 Hình 2.8: Mô hình dữ liệu đa chiều 2.5.3. Bảng sự kiện Bảng sự kiện điển hình có hai kiểu cột, chúng chứa đựng những sự kiện số (thường gọi là thước đo), và chứa khóa của các bảng dimension. 2.5.4. Bảng chiều Các chiều là cách mô tả chủng loại mà theo đó các dữ liệu số trong khối được phân chia để phân tích. Khi xác định một chiều, chọn một hoặc nhiều cột của một trong các bảng liên kết (bảng chiều). 2.5.5. Bảng sự kiện tổng hợp Bảng tổng hợp – Bảng tổng hợp nhằm mục đích trả lời nhanh các câu hỏi thường gặp. Bảng sự kiện tổng hợp – Nhận diện các bảng dữ kiện yêu cầu – Các tổng hợp ở thứ tự cao có thể được tính toán từ các tổng hợp thứ tự thấp, 2.5.6. Nguồn dữ liệu Nguồn dữ liệu của DWH gồm nhiều loại khác nhau:  Dữ liệu từ các hệ thống tác nghiệp  Hệ thống kế thừa  Các nguồn dữ liệu bên ngoài 15 2.5.7. Công cụ làm sạch, chuyển đổi dữ liệu  Làm sạch  Chuyển đổi 2.5.8. Tích hợp dữ liệu khách hàng Tích hợp dữ liệu khách hàng CDI là MDM cho dữ liệu khách hàng. CDI là một quá trình chiết, làm sạch, lưu trữ, duy trì, và phân phối dữ liệu của khách hàng. 2.6.  Mối quan hệ giữa kho dữ liệu và Khai phá dữ liệu Cả hai đều có thể đứng độc lập với nhau, tuy nhiên khi kết hợp được kho dữ liệu với khai phá dữ liệu thì lợi ích rất lớn. 2.7. Kết luận chương Chương này đi vào phân tích công nghệ, cấu trúc, kiến trúc dịch vụ, lược đồ, mô hình dữ liệu và công cụ để xây dựng một kho dữ liệu. Trong chương tiếp theo sẽ tìm hiểu về các hệ thống nguồn, phân tích , chuyển đổi, làm sạch dữ liệu. Xây dựng và thử nghiệm kho dữ liệu, kết xuất ra báo cáo hỗ trợ công tác phân tích và trợ giúp ra quyết định cho hoạt động sản xuất kinh doanh của VNPT QUANG NINH. 16 CHƯƠNG III XÂY DỰNG KHO DỮ LIỆU KHÁCH HÀNG SỬ DỤNG DỊCH VỤ VIỄN THÔNG 3. 1. Nghiên cứu hệ thống nguồn ccbs Hệ thống CCBS gồm 4 khối chức năng chính: o Tính cước, chăm sóc và hỗ trợ khách hàng BCSS. o Cắt mở thuê bao, dịch vụ tự động o Quản lý điều hành sửa chữa báo hỏng. o Quản lý mạng ngoại vi Khách hàng Call Center Hệ thống tính cước & hỗ trợ khách hàng Khách hàng Điểm giao dịch Hệ thống Quản lý mạng ngoại vi Hệ thống Điều hành sửa chữa báo hỏng Khách hàng Web Email Hệ thống Cắt mở thuê bao dịch vụ tự động Hệ thống CCBS tổng thể Hình 3. 1: Hệ thống CCBS tổng thể 3.2. Thiết kế kho dữ liệu 3.2.1. Kiến trúc kho dữ liệu viễn thông Kiến trúc hệ thống kho dữ liệu viễn thông bao gồm máy chủ chuyển đổi dữ liệu, máy chủ cở sở dữ liệu để lưu kho dữ liệu, máy chủ báo cáo + web server + process server, máy chủ phân tích dữ liệu trực tuyến. Hình 3.2: Kiến trúc kho dữ liệu viễn thông 3.2.2. Thiết kế mô hình dữ liệu Việc thiết kế mô hình dữ liệu qua các bước, từ yêu cầu kinh doanh chọn 17 tiến trình kinh doanh cho mô hình, chọn cấp độ của tiến trình kinh doanh, chọn các chiều, chọn các dữ kiện. Hình 3.3 trình bày mô hình dữ liệu hệ thống. Hình 3.3: Mô hình dữ liệu hệ thống 3.2.2.1. Kho dữ liệu chủ đề bán hàng 3.2.2.2. Kho dữ liệu phát triển thuê bao 3.2.2.3. Kho dữ liệu cước khách hàng 3.2.2.4. Kho dữ liệu tổng hợp cước khách hàng 3.2.2.5. Kho dữ liệu thanh toán nợ của khách hàng 3.2.3. Tạo cấu trúc database Ở đây sẽ sử dụng công cụ Warehouse Builder để thực hiện tạo bảng hoặc thực hiện theo các lệnh script. 3.2.3.1. Sử dụng bảng tổng hợp, view và materialized view 3.2.3.2. Phân vùng 3.2.3.3. Chỉ mục 3.2.4. Thiết kế mô hình vật lý Hình 3. 13: Mô hình vật lí của DWH 18 3.2.5. Trích xuất, chuyển đổi nạp dữ liệu 3.2.5.1. Mô tả chung 3.2.5.2. Ánh xạ cho các chiều 3.2.5.3. Ánh xạ cho các bảng sự kiện 3.2.6. Thiết kế công cụ báo cáo Báo cáo là phần không thể thiếu trong các hệ thống kho dữ liệu. Việc xây dựng công cụ tạo báo cáo động và hệ thống báo cáo từ xa được xem xét để phát triển hệ thống báo cáo. Công cụ cho phép quản lý báo cáo đầu ra và cho phép người dùng bổ xung báo cáo vào hệ thống, mở rộng khả năng khai thác của người dùng và đáp ứng nhu cầu sử dụng lâu dài.  Mô hình báo cáo từ xa sử dụng Webservice Máy trạm Máy chủ web Máy chủ báo cáo Browser Engine báo cáo Web viewer Web service Engine báo cáo Window Form Engine báo cáo Hệ thống khác Hình 3.19: Mô hình báo cáo từ xa sử dụng Webservice 3.2.6.1. Kiến trúc và công nghệ 3.2.6.2 Các chức năng cho hệ thống báo cáo 3.2.7. Thiết kế công cụ tra cứu động Tương tự như phần báo cáo, tra cứu động là phần không thể thiếu trong các hệ thống kho dữ liệu. Chức năng tra cứu động tương tự như phần báo cáo, chỉ có cách hiển thị kết quả khác nhau. 3.2.8. Thiết kế công cụ quản trị hệ thống Chức năng quản trị hệ thống cho phép người quản trị hệ thống định nghĩa các quyền và phân quyền cho người dùng. Giúp cho hệ thống kiểm soát được các phiên truy cập và đảm bảo tính toàn vẹn của dữ liệu. 19 3.2.8.1. Các chức năng công cụ quản trị hệ thống 3.2.8.2: Các bảng chức năng trong CSDL. Phần tiếp theo luận văn sẽ giới thiệu một số giao diện chính, báo cáo phân tích  Giao diện chính hệ thống báo cáo, tra cứu, quản trị hệ thống. Hình 3.23: Giao diện chính chương trình  Giao diện phân quyền sử dụng báo cáo  Giao diện thiết lập xử lý số liệu  Giao diện tạo danh mục báo cáo  Giao diện báo cáo thông kê  Giao diện biểu đồ thống kê 3.3. Kết luận chương Với việc phân tích hệ thống nguồn CCBS hiện có của VNPT QUANG NINH cũng như các nhu cầu thực tế nhằm nâng cao hiệu quả điều hành sản xuất kinh doanh, để thấy được tầm quan trọng của việc phải xây dựng một hệ thống kho dữ liệu. Thiết kế kho dữ liệu DWH tập trung dựa trên các hệ thống dữ liệu rời rạc (từ nhiều nguồn dữ liệu khác nhau), nhằm mục đích khai thác tốt hơn, hiệu quả hơn dữ liệu hỗ trợ việc ra quyết định. Từ các nguồn dữ liệu rời rạc khác nhau không thể đưa ra cái nhìn tổng thể, hoặc hiệu quả của một vấn đế, nên các quyết định sẽ không đạt độ chính xác cao. Sau khi nghiên cứu, ứng dụng với công cụ warehouser builder của oracle… áp dụng thử nghiệm cho kho dữ liệu. Dữ liệu đã được tích hợp, nhất là với dữ liệu báo cáo đã đạt đến độ chính xác cao. Nhìn vào kết các báo cáo phân tích đã đưa ra được nhiều chiều của dữ liệu. Nhất là biểu đồ thống kê của báo cáo đã đánh giá được sự hiệu quả của kho dữ liệu. 20 KẾT LUẬN Luận văn nghiên cứu “Xây dựng kho dữ liệu khách hàng sử dụng dịch vụ viễn thông phục vụ công tác quản lý” đã được hoàn thành.  Phân tích công nghệ, cấu trúc, kiến trúc dịch vụ, lược đồ, mô hình dữ liệu và công cụ để xây dựng một kho dữ liệu. Tìm hiểu các phương pháp, kỹ thuật Khai phá dữ liệu và cách sử dụng các phương pháp, kỹ thuật này với từng loại dữ liệu để mang lại hiệu quả cao nhất cho kho dữ liệu.  Thực hiện xây dựng kho dữ liệu thử nghiệm từ hệ thống nguồn CCBS của VNPT QUANG NINH. Tuy nhiên do thời gian thực hiện luận văn có giới hạn nên luận văn chỉ dừng lại với dữ liệu thử nghiệm của một quý đầu năm 2011. Bước đầu đã đưa ra được một số báo cáo phân tích ở phạm vi khuyến mại khách hàng sử các dịch vụ viễn thông của VNPT trên địa bàn tỉnh.  Kết quả thu được rất khả quan, hệ thống kho dữ liệu cho báo cáo khá chính xác giúp cho tra cứu, theo dõi và đưa ra các biểu đồ phân tích với từng phân khúc thị trường của từng loại dịch vụ khuyến mại cho khách hàng. Qua đó đánh giá được chính xác, phản ảnh trung thực lại cho nhà quản lý biết được những dịch vụ nào đem lại doanh thu cao. Kết quả này cho thấy điểm ưu việt của kho dữ liệu và khai phá dữ liệu so với những phương pháp dự báo truyền thống như kinh tế lượng hay thống kê hay những báo cáo thông thường:  Kho dữ liệu có thể khai thác, phục vụ tốt cho nhiều tiêu chí báo cáo, dữ liệu giải quyết được bài toán định hướng quản lý tập trung không bị rời rạc, manh mún của các hệ thống dữ liệu hiện hành. Kho dữ liệu có khả năng điều chỉnh tham số tùy ý để thích nghi với những biến động của dữ liệu trong quá trình sử dụng. Độ chính xác của dữ liệu trong kh dữ liệu chỉ phụ thuộc vào dữ liệu đầu vào, những biến động thực tế đều được thể hiện trên số liệu. Qua đó, có thể khẳng định xây dựng kho dữ liệu và khai phá dữ liệu là một hướng đi hiệu quả để dự đoán số liệu, đưa ra một công cụ hỗ trợ các chuyên viên và nhà quản lý trong công tác xử lý số liệu phục công tác điều hành sản xuất kinh doanh của doanh nghiệp.
- Xem thêm -