Nghiên cứu giải pháp quản lý khách hàng hiệu quả dựa trên hướng tiếp cận khai phá dữ liệu

  • Số trang: 60 |
  • Loại file: PDF |
  • Lượt xem: 19 |
  • Lượt tải: 0
tailieuonline

Đã đăng 27462 tài liệu

Mô tả:

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ ĐÀO THỊ THU HIỀN NGHIÊN CỨU GIẢI PHÁP QUẢN LÝ KHÁCH HÀNG HIỆU QUẢ DỰA TRÊN HƢỚNG TIẾP CẬN KHAI PHÁ DỮ LIỆU LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ ĐÀO THỊ THU HIỀN NGHIÊN CỨU GIẢI PHÁP QUẢN LÝ KHÁCH HÀNG HIỆU QUẢ DỰA TRÊN HƢỚNG TIẾP CẬN KHAI PHÁ DỮ LIỆU Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS. NGUYỄN HÀ NAM HÀ NỘI – 2014 1 LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Nghiên cứu giải pháp quản lý khách hàng hiệu quả dựa trên hƣớng tiếp cận khai phá dữ liệu" là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả đƣợc trình bày trong luận văn là hoàn toàn trung thực. Tôi đã trích dẫn đầy đủ các tài liệu tham khảo, công trình nghiên cứu liên quan. Ngoại trừ các tài liệu tham khảo này, luận văn hoàn toàn là công việc của riêng tôi. Luận văn đƣợc hoàn thành trong thời gian tôi là học viên tại Khoa Công nghệ Thông tin, Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội. Hà Nội, ngày 29 tháng 10 năm 2014 Học viên Đào Thị Thu Hiền 2 LỜI CẢM ƠN Lời đầu tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới PGS.TS. Nguyễn Hà Nam đã tận tình hƣớng dẫn tôi trong suốt quá trình thực hiện luận văn tốt nghiệp. Tôi xin trân trọng cảm ơn các Thầy, Cô giáo đã tận tình chỉ dạy, cung cấp cho tôi những kiến thức quý báu và luôn nhiệt tình giúp đỡ, tạo điều kiện thuận lợi nhất trong suốt quá trình tôi học tập tại trƣờng Đại học Công nghệ. Tôi xin gửi lời cảm ơn tới các bạn trong lớp cao học K18 đã ủng hộ, khuyến khích tôi trong suốt quá trình học tập tại trƣờng. Cuối cùng, tôi muốn đƣợc gửi lời cảm ơn vô hạn tới gia đình, đồng nghiệp và bạn bè, những ngƣời thân yêu luôn bên cạnh và động viên tôi trong suốt quá trình thực hiện luận văn tốt nghiệp. Tôi xin chân thành cảm ơn! 3 MỤC LỤC LỜI CAM ĐOAN ............................................................................................................1 LỜI CẢM ƠN ..................................................................................................................2 MỤC LỤC ....................................................................................................................... 3 BẢNG CÁC TỪ VIẾT TẮT ........................................................................................... 5 DANH MỤC BẢNG BIỂU ............................................................................................. 6 DANH MỤC HÌNH VẼ ..................................................................................................7 MỞ ĐẦU ......................................................................................................................... 9 CHƢƠNG 1. GIỚI THIỆU ........................................................................................... 10 1.1. Nhu cầu xây dựng kho dữ liệu về khách hàng ...................................................10 1.1.1. Tại sao cần quan tâm đến khách hàng ......................................................... 10 1.1.2. Nhu cầu quan tâm đến khách hàng của các ngân hàng thƣơng mại ............11 1.2. Giới thiệu một số dịch vụ ngân hàng ..................................................................13 1.3. Những lợi ích mà dịch vụ ngân hàng mang lại ..................................................14 1.3.1. Đối với ngân hàng ....................................................................................... 14 1.3.2. Đối với khách hàng...................................................................................... 15 1.3.3. Đối với nhà cung cấp dịch vụ: .....................................................................15 1.4. Mục tiêu và cấu trúc của luận văn ......................................................................15 CHƢƠNG 2. KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU TRÊN KHO ...................... 16 2.1. Tổng quan về BI .................................................................................................16 2.1.1. Giới thiệu chung .......................................................................................... 16 2.1.2. Giới thiệu kho dữ liệu ..................................................................................16 2.2. Tìm hiểu bộ công cụ BI của SQL Server ........................................................... 24 2.2.1. SQL Server Reporting Services ..................................................................25 2.2.2. SQL Server Analysis Services: ...................................................................26 CHƢƠNG 3. XÂY DỰNG HỆ THỐNG HỖ TRỢ KHÁCH HÀNG DỰA TRÊN KHO DỮ LIỆU GIAO DỊCH........................................................................................ 27 3.1. Giới thiệu dữ liệu ................................................................................................ 27 3.1.1. Cơ sở dữ liệu................................................................................................ 27 3.1.2. Lƣợc đồ kho dữ liệu .................................................................................... 30 3.2. Báo cáo thống kê ................................................................................................ 31 3.2.1. Thống kê việc sử dụng giao dịch:................................................................ 31 3.2.2. Thống kê lƣợng tiền thanh toán bán lẻ theo tỉnh và độ tuổi ........................ 33 4 3.2.3. 10 dịch vụ bán lẻ đƣợc thực hiện nhiều nhất tại Hồ Chí Minh và Hà Nội. .34 3.2.4. Tƣơng quan giữa các top 10 loại dịch vụ của Hồ Chí Minh và Hà Nội ......35 3.2.5. Tƣơng quan giữa lƣợng tiền thanh toán và số dƣ tài khoản ........................ 37 3.2.6. Mức điện thoại theo chức vụ và tình trạng hôn nhân ..................................38 3.2.7. Thống kê lƣợng giao dịch ATM tại các thời điểm trong ngày .................... 39 3.3. Dự báo, dự đoán .................................................................................................39 3.3.1. Sự phụ thuộc giữa các loại dịch vụ ............................................................. 39 3.3.2. Nhóm khách hàng nào có khả năng sử dụng dịch vụ thanh toán bán lẻ cao nhất: ....................................................................................................................... 47 3.3.3. Sự phụ thuộc giữa loại hình dịch vụ và tỉnh thành ......................................50 3.3.4. Dự đoán xu hƣớng sử dụng dịch vụ thanh toán cƣớc điện thoại .................54 KẾT LUẬN – HƢỚNG PHÁT TRIỂN ........................................................................57 TÀI LIỆU THAM KHẢO ............................................................................................. 58 5 BẢNG CÁC TỪ VIẾT TẮT Tên đầyđủ Viết tắt BI Business Intelligence CSDL Cơ sở dữ liệu KDL Kho dữ liệu KPDL Khai phá dữ liệu NHTM Ngân hàng thƣơng mại POS Point of Sale ATM Automatic teller machine SMS Short Message Service SQL Structured Query Language ETL Extract, Transform and Load 6 DANH MỤC BẢNG BIỂU Bảng 3.1. Mô tả bảng TaiKhoan ...................................................................................28 Bảng 3.2. Mô tả bảng ATM........................................................................................... 28 Bảng 3.3. Mô tả bảng Bill ............................................................................................. 29 Bảng 3.4. Mô tả bảng Retail .......................................................................................... 30 Bảng 3.5. Kết quả mô hình khi thay đổi tham số COMPLEXITY_PENALTY ...........40 Bảng 3.6. Chú thích của các nút tại nhánh sử dụng ATM = 1 ......................................41 Bảng 3.7. Bảng tỷ lệ dự đoán ba thuật toán dự báo tình hình sử dụng dịch vụ ............45 Bảng 3.8.Chú thích các nút của cây phân nhánh ........................................................... 49 7 DANH MỤC HÌNH VẼ Hình 2.1. Kiến trúc kho dữ liệu ..................................................................................... 17 Hình 2.2. Sơ đồ hình sao ............................................................................................... 19 Hình 2.3. Sơ đồ bông tuyết ............................................................................................ 19 Hình 2.4. Quá trình khám phá tri thức trong cơ sở dữ liệu ...........................................21 Hình 3.1. Cơ sở dữ liệu giao dịch khách hàng .............................................................. 27 Hình 3.2. Lƣợc đồ kho dữ liệu ...................................................................................... 30 Hình 3.3. Báo cáo tần suất sử dụng các loại giao dịch theo tỉnh thành ......................... 32 Hình 3.4. Thống kê lƣợng tiền thanh toán bán lẻ theo tỉnh và độ tuổi .......................... 33 Hình 3.5. 10 Dịch vụ bán lẻ đƣợc thanh toán nhiều nhất ở TP Hồ Chí Minh ...............34 Hình 3.6. 10 dịch vụ bản lẻ đƣợc thanh toán nhiều nhất Hồ Chí Minh ........................ 35 Hình 3.7. Tƣơng quan giữa 10 loại dịch vụ TT nhiều nhất của Hồ Chí Minh và Hà Nội .......................................................................................................................................36 Hình 3.8. Tƣơng quan giữa lƣợng tiền thanh toán và số dƣ tài khoản .......................... 37 Hình 3.9. Thống kê thanh toán cƣớc điện thoại năm 2013 ...........................................38 Hình 3.10. Thống kê thanh toán cƣớc điện thoại năm 2014 .........................................38 Hình 3.11.Số giao dịch ATM tại hai thành phố lớn theo thời gian ............................... 39 Hình 3.12. Mô hình khai phá dữ liệu sự phụ thuộc giữa các loại dịch vụ..................... 40 Hình 3.13. Cây phân nhánh dự đoán sử dụng dịch vụ thanh toán bán lẻ tháng 6 .........41 Hình 3.14. Chú thích của nút All ...................................................................................41 Hình 3.15. Chú thích của nút sử dụng ATM=1 ............................................................. 41 Hình 3.16. Mạng phụ thuộc thanh toán bán lẻ tháng 6 thuật toán cây quyết định ........42 Hình 3.17. Biểu đồ dự đoán bán lẻ tháng 6 khi sử dụng thuật toán cây quyết dịnh......42 Hình 3.18. Mạng phụ thuộc khi dùng thuật toán Navie Bayes .....................................43 Hình 3.19. Đặc điểm của các thuộc tính khi dùng thuật toán Naive Bayes ..................43 Hình 3.20. Bảng thuộc tính của mạng nơron.................................................................43 Hình 3.21. Biểu đồ dự báo thanh toán bán lẻ khi sử dụng 3 thuật toán ........................ 44 Hình 3.22. Ma trận phân lớp dự báo tình hình sử dụng dịch vụ bán lẻ ......................... 45 Hình 3.23. Mô hình dự báo thanh toán bán lẻ tháng 6 của từng khách hàng ................46 Hình 3.24. Mô hình dự báo thanh toán bán lẻ tháng 6 ..................................................46 8 Hình 3.25. Kết quả dự báo thanh toán bán lẻ của khách hàng ......................................47 Hình 3.26. Mô hình khai phá dữ liệu.............................................................................48 Hình 3.27. Mạng phụ thuộc thanh toán bán lẻ và các thuộc tính của khách hàng ........48 Hình 3.28. Cây phân nhánh dự đoán nhóm khách hàng sử dụng thanh toán bán lẻ .....49 Hình 3.29. Biểu đồ so sánh độ chính xác ......................................................................50 Hình 3.30. Mô hình khai phá dự đoán sự việc sử dụng giao dịch rút tiền .................... 50 Hình 3.31. Mô hình khai phá dự đoán việc sử dụng giao dịch thanh toán điện thoại ...51 Hình 3.32. Cây phân nhánh dự báo tình hình sử dụng giao dịch rút tiền ATM ............51 Hình 3.33. Cây phân nhánh dự báo tình hình sử dụng giao dịch thanh toán điện thoại51 Hình 3.34. Mạng phụ thuộc khi dùng thuật toán cây quyết định dự báo việc rút tiền ATM .............................................................................................................................. 52 Hình 3.35. Mạng phụ thuộc dự báo việc thanh toán điện thoại ....................................52 Hình 3.36. Biểu đồ dự báo việc sử dụng giao dịch thanh toán hóa đơn điện thoại .......53 Hình 3.37. Ma trận phân lớp dự đoán tình hình rút tiền tại ATM .................................53 Hình 3.38. Ma trận phân lớp của việc sử dụng dịch vụ thanh toán điện thoại ..............54 Hình 3.39. Mô hình khai phá dữ liệu dự báo xu hƣớng sử dụng thanh toán điện thoại 54 Hình 3.40. Dự đoán chiều hƣớng sử dụng dịch vụ thanh toán điện thoại ..................... 55 Hình 3.41. Biểu đồ lƣợng giao dịch thanh toán cƣớc điện thoại theo tháng .................56 9 MỞ ĐẦU Trong thời đại kinh tế thị trƣờng, các doanh nghiệp sản xuất kinh doanh ngày càng có nhiều đối thủ cạnh tranh, cạnh tranh về giá cả và chất lƣợng sản phẩm dịch vụ. Khi cuộc chiến về giá cả gần nhƣ bão hòa thì các đơn vị sản xuất kinh doanh hàng hóa dịch vụ bắt đầu quan tâm đến khách hàng nhiều hơn. Đã có rất nhiều doanh nghiệp tiến hành các cuộc khảo sát khách hàng với quy mô lớn nhằm tìm hiểu khách hàng mong muốn gì ở sản phẩm của mình. Các công ty về công nghệ cũng tung ra thị trƣờng nhiều hệ thống Quản lý khách hàng nhằm giúp các doanh nghiệp quản lý khách hàng của mình tốt hơn. Các phần mềm quản lý khách hàng đa số mới chỉ tập trung việc thu thập thông tin về khách hàng để quản lý dữ liệu tập trung. Việc sử dụng công nghệ BI bao gồm các kỹ thuật khai phá dữ liệu đƣợc áp dụng trong các lĩnh vực cuộc sống nhƣ y tế, giáo dục, bán lẻ, ngân hàng, viễn thông…đã mang lại thành công và lợi ích nhất định cho các đơn vị. Mục tiêu của luận văn là tìm hiểu và ứng dụng công nghệ Busines Intelligent trong phân tích và khai thác dữ liệu trong CSDL giao dịch của khách hàng nhằm tìm ra mối liên quan giữa khách hàng và các dịch vụ của ngân hàng. Luận văn gồm các chƣơng sau: Chƣơng 1. Giới thiệu: chƣơng này giới thiệu nhu cầu xây dựng kho dữ liệu của khách hàng, tại sao cần quan tâm đến khách hàng đồng thời giới thiệu một số loại dịch vụ, giao dịch của khách hàng ngân hàng. Chủ tài khoản và các giao dịch liên quan cũng là đối tƣợng tìm hiểu của luận văn. Chƣơng 2. Giới thiệu kho dữ liệu và khai phá dữ liệu: chƣơng này trình bày lý thuyết về kho dữ liệu, khai phá dữ liệu và giới thiệu bộ công cụ Business Intelligence (BI) của SQL Server. Chƣơng 3. Xây dựng hệ thống hỗ trợ khách hàng dựa trên kho dữ liệu giao dịch: Chƣơng này trình bày về xây dựng kho dữ liệu giao dịch của khách hàng. Dựa trên kho dữ liệu đã có sẽ tiến hành tạo báo cáo đa chiều trả lời các câu hỏi mang tính chất thống kê nhƣ: nhóm khách hàng nào thƣờng sử dụng các loại giao dịch này, giao dịch nào đƣợc sử dụng nhiều nhất, tỉnh thành nào sử dụng dịch vụ nhiều nhất, các loại giao dịch bán lẻ đƣợc thanh toán thƣờng xuyên nhất. Xây dựng mô hình khai phá, phân tích các kết quả thu đƣợc và đƣa ra một số gợi ý liên quan đến mong muốn tăng lƣợng khách hàng sử dụng dịch vụ của ngân hàng. 10 CHƢƠNG 1. GIỚI THIỆU 1.1. Nhu cầu xây dựng kho dữ liệu về khách hàng 1.1.1. Tại sao cần quan tâm đến khách hàng Vai trò của khách hàng trong hoạt động sản xuất kinh doanh của doanh nghiệp là không thể phủ nhận. Ở đây có thể dẫn chứng nhận định của nhà kinh tế nổi tiếng Erwin Frand “Không có khách hàng sẽ không có bất cứ công ty nào tồn tại” đã cho thấy vai trò của khách hàng trong mọi hoạt động kinh doanh. Lý do cần quan tâm đến khách hàng:  Khách hàng là yếu tố quan trọng quyết định sự sống còn và phát triển của doanh nghiệp.  Khách hàng ngày càng có nhiều sự lựa chọn cho sản phẩm dịch vụ.  Chất lƣợng sản phẩm dịch vụ ngày càng có ít sự khác biệt. Làm thế nào để giữ chân đƣợc khách hàng cũ lôi kéo đƣợc khách hàng mới luôn là vấn đề mà các doanh nghiệp quan tâm. Để làm đƣợc điều này trƣớc tiên cùng xem khách hàng mong muốn gì trƣớc khi mua sản phẩm hoặc sử dụng dịch vụ. Theo một bài báo tại Doanh nhân Hồ Chí Minh cuối tuần thì khách hàng thƣờng có những câu hỏi sau trƣớc khi quyết định mua sản phẩm hay sử dụng dịch vụ [6]:  Doanh nghiệp có thể làm đƣợc điều gì cho tôi: theo Robbie Bogue, Chủ tịch của Marketing Excellence, một công ty tƣ vấn tiếp của Los Angeles (Mỹ), nói: “Khách hàng thường không quan tâm đến những gì bạn biết hay bạn có thể làm cho đến khi họ biết được bạn có thể làm được điều gì cho họ”.  Tại sao sản phẩm/dịch vụ lại Quan trọng đối với tôi: khách hàng sẽ đi tìm những thứ mà họ muốn mua chứ không phải là những thứ mà doanh nghiệp muốn họ mua. Doanh nghiệp có thể “yêu” sản phẩm hay dịch vụ do mình tạo ra nhƣng sản phẩm hay dịch vụ đó chẳng đem đến cho khách hàng một giá trị hay lợi ích nào thì chắc chắn nó sẽ không đƣợc họ quan tâm. Hãy tìm hiểu khách hàng cần và mong muốn điều gì nhất và tạo ra một sản phẩm hay dịch vụ để đáp ứng nhu cầu, mong muốn đó.  Sản phẩm hay dịch vụ của doanh nghiệp có đem lại cho tôi Nhiều Hơn những gì tôi đang có hay không? Nói chung, khách hàng luôn muốn có nhiều hơn những gì mà họ đang có. Nếu một cửa hàng bánh pizza chào bán theo kiểu “mua hai cái trả tiền một cái“ thì ngay cả những ngƣời đang ăn kiêng cũng muốn mua. Không hẳn vì họ “tham lam“ mà đó là tâm lý chung của khách hàng: ai cũng muốn có nhiều hơn để dự phòng cho những lúc thiếu thốn. Khi có đƣợc nhiều thứ hơn, khách hàng 11     cũng có cảm giác rằng họ là ngƣời khôn ngoan chứ không phải là những kẻ “ngây thơ“. Sản phẩm hay dịch vụ của doanh nghiệp có Tốt Hơn những gì tôi đang có hay không? Xã hội ngày càng hiện đại, tinh vi hơn và con ngƣời ngày càng hiểu biết hơn thì vấn đề chất lƣợng cũng trở nên quan trọng hơn số lƣợng. Ngay cả những khách hàng muốn có đƣợc nhiều hơn cũng mong muốn nhận đƣợc điều tốt hơn khi quyết định mua một sản phẩm hay dịch vụ nào đó. Thành công mà các nhãn hiệu xe hơi nhƣ Lexus và Infiniti có đƣợc là nhờ biến việc lái xe (hay phải gặp trục trặc và mất thời gian, tiền bạc để bảo trì, sữa chữa) thành một thú vui. Dịch vụ của doanh nghiệp có nhanh hơn các dịch vụ mà tôi đang sử dụng hay không? Thời gian là tiền bạc. Chính vì vậy mà thƣ điện tử trở thành ứng dụng phát triển nhanh nhất trong thế giới Internet. Và nếu Fedex, một công ty chuyển phát nhanh hàng đầu của thế giới, không đƣa ra thị trƣờng dịch vụ “giao hàng vào cuối tuần“ để phục vụ những khách hàng phải làm việc vào cuối tuần thì công ty này đã mất một số khách hàng vào tay US Postal Service, một đối thủ cạnh tranh lớn của FedEx trên thị trƣờng Mỹ. Sản phẩm hay dịch vụ của doanh nghiệp có Rẻ Hơn những sản phẩm hay dịch vụ mà tôi đang sử dụng hay không? Chi phí là một trong những vấn đề đƣợc khách hàng quan tâm hàng đầu khi quyết định mua một sản phẩm hay dịch vụ. Trƣớc khi mua sỉ đƣợc xem là một việc làm “hạ cấp“, bình dân nhƣng nay ngƣời ta quan niệm rằng mua lẻ không phải là một việc làm khôn ngoan. Nếu khách hàng không bận tâm gì đến giá cả thì các công ty đã không sử dụng chiêu “sale off“ (bán hàng giảm giá) khá thƣờng xuyên trong các quảng cáo của họ. Việc sử dụng sản phẩm hay dịch vụ của doanh nghiệp có Giảm Bớt Rủi Ro so với việc sử dụng các sản phẩm hay dịch vụ khác hay không? Bạn có sẵn sàng đầu tƣ tất cả tiền bạc của mình vào một công ty hay dịch vụ tài chính mới thành lập, chƣa có một dấu ấn, thành tích đáng kể nào trong hoạt động, mặc dù công ty đó có những ý tƣởng đầu tƣ rất tuyệt vời hay không? Chắc chắn là không. Khách hàng cũng vậy, họ chỉ mua một sản phẩm mới hay sử dụng một dịch vụ mới khi họ cảm thấy an toàn. 1.1.2. Nhu cầu quan tâm đến khách hàng của các ngân hàng thƣơng mại Ngân hàng Thƣơng mại (NHTM) là một tổ chức kinh doanh tiền tệ và dịch vụ ngân hàng bằng cách huy động vốn tức là nhận tiền gửi và phát hành giấy tờ có giá, rồi sử dụng số vốn huy động đó vào nghiệp vụ cho vay, chiết khấu, làm dịch vụ thanh 12 toán và cung ứng dịch vụ ngân hàng cho tất cả các doanh nghiệp, các tổ chức kinh tế và cá nhân [3]. Ngân hàng Thƣơng mại (NHTM) đã hình thành tồn tại và phát triển hàng trăm năm gắn liền với sự phát triển của kinh tế hàng hoá. Sự phát triển hệ thống NHTM đã có tác động rất lớn đến quá trình phát triển của nền kinh tế hàng hoá, ngƣợc lại kinh tế hàng hoá phát triển mạnh mẽ đến giai đoạn cao nhất là nền kinh tế thị trƣờng thì NHTM cũng ngày càng đƣợc hoàn thiện và trở thành những định chế tài chính không thể thiếu đƣợc. Trong nền kinh tế cạnh tranh gay gắt nhƣ hiện nay các NHTM phải không ngừng hoàn thiện mình để cung cấp dịch vụ tốt nhất cho khách hàng. Bên cạnh loại hình kinh doanh truyền thống các ngân hàng đã và đang triển khai hệ thống ngân hàng hiện đại hay còn gọi là ngân hàng điện tử. Ngày nay, dịch vụ ngân hàng đang vƣơn tới từng ngƣời dân. Đó là dịch vụ ngân hàng tiêu dùng và bán lẻ. "Ngân hàng điện tử", với sự trợ giúp của công nghệ thông tin, cho phép tiến hành các giao dịch bán lẻ với tốc độc cao trong đó nổi bậc là dịch vụ Internet-banking, một thị trƣờng hàng tỷ dân đang mở ra trƣớc mắt họ. Các ngân hàng đua nhau tung ra thị trƣờng một loạt các sản phẩm cho dịch vụ Internet-banking làm cho dịch vụ Ngân hàng trở nên phong phú và phổ biến rộng rãi. Hơn nữa theo thống kê của Bộ thông tin và truyền thông [4] tính đến ngày 26/12/2013, tổng doanh thu viễn thông ƣớc đạt 9,9 tỷ USD. Tổng số thuê bao điện thoại đạt 105 triệu thuê bao, trong đó di động chiếm 93%; hơn 31 triệu ngƣời sử dụng Internet; tổng số thuê bao Internet băng rộng (xDSL) đạt hơn 5,17 triệu thuê bao; tổng băng thông kết nối Internet trong nƣớc đạt 613,8Gb/s và tổng băng thông kết nối Internet quốc tế đạt 549Gb/s; hơn 263.000 tên miền “.vn” đã đăng ký và Việt Nam tiếp tục giữ vị trí số 1 Đông Nam Á về số lƣợng sử dụng tên miền cấp cao mã quốc gia, đạt tốc độ tăng trƣởng bình quân 172% năm; tổng số tên miền tiếng Việt đã đăng ký đạt gần 950.000; tổng số địa chỉ IPv4 đã cấp đạt trên 15,5 triệu địa chỉ. Các thống kê của Bộ Thông tin và truyền thông cho ta thấy thị trƣờng thanh toán trực tuyến của ngân hàng rất tiềm năng và cần đƣợc quan tâm. Các loại giao dịch phổ biến của ngân hàng : Thanh toán cƣớc điện thoại qua ngân hàng: Đây là hình thức thanh toán cƣớc phí nhanh chóng, an toàn và tiết kiệm chi phí cho khách hàng. Thuê bao chỉ cần có Tài khoản Ngân hàng hoặc có thẻ Ngân hàng là có thể thanh toán cƣớc phí trả sau online trên toàn quốc. Thời gian xử lý thanh toán hoàn toàn theo phƣơng thức online nên rất nhanh và hiệu quả. Khách hàng có thể thực hiện qua các hình thức nhƣ Mobile Banking, Internet Banking, ATM, giao dịch tại quầy Ngân hàng hay ủy nhiệm thu định kỳ. Thanh toán hóa đơn hàng hóa dịch vụ bán lẻ: Đây là hình thức thanh toán hóa đơn dịch vụ thông qua hệ thống POS, ATM, qua hệ thống Internet Banking, SMS- 13 Banking. Số lƣợng chủ thẻ ngày càng lớn cùng với việc mở rộng mạng lƣới POS tại các đại lý và việc hỗ trợ thanh toán liên ngân hàng loại giao dịch này càng ngày càng gia tăng về số lƣợng giao dịch. 1.2. Giới thiệu một số dịch vụ ngân hàng - - - - - - - Dịch vụ SMS-banking: SMS-banking [3] là dịch vụ cho phép tra cứu thông tin tài khoản và đăng ký nhận những thông tin mới nhất từ ngân hàng qua tin nhắn điện thoại di động. Dịch vụ Call Center: Call Center là dịch vụ Ngân hàng qua điện thoại. Khách hàng gọi về một số điện thoại cố định của trung tâm dịch vụ để đƣợc cung cấp thông tin chung và thông tin cá nhân. Call Center có thể linh hoạt trả lời các thắc mắc của khách hàng, tuy nhiên phải có ngƣời trực 24/24 giờ. Dịch vụ Phone-banking: Dịch vụ Phone-banking sử dụng Call Center tự động, chỉ cần gọi từ điện thoại cố định hoặc di động vào tổng đài tự động của ngân hàng và thực hiện theo hƣớng dẫn sẽ đƣợc những thông tin về sản phẩm dịch vụ ngân hàng, thông tin tài khoản cá nhân. Dịch vụ Home-banking: Dịch vụ Home-banking [3] là dịch vụ cho phép khách hàng có thể ngồi tại nơi làm việc thực hiện hầu hết các giao dịch với ngân hàng nhƣ chuyển tiền, liệt kê giao dịch, tỷ giá, lãi suất, báo nợ, báo có…Với Homebanking, khách hàng giao dịch với ngân hàng qua mạng nội bộ (Intranet) do ngân hàng xây dựng riêng. Các giao dịch đƣợc tiến hành tại nhà thông qua hệ thống máy tính nối với hệ thống máy tính ngân hàng. Dịch vụ Internet-banking: Dịch vụ Internet-banking giúp khách hàng thực hiện các giao dịch với ngân hàng qua mạng Internet (mạng toàn cầu). Để tham gia, khách hàng truy cập vào website của ngân hàng và thực hiện giao dịch, truy cập thông tin cần thiết. Khách hàng cũng có thể truy cập vào các website khác để mua hàng và thực hiện thanh toán với ngân hàng. Kiosk Ngân hàng: Là sự phát triển của dịch vụ Ngân hàng hƣớng tới việc phục vụ khách hàng với chất lƣợng cao nhất và thuận tiện nhất. Trên đƣờng phố sẽ đặt các trạm làm việc với đƣờng kết nối Internet tốc độ cao. Khi khách hàng cần giao dịch hoặc yêu cầu dịch vụ, họ chỉ cần truy cập, cung cấp số chứng nhận cá nhân và mật khẩu để sử dụng dịch vụ của hệ thống ngân hàng phục vụ mình [3]. Dịch vụ thu hộ hóa đơn: Dịch vụ Thu hộ hóa đơn qua ngân hàng là kênh thanh toán chính xác, tiện lợi giúp nhà cung cấp thu phí sử dụng dịch vụ thông qua tài khoản của khách hàng tại ngân hàng. Khách hàng nợ hoá đơn chỉ cần có tài khoản ngân hàng là có thể chủ động thanh toán các khoản nợ cƣớc của mình. Với dịch vụ này, các hóa đơn định kỳ nhƣ điện thoại, Internet, điện, nƣớc, truyền hình cáp, thanh toán học phí,...,... có thể đƣợc thanh toán dễ dàng mà khách hàng không cần tới các điểm thu phí dịch vụ. Chỉ với một lần đăng ký, các hóa đơn hàng tháng đƣợc khách hàng ủy quyền giao cho ngân hàng sẽ đƣợc 14 thanh toán đầy đủ, đúng hẹn. Số tiền thanh toán đƣợc ngân hàng tự động trích nợ từ tài khoản của khách hàng. Hóa đơn tài chính sẽ đƣợc nhà cung cấp dịch vụ gửi về cho khách hàng qua đƣờng bƣu điện. Việc kết nối dịch vụ thu hộ hóa đơn qua ngân hàng, các nhà cung cấp dịch vụ sẽ có thêm một kênh thanh toán mới, giảm thiểu chi phí cho nhân viên thu cƣớc, các điểm thu cƣớc, phục vụ khách hàng ngày càng tốt hơn bằng việc đem lại cho họ nhiều tiện ích mới, đa dạng. Cùng với đó, phƣơng thức thanh toán không dùng tiền mặt sẽ giúp tránh đƣợc các rủi ro xảy ra với các khoản tiền công ty thu đƣợc từ khách hàng nhƣ: mất tiền, tiền giả… Dịch vụ thu hộ hóa đơn giúp khách hàng bỏ đƣợc nỗi lo khi bị cắt hoặc dừng sử dụng dịch vụ khi khách hàng không thanh toán đầy đủ đúng hạn vì không phải thu xếp thời gian đến các điểm thu phí hoặc đi công tác. 1.3. Những lợi ích mà dịch vụ ngân hàng mang lại 1.3.1. Đối với ngân hàng  Tiết kiệm chi phí, tăng doanh thu: Phí giao dịch Internet-banking đƣợc đánh giá là ở mức rất thấp so với giao dịch truyền thống, từ đó góp phần tăng doanh thu hoạt động cho ngân hàng. Theo thống kê của Ngân hàng Đông Á, chi phí cho giao dịch trên Internet chỉ bằng 1/12 giao dịch tại quầy, bằng 2/3 chi phí giao dịch qua ATM.  Mở rộng phạm vi hoạt động, tăng khả năng cạnh tranh Đa dạng hóa và nâng cao chất dịch vụ và hiệu quả hoạt động, qua đó nâng cao khả năng cạnh tranh của NHTM giúp NHTM thực hiện chiến lƣợc “toàn cầu hóa” mà không cần mở thêm chi nhánh ở trong nƣớc cũng nhƣ ở nƣớc ngoài. Qua các dịch vụ của ngân hàng có thể quảng bá, khuyếch trƣơng thƣơng hiệu của mình một cách sinh động, hiệu quả.  Nâng cao hiệu quả sử dụng vốn Xét về mặt kinh doanh của ngân hàng, dịch vụ sẽ giúp nâng cao hiệu quả sử dụng vốn. Thông qua các dịch vụ của ngân hàng điện tử, các lệnh về chi trả, nhờ thu của khách hàng đƣợc thực hiện nhanh chóng, tạo điều kiện cho vốn tiền tệ chu chuyển nhanh, thực hiện tốt quan hệ giao dịch, trao đổi tiền - hàng. Qua đó đẩy nhanh tốc độ lƣu thông hàng hoá, tiền tệ, nâng cao hiệu quả sử dụng vốn.  Tăng khả năng chăm sóc và thu hút khách hàng Chính sự tiện ích có đƣợc từ công nghệ ứng dụng, từ phần mềm, từ nhà cung cấp dịch vụ mạng, dịch vụ Internet đã thu hút và giữ khách hàng sử dụng, quan hệ giao dịch với ngân hàng, trở thành khách hàng truyền thống của ngân hàng. Khả năng phát 15 triển, cung ứng các tiện ích dịch vụ cho nhiều đối tƣợng khách hàng, nhiều lĩnh vực kinh doanh là rất cao. 1.3.2. Đối với khách hàng  Tiết kiệm chi phí, tiết kiệm thời gian. Việc đăng ký sử dụng các dịch vụ thanh toán hóa đơn giá trị gia tăng đặc biệt có ý nghĩa đối với các khách hàng có ít thời gian để đi đến văn phòng trực tiếp giao dịch với ngân hàng, các khách hàng nhỏ và vừa, khách hàng cá nhân có số lƣợng giao dịch với ngân hàng không nhiều, số tiền mỗi lần giao dịch không lớn. Đây là lợi ích mà các giao dịch kiểu ngân hàng truyền thống khó có thể đạt đƣợc với tốc độ nhanh, chính xác.  Thông tin liên lạc thuận tiện hơn, hiệu quả hơn Thanh toán hóa đơn dịch vụ qua các kênh thanh toán trực tuyến giúp cho khách hàng có thể liên lạc với ngân hàng một cách nhanh chóng, thuận tiện để thực hiện một số nghiệp vụ ngân hàng tại bất kỳ thời điểm nào và ở bất cứ nơi đâu có Internet. Dịch vụ thanh toán trực tuyến giúp khách hàng dễ dàng hơn trong vấn đề chuyển khoản và thanh toán qua mạng. Việc mua bán hàng hóa qua mạng đặc biệt là hàng hóa số hóa thì thanh toán trực tuyến rất tiện lợi cho cả ngƣời mua và ngƣời bán. 1.3.3. Đối với nhà cung cấp dịch vụ: Đối với nhà cung cấp dịch vụ khi sử dụng dịch vụ của ngân hàng sẽ tiết kiệm đƣợc chi phí mở cửa hàng, nhân lực vì không phải trực tiếp đến giao dịch với ngân hàng. Không phải đổi tiền, chuẩn bị tiền lẻ để trả lại khách hàng. 1.4. Mục tiêu và cấu trúc của luận văn Với mục tiêu Tìm hiểu và ứng dụng công nghệ Busines Intelligent trong phân tích và khai thác dữ liệu trong CSDL giao dịch của khách hàng nhằm tìm ra mối liên quan giữa khách hàng và các dịch vụ của ngân hàng vì thế trong khuôn khổ giới hạn của luận văn, tôi xin trình bày: - Tìm hiểu cơ sở lý thuyết về công nghệ BI, giới thiệu về kho dữ liệu, khai phá dữ liệu. Xây dựng cơ sở dữ liệu khách hàng. Thiết kế báo cáo động thống kê và trực quan. Sử dụng các kỹ thuật khai phá dữ liệu để phân tích dữ liệu. 16 CHƢƠNG 2. KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU TRÊN KHO 2.1. Tổng quan về BI 2.1.1. Giới thiệu chung Business Intelligence (BI) là tập hợp các kỹ thuật và các công cụ giúp chuyển đổi dữ liệu thô thành các thông tin có ý nghĩa và hữu ích phục vụ cho các mục đích phân tích kinh doanh. Công nghệ BI có khả năng xử lý một lƣợng lớn dữ liệu phi cấu trúc để giúp xác định, tạo và phát triển các chiến lƣợc, cơ hội kinh doanh mới. Mục tiêu của BI là cho phép dễ dàng cho việc giải thích khối lƣợng lớn dữ liệu. Xác định các cơ hội mới và thực hiện một chiến lƣợc hiệu quả dựa trên những hiểu biết có thể cung cấp cho các doanh nghiệp với một lợi thế thị trƣờng và ổn định lâu dài cạnh tranh. Công nghệ BI cung cấp quan điểm lịch sử, hiện tại và dự báo hoạt động kinh doanh. Chức năng phổ biến của BI là báo cáo, xử lý phân tích trực tuyến, phân tích, khai thác dữ liệu, khai thác chế biến, xử lý sự kiện phức tạp, quản lý hoạt động kinh doanh, điểm chuẩn, khai thác văn bản, phân tích dự báo và phân tích quy tắc. BI có thể đƣợc sử dụng để hỗ trợ một loạt các quyết định kinh doanh khác nhau, từ hoạt động cho đến chiến lƣợc. Quyết định điều hành cơ bản bao gồm định vị sản phẩm hoặc giá cả. Quyết định kinh doanh chiến lƣợc bao gồm các ƣu tiên, mục tiêu và phƣơng hƣớng ở mức độ rộng. Trong mọi trƣờng hợp, BI là hiệu quả nhất khi nó kết hợp dữ liệu thu đƣợc từ thị trƣờng (dữ liệu bên ngoài) với các dữ liệu từ các nguồn nội bộ công ty nhƣ dữ liệu tài chính và các hoạt động (dữ liệu nội bộ). Khi kết hợp dữ liệu bên ngoài và nội bộ có thể cung cấp một bức tranh hoàn chỉnh mà thực tế tạo ra các quyết định kinh doanh "thông minh" . 2.1.2. Giới thiệu kho dữ liệu 2.1.2.1. Cơ sở lý thuyết a. Khái niệm về kho dữ liệu Theo William Inmon [1], kho dữ liệu là một tập hợp dữ liệu hƣớng chủ đề, tích hợp, có tính thời gian và không thay đổi để hỗ trợ quá trình tạo quyết định quản lý. Theo Jonh Ladley, công nghệ kho dữ liệu là tập các phƣơng pháp, kỹ thuật và các công cụ có thể kết hợp, hỗ trợ nhau để cung cấp thông tin cho ngƣời sử dụng trên cơ sở tích hợp từ nhiều nguồn dữ liệu, nhiều môi trƣờng khác nhau. KDL thƣờng rất lớn tới hàng trăm GB thậm chí hàng nghìn TB. 17 b. Kiến trúc kho dữ liệu Nhìn chung tất cả các hệ thống kho dữ liệu có các thành phần sau [14] Hình 2.1. Kiến trúc kho dữ liệu - - - - - - Data Source Layer: Cung cấp dữ liệu cho kho dữ liệu. Nguồn dữ liệu có nhiều dạng khác nhau: tệp văn bản, cơ sở dữ liệu quan hệ, các loại cơ sở dữ liệu khác, file excel,…Nhiều loại dữ liệu khác nhau có thể Data Extraction Layer: Dữ liệu đƣợc lấy từ nguồn dữ liệu vao kho dữ liệu, tại lớp này dữ liệu có thể làm sạch phần nào đó. Staging Area: Đây là vị trí tạm thời mà tại đó dữ liệu nguồn đƣợc sao chép. Stagin area là cần thiết vì lý do thời gian. Tóm lại, tất cả các dữ liệu cần thiết phải có sẵn trƣớc khi dữ liệu có thể đƣợc tích hợp vào kho dữ liệu. ETL Layer: Đây là nơi mà dữ liệu đƣợc chuyển đổi từ dữ liệu có tính giao dịch thành dữ liệu mang tính chất phân tích. Lớp này cũng là nơi làm sạch dữ liệu. Giai đoạn thiết kế ETL thƣờng là giai đoạn tốn nhiều thời gian nhất trong một dự án kho dữ liệu. Data Storage Layer: Đây là nơi dữ liệu đã chuyển đổi và làm sạch đƣợc lƣu trữ. Dựa trên phạm vi và chức năng, 3 loại thực thể có thể đƣợc tìm thấy ở đây là kho dữ liệu, data mart và các điều khiển kho dữ liệu (ODS). Trong bất kỳ hệ thống kho nào chỉ có thể có một trong ba, hai trong ba hoặc cả ba loại trên. Data Logic Layer: Đây là nơi các quy tắc nghiệp vụ đƣợc lƣu trữ. Quy tắc nghiệp vụ đƣợc lƣu trữ ở đây không ảnh hƣởng tới các quy tắc chuyển đổi dữ liệu cơ bản. . Data Presentation Layer: Lớp này nói đến những thông tin mà ngƣời sử dụng muốn đạt đƣợc. Điều này có thể là một hình thức của một bảng / báo cáo đồ họa trong trình duyệt, một báo cáo gửi qua email mà đƣợc tự động tạo ra và gửi hàng ngày, hoặc một cảnh báo để cảnh báo ngƣời sử dụng trƣờng hợp ngoại lệ, 18 - - trong số những ngƣời khác. Thông thƣờng một công cụ OLAP và / hoặc một công cụ báo cáo đƣợc sử dụng trong lớp này. Metadata Layer: Đây là nơi thông tin về các dữ liệu trong hệ thống kho dữ liệu đƣợc đặc tả. Một mô hình dữ liệu hợp lý sẽ là một ví dụ về một cái gì đó trong lớp siêu dữ liệu. System Operations Layer: Lớp này bao gồm thông tin về cách hệ thống kho dữ liệu hoạt động, chẳng hạn nhƣ tình trạng công việc ETL, hiệu năng hệ thống, và lịch sử truy cập của ngƣời dùng. c. Mục đích của kho dữ liệu Mục đích chính của kho dữ liệu là nhắm đáp ứng các tiêu chuẩn cơ bản sau: - - Phải có khả năng đáp ứng mọi yêu cầu về thông tin của ngƣời sử dụng. Hỗ trợ các nhân viên của tổ chức thực hiện tốt, hiệu quả công việc của mình, nhƣ có quyết định hợp lý, nhanh và bán đƣợc nhiều hàng hơn, năng suất cao hơn, thu đƣợc lợi nhuận cao hơn… Giúp cho tổ chức xác định quản lý và điều hành các dự án, nghiệp vụ một cách hiệu quả và chính xác. Tích hợp dữ liệu và các siêu dữ liệu từ nguồn khác nhau. d. Đặc tính của kho dữ liệu Những đặc điểm cơ bản của kho dữ liệu là một tập hợp dữ liệu có tính chất sau: - - - - Tính tích hợp: Kho dữ liệu thƣờng đƣợc xây dựng bằng cách tổng hợp dữ liệu từ nhiều nguồn khác nhau, ví dụ các cơ sở dữ liệu, những bản ghi giao tác trực tuy ến hoặc thậm chí là từ những file dữ liệu độc lập. Những dữ liệu này tiếp tục đƣợc làm sạch, chuẩn hóa để đảm bảo sự nhất quán, sau đó đƣa vào kho dữ liệu. Hƣớng chủ đề: Kho dữ liệu có thể chứa lƣợng dữ liệu lên tới hàng trăm Gigabyte, đƣợc tổ chức theo những chủ đề chính. Kho dữ liệu không chú trọng vào giao tác và việc xử lý giao tác. Thay vào đó, kho dữ liệu tập trung vào việc mô hình hóa, phân tích dữ liệu nhằm hỗ trợ cho nhà quản lý ra quyết định. Do đó, các kho dữ liệu thƣờng cung cấp một khung nhìn tƣơng đối đơn giản bằng cách loại bớt những dữ liệu không cần thiết trong quá trình ra quyết định. Dữ liệu gắn thời gian và có tính lịch sử: Do có tính ổn định, kho dữ liệu thƣờng lƣu trữ dữ liệu của hệ thống trong khoảng thời gian dài, cung cấp đủ số liệu cho các mô hình nghiệp vụ, dự báo, khảo sát những chỉ tiêu cần quan tâm. Dữ liệu có tính ổn định: Dữ liệu trong kho dữ liệu thƣờng đƣợc lƣu trữ lâu dài, ít bị sửa đổi, chủ yếu dùng cho việc truy xuất thông tin nên có độ ổn định cao. Hai thao tác chủ yếu tác động tới kho dữ liệu là: nhập dữ liệu vào và truy xuất.
- Xem thêm -