Đăng ký Đăng nhập
Trang chủ Công nghệ thông tin Cơ sở dữ liệu Dự báo chuỗi thời gian trong hệ thống thông tin bệnh viện...

Tài liệu Dự báo chuỗi thời gian trong hệ thống thông tin bệnh viện

.DOCX
189
419
143

Mô tả:

Dự báo chuỗi thời gian trong hệ thống thông tin bệnh viện
ĐẠI HỌC QUỐC GIA TP. HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA -------------------- DỰ BÁO CHUỖI THỜI GIAN TRONG HỆ THỐNG THÔNG TIN BỆNH VIỆN Chuyên ngành : Hệ thống thông tin quản lý Mã số: 603448 LUẬN VĂN THẠC SĨ TP. HỒ CHÍ MINH, tháng 11 năm 2012 CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán bộ hướng dẫn khoa học : PGS.TS DƯƠNG TUẤN ANH.................. Cán bộ chấm nhận xét 1 :............................................................................ Cán bộ chấm nhận xét 2 :............................................................................ Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp. HCM ngày . . . . . tháng . . . . năm . . . . . Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: 1. ............................................................... 2. ............................................................... 3. ............................................................... 4. ............................................................... 5. ............................................................... Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nếu có). CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA………… ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Chuyên ngành: Hệ thống thông tin quản lý………Mã số : 603448......................... I. TÊN ĐỀ TÀI: Dự báo chuỗi thời gian trong hệ thống thông tin bệnh viện............. II. NHIỆM VỤ VÀ NỘI DUNG: 1. 1. Nghiên cứu các mô hình thống kê, cụ thể ba phương pháp: kỹ thuật làm trơn, mô hình ARIMA và mô hình mùa SARIMA cho dự báo dữ liệu chuỗi thời gian. 2. 2. Nghiên cứu phần mềm R để dự báo chuỗi thời gian. 3. 3. Áp dụng và so sánh hiệu quả của ba phương pháp: kỹ thuật làm trơn, mô hình ARIMA và mô hình mùa SARIMA vào việc dự báo doanh thu của bệnh viện. III. NGÀY GIAO NHIỆM VỤ : 02/07/2012 IV. NGÀY HOÀN THÀNH NHIỆM VỤ: 30/11/2012 V.CÁN BỘ HƯỚNG DẪN: PGS.TS DƯƠNG TUẤN ANH Tp. HCM, ngày . . . . tháng .. . . năm 20.... CÁN BỘ HƯỚNG DẪN (Họ tên và chữ ký) CHỦ NHIỆM BỘ MÔN ĐÀO TẠO (Họ tên và chữ ký) PGS.TS DƯƠNG TUẤN ANH TRƯỞNG KHOA (Họ tên và chữ ký) LỜI CÁM ƠN Lời đầu tiên trong luận văn này tôi xin gửi lời cám ơn chân thành đến thầy PGS. TS Dương Tuấn Anh, thầy đã dành nhiều thời gian và tâm huyết hướng dẫn tôi trong thời gian thực hiện luận văn tốt nghiệp. Tôi xin gửi lời cảm ơn đến quý thầy cô đã giảng dạy và truyền đạt những kiến thức hữu ích cho tôi trong suốt thời gian tham gia học tập tại trường Đại học Bách Khoa thành phố Hồ Chí Minh. Tôi xin chân thành cám ơn các anh chị đồng nghiệp đã tạo điều kiện giúp đỡ tôi trong việc thu thập dữ liệu thực hiện luận văn này. Cuối cùng tôi xin cám ơn đến gia đình và bạn bè đã động viên giúp đỡ tôi trong quá trình thực hiện luận văn này. TP.HCM, ngày 30 tháng 11 năm 2012 Học viên cao học khóa 2010 TÓM TẮT NỘI DUNG LUẬN VĂN Luận văn này thực hiện nhằm mục đích xác định phương pháp nào đưa ra kết quả dự báo dữ liệu chuỗi thời gian tối ưu nhất trong ba phương pháp: (1) Kỹ thuật làm trơn, (2) Mô hình ARIMA và (3) Mô hình mùa (SARIMA). Phương pháp nghiên cứu được thực hiện bởi phương pháp định lượng. Trong luận văn này, tác giả sẽ đi sâu vào nghiên cứu: (1) Lý thuyết của dữ liệu chuỗi thời gian, (2) Ba phương pháp hỗ trợ thực hiện dự báo dữ liệu chuỗi thời gian và (3) Tìm hiểu và sử dụng ngôn ngữ R. Bên cạnh việc nghiên cứu các lý thuyết, thì luận văn cũng tiến hành áp dụng lý thuyết đã nghiên cứu vào hai tập dữ liệu được thu thập từ hai đơn vị trong lĩnh vực bệnh viện tại thành phố Hồ Chí Minh. Đánh giá và đưa ra kết luận từ nghiên cứu thực nghiệm về mô hình dự báo nào cho kết quả tối ưu nhất. Kết quả này sẽ là tư liệu tham khảo hữu hiệu cho các đơn vị trong lĩnh vực y tế - bệnh viện và các doanh nghiệp khác ngoài ngành, có nhu cầu về việc phân tích dữ liệu chuỗi thời gian trong lựa chọn phương pháp và ngôn ngữ hỗ trợ thực hiện. ABSTRACT This thesis aims to determine the best method for forecasting of the data time series in hospital from three methods: (1) Exponential Smoothing, (2) ARIMA model and (3) Seasonal Model (SARIMA). The method research is implemented by Quantitative Methods. In this thesis, I will go to deep into researching: (1) Theory of the data time series, (2) Three methods support for implement of the data time series, and (3) Learn and use the language R. Besides the research of theory, the thesis also conducts applied the research theory into two data sets were collected from two units in the hospital in Ho Chi Minh city. Evaluate and draw conclusions from real research about the best choice of the three forecasting models. These result will be usefull reference material for the units in the hospitals and other industries, there is need for data time series analysis in the selection of the method and language support implemention. DANH MỤC CHỮ VIẾT TẮT ACF : Hàm tự tương quan AIC : Akaike’s Information Criterion ARIMA: Integrated Autoregressive Moving Average PACF : Hàm tự tương quan riêng phần PKDK: Phòng khám đa khoa TTYT : Trung tâm y tế SARIMA: Seasonal ARIMA LỜI CAM ĐOAN Tôi xin cam đoan rằng toàn bộ những nội dung và số liệu trong luận văn này do tôi tự nghiên cứu và thực hiện. Những dữ liệu được thu thập và xử lý một cách khách quan và trung thực. MỤC LỤC LỜI CÁM ƠN..................................................................................................... TÓM TẮT NỘI DUNG LUẬN VĂN................................................................ ABSTRACT....................................................................................................... DANH MỤC CHỮ VIẾT TẮT.......................................................................... LỜI CAM ĐOAN............................................................................................... MỤC LỤC.......................................................................................................... DANH MỤC BẢNG.......................................................................................... DANH MỤC HÌNH........................................................................................... CHƯƠNG 1: GIỚI THIỆU................................................................................ 1.1 Giới thiệu đề tài.................................................................................... 1.1.1 Giới thiệu tổng quan về tình hình ứng dụng dự báo chuỗi thời gian....................................................................... 1.1.2 Tổng quan về tình hình dự báo chuỗi thời gian tại Việt Nam........................................................................................ 1.2 Cơ sở hình thành đề tài......................................................................... 1.3 Mục tiêu đề tài...................................................................................... 1.4 Ý nghĩa đề tài........................................................................................ 1.5 Phạm vi và giới hạn đề tài.................................................................... 1.6 Bố cục luận văn.................................................................................... CHƯƠNG 2: CÁC CÔNG TRÌNH LIÊN QUAN............................................ 2.1 Mô hình Neural Network..................................................................... 2.2 Các mô hình phân tích thống kê........................................................... 2.2.1 Các mô hình xu thế........................................................................ 2.2.2 Dự báo bằng phương pháp phân tích............................................ 2.2.3 Dự báo bằng phân tích hồi quy...................................................... 2.2.4 Các mô hình dự báo bằng phương pháp Box – Jenkins............................................................................................. CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU............................................... 3.1 Phương pháp nghiên cứu...................................................................... 3.1.1 Phương pháp dự báo...................................................................... 3.1.2 Phương pháp luận của dự báo định lượng 16 3.1.3 3.2 Nguồn dữ liệu................................................................................ Phần mềm hỗ trợ................................................................................... CHƯƠNG 4: CƠ SỞ LÝ THUYẾT.................................................................. 4.1 Dự báo chuỗi thời gian......................................................................... 4.1.1 Khái niệm dãy số chuỗi thời gian.................................................. 4.1.2 Phân tích biến động các thành phần của dãy số thời gian.......................................................................................... 4.2 Đánh giá độ chính xác của dự báo....................................................... 4.2.1 Phân chia mẫu................................................................................ 4.2.2 Các thước đo độ chính xác của mô hình dự báo 24 4.3 Các mô hình nghiên cứu....................................................................... 4.3.1 Kỹ thuật làm trơn........................................................................... 4.3.2 Các mô hình ARIMA..................................................................... 4.3.3 4.4 Mô hình mùa.................................................................................. Ngôn ngữ R........................................................................................... 4.4.1 Văn phạm....................................................................................... 4.4.2 Cấu trúc lệnh của ngôn ngữ R....................................................... CHƯƠNG 5: KẾT QUẢ THỰC NGHIỆM....................................................... 5.1 Nguồn dữ liệu....................................................................................... 5.1.1 Phòng khám đa khoa...................................................................... 5.1.2 Trung tâm y tế................................................................................ 5.2 Tập dữ liệu Phòng khám đa khoa......................................................... 5.2.1 Phương pháp kỹ thuật làm trơn..................................................... 5.2.2 Mô hình ARIMA............................................................................ 5.2.3 Mô hình mùa SARIMA................................................................. 5.2.4 Đánh giá các phương pháp............................................................ 5.3 Tập dữ liệu Trung tâm y tế................................................................... 5.3.1 Phương pháp kỹ thuật làm trơn..................................................... 5.3.2 Mô hình ARIMA............................................................................ 5.3.3 Mô hình mùa SARIMA................................................................. 5.3.4 Đánh giá các phương pháp............................................................ 5.4 Kết quả nghiên cứu............................................................................... CHƯƠNG 6: KẾT LUẬN VÀ KIẾN NGHỊ..................................................... 6.1 Kết quả nghiên cứu............................................................................... 6.1.1 Tóm tắt lại nội dung nghiên cứu.................................................... 6.1.2 Kết luận.......................................................................................... 6.2 Kiến nghị............................................................................................... 6.3 Hạn chế và hướng nghiên cứu tiếp theo............................................... 6.3.1 Hạn chế.......................................................................................... 6.3.2 Hướng nghiên cứu tiếp theo.......................................................... THƯ MỤC THAM KHẢO................................................................................ Phụ lục A: DỮ LIỆU PKDK và TTYT............................................................. Phụ lục B: DỮ LIỆU PKDK - MÔ HÌNH ARIMA.......................................... Phụ lục C: DỮ LIỆU PKĐK – MÔ HÌNH SARIMA ............................................................................................................................ Phụ lục D: DỮ LIỆU TTYT –KỸ THUẬT LÀM TRƠN MŨ.......................................................................................................... Phụ lục E: DỮ LIỆU TTYT – MÔ HÌNH ARIMA.......................................... Phụ lục F: DỮ LIỆU TTYT – MÔ HÌNH SARIMA........................................ Phụ lục G: HÀM................................................................................................ Phụ lục H: THƯ VIỆN HỖ TRỢ....................................................................... LÝ LỊCH TRÍCH NGANG................................................................................ DANH MỤC BẢNG Bảng 2.1 Các hàm xu thế................................................................................... Bảng 3.1 Ứng dụng các phương pháp dự báo của các phần mềm (miễn phí hoặc thương mại)............................................................ Bảng 4.1 Bảng các toán tử luận lý.............................................................................41 Bảng 4.2 Bảng một số hàm vẽ biểu đồ 4 Bảng 5.1 Thống kê mô tả dữ liệu PKDK...................................................................44 Bảng 5.2 Thông tin tần số của doanh thu PKDK.......................................................46 Bảng 5.3 Thống kê mô tả dữ liệu TTYT....................................................................49 Bảng 5.4 Thông tin tần số của doanh thu TTYT.......................................................51 Bảng 5.5 So sánh AIC của các mô hình ARIMA đề xuất đối với dữ liệu PKDK mẫu .....................................................................................................................................71 Bảng 5.6 Đánh giá kết quả dự báo của mô hình ARIMA(3,2,3) - PKDK...............72 Bảng 5.7 Đánh giá kết quả dự báo của các mô hình ARIMA đề xuất - PKDK........73 Bảng 5.8 So sánh AIC của các mô hình SARIMA đề xuất đối với dữ liệu PKDK mẫu..............................................................................................................................79 Bảng 5.9 Đánh giá kết quả dự báo của mô hình SARIMA(0,1,0)(1,1,1)12 - PKDK80 Bảng 5.10 Đánh giá kết quả dự báo của các mô hình SARIMA đề xuất - PKDK....81 Bảng 5.11 Đánh giá kết quả dự báo của các phương pháp - PKDK.........................82 Bảng 5.12 Đánh giá kết quả dự báo của các mô hình ARIMA đề xuất - TTYT.......89 Bảng 5.13 Đánh giá kết quả dự báo của các mô hình SARIMA đề xuất - TTYT....93 Bảng 5.14 Đánh giá kết quả dự báo của các phương pháp - TTYT..........................94 DANH MỤC HÌNH Hình 1.1 Tỷ lệ % người dùng của các phần mềm phân tích dữ liệu (2010-2011)..................................................................................... Hình 1.2 Tình hình sử dụng các công cụ phần mềm......................................... Hình 1.3 Sử dụng phần mềm miễn phí tại các khu vực trên thế giới......................................................................................................... Hình 2.1 Kiến trúc của một ANN cho dự báo chuỗi thời gian với 3 ngõ vào, một lớp ẩn hai nơ-ron và một ngõ ra (là giá trị dự báo) ([4])...................................................8 Hình 2.2 Dự báo (2001-2020) số lượng người bị gãy xương tại Northern Ireland của những người trên 50 tuổi và phân theo giới tính.([6])...............................................10 Hình 2.3 Dự báo số lượng bệnh nhân (từ tháng 109 - 132)[5]. 1 Hình 3.1 Phương pháp luận của dự báo chuỗi thời gian. [3] 1 Hình 4.1 Doanh thu theo quý của Johnson & Johnson, (1960-I, 1980-IV) [13] 2 Hình 5.1 Biểu đồ doanh thu PKDK (01/2009 – 06/2012).........................................45 Hình 5.2 Biểu đồ thể hiện tần số và phân phối chuẩn của doanh thu PKDK...........46 Hình 5.3 Biểu đồ tương quan của doanh thu PKDK (01/2009-06/2012)..................47 Hình 5.4 Biểu đồ Doanh thu TTYT (01/2007 – 12/2010).........................................49 Hình 5.5 Biểu đồ thể hiện tần số và phân phối chuẩn của doanh thu TTYT............51 Hình 5.6 Biểu đồ tương quan của doanh thu TTYT..................................................52 Hình 5.7 Biểu đồ dữ liệu doanh thu PKDK đã được làm trơn bằng phương pháp trung bình di động với n=5.........................................................................................53 Hình 5.8 Biểu đồ giá trị làm trơn và giá trị thực tế của doanh thu PKDK theo phương pháp làm trơn mũ Holt..................................................................................54 Hình 5.9 Biểu đồ giá trị làm trơn và giá trị thực tế của doanh thu PKDK tại 35 điểm theo phương pháp làm trơn mũ Holt..........................................................................55 Hình 5.10 Biểu đồ về các ước lượng xu hướng và ước lượng mức độ của phương pháp làm trơn mũ Holt...............................................................................................56 Hình 5.11 Biểu đồ dự báo cho các khoảng thời gian tiếp theo của doanh thu PKDK theo phương pháp làm trơn mũ Holt..........................................................................57 Hình 5.12 Biểu đồ giá trị thực tế và giá trị dự báo của doanh thu PKDK theo phương pháp làm trơn mũ Holt..................................................................................58 Hình 5.13 Biểu đồ giá trị làm trơn và giá trị thực tế của doanh thu PKDK theo phương pháp làm trơn mũ Winters.............................................................................59 Hình 5.14 Biểu đồ giá trị làm trơn và giá trị thực tế của doanh thu PKDK tại 35 điểm theo phương pháp làm trơn mũ Winters...........................................................60 Hình 5.15 Biểu đồ về các ước lượng xu hướng, ước lượng mức độ và ước lượng mùa vụ của phương pháp làm trơn mũ Winters.........................................................61 Hình 5.16 Biểu đồ dự báo cho các khoảng thời gian tiếp theo của doanh thu PKDK theo phương pháp làm trơn mũ Winters.....................................................................62 Hình 5.17 Biểu đồ giá trị thực tế và giá trị dự báo của doanh thu PKDK theo phương pháp làm trơn mũ Winters.............................................................................63 Hình 5.18 Biểu đồ doanh thu PKDK của 35 điểm....................................................64 Hình 5.19 Biểu đồ doanh thu PKDK (01/2009 – 11/2011).......................................65 Hình 5.20 Biểu đồ tương quan của doanh thu PKDK (01/2009-11/2011)................66 Hình 5.21 Biểu đồ dữ liệu doanh thu PKDK mẫu sau khi lấy sai phân bậc 1..........67 Hình 5.22 Biểu đồ dữ liệu doanh thu PKDK mẫu sau khi lấy sai phân bậc 2..........67 Hình 5.23 Biểu đồ tương quan và tương quan riêng phần của dữ liệu PKDK mẫu áp dụng cho mô hình ARIMA.........................................................................................68 Hình 5.24 Biểu đồ giá trị phần dư, tương quan và kiểm định p-values của thống kê Ljung-Box theo mô hình ARIMA thứ nhất................................................................70 Hình 5.25 Biểu đồ so sánh giá trị thực tế và giá trị dự báo cho các khoảng thời gian tiếp theo của doanh thu PKDK theo mô hình ARIMA(3,2,3)...................................72 Hình 5.26 Biểu đồ doanh thu PKDK mẫu (theo số điểm) trước và sau khi lấy sai phân bậc 1...................................................................................................................75 Hình 5.27 Biểu đồ doanh thu PKDK mẫu (theo thời gian) trước và sau khi lấy sai phân bậc 1...................................................................................................................75 Hình 5.28 Biểu đồ dữ liệu PKDK sau khi lấy sai phân bậc 2...................................76 Hình 5.29 Biểu đồ tương quan và tương quan riêng phần của dữ liệu PKDK mẫu áp dụng cho mô hình SARIMA......................................................................................77 Hình 5.30 Biểu đồ giá trị phần dư, tương quan và kiểm định p-values của thống kê Ljung-Box theo mô hình SARIMA(0,1,0)(1,1,1)12...................................................78 Hình 5.31 Biểu đồ so sánh giá trị thực tế và giá trị dự báo cho các khoảng thời gian tiếp theo của doanh thu PKDK theo mô hình SARIMA(0,1,0)(1,1,1)12...................80 Hình 5.32 Biểu đồ doanh thu TTYT của 40 điểm.....................................................84 Hình 5.33 Biểu đồ doanh thu TTYT (01/2007 – 4/2010)..........................................84 Hình 5.34 Biểu đồ tương quan của doanh thu TTYT (01/2007-04/2010)................85 Hình 5.35 Biểu đồ dữ liệu doanh thu TTYT mẫu sau khi lấy sai phân bậc 1...........86 Hình 5.36 Biểu đồ dữ liệu doanh thu TTYT mẫu sau khi lấy sai phân bậc 2...........87 Hình 5.37 Biểu đồ tương quan và tương quan riêng phần của dữ liệu TTYT mẫu áp dụng cho mô hình ARIMA.........................................................................................87 Hình 5.38 Biểu đồ doanh thu TTYT mẫu (theo số điểm) trước và sau khi lấy log. .90 Hình 5.39 Biểu đồ doanh thu TTYT mẫu (theo thời gian) trước và sau khi lấy log.90 Hình 5.40 Biểu đồ dữ liệu TTYT sau khi lấy log và sai phân bậc 1.........................91 Hình 5.41 Biểu đồ dữ liệu TTYT sau khi lấy log và sai phân bậc 2.........................91 Hình 5.42 Biểu đồ tương quan và tương quan riêng phần của dữ liệu TTYT mẫu áp dụng cho mô hình SARIMA......................................................................................92 CHƯƠNG 1: GIỚI THIỆU 1.1 Giới thiệu đề tài 1.1.1 Giới thiệu tổng quan về tình hình ứng dụng dự báo chuỗi thời gian Trong bối cảnh hiện nay, sự phát triển của tất cả các mặt đời sống xã hội cho đến nền kinh tế, nó đã thúc đẩy các doanh nghiệp phải luôn luôn tự hoàn thiện mình hơn nữa để đáp ứng với nhu cầu gia tăng của xã hội. Mặc dù ngành công nghệ thông tin đã song hành cùng với các doanh nghiệp để hỗ trợ các tác nghiệp từ mức thấp nhất đến mức cao nhất, từ cấp nhân viên cho tới cấp lãnh đạo. Đa phần các doanh nghiệp phát triển phần mềm thường xây dựng để hỗ trợ các tác nghiệp hằng ngày, và ít chú trọng phát triển những phần mềm hỗ trợ ra quyết định cho các cấp lãnh đạo. Khi mà các phần mềm hỗ trợ tác nghiệp đã được vận hành ổn định cùng với sự phát triển của các doanh nghiệp, vấn đề đặt ra ở đây là những dữ liệu phát sinh đó phải giải quyết như thế nào. Trước khi có sự giúp đỡ mạnh mẽ của công nghệ thông tin, thì vấn đề này đã được nghiên cứu bằng các phương pháp toán học. Đối với những dữ liệu lớn như ngày nay thì những phương pháp đó được tin học hóa bằng những phần mềm chuyên dụng để hỗ trợ phân tích những dữ liệu đó. Việc sử dụng các phần mềm này cơ bản đã giúp cho các doanh nghiệp tiết kiệm thời gian để phân tích số liệu, nó cung cấp khung nhìn tổng quan nhất đối với sự phát triển theo các mốc thời gian từ quá khứ đến thời điểm hiện tại. Một trong những tính năng thu hút nhiều nhà quản lý của các doanh nghiệp là việc phân tích dữ liệu về khách hàng, nhóm hàng, ..., và đặc biệt hơn nữa là tính năng có thể dự đoán được những kết quả trong tương lai. Sự phát triển của ngành công nghệ thông tin đóng vai trò rất quan trọng đối với sự phát triển của nền kinh tế. Vì vậy, nên các doanh nghiệp phát triển lĩnh vực này luôn luôn tạo ra những phần mềm hỗ trợ tối đa. Điều đó có thể thấy được nhu cầu về tình hình sử dụng công nghệ thông tin trong lĩnh vực phân tích dữ liệu. K. Poll ([16])có một khảo sát với số lượng người tham gia là 1103 người, trong đó 43% sử dụng phần mềm thương mại, 32% sử dụng phần mềm miễn phí và 25% cả hai. Ba phần mềm phổ biến nhất của năm 2011 là RapidMiner, R và Excel. Hình 1.1 Tỷ lệ % người dùng của các phần mềm phân tích dữ liệu (2010-2011) (Nguồn: 2011, Top analysis, data mining tool). [16] Tình hình sử dụng phần mềm thương mại, miễn phí và cả hai loại phần mềm này ở các khu vực trên thế giới. Khu vực Tây Âu, Châu Á và Châu Mỹ Latin là ba khu vực có tỷ lệ sử dụng phần mềm miễn phí chiếm tỷ lệ khá cao hơn so với các khu vực khác. Hình 1.2 Tình hình sử dụng các công cụ phần mềm (Nguồn: 2011, Top analysis, data mining tool). [16] Các nước trong khu vực Tây Âu là khu vực chiếm tỷ lệ cao nhất so với các khu còn lại về việc sử dụng các công cụ miễn phí. Hình 1.3 Sử dụng phần mềm miễn phí tại các khu vực trên thế giới (Nguồn: 2011, Top analysis, data mining tool). [16] 1.1.2 Tổng quan về tình hình dự báo chuỗi thời gian tại Việt Nam Sự phát triển của nền kinh tế Việt Nam có những biến đổi đáng kể bằng chứng là các doanh nghiệp vừa và nhỏ tới những doanh nghiệp lớn đều sử dụng công nghệ thông tin để hỗ trợ các công việc hằng ngày. Những dữ liệu thu thập từ những gì mà doanh nghiệp hoạt động, thì những chủ doanh nghiệp thường có nhu cầu xem xét và dựa vào kinh nghiệm thực tế của mình, để đưa ra những quyết định trong công tác quản lý doanh nghiệp. Những phần mềm hiện tại mà các doanh nghiệp dùng để hỗ trợ, thông thường thì chỉ có những báo cáo mang ý nghĩa thống kê. Mặc dù những doanh nghiệp này đã cố gắng phát triển và tích hợp vào hệ thống phần mềm hiện có, nhưng những báo cáo này cũng chưa đáp ứng được nhu cầu phân tích chuyên sâu để có thể đưa ra quyết định. Sản phẩm Accnet BA của Công ty cổ phần tin học Lạc Việt là phần mềm chuyên dùng đề hỗ trợ đủ các loại báo cáo về tài chính, thế nhưng vẫn chưa đáp ứng được các năng như phân tích dữ liệu: phân tích liên quan về nhóm khách hàng, nhà cung cấp, …. Mặc dù, các doanh nghiệp nước ngoài cũng đã giới thiệu những gói phần mềm có tích hợp phần phân tích dữ liệu, nhưng chi phí cao, thời gian triển khai tương đối lâu, quy trình thực hiện phức tạp. IBM có giới thiệu gói sản phẩm là IBM Cognos 10.1 tới thị trường Việt Nam nhưng hiện tại chỉ mới có Ngân hàng Á Châu – ACB triển khai thành công, nhưng xét về tính năng dự báo thì vẫn chưa thể nào bằng những phần mềm chuyên về phân tích dữ liệu. Tại Việt Nam, lĩnh vực dự báo chuỗi thời gian ngày càng được chú trọng phát triển, đặc biệt ở các mảng: marketing, dự báo doanh thu theo thời gian, phân tích nhu cầu tồn kho của các sản phẩm, … Đa phần các doanh nghiệp có quy mô lớn mới có khái niệm về việc sử dụng các ứng dụng liên quan đến việc phân tích dữ liệu và dự báo chuỗi thời gian cho các hoạt động của doanh nghiệp. Một số các doanh nghiệp đã sử dụng: CoopMart, Prudential, Bảo hiểm Bảo Việt, NamVietBank, VietinBank, … Để đáp ứng được vấn đề về phân tích dữ liệu là việc hình thành các trung tâm hoạt động chuyên về phân tích dữ liệu: VIDAC
- Xem thêm -

Tài liệu liên quan