Đăng ký Đăng nhập
Trang chủ Luận văn thạc sĩ biểu diễn và phân tích trực quan dữ liệu dịch bệnh áp dụng tậ...

Tài liệu Luận văn thạc sĩ biểu diễn và phân tích trực quan dữ liệu dịch bệnh áp dụng tập dữ liệu dịch bệnh sốt xuất huyết tỉnh bình dương

.PDF
88
1
97

Mô tả:

ỦY BAN NHÂN DÂN TỈNH BÌNH DƢƠNG TRƢỜNG ĐẠI HỌC THỦ DẦU MỘT DƢƠNG THỊ THÚY HIỀN BIỂU DIỄN VÀ PHÂN TÍCH TRỰC QUAN DỮ LIỆU DỊCH BỆNH ÁP DỤNG TẬP DỮ LIỆU DỊCH BỆNH SỐT XUẤT HUYẾT (HOẶC DỊCH BỆNH TAY - CHÂN - MIỆNG) TỈNH BÌNH DƢƠNG CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ NGÀNH: 8480104 LUẬN VĂN THẠC SỸ BÌNH DƢƠNG - NĂM 2020 ỦY BAN NHÂN DÂN TỈNH BÌNH DƢƠNG TRƢỜNG ĐẠI HỌC THỦ DẦU MỘT DƢƠNG THỊ THÚY HIỀN BIỂU DIỄN VÀ PHÂN TÍCH TRỰC QUAN DỮ LIỆU DỊCH BỆNH - ÁP DỤNG TẬP DỮ LIỆU DỊCH BỆNH SỐT XUẤT HUYẾT (HOẶC DỊCH BỆNH TAY - CHÂN - MIỆNG) TỈNH BÌNH DƢƠNG CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ NGÀNH: 8480104 LUẬN VĂN THẠC SỸ NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS. TRẦN VĨNH PHƢỚC BÌNH DƢƠNG - NĂM 2020 LỜI CAM ĐOAN Tôi cam đoan đây là công trình nghiên cứu của tôi. Dữ liệu tôi sử dụng trong nghiên cứu về sốt xuất huyết và thời tiết đã đƣợc sự chấp thuận, cho phép sử dụng của lãnh đạo cơ quan Trung tâm Y tế Dự phòng tỉnh Bình Dƣơng, Trung tâm quan trắc, môi trƣờng tỉnh. Nội dung tham khảo từ các nghiên cứu liên quan đều đƣợc trích dẫn rõ ràng. Nội dung của nghiên cứu là nỗ lực của tôi và chƣa từng đƣợc công bố trong các công trình nghiên cứu khoa học nào khác. Tác giả Dƣơng Thị Thúy Hiền i LỜI CẢM ƠN Trong quá trình nghiên cứu và thực hiện đề tài luận văn “Biểu diễn và phân tích trực quan dữ liệu dịch bệnh - Áp dụng tập dữ liệu dịch bệnh sốt xuất huyết (hoặc dịch bệnh tay - chân - miệng) tỉnh Bình Dƣơng”, tôi đã nhận đƣợc rất nhiều sự giúp đỡ từ phía thầy cô, các tổ chức và cá nhân sau: Đầu tiên, tôi xin chân thành cảm ơn sâu sắc đến Thầy PGS.TS. Trần Vĩnh Phƣớc - đã tận tâm dìu dắt, hƣớng dẫn, góp ý, chỉnh sửa để tôi hoàn thành luận văn này. Tôi xin chân thành cảm ơn đến Thầy PGS.TS Lê Tuấn Anh - Phó Hiệu trƣởng Phụ trách Đại học Thủ Dầu Một đã giúp tôi tiếp cận các lĩnh vực nghiên cứu mới vừa khoa học, vừa gần gũi thực tiễn cuộc sống. Tôi trân trọng gửi lời cảm ơn đến Ban Giám hiệu nhà trƣờng, Viện Sau Đại học, cùng Thầy, Cô trong hoa thuật - Công nghệ, Trƣờng Đại học Thủ Dầu Một đã tạo mọi điều kiện giúp tôi nghiên cứu thuận lợi. Xin cảm ơn tất cả Thầy, Cô là giảng viên đã truyền đạt cho chúng tôi những kiến thức và kinh nghiệm vô c ng quý giá trong học tập và nghiên cứu khoa học. Tôi trân trọng cảm ơn Ban lãnh đạo, chuyên gia y tế của Trung tâm Y tế Dự phòng tỉnh Bình Dƣơng, cảm ơn lãnh đạo Trung tâm quan trắc môi trƣờng tỉnh đã giúp đỡ nhiệt tình trong việc thu thập dữ liệu và chia sẻ các kiến thức về chuyên về bệnh Sốt xuất huyết. Xin cảm ơn gia đình, bạn bè c ng lớp CH18HT01 đã luôn ủng hộ, động viên, tạo điều kiện thuận lợi cho tôi hoàn thành văn này. Xin trân trọng cảm ơn BGH trƣờng THCS Phú M , trƣờng THCS Hiệp An c ng đồng nghiệp đã tạo điều kiện thuận lợi cho tôi đi học và báo cáo luận văn này. Một lần nữa xin tri ân và trân trọng cảm ơn tất cả mọi ngƣời. 25 á 12 ăm 2020 Tác giả Dƣơng Thị Thúy Hiền ii MỤC LỤC LỜI CAM ĐOAN ................................................................................................ i LỜI CẢM ƠN ..................................................................................................... ii MỤC LỤC .......................................................................................................... iii DANH MỤC CÁC TỪ VIẾT TẮT, CÁC KÝ HIỆU ...................................... v DANH SÁCH CÁC BẢNG BIỂU .................................................................... vi DANH SÁCH HÌNH ẢNH .............................................................................. vii MỞ ĐẦU ............................................................................................................. 1 1. Tính cấp thiết của đề tài: ................................................................... 1 2. Mục tiêu nghiên cứu: ........................................................................ 2 3. Đối tƣợng nghiên cứu: ...................................................................... 2 4. Phạm vi nghiên cứu:.......................................................................... 2 Phạm vi không gian:................................................................................. 2 Phạm vi thời gian: ..................................................................................... 2 5. Phƣơng pháp nghiên cứu: ................................................................. 2 CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN .................................................... 4 1.1. Tổng quan về tỉnh Bình Dƣơng: .................................................... 4 1.2. Tổng quan về bệnh sốt xuất huyết ở Việt Nam và tỉnh Bình Dƣơng giai đoạn 2014 - 2018: .................................................................. 4 CHƢƠNG 2: CƠ SỞ LÝ THUYẾT ................................................................. 6 2.1. Tổng quan về trực quan hóa: ......................................................... 6 2.2. Lý thuyết về trực quan hóa: ........................................................... 6 2.2.1. Các dạng biểu đồ, đồ thị thƣờng d ng trong trực quan hóa: .. 6 2.2.2. Biểu diễn vị trí của đối tƣợng trên khối không gian - thời gian 9 2.3. Các nghiên cứu liên quan: ............................................................. 9 2.4. Trực quan hóa bằng ngôn ngữ lập trình python: ......................... 11 Tôi sử dụng Thƣ viện Matplotlib để tạo các biểu đồ trực quan trong Python.................................................................................................. 11 2.3.1. Giới thiệu thƣ viện Matplotlib: ............................................. 11 2.3.2. hái niệm: ............................................................................. 11 2.3.3. Các dạng biểu đồ trong thƣ viện Matplotlib: ........................ 11 CHƢƠNG 3: NỘI DUNG VÀ PHƢƠNG PHÁP THỰC HIỆN .................. 13 3.1. Đặt vấn đề: ................................................................................... 13 3.2. Nội dung nghiên cứu: .................................................................. 13 3.2.1. Xác định các biến và mô tả: .................................................. 15 3.2.2. Lập bảng dữ liệu: .................................................................. 17 iii 3.2.3. Phân tích mối quan hệ giữa các biến: ................................... 17 3.2.4. Sơ đồ quan hệ giữa các biến: ................................................ 18 3.2.5. Các hàm toán học giữa các biến: .......................................... 18 3.3. Lập trình trên Python:.................................................................. 18 3.3.1. Biểu đồ cột tổng hợp ca bệnh SXH trong 5 năm (2014 – 2018) của tỉnh Bình Dƣơng:................................................................ 19 3.3.2. Biểu đồ cột ca bệnh SXH từng năm của tỉnh Bình Dƣơng:.. 20 3.3.3. Biểu đồ cột ca bệnh SXH từng Huyện/Thị/Thành phố của tỉnh Bình Dƣơng trong 5 năm: ................................................................... 22 CHƢƠNG 4: CÂU HỎI PHÂN TÍCH ........................................................... 27 4.1. 4.2. Câu hỏi phân tích:........................................................................ 27 Phân tích trực quan dữ liệu bệnh, các yếu tố liên quan:.............. 28 KẾT LUẬN ....................................................................................................... 37 1. 2. Nội dung nghiên cứu và kết quả đạt đƣợc ...................................... 37 Định hƣớng phát triển: .................................................................... 38 TÀI LIỆU THAM KHẢO ............................................................................... 39 PHỤ LỤC ............................................................................................................ 1 1. Bảng dữ liệu thô số ca SXH từng tháng trong khoảng thời gian từ năm 2014 – 2018: ...................................................................................... 1 2. Bảng dữ liệu số ca SXH từng tháng trong khoảng thời gian từ năm 2014 – 2018: .............................................................................................. 3 3. Bảng 3.1 Dữ liệu thống kê số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa của tỉnh Bình Dƣơng năm 2014 ...................................................... 16 4. Bảng 3.2 Dữ liệu thống kê số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa của tỉnh Bình Dƣơng năm 2018 ...................................................... 20 iv DANH MỤC CÁC TỪ VIẾT TẮT, CÁC KÝ HIỆU TỪ VIẾT TẮT TIẾNG VIỆT WHO Tổ chức Y tế thế giới Trung tâm Y tế dự phòng hoặc TTYTDP (Trung tâm kiểm soát, phòng ngừa dịch bệnh) SXH Sốt xuất huyết CSDL Cơ sở dữ liệu CMSXH Ca mắc sốt xuất huyết NĐ Nhiệt độ không khí ĐA Độ ẩm không khí LM Lƣợng mƣa SXHD Sốt xuất huyết Dengue v DANH SÁCH CÁC BẢNG BIỂU Bảng 3.1 Dữ liệu thống kê số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa của tỉnh Bình Dƣơng năm 2014 ....................................................................................... 17 Bảng 3.2 Dữ liệu thống kê số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa của tỉnh Bình Dƣơng năm 2018 ....................................................................................... 20 Bảng 4.1: Dữ liệu lƣợng mƣa, nhiệt độ, độ ẩm số ca mắc SXH của năm 2014 2018 – Thành phố TDM sau khi đã loại bỏ một số dữ liệu không cần thiết d ng cho phân tích dữ liệu. ......................................................................................... 29 vi DANH SÁCH HÌNH ẢNH Hình 2.1: Biểu đồ cột, cột chồng. ........................................................................ 7 Hình 2.2: Biểu đồ đƣờng. ..................................................................................... 7 Hình 2.3: Biểu đồ tròn. ........................................................................................ 7 Hình 2.4: Biểu đồ Area. ....................................................................................... 8 Hình 2.5: Biểu đồ thác nƣớc. ............................................................................... 8 Hình 2.5: Biểu đồ nhiệt. ....................................................................................... 8 Hình 2.6: Biểu đồ kết quả mô hình Hồi quy của nhóm tác giả Ngọc Anh. ......... 8 Hình 3.1: Biểu đồ dịch sốt xuất huyết ở Bình Dƣơng. ...................................... 15 Hình 3.2: Sơ đồ quan hệ giữa các biến. ............................................................. 18 Hình 3.3: Màn hình chính lựa chọn thông tin để xem. ...................................... 19 Hình 3.4: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của 9 huyện, Thị xã/ Thành phố. 19 Hình 3.5: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong năm 2014 của 9 huyện, thị xã/ thành phố. ...................... 20 Hình 3.6: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong năm 2015 của 9 huyện, thị xã/ thành phố. ...................... 20 Hình 3.7: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong năm 2016 của 9 huyện, thị xã/ thành phố. ...................... 21 Hình 3.8: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong năm 2017 của 9 huyện, thị xã/ thành phố. ...................... 21 Hình 3.9: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong năm 2018 của 9 huyện, thị xã/ thành phố. ...................... 22 Hình 3.10: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của Bàu Bàng. ............................ 22 Hình 3.11: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của Bến Cát. ............................... 23 Hình 3.12: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của Bắc Tân Uyên. ..................... 23 vii Hình 3.13: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của Dĩ An. .................................. 24 Hình 3.14: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của Dầu Tiếng. ........................... 24 Hình 3.15: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của Phú Giáo. ............................. 25 Hình 3.16: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của Thuận An. ............................ 25 Hình 3.17: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của Thủ Dầu Một........................ 26 Hình 3.18: Biểu đồ biểu diễn trực quan số liệu về số ca mắc SXH, nhiệt độ, độ ẩm, lƣợng mƣa trong giai đoạn 2014 – 2018 của Tân Uyên. ............................ 26 Hình 4.1: Biểu đồ dịch bệnh sốt xuất huyết ở Bình Dƣơng năm 2014. ............. 31 Hình 4.2: Biểu đồ dịch bệnh sốt xuất huyết ở Bình Dƣơng năm 2017. ............. 32 viii MỞ ĐẦU 1. Tính cấp thiết của đề tài: Bình Dƣơng là một trong những tỉnh có số ca bệnh sốt xuất huyết tăng nhanh hàng năm và không theo chu kỳ nhất định mà diễn biến ngày một phức tạp. Trong vòng 5 năm từ 2014-2018 đã có hai đợt dịch lớn xảy ra vào các năm 2015 và 2017; số ca mắc và tử vong cao nhất nhì khu vực phía Nam. Tình hình dịch bệnh diễn biến ngày càng phức tạp là vấn đề quan tâm hàng đầu của ngành y tế. Việc biểu diễn và phân tích dữ liệu bệnh nhanh chóng là hết sức cần thiết để giúp chuyên gia kịp thời đƣa ra những giải pháp có khả năng giải quyết đƣợc tính phức tạp và dự báo dịch bệnh. Ở Việt Nam, nguồn dữ liệu về y tế, khí hậu, thời tiết, dân cƣ ...v.v đƣợc thu thập, lƣu trữ trong nhiều năm qua. Điều này đã mang đến cơ hội mới cho phân tích, biểu diễn dữ liệu bệnh và dự báo dịch bệnh trong ngành y tế. Do đó, việc áp dụng phƣơng pháp trực quan hóa dữ liệu giúp chuyên gia dự báo dịch bệnh dựa vào nguồn dữ liệu hiện có, kết hợp xem xét các yếu tố liên quan tới sự xuất hiện và lan truyền dịch bệnh là rất cần thiết nhằm góp phần cảnh báo sớm, ngăn chặn sự b ng phát, lây lan của dịch bệnh; giúp các cơ quan có chức năng quản lý, kiểm soát dịch bệnh tiếp cận với một hƣớng khác mới hơn trong công tác dự báo, phòng chống dịch ngoài các phƣơng pháp truyền thống. Bệnh truyền nhiễm sốt xuất huyết đã đe dọa tính mạng con ngƣời vì bệnh không chỉ làm nhiều ngƣời chết ở một nơi, mà còn có thể lây lan đến nhiều nơi khác nhau. Cần theo dõi tiến trình của bệnh và tìm cách giảm tổn thất. Trong đề tài này, tôi đề xuất một hệ thống cảnh báo dựa trên trực quan để kiểm soát sự phát triển của bệnh. Hệ thống này hỗ trợ các chuyên gia trong việc xem tổng quan, từ sự hiểu biết cũng nhƣ kinh nghiệm của các chuyên gia sẽ ƣớc tính khả năng b ng phát dịch. Xem biểu đồ biểu diễn dữ liệu, trên cơ sở kiến thức và kinh nghiệm sẵn có các nhà dịch tễ học có thể ƣớc tính tình hình để đƣa ra thông điệp cảnh báo/hoặc đề xuất một giải pháp ngăn chặn sự b ng phát dịch. 1 Nhận thấy đƣợc tầm quan trọng của vấn đề nêu trên, tôi quyết định chọn đề tài: “Biểu diễn và phân tích trực quan dữ liệu dịch bệnh - áp dụng tập dữ liệu dịch bệnh sốt xuất huyết tỉnh Bình Dƣơng” làm đề tài cho luận văn của mình. 2. Mục tiêu nghiên cứu: Thực hiện phân tích và biểu diễn trực quan dữ liệu dịch bệnh sốt xuất huyết tại Bình Dƣơng trong 5 năm 2014 - 2018. 3. Đối tƣợng nghiên cứu: Để biểu diễn và phân tích trực quan dịch SXH trên địa bàn tỉnh Bình Dƣơng, luận văn tập trung sử dụng, tìm hiểu, xử lý, biểu diễn, phân tích các tập dữ liệu sau: Tập dữ liệu về ca bệnh SXH, lƣợng mƣa, nhiệt độ, độ ẩm từ năm 2014 đến năm 2018. 4. Phạm vi nghiên cứu: Phạm vi không gian: Cơ sở dữ liệu gồm: số ca bệnh sốt xuất huyết, lƣợng mƣa, nhiệt độ, độ ẩm tại địa bàn 09 huyện, thị, thành phố thuộc tỉnh Bình Dƣơng từ năm 2014 - 2018. Phạm vi thời gian: Dữ liệu nghiên cứu đƣợc lấy trong khoảng thời gian từ ngày 01 tháng 01 năm 2014 đến ngày 31 tháng 12 năm 2018. 5. Phƣơng pháp nghiên cứu: Phƣơng pháp phân tích: đƣợc d ng để trả lời các câu hỏi về các thuộc tính nhƣ số ca mắc sốt xuất huyết và các yếu tố ảnh hƣởng đến số ca mắc. Phƣơng pháp trực quan: đƣợc d ng để giúp ngƣời d ng biết đƣợc tình trạng các thuộc tính bằng phƣơng pháp nhìn - hiểu. 2 Phƣơng pháp hình học: đƣợc d ng để biểu diễn các thuộc tính trên khối không gian – thời gian nhiều chiều. Phƣơng pháp tra cứu tài liệu: đƣợc d ng để nghiên cứu khối không gian – thời gian 3D và cách biểu diễn dữ liệu bệnh, nhiệt độ, độ ẩm, lƣợng mƣa lên biểu đồ. Phƣơng pháp lập trình: Sử dụng ngôn ngữ lập trình Python, thƣ viện Matplotlib để tạo những biểu đồ trực quan. Nghiên cứu tổng quan về bệnh sốt xuất huyết; phân tích, tham khảo ý kiến chuyên gia và biểu diễn trực quan hóa dữ liệu bệnh sốt xuất huyết bằng biểu đồ 3D sử dụng thƣ viện Matplotlib trong ngôn ngữ lập trình Python. Qua biểu đồ biểu diễn trực quan, thể hiện mối liên hệ giữa số ca bệnh sốt xuất huyết với lƣợng mƣa, nhiệt độ, độ ẩm, giúp chuyên gia đánh giá và dự báo tình hình dịch bệnh một cách nhanh chóng. Bố cục luận văn đƣợc trình bày ngoài phần Mở đầu và ết luận gồm 04 chƣơng với các nội dung chính nhƣ sau: - Chƣơng 1: Giới thiệu tổng quan về tỉnh Bình Dƣơng, về tình hình dịch bệnh sốt xuất huyết tại Việt Nam và tỉnh Bình Dƣơng; công tác phòng chống dịch bệnh và đặc điểm dịch bệnh sốt xuất huyết tại Bình Dƣơng. - Chƣơng 2: Cơ sở lý thuyết. Tác giả trình bày tổng quan về trực quan hóa và lý thuyết trực quan hóa. Trực quan hóa bằng ngôn ngữ lập trình Python. - Chƣơng 3: Nội dung và phƣơng pháp thực hiện. - Chƣơng 4: Câu hỏi phân tích. 3 CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN 1.1. Tổng quan về tỉnh Bình Dƣơng: Tỉnh Bình Dƣơng thuộc v ng Đông Nam bộ, giáp ranh với TP. Hồ Chí Minh, Đồng Nai, Tây Ninh, Bình Phƣớc; nằm trong V ng kinh tế trọng điểm phía Nam; có diện tích tự nhiên 2.694,43 km2; dân số 2.070.951, mật độ dân số 769 ngƣời/ km2. Bình Dƣơng có 09 đơn vị hành chính cấp huyện (gồm: Thị xã Thuận An, thị xã Bến Cát, thị xã Tân Uyên, thị xã Dĩ An, Thành phố Thủ Dầu Một, và các huyện Bàu Bàng, Bắc Tân Uyên, Dầu Tiếng, Phú Giáo) và 91 đơn vị hành chính cấp xã (46 xã, 41 phƣờng, 04 thị trấn). hí hậu ở Bình Dƣơng có đặc điểm: nắng nóng vào tháng 1, 2, 3, 4 và mƣa nhiều vào tháng 6, 7, 8, 9, độ ẩm khá cao. hí hậu nhiệt đới gió m a, trong năm phân chia thành hai m a: m a mƣa và m a khô. M a mƣa thƣờng bắt đầu từ tháng 5 kéo dài đến cuối tháng 10 dƣơng lịch. Những tháng 7, 8, 9 thƣờng là những tháng mƣa dầm. Nhiệt độ trung bình hàng năm ở Bình Dƣơng từ 26oC27oC. Nhiệt độ cao nhất có lúc lên tới 39,3oC và thấp nhất từ 16oC-17oC (ban đêm) và 18oC vào sáng sớm. Vào m a nắng, độ ẩm trung bình hàng năm từ 76% - 80%, cao nhất là 86% (vào tháng 9) và thấp nhất là 66% (vào tháng 2). Lƣợng nƣớc mƣa trung bình hàng năm từ 1.800 - 2.000 mm. Bình Dƣơng là một trong những tỉnh có nhiều khu công nghiệp lớn, tốc độ đô thị hóa cao; tốc độ tăng dân số cơ học rất nhanh. Sự phát triển kinh tế mạnh mẽ, Bình Dƣơng cũng đối mặt với vấn đề về chăm sóc sức khỏe và phòng chống dịch bệnh. Nhất là tình hình bệnh SXHD cũng tăng nhanh lên theo, số ca mắc bệnh ngày càng tăng theo hàng năm và không theo chu kỳ nhất định mà diễn biến ngày một phức tạp. 1.2. Tổng quan về bệnh sốt xuất huyết ở Việt Nam và tỉnh Bình Dƣơng giai đoạn 2014 - 2018: Theo báo cáo của TTYTDP tỉnh, Bình Dƣơng là một trong những tỉnh có số ca mắc SXHD cao nhất cả nƣớc. Trong vòng 5 năm từ 2014 - 2018 đã có 4 nhiều đợt dịch lớn xảy ra vào các năm 2015 và 2017, số ca mắc và tử vong cao tăng theo hàng năm. Năm 2014 có 2714 ca mắc, tử vong 1; Năm 2015 có 5991 ca mắc, tử vong 14 ca; Năm 2016 cả tỉnh có 3.964 ca mắc SXHD, trong đó có 01 ca tử vong. Trong năm 2017 có 8507 ca mắc và 3 ca tử vong; Năm 2018 toàn tỉnh có 8244 ca mắc, tử vong 3. Cũng nhƣ nhiều nơi lƣu hành bệnh sốt xuất huyết, hệ thống giám sát sốt xuất huyết ở Việt Nam dựa vào báo cáo thụ động đƣợc chẩn đoán lâm sàng ở bệnh nhân nhập viện. iểm soát véc-tơ là công cụ chính để dự phòng và kiểm soát bệnh sốt xuất huyết. Chiến lƣợc này phải đối mặt với những hạn chế về tính kịp thời trong phát hiện và ngăn chặn dịch, đòi hỏi cần có những biện pháp khác để hỗ trợ kiểm soát bệnh tốt hơn. Trong các yếu tố nguy cơ giúp truyền bệnh sốt xuất huyết thì thời tiết, khí hậu là yếu tố đặc biệt quan trọng, gây ảnh hƣởng đến sự sinh sản và phát triển của vec-tơ truyền bệnh, chẳng hạn nhƣ mƣa cung cấp môi trƣờng thuận lợi để muỗi đẻ trứng, nhiệt độ cao sẽ làm giảm thời gian sinh trƣởng và phát triển của muỗi… Việc nghiên cứu dự báo sớm nguy cơ xảy ra dịch sốt xuất huyết là rất cần thiết, giúp các nhà quản lý, chuyên môn chủ động trong công tác phòng chống dịch một cách hiệu quả, giảm đƣợc nguồn lực phân bổ cũng nhƣ tránh đƣợc rủi ro, thiệt hại lớn khi dịch xảy ra. 5 CHƢƠNG 2: CƠ SỞ LÝ THUYẾT 2.1. Tổng quan về trực quan hóa: Trực quan hóa thƣờng đƣợc sử dụng để truyền đạt, trình bày, minh họa dữ liệu một cách dễ hiểu dƣới dạng các biểu đồ, đồ thị,…để trực quan hóa. 2.2. Lý thuyết về trực quan hóa: Trực quan hóa là biểu diễn dữ liệu thành dạng hình ảnh [8]. Trực quan hóa là công cụ cần thiết để hiểu rõ về dữ liệu. Trực quan hóa biểu diễn dữ liệu lên biểu đồ với mục đích mô tả, phát hiện,thu nhận các thông tin bổ ích, các thông tin tiềm ẩn trong dữ liệu thông qua thị giác và bộ não con ngƣời. Thị giác giúp chúng ta tiếp nhận thông tin từ những mô hình trực quan, bộ não sẽ xử lý giúp chúng ta có đƣợc thông tin hữu ích từ những hình ảnh minh họa. Trực quan hóa dữ liệu là các k thuật đƣợc sử dụng để chuyển đổi dữ liệu thành các đối tƣợng trực quan trên màn hình nhƣ các điểm, đƣờng hoặc các thanh đồ họa [9]. Mục tiêu chính của trực quan hóa dữ liệu là hỗ trợ ngƣời d ng rút trích thông tin hoặc khai phá tri thức từ dữ liệu bằng cách d ng thị giác cảm nhận thông tin hoặc tri thức từ hình ảnh, đồ thị biểu diễn dữ liệu. Trong phân tích trực quan, ngƣời d ng (hay các chuyên gia) sử dụng các công cụ đồ họa để rút trích thông tin cần thiết bằng kiến thức và k năng sẵn có của mình. 2.2.1. Các dạng biểu đồ, đồ thị thƣờng dùng trong trực quan hóa: 6  Biểu đồ cột/ cột chồng. Hình 2.1: Biểu đồ cột, cột chồng.  Biểu đồ đƣờng. Hình 2.2: Biểu đồ đƣờng.  Biểu đồ tròn. Hình 2.3: Biểu đồ tròn. 7  Biểu đồ Area. Hình 2.4: Biểu đồ Area.  Biểu đồ thác nƣớc. Hình 2.5: Biểu đồ thác nƣớc.  Biểu đồ nhiệt. Hình 2.5: Biểu đồ nhiệt. 8 2.2.2. Biểu diễn vị trí của đối tƣợng trên khối không gian - thời gian Trên khối không gian - thời gian, một đối tƣợng đƣợc biểu diễn nhƣ một điểm của phép chiếu trên mặt phẳng xy, cho thấy vị trí của nó trong thế giới thực và chiếu trên trục thời gian chỉ ra thời điểm tƣơng ứng với vị trí này. 2.3. Các nghiên cứu liên quan: Nghiên cứu dự báo dịch tả dựa vào mô hình học máy hồi quy và phân lớp của nhóm tác giả Lê Thị Ngọc Anh thực hiện năm 2016, đăng trên cổng Researchgate.net, nghiên cứu trên tập dữ liệu dịch tả và khí hậu, môi trƣờng tại địa bàn Hà Nội [1]. ết quả thực nghiệm trên mô hình hồi quy và phân lớp của nhóm tác giả Ngọc Anh nhƣ hình : Hình 2.6: Biểu đồ kết quả mô hình Hồi quy của nhóm tác giả Ngọc Anh Bảng 2.1 : Bảng kết quả mô hình phân lớp của nhóm tác giả Ngọc Anh 9 Một nghiên cứu của nhóm tác giả thuộc Đại học Công nghệ umaraguru [2] về phát hiện sớm bệnh sốt xuất huyết bằng thuật toán học máy. ết quả thực nghiệm cho thấy thuật toán Random Forest cho độ chính xác 83,3%. Bảng 2 2: Bảng kết quả mô hình học máy của nhóm tác giả Đại học Công nghệ Kumaraguru: Martin Mabangiz và cộng sự đã thực hiện nghiên cứu sử dụng k thuật học máy để dự báo dịch tả ở những khu vực khác nhau ở Uganda bằng thuật toán Bayesians dựa trên số liệu dịch tả trong quá khứ [3]. Ngoài ra, trong một nghiên cứu khác của nhóm tác giả trong bài báo [4] đã đề xuất k thuật dựa trên thống kê hồi quy đa biến Poisson. Họ tập trung vào phân tích tri thức ẩn trong dữ liệu, mối tƣơng quan tuyến tính của các trƣờng hợp sốt xuất huyết và dữ liệu về muỗi, vai trò của muỗi cái, m a để đƣa ra tỷ lệ dự đoán dịch sốt xuất huyết. Một nghiên cứu khác nữa, các tác giả trong bài báo [5] đã xây dựng mô hình dự đoán bằng cách sử dụng cây quyết định (Decision Tree) để dự đoán khả năng xuất hiện bệnh sốt xuất huyết ở khu vực các bộ tộc. Độ chính xác của mô hình do họ đề xuất lên tới 97%. Tuy nhiên, các nghiên cứu đã đề cập ở trên chỉ phân tích và dự báo về dịch bệnh khác hoặc có đề cập đến dự báo dịch hoặc bệnh sốt xuất huyết nhƣng ở các điều kiện (đặc trƣng, đặc th ) và ở các không gian khác nhau. Theo sự hiểu biết của chúng tôi, hiện chƣa có nghiên cứu nào sử dụng phƣơng pháp trực quan 10
- Xem thêm -

Tài liệu liên quan