Đăng ký Đăng nhập
Trang chủ Tổ chức khai thác dữ liệu giao thông vận tải...

Tài liệu Tổ chức khai thác dữ liệu giao thông vận tải

.PDF
14
403
128

Mô tả:

Tổ chức khai thác dữ liệu giao thông vận tải
Tổ chức khai thác dữ liệu giao thông vận tải Nguyễn Thị Diễm Hà Trường Đại học Công nghệ Luận văn ThS. ngành: Hệ thống thông tin; Mã số: 60 48 05 Người hướng dẫn: PGS.TS. Đỗ Trung Tuấn Năm bảo vệ: 2012 Abstract. Trình bày thực trạng giao thông Việt Nam và nhu cầu tổ chức dữ liệu các cung đường trên địa bàn thành phố Hải Phòng. Tìm hiểu về cơ sở dữ liệu phân tán: so sánh cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung; sự cần thiết của cơ sở dữ liệu phân tán; kiến trúc cơ bản của CSDL phân tán; hệ quản trị cơ sở dữ liệu phân tán; thiết kế cơ sở dữ liệu phân tán; Kiểm soát dữ liệu ngữ nghĩa. Thiết kế, xây dựng hệ thống cơ sở dữ liệu phân tán với Visual Studio 2008, hệ quản trị cơ sở dữ liệu SQL server. Keywords. Hệ thống thông tin; Khai thác dữ liệu; Giao thông vận tải; Cơ sở dữ liệu phân tán Content Mở đầu Hiện nay, cùng với xu hướng phát triển chung, nhu cầu về dữ liệu ngày càng tăng, đối với mọi ngành kinh tế quốc dân nói chung, và ngành giao thông vận tải nói riêng. Trong những năm qua, thành phố Hải Phòng đã có nhiều bước tiến trong tất cả các ngành kinh tế, đáp ứng nhu cầu của kinh tế thị trường cũng như đảm bảo kinh tế người dân ở các huyện lị trong thành phố. Hệ thống đường xá liên tỉnh, liên huyện, liên xã cần được quản lý một cách khoa học. Việc sử dụng CNTT ngày càng quen thuộc trong ngành GTVT. Theo phương pháp quản lý trong ngành hiện nay, các đơn vị quản trị giao thông tại các cung đường thường xuyên có các báo cáo về Sở giao thông Hải Phòng, bao gồm: lưu lượng tham gia giao thông, số vụ tai nạn xảy ra, chất lượng các cung đường, công tác bảo dưõng duy tu, giám sát cung đường,... Những dữ liệu đó được tổ chức phân tán tại cơ sở, được ghi lại và xử lý tập trung tại sở giao thông thành phố Hải Phòng. Việc ứng dụng các kiến thức về Cơ sở dữ liệu phân tán về giao thông là cần thiết và có vai trò quan trọng trong công tác quản lý GTVT trên địa bàn thành phố. Luận văn đã chọn đề tài “Tổ chức, khai thác dữ liệu giao thông vận tải” với mục đích tìm hiểu về CSDL phân tán, trên cơ sở đó phân tích, thiết kế CSDL các cung đường nhằm nâng cao công tác quản lý trong ngành giao thông, đặc biệt là công tác quản lý các cung đường trên địa bàn thành phố Hải Phòng. Luận văn chia thành các chương: 1. Một số vấn đề liên quan đến ctác quản lý các hoạt động trên các cung đường trên địa bàn thành phố Hải Phòng; 2. Vai trò của CSDL phân tán và khả năng áp dụng các kiến thức hàn lâm vào bài toán cụ thể của ngành giao thông vận tải; 3. Thiết kế, xây dựng hệ thống CSDL phân tán với Visual Studio 2008, hệ quản trị CSDL SQL server. Cuối luận văn là phần kết luận và tài liệu tham khảo. Chương 1. Nhu cầu sử dụng công nghệ thông tin để giám sát các hoạt động giao thông 1.1. Hiện trạng giao thông ở Việt Nam và vấn đề quản lý Việt nam là một đất nước có hệ thống chính trị ổn định trong khu vực và trên thế giới, là một nước chỉ có duy nhất một Đảng Chính trị lãnh đạo, tình trạng khủng bố hầu như không có. Thế nhưng, tình trạng thiệt mạng do tai nạn giao thông thì lại quá nhiều, bình quân mỗi năm có 9 ngàn đến 13 ngàn người thiệt mạng do TNGT thiệt hại kinh tế ước tính đến cả tỷ USD/năm bằng cả trị giá xuất khẩu lúa gạo (Việt nam có sản lượng xuất khẩu lúa gạo đứng thứ hai trên thế giới). Theo báo cáo của bộ Giao thông vận tải, tai nạn giao thông trong 10 năm qua tăng liên tục, đặc biệt từ năm 2001 tăng đột biến. Năm 2002 tai nạn đã làm chết 10.866 người, bị thương 29.449 người. Hệ thống đường bộ của chúng ta chưa đạt tiêu chuẩn kỹ thuật: như độ nghiêng, độ bám dính mặt đường, độ phẳng, tầm nhìn, ... chưa đảm bảo. Tầm nhìn nhiều chỗ còn bị hạn chế hoặc những chỗ cua không hợp lý đã tạo nhiều điểm đen thường xảy ra TNGT. Hệ thống đèn tín hiệu cảnh báo chỉ dẫn không được thiết kế thi công đồng bộ, nên hầu hết các tuyến đường không có biển báo, đèn báo, đèn chỉ dẫn giao thông… đây cũng là nguyên nhân làm ùn tắc giao thông ở các chỗ đường giao nhau và gây ra TNGT. Hầu hết các tuyến đường, cầu cống trên đất nước ta kể cả những tuyến đường được đầu tư xây dựng từ vốn vay ODA đều chưa đảm bảo tiêu chuẩn kỹ thuật và nhanh xuống cấp đến mức báo động. Ý thức của người tham gia giao thông chưa cao. Tình trạng kinh doanh vận chuyển hành khách trên các tuyến đường một cách tự do và tự phát, không có tổ chức chặt chẽ nên thường xảy ra tình trạng phóng nhanh vượt ẩu để tranh giành khách, nhồi nhét khách…. đã xảy ra không ít tai nạn giao thông thảm khốc. 1.2. Vai trò của công nghệ trong lĩnh vực giao thông vận tải Việc ứng dụng các công nghệ tiên tiến trong giao thông đường bộ có thể xem được bắt đầu vào những năm 1950 của thế kỷ 20 bằng việc thay thế động cơ diesel trong cho các động cơ hơi nước và sau đó là động cơ đốt trong cùng các động cơ điện. Cho đến năm 1989, do có nhiều công nghệ tiến bộ như hệ thống GPS, Internet, cùng với sự ra đời của các hệ thống máy tính có khả năng tính toán lớn, động cơ đốt trong thế hệ mới, hệ thống đệm từ, giao thông đường bộ có những bước tiến dài trong thiết kế, điều khiển, quản lý và khai thác. 1.3. Kết luận chương Với tình hình thực tế hiện nay, công tác quản lý và khai thác hệ thống đường giao thông ở Việt Nam còn rất nhiều bất cập, thiếu tính đồng bộ đòi hỏi cần phải nghiên cứu sâu, rộng. Một trong những vấn đề đó là cần thiết phải xây dựng một hệ thống cơ sở dữ liệu thống nhất, đồng bộ về các cung đường. Để phù hợp với yêu cầu trên, cần xây dựng hệ cơ sở dữ liệu theo mô hình Hệ thống phân tán. Những năm gần đây, hệ cơ sở dữ liệu phân tán được phát triển dựa trên cơ sở dữ liệu và mạng máy tính. Vấn đề hoàn toàn mới là xây dựng và cài đặt một cơ sở dữ liệu phân tán. Chương 2. Về cơ sở dữ liệu phân tán 2.1. So sánh cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung Cơ sở dữ liệu phân tán được thiết kế khác cơ sở dữ liệu tập trung. Điều khiển tập trung: Điều khiển tập trung các nguồn thông tin của công việc hay tổ chức. Có người quản trị đảm bảo an toàn dữ liệu. Trong cơ sở dữ liệu phân tán: không đề cập đến vấn đề điều khiển tập trung. Người quản trị cơ sở dữ liệu chung phân quyền cho người quản trị cơ sở dữ liệu địa phương. Độc lập dữ liệu: Tiện lợi chính của độc lập dữ liệu là các chương trình ứng dụng không bị ảnh hưởng khi thay đổi cấu trúc vật lý của dữ liệu. Trong cơ sở dữ liệu phân tán, độc lập dữ liệu có tầm quan trọng cũng như trong cơ sở dữ liệu truyền thống. Giảm dư thừa dữ liệu: Trong cơ sở dữ liệu tập trung, tính dư thừa hạn chế được càng nhiều càng tốt. Cấu trúc vật lý và khả năng truy cập: người sử dụng truy cập đến cơ sở dữ liệu tập trung phải thông qua cấu trúc truy cập phức tạp: định vị cơ sở dữ liệu, thiết lập đường truyền... Tính toàn vẹn, hồi phục và điều khiển tương tranh: trong cơ sở dữ liệu, tính toàn vẹn, hồi phục và điều khiển đồng thời liên quan nhiều vấn đề liên quan lẫn nhau. Trong cơ sở dữ liệu phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổi các quỹ thời gian cho các giao tác liên tiếp. Như vậy giao tác tự trị là phương tiện đạt được sự toàn vẹn trong cơ sở dữ liệu Tính biệt lập và an toàn: trong cơ sở dữ liệu truyền thống, người quản trị hệ thống có quyền điều khiển tập trung, người sử dụng có chắc chắn được phân quyền mới truy cập vào được dữ liệu. Trong cách tiếp cận cơ sở dữ liệu tập trung không cần thủ tục điều khiển chuyên biệt. Trong cơ sở dữ liệu phân tán, những người quản trị địa phương cũng phải giải quyết vấn đề tương tự như người quản trị cơ sở dữ liệu truyền thống. 2.2. Ưu điểm và hạn chế của cơ sở dữ liệu phân tán 2.2.1. Ưu điểm - Lợi điểm về tổ chức và tính kinh tế. - Tận dụng những cơ sở dữ liệu sẵn có. - Thuận lợi cho nhu cầu phát triển. - Giảm chi phí truyền thông. - Tăng số công việc thực hiện. - Tính dễ hiểu và sẵn sàng. 2.2.2. Hạn chế - Phần mềm phức tạp và kinh phí tốn kém; - Phải xử lý các thay đổi thông báo trong mọi địa điểm; - Khó kiểm soát tính toàn vẹn dữ liệu với nhiều bản sao dữ liệu được phân bố khắp mọi nơi; - Đáp ứng chậm nhu cầu của các trạm trong trường hợp các phần mềm ứng dụng không được phân bố phù hợp với việc sử dụng chung. Nói chung, kỹ thuật thiết kế cơ sở dữ liệu phân tán phức tạp nhưng hệ cơ sở dữ liệu phân tán cũng cần thiết cho xu hướng phát triển kinh tế hiện nay. 2.3. Kiến trúc cơ bản của CSDL phân tán Đây không là kiến trúc tường minh cho tất cả các CSDL phân tán, tuy vậy kiến trúc này thể hiện tổ chức của bất kỳ một CSDL phân tán nào. Sơ đồ tổng thể Sơ đồ phân đoạn Sơ đồ định vị Sơ đồ ánh xạ địa phương 1 DBMS của vị trí 1 CSDL địa phương tại vị trí 1 Sơ đồ ánh xạ địa phương 2 Các vị trí khác… DBMS của vị trí 2 CSDL địa phương tại vị trí 2 Hình 2.1. Kiến trúc cơ bản của CSDL phân tán 2.4. Hệ quản trị cơ sở dữ liệu phân tán Hệ quản trị cơ sở dữ liệu phân tán cung cấp công cụ như tạo lập và quản lý cơ sở dữ liệu phân tán. Gồm: - Phần quản lý cơ sở dữ liệu (DB) - Phần truyền thông dữ liệu (DC) - Từ điển dữ liệu(DD) được mở rộng để thể hiện thông tin về phân tán dữ liệu trong mạng máy tính - Phần cơ sở dữ liệu phân tán (DDB) 2.4.1. Phân loại hệ quản trị CSDL phân tán (1) Hệ quản trị CSDL phân tán thuần nhất: CSDLPT có được bằng cách chia một CSDL thành một tập các CSDL cục bộ và được quản lý bởi cùng một hệ QTCSDL. (2) Hệ quản trị CSDL phân tán không thuần nhất: CSDLPT không thuần nhất được tích hợp bởi một tập các CSDL cục bộ được quản lý bởi các hệ QTCSDL khác nhau. Hệ QTCSDLPT không thuần nhất thêm việc chuyển đổi các mô hình dữ liệu của các hệ QTCSDL khác nhau để thống nhất việc quản lý. 2.4.2. Mô hình kiến trúc hệ quản trị CSDL phân tán - Các hệ Client/Server; - Hệ ngang hàng (Peer to Peer) 2.5. Thiết kế cơ sở dữ liệu phân tán Các chiến lược thiết kế: - Quá trình thiết kế từ trên xuống (top-down) - Quá trình thiết kế từ dưới lên (Bottom-up) Thiết kế CSDL phân tán gồm có các công việc sau: - Thiết kế quan niệm; - Thiết kế phân đoạn; - Thiết kế cấp phát đoạn dữ liệu; 2.5.1. Thiết kế quan niệm Thiết kế CSDL mức quan niệm: biến đổi đầu vào thành một cấu trúc CSDL quan niệm chất lượng hơn, dựa trên một số tiêu chuẩn thiết kế. Các mục tiêu thiết kế quan niệm: Hai tiêu chuẩn quan trọng cần đạt được trong quá trình thiết kế cơ sở dữ liệu mức quan niệm: - Cấu trúc CSDL kết quả (đầu ra của giai đoạn thiết kế quan niệm) cần đạt dạng chuẩn cao nhất; - Cấu trúc CSDL kết quả phải tương đương với cấu trúc ban đầu; Tiêu chuẩn về dạng chuẩn: - Giảm tối đa sự trùng lặp thông tin, từ đó tránh được một số bất tiện khi cập nhật CSDL; - Các phụ thuộc dữ liệu được kiểm tra dễ dàng nhất, đơn giản và tương đối ít tốn kém nhất; Tiêu chuẩn tương đương: đảm bảo các thông tin trong quan hệ phổ quát sẽ được tìm thấy đầy đủ trong CSDL của cấu trúc kết quả. 2.5.2. Phân đoạn dữ liệu - Việc chia một quan hệ thành nhiều quan hệ nhỏ hơn được gọi là phân đoạn quan hệ. - Quá trình phân mảnh phải được gắn liền với vấn đề cấp phát dữ liệu và bài toán cụ thể như thế nào. (1) Phân đoạn ngang: Phân đoạn ngang 1 quan hệ tổng thể n-bộ R là tách R thành các quan hệ con n-bộ R1,R2, …., Rk sao cho quan hệ R có thể được khôi phục lại từ các quan hệ con này bằng phép hợp: R = R1 υ R2, υ …. υ Rk Có 2 loại phân đoạn ngang: Phân đoạn ngang nguyên thủy: phân đoạn ngang nguyên thủy của một quan hệ được thực hiện dựa trên các vị từ được định nghĩa trên quan hệ đó. Phân đoạn ngang dẫn xuất: phân đoạn ngang dẫn xuất của một quan hệ được thực hiện dựa trên các vị từ được định nghĩa trên quan hệ khác. -> Trong phân đoạn ngang, tập các vị từ đóng 1 vai trò quan trọng. (2) Phân đoạn dọc: Phân đoạn dọc 1 quan hệ tổng thể n-bộ R là tách R thành các quan hệ con R1,R2, …., Rk sao cho quan hệ R có thể được khôi phục lại từ các quan hệ con này bằng phép nối: R = R1 R2 …. Rk (3) Phân đoạn hỗn hợp: Phân đoạn một quan hệ thành các tập con và các bộ con: - Các bộ con được xác định bởi phân đoạn dọc; - Các tập con xác định bởi phân đoạn ngang; Cho phép tối ưu hoá các câu hỏi chọn_chiếu hay kết nối_chiếu Việc lựa chọn phân đoạn phụ thuộc vào nhu cầu truy nhập của các ứng dụng. Các yêu cầu của việc phân đoạn: - Tính đầy đủ: Nếu một quan hệ R được phân rã thành các đoạn R1, R2, …, Rk thì mỗi mục dữ liệu trong R phải có trong ít nhất một đoạn Ri nào đó. - Tính tái thiết được: • Nếu 1 quan hệ R được phân rã thành các đoạn R1, R2, …, Rk thì phải tồn tại một toán tử  sao cho R= (Ri)  i. • Toán tử  thay đổi tùy theo từng loại phân đoạn. • Trong thực tế khi các đoạn được phân đoạn ngang thì  là phép hợp, phân đoạn dọc thì  là phép nối và phân mảnh hỗn hợp thì  là phép nối nửa. - Tính tách biệt: • Nếu 1 quan hệ R được phân mảnh ngang thành đoạn R1, R2, …, Rk và mục dữ liệu ti nằm trong mảnh Ri thì nó sẽ không nằm trong một mảnh Rk, k ≠ i. • Tiêu chuẩn này đảm bảo các mảnh ngang phải được tách rời nhau. • Nếu quan hệ được phân mảnh dọc thì thuộc tính chung phải được lặp lại trong mỗi mảnh. Do đó, trong trường hợp phân mảnh dọc tính tách biệt chỉ được định nghĩa trên các trường không phải là thuộc tính chung của quan hệ. 2.5.3. Cấp phát dữ liệu Giả sử có 1 tập các mảnh F={F1,F2,…,Fk} và một mạng máy tính bao gồm các vị trí S={S1,S2,…,Sm} trên đó có 1 tập các ứng dụng Q= {Q1,Q2,…,Qq} đang thực thi. Hãy tìm một phân phối tối ưu các mảnh F cho các vị trí S. Một phân phối được gọi là tối ưu nếu thỏa mãn 2 yếu tố: Chi phí nhỏ nhất: hàm chi phí bao gồm chi phí lưu mỗi mảnh dữ liệu Fi tại vị trí Sj, chi phí vấn tin Fi tại vị trí Sj, chi phí cập nhật Fi tại tất cả các vị trí có chứa nó, và chi phí truyền dữ liệu. Vì thế bài toán cấp phát sẽ tìm một lược đồ cấp phát với hàm chi phí là cực tiểu. Hiệu quả: chiến lược cấp phát được thiết kế nhằm cực tiểu hóa thời gian thực hiện và tăng tối đa lưu lượng hệ thống tại mỗi vị trí. Thông tin cấp phát: Thông tin về cơ sở dữ liệu : độ tuyển của 1 mảnh Fj ứng với câu vấn tin qi – số lượng các bộ của Fj cần được truy xuất để xử lý qi Thông tin về ứng dụng: (i)truy xuất đọc do câu vấn tin qi thực hiện trên mảnh Fj trong mỗi lần chạy của nó; (ii) các truy xuất cập nhật. Thông tin về vị trí : khả năng lưu trữ và xử lý của mỗi trạm. Thông tin về mạng: gij : chi phí truyền mỗi bó tin giữa 2 vị trí Si và Sj , dùng fsize(byte) làm kích thước mỗi bó dữ liệu để tính số lượng thông báo. Chương 3. Thiết kế, xây dựng cơ sở dữ liệu phân tán nhằm quản lý các cung đường trên địa bàn Hải Phòng 3.1. Đảm bảo dữ liệu cho bài toán Những người sử dụng ngân hàng dữ liệu các cung đường: - Người quản lý: Các nhà quản lý thường quyết định phải làm gì, làm như thế nào và đánh giá kết quả đạt được có đúng với kế hoạch ban đầu hay không. Các công việc đó phải trên cơ sở thông tin có giá trị và kịp thời. Phần lớn những quyết định này dựa trên số liệu thông tin và sự phân tích các số liệu này. Do đó ban lãnh đạo là một trong những thành phần sử dụng thông tin cụ thể nhất và nhiêm vụ của cấp cơ sở là cung cấp cho ban lãnh đạo thông tin cần thiết và hữu ích. - Các nhà đầu tư, các cơ quan lập quỹ: Những cơ quan, tổ chức đang dự tính đầu tư vào việc nâng cấp, phát triển GTVT đều quan tâm đến kết quả thu được cả trong quá khứ. Sau khi đầu tư các nhà đầu tư phải luôn luôn theo dõi các thông tin này. - Người dân: có thể xem thông tin về hiện trạng các cung đường. Dữ liệu đầu vào: Căn cứ vào phạm vi, quy mô và đối tượng, các yêu cầu số liệu đầu vào tại mỗi trạm như sau: 1. Tên đường 2. Chiều dài km 3. Loại mặt đường: BT nhựa: BTXM: Cấp phối: Đất: 4. Kiểu đường: Liên quận: Nội quận: 5. Loại đường (1÷5) 6. Hệ thống chiếu sáng: Có: Không: 7. Loại giao cắt: Có kiểm soát: Không có kiểm soát: 8. Giao cắt với đường sắt: Có: Không: 9. Tổ chức giao thông: Đường 1 chiều: Đường 2 chiều có giải phân cách cứng: Đường 2 chiều không có giải phân cách: 10. Mức độ hư hỏng(1÷7) 11. Hệ thống tín hiệu: Có: Không: 12. Mật độ lưu thông: Hình 3.1. Khuôn dạng dữ liệu đầu vào 3.2. Hạ tầng công nghệ thông tin sử dụng trong bài toán 3.2.1. Hệ quản trị Cơ sở dữ liệu SQL Server Ưu điểm của Hệ quản trị CSDL: - Quản lý được dữ liệu dư thừa; - Đảm báo tính nhất quán cho dữ liệu; - Tạo khả năng chia sẻ dữ liệu nhiều hơn; - Cải tiến tính toàn vẹn cho dữ liệu. Microsoft SQL Server là một hệ quản trị cơ sở dữ liệu quan hệ do Microsoft phát triển. SQL Server hoạt động theo mô hình Khách - Chủ cho phép đồng thời cùng lúc có nhiều người dùng truy xuất đến dữ liệu, quản lý việc truy nhập hợp lệ và các quyền hạn của từng người dùng trên mạng. Ngôn ngữ truy vấn quan trọng của Microsoft SQL server là Transact-SQL. Transact-SQL là ngôn ngữ SQL mở rộng dựa trên SQL chuẩn của ISO và ANSI được sử dụng trong SQL Server. 3.2.2. Visual Studio và Ngôn ngữ lập trình C sharp Theo http:// www.microsoft.com/visualstudio [09]: 3.2.2.1. Visual Studio a) Giới thiệu chung : Microsoft Visual Studio là môi trường phát triển tích hợp chính (Integrated Development Environment - IDE) được phát triển từ Microsoft. Đây là một loại phần mềm máy tính có công dụng giúp đỡ các lập trình viên trong việc phát triển phần mềm. Các môi trường phát triển hợp nhất thường bao gồm: - Một trình soạn thảo mã (source code editor): dùng để viết mã. - Trình biên dịch (compiler) và/hoặc trình thông dịch (interpreter). - Công cụ xây dựng tự động: khi sử dụng sẽ biên dịch (hoặc thông dịch) mã nguồn, thực hiện liên kết, và có thể chạy chương trình một cách tự động. - Trình gỡ lỗi: hỗ trợ dò tìm lỗi. - Ngoài ra, còn có thể bao gồm hệ thống quản lý phiên bản và các công cụ nhằm đơn giản hóa công việc xây dựng giao diện người dùng đồ họa (GUI). - Nhiều môi trường phát triển hợp nhất hiện đại còn tích hợp trình duyệt lớp, trình quản lý đối tượng, lược đồ phân cấp lớp,… để sử dụng trong việc phát triển phần mềm theo hướng đối tượng. Visual Studio hỗ trợ rất nhiều ngôn ngữ lập trình, có thể kể tên như sau: C/C++ ( Visual C++), VB.NET (Visual Basic .NET), va C# (Visual C#)… cũng như hỗ trợ các ngôn ngữ khác như F#, Python, và Ruby; ngoài ra còn hỗ trợ cả XML/XSLT, HTML/XHTML, JavaScript và CSS… Những chức năng của Mirosoft Visual Studio: Microsoft Visual Studio có những chức năng cơ bản sau: soạn thảo mã (code editor); Trình gỡ lỗi (debugger); và Thiết kế (Designer). Trong đó chức năng Thiết kế được xem là một trong những điểm nhấn của Microsft Visual Studio. b) Visual Studio 2008 : Tốc độ: Với mỗi phiên bản, Microsoft luôn cố gắng cải thiện Visual Studio để sao cho đạt được hiệu suất làm việc ngày càng cao hơn. Tổng quan, Visual Studio 2008 được xây dựng dựa trên bộ ba trụ cột chính: - Cải thiện hiệu năng sản phẩm; - Hỗ trợ quản lý vòng đời ứng dụng; - Sử dụng công nghệ mới; Visual Studio 2008 đem tới cho nhà phát triển, nhóm phát triển những hỗ trợ chuyên biệt như: - Hỗ trợ phát triển cho thiết bị thông minh; - Xây dựng các ứng dụng dựa trên nền Microsoft Office; - Xây dựng ứng dụng tương thích Windows Vista; - Nâng cao hiệu suất xử lý dữ liệu; - Đem đến những trải nghiệm mới về web; - Nâng cao hỗ trợ cho nhà phát triển; - Hỗ trợ quản lý vòng đời ứng dụng chi tiết. 3.2.2.2. Ngôn ngữ lập trình C sharp C# được coi như ngôn ngữ mang tính cách mạng của Microsoft. Ngôn ngữ C# là một ngôn ngữ được dẫn xuất từ C và C++, nhưng nó được tạo từ nền tảng phát triển hơn. Microsoft bắt đầu với công việc trong C và C++ và thêm vào những đặc tính mới để làm cho ngôn ngữ này dễ sử dụng hơn. Nhiều trong số những đặc tính này khá giống với những đặc tính có trong ngôn ngữ Java. Không dừng lại ở đó, Microsoft đưa ra một số mục đích khi xây dựng ngôn ngữ này. Những mục đích này được được tóm tắt như sau: - C# là ngôn ngữ đơn giản; - C# là ngôn ngữ hiện đại; - C# là ngôn ngữ hướng đối tượng; - C# là ngôn ngữ mạnh mẽ và mềm dẻo; - C# là ngôn ngữ có ít từ khóa; - C# là ngôn ngữ hướng module; - C# sẽ trở nên phổ biến; Lựa chọn phiên bản để xây dựng ứng dụng thử nghiệm: Visual Studio 2008. Phiên bản này có tích hợp sẵn SQL server 2005, ngôn ngữ lập trình: Visual C# . 3.2.3. Kết nối Visual Studio 2008 với CSDL SQL Server 2005 - Cài đặt bộ SQL Server Management Studio Express - Mở VS 2008, Vào Tool → Connect to Server - Kích chọn biểu tượng Connect to Database và điền các thông tin: server name, attach a database file, … - Nhấn Test Connection → OK 3.3. Phân tích, thiết kế cơ sở dữ liệu cung đường Mục tiêu: - Tìm kiếm, in ra các thông tin cần thiết. - Báo cáo, tổng hợp kịp thời. - Chương trình phải tổ chức cơ sở dữ liệu theo cơ chế phân quyền truy nhập tới từng cơ sở dữ liệu để đảm bảo tính bảo mật. - Chương trình phải có khả năng phân tán dữ liệu: sử dụng loại Hệ quản trị cơ sở dữ liệu phân tán thuần nhất, kiến trúc ngang hàng, CSDL được thiết thế theo kiểu phân mảnh ngang. - Hệ thống phải có tính mở. Lý do sử dụng CSDL phân tán: Các tổ chức có cấu trúc phân tán: Đối với cơ cấu tổ chức quản lý trong ngành Giao thông vận tải hiện nay, cấp cao nhất là Bộ, sau đó là các Sở, rồi tới các Phòng tại các quận huyện. Như vậy, với cách tổ chức này, các cơ quan quản lý được phân tán ở các địa phương khác nhau, trong khi đó, dữ liệu quản lý ngày càng lớn và phục vụ cho đa người dùng nằm phân tán, vì vậy tổ chức CSDL theo kiểu phân tán là con đường thích hợp với cấu trúc tổ chức quản lý. Cần kết nối các CSDL có sẵn: CSDL phân tán là giải pháp tự nhiên khi có các CSDL đang ở các trạm (các quận) và sự cần thiết xây dựng một ứng dụng toàn cục. Trong trường hợp này CSDL phân tán được tạo theo tiến trình từ dưới lên dựa trên nền tảng CSDL đang tồn tại. Tiến trình này đòi hỏi phải tái cấu trúc các CSDL cục bộ ở một mức nhất định. 3.3.1. Lược đồ quan niệm của CSDL Trong quá trình tìm hiểu về cách tổ chức dữ liệu các cung đường, cần tổ chức các thực thể và tiến hành chuẩn hoá chúng về dạng chuẩn 3 được các thực thể sau: 1. Quan: dùng để lưu trữ các thông tin về các quận trong thành phố, bao gồm các thuộc tính sau: - MaQuan: trường khoá của thực thể Quan; - TenQuan: tên các quận trong thành phố. - PathServer: địa chỉ máy trạm Hình 3.2. Bảng Quan 2. Duong Mô tả chi tiết các thông tin cần thiết về các cung đường, bao gồm các thuộc tính sau: - MaDuong: trường khoá của thực thể Duong - MaQuan: lưu mã quận - TenDuong: lưu tên đường - ChieuDai: chiều dài đường - MaLoaiMatDuong: Thuộc tính khóa của thực thể LoaiMatDuong - MaKieuDuong: Thuộc tính khóa của thực thể KieuDuong - HeThongChieuSang: Thuộc tính xác định đường có hệ thống chiếu sáng hay không (True or False); - MaLoaiGiaoCat: Thuộc tính khóa của thực thể LoaiGiaoCat - GiaoCatVoiDuongSat: thuộc tính xác định đường có giao cắt với đường sắt hay không. - MaToChucGiaoThong: Thuộc tính khóa của thực thể ToChucGiaoThong; - MaMucDoHuHong: Thuộc tính khóa của thực thể MucDoHuHong; - HeThongTinHieu: thuộc tính xác định đường có hệ thống tín hiệu đèn giao thông hay không. - MatDoLuuThong: thuộc tính xác định mật độ xe lưu thông. Hình 3.3. Bảng Duong 3. LoaiMatDuong Phân loại mặt đường(có các loại mặt đường sau: Bê tông nhựa, Bê tông xi măng(BTXM), Cấp phối, Đất). Các thuộc tính: MaLoaiMatDuong: trường khóa của thực thể LoaiMatDuong TenLoaiMatDuong: thuộc tính xác định tên loại mặt đường Hình 3.4. Bảng LoaiMatDuong 4. KieuDuong Phân loại kiểu đường, gồm: Đường liên quận, Đường nội quận. Các thuộc tính: MaKieuDuong: trường khóa của thực thể KieuDuong TenKieuDuong: thuộc tính xác định tên kiểu đường. Hình 3.5. Bảng KieuDuong 5. LoaiGiaoCat Xác định Loại giao cắt (Có kiểm soát, không có kiểm soát). Các thuộc tính: MaLoaiGiaoCat : Trường khóa của thực thể LoaiGiaoCat TenLoaiGiaoCat: thuộc tính xác định loại giao cắt. Hình 3.6. Bảng LoaiGiaoCat 6. ToChucGiaoThong Xác định cách tổ chức đường giao thông(đường 1 chiều, đường 2 chiều có giải phân cách cứng, đường 2 chiều không có giải phân cách). Các thuộc tính: MaToChucGiaoThong: Trường khóa của thực thể ToChucGiaoThong TenToChucGiaoThong: thuộc tính xác định cách tổ chức giao thông của đường. Hình 3.7. Bảng ToChucGiaoThong 7. MucDoHuHong Xác định mức độ hư hỏng của đường: - Xếp loại 1 và 2: ít hoặc không có vết nứt hay biến dạng, tình trạng mặt đường tốt, không cần sửa chữa hoặc công tác sửa chữa có thể trì hoãn được. - Xếp loại 3 và 4: nứt nhưng không có hoặc ít biến dạng; tình trạng mặt đường không tốt cần tiến hành sữa chữa không cần nghiên cứu gì thêm. - Xếp loại 5, 6, 7: nứt và biến dạng trên diện rộng; tình trạng lớp mặt đường rất xấu và tồi tệ cần sửa chữa lớn hoặc tiến hành trải thảm. Các thuộc tính: MaMucDoHuHong: trường khóa của thực thể MucDoHuHong TenMucDo: thuộc tính xác định mức độ hư hỏng MoTa: thuộc tính xác mô tả mức độ hư hỏng. Hình 3.8. Bảng MucDoHuHong 3.3.2. Phân đoạn dữ liệu Tiêu chuẩn phân đoạn: theo quận, theo tên đường, mức độ hư hỏng, cách thức tổ chức, … - Theo quận: Phân đoạn ngang quan hệ Quan và phân đoạn dọc các quan hệ còn lại để truy xuất các thuộc tính có giá trị theo MaQuan: MaDuong, TenDuong, ChieuDai, HeThongChieuSang, GiaoCatVoiDuongSat, HeThongTinHieu, MatDoLuuThong … - Theo tên đường: phân đoạn dọc quan hệ Duong - Theo mức độ hư hỏng: phân đoạn theo quan hệ MucDoHuHong - Theo cách thức tổ chức: phân đoạn theo quan hệ ToChucGiaoThong 3.3.3. Định vị dữ liệu Các dữ liệu liên quan đến một quận sẽ được đặt tại trạm của quận đó. Các trạm khác(quận khác) có thể truy cập tới để tra cứu, thống kê thông tin. 3.4. Các chức năng chính 3.4.1. Tìm kiếm - Tìm kiếm theo Quận; - TÌm kiếm theo tên đường; - Tìm kiếm theo mức độ hư hỏng của đường; - Tìm kiếm theo cách thức tổ chức giao thông; Hình 3.9. Chức năng Tìm kiếm 3.4.2. Quản lý người dùng Hình 3.10. Đăng nhập hệ thống Hình 3.11. Quản lý người dùng 3.4.3.Quản lý dữ liệu đường Hình 3.12. Quản lý đường 3.5. Kết luận chương Trong chương thử nghiệm, luận văn đã thực hiện: - Chương trình cài đặt thử nghiệm trên mạng LAN. - CSDL ở các máy trạm tương đương nhau, các có thể truy cập tới CSDL ở các trạm khác. Dữ liệu được cập nhật thường xuyên tại các trạm (quận) và được sao lưu để lưu trữ tại kho cơ sở dữ liệu của thành phố (Sở giao thông). - Hệ thống hoạt động theo kiểu CSDLPT ngang hàng (Peer – to- Peer). Việc tổ chức, xử lí dữ liệu về giao thông mới đạt được một số kết quả thử nghiệm đơn giản, có tính minh họa cho những tìm hiểu về lí thuyết cơ sở dữ liệu. Kết luận Kết quả đạt được Luận văn có ý nghĩa đối với cá nhân học viên. Trong thời gian học tập sau đại học, được sự động viên khuyến khích của cơ quan công tác, tôi muốn thực hiện tìm hiểu, nghiên cứu về cách tổ chức những cơ sở dữ liệu về giao thông vận tải. Một trong số đó là vấn đề quản lý các cung đường trên địa bàn Hải Phòng. Việc ứng dụng CSDL phân tán để quản lý dữ liệu về các cung đường hiện nay là vấn đề quan trọng và cần thiết cho những người làm công tác quản lý giao thông vận tải có cái nhìn chính xác, và đưa ra quyết định kịp thời. Đồng thời, góp phần xây dựng ngân hàng dữ liệu cho HDM-4. Trong phạm vi thực hiện đề tài, qua quá trình tìm hiểu, tôi nhận thấy có thể áp dụng lý thuyết về Cơ sở dữ liệu phân tán để thực hiện tổ chức dữ liệu giao thông vận tải. Qua đó đã thử nghiệm, thiết kế Cơ sở dữ liệu phân tán về các cung đường bộ trên địa bàn thành phố Hải Phòng nhằm mục đích phục vụ trực tiếp công tác đào tạo trong trường. Mặc dù đã rất cố gắng nhưng do thời gian và kiến thức có hạn, nên kết quả đạt được mới chỉ là bước đầu. Hướng nghiên cứu tiếp Bên cạnh những vấn đề đạt được của luận văn, còn có một số vấn đề cần phát triển thêm như hoàn thiện và phát triển chương trình, quy mô của bài toán ứng dụng. References [01]. Đỗ Trung Tuấn (1997), Cơ sở Dữ liệu, Nhà xuất bản Giáo dục. [02]. Phạm Thế Quế (2009), Cơ sở dữ liệu phân tán, Nhà xuất bản Thông tin Truyền thông. [03]. Giáo trình Cơ sở dữ liệu phân tán, Đại học KHTN- ĐHQGHN. [04]. Giáo trình Cơ sở dữ liệu 2, Đại học Thái Nguyên. [05]. Đồng Thị Bích Thủy, Bài giảng Cơ sở dữ liệu nâng cao, ĐHKHTN Hồ Chí Minh. [06]. M.Tamer Ozsu và Patricle Valduriez (1999), Principles of Distributed Database Systems. [07]. http://www.giaothongvantai.com.vn [08]. http://www.haiphong.gov.vn [09]. http://www.microsoft.com/sql/
- Xem thêm -

Tài liệu liên quan