ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG
NGUYỄN NHƯ QUỲNH
NGHIÊN CỨU MỘT SỐ THUẬT TOÁN TRONG GIS
ỨNG DỤNG LOGIC MỜ
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên, 2012
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG
NGUYỄN NHƯ QUỲNH
NGHIÊN CỨU MỘT SỐ THUẬT TOÁN TRONG GIS
ỨNG DỤNG LOGIC MỜ
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: PGS. TS. Đặng Văn Đức
Thái Nguyên, 2012
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
i
LỜI CAM ĐOAN
Tôi xin cam đoan bản luận văn “Nghiên cứu một số thuật toán trong
GIS ứng dụng logic mờ” là công trình nghiên cứu của tôi, dưới sự hướng dẫn
khoa học của PGS.TS Đặng Văn Đức, tham khảo các nguồn tài liệu đã được
chỉ rõ trong trích dẫn và danh mục tài liệu tham khảo. Các nội dung công bố
và kết quả trình bày trong luận văn này là trung thực và chưa từng được ai
công bố trong bất cứ công trình nào.
Thái Nguyên, tháng 8 năm 2012
Nguyễn Nhƣ Quỳnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
ii
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS. Đặng Văn Đức, Thầy đã tận
tình chỉ bảo giúp đỡ tôi trong suốt quá trình nghiên cứu và hoàn thành luận văn.
Xin chân thành cảm ơn quý Thầy Cô trong khoa Sau đại học Trường
Đại học Công nghệ Thông tin và Truyền thông Thái Nguyên đã nhiệt tình
giảng dạy, trang bị cho tôi những kiến thức quý báu trong suốt thời gian học
tập tại trường.
Xin cảm ơn các bạn cùng lớp và đồng nghiệp nơi tôi công tác đã tạo
điều kiện cho tôi hoàn thành luận văn này.
Xin gửi lời cảm ơn tới gia đình tôi đã động viên tôi trong suốt quá trình
học tập và hoàn thành luận văn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
iii
MỤC LỤC
MỞ ĐẦU ..........................................................................................................1
Chƣơng 1 TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ VÀ
LOGIC MỜ......................................................................................................3
1.1. Tổng quan về hệ thông tin địa lý ............................................................3
1.1.1. Định nghĩa về hệ thông tin địa lý .....................................................3
1.1.2. Biểu diễn dữ liệu địa lý ...................................................................6
1.1.2.1. Các thành phần của dữ liệu địa lý ............................................6
1.1.2.2. Mô hình biểu diễn dữ liệu không gian ...................................11
1.1.3. Phân tích và xử lý dữ liệu không gian ............................................13
1.1.3.1. Tìm kiếm theo vùng ...............................................................14
1.1.3.2. Tìm kiếm lân cận ....................................................................14
1.1.3.3. Phân tích đường đi và dẫn đường ..........................................14
1.1.3.4. Tìm kiếm hiện tượng và bài toán chồng phủ .........................15
1.1.3.5. Nắn chỉnh dữ liệu không gian ................................................19
1.1.3.6. Tổng quát hóa dữ liệu không gian .........................................19
1.1.4. Ứng dụng của hệ thông tin địa lý ...................................................20
1.2. Tổng quan về logic mờ .........................................................................21
1.2.1. Giới thiệu ........................................................................................21
1.2.2. Tập mờ và các hàm thuộc...............................................................23
1.2.2.1. Khái niệm tập mờ ...................................................................23
1.2.2.2. Các dạng hàm liên thuộc của tập mờ .....................................26
1.2.3. Các phép toán logic ........................................................................27
1.2.3.1. Phép hợp hai tập mờ ...............................................................27
1.2.3.2. Phép giao hai tập mờ ..............................................................28
1.2.3.3. Phép bù của một tập mờ .........................................................29
1.2.4. Hệ suy diễn mờ ...............................................................................29
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
iv
Chƣơng 2 ỨNG DỤNG LOGIC MỜ TRONG HỆ THỐNG THÔNG
TIN ĐỊA LÝ ...................................................................................................33
2.1. Giới thiệu ..............................................................................................33
2.2. Nghiên cứu một số thuật toán trong GIS có ứng dụng logic mờ .........38
2.2.1. Một số thuật toán tìm đường đi tối ưu ứng dụng trong GIS ..........38
2.2.1.1. Phát biểu bài toán ...................................................................38
2.2.1.2. Thuật toán Dijkstra.................................................................39
2.2.1.3. Thuật toán Bellman-Ford .......................................................43
2.2.1.4. Thuật toán A* .........................................................................45
2.2.1.5. Hàm heuristic .........................................................................50
2.2.2 Ứng dụng logic mờ trong bài toán tìm đường.................................51
2.2.2.1 Thuật toán FSA .......................................................................52
2.2.2.2 Thuật toán tìm đường đi ngắn nhất trên cơ sở số mờ .............54
Chƣơng 3 PHÁT TRIỂN CHƢƠNG TRÌNH THỬ NGHIỆM ................60
3.1. Môi trường phát triển chương trình ......................................................60
3.2. Các chức năng của chương trình ..........................................................60
3.3. Một số giao diện của chương trình .......................................................61
3.4. Một số kết quả thử nghiệm ...................................................................62
KẾT LUẬN ....................................................................................................66
TÀI LIỆU THAM KHẢO ............................................................................68
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
v
DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Hệ thống thông tin địa lý.................................................................... 5
Hình 1.2 Tầng (layer) bản đồ ............................................................................ 6
Hình 1.3 Ví dụ biểu diễn vị trí nước bị ô nhiễm ............................................... 8
Hình 1.4 Ví dụ biểu diễn đường ........................................................................ 8
Hình 1.5 Ví dụ biểu diễn khu vực hành chính .................................................. 9
Hình 1.6 Biểu diễn vector của đối tượng địa lý .............................................. 11
Hình 1.7 Biểu diễn thế giới bằng mô hình raster ............................................ 12
Hình 1.8 Chồng phủ đa giác ............................................................................ 16
Hình 1.9 Tiến trình phủ đa giác ...................................................................... 18
Hình 1.10 Hàm phụ thuộc A (x) của tập kinh điển A .................................... 24
Hình 1.11 Hàm liên thuộc B (x) của tập “mờ” B .......................................... 24
Hình 1.12 Độ cao, miền xác định, miền tin cậy của tập mờ ........................... 25
Hình 1.13 Hàm mờ tuyến tính ........................................................................ 26
Hình 1.14 Hàm mờ hình sin ........................................................................... 27
Hình 1.15 Hợp của hai tập mờ có cùng cơ sở ................................................. 27
theo quy tắc Max (a); theo Lukasiewwiez (b)................................................. 27
Hình 1.16 Giao của hai tập mờ có cùng cơ sở ................................................ 29
theo quy tắc Min (a) và theo tích đại số (b) .................................................... 29
Hình 1.17 Bù của tập mờ ................................................................................ 29
Hình 1.18 Mô hình tổng quát hệ suy diễn mờ ............................................... 30
Hình 1.19 Quy trình xây dựng hệ suy diễn mờ .............................................. 31
Hình 2.1 Tính chất không rõ ràng phát sinh khi xác định ranh giới ............... 36
Hình 2.2 Đồ thị minh hoạ thuật toán Dijkstra ................................................. 42
Hình 2.3 Đồ thị minh họa thuật toán Bellman-Ford ...................................... 43
Hình 2.4 Đồ thị mờ G minh họa thuật toán FSA ........................................... 53
Hình 2.5 Các đường đi mờ ngắn nhất của đồ thị mờ G .................................. 53
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
vi
Hình 2.6 Số mờ tam giác ................................................................................. 55
Hình 2.7 Ví dụ mạng lưới ............................................................................... 56
Hình 3.1 Giao diện chính của chương trình thử nghiệm ................................ 61
Hình 3.2 Giao diện chức năng nhập dữ liệu.................................................... 61
Hình 3.3 Giao diện chức năng tính toán ......................................................... 62
Hình 3.4 Ví dụ mạng lưới ............................................................................... 62
Hình 3.5 Nhập dữ liệu cho cung (1,2)............................................................. 63
Hình 3.6 Kết quả thử nghiệm .......................................................................... 64
Hình 3.7 Kết quả thử nghiệm với trường hợp không tồn tại đường đi ........... 64
Hình 3.8 Kết quả thử nghiệm với đồ thị đầy đủ.............................................. 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
1
MỞ ĐẦU
Hệ thống thông tin địa lý (Geographic Information System – GIS) ra
đời trên cơ sở phát triển của khoa học máy tính và được ứng dụng rộng rãi
trong nhiều ngành khoa học có liên quan đến xử lý dữ liệu không gian. GIS
được hình thành từ những năm 70 của thế kỷ trước và phát triển mạnh mẽ
trong một hai chục năm trở lại đây. GIS đã trở thành công cụ hỗ trợ ra quyết
định hầu hết trong các hoạt động kinh tế – xã hội, an ninh – quốc phòng,
trong quản lý, quy hoạch, thăm dò, khai thác…
Đối với GIS, các dữ liệu thu thập thường không đầy đủ, không rõ ràng,
không chắc chắn và mập mờ, điều đó dẫn đến dữ liệu và thông tin trong GIS
là dữ liệu “không rõ ràng” hay dữ liệu “mờ”.
Phân tích dữ liệu không gian bằng cách kết hợp nhiều nguồn dữ liệu
được khai thác từ các hệ thống thông tin địa lý là mục tiêu cao nhất của hầu
hết các dự án GIS để diễn tả, phân tích các ảnh hưởng lẫn nhau, đưa ra các mô
hình dự báo và hỗ trợ ra quyết định. Khái niện “không rõ ràng – mờ” là đặc
trưng vốn có của dữ liệu địa lý và có thể sinh ra do: Thông tin tương ứng với
chúng không đầy đủ; sự xuất hiện không ổn định khi thu thập; tập hợp các dữ
liệu thuộc tính; việc sử dụng các diễn tả định tính đối với các giá trị thuộc tính
và các mối quan hệ dữ chúng. Các hệ GIS thường không sẵn sàng cho việc xử
lý với các dữ liệu mờ. Vì thế cần phải có sự mở rộng cả về mô hình dữ liệu,
các phép toán và lập luận để giải quyết với dữ liệu mờ trong GIS làm cho hệ
thống trở nên mềm dẻo hơn trong việc giải các bài toán không gian mà dữ liệu
của chúng là các dữ liệu dạng mờ.
Theo phương pháp truyền thống khi xử lý, phân tích dữ liệu trong GIS
các thao tác dữ liệu thực hiện một cách cứng nhắc đối với các thủ tục lập luận
và phân tích. Quyết định tổng thể được thực hiện theo từng bước cụ thể và
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
2
quy về kết quả ngay lập tức. Những ứng viên nào thoả điều kiện được dữ lại
và các ứng viên không thoả điều kiện sẽ bị loại bỏ phụ thuộc vào giá trị
ngưỡng. Thêm vào đó các quyết định đưa ra là bắt buộc để biểu diễn các ràng
buộc của chúng dưới dạng các điều kiện số học và các ký hiệu toán học trong
các quan hệ rõ, chúng không cho phép sử dụng các điều kiện cú pháp dưới
dạng ngôn ngữ tự nhiên. Mặt khác kết quả lựa chọn dựa trên các điều kiện
được xác định là ngang nhau, không có giá trị trọng số của các đối tượng.
Một trong các phương pháp toán học nghiên cứu tính chất “không rõ
ràng” của không gian là lý thuyết tập mờ Zadeh (1965). Nó sử dụng độ thuộc
để diễn tả một cá thể tham gia trong một tập hợp. Sự kết hợp lý thuyết tập mờ
và GIS là các đối tượng không gian “mờ” đều có đặc trưng chung là chúng có
ranh giới “không rõ ràng” so với đối tượng không gian “rõ”.
Lý thuyết tập mờ là giải pháp thích hợp nhất cho việc mô hình hoá dữ
liệu “không rõ ràng” và đưa ra cơ sở lý thuyết để hỗ trợ các lập luận trên dữ
liệu này. Vì vậy, học viên đã thực hiện luận văn: “Nghiên cứu một số thuật
toán trong GIS ứng dụng Logic mờ”
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
3
Chƣơng 1
TỔNG QUAN VỀ
HỆ THỐNG THÔNG TIN ĐỊA LÝ VÀ LOGIC MỜ
1.1. Tổng quan về hệ thông tin địa lý
Khái niệm Địa lý (Geography) đề cập lĩnh vực nghiên cứu mô tả Trái
đất (Geo-Earth). Ngày nay, khái niệm này và khái niệm “không gian (Space)”
được sử dụng thay thế nhau trong một số trường hợp. Tuy nhiên, về mặt bản
chất thì Địa lý là tập các mô tả về không gian (hai chiều), khí quyển (ba
chiều), … của Trái đất. Còn “không gian” là cho phép mô tả bất kỳ cấu trúc
đa chiều nào, không quan tâm đến vị trí địa lý của nó. Như vậy có thể xem
Địa lý như là một phần cấu trúc nhỏ trong tập cấu trúc “không gian”.
Khi mô tả Trái đất, các nhà địa lý luôn đề cập đến quan hệ không gian
(spatial relationship) của các đối tượng trong thế giới thực. Mối quan hệ này
được thể hiện thông qua các bản đồ (map) trong đó biểu diễn đồ họa của tập
các đặc trưng trừu tượng và quan hệ không gian tương ứng trên bề mặt trái
đất, ví dụ: bản đồ dân số biểu diễn dân số tại từng vùng địa lý.
Dữ liệu bản đồ còn là loại dữ liệu có thể được số hóa. Để lưu trữ và
phân tích các số liệu thu thập được, cần có sự trợ giúp của hệ thông tin địa lý
(Geographic Information System-GIS).
1.1.1. Định nghĩa về hệ thông tin địa lý
Có nhiều cách diễn giải khác nhau cho từ viết tắt GIS, tuy nhiên các
cách diễn giải đó đều mô tả việc nghiên cứu các thông tin địa lý và các khía
cạnh khác liên quan.
GIS cũng giống như các hệ thống thông tin khác là có khả năng nhập,
tìm kiếm và quản lý các dữ liệu lưu trữ, để từ đó đưa ra các thông tin cần thiết
cho người sử dụng. Ngoài ra, GIS còn cho phép lập bản đồ với sự trợ giúp của
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
4
máy tính, giúp cho việc biểu diễn dữ liệu bản đồ tốt hơn so với cách truyền
thống. Theo Khoa Địa lý, Trường Đại học Texas thì GIS là cơ sở dữ liệu số
chuyên dụng trong đó hệ trục tọa độ không gian là phương tiện tham chiếu
chính. GIS bao gồm các công cụ để thực hiện những công việc sau:
Nhập dữ liệu từ bản đồ giấy, ảnh vệ tinh, ảnh máy bay, số liệu
điều tra và các nguồn khác.
Lưu trữ dữ liệu, khai thác, truy vấn cơ sở dữ liệu.
Biến đổi dữ liệu, phân tích, mô hình hóa, bao gồm cả dữ liệu
thống kê và dữ liệu không gian.
Lập báo cáo, bao gồm bản đồ chuyên đề, bảng biểu, biểu đồ và kế hoạch.
Từ định nghĩa trên, ta thấy: Thứ nhất, GIS có quan hệ với ứng dụng cơ
sở dữ liệu. Thông tin trong GIS đều liên kết với tham chiếu không gian và
GIS sử dụng tham chiếu không gian như phương tiện chính để lưu trữ và truy
nhập thông tin. Thứ hai, GIS là công nghệ tích hợp, cung cấp các khả năng
phân tích như phân tích ảnh máy bay, ảnh vệ tinh hay tạo lập mô hình thống
kê, vẽ bản đồ... Cuối cùng, GIS có thể được xem như một hệ thống cho phép
trợ giúp quyết định. Cách thức nhập, lưu trữ, phân tích dữ liệu trong GIS phải
phản ánh đúng cách thức thông tin sẽ được sử dụng trong công việc lập quyết
định hay nghiên cứu cụ thể.
Theo David Cowen, NCGIA, Mỹ thì GIS là hệ thống phần cứng, phần
mềm và các thủ tục được thiết kế để thu thập, quản lý, xử lý, phân tích, mô
hình hóa và hiển thị các dữ liệu qui chiếu không gian để giải quyết các vấn đề
quản lý và lập kế hoạch phức tạp.
Một cách đơn giản, có thể hiểu GIS như một sự kết hợp giữa bản đồ
(map) và cơ sở dữ liệu (database).
GIS = Bản đồ + Cơ sở dữ liệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
5
Bản đồ trong GIS là một công cụ hữu ích cho phép chỉ ra vị trí của từng
địa điểm. Với sự kết hợp giữa bản đồ và cơ sở dữ liệu, người dùng có thể xem
thông tin chi tiết về từng đối tượng/thành phần tương ứng với địa điểm trên
bản đồ thông qua các dữ liệu đã được lưu trữ trong cơ sở dữ liệu. Ví dụ, khi
xem bản đồ về các thành phố, người dùng có thể chọn một thành phố để xem
thông tin về thành phố đó như diện tích, số dân, thu nhập bình quân, số
quận/huyện của thành phố, …
Độ phức tạp của thế giới thực là không gian hữu hạn. Càng quan sát thế
giới gần hơn càng thấy được chi tiết hơn. Con người mong mỏi lưu trữ, quản
lý đầy đủ các dữ liệu về thế giới thực. Nhưng sẽ dẫn đến phải có cơ sở dữ liệu
lớn vô hạn để lưu trữ mọi thông tin chính xác về chúng. Do vậy, để lưu trữ
được dữ liệu không gian của thế giới thực vào máy tính thì phải giảm số
lượng dữ liệu đến mức có thể quản lý được bằng tiến trình đơn giản hoá hay
trừu tượng hoá (Hình 1.1). Trừu tượng là đơn giản hoá một cách thông minh.
Trừu tượng cho ta tổng quát hoá và “ý tưởng” hoá vấn đề đang xem xét.
Chúng loại bỏ đi các chi tiết dư thừa mà chỉ tập trung vào các điểm chính, cơ
bản. Các đặc trưng địa lý phải được biểu diễn bởi các thành phần rời rạc hay
các đối tượng để lưu vào CSDL máy tính.
Hình 1.1 Hệ thống thông tin địa lý
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
6
GIS lưu trữ thông tin thế giới thực thành các tầng (layer) bản đồ chuyên
đề mà chúng có khả năng liên kết địa lý với nhau. Giả sử ta có vùng quan sát
như trên Hình 1.2.
Hình 1.2 Tầng (layer) bản đồ
Mỗi nhóm người sử dụng sẽ quan tâm đến một hay là vài loại thông tin.
Thí dụ, Sở giao thông công chính sẽ quan tâm nhiều đến hệ thống đường phố.
Sở nhà đất quan tâm nhiều đến các khu dân cư và công sở. Sở thương mại
quan tâm nhiều đến phân bổ khách hàng trong vùng. Tư tưởng tách bản đồ
thành tầng tuy đơn giản nhưng khá mềm dẻo và hiệu quả, chúng có khả năng
giải quyết rất nhiều vấn đề về thế giới thực, từ theo dõi điều hành xe cộ giao
thông, đến các ứng dụng lập kế hoạch và mô hình hoá lưu thông. Ta có thể sử
dụng tiến trình tự động, gọi là mã hoá địa lý (geocoding) để liên kết dữ liệu
bên ngoài với dữ liệu bản đồ. Thí dụ sử dụng mã hoá địa lý để ánh xạ thông
tin bán hàng bằng mã bưu điện (ZIP) hay chỉ ra địa chỉ khách hàng trên bản
đồ bằng các điểm.
1.1.2. Biểu diễn dữ liệu địa lý
1.1.2.1. Các thành phần của dữ liệu địa lý
Trong GIS, dữ liệu được chia làm hai loại: thành phần không gian và
thành phần phi không gian (thuộc tính). Hai loại thành phần dữ liệu này được
kết hợp thông qua một chỉ số chung để mô tả một đối tượng thực. Sự kết hợp
này thể hiện đặc trưng không gian của đối tượng, nó cho phép:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
7
Mô tả “vị trí, hình dạng”: vị trí tham chiếu, đơn vị đo, dạng hình
học của thực thể địa lý.
Mô tả “quan hệ và tương tác” giữa các thực thể địa lý: những
thửa đất nào liền kề với khu công nghiệp ?
Mô tả “thông tin” của các đối tượng địa lý: ai là chủ sở hữu của
thửa đất này?
a. Thành phần không gian
Thành phần dữ liệu không gian hay còn gọi là dữ liệu bản đồ, là dữ liệu
về đối tượng mà vị trí của nó được xác định trên bề mặt trái đất. Dữ liệu
không gian sử dụng trong hệ thống địa lý luôn được xây dựng trên một hệ
thống tọa độ, bao gồm tọa độ, quy luật và các ký hiệu dùng để xác định một
hình ảnh bản đồ cụ thể trên mỗi bản đồ.
Hệ thống GIS dùng thành phần dữ liệu không gian để tạo ra bản đồ hay
hình ảnh bản đồ trên màn hình hoặc trên giấy thông qua thiết bị ngoại vi. Mỗi
hệ thống GIS có thể dùng các mô hình khác nhau để mô hình hóa thế giới
thực sao cho giảm thiểu sự phức tạp của không gian nhưng không mất đi các
dữ liệu cần thiết để mô tả chính xác các đối tượng trong không gian. Hệ thống
GIS hai chiều 2D dùng ba kiểu dữ liệu cơ sở sau để mô tả hay thể hiện các đối
tượng trên bản đồ vector, đó là:
Ðiểm (Point)
Điểm được xác định bởi cặp giá trị tọa độ (x, y). Các đối tượng đơn với
thông tin về địa lý chỉ bao gồm vị trí thường được mô tả bằng đối tượng điểm.
Các đối tượng biểu diễn bằng kiểu điểm thường mang đặc tính chỉ có
tọa độ đơn (x, y) và không cần thể hiện chiều dài và diện tích. Ví dụ, trên bản
đồ, các vị trí của bệnh viện, các trạm rút tiền tự động ATM, các cây xăng,…
có thể được biểu diễn bởi các điểm.
Hình 1.3 là ví dụ về vị trí nước bị ô nhiễm. Mỗi vị trí được biểu diễn
bởi 1 điểm gồm cặp tọa độ (x, y) và tương ứng với mỗi vị trí đó có thuộc tính
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
8
độ sâu và tổng số nước bị nhiễm bẩn. Các vị trí này được biểu diễn trên bản
đồ và lưu trữ trong các bảng dữ liệu.
Hình 1.3 Ví dụ biểu diễn vị trí nước bị ô nhiễm
Ðƣờng – Cung (Line - Arc)
Đường được xác định bởi dãy các điểm hoặc bởi 2 điểm đầu và điểm
cuối (Hình 1.4). Đường dùng để mô tả các đối tượng địa lý dạng tuyến như
đường giao thông, sông ngòi, tuyến cấp điện, cấp nước…
Hình 1.4 Ví dụ biểu diễn đường
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
9
Các đối tượng được biểu diễn bằng kiểu đường thường mang đặc điểm
là có dãy các cặp tọa độ, các đường bắt đầu và kết thúc hoặc cắt nhau bởi
điểm, độ dài đường bằng chính khoảng cách của các điểm. Ví dụ, bản đồ hệ
thống đường bộ, sông, đường biên giới hành chính, … thường được biểu diễn
bởi đường và trên đường có các điểm (vertex) để xác định vị trí và hình dáng
của đường đó.
Vùng (Polygon)
Vùng được xác định bởi ranh giới các đường, có điểm đầu trùng với
điểm cuối. Các đối tượng địa lý có diện tích và được bao quanh bởi đường
thường được biểu diễn bởi vùng.
Các đối tượng biểu diễn bởi vùng có đặc điểm là được mô tả bằng tập
các đường bao quanh vùng và điểm nhãn (label point) thuộc vùng để mô tả,
xác định cho mỗi vùng. Ví dụ, các khu vực hành chính, hình dạng các công
viên, … được mô tả bởi kiểu dữ liệu vùng. Hình 1.5 mô tả ví dụ cách lưu trữ
một đối tượng vùng.
Hình 1.5 Ví dụ biểu diễn khu vực hành chính
Một đối tượng có thể biểu diễn bởi các kiểu khác nhau tùy thuộc vào tỷ
lệ của bản đồ đó. Ví dụ, đối tượng công viên có thể được biểu diễn bởi điểm
trong bản đồ có tỷ lệ nhỏ, và bởi vùng trong bản đồ có tỷ lệ lớn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
10
b. Thành phần phi không gian
Thành phần dữ liệu phi không gian hay còn gọi là dữ liệu thuộc tính, là
những diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị
trí địa lý của chúng thông qua một cơ chế thống nhất. Hệ thống GIS có cơ chế
liên kết dữ liệu không gian và phi không gian của cùng một đối tượng với nhau.
Có thể nói, một trong những chức năng đặc biệt của công nghệ GIS chính là khả
năng liên kết và xử lý đồng thời dữ liệu bản đồ và dữ liệu thuộc tính.
Dữ liệu thuộc tính trong hệ thống GIS bất kỳ thường phân thành 4 loại sau:
Bộ xác định: có thể là một số duy nhất, liên tục, ngẫu nhiên hoặc chỉ
báo địa lý, số liệu xác định vị trí lưu trữ chung. Bộ xác định cho một thực thể
chứa tọa độ phân bố của nó, số hiệu mảnh bản đồ, mô tả khu vực hay con trỏ
đến vị trí lưu trữ của số liệu liên quan. Bộ xác định thường lưu trữ với các bản
ghi tọa độ hay mô tả khác của hình ảnh không gian và các bản ghi số liệu
thuộc tính liên quan.
Số liệu hiện tượng, tham khảo địa lý: miêu tả thông tin danh mục, các
hoạt động liên quan đến các vị trí địa lý xác định (ví dụ như: cho phép xây
dựng, báo cáo tai nạn, nghiên cứu y tế,…) Thông tin này được lưu trữ và quản
lý trong các tệp/ bảng độc lập, trong đó mỗi bản ghi chứa yếu tố xác định vị
trí của sự kiện hay hiện tượng quản lý.
Chỉ số địa lý: bao gồm tên, địa chỉ, khối, phương hướng định vị, …
liên quan đến các đối tượng địa lý. Một chỉ số có thể bao gồm nhiều bộ xác
định cho thực thể địa lý. Ví dụ: chỉ số địa lý về đường phố và địa chỉ địa lý
liên quan đến phố đó.
Quan hệ giữa các đối tượng tại một vị trí địa lý cụ thể trong không
gian. Đây là thông tin quan trọng cho các chức năng xử lý của hệ thống thông
tin địa lý. Các mối quan hệ không gian có thể là mối quan hệ đơn giản hay
lôgic, ví dụ tiếp theo số nhà 101 phải là số nhà 103.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
11
1.1.2.2. Mô hình biểu diễn dữ liệu không gian
Như đã đề cập ở trên, dữ liệu địa lý bao gồm thành phần dữ liệu không
gian và thành phần dữ liệu thuộc tính. Ở phần này, chúng ta sẽ xem xét cách
thức biểu diễn thành phần dữ liệu không gian trong hệ thông tin địa lý.
Hệ thông tin địa lý biểu diễn các thực thể địa lý trong tự nhiên bằng dữ
liệu của nó, hệ thống GIS chứa càng nhiều dữ liệu thì khả năng mang lại
thông tin càng lớn. Dữ liệu của GIS có được thông qua việc mô hình hóa các
thực thể địa lý. Mô hình biểu diễn dữ liệu địa lý là cách thức chúng ta biểu
diễn trừu tượng các thực thể địa lý. Mô hình biểu diễn dữ liệu địa lý đóng vai
trò quan trọng vì cách thức biểu diễn thông tin sẽ ảnh hưởng tới khả năng
thực hiện phân tích dữ liệu và khả năng hiển thị đồ họa của một hệ thống
thông tin địa lý.
Hai nhóm mô hình dữ liệu không gian thường gặp trong các hệ GIS
thương mại là mô hình dữ liệu vector và mô hình dữ liệu raster.
Mô hình vector
Mô hình vector sử dụng tọa độ 2 chiều (x, y) để lưu trữ hình khối của
các thực thể không gian trên bản đồ 2D. Mô hình này sử dụng các đặc tính rời
rạc như điểm, đường, vùng để mô tả không gian, đồng thời cấu trúc topo của
các đối tượng cũng cần được mô tả chính xác và lưu trữ trong hệ thống.
Hình 1.6 Biểu diễn vector của đối tượng địa lý
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
12
Theo Hình 1.6, các đối tượng không gian được lưu trữ dưới dạng
vertor, đồng thời các thuộc tính liên quan đến lĩnh vực cần quản lý (dữ liệu
chuyên đề - thematic data) của đối tượng đó cũng cần kết hợp với dữ liệu
trên. Các nhân tố chỉ ra sự tác động qua lại lẫn nhau giữa các đối tượng cũng
được quản lý, các nhân tố đó có thể là quan hệ topo (giao/ không giao nhau,
phủ, tiếp xúc, bằng nhau, chứa, …), khoảng cách và hướng (láng giềng về
hướng nào).
Mô hình raster
Mô hình raster hay còn gọi mô hình dạng ảnh (image) biểu diễn các đặc
tính dữ liệu bởi ma trận các ô (cell) trong không gian liên tục (Hình 1.7). Mỗi
ô có chỉ số tọa độ (coordinate) và các thuộc tính liên quan. Mỗi vùng được
chia thành các hàng và cột, mỗi ô có thể là hình vuông hoặc hình chữ nhật và
chỉ có duy nhất một giá trị.
Hình 1.7 Biểu diễn thế giới bằng mô hình raster
Trên thực tế, chọn kiểu mô hình nào để biểu diễn bản đồ là câu hỏi luôn
đặt ra với người sử dụng. Việc lưu trữ kiểu đối tượng nào sẽ quyết định mô
hình sử dụng. Ví dụ nếu lưu vị trí của các khách hàng, các trạm rút tiền hoặc
dữ liệu cần tổng hợp theo từng vùng như vùng theo mã bưu điện, các hồ chứa
nước,… thì sử dụng mô hình vector. Nếu đối tượng quản lý được phân loại
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
- Xem thêm -