Đăng ký Đăng nhập
Trang chủ Giáo dục - Đào tạo Cao đẳng - Đại học đề cương hệ thống thông tin địa lý...

Tài liệu đề cương hệ thống thông tin địa lý

.DOCX
14
2152
56

Mô tả:

ĐỀ CƯƠNG HỆ THỐNG THÔNG TIN ĐỊA LÝ Câu 1: Trình bày khái niệm và thành phần của GIS 1. Khái niệm GIS là một hệ thống thông tin có khả năng xây dựng, cập nhật, lưu trữ, truy vấn, xử lý, phân tích và xuất ra các dữ liệu có liên quan tới vị trí địa lý, nhằm hỗ trợ ra quyết định trong các công tác quy hoạch và quản lý tài nguyên thiên nhiên và môi trường. 2. Các thành phần cơ bản của GIS Công nghệ GIS bao gồm 5 hợp phần cơ bản là:  Phần cứng (hardware)  Phần mềm (software)  Dữ liệu địa lý (Geographic data)  Con người (Expertise) Chính sách và cách thức quản lý (Policy and management) a. Phần cứng Thiết bị bao gồm máy vi tính (computer), máy vẽ (plotters), máy in (printer), bàn số hoá (digitizer), thiết bị quét ảnh (scanners), các phương tiện lưu trữ số liệu (Floppy diskettes, optical cartridges, C.D ROM v.v...) b. Phần mềm Là tập hợp các câu lệnh, chỉ thị nhằm điều khiển phần cứng của máy tính thực hiện một nhiệm vụ xác định, phần mềm hệ thống thông tin địa lý có thể là một hoặc tổ hợp các phần mềm máy tính. Phần mềm được sử dụng trong kỹ thuật GIS phải bao gồm các tính năng cơ bản sau: - Nhập và kiểm tra dữ liệu (Data input) - Lưu trữ và quản lý cơ sở dữ liệu (Geographic database) - Xuất dữ liệu (Display and reporting) - Biến đổi dữ liệu (Data transformation) - Tương tác với người dùng (Query input) c. Chuyên viên Đây là một trong những hợp phần quan trọng của công nghệ GIS, đòi hỏi những chuyên viên hướng dẫn sử dụng hệ thống để thực hiện các chức năng phân tích và xử 1 lý các số liệu. Đòi hỏi phải thông thạo về việc lựa chọn các công cụ GIS để sử dụng, có kiến thức về các số liệu đang được sử dụng và thông hiểu các tiến trình đang và sẽ thực hiện trên hệ thồng GIS. d. Số liệu, dữ liệu địa lý (Geographic data) Số liệu được sử dụng trong GIS không chỉ là số liệu địa lý (georeferenced data) riêng lẻ mà còn phải được thiết kế trong một cơ sở dữ liệu (database). Những thông tin địa lý có nghĩa là sẽ bao gồm các dữ kiện về: vị trí địa lý, thuộc tính (attributes) của thông tin, mối liên hệ không gian (spatial relationships) của các thông tin và thời gian. Có 2 dạng số liệu được sử dụng trong kỹ thuật GIS là: Cơ sở dữ liệu không gian và cơ sở dữ liệu thuộc tính. e. Chính sách và quản lý (Policy and management) Ðây là hợp phần rất quan trọng để đảm bảo khả năng hoạt động của hệ thống, là yếu tố quyết định sự thành công của việc phát triển công nghệ GIS. Hệ thống GIS cần được điều hành bởi một bộ phận quản lý, bộ phận này phải được bổ nhiệm để tổ chức hoạt động hệ thống GIS một cách có hiệu quả để phục vụ người sử dụng thông tin. Câu 2: Trình bày cách phân loại đối tượng địa lý tự nhiên. 1. Phân loại theo đặc điểm hình học Theo đặc điểm hình học, các đối tượng địa lý được chia thành đối tượng dạng điểm, đường và vùng - Đối tượng dạng điểm là tập hợp các đối tượng có kích thước nhỏ, khó mô tả thành các đối tượng đường hay vùng. Mỗi điểm được lưu bởi một cặp toạ độ x,y để xác định vị trí của đối tượng. - Đối tượng dạng đường là những đối tượng có kích thước hẹp và dạng tuyến khó thể hiện khó thể hiện ở dạng vùng để tính diện tích. Mỗi đối tượng dạng đường được lưu tối thiểu hai cặp toạ độ x,y hay chuỗi các cặp toạ độ x,y. Các đoạn đường thường được mô tả rõ ràng thông qua các thuộc tính của chúng. Các đoạn đường có đặc điểm hình học khác nhau như đoạn thẳng hay cung - Đối tượng dạng vùng gồm các đối tượng gồm tập hợp các đối tượng địa lý đặc trưng cho một vùng nhất định như thửa đất, kiểu sử dụng đất, đơn vị nô tả tính chất lý hoá, sinh học đất, đơn vị hành chính. Cụ thể mỗi vùng được định nghĩa bởi một đường biên khép kín gồm tạp các toạ độ x,y theo một tuần tự nhất định, điểm đầu và điểm cuối trùng nhau 2 2. Phân loại theo quan điểm toán học Theo quan điểm toán học các đối tượng địa lý được chia thành đối tượng rời rạc và liên tục - Đối tượng rời rạc là đối tượng địa lý được coi như một tập hợp gồm các phần tử riêng rẽ và ta có thể phân biệt được từng phần rõ ràng. Nhiều đối tượng tự nhiên được phân vào nhóm này như nhà ở, thửa đất, đơn vị hành chính, đường, sông ngòi, kiểu sử dụng đất, loại đá - Đối tượng liên tục là những đối tượng và hiện tượng địa lý có sự biến động theo không gian và các phần tử của tập hợp đó phân biệt rõ ràng. Nhiệt độ, không khí và các tính chất vật lý và hoá học của đất, địa hình là một số đối tượng tiêu biểu thuộc nhóm đối tượng liên tục Câu 3: Nêu khái niệm và đặc điểm, ưu nhược điểm của cấu trúc dữ liệu vector. 1. Ưu điểm: - Lưu giữ vị trí chính xác của các điểm và đối tượng trên bề mặt Trái đất theo một hệ quy chiếu nhất định - Dữ liệu lưu tốn ít bộ nhớ hơn dữ liệu Raster - Dữ liệu có thể tạo ra từ độ phân giải gốc, không có sự khái quát hoá dữ liệu - Độ chính xác của dữ liệu gốc được duy trì - Cho phép tạo Topo các đối tượng, thực hiện phân tích mạng rất tiện ích - Chuyển đổi hệ toạ độ được thực hiện dễ dàng 2. Nhược điểm: - Mô hình dữ liệu vector tỏ ra hạn chế trong phân tích dữ liệu không gian - Cấu trúc dữ liệu phức tạp - Thực hiện các phép toán chồng ghép là rất khó khăn - Vị trí mỗi điểm phải lưu trữ một cách chính xác - Cho phân tích không gian, dữ liệu vector phải được chuyển sang mô hình Topology. Quá trình sửa lỗi để tạo Topology khá tốn kém thời gian. Hơn nữa, dữ liệu Topology phải thường xuyên tạo lại vì các dữ liệu điểm, đường và đa giác thường xuyên thay đổi. - Các thuật toán áp dụng cho phân tích không gian rất phức tạp - Các dữ liệu liên tục như dữ liệu độ cao, độ dốc không được hiển thị hiệu quả đối với mô hình dữ liệu Vector 3 - Phân tích không gian và làm trơn dữ liệu không thể thực hiện được trong ranh giới của vùng (polygon). Câu 4: Nêu khái niệm và đặc điểm của mô hình số độ cao. 1. Khái niệm Mô hình số độ cao (Digital Elevation Model - DEM) là sự biểu diễn bằng số của bề mặt địa hình hoặc khoảng chênh cao của mặt đất so với một bề mặt mốc trắc địa nào đó (bề mặt Geoid) trong không gian ba chiều. Mô hình số độ cao có thể hiển thị theo mô hình dữ liệu dạng Vector gọi là TIN (Triangulated Irregular Network) hay theo mô hình dữ liệu Raster có tên gọi là DEM (Digital Elevation Model). 2. Đặc điểm Về bản chất, DEM là mô hình số, khái quát và mô tả bề mặt địa hình trong không gian 3 chiều theo các giá trị tọa độ x, y và độ cao h, theo đó tại một vị trí bất kỳ trong mô hình đó, độ cao tại vị trí đó có thế nội suy được. Mô hình số độ cao dạng Vector: TIN - Triangulated Irregular Network + TIN là một mô hình dữ liệu Vector dạng Topology được xây dựng dựa trên tập tam giác, tập các điểm nút (nodes) và cạnh (edges). Các nodes kết nối với nhau để tạo thành các cạnh và mạng lưới các tam giác xếp liền nhau. + Là tập các đỉnh được nối với nhau thành các tam giác. Các tam giác này hình thành bề mặt 3 chiều (x,y,z) + Mỗi một tam giác được giới hạn bởi 3 điểm đồng nhất về giá trị X,Y và Z (độ cao) + TIN biểu diễn bề mặt liên tục từ những tập hợp điểm phân bố rời rạc bất kỳ. Mô hình số độ cao dạng Raster: DEM - Digital Elevation Model + Mô hình Raster DEM (GRID) là một ma trận các ô vuông và chia thành các hàng và cột. + Mỗi một ô (pixel) chứa giá trị độ cao của điểm trung tâm của ô Câu 5: Nêu khái niệm và đặc điểm, ưu nhược điểm của cấu trúc dữ liệu raster. 1. Khái niệm Cấu trúc dữ liệu Raster là ma trận ô vuông. Mỗi ô vuông gọi là một pixel và đại diện cho một điểm trên thực địa. Nếu một vùng lãnh thổ nào đó được chia thành ma trận 4 ô vuông, mỗi ô vuông có tọa độ riêng, tập các ô vuông trong vùng lãnh thổ chính là thực thể dữ liệu. Nếu các điểm coi như nằm ở tâm của mỗi ô vuông, ta thành lập được một bảng dữ liệu gồm tọa độ địa lý của các điểm trong vùng nhất định. Một ma trận ô vuông cho một vùng lãnh thổ gọi là mô hình dữ liệu Raster. 2. Đặc điểm: - Không gian được chia thành các ô, là ma trận số gồm hàng và cột - Vị trí của các đối tượng xác định bằng vị trí hàng và cột - Ô hay pixel là đơn vị cơ sở trong mô hình dữ liệu raster - Pixel đồng nhất ở bên trong được sắp xếp thành một lưới biểu diễn một đối tượng xác định trên Trái đất. - Mỗi pixel chứa một số nguyên (hoặc số thực) biểu diễn kiểu hay giá trị thuộc tính xuất hiện trên bản đồ - Độ phân giải không gian được quyết định bởi kích thước ô 3. Ưu, điểm a. Nhược điểm So với mô hình dữ liệu Vector, mô hình Raster có một số ưu điểm. Một trong những ưu điểm nổi trội là cấu trúc dữ liệu phù hợp cho thực hiện các phép tính đại số bản đồ và nhiều thuật toán phức tạp khác. Một số ưu điểm chính của dữ liệu Raster đã được khái quát hóa bao gồm: - Cấu trúc dữ liệu đơn giản, thành phần cơ bản của bản đồ chỉ gồm Pixel. - Vị trí của mỗi điểm được lưu đơn giản bằng tọa độ hàng và cột của ma trận số. - Phân tích không gian được thực hiện dễ dàng và thuận tiện. - Dữ liệu Raster thích hợp cho mô hình hóa và tính toán định lượng. - Các dữ liệu rời rạc (discrete data) và dữ liệu như độ cao có thể kết hợp dễ dàng - Dữ liệu raster thích hợp váo các thiết bị đầu ra như máy in (electrostatic plotters) và hiển thị dữ liệu đồ hoạ (graphic terminals) - Nhiều dữ liệu số như ảnh vệ tinh, ảnh máy bay sẵn có và đa dạng, có khả năng cập nhật nhanh dữ liệu số này b. Nhược điểm Cũng giống như dữ liệu vector, dữ liệu raster cũng tồn tại những mặt hạn chế. Một số mặt hạn chế đã được ghi nhận bao gồm: - Độ phân giải của pixel hạn chế khả năng mô tả chi tiết đối tượng. 5 - Rất khó hiển thị các đối tượng hình tuyến chính xác như đường giao thông, thuỷ văn - Xử lý dữ liệu thuộc tính là khó khăn trong trường hợp cơ sở dữ liệu lớn. Mỗi bản đồ raster chỉ tương ứng với một thuộc tính nhất định. - Hầu hết các bản đồ chỉ tồn tại ở dạng vector, để sử dụng dữ liệu raster cần thực hiện chuyển đổi dữ liệu sang dạng raster - Các bản đồ raster thường có màu sắc kém hấp dẫn và kém đẹp hơn dữ liệu vector - Chuyển đổi hệ toạ độ thực hiện khó khăn hơn dữ liệu vector Câu 6: Phân biệt đối tượng địa lý với hiện tượng địa lý. Nêu các thông tin của đối tượng địa lý, hiện tượng địa lý có thể thể hiện trong GIS? Cho ví dụ. 1. Phân biệt đối tượng địa lý với hiện tượng địa lý Đối tượng địa lý là những thực thể tự nhiên như sông ngòi, thửa đất hay thực thể nhân tạo như các công trình hạ tầng kinh tế xã hội trên bề mặt trái đất. Còn hiện tượng địa lý là những khái niệm trừu tượng và phân biệt với đối tượng địa lý vì chúng thường không tồn tại ở một hình thái hay hình dạng nhất định và thường biến đổi theo thời gian. 2. Các thông tin của đối tượng, hiện tượng địa lý a. Thông tin của đối tượng địa lý Khi một đối tượng địa lý không được hiển thị ở mọi vị trí trong khu vực nghiên cứu, chúng được hiển thị một cách rải rác, thưa thớt, và được coi như là một tập hợp các đối tượng địa lý. Các đối tượng như vậy cần được xác định các thông tin: - Vị trí - Hình dạng - Kích thước - Hướng b. Thông tin của hiện tượng địa lý Định nghĩa một hiện tượng địa lý trong hệ GIS cần phải quan tâm đến những thông tin sau: - Hiện tượng đó được đặt tên hoặc mô tả như thế nào. - Hiện tượng được tham chiếu địa lý. - Xác định thời gian hiện tượng tồn tại Câu 7: Khái niệm cơ sở dữ liệu. Khái niệm cơ sở dữ liệu không gian. Khái niệm cơ sở dữ liệu phi không gian. 6 1. Khái niệm cơ sở dữ liệu (Database) Là tập hợp các thông tin được thu thập theo mục đích sử dụng nào đó, được lưu trữ trong máy tính theo những quy tắc nhất định. Đó là tập hợp dữ liệu mà có the điều khiến và lưu trữ một số lượng lớn dữ liệu và dữ liệu có thế chia sẻ giữa các ứng dụng khác nhau. 2. Khái niệm cơ sở dữ liệu không gian Cơ sở dữ liệu không gian là cơ sở dữ liệu chứa đựng các thông tin về vị trí, kích thước, hình dạng, sự phân bố và mối quan hệ của các đối tượng. 3. Cơ sở dữ liệu phi không gian (thuộc tính) Cơ sở dữ liệu phi không gian (thuộc tính) là các file dữ liệu mô tả các đối tượng địa lý Câu 8: Trình bày đặc điểm của các cấu trúc Spaghetty, Topology. 1. Đặc điểm của cấu trúc dữ liệu Spaghetti Mô hình dữ liệu Spaghetti có cấu trúc đơn giản, mỗi đối tượng địa lý được lưu trữ độc lập, vì vậy, một cặp toạ độ có thể xuất hiện hai hay nhiều lần để lưu hai hay nhiều đối tượng liền kề nhau. Không thể hiện mối quan hệ giữa các đối tượng. Phần tử cơ bản của cấu trúc dữ liệu spaghetti là điểm, đường, vùng. Mỗi nhóm đối tượng điểm, đường, vùng và đa giác được lưu thành các tệp riêng biệt. 2. Đặc điểm của cấu trúc dữ liệu Topology Mô hình dữ liệu Topology được gọi là cấu trúc cung – nút. Cấu trúc này được xây dựng trên mô hình cung – nút trong đó cung là phần tử cơ bản. Thể hiện mối quan hệ không gian của các đối tượng. Trong cấu trúc dữ liệu Topology một điểm chỉ được lưu trữ 1 lần. Các phần từ không gian trong cấu trúc Topology được xác định dựa trên các đặc điểm sau: + Mỗi cung được xác định bởi 2 nút + Các phần tử ở giữa 2 nút là các điểm điều khiển (vertex), các điểm này xác định hình dạng của cung. + Các cung giao nhau tại các nút, điểm bắt đầu và điểm kết thúc của một cung 7 phải là nút. + Vùng là tập hợp các cung khép kín, trong trường hợp vùng trong vùng thì phải có sự phân biệt giữa cung bên trong và cung bên ngoài Câu 9: Khái niệm mô hình số độ cao? Trình bày các ứng dụng của mô hình số độ cao. 1. Khái niệm mô hình số độ cao Mô hình số độ cao (Digital Elevation Model - DEM) là sự biểu diễn bằng số của bề mặt địa hình hoặc khoảng chênh cao của mặt đất so với một bề mặt mốc trắc địa nào đó (bề mặt Geoid) trong không gian ba chiều. Mô hình số độ cao có thể hiển thị theo mô hình dữ liệu dạng Vector gọi là TIN (Triangulated Irregular Network) hay theo mô hình dữ liệu Raster có tên gọi là DEM (Digital Elevation Model). 2. Ứng dụng của mô hình số độ cao DEM có thể được sử dụng trong nhiều lĩnh vực khác nhau, như: - Lưu trữ dữ liệu độ cao trong cơ sở dữ liệu không gian quốc gia - Nắn ảnh trực giao trong công nghệ xử lý ảnh số - Nội suy các đường bình độ, hay các đường đẳng trị - Tạo các bản đồ chuyên đề từ DEM, như: bieu đồ khối, mặt cắt địa hình, bản đồ độ dốc, độ lồi, độ lõm và hướng địa hình, bản đồ địa hình nổi, mạng lưới thủy văn. Các bản đồ này trợ giúp tốt cho nghiên cứu địa mạo, tính toán độ sói lở, xâm thực, ... Do đó, hỗ trợ nghiên cứu dự báo trượt lở đất, dự báo xói mòn, lũ lụt. - Mô phỏng địa hình, phục vụ cho các mục đích quân sự (hệ thống dẫn đường, tính toán tầm nhìn, tầm bắn, vùng quét của radar, địa hình ảo tập lái máy bay, tập lái xe tăng, .), các mục đích dân sự (quy hoạch và thiết kế cảnh quan, hệ thống thoát nước cho đô thị, .) - DEM được sử dụng như một phương tiện, phục vụ cho các công tác khảo sát, thiết kế, tính toán khối lượng đào đắp trong thiết kế các công trình, thiết kế đường xá, quy hoạch thủy lợi, quy hoạch các khu công nghiệp - Sử dụng DEM đế mô hình hóa các đối tượng không gian trong các ngành khoa học về trái đất, như: trong địa chất, địa chất thủy văn, trong khai thác mỏ, trong nghiên cứu đại dương - DEM có thế được ứng dụng rộng rãi trong các ngành du lịch, quy hoạch, kiến 8 trúc, thủy điện, thủy lợi, nông nghiệp, công nghệ giải trí, ... Câu 10: Trình bày khái niệm phân tích dữ liệu. Trình bày phân loại các phép phân tích dữ liệu trong GIS theo số lớp sử dụng trong phân tích dữ liệu. 1. Phân tích dữ liệu Phân tích dữ liệu trong GIS là việc sử dụng các phương pháp để phân tích dữ liệu địa lý nhằm nghiên cứu và tìm ra những quy luật phân bố không gian, cung cấp thông tin hữu ích đáp ứng nhu cầu thông tin của người sử dụng. 2. Phân loại các phép phân tích dữ liệu trong GIS theo số lớp sử dụng trong phân tích dữ liệu - Nhóm các phép phân tích dữ liệu dựa trên một lớp dữ liệu: Là các phép phân tích nhằm phân tích mối liên quan giữa các đối tượng trong một lớp dữ liệu bản đồ. Các dạng phân tích với một lớp dữ liệu bao gồm đo lường , phân loại, truy vấn ; phân tích lân cận; phân tích mạng. - Nhóm các phép phân tích dữ liệu dựa trên hai lớp dữ liệu: được thực hiện thông qua chồng xếp (map overlay) hai lớp dữ liệu bản đồ. Hai lớp dữ liệu được chồng xếp trên cơ sở các phép tính số học và đại số để tạo ra lớp dữ liệu mới. Phân tích chồng xếp được thực hiện phổ biến với dữ liệu Raster. Tuy nhiên, dữ liệu Vector cũng có thể thực hiện chức năng chồng ghép. Nguyên lý chung của chồng ghép là kết hợp các đối tượng ở cùng một vị trí. - Nhóm các phép phân tích dữ liệu dựa trên nhiều lớp dữ liệu: là dạng phân tích nâng cao và phức tạp nhất. Các phân tích nâng cao này thường dựa trên các mô hình tính toán phức tạp; các công thức tính toán khác nhau để kết hợp dữ liệu đầu vào và tạo ra lớp thông tin mới. Các phép toán đại số bản đồ (map algabra), công thức tính toán (spatial models), phép tính logic và các loại thuật toán khác có thể sử dụng để thực hiện sự kết hợp. - Các phương pháp xử lý dữ liệu chung: bao gồm chuyển đổi hệ quy chiếu và chuyển đổi dữ liệu như chuyển dữ liệu từ dạng cấu trúc Vector sang cấu trúc Raster Câu 11: Trình bày phân tích dữ liệu thuộc tính: Truy vấn dữ liệu trên bảng dữ liệu. Tính toán trên trường dữ liệu thuộc tính, tạo bản đồ từ các trường thuộc tính. 1. Truy vấn dữ liệu trên bảng dữ liệu Truy vấn đơn giản nhất là tìm một số bản ghi (hàng) và hiển thị từ bảng dữ liệu thuộc tính hay chọn một số bản ghi từ bảng dữ liệu. Trên cơ sở dữ liệu được xây dựng, 9 những câu hỏi liên quan đến dữ liệu thường được thực hiện thông qua quá trình truy vấn cơ sở dữ liệu. Quá trình truy vấn hay tìm kiếm này cho ra kết quả dưới dạng các bảng hay biểu đồ. Để thực hiện việc truy vấn (database query), ta cần thành lập các biểu thức logic biểu thị các điều kiện theo cấu trúc các câu lệnh chuẩn của ngôn ngữ truy vấn có cấu trúc SQL (Structured Query Language). Cơ sở dữ liệu trong các phần mềm GIS đều hoạt động dựa trên các nguyên lý chung của mô hình dữ liệu quan hệ và ngôn ngữ truy vấn có cấu trúc SQL. Một số biểu thức logic truy vấn có thể đơn giản với chỉ một điều kiện nhưng nhiều biểu thức rất phức tạp, thường thì bao gồm rất nhiều điều kiện. 2. Tính toán trên trường dữ liệu Nhiều dạng tính toán có thể thực hiện với dữ liệu trên trường của bảng thuộc tính. Một số phép tính phổ biến là tính diện tích, chiều dài và chu vi của đối tượng. Hơn nữa, các tính toán phức tạp sử dụng các hàm toán số sơ cấp hay công thức tính toán cũng có thể thực hiện. Ví dụ, ta có bảng dữ liệu thuộc tính về các thửa đất, trong đó có trường diện tính và hạng đất. Giả sử mức thuế được tính dựa vào diện tích và hạng đất, ta có thể tính được mức thuế cho mỗi thửa đất. 3. Tạo bản đồ từ các trường thuộc tính Mỗi thuộc tính của đối tượng có thể được hiển thị như bản đồ chuyên đề. Ví dụ, bản đồ đất chứa nhiều thông tin thuộc tính như pH, độ dày tầng đất, lượng chất hữu cơ trong đất. Các thuộc tính này lưu trong bảng dữ liệu thuộc tính được kết nối với tệp bản đồ chỉ ra ranh giới từng loại đất. Các thuộc tính này có thể được gán gia trị và tạo bản đồ thuộc tính riêng. Câu 12: Nêu khái niệm và những lợi ích của chuẩn dữ liệu địa lý 1. Khái niệm Sự chuẩn hóa dữ liệu địa lý có thể hiểu là sự áp dụng bộ tiêu chuẩn và thỏa thuận chung của các cá nhân, tổ chức, hiệp hội hay thậm chí cả các quốc gia trong quá trình thu thập và xây dựng dữ liệu, phân tích dữ liệu và chia sẻ dữ liệu. 2. Lợi ích - Chuẩn hóa dữ liệu địa lý mang lại hiệu quả kinh tế rõ rệt như giảm chi phí thu thập và xử lý dữ liệu. Sự chuẩn hóa dữ liệu địa lý thúc đẩy sự trao đổi thông tin giữa các nhóm sử dụng thông tin được thuận lợi và hiệu quả. Ở khía cạnh kinh tế, nó góp phần giảm chi phí cho xây dựng cơ dữ liệu và biên tập cơ sở dữ liệu. Đặc biệt, sự chuẩn hóa dữ 10 liệu giúp cho các nhà phát triển phần mềm hệ thống GIS hình thành tiêu chuẩn chung. - Chuẩn hóa giảm thiểu được sự sai số và mất mát dữ liệu. Nếu dữ liệu xây dựng theo các định dạng và cấu trúc khác nhau. Dữ liệu chuyển đổi từ dạng này sang dạng khác sẽ gây ra hiện tượng mất dữ liệu và sai số dữ liệu so với dữ liệu gốc. - Chuẩn hóa tạo điều kiện cho chia sẻ dữ liệu cho các nhóm người sử dụng các phần mềm GIS khác nhau. - Chuẩn hóa tạo thuận lợi cho công tác đào tạo và sử dụng các hệ GIS. Ví dụ, sự phát triển các phần mềm chuẩn sẽ cho phép nhiều người có thể sử dụng cùng một phần mềm cho nhiều mục đích khác nhau, giảm cho phí phát triển phần mềm không cần thiết. - Nâng cao chất lượng quản lý dữ liệu và giảm sai số dữ liệu. Câu 13: Phép đo đạc là gì? Truy vấn lựa chọn là gì? Chồng xếp dữ liệu là gì? Phân tích lân cận là gì? 1. Phép đo đạc Phép đo đạc là chức năng đơn giản nhất trong phân tích dữ liệu địa lý với cả dữ liệu Raster và Vector. Nội dung đo đạc chủ yếu là xác định vị trí, chiều dài, diện tích. Các phép đo này được thực hiện khác nhau giữa hai loại dữ liệu Vector và Raster. Đo đạc với dữ liệu Vector: Đơn vị cơ bản của dữ liệu là điểm, đường và vùng. Vì vậy, các phép đo đạc sẽ là xác định vị trí, chiều dài, khoảng cách và diện tích của các đối tượng địa lý. Vị trí của một đối tượng địa lý được lưu dưới dạng một tọa độ x,y với đối tượng điểm, một dãy cặp tọa độ với dạng dữ liệu đường và vùng. Đo đạc với dữ liệu Raster: Các phép đo đạc trên dữ liệu Raster được thực hiện đơn giản hơn vì cấu trúc dữ liệu Raster đơn giản hơn Vector. Xác định vị trí một điểm là vị trí của pixel trong lớp dữ liệu Raster. Vị trí của pixel được xác định bằng tọa độ hàng và cột của lớp dữ liệu. Diện tích được tính bằng tổng các pixel nhân với diện tích một pixel. Diện tích của pixel được tính dựa trên độ phân giải. 2. Truy vấn lựa chọn Phép truy vấn lựa chọn là phép phân tích nhận biết các thực thể thỏa mãn một hay nhiều điều kiện hay tiêu chí nào đó. Các thuộc tính hay đặc điểm hình học của các thực thể được kiểm tra dựa vào các tiêu chí và chỉ những gì thỏa mãn các tiêu chí mới 11 được lựa chọn. Các thực thể được lựa chọn đó có thể được ghi lại lên trên một lớp dữ liệu mới hoặc dữ liệu hình học hay thuộc tính của chúng được lưu lại theo một vài cách khác nhau. Để thực hiện việc truy vấn (database query), ta cần thành lập các biểu thức biểu thị các điều kiện theo cấu trúc các câu lệnh chuẩn của ngôn ngữ truy vấn có cấu trúc SQL (Structured Query Language). Một số biểu thức truy vấn có thể đơn giản với chỉ một điều kiện nhưng nhiều biểu thức rất phức tạp, thường thì bao gồm rất nhiều điều kiện. Biểu thức truy vấn sử dụng các toán tử đại số tập hợp : nhỏ hơn (<), nhỏ hơn hoặc bằng (<=), lớn hơn (>), lớn hơn hoặc bằng (>=), bằng (=) và không bằng (<>) và các toán tử logic: OR, AND, NOT và NOR(XOR) 3. Chồng xếp dữ liệu Chồng xếp dữ liệu được thực hiện thông qua chồng xếp (map overlay) hai lớp bản đồ. Là sự gộp chung dữ liệu không gian và thuộc tính của hai hay nhiều lớp dữ liệu. Hai lớp dữ liệu được chồng xếp trên cơ sở các phép tính số học và đại số để tạo ra lớp dữ liệu mới. Phân tích chồng xếp được thực hiện phổ biến với dữ liệu Raster. Tuy nhiên, dữ liệu Vector cũng có thể thực hiện chức năng chồng ghép. Nguyên lý chung của chồng ghép là kết hợp các đối tượng ở cùng một vị trí theo chiều thẳng đứng. Các phép toán đại số bản đồ, công thức tính toán, phép tính logic và các loại thuật toán khác có thể sử dụng để thực hiện sự kết hợp. 4. Phân tích lân cận Phép phân tích lân cận là một trong số các phép phân tích dữ liệu được sử dụng phổ biến. Phép phân tích lân cận là phép phân tích tạo vùng đệm, là một vùng có kích thước nhỏ hơn hoặc bằng một khoảng cách được xác định trước từ một hay nhiều đối tượng. Vùng đệm có thể được xác định cho đối tượng điểm, đường hay vùng và cho dữ liệu vector hay raster. Vùng đệm thường là các vùng bên ngoài đối tượng với một khoảng cách giới hạn cho trước. Câu 14: Trình bày các loại sai số dữ liệu địa lý do thu thập dữ liệu. Sai số do thu thập dữ liệu Sai số dữ liệu có thể xuất hiện ở các giai đoạn khác nhau từ khâu thu thập dữ liệu, phân tích dữ liệu, lưu trữ và hiển thị dữ liệu. Sai số về dữ liệu liên quan đến nhiều 12 nguyên nhân như phương pháp khảo sát và quan trắc, chất lượng các thiết bị quan trắc, sự lựa chọn hệ quy chiếu bản đồ, sự thiên lệch của người quan trắc. Sai số do dung lượng mẫu quan trắc: Đã có rất nhiều nghiên cứu chỉ ra rằng phân bố các điểm mẫu quan trắc ảnh hưởng đến sai số dữ liệu. Tuy vậy, các cơ sở cung cấp dữ liệu bản đồ thường từ chối cung cấp các thông tin liên quan đến quá trình lấy mẫu và thu thập thông tin để xây dựng các bản đồ. Khi có đầy đủ các thông tin về địa điểm, thời gian lấy mẫu và các thông tin liên quan thì người sử dụng bản đồ có thể sử dụng những công cụ thống kê như lý thuyết thông kê lấy mẫu, kỹ thuật xử lý thống kê địa vật lý, v.v. để xem xét và đánh giá với mức độ tin cậy hợp lý cho các kết quả phân tích dữ liệu GIS. Sai số do thiết bị quan trắc: Nhìn chung c ác thiết bị quan trắc đều có sai số ở một mức độ nhất định. Đặc biệt, dữ liệu thu thập có thể có sai số lớn nếu thiết bị quan trắc cũ hay bị hư hỏng được sử dụng. Sai số do phân tích trong phòng thí nghiệm: Sai số dữ liệu có thể xuất hiện trong quá trình phân tích mẫu trong phòng thí nghiệm. Tuy nhiên, nhìn chung chất lượng dữ liệu thu thập thông qua phân tích trong phòng thí nghiệm bao giờ cũng sai số ít hơn so với thu thập dữ liệu bằng các phương pháp khác. Sai số do số hóa bản đồ: Nguồn gốc sai số trong quá trình số hóa chủ yếu từ sai số của bản đồ gốc. Với đối tượng điểm, sai số thường là sai lệch vị trí. Với đối tượng đường, sai số chủ yếu là do kích thước đường biên quanh đối tượng vùng lớn. Nguyên tắc chung là lấy đường ở giữa đường biên làm đường biên khi số hóa. Ngoài ra, kỹ năng số hóa của kỹ thuật viên cũng ảnh hưởng đến sai số dữ liệu. Sai lệch vị trí do đối tượng địa lý liên tục: Dữ liệu ranh giới của các thửa đất có thể hiển thị đạt độ chính xác cao. Tuy nhiên, các đường biên của các đơn vị đất và kiểu phân bố thực vật thì rất khó đạt được độ chính xác cao. Hơn nữa, ranh giới về sự biến đổi chế độ thủy văn và độ dốc cũng không có ranh giới rõ ràng. Những khó khăn trong hiển thị ranh giới của đối tượng địa lý là nguyên nhân dẫn đến sự sai lệch vị trí. Sai lệch dữ liệu thuộc tính: Độ chính xác của dữ liệu thuộc tính phụ thuộc vào mức độ tin cậy của dữ liệu khi chúng được gán vào các thực thể điểm, đường và vùng của bản đồ. Người ta phân biệt độ chính xác về định tính và độ chính xác định lượng. Độ chính xác định tính liên quan đến bản chất của dữ liệu thuộc tính. Độ chính xác định lượng liên quan đến ước tính giá trị thuộc tính 13 ***** -------THE END------- 14
- Xem thêm -

Tài liệu liên quan