Đăng ký Đăng nhập
Trang chủ Tìm kiếm dữ liệu web với ngôn ngữ xml...

Tài liệu Tìm kiếm dữ liệu web với ngôn ngữ xml

.PDF
80
5
143

Mô tả:

ĐẠI HỌC1THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG .. Phùng Tuấn Anh TÌM KIẾM DỮ LIỆU WEB VỚI NGÔN NGỮ XML LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH 2 TÓM TẮT LUẬN VĂN 1. Thông tin chung: Tên đề tài: Tìm kiếm dữ liệu Web với ngôn ngữ XML Giáo viên hƣớng dẫn: PGS. TS Đỗ Trung Tuấn Học viên thực hiện: Phùng Tuấn Anh Lớp: Cao học K9A Cơ sở đào tạo: Trƣờng Đại học Công nghệ Thông tin và Truyền thông – Đại học Thái Nguyên Chuyên ngành: Khoa học máy tính Mã số chuyên ngành: 60 48 01. 2. Mục tiêu: - Tìm hiểu, làm rõ một số nội dung về ngôn ngữ XML và khả năng sử dụng XML trong việc tìm kiếm dữ liệu. - Ứng dụng ngôn ngữ XML trong việc tìm kiếm dữ liệu Web phục vụ công tác Quản lý nhà nƣớc về lĩnh vực công thƣơng. 3. Nội dung chính: - Nghiên cứu tổng quan về đặc tính XML và các ngôn ngữ truy vấn XML: Xparth, XQuery, XSL - Nhu cầu thực tế về tìm kiếm dữ liệu Web hiện nay trên Internet. - Xây dựng chƣơng trình đề mô, ứng dụng XML để tìm kiếm thông tin trên Website cho ngƣời sử dụng. 4. Kết quả đạt đƣợc: Luận văn đã tìm hiểu những vấn đề liên quan đến dữ liệu và cơ sở dữ liệu, đặc biệt ngôn ngữ XML và cơ sở dữ liệu XML. Trong phần đầu luận văn, một số nhu cầu về sử dụng dữ liệu XML đƣợc trình bày. Trong chƣơng hai, luận văn trình bày một số khía cạnh của ngôn ngữ XML, đặc biệt những cú pháp và tìm kiếm dữ liệu XML. Việc này có ý nghĩa quan trong trong hệ thống các văn bản Internet đã và đang trở nên thông dụng. Ngoài những tìm hiểu về hệ thống XML, luận văn đã thử nghiệm với một vài công việc thực tế tại Sở Công Thƣơng tỉnh Thái Nguyên. Đã xây dựng chƣơng trình đề mô, ứng dụng XML để tìm kiếm thông tin trên Website cho ngƣời sử dụng. 3 MỤC LỤC MỤC LỤC ................................................................................................... 3 DANH MỤC CÁC TỪ VIẾT TẮT ............................................................ 6 DANH MỤC CÁC HÌNH VẼ .................................................................... 7 LỜI CẢM ƠN ............................................................................................. 8 LỜI NÓI ĐẦU ............................................................................................ 9 CHƢƠNG 1 .............................................................................................. 11 DỮ LIỆU VÀ NHU CẦU XỬ LÝ DỮ LIỆU .......................................... 11 1.1. Nhu cầu về dịch vụ Web ................................................................ 11 1.2. Xử lý dữ liệu nhờ các hệ quản trị cơ sở dữ liệu ............................. 17 1.2.1. Giới thiệu ................................................................................ 17 1.2.2. Quá trình phát triển của hệ quản trị cơ sở dữ liệu (DBMS). .. 19 1.3. Nhu cầu về cơ sở dữ liệu XML ..................................................... 22 1.3.1. Lý do cần cơ sở dữ liệu XML ................................................ 22 1.3.2. Vai trò thay thế các cơ sở dữ liệu quan hệ của XML ............. 23 1.3.3. Các giải pháp sử dụng XML .................................................. 23 1.3.4. Đánh giá chung và vai trò của XML ...................................... 24 1.4. Kết luận .......................................................................................... 25 CHƢƠNG 2 .............................................................................................. 26 XML VÀ NGÔN NGỮ TRUY VẤN DỮ LIỆU ...................................... 26 2.1. Giới thiệu XML ............................................................................. 26 2.1.1. Một số ngôn ngữ đánh dấu ..................................................... 26 2.1.2. Ngôn ngữ đánh dấu mở rộng XML ........................................ 27 2.1.3.. Sự khác nhau giữa XML và HTML ...................................... 27 2.1.4. Lịch sử hình thành và phát triển XML ................................... 28 2.2. Đặc điểm của XML ....................................................................... 29 4 2.2.1. Các tệp XML .......................................................................... 30 2.2.2. Sử dụng XML ......................................................................... 31 2.3. Cấu trúc một tài liệu XML............................................................. 32 2.3.1.Thí dụ ...................................................................................... 32 2.3.2. Xem tài liệu XML trên trình duyệt ......................................... 34 2.3.3. Trích dữ liệu trong tài liệu XML ............................................ 34 2.4. Tổ chức dữ liệu XML .................................................................... 35 2.4.1. Tạo tài liệu XML đúng khuôn dạng ....................................... 36 2.4.2. Tạo tài liệu XML hợp lệ ......................................................... 36 2.5. Tạo tài liệu XML ........................................................................... 37 2.5.1. Bộ ký tự mã hóa ..................................................................... 37 2.5.2. Đánh dấu XML và dữ liệu XML ............................................ 38 2.5.3. Ký tự trắng và dấu xuống dòng .............................................. 39 2.5.4. Tạo phần mở đầu .................................................................... 39 2.5.5. Tạo khai báo XML ................................................................. 39 2.5.6. Ghi chú tài liệu ....................................................................... 40 2.5.7. Tạo các chỉ thị xử lý ............................................................... 40 2.5.8. Tạo thẻ và phần tử .................................................................. 40 2.5.9. Tạo tài liệu XML hợp khuôn dạng ......................................... 43 2.5.10. Các ràng buộc hợp khuôn dạng: ........................................... 46 2.5.11. Sử dụng không gian tên trong XML .................................... 48 2.5.12. Không gian tên mặc định...................................................... 53 2.5.13. Cách ghi chú trong DTD ...................................................... 61 2.6. Các ngôn ngữ truy vấn XML ......................................................... 62 5 2.6.1. XPath ...................................................................................... 62 2.6.2. XQuery ................................................................................... 62 2.6.3. XSL ........................................................................................ 63 2.7. Kết luận .......................................................................................... 66 CHƢƠNG 3 .............................................................................................. 67 TÌM KIẾM THÔNG TIN VỚI XML ....................................................... 67 3.1. Nhu cầu tìm kiếm dữ liệu tại Thái Nguyên .................................. 67 3.1.1. Đặc điểm công tác của đơn vị ................................................ 67 3.1.2. Xác định hệ thống thông tin tại cơ quan ................................ 67 3.1.3. Mục đích của tìm kiếm dữ liệu Web ...................................... 67 3.2. Đảm bảo kỹ thuật ........................................................................... 68 3.2.1. Thiết kế hệ thống thu thập thông tin ...................................... 68 3.2.2. Bộ lập chỉ mục ........................................................................ 69 3.2.3. Bộ tìm kiếm thông tin ............................................................. 69 3.2.4. Nguyên lý hoạt động của Search Engine ............................... 70 3.3. Ứng dụng XML tìm kiếm thông tin web tại đơn vị ...................... 70 3.3.1. Tìm kiếm thông tin trên webiste ............................................ 70 3.3.2. Thiết lập chƣơng trình tìm kiếm sử dụng công cụ robot ........ 73 3.3.2. Chƣơng trình tìm kiếm ........................................................... 77 3.4. Kết luận .......................................................................................... 78 KẾT LUẬN ............................................................................................... 79 Kết luận và khuyến nghị ................................................................... 79 Hƣớng phát triển mở rộng ................................................................ 79 TÀI LIỆU THAM KHẢO......................................................................... 80 6 DANH MỤC CÁC TỪ VIẾT TẮT 4th Dimension, ANTs Data Server, Dataphor, Daffodil database, FileMaker Pro, Informix, InterBase, Matisse, Microsoft Access, Mimer SQL, NonStop SQL, Sand Analytic Server , SmallSQL, Sybase ASA, Watcom SQL, Sybase, Sybase IQ, Teradata, ThinkSQL, VistaDB ASCII B2B B2C Cloudscape, Firebird, HSQLDB, Ingres, MaxDB, MonetDB, PostgreSQL, SQLite, tdbengine. CNTT DB2 DBMS DTD ER GML HTML ICT IP ISO MVS (Multiple Virtual Storage) NXD RDBMS RFC SGML SQL SQL SERVER UCS URI WML XML Các hệ quản trị cơ sở dữ liệu thƣơng mại Bộ mã Business to business Business to customer Các hệ quản trị cơ sở dữ liệu mã mở Công nghệ Thông tin Hệ quản trị cơ sở dữ liệu của IBM Hệ quản trị cơ sở dữ liệu Document Type Definition Mô hình thực thể quan hệ Generalized Markup Language Hyper Text Markup Language Công nghệ Thông tin và Truyền thông Giao thức IP International Standard Organisation Lƣu trữ ảo Native XML database (Cơ sở dữ liệu XML nguyên gốc) Hệ quản trị cơ sở dữ liệu quan hệ Request for Comments Standard Generalized Markup Language Structured Query Language Hệ quản trị cơ sở dữ liệu SQL SERVER Universal Character System Uniform Resource Identifier Wireless Markup Language Ngôn ngữ đánh dấu mở rộng, XML 7 DANH MỤC CÁC HÌNH VẼ Hình 1.1: Inetrnet giúp truy cập ................................................................ 11 Hình 1.2: Mua bán trên mạng ................................................................... 13 Hình 1.3: Thông tin nội bộ ........................................................................ 14 Hình 1.4: Dịch vụ 24/ 24 ........................................................................... 15 Hình 1.5: Truyền thông linh hoạt .............................................................. 16 Hình 1.6: Ba tầng cơ sở dữ liệu ................................................................ 18 Hình 1.7: Mô hình ER ............................................................................... 19 Hình 1.8: SQL SERVER ........................................................................... 21 Hình 2.1: Ngôn ngữ HTML ...................................................................... 27 Hình 2.2: XML và ngôn ngữ khác ............................................................ 27 Hình 2.3: Sơ đồ SGML ............................................................................. 29 Hình 2.4: Mối quan hệ giữa các thành phần trong XML .......................... 63 Hình 3.1: Các máy chủ trong kiến trúc C/S .............................................. 70 Hình 3.2: Một trang web chứa thông tin của sở ........................................ 71 Hình 3.3: Nội dung trang web dạng xHTML ........................................... 72 Hình 3.4: Sơ đồ hoạt động của công cụ robot ........................................... 74 Hình 3.5: Sơ đồ thẻ xHTML tổ chức dƣới dạng cây ................................ 76 Hình 3.6: Giao diện trang tìm kiếm .......................................................... 77 Hình 3.7: Giao diện kết quả tìm kiếm ....................................................... 77 8 LỜI CẢM ƠN Tôi xin chân thành cảm ơn Ban giám hiệu, các Thầy Cô trường Đại học Công nghệ thông tin và Truyền thông Thái Nguyên, đặc biệt là các thầy cô trong và ngoài trường đã tận tình giảng dạy, trang bị cho tôi những kiến thức cần thiết trong suốt những năm học tập tại trường. Em xin chân thành cảm ơn thầy Đỗ Trung Tuấn đã tận tình quan tâm, hướng dẫn và giúp đỡ em trong thời gian qua để em có thể hoàn thành tốt luận văn của mình. Tôi xin chân thành cảm ơn các anh chị cùng các bạn đã có những nhận xét, đóng góp ý kiến, động viên, quan tâm và giúp đỡ tôi vượt qua khó khăn. Cuối cùng, Tôi xin gửi lòng biết ơn sâu sắc đến cha mẹ, gia đình, Lãnh đạo Sở Công Thương đã tạo mọi điều kiện về thời gian, vật chất, tinh thần động viên, khích lệ và hỗ trợ tôi trong suốt thời gian qua./. Thái Nguyên, ngày 12 tháng 9 năm 2012 9 LỜI NÓI ĐẦU Thế kỷ XXI, thế kỷ của sự bùng nổ công nghệ thông tin, các công nghệ tiên tiến phát triển nhƣ vũ bão, mang một luồng gió mới thổi vào nhận thức của mỗi ngƣời. Song song đó, thế giới đang trong xu thế toàn cầu hóa, tất cả đều mang ý nghĩa hội nhập. Lúc này, các doanh nghiệp và chính phủ không chỉ cạnh tranh với các doanh nghiệp trong một quốc gia mà còn cạnh tranh với các doanh nghiệp, chính phủ ở khắp thế giới. Vì thế, để tồn tại và phát triển, mục tiêu mà các doanh nghiệp hƣớng đến đầu tiên là nâng cao chất lƣợng phục vụ khách hàng. Khách hàng là yếu tố sống còn của bất kỳ doanh nghiệp nào trong thế kỷ XXI. Một Chính phủ muốn quốc gia mình phát triển phải xem nhân dân và doanh nghiệp là khách hàng. Doanh nghiệp nào làm cho khách hàng thỏa mãn, doanh nghiệp đó sẽ phát triển tốt, Chính phủ nào làm nhân dân hài lòng Chính phủ đó sẽ vững mạnh. Trong bối cảnh phát triển mạnh mẽ của Internet, thƣơng mại điện tử, Chính phủ điện tử đã ra đời và phát triển khá nhanh, điều này không phải là mới trên thế giới nhƣng vẫn là rất mới đối với Việt Nam. Nhiều vấn đề đặt ra là làm thế nào để ứng dụng công nghệ thông tin vào đời sống đƣợc hữu dụng nhất. Chính vì vậy đề tài “Tìm kiếm dữ liệu Web với ngôn ngữ XML” đƣợc đƣa ra nhằm giúp cho các doanh nghiệp hay các tổ chức nhà nƣớc, hỗ trợ cho ngƣời dùng đạt hiệu quả. Với luận văn này, tôi mong muốn sẽ xây dựng đƣợc một hệ thống chƣơng trình phần mền "hệ thống tìm kiếm dữ liệu WEB" để phục vụ cho việc tra cứu văn bản chuyên ngành của Sở Công Thƣơng Thái Nguyên. Trong quá trình tìm hiểu và viết về những đặc tính của XML sẽ không tránh khỏi những sai sót và hạn chế, rất mong đƣợc sự góp ý của Hội đồng và toàn thể những ai đã đọc luận văn này của tôi, để bản luận văn của tôi đƣợc hoàn thiện hơn nữa. 10 Luận văn đƣợc chuẩn bị theo các chƣơng :  Chƣơng 1 trình bày nhu cầu xử lý dữ liệu và dẫn đến vai trò của dữ liệu XML và thông tin trên Internet. Các hệ thống quản trị cơ sở dữ liệu đƣợc đề cập để thấy đƣợc vai trò của chúng.  Chƣơng 2 trình bày một số khía cạnh của XML và thách thức đối với bài toán tìm kiếm thông tin trên Web. Những kiến thức tìm hiểu là cơ sở để phát triển ứng dụng trong chƣơng sau.  Chƣơng 3 trình bày những ứng dụng thử nghiệm tại địa bàn Thái Nguyên. Một số trang màn hình cho phép thể hiện kết quả thử nghiệm. Phần cuối là kết luận, trình bày các kết quả làm đƣợc và định hƣớng nghiên cứu tiếp. 11 CHƢƠNG 1 DỮ LIỆU VÀ NHU CẦU XỬ LÝ DỮ LIỆU 1.1. Nhu cầu về dịch vụ Web Để nói đến nhƣ cầu về dịch vụ Web hiện nay chúng ta phải nói đến các khía cạnh cụ thể nhƣ sau: 1. Thiết lập sự hiện diện: Có gần 300 triệu ngƣời trên thế giới đã truy cập vào mạng và số lƣợng này không ngừng tăng lên hàng ngày. Việc tiếp cận đƣợc dù chỉ 1% nhóm khách hàng này cũng là 1 thành công của các doanh nghiệp. Đó là một phần không nhỏ của cộng đồng xã hội, hãy cho ngƣời ta biết quan tâm tới việc phục vụ cả cộng đồng này, ngƣời ta cần phải có mặt trên mạng Internet. Ngƣời ta nên hiểu, đối thủ cạnh tranh của ngƣời ta cũng đang làm nhƣ vậy. Hình 1.1: Inetrnet giúp truy cập 2. Tận dụng hoàn toàn những cơ hội tiếp xúc : Nhiều khi công việc kinh doanh đƣợc hiểu một cách đơn giản là giao tiếp với khách hàng. Mọi doanh nhân thông minh đều hiểu rằng: "Bí quyết thành công không nằm ở chỗ những gì ngƣời ta biết mà chính là ở chỗ ngƣời ta biết tới những khách hàng nào". Các doanh nhân đều muốn tận dụng các cuộc gặp gỡ thông thƣờng thành công việc kinh doanh có lợi và việc trao danh thiếp là một việc đƣợc coi trọng trong quá trình này. Nhƣng điều gì sẽ xảy ra khi doanh nghiệp cần phải gặp gỡ hàng ngàn, thậm chí hàng triệu đối tác làm ăn, liệu các doanh nghiệp có thể tiếp xúc cùng một lúc với tất cả các khách hàng. Điều này có 12 thể đƣợc giải quyết hết sức đơn giản, tại mọi lúc, mọi nơi, mọi thời điểm thông qua các trang Website trên mạng Internet. 3. Tạo ra nguồn thông tin sẵn có cho đối tác : Khi ngƣời ta muốn tạo các trang thông tin, quảng cáo, có thể ngƣời ta sẽ đăng chúng trên mục quảng cáo, trang vàng, nhƣng thời gian sẽ làm cho ngƣời ta phải tính lại. Vì, làm thế nào để khách hàng quan tâm có thể liên hệ đƣợc ngay với bạn? Phƣơng thức thanh toán trong mỗi dịch vụ sẽ nhƣ thế nào? Quảng cáo trang vàng sẽ khó khăn trong việc này vì đây vẫn chỉ là một loại phƣơng tiện truyền thông có khoảng cách. Trong thời đại hiện nay, các thông tin đòi hỏi phải nhanh chóng hơn và mang tính đa chiều hơn. Internet sẽ giúp ngƣời ta làm đƣợc điều đó thông qua những trang thông tin đƣợc duy trì liên tục 24/24 giờ trong ngày và 07 ngày trong tuần. Khách hàng có thể xem thông tin về doanh nghiệp của bạn bất kỳ lúc nào họ muốn, thậm chí ngay cả khi bạn đang ngủ. 4. Phục vụ khách hàng thật hiệu quả: Công nghệ Internet sẽ mang lại cho doanh nghiệp của ngƣời ta nhiều cách hơn để phục vụ khách hàng. Liệu ngƣời ta có đủ đội ngũ nhân viên trực điện thoại để tiếp nhận các yêu cầu cung cấp thông tin dịch vụ mà họ cần? Liệu khách hàng có thể tự động tra cứu vào cơ sở dữ liệu, tìm kiếm các thông tin về dịch vụ ngƣời ta đang tiến hành mà họ muốn không? Tất cả điều này khách hàng có thể làm đƣợc một cách đơn giản và nhanh chóng thông qua chính Website của doanh nghiệp bạn. 5. Thu hút sự quan tâm của dân chúng : Ngƣời ta khó mà thuyết phục đƣợc các tạp chí đăng bài về việc ngƣời ta khai trƣơng một cửa hàng mới nhƣng ngƣời ta lại có thể thuyết phục đƣợc họ đăng bài nêu tên Website của ngƣời ta vì trang Web đó mới và có nhiều điều thú vị. Với các thông tin nhƣ vậy, bất kỳ ngƣời sử dụng Internet nào cũng có thể truy cập vào Website để tìm hiểu về doanh nghiệp của ngƣời ta và có thể trở thành khách hàng tiềm năng. 6. Công bố thông tin vào bất kỳ thời gian nào : Nếu ngƣời ta cần phải công bố các tài liệu trƣớc lúc nửa đêm thì sẽ nhƣ thế nào? Giả sử đó là tin khẩn cấp, công bố các giải thƣởng của chƣơng trình khuyến mại,... Nếu ngƣời ta 13 gửi các tin này tới các tòa soạn báo thì ngƣời ta sẽ gặp phải trở ngại về thời gian: Thông tin của ngƣời ta chỉ đƣợc phát hành cùng với giờ phát hành của báo và không thể thay đổi sau khi báo đã đƣợc phát hành. Với Internet, ngƣời ta hoàn toàn có thể thay đổi tin tức mới cho Website của doanh nghiệp trong vòng vài giây đồng hồ, những thông tin mới nhất sẽ đƣợc cập nhật và sẽ đƣợc chuyển tới những ngƣời mong đợi mà không phải qua bất kỳ ngƣời đƣa tin nào. 7. Để bán hàng hóa : Internet đem lại cho doanh nghiệp của ngƣời ta một cơ hội lớn để ngƣời ta có thể bán hàng. Sự phát triển của Internet trên toàn thế giới kéo theo sự ra đời và mở rộng của một thị trƣờng khách hàng mới đầy tiềm năng - cộng đồng ngƣời sử dụng Internet. Liệu ngƣời ta có nên chần chừ khi mà các đối thủ cạnh tranh trong kinh doanh của ngƣời ta đang dần từng bƣớc thâm nhập và chiếm lĩnh thị phần trên Internet. Hình 1.2: Mua bán trên mạng 8. Giới thiệu sản phẩm sinh động : Nếu sản phẩm của ngƣời ta là những chiếc máy thì khách hàng sẽ thực sự bị thuyết phục khi nhìn thấy nó hoạt động ra sao. Internet mở ra cho ngƣời ta nhiều cách thức để giới thiệu sản phẩm thật sinh động tới khách hàng thông qua Website bằng hình ảnh, âm thanh, các đoạn phim ngắn, điều này sẽ khiến các khách hàng tiềm năng sẽ đến với ngƣời ta nhiều hơn, không một quyển sách giới thiệu nào có thể làm đƣợc nhƣ vậy. 9. Vƣơn tới một thị trƣờng dân chúng có thu nhập cao : Số lƣợng ngƣời tham gia vào mạng Internet có thể tạo ra một thị trƣờng sẵn có đông đảo nhất. Những ngƣời sử dụng Internet thƣờng là những ngƣời có trình độ học vấn, có 14 hiểu biết và địa vị ổn định, thu nhập cao trong xã hội. Chính vì vậy, tiếp cận đƣợc và chiếm lĩnh thị trƣờng khách hàng này là điều mà bất kỳ doanh nghiệp kinh doanh nào cũng mong muốn đạt đƣợc. 10. Trả lời các câu hỏi thƣờng gặp : Bất kỳ ngƣời trực điện thoại nào trong công ty ngƣời ta cũng đều nói rằng họ dùng phần lớn thời gian của mình để trả lời các câu hỏi gần nhƣ giống nhau. Đó là những câu hỏi mà các khách hàng muốn hỏi trƣớc khi họ giao dịch với bạn. Đƣa những câu hỏi này lên Website sẽ giúp ngƣời ta loại bỏ đƣợc những rào chắn đối với công việc kinh doanh và giải phóng bớt thời gian cho nhân viên trực điện thoại. 11. Giải quyết thông tin nội bộ : Các nhân viên bán hàng lƣu động có thể cần những thông tin cập nhật từng phút để giúp họ bán hàng cũng nhƣ giúp cho việc kinh doanh luôn ăn ý. Nếu ngƣời ta biết thông tin gì cần thiết, ngƣời ta có thể đƣa chúng lên 1 Website riêng. Với một cuộc truy cập Internet thông qua điện thoại nội hạt, nhân viên bán hàng của doanh nghiệp ngƣời ta ở bất kỳ nơi đâu trên thế giới sẽ nhận đƣợc những thông tin đầy đủ nhất mà không phải trả cƣớc phí đƣờng dài và những nhân viên ở văn phòng không bận rộn thêm. Hình 1.3: Thông tin nội bộ 12. Mở rộng ra thị trƣờng quốc tế : Với việc kinh doanh thông thƣờng ngƣời ta không thể gửi thƣ, điện thoại hay phổ biến các quy định tới tất cả mọi khách hàng tiềm năng trên thị trƣờng thế giới, nhƣng với Website ngƣời ta có thể hội thoại trực tiếp với khách hàng quốc tế nhƣ là với một khách hàng trong nội hạt. Khi doanh nghiệp của ngƣời ta có các văn phòng đại diện ở nƣớc 15 ngoài, họ sẽ truy cập vào nguồn thông tin của văn phòng trong nƣớc với chi phí phải trả chỉ bằng một cuộc điện thoại gọi nội hạt. 13. Hình thành dịch vụ 24 giờ : Chúng ta không phải lúc nào cũng có những công việc cùng chung một lịch trình. Công việc kinh doanh là khắp mọi lúc, mọi nơi chứ không phải chỉ là thời gian ở công sở. Khi công việc kinh doanh giữa Châu Âu và Châu Á đang thực hiện thì sự khác biệt về thời gian sẽ là điều cản trở lớn. Các Website sẽ phục vụ khách hàng và các đối tác của ngƣời ta 24/24 giờ trong ngày, 07/07 ngày trong tuần. Thông tin có thể đƣợc khách hàng lựa chọn theo nhu cầu và các thông tin mà họ coi là quan trọng, chính điều này sẽ đƣa ngƣời ta dẫn đầu trong cuộc cạnh tranh ngay cả khi ngƣời ta ở ngoài văn phòng làm việc. Hình 1.4: Dịch vụ 24/ 24 14. Thay đổi thông tin hiện thời một cách nhanh chóng : Có những thông tin bị thay đổi trƣớc khi nó đƣợc in ra. Và ngƣời ta sẽ có một đống giấy tờ có cũng nhƣ không có giá trị lẫn lộn nhau. Các ấn phẩm điện tử có thể thay đổi theo nhu cầu của ngƣời ta mà không cần đến giấy tờ, bút mực hay hóa đơn. Ngƣời ta còn có thể gắn Website của doanh nghiệp với 1 cơ sở dữ liệu mà ngƣời ta có thể thay đổi bao nhiêu lần trong 1 ngày cũng đƣợc tùy theo yêu cầu. Chẳng có giấy tờ nào có thể giúp ngƣời ta thực hiện đƣợc sự năng động đó. 15. Cho phép ngƣời ta tiếp nhận thông tin phản hồi từ phía khách hàng : Với Website ngƣời ta có thể yêu cầu thông tin phản hồi từ phía khách hàng ngay lập tức khi họ đang ghé thăm Website của doanh nghiệp bạn. Điều này giúp ngƣời ta tiết kiệm đƣợc rất nhiều thời gian và tiền bạc để hoạch định các chiến lƣợc quảng cáo và kinh doanh trên cơ sở những thông tin nắm bắt đƣợc 16 từ phía khách hàng mà không phải mất thêm khoản chi nào nữa. Câu trả lời của khách hàng đƣợc đƣa lên Website ngay khi khách hàng tìm hiểu sản phẩm và đƣợc chuyển ngay lập tức tới địa chỉ e-mail của bạn. 16. Thử nghiệm dịch vụ và sản phẩm mới trên thị trƣờng : Khi đƣa ra một sản phẩm mới trên thị trƣờng, điều mà tất cả các doanh nghiệp phải làm là quảng cáo và giới thiệu sản phẩm đó. Với các phƣơng pháp quảng cáo truyền thống, đây sẽ là một công đoạn rất tốn kém và đòi hỏi kinh phí lớn. Nhƣng nếu ngƣời ta giới thiệu, quảng cáo sản phẩm mới trên Website của doanh nghiệp bạn, ngƣời ta sẽ biết rằng có thể chờ đợi gì từ những khách hàng truy cập vào Website, họ chính là thị trƣờng ít tốn kém nhất mà ngƣời ta vƣơn tới. Họ còn có thể cho ngƣời ta biết họ nghĩ gì về sản phẩm của ngƣời ta một cách nhanh nhất, dễ dàng nhất với một chi phí ít hơn bất kỳ thị trƣờng nào mà ngƣời ta vƣơn tới. 17. Phƣơng tiện truyền thông linh hoạt : Hình 1.5: Truyền thông linh hoạt Ngày nay, Internet đƣợc đánh giá là hệ thống truyền dẫn chuyên nghiệp nhất bởi vì sản phẩm chính của nó là các thông tin đƣợc tiếp cận một cách dễ dàng, nhanh chóng và rẻ tiền. Tất cả các ấn phẩm đƣợc truyền trên Internet đang ngày càng trở nên phổ biến bởi vì các công việc đều đƣợc thực hiện trong môi trƣờng kỹ thuật số từ rất nhiều nguồn thông tin cung cấp. Tất cả những công việc này thực hiện một cách dễ dàng thông qua các trang Web trên chính Website của doanh nghiệp bạn. 17 18. Tiếp cận một thị trƣờng của giới trẻ và mang tính giáo dục : Ở hầu hết các trƣờng đại học đều đã cho sinh viên tiếp cận vào Internet, giới học sinh phổ thông sẽ từng bƣớc làm quen và sử dụng dịch vụ Internet trong nhiều năm tới. Nhu cầu về sách vở, trang phục thể thao, các khóa học, thời trang trẻ và rất nhiều thứ khác sẽ trở thành nhu cầu đa dạng của thị trƣờng trên Internet. Thậm chí ngay cả khi áp dụng dịch vụ thƣơng mại điện tử trên mạng và tuổi thọ trung bình có phần tăng lên thì sự tăng trƣởng của khu vực thị trƣờng tuổi dƣới 25 vẫn tiếp tục. 19. Tiếp cận một thị trƣờng có tính chuyên nghiệp : Mạng Internet không đơn thuần chỉ là những máy tính mà nó còn là nơi mọi ngƣời có thể mua bán, trao đổi bất kỳ thứ gì từ chiếc bàn chải đánh răng, các tác phẩm nghệ thuật cho đến các bài học tiếng Anh,... Với 70 triệu ngƣời sử dụng thƣờng xuyên và số lƣợng ngƣời sử dụng tăng lên hàng ngày, thông tin kinh doanh của ngƣời ta có thể đƣợc giới thiệu cho một số lƣợng ngƣời rất lớn. 20. Phục vụ tại thị trƣờng địa phƣơng : Chúng ta đã nói về sức mạnh của việc phục vụ nhu cầu trên thị trƣờng quốc tế thông qua Internet, nhƣng còn khu vực thị trƣờng ở ngay địa phƣơng của ngƣời ta thì sao? Câu trả lời là: chính khách hàng trong địa phƣơng ngƣời ta thông qua các hoạt động marketing, họ sẽ biết tới Website, truy cập thông tin trên Internet và mang lại lợi nhuận cho công ty bạn. Cho nên dù công ty đƣợc đặt ở đâu thì thông qua mạng Internet, những khách hàng tiềm năng vẫn biết đến ngƣời ta và ngƣời ta cũng sẽ sẵn sàng phục vụ họ. 1.2. Xử lý dữ liệu nhờ các hệ quản trị cơ sở dữ liệu 1.2.1. Giới thiệu Thông tin là nguồn tài nguyên quý giá của một tổ chức. Các phần mềm máy tính là những công cụ hiệu quả để xử lý thông tin và hệ quản trị cơ sở dữ liệu là công cụ phổ biến cho phép lƣu trữ và rút trích thông tin một cách hiệu quả. Hệ quản trị cơ sở dữ liệu quan hệ là hệ quản trị cơ sở dữ liệu phổ biến nhất hiện nay và đƣợc hỗ trợ bởi nhiều nhà cung cấp phần mềm. Tính hiệu quả của các ứng dụng phụ thuộc vào chất lƣợng của việc tổ chức dữ liệu. Những cải tiến 18 trong kỹ thuật và xử lý cơ sở dữ liệu đƣa đến các cơ hội sử dụng thông tin một cách linh hoạt và hiệu quả khi dữ liệu đƣợc tổ chức và lƣu trữ trong các cấu trúc quan hệ. Hệ quản trị cơ sở dữ liệu là một thành công trong lĩnh vực thƣơng mại. Hình 1.6: Ba tầng cơ sở dữ liệu Hệ quản trị cơ sở dữ liệu phải đảm bảo các mục tiêu: dữ liệu sẵn dùng, tính toàn vẹn dữ liệu, an toàn dữ liệu, và độc lập dữ liệu.  Dữ liệu sẵn dùng: dữ liệu đƣợc tổ chức sao cho mọi ngƣời dùng có thể truy cập dễ dàng theo chức năng và nhiệm vụ của họ.  Tính toàn vẹn dữ liệu: dữ liệu lƣu trữ trong cơ sở dữ liệu là đúng đắn, đáng tin cậy.  An toàn dữ liệu: Chỉ những ngƣời dùng đƣợc phép mới có thể truy cập dữ liệu. Nếu nhiều ngƣời dùng truy cập chung một mục dữ liệu cùng lúc thì hệ quản trị cơ sở dữ liệu không cho phép họ thực hiện những thay đổi gây mâu thuẫn dữ liệu.  Độc lập dữ liệu: hệ quản trị cơ sở dữ liệu phải cho phép tất cả mọi ngƣời dùng đƣợc phép lƣu trữ, cập nhật và rút trích dữ liệu hiệu quả mà không cần nắm chi tiết về cấu trúc của cơ sở dữ liệu đƣợc biểu diễn và cài đặt. 19 1.2.2. Quá trình phát triển của hệ quản trị cơ sở dữ liệu (DBMS). Quá trình phát triển của DBMS nhƣ sau: Những năm 60 của thế kỷ trƣớc, có các tệp đƣợc chƣơng trình truy cập. Sau đó có các cơ sở dữ liệu theo mô hình (i) phân cấp; (ii) mạng. Sau năm 1970, đa số các cơ sở dữ liệu theo mô hình dữ liệu quan hệ. Sau những năm 80, có ba cơ sở dữ liệu tiên tiến (i) cơ sở dữ liệu phân tán; (ii) cơ sở dữ liệu hƣớng đối tƣợng; và (iii) cơ sở dữ liệu suy diễn. Hình 1.7: Mô hình ER 1.2.2.1. DB2 DB2 là một trong các dòng phần mềm quản trị cơ sở dữ liệu quan hệ của IBM. Có nhiều phiên bản khác nhau của DB2 để chạy trên các loại máy tính từ thiết bị cầm tay đến các máy tính lớn. Ở những công ty nhỏ thƣờng gặp nhất là phiên bản DB2 Enterprise Server Edition hoặc DB2 Data Warehouse Edition (DB2 DWE), chạy trên các máy chủ Unix, Windows hoặc Linux. Tuy nhiên khi nói đến DB2, phần đông ngƣời ta đều nghĩ đến DB2 for Z/OS, phiên bản DB2 nguyên thủy chạy trên máy mainframe IBM đƣợc phát hành từ năm 1982. Trên các máy nhỏ phần đông ngƣời ta hãy sử dụng RDBMS Oracle vì DB2 chỉ xuất hiện trên máy nhỏ cuối thập niên 1990. DB2 sử dụng ngôn ngữ SQL đễ đọc và viết thông tin vào dữ liệu. 20 IBM DB2 Enterprise Server Edition là một hệ quản trị cơ sở dữ liệu quan hệ đƣợc phát triển bởi IBM. DB2 đƣợc dùng chủ yếu trên Unix (thƣờng gọi AIX), Linux, IBM i (trƣớc đây là OS/400), z/OS and Windows servers. DB2 cũng hỗ trợ đắc lực IBM InfoSphere Warehouse khác. Song song với DB2 là một hệ quản trị cơ sở dữ liệu quan hệ khác: Informix, đƣợc IBM phát hành năm 2001. DB2 có một lịch sử lâu dài, và nhiều ngƣời nghĩ rằng, đây là sản phẩm về cơ sở dữ liệu sử dụng [SQL] đầu tiên (SQL cũng đƣợc phát triển bởi IBM) mặc dù Oracle đã phát hành một sản phẩm cơ sở dữ liệu thƣơng mại SQL hơi sớm hơn so với IBM. Tên DB2 lần đầu tiên đƣợc đặt cho hệ quản trị cơ sở dữ liệu vào năm 1983 khi IBM phát hành bản DB2 đầu tiên chạy trên nền của mainframe MVS (Multiple Virtual Storage) nền tảng máy tính lớn. Trƣớc đó, đã có một sản phẩm tƣơng tự đƣợc đặt tên là SQL/DS chạy trên nền máy ảo. Trên nền System 38 trƣớc đó cũng có một hệ quản trị CSDL quan hệ. Hệ quan hệ, hay System R, là một nguyên mẫu đƣợc nghiên cứu phát triển trong những năm 1970. Khởi điểm thứ hai của DB2 bắt đầu lại vào đầu những năm 1970 khi EF Codd, làm việc cho IBM, đã mô tả lý thuyết về cơ sở dữ liệu quan hệ và trong tháng 6 năm 1970 xuất bản các mô hình thao tác dữ liệu. Để áp dụng mô hình Codd, cần một ngôn ngữ cơ sở dữ liệu quan hệ mà ông đặt tên Alpha. Vào thời điểm đó IBM đã không tin tƣởng vào tiềm năng mô hình quan hệ của Codd, để lại công việc cho một nhóm các lập trình viên không thuộc giám sát của Codd, nhóm này đã vi phạm một số nguyên tắc cơ bản trong mô hình quan hệ của Codd, kết quả là cho ra đời ngôn ngữ truy vấn cấu trúc tiếng Anh, hoặc SEQUEL. Khi IBM phát hành sản phẩm cơ sở dữ liệu quan hệ đầu tiên, họ cũng muốn có một "Siêu ngôn ngữ" với chất lƣợng thƣơng mại, do đó, nó kiểm tra toàn bộ SEQUEL và đổi tên ngôn ngữ truy vấn hệ thống (System Query Language) SQL để phân biệt nó với SEQUEL. 1.2.2.2. Oracle ORACLE là một bộ phần mềm đƣợc cung cấp bởi công ty ORACLE, nó bao gồm một bộ xây dựng các ứng dụng và các sản phẩm cuối cùng cho uer (end_uer product).
- Xem thêm -

Tài liệu liên quan