Đăng ký Đăng nhập
Trang chủ Nghiên cứu giải pháp công nghệ và phát triển phần mềm trợ giúp giảng dạy trên mạ...

Tài liệu Nghiên cứu giải pháp công nghệ và phát triển phần mềm trợ giúp giảng dạy trên mạng intranet trong các trường ptth

.PDF
418
50
90

Mô tả:

TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) ĐỀ TÀI NGHIÊN CỨU KHOA HỌC – TRIỂN KHAI CÔNG NGHỆ “Nghiên cứu giải pháp công nghệ và phát triển phần mềm trợ giúp giảng dạy trên mạng Intranet trong các trường PTTH” Báo cáo tổng kết và nghiệm thu đề tài Phiên bản: 2.5 Chủ trì: TS. Hoàng Lê Minh Thành viên: ThS. Phạm Thế Bảo ThS.Nguyễn Giang Sơn ThS. Võ Đức Cẩm Hải CN. Nguyễn Hiền Lương CN. Lê Phạm Hoàng Giàu  THÀNH PHỐ HỒ CHÍ MINH 2003 - 2006 © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 1 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) MỤC LỤC GIỚI THIỆU ĐỀ TÀI.......................................................................................................... ................4 PHẦN I. XÂY DỰNG CÁC HỆ THỐNG THÔNG TIN VÀ PHẦN MỀM ỨNG DỤNG TRONG MÔI TRƯỜNG GIÁO DỤC........................................................................................... ....................6 1.1 Khảo sát thực trạng và nhu cầu ứng dụng CNTT và mạng Internet trong các trường phổ thông.................................................................................................................................... ............6 1.2 Nhu cầu và giải pháp xây dựng các hệ thống thông tin quản lý..............................................8 1.3 Một số vấn đề trong quản lý và trao đổi thông tin trên mạng..................................................9 PHẦN II. XU HƯỚNG PHÁT TRIỂN PHẦN MỀM ỨNG DỤNG TRÊN MẠNG MÁY TÍNH 15 2.1 Lựa chọn giải pháp công nghệ nền............................................................................... ..........15 2.2 Giải pháp phát triển phần mềm dựa trên kiến trúc đa tầng J2EE..........................................16 2.3 Giải pháp kết nối và chuyển đổi dữ liệu.............................................................................. ...20 2.4 Sự cần thiết của môi trường phát triển dựa trên nguồn mở...................................................23 2.5 Hệ điều hành nguồn mở Linux và các phiên bản distro của Linux.......................................27 PHẦN III. NGHIÊN CỨU VỀ CÔNG NGHỆ CỔNG THÔNG TIN.............................................29 3.1 Phân loại website và cổng thông tin...................................................................... .................29 3.2 Cổng thông tin và tích hợp ứng dụng...................................................................... ...............30 3.3 Tình hình phát triển cổng thông tin mã nguồn mở dựa trên uPortal......................................33 3.4 Các chuẩn về portlet container và Java Specification Request 168.......................................38 3.5 Kiến trúc chung của các cổng thông tin.................................................................................41 3.6 Kiến trúc phần mềm cổng thông tin uPortal.......................................................................... .43 PHẦN IV MÔI TRƯỜNG PHÁT TRIỂN ỨNG DỤNG IPORTAL FRAMEWORK VÀ CÁC ỨNG DỤNG TÍCH HỢP CỔNG................................................................................... ...................45 4.1 Công nghệ nền cổng thông tin và môi trường phát triển ứng dụng ......................................45 4.2 Ứng dụng Quản lý thông tin người sử dụng cổng dựa trên OpenLDAP...............................45 4.3 Thiết kế cơ sở dữ liệu người dùng cổng thông tin iPortal trên OpenLDAP..........................46 4.4 Ứng dụng thư điện tử tích hợp trong iPortal..........................................................................53 4.5 Mô hình bảo mật Hệ thống Quản lý thư điện tử iMailManager............................................55 4.6 Ứng dụng quản trị nội dung và tin tức iContentManager......................................................56 4.7 Ứng dụng quản trị tài liệu điện tử iDocManager...................................................................57 4.8 Yêu cầu hệ thống triển khai iPortal và các ứng dụng ............................................................71 V. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN................................................................. ...................73 Những kết quả chính thu được từ đề tài...................................................................... .................73 PHỤ LỤC A KIẾN TRÚC CỔNG THÔNG TIN uPORTAL ..........................................................75 A.1 Tích hợp thông tin và ứng dụng web......................................................................... ............75 A.2 Các thẻ định dạng (Stylesheets)........................................................................................ ....76 A.3 Các kênh ứng dụng trong uPortal...................................................................... ...................78 A.4 Cấu trúc các đối tượng bên trong uPortal .................................................................... ........81 A.5 Khả năng tích hợp của uPortal với các hạ tầng thông tin sẵn có.........................................81 A.6. Xây dựng các kênh ứng dụng trong uPortal.........................................................................83 PHỤ LỤC B. KHUNG PHÁT TRIỂN ỨNG DỤNG iPORTAL FRAMEWORK.........................92 B.1 Giới thiệu chung........................................................................................................ .............92 B.2 Nguyên lý hoạt động........................................................................................... ...................92 B.3 Phân tích thiết kế ứng dụng MyAccount bằng iPortal Framework.......................................95 Mã nguồn một số gói phần mềm nền trong bộ sản phẩm iPortal Framework ..........................100 package org.itpmo.portal.base; // BaseBO............................................................................ .100 package org.itpmo.portal.base; // DBService........................................................................103 package org.itpmo.portal.base; // XML.................................................................. ...............103 package org.itpmo.portal.base.channel; // Channel...............................................................104 package org.itpmo.portal.base.channel; // PrivilegedChannel............................................112 © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 2 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) package org.itpmo.portal.base.channel; // Screen................................................................. .113 package org.itpmo.portal.base.ldap; // Base64.....................................................................115 package org.itpmo.portal.base.ldap; // Common..................................................................117 package org.itpmo.portal.base.ldap; // JNDI........................................................................121 package org.itpmo.portal.base.ldap; // LDAP......................................................................137 package org.itpmo.portal.base.ldap; // PasswordHandler.....................................................140 package org.itpmo.portal.base.ldap; // TreeNode2................................................................143 package org.itpmo.portal.base.ldap; // UnixCrypt................................................................144 PHỤ LỤC C DỊCH VỤ THÔNG TIN THƯ MỤC OPENLDAP.................................................155 C.1 Giới thiệu..................................................................................................................... .........155 C.2 Các mô hình trong kiến trúc LDAP.................................................................... .................155 C.3 Bảo mật LDAP bằng công nghệ SSL và TLS................................................................... ...156 C.4 Khuôn dạng LDIF (LDAP Data Interchange Format) cho dữ liệu LDAP..........................157 PHỤ LỤC D ĐẶC TẢ DUBLIN CORE METADATA................................................................159 D.1 Metadata là gì ?.................................................................................................. ..................159 D.2 Dublin Core Metadata là gì ?.................................................................................. .............159 D.3 Cú pháp của Dublin Core Metadata:...................................................................................160 PHỤ LỤC E LUCENE SEARCH ENGINE.................................................................. .............162 E.1 Tổng quan về Lucene Search Engine........................................................................... ........162 E.1.1 Lucene search engine là gì ?...................................................................................... ...162 E.1.2 Search Engine hoạt động như thế nào?........................................................................162 E.1.3 Phương pháp cài đặt cải tiến của Lucene................................................................ .....163 E.1.4 So sánh - đánh giá khả năng của Lucene với các công cụ tìm kiếm khác..................163 E.2 Các định dạng của tập tin chỉ mục....................................................................... ................165 E. Các tập tin trong từng phân đoạn:................................................................... ..................168 E.3 Cú pháp của lớp Query Parser trong Lucene.......................................................................171 E.3.1 Tổng quan:.................................................................................................. ..................171 PHỤ LỤC F KHẢO SÁT VỀ CÁC CỔNG THÔNG TIN...........................................................174 F. 1 eXo Platform (giấy phép nguồn mở).................................................................... ..............174 F.2 Cổng thông tin Liferay (giấy phép nguồn mở)................................................................. ....178 F.3 Cổng thông tin uPortal (giấy phép nguồn mở).....................................................................180 F.4 Cổng thông tin IBM WebSphere Portal – Express (thương mại).......................................181 F.7 Cổng thông tin ORACLE Portal (thương mại)....................................................................185 © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 3 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) GIỚI THIỆU ĐỀ TÀI Ứng dụng CNTT là một nhu cầu lớn của nền kinh tế đang phát triển như Việt nam, trong đó có ứng dụng CNTT cho ngành giáo dục – đào tạo, đặc biệt là giáo dục phổ thông. Phần mềm ứng dụng, nhất là các phần mềm chạy được trên các mạng máy tính nội bộ (LAN) và mạng Internet, nếu triển khai hiệu quả sẽ góp phần thúc đẩy sự phát triển của giáo dục - đào tạo. Cho đến đầu năm năm 2002 (năm đăng ký thực hiện Đề tài), phần lớn các phần mềm ứng dụng trên mạng tại Việt nam đều được phát triển dựa trên mô hình kiến trúc khách / phục vụ (two-tier client/server), với công nghệ lập trình trên mạng LAN, sử dụng các ngôn ngữ có khả năng giao tiếp mạng của Microsoft như FoxPro, VisualBasic, Visual C/C++, chủ yếu phát triển trên nền Hệ điều hành MS Windows. Điều này cũng có những bất cập riêng là phần lớn các trường Trung học Phổ thông không có đủ kinh phí để mua bản quyền hệ điều hành MS Windows, các hệ quản trị cơ sở dữ liệu MS SQL Server và các tiện ích phát triển vận hành phần mềm của Microsoft, dẫn đến tình trạng vi phạm bản quyền khá phổ biến ngay trong ngành giáo dục-đào tạo. Nhóm cán bộ - giảng viên tại Bộ môn Ứng dụng Tin học, Khoa Toán – Tin học Trường Đại học KHTN TP. HCM, dưới sự lãnh đạo của TS. Hoàng Lê Minh, từ năm 1999 đã được Sở Khoa học, Công nghệ và Môi trường TP. HCM hỗ trợ kinh phí để nghiên cứu, tiếp cận một số phương pháp phát triển phần mềm kiểu mới dựa trên nền các công nghệ nguồn mở như Hệ điều hành Linux, ngôn ngữ lập trình Java, ngôn ngữ đánh dấu văn bản mở rộng XML, dịch vụ Web .... Trong năm 2001, nhóm nghiên cứu tại ĐHKHTN TP. HCM đã thực hiện thành công Đề tài “Công nghệ lập trình Java trên nền máy chủ Linux và phát triển một số ứng dụng website” (đề tài đã nghiệm thu tháng 12/2001). Một số ứng dụng website chạy trên hệ điều hành máy chủ Linux như phần mềm Quản trị Thông tin – Thư viện Điện tử iLOC lần đầu tiên đã được triển khai thành công tại nhiều thư viện đại học, cao đẳng, viện nghiên cứu. Từ các kết quả đạt được, đầu năm 2002, nhóm nghiên cứu tiếp tục đăng ký thực hiện Đề tài “Nghiên cứu giải pháp công nghệ và phát triển phần mềm trợ giúp giảng dạy trên mạng Intranet trong các trường trung học phổ thông”. Giai đoạn nghiên cứu (Giai đoạn 1) của Đề tài đã được hoàn tất vào cuối năm 2002, được Hội đồng Sở KHCN nghiệm thu sơ bộ cho sản phẩm “Cổng thông tin mã nguồn mở iPortal”. Sau kết quả nghiệm thu Giai đoạn 1, sản phẩm cổng thông tin iPortal đã được nhóm nghiên cứu ứng dụng thử nghiệm tại Trung tâm Công nghệ Phần mềm ĐHQG TP. HCM (Unisoft), được cài đặt để phục vụ hệ thống Thư điện tử E-mail tại Văn phòng Đại học Quốc gia TP. HCM, tại một số địa chỉ khác trong ngành giáo dục – đào tạo. Tuy nhiên do hạn chế về hạ tầng mạng, khả năng truy cập Internet trong các trường THPT tại TP. Hồ Chí Minh (vào thời điểm năm 2003) còn quá hạn chế, nên nhóm nghiên cứu chưa có điều kiện thử nghiệm rộng rãi để đánh giá hiệu quả cho các sản phẩm nghiên cứu của đề tài như đăng ký trong Đề cương Đề tài. Từ giữa năm 2003, khi Việt nam bắt đầu có công nghệ truy cập Internet băng thông rộng (ADSL), giá cước truy cập Internet của các công ty trong ngành Bưu chính, Viễn thông giảm mạnh, chương trình đưa Internet vào các trường phổ thông được triển khai © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 4 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) rộng, đã tạo ra những thay đổi lớn (nếu so sánh thời điểm khảo sát đánh giá hiện trạng ứng dụng CNTT trong trường phổ thông do đề tài thực hiện tháng 4/2002). Trong các năm 2004-2005, nhiều trường THPT tại TP. HCM đã xây dựng các mạng nội bộ (LAN), có kết nối với Internet, trang bị các phòng máy, các phần mềm hỗ trợ giảng dạy cho giáo viên và học sinh. Đó là điều kiện cần thiết để nhóm nghiên cứu đề tài chúng tôi có thể đưa ra thử nghiệm rộng rãi các sản phẩm của đề tài như iPortal, iLOC ... dưới nhiều hình thức, cài đặt trên nhiều hệ thống mạng. Một trong các giải pháp mà nhóm đề xuất là đóng gói hoàn chỉnh sản phẩm dưới dạng “software appliance” (còn gọi là phần mềm “nhúng”) để phổ biến, chuyển giao dễ dàng cho đối tượng người dùng không chuyên trong môi trường giáo dục. Đến thời điểm cuối năm 2006, thông qua đơn vị chủ trì là Trung tâm ứng dụng Công nghệ mạng Internet (Cita), nhóm nghiên cứu đã phối hợp với một số công ty phần mềm, công ty sản xuất máy tính thương hiệu Việt nam (Compotech, VTB, GenSoft, Khai trí, V-Open ...) để cài đặt sản phẩm, thương mại hoá một số kết quả nghiên cứu của đề tài, đưa vào ứng dụng trong thực tế. Báo cáo này trình bày một cách tổng quan các kết quả nghiên cứu của đề tài, giới thiệu một số giải pháp công nghệ liên quan đến nội dung “Xây dựng hệ thống thông tin quản lý dựa trên phần mềm nguồn mở” trong môi trường giáo dục – đào tạo. Một trong các mục đích của Báo cáo Đề tài là phục vụ cho việc nâng cao nhận thức, kỹ năng và tạo cơ hội ứng dụng CNTT, ứng dụng các phần mềm nguồn mở với chất lượng cao, chi phí thấp, phù hợp nhu cầu đang trở nên khá cấp thiết hiện nay, khi Việt nam đã gia nhập Tổ chức Thương mại Quốc tế WTO với các cam kết về bảo vệ quyền Sở hữu trí tuệ và bản quyền phần mềm trong các trường phổ thông, các trường cao đẳng và đại học, các trung tâm nghiên cứu, đào tạo CNTT, các tổ chức, cơ quan, doanh nghiệp. Nhóm đề tài xin trân trọng cám ơn đơn vị chủ trì đề tài, Trung tâm Ứng dụng Công nghệ mạng Internet (Cita), Khoa Toán – Tin học Trường Đại học Khoa học Tự nhiên TP. HCM (nơi làm việc của phần lớn các thành viên tham gia đề tài), Trung tâm Công nghệ Phần mềm ĐHQG TP. HCM, Ban Quản lý các dự án CNTT TP. HCM, Sở Khoa học và Công nghệ TP. HCM, Ban Quản lý Dự án Phần mềm Nguồn mở Bộ Khoa học và Công nghệ và nhiều cơ quan, đơn vị tại TP. HCM trong suốt thời gian qua đã quan tâm, giúp đỡ nhóm đề tài thực hiện nghiên cứu, phát triển các ứng dụng CNTT dựa trên phần mềm nguồn mở. Quyền sở hữu trí tuệ của các giải pháp công nghệ, là kết quả nghiên cứu được trình bày trong Báo cáo đề tài này thuộc về cơ quan đặt hàng là Sở Khoa học và Công nghệ TP. HCM. Nhóm tác giả Báo cáo giữ quyền tác giả, trong khi tên thương hiệu của các sản phẩm phần mềm được phát triển từ các giải pháp công nghệ nguồn mở như iLOC, iPortal, iDocsManager, iMailManager, v.v.. .... thuộc về Trung tâm Ứng dụng Công nghệ mạng Internet (Cita), đơn vị chủ trì đề tài đồng thời cũng là nhà đầu tư phát triển và thương mại hoá các phần mềm dựa trên nguồn mở, trong suốt thời gian từ năm 1999 đến nay. Thành phố Hồ Chí Minh, tháng 12/2006 Nhóm nghiên cứu đề tài © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 5 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) PHẦN I. XÂY DỰNG CÁC HỆ THỐNG THÔNG TIN VÀ PHẦN MỀM ỨNG DỤNG TRONG MÔI TRƯỜNG GIÁO DỤC 1.1 Khảo sát thực trạng và nhu cầu ứng dụng CNTT và mạng Internet trong các trường phổ thông Nhằm khảo sát nhu cầu, đánh giá khả năng triển khai ứng dụng của các phần mềm trợ giúp đào tạo trong các trường phổ thông, theo yêu cầu của đề tài, ngày 10 tháng 04 năm 2002, nhóm nghiên cứu đã phối hợp với Trung tâm Đào tạo Khu vực của SEAMEO (Tổ chức Bộ trưởng giáo dục các quốc gia Đông nam Á, có trụ sở tại 35 Lê Thánh Tôn, Quận 1, TP. HCM), Trung tâm ứng dụng Công nghệ mạng Internet (Cita) và Trung tâm Công nghệ Phần mềm ĐHQG-HCM (Unisoft) để tổ chức Hội thảo “Thực trạng và nhu cầu sử dụng mạng Internet trong trường phổ thông trung học”. Đến tham dự Hội thảo có 40 đại biểu, đại diện cho nhiều trường trung học phổ thông lớn tại TP. HCM, lãnh đạo VP II Bộ GD-ĐT, Thành hội Hội Khuyến học Việt Nam TP.HCM, đại diện của các Sở GD-ĐT tỉnh Bình Dương, Cần Thơ, An giang … Khai mạc Hội thảo và trong báo cáo “Tham khảo mô hình ứng dụng Công nghệ Thông tin và Truyền thông trong Giáo dục Phổ thông tại Malaysia: Trường thông minh (“Smart School”)”, Bà Nguyễn Thuý Vân, Q.Giám đốc Trung tâm SEAMEO, đã nhấn mạnh tầm quan trọng của việc ứng dụng CNTT và mạng Internet trong cải tiến cách dạy và học tại các trường phổ thông. Theo tác giả báo cáo, Trường thông minh không chỉ tạo nên một môi trường dạy và học theo phong cách mới, mà còn liên quan đến cả một hệ thống quản lý trường học tiên tiến, trong đó ứng dụng rộng rãi các thành tựu mới nhất của CNTT và Viễn thông – Internet. Phát triển mô hình trường thông minh sẽ tạo điều kiện ban hành các chính sách khuyến khích áp dụng các quy trình công nghệ cho đối tượng phục vụ chính là con người, với năng lực và tinh thần trách nhiệm cao. Mô hình Trường thông minh cũng giúp các trường trong quá trình phát triển có thể kiểm nghiệm, đánh giá, tái cấu trúc trong tổ chức ngày càng hiệu quả hơn. Với việc ứng dụng mô hình Trường thông minh: • Tất cả các học sinh của trường có thể học theo năng lực và sở thích mà vẫn đảm bảo được nội dung chương trình chung; • Học sinh có thể phát triển toàn diện các năng khiếu, kiến thức, kỹ năng; • Giáo viên đưa các bài giảng gần gũi với học sinh hơn, đa dạng và cá biệt hoá theo nhu cầu và trình độ của từng học sinh; • Bộ máy quản lý nhà trường nắm bắt tốt hơn các thông tin về giáo viên và học sinh để từ đó đề ra các quyết định đúng đắn; • Việc đánh giá kết quả học tập trở nên khách quan hơn, khuyến khích học sinh học tốt và thêm tính năng động, sáng tạo; • Nhờ CNTT và mạng Internet, phụ huynh có thể tham gia tích cực vào các hoạt động của nhà trường. Trong báo cáo tiếp theo tại Hội thảo, Ông Bùi Hoàng Tiến, Giám đốc Trung tâm Ứng dụng Công nghệ mạng Internet (Cita) đã đề cập đến “Thực trạng ứng dụng mạngInternet và Phần mềm trong quản lý và đào tạo tại một số trường phổ thông trung học của TP.HCM”. Đây là kết quả của các cuộc khảo sát tình hình mua sắm trang thiết bị tin học và ứng dụng CNTT trong các trường THPT lớn tại các Quận 1,3,5, Bình © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 6 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) Thạnh, Tân Bình (các trường THPT Bùi Thị Xuân, Nguyễn Thị Minh Khai, Lê Hồng Phong, Nguyễn Thượng Hiền, Marie-Curie, Hùng Vương). Báo cáo của ông Bùi Hoàng Tiến cho thấy một số trường điểm của thành phố đã được trang bị khá đầy đủ về máy tính, cá nhân xây dựng các phòng thực hành tin học. Một số trường còn có cả phòng truy cập Internet. Tuy nhiên trong lĩnh vực ứng dụng CNTT và xây dựng phần mềm trợ giúp quản lý, đào tạo thì còn rất hạn chế, trong khi nhu cầu và mong muốn của đa số lãnh đạo và thày cô giáo tại các trường là rất lớn. Một số nhu cầu cơ bản được đề cập nhiều nhất là: • Xây dựng hệ thống website của trường để tự giới thiệu, tạo mối quan hệ gắn bó hơn giữa nhà trường và phụ huynh, xã hội, tạo thuận lợi trong giao dịch, kết nghĩa, nhận các tài trợ giúp đỡ từ các tổ chức khác trong và ngoài nước. • Cho phép phụ huynh có thể truy cập các thông tin về đào tạo của nhà trường về các mặt: tổ chức giáo viên, lịch học, thực hành, thi cử và các hoạt động ngoại khoá khác. Đặc biệt nhu cầu của phụ huynh đối với việc theo dõi kết qủa học tập của con em mình trên mạng là rất lớn, giúp làm cầu nối liên lạc giữa nhà trường, gia đình và xã hội. • Xây dựng nội dung thông tin đa dạng và phong phú, đặc biệt là ứng dụng thư viện điện tử, các dịch vụ Internet trên mạng sẽ góp phần thúc đẩy việc tự học của học sinh, nhu cầu cập nhật và đổi mới trình độ của giáo viên. • Trong nhà trường còn rất thiếu các phần mềm thích hợp đề làm công tác quản lý, dạy và học, đặc biệt là các phần mềm chạy trên các website. Thay mặt nhóm nghiên cứu Đề tài, TS. Hoàng Lê Minh, Giám đốc Trung tâm Công nghệ Phần mềm ĐHQG–HCM đã chia xẻ cùng các đại biểu một số kinh nghiệm trong triển khai các đề án tin học hoá, ứng dụng CNTT và phần mềm đã thực hiện trong những năm vừa qua cho ngành Giáo dục. TS. Minh đề xuất giải pháp hỗ trợ các trường THPT xây dựng website trên nền công nghệ cổng thông tin (Portal) với khả năng quản lý thông tin và bảo mật cao, tiến tới hình thành một hệ thống thông tin giáo dục thật sự có hiệu qủa cho phát triển ứng dụng mà trong đó các giải pháp tiên tiến về phát triển phần mềm tin học sẽ đóng vai trò quan trọng, quyết định cho sự thành công. Trong phần các báo cáo và tham luận của các đại biểu tại hội thảo, đã nêu lên nhiều vấn đề thực tế và nhu cầu cấp bách trong ứng dụng CNTT và viễn thông-Internet vào nhà trường, đón đầu sự phát triển tất yếu của nền kinh tế nước nhà theo xu hướng mở cửa, hội nhập chung. Ông Vũ Thiện Căn, tổ trưởng Tổ Giáo viên Tin học- Trường THPT chuyên Lê Hồng Phong đã có bài phát biểu và minh hoạ các thành công bước đầu của nhà trường trong việc ứng dụng CNTT vào dạy một số môn chuyên như Toán, Tin học, Hóa, Lý, Ngoại ngữ. Qua các ý kiến đóng góp của các đại biểu tại hội thảo, có thể thấy rằng nhu cầu ứng dụng mạng Intranet/Internet để khai thác tài liệu và phần mềm của ngành giáo dục phổ thông là rất lớn. Hiện tại các trường THPT và các địa phương đang cần sự trợ giúp kỹ thuật để có thể xây dựng phương án khai thác mạng nội bộ và đưa CNTT vào hoạt động một cách có hiệu quả cao với chi phí thấp, nhằm tránh tình trạng máy móc được trang bị đầy đủ, nhưng không đồng bộ nên không thể sử dụng, hoặc không sử dụng hết công suất gây lãng phí về đầu tư. Để tạo chuyển biến lớn trong việc ứng dụng CNTT và truyền thông vào trong hoạt động giáo dục phổ thông, rất cần các giải pháp hữu ích, đặc biệt các giải pháp ứng dụng © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 7 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) mạng, ứng dụng phần mềm nguồn mở, nhằm giúp Ban Giám hiệu các trường và cơ quan quản lý ngành tiếp cận các thông tin mới, tránh bệnh hình thức, lãng phí trong quá khứ. 1.2 Nhu cầu và giải pháp xây dựng các hệ thống thông tin quản lý Xây dựng và quản lý một Hệ thống Thông tin (HTTT) ở quy mô toàn cục (còn gọi là hệ thống thông tin quy mô doanh nghiệp) bao giờ cũng là một vấn đề rất quan trọng và cốt lõi trong bất cứ kế hoạch ứng dụng CNTT, ngắn hạn hay dài hạn, của mọi cơ quan, tổ chức doanh nghiệp hoạt động trong bất cứ lĩnh vực nào (quản lý, sản xuất kinh doanh, giáo dục, văn hoá, y tế, ... ). Xuất phát từ mục tiêu xây dựng HTTT là để nhằm tăng cường lượng thông tin được khởi tạo, lưu trữ, trao đổi và khai thác trên mạng máy tính, việc lựa chọn một giải pháp nền để xây dựng HTTT trở thành vấn đề quan trọng hàng đầu, cần được ưu xem xét giải quyết trước để tránh các bất cập và lãng phí về sau. Thực tế hiện nay, phần lớn các hạng mục xây dựng HTTT quản lý đang được triển khai rộng rãi trong các trường, các tỉnh thành và địa phương đều bao gồm: 1. Hệ thống thống thông tin website, phục vụ cho đông đảo người dùng. Thông tin website dùng cho đối tượng người dùng ở bên trong và bên ngoài tổ chức mô tả cơ cấu, chức năng, nhiệm vụ, thông báo về các hoạt động thường xuyên, tạo mối liên kết đến các website và thông tin cơ sở dữ liệu khác nhau. Nền tảng để duy trì hoạt động của mỗi website là hệ thống quản trị nội dung (CMS). Nhưng hạn chế của phần lớn các phần mềm CMS cho website lại chính là khả năng kết nối thông tin tới các cơ sở dữ liệu động và các ứng dụng trên web. 2. Hệ thống thông tin điều hành tác nghiệp, phục vụ lãnh đạo, quản lý. Người lãnh đạo của cơ quan, đơn vị quản lý hành chính như tỉnh, thành phố hoặc ban giám hiệu các trường đại học, cao đẳng, phổ thông đều có nhu cầu phải theo dõi các thông tin diễn ra hàng ngày, trong nội bộ và của các cơ quan cấp trên, cấp dưới đề phục vụ công tác điều hành, ra quyết định, chỉ đạo các bộ phận trực thuộc, kịp thời, trong môi trường mạng thông tin hợp nhất. Điển hình cho các dứng dụng loại này là các ứng dụng quản lý văn bản, hồ sơ, công việc, lập lịch, trao đổi thông tin qua e-mail, nhóm làm việc cộng tác, v.v... 3. Hệ thống các phần mềm ứng dụng, quản lý, cho phép truy cập tới các kho dữ liệu và cơ sở dữ liệu, thực hiện việc trao đổi, tích hợp thông tin với nhiều hệ thống khác. Đó là các phần mềm chuyên dụng, mang tính đặc thù cao cho mỗi hệ thống thông tin, như phần mềm quản lý chương trình đào tạo, quản lý điểm, quản lý thư viện, cung cấp giao tiếp quan mạng để đăng ký dịch vụ từ xa, hỗ trợ thương mại điện tử, v.v... Vấn đề quan trọng là làm sao cho các phần mềm này có thể “trao đổi thông tin” và “tích hợp dữ liệu” được với nhau, trong một khuôn khổ chung và thống nhất của mỗi tổ chức. Tất cả các thành phần nêu trên sẽ tạo ra một Hệ thống thông tin quản lý. Tuy nhiên, nếu đi sâu phân tích các kết quả đạt được trong lĩnh vực này tại nước ta nói chung, và trong lĩnh vực giáo dục, đào tạo nói riêng thì kết quả còn rất khiêm tốn. Thực tế là nhiều cơ quan quản lý, các bộ ngành, địa phương, các trường, viện, v.v.. còn đang rất lúng túng trong lựa chọn giải pháp, lựa chọn sản phẩm cũng như hình thức và lộ trình triển khai xây dựng HTTT. Đã nhiều nơi, nhiều lúc các nhà quản lý đề cập tới đến vấn đề phải dùng chung các phần mềm, dùng chung các cơ sở dữ liệu, thống nhất các chuẩn trao đổi thông © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 8 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) tin và dữ liệu trên mạng diện rộng ... nhưng “lực vẫn bất tòng tâm”, do khúc mắc ở khâu chia sẻ dùng chung các thông tin và cơ sở dữ liệu. Thực tế các đơn vị dù triển khai phần mềm dùng chung, thẩm chí miễn phí cho không nhưng vẫn không xây dựng được hệ thống thông tin quản lý. Trong quá trình khảo sát thực trạng để tìm kiếm giải pháp cho vấn đề trên, chúng tôi chưa tìm được câu trả lời tổng quát. Tuy nhiên, với định hướng phát triển các phần mềm nguồn mở, tuân thủ các chuẩn mở, đặc biệt trong môi trường giáo dục – đào tạo, sẽ sớm mở ra khả năng lôi kéo sự tham gia của số đông các công ty phần mềm và dịch vụ tin học, mở ra mô hình kinh doanh dịch vụ dựa trên phần mềm nguồn mở, dựa trên các chuẩn mở thay thế cho các phần mềm thương mại. Việc làm này sẽ góp phần giải quyết bài toán xây dựng HTTT với chất lượng cao hơn, chi phí thấp hơn hiện nay ! Với niềm tin như vậy, nhóm đề tài hy vọng sẽ mang những đóng góp thiết thực của mình tới cộng đồng CNTT nói chung và ngành giáo dục đào tạo nói riêng, bằng kết quả nghiên cứu của mình. 1.3 Một số vấn đề trong quản lý và trao đổi thông tin trên mạng Thông tin và tri thức Trong thế giới hiện đại, mọi hoạt động của con người đều cần đến thông tin:  Thông tin về giá cả, thị trường, khách hàng và đối tác cho các hoạt động sản xuất kinh tế, kinh doanh thương mại.  Thông tin về các chính sách, pháp luật, thuế, tiền tệ, dân số, lao động, đất đai, môi trường cho hoạt động quản lý kinh tế và quản lý nhà nước.  Thông tin về văn hoá, khoa học và giáo dục tập trung chủ yếu ở hoạt động Thông tin Thư viện. Để có được các thông tin cần thiết, phải hình thành các kho dữ liệu, thu thập và tổ chức thông tin trong các cơ sở dữ liệu và tạo điều kiện cho người sử dụng truy tìm những thông tin cần thiết theo nhu cầu riêng của mình. Phần lớn trong chúng ta đều nhận thức được rằng để có thể hình thành được những nguồn thông tin có giá trị và khai thác hiệu quả chúng, cần phải thiết lập những kho dữ liệu thông tin mà hạt nhân của chúng là các hệ quản trị cơ sở dữ liệu. Tuy nhiên đây mới chỉ là một công đoạn đầu tiên trong cả quá trình. Để biến thông tin thành tri thức, chúng phải được chuyển tải tới người sử dụng theo các yêu cầu về tìm kiếm dữ liệu và dựa vào một giao tiếp với CSDL. Đồng thời dữ liệu trong các kho dữ liệu phải được bổ xung, cập nhật, trao đổi, phân phối và di chuyển tương đối dễ dàng để có thể trở thành những hệ thống thông tin phong phú, rộng rãi, đáp ứng các nhu cầu khác nhau của người sử dụng. Trong thời đại của cuộc cách mạng thông tin, những người sử dụng Thông tin – Thư viện cần có một hệ thống liên kết Thư viện hoạt động trên nền tảng các Thư viện Điện tử trong đó mọi thông tin chủ yếu đều được số hoá để có thể dễ dàng trao đổi trên mạng máy tính Internet. Mạng Internet và truy cập thông tin Chúng ta thử điểm qua một số công nghệ chủ yếu ngày nay giúp cho việc hình thành các kho dữ liệu và phân phối các thông tin trên mạng máy tính Internet. © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 9 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) Công nghệ World-Wide Web ra đời vào những năm 90 của thế kỷ XX đã cho phép phân phối các dữ liệu phi cấu trúc, bao gồm các thông tin dạng văn bản, hình ảnh, âm thanh. Để tìm kiếm và truy cập được các thông tin hữu ích trên mạng, các thông tin này thường được đặt tại các vị trí web (website), người sử dụng phải vào được các địa chỉ chứa chúng. Để thực hiện việc tìm kiếm, chúng ta có thể sử dụng các máy tìm kiếm trên mạng (seach engine) là nơi đã tìm và lưu trữ trước các địa chỉ web. Các thông tin thường được sắp xếp theo chủ đề (subject) hoặc theo một từ khoá (keyword) nào đó. Mạng Internet ra đời và phát triển chứng tỏ tính ưu việt trong khai thác thông tin. Ngày nay Internet đã trở thành một kho dữ liệu thông tin khổng lồ, chứa đựng kiến thức mà nền văn minh nhân loại đã tích lũy hàng trăm năm, và lượng thông tin trên mạng Internet cũng không ngừng được bổ xung hàng phút, hàng giờ. Theo số liệu của máy tìm kiếm thông tin Google, đến thời điểm tháng 12/2006 đã có 6 tỷ trang web chứa đựng thông tin hữu ích. Riêng trên mạng Internet Việt nam ước tính tại thời điểm hiện nay (12/2006) đã có cả hàng chục triệu trang thông tin tiếng Việt. Tuy nhiên vì tính chất quá rộng lớn của kho tài nguyên thông tin Internet nên người ta phải xây dựng các website có chức năng các cổng thông tin (Information Portal) để tập hợp các thông tin chuyên sâu về từng lĩnh vực hẹp hơn, như thương mại, thị trường chứng khoán, thông tin du lịch, giải trí, văn hoá, khoa học, giáo dục, v.v… Xu thế chung trong lĩnh vực khai thác thông tin Internet là mỗi quốc gia, mỗi bộ ngành, địa phương và từng đơn vị phải thiết lập các website hay portal để cung cấp thông tin phục vụ cho nhu cầu khai thác thông tin của chính mình. Nền tảng công nghệ chủ yếu giúp chuyển giao thông tin trên mạng Internet tới người sử dụng là các hệ thống máy chủ web (webserver), nơi thông tin được lưu trữ, và trình duyệt web (web browser), nơi người dùng có thể để truy cập và xem các thông tin dưới dạng văn bản, đồ hoạ, thưởng thức các thông tin đa phương tiện. Ngôn ngữ trình bày trang siêu văn bản HTML (Hyper Text Markup Language) cho phép chuyển tải thông tin tới người dùng với khả năng trình bày rất phong phú và đa dạng. Các nguồn thông tin có thể được trích ra từ các cơ sở dữ liệu, theo yêu cầu của người sử dụng và tạo nên những trang Web sinh động và hấp dẫn. Trong lĩnh vực Thông tin – Thư viện, đã hình thành những địa chỉ trên mạng Internet mà tại đó người sử dụng có thể thực hiện những tìm kiếm thông tin có cấu trúc, được lưu trữ trong các cơ sở dữ liệu bằng giao tiếp thông qua trình duyệt Web của mình. Các hệ thống này sử dụng công nghệ kết nối cơ sở dữ liệu với giao diện dựa trên web: Web-based Database Interface. Đây là một công nghệ mới và đang phát triển rất nhanh chóng, với ứng dụng ngày càng mở rộng và phong phú không chỉ cho lĩnh vực CSDL mà còn cho hầu như tất cả các ứng dụng khác cần đến giao tiếp tiện lợi, từ xa với người sử dụng, như mua bán trên mạng trong thương mại điện tử. Nội dung chủ yếu của công nghệ giao tiếp web là thay vì sử dụng các phần mềm giao tiếp có sẵn của các hệ quản trị cơ sở dữ liệu như Oracle, MS Access, MS SQL Server (phần lớn được lập trình theo mô hình khách/phục vụ), người ta viết thêm các thành phần giao tiếp CSDL và tích hợp với hoạt động của máy chủ web theo các chuẩn giao tiếp CGI (Common Gataway Interface), API (Application Programming Interface) hoặc trên nền tảng công nghệ Java (Servlet/JSP/EJB). © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 10 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) Chúng ta giao tiếp với cơ sở dữ liệu chỉ cần thông qua một trang web thông thường, những bên dưới nó là cả một nền tảng công nghệ hết sức phức tạp và tinh tế, giúp kết nối và chuyển giao dữ liệu từ website là nơi đặt cơ sở dữ liệu đến người sử dụng thông qua mạng Internet. Với công nghệ dựa trên web này, dữ liệu trong các cơ sở dữ liệu đã có thể đến với người sử dụng cũng tiện lợi như các thông tin văn bản, hình ảnh, âm thanh mà chúng ta vẫn tải về từ các website. Những hạn chế của trao đổi dữ liệu truyền thống trên mạng Internet Nếu như vấn đề chuyển giao dữ liệu từ các kho dữ liệu đến người sử dụng thông qua mạng Internet đã có thể giải quyết tương đối tốt đẹp bằng công nghệ Web, sử dụng giao tiếp web và ngôn ngữ trình bày siêu văn bản HTML, thì vấn đề trao đổi dữ liệu giữa các hệ thống thông tin, các kho dữ liệu lại là vấn đề khá nan giải. Mặc dù ngày nay chúng ta đã có mạng Internet như một phương tiện chuyển tải thông tin rất nhanh chóng, nhưng mạng Internet với kiến trúc đặc thù riêng lại không giống như những mạng máy tính cục bộ, nơi mà các dữ liệu có thể trao đổi dễ dàng bằng những phương pháp truyền thống và đơn giản như sao chép (copy), nhân bản (replication), hoặc xuất nhập trực tiếp với sự trợ giúp của các phần mềm chuyên dụng. Việc triển khai một ứng dụng liên quan đến cơ sở dữ liệu trên mạng Internet hoàn toàn không giống như trên mô hình mạng cục bộ, thậm chí nhiều phần mềm hoạt động tốt trên mạng cục bộ lại không thể chạy trên mạng Internet. Điển hình là những hệ thống thông tin do các bộ - ngành và các địa phương xây dựng nhiều năm qua, phần lớn dựa trên mô hình mạng cục bộ với những phần mềm CSDL chuyên dụng đắt tiền nhưng lại không thích hợp để trao đổi, chuyển giao và nhân bản một cách tự động qua mạng diện rộng và mạng Internet. Do đó mỗi khi cần trao đổi dữ liệu, người ta phải truy cập từ xa bằng điện thoại đường dài, hoặc bằng các mạng thuê bao dùng riêng rất tốn kém. (Nhiều hệ thống Thông tin Tư liệu Quốc gia đặt tại Hà nội khi muốn truy cập phải sử dụng điện thoại liên tỉnh để kết nối). Ở đây chưa bàn đến vấn đề bảo mật thông tin khi cần trao đổi qua mạng, mà mới thử tìm hiểu lý do kỹ thuật nào cản trở khả năng trao đổi dữ liệu, qua đó xem xét các giải pháp khắc phục tối ưu nhất. Mạng Internet bản thân nó có một kiến trúc tương đối phức tạp, với nhiều hệ thống mạng máy tính khác nhau kết nối với nhau thông qua nhiều phương thức và nhiều thiết bị nối mạng. Trên mạng lại tồn tại rất nhiều cửa ngõ kiểm soát, ngăn chặn thông tin bằng cơ chế khoá cổng dịch vụ (service ports) của các bức tường lửa (firewall), hoặc đơn thuần bằng các dịch vụ ủy quyền (proxy service) chỉ có khả năng kết nối theo một chiều. Thí dụ khi chúng ta kết nối qua điện thoại hay một mạng dùng riêng để truy cập ra Internet, phần lớn chúng ta chỉ được cấp những địa chỉ IP giả (private IP) do đó không thể vận hành cơ chế trao đổi thông tin trên mạng Internet bằng những phần mềm khách/dịch vụ (client/server) đòi hỏi phải tạo được những kết nối riêng theo cơ chế ổ cắm (socket). Trong trường hợp trao đổi tư liệu Thông tin - Thư viện, phương pháp liên kết thư viện theo chuẩn quốc tế Z39.50 hoàn toàn không thích hợp và không chạy được trên mạng Internet Việt nam, là nơi số lượng địa chỉ IP thực được cấp rất hạn hẹp, với hầu hết các mạng dùng riêng kết nối Internet thông qua dịch vụ ủy quyền và các bức tường lửa. Muốn trao đổi thông tin thông suốt, bắt buộc chúng ta phải tự giới hạn trong môi trường của các dịch vụ Internet phổ biến như World-Wide Web, Internet E-mail, FTP (File Transfer Protocol). Nghi thức truyền tập tin FTP và E-mail là hai dịch vụ ra đời khá sớm trên mạng Internet, giúp con người trao đổi các thông tin riêng tư rất hiệu quả nhờ vào cơ chế hoạt © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 11 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) động đơn giản. Tuy nhiên ứng dụng của chúng trong trao đổi thông tin giữa các cơ sở dữ liệu còn rất hạn chế vì đòi hỏi sự can thiệp của con người. Bản thân dữ liệu thông thường tự nó không chứa đựng những thông tin cần thiết để có thể tự động nhập vào các kho thông tin và các cơ sở dữ liệu khi được chuyển giao bằng FTP hay E-mail ! Dịch vụ WWW có rất nhiều hứa hẹn nhưng bản thân ngôn ngữ chuyển tải thông tin HTML lại không thích hợp để trao đổi dữ liệu. Chúng ta không thể tổ chức một cơ sở dữ liệu tại chỗ chỉ bằng cách tải xuống các trang web chứa thông tin đã được định dạng bằng ngôn ngữ HTML, dù cho các thông tin này có cấu trúc, thậm chí được lấy ra từ một cơ sở dữ liệu nào đó. Để tiếp nhận thông tin và đưa vào cơ sở dữ liệu thông qua mạng Internet, nghĩa là lấy thông tin từ xa, dường như chỉ có cách nhập dữ liệu qua các trang web chứa các form nhập liệu, hoặc bằng cách chuyển tải dữ liệu từ xa về và … tự nhập lấy! Với cách thức trao đổi dữ liệu như hiện nay, nhất là từ các dữ liệu của các kho tư liệu Thông tin-Thư viện thì dù có dùng đến mạng Internet để chuyển tải thông tin, bắt buộc các nhà quản trị Thông tin - Thư viện phải tham gia vào nhiều công đoạn từ chuẩn bị dữ liệu, chuẩn hoá các phần mềm nhập liệu và các hệ quản trị cơ sở dữ liệu cũng như bản thân quá trình nhập dữ liệu. Các lý do nêu trên đã cản trở rất nhiều quá trình trao đổi thông tin và ứng dụng CNTT trong hoạt động Thư viện, đôi khi làm tiêu tốn cả bạc tỷ mà vẫn không giải quyết được vấn đề quan trọng nhất là thông tin phải dễ dàng trao đổi giữa các hệ thống và nhanh chóng đến được với người cần sử dụng chúng. Ngôn ngữ đánh dấu mở rộng XML và trao đổi dữ liệu trên mạng Giải pháp thích hợp cho vấn đề trao đổi dữ liệu tự động giữa các kho thông tin và các cơ sở dữ liệu trên mạng Internet là áp dụng ngôn ngữ đánh dấu mở rộng XML (eXtensible Markup Language) Đây là vấn đề thời sự nóng bỏng nhất hiện nay của CNTT trên thế giới nhưng dường như vẫn chưa được các nhà hoạch định chính sách CNTT chúng ta quan tâm đến, để nhanh chóng áp dụng vào thực tế. Trong khi đó vấn đề xây dựng các kho dữ liệu thông tin quốc gia và các ngành đang được triển khai với nhiều nguồn kinh phí không nhỏ (Riêng tại Tp HCM, kinh phí để tổ chức và xây dựng các kho thông tin dữ liệu phục vụ quản lý xã hội và quản lý kinh tế lên đến hàng chục, hàng trăm tỷ đồng). Bản thân ngôn ngữ XML có nguồn gốc từ ngôn ngữ định dạng siêu văn bản HTML, cả hai ngôn ngữ này đều bắt nguồn từ chuẩn ngôn ngữ định dạng văn bản tổng quát có cấu trúc SGML (Structured General Markup Language). Một văn bản XML hình thành từ các thẻ (tag) với tên gọi phần tử (element). Nhưng khác với ngôn ngữ HTML, số lượng và tên gọi các phần tử trong XML là không hạn chế. Đối với các thông tin đã có cấu trúc, như thông tin trong các cơ sở dữ liệu, việc mô tả chúng bằng văn bản XML là rất dễ dàng và chính xác. Ví dụ thông tin về danh sách nhân viên trong bảng lương sau đây: Bảng lương nhân viên Công ty Lương thực Thành Phố STT Họ Tên Chức vụ Lương chính 1 Nguyễn An Ninh Giám đốc 5.000.000 0,7 2 Trần Thị Thanh Thuý Trợ lý giám đốc 1.500.000 0,3 3 Phạm Văn Bảy Trưởng phòng tài vụ 2.500.000 0.5 © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở Phụ cấp 12 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) Tài liệu XML tương ứng cho các dữ liệu trong bảng trên như sau : Bảng lương nhân viên Công ty Lương thực Thành phố Nguyễn An Ninh Giám đốc 5000000 0,7 Trần Thị Thanh Thuý Trợ lý giám đốc 1500000 0,3 Phạm Văn Bảy Trưởng phòng tài vụ 2500000 0,5 Tài liệu XML như trên rất dễ dàng có thể tạo ra bằng bất cứ trình soạn thảo văn bản nào, tương tự như văn bản HTML, tuy nhiên để có thể sử dụng nó cho trao đổi thông tin, cần phải tuân thủ một số quy tắc sau: Well-Formed: văn bản XML là well-formed khi nó được viết theo cú pháp phù hợp với đặc tả XML của tổ chức W3C. Các phần tử hình thành một cây phân cấp có chung một phần tử gốc (root element). Các phần tử có thể chứa một hay nhiều phần tử con xếp lồng vào nhau. Trong thí dụ trên các phần tử NAME, POSITION, SALARY, PERCENT là con của phần tử EMPLOYEE. Tất cả đều có chung một gốc là SALARYTABLE. Tuy nhiên phần tử TABLENAME không cùng cấp với phần tử NAME theo mối quan hệ cha con. Well-Validated: văn bản XML được gọi là well-validated thì trước hết nó phải là văn bản well-formed và phải phù hợp với tất cả các định nghĩa trong một đặc tả chung cho các văn bản có cùng cấu trúc, gọi là DTD (Document Type Definition). Các định nghĩa này cũng tương tự như định nghĩa dữ liệu trong các bảng của cơ sở dữ liệu về kiểu biến (data type), độ dài dữ liệu (size), và các mối quan hệ khác (key, not null …). Nói cách khác, văn bản XML được coi là valided nếu nó không chứa bất kỳ phần tử nào mà không được định nghĩa trước trong DTD và thứ tự xuất hiện, số lần xuất hiện của một phần tử phải phù hợp với các đặc tả của DTD. Để có thể trao đổi thông tin có cấu trúc, hai cơ sở dữ liệu phải thống nhất dùng chung một đặc tả DTD cho các văn bản XML. Tuy nhiên với các văn bản phi cấu trúc thì không nhất thiết phải tuân thủ hoàn toàn chuẩn về tính Valided của một tài liệu XML, mà chỉ cần một phần trong chúng chứa những thông tin hữu ích giúp cho việc mô tả tính chất và nội dung của bản thân tài liệu. Các thông tin mô tả này còn gọi là Meta-Data (Dữ liệu mô tả về các dữ liệu). © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 13 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) Các văn bản XML với một số thông tin mô tả kèm theo cũng dưới dạng văn bản XML có thể dễ dàng chuyển giao trên mạng Internet, tương tự như các tập tin HTML. Nhưng chúng không trực tiếp dành cho con người mà dành cho các hệ thống tự động xử lý thông tin để nhập vào các cơ sở dữ liệu. Quá trình xử lý các văn bản XML và các phần mềm dùng để xử lý chúng còn gọi là các bộ XML Parser. Các phần mềm này cũng có vai trò tương tự như các trình duyệt thông tin Web, chỉ có khác là các bộ XML Parser này dành cho các phần mềm và chương trình máy tính để thực hiện quá trình tự động xử lý và nhập/xuất dữ liệu thay cho con người. Tuy ý tưởng về một ngôn ngữ văn bản giúp tự động hoá quá trình nhập/xuất/trao đổi dữ liệu giữa các kho dữ liệu như ngôn ngữ XML là hết sức đơn giản, nhưng hiệu quả mà nó đem lại rất to lớn, giúp chúng ta có thể giải quyết những vấn đề còn vướng mắc trong quá trình trao đổi thông tin CSDL trên mạng Internet. XML như ngôn ngữ đánh dấu văn bản đã được thiết kế để mô tả dữ liệu. Các thẻ được sử dụng trong XML không được định nghĩa sẵn như trong HTML mà lập trình viên phải tự định nghĩa các thẻ này. HTML được thiết kế để hiển thị dữ liệu và tập trung vào cách hiển thị dữ liệu như thế nào. Trong khi đó XML là ngôn ngữ chỉ được dùng để mô tả dữ liệu và tập trung vào ý nghĩa của dữ liệu. Ngôn ngữ này không xử lý được dữ liệu do đó phải cần đến các công cụ để xử lý dữ liệu như các trình phân tích và xử lý tài liệu XML (SAX, DOM), các ngôn ngữ định dạng dữ liệu (XSL), các giao diện lập trình ứng dụng hỗ trợ cho việc truy xuất các thành phần trong tài liệu XML. XML có thể được dùng để trao đổi thông tin trên mạng thông qua các phương tiện trao đổi khác nhau giữa các chương trình ứng dụng. Trong tương lai XML sẽ được dùng để tổ chức và mô tả các dữ liệu trên Web trong khi HTML sẽ chỉ được dùng để định dạng và hiển thị dữ liệu, bên cạnh các nghi thức kha như WML, SVG, MathML, VRML, ...  XML là công cụ để tạo nên dữ liệu có cấu trúc trong tập tin dạng văn bản.  Có thể sử dụng XML để tạo, hiển thị và xử lý trên các cấu trúc dữ liệu phức tạp như cấu trúc cây, cấu trúc bảng.  XML được mô tả rõ ràng và có cấu trúc hệ thống rất thuận lợi trong công việc tìm kiếm thông tin dựa trên các thẻ trong tài liệu XML.  Cho phép kết nối nhiều tài liệu XML, tạo thành một tài liệu XML mới.  XML được sử dụng để tạo nên cấu trúc và mô tả dữ liệu, thích hợp cho các ứng dụng có nhiều người dùng sử dụng chung dữ liệu.  Tài liệu XML có thể trao đổi trên mạng thông qua các phương tiện khác nhau giữa các chương trình ứng dụng.  Xử lý được tất cả các ký tự dấu ở các ngôn ngữ khác nhau do XML mã hóa theo chuẩn ISO-10646. (Unicode). XSL - Ngôn ngữ định dạng mở rộng XSL là ngôn ngữ dựa trên XML, được thiết kế để chuyển đổi một tài liệu XML thành một tài liệu XML khác hoặc chuyển đổi một tài liệu XML thành các đối tượng thể hiện (rendition object). Ngôn ngữ XSL gốc được chia thành ba ngôn ngữ riêng lẻ, ngôn ngữ chuyển đổi (XSLT), Ngôn ngữ thể hiện (XSLF - gồm cách sử dụng của XSLT), ngôn ngữ truy cập cấu trúc bên dưới của XML (Xpath). © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 14 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) PHẦN II. XU HƯỚNG PHÁT TRIỂN PHẦN MỀM ỨNG DỤNG TRÊN MẠNG MÁY TÍNH 2.1 Lựa chọn giải pháp công nghệ nền Ngành Công nghệ phần mềm trong khoảng thời gian 10 năm (1995-2005) đã có những bước tiến bộ vượt bậc, đặc biệt từ sau khi xuất hiện máy vi tính cá nhân, mạng máy tính Internet và sự tiến bộ không ngừng của kỹ thuật phần cứng làm giảm giá thành, tăng hiệu năng tính toán và cơ hội ứng dụng phần mềm trên mạng. Những năm 1990, tại Việt nam bắt đầu xuất hiện các phần mềm tin học đầu tiên được viết bằng ngôn ngữ Basic, Pascal, những hệ quản trị cơ sở dữ liệu trên nền ngôn ngữ FoxPro. Đặc trưng của giai đoạn này là các phần mềm được phát triển giữa trên nền giao diện DOS (DOS-based), có thể sử dụng mạng vi tính ở mức độ chia sẻ tập tin, với khả năng bảo mật còn non yếu. Sau đó, với sự ra đời của hệ điều hành đồ hoạ MS Windows, rất nhiều ứng dụng được chuyển qua nền giao diện đồ hoạ tiện lợi, phong phú. Các phần mềm phát triển trên môi trường MS Windows (windows-based) được hỗ trợ bởi các công cụ lập trình, các thư viện tiện ích phong phú và nhất là do tình trạng bản quyền lỏng lẻo, sao chép lậu phần mềm ngày càng dễ dàng nên đã góp phần tạo ra một trào lưu phát triển ứng dụng trên Windows khá sâu rộng trong giới CNTT nưôc nhà. Chỉ mới gần đây, khi mạng Internet ngày càng xâm nhập rộng rãi, các giải pháp phần mềm trên nền website (web-based) mới được chú trọng và ngày càng tỏ rõ vai trò chủ đạo cho các ứng dụng Tin học hoá quy mô lớn, xoá đi sự khác biệt giữa các phần mềm trên nền Windows và không phải Windows (như UNIX/Linux). Tuy nhiên, theo nhận định của nhóm nghiên cứu chúng tôi, xu hướng phát triển phần mềm dựa trên nền tảng các cổng thông tin (portal-based) mới là xu hướng chủ đạo cho các ứng dụng đã và đang được triển khai mới hiện nay của thế giới. Đây thực sự là một thách thức đối với nền công nghệ phần mềm non trẻ của Việt nam còn chưa kịp tiếp cận các nền tảng và công nghệ website. Căn cứ vào những nghiên cứu trên, kết hợp với nhu cầu thực tế, nhóm nghiên cứu chúng tôi đã quyết định dầu tư nghiên cứu khả năng áp dụng phần mềm cổng thông tin và phát triển phần mềm cho cổng thông tin. Mục tiêu của nghiên cứu này để giúp đánh giá giải pháp công nghệ trước khi quyết định đầu tư phát triển ở quy mô lớn. Đây là phương pháp tiếp cận khoa học và thực tiễn một vấn đề mới, theo cách gọi của các nhà công nghệ là sự chứng minh quan điểm. Cho đến hiện tại, các kết quả mà chúng tôi đã đạt được đều dựa trên phương pháp tư duy này. Thực sự đây là giải pháp rất hiệu quả để phát triển sản phẩm CNTT, tránh các quyết định đầu tư có thể dẫn đến lãng phí thời gian và nhân lực. Cổng thông tin không phải là một phát kiến mới, mà là kết qủa tất yếu của sự phát triển trong lĩnh vực công nghệ phần mềm trên mạng, khi nhu cầu tích hợp thông tin và ứng dụng trở nên rõ ràng. Chúng ta hãy hình dung một tổ chức, cơ quan khi tin học hoá phải phát triển và khai thác hàng chục ứng dụng CNTT, hàng trăm phần mềm các loại, mà mỗi phần mềm đều đòi hỏi các cơ chế truy xuất dữ liệu, cơ chế bảo mật riêng. Khi đó, ngay việc ghi nhớ các mật khẩu để đăng nhập quản trị và bảo trì phần mềm đã là cơn ác mộng cho các chuyên gia CNTT, chưa nói đến người sử dụng thông thường ! Điều này cũng giống như khi còn đói thông tin, chúng ta sẵn sàng ngồi tra cứu trên Internet để xem tất cả các tài liệu nào có thể tiếp cận được, nhưng khi đã có một rừng các thông tin thì việc tập hợp chúng lại trong một website, trong cơ sở dữ liệu và dùng các công cụ, các máy tìm kiếm thông tin là điều bắt buộc. © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 15 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) Trong thời gian tiến hành đề tài nghiên cứu tại Trung tâm Công nghệ Phần mềm ĐHQG-HCM, chúng tôi đã tổ chức ba đợt tập huấn giới thiệu công nghệ cổng thông tin và phát triển phần mềm, cho đối tượng là sinh viên hệ chính quy các Khoa CNTT, Khoa Toán-Tin học, các lập trình viên của một số công ty phát triển phần mềm tại TP.HCM. Kết quả đào tạo tuy mới ở bước khởi đầu, nhưng theo đánh giá của nhóm đề tài là rất khả quan. Các lập trình viên Việt nam hoàn toàn có khả năng nắm bắt công nghệ mới rất nhanh chóng, và có thể ứng dụng chúng để phát triển ra các sản phẩm phần mềm (trong nền tảng cổng thông tin) với chất lượng cao, không thua kém sản phẩm của các công ty chuyên phần mềm nước ngoài. Trong các chuyến công tác tại Nhật bản và Hoa kỳ, chủ nhiệm đề tài, TS. Hoàng Lê Minh đã có cơ hội tiếp xúc với một số chuyên gia nước ngoài phát triển phần mềm để trao đổi về sản phẩm phần mềm cổng thông tin iPortal được phát triển dựa trên khung phần mềm cổng thông tin mã nguồn mở uPortal do hơn 20 trường Đại học tại Hoa kỳ và Châu Âu, nhận tài trợ của Quỹ Andrew Melon, phát triển. Kết quả ban đầu là đáng khích lệ. Tổ chức Jasig (Java in Administration Special Interest Group, một tổ chức của các giới thiệu website ĐHQG-HCM với phần mềm cổng thông tin Việt hoá iPortal do nhóm nghiên cứu thực hiện tại Trung tâm CNPM ĐHQG (UniSoft), minh chứng cho sự lựa chọn công nghệ nền để phát triển ứng dụng mạng Intranet/Internet của nhóm nghiên cứu từ năm 2002. 2.2 Giải pháp phát triển phần mềm dựa trên kiến trúc đa tầng J2EE Ðể thoả mãn các yêu cầu xây dựng những ứng dụng lớn quy mô xí nghiệp, Công ty Sun Microsystems đã đưa ra mô hình phát triển ứng dụng dựa trên nền tảng công nghệ Java cho xí nghiệp J2EE (Java2 Enterprise Edition). Ðây là một xu hướng quan trọng, thu hút sự quan tâm của rất nhiều các công ty phần mềm trong và ngoài nước. Sun Microsystems là công ty đầu tiên khởi xướng môi trường phát triển ứng dụng phần mềm bằng công nghệ Java vào năm 1995. Nhưng khác với MicroSoft, Oracle, IBM với nhiều công nghệ sở hưu riêng và có nhiều thành công trên thị trường, Sun lại đề nghị một mô hình hoàn toàn mở, với ý tưởng xuất phát từ mô hình phát triển khá thành công của hệ điều hành UNIX (Sun Microsystems cũng là một nhà phát triển nổi tiếng với các phiên bản SunOS và Sun Solaris) và phần mềm nguồn mở OpenOffice (Sun Microsystems cũng có sản phẩm thương mại tương đương là StarOffice). Các ứng dụng J2EE theo định nghĩa là các ứng dụng đa tầng (multi-tier). Có thể chia ứng dụng J2EE thành các tầng như sau:  Client Tier (Internet/Intranet Client hay còn gọi là tầng khách) bao gồm trình duyệt web của người sử dụng (có thể nằm trong hay ngoài firewall của mạng, có thể là các máy dịch vụ ủy quyền proxy server). © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 16 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)  Web Tier (Internet/Intranet Webserver hay còn gọi là tầng Web) bao gồm các máy chủ chứa nội dung Web của xí nghiệp, có thể là công cộng nằm ở vùng DMZ, hay dùng riêng trong mạng cục bộ.  JSP/Servlet/EJB Tier (Java Application Server hay còn gọi là tầng business) bao gồm các máy chủ ứng dụng chứa các thành phần business logic xử lý ứng dụng bằng công nghệ Java (JSP, Servlet/EJB)  EIS Tier (Database Server hay còn gọi là tầng EIS) bao gồm các máy chủ CSDL, kho dữ liệu và ứng dụng khác © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 17 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) Hình 1 Mô hình ứng dụng đa tầng Mô hình ứng dụng nhiều tầng cho phép gứi các yêu cầu xử lý công việc và ứng dụng từ máy trạm (Client) thông qua máy chủ web (Web Server) đến một tầng xử lý trung gian là máy chủ ứng dụng (Application Server) chạy trong môi trường Java (JSP/Servlet/EJB). Trong hệ thống đa tầng, nhiều người sử dụng có thể chia sẻ các tài nguyên dùng chung ở mức xí nghiệp (Enterprise Information System) như các cơ sở dữ liệu (Database Server) và các ứng dụng truyền thống khác (Legacy Applications). Kiến trúc này có những lợi ích đáng kể so với kiến trúc client/server hai tầng và do đó cho phép các ứng dụng chạy nhanh hơn, có khả khả năng mở rộng và liên tác cao hơn. Ích lợi của kiến trúc đa tầng có thể liệt kê như sau: 1. Độ tin cậy và tính linh hoạt trong mở rộng khả năng phục vụ giúp cho các giao dịch (business transactions) được thực hiện nhanh chóng và chính xác. Máy chủ ứng dụng hỗ trợ chia xẻ ứng dụng và cung cấp khả năng mở rộng tối đa. Mỗi máy chủ ứng dụng với hệ thống nhiều CPU hoặc cluster máy chủ ứng dụng có thể hỗ trợ một số lượng lớn các giao dịch/người sử dụng, không phụ thuộc vào nền phần cứng, hệ điều hành và cấu hình hệ thống. Máy chủ ứng dụng được thiết kế trong môi trường phân tán gồm các truy xuất dữ liệu tốc độ cao, các giao tác với khối lượng lớn và khả năng mở rộng ứng dụng. Nhờ phân hoạch ứng dụng, máy chủ ứng dụng cung cấp giải pháp có thể mở rộng cho một số lượng lớn người dùng và giao tác. Khả năng mở rộng đạt được trong một hệ thống (máy chủ) nhờ thêm vào các CPU hay các hệ thống chạy trên mạng. Kiến trúc module của máy chủ ứng dụng còn cho phép dễ dàng mở rộng hệ thống và chức năng của ứng dụng ở mọi thời điểm. Nhờ việc cài đặt những module mới, những ứng dụng có thể được cung cấp © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 18 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) những chức năng mới. Những đặc trưng này làm cho phần mềm trên máy chủ ứng dụng có khả năng thích nghi cao với sự thay đổi môi trường hoạt động. 2. Độ an toàn và bảo mật cao giúp bảo vệ các thông tin quan trọng của người sử dụng và tính thống nhất (integrity) của dữ liệu. Máy chủ ứng dụng cung cấp các đặc trưng bảo mật từ A đến Z cho việc triển khai ứng dụng các xí nghiệp. Máy chủ ứng dụng cung cấp truyền thông bảo mật với máy chủ Web như hỗ trợ SSL, HTTPS và xác thực qua HTTP. Ðể làm cầu nối giữa trình duyệt và nguồn dữ liệu an toàn, máy chủ ứng dụng cung cấp khả năng xác thực người sử dụng, khả năng làm việc với cookies và điều khiển truy nhập dữ liệu đối với các giao tác an toàn. Việc ghi nhận và theo vết các sự kiện cho phép bảo vệ chống lại các truy nhập không hợp lệ và cho phép người quản trị phát hiện các hành động chủ quan, khách quan ảnh hưởng đến bảo mật. 3. Tính sẵn sàng (khả dụng – availability) cho phép phục vụ những yêu cầu gia tăng trên phạm vi toàn cầu. Máy chủ ứng dụng hỗ trợ các đặc trưng chính bao gồm đa luồng, quản lý đối tượng và cân bằng tải động ở mức độ thấp, thông qua việc cung cấp truy xuất dữ liệu hiệu quả và thời gian đáp ứng nhanh do sử dụng các dịch vụ hệ thống như quản lý hàng đợi luồng, caching liên kết dữ liệu, caching kết quả. Nhiều thực thể (instance) của máy chủ ứng dụng có thể được cài đặt thêm trên hệ thống khi cần thiết. Nhờ kiến trúc dựa vào thành phần và khả năng cân bằng tải động và theo dõi tải, việc xử lý yêu cầu được cân bằng trên các máy chủ ứng dụng, đảm bảo tính sẵn sàng cao, thậm chí ngay cả khi khi nếu một máy chủ bị lỗi. Với khả năng phục vụ trực tuyến, các thành phần máy chủ và ứng dụng có thể được cấu hình lại, thêm hoặc bớt mà không cần tắt hệ thống. 4. Tính linh hoạt cao trong mở rộng khả năng phục vụ cho phép việc phát triển hệ thống để đáp ứng nhiều yêu cầu thay đổi khác nhau (khi yêu cầu hệ thống thay đổi, chỉ cần thay đổi logic xử lý tại một vi trí ở tầng giữa – middle tier – mà không cần thay đổi tại từng máy khách) Với khả năng quản lý theo trạng thái và theo phiên làm việc, máy chủ ứng dụng hỗ trợ những yêu cầu phức tạp, nhiều bước. Hệ thống quản lý sẽ hỗ trợ quản lý tài nguyên, dữ liệu, giao tác, tự động xác nhận truy vấn quay vòng, xác nhận thành công để không thực hiện lại nhiều lần. Máy chủ ứng dụng cung cấp khả năng truy xuất dữ liệu dùng chung và truy xuất một cách thống nhất các tác vụ dựa trên giao tiếp chuẩn tới những hệ thống dữ liệu không đồng nhất. 5. Tích hợp dễ dàng các ứng dụng mới với hệ thống thông tin sẵn có. Với kiến trúc máy chủ mở rộng, người phát triển có thể thiết kế các ứng dụng nhằm đáp ứng nhu cầu triển khai ban đầu và phát triển sau đó mà không cần viết lại mã nguồn hay sửa đổi các chi tiết kỹ thuật ứng dụng. Khả năng sắp xếp có hiệu quả tạo cho máy chủ ứng dụng một giải pháp tối ưu cho các ứng dụng yêu cầu hỗ trợ giải quyết khối lượng lớn công việc. 6. Giảm tính phức tạp trong phát triển ứng dụng phân tán nhờ cấu trúc đơn giản hóa (EJB container và web server xử lý các tác vụ quan trọng thay cho người phát triển) và khả năng chuyên môn hóa công việc (mỗi nhóm phát triển chuyên sâu về một mảng như thiết kế giao diện, logic hiển thị, logic xử lý,...) Kiến trúc ứng dụng qui mô xí nghiệp liên quan đến toàn bộ hạ tầng cơ sở phần cứng và phần mềm, cấu hình mạng, môi trường phát triển thử nghiệm và triển khai ứng dụng, v.v. Ðiều này phản ánh đòi hỏi của sự đầu tư lâu dài. Bằng cách sử dụng mô hình này, các ứng dụng J2EE đều là các ứng dụng website, cho phép kết hợp các hệ thống ứng © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 19 TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA) dụng khác nhau thành một môi trường dễ quản lý, tạo điều kiện thuận lợi cho quá trình khai thác và truy cập dữ liệu trên web. Tuy nhiên để đạt được mô hình này, các chuyên gia CNTT phải có khả năng tích hợp những giải pháp website mà không cần xây dựng lại cơ sở hạ tầng CNTT, không viết lại các ứng dụng đã có từ cấp cơ sở và giảm thiểu quá trình huấn luyện lại người dùng. Mặt khác phải chú trọng lựa chọn hệ điều hành, webserver và các phần mềm bảo mật/quản trị kèm theo, các hệ cơ sở dữ liệu và các thành phần phần mềm của nhà sản xuất thứ ba để có thể tiết kiệm đầu tư. Do đó việc nghiên cứu kỹ để lựa chọn môi trường (hệ điều hành) cho ứng dụng J2EE là rất quan trọng. Kiến trúc ứng dụng website được xây dựng trên nền kiến trúc toàn xí nghiệp, có thể liên quan đến từng ứng dụng hay dự án. Sau khi xây dựng xong hạ tầng cơ sở, việc nghiên cứu kiến trúc ứng dụng phải dẫn đến kết quả: làm sao xây dựng ứng dụng cho phù hợp. Ðồng thời chúng ta phải xem xét kỹ vấn đề cập nhật kiến trúc, khả năng sử dụng và sử dụng lại các thành phần đã phát triển. Việc cài đặt các ứng dụng quy mô xí nghiệp, bảo đảm khai thác các đầu tư đã có vào cơ sở hạ tầng, tích hợp nhiều môi trường không đồng nhất và khả năng truy nhập vào dữ liệu sẵn có của hệ thống là điều kiện tất yếu cho thành công của ứng dụng CNTT. 2.3 Giải pháp kết nối và chuyển đổi dữ liệu Phương pháp tiếp cận giải quyết bài toán phát triển phần mềm cho cổng thông tin là phục vụ mục tiêu kết nối, trao đổi và tích hợp thông tin, cụ thể là:  Mục tiêu thứ nhất là việc nối kết và chuyển đổi dữ liệu với nhiều thành phần hệ thống khác nhau (về kỹ thuật giao thức và dạng nội dung dữ liệu).  Mục tiêu thứ hai trong quá trình tiếp cận là thống nhất về nghiệp vụ và chuẩn hoá về công nghệ của các giao thức (interface/protocol), cơ sở dữ liệu (database) và cách hoạt động (logic processing) của hệ thống  Mục tiêu thứ ba là đảm bảo tính liên tục của các dịch vụ và các ứng dụng Các tiêu chí chính khi xây dựng cổng thông tin là cần phải:  Phát triển một hệ thống cổng thông tin với các phần mềm ứng dụng như là các dịch vụ (Web Application Service – Software as a Service)  Tạo mới các cơ sở dữ liệu của hệ thống, người sử dụng và các ứng dụng  Hỗ trợ đa ngôn ngữ và các dạng dữ liệu khác nhau  Hỗ trợ thống kê và theo dõi các thông tin động trên toàn bộ các nguồn  Phát triển một tập hợp các siêu dữ liệu XML nhằm phục vụ cho việc thu thập, cung cấp thông tin và trao đổi tự động với các ứng dụng bên ngoài. Giải pháp phần mềm cần được xây dựng trên nền tảng cổng thông tin nhằm liên kết các nguồn thông tin dạng khác nhau vào một chuẩn đóng gói dữ liệu duy nhất. Giao thức trao đổi (interface) tại các nguồn thông tin có thể khác nhau tùy theo yếu tố của nguồn thông tin địa phương. Các thông tin được đóng gói thành các dữ liệu có cấu trúc XML chặt chẽ. Việc đảm bảo giao thức địa phương và các nguồn thông tin địa phương tuân theo giao thức cung cấp thông tin của nguồn thông tin đó. Ý tưởng chính của giải pháp là việc tất cả các dữ liệu trao đổi qua kênh thông tin đều có cấu trúc XML. Các cấu trúc này tuân theo các giản đồ XML (XML Schema). Các © 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở 20
- Xem thêm -

Tài liệu liên quan

Tài liệu vừa đăng