TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC – TRIỂN KHAI CÔNG NGHỆ
“Nghiên cứu giải pháp công nghệ và phát triển phần mềm trợ giúp
giảng dạy trên mạng Intranet trong các trường PTTH”
Báo cáo tổng kết
và nghiệm thu đề tài
Phiên bản: 2.5
Chủ trì:
TS. Hoàng Lê Minh
Thành viên:
ThS. Phạm Thế Bảo
ThS.Nguyễn Giang Sơn
ThS. Võ Đức Cẩm Hải
CN. Nguyễn Hiền Lương
CN. Lê Phạm Hoàng Giàu
THÀNH PHỐ HỒ CHÍ MINH
2003 - 2006
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
1
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
MỤC LỤC
GIỚI THIỆU ĐỀ TÀI..........................................................................................................
................4
PHẦN I. XÂY DỰNG CÁC HỆ THỐNG THÔNG TIN VÀ PHẦN MỀM ỨNG DỤNG TRONG
MÔI TRƯỜNG GIÁO DỤC...........................................................................................
....................6
1.1 Khảo sát thực trạng và nhu cầu ứng dụng CNTT và mạng Internet trong các trường phổ
thông....................................................................................................................................
............6
1.2 Nhu cầu và giải pháp xây dựng các hệ thống thông tin quản lý..............................................8
1.3 Một số vấn đề trong quản lý và trao đổi thông tin trên mạng..................................................9
PHẦN II. XU HƯỚNG PHÁT TRIỂN PHẦN MỀM ỨNG DỤNG TRÊN MẠNG MÁY TÍNH 15
2.1 Lựa chọn giải pháp công nghệ nền...............................................................................
..........15
2.2 Giải pháp phát triển phần mềm dựa trên kiến trúc đa tầng J2EE..........................................16
2.3 Giải pháp kết nối và chuyển đổi dữ liệu..............................................................................
...20
2.4 Sự cần thiết của môi trường phát triển dựa trên nguồn mở...................................................23
2.5 Hệ điều hành nguồn mở Linux và các phiên bản distro của Linux.......................................27
PHẦN III. NGHIÊN CỨU VỀ CÔNG NGHỆ CỔNG THÔNG TIN.............................................29
3.1 Phân loại website và cổng thông tin......................................................................
.................29
3.2 Cổng thông tin và tích hợp ứng dụng......................................................................
...............30
3.3 Tình hình phát triển cổng thông tin mã nguồn mở dựa trên uPortal......................................33
3.4 Các chuẩn về portlet container và Java Specification Request 168.......................................38
3.5 Kiến trúc chung của các cổng thông tin.................................................................................41
3.6 Kiến trúc phần mềm cổng thông tin uPortal..........................................................................
.43
PHẦN IV MÔI TRƯỜNG PHÁT TRIỂN ỨNG DỤNG IPORTAL FRAMEWORK VÀ CÁC
ỨNG DỤNG TÍCH HỢP CỔNG...................................................................................
...................45
4.1 Công nghệ nền cổng thông tin và môi trường phát triển ứng dụng ......................................45
4.2 Ứng dụng Quản lý thông tin người sử dụng cổng dựa trên OpenLDAP...............................45
4.3 Thiết kế cơ sở dữ liệu người dùng cổng thông tin iPortal trên OpenLDAP..........................46
4.4 Ứng dụng thư điện tử tích hợp trong iPortal..........................................................................53
4.5 Mô hình bảo mật Hệ thống Quản lý thư điện tử iMailManager............................................55
4.6 Ứng dụng quản trị nội dung và tin tức iContentManager......................................................56
4.7 Ứng dụng quản trị tài liệu điện tử iDocManager...................................................................57
4.8 Yêu cầu hệ thống triển khai iPortal và các ứng dụng ............................................................71
V. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN.................................................................
...................73
Những kết quả chính thu được từ đề tài......................................................................
.................73
PHỤ LỤC A KIẾN TRÚC CỔNG THÔNG TIN uPORTAL ..........................................................75
A.1 Tích hợp thông tin và ứng dụng web.........................................................................
............75
A.2 Các thẻ định dạng (Stylesheets)........................................................................................
....76
A.3 Các kênh ứng dụng trong uPortal......................................................................
...................78
A.4 Cấu trúc các đối tượng bên trong uPortal ....................................................................
........81
A.5 Khả năng tích hợp của uPortal với các hạ tầng thông tin sẵn có.........................................81
A.6. Xây dựng các kênh ứng dụng trong uPortal.........................................................................83
PHỤ LỤC B. KHUNG PHÁT TRIỂN ỨNG DỤNG iPORTAL FRAMEWORK.........................92
B.1 Giới thiệu chung........................................................................................................
.............92
B.2 Nguyên lý hoạt động...........................................................................................
...................92
B.3 Phân tích thiết kế ứng dụng MyAccount bằng iPortal Framework.......................................95
Mã nguồn một số gói phần mềm nền trong bộ sản phẩm iPortal Framework ..........................100
package org.itpmo.portal.base; // BaseBO............................................................................
.100
package org.itpmo.portal.base; // DBService........................................................................103
package org.itpmo.portal.base; // XML..................................................................
...............103
package org.itpmo.portal.base.channel; // Channel...............................................................104
package org.itpmo.portal.base.channel; // PrivilegedChannel............................................112
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
2
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
package org.itpmo.portal.base.channel; // Screen.................................................................
.113
package org.itpmo.portal.base.ldap; // Base64.....................................................................115
package org.itpmo.portal.base.ldap; // Common..................................................................117
package org.itpmo.portal.base.ldap; // JNDI........................................................................121
package org.itpmo.portal.base.ldap; // LDAP......................................................................137
package org.itpmo.portal.base.ldap; // PasswordHandler.....................................................140
package org.itpmo.portal.base.ldap; // TreeNode2................................................................143
package org.itpmo.portal.base.ldap; // UnixCrypt................................................................144
PHỤ LỤC C DỊCH VỤ THÔNG TIN THƯ MỤC OPENLDAP.................................................155
C.1 Giới thiệu.....................................................................................................................
.........155
C.2 Các mô hình trong kiến trúc LDAP....................................................................
.................155
C.3 Bảo mật LDAP bằng công nghệ SSL và TLS...................................................................
...156
C.4 Khuôn dạng LDIF (LDAP Data Interchange Format) cho dữ liệu LDAP..........................157
PHỤ LỤC D ĐẶC TẢ DUBLIN CORE METADATA................................................................159
D.1 Metadata là gì ?..................................................................................................
..................159
D.2 Dublin Core Metadata là gì ?..................................................................................
.............159
D.3 Cú pháp của Dublin Core Metadata:...................................................................................160
PHỤ LỤC E LUCENE SEARCH ENGINE..................................................................
.............162
E.1 Tổng quan về Lucene Search Engine...........................................................................
........162
E.1.1 Lucene search engine là gì ?......................................................................................
...162
E.1.2 Search Engine hoạt động như thế nào?........................................................................162
E.1.3 Phương pháp cài đặt cải tiến của Lucene................................................................
.....163
E.1.4 So sánh - đánh giá khả năng của Lucene với các công cụ tìm kiếm khác..................163
E.2 Các định dạng của tập tin chỉ mục.......................................................................
................165
E. Các tập tin trong từng phân đoạn:...................................................................
..................168
E.3 Cú pháp của lớp Query Parser trong Lucene.......................................................................171
E.3.1 Tổng quan:..................................................................................................
..................171
PHỤ LỤC F KHẢO SÁT VỀ CÁC CỔNG THÔNG TIN...........................................................174
F. 1 eXo Platform (giấy phép nguồn mở)....................................................................
..............174
F.2 Cổng thông tin Liferay (giấy phép nguồn mở).................................................................
....178
F.3 Cổng thông tin uPortal (giấy phép nguồn mở).....................................................................180
F.4 Cổng thông tin IBM WebSphere Portal – Express (thương mại).......................................181
F.7 Cổng thông tin ORACLE Portal (thương mại)....................................................................185
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
3
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
GIỚI THIỆU ĐỀ TÀI
Ứng dụng CNTT là một nhu cầu lớn của nền kinh tế đang phát triển như Việt nam,
trong đó có ứng dụng CNTT cho ngành giáo dục – đào tạo, đặc biệt là giáo dục phổ thông.
Phần mềm ứng dụng, nhất là các phần mềm chạy được trên các mạng máy tính nội
bộ (LAN) và mạng Internet, nếu triển khai hiệu quả sẽ góp phần thúc đẩy sự phát triển của
giáo dục - đào tạo.
Cho đến đầu năm năm 2002 (năm đăng ký thực hiện Đề tài), phần lớn các phần
mềm ứng dụng trên mạng tại Việt nam đều được phát triển dựa trên mô hình kiến trúc
khách / phục vụ (two-tier client/server), với công nghệ lập trình trên mạng LAN, sử dụng
các ngôn ngữ có khả năng giao tiếp mạng của Microsoft như FoxPro, VisualBasic, Visual
C/C++, chủ yếu phát triển trên nền Hệ điều hành MS Windows. Điều này cũng có những
bất cập riêng là phần lớn các trường Trung học Phổ thông không có đủ kinh phí để mua
bản quyền hệ điều hành MS Windows, các hệ quản trị cơ sở dữ liệu MS SQL Server và các
tiện ích phát triển vận hành phần mềm của Microsoft, dẫn đến tình trạng vi phạm bản
quyền khá phổ biến ngay trong ngành giáo dục-đào tạo.
Nhóm cán bộ - giảng viên tại Bộ môn Ứng dụng Tin học, Khoa Toán – Tin học
Trường Đại học KHTN TP. HCM, dưới sự lãnh đạo của TS. Hoàng Lê Minh, từ năm
1999 đã được Sở Khoa học, Công nghệ và Môi trường TP. HCM hỗ trợ kinh phí để nghiên
cứu, tiếp cận một số phương pháp phát triển phần mềm kiểu mới dựa trên nền các công
nghệ nguồn mở như Hệ điều hành Linux, ngôn ngữ lập trình Java, ngôn ngữ đánh dấu văn
bản mở rộng XML, dịch vụ Web ....
Trong năm 2001, nhóm nghiên cứu tại ĐHKHTN TP. HCM đã thực hiện thành
công Đề tài “Công nghệ lập trình Java trên nền máy chủ Linux và phát triển một số
ứng dụng website” (đề tài đã nghiệm thu tháng 12/2001). Một số ứng dụng website chạy
trên hệ điều hành máy chủ Linux như phần mềm Quản trị Thông tin – Thư viện Điện tử
iLOC lần đầu tiên đã được triển khai thành công tại nhiều thư viện đại học, cao đẳng, viện
nghiên cứu.
Từ các kết quả đạt được, đầu năm 2002, nhóm nghiên cứu tiếp tục đăng ký thực
hiện Đề tài “Nghiên cứu giải pháp công nghệ và phát triển phần mềm trợ giúp giảng
dạy trên mạng Intranet trong các trường trung học phổ thông”.
Giai đoạn nghiên cứu (Giai đoạn 1) của Đề tài đã được hoàn tất vào cuối năm 2002,
được Hội đồng Sở KHCN nghiệm thu sơ bộ cho sản phẩm “Cổng thông tin mã nguồn
mở iPortal”.
Sau kết quả nghiệm thu Giai đoạn 1, sản phẩm cổng thông tin iPortal đã được
nhóm nghiên cứu ứng dụng thử nghiệm tại Trung tâm Công nghệ Phần mềm ĐHQG
TP. HCM (Unisoft), được cài đặt để phục vụ hệ thống Thư điện tử E-mail tại Văn phòng
Đại học Quốc gia TP. HCM, tại một số địa chỉ khác trong ngành giáo dục – đào tạo. Tuy
nhiên do hạn chế về hạ tầng mạng, khả năng truy cập Internet trong các trường THPT tại
TP. Hồ Chí Minh (vào thời điểm năm 2003) còn quá hạn chế, nên nhóm nghiên cứu chưa
có điều kiện thử nghiệm rộng rãi để đánh giá hiệu quả cho các sản phẩm nghiên cứu của
đề tài như đăng ký trong Đề cương Đề tài.
Từ giữa năm 2003, khi Việt nam bắt đầu có công nghệ truy cập Internet băng thông
rộng (ADSL), giá cước truy cập Internet của các công ty trong ngành Bưu chính, Viễn
thông giảm mạnh, chương trình đưa Internet vào các trường phổ thông được triển khai
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
4
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
rộng, đã tạo ra những thay đổi lớn (nếu so sánh thời điểm khảo sát đánh giá hiện trạng
ứng dụng CNTT trong trường phổ thông do đề tài thực hiện tháng 4/2002).
Trong các năm 2004-2005, nhiều trường THPT tại TP. HCM đã xây dựng các
mạng nội bộ (LAN), có kết nối với Internet, trang bị các phòng máy, các phần mềm hỗ trợ
giảng dạy cho giáo viên và học sinh. Đó là điều kiện cần thiết để nhóm nghiên cứu đề tài
chúng tôi có thể đưa ra thử nghiệm rộng rãi các sản phẩm của đề tài như iPortal, iLOC ...
dưới nhiều hình thức, cài đặt trên nhiều hệ thống mạng.
Một trong các giải pháp mà nhóm đề xuất là đóng gói hoàn chỉnh sản phẩm dưới
dạng “software appliance” (còn gọi là phần mềm “nhúng”) để phổ biến, chuyển giao dễ
dàng cho đối tượng người dùng không chuyên trong môi trường giáo dục.
Đến thời điểm cuối năm 2006, thông qua đơn vị chủ trì là Trung tâm ứng dụng
Công nghệ mạng Internet (Cita), nhóm nghiên cứu đã phối hợp với một số công ty phần
mềm, công ty sản xuất máy tính thương hiệu Việt nam (Compotech, VTB, GenSoft, Khai
trí, V-Open ...) để cài đặt sản phẩm, thương mại hoá một số kết quả nghiên cứu của đề tài,
đưa vào ứng dụng trong thực tế.
Báo cáo này trình bày một cách tổng quan các kết quả nghiên cứu của đề tài, giới
thiệu một số giải pháp công nghệ liên quan đến nội dung “Xây dựng hệ thống thông tin
quản lý dựa trên phần mềm nguồn mở” trong môi trường giáo dục – đào tạo. Một trong
các mục đích của Báo cáo Đề tài là phục vụ cho việc nâng cao nhận thức, kỹ năng và tạo
cơ hội ứng dụng CNTT, ứng dụng các phần mềm nguồn mở với chất lượng cao, chi phí
thấp, phù hợp nhu cầu đang trở nên khá cấp thiết hiện nay, khi Việt nam đã gia nhập Tổ
chức Thương mại Quốc tế WTO với các cam kết về bảo vệ quyền Sở hữu trí tuệ và bản
quyền phần mềm trong các trường phổ thông, các trường cao đẳng và đại học, các trung
tâm nghiên cứu, đào tạo CNTT, các tổ chức, cơ quan, doanh nghiệp.
Nhóm đề tài xin trân trọng cám ơn đơn vị chủ trì đề tài, Trung tâm Ứng dụng Công
nghệ mạng Internet (Cita), Khoa Toán – Tin học Trường Đại học Khoa học Tự nhiên TP.
HCM (nơi làm việc của phần lớn các thành viên tham gia đề tài), Trung tâm Công nghệ
Phần mềm ĐHQG TP. HCM, Ban Quản lý các dự án CNTT TP. HCM, Sở Khoa học và
Công nghệ TP. HCM, Ban Quản lý Dự án Phần mềm Nguồn mở Bộ Khoa học và Công
nghệ và nhiều cơ quan, đơn vị tại TP. HCM trong suốt thời gian qua đã quan tâm, giúp đỡ
nhóm đề tài thực hiện nghiên cứu, phát triển các ứng dụng CNTT dựa trên phần mềm
nguồn mở.
Quyền sở hữu trí tuệ của các giải pháp công nghệ, là kết quả nghiên cứu được trình
bày trong Báo cáo đề tài này thuộc về cơ quan đặt hàng là Sở Khoa học và Công nghệ TP.
HCM. Nhóm tác giả Báo cáo giữ quyền tác giả, trong khi tên thương hiệu của các sản
phẩm phần mềm được phát triển từ các giải pháp công nghệ nguồn mở như iLOC, iPortal,
iDocsManager, iMailManager, v.v.. .... thuộc về Trung tâm Ứng dụng Công nghệ mạng
Internet (Cita), đơn vị chủ trì đề tài đồng thời cũng là nhà đầu tư phát triển và thương mại
hoá các phần mềm dựa trên nguồn mở, trong suốt thời gian từ năm 1999 đến nay.
Thành phố Hồ Chí Minh, tháng 12/2006
Nhóm nghiên cứu đề tài
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
5
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
PHẦN I. XÂY DỰNG CÁC HỆ THỐNG THÔNG TIN VÀ PHẦN
MỀM ỨNG DỤNG TRONG MÔI TRƯỜNG GIÁO DỤC
1.1 Khảo sát thực trạng và nhu cầu ứng dụng CNTT và mạng Internet
trong các trường phổ thông
Nhằm khảo sát nhu cầu, đánh giá khả năng triển khai ứng dụng của các phần mềm
trợ giúp đào tạo trong các trường phổ thông, theo yêu cầu của đề tài, ngày 10 tháng 04
năm 2002, nhóm nghiên cứu đã phối hợp với Trung tâm Đào tạo Khu vực của SEAMEO
(Tổ chức Bộ trưởng giáo dục các quốc gia Đông nam Á, có trụ sở tại 35 Lê Thánh Tôn,
Quận 1, TP. HCM), Trung tâm ứng dụng Công nghệ mạng Internet (Cita) và Trung tâm
Công nghệ Phần mềm ĐHQG-HCM (Unisoft) để tổ chức Hội thảo “Thực trạng và nhu
cầu sử dụng mạng Internet trong trường phổ thông trung học”.
Đến tham dự Hội thảo có 40 đại biểu, đại diện cho nhiều trường trung học phổ
thông lớn tại TP. HCM, lãnh đạo VP II Bộ GD-ĐT, Thành hội Hội Khuyến học Việt Nam
TP.HCM, đại diện của các Sở GD-ĐT tỉnh Bình Dương, Cần Thơ, An giang …
Khai mạc Hội thảo và trong báo cáo “Tham khảo mô hình ứng dụng Công nghệ
Thông tin và Truyền thông trong Giáo dục Phổ thông tại Malaysia: Trường thông
minh (“Smart School”)”, Bà Nguyễn Thuý Vân, Q.Giám đốc Trung tâm SEAMEO, đã
nhấn mạnh tầm quan trọng của việc ứng dụng CNTT và mạng Internet trong cải tiến cách
dạy và học tại các trường phổ thông. Theo tác giả báo cáo, Trường thông minh không chỉ
tạo nên một môi trường dạy và học theo phong cách mới, mà còn liên quan đến cả một hệ
thống quản lý trường học tiên tiến, trong đó ứng dụng rộng rãi các thành tựu mới nhất của
CNTT và Viễn thông – Internet. Phát triển mô hình trường thông minh sẽ tạo điều kiện ban
hành các chính sách khuyến khích áp dụng các quy trình công nghệ cho đối tượng phục vụ
chính là con người, với năng lực và tinh thần trách nhiệm cao. Mô hình Trường thông
minh cũng giúp các trường trong quá trình phát triển có thể kiểm nghiệm, đánh giá, tái cấu
trúc trong tổ chức ngày càng hiệu quả hơn.
Với việc ứng dụng mô hình Trường thông minh:
• Tất cả các học sinh của trường có thể học theo năng lực và sở thích mà vẫn đảm
bảo được nội dung chương trình chung;
• Học sinh có thể phát triển toàn diện các năng khiếu, kiến thức, kỹ năng;
• Giáo viên đưa các bài giảng gần gũi với học sinh hơn, đa dạng và cá biệt hoá theo
nhu cầu và trình độ của từng học sinh;
• Bộ máy quản lý nhà trường nắm bắt tốt hơn các thông tin về giáo viên và học sinh
để từ đó đề ra các quyết định đúng đắn;
• Việc đánh giá kết quả học tập trở nên khách quan hơn, khuyến khích học sinh học
tốt và thêm tính năng động, sáng tạo;
• Nhờ CNTT và mạng Internet, phụ huynh có thể tham gia tích cực vào các hoạt
động của nhà trường.
Trong báo cáo tiếp theo tại Hội thảo, Ông Bùi Hoàng Tiến, Giám đốc Trung tâm
Ứng dụng Công nghệ mạng Internet (Cita) đã đề cập đến “Thực trạng ứng dụng
mạngInternet và Phần mềm trong quản lý và đào tạo tại một số trường phổ thông
trung học của TP.HCM”. Đây là kết quả của các cuộc khảo sát tình hình mua sắm trang
thiết bị tin học và ứng dụng CNTT trong các trường THPT lớn tại các Quận 1,3,5, Bình
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
6
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
Thạnh, Tân Bình (các trường THPT Bùi Thị Xuân, Nguyễn Thị Minh Khai, Lê Hồng
Phong, Nguyễn Thượng Hiền, Marie-Curie, Hùng Vương).
Báo cáo của ông Bùi Hoàng Tiến cho thấy một số trường điểm của thành phố đã
được trang bị khá đầy đủ về máy tính, cá nhân xây dựng các phòng thực hành tin học. Một
số trường còn có cả phòng truy cập Internet. Tuy nhiên trong lĩnh vực ứng dụng CNTT và
xây dựng phần mềm trợ giúp quản lý, đào tạo thì còn rất hạn chế, trong khi nhu cầu và
mong muốn của đa số lãnh đạo và thày cô giáo tại các trường là rất lớn. Một số nhu cầu cơ
bản được đề cập nhiều nhất là:
• Xây dựng hệ thống website của trường để tự giới thiệu, tạo mối quan hệ gắn bó
hơn giữa nhà trường và phụ huynh, xã hội, tạo thuận lợi trong giao dịch, kết nghĩa, nhận
các tài trợ giúp đỡ từ các tổ chức khác trong và ngoài nước.
• Cho phép phụ huynh có thể truy cập các thông tin về đào tạo của nhà trường về
các mặt: tổ chức giáo viên, lịch học, thực hành, thi cử và các hoạt động ngoại khoá khác.
Đặc biệt nhu cầu của phụ huynh đối với việc theo dõi kết qủa học tập của con em mình
trên mạng là rất lớn, giúp làm cầu nối liên lạc giữa nhà trường, gia đình và xã hội.
• Xây dựng nội dung thông tin đa dạng và phong phú, đặc biệt là ứng dụng thư viện
điện tử, các dịch vụ Internet trên mạng sẽ góp phần thúc đẩy việc tự học của học sinh, nhu
cầu cập nhật và đổi mới trình độ của giáo viên.
• Trong nhà trường còn rất thiếu các phần mềm thích hợp đề làm công tác quản lý,
dạy và học, đặc biệt là các phần mềm chạy trên các website.
Thay mặt nhóm nghiên cứu Đề tài, TS. Hoàng Lê Minh, Giám đốc Trung tâm
Công nghệ Phần mềm ĐHQG–HCM đã chia xẻ cùng các đại biểu một số kinh nghiệm
trong triển khai các đề án tin học hoá, ứng dụng CNTT và phần mềm đã thực hiện trong
những năm vừa qua cho ngành Giáo dục. TS. Minh đề xuất giải pháp hỗ trợ các trường
THPT xây dựng website trên nền công nghệ cổng thông tin (Portal) với khả năng quản lý
thông tin và bảo mật cao, tiến tới hình thành một hệ thống thông tin giáo dục thật sự có
hiệu qủa cho phát triển ứng dụng mà trong đó các giải pháp tiên tiến về phát triển phần
mềm tin học sẽ đóng vai trò quan trọng, quyết định cho sự thành công.
Trong phần các báo cáo và tham luận của các đại biểu tại hội thảo, đã nêu lên nhiều
vấn đề thực tế và nhu cầu cấp bách trong ứng dụng CNTT và viễn thông-Internet vào nhà
trường, đón đầu sự phát triển tất yếu của nền kinh tế nước nhà theo xu hướng mở cửa, hội
nhập chung. Ông Vũ Thiện Căn, tổ trưởng Tổ Giáo viên Tin học- Trường THPT chuyên
Lê Hồng Phong đã có bài phát biểu và minh hoạ các thành công bước đầu của nhà trường
trong việc ứng dụng CNTT vào dạy một số môn chuyên như Toán, Tin học, Hóa, Lý,
Ngoại ngữ.
Qua các ý kiến đóng góp của các đại biểu tại hội thảo, có thể thấy rằng nhu cầu ứng
dụng mạng Intranet/Internet để khai thác tài liệu và phần mềm của ngành giáo dục phổ
thông là rất lớn. Hiện tại các trường THPT và các địa phương đang cần sự trợ giúp kỹ
thuật để có thể xây dựng phương án khai thác mạng nội bộ và đưa CNTT vào hoạt động
một cách có hiệu quả cao với chi phí thấp, nhằm tránh tình trạng máy móc được trang bị
đầy đủ, nhưng không đồng bộ nên không thể sử dụng, hoặc không sử dụng hết công suất
gây lãng phí về đầu tư.
Để tạo chuyển biến lớn trong việc ứng dụng CNTT và truyền thông vào trong hoạt
động giáo dục phổ thông, rất cần các giải pháp hữu ích, đặc biệt các giải pháp ứng dụng
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
7
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
mạng, ứng dụng phần mềm nguồn mở, nhằm giúp Ban Giám hiệu các trường và cơ quan
quản lý ngành tiếp cận các thông tin mới, tránh bệnh hình thức, lãng phí trong quá khứ.
1.2 Nhu cầu và giải pháp xây dựng các hệ thống thông tin quản lý
Xây dựng và quản lý một Hệ thống Thông tin (HTTT) ở quy mô toàn cục (còn gọi
là hệ thống thông tin quy mô doanh nghiệp) bao giờ cũng là một vấn đề rất quan trọng và
cốt lõi trong bất cứ kế hoạch ứng dụng CNTT, ngắn hạn hay dài hạn, của mọi cơ quan, tổ
chức doanh nghiệp hoạt động trong bất cứ lĩnh vực nào (quản lý, sản xuất kinh doanh, giáo
dục, văn hoá, y tế, ... ).
Xuất phát từ mục tiêu xây dựng HTTT là để nhằm tăng cường lượng thông tin được
khởi tạo, lưu trữ, trao đổi và khai thác trên mạng máy tính, việc lựa chọn một giải pháp
nền để xây dựng HTTT trở thành vấn đề quan trọng hàng đầu, cần được ưu xem xét giải
quyết trước để tránh các bất cập và lãng phí về sau.
Thực tế hiện nay, phần lớn các hạng mục xây dựng HTTT quản lý đang được triển
khai rộng rãi trong các trường, các tỉnh thành và địa phương đều bao gồm:
1. Hệ thống thống thông tin website, phục vụ cho đông đảo người dùng.
Thông tin website dùng cho đối tượng người dùng ở bên trong và bên ngoài tổ chức
mô tả cơ cấu, chức năng, nhiệm vụ, thông báo về các hoạt động thường xuyên, tạo mối
liên kết đến các website và thông tin cơ sở dữ liệu khác nhau. Nền tảng để duy trì hoạt
động của mỗi website là hệ thống quản trị nội dung (CMS). Nhưng hạn chế của phần lớn
các phần mềm CMS cho website lại chính là khả năng kết nối thông tin tới các cơ sở dữ
liệu động và các ứng dụng trên web.
2. Hệ thống thông tin điều hành tác nghiệp, phục vụ lãnh đạo, quản lý.
Người lãnh đạo của cơ quan, đơn vị quản lý hành chính như tỉnh, thành phố hoặc
ban giám hiệu các trường đại học, cao đẳng, phổ thông đều có nhu cầu phải theo dõi các
thông tin diễn ra hàng ngày, trong nội bộ và của các cơ quan cấp trên, cấp dưới đề phục
vụ công tác điều hành, ra quyết định, chỉ đạo các bộ phận trực thuộc, kịp thời, trong môi
trường mạng thông tin hợp nhất. Điển hình cho các dứng dụng loại này là các ứng dụng
quản lý văn bản, hồ sơ, công việc, lập lịch, trao đổi thông tin qua e-mail, nhóm làm việc
cộng tác, v.v...
3. Hệ thống các phần mềm ứng dụng, quản lý, cho phép truy cập tới các kho dữ liệu
và cơ sở dữ liệu, thực hiện việc trao đổi, tích hợp thông tin với nhiều hệ thống khác.
Đó là các phần mềm chuyên dụng, mang tính đặc thù cao cho mỗi hệ thống thông
tin, như phần mềm quản lý chương trình đào tạo, quản lý điểm, quản lý thư viện, cung cấp
giao tiếp quan mạng để đăng ký dịch vụ từ xa, hỗ trợ thương mại điện tử, v.v... Vấn đề
quan trọng là làm sao cho các phần mềm này có thể “trao đổi thông tin” và “tích hợp dữ
liệu” được với nhau, trong một khuôn khổ chung và thống nhất của mỗi tổ chức.
Tất cả các thành phần nêu trên sẽ tạo ra một Hệ thống thông tin quản lý. Tuy
nhiên, nếu đi sâu phân tích các kết quả đạt được trong lĩnh vực này tại nước ta nói chung,
và trong lĩnh vực giáo dục, đào tạo nói riêng thì kết quả còn rất khiêm tốn. Thực tế là
nhiều cơ quan quản lý, các bộ ngành, địa phương, các trường, viện, v.v.. còn đang rất lúng
túng trong lựa chọn giải pháp, lựa chọn sản phẩm cũng như hình thức và lộ trình triển khai
xây dựng HTTT. Đã nhiều nơi, nhiều lúc các nhà quản lý đề cập tới đến vấn đề phải dùng
chung các phần mềm, dùng chung các cơ sở dữ liệu, thống nhất các chuẩn trao đổi thông
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
8
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
tin và dữ liệu trên mạng diện rộng ... nhưng “lực vẫn bất tòng tâm”, do khúc mắc ở khâu
chia sẻ dùng chung các thông tin và cơ sở dữ liệu. Thực tế các đơn vị dù triển khai phần
mềm dùng chung, thẩm chí miễn phí cho không nhưng vẫn không xây dựng được hệ thống
thông tin quản lý.
Trong quá trình khảo sát thực trạng để tìm kiếm giải pháp cho vấn đề trên, chúng
tôi chưa tìm được câu trả lời tổng quát. Tuy nhiên, với định hướng phát triển các phần
mềm nguồn mở, tuân thủ các chuẩn mở, đặc biệt trong môi trường giáo dục – đào tạo, sẽ
sớm mở ra khả năng lôi kéo sự tham gia của số đông các công ty phần mềm và dịch vụ tin
học, mở ra mô hình kinh doanh dịch vụ dựa trên phần mềm nguồn mở, dựa trên các chuẩn
mở thay thế cho các phần mềm thương mại. Việc làm này sẽ góp phần giải quyết bài toán
xây dựng HTTT với chất lượng cao hơn, chi phí thấp hơn hiện nay ! Với niềm tin như vậy,
nhóm đề tài hy vọng sẽ mang những đóng góp thiết thực của mình tới cộng đồng CNTT
nói chung và ngành giáo dục đào tạo nói riêng, bằng kết quả nghiên cứu của mình.
1.3 Một số vấn đề trong quản lý và trao đổi thông tin trên mạng
Thông tin và tri thức
Trong thế giới hiện đại, mọi hoạt động của con người đều cần đến thông tin:
Thông tin về giá cả, thị trường, khách hàng và đối tác cho các hoạt động sản xuất kinh
tế, kinh doanh thương mại.
Thông tin về các chính sách, pháp luật, thuế, tiền tệ, dân số, lao động, đất đai, môi
trường cho hoạt động quản lý kinh tế và quản lý nhà nước.
Thông tin về văn hoá, khoa học và giáo dục tập trung chủ yếu ở hoạt động Thông tin Thư viện.
Để có được các thông tin cần thiết, phải hình thành các kho dữ liệu, thu thập và tổ
chức thông tin trong các cơ sở dữ liệu và tạo điều kiện cho người sử dụng truy tìm những
thông tin cần thiết theo nhu cầu riêng của mình.
Phần lớn trong chúng ta đều nhận thức được rằng để có thể hình thành được những
nguồn thông tin có giá trị và khai thác hiệu quả chúng, cần phải thiết lập những kho dữ
liệu thông tin mà hạt nhân của chúng là các hệ quản trị cơ sở dữ liệu. Tuy nhiên đây mới
chỉ là một công đoạn đầu tiên trong cả quá trình.
Để biến thông tin thành tri thức, chúng phải được chuyển tải tới người sử dụng theo
các yêu cầu về tìm kiếm dữ liệu và dựa vào một giao tiếp với CSDL. Đồng thời dữ liệu
trong các kho dữ liệu phải được bổ xung, cập nhật, trao đổi, phân phối và di chuyển tương
đối dễ dàng để có thể trở thành những hệ thống thông tin phong phú, rộng rãi, đáp ứng các
nhu cầu khác nhau của người sử dụng.
Trong thời đại của cuộc cách mạng thông tin, những người sử dụng Thông tin –
Thư viện cần có một hệ thống liên kết Thư viện hoạt động trên nền tảng các Thư viện
Điện tử trong đó mọi thông tin chủ yếu đều được số hoá để có thể dễ dàng trao đổi trên
mạng máy tính Internet.
Mạng Internet và truy cập thông tin
Chúng ta thử điểm qua một số công nghệ chủ yếu ngày nay giúp cho việc hình
thành các kho dữ liệu và phân phối các thông tin trên mạng máy tính Internet.
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
9
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
Công nghệ World-Wide Web ra đời vào những năm 90 của thế kỷ XX đã cho phép
phân phối các dữ liệu phi cấu trúc, bao gồm các thông tin dạng văn bản, hình ảnh, âm
thanh. Để tìm kiếm và truy cập được các thông tin hữu ích trên mạng, các thông tin này
thường được đặt tại các vị trí web (website), người sử dụng phải vào được các địa chỉ
chứa chúng. Để thực hiện việc tìm kiếm, chúng ta có thể sử dụng các máy tìm kiếm trên
mạng (seach engine) là nơi đã tìm và lưu trữ trước các địa chỉ web. Các thông tin thường
được sắp xếp theo chủ đề (subject) hoặc theo một từ khoá (keyword) nào đó.
Mạng Internet ra đời và phát triển chứng tỏ tính ưu việt trong khai thác thông tin.
Ngày nay Internet đã trở thành một kho dữ liệu thông tin khổng lồ, chứa đựng kiến thức
mà nền văn minh nhân loại đã tích lũy hàng trăm năm, và lượng thông tin trên mạng
Internet cũng không ngừng được bổ xung hàng phút, hàng giờ.
Theo số liệu của máy tìm kiếm thông tin Google, đến thời điểm tháng 12/2006 đã
có 6 tỷ trang web chứa đựng thông tin hữu ích. Riêng trên mạng Internet Việt nam ước
tính tại thời điểm hiện nay (12/2006) đã có cả hàng chục triệu trang thông tin tiếng Việt.
Tuy nhiên vì tính chất quá rộng lớn của kho tài nguyên thông tin Internet nên người
ta phải xây dựng các website có chức năng các cổng thông tin (Information Portal) để tập
hợp các thông tin chuyên sâu về từng lĩnh vực hẹp hơn, như thương mại, thị trường chứng
khoán, thông tin du lịch, giải trí, văn hoá, khoa học, giáo dục, v.v…
Xu thế chung trong lĩnh vực khai thác thông tin Internet là mỗi quốc gia, mỗi bộ
ngành, địa phương và từng đơn vị phải thiết lập các website hay portal để cung cấp thông
tin phục vụ cho nhu cầu khai thác thông tin của chính mình.
Nền tảng công nghệ chủ yếu giúp chuyển giao thông tin trên mạng Internet tới
người sử dụng là các hệ thống máy chủ web (webserver), nơi thông tin được lưu trữ, và
trình duyệt web (web browser), nơi người dùng có thể để truy cập và xem các thông tin
dưới dạng văn bản, đồ hoạ, thưởng thức các thông tin đa phương tiện. Ngôn ngữ trình bày
trang siêu văn bản HTML (Hyper Text Markup Language) cho phép chuyển tải thông tin
tới người dùng với khả năng trình bày rất phong phú và đa dạng. Các nguồn thông tin có
thể được trích ra từ các cơ sở dữ liệu, theo yêu cầu của người sử dụng và tạo nên những
trang Web sinh động và hấp dẫn.
Trong lĩnh vực Thông tin – Thư viện, đã hình thành những địa chỉ trên mạng
Internet mà tại đó người sử dụng có thể thực hiện những tìm kiếm thông tin có cấu trúc,
được lưu trữ trong các cơ sở dữ liệu bằng giao tiếp thông qua trình duyệt Web của mình.
Các hệ thống này sử dụng công nghệ kết nối cơ sở dữ liệu với giao diện dựa trên web:
Web-based Database Interface. Đây là một công nghệ mới và đang phát triển rất nhanh
chóng, với ứng dụng ngày càng mở rộng và phong phú không chỉ cho lĩnh vực CSDL mà
còn cho hầu như tất cả các ứng dụng khác cần đến giao tiếp tiện lợi, từ xa với người sử
dụng, như mua bán trên mạng trong thương mại điện tử.
Nội dung chủ yếu của công nghệ giao tiếp web là thay vì sử dụng các phần mềm
giao tiếp có sẵn của các hệ quản trị cơ sở dữ liệu như Oracle, MS Access, MS SQL Server
(phần lớn được lập trình theo mô hình khách/phục vụ), người ta viết thêm các thành phần
giao tiếp CSDL và tích hợp với hoạt động của máy chủ web theo các chuẩn giao tiếp CGI
(Common Gataway Interface), API (Application Programming Interface) hoặc trên nền
tảng công nghệ Java (Servlet/JSP/EJB).
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
10
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
Chúng ta giao tiếp với cơ sở dữ liệu chỉ cần thông qua một trang web thông thường,
những bên dưới nó là cả một nền tảng công nghệ hết sức phức tạp và tinh tế, giúp kết nối
và chuyển giao dữ liệu từ website là nơi đặt cơ sở dữ liệu đến người sử dụng thông qua
mạng Internet. Với công nghệ dựa trên web này, dữ liệu trong các cơ sở dữ liệu đã có thể
đến với người sử dụng cũng tiện lợi như các thông tin văn bản, hình ảnh, âm thanh mà
chúng ta vẫn tải về từ các website.
Những hạn chế của trao đổi dữ liệu truyền thống trên mạng Internet
Nếu như vấn đề chuyển giao dữ liệu từ các kho dữ liệu đến người sử dụng thông
qua mạng Internet đã có thể giải quyết tương đối tốt đẹp bằng công nghệ Web, sử dụng
giao tiếp web và ngôn ngữ trình bày siêu văn bản HTML, thì vấn đề trao đổi dữ liệu giữa
các hệ thống thông tin, các kho dữ liệu lại là vấn đề khá nan giải.
Mặc dù ngày nay chúng ta đã có mạng Internet như một phương tiện chuyển tải
thông tin rất nhanh chóng, nhưng mạng Internet với kiến trúc đặc thù riêng lại không
giống như những mạng máy tính cục bộ, nơi mà các dữ liệu có thể trao đổi dễ dàng bằng
những phương pháp truyền thống và đơn giản như sao chép (copy), nhân bản (replication),
hoặc xuất nhập trực tiếp với sự trợ giúp của các phần mềm chuyên dụng. Việc triển khai
một ứng dụng liên quan đến cơ sở dữ liệu trên mạng Internet hoàn toàn không giống như
trên mô hình mạng cục bộ, thậm chí nhiều phần mềm hoạt động tốt trên mạng cục bộ lại
không thể chạy trên mạng Internet.
Điển hình là những hệ thống thông tin do các bộ - ngành và các địa phương xây
dựng nhiều năm qua, phần lớn dựa trên mô hình mạng cục bộ với những phần mềm CSDL
chuyên dụng đắt tiền nhưng lại không thích hợp để trao đổi, chuyển giao và nhân bản một
cách tự động qua mạng diện rộng và mạng Internet. Do đó mỗi khi cần trao đổi dữ liệu,
người ta phải truy cập từ xa bằng điện thoại đường dài, hoặc bằng các mạng thuê bao dùng
riêng rất tốn kém. (Nhiều hệ thống Thông tin Tư liệu Quốc gia đặt tại Hà nội khi muốn
truy cập phải sử dụng điện thoại liên tỉnh để kết nối). Ở đây chưa bàn đến vấn đề bảo mật
thông tin khi cần trao đổi qua mạng, mà mới thử tìm hiểu lý do kỹ thuật nào cản trở khả
năng trao đổi dữ liệu, qua đó xem xét các giải pháp khắc phục tối ưu nhất.
Mạng Internet bản thân nó có một kiến trúc tương đối phức tạp, với nhiều hệ thống
mạng máy tính khác nhau kết nối với nhau thông qua nhiều phương thức và nhiều thiết bị
nối mạng. Trên mạng lại tồn tại rất nhiều cửa ngõ kiểm soát, ngăn chặn thông tin bằng cơ
chế khoá cổng dịch vụ (service ports) của các bức tường lửa (firewall), hoặc đơn thuần
bằng các dịch vụ ủy quyền (proxy service) chỉ có khả năng kết nối theo một chiều. Thí dụ
khi chúng ta kết nối qua điện thoại hay một mạng dùng riêng để truy cập ra Internet, phần
lớn chúng ta chỉ được cấp những địa chỉ IP giả (private IP) do đó không thể vận hành cơ
chế trao đổi thông tin trên mạng Internet bằng những phần mềm khách/dịch vụ
(client/server) đòi hỏi phải tạo được những kết nối riêng theo cơ chế ổ cắm (socket).
Trong trường hợp trao đổi tư liệu Thông tin - Thư viện, phương pháp liên kết thư viện theo
chuẩn quốc tế Z39.50 hoàn toàn không thích hợp và không chạy được trên mạng Internet
Việt nam, là nơi số lượng địa chỉ IP thực được cấp rất hạn hẹp, với hầu hết các mạng dùng
riêng kết nối Internet thông qua dịch vụ ủy quyền và các bức tường lửa. Muốn trao đổi
thông tin thông suốt, bắt buộc chúng ta phải tự giới hạn trong môi trường của các dịch vụ
Internet phổ biến như World-Wide Web, Internet E-mail, FTP (File Transfer Protocol).
Nghi thức truyền tập tin FTP và E-mail là hai dịch vụ ra đời khá sớm trên mạng
Internet, giúp con người trao đổi các thông tin riêng tư rất hiệu quả nhờ vào cơ chế hoạt
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
11
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
động đơn giản. Tuy nhiên ứng dụng của chúng trong trao đổi thông tin giữa các cơ sở dữ
liệu còn rất hạn chế vì đòi hỏi sự can thiệp của con người. Bản thân dữ liệu thông thường
tự nó không chứa đựng những thông tin cần thiết để có thể tự động nhập vào các kho
thông tin và các cơ sở dữ liệu khi được chuyển giao bằng FTP hay E-mail !
Dịch vụ WWW có rất nhiều hứa hẹn nhưng bản thân ngôn ngữ chuyển tải thông tin
HTML lại không thích hợp để trao đổi dữ liệu. Chúng ta không thể tổ chức một cơ sở dữ
liệu tại chỗ chỉ bằng cách tải xuống các trang web chứa thông tin đã được định dạng bằng
ngôn ngữ HTML, dù cho các thông tin này có cấu trúc, thậm chí được lấy ra từ một cơ sở
dữ liệu nào đó. Để tiếp nhận thông tin và đưa vào cơ sở dữ liệu thông qua mạng Internet,
nghĩa là lấy thông tin từ xa, dường như chỉ có cách nhập dữ liệu qua các trang web chứa
các form nhập liệu, hoặc bằng cách chuyển tải dữ liệu từ xa về và … tự nhập lấy!
Với cách thức trao đổi dữ liệu như hiện nay, nhất là từ các dữ liệu của các kho tư
liệu Thông tin-Thư viện thì dù có dùng đến mạng Internet để chuyển tải thông tin, bắt
buộc các nhà quản trị Thông tin - Thư viện phải tham gia vào nhiều công đoạn từ chuẩn bị
dữ liệu, chuẩn hoá các phần mềm nhập liệu và các hệ quản trị cơ sở dữ liệu cũng như bản
thân quá trình nhập dữ liệu. Các lý do nêu trên đã cản trở rất nhiều quá trình trao đổi thông
tin và ứng dụng CNTT trong hoạt động Thư viện, đôi khi làm tiêu tốn cả bạc tỷ mà vẫn
không giải quyết được vấn đề quan trọng nhất là thông tin phải dễ dàng trao đổi giữa các
hệ thống và nhanh chóng đến được với người cần sử dụng chúng.
Ngôn ngữ đánh dấu mở rộng XML và trao đổi dữ liệu trên mạng
Giải pháp thích hợp cho vấn đề trao đổi dữ liệu tự động giữa các kho thông tin và
các cơ sở dữ liệu trên mạng Internet là áp dụng ngôn ngữ đánh dấu mở rộng XML
(eXtensible Markup Language) Đây là vấn đề thời sự nóng bỏng nhất hiện nay của
CNTT trên thế giới nhưng dường như vẫn chưa được các nhà hoạch định chính sách
CNTT chúng ta quan tâm đến, để nhanh chóng áp dụng vào thực tế. Trong khi đó vấn đề
xây dựng các kho dữ liệu thông tin quốc gia và các ngành đang được triển khai với nhiều
nguồn kinh phí không nhỏ (Riêng tại Tp HCM, kinh phí để tổ chức và xây dựng các kho
thông tin dữ liệu phục vụ quản lý xã hội và quản lý kinh tế lên đến hàng chục, hàng trăm
tỷ đồng).
Bản thân ngôn ngữ XML có nguồn gốc từ ngôn ngữ định dạng siêu văn bản
HTML, cả hai ngôn ngữ này đều bắt nguồn từ chuẩn ngôn ngữ định dạng văn bản tổng
quát có cấu trúc SGML (Structured General Markup Language). Một văn bản XML hình
thành từ các thẻ (tag) với tên gọi phần tử (element). Nhưng khác với ngôn ngữ HTML, số
lượng và tên gọi các phần tử trong XML là không hạn chế.
Đối với các thông tin đã có cấu trúc, như thông tin trong các cơ sở dữ liệu, việc mô
tả chúng bằng văn bản XML là rất dễ dàng và chính xác. Ví dụ thông tin về danh sách
nhân viên trong bảng lương sau đây:
Bảng lương nhân viên Công ty Lương thực Thành Phố
STT
Họ Tên
Chức vụ
Lương
chính
1
Nguyễn An Ninh
Giám đốc
5.000.000
0,7
2
Trần Thị Thanh Thuý
Trợ lý giám đốc
1.500.000
0,3
3
Phạm Văn Bảy
Trưởng phòng tài vụ
2.500.000
0.5
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
Phụ cấp
12
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
Tài liệu XML tương ứng cho các dữ liệu trong bảng trên như sau :
Bảng lương nhân viên
Công ty Lương thực Thành phố
Nguyễn An Ninh
Giám đốc
5000000
0,7
Trần Thị Thanh Thuý
Trợ lý giám đốc
1500000
0,3
Phạm Văn Bảy
Trưởng phòng tài vụ
2500000
0,5
Tài liệu XML như trên rất dễ dàng có thể tạo ra bằng bất cứ trình soạn thảo văn bản
nào, tương tự như văn bản HTML, tuy nhiên để có thể sử dụng nó cho trao đổi thông tin,
cần phải tuân thủ một số quy tắc sau:
Well-Formed: văn bản XML là well-formed khi nó được viết theo cú pháp phù
hợp với đặc tả XML của tổ chức W3C. Các phần tử hình thành một cây phân cấp có
chung một phần tử gốc (root element). Các phần tử có thể chứa một hay nhiều phần tử con
xếp lồng vào nhau. Trong thí dụ trên các phần tử NAME, POSITION, SALARY,
PERCENT là con của phần tử EMPLOYEE. Tất cả đều có chung một gốc là
SALARYTABLE. Tuy nhiên phần tử TABLENAME không cùng cấp với phần tử NAME
theo mối quan hệ cha con.
Well-Validated: văn bản XML được gọi là well-validated thì trước hết nó phải là
văn bản well-formed và phải phù hợp với tất cả các định nghĩa trong một đặc tả chung cho
các văn bản có cùng cấu trúc, gọi là DTD (Document Type Definition). Các định nghĩa
này cũng tương tự như định nghĩa dữ liệu trong các bảng của cơ sở dữ liệu về kiểu biến
(data type), độ dài dữ liệu (size), và các mối quan hệ khác (key, not null …). Nói cách
khác, văn bản XML được coi là valided nếu nó không chứa bất kỳ phần tử nào mà không
được định nghĩa trước trong DTD và thứ tự xuất hiện, số lần xuất hiện của một phần tử
phải phù hợp với các đặc tả của DTD.
Để có thể trao đổi thông tin có cấu trúc, hai cơ sở dữ liệu phải thống nhất dùng
chung một đặc tả DTD cho các văn bản XML. Tuy nhiên với các văn bản phi cấu trúc thì
không nhất thiết phải tuân thủ hoàn toàn chuẩn về tính Valided của một tài liệu XML, mà
chỉ cần một phần trong chúng chứa những thông tin hữu ích giúp cho việc mô tả tính chất
và nội dung của bản thân tài liệu. Các thông tin mô tả này còn gọi là Meta-Data (Dữ liệu
mô tả về các dữ liệu).
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
13
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
Các văn bản XML với một số thông tin mô tả kèm theo cũng dưới dạng văn bản
XML có thể dễ dàng chuyển giao trên mạng Internet, tương tự như các tập tin HTML.
Nhưng chúng không trực tiếp dành cho con người mà dành cho các hệ thống tự động xử lý
thông tin để nhập vào các cơ sở dữ liệu. Quá trình xử lý các văn bản XML và các phần
mềm dùng để xử lý chúng còn gọi là các bộ XML Parser. Các phần mềm này cũng có vai
trò tương tự như các trình duyệt thông tin Web, chỉ có khác là các bộ XML Parser này
dành cho các phần mềm và chương trình máy tính để thực hiện quá trình tự động xử lý
và nhập/xuất dữ liệu thay cho con người. Tuy ý tưởng về một ngôn ngữ văn bản giúp tự
động hoá quá trình nhập/xuất/trao đổi dữ liệu giữa các kho dữ liệu như ngôn ngữ XML là
hết sức đơn giản, nhưng hiệu quả mà nó đem lại rất to lớn, giúp chúng ta có thể giải
quyết những vấn đề còn vướng mắc trong quá trình trao đổi thông tin CSDL trên mạng
Internet.
XML như ngôn ngữ đánh dấu văn bản đã được thiết kế để mô tả dữ liệu. Các thẻ
được sử dụng trong XML không được định nghĩa sẵn như trong HTML mà lập trình viên
phải tự định nghĩa các thẻ này. HTML được thiết kế để hiển thị dữ liệu và tập trung vào
cách hiển thị dữ liệu như thế nào. Trong khi đó XML là ngôn ngữ chỉ được dùng để mô tả
dữ liệu và tập trung vào ý nghĩa của dữ liệu. Ngôn ngữ này không xử lý được dữ liệu do
đó phải cần đến các công cụ để xử lý dữ liệu như các trình phân tích và xử lý tài liệu XML
(SAX, DOM), các ngôn ngữ định dạng dữ liệu (XSL), các giao diện lập trình ứng dụng hỗ
trợ cho việc truy xuất các thành phần trong tài liệu XML. XML có thể được dùng để trao
đổi thông tin trên mạng thông qua các phương tiện trao đổi khác nhau giữa các chương
trình ứng dụng. Trong tương lai XML sẽ được dùng để tổ chức và mô tả các dữ liệu trên
Web trong khi HTML sẽ chỉ được dùng để định dạng và hiển thị dữ liệu, bên cạnh các
nghi thức kha như WML, SVG, MathML, VRML, ...
XML là công cụ để tạo nên dữ liệu có cấu trúc trong tập tin dạng văn bản.
Có thể sử dụng XML để tạo, hiển thị và xử lý trên các cấu trúc dữ liệu phức tạp như
cấu trúc cây, cấu trúc bảng.
XML được mô tả rõ ràng và có cấu trúc hệ thống rất thuận lợi trong công việc tìm kiếm
thông tin dựa trên các thẻ trong tài liệu XML.
Cho phép kết nối nhiều tài liệu XML, tạo thành một tài liệu XML mới.
XML được sử dụng để tạo nên cấu trúc và mô tả dữ liệu, thích hợp cho các ứng dụng
có nhiều người dùng sử dụng chung dữ liệu.
Tài liệu XML có thể trao đổi trên mạng thông qua các phương tiện khác nhau giữa các
chương trình ứng dụng.
Xử lý được tất cả các ký tự dấu ở các ngôn ngữ khác nhau do XML mã hóa theo chuẩn
ISO-10646. (Unicode).
XSL - Ngôn ngữ định dạng mở rộng
XSL là ngôn ngữ dựa trên XML, được thiết kế để chuyển đổi một tài liệu XML
thành một tài liệu XML khác hoặc chuyển đổi một tài liệu XML thành các đối tượng thể
hiện (rendition object). Ngôn ngữ XSL gốc được chia thành ba ngôn ngữ riêng lẻ, ngôn
ngữ chuyển đổi (XSLT), Ngôn ngữ thể hiện (XSLF - gồm cách sử dụng của XSLT), ngôn
ngữ truy cập cấu trúc bên dưới của XML (Xpath).
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
14
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
PHẦN II. XU HƯỚNG PHÁT TRIỂN PHẦN MỀM ỨNG DỤNG
TRÊN MẠNG MÁY TÍNH
2.1 Lựa chọn giải pháp công nghệ nền
Ngành Công nghệ phần mềm trong khoảng thời gian 10 năm (1995-2005) đã có
những bước tiến bộ vượt bậc, đặc biệt từ sau khi xuất hiện máy vi tính cá nhân, mạng máy
tính Internet và sự tiến bộ không ngừng của kỹ thuật phần cứng làm giảm giá thành, tăng
hiệu năng tính toán và cơ hội ứng dụng phần mềm trên mạng.
Những năm 1990, tại Việt nam bắt đầu xuất hiện các phần mềm tin học đầu tiên
được viết bằng ngôn ngữ Basic, Pascal, những hệ quản trị cơ sở dữ liệu trên nền ngôn ngữ
FoxPro. Đặc trưng của giai đoạn này là các phần mềm được phát triển giữa trên nền giao
diện DOS (DOS-based), có thể sử dụng mạng vi tính ở mức độ chia sẻ tập tin, với khả
năng bảo mật còn non yếu. Sau đó, với sự ra đời của hệ điều hành đồ hoạ MS Windows,
rất nhiều ứng dụng được chuyển qua nền giao diện đồ hoạ tiện lợi, phong phú. Các phần
mềm phát triển trên môi trường MS Windows (windows-based) được hỗ trợ bởi các công
cụ lập trình, các thư viện tiện ích phong phú và nhất là do tình trạng bản quyền lỏng lẻo,
sao chép lậu phần mềm ngày càng dễ dàng nên đã góp phần tạo ra một trào lưu phát triển
ứng dụng trên Windows khá sâu rộng trong giới CNTT nưôc nhà. Chỉ mới gần đây, khi
mạng Internet ngày càng xâm nhập rộng rãi, các giải pháp phần mềm trên nền website
(web-based) mới được chú trọng và ngày càng tỏ rõ vai trò chủ đạo cho các ứng dụng Tin
học hoá quy mô lớn, xoá đi sự khác biệt giữa các phần mềm trên nền Windows và không
phải Windows (như UNIX/Linux).
Tuy nhiên, theo nhận định của nhóm nghiên cứu chúng tôi, xu hướng phát triển
phần mềm dựa trên nền tảng các cổng thông tin (portal-based) mới là xu hướng chủ đạo
cho các ứng dụng đã và đang được triển khai mới hiện nay của thế giới. Đây thực sự là
một thách thức đối với nền công nghệ phần mềm non trẻ của Việt nam còn chưa kịp tiếp
cận các nền tảng và công nghệ website.
Căn cứ vào những nghiên cứu trên, kết hợp với nhu cầu thực tế, nhóm nghiên cứu
chúng tôi đã quyết định dầu tư nghiên cứu khả năng áp dụng phần mềm cổng thông tin và
phát triển phần mềm cho cổng thông tin. Mục tiêu của nghiên cứu này để giúp đánh giá
giải pháp công nghệ trước khi quyết định đầu tư phát triển ở quy mô lớn. Đây là phương
pháp tiếp cận khoa học và thực tiễn một vấn đề mới, theo cách gọi của các nhà công nghệ
là sự chứng minh quan điểm. Cho đến hiện tại, các kết quả mà chúng tôi đã đạt được đều
dựa trên phương pháp tư duy này. Thực sự đây là giải pháp rất hiệu quả để phát triển sản
phẩm CNTT, tránh các quyết định đầu tư có thể dẫn đến lãng phí thời gian và nhân lực.
Cổng thông tin không phải là một phát kiến mới, mà là kết qủa tất yếu của sự phát
triển trong lĩnh vực công nghệ phần mềm trên mạng, khi nhu cầu tích hợp thông tin và ứng
dụng trở nên rõ ràng. Chúng ta hãy hình dung một tổ chức, cơ quan khi tin học hoá phải
phát triển và khai thác hàng chục ứng dụng CNTT, hàng trăm phần mềm các loại, mà mỗi
phần mềm đều đòi hỏi các cơ chế truy xuất dữ liệu, cơ chế bảo mật riêng. Khi đó, ngay
việc ghi nhớ các mật khẩu để đăng nhập quản trị và bảo trì phần mềm đã là cơn ác mộng
cho các chuyên gia CNTT, chưa nói đến người sử dụng thông thường ! Điều này cũng
giống như khi còn đói thông tin, chúng ta sẵn sàng ngồi tra cứu trên Internet để xem tất cả
các tài liệu nào có thể tiếp cận được, nhưng khi đã có một rừng các thông tin thì việc tập
hợp chúng lại trong một website, trong cơ sở dữ liệu và dùng các công cụ, các máy tìm
kiếm thông tin là điều bắt buộc.
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
15
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
Trong thời gian tiến hành đề tài nghiên cứu tại Trung tâm Công nghệ Phần mềm
ĐHQG-HCM, chúng tôi đã tổ chức ba đợt tập huấn giới thiệu công nghệ cổng thông tin và
phát triển phần mềm, cho đối tượng là sinh viên hệ chính quy các Khoa CNTT, Khoa
Toán-Tin học, các lập trình viên của một số công ty phát triển phần mềm tại TP.HCM. Kết
quả đào tạo tuy mới ở bước khởi đầu, nhưng theo đánh giá của nhóm đề tài là rất khả
quan. Các lập trình viên Việt nam hoàn toàn có khả năng nắm bắt công nghệ mới rất
nhanh chóng, và có thể ứng dụng chúng để phát triển ra các sản phẩm phần mềm (trong
nền tảng cổng thông tin) với chất lượng cao, không thua kém sản phẩm của các công ty
chuyên phần mềm nước ngoài.
Trong các chuyến công tác tại Nhật bản và Hoa kỳ, chủ nhiệm đề tài, TS. Hoàng Lê
Minh đã có cơ hội tiếp xúc với một số chuyên gia nước ngoài phát triển phần mềm để trao
đổi về sản phẩm phần mềm cổng thông tin iPortal được phát triển dựa trên khung phần
mềm cổng thông tin mã nguồn mở uPortal do hơn 20 trường Đại học tại Hoa kỳ và Châu
Âu, nhận tài trợ của Quỹ Andrew Melon, phát triển. Kết quả ban đầu là đáng khích lệ. Tổ
chức Jasig (Java in Administration Special Interest Group, một tổ chức của các giới thiệu
website ĐHQG-HCM với phần mềm cổng thông tin Việt hoá iPortal do nhóm nghiên cứu
thực hiện tại Trung tâm CNPM ĐHQG (UniSoft), minh chứng cho sự lựa chọn công nghệ
nền để phát triển ứng dụng mạng Intranet/Internet của nhóm nghiên cứu từ năm 2002.
2.2 Giải pháp phát triển phần mềm dựa trên kiến trúc đa tầng J2EE
Ðể thoả mãn các yêu cầu xây dựng những ứng dụng lớn quy mô xí nghiệp, Công ty
Sun Microsystems đã đưa ra mô hình phát triển ứng dụng dựa trên nền tảng công nghệ
Java cho xí nghiệp J2EE (Java2 Enterprise Edition). Ðây là một xu hướng quan trọng, thu
hút sự quan tâm của rất nhiều các công ty phần mềm trong và ngoài nước. Sun
Microsystems là công ty đầu tiên khởi xướng môi trường phát triển ứng dụng phần mềm
bằng công nghệ Java vào năm 1995. Nhưng khác với MicroSoft, Oracle, IBM với nhiều
công nghệ sở hưu riêng và có nhiều thành công trên thị trường, Sun lại đề nghị một mô
hình hoàn toàn mở, với ý tưởng xuất phát từ mô hình phát triển khá thành công của hệ điều
hành UNIX (Sun Microsystems cũng là một nhà phát triển nổi tiếng với các phiên bản
SunOS và Sun Solaris) và phần mềm nguồn mở OpenOffice (Sun Microsystems cũng có
sản phẩm thương mại tương đương là StarOffice). Các ứng dụng J2EE theo định nghĩa là
các ứng dụng đa tầng (multi-tier). Có thể chia ứng dụng J2EE thành các tầng như sau:
Client Tier (Internet/Intranet Client hay còn gọi là tầng khách) bao gồm trình duyệt
web của người sử dụng (có thể nằm trong hay ngoài firewall của mạng, có thể là các
máy dịch vụ ủy quyền proxy server).
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
16
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
Web Tier (Internet/Intranet Webserver hay còn gọi là tầng Web) bao gồm các máy chủ
chứa nội dung Web của xí nghiệp, có thể là công cộng nằm ở vùng DMZ, hay dùng
riêng trong mạng cục bộ.
JSP/Servlet/EJB Tier (Java Application Server hay còn gọi là tầng business) bao gồm
các máy chủ ứng dụng chứa các thành phần business logic xử lý ứng dụng bằng công
nghệ Java (JSP, Servlet/EJB)
EIS Tier (Database Server hay còn gọi là tầng EIS) bao gồm các máy chủ CSDL, kho
dữ liệu và ứng dụng khác
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
17
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
Hình 1 Mô hình ứng dụng đa tầng
Mô hình ứng dụng nhiều tầng cho phép gứi các yêu cầu xử lý công việc và ứng
dụng từ máy trạm (Client) thông qua máy chủ web (Web Server) đến một tầng xử lý trung
gian là máy chủ ứng dụng (Application Server) chạy trong môi trường Java
(JSP/Servlet/EJB). Trong hệ thống đa tầng, nhiều người sử dụng có thể chia sẻ các tài
nguyên dùng chung ở mức xí nghiệp (Enterprise Information System) như các cơ sở dữ
liệu (Database Server) và các ứng dụng truyền thống khác (Legacy Applications). Kiến
trúc này có những lợi ích đáng kể so với kiến trúc client/server hai tầng và do đó cho phép
các ứng dụng chạy nhanh hơn, có khả khả năng mở rộng và liên tác cao hơn. Ích lợi của
kiến trúc đa tầng có thể liệt kê như sau:
1. Độ tin cậy và tính linh hoạt trong mở rộng khả năng phục vụ giúp cho các giao
dịch (business transactions) được thực hiện nhanh chóng và chính xác. Máy chủ
ứng dụng hỗ trợ chia xẻ ứng dụng và cung cấp khả năng mở rộng tối đa. Mỗi máy
chủ ứng dụng với hệ thống nhiều CPU hoặc cluster máy chủ ứng dụng có thể hỗ trợ
một số lượng lớn các giao dịch/người sử dụng, không phụ thuộc vào nền phần
cứng, hệ điều hành và cấu hình hệ thống. Máy chủ ứng dụng được thiết kế trong
môi trường phân tán gồm các truy xuất dữ liệu tốc độ cao, các giao tác với khối
lượng lớn và khả năng mở rộng ứng dụng. Nhờ phân hoạch ứng dụng, máy chủ ứng
dụng cung cấp giải pháp có thể mở rộng cho một số lượng lớn người dùng và giao
tác. Khả năng mở rộng đạt được trong một hệ thống (máy chủ) nhờ thêm vào các
CPU hay các hệ thống chạy trên mạng. Kiến trúc module của máy chủ ứng dụng
còn cho phép dễ dàng mở rộng hệ thống và chức năng của ứng dụng ở mọi thời
điểm. Nhờ việc cài đặt những module mới, những ứng dụng có thể được cung cấp
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
18
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
những chức năng mới. Những đặc trưng này làm cho phần mềm trên máy chủ ứng
dụng có khả năng thích nghi cao với sự thay đổi môi trường hoạt động.
2. Độ an toàn và bảo mật cao giúp bảo vệ các thông tin quan trọng của người sử
dụng và tính thống nhất (integrity) của dữ liệu. Máy chủ ứng dụng cung cấp các
đặc trưng bảo mật từ A đến Z cho việc triển khai ứng dụng các xí nghiệp. Máy chủ
ứng dụng cung cấp truyền thông bảo mật với máy chủ Web như hỗ trợ SSL,
HTTPS và xác thực qua HTTP. Ðể làm cầu nối giữa trình duyệt và nguồn dữ liệu an
toàn, máy chủ ứng dụng cung cấp khả năng xác thực người sử dụng, khả năng làm
việc với cookies và điều khiển truy nhập dữ liệu đối với các giao tác an toàn. Việc
ghi nhận và theo vết các sự kiện cho phép bảo vệ chống lại các truy nhập không
hợp lệ và cho phép người quản trị phát hiện các hành động chủ quan, khách quan
ảnh hưởng đến bảo mật.
3. Tính sẵn sàng (khả dụng – availability) cho phép phục vụ những yêu cầu gia tăng
trên phạm vi toàn cầu. Máy chủ ứng dụng hỗ trợ các đặc trưng chính bao gồm đa
luồng, quản lý đối tượng và cân bằng tải động ở mức độ thấp, thông qua việc cung
cấp truy xuất dữ liệu hiệu quả và thời gian đáp ứng nhanh do sử dụng các dịch vụ
hệ thống như quản lý hàng đợi luồng, caching liên kết dữ liệu, caching kết quả.
Nhiều thực thể (instance) của máy chủ ứng dụng có thể được cài đặt thêm trên hệ
thống khi cần thiết. Nhờ kiến trúc dựa vào thành phần và khả năng cân bằng tải
động và theo dõi tải, việc xử lý yêu cầu được cân bằng trên các máy chủ ứng dụng,
đảm bảo tính sẵn sàng cao, thậm chí ngay cả khi khi nếu một máy chủ bị lỗi. Với
khả năng phục vụ trực tuyến, các thành phần máy chủ và ứng dụng có thể được cấu
hình lại, thêm hoặc bớt mà không cần tắt hệ thống.
4. Tính linh hoạt cao trong mở rộng khả năng phục vụ cho phép việc phát triển hệ
thống để đáp ứng nhiều yêu cầu thay đổi khác nhau (khi yêu cầu hệ thống thay đổi,
chỉ cần thay đổi logic xử lý tại một vi trí ở tầng giữa – middle tier – mà không cần
thay đổi tại từng máy khách) Với khả năng quản lý theo trạng thái và theo phiên
làm việc, máy chủ ứng dụng hỗ trợ những yêu cầu phức tạp, nhiều bước. Hệ thống
quản lý sẽ hỗ trợ quản lý tài nguyên, dữ liệu, giao tác, tự động xác nhận truy vấn
quay vòng, xác nhận thành công để không thực hiện lại nhiều lần. Máy chủ ứng
dụng cung cấp khả năng truy xuất dữ liệu dùng chung và truy xuất một cách thống
nhất các tác vụ dựa trên giao tiếp chuẩn tới những hệ thống dữ liệu không đồng
nhất.
5. Tích hợp dễ dàng các ứng dụng mới với hệ thống thông tin sẵn có. Với kiến trúc
máy chủ mở rộng, người phát triển có thể thiết kế các ứng dụng nhằm đáp ứng nhu
cầu triển khai ban đầu và phát triển sau đó mà không cần viết lại mã nguồn hay sửa
đổi các chi tiết kỹ thuật ứng dụng. Khả năng sắp xếp có hiệu quả tạo cho máy chủ
ứng dụng một giải pháp tối ưu cho các ứng dụng yêu cầu hỗ trợ giải quyết khối
lượng lớn công việc.
6. Giảm tính phức tạp trong phát triển ứng dụng phân tán nhờ cấu trúc đơn giản hóa
(EJB container và web server xử lý các tác vụ quan trọng thay cho người phát triển)
và khả năng chuyên môn hóa công việc (mỗi nhóm phát triển chuyên sâu về một
mảng như thiết kế giao diện, logic hiển thị, logic xử lý,...)
Kiến trúc ứng dụng qui mô xí nghiệp liên quan đến toàn bộ hạ tầng cơ sở phần
cứng và phần mềm, cấu hình mạng, môi trường phát triển thử nghiệm và triển khai ứng
dụng, v.v. Ðiều này phản ánh đòi hỏi của sự đầu tư lâu dài. Bằng cách sử dụng mô hình
này, các ứng dụng J2EE đều là các ứng dụng website, cho phép kết hợp các hệ thống ứng
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
19
TRUNG TÂM ỨNG DỤNG CÔNG NGHỆ MẠNG INTERNET (CITA)
dụng khác nhau thành một môi trường dễ quản lý, tạo điều kiện thuận lợi cho quá trình
khai thác và truy cập dữ liệu trên web. Tuy nhiên để đạt được mô hình này, các chuyên gia
CNTT phải có khả năng tích hợp những giải pháp website mà không cần xây dựng lại cơ
sở hạ tầng CNTT, không viết lại các ứng dụng đã có từ cấp cơ sở và giảm thiểu quá trình
huấn luyện lại người dùng. Mặt khác phải chú trọng lựa chọn hệ điều hành, webserver và
các phần mềm bảo mật/quản trị kèm theo, các hệ cơ sở dữ liệu và các thành phần phần
mềm của nhà sản xuất thứ ba để có thể tiết kiệm đầu tư. Do đó việc nghiên cứu kỹ để lựa
chọn môi trường (hệ điều hành) cho ứng dụng J2EE là rất quan trọng.
Kiến trúc ứng dụng website được xây dựng trên nền kiến trúc toàn xí nghiệp, có thể
liên quan đến từng ứng dụng hay dự án. Sau khi xây dựng xong hạ tầng cơ sở, việc nghiên
cứu kiến trúc ứng dụng phải dẫn đến kết quả: làm sao xây dựng ứng dụng cho phù hợp.
Ðồng thời chúng ta phải xem xét kỹ vấn đề cập nhật kiến trúc, khả năng sử dụng và sử
dụng lại các thành phần đã phát triển.
Việc cài đặt các ứng dụng quy mô xí nghiệp, bảo đảm khai thác các đầu tư đã có
vào cơ sở hạ tầng, tích hợp nhiều môi trường không đồng nhất và khả năng truy nhập vào
dữ liệu sẵn có của hệ thống là điều kiện tất yếu cho thành công của ứng dụng CNTT.
2.3 Giải pháp kết nối và chuyển đổi dữ liệu
Phương pháp tiếp cận giải quyết bài toán phát triển phần mềm cho cổng thông tin là
phục vụ mục tiêu kết nối, trao đổi và tích hợp thông tin, cụ thể là:
Mục tiêu thứ nhất là việc nối kết và chuyển đổi dữ liệu với nhiều thành phần hệ
thống khác nhau (về kỹ thuật giao thức và dạng nội dung dữ liệu).
Mục tiêu thứ hai trong quá trình tiếp cận là thống nhất về nghiệp vụ và chuẩn
hoá về công nghệ của các giao thức (interface/protocol), cơ sở dữ liệu
(database) và cách hoạt động (logic processing) của hệ thống
Mục tiêu thứ ba là đảm bảo tính liên tục của các dịch vụ và các ứng dụng
Các tiêu chí chính khi xây dựng cổng thông tin là cần phải:
Phát triển một hệ thống cổng thông tin với các phần mềm ứng dụng như là các
dịch vụ (Web Application Service – Software as a Service)
Tạo mới các cơ sở dữ liệu của hệ thống, người sử dụng và các ứng dụng
Hỗ trợ đa ngôn ngữ và các dạng dữ liệu khác nhau
Hỗ trợ thống kê và theo dõi các thông tin động trên toàn bộ các nguồn
Phát triển một tập hợp các siêu dữ liệu XML nhằm phục vụ cho việc thu thập,
cung cấp thông tin và trao đổi tự động với các ứng dụng bên ngoài.
Giải pháp phần mềm cần được xây dựng trên nền tảng cổng thông tin nhằm liên kết
các nguồn thông tin dạng khác nhau vào một chuẩn đóng gói dữ liệu duy nhất. Giao thức
trao đổi (interface) tại các nguồn thông tin có thể khác nhau tùy theo yếu tố của nguồn
thông tin địa phương. Các thông tin được đóng gói thành các dữ liệu có cấu trúc XML chặt
chẽ. Việc đảm bảo giao thức địa phương và các nguồn thông tin địa phương tuân theo giao
thức cung cấp thông tin của nguồn thông tin đó.
Ý tưởng chính của giải pháp là việc tất cả các dữ liệu trao đổi qua kênh thông tin
đều có cấu trúc XML. Các cấu trúc này tuân theo các giản đồ XML (XML Schema). Các
© 2001-2006 CitaSoft - Đề tài nghiên cứu – triển khai giải pháp nguồn mở
20