ĐẠI HỌC QUỐC GIA HÀ NỘI
K H O A CÔNG N G H Ệ
Chy Ty
CÁC GIẢI PHÁP NÂNG CAO TÍNH SẴN SÀNG
HỆ THỐNG MẠNG, MẠNG ISP CÔNG TY
VIỄN THÔNG QUÂN ĐỘI VIETEL
Chuyên ngành: Công nghệ thông tin
Mã số: 01.01.10
LUẬN VĂN THẠC s ĩ
NGƯỜI HƯỚNC. DẪN KHOA H Ọ C:
1. PGS TS Nguyễn Văn Vỵ
2. TS Tôn Quốc Bình
Hà Nội - Năm 2003
Chv 7'v Khoa Cóng nghe Dại học Quốc gia Hà nội
MỰC LỤC
Mỏ d ầ u .................................................................................................................................................1
( hương f Hệ thông sàn sàng cao.................................................................................... 3
1.1. Khái niệm về hệ thống sẩn sàng cao (High Availabiỉity)...............................................3
1.1.1. Định nghĩa tính sẵn sàng cao của hệ thống.............................................................. 3
1.1.2. Các mức sẵn sàng cao.................................................................................................. 3
1.1.3. Quan niệm về hệ sẩn sàng c a o ...................................................................................4
1.2. Các rủi ro và mức độ rủi ro trong một hệ th ống.............................................................. 6
IA Các giải pháp chung đảm bảo tính sẩn sàng c a o ............................................................. 7
1.3.1. Giải pháp phần cứng.....................................................................................................7
1.3.2. Giải pháp phán mềm.................................................................................................... 9
1.3.3. Giái pháp liên quan đến mối trường..................................................................... 10
1.3.4. Giải pháp liên quan đến người dùng..................................................................... 10
1.3.5. Lựa chọn một giải pháp tổng hợp..........................................................................1 i
Chương II Công nghệ kết c u m ...................................................................................................12
2.1. Định nghĩa kết cụm (Cluster)...........................................................................................12
2-2. Các lợi ích và hạn chế của sự kết cụm ..........................................................................13
2.2. ]. Lợi ích của sự kết c ụ m ........................................................................................... 13
2.2.2. Những hạn chế......................................................................................................... 14
2.3. Kêì cụm nhiều địa điếm và phân tán về địa ỉý.............................................................14
2.3.1. Kiểu thiếl kế thực hiện đầy đủ.................................. ............................................... 14
2.3.2. Kiếu thiết kế thực hiện lừng phần.......................................................................... 15
2.3.3. Phân bố rải rác các kết cụm....................................................................................16
2.4. Tổ chức kết c ụ m .............................................................................................................. 16
2.4.1. Trại kết cụm (Clusler Farm)................................................................................... 17
2.4.2. Gói kết cụm (Cluster Pack).......................................................................................18
2.5. Nguvên [ỷ hoạt động kết cụm........................................................................................... ỉ 8
2.6. Các cơ chế thứ lôi (Failover)............................................................................................ 2 ỉ
2.7. Nhịp tim (Heartbeat).......................................................................................................... 27
2.8. Cản hàng tái mạng (Network Load Balancing- NLB)............................................... 28
2.9. MC/Service Guard (Kết cụm của H P ) ..........................................................................32
2.9.1. Giới thiệu..................................................................................................................... 32
2.9.2. Đặc điểm và lợi ích của MC/Service G ua rd...........................................................33
2.9.3. Khóa kết cụm (Clusier Lock)...................................................................................34
2.9.4. Nhịp l i m . ......................... .................................................... .................................35
2.9.5. Gói tin (Packaging)................................................................................................... 36
2.9.6. NODE Fail F a s t . r ............ ................................................................................... 36
2.9.7. Các cơ chế thứ lỗi (Failover Policies)..................................................................... 37
2.9.8. Còng cụ MC/Service Guard...................................................................................... 38
2.10. SteelEye LifeKeeper (Kết cụm của SteelEye).............................................................39
2.10.1. Giới thiệu...................................................................................................................39
2.10.2. Phàn mềm công cụ khói phục ứng d ụ n g ..............................................................40
2.10.3. Đường truyển thông (Communication Path)...................................................... 4Ü
2.11. Microsoft Cluster (Kết cụm của Microsoft)................................................................ 42
2 . 11.1. Giới thiệu về việc thiết lập Microsoft Cluster......................................................42
2. ] ỉ .2. Đặc điổm Microsoft Cluster...................................................................................43
Luận văn Thạc sĩ
Trang 100
Chy T VKhoa Cóng nghệ Đại học Quốc gia Hà nội
2.11.3. Các ứng dụng hỗ trợ bởi Microsoft Cluster windows 2000............................ 44
2.11.4. Các máy dịch vụ ả o ...............................................................................................45
2.12. Kết luận................. .......................................................................................................46
2.12.1. MC/Service G uard.................................................................................................47
2.12.2. LifeKeeper.............................................................................................................. 47
2.12.3. Microsoft Cluster................................................................................................... 48
Chương III Công nghệ lưu trữ và khôi phục dữ liệ u ...................................................... 50
3 .1. 'l ổng q u an ......................................................................................................................... 50
3.2. Mô hình lưu trữ dữ liệu................................................................................................... 50
3.2.1. Kho lưu trữ kết nối trực tiếp (Direct Attach Storage- DAS)..............................50
3.2.2. Kho hru trừ kết nối qua mạng (Network Attach Storage-NAS).......................51
3.2.3. Kho lưu trữ mạng (Storage Area Networks-SAN)................................................ 52
3.3. Lưu trữ ảo.......................................................................................................................... 53
3.4. Sao lưu không có thời gian chết(Zero downtime Backup - ZDB).............................55
3.5. Côna. nghệ kênh sợi quang (Fible Channel-FC)......................................................... 57
3.6. Công nghẹ R A ID .............................................................................................................58
3.7. Quản trị lưu trữ ................................................................................................................ 61
Chương IV Thiết kê hệ thông sẵn sàng cao, mạng ISP V ietel......................................... 63
4 .1. Giới thiệu mạng Viên thông quân đội V ietel..............................................................63
4.2. Hiện trạng mạng ISP V ietel........................................................................................... 64
4.2. [ Các thành phán trong mạng ISPcủa V ieteỉ........................................................... 64
4.2.2. Mô tả chi tiết hệ th ố n g ........................................................................................... 67
4.2.3. Dự phòng và khôi phục dữ liệu.............................................................................. 68
4.2.4. Các hệ Quản trị m ạng............................................................................................. 70
4.3. Mạng có lính sẩn sàng cao................................................................................................71
4.3.1. Dự phòng bộ định tuyến......................................................................................... 72
4.3.2. Dự phòng NSÕOO..................................................................................................... 73
4.3.3. Dự phòng Sw itch..................................................................................................... 73
4.3.4. Môi (rường kết cụm .................................................................................................. 74
4.4. Các vấn đề cần giải quyết để nâng cao tính sẵn sàng mạng ISP Vieteỉ...................74
4.5. Thiết kế và các giải p h áp ................................................................................................. 76
4.5.1. Giái pháp cho bộ định tuyến (Cisco Router 2600)...............................................76
4.5.2. Giải pháp cho N S-500.............................................................................................. 79
4.5.3. Giải pháp cho Cisco Switch 6500........................................................................... 80
4.5.4. Giải pháp kết cụm...................................................................................................... 81
4.5.4.1. MC/Service G uard..........................................................................................81
4.5.4.2. LifeKeeper.......................................................................................................84
4.5.5 Giải pháp Primary và Secondary............................................................................ 85
4.5.6. Giái pháp nguồn cung cấp điện...............................................................................85
4.5.7. Xâv dựng hẹ thống kết cụm cho dịch vụ M ail......................................................86
4.6. Kịch bán kiếm tra hệ thống trong mồi trường kết cụm MC/ServiceGuard...............94
Kết luận........................................................................... .................................................................97
Tài liệu tham k h ả o ........................................................................................................................ 98
Luận vãn Thạc sĩ
Trang 101
TtrVIÉT TÄT
AAA
Authentication, Authorization, and Accounting
CRM
Customer Ralationship Management
DAS
Direct Attach Storage
RMS
Event Monitoring Service
ERP
Enterprise Resource Planing
FTP
File Tranter Protocol
GRE
Generic Routing Encapsulation
IISTP
Hot Standby Routing Protocol
LDAP
Lightweight Directory Access Protocol
MTBF
Mean Time Between Fault
MTTR
Mean Time To Repair
NAS
Network Attach Storage
NFS
Network Pile System
N IB
Network Load Balancing
NMS
Network Management Server
NOC
Network Operation Center
ÜLPT
Online Transaction Processing
RAID
Redundant Array o f I n d e p e n d e n t Disk
RAS
Remote Access Server
SAN
Storage Area Network
TCP
Transmission Control Protocol
L'DP
User Datagram Protocol
VLAN
Vitual LAN
VA
Virtual Array
VPN
Virtual Private Network
ZDB
Zero Downtime Backup
Ch V Ty Khoa Công nghệ Đại học Quốc ỊỊÌa Hà nội
MỞ ĐẨU
Với n ế n kinh tế toàn cấu d a n g phát triển, các C ô n g ty với q u y m ô trên loàn Ihế giới
đà và đ a n g đ u a c ô n g n g h ệ th ô n g tin vào các ứng d ụ n g thực tế. T h ư ơ n g m ại điện tứ đã tạo
diều k iện d ế m ọi người c ó Ihê’ tiến h à n h kinh doa n h 24 g iờ m ột n g à y , 7 ngày m ột tuần.
N h ữ n g ứng d ụ n g mới c ó thể c h o phép tiến h à n h tin học h o á c á c h o ạ t đ ộ n g hàng ngày của
m ình với m ức đ ộ c a o nhất từ x ư a đến nay.
Xu hư ớ n g n h ư vậy đ ã rõ ràng, tất c ả ch ú n g ta đều cần phải d ự a vào m ột hệ thống ổn
định đô có t h ể tru y c ậ p bất c ứ lúc nào. chính nhu c ầ u nàv làm tăng đ á n g kể tính sẩn sàng
c ủ a hệ th ố n g . C h ín h vì c á c c ồ n g ty và c á c tổ chức đều phải d ự a vào h ệ thống m á y tính của
m ình, bất c ứ thời gian n g ừ n g h o ạ t đ ộ n g nào c ủ a h ệ th ố n g đều có th ể ảnh hư ở ng nghiêm
trọ n a đến kin h d o a n h củ a c ô n g ty. nó k h ô n g chí là sự sút g iả m về n ã n g suất lao độn g m à
c òn là sự thất thoát vé d o a n h th u hay th ậm chí là sự su y g iám vị t h ế trê n thị trường.
H iện n à y c á c h ã n g lớn về lĩnh vực c ó n g n g h ệ th ô n g tin đ ã và đ a n g dược ng h iên cứu
các giải p h á p n â n g c a o tính s ẵ n sàng cao hệ thông m ạn g b a o g ồ m c ả giải pháp phân cứ ng
và phần n iềm . C á c c ồ n g ty. Lổ chức với q u y m ò lớn đ a n g đượ c áp đ ụ n g c á c giải pháp tính
sàn s à n g c a o đ ế đ ả m bảo hệ t h ố n g của họ vận hành liên tục. V à lư ơ ng lai m ọi c ổ n g ty, tổ
chức vừa và n h ỏ m à h o ạ t đ ộ n g c ủ a h ọ đéu dự a vào hệ [hống m ạ n g th ì cần phái có m ột giải
p h á p sẩn s à n g tích hợp.
M ạ n g c u n g c ấ p d ịc h vụ Iniernei (ISP) c ủ a c ô n g ty V iễ n t h ô n g q u â n đội là một
iroim s ố m ạ n g ISP V iệi N a m vừa xây dự n g đ ể phục vụ k h á c h h à n g c ó nhu cầu kết nối
Internet. M ạ n g có đ ư ờ n g kết n ố i quốc lế 2M B, và sắp tới sẽ tăn g th ê m m ột s ố đường kết
nối ra q u ố c tế với đ ư ờ n g tru y ề n lốc độ cao. Đ ể đ á p ứ ng tốt các d ịch vụ k h ô n g bị g ián đoạn
c h o các k h á c h h à n g n h ư là c á c doa n h ng h iệp và các c ơ q u a n ch ứ c n ă n g với nhu càu trao
dổi th õ n g lin liên tục c ầ n có m ột giải pháp đổ tăng đ ộ sẩn sàng, đ ả m bảo hệ ihống vận
h à n h với thời gian n g ừ n g hoạt đ ộ n g là nhỏ nhất. H iện nay, m ạ n g IS P c ô n g ty viễn thông
q u á n đội đã thực h iện giái p h á p dự p h ò n g bằng c á c h m u a th é m m ộ t s ố thiết bị phụ để
p h ò n g ngừa trong trư ờ n g hợ p p h ấ n cứ ng bị hỏng. G iải pháp n h ư vậy c h í là tạm thời, nó
c h ư a đ á p ứ ng đượ c đ ầ y di) c á c nhu cầu c ú a các k h á c h hàng, vì m ột sô' lỗi chưa the khác
Luận văn 1'hcic sỉ
Trang l
Chy Ty Khoa Công nghệ Đợi học Quốc ỊỊÌa Hà nội
phục dược như lỗi phần mềm và ihậm chí cần phải cấu hình lại hệ thống sau mội số lần
thất hại. cho nên cán có mội giái pháp mới tối ưu hơn với thời gian khôi phục rất nhỏ. Với
những lý do irén mà dề tài cua luận văn dược chọn là “ Các giải pháp nâng cao tính sẵn
sàng hộ thống mạng, Mạng ISP của công ty viễn thống quân đội Vietel”
Mục tiêu của đề tài là nghiên cứu tổng hợp những vản đề chung nhất vé một hệ
ỉhôiig san sàng cao. những giài pháp công nghệ chúng đang được sử dụng trên thực tẽ và
vận dụng nó để phân tích, để xuất các giải pháp nâng cao tính sẵn sàng cao của hệ thống
mạng ISP của công ty viễn thống quân đội.
Nội dung của luận văn bao gồm:
r
Chương 1: Hệ thống sẩn sàng cao, mô tả các khái niệm về một hệ thống tin có
tính sẩn sàng cao, phân tích các rủi ro có Ihể xây ra cho nó và các công việc cần
thực hiện để nâng cao tính sẵn sàng cúa hệ thống.
r Chương 2: Công nghệ kết cụm. mô tả Công nghệ kết cụm bao gổm: nguyên lý
hoạt động, cách thức tổ chức Cluster và một sô cồng cụ iiên quan tới giải pháp
Cluster như MC/Service Guard, LifeKeeper. Microsoft Clustering.
r Chương 3: Công nghệ lưu trữ và khôi phục dữ liệu,
m õ tả công nghệ lưu trữ và
khói phục dữ liệu bao gồm mô hình lưu irữ, cách khôi phục và sao chép dữ liệu
cùng với việc quản trị lưu trữ dữ liệu.
r Chương 4: Thiết kế hổ thống sẵn sàng cao mạng 1SP Vieteí mô tả việc phân tích
hiện trạng Mạng 1SP cổng ty viễn thông quàn đội Vietel và xây dựng giải pháp
có độ sẵn sàng cao cho mạng ISP này.
r- Kếi luận
Luận vân Thạc sĩ
Trang 2
City Ty Khoa Công nghệ Đại học Quốc gia Hà nội
CHƯƠNG I
HỆ THỐNG SẴN SÀNG CAO
1.1. Khái niệm về hệ thống sẳn sàng cao (High Availability)
1.1.1. Định nghĩa tính sân sàng cao của hệ thống
Tính sẩn sàng cao cùa hệ thống được hiểu là khá nàng hoạt động của một hệ thống
Irựe tuyốn và sẩn sàng đáp ứng nhu cầu khách hàng ở mọi thời điếm. Có rất nhiều nhân tố
làm cho hệ thống ngìmg hoại động không thể đáp ứng được yêu cầu của khách hàng trong
đó bao gôm cá thời gian cần để bảo trì hệ thống. Mục đích của các giải pháp tính sẩn sàng
cao là hạn chế tối thiểu việc ngừng hoạt động và sự khôi phục hệ thống một cách nhanh
chónạ khi có sự cô' xẩy ra.
Tính sẵn sàng cao không phái là một công nghệ riêng biệt hoặc ỉà một đặc trưng rõ
ràng cua hệ ihống. Đúng hơn, tính sẵn sàng cao là khả năng để đạt được mục tiêu và mang
nhiều ý nghĩa cụ thể tuỳ theo nhu cầu đặt ra. Để đạt được mục tiêu chiến lược này có rất
nhicu chiến lược còng nghệ và dịch vụ đã được dùng và mỗi công nghệ hay dịch vụ lại
hướnạ đốn đặt một mục tiêu cụ thế. [18]
1.1.2. Các mức sản sàng cao
Trong một phạm vi nào đó. tính sẩn sàng caơ chỉ đơn giản mang ý nghĩa khôi phục
một thám hoa và đưa tổ chức trở lại hoạt động bình thường của hệ thống một cách nhanh
chóng. Với những hệ thống nhỏ thì nó có thể chỉ đơn gián là có một hệ thống điện và cônơ
nghệ lưu Irữ dừ liệu được bảo vệ an toàn không bị ngắt kỹ thuật. Với một phạm vi rộng
hưn Ihì tính sẩn sàng cao là hệ thông có thể sần sàng làm việc liên tục đáp ứng mọi nhu
cẩu cùa khách hàng với cường độ, tẩn xuất và khối lượng khác nhau. Ví du như công nghệ
chia sẻ một khối ìượng lớn cống việc đế tiến hành ở nhiều nơi, đám bão tính trong suốt đối
với khách hàng khi sử dụng các dữ liệu được phân bổ ở nhiều nơi với khoảng cách lớn thì
khách hànạ cám nhận như sử dụng các dữ liệu tại chồ. Cho nên, có thể nói rầng, có rấí
Luán vàn Thạc sĩ
Trang 3
Chy Tv Khoa Công nghệ Đại học Quốc gia Hà nội
nhicu m ức đ ộ tính sần sà n g c a o k h ác nhau n ằ m giữa hai m ực đ ộ tối thiổu và lối đ a được đé
cập tiến, i 18 1
Người ta chia mức độ sần sàng trung bình theo các mức độ sau:
Mực độ sẵn sàng
Sán sàng
Thời gian ngừng hoạt động/năm
100%
0 phút
99.9999%
5 phút
: Sần sà n g liên lục
(Continuous Availability)
Tính chịu lồi cao
(Fault Tolerant)
Tính chịu lồi thường
99.99%
53 phút
(Fault Resilient)
Sán sàng cao
99.9%
8,8 tiếng
(High Availability)
Sẩn sàng bình thường
99-99.5%
44-87 tiếng
(Basic Availability)
Mức độ sẵn sàng được tính bàng công thức sau:
A_
MTBF
" MTBF + M TTR
Trong dó MTBF (Mean Time Between Fault) là thời gian mà hệ thống hoạt động
cung cấp dịch vụ, MTTR {Mean Time To Repair) là thời gian mà hệ thống ngừng hoạt
độne cung cấp dịch vụ.
Như vậv chúng ta có thể nâng cao mức độ sẩn sàng bàng cách giám thời gian
ngừng hoạt dộng cứa hệ thống và thời gian khôi phục lỗi khi hệ thống gặp sự cô. [27]
1.1.3. Q u a n niệm về hệ sản sàng cao
> Q u a n niệm đơn th u ầ n về kỹ th u ậ t
Khổng có một giải pháp nào là đưn giản, dể dàng và rẻ tiền cho tính sẵn sàng cao.
Bấi kv giái pháp nào cũng phải đâm báo cân đối giữa nhu cẩu thực tế và tính kinh tế cùa
nó.
Luán văn Thạc sĩ
Trang 4
( 'hy Ị y Khoa CônỊị nghệ tìại học Quốc gia Hà nội
Xu hướng của chúng ta là lập hựp những thành phần quan trọng khác nhau về phấn
cứng, phần mềm, các tiến trình của những hệ thống độc lập để tạo thành một hệ thống
phối hợp dế cổ thế quán lý một cách tập trung. Cụ ihể hơn là, tập hợp những thành phổn có
mõi quan hệ phụ thuộc lẫn nhau cua hệ thống phức lạp ihành một hệ thống tổng thể để
(láp ứng đirợc các yêu cầu đặt ra.
Một hệ ihống phối hợp ihường dược cấu hình và đo đạc bởi một trung tâm máy
dịch vụ và Irung tâm mạng.
Trung tâm máy dịch vụ ỉà tập hợp các máy dịch vụ được kết cụm với tính sẵn sàng
CỈU» do bàng phần trảm thời gian dịch vụ trực tuyến mà các khách hàng ở bất cứ nơi nào
trong miền cúa hệ thống đều có thế truy cập được.
Trung tàm mạng dựa vào mỏt kiến trúc phân tán. Tính sẵn sàng đo bằng phần trăm
thời gian dịch vụ trực tuyến tại mức người dùng cuối cùng.
Giải pháp nâng cao tính sẩn sàng thường tập trung vào hai mặt là: ngăn ngừa và
tránh những sự cố của tất cả các vấn đề có thể làm cho hệ thống bị gián đoạn việc cung
cấp dịch vụ. Thèm vào đó, cần tập trung vào việc phục hổi nhanh và hạn chế mọi xung đột
mà có thể xay ra làm cho hệ thống ngừng hoạt động.
> Q u a n niệm kinh té kỹ th u ậ t
Thực hiện cách tiếp cận tiên tiến đòi hỏi không những phải lựa chọn thiết bị phần
cứng tốt. đổng bộ mà còn biết iựa chọn dịch vụ phần mềm và tổ chức quản lý chúng để có
thế đạt dược một giải pháp toàn bộ hiệu quả.
Sự cần thiết của một dịch vụ phẩn mềm bổ .sung cho
CO'
sở hạ tầng là một điểm rất
quan trọng. Tính sẩn sàng cao không chỉ là việc đạt được thông qua các giải pháp kỹ
thuậl. mặc dù công nghệ là một phán quan trọng trong bất kỳ giải pháp nào. Việc mua
thiếl bị và công nghệ với một giá cao. tính chịu lồi cao, trạng thái của một hệ thống nghệ
ihuậi không phái lúc nào cũng cần thiết. Điều đó có nghĩa là, việc kinh doanh cần đặt
Luân ván Thạc sĩ
Trang 5
Chy Ty Khoa Công nghệ Đại học Quốc gia Hà nội
được mức: độ của tính sẩn sàng mong muốn chỉ với những cồng nghệ có dịch vụ 1hích hợp,
vói
SƯ
quán trị, sự hổ trợ phòng ngừa rủi ro, quản lý và đặt kế hoạch khôi phục đúng đắn.
Bái kỳ một giải pháp sẩn sàng cao nào đểu cần đến một sự hiểu biết thấu đáo về hệ
thống và có một kê hạch xát xao. Tính sắn sàng của hệ thống phải được đánh giá, đo đạc
bổ cứu, phòng ngừa và những kế hoạch điểu khiển hoạt động của hệ thống một cách thích
hựp. Tính chuvẻn môn cao là một yêu cầu cho một giải pháp đạt hiệu quả cao. [18]
1.2. Các rủi ro và mức độ rủ i ro trong một hệ thông
Qua các nghiên cứu cho thấy, nguyên nhân chính làm cho nhiều hệ thống bị trục
trặc, sụp đổ có nguồn gốc từ: phần mềm, phần cứng, người dùng và mói trường.
r Lỏi plúỉn cứng: Phần cứng ihường là nguyên nhản chính dẫn tới hệ (hống bị lỗi.
Theo thống kê cho thấy. 39% trường họp đều liên quan tới phần cứng, trong đó
lỗi do thiết bị lưu trữ là 5.1,7%, bộ nhớ là 23%, các bảng mạch 16,7%, bộ xử lý
2,9% và nguồn điện là 5,7%. Những lỗi này là hậu quả của quá trình sản xuất
bao gổm các công nghệ sán xuất và sự quản lý nó. Ngày nay, rất nhiều nhà sản
xuất đã không ngừng cái tiến công nghệ và tổ chức quản lv để xây dựng các
ihiồì bị phần cứng với độ tin cậy cao. Các thiết bị phàn cứng ngày càng có nhiều
tính năng và sức mạnh lớn hơn với độ tin cậy cao hơn. Ngoài các lỏi do bản
thân thiết bị, lỗi phân cứng còn xảy ra ở khâu kết nối như cáp, các card mạng,
bộ chuyển mạch.v.v.
r Lồi phán mềm: Lỗi phần mềm tồn tại như một sự tất yếu. Nhất là việc xuất hiện
các phiên bản phần mềm mới càng ngày càng gia tăng khả năng lỗi đi kèm theo
phần mém đó. Theo thống kê cho thấy, lỗi ph-ần mềm chiếm 31% tổng số lỗi.
Trong đó, do hệ điểu hành là 61,7% và các ứng dụng là 39,3%. Cũng như đối
với lỗi phần cứng, các nhà sản xuất phần mềm thường xuyên hoàn thiện và sử
dụns cổng nghệ mới (hướng đối tượng), tăng cường quá trình tự động hóa việc
sán xuất phần mém. sử dụng Ihành phần dùng lại để giảm thiểu lỗi phần mềm.
ỈMỚtì vàn Thạc sĩ
Trang 6
Chv Ty Khoa Cóng nghệ Đại học Quốc gia Hà nội
r
Lồi môi n ư<'ỉng\ Môi trường mà trong đó hệ thống hoạt động có thể có nhiều sự
cố chủ quan đưa lại. Nó bao gồm sự mất nguồn điện và thảm hoạ môi trường
như cháy, khủng bố, lũ lụt, động đất.v.v. Theo thống kê, lỗi do mỏi trường
chiếm 12%.
r' Lồi người dùng: Theo thống kê cho thấy, 18% lỗi do người dùng gây ra, trong
đó 66,6% là (io người điều khiển. Nguyên nhân dẫn đến lỗi người dùng có thể
chương trình khổng tiện dùng, do trình độ thành thạo của người dùng còn hạn
chế. Vì vậy, có thể giảm lỗi người dùng bàng một số phương pháp như tăng
cường đào tạo, phần mểm dễ sử dụng và tổ chức quản lý tập trung. [12]
Hình U Biếu dồ mức lỗi trung bình các Ịoại tron ọ một hệ thống
1.3. Các giải pháp chung đảm bào tính sản sàng cao
ĩ .3.1. Giải p h á p p h ầ n cứng
Nhin vào biểu đổ lỗi ta thấy, số lỗi phần cứng là lớn nhất. Vì vậy, các giải pháp để
khắc phục các lỗi phần cứng được quan tâm trước hết.
r- Sứ dạng dư phòng trong két nổi các máy khách!dịch vụ
Luận vãn Thạc sĩ
Trang 7
Chy Ty Khoa Còng nghệ Đoi hoc Quốc gia Hà nội
T ro n g m ột hệ s ẩ n s à n g c a o cần có giải p h á p c h o c á c vấn để x ẩ y ra khi m áy k h á c h
Iruy c ậ p các địch vụ từ m á y d ịc h vụ qua m ạng. T a có thế loại b ỏ lỗi đ ơ n k h â u kết nối bằng
c á ch d ự p h ò n g các th àn h phần kết nối n h ư sử d ụ n g n h iều c a rd m ạ n g . H u b , Switch, R outer
v à C áp, v.v. từ đ ó m ột hệ th ô n g có thể ch u y ể n tới m ộ t card d ự p h ò n g m à k h ô n g ánh hướ ng
đón sự ạián đ o ạ n tro n g việc kết nối bời m áy khách.
r Sử dụng còng nghệ kết cụm đê han chê tói đa sự ngừng hoạt động dịch vụ
Đ ê hạn c h ế lối đ a sự n g ừ n g trễ sự hoạt đ ộ n g c ủ a d ịch vụ ta c ó thể trang bị hai hoặc
n h iều m á y d ịch vụ k ế t nối với nhau trong m ột m ôi trư ờng kết c ụ m thực hiện m ột hay
n hiêu c ô n ẹ việc khác nhau, tro n g trường h ọ p m ộ t dịch vụ hay m á y d ịch vụ bị hỏn g các
d ịc h vụ đ ó sẽ c h u y ể n s a n g m á y dịch vụ k h á c trong m ôi trư ờng k ế t c ụ m đ ó với thời gian
n g ừ n g chi vài giây.
C ó rất nhiều c ô n g n g h ệ kết c ụm đ ã phát triển đ ể h ạ n c h ế tối đ a sự n g ừ n g trễ cúa hệ
th ống. Cáo c ô n g n g h ệ đ ó đ ã đượ c thiết k ế c h o từng d ịch vụ và đối với m ỗi hệ điều hàn h
nhất định. C ô n g nghệ kết c ụ m đ ư ợ c xem là giải p h á p chủ yếu đ ể đ ả m bảo tính sẩn sàng
c a o c u a toàn hệ Ihống.
r Công nghệ lưu trữ và bảo vệ dữ liệu
T ính sẩn s à n g c a o liên q u a n đ ế n việc truy c ậ p d ừ liệu với thiết bị lưu trữ. V iệc thiết
k ế kết hợp phần cứ ng b ằ n g c ô n g n g h ệ R A ID ( R e d u n d a n t A rra y o f In ex p e n siv e Disk) với
v iệc sir d ụ n g phấn m ề m bản s a o dữ liệu là rấ t c ầ n thiết. Đ ể đạt đư ợ c m ụ c đích tính sẵn
sàn g c a o và hiệu suất c a o thì việc thiết k ế nên có nhiều bộ đ iều k h iể n thiết bị lưu trữ c ù n g
với dư ờ ng dẫn và c á p d ự p h ò n g tới thiết bị lưu trữ.
N h ữ n g câu hỏi sa u đ á y liên quan tới s ự b ả o vệ d ữ liệu
•
C ó c ầ n khôi phục d ữ liệu trực tuyến k h ô n g ?
•
C ó đ ễ d à n g th ay đổi m ột ổ đĩa bị h ỏ n g k h ô n g ?
•
Có c ầ n thiết phối hợp c ác mức R A ID và lăng k h ả n ă n g thực hiện?
Luán vãn Thạc sĩ
Trang 8
Ch V Tv Khoa Cóng nghệ Đại hoc Quốc gia Hà nội
r Dự phòng các thiết bị phần cứng cho thay thế
Đe nâng cao tính sẵn sàng của hệ thống thì cần phải dự phòng một số thiết bị cần
thiol dê đám báo kịp thời trong việc thay thế thiết bị đã bị hỏng khi sự cố phẩn cứng xẩy
ra. Khi dự phòng cho ihay thế cần tính đốn xác xuất thống kế về sự hư hỏng mồi loại thiết
bị
'r- Quản lý, dụ báo và báo cáo tình trạng phản cứng hệ thông
Để nâng cao tính sẩn sàng của hộ thống cần phải nói đến việc dự đoán rúi ro để báo
vệ và lập báo cáo về hiện trạng của hệ íhống. Trên cơ sở đó ta có thế ngăn ngừa các rủi ro
và sứm đưa ra giải pháp khác phục sự cố. Cho nên, cần có phẩn mềm giúp cho người quán
trị như giám sái các tài nguyên của hệ thống, giám sáĩ các yêu cầu của người dùne, kiểm
tra lình trạng của tài nguyên và gứi thông điệp kịp thời mỗi khi gặp sự cố, đặc biệt ưưừng
hợp khàn cấp.
Phần m ềm Event Monitoring Service (EMS) của HP hồ trợ việc nâng cao tính sẩn
sàng cao của hệ thống. Nó có ihể báo cáo khi mất (hỏng) lài nguyên. N ó có thể nhận ra và
báo cáo khi lỗi (lơn có thế xây ra, giúp cho người quản trị hành động trước sự kiện xảy ra
dè bào vệ sự mất mái thòng tin và nâng cao tính sẵn sàng cao.
1.3.2. ( ỉ ỉ a ỉ pháp phần mểm
Tính sán sàng của hệ thống có thể được bảo đảm bằng các phầm mềm
ứng dụng hoạt động tốt tránh bị lỗi. Cho nền, để nâng cao các ứng dựng họat động tốt và
tì Ún ổ
đắn thì cần chú V đến các vấn đề sau:
•
Sao lưu dữ liệu và phục hổi dữ liệu: Khi một chương trình ứng dụng không
hoạt động được thì có thể phục hồi từ trạng thái cũ.
•
Phân tán dữ liệu: Có thể phân lán dữ liệu để chia sẻ sự thực hiện của hệ
Ihống cùng với chia sẻ lỗi của mội hệ thống.
Luưn văn Thạc sĩ
Trang 9
Chy T ỵ Khoa Công nghệ Đại học Quốc gia Hà nội
•
Các hệ q u ả n trị c ơ s ơ d ữ liệu: Hệ q u ả n trị c ơ s ả d ữ liệu phái có khả năng
p h ụ c hổi và sao lưu d ữ liệu c ù n g với việc phàn tán d ữ liệu đế nâng caơ tính
sẩn sà n g cao cùa d ịch vụ. K hông n h ữ n g có c á c tính n ằ n g trên, m à một h ệ
q u á n trị c ơ sờ d ữ liệu c ò n cần phải tin cậy, ít lỗi, dễ d ứ d u n g v à đễ q u á n trị.
1.3.3. Giải p h á p Hên q u a n đến mỏi trường
Đ ế p hòng c h ố n g hệ th ố n g k h ỏ i s ự c ố và n â n g c a o tính sẵn s à n g có thể thực h iện
bănụ c á ch sử cỉụng nhiều địa đ iể m vật lý (m ultiple physical sites). K iến trúc nhiều địa
diêm (m ulti-siie arc h ite c tu re ) c ó thể được thiết k ế theo rất nh iều c á ch khác nhau, trong đó
phổ biên nhất là có site gốc (p rim a ry site) và m ộ t hay vài site ở xa (re m o te site) để tránh
khỏi những th am họa do m ôi trư ờ n g n h ư bão, lũ lụt, c h á y v.v.
Đối với n g u ồ n đ iệ n thì n ê n sứ d ụ n g hai n guồn c u n g c ấ p đ iện cho hệ thống, bao
gốm dường c u n g c ấ p điện và thiết bị lưu đ iện (UPS). N ếu m ột n g u ồ n đ iệ n bị m ất thì m ạch
diện sẽ chuyển sa n g m ột n g u ồ n k h á c m à k h ô n g làm cho hệ th ố n g bị ngắt.
Đ ể đạt đượ c m ộ t m ứ c đ ộ tính sẵn sà n g cao c ủ a n g u ồ n đ iện tro n g trường h ợ p m ất
điện Ihì nên sử d ụ n g thiêì bị lưu điện riêng biệt cho m ỗi m á y d ịch vụ và cho các thiết bị
Um trữ chia sẻ.
1.3.4. (ỉiải p h á p liên q u a n đến người dùng
Đ ể n â n g c a o tính săn s à n g c ủ a hệ thống k h ô n g n hữ ng tập tru n g chú ý đến việc đầu
ur còng nghệ h o ặc thiết bị đắt tiền có tính c hịu lồi cao m à cầ n tập tr u n g vào đ à o tạo đội
ngũ cán bộ kv th u ật c ô n g nghệ th ô n g tin làm sao đ ể họ hiểu biết về c á c giá phải t r ả khi hệ
thông bị n gư ng hoạt đ ộ n g và c á c h b ả o vệ c ũ n g như c á ch k h ắ c phục lỗi. T rên c ơ sở đó, đưa
ra các quy định về c á c h thức s ử d ụ n g hệ Thống để tránh n h ữ n g lồi c ủ a người quản trị.
K hông những đ à o tạo để k h ắ c p h ụ c hoặc b ả o vệ m à còn n g h iê n cứu c á c c ô n g nghệ mới đê
đ á p ứng nhu c ầ u tính sắn s à n g c ủ a hệ thống.
Luận văn Thac sĩ
Trang 10
Chy Ty Khoa Cong nghé Đại học Quôc gia Hà nội
1.3.5. Lựa chọn m ột giải p h á p tổng hựp
Đế có dược một giải pháp thích hợp đáp ứng nhu cầu tính sẩn sàng của hệ thống thì
cán tợp hợp rất nhiều giải pháp khác nhau, từ đó xem xét và lựa chọn các phương án thích
hợp đáp ứng các nhu cầu đặt ra tùy {heo hoàn cảnh, đảm báo tính kinh tế và tính kỹ thuật.
Luận văn Thạc sĩ
Trang II
Chy Ty Khoa Cóng nghệ Đại học Quốc gia Hà nội
CHƯƠNG II
CÔNG NGHỆ KẾT CỤM
2.1. Địnli nghĩa kết cụm (Cluster)
Trong mỏi mạng máy tính của một cơ quan hay một cơ sở kinh doanh lớn. các dừ
liệu cần thiết để hoạt động đéu được lưu giữ trên các máy dịch vụ. Người dùng cuối liên
tục truy cập các dữ liệu này để phục
VỌI
cho công việc của mình. Điều này yêu cầu hệ
Ihôny mạng phải đám bảo luôn sắn sàng phục vụ người sử dụng. Trong thực tế. mặc dù
các hãng sán xuất đã cố gắng làm mọi cách để nâng cao chất lượng của hệ thống máy
tính, nhưng cũng như tất cả các phương tiện kỹ thuật khác, việc xảy ra sự cô' là vấn đề
không bao giờ tránh khói của hệ thống mạng. BỞI vậy, vấn đề quan trọng đặt ra là làm thế
nào để cho các dữ liệu luôn luôn sẵn sàng để cho người dùng truy cập, ngay cả khi có sự
cỏ xay ra. Kết cụm là một giải pháp mà các hãng sản xuất máy tính đưa ra để giải quyết
vấn đế này.
Kết cụm là một kiến trúc kết nối một số máy dịch vụ cùng với những phần mềm
chuyên dụng nhàm đảm bảo nâng cao khả nàng sần sàng cho các hệ thống mạng máy tính
nhờ khá năng Ihay thế hay thứ lỗi khi gặp lỗi của cả hệ thống. Kiến trúc này được thiết kế
sao cho hệ ihống vẫn hoạt động bình thường khi có một sự cô' nào đó xảy ra ở một máy
dịch vụ đang làm việc. Sự kết cụm cho phép sử dụng một số máy dịch vụ kết nối với nhau
tạo thành một cụm có khá năng khắc phục hay thứ lỗi nhằm nâng cao độ sẵn sàng của hệ
thống mạng. Nếu một máy dịch vụ ngừng hoạt động do bị sự cố hoặc để nâng cấp, bảo trì
v.v... thì toàn bộ công việc mà máy dịch vụ này đảm nhân sẽ được tự động chuyển sang
cho một máv dịch vụ khác (trong cùng một kết cụm) mà không làm cho hệ thống bị ngắt
hay gián đoạn. Quá trình này gọi là quá trình thứ lỗi và việc phục hồi tài nguyên trở lại
máy dịch vụ cũ được gọi là phục hổi lại “fail-back” .
Mỗi nhà sán xuất có một chiến lược và công nghệ riêng cho việc thiết kế hệ kết
cụm. Ví dụ như một giải pháp đơn giản của HP là kết hợp các kỹ thuật chịu đựng sai sót
nhỏ bao aổm các việc bố trí bộ nguồn điện dự phòng và có độ an toàn cao, cộng với các ổ
dìu RAIDv.v. [1J
Luãn văn Thạc sĩ
Trang 12
Chy Ty Khoa Cõng nghệ Đại học Quốc gia Hà nội
2.2. Các lựi ích và hạn chê của sự kết cụm
2.2.1. Lọi ích của sụ kết cụm
Việc, kêì c ụm đượ c s ử d ụ n g đ ể p h ụ c vụ c h o ba vấn đề c ơ bản sau:
r- Yéu cầu về tính sần sàng cao (Availability)
T ính sẩn s à n g c a o ở đây m u ố n để cậ p đ ế n việc c u n g c ấ p cho người d ùng cuối k h á
nâng cao nhái đ ể truy cậ p đến c á c d ữ liệu hay d ịch vụ m ạ n g và g iảm thiểu sự ngìm g hoạt
đ ộ n g ngoài ý m u ố n . G iải p h á p đ ư a ra cẩn đ á p ứng được nhu c ầ u hoạt đ ộ n g của c ơ quan.
r Yéu cầu vê độ tin cậy cao của hệ thông (Reliability)
Đ ộ tin c ậ y c a o được hiểu là khả n â n g giảm thiểu tần xuất xảy ra các sự cố. và nâng
cao khá năng chịu đ ự n g sai sót c ủ a hệ Ihống. M ột giải pháp đượ c coi là có độ tin cậy ca o
nếu nó giám thiểu được s ố c á c s ự c ố riêng rẽ x ảy ra c ũ n g n h ư sự ảnh h ư ở n g của cấc sự c ố
này đến các dịch vụ m à hệ t h ố n g c u n g cấp. N gười ta náng c a o đ ộ tin c ậ y của hệ thông dựa
vào c á c kỷ thuật n h ư d ự p hòng, th ứ lỗi, c ũ n g n h ư c ác p h ầ m m ề m ứng d ụ n g . K h ả năng chịu
đ ự n g sai sót phái được hiểu là k h á nồng phát hiện được lỗi, n h ư n g k h ô n g làm cho hệ th ố n g
bị ngừng hoại đ ộ n g d o c ơ c h ế đ ể xứ lý lỗi.
r Yêu cẩu vê khả năng mở rộng được (Scalablility)
Khả n ă n g c ó thể c ả i th iệ n h o ạ t đ ộ n g c ủ a hệ th ố n g b ằ n g c á c h trang bị th êm tài
nguyên hay m áy tính c h o hệ th ô n g đ ó được gọi là khá năng m ở rộ n g được. Các hẹ thống
riêng rẽ có thể đ ư ợ c m ở rộ n g b ằ n g cách thêm c ác tài n g u y ê n ( n h ư C P U s , bộ nhớ, ỏ đĩa).
C ác dịch vụ c ũ n g có thể được m ở r ộ n g b ằ n g c ách th êm c á c thiết bị vào hệ thống đ ể tảng
k h ả năng làm d ịch vụ c ủ a hệ th ố n g c ả về qui m ô và chất lượng.
Luán văn Thạc sỉ
Trang 13
Ch VTv Khoa Công nghệ Đại học Quốc gia Hà nội
Mọt dịch vụ mạng được thiết kế tốt thường sử dụng kỹ thuậi hệ thống và ihành
phan du ihừa để dự phòng các sự cố làm ảnh hưởng đến sự sẩn sàng của toàn bộ dịch vụ
dó.
Ba yêu cầu trên còn được gọi tắt là RAS (Reliability-Availability-Scalability) cũng
như những hệ thống đáp ứng dược ba yêu cầu trên còn được gọi là hệ thống RAS. [1]
2.2.2 . N h ừ n g h ạ n c h é
KỸ thuật kết cụm phụ thuộc vào sự tương thích giữa các ứng dụng và dịch vụ để có
thè hoạt động tốl. Các phần mểm cần phải có những đáp ứng thích họp khi có sự cố xảy
ra. Tuy nhiên, kỹ ihuật kết cụm không thể chống lại các sự cố xáy ra do virus, sai sót của
phần mém hay các sai sót do người sử dụng. Để chống lại các sự cỏ' này cần xây dựng một
cơ sử dữ liệu được báo vệ chác chắn cũng như có các kế hoạch khõi phục, sao lưu dữ liệu.
2.3. Kết cụm nhiều địa điểm và phân tán về địa lý
Hầu hêi các doanh nghiệp đều xây dựng hệ ihống phòng chổng sự cố và nâng cao
tính sần sàng bằng cách sử dụng nhiều địa điểm vật lý (multiple physical sites). Kiến trúc
nhiều địa điểm (multi-site architecture) có thể được thiết k ế theo rất nhiều cách khác nhau,
trong đó phổ biên nhất là có địa điểm chính (primary site) và một hay vài địa điểm ở xa
(remote sile). Hình 2 . 1 trình bày một ví dụ về một địa điểm chính và một địa điểm ở xa
cho mội lổ chức (hương mại điện tứ.
2.3.1. Kiểu thiết kè thực hiện đày đủ
Với kiểu thiết kế đầy đủ. toàn bộ cấu trúc của địa điểm chính được xây dựng lại
đáv ctú
ở các địa điếm ở xa. Điều này cho phép địa điểm ở xa hoạt động độc lập hay xử iỷ
toàn bộ khối lượng công việc của địa điểm chính nếu cần. Trong trường họp này, việc thiết
kế phải đảm báo sao cho cơ sớ dữ liệu và các ứng dụng phải đổng bộ và được sao lặp ỉại
ngay lập tức hay dược sao lặp ở chê độ thời gian thực (real-time replication).
Luạn vãn Thạc sĩ
Trang 14
Chy Ty Khoa Công nghệ Đại học Quốc gia Hà nội
Sự sao lặp ở chế độ thời gian thực đám bảo một trạng thái ổn định cho dữ liệu và
các ứng dụng dịch vụ giữa các địa điểm. Trong trường hợp không thổ thực hiện việc cập
nhật theo Ihời gian thực như nêu trên thì cơ sờ dữ liệu và ứng dụng phái được cập nhật
càn« sớm càng tốt.
H O i.tí
1f: Yi)
Hình 2.1
2.3.2. Kiêu thiết kế thực hiện từng phần
Với kiổu thiết kế thực hiện từng phẩn thì chi có các thành phần cơ bản là dược cài
đãi ỏ'các dia điếm ờ xa nhằm:
Xử lý các khối lượng cổng việc quá tải trong các giờ cao điểm
ỊM ậ n văn Thạc sĩ
Trang 15
Ch V Ty Khoa Còng nghệ Đai học Quốc gia Hà nội
r Duv trì hoạt động ờ mức cơ bản Irong trường hợp địa điếm chính bị sự cố
^ Cung cấp một số dịch vụ hạn chế nêu cần.
2.3.3. Phân bô rải rác các kết cụm
Cá kiểu thiết kế đầy đú hay từng phần đều dùng phương cách phân tán các máy
dịch vụ trong kết cụtn nẳm rải rác về mặt địa lý (geographically dispersed). Kết cụm phân
tán về địa lý sử dụng mạng LAN ảo (VLAN) để kết nối các mạng khu vực lưu trữ SAN
(storage area network) qua những khoảng cách lớn. Một kết nối mạng LAN ảo với độ trễ
vào khoáng dưới 500 ms dám báo ràng sự kết cụm có thể duy trì được.
Việc mở lộng các kho lưu trữ, nếu có, sẽ được xử lý bang các phán cứng, còn sự kết
cụm sỗ không quán lý việc thực hiện các công việc này. Việc hóng hóc xảy ra (bao gồm
cá việc hỏng kho lưu trữ gốc) cẩn được can thiệp bằng thủ công để duy trì chức năng sự
kết cụm.
2.4. Tổ chức kết cụm
Kết cụm được tổ chức thành các nhóm gọi là các trại (farm) hay gói (pack). Trong
hầu hết các trường hợp, như trình bày ironR hình 2.2, các dịch vụ ỏ tầng trước và giữa
dược tổ chức thành các trại sử dụng các clone, trong khi đó các địch vụ tầng sau được tổ
chức ihành các gói.
Luận vãn Thạc sĩ
Trang 16
- Xem thêm -