Đăng ký Đăng nhập
Trang chủ Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu áp dụng vào việc nâng cấp...

Tài liệu Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu áp dụng vào việc nâng cấp hệ thống mạng của văn phòng trung ương đảng

.PDF
87
1
128

Mô tả:

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI --------------------------------------- HOÀNG PHƯƠNG NHUNG XÂY DỰNG GIẢI PHÁP CHO HỆ THỐNG MẠNG PHÂN PHỐI DỮ LIỆU ÁP DỤNG VÀO VIỆC NÂNG CẤP HỆ THỐNG MẠNG CỦA VĂN PHÒNG TRUNG ƯƠNG ĐẢNG Chuyên ngành : KỸ THUẬT MÁY TÍNH VÀ TRUYỀN THÔNG LUẬN VĂN THẠC SĨ KỸ THUẬT KỸ THUẬT MÁY TÍNH VÀ TRUYỀN THÔNG NGƯỜI HƯỚNG DẪN KHOA HỌC : TS. Trần Hải Anh Hà Nội - Năm 2016 MỤC LỤC __________ Lời cam đoan Lời cảm ơn Danh mục ký hiệu, từ viết tắt, thuật ngữ Danh mục hình vẽ, đồ thị Mở đầu Chương I : Cơ sở lý thuyết I- Giới thiệu chung về hệ thống mạng phân phối dữ liệu II- Giải pháp CDN III- Vấn đề MAB Chương II : Phân tích triển khai giải pháp lựa chọn máy chủ dựa trên thuật toán MAB I- Thuật toán -Greedy Trang ii iii iv v 1 4 4 5 28 36 37 II- Thuật toán Softmax 39 IV- Reward thu được dự kiến 45 I- Thuật toán -Greedy 50 III- Thuật toán UCB Chương III : Kết quả thực nghiệm 42 46 II- Thuật toán Softmax 56 IV- Đánh giá chung 68 III- Thuật toán UCB V- Triển khai thực tiễn áp dụng vào việc nâng cấp hệ thống mạng diện rộng của Văn phòng Trung ương Đảng 63 70 Kết luận và kiến nghị 72 Phụ lục 76 Tài liệu tham khảo 73 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu LỜI CAM ĐOAN __________ Tôi xin cam đoan Luận văn Thạc sỹ "Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu. Áp dụng vào việc nâng cấp hệ thống mạng của Văn phòng Trung ương Đảng" là công trình nghiên cứu của riêng tôi. Nội dung Luận văn tập trung nghiên cứu một số thuật toán phân phối dữ liệu để áp dụng vào hệ thống mạng phân phối dữ liệu của cơ quan đang công tác, các số liệu và kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Hà Nội, ngày 10 tháng 10 năm 2016 Tác giả Hoàng Phương Nhung Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang ii Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu LỜI CẢM ƠN ___________ Lời đầu tiên, tôi xin gửi lời cảm ơn đến toàn thể các thầy, cô giáo Viện Công nghệ Thông tin & Truyền thông đã tận tình chỉ bảo tôi trong suốt thời gian học tập tại nhà trường. Tôi xin gửi lời cảm ơn sâu sắc đến TS. Trần Hải Anh, người đã trực tiếp hướng dẫn, tạo mọi điều kiện thuận lợi và tận tình chỉ bảo cho tôi trong suốt thời gian làm luận văn tốt nghiệp. Tôi cũng xin gửi lời cảm ơn tới Lãnh đạo Vụ Hành chính - Cơ yếu, Văn phòng Trung ương Đảng và anh chị em Phòng Nhân sao - Chế bản đã quan tâm, tạo điều kiện về thời gian, tương trợ trong công việc trong suốt thời gian hoàn thành Luận văn tốt nghiệp. Cảm ơn các thành viên của Lớp 13B-MTTT đã hỗ trợ, chia sẻ với tôi những lúc khó khăn trong suốt quá trình tôi thực hiện đề tài Luận văn. Tuy nhiên, do thời gian hạn hẹp, mặc dù đã nỗ lực hết sức mình, nhưng chắc rằng luận văn khó tránh khỏi thiếu sót. Tôi rất mong nhận được sự thông cảm và chỉ bảo tận tình của quý thầy cô và các bạn. HỌC VIÊN Hoàng Phương Nhung Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang iii Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu DANH MỤC KÝ HIỆU, TỪ VIẾT TẮT, THUẬT NGỮ _______________ Ký hiệu/từ viết tắt Ý nghĩa CDN Content Delivery Networks UCB Upper Confidence Bounds QoE Quality of Experience HN Hà Nội MAB QoS HTML ĐN HCM Multi-Armed Bandit Quality of Service Hyper Text Markup Language Đà Nẵng Thành phố Hồ Chí Minh VPTW Văn phòng Trung ương Đảng HTCP Hypertext Caching Protocol ICP CARP Internet Cache Protocol Cache Array Routing Protocols P2P Kiến trúc ngang hàng WCCP Web Cache Coordination Protocol NECP Network Element Control Protocol Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang iv Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu DANH MỤC HÌNH VẼ, ĐỒ THỊ _______________ Hình 1. Mô hình mạng CDN Hình 2 : Kiến trúc của một mạng lưới phân phối nội dung (CDN) Hình 3 : Mô tả nội dung và dịch vụ CDN cung cấp cho người dùng Hình 4: Kiến trúc phân lớp của một CDN Hình 5: Phân loại CDN thành phần Hình 6 : Các giao thức tương tác sử dụng trong CDN Hình 7: Giao thức tương tác khác nhau Hình 8 : Quản lý và phân loại phân phối nội dung Hình 9: Chiến lược vị trí thay thế Hình 10 : Quá trình phân phối nội dung đến các máy chủ đại diện Hình 11 : Phân phối nội dung đến người dùng Hình 12 : Sự phân loại lựa chọn và chuyển giao kỹ thuật nội dung. Nội dung có thể được chuyển cho người dùng toàn bộ hoặc một phần. Hình 13: Mô tả Yêu cầu định tuyến trong một môi trường CDN Hình 14 : Phân phối nội dung trong một mạng CDN và giữa các mạng CDN ngang hàng Hình 15 : Quá trình lựa chọn cần gạt trong Thuật toán -Greedy Hình 16 : Giải thuật Thuật toán -Greedy Hình 17 : Sơ đồ lựa chọn máy chủ của Thuật toán -Greedy Hình 18 : Giải thuật Thuật toán Softmax Hình 19 : Sơ đồ lựa chọn máy chủ của Thuật toán Softmax Hình 20 : Giải thuật Thuật toán UCB Hình 21 : Sơ đồ lựa chọn máy chủ của Thuật toán UCB Hình 22 : Demo hệ thống phân phối dữ liệu mô phỏng Hình 23 : Vấn đề không có server nào hoạt động Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang v Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu Hình 24 : Vấn đề thông báo hiện có server khai báo tình trạng hoạt động Hình 25 : Thông tin 8 máy chủ đại diện đang hoạt động tại thời điểm thực hiện mô phỏng Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang vi Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu MỞ ĐẦU ________ 1- Cơ sở khoa học và thực tiễn Năm 2016, bước sang năm thứ 19 Internet có mặt tại Việt Nam. Từ lạ lẫm đến quen thuộc, phát triển rộng rãi với tốc độ như vũ bão, Internet đã và đang góp phần thay đổi cuộc sống của người Việt. Dịch vụ Internet ngày càng đa dạng, phong phú. Những năm gần đây, dịch vụ truy cập Internet qua hạ tầng di động 3G tiến tới sử dụng 4G thể hiện sự tăng trưởng vượt bậc do sự tiện lợi trong sử dụng. Tốc độ kết nối Internet trong nước và quốc tế ngày càng nhanh, phục vụ đắc lực cho việc khai thác nội dung, sử dụng dịch vụ của người dùng. Nguyên Thứ trưởng Bộ Thông tin và Truyền thông Lê Nam Thắng đã đánh giá, Internet đã tạo môi trường thuận lợi cho việc tiếp cận thông tin, phổ cập rộng rãi thông tin trong xã hội, phục vụ cho công việc, nghiên cứu, học tập, sản xuất kinh doanh và tuyên truyền các chính sách của Đảng và Nhà nước tới người dân1. Internet đã góp phần tạo lập cộng đồng, thúc đẩy hoạt động của các tổ chức xã hội, nâng cao năng lực sản xuất và thương mại, tạo ra nhiều hơn của cải vật chất trong xã hội và nâng cao đời sống người dân. Internet còn là sân chơi bổ ích, một kênh giải trí hấp dẫn với nhiều ứng dụng phục vụ người dùng. Tuy nhiên, băng thông mạng liên tục bị quá tải bởi lưu lượng sử dụng và các nội dung chiếm băng thông, các dịch vụ Web phổ biến thường bị tắc nghẽn do nhu cầu thực hiện trên dịch vụ lớn. Đây là một trong những vấn đề quan trọng cần giải quyết để quản lý luồng lưu lượng, đáp ứng yêu cầu người dùng tốt nhất, cải thiện chất lượng dịch vụ. Và hệ thống mạng phân phối dữ liệu được xem là giải pháp tối ưu được các nhà cung cấp dịch vụ hướng tới. Nguồn : http://www.nhandan.com.vn/antuong/item/21822602-kinh-te-internet-l%C3%A0-coh%E1%BB%8Di-d%E1%BA%BB-viet-nam-ph%C3%A1t-tri%E1%BA%BBn.html 1 Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 1 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu 2- Sự cần thiết phải triển khai thuật toán Hiện tại, hệ thống máy tính tại cơ quan đang công tác chưa kết nối trực tuyến với mạng Internet; chủ yếu sử dụng các máy tính cá nhân đơn lẻ, tách biệt, phối hợp trong công tác thông qua thư điện tử mạng nội bộ => bất cập trong trao đổi nghiệp vụ, phối hợp công tác, còn sử dụng văn bản giấy quá nhiều => tốn kém về chi phí in ấn, nguồn nhân lực phục vụ công tác lưu trữ lớn. Văn phòng Trung ương Đảng có trụ sở chính tại Hà Nội (HN) và cơ sở tại Đà Nẵng (ĐN) và Thành phố Hồ Chí Minh (HCM) tuy nhiên việc phối hợp công tác hiện rất khó khăn, bản thân nhận thấy việc phối hợp xử lý công việc ngay tại HN cũng còn phụ thuộc khá nhiều vào văn bản giấy. Việc ứng dụng giải pháp CDN vào thực tiễn sẽ giúp đẩy mạnh ứng dụng công nghệ thông tin vào giải quyết xử lý công việc, giảm thiểu tối đa chi phí in ấn, nhân lực. 3- Mục đích của luận văn (các kết quả cần đạt được) Sau khi nghiên cứu cơ sở lý thuyết và tiến hành thực nghiệm, tôi mạnh dạn đề xuất ứng dụng giải pháp CDN và thuật toán lựa chọn máy chủ MAB vào việc triển khai nâng cấp hạ tầng mạng ở đơn vị đang công tác. - Hạ tầng kỹ thuật mạng nội bộ của VPTW sử dụng công nghệ CDN tích hợp chức năng kiểm soát truy nhập và giám sát hoạt động hệ thống, trở thành hạ tầng chung, thống nhất, đảm bảo hoạt động cài đặt, vận hành, khai thác. - Đặt cụm máy chủ đại diện tại Hà Nội, Đà Nẵng, Thành phố Hồ Chí Minh có chức năng “ngang hàng” để có thể “thứ lỗi” cho nhau. - Thuật toán lựa chọn máy chủ đại diện đáp ứng tốt yêu cầu khai thác nội dung, phối hợp xử lý công việc của chuyên viên, lãnh đạo cơ quan. - Vấn đề mạng phải có khả năng theo dõi, giám sát trực tuyến tình trạng làm việc cũng như hiệu suất hoạt động của các thiết bị có trong mạng, có khả năng lập các báo cáo về hiệu suất và tình trạng hoạt động của hệ thống mạng, có khả năng dự báo những sự cố tiềm tàng có thể sẽ xảy ra. Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 2 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu 4- Đối tượng và phạm vi nghiên cứu : - Đối tượng : Thuật toán lựa chọn máy chủ trong hệ thống mạng phân phối dữ liệu mà cụ thể là các thuật toán MAB. - Phạm vi nghiên cứu : Giả lập một môi trường mạng phân tán nội dung đồng thời áp dụng các thuật toán nghiên cứu được trên môi trường giả lập. 5- Phương pháp nghiên cứu - Lý thuyết : + Tìm tài liệu về mạng phân tán nội dung và giải thuật chọn lựa máy chủ trên mạng Internet, các bài báo, sách tham khảo. + Phác thảo định hướng thực hiện. - Thực nghiệm : + Tham khảo các ý kiến của chuyên gia có kinh nghiệm trong lĩnh vực mạng phân tán : Gặp gỡ, trao đổi, tiếp thu ý kiến. +Giả lập môi trường mô phỏng mạng phân tán + Tham khảo code giải thuật chọn lựa máy chủ trên mạng Internet, các bài báo, sách tham khảo áp dụng vào môi trường giả lập. 6- Bố cục luận văn Bố cục luận văn gồm 3 phần : mở đầu, nội dung và kết luận. Nội dung luận văn gồm có 3 chương : Chương I :Cơ sở lý thuyết Chương II : Phân tích triển khai giải pháp chọn lựa máy chủ dựa trên Thuật toán MAB Chương III : Kết quả thực nghiệm Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 3 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu CHƯƠNG I : CƠ SỞ LÝ THUYẾT _____________ I-Giới thiệu chung về hệ thống mạng phân phối dữ liệu Hệ thống mạng phân phối dữ liệu đóng vai trò quan trọng trong lĩnh vực phát triển của công nghệ thông tin, đặc biệt là trong điều kiện phát triển bùng nổ của các mạng máy tính. Sự phát triển của các mạng LAN, WAN cho phép hàng trăm, hàng nghìn hay thậm chí hàng triệu máy tính có thể kết nối với nhau. Công nghệ hiện nay không chỉ đáng tin cậy mà còn tạo nên các hệ thống máy tính khổng lồ, được kết nối bằng các đường kết nối tốc độ cao. Hệ thống mạng phân phối dữ liệu được xây dựng cần đảm bảo một số đặc trưng : - Chia sẻ tài nguyên - Tính trong suốt - Tính mở - Tính co giãn Tính trong suốt đảm bảo khả năng che giấu tiến trình và tài nguyên phân phối trong mạng máy tính. - Truy nhập: che giấu sự khác biệt trong cách biểu hiện dữ liệu và cách thức truy nhập tài nguyên. Ở mức cơ bản, ta che giấu sự khác biệt về kiến trúc máy, nhưng quan trọng hơn chính là ta phải đạt được sự thống nhất trong biểu diễn dữ liệu bởi các máy tính khác nhau và các hệ điều hành khác nhau. - Vị trí: che giấu vị trí tài nguyên  người dùng hoàn toàn không biết về vị trí vật lý của tài nguyên trong hệ thống. Để đạt được, ta cần tiến hành định danh bằng tên gọi logic. Tên gọi có thể đơn giản, không cần mã hóa. - Di trú: che giấu việc tài nguyên di chuyển sang máy khác  tài nguyên có thể không nằm ở vị trí cố định, mà nó có thể được di chuyển sang các máy khác nhau trong hệ thống để phục vụ các yêu cầu khác nhau mà không ảnh hưởng tới việc truy nhập tài nguyên. Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 4 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu - Di chuyển: che giấu việc tài nguyên có thể bị di chuyển sang nơi khác  tài nguyên có thể di chuyển sang nơi khác ngay cả khi nó đang bị truy cập. - Nhân bản: che giấu việc sao chép tài nguyên  việc sao chép tài nguyên giúp đơn giản hóa và tăng tốc độ truy cập dữ liệu, các bản sao đặt gần hoặc ngay tại nơi truy cập dữ liệu. Các bản sao này phải có cùng tên, để che giấu với người dùng; và hệ thống cần có tính trong suốt về vị trí, để đảm bảo khả năng quản lý các bản sao khác nhau trên các máy trong hệ thống. - Tương tranh: che giấu sự chia sẻ tài nguyên bởi một số người sử dụng, nhiều người dùng có thể cùng truy cập dữ liệu tại cùng một thời điểm, đặc biệt sử dụng nhiều trong mạng truyền thông. - Lỗi: che giấu lỗi và khắc phục lỗi  đảm bảo người dùng hoàn toàn không biết về các lỗi xảy ra trong hệ thống và sự khắc phục các lỗi này. Che giấu lỗi là một trong các yêu cầu khó thực hiện nhất, và có thể không thực hiện được trong một số tình huống cụ thể. Điểm khó nhất chính là ta không thể phân biệt được tài nguyên là truy cập chậm hay không thể truy cập được. Tuy nhiên không phải lúc nào cũng nên thể hiện tính trong suốt hoàn toàn với người dùng. Ngoài ra cũng có sự đánh đổi giữa mức độ trong suốt và tốc độ hệ thống. Việc thiết kế hệ phân tán trong suốt là cần thiết, tuy nhiên cũng cần đảm bảo sự hài hoà với các đặc tính khác như hiệu năng và tính thân thiện với người dùng của hệ thống. Tuy nhiên có thể phải trả giá đắt cho việc không đảm bảo tính trong suốt hoàn toàn của hệ phân tán. II- Giải pháp CDN 1- Tổng quan Với sự phát triển bùng nổ của Internet, các dịch vụ Web phổ biến thường bị tắc nghẽn và nguyên nhân chính là do yêu cầu về dịch vụ của đại bộ phận người sử dụng dẫn tới không thể quản lý luồng dữ liệu, nhiều yêu cầu bị mất. Việc sao chép cùng một nội dung hoặc dịch vụ tương tự trên máy chủ Web đến các máy chủ sao Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 5 Xây dựng ựng giải pháp cho hệ thống mạng phân phối dữ liệu lưu đặt tại các địa điểm khác nhau được xem là một phương pháp tối ưu bởi nhà cung cấp dịch vụ mạng để cải thiện hiệu suất và khả năng mở rộng băng thông thông. Người dùng sẽ được chuyển hướng đến máy chủ lân cận giúp làm giảm tác động máy chủ Web, rút ngắn thời gian đáp ứng các yêu cầu của người dùng dùng. Client Client Tuyến ến bị tắc nghẽn Client Máy chủủ đại diện Máy chủ đại diện Máy chủ gốc Máy chủ đại diện Tuyến không bịị tắc nghẽn Client Client Hình 1. Mô hình mạng CDN Mạng lưới phân phối nội dung (CDNs) cung cấp các dịch vụ cải thiện hiệu suất mạng bằng cách tối đa hóa băng thông thông, nâng cao khả năng tiếp cận và duy trì thông qua bản sao nội dung dung. Cơ sở hạ tầng nội dung gồm một tập các máy chủ lân cận (máy máy chủ đại diện diện) cung cấp bản sao nội dung tới người dùng cuối cùng, cùng theo yêu cầu định tuyến chuyển của yêu cầu của người dùng đến máy chủ đại diện thích hợp; tương tác với cơ sở hạ tầng phân phối để cập nhật các nội dung được lưu trữ trong cache CDN. Các cơ ssở hạạ tầng phân phối sao chép nội dung từ máy chủ gốc đến các máy chủ đại diện đảm bảo tính thống nhất của nội dung trong bộ nhớ đệm đệm. Các cơ sở hạ tầng duy trì các bản ghi các truy cập của người dùng và ghi lại việc sử dụng ụng các máy chủ CDN. Trong thực ti tiễn, CDN thường lưu trữ nội dung tĩnh gồm Học viên ên : Hoàng Phương Nhung, CB130041, 13B 13B-MTTT Trang 6 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu hình ảnh, video, clip, nội dung quảng cáo, và các đối tượng nhúng vào nội dung Web động. Đối tượng CDN nhắm tới là phương tiện truyền thông và các công ty quảng cáo Internet, trung tâm dữ liệu, cung cấp dịch vụ Internet (ISP), các nhà bán lẻ âm nhạc trực tuyến, các nhà khai thác di động, người tiêu dùng các nhà sản xuất thiết bị điện tử, và các công ty vận chuyển. CDN cung cấp hiệu suất tốt hơn thông qua bộ nhớ đệm hoặc nội dung trang Web được sao chép tới các máy chủ đại diện tại các vị trí địa lý khác nhau (các máy chủ lân cận) để đối phó với sự tăng vọt một cách đột ngột yêu cầu về nội dung. Người dùng được chuyển hướng đến máy chủ đại diện gần họ nhất. Cách tiếp cận này giúp giảm thiểu tác động đến mạng vào thời gian xử lý yêu cầu của người dùng. Nhà cung cấp nội dung, nhà cung cấp dịch vụ CDN và người dùng cuối là 3 thành phần chính cấu thành kiến trúc CDN : + Nhà cung cấp nội dung là đại diện trong không gian tên URI của các đối tượng Web sẽ được phân phối. Máy chủ của nhà cung cấp nội dung quản lý đối tượng đó. + Nhà cung cấp dịch vụ CDN là đơn vị cung cấp giải pháp để phân phối nội dung kịp thời và tin cậy. + Người dùng cuối cùng là người khai thác thông tin trên dữ liệu web của nhà cung cấp nội dung. Nhà cung cấp dịch vụ CDN sử dụng bộ nhớ đệm hoặc bản sao các máy chủ nằm ở vị trí địa lý khác nhau để tái tạo nội dung. Máy chủ cache CDN cũng được gọi là máy chủ lân cận hoặc đại diện hoặc thay thế. CDN phân phối nội dung cho máy chủ đại diện theo cách tất cả các máy chủ cache chia sẻ cùng một nội dung và URL. Yêu cầu của người dùng được chuyển đến máy chủ đại diện gần đó và một máy chủ đại diện được chọn cung cấp yêu cầu nội dung cho người dùng cuối. Như vậy, tính minh bạch cho người dùng là đạt được. Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 7 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu 2- Sự ra đời và phát triển của CDN Trong những năm qua, chúng ta đã chứng kiến sự ra đời, phát triển và sự nở rộ của Internet. Kết quả là, sự tăng trưởng lớn mạnh trong mạng lưới bởi sự chấp nhận nhanh chóng của truy cập băng thông rộng, cùng với sự phát triển của các hạ tầng phức tạp và sự phong phú về nội dung. Sự bùng nổ, phát triển nở rộ của Internet mang lại thách thức mới trong việc phát triển, cung cấp nội dung cho người dùng và quản lý. Dịch vụ web hiện nay thường bị tắc nghẽn và nút cổ chai do nhu cầu lớn về dịch vụ. Sự tăng vọt một cách đột ngột yêu cầu về nội dung có thể gây quá tải với các máy chủ Web và kết quả là một điểm nóng có thể được tạo ra. Đối phó với nhu cầu đột xuất như vậy gây ra căng thẳng đáng kể trên một máy chủ Web. Cuối cùng các máy chủ web là hoàn toàn choáng ngợp với sự gia tăng đột biến trong mạng lưới. Nhà cung cấp nội dung xem các trang Web như một phương tiện truyền tải nội dung phong phú tới người dùng của họ. Chất lượng giảm, cùng với thời gian truy cập chậm trễ chủ yếu là do thời gian tải về lâu dài, sẽ khiến người dùng thất vọng. Công ty có được nguồn tài chính đáng kể từ kinh doanh dịch vụ Web. Do đó, họ đặc biệt quan tâm đến việc cải thiện chất lượng dịch vụ, kinh nghiệm của người dùng khi truy cập vào trang Web của họ. Trong những năm trở lại đây, chúng ta đã đã thấy được sự phát triển của các công nghệ nhằm cải thiện nội dung và chất lượng dịch vụ phân phối nội dung trên các trang Web. Cơ sở hạ tầng hỗ trợ các công nghệ này tạo thành một loại mới của mạng, mà thường được gọi là mạng nội dung. Với sự ra đời của CDN, các nhà cung cấp nội dung bắt đầu đưa các trang web của họ trên một CDN. Chẳng mấy chốc họ nhận ra tính hữu dụng của nó thông qua độ tin cậy và khả năng mở rộng mà không cần phải duy trì cơ sở hạ tầng tốn kém. Trong một vài năm trở lại đây, một số công ty đã trở thành chuyên gia trong việc cung cấp các nội dung nhanh chóng và đáng tin cậy và CDN đã trở thành một thị trường khổng lồ để tạo ra doanh thu lớn. CDN thế hệ đầu tiên chủ yếu tập trung Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 8 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu vào các tài liệu Web tĩnh hay động. Thế hệ thứ hai của CDN trọng tâm đã chuyển sang âm thanh và video. 3- Mạng lưới phân phối Nhà cung cấp nội dung có thể đăng ký nhà cung cấp dịch vụ CDN đã đặt dịch vụ và nội dung trên các máy chủ nội dung. Nội dung sẽ được sao chép bằng cách đẩy nội dung vào các máy chủ đại diện (thay thế). Một người dùng được phục vụ các nội dung từ máy chủ Web đại diện nhân rộng. Do đó, người dùng cuối vô tình giao tiếp và lấy dữ liệu từ máy chủ đại diện nhân rộng lân cận. Hình 2 : Kiến trúc của một mạng lưới phân phối nội dung (CDN) 4- Nội dung phân phối Nhà cung cấp CDN đảm bảo cập nhật nhanh chóng bất kỳ nội dung kỹ thuật số. Họ lưu trữ : nội dung tĩnh (các trang HTML tĩnh, hình ảnh, tài liệu, bản vá lỗi phần mềm), truyền thông phương tiện (âm thanh, video) và các dịch vụ nội dung khác nhau (thương mại điện tử). Người dùng cuối cùng có thể tương tác với các CDN bằng cách xác định các nội dung/dịch vụ yêu cầu qua thiết bị đầu - cuối : điện thoại di động, điện thoại thông minh/PDA, máy tính xách tay và máy tính để bàn. Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 9 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu Hình 3 : Mô tả nội dung và dịch vụ CDN cung cấp cho người dùng Nhà cung cấp CDN tính phí người dùng của họ (nhà cung cấp nội dung) theo các nội dung được cung cấp đến người dùng cuối cùng của máy chủ đại diện của họ. CDN hỗ trợ theo dõi thông tin sử dụng của người dùng liên quan đến yêu cầu định tuyến, phân phối và xử lý thông tin. Các yếu tố ảnh hưởng đến giá của các dịch vụ CDN bao gồm : • Chi phí băng thông • Lưu lượng phân phối nội dung • Kích thước của nội dung nhân rộng trên các máy chủ đại diện • Số lượng máy chủ đại diện • Vấn đề an ninh khi gia công phần mềm phân phối nội dung, độ tin cậy và ổn định của hệ thống. CDN chủ yếu nhắm vào các nhà cung cấp nội dung hoặc người dùng muốn đảm bảo QoS cho người dùng cuối khi duyệt web. Mục tiêu kinh doanh cuả CDN tập trung vào : khả năng mở rộng, bảo mật, độ tin cậy, đáp ứng và thực hiện. Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 10 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu 5- Kiến trúc lớp Hình 4: Kiến trúc phân lớp của một CDN Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 11 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu - Cấu trúc cơ bản (Basic Fabric) : là lớp thấp nhất, cung cấp các nguồn tài nguyên cơ sở hạ tầng để hình thành một CDN, gồm các tài nguyên tính toán phân phối như : SMP, cụm máy chủ tập tin, chỉ số máy chủ và cơ sở hạ tầng mạng lưới cơ bản kết nối băng thông cao. Mỗi một nguồn tài nguyên này chạy các phần mềm hệ thống như hệ điều hành, các hệ thống quản lý tập tin phân phối, lập chỉ mục nội dung và hệ thống quản lý. - Truyền thông và lớp kết nối : cung cấp các giao thức Internet lõi (TCP/UDP, FTP) cũng như các giao thức Internet CDN cụ thể : Internet Cache Protocol (ICP), Hypertext Caching Protocol (HTCP), Cache Array Routing Protocols (CARP) và giao thức xác thực như PKI (Public Key cơ sở hạ tầng), hoặc SSL (Secure Sockets Layer) cho truyền thông, bộ nhớ đệm và cung cấp các nội dung (dịch vụ) một cách xác thực; cung cấp khả năng tìm kiếm và phục hồi nội dung được sao chép hiệu quả bằng việc duy trì chỉ số phân phối. - Lớp CDN : chứa các chức năng cốt lõi của CDN, gồm có 3 lớp con : dịch vụ CDN, loại CDN và các loại nội dung. Một CDN cung cấp các dịch vụ cốt lõi như : lựa chọn thay thế, yêu cầu định tuyến, bộ nhớ đệm và cân bằng tải địa lý và các dịch vụ cụ thể dùng cho quản lý SLA, chia sẻ tài nguyên và môi giới CDN. Một CDN hoạt động trên một tên miền của doanh nghiệp phục vụ mục đích học tập, công cộng hay chỉ đơn giản là được sử dụng như máy chủ phụ của nội dung và dịch vụ, cũng có thể dành riêng để chia sẻ tập tin theo kiến trúc ngang hàng (P2P) và cung cấp tất cả các loại nội dung MIME như : văn bản, âm thanh, video...để đáp ứng yêu cầu của người dùng. - Người dùng cuối : là lớp cao nhất của kiến trúc lớp CDN. Tại lớp này, người dùng kết nối với CDN bằng cách xác định các URL của trang web cung cấp nội dung trên các trình duyệt. 6- Phân loại: CDNs được phân loại theo các loại thuộc tính/khía cạnh khác nhau gồm : thành phần CDN, nội dung phân phối và quản lý, yêu cầu định tuyến, và đo lường hiệu suất. Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 12 Xây dựng giải pháp cho hệ thống mạng phân phối dữ liệu Vấn đề đầu tiên là một vài khía cạnh của CDN liên quan đến tổ chức và hình thành, phân loại các CDN theo các thuộc tính cấu trúc. Vấn đề thứ hai liên quan đến việc phân phối nội dung, cơ chế của CDN; mô tả các phương pháp quản lý và phân phối nội dung của CDN : vị trí thay thế, lựa chọn nội dung, gia công phần mềm nội dung và tổ chức sao lưu. Vấn đề thứ ba liên quan đến các thuật toán định tuyến yêu cầu và phương pháp định tuyến yêu cầu. Vấn đề cuối cùng nhấn mạnh trên các hiệu suất đo lường của CDN và hình thành các hiệu suất mạng và số liệu thống kê. 7- Thành phần của CDN Cấu trúc của một CDN khác nhau tùy thuộc vào nội dung (dịch vụ) mà nó cung cấp cho người dùng. Trong cơ cấu của CDN, một tập hợp máy chủ đại điện được sử dụng để xây dựng cơ sở hạ tầng nội dung, chuyển hướng yêu cầu người dùng đến một máy chủ đại diện. Nguyên tắc phân loại dựa trên các đặc điểm cấu trúc khác nhau của CDN. Những đặc điểm này là các thành phần quan trọng của CDN, quyết tổ chức, loại máy chủ được sử dụng, các tương tác giữa các thành phần CDN, cũng như các nội dung khác nhau và các dịch vụ được cung cấp bởi các CDN. Hình 5: Phân loại CDN thành phần Học viên : Hoàng Phương Nhung, CB130041, 13B-MTTT Trang 13
- Xem thêm -

Tài liệu liên quan