LỜI CAM ĐOAN
Tôi xin cam đoan, những kiến thức trình bày trong luận văn là do tôi tìm
hiểu, nghiên cứu và trình bày dưới sự hướng dẫn của PGS.TS Hoàng Xuân
Huấn. Trong quá trình làm luận văn, tôi đã tham khảo các tài liệu có liên quan
và đều trích dẫn nguồn đầy đủ, rõ ràng. Những kết quả mới trong luận văn là
của riêng tôi, không sao chép từ bất kỳ một công trình nào khác. Nếu có điều gì
không trung thực, tôi xin hoàn toàn chịu trách nhiệm.
Học viên
Vũ Minh Mạnh
LỜI CẢM ƠN
Trước hết, tôi xin gửi lời cảm ơn sâu sắc đến PGS.TS Hoàng Xuân Huấn,
người thầy đã giành nhiều thời gian để hướng dẫn, góp ý giúp tôi hoàn thành
luận văn này. Thầy luôn truyền cho tôi cảm hứng, nhiệt huyết nghiên cứu khoa
học, động viên và cho tôi nhiều lời khuyên quý báu.
Tôi cũng xin bày tỏ lòng biết ơn chân thành tới các thầy, cô giáo đã giảng dạy
tôi trong suốt 2 năm học tại Trường Đại học Công nghệ - Đại học Quốc gia Hà
Nội. Mỗi thầy cô đều cho tôi những bài giảng thật hay và bổ ích.
Tôi cũng xin gửi lời cảm ơn tới Ban giám đốc Học viện An ninh nhân dân,
Lãnh đạo Khoa Công nghệ và An ninh thông tin cùng các anh chị đồng nghiệp
đã tạo mọi điều kiện thuận lợi giúp tôi tham gia và hoàn thành khóa học.
Cuối cùng, tôi xin gửi lời biết ơn đến bố mẹ, anh chị trong gia đình, bạn bè,
người thân đã luôn ủng hộ, động viên tôi vượt qua những khó khăn trong cuộc
sống, để tôi có thể theo đuổi ước mơ và hoài bão của mình.
Học viên
Vũ Minh Mạnh
Mục lục
MỞ ĐẦU
1
1 GIỚI THIỆU VỀ MẠNG XÃ HỘI
5
1.1
1.2
1.3
Giới thiệu chung về mạng xã hội . . . . . . . . . . . . . . . . . . .
5
1.1.1
Lịch sử phát triển của mạng xã hội . . . . . . . . . . . . . .
7
1.1.2
Những tính năng của mạng xã hội . . . . . . . . . . . . . .
9
Các đặc trưng cơ bản của mạng xã hội . . . . . . . . . . . . . . . .
10
1.2.1
Đặc trưng thế giới nhỏ . . . . . . . . . . . . . . . . . . . . .
10
1.2.2
Đặc trưng tập nhân . . . . . . . . . . . . . . . . . . . . . . .
11
1.2.3
Phân bố luật lũy thừa . . . . . . . . . . . . . . . . . . . . .
11
1.2.4
Đặc trưng cấu trúc cộng đồng . . . . . . . . . . . . . . . . .
12
1.2.5
Các đặc trưng khác của mạng xã hội . . . . . . . . . . . . .
13
Một số chủ đề được nghiên cứu trên mạng xã hội . . . . . . . . . .
14
1.3.1
Phát hiện cấu trúc cộng đồng trên mạng xã hội . . . . . .
14
1.3.2
Dự đoán liên kết trên mạng xã hội . . . . . . . . . . . . . .
15
1.3.3
Tính riêng tư trên mạng xã hội . . . . . . . . . . . . . . . .
16
1.3.4
Tiến hóa động trên mạng xã hội . . . . . . . . . . . . . . .
16
1.3.5
Khai phá dữ liệu trên mạng xã hội . . . . . . . . . . . . . .
17
1.3.6
Tối đa hóa ảnh hưởng trên mạng xã hội . . . . . . . . . . .
18
1.3.7
Phát hiện, giám sát và ngăn ngừa thông tin sai lệch trên
mạng xã hội . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2 THÔNG TIN SAI LỆCH VÀ CÁC MÔ HÌNH LAN TRUYỀN
THÔNG TIN SAI LỆCH
20
2.1
Định nghĩa thông tin sai lệch . . . . . . . . . . . . . . . . . . . . .
20
2.2
Mô hình lan truyền thông tin sai lệch . . . . . . . . . . . . . . . .
24
2.2.1
Mô hình tầng độc lập . . . . . . . . . . . . . . . . . . . . .
25
2.2.2
Mô hình ngưỡng tuyến tính . . . . . . . . . . . . . . . . . .
26
2.3
Một số hướng nghiên cứu liên quan đến bài toán hạn chế lan
truyền thông tin sai lệch trên mạng xã hội trực tuyến . . . . . . .
29
3 GIẢI PHÁP GIẢM THIỂU TỐI ĐA THIỆT HẠI DO THÔNG
TIN SAI LỆCH GÂY RA TRÊN MẠNG XÃ HỘI TRỰC TUYẾN 34
3.1
Phát biểu bài toán . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
3.2
Độ khó của bài toán . . . . . . . . . . . . . . . . . . . . . . . . . .
39
3.3
Các thuật toán đề xuất giải quyết bài toán MDM . . . . . . . . .
41
3.3.1
Thuật toán tham lam dựa trên hàm f (I) . . . . . . . . . .
41
3.3.2
Thuật toán tham lam dựa trên hàm α(v) . . . . . . . . . .
43
4 THỰC NGHIỆM
45
4.1
Mục đích thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . .
45
4.2
Dữ liệu tiến hành thực nghiệm . . . . . . . . . . . . . . . . . . . .
45
4.3
Cài đặt thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . .
46
4.4
Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . .
47
4.5
Kết luận và nhận xét . . . . . . . . . . . . . . . . . . . . . . . . . .
51
KẾT LUẬN
52
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ
54
PHỤ LỤC
62
Danh mục các từ viết tắt
Từ viết tắt Thuật ngữ tiếng Anh
IC
Independent Cascade
LT
Linear Threshold
MDM
Minimize Damage of Misinformation
MXH
Social Network
Thuật ngữ tiếng Việt
Mô hình tầng độc lập
Mô hình ngưỡng tuyến tính
Bài toán cực tiểu hóa thiệt hại do
thông tin sai lệch gây ra
Mạng xã hội
Danh sách bảng
1.1
Một số mạng xã hội tiêu biểu cho phân bố luật lũy thừa . . . . .
12
4.1
Dữ liệu thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . .
46
Danh sách hình vẽ
1.1
Bảng xếp hạng các mạng xã hội theo số lượng người dùng, tháng
1/2017 (đơn vị Triệu người dùng) . . . . . . . . . . . . . . . . . . .
6
1.2
Các trang mạng xã hội trên Internet . . . . . . . . . . . . . . . . .
8
1.3
Đặc trưng thế giới nhỏ của mạng xã hội . . . . . . . . . . . . . . .
11
1.4
Đặc trưng tập nhân của mạng xã hội . . . . . . . . . . . . . . . . .
12
1.5
Mạng đồng tác giả . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
1.6
Đường kính mạng xã hội Facebook . . . . . . . . . . . . . . . . . .
14
1.7
Mô hình câu lạc bộ karate của Zachary, một trong những mô hình
chuẩn cho bài toán phát hiện cấu trúc cộng đồng . . . . . . . . . .
1.8
14
Sự tiến hóa của mạng lưới những nhà phát minh làm việc cho
Apple trong 6 năm . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.1
Một ví dụ quá trình lan truyền thông tin trên mô hình IC . . . .
26
2.2
Một ví dụ quá trình lan truyền thông tin trên mô hình LT . . . .
28
3.1
Phép dẫn từ bài toán Tập phủ dạng 0 − 1 đến bài toán MDM . . .
40
4.1
Tổng thiệt hại khi ngân sách B thay đổi, d = 6, |S| = 10 . . . . . .
48
4.2
Tổng thiệt hại khi ngân sách B thay đổi, d = 6, |S| = 20 . . . . . .
49
4.3
Độ giảm thiệt hại khi kích thước nguồn S thay đổi, d = 5, B = 25
50
1
MỞ ĐẦU
Ngày nay, các mạng xã hội trực tuyến đã trở thành một phần không thể thiếu
trong cuộc sống của con người, cho phép mỗi chúng ta có thể tạo, chia sẻ và trao
đổi thông tin, ý tưởng một cách nhanh chóng và dễ dàng hơn bao giờ hết. Đối
với nhiều người dùng, các trang mạng xã hội trực tuyến như Facebook, Twitter,
Google+ được coi là những kênh tin tức chính. Trong nhiều trường hợp, các trang
mạng xã hội này còn đưa những tin tức quan trọng trước cả một số phương tiện
truyền thông đại chúng khác như phát thanh, truyền hình vv.. Ví dụ, tin tức về
trùm khủng bố Bin Laden bị tiêu diệt lan truyền trên Twitter trước khi Tổng
thống Mỹ chính thức thông báo trên các phương tiện truyền thông công cộng [52]
hoặc câu chuyện về cái chết của ca sĩ Whitney Houston lan rộng trên Twitter,
trước 27 phút so với hãng tin AP (Associated Press) [53]. Có thể nói rằng, các
trang mạng xã hội ngày nay là một trong những nguồn cung cấp thông tin phong
phú, đa chiều và là "nơi khám phá tin tức" của nhiều độc giả, đặc biệt là những
độc giả trẻ và phụ nữ, chiếm số đông nhất trong nhóm chọn mạng xã hội để cập
nhật tin tức.
Bên cạnh những thông tin tin cậy, chính xác thì những thông tin sai lệch cũng
lan truyền rộng rãi trên mạng xã hội một cách dễ dàng. Một nhóm nghiên cứu
đến từ Đại học Columbia (New York, Mỹ) [23] đã chỉ ra rằng tốc độ lan truyền
của thông tin sai lệch ngang bằng so với những tin tức chính thống. Chính những
điều này đã gây ra những thiệt hại to lớn cho các cá nhân, tổ chức không những
về kinh tế, chính trị mà còn tác động đến tâm lý, cuộc sống con người. Gần
đây, diễn đàn Kinh tế thế giới (World Economic Forum, 2014) đã coi sự gia tăng
nhanh chóng của thông tin sai lệch trên các phương tiện xã hội trực tuyến là
một trong mười xu hướng hàng đầu mà thế giới phải đối mặt.
Trước những thách thức nêu trên, làm thể nào để có thể hạn chế sự lan truyền
của thông tin sai lệch trên mạng xã hội một cách kịp thời và hiệu quả? là một
câu hỏi đang nhận được sự quan tâm nghiên cứu của nhiều nhà khoa học trong
thời gian gần đây.
Một số nghiên cứu tập trung vào việc nhận dạng thông tin sai lệch và tin đồn
(Rumor) như nghiên cứu của Qazvinian, 2011, [6] và Kwwon, 2013, [7].
Một số khác, nghiên cứu vấn đề xác định tập đỉnh là nguồn phát thông tin sai
2
lệch ban đầu. Chẳng hạn, Dung T. Nguyen và các cộng sự, 2012, [65] đã nghiên
cứu bài toán xác định k nguồn phát tán thông tin sai lệch khả nghi nhất từ tập
người dùng bị kích hoạt bởi thông tin sai lệch cho trước.
Bên cạnh đó, một số tác giả đề xuất giải pháp hạn chế sự lan truyền thông tin
sai lệch trên mạng xã hội bằng cách chọn ra một số đỉnh ban đầu để tiêm thông
tin tốt, từ đó lan truyền những thông tin này trên cùng mạng nhằm thuyết phục
những người dùng khác tin theo, trong đó sử dụng các mô hình lan truyền thông
tin khác nhau [2–4]. Budak và các cộng sự, 2011, [2], đã đưa ra mô hình tầng độc
lập đa chiến dịch (Multi-Campaign Independent Cascade Model), gồm chiến dịch
phổ biến thông tin tốt và chiến dịch phổ biến thông tin sai lệch cùng cạnh tranh
với nhau. H. Zhang và các cộng sự, 2015, [3], đã nghiên cứu bài toán hạn chế
sự lan truyền thông tin sai lệch dưới mô hình kích hoạt cạnh tranh (Competitive
Activation Model). Hay như trong nghiên cứu của N. P. Nguyen và các cộng sự,
2013, [4], đã nghiên cứu bài toán hạn chế thông tin sai lệch dưới hai mô hình
tầng độc lập (Independent Cascade) và ngưỡng tuyến tính (Linear Threshold),
đồng thời đề xuất thuật toán xác định một tập nhỏ nhất các đỉnh có ảnh hưởng
lớn nhất, từ đó lan truyền những thông tin tốt nhằm hạn chế ảnh hưởng của
thông tin sai lệch.
Đặc biệt, ngoài những hướng nghiên cứu kể trên còn một cách tiếp cận khác
trong việc ngăn chặn thông tin sai lệch lan truyền trên mạng xã hội được trình
bày trong công trình nghiên cứu của H. Zhang và các cộng sự, 2016, [1], bằng
cách đặt giám sát (Monitor Placement) trên một số đỉnh của đồ thị mạng nhằm
ngăn chặn thông tin sai lệch lây lan đến những đỉnh khác trong cùng mạng. Đặt
giám sát là phương pháp sử dụng các bộ lọc nội dung nhằm phát hiện thông tin
sai lệch ở người dùng (đỉnh) được cài đặt và ngăn chặn sự chia sẻ, lan truyền
thông tin sai lệch từ đỉnh này; hoặc trong ngữ cảnh khác có thể hiểu là việc
thuyết phục người dùng (đỉnh) không tin theo và lan truyền thông tin sai lệch.
Một số công trình nghiên cứu khác gọi phương pháp này với tên gọi đó là phương
pháp tạo miễn dịch (Immunize) cho các đỉnh trong đồ thị mạng xã hội.
Đứng trước những nguy cơ mất an toàn, an ninh thông tin trên mạng xã hội
do thông tin sai lệch gây ra, đồng thời thúc đẩy bởi những công trình nghiên cứu
đã nêu ở trên, đặc biệt là nghiên cứu của H. Zhang, 2016, [1] đã tạo động lực
cho tác giả lựa chọn đề tài "Giảm thiểu tối đa thiệt hại do thông tin sai
lệch gây ra trên mạng xã hội trực tuyến" làm đề tài luận văn của mình.
3
Đóng góp chính của luận văn bao gồm:
- Thứ nhất, đề xuất một mô hình ngưỡng tuyến tính cho bài toán Cực tiểu
hóa thiệt hại do thông tin sai lệch gây ra, đồng thời chứng mình bài toán
này thuộc lớp bài toán NP-khó.
- Thứ hai, đề xuất hai thuật toán tham lam nhằm giải quyết bài toán đặt ra.
- Thứ ba, kết quả thực nghiệm cho thấy ưu điểm nổi trội của hai thuật toán
đề xuất so với các thuật toán thông dụng khác như thuật toán bậc cực đại
(Max Degree) và thuật toán ngẫu nhiên (Random) trong việc hạn chế thông
tin sai lệch lan truyền trên mạng.
Ngoài phần mở đầu và kết luận, bố cục chính của luận văn gồm bốn chương
như sau:
Chương 1: Giới thiệu về mạng xã hội
Chương này giới thiệu tổng quan về mạng xã hội gồm: Định nghĩa mạng xã
hội, lịch sử hình thành, phát triển và những đặc trưng cơ bản của mạng xã hội.
Đặc biệt, trong chương này trình bày tổng quan một số chủ đề nổi bật liên quan
đến mạng xã hội, đã và đang nhận được sự quan tâm nghiên cứu của nhiều học
giả trong thời gian gần đây.
Chương 2: Thông tin sai lệch và các mô hình lan truyền thông tin
sai lệch
Chương này tác giả trình bày định nghĩa thông tin sai lệch, những nguy cơ
và hậu quả do thông tin sai lệch gây ra đối với các cá nhân, tổ chức. Đồng thời,
phân tích cơ chế lan truyền thông tin và những đặc tính của hai mô hình lan
truyền thông tin đang được sử dụng rộng rãi bao gồm: Mô hình tầng độc lập
và mô hình ngưỡng tuyến tính. Ngoài ra, ở Chương 2 tổng quan một số hướng
nghiên cứu liên quan đến bài toán hạn chế lan truyền thông tin sai lệch trên
mạng xã hội trực tuyến.
Chương 3: Giải pháp giảm thiểu tối đa thiệt hại do thông tin sai
lệch gây ra trên mạng xã hội trực tuyến
Từ thực trạng đã nêu trong Chương 2 và xuất phát từ những công trình
nghiên cứu liên quan trước đó, tác giả phát biểu bài toán Cực tiểu hóa thiệt hại
do thông tin sai lệch gây ra trên mạng xã hội trực tuyến, chứng minh bài toán
này thuộc lớp bài toán NP-khó, đồng thời đề xuất thuật toán nhằm giải quyết
bài toán này.
4
Chương 4: Thực nghiệm
Mô tả các bước tiến hành và kết quả thực nghiệm nhằm đánh giá hiệu quả
của thuật toán đề xuất trong việc ngăn chặn sự lan truyền của thông tin sai
lệch. Thực nghiệm tiến hành dựa trên ba bộ dữ liệu là các mạng xã hội thực,
bao gồm: Gnutella, CollegeMsg và Email. Kết quả thực nghiêm cho thấy, thuật
toán do tác giả đề xuất tốt hơn các thuật toán thông dụng khác như thuật toán
bậc cực đại (Max Degree) và thuật toán ngẫu nhiên (Random).
5
Chương 1
GIỚI THIỆU VỀ MẠNG XÃ HỘI
Chương này giới thiệu tổng quan về mạng xã hội bao gồm: Định nghĩa mạng
xã hội, lịch sử hình thành, phát triển và những đặc trưng cơ bản của mạng xã
hội. Đặc biệt, trong chương này trình bày tổng quan một số chủ đề nổi bật liên
quan đến mạng xã hội, đã và đang nhận được sự quan tâm nghiên cứu của nhiều
học giả trong thời gian gần đây.
1.1
Giới thiệu chung về mạng xã hội
Trong những năm gần đây, cùng với sự phát triển của Web 2.0, các mạng xã
hội trực tuyến như Facebook1 , Twitter2 , Instagram3 ngày càng trở lên phổ biến
và có sự phát triển nhanh chưa từng thấy. Theo số liệu thống kê công bố trên
trang Statista4 , tính đến tháng 1/2017, Facebook vẫn là mạng xã hội có lượng
người dùng lớn nhất thế giới với hơn 1.87 tỉ người sử dụng, Twitter với 317 triệu
người dùng đứng ở vị trí thứ 9 trong bảng xếp hạng.
Theo Marin và Wellman [30], mạng xã hội (MXH) là một tập hợp các tác
nhân có yếu tố xã hội được kết nối với nhau bởi một hoặc nhiều các quan hệ xã
hội.
Ngoài ra, MXH còn có những định nghĩa khác: MXH là một cấu trúc xã hội
được tạo thành từ các nút và các cung mà mỗi nút được liên kết bởi một hoặc
nhiều cung khác nhau, thể hiện một mối quan hệ cụ thể [31]. Mỗi nút thường
được gọi là tác nhân, đại diện cho một đối tượng trong mạng xã hội, có thể là
một người, một nhóm người, một tài liệu, một tổ chức hay một quốc gia vv..
Mỗi cung là một liên kết giữa các nút, biểu diễn mối quan hệ giữa các đối tượng.
Liên kết này có thể là mối quan hệ họ hàng, người quen, bạn bè, đồng nghiệp,
cũng có thể là các giao dịch, trao đổi tài chính vv.. Nếu mối quan hệ giữa các
đối tượng là quan hệ qua lại thì có thể biểu diễn bằng một liên kết vô hướng,
chẳng hạn nếu người A là đồng nghiệp của người B thì ngược lại người B cũng
1 https://www.facebook.com
2 https://www.twitter.com
3 https://www.instagram.com
4 http://www.statista.com
6
là đồng nghiệp của người A. Nếu mối quan hệ này là quan hệ một chiều thì có
thể biểu diễn bằng một liên kết có hướng, ví dụ người A mua hàng của người B
nhưng chưa chắc người B đã mua hàng của người A.
Rõ ràng, khái niệm về MXH không chỉ giới hạn trong trường hợp cụ thể là
những trang mạng xã hội (Social Network Sites) như WhatsApp, Instagram,
Viber vv.. Các vấn đề của MXH đã được nghiên cứu thường xuyên trong lĩnh
vực xã hội học, trước sự ra đời của máy tính và Internet. Khi MXH này được
thiết lập và thi hành bằng các phương tiện truyền thông Internet, nó được hiểu
là MXH trực tuyến (Online Soial Network).
Nhìn từ nhiều phía, MXH trực tuyến là một đại diện tiêu biểu của Web 2.0
mô phỏng các quan hệ xã hội thực. MXH trực tuyến tạo ra một hệ thống trên
nền Internet kết nối các thành viên cùng sở thích với nhiều mục đích khác nhau
không phân biệt không gian và thời gian qua những tính năng như kết bạn, chat,
e-mail, phim ảnh, voice chat, chia sẻ tập tin, blog và xã luận. Những người sử
dụng MXH này được gọi là những cư dân mạng. Nhờ vào những ưu việt này mà
MXH trực tuyến đang có tốc độ phát triển chóng mặt ở mọi lứa tuổi, đặc biệt
là ở giới trẻ trên toàn thế giới.
Hình 1.1: Bảng xếp hạng các mạng xã hội theo số lượng người dùng, tháng 1/2017 (đơn vị Triệu người
dùng)
7
1.1.1
Lịch sử phát triển của mạng xã hội
Lịch sử phát triển của MXH luôn đồng hành cùng với sự phát triển của
Internet. Từ những email đầu tiên được gửi đi bởi các nhà nghiên cứu Thụy Sĩ
vào năm 1971 đến những MXH hiện đại như Facebook, Twitter vv.. Internet và
các nội dung chia sẻ luôn gắn liền với tính chất cộng đồng. Mục tiêu chính của
Internet là tạo phương tiện để con người có thể kết nối, giao tiếp và tương tác
với nhau. Tuy nhiên, từ lúc xuất hiện đến nay, mạng xã hội đã trải qua nhiều
thay đổi nhanh chóng cả về nguyên lý làm việc lẫn giao diện đồ họa.
Năm 1991, nhà khoa học Tim Berner-Lee thuộc Phòng thí nghiệm vật lý vi
mô châu Âu (CERN) đã đề xuất một giao thức mới để phát tán thông tin. Giao
thức đính kèm đường dẫn dưới dạng ký tự ẩn dưới những ký tự khác (Link).
Cuối cùng hình thành nên giao thức kết nối Internet World Wide Web (WWW).
Năm 1994 đánh dấu sự ra đời của Blog cá nhân đầu tiên. Justin Hall là sinh
viên đại học Swarthmore đã phát triển website mang tên Justin’s Link from the
Underground để kết nối với thế giới bên ngoài. Hall đã xây dựng trang web trong
suốt 11 năm và anh được mệnh danh là "cha đẻ của trang blog cá nhân".
Năm 1995 đánh dấu sự ra đời của trang Classmate5 với mục đích hỗ trợ những
người di cư có thể tìm lại bạn bè đã thất lạc của họ. Đây là một dịch vụ cộng
đồng được tạo ra để giúp tìm lại những bạn học từ thời tiểu học, trung học và
đại học của người dùng.
Năm 1997, một chương trình nhắn tin có quảng cáo AOL Instant Messenger6
(AIM) đã ra đời, cho phép hàng triệu người có thể trò chuyện thời gian thực với
nhau. Trong khoảng thời gian này, trang MXH SixDegree7 được thành lập với
mục đích giao lưu kết bạn dựa theo sở thích.
Năm 2000, Jimmy Wales và Larry Sanger sáng lập nên Wikipedia8 , bách khoa
toàn thư nguồn mở, trực tuyến và có tính cộng tác đầu tiên trên thế giới.
Năm 2001, sau vụ khủng bố trung tâm thương mại thế giới vào ngày 11/9/2001
đã gợi cảm hứng cho Scott Heiferman tìm cách tạo ra trang web Meetup9 nhằm
giúp mọi người có thể kết nối với nhau và thậm chí không cần online. Meetup.com
có mục đích duy nhất là tạo điều kiện cho những người có cùng suy nghĩ gặp gỡ,
trò truyện, học tập và kết nối. Trang web hướng tới mục đích mang mọi người
5 https://www.classmate.com
6 https://www.aol.com
7 https://www.sixgegrees.org
8 https://www.wikipedia.org
9 https://www.meetup.com
8
ra khỏi nhà, tham gia vào các mối quan hệ và giao tiếp cùng với những người
khác. Hiện trang web đã được phổ biến rộng rãi, mỗi tháng có hơn 340.000 hội
nhóm tổ chức gặp gỡ, giao tiếp, làm việc, ăn uống và cùng nhau học tập.
Năm 2002, MXH Friendster10 ra đời và trở thành một trào lưu mới tại Hoa
Kỳ với hàng triệu người dùng đăng ký. Friendster cho phép người dùng tạo thông
tin cá nhân và kết nối ảo với những người khác. Đây là MXH đầu tiên đạt được
hơn 1 triệu người dùng.
Kế thừa các bước phát triển của các MXH đi trước, MXH MySpace11 được
sáng lập và ra đời vào năm 2003 bởi Chris DeWolfe và Tom Andersonra. Với
nhiều tính năng mới cho phép người dùng tải các hình ảnh, video do vậy chỉ 1
tháng sau khi ra mắt, MySpace nhanh chóng đạt hơn 1 triệu tài khoản đăng ký.
Do nắm được các nhu cầu của người dùng, MySpace trở thành MXH đầu tiên có
nhiều lượt xem vượt qua cả Google, tuy nhiên sự ra đời của Facebook đã khiến
cho Myspace nhanh chóng trở thành dĩ vãng.
Năm 2004, Mark Zuckerburg giới thiệu MXH Facebook, đánh dấu bước ngoặt
mới cho hệ thống MXH trực tuyến. Với nền tảng Facebook Platform hỗ trợ mạnh
mẽ cho các ứng dụng, người dùng có thể tạo ra những ứng dụng mới cho cá nhân
mình cũng như các thành viên khác. Facebook nhanh chóng gặt hái được thành
công vược bậc, mang lại hàng trăm tính năng mới và trung bình các thành viên
bỏ ra 19 phút trên trang này mỗi ngày.
Hình 1.2: Các trang mạng xã hội trên Internet
10 https://www.friendster.org
11 https://www.myspace.org
9
Năm 2005, MXH YouTube12 ra đời, cho phép người dùng tự do đăng tải và
chia sẻ video với gia đình, bạn bè. Tiếp sau đó, năm 2006, MXH Twitter ra đời,
cho phép mỗi cá nhân có thể truyền đạt thông tin một cách nhanh chóng và dễ
dàng đến với một nhóm lớn. Năm 2011, MXH Google+ ra đời, đây là một MXH
có đầy đủ tính năng của Google. Người dùng Google+ đánh giá cao khả năng
nhóm các danh sách liên lạc vào các đoạn khác nhau (thường gọi là Vòng) và giao
tiếp với nhau qua công cụ chat Video có tên Hangouts. Năm 2012, Pinterest13
là MXH hình ảnh đồ họa và đã vượt mức 10 triệu người dùng, phát triển nhanh
hơn bất cứ trang web độc lập nào khác.
Ngoài những MXH nổi tiếng nêu trên, còn có hàng trăm MXH khác trên toàn
thế giới: Flickr, WeChat, Sina Weibo, Baidu Tieba vv.. Ở Việt Nam hiện nay có
một số MXH như: Zing Me, YuMe, Tamtay cũng đã thu hút được nhiều người
dùng nhiều với mục đích khác nhau.
1.1.2
Những tính năng của mạng xã hội
- Tính liên kết cộng đồng: Đây là tính năng nổi bật của MXH trực tuyến cho
phép mở rộng phạm vi kết nối giữa con người với con người trong một không
gian đa dạng. Người sử dụng có thể trở thành bạn của nhau thông qua việc
gửi lời mời kết bạn mà không cần gặp gỡ trực tiếp. Việc tạo ra các liên kết
này hình thành một cộng đồng mạng với số lượng thành viên lớn. Những
người chia sẻ cùng một mối quan tâm có thể tập hợp lại thành các nhóm
trên MXH, thường xuyên giao lưu, chia sẻ trên mạng thông qua việc bình
luận hay dẫn đến các liên kết trên trang chung của nhóm.
- Tính đa phương tiện: Hoạt động theo nguyên lý của web 2.0, MXH có rất
nhiều tiện ích nhờ sự kết hợp giữa các yêu tố văn bản, âm thanh, hình ảnh,
hình ảnh động, video vv.. Sau khi đăng ký mở tài khoản, người dùng có thể
tự do xây dựng một không gian riêng cho bản thân. Nhờ những tiện ích và
dịch vụ mà MXH cung cấp, người dùng có thể chia sẻ đường dẫn, tệp âm
thanh, hình ảnh, video vv.. Không những vậy, họ còn có thể tham gia vào
các trò chơi trực tuyến, gửi tin nhắn, trò chuyện trực tuyến với bạn bè từ
đó tạo dựng các mối quan hệ mới trong xã hội ảo.
- Tính tương tác: Thể hiện không chỉ ở chỗ thông tin được truyền đi sau đó
12 https://www.youtube.com
13 https://www.pinterest.com
10
được phản hồi từ phía người nhận, mà còn phụ thuộc vào cách người dùng
sử dụng ứng dụng của MXH.
- Khả năng truyền tải và lưu trữ thông tin: Một tính năng quan trọng của
MXH giúp thông tin được lan truyền rộng rãi trong một khoảng thời gian
ngắn. Những thành viên trong MXH là một mắt xích để tạo ra mạng lưới
truyền tải thông tin, họ có thể tương tác với nhau bất kể khoảng cách về
địa lý, ngôn ngữ, giới tính, tôn giáo. Nếu như trong thế giới thực, chúng ta
phải gặp nhau để trao đổi, trò chuyện, hay cùng hợp tác thì ngày nay việc
đó thật đơn giản và thuận tiện hơn rất nhiều nhờ MXH.
1.2
Các đặc trưng cơ bản của mạng xã hội
1.2.1
Đặc trưng thế giới nhỏ
Vấn đề nghiên cứu cấu trúc MXH đã gây được sự chú ý và quan tâm sâu sắc
của các nhà nghiên cứu trong nhiều năm qua. Đầu tiên là thí nghiệm nổi tiếng
có tên gọi "thí nghiệm thế giới nhỏ" (Small World Experiment) được thực hiện
bởi Stanley Milgram, 1967, nhằm tính toán số bước cần thiết để hai người bất kỳ
trong một dân số đã được xác định có thể biết nhau. Để thực hiện được điều nay,
Milgram đã chọn ngẫu nhiên một số cá nhân ở các thành phố là điểm khởi đầu
và điểm kết thúc. Mỗi cá nhân ở điểm khởi đầu được yêu cầu gửi một bức thư có
nội dung là thông tin liên lạc của cá nhân cần tìm ở điểm kết thúc tới người mà
họ biết. Người nhận được thư sẽ phải chuyển tiếp bức thư tới một người là bạn
bè hoặc người thân của họ mà họ cho rằng người đó có khả năng cao nhất biết
người cần tìm. Cứ như vậy cho đến khi bức thư đến được tay người cần tìm. Và
kết quả là 64 trong 296 bức thư đã được chuyển đến đích với số bước trung bình
khoảng 5.5 hoặc 6. Do đó, các nhà nghiên cứu kết luận rằng giữa hai người dân
bất kỳ ở Hoa Kỳ có thể biết nhau thông qua trung bình khoảng 6 bước.
Trên thực tế, người ta đã kiểm chứng được "hiện tượng thế giới nhỏ" (Small
World Phenomenon) đúng với hầu hết các MXH nhỏ. Đối với các MXH lớn như
Facebook, khoảng cách trung bình kết nối giữa hai người dùng bất kỳ trên thế
giới là 5.28 bước vào năm 2008 và đến năm 2011 khoảng cách này rút ngắn xuống
còn 4.74.
11
Hình 1.3: Đặc trưng thế giới nhỏ của mạng xã hội
1.2.2
Đặc trưng tập nhân
Cấu trúc và sự vận động của MXH chịu tác động bởi các nút có số lượng lớn
các cung kết nối hay các nút có bậc cao. Người ta gọi những nút này là nút trung
tâm hay nút nhân. Phân tích cấu trúc MXH đã chỉ ra rằng, MXH luôn chứa một
lượng lớn những nút có bậc cao [32]. Bao quanh các nút này là các nút có bậc
thấp hơn, và quanh những nút có bậc thấp hơn này lại là các nút có bậc thấp
hơn chúng, cứ như vậy tạo thành một hệ thống phân cấp. Các nút nhân có vai
trò quan trọng trong việc kết nối luồng thông tin của toàn mạng. Nếu ta chọn
một nút có số bậc lớn và đưa ra khỏi mạng, mạng sẽ phân chia thành các nhóm
cô lập nhau.
Một nút mới khi được thêm vào mạng thường có xu hướng kết nối đến những
nút có bậc cao, đây gọi là hiện tượng "rich get richer" ("người giàu thường trở
lên giàu hơn"). Điều này giải thích tại sao trong mạng những công trình khoa
học, các bài báo được tham chiếu nhiều thì lại được nhiều người nghiên cứu và
tham chiếu hay như trong các MXH trực tuyến chúng ta thường có xu hướng
kết bạn với những người nổi tiếng vv..
1.2.3
Phân bố luật lũy thừa
Sự phân bố bậc của các nút trong mạng được mô tả bởi hàm P (k), hàm này
cho biết xác suất của một nút có bậc là k . Phân bố bậc mô tả các các liên kết
trong mạng phân bố như thế nào giữa các nút.
12
Hình 1.4: Đặc trưng tập nhân của mạng xã hội
Phân bố bậc của một mạng là tuân theo luật lũy thừa nếu xác suất một nút
có bậc là k tỉ lệ với k −α , với k lớn và α > 1. Hiện nay, hầu hết các MXH đều có
phân bố bậc theo luật lũy thừa [33]. Bảng 1.1 liệt kê một số mạng với số mũ α.
Tên mạng
WWW
Film Actors
Telephone Call Graph
Email Networks
Sexual Contacts
Internet
Peer-To-Peer
Metabolic Network
Protein Interactions
Số mũ α
2.3/2.7
2.3
2.1
1.5/2.0
3.2
2.5
2.1
2.2
2.4
Bảng 1.1: Một số mạng xã hội tiêu biểu cho phân bố luật lũy thừa
1.2.4
Đặc trưng cấu trúc cộng đồng
Theo Simmel, 1995, thì cộng đồng là một tập các thực thể có những tính chất
tương tự nhau và/hoặc cùng đóng một vai trò trong MXH. Trong xã hội ngày
nay, tồn tại nhiều nhóm cộng đồng khác nhau, chẳng hạn như nhóm bạn bè có
cùng sở thích, cộng đồng những nhà khoa học, các câu lạc bộ thể thao vv.. Sự
phát triển của MXH trực tuyến cũng tạo ra nhiều nhóm ảo, hay còn gọi là các
cộng đồng trực tuyến.
MXH có một đặc trưng quan trọng đó là cấu trúc cộng đồng, trong mạng được
phân chia thành các cộng đồng lớn nhỏ khác nhau; bên trong các cộng đồng lớn
13
có những cộng đồng con nhỏ hơn. Giữa các nút trong một cộng đồng có mật độ
kết nối lớn hơn so với các nút bên ngoài.
Hình 1.5: Mạng đồng tác giả
Xét theo tiêu chí cấu trúc, cộng đồng được chia thành hai kiểu: cấu trúc cộng
đồng tách rời và cấu trúc cộng đồng chồng chéo. Đối với cấu trúc cộng đồng
chồng chéo, một nút có thể thuộc nhiều cộng đồng khác nhau. Ngược lại, trong
cấu trúc cộng đồng tách rời, một nút chỉ thuộc duy nhất một cộng đồng.
1.2.5
Các đặc trưng khác của mạng xã hội
Một mạng có đường kính d nếu mọi cặp nút trong mạng được kết nối với nhau
bằng một đường chiều dài tối đa bằng d. Leskovec, 2005, [34] đã chỉ ra rằng MXH
không chỉ có đường kính nhỏ (đặc trưng thế giới nhỏ) mà đường kính mạng còn
co ngắn lại và sau đó giữ ổn định theo thời gian. MXH trực tuyến Facebook là
một ví dụ điển hình cho đặc trưng này, năm 2008 đường kính của mạng Facebook
là 5.28, đến năm 2011 đường kính của mạng rút ngắn xuống còn 4.74 và đến thời
điểm hiện tại là 3.57.
Ngoài ra, nghiên cứu của Leskovec cũng chỉ ra rằng, bậc trung bình của các
nút trong mạng tăng theo thời gian do số lượng liên kết tăng "siêu" tuyến tính
so với số lượng nút.
- Xem thêm -