BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ QUỐC PHÒNG
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ
---------------------------
BÙI QUẢNG NAM
NGHIÊN CỨU PHÂN PHỐI XÁC SUẤT ỔN ĐỊNH
VÀ ỨNG DỤNG TRONG THỐNG KÊ
LUẬN ÁN TIẾN SĨ TOÁN HỌC
HÀ NỘI - 2016
BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ QUỐC PHÒNG
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ
---------------------------
BÙI QUẢNG NAM
NGHIÊN CỨU PHÂN PHỐI XÁC SUẤT ỔN ĐỊNH
VÀ ỨNG DỤNG TRONG THỐNG KÊ
Chuyên ngành: Lý thuyết xác suất và thống kê toán học
62 46 01 06
Mã số:
LUẬN ÁN TIẾN SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS TS Hồ Đăng Phúc
2. TS Vũ Ba Đình
HÀ NỘI - 2016
LỜI CAM ĐOAN
Nghiên cứu sinh xin cam đoan đây là công trình nghiên cứu của nghiên
cứu sinh. Các kết quả nêu trong luận án là trung thực, được các đồng tác giả
cho phép sử dụng và chưa từng được ai công bố trong bất kỳ công trình nào
khác. Các dữ liệu tham khảo có trích dẫn đầy đủ.
Nghiên cứu sinh
Bùi Quảng Nam
LỜI CẢM ƠN
Luận án được hoàn thành dưới sự hướng dẫn của các thầy PGS. TS. Hồ
Đăng Phúc và TS. Vũ Ba Đình. Nghiên cứu sinh xin bày tỏ lòng biết ơn sâu
sắc nhất đối với các thầy vì sự tận tình trong hướng dẫn nghiên cứu, sự chặt
chẽ và kỹ lưỡng của các thầy trong giảng dạy và tình cảm của các thầy dành
cho nghiên cứu sinh trong cuộc sống.
Nghiên cứu sinh xin gửi lời cảm ơn Viện Công nghệ thông tin, Phòng
Đào tạo, Viện Khoa học và Công nghệ Quân sự, nơi nghiên cứu sinh đã học
tập nghiên cứu từ năm 2011 đến nay.
Nghiên cứu sinh xin gửi lời cảm ơn Phòng Xác suất và Thống kê toán
học, Viện Toán học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam, đã
giúp đỡ nghiên cứu sinh rất nhiều trong quá trình học tập và hoàn thành luận
án tiến sĩ.
Nghiên cứu sinh xin gửi lời cảm ơn Bộ môn Toán, Khoa Khoa học cơ
bản, Học viện Phòng không – Không quân đã giúp đỡ và tạo mọi điều kiện để
nghiên cứu sinh có thể hoàn thành quá trình học tập.
Trong thời gian học tập và hoàn thành luận án nghiên cứu sinh đã nhận
được sự quan tâm giúp đỡ và góp ý của GS. TS. Nguyễn Văn Hữu, TS.
Nguyễn Hồng Hải, PGS. TS. Tô Văn Ban, TS. Nguyễn Văn Hùng, TS.
Nguyễn Hắc Hải, … Nghiên cứu sinh xin chân thành cảm ơn các thầy về sự
giúp đỡ quý báu đó.
Nghiên cứu sinh xin gửi lời cảm ơn tới tất cả các thầy cô, gia đình,
đồng nghiệp và bạn bè đã góp ý, ủng hộ, động viên và giúp đỡ nghiên cứu
sinh trong quá trình học tập và hoàn thành luận án.
Bùi Quảng Nam
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT ……………………………………………
DANH MỤC CÁC BẢNG ……………………………………………………………………….……………
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ……………………………………………….……………
MỞ ĐẦU …………………………………………………………………………………………………………….….…
Chương 1. TỔNG QUAN VỀ PHÂN PHỐI XÁC SUẤT ỔN ĐỊNH ……..…
1.1. Định lý giới hạn trung tâm .……………………………………………………………………..…..…
1.2. Định lý giới hạn trung tâm suy rộng và phân phối xác suất ổn định …..
1.3. Độ đo xác suất trên không gian metric ……………………………..…………………..……
1.4. Kiến thức cơ sở về độ đo xác suất trên nón lồi ………...…………….…………………
1.5. Khái niệm cơ sở về độ đo ngẫu nhiên ……………………………….……………...…………
1.6. Hàm biến đổi chính quy …………………………………….……………….………………………..…
Chương 2. ĐỘ ĐO XÁC SUẤT TRÊN NÓN LỒI VÀ ĐỘ ĐO NGẪU
NHIÊN ỔN ĐỊNH CHẶT …………………………………………………………………………………..….
2.1. Các độ đo xác suất ổn định chặt và nửa ổn định chặt trên nón lồi …..…..
2.2. Miền hút và miền nửa hút ……………………………………………….…………………………..…
2.3. Đặc trưng của các độ đo ngẫu nhiên ổn định ……………………………..…………..…
2.4. Miền hút của các độ đo ngẫu nhiên ổn định …………………..………………………..…
Chương 3. ỨNG DỤNG PHÂN PHỐI XÁC SUẤT ỔN ĐỊNH TRONG
PHÂN TÍCH TÍN HIỆU ĐỊNH VỊ GPS ……………………………………………………………
3.1. Một số phương pháp ước lượng tham số của phân phối ổn định …...……
3.2. Tiêu chuẩn kiểm định Kolmogorov – Smirnov …………………………..……………
3.3. Nghiên cứu đặc tính của số liệu tín hiệu định vị GPS bằng tiêu chuẩn
kiểm định Kolmogorov - Smirnov …………………………………………………….…...…………….
3.4. So sánh kết quả phân tích số liệu theo giả thiết phân phối ổn định và
giả thiết phân phối chuẩn …..……………………………………………………………………………………
KẾT LUẬN ……………………………………………………………………………….………………………...………
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ ………………
TÀI LIỆU THAM KHẢO ………………………..……………………………...………………………………
PHỤ LỤC 1 ………..………………………………………………………………………….……………………………
PHỤ LỤC 2 ………..……………………………………………………………………………….………………………
PHỤ LỤC 3 ………..………………………………………………………………………………….……………………
Trang
i
iv
v
1
7
8
10
16
19
27
31
33
33
46
56
61
72
77
80
82
88
95
97
98
101
109
110
i
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT
a, an , b, br , r , s, t , u , v
Các số thực (chữ cái in thường)
a, u, x
Các độ đo không âm trên S (chữ cái in đậm)
Số mũ đặc trưng của phân phối ổn định
BK
Xích ma đại số các tập Borel trong K
BS
Xích ma đại số các tập Borel trong S
Tham số độ lệch của phân phối ổn định
Tập các số phức
C (S )
Không gian các hàm thực liên tục và bị chặn trên S
Tham số tỷ lệ (thang đo) của phân phối ổn định
Độ đo phổ của độ đo ngẫu nhiên chia được vô hạn
dK
Khoảng cách Kolgomorov
DA( )
Miền hút của độ đo ngẫu nhiên
DStA( )
Miền hút chặt của độ đo xác suất
DStSA(r , )
Miền r - nửa hút chặt của độ đo xác suất
Tham số định vị của phân phối ổn định
( e)
Độ đo xác suất tập trung tại phần tử trung lập e của K
(0)
Độ đo xác suất tập trung tại đỉnh 0 của K
A
Biên của tập A
e
Phần tử trung lập của nón lồi K
E( X )
Kỳ vọng của biến ngẫu nhiên X
F
Hàm phân phối của biến ngẫu nhiên
Fˆn
Hàm phân phối thực nghiệm của n quan sát
F( S )
Lớp các hàm đo được Borel trên S
ii
Fc ( S )
Lớp các hàm trong F ( S ) liên tục với giá compact
F
Xích ma đại số các tập con của
(t ), t
Hàm đặc trưng
( x), x
Hàm phân phối của biến ngẫu nhiên chuẩn tắc
( x), x
Hàm phân phối Fréchet với số mũ ổn định
i, j , k , m, n
Các số tự nhiên
I (a , )
Độ đo ngẫu nhiên chia được vô hạn với độ đo phổ
K
Ký hiệu nón lồi
K̂
Tập tất cả các đặc trưng
K
Tập con của K̂ tách K
K
Tập của tất cả các đặc trưng trong K
{K n }
Dãy các tập con compact của S
L( , g )
Biến đổi Laplace của độ đo ngẫu nhiên trên S
m( S )
Lớp các độ đo Radon không âm trên S
mb ( S )
Lớp các độ đo hữu hạn địa phương trên S
M (S )
Xích ma đại số các tập con của m( S )
, ,G
Độ đo dương (hoặc độ đo xác suất)
n
Tích chập của n độ đo xác suất
n ,n
Dãy các độ đo thuộc m( S )
Tập các số tự nhiên
p, pn , p0 , q, qn
Độ đo xác suất
pn
Dãy các độ đo xác suất
P (K )
Tập các độ đo xác suất xác định trên K
P (S )
Tập các độ đo xác suất xác định trên ( S , BS )
iii
(S )
Tập các độ đo ngẫu nhiên trên S
Tập các số thực
Tập các số thực lớn hơn hoặc bằng 0
Tập các số thực nhỏ hơn hoặc bằng 0
S
Không gian metric khả ly đầy đủ
Sn
Tổng của n biến ngẫu nhiên
St S
Tập các độ đo xác suất - ổn định chặt
St ( , r ) SS
Tập các độ đo xác suất ( , r ) - nửa ổn định chặt
S ( )
Nửa nhóm con của nhóm nhân ( , )
Ta
Toán tử co của các độ đo với hệ số co a 0
Tn
Biến ngẫu nhiên Kolmogorov
Triv( K )
Tập các độ đo xác suất tập trung tại {0, e} K
Var ( X )
Phương sai của biến ngẫu nhiên X
X 1 ,..., X n , Y , Y1 , Y2
Biến ngẫu nhiên
Không gian mẫu
( , F , P )
Không gian xác suất
( x), x ,0
Hàm phân phối Weibull với số mũ ổn định
0
Đỉnh của nón lồi K hoặc độ đo đồng nhất bằng 0 trên S
w
Ký hiệu sự hội tụ yếu
Dấu tích chập
iv
DANH MỤC CÁC BẢNG
Trang
Bảng 3.1. Số liệu thu được từ tín hiệu vệ tinh …………………………………..…...…
77
Bảng 3.2. Một số giá trị tới hạn của phân phối Kolmogorov-Smirnov
82
Bảng 3.3. Kiểm định Kolmogorov – Smirnov với vĩ độ và kinh độ …..
83
Bảng 3.4. Bảng tính giá trị Tn theo các tham số của phân phối ổn định
86
Bảng 3.5. Bảng so sánh các giá trị hàm phân phối xác suất …….…………..
87
Bảng 3.6. Liên hệ giữa cỡ mẫu tối thiểu theo độ tin cậy và khoảng
tin cậy …….…..……………………………………………………………………………………
89
Bảng 3.7. Liên hệ giữa khoảng tin cậy theo cỡ mẫu tối thiểu và độ
tin cậy …..…………………………………………………………………………………...…..…
90
Bảng 3.8. Liên hệ giữa độ tin cậy theo cỡ mẫu tối thiểu và khoảng
tin cậy ..…………………………………………………………………………………...…..…...
91
v
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Trang
Hình 3.1. Phân phối thực nghiệm của sai số vĩ độ và đường cong
phân phối chuẩn ……………………………………………………………………...…...…
84
Hình 3.2. Đồ thị hàm mật độ của phân phối chuẩn và phân phối ổn
định …………………………………………………………………………………………..…….…
92
1
MỞ ĐẦU
1. Lý do chọn đề tài
1.1.
Khi tiến hành đo đạc các đại lượng như khoảng cách, chiều cao, độ sâu,
khối lượng, hàm lượng, nồng độ hóa học, điện áp, điện trở, nhiệt độ, … người
ta đều không tránh khỏi các sai số. Các sai số đó có nguồn gốc rất khác nhau,
do các đặc tính vật lý của phương tiện đo cũng như của đối tượng được đo, do
các điều kiện của môi trường cũng như do đặc điểm chủ quan của con người.
Các sai số thường được chia thành phần sai số hệ thống và phần sai số ngẫu
nhiên. Sai số hệ thống là phần sai số có thể xác định được chính xác quy luật
tất định và có thể kiểm soát được. Trong khi đó, sai số ngẫu nhiên là phần
chưa biết chính xác quy luật tất định hoặc do các yếu tố hoàn toàn ngẫu nhiên
gây ra.
Trong nhiều trường hợp, sai số ngẫu nhiên được tích hợp từ các sai số
thành phần khác nhau, do vậy theo Định lý giới hạn trung tâm, người ta
thường coi các sai số ngẫu nhiên có phân phối chuẩn và dựa vào đó để tìm
cách khống chế hoặc làm giảm các sai số, với một trong những giải pháp là
tiến hành đo nhiều lần và lấy giá trị trung bình của các lần đo làm giá trị báo
cáo cho giá trị cần đo.
Tuy nhiên, trên thực tế không phải phép đo nào cũng có sai số với phân
phối chuẩn. Do vậy, việc dùng các công cụ của phân phối chuẩn để xác định
khoảng tin cậy của phép đo sau khi lấy giá trị trung bình sẽ có thể dẫn đến kết
luận không chính xác, sai lệch nhiều so với thực tế.
1.2.
Một trong các lớp phân phối rộng hơn phân phối chuẩn là lớp phân
phối ổn định. Đây là lớp phân phối cũng thỏa mãn Định lý giới hạn trung tâm
suy rộng, là cơ sở lý thuyết cho việc tăng độ chính xác của phép đo thông qua
2
việc lấy giá trị trung bình của nhiều lần đo làm giá trị báo cáo cho phép đo,
xác định chính xác số lần đo tương ứng với độ tin cậy cho trước. Vì vậy, việc
đưa ra các kết quả nghiên cứu về lý thuyết các phân phối ổn định (và mở rộng
của chúng là các phân phối nửa ổn định) và vận dụng các kết quả đó vào
nghiên cứu các công cụ phân tích thống kê tương ứng là rất quan trọng.
1.3.
Trong Quốc phòng việc xử lý và phân tích thông tin là vấn đề rất quan
trọng. Một trong các vấn đề cần quan tâm là công tác phân tích tín hiệu định
vị GPS cho phép xác định được vị trí của địch, giúp ta xây dựng được các
phương án bảo vệ cũng như tiêu diệt mục tiêu. Trong các phép đo đạc sử
dụng máy định vị GPS, ra đa,… người ta đều không tránh khỏi các sai số.
Việc xác định phân phối xác suất của sai số đo sẽ giúp xây dựng được phương
pháp xác định vị trí mục tiêu với độ chính xác cần thiết, với số lần đo ít nhất.
Như vậy, việc nghiên cứu sâu hơn về các vấn đề liên quan đến phân
phối xác suất ổn định trên các cấu trúc tổng quát hơn các không gian tuyến
tính, cụ thể là trên các nón lồi hoặc trên các nón lồi đặc biệt của không gian
các độ đo dương, cũng là những đề tài thực sự có ý nghĩa khoa học. Mặt khác,
việc sử dụng lý thuyết các phân phối xác suất ổn định vào nghiên cứu xử lý
thống kê đối với dữ liệu tín hiệu định vị GPS, rada, điện tử, … cũng là những
chủ đề cần quan tâm. Với các lý do trên, chúng tôi quyết định chọn đề tài
nghiên cứu cho luận án của mình là: Nghiên cứu phân phối xác suất ổn định
và ứng dụng trong thống kê.
2. Mục đích nghiên cứu
Mục tiêu thứ nhất của luận án này là đưa ra hiểu biết sâu hơn về các
đặc tính, đặc trưng của phân phối xác suất ổn định và nửa ổn định trên nón
lồi, cung cấp thêm các kết quả mới về lớp phân phối xác suất đó. Đồng thời
3
nghiên cứu các mối liên hệ giữa miền hút – miền nửa hút và giữa miền hút –
miền nửa hút với phân phối xác suất tương ứng.
Mục tiêu thứ hai của luận án là đưa ra các đặc trưng về tính ổn định của
các độ đo ngẫu nhiên, liên hệ giữa tính ổn định với tính biến đổi chính quy
đối với các độ đo ngẫu nhiên.
Mục tiêu thứ ba của luận án là áp dụng phương pháp kiểm định giả
thuyết của Kolmogorov – Smirnov về sự phù hợp của hàm phân phối xác
suất, phương pháp ước lượng tham số đối với phân phối ổn định của Nolan
với sự hỗ trợ của phần mềm SPSS, STABLE, MAPLE và EXCEL để khẳng
định số liệu tín hiệu định vị của hệ thống định vị toàn cầu GPS (Global
Positioning System) có phân phối ổn định và không có phân phối chuẩn. Từ
đó đưa ra mối liên hệ giữa khoảng tin cậy, độ tin cậy tương ứng với cỡ mẫu
tối thiểu, khi lấy giá trị trung bình làm giá trị báo cáo của phép đo.
3. Đối tượng nghiên cứu
Phân phối xác suất ổn định trên nón lồi và áp dụng lý thuyết các phân
phối xác suất ổn định vào nghiên cứu xử lý thống kê đối với dữ liệu tín hiệu
định vị GPS.
4. Phạm vi nghiên cứu
Luận án tập trung nghiên cứu các đặc trưng của phân phối xác suất ổn
định và nửa ổn định trên nón lồi liên quan đến miền hút và miền nửa hút của
chúng. Nghiên cứu các đặc trưng của độ đo xác suất trên không gian các độ
đo dương (như một trường hợp đặc biệt của nón lồi) liên quan đến tính ổn
định và tính biến đổi chính quy.
Mặt khác, áp dụng lý thuyết các phân phối xác suất ổn định và tiêu
chuẩn kiểm định Kolmogorov – Smirnov vào nghiên cứu xử lý thống kê đối
với dữ liệu tín hiệu định vị GPS.
4
5. Phương pháp nghiên cứu
Để đạt được mục tiêu nghiên cứu, nghiên cứu sinh sử dụng các phương
pháp nghiên cứu sau:
a)
Nghiên cứu các tài liệu liên quan đến các kết quả đã có về Định lý giá
trị trung tâm suy rộng, phân phối xác suất ổn định, nửa ổn định; các mối quan
hệ giữa biến ngẫu nhiên (hoặc độ đo xác suất) với tính ổn định và nửa ổn định
trên không gian tuyến tính; tính biến đổi chính quy liên hệ với miền hút của
phân phối xác suất ổn định trong không gian hữu hạn chiều.
b)
Nghiên cứu các kết quả đã có về phân phối xác suất ổn định trên nón
lồi, từ đó xác định các công cụ thích hợp cho việc nghiên cứu lý thuyết phân
phối xác suất trên nón lồi cũng như trên không gian các độ đo dương như
trường hợp đặc biệt của nón lồi.
c)
Nghiên cứu tài liệu về Giải tích điều hòa; Lý thuyết độ đo ngẫu nhiên;
Lý thuyết các độ đo xác suất trên không gian metric, để trang bị công cụ thích
hợp cho việc nghiên cứu lý thuyết xác suất trên nón lồi.
d)
Nghiên cứu tài liệu về lý thuyết thống kê liên quan đến các phương
pháp ước lượng và kiểm định, chuẩn bị các công cụ phục vụ cho phần nghiên
cứu ứng dụng.
e)
Thu thập một bộ số liệu tín hiệu định vị bằng hệ thống định vị toàn cầu
GPS.
f)
Nghiên cứu một số phương pháp ước lượng các tham số của biến ngẫu
nhiên có phân phối ổn định. Tìm hiểu các phần mềm STABLE, SPSS và
MAPLE và vận dụng các phần mềm đó vào phân tích số liệu định vị GPS.
6. Ý nghĩa khoa học và thực tiễn
Ý nghĩa khoa học:
a)
Nghiên cứu này góp phần làm phong phú hơn các kết quả và sự hiểu
biết về phân phối xác suất ổn định và nửa ổn định trên cấu trúc trừu tượng
5
hơn không gian tuyến tính là nón lồi, đưa ra mối liên hệ giữa các đặc trưng
của phân phối xác suất ổn định và nửa ổn định trên nón lồi liên quan đến miền
hút và miền nửa hút của chúng.
b)
Xác định được mối quan hệ giữa tính ổn định và tính biến đổi chính
quy của các độ đo xác suất trên không gian các độ đo dương.
c)
Giới thiệu cách áp dụng lý thuyết phân phối xác suất ổn định và tiêu
chuẩn kiểm định Kolmogorov – Smirnov vào nghiên cứu xử lý thống kê đối
với dữ liệu tín hiệu định vị GPS.
Ý nghĩa thực tiễn:
Luận án có thể được sử dụng làm tài tham khảo cho sinh viên, học viên
cao học và các nhà nghiên cứu trong ứng dụng lý thuyết phân phối xác suất
ổn định vào phân tích thống kê. Kết quả của nghiên cứu này có thể vận dụng
trong Quốc phòng để xác định chính xác vị trí mục tiêu với cỡ mẫu tối thiểu
và độ tin cậy cho trước, phục vụ cho việc ra quyết định và tiêu diệt mục tiêu,
nhất là trong thời đại chiến tranh công nghệ cao như hiện nay.
7. Cấu trúc của luận án
Ngoài phần mở đầu; kết luận; danh mục các công trình khoa học đã
công bố; tài liệu tham khảo; phụ lục, luận án được trình bày trong ba chương.
Chương 1 giới thiệu Định lý giới hạn trung tâm suy rộng liên quan đến
khái niệm phân phối xác suất ổn định; trình bày các kiến thức cơ sở phục vụ
cho nghiên cứu trong các chương sau, bao gồm các nội dung về độ đo xác
suất trên không gian metric; khái niệm cơ sở của độ đo xác suất trên nón lồi
và độ đo ngẫu nhiên; tính biến đổi chính quy của các hàm số.
Trên cơ sở các kiến thức về phân phối xác suất ổn định trên đường
thẳng thực được trình bày trong Chương 1, Luận án tiếp tục phát triển theo
hai hướng. Hướng thứ nhất nghiên cứu lý thuyết trong Chương 2, phát triển
6
các kiến thức về phân phối ổn định lên cấu trúc trừu tượng của các nón lồi.
Hướng thứ hai là nghiên cứu ứng dụng trong Chương 3, áp dụng các kiến
thức về phân phối ổn định trên đường thẳng thực vào giải quyết bài toán thực
tế liên quan đến dữ liệu định vị GPS, có tiềm năng ứng dụng vào các vấn đề
trong khoa học quốc phòng.
Chương 2 trình bày một số kết quả nghiên cứu về tính ổn định và nửa
ổn định của các độ đo xác suất trên nón lồi, cho thấy các số mũ ổn định và
nửa ổn định của độ đo xác suất là các số dương nếu và chỉ nếu phần tử trung
lập của nón lồi trùng với đỉnh của nón; một độ đo xác suất là ổn định (hoặc
nửa ổn định) nếu và chỉ nếu miền hút (miền nửa hút) của nó là khác trống.
Đồng thời chương này còn trình bày một số kết quả về đặc trưng của độ
đo ngẫu nhiên ổn định chặt và các tính chất của độ đo ngẫu nhiên thuộc vào
miền hút chặt của độ đo ngẫu nhiên ổn định chặt, liên hệ với tính biến đổi
chính quy của phép biến đổi Laplace và của độ đo ngẫu nhiên đó.
Chương 3 trình bày phương pháp ước lượng tham số của phân phối xác
suất ổn định; phương pháp kiểm định giả thuyết thống kê Kolmogorov –
Smirnov về sự phù hợp đối với phân phối xác suất ổn định và một số kết quả
ứng dụng lý thuyết phân phối xác suất ổn định vào nghiên cứu số liệu tín hiệu
định vị GPS. Cụ thể, các kết quả đó đã chỉ ra rằng số liệu tín hiệu định vị GPS
có phân phối xác suất ổn định với số mũ ổn định nhỏ hơn 2, mà không có
phân phối chuẩn. Từ đó, xác định được mối quan hệ đúng đắn giữa độ rộng
của khoảng tin cậy, độ tin cậy và cỡ mẫu tối thiểu khi lấy giá trị trung bình
làm giá trị báo cáo cho phép đo, điều này cần thiết cho việc xác định chính
xác vị trí của mục tiêu qua tín hiệu định vị GPS.
7
Chương 1
TỔNG QUAN VỀ PHÂN PHỐI XÁC SUẤT ỔN ĐỊNH
Chương này giới thiệu tổng quan về chủ đề Định lý giới hạn trung tâm
và Định lý giới hạn trung tâm suy rộng liên quan đến khái niệm phân phối xác
suất ổn định; trình bày một số kiến thức cơ sở phục vụ cho nghiên cứu trong
các chương sau như: độ đo xác suất trên không gian metric; độ đo xác suất
trên nón lồi; độ đo ngẫu nhiên; tính biến đổi chính quy của các hàm số. Các
kết quả trong chương này đều được trích dẫn từ các tài liệu tham khảo, do đó
không trình bày phần chứng minh.
Lý thuyết xác suất là một ngành Toán học hiện đại, các kết quả trong
lĩnh vực này đã có ứng dụng trong rất nhiều ngành, giúp khám phá các quy
luật của các ngành đó khi có tác động của các yếu tố ngẫu nhiên. Trong quốc
phòng, xác suất thống kê cũng là một công cụ nghiên cứu quan trọng, được sử
dụng để phân tích và xử lý số liệu, xây dựng các mô hình toán học phù hợp,
đánh giá hiệu suất chiến đấu, độ chính xác của các loại vũ khí, khí tài, độ an
toàn của các công trình, khả năng bảo mật thông tin, …
Lý thuyết xác suất ra đời vào nửa cuối thế kỷ 17 ở nước Pháp. Hai nhà
Toán học vĩ đại của nước Pháp đó là Blaise Pascal (1623 - 1662) và Pierre de
Fermat (1601 - 1665) đã trao đổi thư từ với nhau để bàn về một số bài toán
liên quan đến trò chơi may rủi. Những bài toán này và các phương pháp giải
chúng có thể xem là những nghiên cứu đầu tiên của lý thuyết xác suất. Tuy
nhiên trước đó, ở Italia các nhà Toán học Cardano (1501 – 1576), Pacioli
(1445 – 1509), Tartaglia đã giải một số bài toán riêng lẻ trong trò chơi may
rủi. Có lẽ Cardano và Huygens (1629 – 1695) là những người đầu tiên viết
8
sách về xác suất (sách của Cardano xuất bản năm 1563 và sách của Huygens
công bố năm 1657).
Lịch sử thực sự của lý thuyết xác suất bắt nguồn từ các công trình James
Bernoulli (1654 – 1705). Ông là người phát minh ra luật số lớn. Chính vì lý
do đó, ngày nay Hội Xác suất Thống kê thế giới mang tên Bernoulli. De
Moivre (1667 – 1754) là tác giả của Định lý giới hạn trung tâm (trường hợp
đối xứng), một trong những thành tựu quan trọng nhất của xác suất. Năm
1812, P.S. Laplace (1749 – 1827) công bố cuốn sách “Theorie Analytique des
Probabilities” (Lý thuyết giải tích của xác suất). Cuốn sách này được xem là
một đóng góp to lớn của Laplace trong xác suất. Ông là tác giả của Định lý
giới hạn trung tâm (trường hợp không đối xứng), và là người đầu tiên áp dụng
lý thuyết xác suất vào các vấn đề liên quan tới sai số quan sát.
1.1. Định lý giới hạn trung tâm
Định lý giới hạn trung tâm là một nội dung nghiên cứu chủ đạo xuyên
suốt quá trình ra đời và phát triển của Lý thuyết Xác suất, đóng vai trò quan
trọng không những đối với nội tại Lý thuyết Xác suất mà còn đối với Lý
thuyết Thống kê và được ứng dụng trong nhiều lĩnh vực khoa học. Có thể coi
Định lý Moivre - Laplace đưa ra năm 1812 là khởi thủy của các định lý giới
hạn trung tâm [5].
Định lý 1.1.1. [5, Định lý 2.1] Nếu { X n } là một dãy biến ngẫu nhiên độc lập
có cùng phân phối Bernoulli với tham số p (0;1) , S n X 1 ... X n thì
lim P{
n
Sn np
x} = ( x ) x ,
npq
trong đó q 1 p và ( x) là hàm phân phối xác suất của biến ngẫu nhiên
chuẩn tắc
9
1
( x)
2
x
e
t2
2 dt .
Trong định lý trên, X n là biến ngẫu nhiên nhận hai giá trị 0 và 1, tổng
S n chính là số lần thành công trong số phép thử Bernoulli, tổng này là biến
ngẫu nhiên có phân phối nhị thức với hai tham số n và p . Như vậy, Định lý
Moivre - Laplace cho thấy khi số lượng phép thử rất lớn, phân phối nhị thức
sẽ xấp xỉ phân phối chuẩn. Các Định lý giới hạn trung tâm dưới đây là phiên
bản mở rộng của Định lý Moivre - Laplace ra trường hợp các biến ngẫu nhiên
nhận nhiều hơn hai giá trị.
Định lý 1.1.2. [5, Định lý 9.1] Giả sử { X n } là dãy biến ngẫu nhiên độc lập,
với kỳ vọng E ( X n ) 0 và phương sai Var ( X n ) n2 . Ký hiệu
Sn X1 ... X n , Bn2 12 ... n2 . Lúc đó, nếu với mọi 0 ta có
1 n
lim 2 x 2dFX k ( x) 0
n B
n k 1 | x| B
n
thì
lim sup | P{
n x
Sn
x} ( x ) | 0 .
Bn
Định lý 1.1.3. [5, Hệ quả 9.2] Nếu { X n } là một dãy biến ngẫu nhiên độc lập
có cùng phân phối, kỳ vọng của X 1 là E ( X 1 ) và phương sai của X 1 là
Var ( X1 ) 2 hữu hạn thì với S n X 1 ... X n , ta có
lim sup | P{
n x
S n n
x} ( x) | 0 .
n
Định lý 1.1.4. [5, Định lý 6.5.1] Giả sử với mỗi n 1,2,... {X nk } là những
biến ngẫu nhiên độc lập, Fnk là hàm phân phối của X nk . Để có điều kiện vô
10
cùng bé đều (tức là, max P | X nk | 0, n , 0 ) và phân phối của
k 1
tổng
i)
k
X nk hội tụ yếu về phân phối chuẩn N (a, 2 ) cần và đủ là:
P | X
nk
| 0, 0 ;
k
ii)
{
k
iii)
x 2 dFnk ( x) - (
| x|
xdF
nk
( x)) 2 } 2 , 0 ;
| x|
xdF
nk
( x) a, 0 .
k | x|
Trong các Định lý giới hạn trung tâm trên đây đều đòi hỏi phương sai
của các biến ngẫu nhiên X n là hữu hạn. Cụ thể, Định lý 1.1.3 khẳng định nếu
phương sai 2 của các biến ngẫu nhiên cùng phân phối X n tồn tại thì với các
dãy hằng số chuẩn hóa
an
1
2
n
; bn
n
2
,
n
dãy tổng chuẩn hóa an Sn bn sẽ hội tụ theo phân phối đến biến ngẫu nhiên
chuẩn tắc.
Một câu hỏi được đặt ra là trong trường hợp 2 không hữu hạn có tồn
tại các hằng số an , bn để tổng chuẩn hóa an Sn bn hội tụ theo phân phối đến
một biến ngẫu nhiên không suy biến nào đó hay không? Nếu tồn tại các hằng
số an , bn và biến ngẫu nhiên Y như vậy thì Y có phân phối gì? Câu trả lời là
khi đó biến ngẫu nhiên Y có phân phối ổn định. Các vấn đề đó liên quan đến
Định lý giới hạn trung tâm suy rộng và lớp các phân phối xác suất ổn định.
1.2. Định lý giới hạn trung tâm suy rộng và phân phối xác suất ổn định
Năm 1980 J. Z. Jurek [12] đã giới thiệu kết quả nghiên cứu về các độ
đo xác suất ổn định trên không gian Euclid. Năm 1968 R. Jajte [10] đã công
bố một số kết quả khác về phân phối ổn định trên không gian Hilbert. Năm
- Xem thêm -