ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
NGUYỄN THỊ LƯU
LÝ THUYẾT JACOBIAN XẤP XỈ
Chuyên ngành: Toán Giải tích
Mã số: 60460102
LUẬN VĂN THẠC SỸ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
GS. TSKH NGUYỄN XUÂN TẤN
HÀ NỘI- 2014
Mục lục
Lời nói đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 Hàm khả vi
3
7
1.1
Hàm khả vi từ R đến R . . . . . . . . . . . . . . . . . . . . .
7
1.2
Hàm khả vi từ Rn đến R . . . . . . . . . . . . . . . . . . . . .
9
1.2.1
Các định nghĩa và tính chất . . . . . . . . . . . . . . .
9
1.2.2
Các phép tính đạo hàm . . . . . . . . . . . . . . . . .
13
Hàm khả vi từ Rn đến Rm . . . . . . . . . . . . . . . . . . . .
14
1.3.1
Các định nghĩa và tính chất . . . . . . . . . . . . . . .
14
1.3.2
Phép tính của đạo hàm . . . . . . . . . . . . . . . . .
16
Bài toán tối ưu trơn . . . . . . . . . . . . . . . . . . . . . . .
17
1.4.1
Bài toán trơn không có ràng buộc . . . . . . . . . . .
17
1.4.2
Bài toán trơn với ràng buộc đẳng thức . . . . . . . . .
18
1.3
1.4
2 Jacobian xấp xỉ
20
2.1
Jacobian xấp xỉ của hàm thực mở rộng . . . . . . . . . . . . .
20
2.2
Phép tính Jacobian xấp xỉ . . . . . . . . . . . . . . . . . . . .
32
2.2.1
Phép nhân vô hướng . . . . . . . . . . . . . . . . . . .
32
2.2.2
Phép cộng . . . . . . . . . . . . . . . . . . . . . . . . .
33
2.2.3
Phép lấy maximum . . . . . . . . . . . . . . . . . . . .
34
2.2.4
Định lý giá trị trung bình . . . . . . . . . . . . . . . .
35
1
2.2.5
Jacobian xấp xỉ của hàm hợp . . . . . . . . . . . . . .
40
2.3
Jacobian xấp xỉ của hàm vectơ . . . . . . . . . . . . . . . . .
42
2.4
Hessian xấp xỉ . . . . . . . . . . . . . . . . . . . . . . . . . .
58
2.4.1
Hessian xấp xỉ của hàm vô hướng . . . . . . . . . . . .
58
2.4.2
Hessian xấp xỉ của hàm vectơ . . . . . . . . . . . . . .
62
3 Ứng dụng của Jacobian xấp xỉ
64
3.1
Nón và các khái niệm liên quan . . . . . . . . . . . . . . . . .
65
3.2
Điều kiện tối ưu cấp hai cho bài toán tối ưu vectơ . . . . . .
67
3.2.1
Bài toán tối ưu không ràng buộc . . . . . . . . . . . .
67
3.2.2
Bài toán tối ưu có ràng buộc . . . . . . . . . . . . . .
73
Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . .
80
2
LỜI NÓI ĐẦU
Vào nửa sau thế kỷ XVII, đồng thời và độc lập, nhà toán học người Đức
là Leibniz và nhà toán học người Anh là Newton đã phát minh ra phép tính
vi phân, một công cụ đắc lực để giải nhiều bài toán trong vật lý, cơ học, hóa
học, kỹ thuật . . . Nhưng phép tính vi phân mà Leibniz và Newton phát minh
ra chỉ áp dụng được cho các lớp hàm có tính chất khá tốt.
Một vấn đề đặt ra là đối với các hàm không khả vi, vì đạo hàm của chúng
không tồn tại nên có thể thay thế khái niệm đạo hàm bằng khái niệm khác
được không? Đây là vấn đề nghiên cứu của nhiều nhà toán học vào nửa cuối
thế kỷ XX. Từ đó, môn giải tích không trơn ra đời. Môn học này đã giải
quyết các bài toán trên các lớp hàm không có đạo hàm theo nghĩa thông
thường, bằng cách đưa ra các khái niệm dưới vi phân khác nhau để thay thế
khái niệm đạo hàm, tại một điểm cho trước hàm được xấp xỉ bởi một họ các
hàm tuyến tính.
Từ những năm cuối của thế kỷ XX, đầu thế kỷ XXI, V. Jeyakumar và D.
T. Lục đã đưa ra khái niệm mới về dưới vi phân và gọi là Jacobian xấp xỉ cho
các hàm liên tục. Khái niệm này cho ta một công cụ hữu ích để nghiên cứu
những bài toán về hàm liên tục. Jacobian xấp xỉ có những phép tính khá tốt,
tương ứng với các phép tính của đạo hàm thông thường như phép lấy tích,
tổng, hợp, định lý giá trị trung bình . . . Đặc biệt, nhiều dưới vi phân cũng là
Jacobian xấp xỉ như dưới vi phân của hàm lồi, hàm Lipschitz và nhiều dưới
vi phân khác như của Michel - Penot, Moduchovich . . . Vì vậy, những kết
quả thu được bằng sử dụng Jacobian xấp xỉ cũng đúng cho các hàm có dưới
vi phân này. Hơn nữa, hàm Lipschitz địa phương có thể có một Jacobian xấp
3
xỉ mà bao lồi của nó là chứa thật sự trong dưới vi phân suy rộng Clarke.
Khác với những dưới vi phân đã đề cập đến, Jacobian xấp xỉ ở đây chỉ là
tập đóng, không nhất thiết bị chặn hoặc lồi. Nhờ tính không lồi và không
bị chặn mà ta có thể dùng để đặc trưng một số tính chất của hàm liên tục
như tính Lipschitz địa phương, tính lồi, tính đơn điệu . . . Việc nghiên cứu
Jacobian xấp xỉ đã mở rộng, thống nhất và làm sâu sắc nhiều kết quả trong
giải tích không trơn và tối ưu hóa. Lý thuyết Jacobian xấp xỉ đang là đề tài
được nhiều nhà toán học quan tâm nghiên cứu.
Trong phạm vi luận văn cao học, tác giả tập trung trình bày có hệ thống
một số kết quả về Jacobian xấp xỉ của một hàm liên tục trong không gian
hữu hạn chiều, trước hết là hàm vô hướng, tiếp theo là hàm vectơ dựa trên
cơ sở các kết quả mà V. Jeyakumar và D. T. Lục và các cộng sự đã nghiên
cứu. Với nội dung này, bản luận văn được bố cục như sau:
Chương 1 trình bày các kiến thức cơ bản về hàm vô hướng và hàm vectơ
nhiều biến khả vi như: Các khái niệm, tính chất, phép toán và ứng dụng của
nó trong bài toán cực trị.
Chương 2 trình bày các khái niệm, tính chất và các phép tính về Jacobian
xấp xỉ của hàm thực mở rộng, hàm vectơ. Phần cuối của chương trình bày
khái niệm Hessian xấp xỉ và công thức Taylor đối với hàm khả vi liên tục.
Chương 3 trình bày ứng dụng của Jacobian xấp xỉ trong bài toán tối ưu.
Ở đây, ta đưa ra một số điều kiện cần và đủ cấp hai cho bài toán tối ưu với
hàm vectơ khả vi liên tục trong không gian hữu hạn chiều.
Trong quá trình thực hiện luận văn thạc sĩ, tác giả đã nhận được sự giúp
đỡ, tạo điều kiện nhiệt tình và quý báu của nhiều cá nhân, tập thể.
Lời đầu tiên, tác giả xin được bày tỏ lòng biết ơn sâu sắc tới thầy giáo
GS. TSKH Nguyễn Xuân Tấn, người thầy đã trực tiếp hướng dẫn, chỉ bảo
tận tình và giúp đỡ tác giả trong suốt quá trình làm luận văn này.
Tác giả xin được gửi lời cảm ơn chân thành tới các thầy cô giáo trong nhà
4
trường, đặc biệt là các thầy cô giáo chuyên ngành Giải tích, khoa Toán - Cơ
- Tin học, trường Đại học Khoa học Tự Nhiên - Đại học Quốc Gia Hà Nội
đã tận tình giúp đỡ tác giả trong suốt thời gian theo học, thực hiện và hoàn
thành luận văn.
Cuối cùng, tác giả xin được gửi lời cảm ơn đến người thân, gia đình, bạn
bè đã luôn động viên giúp đỡ và tạo điều kiện cho tác giả trong suốt thời
gian học tập và hoàn thành luận văn của mình.
Hà Nội, tháng 11 năm 2014
Nguyễn Thị Lưu
5
Bảng kí hiệu
R = R ∪ {±∞}
L(Rn , Rm ) : không gian các ánh xạ tuyến tính liên tục từ Rn vào Rm
Bn : hình cầu đơn vị trong Rn
Bm×n : hình cầu đơn vị trong L(Rn , Rm )
coA : bao lồi của tập A
coA : bao lồi đóng của tập A
Int(A) : phần trong của tập A
Ext(A) : điểm cực biên của tập A
5f (a) : vectơ gradient của f tại a
Df (a) : đạo hàm của hàm vectơ f tại a
fd+ (x, v) : đạo hàm Dini trên
fd− (x, v) : đạo hàm Dini dưới
f 0 (x, v) : đạo hàm theo hướng
f ◦ (x, v) : đạo hàm suy rông Clarke
f (x, v) : đạo hàm trên Michel-Penot
∂ ◦ f (x0 ) : gradient suy rộng Clarke của f tại x0
∂ f (x0 ) : dưới vi phân Michel-Penot
∂ 2 f (x) : Hessian xấp xỉ
coneC : nón sinh bởi C
C 0 : nón cực của nón C
T1 (D, x0 ) : nón tiếp tuyến cấp 1 của D tại x0
T2 (D, x0 ) : nón tiếp tuyến cấp 2 của D tại x0
min(A \ C) hoặc min(A): tập các điểm hữu hiệu của A đối với nón C
W M in(A\C) hoặc W M in(A): tập các điểm hữu hiệu yếu của A đối với nón C
6
Chương 1
Hàm khả vi
Trong cuộc sống, nhất là trong các ngành kỹ thuật và kinh tế . . . chúng
ta thường gặp những bài toán được quy về bài toán dạng min f (x), trong đó
x∈D
n
D là một tập trong không gian R , f là một hàm số xác định trên D. Thông
thường, hàm f có nhiều tính chất. Ta cần tìm ra những tính chất quan trọng
để bài toán trên có nghiệm và thuật toán giải ra nghiệm. Ta xét một lớp hàm
như vậy, đó là các lớp hàm khả vi.
Trong chương này ta sẽ nhắc lại một số kiến thức cơ bản về hàm khả vi
trong phép tính vi phân của hàm nhiều biến.
1.1
Hàm khả vi từ R đến R
Định nghĩa 1.1.1. Cho hàm f : (a, b) ⊂ R −→ R.
Hàm f được gọi là khả vi tại điểm x0 ∈ (a, b) nếu tồn tại giới hạn
lim
x→x0
f (x) − f (x0 )
.
x − x0
Khi đó, đặt
A = lim
x→x0
f (x) − f (x0 )
x − x0
7
thì A được gọi là đạo hàm của hàm f tại điểm x0 , ký hiệu là f 0 (x0 ).
Nếu hàm f khả vi tại mọi điểm x ∈ (a, b), ta nói rằng f khả vi trong
khoảng (a, b).
Định lý 1.1.1. [1] Cho f, g : (a, b) ⊂ R → R là các hàm khả vi tại x0 ∈ (a, b).
Khi đó các hàm f ± g, cf (c bất kỳ thuộc R), f · g và
f
g
nếu g(x0 ) 6= 0 là các
hàm khả vi tại x0 và ta có
i)
ii)
iii)
iv)
(f ± g)0 (x0 ) = f 0 (x0 ) ± g 0 (x0 );
(cf )0 (x0 ) = cf 0 (x0 );
(f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 );
0
f
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) =
.
g
g 2 (x0 )
Định lý 1.1.2 (Đạo hàm của hàm hợp). Cho (a, b), (c, d) ⊂ R và các hàm
f : (a, b) → (c, d), g : (c, d) → R. Giả sử f khả vi tại x0 ∈ (a, b) và g khả vi
tại y0 = f (x0 ) ∈ (c, d). Khi đó, hàm hợp g · f khả vi tại x0 và
(g.f )0 (x0 ) = g 0 [f (x0 )]f 0 (x0 ).
Định lý 1.1.3 (Đạo hàm của hàm ngược). Giả sử rằng
1)
Hàm số f : (a, b) → R liên tục và đơn điệu thực sự trong (a, b).
2)
f có đạo hàm f 0 (x0 ) 6= 0 tại x0 ∈ (a, b).
Khi đó hàm ngược g = f −1 của hàm f có đạo hàm tại điểm y0 = f (x0 ) và
g 0 (y0 ) =
1
f 0 (x0 ) .
Định lý 1.1.4 (Định lý giá trị trung bình). Giả sử rằng hàm số f : [a, b] → R
có các tính chất:
1)
f liên tục trên [a, b];
2)
f khả vi trong (a, b);
Khi đó tồn tại ít nhất một điểm c ∈ (a, b) sao cho f (b) − f (a) = f 0 (c)(b − a).
8
1.2
Hàm khả vi từ Rn đến R
1.2.1
Các định nghĩa và tính chất
Cho U là tập mở trong Rn , hàm f : U → R, a = (a1 , a2 , . . . , an ), a ∈ U .
Ta ký hiệu L(Rn , R) là không gian các hàm tuyến tính liên tục từ Rn đến R.
Định nghĩa 1.2.1. Hàm f được gọi là khả vi tại điểm a nếu tồn tại một
hàm tuyến tính liên tục L ∈ L(Rn , R) sao cho
f (a + h) − f (a) = L(h) + (h)||h||,
trong đó h = (h1 , h2 , . . . , hn ) ∈ Rn , (h) → 0 khi h → 0.
Hàm tuyến tính liên tục L được gọi là đạo hàm của f tại a, ký hiệu là f 0 (a)
hay Df (a).
Hàm f được gọi là khả vi trong U nếu nó khả vi tại mọi x ∈ U .
Định lý 1.2.1. [2] Nếu f khả vi tại a thì đạo hàm tương ứng được xác định
duy nhất.
Định lý 1.2.2. [2] Nếu f khả vi tại a thì f liên tục tại a.
Định nghĩa 1.2.2. Ta nói f khả vi theo hướng v ∈ Rn tại a nếu tồn tại giới
hạn
f (a + tv) − f (a)
.
t→0
t
lim
Khi đó, giới hạn này được gọi là đạo hàm của f theo hướng v tại a, ký hiệu
là f 0 (a, v).
Trường hợp đặc biệt, nếu v là một vectơ trong cơ sở chính tắc {e1 , e2 , . . . , en }
của Rn (~v = e~1 = (1, 0, . . . , 0) hoặc e~2 = (0, 1, . . . , 0)) ta có khái niệm sau.
Định nghĩa 1.2.3. Nếu f 0 (a, ei ) tồn tại thì được gọi là đạo hàm riêng thứ i
của hàm f tại a, hay đạo hàm riêng theo biến xi của hàm f tại a và ký hiệu
là
∂f
∂xi (a)
hay Di f (a) hoặc fx0 i (a).
9
Ta có mối quan hệ giữa đạo hàm, đạo hàm riêng và đạo hàm theo hướng
như sau.
Định lý 1.2.3. [1] Nếu f khả vi tại a ∈ U thì f có đạo hàm riêng theo mọi
biến tại a và
n
X
∂f
f (a)(h) =
(a)hi ,
∂x
i
i=1
0
trong đó h = (h1 , h2 , . . . , hn ) ∈ Rn .
Từ định lý này ta suy ra f 0 (a) là hàm tuyến tính được xác định bởi ma
∂f
∂f
∂f
trận cấp 1×n, đó là ma trận ∂x
(a),
(a),
.
.
.
,
(a)
và như vậy cũng có
∂x2
∂xn
1
thể xem f 0 (a) như một vectơ của không gian Rn và được gọi là vectơ gradient
của f tại a, ký hiệu là 5f (a).
Định lý 1.2.4. [1] Nếu hàm f có các đạo hàm riêng
∂f
∂f
∂f
∂x1 (x), ∂x2 (x), . . . , ∂xn (x)
trong một lân cận nào đó của điểm a = (a1 , a2 , . . . , an ) và chúng là các hàm
số liên tục tại a thì hàm f khả vi tại a và
n
X
∂f
f (a)(h) =
(a)hi ,
∂x
i
i=1
0
trong đó h = (h1 , h2 , . . . , hn ) ∈ Rn .
Định lý 1.2.5. [1] Nếu f khả vi tại a thì nó có đạo hàm theo mọi hướng tại
a và
n
X
∂f
f (a, v) = f (a)(v) =
(a)vi = h5f (a), vi,
∂xi
i=1
0
0
trong đó v = (v1 , v2 , . . . , vn ) ∈ Rn .
Cho U là tập mở trong Rn , hàm f : U → R, a = (a1 , a2 , . . . , an ) ∈ U . Giả
sử Di f (x) tồn tại ∀x ∈ U , như thế ta có ánh xạ
Di f : U → R
x 7→ Di f (x).
10
Định nghĩa 1.2.4. Nếu hàm Di f có đạo hàm theo biến thứ j tại a tức là
nếu tồn tại Dj (Di f )(a) thì đạo hàm này được gọi là đạo hàm riêng cấp hai
của f tại a theo các biến thứ i và thứ j hay theo các biến xi và xj và được
ký hiệu là Dij f (a) hay
∂2f
∂xi ∂xj (a).
Định lý 1.2.6. [1][Schwarz] Giả sử U là tập mở trong Rn , a ∈ U, f : U → R.
Nếu
∂2f
∂xi ∂xj (x)
và
∂2f
∂xj ∂xi (x)
tồn tại trên U và liên tục tại a thì ta có
∂2f
∂2f
(a) =
(a).
∂xi ∂xj
∂xj ∂xi
Bằng quy nạp ta có thể định nghĩa đạo hàm riêng các cấp theo các biến.
Áp dụng liên tiếp Định lý 1.2.6 ta suy ra, nếu f có các đạo hàm riêng liên
tục đến cấp k trên U thì các đạo hàm riêng
∂pf
∂xi1 ∂xi2 ...∂xip (a), (p
≤ k) không
phụ thuộc vào thứ tự các biến lấy đạo hàm. Chúng luôn được viết dưới dạng
chính tắc
∂ |α| f
(a),
∂xα11 ∂xα22 . . . ∂xαnn
α = (α1 , α2 , . . . , αn ) là bộ n số nguyên không âm, |α| = α1 +α2 +· · ·+αn = p.
Giả sử f khả vi trong U . Ta có ánh xạ
f 0 : U → L(Rn , R)
x 7→ f 0 (x).
Định nghĩa 1.2.5. Ta có
i) Hàm f được gọi là khả vi liên tục hay thuộc lớp C 1 trên U , ký hiệu là
f ∈ C 1 (U ) nếu f 0 liên tục.
ii) Hàm f được gọi là khả vi cấp hai tại a nếu f 0 khả vi tại a, tức là tồn tại
một ánh xạ tuyến tính B : Rn → L(Rn , R) sao cho
||f 0 (a + h) − f 0 (a) − B(h)|| = (h)||h||,
trong đó h = (h1 , h2 , . . . , hn ) ∈ Rn , (h) → 0 khi ||h|| → 0.
Ánh xạ B nếu tồn tại là duy nhất và được gọi là đạo hàm của f 0 tại a hay
11
đạo hàm cấp 2 của f tại a, ký hiệu f 00 (a) hay D2 f (a).
iii) Hàm f được gọi là khả vi cấp hai trên U nếu f khả vi cấp hai tại mọi
x ∈ U.
Khi đó, nếu ánh xạ f 00 : x → f 00 (x) là liên tục thì f được gọi là khả vi cấp
hai liên tục hay thuộc lớp C 2 trên U , ký hiệu là f ∈ C 2 (U ).
Định lý 1.2.7. [1] Giả sử hàm f khả vi cấp hai tại a. Khi đó f 00 (a) là ánh
xạ song tuyến tính đối xứng từ Rn × Rn vào R.
Bằng quy nạp ta có thể định nghĩa hàm khả vi cấp p, đạo hàm cấp p của
f tại a, ký hiệu là f (p) (a) hay Dp f (a), hàm khả vi liên tục cấp p hay thuộc
lớp C p trên U . Nếu f khả vi cấp p tại a thì f (p) (a) là ánh xạ p - tuyến tính
đối xứng từ Rn × Rn × · · · × Rn p lần vào R. Khi f khả vi cấp p tại a, ta sẽ
viết Dp f (a)(hp ) thay cho Dp f (a)(h, h, . . . , h).
Định lý 1.2.8. [3] Giả sử f khả vi cấp hai tại a. Khi đó, f có tất cả các đạo
n
P
∂2f
00
hàm riêng cấp hai tại a và f 00 (a)(h, k) =
∂xi ∂xj (a)hi kj . Như vậy f (a)
i=1
được xác định bởi ma trận vuông cấp n như sau
2
∂2f
∂ f
∂2f
. . . ∂x1 ∂xn (a)
2 (a)
∂x1 ∂x2 (a)
∂x2 1
2
∂ f
∂ f
∂2f
. . . ∂x2 ∂xn (a)
∂x1 ∂x2 (a)
2 (a)
∂x
2
..
..
..
.
.
.
.
.
.
∂2f
∂xn ∂x2 (a)
∂2f
∂xn ∂x1 (a)
...
∂2f
∂x2n (a)
Ma trận này được gọi là ma trận Hessian của f tại a.
Tổng quát hơn ta có.
Định lý 1.2.9. [3] Giả sử f khả vi cấp p tại a. Khi đó f có tất cả các đạo
hàm riêng cấp p tại a và
f (p) (a)(hp ) =
X
|α|=p
∂ |α| f
α1
αn
α1
αn (a)h1 . . . hn ,
∂x1 . . . ∂xn
với h = (h1 , h2 , . . . , hn ) ∈ Rn .
12
1.2.2
Các phép tính đạo hàm
Thông qua các phép tính đạo hàm chúng ta tính đạo hàm của các hàm
phức tạp dựa trên đạo hàm của các hàm đơn giản và tính được gần đúng giá
trị của đạo hàm.
1) Phép nhân vô hướng
Định lý 1.2.10. Giả sử hàm f : U → R khả vi tại a, λ ∈ R. Khi đó hàm λf
cũng khả vi tại a và
(λf )0 (a) = λf 0 (a).
2) Phép cộng
Định lý 1.2.11. [3] Giả sử các hàm f, g : U → R khả vi tại a. Khi đó, hàm
f + g cũng khả vi tại a và
(f + g)0 (a) = f 0 (a) + g 0 (a).
3) Định lý giá trị trung bình
Ta gọi một đoạn trong Rn với hai đầu mút a, b ∈ Rn là tập hợp
[a, b] = {ta + (1 − t)b, 0 ≤ t ≤ 1}.
Định lý 1.2.12. Giả sử U là tập mở trong Rn , [a, b] ⊂ U, f : U → R là một
hàm khả vi trên R. Khi đó, tồn tại c ∈ [a, b] sao cho
f (b) − f (a) = f 0 (c)(b − a).
4) Đạo hàm của hàm hợp
Định lý 1.2.13. [3] Cho U là tập mở trong Rn và hàm f : U → Rm với
f = (f1 , f2 , . . . , fn ). Giả sử với mỗi i = 1, 2, . . . , m hàm fi khả vi tại a ∈ U ,
V là tập mở chứa f (a) trong Rm , hàm g : V → R khả vi tại f (a). Khi đó,
hàm h = g ◦ f : U → R khả vi tại a và
0
h0 (a) = g 0 (f (a))(f10 (a), f20 (a), . . . , fm
(a)).
13
(1.1)
Vế phải của (1.1) là
0
D1 g(f (a)).f10 (a) + D2 g(f (a)).f20 (a) + · · · + Dm g(f (a)).fm
(a),
với Dm g(f (a)) là đạo hàm riêng theo biến thứ m của g(f (a)).
5) Công thức Taylor
Định lý 1.2.14. [1] Giả sử U là tập mở trong Rn , a ∈ U, f : U → R, f thuộc
lớp C k (U ). Khi đó, ∀h ∈ Rn với ||h|| khá nhỏ, ta có
1
1
1
Df (a)(h)+ D2 f (a)(h2 )+· · ·+ Dk f (a)(hk )+0(||h||k ),
1!
2!
k!
ik
h
∂
∂
k
k
trong đó D f (a)(h ) = h1 ∂x1 + · · · + hn ∂xn f (a).
f (a+h) = f (a)+
1.3
Hàm khả vi từ Rn đến Rm
Trong mục này, ta sẽ trình bày các khái niệm và các kết quả được mở
rộng từ hàm vô hướng khả vi cho hàm vectơ khả vi.
1.3.1
Các định nghĩa và tính chất
Cho U là tập mở trong Rn , f : U → Rm là hàm vectơ, a ∈ U, f =
(f1 , f2 , . . . , fm ). Ký hiệu L(Rn , Rm ) là không gian các ánh xạ tuyến tính liên
tục từ Rn vào Rm .
Định nghĩa 1.3.1. [1] Hàm f được gọi là khả vi tại điểm a nếu tồn tại một
ánh xạ tuyến tính A ∈ L(Rn , Rm ) sao cho
||f (a + h) − f (a) − A(h)||
= 0,
h→0
||h||
lim
hay
||f (a + h) − f (a) − A(h)|| = (h)(||h||),
trong đó h = (h1 , h2 , . . . , hn ) ∈ Rn , (h) → 0 khi ||h|| → 0.
14
Ánh xạ tuyến tính A được gọi là đạo ánh hay đạo hàm của hàm vectơ f
tại a, ký hiệu là f 0 (a) hay Df (a).
Nếu f khả vi tại mọi điểm a ∈ U thì ta nói f khả vi trong U .
Định lý 1.3.1. [1] Nếu f khả vi tại a thì đạo hàm tương ứng được xác định
duy nhất.
Định lý 1.3.2. [1] Nếu f khả vi tại a thì f liên tục tại a.
Ta có điều kiện cần và đủ về tính khả vi của hàm f như sau.
Định lý 1.3.3. [1] Hàm f khả vi tại a khi và chỉ khi mỗi hàm thành phần
fi , i = 1, 2, . . . , m khả vi tại a. Khi đó, ma trận của ánh xạ tuyến tính Df (a) :
Rn → Rm là
D1 f1 (a)
D2 f1 (a)
...
D1 f2 (a) D2 f2 (a) . . .
..
..
.
.
...
D1 fm (a) D2 fm (a) . . .
Dn f1 (a)
Dn f2 (a)
..
.
Dn fm (a)
Ma trận này được gọi là ma trận Jacobian của hàm f tại a, ký hiệu là
Jf (a).
Cũng như hàm vô hướng, đối với hàm vectơ ta cũng có các khái niệm
được định nghĩa tương tự như: hàm khả vi cấp p, đạo hàm cấp p, hàm khả
vi liên tục cấp p và nếu f khả vi cấp p tại a thì f (p) (a) là ánh xạ p - tuyến
tính từ Rn × Rn × · · · × Rn , p lần vào Rm .
Lấy v ∈ Rm bất kỳ. Khi đó, ta có định nghĩa hàm (vf ) : Rn → R như sau
(vf )(x) := hv, f (x)i =
n
X
vi fi (x).
i=1
Rõ ràng nếu f khả vi tại a thì vf cũng khả vi tại a.
Theo Định lý 1.2.5 ta có
(vf )0 (a, u) = h(vf )0 (a), ui = hf 0 (a)(u), vi,
15
∀v ∈ Rm , u ∈ Rn .
1.3.2
Phép tính của đạo hàm
1) Phép nhân vô hướng
Định lý 1.3.4. [2] Giả sử hàm f : U → Rm khả vi tại a, λ ∈ R. Khi đó, hàm
λf cũng khả vi tại a và
(λf )0 (a) = λf 0 (a).
2) Phép cộng
Định lý 1.3.5. [2] Giả sử f, g : U → Rm khả vi tại a. Khi đó, f + g cũng
khả vi tại a và
(f + g)0 (a) = f 0 (a) + g 0 (a).
3) Định lý giá trị trung bình
Định lý 1.3.6. [2] cho U là tập mở trong Rn , [a, b] ⊂ U , và f : U → Rm là
một hàm khả vi trên U . Khi đó
||f (b) − f (a)|| ≤ sup ||f 0 (x)||.||b − a||.
x∈[a,b]
4) Đạo hàm của hàm hợp
Định lý 1.3.7. Cho U ⊂ Rn , V ⊂ Rm là các tập mở, f : U → Rm , g :
V → Rp tương ứng là các hàm khả vi tại a ∈ U và f (a) ∈ V . Khi đó, hàm
h = g ◦ f : U → Rp khả vi tại a và
h0 (a) = g 0 (f (a)) ◦ f 0 (a).
16
5) Công thức Taylor
Định lý 1.3.8. [3] Cho U là tập mở trong Rn , f : U → Rm , a = (a1 , a2 , . . . , an ) ∈
U . Giả sử f khả vi cấp p − 1 trong U và khả vi cấp p tại a. Khi đó ∀h ∈ Rn
với ||h|| đủ nhỏ, ta có
||f (a + h) − f (a) −
1.4
1
1
Df (a)(h) − · · · − Dp f (a)(hp )|| = 0(||h||p ).
1!
p!
Bài toán tối ưu trơn
Trong mục này, bằng việc ứng dụng đạo hàm, ta sẽ đưa ra các điều kiện
cực trị cho lớp bài toán trơn.
Cho bài toán
min f (x),
x∈D
(P )
trong đó f : Rn → R là hàm mục tiêu, D ⊂ Rn là tập ràng buộc. Nếu f là
hàm khả vi thì bài toán (P) được gọi là bài toán tối ưu khả vi hay tối ưu
trơn.
Định nghĩa 1.4.1. Điểm x◦ ∈ D được gọi là cực tiểu địa phương của (P )
nếu tồn tại lân cận U của x◦ sao cho
f (x◦ ) ≤ f (x) ∀x ∈ U ∩ D.
Điểm x◦ ∈ D được gọi là cực tiểu toàn cục của (P ) nếu
f (x◦ ) ≤ f (x) ∀x ∈ D.
Dưới đây, ta sẽ đưa ra các điều kiện cần và đủ tối ưu cho bài toán không
có ràng buộc và bài toán với ràng buộc đẳng thức.
1.4.1
Bài toán trơn không có ràng buộc
Xét bài toán
min f (x).
x∈Rn
17
(P1 )
Ta có
Điều kiện cần
Giả sử f khả vi tại x◦ , x◦ là điểm cực tiểu địa phương của (P1 ). Khi đó,
Df (x◦ ) = 0.
Các điểm thỏa mãn Df (x) = 0 gọi là điểm dừng.
Điều kiện đủ
Giả sử trong một lân cận nào đó của điểm dừng x◦ hàm f khả vi cấp hai và
tất cả các đạo hàm riêng cấp hai liên tục tại x◦ .
Khi đó, nếu D2 f (x◦ )(h2 ) > 0 với ∀h ∈ Rn , h 6= 0 thì x◦ là cực tiểu địa phương
của bài toán (P1 ).
1.4.2
Bài toán trơn với ràng buộc đẳng thức
Xét bài toán
min f (x),
x∈D
(P2 )
trong đó D = {x ∈ Rn , φi (x) = 0, i = 1, m}, f, φi : Rn → R. Với các bài
toán có ràng buộc, một công cụ hữu ích được sử dụng rộng rãi khi nghiên
cứu là hàm Lagrange.
Hàm Lagrange của bài toán (P2 ) được thiết lập như sau
L(x, λ) := f (x)+λ1 φ1 (x)+...+λm φm (x),
x ∈ D, λ = (λ1 , λ2 , . . . , λm ) ∈ Rm .
Khi đó, bài toán (P2 ) được đưa về bài toán tối ưu không ràng buộc với hàm
mục tiêu là hàm Lagrange.
Ta có điều kiện cần và đủ của bài toán (P2 ) như sau.
Điều kiện cần
Giả sử x◦ là cực tiểu địa phương của (P2 ). Hàm f và hàm φi (i = 1, m)
khả vi liên tục trong một lân cận của x◦ và Dφ1 (x◦ ), Dφ2 (x◦ ), . . . , Dφm (x◦ )
18
độc lập tuyến tính. Khi đó, tồn tại λ∗ = (λ∗1 , λ∗2 , . . . , λ∗m ) sao cho
L0x (x◦ , λ∗ ) = 0,
hay Df (x◦ ) + λ∗1 Dφ1 (x◦ ) + · · · + λ∗m Dφm (x◦ ) = 0.
Điểm x◦ ∈ D gọi là điểm dừng ứng với giá trị λ◦ = (λ◦1 , λ◦2 , . . . , λ◦m ) nếu
L0x (x◦ , λ◦ ) = 0.
Điều kiện đủ
Giả sử trong một lân cận nào đó của điểm dừng x◦ ứng với giá trị λ◦ ,
hàm f và mọi hàm φi (i = 1, m) khả vi cấp hai và có tất cả các đạo hàm riêng
cấp hai liên tục tại x◦ .
Nếu L0x (x◦ , λ◦ )(h2 ) > 0, ∀h ∈ Rn , h 6= 0 thì x◦ là điểm cực tiểu địa phương
của (P2 ).
Như vậy, đối với hàm khả vi, ta đã trình bày được một số tính chất và phép
toán cơ bản. Bên cạnh đó, bằng việc ứng dụng đạo hàm ta đã đưa ra điều
kiện cực trị cho lớp bài toán trơn.
19
- Xem thêm -