Đăng ký Đăng nhập
Trang chủ Về bài toán tối ưu trong học độ tương tự...

Tài liệu Về bài toán tối ưu trong học độ tương tự

.PDF
41
1
96

Mô tả:

.. ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC KHOA HỌC ------------------------------- TRẦN VĂN PHƢỢNG VỀ BÀI TOÁN TỐI ƢU TRONG HỌC ĐỘ TƢƠNG TỰ LUẬN VĂN THẠC SĨ TOÁN HỌC THÁI NGUYÊN - 2019 ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC KHOA HỌC ------------------------------- TRẦN VĂN PHƢỢNG VỀ BÀI TOÁN TỐI ƢU TRONG HỌC ĐỘ TƢƠNG TỰ Chuyên ngành: Toán ứng dụng Mã số : 8 46 01 12 LUẬN VĂN THẠC SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC TS. Nguyễn Thanh Sơn THÁI NGUYÊN - 2019 iii Möc löc B£ng kþ hi»u 1 Mð ¦u 2 Ch÷ìng 1 B i to¡n tèi ÷u trong khæng gian húu h¤n chi·u 6 1.1 Sì l÷ñc v· b i to¡n tèi ÷u 6 1.1.1 B i to¡n tèi ÷u . . . . . . . . . . . . . . . . . . . . 6 1.1.2 Kh¡i qu¡t b i to¡n tèi ÷u câ r ng buëc . . . . . . . 8 1.1.3 Tèi ÷u h m möc ti¶u bªc hai vîi r ng buëc b§t ¯ng thùc 1.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Mët sè ph÷ìng ph¡p gi£i b i to¡n tèi ÷u 1.2.1 Ph÷ìng ph¡p Newton . . . . . . . . . . . . . . . . . 11 1.2.2 Ph÷ìng ph¡p gi£m s¥u nh§t . . . . . . . . . . . . . 13 1.2.3 Ph÷ìng ph¡p h m ch­n logarith . . . . . . . . . . . 15 1.2.4 Ph÷ìng ph¡p chi¸u gradient . . . . . . . . . . . . . 18 Ch÷ìng 2 B i to¡n håc ë t÷ìng tü 2.1 2.2 . . . . . . . . . . 11 21 B i to¡n håc ë t÷ìng tü v  c¡c ki¸n thùc li¶n quan . . . . 21 2.1.1 Mët sè ki¸n thùc li¶n quan . . . . . . . . . . . . . . 21 2.1.2 B i to¡n håc ë t÷ìng tü . . . . . . . . . . . . . . . 25 2.1.3 T½nh lçi cõa b i to¡n . . . . . . . . . . . . . . . . . 26 2.1.4 Kho£ng c¡ch Mahalanobis . . . . . . . . . . . . . . 27 Ph÷ìng ph¡p gi£i b i to¡n håc ë t÷ìng tü . . . . . . . . . 28 2.2.1 Tr÷íng hñp kho£ng c¡ch Euclide câ trång sè . . . . 28 iv 2.2.2 Ph÷ìng ph¡p chi¸u gradient cho b i to¡n håc ë t÷ìng tü . . . . . . . . . . . . . . . . . . . . . . . . 29 2.2.3 V½ dö sè . . . . . . . . . . . . . . . . . . . . . . . . 32 K¸t luªn T i li»u tham kh£o 36 37 B£ng kþ hi»u H khæng gian Hilbert thüc ∇f gradient cõa h m sè, grad ∇2 f Hessian cõa h m sè kAk chu©n Euclid cõa ma trªn λ(A) c¡c gi¡ trà ri¶ng cõa A≥0 ma trªn nûa x¡c ành d÷ìng A>0 ma trªn x¡c ành d÷ìng x∗ iºm cüc tiºu hay cüc tiºu f (x∗ ) gi¡ trà cüc tiºu f f v  l  ma trªn cï A A n×n 2 Mð ¦u Th¸ giîi ang b÷îc v o Cuëc c¡ch m¤ng khoa håc l¦n thù t÷ vîi AI (Artifical Intelligence - Tr½ tu» nh¥n t¤o) v  IoT (Internet of Things Internet v¤n vªt) em ¸n nhúng ët ph¡ b§t ngí v· cæng ngh». Vai trá cõa nâ èi vîi mët quèc gia, mët vòng l¢nh thê lîn ¸n mùc ÷ñc nhªn ành, r¬ng ai d¨n ¦u v· cæng ngh» n y s³ chi¸n th­ng trong cuëc c¤nh tranh v· cæng ngh», kinh t¸... Trong thüc t¸, Tr½ tu» nh¥n t¤o m  cö thº hìn núa l  Håc m¡y (Machine Learning) ¢ l  mët ng nh con ph¡t triºn tø l¥u cõa khoa håc m¡y t½nh. Luªn v«n n y s³ x²t mët b i to¡n nhä trong l¾nh vüc rëng lîn n y d÷îi gâc ë to¡n håc, â l  Håc ë t÷ìng tü. Trong mët khæng gian Euclide, hay têng qu¡t hìn l  trong mët khæng gian metric, kh¡i ni»m kho£ng c¡ch ÷ñc dòng º o kho£ng c¡ch giúa hai èi t÷ñng. èi t÷ñng l  tròng nhau n¸u kho£ng c¡ch b¬ng 0, ð g¦n nhau n¸u kho£ng c¡ch nhä v  xa nhau n¸u kho£ng c¡ch lîn. B¥y gií, ta x²t mët tªp hñp têng qu¡t hìn nh÷ tªp c¡c h¼nh chöp m°t ng÷íi, hay tªp c¡c v«n b£n. Gi£ sû ta câ thº bi¸n êi c¡c èi t÷ñng â th nh c¡c èi t÷ñng to¡n håc nh÷ v²c tì ho°c ma trªn. Ta c¦n ph£i x¥y düng mët ph²p o º câ thº ph¥n bi»t ÷ñc hai nhâm èi t÷ñng t÷ìng tü nhau v  kh¡c nhau. V· m°t ành l÷ñng, hai èi t÷ñng t÷ìng tü nhau n¸u câ kho£ng c¡ch (theo ph²p o vøa ÷ñc x¥y düng) nhä v  hai èi t÷ñng kh¡c nhau s³ câ kho£ng c¡ch lîn. C¥u häi ti¸p theo l  x¥y düng ph²p o â nh÷ th¸ n o? Þ t÷ðng tü 3 nhi¶n l  kh¡i qu¡t hâa kho£ng c¡ch Euclide. Ta câ vîi kx − ykE = trong â I q kx − yk2 = q (x − y)T (x − y) = q x, y ∈ Rn th¼ (x − y)T I(x − y), I b¬ng mët ma trªn A v  ành ngh¾a q kx − ykA = (x − y)T A(x − y). (0.0.1) l  mët ma trªn ìn và. B¥y gií, ta thay èi xùng nûa x¡c ành d÷ìng L÷u þ r¬ng khi â (0.0.1) ch¿ l  mët gi£ kho£ng c¡ch, tùc l  hai iºm 0. Nh÷ vªy, vi»c x¥y düng kho£ng kh¡c nhau câ thº câ kho£ng c¡ch b¬ng c¡ch ÷ñc quy v· vi»c t¼m mët ma trªn èi xùng nûa x¡c ành d÷ìng. N¸u khæng câ gñi þ g¼ th¼ ¥y l  mët b i to¡n khæng câ líi gi£i. Ð gâc ë Håc m¡y, muèn m¡y ph¥n bi»t ÷ñc th¸ n o l  hai èi t÷ñng l  t÷ìng tü, th¸ n o l  khæng t÷ìng tü th¼ ta ph£i d¤y nâ. Thæng tin S gñi þ ð ¥y l  vi»c cho tr÷îc hai tªp con èi t÷ñng (gi£ sû l  nhau, cán D Rn ) m  trong â S v  D cõa khæng gian c¡c chùa nhúng èi t÷ñng t÷ìng tü chùa nhúng èi t÷ñng khæng t÷ìng tü. Mët ph²p o tèt, A, trong tr÷íng hñp n y °c tr÷ng bði ma trªn i) Kho£ng c¡ch giúa c¡c èi t÷ñng thuëc S ph£i thäa m¢n ba i·u: theo ma trªn A c ng nhä c ng tèt; ii) Kho£ng c¡ch giúa c¡c èi t÷ñng thuëc D theo ma trªn A ph£i t÷ìng èi lîn; iii) Ma trªn A ph£i thäa m¢n c¡c i·u ki»n º x¥y düng ÷ñc gi£ kho£ng c¡ch, tùc l  A ph£i èi xùng v  nûa x¡c ành d÷ìng. Nhúng gñi þ tr¶n ¢ d¨n ¸n b i to¡n tèi ÷u sau: arg min A X kx − yk2A (0.0.2) (xi ,xj )∈S sao cho X (xi ,xj )∈D kx − ykA ≥ 1, A ≥ 0. (0.0.3) 4 Möc ½ch cõa · t i l  tr¼nh b y vi»c gi£i b i to¡n tèi ÷u n£y sinh trong håc ë t÷ìng tü (0.0.2), (0.0.3). Nëi dung cõa · t i luªn v«n ÷ñc tr¼nh b y trong hai ch÷ìng. Ch÷ìng 1. B i to¡n tèi ÷u trong khæng gian húu h¤n chi·u Nëi dung ch½nh cõa ch÷ìng n y l  c¡c ki¸n thùc v· tèi ÷u hâa. Chóng tæi nh­c l¤i mët c¡ch sì l÷ñc c¡c kh¡i ni»m cì b£n cõa b i to¡n tèi ÷u v  mët sè ph÷ìng ph¡p cho b i to¡n tèi ÷u khæng r ng buëc. Trong â, chóng tæi i s¥u v o tr¼nh b y chi ti¸t ph÷ìng ph¡p chi¸u gradient s³ dòng ð Ch÷ìng 2. T i li»u tham kh£o ch½nh cho ch÷ìng n y l  [2], [4]. Ch÷ìng 2. B i to¡n håc ë t÷ìng tü Trong ch÷ìng n y, luªn v«n tr¼nh b y nhúng chõ · kh¡i qu¡t v· b i to¡n håc ë t÷ìng tü. Sau â, chóng tæi i v o tr¼nh b y chi ti¸t b i to¡n Håc ë t÷ìng tü theo lo¤t. Cán mët sè chõ · r§t thó và kh¡c nh÷ Håc ë t÷ìng tü online, Håc ë t÷ìng tü düa tr¶n lþ thuy¸t thæng tin ¢ khæng thº ÷ñc tr¼nh b y do khuæn khê câ h¤n cõa luªn v«n công nh÷ sü h¤n ch¸ v· thíi gian v  n«ng lüc. Sau còng, ch÷ìng n y tr¼nh b y ph÷ìng ph¡p chi¸u gradient cho B i to¡n håc ë t÷ìng tü v  v½ dö sè minh håa cho ph÷ìng ph¡p â. Ch÷ìng n y tham kh£o c¡c t i li»u [3], [5]. Luªn v«n ÷ñc ho n th nh t¤i Tr÷íng ¤i håc Khoa håc - ¤i håc Th¡i Nguy¶n. Trong qu¡ tr¼nh håc tªp v  thüc hi»n luªn v«n n y, Tr÷íng ¤i håc Khoa håc ¢ t¤o måi i·u ki»n tèt nh§t º t¡c gi£ håc tªp, nghi¶n cùu. T¡c gi£ xin ÷ñc b y tä láng bi¸t ìn ch¥n th nh ¸n c¡c th¦y, cæ trong khoa To¡n - Tin, trong Tr÷íng ¤i håc Khoa håc - ¤i håc Th¡i Nguy¶n. °c bi»t, t¡c gi£ xin b y tä láng bi¸t ìn s¥u s­c tîi TS. Nguy¹n Thanh Sìn - Ng÷íi ¢ tªn t¼nh h÷îng d¨n t¡c gi£ ho n 5 th nh luªn v«n n y. T¡c gi£ công xin ÷ñc gûi líi c£m ìn tîi Ban gi¡m hi»u tr÷íng THPT Nguy¹n «ng ¤o v  tªp thº c¡c th¦y cæ gi¡o trong tê To¡n-Tin cõa Tr÷íng ¢ t¤o i·u ki»n gióp ï t¡c gi£ trong thíi gian t¡c gi£ tham gia håc cao håc. Th¡i Nguy¶n, th¡ng 04 n«m 2019 T¡c gi£ luªn v«n Tr¦n V«n Ph÷ñng 6 Ch÷ìng 1 B i to¡n tèi ÷u trong khæng gian húu h¤n chi·u Nëi dung ch½nh cõa ch÷ìng n y l  c¡c ki¸n thùc v· tèi ÷u hâa. Chóng tæi nh­c l¤i mët c¡ch sì l÷ñc c¡c kh¡i ni»m cì b£n cõa b i to¡n tèi ÷u v  mët sè ph÷ìng ph¡p cho b i to¡n tèi ÷u bao gçm b i to¡n khæng r ng buëc v  b i to¡n câ r ng buëc. Trong â, chóng tæi i s¥u v o tr¼nh b y chi ti¸t ph÷ìng ph¡p chi¸u gradient s³ dòng ð Ch÷ìng 2. T i li»u tham kh£o ch½nh cho ch÷ìng n y l  [2], [4]. 1.1 Sì l÷ñc v· b i to¡n tèi ÷u Möc n y s³ tr¼nh b y kh¡i ni»m, k¸t qu£ cì b£n º câ c¡i nh¼n kh¡i qu¡t v· b i to¡n tèi ÷u. 1.1.1 B i to¡n tèi ÷u Cho f : Rn → R. T¼m cüc tiºu àa ph÷ìng x∗ f (x∗ ) ≤ f (x), ∀x ∈ Ux∗ , trong â, U x∗ l  l¥n cªn àa ph÷ìng n o â cõa min f (x). x cõa f, ngh¾a l , (1.1.1) x∗ . º ng­n gån, ta vi¸t (1.1.2) 7 h m möc ti¶u, • x∗ : iºm cüc tiºu hay cüc tiºu, • f (x∗ ) : gi¡ trà cüc tiºu, • B i to¡n (1.1.1): B i to¡n cüc tiºu khæng r ng buëc. B i to¡n cüc tiºu câ r ng buëc (constrained optimization) l  b i to¡n • f: t¼m x∗ sao cho f (x∗ ) ≤ f (x), ∀x ∈ Ux∗ ∩ U, vîi U (1.1.3) cho tr÷îc. Nâ câ thº vi¸t d÷îi d¤ng min f (x). x∈U B i to¡n cüc tiºu to n cöc (global optimization) l  b i to¡n t¼m x∗ sao cho f (x∗ ) ≤ f (x), ∀x. (1.1.4) i·u ki»n tèi ÷u C¡c i·u ki»n c¦n thi¸t cho sü tèi ÷u ÷ñc rót ra b¬ng c¡ch gi£ sû r¬ng x∗ ∇f (x∗ ) l  iºm cüc tiºu àa ph÷ìng v  sau â chùng minh t½nh ch§t cõa v  ∇2 f (x∗ ). ành lþ 1.1.1 (i·u ki»n c¦n). Cho f ∈ C 2(Ux ) v  x∗ l  mët cüc tiºu ∗ àa ph÷ìng cõa f . Khi â ∇f (x∗ ) = 0. Hìn núa, ta cán câ ∇2 f (x∗ ) ≥ 0. Tø ành l½ tr¶n ta ành ngh¾a c¡c kh¡i ni»m sau: 8 ành ngh¾a 1.1.2 i·u ki»n ∇f (x∗) = 0 ÷ñc gåi l  i·u ki»n c¦n c§p mët. x∗ thäa m¢n i·u ki»n c¦n c§p mët ÷ñc gåi l  iºm døng hay iºm tîi h¤n. ành lþ 1.1.3 (i·u ki»n õ). Cho f ∈ C 2(Ux ). Gi£ sû ∇f (x∗) = 0 ∗ v  ∇2f (x∗) > 0. Khi â, x∗ l  mët cüc tiºu àa ph÷ìng cõa f . 1.1.2 Kh¡i qu¡t b i to¡n tèi ÷u câ r ng buëc Tø möc n y cho ¸n h¸t ch÷ìng 1, ta s³ x²t b i to¡n tèi ÷u r ng buëc têng qu¡t nh÷ sau ( minn (f (x)) x∈R trong â f, ci , cj nh­c l¤i r¬ng f sao cho ci (x) = 0, i ∈ E l  c¡c h m trìn v  I, E l  c¡c tªp ch¿ sè húu h¤n. Ta ÷ñc gåi l  h m möc ti¶u, buëc ¯ng thùc v  cj (x), j ∈ I (1.1.5) cj (x) ≥ 0, j ∈ I ci (x), i ∈ E l  c¡c h m r ng l  c¡c h m r ng buëc b§t ¯ng thùc. Ta k½ hi»u Ω = {x ∈ Rn : ci (x) = 0, i ∈ E, cj (x) ≥ 0, j ∈ I}, v  gåi nâ l  (1.1.6) tªp ch§p nhªn ÷ñc. Theo â, B i to¡n (1.1.5) câ thº ÷ñc vi¸t l¤i ð d¤ng min f (x). x∈Ω iºm x∗ ∈ Rn ÷ñc gåi l  v  câ mët l¥n cªn N cõa mët nghi»m àa ph÷ìng cõa (1.1.5) n¸u x ∈ Ω x∗ trong Rn sao cho f (x) ≥ f (x∗ ), ∀x ∈ N ∩ Ω. N¸u ta thay d§u "≥" trong (1.1.8) bði ">" ta câ kh¡i ni»m ph÷ìng ch°t. (1.1.7) (1.1.8) nghi»m àa 9 ành ngh¾a 1.1.4 Cho x ∈ Ω, tªp ho¤t (active set) k½ hi»u A(x) ÷ñc ành ngh¾a l  A(x) = E ∪ {i ∈ I : ci (x) = 0}. R ng buëc b§t ¯ng thùc i ÷ñc gåi l  ho¤t (active) n¸u ci(x) = 0 v  ng÷ñc l¤i n¸u ci(x) > 0 th¼ ÷ñc gåi l  khæng ho¤t. ành ngh¾a 1.1.5 Ta nâi t¤i iºm x i·u ki»n r ng buëc ëc lªp tuy¸n t½nh (LICQ) ÷ñc thäa m¢n n¸u t¤i â tªp c¡c gradient cõa c¡c r ng buëc ho¤t, {∇ci (x), i ∈ A(x)} l  ëc lªp tuy¸n t½nh. Vîi c¡c nguy¶n li»u tr¶n, ta câ thº ph¡t biºu ành lþ v· i·u ki»n c¦n tèi ÷u cì b£n nh§t cõa b i to¡n tèi ÷u câ r ng buëc, i·u ki»n KarushKuhn- Tucker hay ng­n gån l  i·u ki»n KKT. ành lþ 1.1.6 Gi£ sû x∗ l  mët nghi»m àa ph÷ìng cõa b i to¡n (1.1.5) vîi h m möc ti¶u v  h m r ng buëc thuëc lîp C 1 v  i·u ki»n LICQ ÷ñc thäa m¢n. Khi â câ mët nh¥n tû Lagrange λ∗ = (λ∗i ), i ∈ E ∪ I sao cho c¡c i·u ki»n sau ¥y thäa m¢n t¤i iºm (x∗, λ∗) ∇x L(x∗ , λ∗ ) = 0, ci (x∗ ) = 0, vîi (1.1.10) ci (x∗ ) ≥ (1.1.11) λ∗i ≥ λ∗i ci (x∗ ) = måi i ∈ E, 0, vîi måi i ∈ I, 0, vîi måi i ∈ I, 0, vîi måi i ∈ E ∪ I. (1.1.9) Chùng minh cõa ành lþ n y ÷ñc tr¼nh b y chi ti¸t trong [4]. (1.1.12) (1.1.13) 10 1.1.3 Tèi ÷u h m möc ti¶u bªc hai vîi r ng buëc b§t ¯ng thùc Trong möc n y, º t«ng t½nh têng qu¡t chóng tæi s³ x²t b i to¡n sau 1 min q(x) = xT Gx + xT c, x 2 (1.1.14) aTi x = bi , i ∈ E, (1.1.15) aTi x ≥ bi , i ∈ I, (1.1.16) sao cho trong â G l  mët ma trªn èi xùng cï n × n, c, ai , bi l  c¡c v²c tì cho tr÷îc. N¸u b i to¡n khæng câ r ng buëc ¯ng thùc, ta ch¿ vi»c coi E =∅ trong c¡c ph¡t biºu. So vîi b i to¡n têng qu¡t (1.1.5), h m möc ti¶u l  mët h m bªc hai v  c¡c r ng buëc l  c¡c h m tuy¸n t½nh. N¸u G l  mët ma trªn nûa x¡c ành d÷ìng, ta nâi â l  b i to¡n quy ho¤ch (tèi ÷u) to n ph÷ìng lçi. N¸u G l  x¡c ành d÷ìng, b i to¡n ÷ñc gåi l  lçi ch°t. Tr÷íng hñp cán l¤i, vi»c gi£i B i to¡n (1.1.14)-(1.1.16) s³ khâ hìn v¼ nâ câ thº câ nhi·u cüc trà àa ph÷ìng ho°c iºm døng. Tr÷îc h¸t, ta h¢y ¡p döng lþ thuy¸t têng qu¡t cõa tèi ÷u câ r ng buëc v o B i to¡n (1.1.14)-(1.1.16). H m Lagrange cho b i to¡n n y l  X 1 L(x, λ) = xT Gx + xT c − λi (aTi x − bi ). 2 i∈I∪E Khi â, tªp ch¿ sè ho¤t t¤i x∗ , A(x∗ ) bao gçm c¡c ch¿ sè thäa m¢n  A(x∗ ) = i ∈ E ∪ I : aTi x∗ = bi . p döng c¡c i·u ki»n cõa ành lþ 1.1.6, ta suy ra i·u ki»n c¦n tèi ÷u 11 cho nghi»m x∗ l  tçn t¤i c¡c nh¥n tû Lagrange Gx∗ + c − X λ∗i , i ∈ A(x∗ ) º cho λ∗i ai = 0, (1.1.17) i∈A(x∗ ) aTi x∗ = bi , i ∈ A(x∗ ), (1.1.18) aTi x∗ ≥ bi , i ∈ I\A(x∗ ), (1.1.19) λ∗i ≥ 0, ∀i ∈ I ∩ A(x∗ ). (1.1.20) L÷u þ r¬ng ta khæng c¦n ¸n i·u ki»n LICQ nh÷ ành lþ 1.1.6 ð ¥y. Sau ¥y, ta s³ ph¡t biºu mët tr÷íng hñp °c bi»t nh÷ng r§t hay g°p trong thüc t¸ khi gi£i b i to¡n tèi ÷u to n ph÷ìng. ành lþ 1.1.7 N¸u x∗ thäa m¢n c¡c i·u ki»n vîi c¡c λ∗i ∈ A(x∗ ) n o â v  G l  nûa x¡c ành d÷ìng (bao gçm x¡c ành d÷ìng) th¼ x∗ l  mët nghi»m to n cöc cõa B i to¡n (1.1.14)-(1.1.16). (1.1.18) (1.1.20) Chùng minh cõa ành lþ n y ÷ñc tr¼nh b y trong [4]. Công tø chùng minh, ta suy r¬ng n¸u G x¡c ành d÷ìng th¼ x∗ l  nghi»m duy nh§t. 1.2 Mët sè ph÷ìng ph¡p gi£i b i to¡n tèi ÷u Nëi dung trong möc n y ÷ñc tr½ch d¨n tø t i li»u tham kh£o [2]. 1.2.1 Ph÷ìng ph¡p Newton Trong möc n y, ta gi£ sû r¬ng c¡c i·u ki»n sau ¥y luæn ÷ñc thäa m¢n. ành ngh¾a 1.2.1 C¡c i·u ki»n sau ªy ÷ñc gåi l  gi£ thi¸t ti¶u chu©n. • f kh£ vi c§p hai v  tho£ m¢n i·u ki»n Lipschitz vîi Hessian k∇2 f (x) − ∇2 f (x)k ≤ γkx − yk. 12 • H m f thäa m¢n i·u ki»n c¦n t¤i x∗ ∇f (x∗ ) = 0. • H m f câ Hesian spd t¤i x∗ ∇2 f (x∗ ) > 0. Ph÷ìng ph¡p Newton x¥y düng mët d¢y l°p hëi tö tîi nghi»m. Ta s³ tªp trung ph¥n t½ch vi»c t¼m gi¡ trà ti¸p theo x+ tø gi¡ trà hi»n t¤i C¡ch l m ð ¥y l  t¼m cüc tiºu cõa mët x§p x¿ bªc hai, m  ta gåi l  h¼nh bªc hai, cõa f xung quanh xc xc . mæ 1 mc (x) = f (xc ) + ∇f (xc )T (x − xc ) + (x − xc )T ∇2 f (xc )(x − xc ). 2 2 N¸u ∇ f (xc ) > 0, cüc tiºu duy nh§t x+ cõa mc (x) l  nghi»m duy nh§t cõa ph÷ìng tr¼nh ∇mc (x) = 0. i·u n y t÷ìng ÷ìng vîi 0 = ∇mc (x+ ) = ∇f (xc ) + ∇2 f (xc )(x+ − xc ). Do â x+ = xc − (∇2 f (xc ))−1 ∇f (xc ). Khi â, b÷îc cªp nhªt s³ l  x+ = xc + s, vîi s = −(∇2 f (xc ))−1 ∇f (xc ). L÷u þ r¬ng n¸u nghi»m x+ xc xa cüc tiºu th¼ ∇2 f (xc ) câ thº khæng l  spd n¶n câ thº l  cüc ¤i ho°c iºm y¶n ngüa. Tuy nhi¶n i·u n y bà lo¤i trø do gi£ thi¸t ∇2 f (x∗ ) > 0 cõa gi£ thi¸t ti¶u chu©n. Sü hëi tö cõa ph÷ìng ph¡p Newton ÷ñc n¶u trong ành l½ sau. ành lþ 1.2.2 Gi£ sû c¡c gi£ thi¸t ti¶u chu©n ÷ñc thäa m¢n. X²t d¢y l°p xk+1 = xk + pk , 13 vîi pk = −∇2fk−1∇fk . Khi â: • N¸u x0 õ g¦n x∗ th¼ d¢y {xk } hëi tö tîi x∗ . • Tèc ë hëi tö l  q -bªc hai. • D¢y chu©n cõa gradient {k∇fk k} hëi tö q -bªc hai tîi 0. 1.2.2 Ph÷ìng ph¡p gi£m s¥u nh§t Nh÷ ¢ bi¸t h÷îng gi£m s¥u nh§t (steepest descent) t¤i d = −∇f (x). Ph÷ìng ph¡p n y cªp nhªt xc λ>0 l  bði cæng thùc x+ = xc − λ∇f (xc ), trong â x (1.2.1) l  ë d i b÷îc. M°c dò ta ¢ x¡c ành ÷ñc h÷îng gi£m s¥u nh§t, nh÷ng vi»c x¡c ành ÷ñc ë d i b÷îc chån tèt nh§t cho λ λ l  tèi quan trång cõa ph÷ìng ph¡p n y. Lüa l  nâ tèi thiºu hâa h m φ(λ) = f (xc − λ∇f (xc )). Nh÷ng b i to¡n n y trong h¦u h¸t tr÷íng hñp công khæng d¹ gi£i hìn b i to¡n cüc trà ban ¦u. V¼ th¸, ng÷íi ta t¼m mët c¡ch ti¸p cªn nîi läng. Ta x²t mæ h¼nh x§p x¿ bªc mët cõa f (x) mc (x) = f (xc ) + ∇f (xc )(x − xc ). Qua b÷îc cªp nhªt (1.2.1), mæ h¼nh bªc mët (l  x§p x¿ Taylor bªc mët cõa h m möc ti¶u) s³ gi£m pred = mc (xc ) − mc (x+ ) = ∇f (xx )(xc − x+ ) = λk∇f (xc )k2 . V  ë gi£m t÷ìng ùng cõa h m möc ti¶u l  ared = f (xc ) − f (x+ ). 14 Ta s³ r ng buëc i·u ki»n ared > αλpred , hay t÷ìng ÷ìng f (xc − λ∇) − f (xc ) < −αλk∇f (xc )k2 . (1.2.2) Þ ngh¾a cõa i·u ki»n n y l  ë gi£m thüc sü cõa h m möc ti¶u ph£i lîn hìn t½ch cõa ë gi£m mæ h¼nh bªc mët vîi h» sè th÷íng, ng÷íi ta hay chån º x¡c ành ë d i b÷îc (backtracking). Ta chån t¼m sè nguy¶n d÷ìng cö thº hâa ð váng l°p m α d÷ìng. Thæng α = 10−4 . λ, ta câ thº sû döng mët β ∈ (0; 1) thõ töc truy ng÷ñc (câ thº chån b¬ng nhä nh§t sao cho λ = β m. 0, 9) v  sau â, Thõ töc n y ÷ñc while trong cõa Thuªt to¡n 1. ¥y công l  mët c¡ch thæng döng º x¡c ành ë d i b÷îc èi vîi nhúng ph÷ìng ph¡p t¼m theo ÷íng th¯ng kh¡c. Algorithm 1 Thuªt to¡n gi£m s¥u-steep Input: x, f, τ, kmax , α, β Output: mët x§p x¿ cõa 1: r0 = k∇f (x)k 2: tol = τa r0 + τr 3: k = 2; 4: while k∇f (x)k > tol x∗ and k < kmax 5: m=1 6: ared = f (x) − f (x − β∇f (x)) 7: pred = βk∇f (x)k2 8: while 9: ared ≤ αpred do do m=m+1 10: ared = f (x) − f (x − β m ∇f (x)) 11: pred = β m k∇f (x)k2 12: end while 13: x = x + λx 14: end while 15: N¸u k = kmax th¼ b¡o ch÷ìng tr¼nh th§t b¤i 15 Kh¡i qu¡t i·u ki»n (1.2.2), ta câ i·u ki»n f (xc + λd) − f (xc ) < αλ∇f (xc )T d, trong â α ∈ (0, 1) l  tham sè thuªt to¡n. Công nh÷ ph÷ìng ph¡p gi£m s¥u nh§t, ta th÷íng chån α = 10−4 . i·u ki»n n y ch½nh l  i·u ki»n Armijo v  th÷íng ÷ñc gåi l  i·u ki»n gi£m õ (sufficient condition). 1.2.3 Ph÷ìng ph¡p h m ch­n logarith Trong möc n y, chóng ta t¼m hiºu ph÷ìng ph¡p h m ch­n logarith cho b i to¡n tèi ÷u r ng buëc d¤ng b§t ¯ng thùc. Cö thº ta x²t b i to¡n tèi ÷u min f (x), x sao cho : ci (x) ≥ 0, i ∈ I. (1.2.3) Ta ành ngh¾a mi·n húu h¤n ng°t F 0 := {x ∈ Rn : ci (x) > 0, vîi måi i ∈ I}, (1.2.4) v  gi£ sû r¬ng mi·n kh¡c réng. Ta s³ x¥y düng h m ch­n cho B i to¡n (1.2.3), (1.2.4) vîi c¡c t½nh ch§t sau: (i) gi¡ trà væ còng khi (ii) trìn trong F 0, ∞ khi (iii) ti¸n tîi x x∈ / F 0, ti¸n ¸n bi¶n F 0. Câ thº th§y h m − X log ci (x), (1.2.5) i∈I vîi log l  logarith cì sè tü nhi¶n, thäa m¢n c¡c t½nh ch§t (i)-(iii). Nâ ÷ñc gåi l  h m ch­n logarith. Khi â, h m k¸t hñp (cõa h m möc ti¶u v  h m ch­n) cho B i to¡n (1.2.3), (1.2.4) ÷ñc cho bði P (x; µ) = f (x) − µ X i∈I log ci (x), (1.2.6) 16 trong â µ l  mët h¬ng sè i·u ch¿nh vai trá cõa h m ch­n trong h m têng hñp v  ÷ñc gåi l  gåi l  khi tham sè ch­n. H m k¸t hñp P (x; µ) công ÷ñc h m ch­n log cho B i to¡n tèi ÷u (1.2.3), (1.2.4). Ta nhªn th§y µ ti¸n v· 0, h m ch­n log P (x; µ) d¦n v· h m möc ti¶u ban ¦u cõa B i to¡n (1.2.3). Nh÷ vªy, c¡ch ti¸p cªn cõa ph÷ìng ph¡p h m ch­n log l  thay th¸ b i to¡n tèi ÷u vîi r ng buëc b§t ¯ng thùc b¬ng mët hå c¡c b i to¡n tèi ÷u khæng r ng buëc phö thuëc v o tham sè. Theo â, ta câ thº mæ t£ l¤i quy tr¼nh n y trong Thuªt to¡n 2. Algorithm 2 Ph÷ìng ph¡p Log-barrier Cho µ0 > 0, dung sai τ0 > 0, iºm b­t ¦u xs0 ; for k = 0, 1, 2, . . . T¼m mët tèi thiºu g¦n óng xk cõa P (.; µk ), b­t ¦u tø xsk , v  k¸t thóc khi k∇P (x; µk )k ≤ τk ; if kiºm tra sü hëi tö cuèi còng ¢ thäa m¢n stop vîi nghi»m g¦n óng x ; k Chån tham sè ch­n mîi µk+1 ∈ (0, µk ); Chån iºm b­t ¦u mîi xsk+1 ; end (for) º t¼m iºm cüc tiºu ð b÷îc 3 trong Thuªt to¡n 2, ta câ thº sû döng ph÷ìng ph¡p Newton cho b i to¡n tèi ÷u khæng r ng buëc tr¼nh b y ð Möc 1.2.1. ành lþ sau ¥y s³ cung c§p cho chóng ta mèi quan h» giúa B i to¡n tèi ÷u khæng r ng buëc (1.1.5) v  B i to¡n tèi ÷u câ r ng buëc (1.2.3). ành lþ 1.2.3 Gi£ sû r¬ng f v  −ci, i ∈ I ·u l  c¡c h m lçi v  mi·n húu hi»u ng°t F 0 l  khæng réng. °t {µk } l  mët d¢y gi£m sao cho µk ↓ 0, v  gi£ sû r¬ng tªp hñp nghi»m M l  khæng trèng v  giîi nëi. Khi â, c¡c kh¯ng ành sau l  óng. (i) Vîi måi µ > 0, P (x; µ) l  lçi trong F 0 v  câ mët cüc tiºu x(µ) (khæng nh§t thi¸t ph£i l  duy nh§t) tr¶n F 0. B§t ký cüc tiºu àa
- Xem thêm -

Tài liệu liên quan

Tài liệu xem nhiều nhất