Bài giảng Tối ưu hóa nâng cao - Bài 2: Các kiến thức cơ sở - Hoàng Nam Dũng

Tập lồi
Định nghĩa
Tập hợp S C Rn /à một tập lồi nếu
Àx + (1 — À)y 2 S; VÀ 2 [0; 1]; x; y 2 S.
Nói một cách khác đoạn thẳng nối hai điểm hoàn toàn nằm trong tập hợp nếu hai đầu mút công thuộc tập hợp.
102 trang phuongnguyen 13620
Download
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tối ưu hóa nâng cao - Bài 2: Các kiến thức cơ sở - Hoàng Nam Dũng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Tối ưu hóa nâng cao - Bài 2: Các kiến thức cơ sở - Hoàng Nam Dũng

Các kiến thức cơ sở
Hoà ng Nam Dũng
Khoa Toán - Cơ - Tin học, Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
Tập lồi
Định nghĩa
Tập hợp S C Rn /à một tập lồi nếu
Àx + (1 — À)y 2 S; VÀ 2 [0; 1]; x; y 2 S.
Nói một cách khác đoạn thẳng nối hai điểm hoàn toàn nằm trong tập hợp nếu hai đầu mút công thuộc tập hợp.
Tập lồi
Định nghĩa
Tập hợp S C Rn /à một tập lồi nếu
Àx + (1 — À)y 2 S; VÀ 2 [0; 1]; x; y 2 S.
Nói một cách khác đoạn thẳng nối hai điểm hoàn toàn nằm trong tập hợp nếu hai đầu mút công thuộc tập hợp.
Tập không lồi
Ví dụ tạp lồi
I Tập rỗng, điểm, đường thắng, toàn bộ không gian Rn.
I Hình cầu {x 2 Rn I ||xII < r} với chuẩn II ■ II và bán kín r cho trước.
I Siêu phắng (hyperplane) {x 2 Rn I aTx = b} với a 2 Rn, b 2 R cho trước.
I Nửa không gian (halfspace) {x 2 Rn I aTx < b} với a 2 Rn, b 2 R cho trước.
I {x 2 Rn I Ax = b} với A 2 Rmxn, b 2 Rm cho trước.
I Da diện {x 2 Rn I Ax < b} với A 2 Rmxn, b 2 Rm cho trước.
I ...
Tổ hợp lồi và bao lồi
Định nghĩa
Một tổ hợp lồi của X1; x2;...; xk 2 Rn là một tô hợp tuyến tính
A1X1 + A2 X2 + • • • + AkXk
với các hệ số A1; A2;... ;Ak > 0 thỏa mãn
A1 + A2 + • • • + Ak = 1.
Tổ hợp lồi và bao lồi
Định nghĩa
Một tổ hợp lồi của X1; x2;...; xk 2 Rn là một tô hợp tuyến tính
A1X1 + A2 X2 + • • • + AkXk
với các hệ số A1; A2;... ;Ak > 0 thỏa mãn
A1 + A2 + • • • + Ak = 1.
Định nghĩa
Bao lồi của một tập hợp S, conv(S), là tập hợp của tất cả các tô hợp lểi của các phan tử thuộc S.
Tổ hợp lồi và bao lồi
Định nghĩa
Một tổ hợp lồi của X1; x2;...; xk 2 Rn là một tô hợp tuyến tính
A1X1 + A2 X2 + • • • + AkXk
với các hệ số A1; A2;... ;Ak > 0 thỏa mãn
A1 + A2 + • • • + Ak = 1.
Định nghĩa
Bao lồi của một tập hợp S, conv(S), là tập hợp của tất cả các tô hợp lểi của các phan tử thuộc S.
conv(S) là một tập lồi và là tập lồi bé nhất chứa S.
Tổ hợp lồi và bao lồi
Định nghĩa
Một tổ hợp lồi của X1; x2;...; xk 2 Rn là một tô hợp tuyến tính
A1X1 + A2 X2 + • • • + AkXk
với các hệ số A1; A2;... ;Ak > 0 thỏa mãn
A1 + A2 + • • • + Ak = 1.
Định nghĩa
Bao lồi của một tập hợp S, conv(S), là tập hợp của tất cả các tô hợp lểi của các phan tử thuộc S.
conv(S) là một tập lồi và là tập lồi bé nhất chứa S.
Hàm lồi
Đinh nghĩa
Một hàm so f : S ! R, S C Rn, được gọi là một hàm lồi nếu
I Miền định nghĩa S là một tập loi.
I Hàm f thỏa mãn
f(Ax + (1 — A)y) < Af(x) + (1 — A)f(y), VA 2 [0,1],x,y 2 S.
Hàm lồi
Đinh nghĩa
Một hàm so f : S ! R, S C Rn, được gọi là một hàm lồi nếu
I Miền định nghĩa S là một tập loi.
I Hàm f thỏa mãn
f(Ax + (1 — A)y) < Af(x) + (1 — A)f(y), VA 2 [0,1],x,y 2 S.
Hàm lõm
Định nghĩa
Một hàm so f : S ! R, S C Rn, được gọi là một hà m lõm nếu
I Miền định nghĩa S là một tập loi.
I Hàm f thỏa mãn
f(Ax + (1 — A)y) > Af(x) + (1 — A)f(y); VA 2 [0; 1];x;y 2 S.
f là hà m lõm o —f là một hà m lồi.
Hàm lồi ngặt và hàm lồi mạnh
Định nghĩa
Một hàm lồi f : S ! R được gọi là
I lồi ngặt nếu ta có với mọi X 2 (0; 1); x; y 2 S; x = y f(Xx + (1 - X)y) < Xf(x) + (1 - X)f(y).
Tức là độ cong của nó lớn hơn độ cong của 1 hàm tuyến tính.
Hàm lồi ngặt và hàm lồi mạnh
Định nghĩa
Một hàm lồi f : S ! R được gọi là
I lồi ngặt nếu ta có với mọi X 2 (0; 1); x; y 2 S; x = y
f(Xx + (1 - X)y) < Xf(x) + (1 - X)f(y).
Tức là độ cong của nó lớn hơn độ cong của 1 hàm tuyến tính.
I lồi mạnh nếu tồn tại m > 0 sao cho f — m||x112 là một hàm lồi hay tương đương với
tồn tại m > 0 sao cho ta có với mọi X 2 [0; 1]; x; y 2 S
f(Xx + (1 - X)y) < Xf(x) + (1 - X)f(y) -1 mX(1 - X)|x-y 112.
Hàm lồi ngặt và hàm lồi mạnh
Định nghĩa
Một hàm lồi f : S ! R được gọi là
I lồi ngặt nếu ta có với mọi X 2 (0; 1); x; y 2 S; x = y
f(Xx + (1 - X)y) < Xf(x) + (1 - X)f(y).
Tức là độ cong của nó lớn hơn độ cong của 1 hàm tuyến tính.
I lồi mạnh nếu tồn tại m > 0 sao cho f — m||x112 là một hàm lồi hay tương đương với
tồn tại m > 0 sao cho ta có với mọi X 2 [0; 1]; x; y 2 S
f(Xx + (1 - X)y) < Xf(x) + (1 - X)f(y) -1 mX(1 - X)|x-y 112.
Mối quan hệ:
Lồi mạnh =) lồi ngặt =) lồi.
Ví dụ hà m lồi
I Hàm đơn biến
eax trên R với a 2 R
xa trên R>0 với a 2 (0; 1)
—xa trên R>0 với a 2 [0; 1]
— logx trên R>0
I Hàm affine: aTx + b đồng thời vừa là hàm lồi, vừa là hàm lõm
I Hàm bậc 2: 2xTAx + bTx + c với A nửa xác định dương
(A	0)
I Least square lost: ky — AxII2
I Chuẩn I|xII bất kì, ví dụ chuẩn Lp
I Hàm max: f(x) = max{xi;x2;...;xng
I ...
Đặc trưng của hàm lồi
I Epigraph:
epi(f) = {(x; t) 2 dom(f) X RI f (x) < t}
Đặc trưng của hàm lồi
I Epigraph:
epi(f) = {(x; t) 2 dom(f) X RI f (x) < t}
Đặc trưng của hàm lồi
I Epigraph:
epi(f) = {(x; t) 2 dom(f) X RI f (x) < t}
f là hàm lồi o epi(f) là một tập lồi.
Đặc trưng của hàm lồi
I Epigraph:
epi(f) = {(x; t) 2 dom(f) X RI f (x) < t}
f là hàm lồi o epi(f) là một tập lồi.
I Tập mức dưới: Nếu f lồi thì tập mức dưới
{x 2 dom(f) I f(x) < a}
là lồi với mọi a 2 R. Tuy nhiên điều ngược lại không đúng.
Đặc trưng của hàm lồi
Định lý (Đặc trưng bậc nhất)
Neu f khả vi thì f là hàm loi khi và chỉ khi dom(f) là một tập loi và
f(y) > f(x) + Vf(x)T(y — x); 8x;y 2 dom(f).
Đặc trưng của hàm lồi
Định lý (Đặc trưng bậc nhất)
Neu f khả vi thì f là hàm loi khi và chỉ khi dom(f) là một tập loi và
f(y) > f(x) + Vf(x)T(y — x); 8x;y 2 dom(f).
Định lý (Đặc trưng bậc hai)
Neu f khả vi hai lần thì hàm loi khi và chỉ khi dom(f) là một tập loi và
V2f(x) >2 0; 8x 2 dom(f).
Đặc trưng của hàm lồi
Định lý (Đặc trưng bậc nhất)
Neu f khả vi thì f là hàm loi khi và chỉ khi dom(f) là một tập loi và
f(y) > f(x) + Vf(x)T(y — x); 8x;y 2 dom(f).
Định lý (Đặc trưng bậc hai)
Neu f khả vi hai lần thì hàm loi khi và chỉ khi dom(f) là một tập loi và
V2f(x) >2 0; 8x 2 dom(f).
Định lý (Bất đẳng thức Jenssen)
Neu f là một hàm loi và X là một biến ngẫu nhiên trên dom(f) thì
f(E[X]) < E[f(X)].
Operations preserving convexity
Nonnegative linear combination:	convex implies
af + ... + amfm convex for any a1,... am > 0
Pointwise maximization: if fs is convex for any s e S, then f (x) = maxseS fs(x) is convex. Note that the set S here
(number of functions fs) can be infinite
Partial minimization: if g(x,y) is convex in x,y, and C is convex, then f (x) = mill,, C g(x, y) is convex
Example: distances to a set
Let C be an arbitrary set, and consider the maximum distance to C under an arbitrary norm II • II:
f (x) = max ||x - y\\
y&C
Let's check convexity: fy(x) = ||x — y\\ is convex in x for any fixed y, so by pointwise maximization rule, f is convex
Now let C be convex, and consider the minimum distance to C:
f(x) = min Hx — y||
yeC
Let's check convexity: g(x,y) = ||x — y\\ is convex in x,y jointly, and C is assumed convex, so apply partial minimization rule
More operations preserving convexity
Affine composition: if f is convex, then g(x) = f (Ax + b) is convex
General composition: suppose f = h o g, where g : Rn	R,
h : R	R, f : Rn R. Then:
f is convex if h is convex and nondecreasing, g is convex
f is convex if h is convex and nonincreasing, g is concave
f is concave if h is concave and nondecreasing, g concave
f is concave if h is concave and nonincreasing, g convex
How to remember these? Think of the chain rule when n = 1:
f"(x) = h"(g(x))g'(x)2 + h'(g(x))g"(x)
• Vector composition: suppose that
f (x) = h{g(x) = h(gi(x),. ..gk(x))
where g : Rn Rk, h : Rk	R, f : Rn	R. Then:
f is convex if h is convex and nondecreasing in each argument, g is convex
f is convex if h is convex and nonincreasing in each argument, g is concave
f is concave if h is concave and nondecreasing in each argument, g is concave
f is concave if h is concave and nonincreasing in each argument, g is convex
Example: log-sum-exp function
Log-sum-exp function: g(x) = log(£k=1 eaTx+bi), for fixed ữi,bị, Ỉ = 1,... k. Often called “soft max”, as it smoothly approximates maxi=i;...fc (aTx + bi)
How to show convexity? First, note it suffices to prove convexity of f (x) = logQ2Z=i exi) (affine composition rule)
Now use second-order characterization. Calculate
Vif(x)
= E”=1
vjf(x) = £11 e3*1{i = j} — (£11 e3*)2
Write v2f(x) = diag(z) — zzT, where zi = eXi/(£11 exe). This matrix is diagonally dominant, hence positive semidefinite
Bà i toán tối ưu
Một bài toán tối ưu hóa gồm có
x vectơ của các biến
I hàm mục tiêu f là một hàm (vô hướng) mà chúng ta muốn cực đại hóa hay cực tiếu hóa
Các hàm điều kiện gi, hi là các hàm (vô hướng) của x định nghĩa các đắng thức hay bất đắng thức mà x phải thỏa mãn.
Bà i toán tối ưu
Một bài toán tối ưu hóa gồm có
x vectơ của các biến
I hàm mục tiêu f là một hàm (vô hướng) mà chúng ta muốn cực đại hóa hay cực tiếu hóa
Các hàm điều kiện gi, hi là các hàm (vô hướng) của x định nghĩa các đắng thức hay bất đắng thức mà x phải thỏa mãn.
Bài toán tối ưu có thể viết dưới dạng
min f (x)
s.t. gi (x) < 0;	i = 1; 2; . . . ; k
hj (x) = 0; j = 1; 2;... ; l .
max min:
max f(x)	min	— f(x)
s.t. gi (x)	<	0;	i = 1; . . . ; k	o s.t. gi (x)	<	0;	i = 1; . . . ; k
hj (x)	=	0;	j = 1; . . . ; l .	hj (x)	=	0;	j = 1; . . . ; l .
max min:
max f(x)	min	— f(x)
s.t. gi (x)	<	0;	i = 1; . . . ; k	o s.t. gi (x)	<	0;	i = 1; . . . ; k
hj (x)	=	0;	j = 1; . . . ; l .	hj (x)	=	0;	j = 1; . . . ; l .
Vế phải khác 0:
max f(x)	min — f(x)
s.t. gi (x)	<	bị ;	i =	1;	.	. . ; k	o s.t. gi (x)	< 0;	i = 1;...; k
hj (x)	=	Cj ;	j =	1;	.	. . ; l .	hj (x)	= 0;	j = 1; . . . ; l .
với gi = gi - bi, hị = hj - Cj.
max min:
max
f (x )
min
-f (x )
s.t.
gi (x ) < 0;
i = 1;
• ••; k (
) s.t.
gi (x) < 0;
i = 1,, •
•;k
hj (x) = 0;
j = 1;
• •• ; l •
hj(x) =0;
j = 1; • •
..; l •
Vế phải khác 0:
max
f (x)
min
-f (x )
s.t.
gi (x ) < bi ;
i = 1;
k (
s.t.
ghi (x) < 0;
i = 1; •
••;k
hj (x ) = Cj ;
j = 1
,•••; l •
hhj (x) = 0;
j = 1; •
• • ; l •
với gi
= gi - bi, hj
= hj -
cj .
min
f(x)
min
f (x )
s.t.
gi (x ) > 0;
i = 1; •
• •; k (=
s.t.
-gi (x ) < 0;
i = 1; •
••;k
hj (x ) = 0;
j = 1; •
• • ; l •
hj (x) = 0;
j = 1; •
•• ; l^	11
min	f (x)	min	f (x)
s.t.	gị (x)	< 0; i = 1; . . . ; k s.t.	gi (x)	< 0; i = 1;	. . . ; k
hj (x) = 0; j = 1; . . . ; l .	hj (x) < 0; j = 1; . . . ; l
-hj (x ) < 0; j = 1;...; l .
min	f (x)
s.t. gì(x) < 0;	i = 1;...; k
hj (x ) = 0; j = 1; . . . ; l .
min f(x)
s.t. gi(x)	<	0;	i =	1;...; k
hj (x)	<	0;	j =	1;	.	. . ; l
-hj (x ) < 0; j = 1;...; l .
< —! =: Thêm biến bù
min	f (x )
s.t. gì(x) < 0;	i = 1;...; k
hj (x ) = 0; j = 1; . . . ; l .
min f (x )
s.t. gì (x) + Sì = 0;	i = 1; . . . ; k
hj (x )= 0;	j = 1;...; l
Sì > 0;	i = 1; . . . ; k .
min f(x)
s.t. gỉ (x) < 0; i = 1; 2; . . . ; k
hj (x) = 0; j = 1; 2;... ; l
I gi(x) < 0 gọi là ràng buộc bất đẳng thức, hj(x) = 0 gọi là ràng buộc đẳng thức.
min f(x)
s.t. gỉ (x) < 0; i = 1; 2; . . . ; k
hj (x) = 0; j = 1; 2;... ; l
I gi(x) < 0 gọi là ràng buộc bất đẳng thức, hj(x) = 0 gọi là ràng buộc đẳng thức.
I x thỏa mãn các điều kiện được gọi là một nghiệm chấp nhận được (feasible solution).
min f(x)
s.t. gỉ (x) < 0; i = 1; 2; . . . ; k
hj (x) = 0; j = 1; 2;... ; l
I gi(x) < 0 gọi là ràng buộc bất đẳng thức, hj(x) = 0 gọi là ràng buộc đẳng thức.
I x thỏa mãn các điều kiện được gọi là một nghiệm chấp nhận được (feasible solution).
I Tập hợp các nghiệm CND được gọi là mien CND (feasible region).
min f(x)
s.t. gỉ (x) < 0; i = 1; 2; . . . ; k
hj (x) = 0; j = 1; 2;... ; l
I gi(x) < 0 gọi là ràng buộc bất đẳng thức, hj(x) = 0 gọi là ràng buộc đẳng thức.
I x thỏa mãn các điều kiện được gọi là một nghiệm chấp nhận được (feasible solution).
I Tập hợp các nghiệm CND được gọi là mien CND (feasible region).
I Neu miền CND bằng rỗng ta nói bài toán không có nghiệm CND (infeasible), ngược lại là có nghiệm chấp nhận được (feasible).
min f (x)
s.t. gỉ (x) < 0;	i = 1; 2; . . . ; k
hj (x) = 0; j = 1; 2;... ; l .
I Với một nghiệm CND x, nếu
gi(x) = 0 ta nói gi active tại x.
min f (x)
s.t. gỉ (x) < 0;	i = 1; 2; . . . ; k
hj (x) = 0; j = 1; 2;... ; l .
I Với một nghiệm CND x, nếu gi(x) = 0 ta nói gi active tại x.
I Giá trị nhỏ nhất của f(x) trên miền CND gọi là giá trị tối ưu (optimal value), kí hiệu f*.
min f (x)
s.t. gỉ (x) < 0;	i = 1; 2; . . . ; k
hj (x) = 0; j = 1; 2;... ; l .
I Với một nghiệm CND x, nếu gi(x) = 0 ta nói gi active tại x.
I Giá trị nhỏ nhất của f(x) trên miền CND gọi là giá trị tối ưu (optimal value), kí hiệu f*.
I Nếu x là một nghiệm CND và f(x) = f* thì ta gọi x là một nghiệm tối ưu (optimal solution).
min f (x)
s.t. gỉ (x) < 0;	i = 1; 2; . . . ; k
hj (x) = 0; j = 1; 2;... ; l .
I Với một nghiệm CND x, nếu gi(x) = 0 ta nói gi active tại x.
I Giá trị nhỏ nhất của f(x) trên miền CND gọi là giá trị tối ưu (optimal value), kí hiệu f*.
I Nếu x là một nghiệm CND và f(x) = f* thì ta gọi x là một nghiệm tối ưu (optimal solution).
I Nếu x là một nghiệm CND và f(x) < f * + " thì ta gọi x là e-suboptimal.
Example: lasso
Given y G Rn, X G RnXp, consider the lasso problem:
min \\y - XII2 subject to IIBII1 < s
Is this convex? What is the criterion function? The inequality and
equality constraints? Feasible set? Is the solution unique, when:
n > p and X has full column rank?
p > n (“high-dimensional” case)?
How do our answers change if we changed criterion to Huber loss:
y p(y - xTBY p(z)= / 2z2 , „ |z| < ỏ ?
y iP	pu	Ụ|z|- 1Ỗ2 else ■
Example: support vector machines
Given y e {-1,1}n, X e RnXp with rows xi,... xn, consider the support vector machine or SVM problem:
1	n
min	2||p||2 + ơ^£i
P,P0,£	2	“1
subject to pi > 0, i = 1,...n
yi(xT p + Pop > 1 - pi, i = 1,...n
Is this convex? What is the criterion, constraints, feasible set? Is the solution (p,po, p) unique? What if changed the criterion to
2IIPII2 + 2 Po2 + cẺ£'01?
2	2	i=i
For original criterion, what about p component, at the solution?
I Khi không có điều kiện ràng buộc thì ta có bài toán tối ưu hóa không ràng buộc.
I Ngược lại ta có bài toán tối ưu hóa có ràng buộc.
I Khi không có điều kiện ràng buộc thì ta có bài toán tối ưu hóa không ràng buộc.
I Ngược lại ta có bài toán tối ưu hóa có ràng buộc.
Tiếp theo ta xét các loại bài toán tối ưu hóa
I tuyến tính
I lồi
I rời rạc.
Bà i toán tối ưu tuyến tính
Dạng chính tắc
min c Tx
s.t. Ax = b
x > 0.
Dạng chuẩn tắc
min
s.t.
c T x
Ax > b
Dạng tổng quát
min
s.t.
x > 0.
c Tx + d Ty Ax + By = a Cx + Dy > b x > 0.
Bài toán tối ưu
min f (x)
s.t. gỉ (x) < 0; i = 1; 2; . . . k
được gọi là là bài toán toi ưu loi nếu f và gi là các hàm lồi.
Bài toán tối ưu
min f (x)
s.t. gỉ (x) < 0; i = 1; 2; . . . k
được gọi là là bài toán toi ưu loi nếu f và gi là các hàm lồi.
Khi đó mỗi điều kiện ứng với một tập mức dưới lồi nên miền chấp nhận được là giao của chúng cũng là một tập lồi.
Bài toán tối ưu
min f (x)
s.t. gỉ (x) < 0; i = 1; 2; . . . k
được gọi là là bài toán toi ưu loi nếu f và gi là các hàm lồi.
Khi đó mỗi điều kiện ứng với một tập mức dưới lồi nên miền chấp nhận được là giao của chúng cũng là một tập lồi.
Bài toán tối ưu
min f(x)
s.t. gi(x) < 0; i = 1;...; k
hj(x) = 0; j = 1;---; 1.
là lồi nếu
Bài toán tối ưu
min f (x)
s.t. gỉ (x) < 0; i = 1; 2; . . . k
được gọi là là bài toán toi ưu loi nếu f và gi là các hàm lồi.
Khi đó mỗi điều kiện ứng với một tập mức dưới lồi nên miền chấp nhận được là giao của chúng cũng là một tập lồi.
Bài toán tối ưu
min f(x)
s.t. gi(x) < 0; i = 1;...; k
hj(x) = 0; j = 1;...; f và gi là các hàm lồi
I hj vừa là hàm lồi vừa là hàm lõm.
.
là lồi nếu
min f(x)
s.t. gi(x) < 0;	i = 1;...; k
hj(x) < 0;	j = 1;...; 1
-hj(x) < 0; j = 1;...; 1
Bài toán tối ưu lồi
Bổ đề
f : Rn —> R là hàm vừa loi vừa lõm khi và chỉ khi f là hàm affine.
Bài toán tối ưu lồi
Bổ đề
f : Rn —> R là hàm vừa loi vừa lõm khi và chỉ khi f là hàm affine.
Chứng minh.
f vừa là hàm lồi vừa là hàm lõm thì ta có
f(Ax + (1 — A)y) = Af(x) + (1 — A)f(y); VA 2 [0; 1];x; y 2 Rn.
Bài toán tối ưu lồi
Bổ đề
f : Rn ! R là hàm vừa loi vừa lõm khi và chỉ khi f là hàm affine.
Chứng minh.
f vừa là hàm lồi vừa là hàm lõm thì ta có
f(Ax + (1 — A)y) = Af(x) + (1 — A)f(y); VA 2 [0; 1];x; y 2 Rn.
Suy ra với mọi A 2 [0; 1] ta có
f (Ax) = f (Ax + (1 — A)0) = Af (x) + (1 — A)f (0);
Bài toán tối ưu lồi
Bổ đề
f : Rn —> R là hàm vừa loi vừa lõm khi và chỉ khi f là hàm affine.
Chứng minh.
f vừa là hàm lồi vừa là hàm lõm thì ta có
f(Ax + (1 — A)y) = Af(x) + (1 — A)f(y); VA 2 [0; 1];x; y 2 Rn. Suy ra với mọi A 2 [0; 1] ta có
f (Ax) = f (Ax + (1 — A)0) = Af (x) + (1 — A)f (0);
hay
g (Ax) = Ag (x)
với g(x) := f(x) - f(0).
Bổ đề
f : Rn ! R là hàm vừa loi vừa lõm khi và chỉ khi f là hàm affine.
Chứng minh.
f vừa là hàm lồi vừa là hàm lõm thì ta có
f(Ax + (1 — A)y) = Af(x) + (1 — A)f(y); VA 2 [0; 1];x; y 2 Rn.
Suy ra với mọi A 2 [0; 1] ta có
f (Ax) = f (Ax + (1 — A)0) = Af (x) + (1 — A)f (0);
hay
g (Ax) = Ag (x)
với g(x) := f(x) — f(0). Từ đó ta cũng suy ra với mọi A > 1 ta có
g(x) = g ( A(Axộ = A g(Ax) hay
18
Ag (x) = g (Ax).
Chứng minh.
Ta có
g(x + y) =	2x + 1 y) = 2f Qx + 2y) - 2f(0)
□
Chứng minh.
Ta có
g(x + y) =	2x + 1 y) = 2f Qx + 2y) - 2f(0)
= 2(1 f(x) +1 f(y)) - 2f(0)
□
Chứng minh.
Ta có
g(x + y) =	2x + 1 y) = 2f Qx + 2y) - 2f(0)
= 2(1 f(x) +1 f(y)} - 2f(0)
= f (x) +f (y) - 2f (0) = g(x) + g (y)-
□
Chứng minh.
Ta có
g(x + y) = 2g(^2x + 1 y) = 2f Qx + 2y) - 2f(0)
= 2(1 f(x) +1 f(y)} - 2f(0)
= f (x) +f (y) - 2f (0) = g(x) + g (y)-
Suy ra g là hàm tuyến tính và do đó f là hàm affine.	□
Chứng minh.
Ta có
g(x + y) = Như vậy bài toán tối ưu lồi sẽ có dạng min f(x)
s.t. gi(x) < 0; i = 1;...; k
Ax = b
với f và gi, i = 1; 2;... k, là các hàm lồi.
g(^2x + 1 y) = 2f Qx + 2y) - 2f(0)
= 2(1 f(x) +1 f(y)} - 2f(0)
= f (x) +f (y) - 2f (0) = g(x) + g (y).
19
Suy ra g là hàm tuyến tính và do đó f là hàm affine.	□
Tối ưu liên tục vs. tối ưu rời rạc
Dôi khi chúng ta đòi hỏi biến phải là số nguyên hay nhị phân. Ví dụ như khi biến của chúng ta là số ôtô cần để vận chuyển, số nhân lực, hay biến quyết định có làm một việc gì đó không.
Khi đó ta sẽ có bài toán tối ưu hóa nguyên hoặc tối ưu hóa nhị phân.
Trong nội dung môn học này chúng ta sẽ không xét đến dạng bài toán trên.
Xét bài toán tối ưu
min f (x)
s.t. gỉ (x) < 0; i = 1; 2; . . . ; k hj (x) = 0; j = 1; 2;... ; l .
Kí hiệu X là miền CND.
Xét bài toán tối ưu
min
f (x)
s.t.
gi (x) < 0; i = 1; 2; k hj (x)= 0; j = 1; 2;...; l .
Kí hiệu X là miền CND.
x 2 X được gọi là nghiệm tối ưu địa phương (locally optimal) nếu tồn tại R > 0 sao cho
f(x) < f(x); 8x 2 X : ||x — x||2 < R.
Xét bài toán tối ưu
min f (x)
s.t. gỉ (x) < 0; i = 1; 2; . . . ; k hj (x) = 0; j = 1; 2;... ; l .
Kí hiệu X là miền CND.
x 2 X được gọi là nghiệm tối ưu địa phương (locally optimal) nếu tồn tại R > 0 sao cho
f(x) < f(x); 8x 2 X : ||x — x||2 < R.
De phân biệt với nghiệm tối ưu địa phương với nghiệm tối ưu, ta còn gọi nghiệm tối ưu là nghiệm tối ưu toàn cục (globally optimal).
Cực tiểu địa phương của bài toán tối ưu lồi
Định lý
Nghiệm toi ưu địa phương của một bài toán toi ưu loi công là nghiệm tèi ưu toàn cục.
Chứng minh.
Chứng minh phản chứng dựa trên tính lồi của miền CND và hàm mục tiêu.	□
Điểm dừng (stationary point) x của một hàm khả vi f là một điểm tại đó Vf(x) = 0.
Điểm dừng (stationary point) x của một hàm khả vi f là một điểm tại đó Vf(x) = 0.
Ta sẽ thấy mỗi điểm cực trị địa phưong là một điểm dừng.
Điểm dừng (stationary point) x của một hàm khả vi f là một điểm tại đó Vf(x) = 0.
Ta sẽ thấy mỗi điểm cực trị địa phưong là một điểm dừng. Tuy nhiên cần lưu ý rằng không phải mọi điểm dừng đều là cực trị địa phưong.
Điểm dừng (stationary point) x của một hàm khả vi f là một điểm tại đó Vf(x) = 0.
Ta sẽ thấy mỗi điểm cực trị địa phưong là một điểm dừng. Tuy nhiên cần lưu ý rằng không phải mọi điểm dừng đều là cực trị địa phưong.
Ví dụ: f(x) = x3
f'(0) = 0 nhưng 0 không phải là một điểm cực trị.
Dường mức của một hàm so f : Rn ! R là một tập hợp có dạng
Lc (f) = {x I f (x) = c }:
Dường mức của một hàm so f : Rn ! R là một tập hợp có dạng
Lc(f) = {x I f(x) = c}.
f (x; y) = (x2 + y - 11)2 + (x + y2 - 7)2
Log-spaced level curve
Với hàm f khả vi, gradient tại một điểm hoặc bằng 0 hoặc vuông góc với đường mức tại điểm đó.
Với hàm f khả vi, gradient tại một điểm hoặc bằng 0 hoặc vuông góc với đường mức tại điểm đó.
Ví dụ: f(x; y) = x3 - 3x - 2y2
Tà i liệu tham khảo
n Chương 2 và chương 3, S. Boyd and L. Vandenberghe, Convex Optimization, Cambridge University Press.
n Chương 1, J. Nocedal and S. Wright, Numerical Optimization, Springer.
File đính kèm:
bai_giang_toi_uu_hoa_nang_cao_bai_2_cac_kien_thuc_co_so_hoan.doc
toi_uu_hoa_nang_cao02_fundamental_3203_560998.pdf