44
UNIVERSIDAD NACIONAL DE INGENIER ´ IA FACULTAD DE CIENCIAS ESCUELA PROFESIONAL DE MATEM ´ ATICA INTRODUCCI ´ ON AL AN ´ ALISIS CONVEXO Eladio OCA ˜ NA ANAYA 2012

Análsisi Convexo

Embed Size (px)

DESCRIPTION

a

Citation preview

Page 1: Análsisi Convexo

UNIVERSIDAD NACIONAL DE INGENIERIA

FACULTAD DE CIENCIAS

ESCUELA PROFESIONAL DE MATEMATICA

INTRODUCCION AL ANALISIS CONVEXO

Eladio OCANA ANAYA

2012

Page 2: Análsisi Convexo

Contenido

1 Convexidad 11.1 Conjuntos convexos . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Conos de IRn . . . . . . . . . . . . . . . . . . . . . . 31.1.2 Subespacio afın de IRn . . . . . . . . . . . . . . . . . 3

1.2 Propiedades topologicas . . . . . . . . . . . . . . . . . . . . 41.2.1 Propiedades relativas a abiertos . . . . . . . . . . . . 41.2.2 Propiedades relativas a cerrados . . . . . . . . . . . 6

1.3 Conos Asintoticos . . . . . . . . . . . . . . . . . . . . . . . . 101.4 Convexos y aplicaciones lineales . . . . . . . . . . . . . . . . 12

2 Funciones semicontinuas y convexas 152.1 Funciones semicontinuas . . . . . . . . . . . . . . . . . . . . 16

2.1.1 Regularizacion sci . . . . . . . . . . . . . . . . . . . 172.2 Funciones convexas de IRn en IR . . . . . . . . . . . . . . . 18

2.2.1 Funciones convexas de una variable real . . . . . . . 192.2.2 Funciones convexas de varias variables . . . . . . . . 21

2.3 Funciones asintoticas . . . . . . . . . . . . . . . . . . . . . . 23

3 Conjugacion y Subdiferencial 283.1 Teoremas de separacion . . . . . . . . . . . . . . . . . . . . 283.2 Conos polares . . . . . . . . . . . . . . . . . . . . . . . . . . 303.3 Funciones conjugadas . . . . . . . . . . . . . . . . . . . . . 313.4 Funciones indicatriz y soporte de un conjunto . . . . . . . . 343.5 Relaciones entre funcion asıntota y funcion conjugada . . . 363.6 Subdiferencial de una funcion convexa . . . . . . . . . . . . 373.7 Derivadas direccionales de una funcion convexa . . . . . . . 393.8 Derivadas de una funcion convexa . . . . . . . . . . . . . . 413.9 Subdiferencial de la suma de dos

funciones convexas . . . . . . . . . . . . . . . . . . . . . . . 42

Page 3: Análsisi Convexo

Capıtulo 1

Convexidad

1.1 Conjuntos convexos

Definicion 1.1.1 (conjunto convexo) Un conjunto C ⊂ IRn es llamadoconjunto convexo si

∀x ∈ C, ∀ y ∈ C, ∀ t ∈ [0, 1] =⇒ tx+ (1− t)y ∈ C.

Observacion. La definicion de convexidad es una propiedad unidimen-sional y no requiere de ninguna topologıa ni de otras estructuras matematicas.Se necesita solamente que el conjunto este dentro de un espacio vectorial.

Definicion 1.1.2 (combinacion convexa) Dados x ∈ IRn y C ⊂ IRn.Se dice que x es una combinacion convexa de C si existen p ∈ IN, {ti}pi=1 ⊂[0, 1] y {xi}pi=1 ⊂ C tales que

p∑i=1

ti = 1 y x =p∑i=1

tixi.

Observacion. Si denotamos por D el conjunto de todas las conbinacionesconvexas de C, entonces D es convexo.

La siguiente proposicion muestra una manera alternativa de definir unconjunto convexo.

Proposicion 1.1.1 Un conjunto C es convexo si y solo si C contiene atodas sus combinaciones convexas.

Demostracion. i) Claramente, si C contiene a todas sus combinacionesconvexas, entonces este es un conjunto convexo.

ii) Recıprocamente, asumamos que C es convexo y x ∈ IRn unacombinacion convexa de C. Entonces existen p ∈ IN, {ti}pi=1 ⊂ [0, 1] y{xi}pi=1 ⊂ C tales que

p∑i=1

ti = 1 y x =p∑i=1

tixi. (1.1)

Mostraremos que x ∈ C. Para tal efecto, procedemos por induccion:

1

Page 4: Análsisi Convexo

a) Debido a que C es convexo, la combinacion convexa de cada par depuntos de la coleccion {xi}pi=1 esta en C.

b) Por hipotesis inductiva, asumamos que la combinacion convexa decada subcoleccion de p− 1 elementos de {xi}pi=1 esta en C.

c) Ahora mostraremos que x ∈ C. De (1.1) podemos asumir, sin perdidade generalidad, que

∑p−1i=1 ti > 0 (caso contrario ti = 0 para todo

i = 1, · · · , p− 1, ası x = xp ∈ C). Denotemos

t =p−1∑i=1

ti y y =p−1∑i=1

titxi.

Entoncesp−1∑i=1

tit

= 1, tp = 1− t y x = ty + (1− t)xp.

Por la hipotesis inductiva, y ∈ C y por lo tanto x ∈ C.

Proposicion 1.1.2 Sea {Ci}i∈I una familia de conjuntos convexos de IRn

(I es un conjunto de indices finito, numerable o no numerable), entonces∩i∈ICi es tambien un conjunto convexo.

Demostracion. Queda como ejercicio para el lector.

Observacion. En general la union de dos conjuntos convexos no es con-vexo.

La Proposicion 1.1.2 nos permite hacer la siguiente definicion.

Definicion 1.1.3 (capsula convexa) Sea S ⊂ IRn, la capsula convexade S, denotada por co (S), es la interseccion de todos los conjuntos convexosque contienen a S.

Observacion. Debido a que todo el espacio Rn es en particular unconjunto convexo, entonces la familia de conjuntos convexos que contienena S es no vacıo.

La Proposicion 1.1.2 muestra que co (S) de un conjunto convexo, masaun, con respecto a la relacion de inclusion (que es una relacion de orden),este es el menor conjunto convexo que contiene a S.

Otra manera de escribir la capsula convexa de un conjunto es dadamediante la siguiente proposicion.

Proposicion 1.1.3 La capsula convexa co (S) es el conjunto de todas lascombinaciones convexas de S.

Demostracion. Sea D el conjunto de todas combinaciones convexas deS, entonces S ⊂ D. Debido a que D es convexo, entonces co (S) ⊂ D.Recıprocamente, sea y ∈ D, entonces y es una combinacion convexa deelementos de S. Debido a que S ⊂ co (S), el punto y tambien es unacombinacion convexa de elementos de co (S). Por la Proposicion 1.1.1,debido a que co (S) es convexo, y ∈ co (S).

2

Page 5: Análsisi Convexo

Corolario 1.1.1 S1 ⊂ S2 implica co (S1) ⊂ co (S2).

Demostracion.Queda como ejercicio para el lector.

1.1.1 Conos de IRn

Definicion 1.1.4 (cono) Un conjunto K ⊂ IRn es llamado cono, si

∀x ∈ K, ∀λ > 0 =⇒ λx ∈ K.

• K es llamado un cono sin punta si 0 /∈ K.

• K es llamado un cono convexo si este es, ademas de ser un cono, unconjunto convexo.

Proposicion 1.1.4 a) Sea K un cono, entonces este es convexo si y solosi K +K ⊂ K.

b) Si {Ki}i∈I es una familia (finita o infinita) de conos, entonces ∩i∈IKi

tambien es un cono.

Demostracion. Queda como ejercicio para el lector.

El item b) de la proposicion anterior nos permite definir la capsulaconica de un conjunto dado.

Definicion 1.1.5 (capsula conica) Dado un conjunto S ⊂ IRn, la capsulaconica de S, denotada por cono(S), es la interseccion de todos los conosque contienen a S.

Proposicion 1.1.5 Sea S ⊂ IRn.

a) cono(S) = {λx : x ∈ S, λ > 0},

b) Si S es convexo, entonces cono(S) tambien es convexo.

Demostracion. Queda como ejercicio para el lector.

Ejercicio. Para un conjunto S ⊂ IRn, la capsula convexa conica de S esla interseccion de todos los conos convexos que contienen a S. Demuestreque la capsula convexa conica de S y la capsula conica de co (S) coinciden.

1.1.2 Subespacio afın de IRn

Sea H ⊂ IRn. Se dice que H es un subespacio afın de IRn si existe a ∈ Htal que

H − a = {h− a : h ∈ H}es un subespacio vectorial de IRn.

Se sigue que H es convexo y que

H − a = H − b para todo a, b ∈ H.

Por definicion, la dimension de H (dim(H)) es la dimension del sube-spacio vectorial H − a.

3

Page 6: Análsisi Convexo

Proposicion 1.1.6 Sea {Hi}i∈I una familia de subespacios afines de IRn,entonces ∩i∈IHi tambien es un subespacio afın de IRn.

Demostracion. Queda como ejercicio para el lector.

La proposicion anterior nos permite hacer la siguiente definicion

Definicion 1.1.6 Dado un conjunto S ⊂ IRn, el subespacio afın generadopor S, denotado por aff (S), se define como la interseccion de todos lossubespacios afines que contienen a S.

Por definicion, la dimension de S es la dimension de aff (S).

Proposicion 1.1.7 Sean S ⊂ IRn y a ∈ S.

i) aff (S) = {a+∑pi=1 ti(bi − a) : p ∈ IN, {ti}pi=1 ∈ IR, {bi}pi=1 ∈ S}.

ii) S1 ⊂ S2 implica aff (S1) ⊂ aff (S2).

iii) aff (S) = aff (co(S)).

Demostracion. Queda como ejercicio para el lector.

1.2 Propiedades topologicas

1.2.1 Propiedades relativas a abiertos

Definicion 1.2.1 (conjuntos abiertos en IRn) Se dice que un conjuntoU ⊂ IRn es abierto (o abierto en IRn) si para todo x ∈ U , existe una bolaabierta B(x, r) con r > 0 tal que B(x, r) ⊂ U . Recordemos que una bolaabierta B(x, r) es un conjunto definido por

B(x, r) := {y ∈ IRn : ‖y − x‖ < r}

donde ‖·‖ representa una norma en IRn que puede ser por ejemplo la normaeuclidiana:

‖x‖ =√x2

1 + x22 + · · ·+ x2

n,

donde x = (x1, x2, · · · , xn).

Definicion 1.2.2 (conjuntos abiertos relativos) Sea H ⊂ IRn. Se diceque V ⊂ H es abierto en H si existe U ⊂ IRn abierto en IRn tal que

V = U ∩H.

Observaciones.

i) La Definicion 1.2.2 es una extension de la Definicion 1.2.1 en el sentidoque si H = IRn, entonces ambas definiciones coinciden.

4

Page 7: Análsisi Convexo

ii) En general, un conjunto puede ser abierto en H sin serlo en todo elespacio IRn. Considere por ejemplo

H = {(x, y) ∈ IR2 : 0 ≤ y = x} y V = {(x, y) ∈ IR2 : 1 < y = x < 2}

Entonces V es abierto en H ya que V = U ∩H, siendo U el produntode intervalos abiertos:

U = (1, 2)× (1, 2) o U = (1, 2)× IR o · · ·

Definicion 1.2.3 (interior e interior relativo) Sea S ⊂ IRn.

• El interior de S respecto a IRn (o simplemente interior de S), de-notado por int (S), es el mayor (en el sentido de inclusion) conjuntoabierto de IRn contenido en S, es decir,

int (S) =⋃

S⊃U : abiertoU.

• Sea H ⊂ IRn con S ⊂ H. El interior de S respecto a H, denotadopor intH(S), es el mayor conjunto abierto de H contenido en S, esdecir,

intH(S) =⋃

S⊃V : abierto en H

V.

Observe que en las definiciones de abierto relativo e interior relativo deun conjunto S respecto a un conjunto H, el conjunto H es consideradocualquier conjunto. El caso mas importante en optimizacion convexa escuando H = aff (S). Ası tenemos la siguiente definicion

Definicion 1.2.4 (interior respecto al subspacion afın generado) SeaS ⊂ IRn. El interior relativo de S, denotado por ri (S), es el interior de Scon respecto a aff (S).

Observacion. En general S1 ⊂ S2 implica int (S1) ⊂ int (S2). Noobstante, esta inclusion no se cumple para interior relativo. Considere porejemplo en IR2,

S1 = [0, 1]× {0} y S2 = [0, 1]× [0, 1].

Entonces

ri (S1) = (0, 1)× {0} y ri (S2) = (0, 1)× (0, 1).

Una propiedad topologica fundamental de los conjuntos convexos esdada en el siguiente teorema.

Teorema 1.2.1 El interior relativo de un conjunto convexo no vacıo esno vacıo.

5

Page 8: Análsisi Convexo

Demostracion. Sea x0 ∈ C ⊂ IRn. Denotemos p = dim(C) ≤ n, entoncesexisten x1, · · · , xp en C tal que {xi−x0}pi=1 es LI. Sea T la capsula convexadel conjunto {x0, x1, · · · , xp},

T =

{p∑i=0

tixi : {ti}pi=0 ⊂ [0, 1],p∑i=0

ti = 1

}

= x0 +

{p∑i=1

ti(xi − x0) : {ti}pi=1 ⊂ [0, 1],p∑i=1

ti ≤ 1

}y

T =

{p∑i=0

tixi : {ti}pi=0 ⊂ ]0, 1[ ,p∑i=0

ti = 1

}

= x0 +

{p∑i=1

ti(xi − x0) : {ti}pi=1 ⊂ ]0, 1[ ,p∑i=1

ti < 1

}

Entonces T ⊂ T y, por la convexidad de C, T ⊂ C. Por otro lado, elconjunto T es un conjunto abierto no vacıo de aff (C) debido a que Tes la imagen del conjunto abierto no vacıo (de IRp) {t = (t1, · · · , tp) ∈Rp++ :

∑pi=1 ti < 1} por medio de la aplicacion afın biyectiva

(t1, · · · , tp) ∈ IRp → x0 +p∑i=1

ti(xi − x0).

La demostracion queda establecida.

Corolario 1.2.1 Si C ⊂ IRn es convexo no vacıo, entonces aff (C) =aff (ri (C)).

Demostracion. Usando las notaciones de la demostracion del teoremaanterior, aff (T ) = aff (C) y por lo tanto aff (ri (C)) = aff (C).

Teorema 1.2.2 Si C es convexo entonces ri(C) es convexo.

Demostracion. Sean x, y ∈ ri (C) y t ∈ [0, 1], entonces existe r > 0 talque B(x, r)∩ aff (C) ⊂ C y B(y, r)∩ aff (C) ⊂ C. Se sigue que B(tx+ (1−t)y, r) ∩ aff (C) ⊂ C. Por lo tanto tx+ (1− t)y ∈ ri (C).

1.2.2 Propiedades relativas a cerrados

Definicion 1.2.5 (conjuntos cerrados en IRn) Se dice que un conjuntoC ⊂ IRn es cerrado (o cerrado en IRn) si IRn \ C es un conjunto abierto.

Similar a la definicion de abierto relativo, definimos el cerrado relativo.

Definicion 1.2.6 (conjuntos cerrados relativos) Sea H ⊂ IRn. Se diceque C ⊂ H es cerrado en H si H \ C es abierto en H.

6

Page 9: Análsisi Convexo

A diferencia de los conjuntos abiertos, la siguiente proposicion muestraque las definiciones previas de cerrado y cerrado relativo coinciden cuandoH es cerrado de IRn, en particular cuando H = aff (C).

Proposicion 1.2.1 Sean H ⊂ IRn y C ⊂ H. Asuma que H es cerradoen IRn. Entonces C es cerrado en H si y solo si C es cerrado en IRn.

Demostracion. (⇐) Asumamos que C es cerrado en IRn, entoncesIRn \ C es abierto (en IRn). Por definicion,

(IRn \ C) ∩H = H \ C

es abierto en H. Luego C es cerrado en H.(⇒) Assuma que C es cerrado en H, entonces H \ C es abierto en H.

Este implica que existe un abierto U de IRn tal que H \ C = U ∩ H. Sededuce que

C = H \ (H \ C) = H \ (U ∩H)= (IRn \ U) ∩H.

Por lo tanto C es cerrado en IRn.

Observacion. Debido a que nuestro interes en este curso son los conjun-tos abiertos relativos y cerrados relativos, ambos con respecto a su sube-spacio afın generado o con respecto a todo el espacio que contienen a estosconjuntos, entonces por la proposicion anterior, cada vez que hablemos queun conjunto C ⊂ Rn es cerrado, nos referiremos a que este es cerrado conrespecto a IRn.

Definicion 1.2.7 (Clausura de un conjunto) Sea S ⊂ IRn. La clausurade S respecto a IRn (o simplemente la clusura de S), denotado por S, esel menor (en el sentido de inclusion) conjunto cerrado conteniendo a S, esdecir,

S =⋂

S⊂C: cerradoC.

Proposicion 1.2.2 Si S ⊂ IRn, entonces aff (S) = aff (S).

Demostracion. Queda como ejercicio para el lector.

Observacion. Sabemos que en IR los conjuntos convexos son intervalosy que la clausura de estos siguen siendo intervalos y por lo tanto convexos.Una generalizacion de esta propiedad es dada en el siguiente resultado.

Proposicion 1.2.3 Si C ⊂ IRn es convexo, entonces C es convexo.

Demostracion. Sean a, b ∈ C, t ∈ [0, 1] y ε > 0. Existen a′, b′ ∈ C talesque ||a− a′|| ≤ ε y ||b− b′|| ≤ ε, luego

‖a′ + t(b′ − a′)− a+ t(b− a)‖ ≤ (1− t)‖a′ − a‖+ t‖b− b′‖ ≤ ε.

Este implica que a′ + t(b′ − a′) ∈ C.

7

Page 10: Análsisi Convexo

Proposicion 1.2.4 Sea C ⊂ IRn convexo no vacıo. Si x ∈ ri (C) y y ∈ C,entonces

x+ t(y − x) ∈ ri (C) para todo t ∈ [0, 1[ .

Demostracion. Sin perdida de generalidad, supongamos que dim(C) = n,pues aff (ri (C)) = aff (C) = aff (C). Sea t ∈ ]0, 1[, z = x + t(y − x) (sesupone que x 6= y), luego existe una vecindad convexa abierta V de x talque z /∈ V ⊂ C Sea

T = {y = z + r(x− x) : r > 0, x ∈ V } = x+⋃r>0

r(z − V ).

Este conjunto es abierto y contiene a y, entonces existe y ∈ T ∩ C. Con-sideremos ahora

W = {z = y + t(x− y) : t ∈ ]0, 1[ , x ∈ V } = y +⋃

t∈ ]0,1[

t(V − y).

Por construccion, W es convexo abierto satisfaciendo z ∈ W ⊂ C, estoimplica que z ∈ int (C).

Proposicion 1.2.5 Si C es no vacıo y convexo, entonces ri (C) = ri (C)y ri (C) = C.

Demostracion. i) Sabemos que C ⊂ C y aff (C) = aff (C), entoncesri (C) ⊂ ri (C). Para mostrar la otra inclusion, consideremos z ∈ ri (C) yx ∈ ri (C), entonces existe y ∈ C y t ∈ ]0, 1[ tal que z = x+ t(y − x). Porlo tanto, por la proposicion anterior, z ∈ ri (C).

ii) Sabemos que ri (C) ⊂ C. Sean y ∈ C y x ∈ ri (C), entonces paratodo n ∈ IN, zn = x+(1− 1

n )(y− x) ∈ ri (C), este implica que y ∈ ri (C).

Definicion 1.2.8 (Capsula convexa cerrada) Sea S ⊂ IRn, considere-mos la familia de todos los conjuntos convexos cerrados que contienen a S,esta familia es no vacıa porque contiene a IRn. La interseccion de todos losconjuntos de esta familia es el conjunto convexo cerrado mas pequeno (enel sentido de inclusion) que contiene a S. Esta interseccion es llamada lacapsula convexa cerrada de S y es denotada por co (S).

Proposicion 1.2.6 Sea S ⊂ IRn, entonces

co (S) = co (S).

Demostracion. Queda como ejercicio para el lector.

Observacion. Note que si S es cerrado, entonces co (S) no necesari-amente es cerrado. Considere por ejemplo S = {(x, y) ∈ IR2

++ : xy ≥1} ∪ {(0, 0)}.

Definicion 1.2.9 (Frontera y frontera relativa) Dado S ⊂ IRn, la fron-tera de S, denotada por Fr (S), es el conjunto

Fr (S) = {x ∈ S : x /∈ int (S)}.

Cuando S es convexo, la frontera relativa de S, denotada por Frel (S),es el conjunto

Frel (S) = {x ∈ S : x /∈ ri (S)}.

8

Page 11: Análsisi Convexo

Proposicion 1.2.7 Si C es convexo, entonces

Frel (C) = Frel (ri (C)) = Frel (C).

Demostracion. Queda como ejercicio para el lector.

Teorema 1.2.3 Sea x0 ∈ S ⊂ E fijo. Si x ∈ co (S), entonces existenp ∈ N, xi ∈ S, ti > 0, i = 1, · · · , p tales que los p vectores (xi − x0) sonlinealmente independientes y

x = x0 +p∑i=1

ti(xi − x0) yp∑i=1

ti ≤ 1.

Demostracion. Sea x ∈ co (S), por la Proposicion 1.1.3, existen p ∈ N , tiy xi, tales que

x = t0x0 +p∑i=1

tixi,

p∑i=0

ti = 1, xi ∈ S y ti ≥ 0 ∀i = 1, · · · , p.

Sin perdida de generalidad consideremos que xi 6= xj si i 6= j, entonces:

x = x0 +p∑i=1

ti(xi − x0),p∑i=1

ti ≤ 1, xi ∈ S, y ti > 0 ∀i = 1, · · · , p.

(1.2)El proceso de eliminacion de los (xi − x0) es como sigue:

1) Reducir la expresion de x en (1.2) eliminando los ti nulos.2) Si los vectores (xi − x0) son linealmente independientes, acabo.3) Caso contrario, existen λi, i = 1, · · · p tales que

0 =p∑i=1

λi(xi − x0),p∑i=1

|λi| > 0. (1.3)

Sin perdida de generalidad supondremos que:

p∑i=1

λi ≥ 0

(pues es siempre posible cambiar λi por −λi para todo i en la ecuacion(1.3)). Ahora calculemos i ∈ {1, · · · , p} tal que:

λiti

= max{λjtj

: j ∈ {1, · · · , p}}

Sin perdida de generalidad (despues de una eventual reenumeracion), tomemosp = i. Luego, de las ecuaciones (1.3) y (1.2) se tiene que:

(xp − x0) = −p−1∑i=1

λiλp

(xi − x0) y x = x0 +p−1∑i=1

(ti −tpλiλp

)(xi − x0).

Por otro lado, la condicion (1.3) implica que λp > 0 y

t′i = ti −tpλiλp≥ 0, i = 1, · · · , p− 1,

9

Page 12: Análsisi Convexo

p−1∑i=1

t′i =p∑i=1

ti −tpλp

[λp +p−1∑i=1

λi ] ≤p∑i=1

ti ≤ 1.

Obteniendose ası:

x = x0 +p−1∑i=1

t′i(xi − x0),p−1∑i=1

t′i ≤ 1, xi ∈ S y ti ≥ 0 ∀ i = 1, · · · , p− 1.

una ecuacion del tipo (1.2). Luego, retorne a la fase (1) del proceso. Encada etapa se disminuye la cantidad de vectores en al menos una unidad,lo cual implica que el proceso termina en un numero finito de etapas.

Corolario 1.2.2 (Teorema de Caratheodory) Sea ∅ 6= S ⊂ Rn. Lacapsula convexa de S es el conjunto de las combinaciones convexas de a lomas n+ 1 puntos de S.

Corolario 1.2.3 La capsula convexa de un conjunto cerrado y acotado escerrado y acotado.

Demostracion. Sea S ⊂ IRn cerrado y acotado (entonces compacto). Six ∈ co (S) entonces existen {x0, x1, · · · , xn} ⊂ S, {t0, t1, · · · , tn} ⊂ [0, 1]tales que

∑ni=0 ti = 1 y x =

∑ni=0 tixi. Consideremos

T = {t = (t0, · · · , tn) ∈ IRn+1 : {ti}ni=0 ⊂ [0, 1],n∑i=0

ti = 1}

y f : IRn × (IRn)n+1 → IRn definida por

f(t, x0, x1, · · · , xn) =n∑i=0

tixi.

Como T es compacto y f es continua, f(T × Sn+1) es compacto. Observeque co (S) = f(T × Sn+1), luego co (S) es compacto.

1.3 Conos Asintoticos

Sea C ⊂ IRn convexo no vacıo y a ∈ C, consideremos

C∞(a) = {d ∈ IRn : a+ λd ∈ C para todo λ > 0}.

Se observa inmediatamente que C∞(a) es un cono convexo con punta (i.e.,conteniendo a 0).

En general C∞(a) depende de a, consideremos por ejemplo C = IR2++∪

{(0, 0)}, entonces C es convexo y

C∞((0, 0)) = {(0, 0)} ∪ C y C∞((1, 1)) = IR2+.

Proposicion 1.3.1 Sea C ⊂ IRn convexo no vacıo y a ∈ C. Si C escerrado, entonces C∞(a) es cerrado.

10

Page 13: Análsisi Convexo

Demostracion. Sea {dn} ⊂ C∞(a) tal que dn → d y λ > 0, entoncesa + λdn ∈ C para todo n. Se deduce que a + λd ∈ C y por lo tantod ∈ C∞(a).

Definicion 1.3.1 Dado C ⊂ IRn convexo no vacıo, el cono de recesionde C (o cono asintotico de C), denotado por C∞, es el conjunto

C∞ =⋂a∈C

C∞(a).

Los elementos d ∈ C∞ son llamados direcciones de recesion de C.

Teorema 1.3.1 Sea C ⊂ IRn convexo cerrado no vacıo, entonces

C∞(a) = C∞(b) para todo a, b ∈ C.

Se deduce que C∞ = C∞(a) para todo a ∈ C. Por la Proposicion 1.3.1,C∞ es cerrado.

Demostracion. Sean a, b ∈ C, es suficiente mostrar que C∞(a) ⊂ C∞(b).Sean d ∈ C∞(a) y λ > 0, entonces para todo n ∈ IN, a + nλd ∈ C, luego(1− 1

n )b+ 1na+λd = (1− 1

n )b+ 1n (a+nλd) ∈ C, haciendo tender n→∞ y

utilizando el hecho que C es cerrado se tiene que b+λd ∈ C y por lo tantod ∈ C∞(b).

Proposicion 1.3.2 Sea C ⊂ IRn convexo cerrado y no vacıo. Entonces Ces acotado si y solo si C∞ = {0}.

Demostracion. Trivialmente C∞ = {0} cuando C es acotado. Paramostrar la recıproca, supongamos que C no es acotado, mostraremos queC∞ no se reduce al origen. Fijemos a ∈ C, entonces para todo n ∈ IN,existe xn ∈ C tal que ‖xn − a‖ ≥ n. Consideremos dn = xn−a

‖xn−a‖ , entoncesexiste d ∈ IRn con ‖d‖ = 1 y una subsucesion {dϕ(n)} de {dn} que convergea d. Se va a mostrar que d ∈ C∞. Sea λ > 0, como a ∈ C y xϕ(n) ∈ C,

entonces para todo t ∈ ]0, 1[ , a+ t‖xϕ(n)−a‖λ (λdϕ(n)) = a+ t(xϕ(n)−a) ∈ C.

Considerando tϕ(n) = λ‖xϕ(n)−a‖

se tiene que a + λdϕ(n) ∈ C para todon ≥ n0 con n0 suficientemente grande. Haciendo n → ∞, se deduce quea+ λd ∈ C.

Definicion 1.3.2 (Espacio de linealidad) Sea C ⊂ IRn convexo cer-rado no vacıo, el espacio de linealidad de C es el conjunto

C∞ ∩ (−C∞).

Es facil verificar que este conjunto es un subespacio vectorial de IRn. De-notando L = C∞ ∩ (−C∞) se tiene

C = L+ (C ∩ L⊥),

donde L⊥ = {y ∈ IRn : 〈x, y〉 = 0 para todo x ∈ L}.

Proposicion 1.3.3 Si {Ci} es una familia de conjuntos convexos cerradosde IRn tal que C = ∩Ci es no vacıo, entonces C∞ = ∩(Ci)∞.

Demostracion. Queda como ejercicio para el lector.

11

Page 14: Análsisi Convexo

1.4 Convexos y aplicaciones lineales

Sea A : IRn → IRp una aplicacion lineal, C ⊂ IRn y D ⊂ IRp. Es facilverificar que A(C) = {y ∈ IRp : ∃ x ∈ C con y = Ax} y A−1(D) = {x ∈IRn : Ax ∈ D} satisfacen las siguientes propiedades:

• Por la continuidad de A, A(C) ⊂ A(C) y A−1(D) es abierto (cerrado)cuando D es abierto (cerrado).

• Por la linealidad de A, A(C) es convexo cuando C es convexo yA−1(D) es convexo cuando D es convexo.

Proposicion 1.4.1 Si C ⊂ IRn es convexo no vacıo y A : IRn → IRp unaaplicacion lineal, entonces

A(ri (C)) = ri (A(C)) = ri (A(C)).

Demostracion. Es facil verificar que

A(ri (C)) ⊂ A(C) ⊂ A(C) = A(ri (C)) ⊂ A(ri (C)) ⊂ A(C).

Este implica que A(ri (C)) = A(C) = A(C) y como ri (D) = ri (D),

ri (A(C)) = ri (A(C)) = ri (A(ri (C))) ⊂ A(ri (C)).

Para mostrar la inclusion contraria de la ultima relacion, consideremosy ∈ A(ri (C)) y y ∈ ri (A(C)) (y existe debido a que A(C) 6= ∅). Luego,existen x ∈ ri (C) y x ∈ C tal que y = Ax y y = Ax. Como x ∈ ri (C),existe x ∈ ri (C) y t ∈ ]0, 1[ tal que x = tx + (1 − t)x y por lo tantoy = ty + (1 − t)y, con y = A(x). Debido a que y ∈ ri (A(C)) y y ∈ A(C),entonces se tiene que y ∈ ri (A(C)).

Observacion. Si C ⊂ IRn es cerrado no vacıo y A : IRn → IRp unaaplicacion lineal, ¿sera que A(C) es cerrado?. La respuesta es afirmativasi ademas el conjunto C es acotado, este es debido porque la imagen deun compacto por una aplicacion continua es compacto y en consecuenciacerrado. Este es falso en general, por ejemplo consideremos

C = {(x, y) ∈ IR2++ : xy ≥ 1} y A : IR2 → IR tal que A(x, y) = x.

Entonces A(C) = ]0,+∞[ no es cerrado. (Aquı A(C) es la proyeccion de Csobre el eje x).

El siguiente Teorema muestra que la condicion de compacidad en laafirmacion anterior puede ser debilitada.

Teorema 1.4.1 Sea A : IRn → IRp una aplicacion lineal y C ⊂ IRn con-vexo no vacıo. Si la siguiente condicion se verifica:

Ad = 0 y d ∈ (C)∞ ⇒ − d ∈ (C)∞,

entonces

a) A(C) = A(C);

12

Page 15: Análsisi Convexo

b) A((C)∞) = (A(C))∞.

Demostracion. i) Se cumple siempre A(C) ⊂ A(C) ⊂ A(C) ⊂ A(C).Denotando D = C, mostraremos que A(D) es cerrado. Sin perdida degeneralidad podemos suponer que 0 ∈ D. Sea L = D∞ ∩ (−D∞) ∩ {d :Ad = 0} y L⊥ el subespacio ortogonal de L. Denotando D = D ∩ L⊥,tenemos que D es cerrado, D = D + L y A(D) = A(D). De otro lado,

D∞ ∩ {d : Ad = 0} = (L⊥)∞ ∩D∞ ∩ {d : Ad = 0}= L⊥ ∩D∞ ∩ (−D∞) ∩ {d : Ad = 0}= {0}.

Mostraremos que A(D) es cerrado. Sea y ∈ A(D), entonces existe unasucesion {xn} en D tal que Axn → y. Denotemos

K = D ∩ {x : ‖Ax− y‖ ≤ 1},

entonces K es convexo y cerrado. Este tambien es acotado ya que {x :‖Ax− y‖ ≤ 1}∞ = {d : Ad = 0} y K∞ = (D)∞ ∩ {d : Ad = 0} = {0}. Sededuce que {xn} es acotada y por lo tanto admite un valor de adherenciax ∈ D, Ax = y y y ∈ A(D).

b) Mostraremos que A(D∞) = (A(D))∞. Sea d ∈ D∞, debido a que0 ∈ D, λd ∈ D para todo λ > 0 y por consiguiente

λA(d) = A(λd) ∈ A(D) para todo λ > 0.

Se deduce que Ad ∈ (A(D))∞. Recıprocamente, sea v ∈ (A(D))∞ =(A(D))∞ con v 6= 0. Debido a que 0 ∈ D, 0 ∈ A(D) y por consiguienteλv ∈ A(D) para todo λ > 0. En particular, para λ = 1, K = {d ∈ D : Ad =v} = D ∩ {d : Ad = v} es convexo, cerrado y no vacıo. Este tambien esacotado ya que K∞ = D∞∩{d : Ad = 0} = {0}. Debido a que nv ∈ A(D),existe dn ∈ K tal que ndn ∈ D. La sucesion {dn} siendo acotada esteadmite un valor de adherencia d ∈ K. Mostraremos que d ∈ (D)∞. Si eseno sucede, entonces existe λ > 0 tal que λd /∈ D. Debido a que 0 y ndnestan en D, λdn ∈ D para todo n > λ y por lo tanto, debido a que λd es unvalor de adherencia de {λdn} y D es cerrado, λd ∈ D, una contradiccion.

Proposicion 1.4.2 Si C, D ⊂ IRn son convexos, entonces ri (C)+ri (D) =ri (C +D).

Demostracion. Considere A : IRn × IRn → IRn definida por A(x, y) =x+ y, entonces A(C×D) = C+D. Es facil verificar que C×D es convexoy que ri (C ×D) = ri (C)× ri (D).

De manera general, la suma de dos convexos cerrados no necesariamentees cerrado. Considere por ejemplo en IR2,

C = {(x, y) : x > 0, y > 0, xy ≥ 1} y D = {(x, y) : y = 0, x ≤ 0},

entoncesC +D = {(x, y) : y > 0}.

13

Page 16: Análsisi Convexo

Corolario 1.4.1 Sean C, D ⊂ IRn convexos satisfaciendo

d ∈ (C)∞ ∩ (−D)∞ ⇒ − d ∈ (C)∞ ∩ (−D)∞ .

Entonces

C +D = C +D y (C +D)∞ = (C)∞ + (D)∞ .

Demostracion. Sea A : IRn × IRn → IRn definida por A(x, y) = x + y,entonces A(C ×D) = C +D y, teniendo en cuenta que C ×D = C ×D y(C ×D)∞ = (C)∞ × (D)∞, la condicion

Ad = 0 y d ∈ (C ×D)∞ ⇒ − d ∈ (C ×D)∞

es equivalente a

d1 ∈ (C)∞ y − d1 ∈ (D)∞ ⇒ − d1 ∈ (C)∞ y d1 ∈ (D)∞.

Aplicar el Teorema 1.4.1.

14

Page 17: Análsisi Convexo

Capıtulo 2

Funciones semicontinuas yconvexas

Dada una funcion f : S → IR con S ⊂ IRn, siempre se puede extender auna funcion g : IRn → IR definida por:

g(x) ={

f(x) si x ∈ S+∞ si x /∈ S.

De ahora en adelante supondremos que las funciones estan definidassobre IRn con valores en IR.

Dada f : IRn → IR y λ ∈ IR, consideremos los siguientes conjuntos:

dom (f) := {x ∈ IRn : f(x) < +∞} dominio de f

epi (f) := {(x, λ) ∈ IRn × IR : f(x) ≤ λ} epıgrafo de f

epi (f) := {(x, λ) ∈ IRn × IR : f(x) < λ} epıgrafo estricto de f

Sλ(f) := {x ∈ IRn : f(x) ≤ λ} λ−subnivel de f

Sλ(f) := {x ∈ IRn : f(x) < λ} λ−subnivel estricto de f

Claramente se verifican las siguientes relaciones entre estos conjuntos:

• dom (f) =⋃λ∈IR Sλ(f) =

⋃λ∈IR Sλ(f);

• dom (f) = proj IRn(epi (f)) = proj IRn(epi (f));

• λ < µ ⇒ Sλ(f) ⊂ Sλ(f) ⊂ Sµ(f) ⊂ Sµ(f);

• λ < µ y (x, λ) ∈ epi (f) ⇒ (x, µ) ∈ epi (f);

• f(x) = inf[λ : (x, λ) ∈ epi (f)] = inf[λ : x ∈ Sλ(f)];

• f(x) = inf[λ : (x, λ) ∈ epi (f)] = inf[λ : x ∈ Sλ(f)];

• f1 ≤ f2 ⇔ epi (f1) ⊃ epi (f2)⇔ Sλ(f1) ⊃ Sλ(f2) para todo λ ∈ IR;

15

Page 18: Análsisi Convexo

• f1 ≤ f2 ⇔ epi (f1) ⊃ epi (f2) ⇔ Sλ(f1) ⊃ Sλ(f2) para todo λ ∈ IR;

• Sλ(f)× {λ} = epi (f)⋂

[IRn × {λ}] para todo λ ∈ IR;

• Sλ(f)× {λ} = epi (f)⋂

[IRn × {λ}] para todo λ ∈ IR.

2.1 Funciones semicontinuas

Se dice que f : IRn → IR es

• semicontinua inferiormente (sci) en x0 si para todo λ < f(x0) existeuna vecindad V de x tal que λ < f(x) para todo x ∈ V ;

• semicontinua superiormente (scs) en x0 si −f es sci en x0, es decir sipara todo λ > f(x0) existe una vecindad V de x tal que λ > f(x)para todo x ∈ V ;

• sci (scs) si este es sci (scs) en todo x ∈ IRn.

Teorema 2.1.1 f es sci ⇐⇒ epi (f) cerrado ⇐⇒ Sλ(f) cerrado paratodo λ ∈ IR.

Demostracion. a) f sci ⇒ epi (f) es cerrado. En efecto, se va mostrarque [epi (f)]c es abierto. Sea (x0, λ0) /∈ epi (f), entonces λ0 < f(x0). Seaµ tal que λ0 < µ < f(x0) entonces debido a que f es sci en x0, existeuna vecindad V de x0 tal que x ∈ V ⇒ µ < f(x), lo cual implica queV× ]−∞, µ[ es una vecindad de (x0, λ0) que no intersecta al epi (f).

b) epi (f) cerrado ⇒ Sλ(f) cerrado. Este se deduce de la igualdad

Sλ(f)× {λ} = epi (f) ∩ [IRn × {λ}].

c) Sλ(f) es cerrado para todo λ ∈ IR⇒ f es sci. En efecto, si f(x0) =−∞ entonces f es sci en x0 por definicion. Si f(x0) > −∞ entonces paratodo λ < f(x0) se tiene que x0 /∈ Sλ(f) y por lo tanto, por ser Sλ(f)cerrado, existe una vecindad V de x0 tal que x /∈ Sλ(f) para todo x ∈ V ,es decir λ < f(x) para todo x ∈ V .

Las siguientes propiedades son clasicas y bastante conocidas:

Proposicion 2.1.1 Sean f, g : IRn → IR, entonces

• si f y g son sci en x0 entonces f+g, min(f, g) y kf , para todo k > 0,son sci en x0.

• si {fi}i∈I es una familia arbitraria de funciones sci en x0, entonces lafuncion supi∈Ifi definida por (supi∈Ifi)(x) = supi∈Ifi(x) para todox, es sci en x0.

Proposicion 2.1.2 Sea C ⊂ IRn compacto no vacıo y f sci en C, entoncesexiste x ∈ C tal que f(x) = inf[f(x) : x ∈ C].

Demostracion. Para todo λ > α = inf[f(x) : x ∈ C] los conjuntosKλ = {x ∈ C : f(x) ≤ λ} = C∩Sλ(f) son compactos no vacıos y encajados:µ, λ > α con µ > λ ⇒ Kµ ⊃ Kλ. Se sigue que K = ∩λ>αKλ es no vacıo.Todo x ∈ K satisface f(x) = inf[f(x) : x ∈ C].

16

Page 19: Análsisi Convexo

Sean X ⊂ IRn, Y ⊂ IRm y ϕ : X × Y → IR, consideraremos muy amenudo la funcion h llamada funcion marginal definida por

h(x) = infy∈Y

ϕ(x, y).

La siguiente proposicion muestra que h hereda la propiedad de sci de ϕcuando Y es considerado compacto.

Proposicion 2.1.3 Si Y es compacto y ϕ sci en (x, y) para todo y ∈ Y ,entonces h es sci en x y

S(x) := {y ∈ Y : h(x) = ϕ(x, y)}

es compacto no vacıo.

Demostracion. La compacidad de Y y la semicontinuidad inferior de lafuncion ϕ(x, .) : Y → IR implican que S(x) es un compacto no vacıo. Seaλ < h(x) y µ tales que λ < µ < h(x). Sea y ∈ Y , debido a que µ < ϕ(x, y)entonces existe Vy vecindad abierta de x, Wy vecindad abierta de y talesque µ < ϕ(x, y) para todo (x, y) ∈ Vy × Wy. Como Y es compacto yY = ∪y∈YWy, existe un subconjunto finito J de Y tal que Y = ∪j∈JWyj .Haciendo V = ∩j∈JVyj

, se tiene que V es una vecindad abierta de x. Luego,para todo (x, y) ∈ V × Y , se tiene que ϕ(x, y) > µ > λ y ası se tiene queh(x) ≥ µ > λ.

2.1.1 Regularizacion sci

Asociado a una funcion f : IRn → IR, consideremos

= = {g : IRn → IR : g es sci y g(x) ≤ f(x) para todo x ∈ IRn}.

Note que = es no vacıo pues este contiene a la funcion identicamente −∞.

La regularizacion sci de f , denotada por f (o cl (f)), es la funcionsupg∈=g definida por (supg∈=g)(x) = supg∈=g(x) para todo x. Esta funciones la mas grande funcion sci que esta mayorada por f .

Proposicion 2.1.4 epi (f) = epi (f) y Sλ(f) = ∩µ>λSµ(f).

Demostracion. Se tiene f ≤ f y por lo tanto epi (f) ⊃ epi (f). De-bido a que f es sci, epi (f) es cerrado y por lo tanto epi (f) ⊃ epi (f).Recıprocamente, sea g definida por g(x) = inf[λ : (x, λ) ∈ epi (f)] paratodo x. Entonces epi (g) = epi (f) y por lo tanto g ∈ =. Se deduce queg ≤ f y de este epi (f) ⊂ epi (g) = epi (f).

La segunda igualdad se deduce de la primera, los detalles quedan comoejercicio para el lector.

Proposicion 2.1.5 f es sci en x0 si y solo si f(x0) = f(x0).

Demostracion. Sabemos que f ≤ f . Si f(x0) < f(x0) elegimos λ tal quef(x0) < λ < f(x0). Debido a que ((x0), f(x0)) ∈ epi (f) = epi (f), entoncespara cada vecindad V de x0, epi (f) ∩ (V× ]−∞, λ[ ) 6= ∅ y por lo tanto

17

Page 20: Análsisi Convexo

para cada vecindad V de x0, existe x ∈ V tal que f(x) < λ lo que implicaque f no es sci en x0. Para la recıproca, sea λ < f(x0). Debido a que f essci y f(x0) = f(x0), existe una vecindad V de x0 tal que λ < f(x) ≤ f(x)para todo x ∈ V . Por lo tanto f es sci en x0.

Observacion. En vista a la Proposicion 2.1.4, sabemos que Sλ(f) =⋂µ>λ Sµ(f). El siguiente ejemplo muestra que no siempre se cumple Sλ(f) =

Sλ(f). Consideremos

f(x) ={

x2 si x 6= 0,1 si x = 0.

EntoncesS0(f) = ∅ y S0(f) = {0}.

2.2 Funciones convexas de IRn en IR

En todo lo que sigue haremos uso de la siguiente convencion:

∞+ α = α+∞ = +∞ para todo α ∈ IR;

−∞+ α = α−∞ = −∞ para todo α ∈ IR;

(−∞) +∞ =∞+ (−∞) = +∞.

Definicion 2.2.1 Se dice que f : IRn → IR es convexa si epi (f) es con-vexo.

Por ejemplo la funcion f : IR→ IR definida por

f(x) =

+∞ si x < 0,1 si x = 0,−∞ si x > 0.

es convexa.

Las siguientes propiedades pueden ser verificadas facilmente:

1. f es convexa si y solo si epi (f) es convexo;

2. f es convexa si y solo si para todo x, y ∈ IRn y para todo t ∈ ]0, 1[ secumple

f(tx+ (1− t)y) ≤ tf(x) + (1− t)f(y);

3. f es convexa si y solo si para todo x ∈ IRn y para todo d ∈ IRn lafuncion de una variable real fa,d definida por fx,d(t) = f(x + tx) esconvexa;

4. Si f es convexa, entonces dom (f) = proj IRn(epi (f)) es convexa ypara todo λ ∈ IR, Sλ(f) es convexo;

5. Si f es convexa, entonces f es convexa;

18

Page 21: Análsisi Convexo

6. Si f es convexa y λ > 0 entonces λf es convexa;

7. Si f : IRn → IR es convexa y k : IR → IR convexa creciente entoncesla composicion k ◦ f es convexa;

8. Si f y g son convexas, entonces f + g es convexa;

9. Sea {fi}i∈I una familia de funciones convexas definidas sobre IRn

entonces la funcion supi∈I fi es convexa.

Similar a la Proposicion 2.1.3, la funcion marginal tambien hereda laconvexidad de la funcion ϕ.

Proposicion 2.2.1 Sea ϕ : IRn × IRp → IR convexa y h : IRn → IRdefinida por

h(x) = infy∈IRp

ϕ(x, y).

Entonces h es convexa.

Demostracion. Debido a que

h(x) < λ⇐⇒ ∃ y tal que ϕ(x, y) < λ,

se deduce queepi (h) = proj IRn×IR(epi (ϕ).

Por lo tanto epi (h) convexo que es equivalente a la convexidad de h.

La siguiente proposicion es fundamental.

Proposicion 2.2.2 Sea f : IRn → IR convexa. Si existe x0 tal que f(x0) =−∞, entonces f(x) = −∞ para todo x ∈ ri (dom (f)).

Demostracion. Sea x ∈ ri (dom (f)), entonces existen t ∈ ]0, 1[ e y ∈dom (f) tal que x = tx0 +(1− t)y. Se sigue que f(x) ≤ tf(x0)+(1− t)f(y)y por lo tanto f(x) = −∞.

De esta proposicion se deduce que f no puede tomar valor finito fuerade la frontera relativa de su dominio. Afın de evitar tales patologıas, tra-bajaremos principalmente con las funciones llamadas propias.

Definicion 2.2.2 Se dice que una funcion f : IRn → R es propia si sudominio es no vacıo y f(x) > −∞ para todo x ∈ IRn.

2.2.1 Funciones convexas de una variable real

Hemos visto que una funcion f : IRn → IR es convexa si y solo si para todox, d ∈ IRn la funcion fx,d : IR → IR definida por fx,d(t) = f(x + td) esconvexa. Ası, similar al caso de conjuntos, la convexidad de funciones esuna propiedad unidimensional.

En esta seccion estudiaremos primeramente la convexidad de funcionesde una sola variable real para luego extenderla en la siguiente seccion afunciones de varias variables.

Si θ : IR→ R es convexa, entonces dom (θ) es convexo y por lo tanto esun intervalo.

19

Page 22: Análsisi Convexo

Teorema 2.2.1 Sea I un intervalo no vacıo de IR y θ : I → R. Cada unade las tres condiciones siguientes es equivalente a la convexidad de θ:

θ(c)− θ(a)c− a

≤ θ(c)− θ(b)c− b

∀ a, b, c ∈ I tales que a < b < c, (2.1)

θ(b)− θ(a)b− a

≤ θ(c)− θ(a)c− a

∀ a, b, c ∈ I tales que a < b < c, (2.2)

θ(b)− θ(a)b− a

≤ θ(c)− θ(b)c− b

∀ a, b, c ∈ I tales que a < b < c. (2.3)

Demostracion. Es claro que θ es convexa si y solamente si para todoa, b, c ∈ I tales que a < b < c, aquı existe t ∈]0, 1[ tal que b = ta+ (1− t)c.Luego, se tiene que

θ(b) ≤ tθ(a) + (1− t)θ(c).

Esta desigualdad es equivalente a cada una de las tres condiciones sigu-ientes:

t [ θ(c)− θ(a)] ≤ [ θ(c)− θ(b)],θ(b)− θ(a) ≤ (1− t) [ θ(c)− θ(a)],

t [θ(b)− θ(a)] ≤ (1− t) [ θ(c)− θ(b)].

Reemplazar t por su valor en funcion de a, b, c.

Se deduce el siguiente resultado.

Teorema 2.2.2 Sea I un intervalo no vacıo de R y θ : I → R convexa.Sean a, b, c ∈ I tales que a < b < c. Entonces θ es continua en b y admitederivadas por la izquierda y por la derecha en ese punto. Ademas

θ(b)− θ(a)b− a

≤ θ′−(b) ≤ θ′+(b) ≤ θ(c)− θ(b)c− b

. (2.4)

Demostracion. Tome y2, y1, x1, x2 tales que a < y2 < y1 < b < x1 <x2 < c. Se obtienen las siguientes desigualdades de monotonıa

θ(a)− θ(b)a− b

≤ θ(y2)− θ(b)y2 − b

≤ θ(y1)− θ(b)y1 − b

≤ · · ·

· · · ≤ θ(x1)− θ(b)x1 − b

≤ θ(x2)− θ(b)x2 − b

≤ θ(c)− θ(b)c− b

.

Hacer y → b− y x → b+. Se obtiene la existencia de las dos derivadaslaterales. De las desigualdades previas tambien se obtiene la continuidadde θ en b.

Corolario 2.2.1 Toda funcion convexa de una variable real es continuaen el interior de su dominio.

Corolario 2.2.2 Sean I un intervalo no vacıo de IR y θ : I → IR convexa.Entonces para todo a, b, c ∈ int (I) tales que a < b < c se tiene que

θ′+(a) ≤ θ(b)− θ(a)b− a

≤ θ′−(b) ≤ θ′+(b) ≤ θ(c)− θ(b)c− b

≤ θ′−(c).

20

Page 23: Análsisi Convexo

Si θ es derivable, las dos semi-derivadas coinciden. Se obtiene entonceslas caracterizaciones de primer orden.

Proposicion 2.2.3 Sea I un intervalo abierto no vacıo de IR y θ : I → IRderivable en I. Las tres condiciones siguientes son equivalentes:

(a) θ es convexa en I;

(b) (t− s)(θ′(t)− θ′(s)) ≥ 0 para todo t, s ∈ I;

(c) θ(t) ≥ θ(s) + (t− s)θ′(s) para todo t, s ∈ I.

Demostracion. Si θ es convexa, se obtiene (b) y (c) a partir del corolarioprecedente. Supongamos (b) y sean a, b, c ∈ I con a < b < c. Como θ esderivable y θ′ es creciente, entonces existen r y s tales que

a < r < b < s < c,θ(b)− θ(a)b− a

= θ′(r) ≤ θ′(s) =θ(c)− θ(b)c− b

.

Por lo tanto θ es convexa. Finalmente, supongamos (c), entonces para todot ∈ I, θ(t) = sups∈I [θ(s) + (t − s)θ′(s)] (hacer s = t). Ası θ es convexacomo lo es el sup de funciones afines.

La caracterizacion de segundo orden de la convexidad es un corolariodirecto de la proposicion previa.

Proposicion 2.2.4 Sea I un intervalo abierto no vacıo de IR y θ : I → IRdos veces derivable en I, entonces θ es convexo sobre I si y solo si θ′′(t) ≥ 0para todo t ∈ I.

2.2.2 Funciones convexas de varias variables

En esta seccion extenderemos los resultados de la seccion previa a funcionesde varias variables.

Proposicion 2.2.5 Sea f : IRn → IR convexa y propia, entonces f es scien ri (dom (f)) y continua en int (dom (f)). En particular f(x) = f(x)para todo x ∈ ri (dom (f)).

Demostracion. a) Sea x0 ∈ ri (dom (f)). Si f no es sci en x0, entoncesf(x0) < f(x0). Tenemos x0 ∈ Sf(x0)(f) = ∩λ>f(x0)Sλ(f). Sea Sλ(f) con

λ ∈ ]f(x0), f(x0)[ y x ∈ ri (Sλ(f)) (tal x existe debido a que Sλ(f) 6= ∅).Consideremos θ : IR→ IR definida por θ(t) = f(x0 + t(x−x0)), debido a laconvexidad de f , 0 ∈ int (dom (θ)) (ya que x0 ∈ ri (dom (f)) y x ∈ dom (f))y por consiguiente θ es continua en 0. De otro lado, para todo t ∈ ]0, 1[ ,x0 + t(x−x0) ∈ Sλ(f) y por consiguiente f(x0 + t(x−x0)) = θ(t) ≤ λ. Porla continuidad de θ en 0 se deduce f(x0) = θ(0) ≤ λ, en contradiccion conλ ∈]f(x0), f(x0)[. Por lo tanto f(x) = f(x) para todo x ∈ ri (dom (f)).

b) Por el item anterior, es suficiente mostrar que f es scs en int (dom (f)).Sea x0 ∈ int (dom (f)) y λ > f(x0). Para i = 1, · · · , n, consideremos lafuncion θi : IR → IR definida por θi(t) = f(x0 + tei) donde {e1, · · · , en}es la base canonica de IRn. Siendo las funciones θi convexas con 0 ∈int (dom (θi)), estas son continuas en 0. Debido a que θi(0) = f(x0) < λ,existe ti > 0 tal que f(x0 + tei) = θi(t) < λ para todo t ∈ [−ti, ti]. Por laconvexidad de Sλ(f) se deduce que co ({x0 ± tiei}) ⊂ Sλ(f).

21

Page 24: Análsisi Convexo

Proposicion 2.2.6 Si f es convexa propia, entonces f tambien es convexapropia.

Demostracion. Se sabe que si A : IRp → IRq es una aplicacion continuay C ⊂ IRp, entonces A(C) ⊂ A(C). Haciendo C = epi (f) y A = proj IRn ,se deduce que dom (f) ⊂ dom (f) ⊂ dom (f) y por lo tanto ri (dom (f)) =ri (dom (f)). Si f(x0) = −∞ entonces f(x) = f(x) = −∞ para todox ∈ ri (dom (f)) y por lo tanto f no es propia.

Proposicion 2.2.7 Sean C un convexo abierto no vacıo de Rn y f : C →R diferenciable sobre C. Las tres condiciones siguientes son equivalentes:

(a) f es convexa sobre C;(b) 〈∇f(x)−∇f(y), x− y〉 ≥ 0 para todo x, y ∈ C;(c) f(y) ≥ f(x) + 〈∇f(x), x− y〉 para todo x, y ∈ C.

Proposicion 2.2.8 Sea C un convexo abierto no vacıo de Rn y f : C →R dos veces diferenciable sobre C. Entonces f es convexa sobre C si ysolamente si la matriz ∇2f(x) es semi-definida positiva para todo x ∈ C.

Observacion. Por la Proposicion 2.2.5 una funcion convexa es continuaen el interior de su dominio. El siguiente ejemplo muestra que en gen-eral una funcion convexa, aun asumiendo la condicion de semicontinuidadinferior, este no es continua en la frontera de su dominio.

Sea f : IR2 → IR defnida por

f(x, y) =

{x2

y si y > 0,+∞ caso contrario.

Debido a que

∇2f(x, y) =2y3

(y2 −xy−xy x2

)para todo (x, y) ∈ IR× ]0,∞[ ,

f es convexa sobre IR×]0,+∞[ . De otro lado, para cada µ ∈ IR,

Sµ(f) =

{(x, y) : y > 0, x2 − µy ≤ 0} si µ ≥ 0,

∅ si µ < 0,

y por lo tanto, por la Proposicion 2.1.4, para cada λ ∈ IR,

Sλ(f) =⋂µ>λ

Sµ(f) =

{(x, y) : y ≥ 0, x2 − λy ≤ 0} si λ ≥ 0,

∅ si λ < 0.

Se deduce que

f(x, y) = inf[λ : (x, y) ∈ Sλ(f)] =

x2

y si y > 0,0 si x = y = 0,

+∞ caso contrario.

Siendo f sci, este no es scs en (0, 0) ya que f( 1n ,

1n2 ) = 1 para todo n ∈ IN.

22

Page 25: Análsisi Convexo

Proposicion 2.2.9 Sea f convexa propia, entonces

dim(Sλ(f)) = dim(dom (f)) para todo λ > infxf(x).

Demostracion. Como f es propia, entonces existe x0 ∈ dom (f) tal quef(x0) < λ. Sea x1 ∈ ri (dom(f)), entonces f [(x0 + t(x1 − x0)) = f(xt) ≤f(x0) + t[f(x1) − f(x0)] y por lo tanto existe t ∈]0, 1[ tal que f(xt) < λ.Como xt ∈ ri (dom(f)), la restriccion de f al aff (dom(f)) es continua enxt y en consecuencia Sλ(f) contiene una vecindad de xt en la topologıa deaff (dom(f)).

2.3 Funciones asintoticas

Sea f : IRn → IR una funcion convexa sci propia, entonces epi (f) es unconjunto convexo cerrado no vacıo. Sea F = epi (f), entonces F∞ es uncono convexo cerrado con (0, 1) ∈ F∞. Por lo tanto se cumple la siguienterelacion:

(d, λ) ∈ F∞ y µ > λ⇒ (d, µ) ∈ F∞.Se deduce que F∞ es no vacıo y es el epıgrafo de una funcion convexa scillamada la funcion asintotica de f (o funcion de recesion de f) denotadapor f∞ (o por f0+).

Proposicion 2.3.1 Sea f una funcion convexa sci propia, entonces f∞ espositivamente homogenea de grado 1, es decir

f∞(0) = 0 y f∞(kd) = kf∞(d) para todo k > 0.

Demostracion. a) Como (0, 0) ∈ (epi (f))∞, se tiene f∞(0) ≤ 0. Deotro lado, debido a que f es propia, existe a tal que f(a) < +∞ y por lotanto (a, f(a)) ∈ epi (f). De este y de (0, f∞(0)) ∈ (epi (f))∞, se deduce(a + λ0, f(a) + λf∞(0)) ∈ epi (f) para todo λ > 0 y por lo tanto f(a) ≤f(a) + λf∞(0) para todo λ > 0. Se sigue que f∞(0) ≥ 0.

b) Sea (d, f∞(d)) ∈ (epi (f))∞, entonces (kd, kf∞(d)) ∈ (epi (f))∞y por lo tanto f∞(kd) ≤ kf∞(d) para todo k > 0. Similarmente, sea(kd, f∞(kd)) ∈ (epi (f))∞, entonces (d, 1

kf∞(kd)) ∈ (epi (f))∞ y por lotanto f∞(d) ≤ 1

kf∞(kd) para todo k > 0.

Proposicion 2.3.2 Sea f : IRn → IR convexa sci propia y a ∈ dom (f),entonces

f∞(d) = supk>0

f(a+ kd)− f(a)k

,

= limk→+∞

f(a+ kd)− f(a)k

,

= limk→+∞

f(a+ kd)k

.

Demostracion. Sean d ∈ IRn and (a, f(a)) ∈ epi (f), se tiene dos casos: i)si f∞(d) =∞, entonces para todo α ∈ IR, (d, α) /∈ epi (f∞) y por lo tantoexiste k = k(α) > 0 tal que (a+ kd, f(a) + kα) /∈ epi (f). Se sigue que

α <f(a+ kd)− f(a)

k≤ sup

k>0

f(a+ kd)− f(a)k

23

Page 26: Análsisi Convexo

y por lo tanto

f∞(d) =∞ = supk>0

f(a+ kd)− f(a)k

.

ii) si (d, f∞(d)) ∈ (epi (f))∞, entonces (a+kd, f(a)+kf∞(d)) ∈ (epi (f))∞para todo k > 0 y por lo tanto

f(a+ kd)− f(a)k

≤ f∞(d) para todo k > 0.

Se deduce que

supk>0

f(a+ kd)− f(a)k

≤ f∞(d).

Para mostrar la otra desigualdad, sea m ≥ supk>0f(a+kd)−f(a)

k , entoncesf(a + kd) ≤ f(a) + km para todo k > 0 y por lo tanto (a + kd, f(a) +kf∞(d)) ∈ (epi (f))∞ para todo k > 0. Se sigue que (d,m) ∈ (epi (f))∞ ypor lo tanto f∞(d) ≤ m. Ası,

supk>0

f(a+ kd)− f(a)k

≥ f∞(d).

Finalmente las dos ultimas igualdades de la proposicion se cumplendebido a que la funcion ]0,∞[3 k → f(a+kd)−f(a)

k es monotona creciente.

Ejemplo. 1) Sea f : R → R definida por f(x) = ex, entonces

f∞(d) ={

0 si d ≤ 0,+∞ si d > 0.

2) Sea f : Rn → R definida por f(x) = 12 〈x,Ax〉 − 〈b, x〉 con A simetrica

semidefinida positiva, entonces

f∞(d) ={−〈b, d〉 si Ad = 0,+∞ en caso contrario.

3) Sea f : Rn → R definida por f(x) = ‖x‖, entonces

f∞(d) ={

0 si d = 0,+∞ en caso contrario.

Teorema 2.3.1 Sea f una funcion convexa sci y propia, entonces f∞ espropia y S0(f∞) = [Sλ(f)]∞ para todo λ ∈ IR tal que Sλ(f) 6= ∅.

Demostracion. a) Sea a ∈ dom (f), por la proposicion anterior, para todod ∈ IRn, f∞(d) ≥ f(a+d)−f(a) y por lo tanto f∞(d) > −∞. De este y delhecho que epi (f∞) 6= ∅ (ya que epi (f) 6= ∅) se deduce que f∞ es propia.

b) Sea d ∈ S0(f∞) y sea a ∈ Sλ(f), entonces para todo k > 0, (a +kd, λ) ∈ epi (f) y por lo tanto a + kd ∈ Sλ(f), es decir d ∈ [Sλ(f)]∞.Recıprocamente, sea d ∈ [Sλ(f)]∞ y sea a ∈ Sλ(f), entonces para todok > 0, a + kd ∈ Sλ(f) y por lo tanto (a + kd, λ) ∈ epi (f). Se deduce que(d, 0) ∈ (epi (f))∞ = epi (f∞), es decir d ∈ S0(f∞).

24

Page 27: Análsisi Convexo

Definicion 2.3.1 Se dice que f : IRn → IR es inf-compacta si para cadaλ ∈ R el conjunto Sλ(f) es compacto.

Se deduce directamente de la definicion que inf-compacidad implicasemicontinuidad inferior.

La propiedad fundamental de funciones inf-compactas es la siguiente

Proposicion 2.3.3 Asuma que f : IRn → IR es inf-compacta. Sea m =infx∈IRn f(x) y S = {x ∈ IRn : m = f(x)} y asuma que m <∞, entoncesS es compacto no vacıo.

Demostracion. Observe que

S =⋂λ>m

Sλ(f).

El conjunto S es compacto no vacıo como interseccion de compactos enca-jados no vacıos.

Proposicion 2.3.4 Sea f : IRn → IR convexa sci propia, entonces

a) f es inf-compacta si y solo si S0(f∞) = {0},

b) f es inf-compacta si y solo si existe λ ∈ IR tal que Sλ(f) es compactono vacıo.

Demostracion. Utilizar el teorema anterior y el hecho que un conjuntoconvexo cerrado C es compacto si y solo si C∞ = {0}.

La siguiente proposicion da una caracterizacion de inf-compacidad parafunciones no necesariamente convexa.

Proposicion 2.3.5 Sea f : Rn → IR sci. Entonces f es inf-compacta siy solo si para toda sucesion {xk}k en IRn con ‖xk‖ → +∞ implica quef(xk)→ +∞.

Demostracion. Note que las hipotesis implican que Sλ(f) es cerradopara todo λ. Si f no es inf-compacta, existe λ < +∞ tal que Sλ(f) no esacotado, por lo tanto existe una sucesion {xk} en IRn tal que f(xk) ≤ λpara cada k y ‖xk‖ → +∞ cuando k → +∞. Recıprocamente, asumamosque existe una sucesion {xk}k en IRn tal que lim inf f(xk) < λ < +∞ y‖xk‖ → +∞ cuando k → +∞, entonces Sλ(f) no es acotado.

Proposicion 2.3.6 Sean f, g : IRn → IR con f es inf-compacta y g sci yacotada inferiormente (es decir, existe β > −∞ tal que g(x) ≥ β para todox ∈ IRn), entonces f + g es inf-compacta.

Demostracion. Observe que f(x) + g(x) ≤ λ implica f(x) + β ≤ λ. Porlo tanto Sλ(f + g) ⊂ Sλ−β(f) que es acotado. Se sigue que f + g es inf-compacta.

25

Page 28: Análsisi Convexo

Definicion 2.3.2 Se dice que f : IRn → IR es estrictamente convexasi para todo t ∈ ]0, 1[ y para todo a, b ∈ IRn con a 6= b,

f(ta+ (1− t)b) < tf(a) + (1− t)f(b).

En el caso diferenciable tenemos la siguiente caracterizacion:

Proposicion 2.3.7 Sea C ⊂ IRn convexo abierto no vacıo y f : C → Rdiferenciable. Las siguientes tres condiciones son equivalentes.

(a) f es estrictamente convexa;

(b) 〈∇f(x)−∇f(y), x− y〉 > 0 para todo x, y ∈ C, x 6= y;

(c) f(y) > f(x) + 〈∇f(x), x− y〉 para todo x, y ∈ C, x 6= y.

De este se deduce una condicion suficiente pero no necesaria (considerepor ejemplo la funcion θ(t) = t4) de segundo orden:

Proposicion 2.3.8 Sea C ⊂ IRn convexo abierto no vacıo y f : C → IRdos veces diferenciable. Si para todo x ∈ C la matriz ∇2f(x) es definidapositiva, entonces f es estrictamente convexa sobre C.

Definicion 2.3.3 Se dice que f : IRn → IR es fuertemente convexa decoeficiente α > 0 si para todo t ∈ [0, 1] y todo x, y ∈ IRn,

f(tx+ (1− t)y) ≤ tf(x) + (1− t)f(y)− α

2t(1− t)‖x− y‖2.

Es claro que una funcion fuertemente convexa es estrictamente convexa.

La siguiente caracterizacion es mas agradable para utilizar.

Proposicion 2.3.9 Sea f : IRn → IR y a ∈ IRn fijo arbitrario. Entoncesf es fuertemente convexa de coeficiente α > 0 si y solo si la funcion g :IRn → IR definida por

g(x) = f(x)− α

2‖x− a‖2

es convexa.

Demostracion. Para x, y ∈ IRn y t ∈ [0, 1] hacemos

u = tf(x) + (1− t)f(y)− f(tx+ (1− t)y),v = tg(x) + (1− t)g(y)− g(tx+ (1− t)y),

w =α

2[ t‖x− a‖2 + (1− t)‖y − a‖2 − ‖tx+ (1− t)y − a‖2 ].

Es facil ver que de u = v + w y de

w =α

2t(1− t)‖x− y‖2.

se deduce el resultado.

A partir de esta proposicion, derivamos inmediatamente las caracteriza-ciones de primer y segundo orden aplicando las proposiciones 2.2.7 y 2.2.8a la funcion g con a = 0. Luego

∇f(x) = ∇g(x) + αx y ∇2f(x) = ∇2g(x) + αI.

26

Page 29: Análsisi Convexo

Proposicion 2.3.10 Sea C convexo abierto no vacıo de IRn y f : C → IRdiferenciable. Las siguientes tres condiciones son equivalentes.

(a) f es fuertemente convexa de coeficiente α > 0;(b) 〈∇f(x)−∇f(y), x− y〉 ≥ α‖x− y‖2 para todo x, y ∈ C, x 6= y ;(c) f(y) ≥ f(x)+〈∇f(x), x−y〉+ α

2 ‖x−y‖2 para todo x, y ∈ C, x 6= y.

Proposicion 2.3.11 Sea C convexo abierto no vacıo de IRn y f : C → IRdos veces diferenciable sobre C, entonces f es fuertemente convexa sobreC de coeficiente α > 0 si y solo si para todo x ∈ C los valores propios dela matriz ∇2f(x) son mayores o iguales a α.

El siguiente resultado es importante debido a que es muy util para la exis-tencia de soluciones optimas.

Teorema 2.3.2 Sea f : IRn → IR convexa sci propia. Si f es fuertementeconvexa, entonces f es inf-compacto.

Demostracion. Sea α el coeficiente de fuerte convexidad de f y x ∈dom (f). La funcion g : IRn → IR definida por g(x) = f(x)− α

2 ‖x− x‖2 es

convexa sci propia. Sea d 6= 0,

f∞(d) = supt>0

g(x+ td)− g(x)t

+αt

2|d‖2.

De la convexidad de g,

g(x+ td)− g(x)t

≥ g(x+ d)− g(x)1

para todo t > 1,

y por lo tanto f∞(d) =∞.

Finalizemos esta seccion con una aplicacion al principio variacional deEkeland.

Teorema 2.3.3 Sea f : IRn → IR diferenciable tal que −∞ < m :=inf f(x). Sea ε > 0 y xε tal que f(xε) ≤ m + ε. Entonces existe x talque ‖x− xε‖ ≤

√ε, ‖∇f(x)‖ ≤ 2

√ε y f(x) ≤ m+ ε.

Demostracion. Consideremos g(x) = f(x)+ α2 ‖x−xε‖

2 con α > 0. Comof es sci y la componente x→ α

2 ‖x−xε‖2 es inf-compacto, entonces g es inf-

compacto y por lo tanto existe x tal que g(x) ≤ g(x) para todo x. Se sigueque∇f(x)+α(x−xε) = ∇g(x) = 0 y en consecuencia ‖∇f(x)‖ = α‖x−xε‖.

De otro lado,

m+α

2‖x− xε‖2 ≤ f(x) +

α

2‖x− xε‖2 = g(x) ≤ g(xε) = f(xε) ≤ m+ ε.

Se deduce por lo tanto que

‖x− xε‖2 ≤2εα

y f(x) ≤ m+ ε.

Considerar α = 2.

27

Page 30: Análsisi Convexo

Capıtulo 3

Conjugacion ySubdiferencial

3.1 Teoremas de separacion

Un subconjunto H ⊂ IRn se llama hiperplano si este es de la forma

H = H(a, α) = {x ∈ IRn : 〈a, x〉 = α}

donde a ∈ IRn, a 6= 0 y α ∈ IR. Se deduce que los hiperplanos de IRn sonlos subespacios afines de dimension (n− 1). El hiperplano de IRn divide aeste espacio en dos semiespacios cerrados

E1 = {x ∈ IRn : 〈a, x〉 ≥ α} y E2 = {x ∈ IRn : 〈a, x〉 ≤ α}.

Sean S1, S2 ⊂ IRn no vacıos. Se dice que el hiperplano H = H(a, α)

• separa a S1 y S2 si

〈a, x1〉 ≤ α ≤ 〈a, x2〉 para todo (x1, x2) ∈ S1 × S2.

• separa propiamente a S1 y S2 si existe separacion y ademas existenx1 ∈ S1, x2 ∈ S2 tales que

〈a, x2 − x1〉 > 0.

(S1 y S2 no estan contenidos ambos en el hiperplano).

• separa estrictamente a S1 y S2 si

〈a, x1〉 < α < 〈a, x2〉 para todo x1 ∈ S1 y x2 ∈ S2.

• separa fuertemente a S1 y S2 si existen α1, α2 ∈ IR tales que

〈a, x1〉 ≤ α1 < α < α2 ≤ 〈a, x2〉 para todo x1 ∈ S1 y x2 ∈ S2.

Ahora analizaremos la separacion de conjuntos con interseccion vacıa.Note que

S1 ∩ S2 = ∅ si y solo si 0 /∈ S2 − S1.

Los primeros resultados de separacion caracterizan la separacion delorigen con un conjunto.

28

Page 31: Análsisi Convexo

Teorema 3.1.1 Sea C ⊂ IRn convexo cerrado no vacıo tal que 0 /∈ C,entonces existen a ∈ IRn y α > 0 tales que 〈a, x〉 ≥ α para todo x ∈ C.

Demostracion. Consideremos el problema m = inf[‖x‖2 : x ∈ C] (donde‖ · ‖ es la norma euclidiana). Observe que la funcion x → ‖x‖2 es fuerte-mente convexa y sci, entonces existe un unico x ∈ C tal que m = ‖x‖2 ≤‖x‖2 para todo x ∈ C. El hecho que 0 /∈ C, implica que x 6= 0 y por lotanto m > 0. De otro lado, para todo x ∈ C y todo t ∈ [0, 1] se tiene

‖x‖2 = m ≤ 〈x+ t(x− x), x+ t(x− x)〉 = ‖x‖2 + 2t〈x, x− x〉+ t2‖x− x‖2.

Este implica que 〈x, x − x〉 ≥ 0 para todo x ∈ C. Haciendo a = x yα = ‖x‖2 se muestra el resultado.

Teorema 3.1.2 Sea C convexo no vacıo tal que 0 /∈ C, entonces existea ∈ IRn tal que 〈a, x〉 ≥ 0 para todo x ∈ C y 〈a, x〉 > 0 para todo x ∈ ri (C).(separacion propia).

Demostracion. Si 0 /∈ C, entonces separar 0 de C usando el Teorema3.1.1. Caso contrario, 0 ∈ C y por lo tanto 0 ∈ aff (C). Considere D =C+aff (C)]⊥. Note que D es convexo, 0 /∈ D y int (D) = ri (C)+[aff (C)]⊥.Sea x ∈ ri (C), entonces x ∈ int (D). Luego, para todo k ∈ N , −xk /∈ D(caso contrario 0 ∈ D). Separando 0 de D+ x

k , tenemos que existen ak 6= 0y αk > 0 tales que

0 < αk ≤⟨ak ,

(x+

x

k

)⟩para todo x ∈ D.

Sin perdida de generalidad, podemos asumir ‖ak‖ = 1. Haciendo x = x enla desigualdad previa, se tiene

0 < αk ≤(

1 +1k

)〈ak, x〉 ≤ 2‖x‖.

La sucesion {(ak, αk)} es acotada. Sea (a, α) un valor de adherencia de lasucesion, entonces existe una subsucesion convergente a este valor. Se tiene‖a‖ = 1 y α ≥ 0. Pasando al limite cuando k →∞,

0 ≤ α ≤ 〈a, x〉 para todo x ∈ D (y por lo tanto para todo x ∈ C)

lo que es eqivalente a D ⊂ {x ∈ IRn : α ≤ 〈a, x〉} y por lo tanto int (D) ⊂{x ∈ IRn : α < 〈a, x〉}. Se deduce que 〈a, x〉 > 0 para todo x ∈ ri (C).

Teorema 3.1.3 (Separacion fuerte) Sean C y D convexos cerrados yno vacıos satisfaciendo

i) C ∩D = ∅,

ii) d ∈ C∞ ∩D∞ implica −d ∈ C∞ ∩D∞.

Entonces existen a ∈ IRn y α1, α2 ∈ IR tales que

〈a, x〉 ≤ α1 < α2 ≤ 〈a, y〉 para todo (x, y) ∈ C ×D.

29

Page 32: Análsisi Convexo

Demostracion. Sea S = D − C, entonces S es cerrado y 0 /∈ S. Por elTeorema 3.1.1, existen a ∈ IRn y β > 0 tal que

β ≤ infx∈C,y∈D

〈a, y − x〉 = infy∈D〈a, y〉 − sup

x∈C〈a, x〉.

Considerando α1 = supx∈C〈a, x〉 y α2 = infy∈D〈a, y〉, se tiene α2 − α1 ≥β > 0.

Teorema 3.1.4 (Separacion propia) Sean C y D convexos no vacıostales que ri (C) ∩ ri (D) 6= ∅, entonces existen a ∈ IRn (a 6= 0) y α ∈ IRtales que

〈a, x〉 ≤ α ≤ 〈a, y〉 para todo (x, y) ∈ C ×D.Ademas,

〈a, y − x〉 > 0 para todo (x, y) ∈ riC × riD.

Demostracion. Sea M = ri (D)− ri (C) = ri (M), entonces M es convexocon 0 /∈M . Por el Teorema 3.1.2, existe a ∈ IRn (a 6= 0) tal que

〈a, x〉 < 〈a, y〉 para todo (x, y) ∈ riC × riD

y por lo tantosup

x∈ri (C)

〈a, x〉 ≤ infx∈ri (D)

〈a, y〉.

Debido a que

supx∈ri (C)

〈a, x〉 = supx∈ri (C)

〈a, x〉 = supx∈C〈a, x〉

yinf

y∈ri (D)〈a, y〉 = inf

y∈ri (D)

〈a, y〉 = infy∈D〈a, y〉,

el teorema se demuestra considerando α = 12 [supx∈C〈a, x〉+infy∈D〈a, y〉].

Observacion. En general, en las condiciones del teorema anterior, no setiene la existencia de a ∈ IRn y α ∈ IR tales que

〈a, x〉 < α < 〈a, y〉 para todo (x, y) ∈ riC × riD.

Como contra-ejemplo considere

C = {(x, y) : x > 0, y > 0, xy ≥ 1} y D = {(x, y) : y = 0}.

3.2 Conos polares

Sea ∅ 6= K ⊂ IRn. Definimos el cono polar de K, denotado por K0, como

K0 = {x∗ ∈ IRn : 〈x, x∗〉 ≤ 0 para todo x ∈ K}=

⋂x∈K{x∗ ∈ IRn : 〈x, x∗〉 ≤ 0} .

LuegoK0 es un cono convexo y cerrado como interseccion de conos convexoscerrados. Es facil verificar las siguientes propiedades

30

Page 33: Análsisi Convexo

• K1 ⊂ K2 ⇒ K02 ⊂ K0

1 ;

• (K)0 = K0 ;

• (cono(K))0 = K0.

Existen numerosas propiedades concernientes a los conos polares tantocon la interseccion, reunion, suma, etc, que son estudiadas aquı. En generalpara cualquier conjunto no vacıo K siempre se cumple K ⊂ K00.

Proposicion 3.2.1 Sea K un cono convexo cerrado y no vacıo, entonces(K0)0 = K.

Demostracion. Por la observacion anterior, es suficiente demostrar que(K0)0 ⊂ K. Sea x /∈ K, entonces existe a 6= 0 y α ∈ IR tal que 〈a, x〉 ≤α < 〈a, y〉 para todo y ∈ K. Debido a que 0 ∈ K se tiene α < 0, luegocomo K es un cono, 〈−a, y〉 ≤ 0 para todo y ∈ K y por lo tanto −a ∈ K0.De este y del hecho que 〈−a, x〉 ≥ −α > 0, se deduce que x /∈ K00.

Corolario 3.2.1 Sea ∅ 6= K ⊂ IRn, entonces K00 es el cono convexocerrado mas pequeno conteniendo K.

Demostracion. Sea T un cono convexo cerrado tal que K ⊂ T , entoncesT 0 ⊂ K0 y por lo tanto K00 ⊂ T 00 = T . De este se deduce que K00 esel cono convexo cerrado mas pequeno conteniendo K. Si K es un conoconvexo, K es el cono convexo cerrado mas pequeno conteniendo K.

3.3 Funciones conjugadas

Sea f : IRn → IR convexa sci propia, entonces epi (f) ⊂ IRn+1 es convexocerrado y no vacıo. Consideremos

K = {k(x, λ,−1) : k ≥ 0, (x, λ) ∈ epi (f)} =⋃k≥0

k(epi (f)× {−1}),

el cono convexo generado por epi (f) × {−1} ⊂ IRn+2. Este cono no escerrado, de hecho, K difiere de su clausura en el subespacio IRn× IR×{0}.Se cumple

K ∩ (IRn × IR× {−1}) = epi (f)× {−1}.

Consideremos K0, el cono polar de K,

K0 = {(x∗, λ∗, µ∗) : 〈x, x∗〉+ λλ∗ − µ∗ ≤ 0 para todo (x, λ) ∈ epi (f)}.

Sea x ∈ dom (f), haciendo variar λ en [f(x),+∞[ se ve que necesariamentese debe tener λ∗ ≤ 0 cuando (x∗, λ∗, µ∗) ∈ K0. Sea

T = {(x∗, µ∗) : (x∗,−1, µ∗) ∈ K0}.

Este conjunto es convexo y cerrado. Ademas si µ∗1 ≤ µ∗2 y (x1, µ∗1) ∈ T ,

entonces (x1, µ∗1) ∈ T . Por lo tanto T es el epıgrafo de una funcion convexa

cerrada que se denotara por f∗. Se cumple

f∗(x∗) = inf[µ∗ : 〈x, x∗〉 − λ ≤ µ∗ para todo (x, λ) ∈ epi (f)],

31

Page 34: Análsisi Convexo

es decirf∗(x∗) = sup

x∈dom (f)

[〈x, x∗〉 − f(x)].

Ademas se puede mostrar que

K0 = {(kx∗,−k, kµ∗) : k ≥ 0, (x∗, µ∗) ∈ epi (f∗)}.

Debido a que K y K0 se corresponden por dualidad (es decir, K = (K0)0),se sigue que f y f∗ se corresponden por dualidad (es decir, f = (f∗)∗).Asi, cuando uno de ellos es conocido, entonces el otro tambien es conocido.

Definicion 3.3.1 (Funcion conjugada) Sea f : IRn → IR, la funcionconjugada de f (en el sentido de Fenchel) es la funcion f∗ : IRn → IRdefinida por

f∗(x∗) = supx∈dom (f)

[〈x, x∗〉 − f(x)] = supx∈IRn

[〈x, x∗〉 − f(x)].

Observe que esta funcion es convexa y sci como supremo de funciones con-vexas y sci. Ademas, para x∗ ∈ IRn,

〈x, x∗〉 − f(x) ≤ f∗(x∗) para todo x ∈ IRn

lo que es equivalente a

〈x, x∗〉 − f∗(x∗) ≤ f(x) para todo x ∈ IRn.

Este nos dice que la funcion lineal afın x→ 〈x, x∗〉−f∗(x∗) esta por debajode la funcion f . Mas aun, f∗(x∗) es el menor valor con esta propiedad, estoes, si

〈x, x∗〉 − β ≤ f(x) para todo x ∈ IRn,

entonces f∗(x∗) ≤ β.

Se cumplen las siguientes propiedades:

• Si existe x0 tal que f(x0) = −∞, entonces f∗(x∗) = +∞ para todox∗ ∈ IRn.

• Si f(x) = +∞ para todo x ∈ IRn, entonces f∗(x∗) = −∞ para todox∗ ∈ IRn.

• Si f(x) ≤ g(x) para todo x ∈ IRn, entonces g∗(x∗) ≤ f∗(x∗) paratodo x∗ ∈ IRn.

• f∗(x∗) + f(x) ≥ 〈x, x∗〉 para todo (x, x∗) ∈ IRn × IRn.

Asociada a f : IRn → IR definimos las funciones f, fc, fc : IRn → IRdefinidas por

f(x) = inf[λ : (x, λ) ∈ epi (f) ],fc(x) = inf[λ : (x, λ) ∈ co (epi (f))],fc(x) = inf[λ : (x, λ) ∈ co (epi (f))].

Estas son respectivamente la mas grande funcion sci, la mas grande funcionconvexa y la mas grande funcion convexa sci, todas mayoradas por f .

32

Page 35: Análsisi Convexo

Proposicion 3.3.1 Sea f : IRn → IR, entonces

f∗ = (f)∗ = (fc)∗ = (fc)∗.

Demostracion. Para µ ∈ IR, las siguientes relaciones son equivalentes:

• 〈x, x∗〉 − λ ≤ µ para todo (x, λ) ∈ epi (f)

• 〈x, x∗〉 − λ ≤ µ para todo (x, λ) ∈ epi (f)

• 〈x, x∗〉 − λ ≤ µ para todo (x, λ) ∈ co (epi (f))

• 〈x, x∗〉 − λ ≤ µ para todo (x, λ) ∈ co (epi (f)).

Las igualdades de la proposicion se deducen del hecho que f∗(x∗) = sup[〈x, x∗〉−λ : (x, λ) ∈ epi (f)].

Definicion 3.3.2 (Funcion biconjugada) Sea f : IRn → IR, la funcionbiconjugada de f (en el sentido de Fenchel), denotada por f∗∗, es la con-jugada de la funcion conjugada, esto es

f∗∗(x) = supx∗∈IRn

[〈x, x∗〉 − f∗(x∗)].

Se deduce que

f∗∗(x) = supx∗

[〈x, x∗〉 − supy

[〈y, x∗〉 − f(y)]] = supx∗

infy

[〈x− y, x∗〉+ f(y)].

En particular

f∗∗(x) ≤ supx∗

[〈x− x, x∗〉+ f(x)] = f(x). (3.1)

Continuando de manera inductiva, podemos definir la tercera conju-gada, la cuarta conjugada,· · ·, etc., de f . Como consecuencia de la siguienteproposicion mostraremos que la tercera y la primera conjugada coinciden.

Proposicion 3.3.2 Sea f : X → R convexa sci. Entonces

f∗∗(x) = f(x) para todo x ∈ IRn.

Demostracion. Por la observacion anterior, es suficiente mostrar quef(x) ≤ f∗∗(x). Sin perdida de generalidad podemos asumir que epi (f) 6= ∅(caso contrario f(x) = +∞ para todo x y por lo tanto f∗∗(x) = +∞ paratodo x). Si f(x) = −∞, entonces por la desigualdad (3.1), f∗∗(x) = −∞.Caso contrario, si f(x) > −∞, entonces (x, λ) /∈ epi (f) para λ < f(x). Porlos teoremas de separacion existe (ξ∗, β) ∈ IRn × IR con λ ≤ β ≤ f(x) talque la funcion lineal y → 〈ξ∗, y − x〉+ β = 〈ξ∗, y〉 − (〈ξ∗, x〉 − β) pasa pordebajo de la funcion f . Luego, por la propiedad de minimalidad de f(ξ∗),f∗(ξ∗) ≤ 〈ξ∗, x〉 − β de donde β ≤ f∗∗(x). Haciendo λ → f(x), tenemosf(x) ≤ f∗∗(x). El resultado queda establecido.

Corolario 3.3.1 Sea f : IRn → R. Entonces

f∗∗∗(x∗) = f∗(x∗) para todo x∗ ∈ IRn.

33

Page 36: Análsisi Convexo

Demostracion. Este se deduce de la proposicion anterior, teniendo encuenta que f∗ es convexa y sci.

Observacion. De la Proposiciones 3.3.2 y 3.3.1,

f∗∗ = (fc)∗∗ = fc

y por lo tantoepi (f∗∗) = co (epi (f).

3.4 Funciones indicatriz y soporte de un con-junto

Sea C ⊂ IRn, la funcion indicatriz de C, denotado por δ(·|C), se definecomo

δ(x|C) ={

0 si x ∈ C,+∞ si x /∈ C.

Se cumplen las siguientes propiedades:

• C es convexo si y solo si δ(·|C) es convexa,

• C es cerrado si y solo si δ(·|C) es sci,

• S ⊂ C si y solo si δ(·|S) ≥ δ(·|T ) para todo x ∈ IRn,

• δ(·|C), δ(·|co (C)) y δ(·|coC) son respectivamente la mas grande funcionsci, la mas grande funcion convexa y la mas grande funcion convexasci, todas mayoradas por δ(·|C).

Definicion 3.4.1 (Funcion soporte) La funcion soporte de un conjuntoC ⊂ IRn, denotada por δ∗(·|C), es la funcion conjugada de la funcionindicatriz de C.

Se cumplen las siguientes propiedades:

• δ∗(x∗|C) = supx∈IRn [〈x, x∗〉 − δ(x|C)] = supx∈C〈x, x∗〉;

• Si C 6= ∅, entonces δ∗(·|C) es convexa sci y propia;

• δ∗(·|C) es positivamente homogenea de grado 1, esto es δ∗(kx∗|C) =kδ∗(x∗|C) para todo k > 0 y para todo x∗ ∈ IRn.

En realidad la tercera propiedad es una caracterizacion de la funcionsoporte.

Teorema 3.4.1 Sea f : IRn → IR convexa sci propia y positivamente ho-mogenea de grado 1, entonces existe C convexa cerrada y no vacıo tal quef(x∗) = δ∗(x∗|C) para todo x∗ ∈ IRn. Ademas f∗(x) = δ(x|C) para todox ∈ IRn.

34

Page 37: Análsisi Convexo

Demostracion. a) Se cumple

f∗(x) = supx∗

[〈x, x∗〉 − f(x∗)]

= supx∗,k>0

[〈x, kx∗〉 − f(kx∗)]

= supk>0

[k

[supx∗

[〈x, x∗〉 − f(x∗)]]].

Puesto que f es propia, supx∗ [〈x, x∗〉 − f(x∗)] > −∞. Por lo tanto

f∗(x) ={

0 si supx∗ [〈x, x∗〉 − f(x∗)] ≤ 0,+∞ caso contrario .

Sea C = S0(f∗), entonces C es convexo cerrado no vacıo y f∗(x) = δ(x|C)para todo x ∈ IRn.

b) Debido a que f es convexa sci y propia, f = f∗∗ y por lo tantof(x∗) = δ∗(x∗|C) para todo x∗ ∈ IRn.

Definicion 3.4.2 (Cono barrera) Sea C ⊂ IRn. El cono barrera de Ces el conjunto K definido por

K = {x∗ : δ∗(x∗|C) < +∞} = dom (δ∗(·|C)).

Se deduce que K es un cono convexo ya que este es el dominio de unafuncion convexa positivamente homogenea. En general K no es cerradoaun cuando C es convexo cerrado. Considere por ejemplo C = {(x, y) ∈IR2 : y + ex ≤ 0}. Entonces K = IR2

++ ∪ ({0} × IR+).

Teorema 3.4.2 Sea C ⊂ IRn convexo cerrado y no vacıo y K su conobarrera, entonces K ⊂ (C∞)0 y K0 = C∞. Se deduce que K = (C∞)0.

Demostracion. Sea a ∈ C fijo arbitrario. i) Consideremos x∗ ∈ K,entonces δ∗(x∗|C) < +∞. Si d ∈ C∞, entonces 〈a + λd, x∗〉 ≤ δ∗(x∗|C)para todo λ > 0. Se deduce que 〈d, x∗〉 ≤ 0 para todo d ∈ C∞ y porlo tanto x∗ ∈ (C∞)0. De esta manera se muestra que K ⊂ (C∞)0. Pordualidad y por el hecho que C∞ es un cono convexo cerrado no vacıo,K0 ⊃ (C∞)00 = C∞.

ii) Mostraremos ahora que K0 ⊂ C∞. Sea d /∈ C∞, entonces existeλ > 0 tal que a+ λd /∈ C. Separando a+ λd de C, existe x∗ 6= 0 tal que

〈a+ λd, x∗〉 > 〈x, x∗〉 para todo x ∈ C.

Ası de un lado, reemplazando x = a en la ultima expresion, se obtiene〈d, x∗〉 > 0. De otro lado, debido a que sup[〈x, x∗〉 : x ∈ C] ≤ 〈a+ λd, x∗〉,se obtiene x∗ ∈ K. Se concluye por lo tanto que d /∈ K0.

Corolario 3.4.1 Sea C ⊂ IRn convexo no vacıo. Entonces C es acotadosi y solo si K = IRn.

Demostracion. C es acotado si y solo si C es acotado si y solo si (C)∞ ={0} si y solo si K = IRn. Debido a que K es convexo, lo anterior tambienes equivalente a K = IRn.

35

Page 38: Análsisi Convexo

3.5 Relaciones entre funcion asıntota y funcionconjugada

Proposicion 3.5.1 Sea f : IRn → IR convexa sci propia. Entonces f∞(d) =δ∗(d|dom (f∗)) para todo d ∈ IRn.

Demostracion. Sea a ∈ dom (f), entonces f∞(d) = supt>0f(a+td)−f(a)

t .De otro lado, debido a f∗∗ = f ,

f(a+ td) = supx∗∈dom (f∗)

[〈x∗, a+ td〉 − f∗(x∗)]

y por lo tanto

f∞(d) = supt>0, x∗∈ dom (f∗)

1t[〈x∗, a+ td〉 − f∗(x∗)− f(a)]

= supx∗∈ dom (f∗)

[〈x∗, d〉+ sup

t>0

1t[〈x∗, a〉 − f∗(x∗)− f(a)]

].

Debido a que 〈x∗, a〉 ≤ f∗(x∗) + f(a), se tiene f∞(d) = δ∗(d|dom (f∗)).

Corolario 3.5.1 Sea f : IRn → IR convexa sci propia. Entonces

i) f es inf-compacto si y solo si 0 ∈ int (dom (f∗));

ii) f∗ es inf-compacto si y solo si 0 ∈ int (dom (f)).

Demostracion. i) f es inf-compacto si y solo si

δ∗(d|dom (f∗)) = f∞(d) ={

0 si d = 0,> 0 caso contrario.

Ası este es equivalente a

0 ∈ int (dom (f∗)).

ii) Se deduce por dualidad.

Ejemplo. Sea f : IRn → IR convexa, sci y propia. Consideremos ψ :IRn × IR→ IR definida por

ψ(x∗, λ∗) ={

0 si f∗(x∗) + λ∗ ≤ 0,+∞ en caso contrario.

Entonces ψ es convexa sci y propia (esta es una funcion indicatriz). Sufuncion conjugada es

ψ∗(x, λ) = supx∗,λ∗

[〈x, x∗〉+ λλ∗ : f∗(x∗) + λ∗ ≤ 0].

Se tiene los siguientes casos:

• Si λ < 0, entonces ψ∗(x, λ) = ∞ (tomar x∗ ∈ dom (f∗) y hacerλ∗ → −∞),

36

Page 39: Análsisi Convexo

• Si λ = 0, entonces ψ∗(x, λ) = sup[〈x, x∗〉 : x∗ ∈ dom (f∗)] = f∞(x),

• Si λ > 0, entonces

ψ∗(x, λ) = supx∗

[〈x, x∗〉 − λf∗(x∗)]

= λ supx∗

[⟨xλ, x∗⟩− f∗(x∗)

]= λf(

x

λ).

Denotando ϕ = ψ∗, lo anterior se resume en

ϕ(x, λ) =

λf(xλ ) si λ > 0,

f∞(x) si λ = 0,

+∞ si λ < 0.

Ası la conjugada de ϕ es

ϕ∗(x∗, λ∗) = ψ(x∗, λ) ={

0 si f∗(x∗) + λ∗ ≤ 0,+∞ en caso contrario.

3.6 Subdiferencial de una funcion convexa

Sea f : IRn → IR convexa propia y a ∈ dom (f). El subdiferencial (osubgradiente) de f en a, denotado por ∂f(a), es el conjunto definido por

∂f(a) = {x∗ ∈ IRn : f(a) + f∗(x∗) = 〈x∗, a〉}. (3.2)

Recordemos que siempre se cumple la desigualdad 〈x∗, a〉 ≤ f∗(x∗) + f(a)y por lo tanto

∂f(a) = {x∗ ∈ IRn : f(a) + f∗(x∗) ≤ 〈x∗, a〉}. (3.3)

Debido a que f∗(x∗) = supx[〈x∗, x〉 − f(x)],

∂f(a) = {x∗ ∈ IRn : f(a) + 〈x∗, x− a〉 ≤ f(x) para todo x ∈ IRn}. (3.4)

Note que0 ∈ ∂f(a) si y solo si f(a) = inf

x∈IRnf(x).

Para dar una interpretacion geometrica del subdiferencial ∂f(a), con-sideremos el hiperplano en IRn × IR,

H = {(x, λ) : f(a) + 〈x∗, x− a〉 = λ}.

De (3.4), el epıgrafo de f esta en la parte superior del hiperplano H.

Proposicion 3.6.1 Sea f : IRn → IR convexa propia y a ∈ dom (f). En-tonces ∂f(a) es convexo y cerrado.

37

Page 40: Análsisi Convexo

Demostracion. Se deduce del hecho que la aplicacion x∗ → f∗(x∗) −〈a, x∗〉 es convexa y sci.

Proposicion 3.6.2 Sea f : IRn → IR convexa propia y a ∈ dom (f). Si∂f(a) 6= ∅ entonces f es sci en a.

Demostracion. Sea x∗ ∈ ∂f(a), entonces f(a) + 〈x∗, x − a〉 ≤ f(x)para todo x ∈ IRn. Sea λ < f(a), entonces por la continuidad de laaplicacion x → f(a) + 〈x∗, x − a〉, existe una vecindad V de a tal queλ < f(a) + 〈x∗, x − a〉 para todo x ∈ V . Se sigue que λ < f(x) para todox ∈ V y por lo tanto la sci de f en a.

Observacion. La recıproca de la proposicion anterior es falsa. Considerepor ejemplo f : IR→ ]−∞,+∞] definida por

f(x) ={

+∞ si x < 0,−√x si x ≥ 0.

Entonces f es convexa sci y

f∗(x∗) = supx≥0

[xx∗ +√x] =

{+∞ si x∗ ≥ 0,− 1

4x∗ si x∗ < 0.

Se tiene

x∗ ∈ ∂f(x) ⇐⇒

−√x− 1

4x∗ = x∗x si x ≥ 0 y x∗ < 0,

∅ caso contrario.

y por lo tanto

∂f(x) =

{− 1

2√x} si x > 0,

∅ caso contrario.

Proposicion 3.6.3 Sea f : IRn → IR convexa sci propia. Entonces x∗ ∈∂f(x) si y solo si x ∈ ∂f∗(x∗).

Demostracion. Se deduce del hecho que f = f∗∗.

Teorema 3.6.1 Sea f : IRn → IR convexa sci propia. Entonces ∂f(a) 6= ∅para todo a ∈ ri (dom (f)).

Demostracion. Considere C = {(a, f(a))}. Entonces C = ri (C) y C ∩ri (epi (f)) = ∅. Por los teoremas de separacion, existe (x∗, α∗) 6= (0, 0) talque

〈a, x∗〉+ α∗f(a) > 〈x, x∗〉+ α∗λ para todo (x, λ) ∈ ri (epi (f)). (3.5)

Se deduce que α∗ < 0. Considerando sin perdidad de generalidad α∗ = −1y haciendo λ→ f(a), se obtiene

〈a, x∗〉 − f(a) ≥ 〈x, x∗〉 − f(x) para todo x ∈ dom (f).

Este implica que x∗ ∈ ∂f(a).

38

Page 41: Análsisi Convexo

3.7 Derivadas direccionales de una funcionconvexa

Sea f : IRn → IR finita en a ∈ IRn. La derivada direccional de f en a en ladireccion d ∈ IRn, denotada por f ′(a, d), es el lımite, si existe,

f ′(a, d) = limt→0+

f(x+ td)− f(a)t

.

Cuando f es convexa, la funcion t→ f(x+td)−f(a)t es creciente sobre ]0,+∞[ .

Por lo tanto limt→0+f(x+td)−f(a)

t existe (con la eventualidad de ser ±∞)y coincide con inft>0

f(x+td)−f(a)t .

Teorema 3.7.1 Sea f : IRn → IR convexa propia y sea a ∈ dom (f),entonces f ′(a, ·) es una funcion convexa positivamente homogenea.

Demostracion. Claramente se verifica que f ′(a, kd) = kf ′(a, d) para todok > 0. De otro lado, debido a que la funcion d → g(d) = f(a + d) −f(a) es convexa en IRn, entonces (d, θ) → ϕ(d, θ) = θg(dθ ) es convexa enIRn× ]0,+∞[ . Se sigue que d → f ′(a, d) es convexa en IRn debido a quef ′(a, d) = infθ>0 ϕ(d, θ).

Proposicion 3.7.1 Sea f : IRn → IR convexa propia y a ∈ dom (f), en-tonces

x∗ ∈ ∂f(a) si y solo si f ′(a, d) ≥ 〈x∗, d〉 para todo d ∈ IRn.

Demostracion. Sea x∗ ∈ ∂f(a), entonces f(a+ td)−f(a) ≥ t〈x∗, d〉 paratodo d ∈ IRn y para todo t > 0. Dividiendo por t y luego haciendo t→∞,obtenemos f ′(a, d) ≥ 〈x∗, d〉. Recıprocamente, asuma que f ′(a, d) ≥ 〈x∗, d〉para todo d ∈ IRn. Tomando d = x− a se obtiene

〈x∗, x− a〉 ≤ f ′(a, d) ≤ f(x+ td)− f(a)t

para todo t > 0.

Haciendo t = 1 se obtiene el resultado.

Proposicion 3.7.2 Sea f : IRn → IR convexa propia y a ∈ dom (f).

a) Si existe d tal que f ′(a, d) = −∞, entonces ∂f(a) = ∅.

b) Si f ′(a, d) > −∞ para todo d ∈ IRn, entonces θ(d) = δ∗(d|∂f(a))donde θ es la funcion θ(d) = f ′(a, d) para todo d ∈ IRn. Se deduceque ∂f(a) 6= ∅.

Demostracion. a) Si f ′(a, d) = −∞, debido a que 〈x∗, x − a〉 ≤ f ′(a, d)para todo x∗ ∈ ∂f(a), se deduce que ∂f(a) = ∅.

b) θ es convexa positivamente homogenea y θ tambien es convexa ypositivamente homogenea. Ası θ es la funcion soporte de un conjunto con-vexo cerrado D 6= ∅. Sea µx∗(d) = f ′(x, d) − 〈x∗, d〉 entonces µx∗(d) =θ(d)− 〈x∗, d〉 se sigue que

x∗ ∈ ∂f(a) ⇐⇒ µx∗(d) ≥ 0 ∀d ⇐⇒ µx∗(d) ≥ 0 ∀d

39

Page 42: Análsisi Convexo

es decirx∗ ∈ ∂f(a) ⇐⇒ 〈x∗, d〉 ≤ δ∗(x∗|D) ∀d

⇐⇒ supd

[〈x∗, d〉 − δ∗(x∗|D)] ≤ 0 ⇐⇒ δ∗(x∗|D) ≤ 0 ⇐⇒ x∗ ∈ D

en consecuencia ∂f(a) 6= ∅ y θ(d) = δ∗(d|∂f(a)).

Observacion. f convexa, sci en a y ∂f(a) 6= ∅ 6=⇒ f ′(a, .) sci

Ejemplo.

f(x, y) =

y si y < 00 si x = y = 0

+∞ en caso contrario

luego

f∗(x∗, y∗) ={

0 si x∗ = 0 y y∗ ≥ 1+∞ en caso contrario

∂f(0, 0) = {0} × [1,∞[

θ(1, 0) = f ′((0, 0), (1, 0)) = +∞

peroθ(1, 0) = sup[1x∗ + 0y∗ : (x∗, y∗) ∈ ∂f(0, 0)] = 0

Proposicion 3.7.3 Sea f convexa propia, a ∈ dom(f) entonces

∂f(a) 6= ∅ y compacto ⇐⇒ a ∈ int(dom(f))

En tal casof ′(a, .) = δ∗(.|∂f(a))

Demostracion.

a) Supongamos que a ∈ int(dom(f)), y sea d ∈ IRn, d 6= 0, entoncesexiste t > 0 tal que a+ td ∈ dom(f). Pero

θ(d) = f ′(a, d) = inft>0

f(a+ td)− f(a)t

≤ f(a+ d)− f(a)

y en consecuencia f ′(a, d) = θ(d) < +∞ ∀d ∈ IRn. θ convexa =⇒ 0 =θ(0) ≤ 1

2θ(d) + 12θ(−d) < +∞. Se sigue que θ(d) > −∞ ∀d. Por lo

tanto θ es una funcion convexa propia y dom(θ) = IRn, θ es entoncescontinua sobre int(dom(f)) = IRn y por consiguiente θ = θ de estamanera f ′(a, d) = δ∗(d|∂f(a)) < +∞ ∀d. Por consiguiente ∂f(a) esacotado y por lo tanto compacto.

b) Supongamos que ∂f(a) es compacto. Sea e1, ..., en los vectores de labase canonica. Se observa que dom(θ) = IRn, ya que dom(θ) = IRn

en consecuencia θ = θ. Debido a que f ′(a, ei) y f ′(a,−ei) son finitasexisten ti > 0 y t′i > 0 tal que f(a + tiei) y f(a − tiei) son < +∞por consiguiente a + tiei y a − t′iei ∈ dom(f). Observemos que laenvoltura convexa de los 2n puntos a+ tiei, a− t′iei es una vecindadde 0 contenido en el dom(f).

Corolario 3.7.1 Sea f convexa propia, a ∈ ri(dom(f)) entonces ∂f(a) 6=∅ y f ′(a, d) = δ∗(d|∂f(a))

40

Page 43: Análsisi Convexo

Demostracion.Considere IRn = [aff(dom(f))] × [aff(dom(f))]⊥. Defi-namos f como la restriccion de f a aff(dom(f)). Se tiene que

f(x, y) ={

f(x) si y = 0+∞ en caso contrario

entonces∂f(a1, a2) = ∂f(a1)× [aff(dom(f))]⊥

3.8 Derivadas de una funcion convexa

Sea f : IRn → IR finita en a. Se dice que f es Frechet-diferenciable en a siexiste x∗ ∈ IRn tal que

f(a+ h)− f(a)− 〈h, x∗〉‖h‖

→ 0

cuando h→ 0.Notamos que la definicion no depende de la norma in IRn y que el elementox∗ (si existe) es unico. Entonces ponemos x∗ = ∇f(a) que es llamado laderivada de Frechet en a. De manera trivial se tiene :

〈∇f(a), h〉 = f ′(a, h) ∀h si ∇f(a) existe

Teorema 3.8.1 Sea f una funcion convexa propia y a ∈ dom(f). En-tonces f es Frechet diferenciable en a ⇐⇒ ∂f(a) es un singleton. En estecaso a ∈ int(dom(f)) y ∂f(a) = {∇f(a)}.

Demostracion.

a) f Frechet-diferenciable en a ⇒ f ′(a, h) = 〈∇f(a), h〉∀h. Si x∗ ∈∂f(a), entonces 〈x∗, h〉 ≤ f ′(a, h) ≤ 〈∇f(a), h〉∀h, y entonces 〈x∗ −∇f(a), h〉 ≤ 0 ∀h. Haciendo h = x∗ −∇f(a) se tiene x∗ = ∇f(a).

b) Se supone que ∂f(a) = {x∗} entonces ∂f(a) es un compacto y a ∈int(dom(f)). Se pone g(x) = f(x)− f(a)− 〈x− a, x∗〉, entonces g esconvexa y g(a) = 0.

g′(a, h) = 0 ∀hSea (e1, e2, ..., en) la base canonica de IRn, se pone di = ei, dn + i =−ei ∀i = 1, 2, ..., n. Sea h ∈ IRn, se pone ξi = 0, ξn + i = −hisi hi < 0 y ξi = hi, ξn + i = 0 si hi ≥ 0. Entonces se tiene h =∑2ni=1 ξidi. se considera la norma ‖h‖1 =

∑ni=1 |hi| y sea ti = ξi

‖h‖i

para i = 1, 2, ..., 2n. Entonces ti ≥ 0 ∀i y∑ti = 1. Por convexidad

de g se tiene g(a+h) = g(a+∑2ni=1 ti‖h‖1di) ≤

∑2ni=1 tig(a+‖h‖1di).

Entonces 0 ≤ g(a+h)−g(a)‖h‖1 ≤

∑2ni=1 ti

g(a+‖h‖1di)−g(a)‖h‖1 . La primera

desigualdad viene del hecho de que g(a + h) ≥ g(a) ∀h. Ya queg′(a, di) = 0. Y pasando al limite se ve que

limh→0

g(a+ h)− g(a)‖h‖1

= 0

y entonces ∇g(a) = 0. Por consiguiente x∗ = ∇f(a).

41

Page 44: Análsisi Convexo

Proposicion 3.8.1 Sea f convexa sci propia. Si f es estrictamente con-vexa, entonces int(dom(f∗)) 6= ∅, f∗ es diferenciable sobre int(dom(f∗)) y∂f∗(x∗) = ∅ si x∗ /∈ int(dom(f∗)).

Demostracion. x ∈ ∂f∗(x∗) ⇒ x es solucion optimal de infx f(x) −〈x, x∗〉. La funcion f es estrictamente convexa, la solucion optimal, siexiste, es unica, entonces ∂f∗(x∗) es un singleton cada vez que ∂f∗(x∗) 6= ∅.Pero ∂f∗(x∗) 6= ∅ si x∗ ∈ ri(dom(f∗)), entonces f∗ es diferenciable sobreri(dom(f∗)) 6= ∅, f∗ diferenciable en x∗ ⇒ x∗ ∈ int(dom(f∗)). Si x∗

pertenece a la frontera del dom(f∗) entonces ∃d 6= 0 tal que x∗ + td /∈dom(f∗) ∀t > 0, pero entonces f ′∗(x∗, d) = +∞, ∂f∗(x∗) es no acotado ovacıo. Pero, si no es vacıo, es acotado porque es reducido a un punto.

Proposicion 3.8.2 Sea f convexa sci propia. Si f∗ es diferenciable entodo x∗ tal que ∂f∗(x∗) 6= ∅, entonces f es estrictamente convexa sobreri(dom(f)).

Demostracion. Supongamos que f no es estrictamente convexa sobreri(dom(f)), entonces ∃x, y ∈ ri(dom(f)) y t ∈]0, 1[ tal que x 6= y y

f(tx+ (1− t)y) = tf(x) + (1− t)f(y) (3.6)

Porque tx+ (1− t)y ∈ ri(dom(f)),∃x∗ ∈ ∂f(tx+ (1− t)y) y entonces

f(tx+ (1− t)y) + 〈x− tx− (1− t)y, x∗〉 ≤ f(x) (3.7)

f(tx+ (1− t)y) + 〈y − tx− (1− t)y, x∗〉 ≤ f(y) (3.8)

Multiplicamos (3.7) por t y (3.8) por (1− t) y sumando se tiene

f(tx+ (1− t)y) ≤ tf(x) + (1− t)f(y)

Por la ecuacion (3.6), se tiene necesariamente la igualdad en (3.7) y (3.8).Por otro lado

f(tx+ (1− t)y) + f∗(x∗) = 〈tx+ (1− t)y, x∗〉 (3.9)

Reemplazando en (3.7) y (3.8) se tiene

f∗(x∗) + f(x) = 〈x, x∗〉 y f∗(x∗) + f(y) = 〈y, x∗〉

y entonces x, y ∈ ∂f∗(x∗). Lo que es imposible porque ∂f∗(x∗) o es vacıoo es reducido a un punto.

3.9 Subdiferencial de la suma de dosfunciones convexas

Para completar, nosotros solo enunciaremos el siguiente Teorema. La de-mostracion de este Teorema sera dada en el siguiente capıtulo.

Teorema 3.9.1 Sea f y g dos funciones convexas sci propias, s = f + g,a ∈ dom(s) = [dom(f)]

⋂[dom(g)] tal que ∂f(a) 6= ∅ y ∂g(a) 6= ∅. Entonces

a) ∂f(a) + ∂g(a) ⊂ ∂s(a)

b) Si int(dom(f))⋂int(dom(g)) 6= ∅, entonces ∂f(a) + ∂g(a) = ∂s(a)

42