37
XXXIII Semana de la Matem´ atica Instituto de Matem´ aticas Pontificie Universidad Cat´ olica de Valpara´ ıso Introducci´ on al An´ alisis Convexo Pedro Gajardo Centro de Modelamiento Matem´ atico Universidad de Chile UMI 2807 CNRS http://www.dim.uchile.cl/~pgajardo/ 2006

Introduccion Al Analisis Convexo - Pedro Gajardo

Embed Size (px)

Citation preview

Page 1: Introduccion Al Analisis Convexo - Pedro Gajardo

XXXIII Semana de la MatematicaInstituto de MatematicasPontificie Universidad Catolica de Valparaıso

Introduccion al

Analisis Convexo

Pedro Gajardo

Centro de Modelamiento Matematico

Universidad de Chile UMI 2807 CNRS

http://www.dim.uchile.cl/~pgajardo/

2006

Page 2: Introduccion Al Analisis Convexo - Pedro Gajardo
Page 3: Introduccion Al Analisis Convexo - Pedro Gajardo

Dado que la forma del Universo entero es la mas perfecta y, de hecho, la mas sa-biamente creada, absolutamente nada en el mundo ocurrirıa sin que una minimizacıon omaximizacion este actuando.

Leonhard Euler (1744)

Page 4: Introduccion Al Analisis Convexo - Pedro Gajardo

Indice general

1. Presentacion 1

1.1. Conjuntos convexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2. Fundamentos de Analisis Convexo 5

2.1. Funciones convexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2. Conjuda de Fenchel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.3. Subdiferencial convexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3. Dualidad vıa perturbaciones 19

3.1. Problemas perturbados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.2. Teoremas de dualidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4. Aplicaciones 25

4.1. Programacion lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4.2. Problema de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

iv

Page 5: Introduccion Al Analisis Convexo - Pedro Gajardo

CAPITULO 1

Presentacion

El presente documento ha sido elaborado con el objetivo de ser un apoyo a las charlasrealizadas en la XXXIII Semana de la Matematica. El tema abordado es el AnalisisConvexo, teorıa que permite estudiar de manera unificada problemas de optimizacion ycalculo de variaciones en el contexto convexo. En estas paginas se podran encontrar losprimeros conceptos, resultados y ejemplos relacionados con esta disciplina, en particular,lo que concierne a la Dualidad en optimizacion convexa. La mayor parte de los contenidosde este apunte son presentados de manera similar (orden y demostraciones) al cursoAnalisis Convexo y Dualidad dictado el ano 1999 por el profesor Roberto Cominetti enla Facultad de Ingenierıa de la Universidad de Chile. Otros resultados y demostracioneshan sido obtenidos principalmente del apunte Analisis Convexo y Dualidad del ProfesorFelipe Alvarez [1] quien dicta regularmente el curso de mismo nombre en la Facultad deIngenierıa de la Universidad de Chile, y del libro, recientemente publicado, VariationalAnalysis in Sobolev and BV spaces de los autores Heddy Attouch, Giuseppe Buttazzoy Gerard Michaille [2]. Como bibliografıa complementaria se recomienda el fundacionaltexto Convex Analysis de Tyrell Rockafellar [6] asi como el libro Convex analysis andminimization algorithms de Jean B. Hiriart-Urruty y Claude Lemarechal [4, 5].

Este cursillo esta orientado a estudiantes con un cierto bagaje en analisis funcional(como referencia ver [3]) aunque en su mayorıa intenta ser autocontenido.

1

Page 6: Introduccion Al Analisis Convexo - Pedro Gajardo

1.1. CONJUNTOS CONVEXOS

1.1 Conjuntos convexos

Durante el curso se trabajara en un espacio vectorial normado real (evn) (X, ‖ · ‖) endualidad con su espacio dual topologico X∗ dotado de la norma usual

‖x∗‖∗ := supx∈X‖x‖≤1

〈x, x∗〉 x∗ ∈ X∗

donde 〈·, ·〉 denota el producto de dualidad entre X y X∗, es decir, para una funcion linealcontinua x∗ ∈ X∗ definida sobre el espacio X a valores en IR, se tiene x∗ : X −→ IR yescribiremos

〈x, x∗〉 = x∗(x) ∀ x ∈ X. (1.1.1)

Recordemos que la topologıa mas pequena en X que hace continua a los elementos en X∗

es la topologıa debil. Por otro lado, dado x ∈ X se tiene que el operador evaluacion (quenotaremos de igual manera) x : X∗ −→ IR definido por

x(x∗) = x∗(x) = 〈x, x∗〉

es lineal continuo (para la topologıa inducida por ‖ · ‖∗ en X∗), por lo tanto X ⊂ X∗∗. Latopologıa mas pequena en X∗ que hace ser continuos a los operadores evaluacion (i.e. alos elementos de X) es la topologıa ∗-debil.

Si X es un espacio vectorial normado de Banach (completo) entonces todo conjuntoacotado y cerrado (para la topologıa inducida por la norma ‖·‖∗) en X∗ es compacto parala topologıa ∗-debil. Un espacio de Banach se dice reflexivo si X puede ser identificadocon X∗∗. En este caso se tiene que los conjuntos acotados y cerrados (para la topologıade la norma) en X son compactos para la topologıa debil. Por ultimo, recordamos quelos evn de Hilbert (dotados de producto interno, norma definida por el producto internoy completo para la topologıa inducida) pueden ser identificados con su espacio dual, ental situacion, el producto de dualidad entre el espacio y su dual es el producto internoque le da el caracter de Hilbert al espacio. Como los espacios de Hilbert son reflexivos setendra tambien que todo conjunto acotado y cerrado (para la topologıa de la norma) escompacto para la topologıa debil.

Se tendra que un espacio vectorial normado X dotado de la topologıa debil y su dualtopologico X∗ dotado de la topologıa ∗-debil estan en dualidad (ver detalles en [1]) graciasal par de dualidad definido en (1.1.1).

La mayor parte de la notacion es la comunmente utilizada en los textos de analisisfuncional (ver [3]).

Definicion 1.1.1. Un conjunto C ⊂ X se dice convexo si para todo par de puntosx, y ∈ C se tiene

[x, y] := αx + (1 − α)y : α ∈ [0, 1] ⊂ C.

2

Page 7: Introduccion Al Analisis Convexo - Pedro Gajardo

1.1. CONJUNTOS CONVEXOS

De la teorıa basica de geometrıa en evn se tiene que un hiperplano cerrado H en Xpuede ser representado por

H = x ∈ X : 〈x, x∗〉 = α

para algun x∗ ∈ X∗ y α ∈ IR. De igual modo, un semiespacio cerrado H de X puede serrepresentado por

H = x ∈ X : 〈x, x∗〉 ≤ α

para algun x∗ ∈ X∗ y α ∈ IR.

A continuacion mostraremos que un conjunto convexo cerrado es descrito utilizandosolo formas lineales continuas (i.e. elementos en X∗). Este resultado esta basado en elTeorema de Hahn-Banach que se presenta a continuacion.

Teorema 1.1.1. Sea C ⊂ X un conjunto convexo cerrado no vacıo del evn X. Entonces,cada elemento u /∈ C puede ser fuertemente separado de C por un hiperplano cerrado, esdecir,

∃ z∗ ∈ X∗, z∗ 6= 0, ∃ α ∈ IR tal que 〈u, z∗〉 > α y 〈x, z∗〉 ≤ α ∀ x ∈ C.

Demostracion. La demostracion es dada cuando el evn X es un espacio de Hilbert.Para el caso general, se utiliza la version analıtica del Teorema de Hahn-Banach el cuales una consecuencia del Lema de Zorn.

Recordemos que si X es un espacio de Hilbert entonces X∗ se identifica con X y setiene que ‖x‖2 = 〈x, x〉 (producto interno ”=”producto de dualidad).

Denotemos por PC(u) la proyeccion de u ∈ X sobre el conjunto C (esta existe y esunica, ver [3]). PC(u) esta caracterizada por

〈u − PC(u), x − PC(u)〉 ≤ 0 ∀ x ∈ CPC(u) ∈ C.

Sea z∗ := u − PC(u). Como u /∈ C se tiene z∗ 6= 0 y de la caracterizacion de PC(u) sededuce

supx∈C

〈x, z∗〉 ≤ 〈PC(u), z∗〉. (1.1.2)

Por otro lado,0 < ‖z∗‖2 = 〈z∗, z∗〉 = 〈u, z∗〉 − 〈PC(u), z∗〉,

lo que implica〈u, z∗〉 > 〈PC(u), z∗〉. (1.1.3)

3

Page 8: Introduccion Al Analisis Convexo - Pedro Gajardo

1.1. CONJUNTOS CONVEXOS

Tomemos α := 〈z, PC(u)〉. Combinando (1.1.2) y (1.1.3) se obtiene

supx∈C

〈x, z∗〉 ≤ α < 〈u, z∗〉,

lo cual demuestra el resultado.

Corolario 1.1.1. Sea C ⊂ X un conjunto convexo cerrado no vacıo del evn X. Entonces,C es la interseccion de todos los semiespacios cerrados que lo contienen, es decir,

C =⋂

C⊂Hz∗,α

Hz∗,α,

donde Hz∗,α := x ∈ X : 〈x, z∗〉 ≤ α para z∗ ∈ X∗ y α ∈ IR.

Demostracion. Notemos F el conjunto de X∗ × IR dado por (notar que es no vacıo)

F := (z∗, α) ∈ X∗ × IR : C ⊂ Hz∗,α.

ClaramenteC ⊂

(z∗,α)∈F

Hz∗,α.

Para probar la inclusion inversa tomemos u ∈⋂

(z∗,α)∈F

Hz∗,α. Si u /∈ C, utilizando el teore-

ma de separacion de Hahn-Banach 1.1.1 se obtiene una contradiccion.

Observacion 1.1.1. Los conjuntos cerrados Hz∗,α de la proposicion anterior tambien re-sultan ser cerrados para la topologıa debil y por lo tanto el conjunto convexo cerrado Ces cerrado para la topologıa debil (interseccion de cerrados debiles). Ası, una conclusionimportante, y que sera utilizada mas adelante, del Corolario 1.1.1, es que todo conjuntoconvexo cerrado es tambien cerrado para la topologıa debil.

Proposicion 1.1.1. Sea Cλλ∈Λ ⊂ X una familia de conjuntos convexos cerrados novacıos, entonces C =

λ∈Λ

Cλ es un conjunto convexo cerrado.

Demostracion. Propuesto.

4

Page 9: Introduccion Al Analisis Convexo - Pedro Gajardo

CAPITULO 2

Fundamentos de Analisis Convexo

En el analisis de problemas de minimizacion y maximizacion es conveniente considerarfunciones que toman valores en la recta real extendida (mayores detalles ver en [1]) IR :=IR∪−∞, +∞ = [−∞, +∞] en lugar de solo IR =]−∞, +∞[. Por ejemplo, en un espaciovectorial normado (evn) X, consideremos un problema de minimizacion del tipo

infx∈C

f0(x) = inff0(x) : x ∈ C (2.0.1)

donde f0 : X −→ IR es la funcion objetivo a minimizar y C ⊂ X es un conjunto derestricciones. Con la topologıa apropiada, IR es un intervalo compacto. En particular,todo subconjunto A ⊂ IR admite un ınfimo inf A (y un supremo sup A). Ası, tomandoA = f0(x) : x ∈ C tenemos que inff0(x) : x ∈ C esta bien definido en IR. En estecontexto resulta muy util introducir la funcion indicatriz del conjunto C, ΨC : X −→ IR,definida por

ΨC(x) :=

0 si x ∈ C,+∞ si x /∈ C.

Con la convencionα + (+∞) = (+∞) + α = +∞ ∀ α ∈ IR,

es posible definir la funcion f0 +ΨC mediante (f0 +ΨC)(x) := f0(x)+ΨC(x), y es directoverifcar que

infx∈C

f0(x) = infx∈X

(f0 + ΨC).

De esta forma, el problema de minimizacion (2.0.1) puede formularse de manera equi-valente como

infx∈X

f(x),

5

Page 10: Introduccion Al Analisis Convexo - Pedro Gajardo

2.1. FUNCIONES CONVEXAS

donde f : X −→ IR ∪ +∞ esta defnida por f = f0 + ΨC . Esto permite considerar lasrestricciones de manera implıcita en la defnicion de f y dar ası un tratamiento unificadoa este tipo de problemas.

2.1 Funciones convexas

Definicion 2.1.1. Una funcion f : X −→ IR definida sobre un evn X es convexa si

f(αx + (1 − α)y) ≤ αf(x) + (1 − α)f(y) ∀ x, y ∈ X, ∀ α ∈ [0, 1],

y estrictamente convexa si

f(αx + (1 − α)y) < αf(x) + (1 − α)f(y) ∀ x, y ∈ X, ∀ α ∈]0, 1[.

La funcion es semicontinua inferior (sci) para una cierta topologıa τ en x ∈ dom f :=x ∈ X : f(x) < +∞ si para toda sucesion xk →τ x (convergencia segun la topologıa)se tiene

f(x) ≤ lım infk→∞

f(xk).

Si la topologıa τ es la topologıa inducida por la norma (topologıa fuerte) diremos simple-mente que f es sci.

La funcion f es coerciva si

lım‖x‖→+∞

f(x) = +∞.

Finalmente, la funcion f se dice propia si f no toma nunca el valor −∞ y existe x ∈ Xtal que f(x) < +∞. El conjunto de las funciones convexas, sci y propias definidas sobreel evn X sera denotado por Γ0(X).

Observe que si f0 : X −→ IR es una funcion convexa sci y C ⊂ X es un conjuntoconvexo cerrado no vacıo, entonces la funcion f : X −→ IR ∪ +∞ definida por

f = f0 + ΨC

es una funcion convexa sci y propia.

El epigrafo de una funcion f : X −→ IR esta definido por

epi f := (x, r) ∈ X × IR : f(x) ≤ r.

Este conjunto del espacio producto es muy util ya que nos permite trabajar con funcionesy conjuntos indistintamente debido a las siguientes equivalencias.

6

Page 11: Introduccion Al Analisis Convexo - Pedro Gajardo

2.1. FUNCIONES CONVEXAS

Proposicion 2.1.1. Sea f : X −→ IR definida sobre un evn X. Entonces, se tiene que

f es convexa si y solamente si (ssi) epi f es un conjunto convexo en el espacioproducto X × IR;

f es sci para la topologıa τ si y solamente si (ssi) epi f es un conjunto cerrado enel espacio producto X × IR, donde X esta dotado de la topologıa τ ;

f es propia ssi epi f es un conjunto no vacıo.

Demostracion. Propuesto.

Observacion 2.1.1. Si la funcion f : X −→ IR∪+∞ es convexa y semicontinua inferior(sci) (para la topologıa fuerte) entonces, por el resultado anterior se tiene que epi f esun conjunto convexo cerrado (para la topologıa fuerte). Debido a la Observacion 1.1.1deducimos que epi f es cerrado para la topologıa debil en X × IR. Ası, por la Proposicion2.1.1, se demuestra que f sera tambien semicontinua inferior (sci) para la topologıa debil,es decir, para todo x ∈ dom f y para toda sucesion xk convergiendo debil a x, se tiene

f(x) ≤ lım infk→∞

f(xk).

Dada una funcion f : X −→ IR∪+∞, si consideramos el problema de optimizacion

(P ) infx∈X

f(x)

se obtiene el siguiente resultado.

Teorema 2.1.1. Si el evn X es un espacio reflexivo y la funcion f es convexa, sci, propiay coerciva, entonces existe x tal que

f(x) = infx∈X

f(x).

Si ademas, f es estrictamente convexa, entonces el minimizador x es unico.

Demostracion. Dado que f es propia, entonces existe x0 ∈ X tal que γ := f(x0) < +∞.Sea xk una sucesion minimizante del problema de minimizacion, es decir,

f(xk) → infx∈X

f(x).

Esta sucesion existe ya que como infx∈X

f(x) ≤ γ, podrıan ocurrir dos casos: si

infx∈X

f(x) > −∞

7

Page 12: Introduccion Al Analisis Convexo - Pedro Gajardo

2.1. FUNCIONES CONVEXAS

para cada k ∈ N existe xk tal que (de la definicion de ınfimo)

infx∈X

f(x) ≤ f(xk) ≤ infx∈X

f(x) + 1/k.

Si infx∈X

f(x) = −∞ (mas adelante veremos que esto no ocurre) tomamos xk tal que

f(xk) ≤ −k + γ + 1. Ası, se observa que (en cualquiera de los dos casos)

xk ∈ M := x ∈ X : f(x) ≤ γ + 1 ∀ k ∈ N.

Debido a que f es convexa y sci es facil probar que el conjunto M es convexo y cerrado.Por otro lado, dado que f es coerciva, se tendra que M es acotado. De hecho, si existeuna sucesion yk ∈ M con ‖yk‖ → +∞ por la coercividad obtendrıamos f(yk) → +∞lo que no puede ser ya que yk ∈ M . Por lo tanto el conjunto M es cerrado y acotadoy como X es un espacio reflexivo, M sera compacto para la topologıa debil. Ası, existeuna subsucesion de xk (que notaremos igual) que converge debil a un elemento x ∈ X.Concluımos pues la funcion f es sci para la topologıa debil (ver Observacion 2.1.1) y porlo tanto

infx∈X

f(x) ≤ f(x) ≤ lım infk→∞

f(xk) = lımk→∞

f(xk) = infx∈X

f(x).

Ademas, como f es propia, se tiene

−∞ < infx∈X

f(x) = f(x).

Si f es estrictamente convexa, supongamos x1 6= x2 tales que

f(x1) = infx∈X

f(x) = f(x2).

Sea z := 1/2(x1 + x2). De la definicion de estricta convexidad obtenemos

f(z) < 1/2(f(x1) + f(x2)) = infx∈X

f(x),

lo que es una contradiccion.

Observacion 2.1.2. El resultado anterior puede ser extendido, en cierta forma, cuando fno es convexa. De hecho, siguiendo los pasos de la demostracion precedente, se prueba lomismo si la funcion f es sci para la topologıa debil y es coerciva.

Veamos ahora un resultado que se obtiene como aplicacion directa de las equivalenciasdadas en la Proposicion 2.1.1.

8

Page 13: Introduccion Al Analisis Convexo - Pedro Gajardo

2.1. FUNCIONES CONVEXAS

Proposicion 2.1.2. Sea fλ : X −→ IR ∪ +∞ una familia de funciones convexas, sci,propias indexadas por λ ∈ Λ. Entonces se tiene que la funcion definida por

f(x) = supλ∈Λ

fλ(x) (2.1.1)

tambien es convexa y sci.

Demostracion. Basta notar que el epigrafo de la funcion f definida por (2.1.1) es lainterseccion de los epigrafos, es decir,

epi f =⋂

λ∈Λ

epi fλ ∈ X × IR.

Aplicando las proposiciones 1.1.1 y 2.1.1 se deduce el resultado.

El resultado anterior puede ser presentado de forma mas general, de hecho, veremos acontinuacion que toda funcion convexa, sci y propia puede ser expresada como el supremode funciones lineales afines. Esto ultimo es una consecuencia directa del Teorema deseparacion de Hahn-Banach 1.1.1.

Teorema 2.1.2. Sea f : X −→ IR∪+∞ una funcion convexa, sci y propia (f ∈ Γ0(X)),entonces existe un conjunto M ⊂ X∗ × IR tal que

f(x) = sup(z∗,α)∈M

〈x, z∗〉 − α ∀ x ∈ X. (2.1.2)

Demostracion. Sea M el conjunto del espacio producto X∗× IR definido por (tambienllamado conjunto de lineales afines minorantes)

(x∗, α) ∈ M ⇔ 〈x, z∗〉 − α ≤ f(x) ∀ x ∈ X.

Notemos que M 6= ∅, de hecho, como epi f ⊂ X × IR es un conjunto convexo cerrado novacıo (pues f ∈ Γ0(X)) se tiene que (ver Corolario 1.1.1)

epi f =⋂

(z∗,s,α)∈F

H(z∗,s),α,

donde H(z∗,s),α es el semiespacio cerrado en el espacio producto X × IR definido por

H(z∗,s),α = (x, r) ∈ X × IR : 〈x, z∗〉 + rs ≤ α,

y F ⊂ X∗ × IR × IR es la familia de semiespacios que contiene epi f , es decir,

(z∗, s, α) ∈ F ⇔ epi f ⊂ H(z∗,s),α.

9

Page 14: Introduccion Al Analisis Convexo - Pedro Gajardo

2.1. FUNCIONES CONVEXAS

Primero veamos que si (z∗, s, α) ∈ F entonces s ≤ 0, de hecho

(z∗, s, α) ∈ F ⇒ 〈x, z∗〉 + sr ≤ α ∀(x, r) ∈ epi f.

Si s > 0 tomando x ∈ dom f y r suficientemente grande la desigualdad anterior es falsa.Ahora, si para todo elemento (z∗, s, α) en F se tiene s = 0, entonces

epi f =⋂

(z∗,s,α)∈F

(x, r) ∈ X × IR : 〈x, z∗〉 ≤ α,

lo que implica que si (x, r) ∈ epi f se tendra (x, r − n) ∈ epi f para todo n ∈ N lo cualinduce a una contradiccion, por lo tanto debe existir (z∗, s, α) ∈ F con s < 0. Sin perdidade generalidad supondremos (haciendo una normalizacion) s = −1. Ası, se tiene que

epi f ⊂ H(z∗,−1),α

lo que implica〈x, z∗〉 − r ≤ α ∀ (x, r) ∈ epi f

y por lo tanto〈x, z∗〉 − α ≤ f(x) ∀ x ∈ X

mostrando asi que M 6= ∅ ((z∗, α) ∈ M).

Mostremos ahora la igualdad (2.1.2). Claramente

f(x) ≥ sup(z∗,α)∈M

〈x, z∗〉 − α ∀ x ∈ X.

Para probar la desigualdad contraria, utilicemos el Teorema de separacion de Hahn-Banach 1.1.1. Sea x0 ∈ X y r ∈ R tal que r0 < f(x0), es decir, (x0, r0) /∈ epi f .Como el epigrafo de f es un conjunto convexo, cerrado, no vacıo se tiene que existe(z∗, s, α) ∈ X∗ × IR × IR no nulo tal que

〈x, z∗〉 + rs ≤ α ∀ (x, r) ∈ epi f y 〈x0, z∗〉 + r0s > α. (2.1.3)

Por un argumento utilizado anteriormente, se deduce s ≤ 0.

Veamos el caso f(x0) < +∞. En esta situacion se tendra que s < 0, pues si s = 0tomamos (x0, f(x0)) ∈ epi f y por (2.1.3) se deduce

〈x0, z∗〉 ≤ α < 〈x0, z

∗〉

lo que es absurdo. Sin perdida de generalidad (otra vez) suponemos s = −1. De la relacion(2.1.3) deducimos (notar que (x, f(x)) ∈ epi f)

〈x, z∗〉 − α ≤ f(x) ∀x ∈ X

10

Page 15: Introduccion Al Analisis Convexo - Pedro Gajardo

2.2. CONJUDA DE FENCHEL

y por lo tanto (z∗, α) ∈ M. Ademas, de la segunda parte de (2.1.3)

sup(z∗,α)∈M

〈x0, z∗〉 − α ≥ 〈x0, z

∗〉 − α > r0

para todo r0 < f(x0) demostrando ası

sup(z∗,α)∈M

〈x0, z∗〉 − α ≥ f(x0).

El caso f(x0) = +∞ es dejado como ejercicio.

2.2 Conjuda de Fenchel

En esta seccion veremos un concepto muy importante en Analisis Convexo, opti-mizacion y otras areas de las matematicas aplicadas (tratamiento de imagenes por ejem-plo).

Definicion 2.2.1. Sea la funcion f : X −→ IR ∪ +∞. La conjuda de Fenchel de lafuncion f es la funcion f ∗ : X∗ −→ IR ∪ +∞ definida por

f ∗(x∗) := supx∈X

〈x, x∗〉 − f(x).

Recordemos que los espacios X y X∗ se consideran como espacios en dualidad (detallesver [1]), ası la conjugada de g : X∗ −→ IR∪ +∞ es g∗ : X −→ IR∪ +∞ definida por

g∗(x) := supx∗∈X∗

〈x∗, x〉 − g(x∗).

Observe que la funcion f ∗ : X∗ −→ IR∪+∞ es convexa, semicontinua inferior (sci)y propia (f ∗ ∈ Γ0(X

∗)) debido a que es el supremo de funciones lineales continuas afines.

Proposicion 2.2.1. Considere la funcion f : X −→ IR ∪ +∞. f es funcion convexa,sci y propia (f ∈ Γ0(X)) sı y solo si

f ∗∗(x) = supx∗∈X∗

〈x∗, x〉 − f ∗(x∗) = f(x).

Demostracion. Es directo mostrar que la funcion f ∗∗ es convexa, sci y propia. Porotro lado, de las definiciones, no es difıcil ver que siempre se tiene f ∗∗ ≤ f . La igualdad

11

Page 16: Introduccion Al Analisis Convexo - Pedro Gajardo

2.2. CONJUDA DE FENCHEL

proviene del hecho que f , por pertenecer a Γ0(X), es el supremo de todas las minorantesafines (Teorema 2.1.2), es decir,

f(x) = sup〈x, x∗〉 − α : 〈y, x∗〉 − α ≤ f(y) ∀ y ∈ X. (2.2.1)

Si se fija un elemento x∗ ∈ X∗ y se hace variar α tal que 〈·, x∗〉 − α ≤ f(·) se observa queel mejor α que se podrıa obtener es

α = supy∈X

〈y, x∗〉 − f(y) = f ∗(x∗),

pudiendo ser eventualmente +∞ (dependera de x∗). Esto mas la expresion (2.2.1) prue-ban el resultado deseado.

Ejemplo 2.2.1. Sea X = IR y la funcion f definida por f(x) = ex, pruebe que

f ∗(x∗) =

+∞ si x∗ < 00 si x∗ = 0x∗(ln x∗ − 1) si x∗ > 0.

Ejemplo 2.2.2. Sea X un espacio de Hilbert y f(x) = 12‖x‖2. Mostremos que

f ∗(x∗) =1

2‖x∗‖2 = f(x∗).

Demostracion. Dado x∗ ∈ X∗ = X, considere la funcion diferenciable

g(x) = 〈x, x∗〉 −1

2‖x‖2.

El elemento x donde se maximiza la funcion g satisface

∇g(x) = x∗ − x = 0.

Por lo tanto f ∗(x∗) = g(x) = 12‖x∗‖2.

Ejemplo 2.2.3 (Se requiere de conocimientos en espacios de Sobolev, ver [3]). Sea Ω unconjunto abierto acotado y no vacıo de IRn. Considere el espacio de Hilbert X = L2(Ω)de las funcion a cuadrado integrable, es decir,

L2(Ω) =

u : Ω −→ IR |

Ω

u2(x)dx < +∞

.

Como X es un Hilbert su dual topologico X∗ lo identificaremos con el mismo, asi, elproducto de dualidad (producto interno en X = L2(Ω)) estara dado por

〈u, u∗〉L2(Ω),L2(Ω) =

Ω

u(x)u∗(x)dx u, u∗ ∈ L2(Ω)

12

Page 17: Introduccion Al Analisis Convexo - Pedro Gajardo

2.2. CONJUDA DE FENCHEL

induciendo la norma

‖u‖L2(Ω) =

(∫

Ω

u2(x)dx

)12

.

Sea la funcion f : X −→ IR ∪ +∞ definida por

f(u) =

12

Ω

‖∇u(x)‖2dx si u ∈ H1(Ω)

+∞ si u /∈ H1(Ω)

donde H1(Ω) es el conjunto de las funciones en X con derivada (en el sentido de lasdistribuciones) a cuadrado integrable. Es directo ver que f es una funcion convexa ypropia. Probemos primero que f es sci. Sea u ∈ H1(Ω) = dom f y tomemos uk → u (conla topologia de la norma en X = L2(Ω). Debemos demostrar que

f(u) ≤ lım infk→∞

f(uk).

El caso no trivial es cuando lım infk→∞

f(uk) < +∞. En este caso se tendra que existe M > 0

tal que

f(uk) =1

2

Ω

‖∇uk(x)‖2dx ≤ M ∀k ≥ 0. (2.2.2)

Como uk es una susecion acotada en X (es convergente) se tiene por (2.2.2) que sera aco-tada en H1(Ω) y por lo tanto existe una subsucesion convergente que converge debil aun elemento w ∈ H1(Ω) (este espacio es reflexivo) como uk converge fuerte a u en X sededuce w = u.

Por otro lado, si consideramos la funcion J : H1(Ω) −→ IR definida por

J(u) =1

2

Ω

‖∇u(x)‖2dx

se observa que J es convexa y continua (para la topologıa fuerte en H1(Ω)). De la Ob-servacion 2.1.1 se deduce que el funcional J es sci para la topologıa debil y como f = Jsobre H1(Ω) se obtiene

f(u) = J(u) ≤ lım infk→∞

J(uk) = lım infk→∞

f(uk),

debido a que una subsucesion de uk converge debil a u en H1(Ω).

Calculemos ahora f ∗. De la definicion escribimos

f ∗(v) = supu∈L2(Ω)

Ω

v(x)u(x)dx − f(u) =

13

Page 18: Introduccion Al Analisis Convexo - Pedro Gajardo

2.3. SUBDIFERENCIAL CONVEXO

supu∈H1(Ω)

Ω

v(x)u(x)dx −1

2

Ω

‖∇u(x)‖2dx = − infu∈H1(Ω)

1

2

Ω

‖∇u(x)‖2dx −

Ω

v(x)u(x)dx.

Observamos que la expresion anterior es la formulacion variacional de la siguiente EDP

−4u = v en Ω∂u∂n

= 0 en ∂Ω

Por lo tanto, si uv es la solucion en H1(Ω) de dicha EDP, entonces

f ∗(v) =

Ω

v(x)uv(x)dx −1

2

Ω

‖∇uv(x)‖2dx.

2.3 Subdiferencial convexo

Sea f : X −→ IR∪+∞ una funcion convexa y x ∈ dom f = z ∈ X : f(z) < +∞.Diremos que x∗ ∈ X∗ es un subgradiente de f en x si

f(x) + 〈y − x, x∗〉 ≤ f(y) ∀ y ∈ X.

Denotaremos por ∂f(x) ⊂ X∗ el conjunto de todos los subgradientes de f en x ∈ dom f .El conjunto

∂f(x) = x∗ ∈ X∗ : f(x) + 〈y − x, x∗〉 ≤ f(y) ∀ y ∈ X,

es llamado el subdiferencial de f en x ∈ dom f .

Proposicion 2.3.1. Un elemento x ∈ X es un mınimo global de f (i.e. f(x) ≤ f(x) ∀ x ∈X) sı y solamente si 0 ∈ ∂f(x).

Demostracion. Es directo de la definicion del subdiferencial ∂f .

Proposicion 2.3.2. Si la funcion convexa f : X −→ IR ∪ +∞ es diferenciable enx ∈ X entonces ∂f(x) = ∇f(x).

Demostracion. Es facil mostrar que si f es diferenciable entonces ∇f(x) ∈ ∂f(x). Dehecho, una propiedad de las funciones convexas diferenciables es

f(x) + 〈y − x,∇f(x)〉 ≤ f(y) ∀ y ∈ X, (2.3.1)

puesf(ty + (1 − t)x) = f(x + t(y − x)) ≤ tf(y) + (1 − t)f(x)

14

Page 19: Introduccion Al Analisis Convexo - Pedro Gajardo

2.3. SUBDIFERENCIAL CONVEXO

para t pequeno. Esto implica

f(x) + t−1[f(x + t(y − x)) − f(x)] ≤ f(y)

y haciendo tender t → 0 se obtiene la expresion (2.3.1). Sea ahora x∗ ∈ ∂f(x). De ladefinicion de subgradiente se tiene

g(x) := f(x) + 〈x, x∗〉 ≤ f(y) + 〈y, x∗〉 = g(y) ∀ y ∈ X,

es decir, la funcion diferenciable g se minimiza en x, por lo tanto

∇g(x) = ∇f(x) − x∗ = 0

obteniendo ası el resultado.

Proposicion 2.3.3. Para todo elemento en x ∈ X el conjunto ∂f(x) ⊂ X ∗ es convexo ycerrado para la topologıa ∗-debil.

Demostracion. Observamos que el subdiferencial ∂f(x) es una interseccion de semies-pacios cerrados para la topologıa ∗-debil, de hecho

∂f(x) = x∗ ∈ X∗ : f(x) + 〈y − x, x∗〉 ≤ f(y) ∀ y ∈ X

=⋂

y∈X

x∗ ∈ X∗ : 〈y − x, x∗〉 ≤ f(y) − f(x),

donde un elemento en X es entendido como un funcional lineal continuo (para la topologıa∗-debil) definido sobre X∗.

Proposicion 2.3.4. Para una funcion convexa f : X −→ IR ∪ +∞ se tiene quex∗ ∈ ∂f(x) sı y solamente si

f(x) + f ∗(x∗) = 〈x, x∗〉.

Demostracion. La desigualdad

f(x) + f ∗(x∗) ≥ 〈x, x∗〉

siempre es cierta para cualquier elemento en X∗ debido a la definicion de f ∗. Esta esconocida como la desigualdad de Fenchel. Por otro lado, si x∗ ∈ ∂f(x) entonces

f(x) + 〈y − x, x∗〉 ≤ f(y) ∀ y ∈ X ⇒ f ∗(x∗) = supy∈X

〈y, x∗〉 − f(y) ≤ 〈x, x∗〉 − f(x).

15

Page 20: Introduccion Al Analisis Convexo - Pedro Gajardo

2.3. SUBDIFERENCIAL CONVEXO

Ejemplo 2.3.1. Sea X un espacio de Hilbert y f la funcion definida por f(x) = ‖x‖,entonces

∂f(x) =

x/‖x‖ si x 6= 0BX si x = 0

donde BX = z ∈ X : ‖z‖ ≤ 1 es la bola unitaria en X.

Demostracion. El caso x 6= 0 se obtiene mediante la Proposicion 2.3.2 ya que f(·) = ‖·‖es diferenciable en X \ 0 (esto es cierto en todo evn reflexivo). Sea x∗ ∈ ∂f(0), de ladefinicion de subgradiente observamos que

〈y, x∗〉 ≤ ‖y‖ ∀ y ∈ X ⇒ ‖x∗‖∗ = supy∈X‖y‖≤1

〈y, x∗〉 ≤ 1.

La siguiente proposicion permite calcular el operador inverso del subdiferencial de unafuncion convexa.

Proposicion 2.3.5. Para una funcion f : X −→ IR ∪ +∞ en Γ0(X) (convexa, sci ypropia) se tiene que

x∗ ∈ ∂f(x) ⇔ x ∈ ∂f ∗(x∗).

Demostracion. De la Proposicion 2.3.4 y recordando que f = f ∗∗ obtenemos

x∗ ∈ ∂f(x) ⇔ f(x) + f ∗(x∗) = 〈x, x∗〉

⇔ f ∗∗(x) + f ∗(x∗) = 〈x, x∗〉 ⇔ x ∈ ∂f ∗(x∗).

La proposicion anterior es una extension de un resultado obtenido por Legendre. Elya se habıa percatado que el operador inverso del gradiente de una funcion convexa cor-respondıa al gradiente de otra funcion convexa.

Proposicion 2.3.6. Para una funcion f : X −→ IR ∪ +∞ convexa se cumplen lassiguientes dos propiedades:

(a) ∂f(x) 6= ∅ ⇒ f(x) = f ∗∗(x)

(b) f(x) = f ∗∗(x) ⇒ ∂f(x) = ∂f ∗∗(x).

16

Page 21: Introduccion Al Analisis Convexo - Pedro Gajardo

2.3. SUBDIFERENCIAL CONVEXO

Demostracion. Siempre se tiene f ≥ f ∗∗ (incluso si f no es convexa) debido a ladesigualdad de Fenchel. Por otro lado, si x∗ ∈ ∂f(x) entonces f(x) + 〈· − x, x∗〉 es unafuncion lineal afin de f ∗ y como f ∗∗ es el supremo de todas las minorantes afines de f ∗

obtenemosf ∗∗(·) ≥ f(x) + 〈· − x, x∗〉.

Evaluando en x se concluye f ∗∗(x) ≥ f(x). Para demostrar la segunda parte, sea f(x) =f ∗∗(x) y x∗ ∈ ∂f(x), esto es equivalente (por la Proposicion 2.3.4) a

f(x) + f ∗(x∗) = 〈x, x∗〉 ⇔ f ∗∗(x) + f ∗(x∗) = 〈x, x∗〉.

Debido a que f ∗ es convexa, sci y propia, por la Propiedad 2.2.1 se tiene que f ∗ = (f ∗)∗∗.Asi,

f ∗∗(x) + (f ∗)∗∗(x∗) = 〈x, x∗〉

lo que es equivalente a decir (por la Proposicion 2.3.4) x∗ ∈ ∂f ∗∗(x).

Observando los pasos seguidos en la demostracion anterior se deduce que siempre∂f(x) ⊂ ∂f ∗∗(x).

17

Page 22: Introduccion Al Analisis Convexo - Pedro Gajardo

2.3. SUBDIFERENCIAL CONVEXO

18

Page 23: Introduccion Al Analisis Convexo - Pedro Gajardo

CAPITULO 3

Dualidad vıa perturbaciones

3.1 Problemas perturbados

Sea X un espacio vectorial normado (evn) y f : X −→ IR ∪ +∞ una funcionconvexa semicontinua inferior (sci) y propia (f ∈ Γ0(X)). Consideremos el problema deoptimizacion siguiente:

(P ) mınx∈X

f(x).

Al problema (P ) lo llamaremos problema primal.

Supongamos que el problema (P ) esta inmerso en una familia de problemas de opti-mizacion

(Py) v(y) = mınx∈X

φ(x, y), (3.1.1)

donde y ∈ Y (evn llamado espacio de perturbaciones) y φ : X ×Y −→ IR∪+∞ es unafuncion convexa, sci y propia (φ ∈ Γ0(X × Y )) tal que

φ(·, 0) = f(·).

Ahora, consideremos la funcion conjugada de φ

φ∗ : X∗ × Y ∗ −→ IR ∪ +∞

a la cual le asociamos la familia de problemas

w(x∗) = mıny∗∈Y ∗

φ∗(x∗, y∗).

19

Page 24: Introduccion Al Analisis Convexo - Pedro Gajardo

3.2. TEOREMAS DE DUALIDAD

Llamaremos problema dual asociado al problema primal (P ) a

w(0) = mıny∗∈Y ∗

φ∗(0, y∗).

Observe que al problema (D) podemos a su vez asociarle su problema dual utilizando laconjugada de φ∗ la cual resultara ser φ, es decir, el problema dual de (D) es el problemaprimal (P ) (bidual ≡ primal).

Proposicion 3.1.1. La funcion valor v : Y −→ IR ∪ +∞ definida por (3.1.1) esconvexa.

Demostracion. Propuesto.

Notemos que la funcion conjugada (de Fenchel) de la funcion valor v : Y −→ IR∪+∞definida por (3.1.1) esta dada por

v∗(y∗) = supy∈Y

〈y, y∗〉Y,Y ∗ − v(y) = supy∈Y

〈y, y∗〉Y,Y ∗ − infx∈X

φ(x, y)

= supy∈Y

〈y, y∗〉Y,Y ∗ + supx∈X

−φ(x, y) = supy∈Y

supx∈X

〈y, y∗〉Y,Y ∗ + 〈x, 0〉X,X∗ − φ(x, y) = φ∗(0, y∗),

donde 〈·, ·〉X,X∗ y 〈·, ·〉Y,Y ∗ son los pares de dualidad entre los espacios (X,X∗) e (Y, Y ∗).Durante el resto del apunte notaremos simplemente 〈·, ·〉 siempre y cuando no existaconfusion.

3.2 Teoremas de dualidad

Consideremos α y β los valores de los problemas primal y dual respectivamente, esdecir,

(P ) α := mınx∈X

φ(x, 0) (3.2.1)

y(D) β := mın

y∗∈Y ∗φ∗(0, y∗), (3.2.2)

donde φ ∈ Γ0(X × Y ) con φ(·, 0) = f(·) ∈ Γ0(X). Recordemos que las funciones valorestan dadas por

v(y) = mınx∈X

φ(x, y) y w(x∗) = mıny∗∈Y ∗

φ∗(x∗, y∗),

que pueden tomar valores en IR. Vimos que v(·) es una funcion convexa y que

v∗(·) = φ∗(0, ·).

20

Page 25: Introduccion Al Analisis Convexo - Pedro Gajardo

3.2. TEOREMAS DE DUALIDAD

Lo mismo se puede demostrar para la funcion valor w, es decir, w tambien es una funcionconvexa y w∗(x) = φ(x, 0) = f(x). Ası los problemas primal y dual pueden ser escritos dela siguiente forma

(P ) mınx∈X

w∗(x) (3.2.3)

y(D) mın

y∗∈Y ∗v∗(y∗). (3.2.4)

A continuacion veremos dos resultados que relacionan los valores de los problemasprimal y dual. El primero de ellos es conocido como el Teorema de dualidad abstracta.Para ello notaremos por S(P ) y S(D) los conjunto soluciones de los problemas primal ydual respectivamente, es decir, si x ∈ S(P ) entonces f(x) ≤ f(x) para todo x ∈ X.

Teorema 3.2.1. Si ∂v(0) 6= ∅ entonces

1. α = −β

2. S(D) = ∂v(0).

Equivalentemente, se obtiene que si ∂w(0) 6= ∅, entonces

1. α = −β

2. S(P ) = ∂w(0).

Demostracion. De la primera parte de la Proposicion 2.3.6 se tiene que si ∂v(0) 6= ∅entonces α = v(0) = v∗∗(0). Ademas,

α = v∗∗(0) = supy∗∈Y ∗

〈0, y∗〉 − v∗(y∗) = − infy∗∈Y ∗

v∗(y∗) = −β.

Por otro lado, dado que v(0) = v∗∗(0), de la segunda parte de la Proposicion 2.3.6 se tiene∂v(0) = ∂v∗∗(0). Si y∗ ∈ S(D) de la Proposicion 2.3.1 y de la expresion del problemadual (3.2.4) se deduce 0 ∈ ∂v∗(y∗) y dado que v∗ ∈ Γ0(Y

∗) de la Proposicion 2.3.4 y 2.3.6concluımos

y∗ ∈ ∂v∗∗(0) = ∂v(0).

La demostracion de la segunda parte del teorema es analoga a la anterior.

El teorema anterior nos da una caracterizacion del conjunto de soluciones del problemadual S(D) ademas de una relacion entre los valores de los problemas primal y dual. Ahoraveremos un resultado similar, conocido como el Teorema de dualidad practico, con una

21

Page 26: Introduccion Al Analisis Convexo - Pedro Gajardo

3.2. TEOREMAS DE DUALIDAD

hipotesis, a priori, mas facil de verificar. Para esto necesitaremos los teoremas que damosa continuacion y cuyas demostraciones pueden ser vistas en [1].

Antes, recordemos que una funcion f : X −→ IR ∪ +∞ es localmente acotada enx ∈ dom f si existe una vecindad Vx de x y R ∈ IR tal que

f(y) ≤ R ∀ y ∈ Vx.

Por otro lado, la funcion f sera localmente Lipschitz en x ∈ dom f (y por lo tantocontinua en x) si existe una vecindad Vx de x y una constante L > 0 (que depende de x)tal que

|f(y) − f(y′)| ≤ L‖y − y′‖ ∀ y, y′ ∈ Vx.

Teorema 3.2.2. Si f : X −→ IR∪+∞ es un funcion convexa, entonces f es localmenteacotada en x ∈ dom f sı y solo si f es localmente Lipschitz en x.

Demostracion. Ver [1] Teorema 2.1.1.

Teorema 3.2.3. Si f : X −→ IR∪+∞ es convexa, finita y continua en x ∈ X entonces∂f(x) 6= ∅.

Demostracion. Ver [1] Teorema 2.4.1.

Teorema 3.2.4. Consideremos el esquema de dualidad (3.2.1) y (3.2.2) asociado a lafuncion φ ∈ Γ0(X×Y ). Supongamos que existe x0 ∈ X tal que la funcion φ(x0, ·) es finitay continua en y = 0. Entonces, v(0) = α = −∞, o se tiene

1. α + β = 0

2. S(D) = ∂v(0) 6= ∅

Demostracion. Sea V un vecindad de y = 0 en el evn Y tal que

φ(x0, y) ≤ φ(x0, 0) + 1 ∀ y ∈ V.

Dado que v(y) ≤ φ(x0, y) se tendra que la funcion convexa v es acotada en V (vecindadde cero en Y ) y por el Teorema 3.2.2, v(·) es continua en y = 0. Si v(0) > −∞, entoncespor el Teorema 3.2.3 se tiene que ∂v(0) 6= ∅ y gracias al Teorema de la dualidad abstracto3.2.1 concluımos ya que si v(0) es finito entonces α + β = 0.

22

Page 27: Introduccion Al Analisis Convexo - Pedro Gajardo

3.2. TEOREMAS DE DUALIDAD

La hipotesis del teorema de dualidad 3.2.4 se conoce como condicion de calificacionprimal. Observe que siguiendo una demostracion analoga a este teorema y utilizando lasegunda parte del Teorema 3.2.1 se puede obtener un resultado con condiciones sobre lafuncion φ∗ ∈ Γ0(X

∗ × Y ∗) en vez de la funcion φ. Dichas condiciones se conocen comocondicion de calificacion dual.

Cuando se tiene α + β = 0 se dice que no hay salto de dualidad, ası, al resolverel problema primal (P ) se estara resolviendo el problema dual (D) o viceversa. El casoα = −∞ es un caso patologico y se dice que el problema primal (P ) es no acotado.Por otro lado, no es difıcil mostrar que en tal caso, β resulta ser +∞ y por lo tanto, elproblema dual (D) es infactible.

23

Page 28: Introduccion Al Analisis Convexo - Pedro Gajardo

3.2. TEOREMAS DE DUALIDAD

24

Page 29: Introduccion Al Analisis Convexo - Pedro Gajardo

CAPITULO 4

Aplicaciones

En este ultimo capıtulo son presentados dos ejemplos donde se aplican los resultados dela dualidad vistos en las unidades precedentes. El primero es el problema de programacionlineal en dimension finita y el segundo es el problema de Dirichlet.

4.1 Programacion lineal

Sea IRn y IRm dotados del producto interno habitual (que notaremos de la mismamanera)

〈x, x′〉 =n∑

i=1

xix′i ∀ x = (x1, . . . , xn), x′ = (x′

1, . . . , x′n) ∈ IRn,

〈y, y′〉 =m∑

i=1

yiy′i ∀ y = (y1, . . . , ym), y′ = (y′

1, . . . , y′m) ∈ IRm,

y la norma Euclidiana inducida

‖x‖2n = 〈x, x〉 =

n∑

i=1

x2i ∀ x = (x1, . . . , xn) ∈ IRn,

‖y‖2m = 〈y, y〉 =

m∑

i=1

y2i ∀ y = (y1, . . . , ym) ∈ IRm.

25

Page 30: Introduccion Al Analisis Convexo - Pedro Gajardo

4.1. PROGRAMACION LINEAL

Dado los vectores c ∈ IRn, b ∈ IRm y la matriz A ∈ Mm×n (matrices de m filas y ncolumnas) se desea estudiar el problema de optimizacion

(P ) infx∈IRn

Ax≤b

〈c, x〉

donde la desigualdad Ax ≤ b es componente a componente. El problema (P ) es conocidocomo programacion lineal.

Sea X = IRn e Y = IRm. Consideremos la funcion φ : X × Y −→ IR ∪ +∞ definidapor

φ(x, y) =

〈c, x〉 si Ax ≤ b − y+∞ si no.

Observe que si Ax ≤ b, entonces φ(0, x) = 〈c, x〉.

Es directo mostrar que φ es convexa y semicontinua inferior (sci). Calculemos la con-jugada de Fenchel de la funcion φ:

φ∗(x∗, y∗) = sup(x,y)∈X×Y

〈x, x∗〉 + 〈y, y∗〉 − φ(x, y) = sup(x,y)∈X×Y

Ax≤b−y

〈x, x∗〉 + 〈y, y∗〉 − 〈c, x〉.

Si existe una cordenada i de y∗ ∈ Y ∗ = IRm negativa (i.e. y∗i < 0), entonces tomando

x = 0 y haciendo tender yi → −∞ se obtiene que el supremo anterior es +∞.

Supongamos y∗ ≥ 0 (i.e. y∗i ≥ 0 para todo i). En este caso se tiene que el mayor valor

de 〈y, y∗〉 bajo la restriccion Ax ≤ b − y se obtiene con y = b − Ax, por lo tanto

φ∗(x∗, y∗) = supx∈X

〈x, x∗〉 + 〈b − Ax, y∗〉 − 〈c, x〉 = supx∈X

〈x, x∗ − A∗y∗ − c〉 + 〈b, y∗〉,

con A∗ la matriz traspuesta de A. Si alguna coordenada del vector x∗−A∗y∗−c es distintade cero, el supremo anterior es +∞ y por lo tanto

φ∗(x∗, y∗) =

〈b, y∗〉 si y∗ ≥ 0 y A∗y∗ + c = x∗

+∞ si no.

Por lo anterior, el problema dual (D) asociado al problema primal (P ) se escribe

(D) infy∗∈IRm

φ∗(0, y∗) = infy∗∈IRm

A∗y∗+c=0y∗≥0

〈b, y∗〉.

Veamos ahora como se traduce la condicion de calificacion primal, es decir, que significaque exista x0 ∈ X = IRn tal que φ(x0, ·) sea finita y continua en y = 0 ∈ Y = IRm.

26

Page 31: Introduccion Al Analisis Convexo - Pedro Gajardo

4.2. PROBLEMA DE DIRICHLET

Directamente se observa que φ(x0, ·) es finita y continua en cero sı y solo si (ssi) Ax0 < b.De hecho, el que φ(x0, ·) sea finita en y = 0 es equivalente a Ax0 ≤ b. Si Ax0 = b, restandouna pequena perturbacion y al lado derecho tal que Ax0 > b−y se tendrıa φ(x0, y) = +∞.Esto implica que φ(x0, ·) no es continua en y = 0 (pasa de 〈c, x0〉 a +∞). Por lo tanto,el caso Ax0 < b nos asegura que para pequenas perturbaciones se mantenga la condicionAx0 ≤ b − y y ası φ(x0, y) = 〈c, x0〉 en una vecindad de cero (funcion continua). Estacondicion (∃ x0 ∈ IRn tal que Ax0 < b) es conocida como la condicion de Slater.

Aplicando el Teorema de la dualidad 3.2.4 deducimos que bajo la condicion de Slatery si el problema primal (P ) satisface

infx∈IRn

Ax≤b

〈c, x〉 > −∞,

entoncesinf

x∈IRn

Ax≤b

〈c, x〉 + infy∗∈IRm

A∗y∗+c=0y∗≥0

〈b, y∗〉 = 0 (4.1.1)

y se tiene que el conjunto de soluciones del problema dual S(D) = ∂v(0) es no vacıo.

Por otro lado, observamos que la funcion valor del problema dual es dada por

w(x∗) := infy∗∈IRm

A∗y∗+c=x∗

y∗≥0

〈b, y∗〉.

Se puede probar, gracias al Teorema 3.2.3 que, dada la particular estructura de w(·), setiene w(0) ∈ IR ⇒ ∂w(0) 6= ∅. Ası, debido a (4.1.1) y al Teorema de dualidad 3.2.1probamos que el conjunto de soluciones del problema primal S(P ) = ∂w(0) es no vacıo.

4.2 Problema de Dirichlet

Para estudiar el presente problema se recomienda revisar la literartura en Teorıa dedistribuciones y espacios de Sobolev [3].

Sea Ω ⊂ IRn un conjunto abierto y acotado. Consideraremos los siguientes espacios:

L2(Ω) =

u : Ω −→ IR |

Ω

u2(x)dx < +∞

L2(Ω)n = w = (w1, . . . , wn) : Ω −→ IRn | wi ∈ L2(Ω)

H10 (Ω) =

u ∈ L2(Ω) |∂u

∂xi

existe (sentido debil) y esta en L2(Ω), u = 0 en ∂Ω

.

27

Page 32: Introduccion Al Analisis Convexo - Pedro Gajardo

4.2. PROBLEMA DE DIRICHLET

Observe que si u ∈ H10 (Ω) entonces el gradiente debil ∇u =

(

∂u∂x1

, . . . , ∂u∂xn

)

esta en

L2(Ω)n.

Las normas a utilizar son:

‖u‖L2(Ω) =

(∫

Ω

u2(x)dx

)12

‖w‖L2(Ω)n =

(

i=1

‖wi‖2L2(Ω)

)12

‖u‖H10 (Ω) =

(∫

Ω

‖∇u(x)‖22dx

)12

= ‖∇u‖L2(Ω)n ,

donde ‖ · ‖2 es la norma Euclidiana en IRn.

Dado que el evn (L2(Ω), ‖·‖L2(Ω)) es un espacio de Hilbert, identificamos su dual con elmismo. Lo mismo para el evn (L2(Ω)n, ‖·‖L2(Ω)n). El espacio dual del evn (H1

0 (Ω), ‖·‖H10 (Ω))

se denota por H−1(Ω).

Los productos de dualidad entre los diferentes espacios y sus duales los notaremos〈·, ·〉L2(Ω),L2(Ω), 〈·, ·〉L2(Ω)n,L2(Ω)n y 〈·, ·〉H1

0 (Ω),H−1(Ω) donde

〈u, u∗〉L2(Ω),L2(Ω) =

Ω

u(x)u∗(x)dx u, u∗ ∈ L2(Ω)

〈w,w∗〉L2(Ω)n,L2(Ω)n =n∑

i=1

Ω

wi(x)w∗i (x)dx =

n∑

i=1

〈wi, w∗i 〉L2(Ω),L2(Ω) w, w∗ ∈ L2(Ω)n

〈u, u∗〉H10 (Ω),H−1(Ω) =

Ω

u(x)u∗(x)dx u ∈ H10 (Ω), u∗ ∈ H−1(Ω).

Recordemos que dados dos espacios vectoriales normados (evn) X e Y y un operadorlineal continuo A : X −→ Y , su operador adjunto (que resulta ser lineal continuo)A∗ : Y ∗ −→ X∗ esta definido por

〈x,A∗y∗〉X,X∗ = 〈Ax, y∗〉Y,Y ∗ ∀ x ∈ X, y∗ ∈ Y ∗.

De esta forma, dado un operador continuo A = (A1, . . . , An) : H10 (Ω) −→ L2(Ω)n se

define su operador adjunto A∗ : L2(Ω)n −→ H−1(Ω) mediante la relacion

〈u∗, A∗w∗〉H10 (Ω),H−1(Ω) = 〈Au∗, w∗〉L2(Ω)n,L2(Ω)n =

n∑

i=1

Ω

Aiu∗(x)w∗(x)dx

28

Page 33: Introduccion Al Analisis Convexo - Pedro Gajardo

4.2. PROBLEMA DE DIRICHLET

para todo w∗ ∈ L2(Ω)n, u∗ ∈ H10 (Ω).

Para el estudio de nuestro problema, supongamos A : H10 (Ω) −→ L2(Ω)n dado por

Au = ∇u (operador lineal y continuo). El operador adjunto A∗ : L2(Ω)n −→ H−1(Ω)estara dado por

〈u∗, A∗w∗〉H10 (Ω),H−1(Ω) = 〈Au∗, w∗〉L2(Ω)n,L2(Ω)n =

n∑

i=1

Ω

∂u∗

∂xi

(x)w∗(x)dx

para todo w∗ ∈ L2(Ω)n, u∗ ∈ H10 (Ω).

Integrando por partes, y recordando que si u∗ ∈ H10 (Ω) entonces u∗ = 0 en ∂Ω, se

obtiene

n∑

i=1

Ω

∂u∗

∂xi

(x)w∗(x)dx = −n∑

i=1

Ω

∂w∗

∂xi

(x)u∗(x)dx = −〈u∗, div w∗〉H10 (Ω),H−1(Ω),

donde el funcional div : L2(Ω)n −→ H−1(Ω) esta definido por

div w∗ :=n∑

i=1

∂w∗

∂xi

∈ H−1(Ω) ∀ w∗ ∈ L2(Ω)n.

Por todo lo anterior se tendra que A∗ = − div .

Antes de pasar al problema propiamente tal calculemos una conjugada de Fenchel quenos sera util. Sean X e Y dos evn. Considere las funciones F ∈ Γ0(X) y G ∈ Γ0(Y ). Paraun operador lineal continuo A : X −→ Y se define la funcion φ : X × Y −→ IR ∪ +∞dada por

φ(x, y) = F (x) + G(Ax + y).

Es directo probar que φ ∈ Γ0(X × Y ). Calculemos ahora su conjugada

φ∗(x∗, y∗) = supx∈Xy∈Y

〈x, x∗〉X,X∗ + 〈y, y∗〉Y,Y ∗ − F (x) − G(Ax + y).

Si hacemos el cambio de variable z = Ax + y se tiene

φ∗(x∗, y∗) = supx∈Xz∈Y

〈x, x∗〉X,X∗ + 〈z − Ax, y∗〉Y,Y ∗ − F (x) − G(z)

= supx∈Xz∈Y

〈x, x∗〉X,X∗ + 〈z, y∗〉Y,Y ∗ − 〈x,A∗y∗〉X,X∗ − F (x) − G(z)

= supx∈X

〈x, x∗ − A∗y∗〉X,X∗ − F (x) + supz∈Y

〈z, y∗〉Y,Y ∗ − G(z) = F ∗(x∗ − A∗y∗) + G(y∗),

29

Page 34: Introduccion Al Analisis Convexo - Pedro Gajardo

4.2. PROBLEMA DE DIRICHLET

donde A∗ : Y ∗ −→ X∗ es el operador adjunto de A.

Ahora consideremos los espacios X = H10 (Ω) e Y = L2(Ω)n con sus respectivos duales

topologicos X∗ = H−1(Ω) e Y ∗ = L2(Ω)n. Dada una funcion v : Ω −→ IR en L2(Ω), elproblema a estudiar es

(P ) infu∈H1

0 (Ω)

1

2

Ω

‖∇u(x)‖22dx−

Ω

u(x)v(x)dx = infu∈H1

0 (Ω)

1

2‖∇u‖2

L2(Ω)n−〈u, v〉H10 (Ω),H−1(Ω).

Si tomamos los funcionales F : H10 (Ω) −→ IR, G : L2(Ω)n −→ IR y A : H1

0 (Ω) −→ L2(Ω)n

definidos por

F (u) = −

Ω

u(x)v(x)dx = −〈u, v〉H10 (Ω),H−1(Ω) u ∈ H1

0 (Ω)

G(u′) =1

2

Ω

‖u′(x)‖22dx =

1

2‖u′‖2

L2(Ω)n u′ ∈ L2(Ω)n

Au = ∇u u ∈ H10 (Ω),

es directo probar que F ∈ Γ0(X) (es lineal y continuo) y G ∈ Γ0(Y ) (es continuo yestrictamente convexo). Si definimos la funcion φ : X × Y −→ IR por

φ(u,w) = F (u) + G(Au + w)

se tiene que el problema (P ) puede ser escrito como

(P ) infu∈H1

0 (Ω)F (u) + G(Au) = inf

u∈H10 (Ω)

φ(u, 0).

Observe tambien que φ ∈ Γ0(X × Y ).

Por el calculo hecho anteriormente se tiene

φ∗(u∗, w∗) = F ∗(u∗ − A∗w∗) + G∗(w∗),

donde

G∗(w∗) = G(w∗) ver Ejemplo 2.2.2

A∗w∗ = − div w∗.

Calculemos F ∗:

F ∗(u∗) = supu∈H1

0 (Ω)

〈u, u∗〉H10 (Ω),H−1(Ω) + 〈u, v〉H1

0 (Ω),H−1(Ω) = supu∈H1

0 (Ω)

〈u, u∗ + v〉H10 (Ω),H−1(Ω),

30

Page 35: Introduccion Al Analisis Convexo - Pedro Gajardo

4.2. PROBLEMA DE DIRICHLET

por lo tanto

F ∗(u∗) =

0 si u∗ = −v+∞ si no,

y entonces

F ∗(−A∗w∗) =

0 si div w∗ = −v+∞ si no.

De esta forma el problema dual (D) esta dado por

(D) infw∗∈Y ∗

φ(0, w∗) = infw∗∈L2(Ω)n

F ∗(−A∗w∗) + G∗(w∗)

= infw∗ ∈ L2(Ω)n

div w∗ = −v

1

2‖w∗‖2

L2(Ω)n .

La calificacion primal se tendra ya que para u0 = 0 se tiene que φ(0, ·) = G(·) es unafuncion finita y continua en w = 0 ∈ L2(Ω)n. Por otro lado, es facil probar que la funcionF (u) + G(Au) es estrictamente convexa y coerciva, al igual que la funcion G∗ = G. DelTeorema 2.1.1 se deduce

(P ) −∞ < infu∈H1

0 (Ω)F (u) + G(Au),

por lo tanto el conjunto de soluciones S(D) del problema dual (D) es no vacıo. De hechoexiste una unica solucion por ser G∗ estrictamente convexa (ver demostracion del Teorema2.1.1). Se puede probar que la condicion de calificacion dual (lo mismo que la condicionde calificacion primal pero para φ∗(·, w∗

0)) no se tiene. De la teorıa general de espacios deSobolev recordamos que X = H1

0 (Ω) es un espacio reflexivo y aplicando el Teorema 2.1.1concluımos que existe un unico u solucion del problema primal (P ).

Para terminar, sea u la solucion de (P ) y w∗ la solucion de (D). Del teorema dedualidad escribimos

0 = infu∈H1

0 (Ω)

1

2‖∇u‖2

L2(Ω)n − 〈u, v〉H10 (Ω),H−1(Ω) + inf

w∗ ∈ L2(Ω)n

div w∗ = −v

1

2‖w∗‖2

L2(Ω)n

=1

2‖∇u‖2

L2(Ω)n − 〈u, v〉H10 (Ω),H−1(Ω) +

1

2‖w∗‖2

L2(Ω)n .

Dado que div w∗ = −v, remplazando se tiene

0 =1

2‖∇u‖2

L2(Ω)n + 〈u, div w∗〉H10 (Ω),H−1(Ω) +

1

2‖w∗‖2

L2(Ω)n .

Dado que A = ∇ y −A∗ = div se observa

0 =1

2‖∇u‖2

L2(Ω)n + 〈u, div w∗〉H10 (Ω),H−1(Ω) +

1

2‖w∗‖2

L2(Ω)n

31

Page 36: Introduccion Al Analisis Convexo - Pedro Gajardo

4.2. PROBLEMA DE DIRICHLET

=1

2‖∇u‖2

L2(Ω)n − 〈∇u, w∗〉L2(Ω)n,L2(Ω)n +1

2‖w∗‖2

L2(Ω)n =1

2‖∇u − w∗‖2

L2(Ω)n .

La ultima igualdad es debida a que en un espacio de Hilbert (H, 〈·, ·〉) se tiene que lanorma esta definida por ‖x‖2 = 〈x, x〉 y por lo tanto

‖x − y‖2 = ‖x‖2 − 2〈x, y〉 + ‖y‖2.

Finalmente, hemos demostrado que si u es la solucion de (P ) y w∗ la solucion de (D)entonces

∇u = w∗

div w∗ = −v

lo que implica

− div ∇u = −∆u =n∑

i=1

∂2u

∂x2i

= v,

y como u esta en H10 (Ω) se concluye

−∆u(x) = v(x) x ∈ Ω

u(x) = 0 x ∈ ∂Ω.

Un analisis similar al anterior para otros problemas variacionales como el problema deStokes o el de la torsion elasto-plastica se encuentra en [1]. Para mayor profundidad en elestudio de problemas variacionales en espacios de Sobolev se recomienda revisar [2].

32

Page 37: Introduccion Al Analisis Convexo - Pedro Gajardo

Bibliografıa

[1] F. Alvarez, Analisis Convexo y Dualidad, Apunte del Departamento de IngenierıaMatematica, Universidad de Chile (2005).Disponible en http://www.dim.uchile.cl/~pgajardo/apunteFAlvarez.pdf

[2] H. Attouch, G. Buttazzo y G. Michaille, Variational Analysis in Sobolev and BVspaces, MPS-SIAM Series on Optimization (2005).

[3] H. Brezis, Analyse fonctionnelle Masson, Paris, (1983).

[4] J.-B. Hiriart-Urruty y C. Lemarechal, Convex analysis and minimization algorithms.I. Fundamentals, Grundlehren der Mathematischen Wissenschaften [FundamentalPrinciples of Mathematical Sciences], 305. Springer-Verlag, Berlin, (1993).

[5] J.-B. Hiriart-Urruty y C. Lemarechal, Convex analysis and minimization algorithms.II. Advanced theory and bundle methods, Grundlehren der Mathematischen Wis-senschaften [Fundamental Principles of Mathematical Sciences], 306. Springer-Verlag,Berlin, (1993).

[6] T.R. Rockafellar, Convex Analysis, Princeton Mathematical Series, No. 28 PrincetonUniversity Press, Princeton, N.J. (1970).

33