51
Cap´ ıtulo 1 Espacios vectoriales En este cap´ ıtulo vamos a definir un espacio vectorial real de dimensi´ on finita desde un punto de vista abstracto. De hecho, a lo largo de esta secci´ on utilizaremos la notaci´ on de Dirac para vectores, con la finalidad de que el lector se familiarice con esta notaci´ on que es utilizada con frecuencia en diversas ´ areas de la f´ ısica. Con este uso de notaci´ onadem´as se preparar´a al lector para introducirse en espacios vectoriales de dimensi´on infinita no necesariamente reales. Muchos de los resultados que se discutir´an por lo tanto ser´ anv´alidos en casos m´ as generales. 1.1. Espacios vectoriales Empecemos definiendo el concepto de espacio vectorial sobre el campo de los com- plejos. Definici´ on 1.1.1. Un espacio vectorial V sobre el campo de los complejos C es un conjunto de objetos, los cuales denotaremos por |ai, |bi ´ o |xi y ser´ an llamados vectores, que satisfacen las siguientes propiedades: 1. A cada par de vectores |ai, |bi2 V les corresponde un vector |ai + |bi tambi´ en contenido en V , al que llamaremos suma de |ai con |bi, tal que, I) |ai + |bi = |bi + |ai, II) |ai +(|bi + |ci)=(|ai + |bi)+ |ci, 3

Notas Métodos Físico Matemáticos

Embed Size (px)

DESCRIPTION

Analiza funciones detransformaciones lineales; calculalímites; aplica la derivada; resuelveinterpretaciones geométricas dederivadas e integrales, la tangente auna curva y el área bajo la curva.

Citation preview

Page 1: Notas Métodos Físico Matemáticos

Capıtulo 1

Espacios vectoriales

En este capıtulo vamos a definir un espacio vectorial real de dimension finita desdeun punto de vista abstracto. De hecho, a lo largo de esta seccion utilizaremos la notacionde Dirac para vectores, con la finalidad de que el lector se familiarice con esta notacion quees utilizada con frecuencia en diversas areas de la fısica. Con este uso de notacion ademasse preparara al lector para introducirse en espacios vectoriales de dimension infinita nonecesariamente reales. Muchos de los resultados que se discutiran por lo tanto seran validosen casos mas generales.

1.1. Espacios vectoriales

Empecemos definiendo el concepto de espacio vectorial sobre el campo de los com-plejos.

Definicion 1.1.1. Un espacio vectorial V sobre el campo de los complejos Ces un conjunto de objetos, los cuales denotaremos por |ai, |bi o |xi y seran llamados

vectores, que satisfacen las siguientes propiedades:

1. A cada par de vectores |ai, |bi 2 V les corresponde un vector |ai + |bi tambien

contenido en V, al que llamaremos suma de |ai con |bi, tal que,

I) |ai+ |bi = |bi+ |ai,II) |ai+ (|bi+ |ci) = (|ai+ |bi) + |ci,

3

Page 2: Notas Métodos Físico Matemáticos

4 Espacios Vectoriales

III) Existe un unico vector |0i 2 V, llamado vector cero, tal que |ai+ |0i = |ai paracualquier vector |ai 2 V.

IV) A cada vector |ai 2 V le corresponde un unico vector �|ai tambien contenido

en el espacio vectorial V tal que |ai+ (�|ai) = |0i.2. Para cada numero complejo ↵ 2 C (tambien denominado escalar) y cada vector

|ai 2 V les corresponde un vector ↵|ai 2 V tal que

V) Si � 2 C es otro escalar, entonces ↵(�|ai) = (↵�)|aiVI) 1|ai = |ai.

3. La multiplicacion de escalares con vectores es distributiva:

VII) ↵(|ai+ |bi) = ↵|ai+ ↵|bi.VIII) (↵ + �)|ai = ↵|ai+ �|bi.

El espacio vectorial que hemos definido a traves de las propiedades 1, 2, y 3 se le suelellamar espacio vectorial complejo. Esta definicion se puede modificar sustituyendo elcampo de los complejos C por el campo de los reales R. En este caso diremos que elespacio vectorial V es un espacio vectorial real.

Ejemplo 1.1.1. A continuacion se describen varios espacios que son espacios vec-toriales y se dan algunos ejemplos de espacios que no lo son.

1. R es un espacio vectorial sobre el campo de los reales R. Es claro entonces que laspropiedades 1, 2 y 3 de la definicion 1.1.1 se satisfacen automaticamente por laspropiedades de los numeros reales.

2. R es un espacio vectorial sobre el campo de los reales R. De manera completamenteanaloga al caso anterior se puede verificar que se cumplen las propiedades 1,2 y 3de la definicion 1.1.1 por las propiedades de los numeros complejos.

3. R es no un espacio vectorial sobre el campo de los complejos C. Si x, y 2 R,denotaremos los correspondientes vectores por |xi y |yi respectivamente. Si ↵ esun escalar entonces ↵|xi = ↵x es un numero complejo. Esto quiere decir que ↵|xino pertenece al espacio vectorial R pues no es un numero real. Esto indica que lapropiedad 2 de la definicion 1.1.1 no se satisface.

4. Denotese por Pc[x] el conjunto de los polinomios con coeficientes complejos convariable x. Entonces Pc

n

[x] es un espacio vectorial sobre el campo de los complejos.En este caso la suma de vectores se toma como la suma ordinaria entre polinomiosy la multiplicacion por escalares como la multiplicacion ordinaria entre polinomiosy numeros complejos:

Page 3: Notas Métodos Físico Matemáticos

Espacios Vectoriales 5

a) Suma de vectores: sea |ai =P1

n=0 anxn y sea |bi =

P1n=0 bnx

n. Entonces lasuma |ai+ |bi es un polinomio, |ai+ |bi =P1

n=0(an + b

n

)xn. Se puede verificasin problema los puntos I), II), III) y IV) de la definicion 1.1.1. Para el puntoIII), el vector cero es el polinomio con todos sus coeficientes iguales a cero:|0i = 0.

b) Multiplicacion por escalares. Si ↵ es un escalar (un numero complejo) y |ai =P1n=0 anx

n es un vector, entonces ↵|ai sigue siendo un vector en Pc

n

[x] pues↵|ai =

P1n=0 ↵anx

n es un polinomio con coeficientes complejos. Esto verificael punto V). El escalar 1 + 0i = 1 2 C es tal que 1 |ai = |ai para cualquierpolinomio |ai. Esto verifica el punto VI).

c) Finalmente la propiedad distributiva entre vectores y escalares se verifica di-rectamente de la propiedad distributiva entre numeros complejos y polinomioscon coeficientes complejos.

5. Denotese por Pr[x] el conjunto de los polinomios con coeficientes reales con variablex. En este caso, Pr

n

[x] no es un espacio vectorial sobre el campo de los complejos.De hecho, si ↵ es un escalar y |ai =

P1n=0 anx

n es un polinomio con coeficientesreales, entonces ↵|ai =P1

n=0 ↵anxn resulta ser un polinomio con coeficientes com-

plejos. Esto quiere decir que ↵|ai 62 Pr

n

[x], y po lo tanto falla el punto 2 de ladefinicion 1.1.1.

6. El conjunto de las matrices complejas de tamano m ⇥ n, Mm⇥n es un espaciovectorial sobre el campo de los complejos con la suma vectorial definida como la sumaordinaria entre matrices y la multiplicacion por escalares como la multiplicacionordinaria entre matrices y numeros complejos.

7. El conjunto de las funciones reales C1, que poseen derivadas de todos los ordenesy estan definidas sobre el intervalo (a, b) (con a < b 2 R), es un espacio vectorialsobre el campo de los reales. La suma entre vectores definida como la suma ordinariaentre dos funciones y el producto por escalares definido como el producto ordinarioentre una funcion y un numero real.

Podemos entonces apreciar como la existencia de un espacio vectorial real o com-plejo dependen mucho de la naturaleza de los vectores ası como de la de los escalares. Acontinuacion vamos a definir una serie de conceptos que son importantes en el estudio deespacios vectoriales tales como las nociones de independencia lineal, subespacios vectoria-les o base de un espacio vectorial. En lo que sigue vamos a suponer que el campo sobreel que se define el espacio vectorial es el de los complejos C aunque las definiciones sonvalidas en general cuando se define el espacio vectorial sobre cualquier campo, como el delos reales R.

Page 4: Notas Métodos Físico Matemáticos

6 Espacios Vectoriales

Definicion 1.1.2. Decimos que un conjunto de vectores |a1i, |a2i, . . . , |ani son

linealmente independientes si la igualdad,

nX

j=0

j

|aj

i = 0 con ↵

j

2 C,

implica que ↵

j

= 0 para todo 1 j n. La suma

Pn

j=0 ↵j

|aj

i se le llama combinacion

lineal del conjunto de vectores {|aj

i}nj=0

Definicion 1.1.3. Sea V un espacio vectorial. Decimos que un subconjunto no

vacıo W de V es un subespacio de V si para cualesquiera dos vectores |ai, |bi contenidosen W se tiene que la combinacion lineal ↵|ai + �|bi tambien es un vector en W para

cualesquiera ↵, � 2 C.

La siguiente proposicion nos dice que un subespacio es en sı mismo un espaciovectorial y mas aun, que la interseccion de dos subespacios de un espacio vectorial es unsubespacio. Este resultado se puede utilizar para saber si un subconjunto de un espaciovectorial es un espacio vectorial, pues solo necesitamos verificar la condicion establecidaen la definicion 1.1.3. Su demostracion se deja como ejercicio para el lector.

Proposicion 1.1.1. Un subespacio W de un espacio vectorial V es un es un

espacio vectorial. La interseccion de dos subespacios de un mismo espacio vectorial es un

subespacio.

El siguiente teorema nos da una vıa para definir un subespacio a partir de cualquierconjunto de vectores.

Teorema 1.1.1. Sea S un conjunto no vacıo de vectores de un espacio vectorial

V. Sea WS

el conjunto definido como la coleccion de todas las combinaciones lineales de

vectores en S. Entonces WS

es un subespacio. Decimos que WS

es la prolongacion de

S por combinaciones lineales o bien que WS

el espacio prolongado o generado por el

conjunto de vectores S y denotaremos esta accion como WS

= span{S}

Demostracion. Sean |ai, |bi 2 WS

. Puesto que |ai y |bi son combinaciones lineales devectores en S entonces podemos escribir,

|ai =X

|aji2S

j

|aj

i,

|bi =X

|bji2S

j

|bj

i,

Page 5: Notas Métodos Físico Matemáticos

Espacios Vectoriales 7

donde �

j

, �

j

2 C. Entonces si consideramos la combinacion lineal ↵|ai+ �|bi es tal que,

↵|ai+ �|bi = ↵

X

|aji2S

j

|aj

i+ �

X

|bji2S

j

|bj

i

=X

|aji,|bji2S

(↵�j

|aj

i+ ��

j

|bj

i) . (1.1)

De lo anterior podemos apreciar que ↵|ai + �|bi resulta ser tambien una combinacionlineal de vectores contenidos en S para cualesquiera ↵, � 2 C.

Definicion 1.1.4. Decimos que un conjunto de vectores B de un espacio vectorial

V es una base de V si se cumple que: i) los vectores en B son linealmente independientes

y ii) que todo el espacio vectorial V es la prolongacion de B por combinaciones lineales,

es decir, span{B} = V. Si un espacio vectorial tiene una base finita entonces decimos que

el espacio vectorial tiene dimencion finita y en caso contrario diremos que el espacio

es de dimension infinita.

Teorema 1.1.2. Sea V un espacio vectorial de dimension finita. Entonces cual-

quier base de V tiene siempre la misma cardinalidad, es decir cualquier base escogida tiene

siempre la misma cantidad de vectores. A dicho numero le daremos el nombre de dimen-

sion del espacio vectorial. Un espacio vectorial de dimension N se denotara algunas veces

como VN

para enfatizar que se trata de un espacio de dimension finita de tamano N .

Los espacios vectoriales que ya nos son familiares como R2 o R3 tenemos una nocionintuitiva de lo que denominamos base: una base nos proporciona una manera unica derepresentar un vector en dichos espacios. Nuestra generalizacion de base en espacios vec-toriales abstractos en el sentido de las definiciones dadas nos permite alcanzar la mismaconclusion al menos para el caso de espacios vectoriales de dimension finita.

Proposicion 1.1.2. Sea VN

un espacio vectorial de dimension finita y sea B :={|a

j

i}Nj=1 una base de V

N

. Entonces cualquier para vector |ai 2 VN

existe un unico con-

junto de escalares {↵j

}Nj=1 tal que

|ai =NX

j=1

j

|aj

i.

A los elementos de dicho conjunto de escalares se le denomina componentes de |airespecto a la base B.

Page 6: Notas Métodos Físico Matemáticos

8 Espacios Vectoriales

Finalmente cabe anadir que si tomamos el espacio generado por un subconjunto dem < N vectores de una base B = {|a

j

i}Nj=1 de un espacio vectorial V

n

, obtenemos unespacio vectorial que es un subespacio de V

N

.

Ejemplo 1.1.2. A continuacion daremos algunos ejemplos de subespacios de es-pacios vectoriales.

1. Considerese el espacio vectorial C sobre el campo de los reales. Entonces el conjuntode numeros complejos con parte imaginaria identica a cero R ⇢ C es un subespaciode C.

2. En cambio, si el espacio vectorial C se define sobre el campo de los complejos Centonces el conjunto de numeros complejos con parte imaginaria identica a ceroR ⇢ C no es un subespacio de C.

3. El conjunto de polinomios de orden n con coeficientes complejos, al que denotaremospor Pc

n

[x] es un subespacio de Pc[x]. En efecto, dados ↵, � 2 C arbitrarios y dospolinomios de orden n, |ai =Pn

j=0 ajxj y |bi =Pn

j=0 bjxj, entonces es claro que la

combinacion lineal de polinomios ↵|ai+ �|bi =Pn

j=0(↵aj + �b

j

)xj es un polinomiode orden n. Entonces |ai, |bi 2 Pc

n

[x] implica que ↵|ai+�|bi 2 Pc

n

[x] lo que muestraque Pc

n

[x] es un subespacio de Pc[x]. Esto a su vez muestra, por la proposicion 1.1.1se sigue que Pc[x] es un espacio vectorial sobre el campo de los complejos.

4. El conjunto de los reales R es un subespacio de R2 sobre el campo de los reales. Engeneral el espacio euclıdeo Rm es un subespacio de Rn sobre el campo de los reales,para cualquier m < n.

Ejemplo 1.1.3. A continuacion daremos algunos ejemplos de bases de algunosespacios vectoriales.

1. El numero 1 es una base para el espacio vectorial R definido sobre el campo de losreales. La dimension de este espacio vectorial es 1.

2. El numero 1 2 C y el numero i 2 C forman una base del espacio vectorial C definidosobre el campo de los complejos C. La dimension de este espacio vectorial es 2.

3. El numero 1 2 C es una base del espacio vectorial C definido sobre el campo de losreales R. En contraste con el caso anterior, este espacio vectorial tiene dimension 1.Entonces tenemos que un “mismo” espacio vectorial puede tener dimension diferentesi se cambia el campo sobre el que esta definido. En otras palabras, la dimension deun espacio vectorial depende de la naturaleza de los escalares.

Page 7: Notas Métodos Físico Matemáticos

Producto Interno 9

4. El conjunto de vectores unitario ~e1,~e2,~e3 definidos como

~e1 :=

0

@100

1

A, ~e1 :=

0

@010

1

A, ~e1 :=

0

@001

1

A.

forman una base de R3 sobre el campo de los reales. La dimension de este espaciovectorial es 3.

5. Una base para Pc[t] se forma a partir del conjunto de monomios {1, t, t2, . . . }. Esteespacio es claramente de dimension infinita.

6. El conjunto que consiste de los monomios {1, t, t2, . . . , tn} forma una base para elespacio Pc

n

[x]

1.2. Producto interno

Un espacio vectorial es todavıa bastante general y contiene una pobre estructuracomo para ser considerado de utilidad en fısica. Ejemplo claro de ello es que en nuestradefinicion 1.1.1 de espacio vectorial no figura la estampa de lo que conocemos comoproducto “punto” o producto interno. El producto interno en el estudio de la fısicaes importante pues permite introducir nociones trascendentes tales como el trabajo querealiza una fuerza sobre un objeto a lo largo de una trayectoria o el flujo de materia atraves de una superficie determinada.

1.2.1. Espacios vectoriales con producto interno

La estructura de la que ahora dotaremos a un espacio vectorial es la que denominare-mos en adelante producto escalar o producto interno, que es en esencia una generalizacionde la operacion denominada producto “punto”. Dicha operacion es llevada a cabo entredos vectores a los que se le asocia un elemento de un campo que podemos tomar como elconjunto de los numeros reales. La asociacion mencionada se denota simbolicamente comog : V ⇥ V ! R. En el espacio vectorial Rn la aplicacion g se denota habitualmente comog(a,b) = a · b. Esta operacion binaria tiene ciertas propiedades que la vuelven especial yla diferencian de otras operaciones definidas anteriormente. Por ejemplo, g es simetrica,es decir, g(a,b) = g(b, a) y es lineal en su primer y segundo argumentos:

g(↵a+ �b, c) = ↵g(a, c) + �g(b, c)

Page 8: Notas Métodos Físico Matemáticos

10 Espacios Vectoriales

o equivalentemente(↵a+ �b) · c = ↵a · c+ �b · c

De hecho, una funcion que es lineal en sus dos argumentos es denominada bilineal. Elproducto punto ademas es una operacion que permite obtener la “longitud” de un vectoro su norma, esto es, ||a|| = g(a, a) = a · a � 0. Esta propiedad ademas asegura que elunico vector de longitud cero es el vector cero, i.e., g(a, a) = 0 si y solo si a = 0. Nosgustarıa pues, generalizar esta propiedades a espacios vectoriales abstractos. Sin embargo,la bilinealidad mostrada arriba conduce a una contradiccion cuando usamos el campo delos complejos. Notese que, para un vector no nulo a, la bilinealidad de g conduce a,

g(ia, ia) = i

2g(a, a) = �g(a, a).

Entonces, alguna de las dos cantidades g(ia, ia) o g(a, a) debe ser negativa. Esto implicarıaque un vector podrıa tener “longitud” negativa, lo que es imposible por mera definicionde longitud. Esta inconsistencia puede evitarse si debilitamos la propiedad de bilinealidadsustituyendola por linealidad en uno solo de sus argumentos. En efecto, podemos apreciarque si la linealidad en el otro argumento la mantenemos bajo conjugacion obtenemosresultados consistentes. Esto sin embargo, requiere tambien modificar la nocion de simetrıadel producto interno para tener de igual forma, resultados consistentes.

Definicion 1.2.1. El producto interno entre dos vectores |ai y |bi en un espacio

vectorial V es un numero complejo g(|ai, |bi) 2 C tal que,

(a) g(|ai, |bi) = g(|ai, |bi)⇤.(b) g (|ai, (↵|bi+ �|ci)) = ↵g(|ai, |bi) + �g(|ai, |bi).(c) g(|ai, |ai) � 0 y ademas g(|ai, |ai) = 0 si y solo si |ai = 0.

Un espacio vectorial dotado de un producto interno recibe el nombre espacio con pro-

ducto interno. La propiedad (c) es conocida como la propiedad de positividad definidadel producto interno. Un producto interno que es positivo definido es llamado tambien

producto interno Riemanniano. En cualquier otro caso es llamado producto in-

terno pseudo-Riemanniano

Debe notarse que la linealidad en el primer argumento esta ausente ya que, comose explico anteriormente, podrıa ser inconsistente. De hecho, si usamos la propiedad de“simetrıa” (a) podemos concluir que es necesaria una operacion adicional para tenerlinealidad en el primer argumento. Primero notemos que si tenemos para un ↵ 2 C ycualesquiera dos vectores |ai, |bi 2 V de un espacio vectorial V se tiene que

g(↵|ai, |bi) = g(|ai,↵|bi)⇤ = ↵

⇤g(|ai, |bi)⇤,

Page 9: Notas Métodos Físico Matemáticos

Producto Interno 11

donde se ha hecho uso de las propiedades (a) y (b) del producto interno. La ecuacion an-terior indica que una constante puede “salir” del primer argumento conjugada. De hecho,usando las mismas propiedades podemos concluir una propiedad mas general. Dados dosescalares ↵, � 2 C y dados cualesquiera dos vectores |ai, |bi 2 V de un espacio vectorialV , se tiene que

g(↵|ai+ �|bi, |ci) = ↵

⇤g(|ai, |ci)⇤ + �

⇤g(|bi, |ci)⇤, (1.2)

Se puede decir que la propiedad anterior es una especie de linealidad del producto in-terno, con la diferencia de que las constantes deben conjugarse al momento de “salir” delproducto interno. Debido a esta propiedad el producto interno no puede llamarse bilineal.Sin embargo, esta propiedad es especial y no puede pasar desapercibida, de modo querecibe un nombre especial. Una funcion g que cumple las propiedades (c) y (1.2) recibe elnombre de sesquilineal.

Notacion. Si bien el producto interno es una funcion de dos argumentos, este se sueledenotar de una manera mas compacta. Si tenemos dos vectores |ai, y |bi entoncesdenotaremos el producto interno g(|ai, |bi) como,

g((|ai, |bi) ⌘ ha|bi,

lo que disminuye considerablemente la notacion. Sin embargo, es menester mencionarque debemos tener cuidado al realizar operaciones de esta manera. Especificamente,dado que el producto no es conmutativo y que el primer argumento es lineal bajoconjugacion, entonces hay que tener en mente las siguientes reglas para nuestra nuevanotacion

Un escalar ↵ multiplicado por un vector |ai los podemos representar de dosformas equivalentes,

↵|ai ⌘ |↵ai.El producto interno de un vector |ai por un vector ↵|bi en dicho orden puederepresentarse como,

g(|ai,↵|bi) ⌘ ha|↵bi = ↵ha|bi.Dados ↵ 2 C y |ai, |bi 2 V , tenemos que el producto de ↵|ai con |bi se representacomo

g(↵|ai, |bi) ⌘ h↵a|bi = ↵

⇤ha|bi.Finalmente dados dos escalares ↵, � 2 C y tres vectores |ai, |bi, |ci 2 V , entoncesel producto de ↵|ai+ �|bi con |ci se representa como

g(↵|ai+ �|bi, |ci) ⌘ h↵a+ ↵b|ci = ↵

⇤ha|ci+ �

⇤hb|ci.

Page 10: Notas Métodos Físico Matemáticos

12 Espacios Vectoriales

Se puede pensar que la notacion adopata es en cierta forma equivalente al producto internodefinido de manera matricial: para multiplicar dos vectores columna, uno de estos se tieneque trasponer y conjugar para que el producto matricial tenga sentido. De hecho, masadelante veremos que los vectores “al reves” ha| son entidades que tienen significado porsı mismos y que se pueden obtener como una operacion similar a la de la trasposicionconjugada de matrices. En la practica, si debemos realizar operaciones entre dos vectores,por ejemplo, del vector ↵|ai+�|bi con el vector |ci, entonces primero debemos “trasponery conjugar” el primer vector y luego multiplicarlo por el segundo con las reglas habituales.El resultado de “trasponer y conjugar” el vector ↵|ai+ �|bi es

⇤ha|+ �

⇤hb|,y el producto interno se calcula como,

h↵a+ �b|ci = (↵⇤ha|+ �

⇤hb|) |ci = ↵

⇤ha|ci+ �

⇤hb|ci.En adelante nos referiremos un vector de la forma |·i como ket mientras que su “tras-puesto conjugado” h·| se denominara bra. Notese que en la operacion de producto arribaejemplificada, tenemos que un vector bra siempre se aparea con un vector ket para formarun producto interno.

Ejemplo 1.2.1. Si el espacio vectorial es V = Cn, entonces dos vectores |ai, |bien Cn se representan como |ai = (↵1,↵2, . . . ,↵n

) y |bi = (�1, �2, . . . , �n

). Entonces, unamanera de definir el producto interno ha|bi es como sigue,

ha|bi := ↵

⇤1�1 + ↵

⇤2�2 + · · ·+ ↵

⇤n

� =nX

j=1

⇤j

j

,

el cual satisface las propiedades (a), (b) y (c) de la definicion 1.2.1. En particular si |ai =|bi, entonces

ha|ai = |↵1|2 + |↵2|2 + · · ·+ |↵n

|2 =nX

j=1

|↵j

|2,

el cual es positivo.

Ejemplo 1.2.2. Si ahora consideramos el espacio vectorial PC [t] que consiste detodos los polinomios con coeficientes complejos entonces el producto interno entre dospolinomios |xi, |yi 2 PC [t] puede definirse como

hx|yi :=Z

b

a

w(t)x⇤(t)y(t)dt

donde a < b son dos numeros reales y w : R ! R es una funcion real, bien definida en (a, b)estrictamente positiva. Como el producto interno definido arriba depende de la funcionw(t) que es en cierto modo arbitraria, podemos definir una gran variedad de productosinternos en el espacio vectorial PC [t]. La funcion w recibe el nombre de funcion de peso.

Page 11: Notas Métodos Físico Matemáticos

Producto Interno 13

Ejemplo 1.2.3. Sea C0(a, b) el conjunto de todas las funciones complejas continuasdefinidas en el intervalo real (a, b). Una manera de definir el producto interno en dichoespacio vectorial es como sigue. Dadas dos funciones f, g 2 C0(a, b), tenemos que

ha|bi :=Z

b

a

w(t)f ⇤(t)g(t)dt

siendo w una funcion de peso que, como se menciono anteriormente, es real y estrictamentepositiva en el intervalo (a,b).

1.2.2. Ortogonalidad

El producto interno nos permite hacer una analogıa directa con espacios vectorialescuya geometrıa es en cierto modo intuitiva. Uno concepto que es fundamental en geometrıaanalıtica es el de perpedicularidad. En el espacio Rn decimos que dos vectores son perpen-diculares si su producto punto es cero. En espacios vectoriales abstractos generalizamosdicho concepto de una forma completamente analoga.

Definicion 1.2.2. Dos vectores |ai, |bi 2 V de un espacio vectorial V son ortogo-

nales o perpendiculares si ha|bi = 0. Un vector |ei es normal o esta normalizado si

he|ei = 1. Una base B = {|ej

i}Nj=1 de un espacio vectorial N-dimensional V

N

se le llama

base ortonormal si

hei

|ej

i = �

i,j

donde �

i,j

es conocida como la delta de Kronecker y esta definida como,

i,j

=

⇢1 si i = j

0 si i 6= j.

Ejemplo 1.2.4. La base estandar del espacio vectorial Rn (o aun del espaciovectorial Cn)

|e1i := (1, 0, 0, . . . , 0),

|e2i := (0, 1, 0, . . . , 0),

|e3i := (0, 0, 1, . . . , 0),

|e1i := (0, 0, 0, . . . , 1), (1.3)

es ortonormal bajo la definicion usual de producto interno en dichos espacios.

Ejemplo 1.2.5. Considerese el espacio vectorial C(0, 2⇡) que consiste de todas lasfunciones complejas analıticas definidas en el intervalo (0, 2⇡). Si definimos el productointerno como en el ejemplo 1.2.3 con funcion de peso w(x) = 1, entonces la base,

|ek

i :=e

ikx

p2⇡

Page 12: Notas Métodos Físico Matemáticos

14 Espacios Vectoriales

es una base ortonormal. En efecto, notese que

hek

|ek

i =Z 2⇡

0

e

ikx

p2⇡

e

ikx

p2⇡

dx = 1,

y que

hek

|el

i =Z 2⇡

0

e

ikx

p2⇡

e

ilx

p2⇡

dx = 0,

lo que satisface las propiedades deseadas. Por lo tanto podemos escribir,

hek

|el

i = �

k,l

.

1.2.3. El procedimiento de Gram-Schmidt

Supongamos que tenemos un espacio vectorial V con una base que no es ortonormal.En muchas ocasiones es deseable tener una base ortonormal para un espacio vectorial, porlo que se hace necesario tener un procedimiento d mediante el cual podamos construiruna base auntenticamente ortonormal. Las razones para hacer eso son muy variadas peroprincipalmente es porque, en la practica, muchos calculos se pueden simplificar enorme-mente como veremos mas adelante. El procedimiento mediante el cual podemos llevar,de una manera sistematica, una base cualquiera a una base ortonormal es llamado elprocedimiento de Gram-Schmidt. El procedimiento mencionado tiene una descripciongeometrica bastante intuitiva que, ademas, puede llevarse a un plano abstracto con ladefinicion de producto interno en espacios vectoriales. Sea B := {|a1i, |a2i, |a3i, . . . , |ani}una base de un espacio vectorial de dimension n. Nuestro objetivo es construir, a partirde los elementos de B, una base B = {|e1i, |e2i, |e3i, . . . , |eni} que sea ortonormal. Elprimer vector de dicha base se puede construir de manera directa: tomese el vector |a1i ydefinase |e1i de la siguiente forma

|e1i := |a1ipha1|a1i=

|a1i|a1| . (1.4)

Esta operacion asegura que el primer vector de la base B es normal. Vamos ahora aproceder inductivamente para definir los vectores subsecuentes. Considermos la proyecciondel vector |a2i sobre el vector |a1i, la cual esta dada por el producto interno he1|a2i.Para construir un vector que sea perpendicular a |e1i podemos tomar |a2i y sustraerla componente que “nos sobra” a lo largo |e1i. Un vector con tales caracterısticas loescribimos como,

|e02i = |a2i � he1|a2i|e1i. (1.5)

Unas cuantas operaciones nos muestran que, efectivamente, |e02i es ortogonal con |e1i.Esto es,

he1|e02i = he1|a2i � ha2|e1ihe1|e1i = 0.

Page 13: Notas Métodos Físico Matemáticos

Producto Interno 15

Entonces, el siguiente vector de la base ortonormal B lo podemos tomar como el vector|e02i pero normalizado,

|e2i = |e02iphe02|e02i(1.6)

El siguiente vector de la base, |e3i debe ser ortogonal tanto a |e1i como a |e2i definidospreviamente. Para ello vamos a tomar un nuevo elemento de la base B, el cual podemoselegir, si perdida de generalidad, como |a3i. El vector |a3i tendra, en general, proyeccionesdistintas de cero tanto a lo largo de |e1i como a lo largo de |e2i, las cuales estan dadas porhe2|a3i y he1|a3i respectivamente. Si sustraemos de |a3i ambas componentes obtendremosun vector ortogonal tanto a |e1i como a |e2i. En efecto,

|e03i = |a3i � he1|a3i|e1i � he2|a3i|e2i =2X

j=1

hej

|a3i|eji. (1.7)

Entonces, el siguiente vector de la base lo definimos como el vector |e3i dividido entre sumagnitud,

|e3i = |e03iphe03|e03i. (1.8)

Este procedimiento se puede continuar inductivamente hasta agotar los vectores dela base B. En general, si tenemos definidos ya los primeros m � 1 vectores de la basenueva B (con m n), entonces el m-esimo vector se obtiene a partir del vector |a

m

i, alcual se le sustraen todas las componentes a lo largo de las direcciones definidas por losm� 1 vectores ortonormales previamente hallados. De esta manera primero obtenemos elvector |e0

m

i,

|e0m

i = |am

i � he1|ami|e1i � he2|ami|e2i . . . hem�1|ami|em�1i =m�1X

j=1

hej

|a3i|eji. (1.9)

y luego obtenemos el vector de base |em

i normalizando |em

i0,

|em

i = |e0m

iphe0m

|e0m

i , (1.10)

lo que define completamente el procedimiento Gram-Schmidt.

1.2.4. La desigualdad de Schwarz

Una desigualdad que es frecuentemente encontrada en diferentes areas de las ma-tematicas es la desigualdad conocida como la desigualdad de Cauchy-Schwarz. Original-mente esta desigualdad fue establecida para series (establecida por Augustin-Louis Cauchy

Page 14: Notas Métodos Físico Matemáticos

16 Espacios Vectoriales

en 1821) y mas tarde generalizada al caso de integrales (por Viktor Bunyakovsky en 1859y Hermann Amandus Schwarz en 1888). Este resultado se puede establecer, sin embargo,de manera general en espacios con producto interno.

Teorema 1.2.1. Cualquier par de vectores |ai, |bi de un espacio con producto

interno V, satisfacen la desigualdad de Schwarz,

|ha|bi|2 ha|aihb|bi. (1.11)

La igualdad es satisfecha cuando |ai es proporcional a |bi.

Demostracion. Sea |ci un vector definido como sigue,

|ci = |bi � ha|biha|ai |ai,

y notese que ha|ci = 0. Escribimos ahora a |bi en terminos de |ci despejando de la igualdadanterior,

|bi = |ci+ ha|biha|ai |ai.

Si tomamos ahora el producto de |bi consigo mismo obtenemos,

hb|bi =

✓hc|+ ha|bi⇤

ha|ai ha|◆✓

|ci+ ha|biha|ai |ai

= hc|ci+ ha|biha|aihc|ai+

ha|bi⇤ha|ai ha|ci+

����ha|biha|ai

����2

ha|ai.

Como |ai y |ci son ortogonales, es facil observar que,

hb|bi = hc|ci+ |ha|bi|2ha|ai .

Ahora, por la propiedad de producto interno que garantiza que el producto de un vectorconsigo mismo es mayor o igual a cero, entonces tenemos que, en particular hc|ci � 0.Esta desigualdad implica que

hb|bi � |ha|bi|2ha|ai .

de donde se sigue automaticamente el resultado.

Page 15: Notas Métodos Físico Matemáticos

Espacios Normados 17

1.3. Espacios Normados

En espacios vectoriales se suele introducir la nocion de longitud de un vector. Estanocion es bastante util pues muchas propiedades f’sicas se suelen describir mediante vec-tores, cantidades que poseen magnitud y direccion. Particularmente la magnitud de unvector es lo que asociamos en espacios vectoriales abstractos con el concepto de norma.Aunque una norma se puede definir independientemente del producto interno, cuando sedefine un producto interno en un espacio vectorial se puede definir autonmaticamente unanorma en el mismo espacio como a continuacion senalamos.

Definicion 1.3.1. La norma (tambien llamada longitud o magnitud) de un vector

|ai en un espacio con producto interno, se denota por ||a|| y se define como

||a|| :=pha|ai.

Si tenemos la combinacion lineal de dos vectores, ↵|ai+�|bi, entonces la norma de dicha

combinacion lineal se denotara como ||↵a+ �b||.

Una norma en un espacio vectorial V verifica cumple las siguientes propiedades:

1. La norma del vector cero |0i es cero: ||0|| = 0.

2. ||a|| � 0 y ademas ||a|| = 0 si y solo si |ai = |0i.3. ||↵a|| = |↵|||a|| para cualquier escalar ↵ 2 C.

4. ||a+ b|| ||a||+ ||b||. Esta propiedad es llamada desigualdad del triangulo.

Un espacio vectorial dotado de una norma recibe el nombre es espacio lineal nor-mado. Al igual que en espacios vectoriales como R2 o R3, uno puede introducir el conceptode distancia a partir de la norma. De manera general, un espacio lineal normado se puedetransformar automaticamente en un espacio metrico definiendo la funcion distancia comola norma de la diferencia entre dos vectores,

d(|ai, |bi) := ||a� b|| . (1.12)

Es facil mostrar que la distancia que hemos introducido satisface las tres propiedades quedefinen una distancia. Sin embargo, tal como hemos visto anteriormente, no es necesariodefinir un espacio lineal normado para definir un espacio metrico, pues existen manerasdiferentes de definir una distancia entre dos puntos. Mas aun, en general no siempre esposible dotar a un espacio de una estructura de espacio lineal normado (lo que requiere

Page 16: Notas Métodos Físico Matemáticos

18 Espacios Vectoriales

dotarlo inicialmente de una estructura de espacio vectorial). Por ejemplo, sabemos comotransformar S

2 ⇢ R3 en un espacio metrico (usando la distancia usual o la distanciadefinida como la longitud del arco del cırculo mas grande que pasa por dos puntos), perono es posible dotar al cırculo de una estructura de espacio vectorial.

Al igual que el caso anterior, podemos tambien mostrar una relacion similar entreel producto interno y la norma en un espacio vectorial. Como hemos visto, un espaciocon producto interno es automaticamente un espacio lineal normado, pero el recıproco noes necesariamente cierto. Es decir, un espacio dotado de una norma no necesariamentedefine un producto interno. Sin embargo, si la norma satisface la ley del paralelogramo,

||a+ b||2 + ||a� b||2 = 2||a||2 + ||b||2

entonces uno puede definir,

ha|bi = 1

4

⇥||a+ b||2 � ||a� b||2 � i

�||a+ ib||2 � ||a� ib||2�⇤

que cumple con las propiedades de producto interno. De hecho, tenemos en general que,

Teorema 1.3.1. Un espacio lineal normado es un espacio con producto interno si

y solo si la norma satisface la ley del paralelogramo.

De hecho tenemos aun mas. Si tenemos un espacio vectorial de dimension finita VN

,siempre podemos definir una norma de la siguiente manera (sin necesidad de invocar elproducto interno). Si B = {|a

j

i}Nj=1 es cualquier base para V

N

, entonces para un vector|ai 2 V

N

con desarrollo

|ai =NX

j=1

j

|aj

i,

definimos una norma en VN

como,

||a|| :=NX

j=1

|↵j

|2.

Es facil mostrar que esta norma cumple la ley del paralelogramo, por lo que en espaciosvectoriales de dimension finita. Entonces tenemos el siguiente resultado,

Teorema 1.3.2. Todo espacio vectorial de dimension finita es un espacio lineal

normado y ademas se puede transformar en un espacio de producto interno.

Page 17: Notas Métodos Físico Matemáticos

Espacios Normados 19

Ejemplo 1.3.1. Considerese el espacio vectorial Cn con campo en C. El productointerno definido anteriormente (vease Ejemplo 1.2.1) define una norma para el vector|ai = (↵1,↵2, . . . ,↵n

) dada por la expresion,

||a|| :=p

ha|ai =

nX

j=1

|↵j

|2!1/2

.

Esta norma define a su vez la distancia habitual entre dos vectores |ai = (↵1,↵2, . . . ,↵n

)y |bi(�1, �2, . . . , �n

),

d(|ai, |bi) = ||a� b|| =pha� b|a� bi =

nX

j=1

|↵j

� �

j

|2!1/2

.

Ejemplo 1.3.2. Una norma diferente que se puede definir en Cn esta dada por

||a||1 :=nX

j=1

|↵j

|,

la cual satisface todas las propiedades de norma enunciadas anteriormente. Con estanorma tenemos definida una distancia como sigue,

d(a, b) :=nX

j=1

|↵j

� �

j

|.

Ejemplo 1.3.3. Finalmente, uno puede generalizar las normas definidas anterior-mente en una sola definicion. Si |ai = (↵1,↵2, . . . ,↵n

) 2 Cn entonces, dado un p 2 (0,1)definimos

||a||p

:=

nX

j=1

|↵j

|p!1/p

,

lo que satisface todas las propiedades de norma. Los casos p = 2 y p = 1 correspondena los ejemplos de norma definidos el los ejemplos de arriba. La distancia asociada a estanorma se escribe entonces como,

d(a, b) =

nX

j=1

|↵j

� �

j

|p!1/p

.

Page 18: Notas Métodos Físico Matemáticos

20 Espacios Vectoriales

Page 19: Notas Métodos Físico Matemáticos

Capıtulo 2

Transformaciones Lineales:Operadores en espacios vectoriales

Si deseamos estudiar fenomenos fısicos cuya descripcion tiene como base un espaciovectorial, se hace imprescindible contar con herramientas matematicas adicionales. Porejemplo, si estudiamos el movimiento de un objeto en un espacio euclidiano, un vectordescribe la posicion del objeto, otro mas la velocidad, otros mas la aceleracion y la fuerza yası sucesivamente con mas cantidades fısicas. Estos vectores no permanecen estaticos, sinoque se cambian continuamente. Mas aun, una cantidad fısica (o mas de manera conjunta)puede definir otra cantidad fısica cuando realizamos una “operacion”. Por ejemplo, laposicion nos puede dar la velocidad del objeto bajo la operacion de derivada, o bien, laintegral de lınea de la fuerza a lo largo de una trayectoria nos define el trabajo. Estosugiere que los espacios vectoriales que hemos definido de forma abstracta deben dotarsede operaciones para que los vectores puedan “moverse” de un espacio en otro, o de unespacio en sı mismo. Estas operaciones reciben el nombre generıco de transformacion omapeo. Por supuesto, existen muchas clases de transformaciones, y en este capıtulo nosenfocaremos en cierto tipo transformaciones que nos son de utilidad en la descripcion dediversos fenomenos fısicos.

Ejemplo 2.0.4. He aquı algunos ejemplos de mapeos o transformaciones.

1. Sea f : R ! R dado por f(x) = x

3.

2. Sea g : R2 ! R dado por g(x, y) = x

2 + y

2 + 4.

3. Sea F : R2 ! C dado por F (x, y) = x

2 + 2 + i(x3 + y

5 + 1). En general si U, V :R2 ! R, entonces F puede escribirse como F (x, y) = U(x, y) + iV (x, y).

21

Page 20: Notas Métodos Físico Matemáticos

22 Transformaciones Lineales

4. El movimiento de una partıcula durante un intervalo de tiempo tambien es unatransformacion. Sea [a, b] el intervalo de tiempo en describiremos el movimientode un objeto en el espacio R3. Entonces una funcion ~r : [a, b] ! R3 describe elmovimiento del objeto en cuestion. En este caso ~r(t) = (x(t), y(y), z(t)) se entiendecomo la posicion del objeto como funcion del tiempo que se obtiene al resolver laecuacion de Newton correspondiente.

5. Sea T : R ! R2 dado por T (t) = (t, 3t).

2.1. Transformaciones lineales

Consideremos ahora dos espacios vectoriales arbitrarios, que denotaremos por V yW , ambos con el mismo campo escalar. Sea ademas F : V ! W un mapeo (o transforma-cion) entre los espacios vectoriales mencionados. Entonces dados dos vectores |ai, |bi 2 Vles corresponde sendos vectores |xi, |yi 2 W bajo la imagen de F , esto es, F (|ai) = |xiy F (|bi) = |yi. En general una transformacion arbitraria no preserva, necesariamente, laestructura de espacio vectorial; es decir, un combinacion lineal de vectores en V no tienecomo imagen la combinacion lineal de las imagenes de los vectores originales:

F (↵|ai+ �|bi) 6= ↵|xi+ �|yi.

De hecho, esto ocurre en todos los casos mostrados en el Ejemplo 2.0.4, a excepcion delıtem 5. Existen muchos fenomenos fısicos descritos por transformaciones entre espaciosvectoriales, en las cuales la preservacion de la estructura de espacio vectorial es deseabley aun indispensable. Este hecho motiva la siguiente,

Definicion 2.1.1 (Transformacion lineal). Una transformacion lineal de un

espacio vectorial complejo V en un espacio vectorial complejo W es un mapeo T : V ! Wtal que,

T(↵|ai+ �|bi) = ↵T(|ai) + �T(|bi).para cualesquiera vectores |ai, |bi 2 V y cualesquiera escalares ↵, � 2 C. Una transfor-

macion lineal T : V ! V se le llama endomorfismo de V u operador lineal en V.La accion de un operador lineal T sobre un vector |ai muchas veces se suele escribir, por

comodidad, sin parentesis: T(|ai) ⌘ T|ai.

La definicion anterior se extiende naturalmente a espacios vectoriales con campoen los reales. Notese ademas que la definicion misma de transformacion lineal obliga aque los espacios vectoriales que involucra dicha transformacion esten definidos sobre elmismo campo escalar, pues los escalares que aparecen en las combinaciones lineales de

Page 21: Notas Métodos Físico Matemáticos

Transformaciones Lineales 23

cada espacio, son los mismos. Una consecuencia inmediata de la definicion anterior es lasiguiente,

Proposicion 2.1.1. Dos transformaciones lineales T : V ! W y S : V ! W son

iguales si y solo si T|ai

i = S|ai

i para todos los vectores |ai

i de alguna base B de V. Deesta forma, una transformacion lineal esta definida de manera unica si esta bien definida

su accion sobre los vectores de cualquier base del espacio dominio.

Demostracion. Si las transformaciones son iguales entonces esta claro que T|ai

i = S|ai

ipara todos los elementos |a

i

i de cualquier base B de V , por lo que la parte ()) estatrivialmente demostrada. El “regreso” (() se demuestra como sigue. Sea B = {|a

j

i} unabase para V . Supongase ademas que la accion de T y S sobre cada vector de la base B

esta bien definida. Por definicion de base, tenemos que cualquier vector |ai 2 V se puedeescribir de manera unica como una combinacion lineal de los vectores de la base,

|ai =X

j

j

|aj

i.

Entonces tenemos, a partir de la definicion de transformacion lineal que,

T|ai =X

j

j

T|aj

i,

y que

S|ai =X

j

j

S|aj

i.

Por hipotesis sabemos que T|ai

i = S|ai

i, por lo que podemos concluir que

T|ai = T|ai.

Como la igualdad anterior es valida para cualquier vector |ai 2 V se sigue que las trans-formaciones son identicas. Mas aun, si B es otra base, entonces cada vector de B se puedeescribir como combinacion lineal de elementos de B. Esto quiere decir que los vectores enB tienen la misma imagen bajo T y bajo S, por lo que un argumento similar al anteriorpermite concluir la igualdad de T con S independientemente de la base en la que se hayandefinido la accion de dichas transformaciones.

Un caso particular de transformaciones lineales ocurre cuando el espacio imagen Wes el campo de los reales R o el campo de los complejos C. En este caso, la transformacionlineal toma el nombre de funcional lineal.

Page 22: Notas Métodos Físico Matemáticos

24 Transformaciones Lineales

El conjunto de todas las transformaciones lineales del espacio vectorial V en W sedenota por L(V ,W). Notese que la suma de dos transformaciones lineales T,S 2 L(V ,W)esta bien definida si la adoptamos como la suma vectorial de las imagenes correspondien-tes: (T + S)|ai := T|ai + S|ai. Mas aun, esta suma de transformaciones satisface laspropiedades I)� IV ) de la definicion de espacio vectorial si adoptamos como el vector ce-ro la transformacion “cero” 0 que asocia a cada vector de V el vector cero de W . Ademas,la multiplicacion por escalar esta tambien bien definida si la adoptamos como la multi-plicacion por escalar en el espacio W : la transformacion S := ↵T es una transformacionlineal y satisface las propiedades V )� V III) de la definicion de espacio vectorial (la de-mostracion se deja como ejercicio para el lector). Todas estas observaciones implica que, elconjunto de transformaciones lineales L(V ,W) posee naturalmente todas las propiedadesde un espacio vectoria y es por lo tanto un espacio vectorial en sı mismo.

El conjunto de todos los endomorfismos de V se denota como L(V) en lugar deL(V ,V).

Para cualquier espacio vectorial complejo V , el conjunto de todas los funcionaleslineales L(V ,C) se denota por V⇤ y recibe el nombre de espacio dual de V . Analogamente,si V es un espacio vectorial real, el espacio dual V⇤ se define como el conjunto de todoslos funcionales lineales L(V ,R).

Ejemplo 2.1.1. A continuacion daremos una serie de ejemplos de operadoreslineales en varios espacios vectoriales. La prueba de su linealidad se deja como ejerciciopara el lector.

1. Sea {|a1i, |a2i, . . . , |ami un conjunto arbitrario de m vectores en un espacio vectorialV . Sea ademas {f1, f2, . . . , fm} un conjunto de m funcionales lineales. Entonces

A :=mX

j=1

|aj

ifj,

es una transformacion lineal en V . El operador linealA actua sobre un vector |xi 2 Vcomo sigue,

A|xi =mX

j=1

|aj

ifj(|xi).

Esto es, cuando el operadorA actua sobre el vector |xi, los funcionales lineales se en-cargan de transformar |xi en un un conjunto de escalares {f1(|xi), f2(|xi), . . . , f2(|xi)}.Con estos escalares a su vez, se forma una combinacion lineal con los vectores to-mados inicialmente, que es el resultado de la operacion de A sobre |xi.

Page 23: Notas Métodos Físico Matemáticos

Transformaciones Lineales 25

2. Sea |xi 2 PC [t] definido como

|xi = x(t) =nX

j=0

a

j

t

j

.

Sea D un operador que actua sobre |xi de la siguiente forma,

D|xi = x(t) =nX

j=0

ja

j

t

j�1.

Entonces D es un operador lineal y es de hecho, el operador derivada.

3. Sea |xi 2 PC [t] definido como

|xi = x(t) =nX

j=0

a

j

t

j

.

Sea S un operador que actua sobre |xi de la siguiente forma,

S|xi = x(t) =nX

j=0

a

j

j + 1t

j+1.

Entonces S es un operador lineal y es de hecho, el operador integral.

4. Considere el espacio vectorial complejo C0[a, b] y defınase el operador int : C0[a, b] !C como sigue: dado f 2 C0[a, b]

int(f) :=

Zb

a

f(x)dx.

Entonces int es un funcional lineal en C0[a, b].

Una consecuencia inmediata de la definicion de transformacion lineal dada en De-finicion 2.1.1 es que el vector cero de V tiene como imagen el cero de W . Para mapeosen general esto no es necesariamente cierto pero sı es un requisito necesario para queuna transformacion sea lineal. De hecho, muchos otros vectores en V tambien pueden serenviados al cero de W , como acontinuacion se enuncia en el siguiente,

Teorema 2.1.1. El conjunto de vectores in V cuya imagen es el vector cero de Wbajo una transformacion lineal T : ,V ! W forma un subespacio de V llamado nucleo

o espacio nulo de T el cual denotamos por ker(T).

Page 24: Notas Métodos Físico Matemáticos

26 Transformaciones Lineales

Demostracion. Sean |ai, |bi 2 V tales que T|ai = |0i y T|bi = |0i. Es decir, tomamos dosvectores del nucleo de V , i.e., |ai, |bi 2 ker(T) ⇢ V . Notese que para cualesquiera ↵, � 2 Ctenemos que T (↵|ai+ �|bi) = ↵T|ai+ �T|bi por linealidad de T. Por hipotesis tenemosque tanto |ai como |bi tiene como imagen |0i 2 W bajo T. De este modo podemos verque T (↵|ai+ �|bi) = |0i, lo que nos permite concluir que ↵|ai + �|bi 2 ker(T) paracualesquiera ↵, � 2 C. Esto implica que ker(T) es un subespacio.

Como ker(T) es un subespacio de V , este debe tener una dimension menor o comomucho igual, a la dimension de V . La dimension de ker(T) es llamada nulidad de V . Elsiguiente teorema nos muestra que todos los vectores que tienen una preimagen bajo Tes tambien un subespacio.

Teorema 2.1.2. El rango T(V) de una transformacion lineal T : V ! W es el

conjunto de todos los vectores en W que son imagen de algun vector en V bajo T. Entonces

T(V) es un subespacio. La dimension de T(V) se denomina rango de T.

La demostracion de este teorema y el siguiente se dejan como ejercicios para ellector.

Teorema 2.1.3. Una transformacion lineal es inyectiva su y solo si su nucleo es

el vector cero, ker(T) = {0}.

Supongamos que tenemos un espacio vectorial V y una transformacion lineal T.Puesto que ker(T) es un subespacio de V , podemos primero definir una base en ker(T)y luego anadir vectores linealmente independientes hasta completar una base para Vque llamaremos B = {|a1i, |a2i, . . . , |ani}. Supongase que la dimension de ker(T) es m.Entonces, sin perdida de generalidad podemos tomar los primeros m vectores de B co-mo los vectores de la base para ker(T). Es facil mostrar que el conjunto de vectores{T|a

m+1i,T|am+2i, . . . ,T|a

n

i} forma una base para T(V). Este resultado se recoge en elsiguiente,

Teorema 2.1.4 (Teorema de la dimension). Sea T : V ! W una transformacion

lineal. Entonces

dimV = dimker(T) + dimT(V).

Una consecuencia inmediata de este teorema es la siguiente,

Proposicion 2.1.2. Un endomorfismo de un espacio vectorial de dimension finita

es biyectivo si se verifica cualquiera de estas dos propidades: o es inyectivo o es sobre.

Page 25: Notas Métodos Físico Matemáticos

Transformaciones Lineales 27

Debemos tener en cuenta que la proposicion anterior no es valida para espaciosvectoriales de dimension infinita, pues el teorema de la dimension deja de ser valido paraespacios vectoriales de dimension infinita.

Ejemplo 2.1.2. Consideremos la siguiente transformacion linealT : R4 ! R3

definida como,

T(x1, x2, x3, x4) = (2x1 + x2 + x3 � x4, x1 + x2 + 2x3 + 2x4, x1 � x3 � 3x4).

Primero busquemos el conjunto de vectores (x1, x2, x3, x4) 2 R4 tales queT(x1, x2, x3, x4) =(0, 0, 0). Esto es, buscamos las soluciones del conjunto de ecuaciones,

2x1 + x2 + x3 � x4 = 0,

x1 + x2 + 2x3 + 2x4 = 0,

x1 � x3 � 3x4 = 0.

Por supuesto, este sistema no esta completamente determinado, por lo que tendre-mos una infinidad de soluciones. Estas estan dadas por x1 = x3 +3x4 y x2 = �3x3 � 5x4.Dicho de otra manera, un vector de la forma

(x3 + 3x4,�3x3 � 5x4, x3, x4) = x3(1,�3, 1, 0) + x4(3,�5, 0, 1)

satisface la ecuacion T(x1, x2, x3, x4) = (0, 0, 0) para cualesquiera valores x3 y x4 en R.De hecho podemos apreciar sin problemas que los vectores |a1i = (1,�3, 1, 0) y |a2i =(3,�5, 0, 1) forman una base para ker(T). Por lo tanto tenemos que dimker(T) = 2 ypor el teorema de la dimension T(V) = 2. Esto es, el teorema de la dimension nos indicaque el rango de T es bidimensional. Esto resulta en efecto claro cuando notamos que latranformacion lineal T la reescribimos como,

T(x1, x2, x3, x4) = (2x1 + x2 + x3 � x4)(1, 0, 1) + (x1 + x2 + 2x3 + 2x4)(0, 1,�1).

y por lo tanto, cualquier vector (x1, x2, x3, x4) tiene como imagen bajo T en R3 forzosa-mente una combinacion lineal de los vectores (1, 0, 1) y (0, 1,�1).

Como hemos visto hasta ahora a traves de varios ejemplos de espacios vectoriales,muchos de estos espacios a primera vista lucen bastante diferentes, cuando en realidadcomparte mucho mas caracterısticas de lo que podemos apreciar. Un ejemplo intuitivode esta situacion podrıa ser el espacio C con campo en los reales comparado con R2 concampo en R. Aunque los vectores en estos dos espacios los denominamos con nombres di-ferentes e incluso los representamos en formas distintas, estos tienen bastantes similitudesentre sı. Por ejemplo, ambos son bi-dimensionales e incluso graficamente no atrevemos arepresentar ambos espacios en la misma manera: como un plano cartesiano. Esta nocionde similitud la podemos hacer mas precisa con la siguiente definicion.

Page 26: Notas Métodos Físico Matemáticos

28 Transformaciones Lineales

Definicion 2.1.2. Un espacio vectorial V se dice que es isomorfo a otro espacio

vectorial W si existe un mapeo lineal biyectivo T : V ! W. En este caso T recibe el nombre

de isomorfismo. Un mapeo lineal biyectivo de V en sı mismo se llama automorfismo

de V.

Para fines practicos podemos decir que dos espacios vectoriales isomorfos son enrealidad manifestaciones del “mismo” espacio vectorial. En el ejemplo que precede ladefinicion anterior la correspondencia entre ambos espacio esta dada por T : C ! R2

definido como T(x + iy) = (x, y) el cual establece un isomorfismo entre ambos espacios.Debemos enfatizar sin embargo que los espacios R2 y C son isomorfos unicamente como

espacios vectoriales. Si dotamos a estos espacios con otras estructuras entonces resultarıanser bastante distintos. Por ejemplo, en C, se tiene una multiplicacion natural entre suselementos, mientras que R2 no la tiene. El siguiente teorema nos ofrece un criterio paraisomorfismos.

Teorema 2.1.5. Una transformacion lineal sobreyectiva T : V ! W es un iso-

morfismo si y solo si su nulidad es cero.

Otro teorema que tambien nos da informacion sobre los vectores transformados esel siguiente.

Teorema 2.1.6. Un isomorfismo T : V ! W transforma un conjunto de vec-

tores linealmente independientes en un conjunto de vectores que tambien es linealmente

independiente.

Demostracion. Supongamos que {|aj

i}nj=1 ⇢ V es un conjunto de vectores linealmente

independientes. Probemos el teorema por contradiccion. Entonces supongase que para elconjunto de vectores {T|a

j

i}nj=1 existe un conjunto de escalares {↵

j

}nj=1 tales que

nX

j=1

j

T|aj

i = |0i.

Entonces por linealidad de T tenemos que

T

nX

j=1

j

|aj

i!

= |0i.

De esta ultima igualdad se desprende queP

n

j=1 ↵j

|aj

i = |0i porque T es un isomorfismo(su nulidad es cero, o equivalentemente su nucleo consta unicamente del vector cero).Esto contradice nuestra hipotesis inicial de que {|a

j

i}nj=1 ⇢ V es un conjunto de vectores

linealmente independientes, lo que prueba el teorema.

Page 27: Notas Métodos Físico Matemáticos

Transformaciones Lineales 29

El siguiente teorema nos muestra en cambio que la “diversidad” de espacios vecto-riales de dimension finita esta bastante limitada.

Teorema 2.1.7. Dos espacios vectoriales de dimension finita son isomorfos si y

solo si poseen la misma dimension.

Demostracion. Sea {|aj

i}nj=1 una base para V , siendo n la dimension de V . Sea T un

ismorfismo entre V y W y defınase los vectores en W como sigue |bj

i = T|aj

i paraj = 1, 2, . . . , n. Como T es un isomorfismo es claro que el conjunto de vectores BW :={|b

j

i}nj=1 ⇢ W es linealmente independiente. Tenemos ahora que probar que BW es una

base para W . Si suponemos que span(BW) 6= W entonces podemos decir que existe unvector |bi linealmente independiente con todos los vectores de BW . Como T es biyectivo,existe un |ai 2 V tal que T|ai = b Entonces,

nX

j=1

j

|bj

i+ ↵|bi 6= |0i,

par cualesquiera escalares {↵j

}nj=1. De esto se desprende que

nX

j=1

j

T|aj

i+ ↵T|ai 6= |0i,

o lo que es lo mismo,

T

nX

j=1

j

|aj

i+ ↵|ai!

6= |0i.

Como T es un ismorfismo es claro que

nX

j=1

j

|aj

i+ ↵|ai 6= |0i.

pues su nulidad es cero. Esto es, sin embargo, una contradicion con el hecho de que B

forma una base para V . Por lo tanto BW es una base para W y consecuentemente sudimension es n.

Para probar el reciproco supongamos que la dimension de ambos espacios es n.Supongase ademas que BV := {|a

j

i}nj=1 y BV := {|b

j

i}nj=1 son bases de V y W respecti-

vamente. Defınase una transformacion T como sigue: T|aj

i = |bj

i. Sabemos la accion deT sobre los vectores de base es suficiente para definir completamente una transformacionlineal. Es facil verificar que ademas T establece un isomorfismo entre V y W .

Page 28: Notas Métodos Físico Matemáticos

30 Transformaciones Lineales

Entonces, el teorema anterior tiene por consecuencia que cualquier espacio vectorialreal de dimension n es isomorfo a Rn, mientras que cualquier espacio vectorial complejode dimension n es isomorfo a Cn. De esta forma tenemos que, para fines practicos existensolo dos tipos de espacios vectoriales de dimension finta n, Rn o Cn.

Un ejemplo de espacios isomorfos es el caso de los espacios vectoriales V y su co-rrespondiente espacio dual V⇤, es decir, el el espacio que consiste de todas las aplica-ciones lineales en V es isomorfo con V mismo. Para ver que este es el caso conside-remos un espacio vectorial de dimension finita N en el cual se ha definido una baseB := {|a1i, |a2i, . . . , |aNi}. Sea f un funcional lineal sobre V . Sabemos que, por defini-cion, un funcional lineal asocia a cada vector en V un escalar complejo. Mas aun, sabemospor la Proposicion 2.1.1 que una transformacion lineal esta bien definida si definimos suaccion sobre los vectores de base. Lo mismo es cierto para funcionales lineales por razonesobvias. Supongamos entonces que el funcional lineal f actua sobre los vectores de la baseB como sigue,

f |aj

i = ↵

j

, 8 1 j N.

siendo un {↵1,↵2, . . . ,↵N

} un cierto conjunto de escalares que es el resultado de la apli-cacion de f sobre cada vector de base. La ecuacion anterior nos permite observar que elconjunto de escalares {↵1,↵2, . . . ,↵N

} define de manera unica al funcional lineal f . Peropodemos hacer aun mas. Sabemos que un funcional lineal tambien puede ser visto comoun vector, pues V⇤ es un espacio vectorial. Esto quiere decir que debe existir una base detal manera que el funcional lineal f se escriba como una combinacion lineal de la base. Labase en cuestion se puede hallar de manera relativamente directa. Defınase el conjunto defuncionales lineales {f1, f2, . . . , fN} de la siguiente manera,

f1|a1i = 1, f1|a2i = 0, , . . . , f1|aNi = 0,

f2|a1i = 0, f2|a2i = 1, , . . . , f2|aNi = 0,...

fN

|a1i = 0, fN

|a2i = 0, , . . . , fN

|aN

i = 1.

Es posible observar que el funcional lineal f se puede escribir como

f = ↵1f1 + ↵2f2 + · · ·+ ↵

N

fN

.

Notemos ahora que, dado cualquier vector |bi 2 V , el cual tiene una descomposicion unicaen terminos de una combinacion lineal de los vectores de base,

|bi =NX

j=1

j

|aj

i,

Page 29: Notas Métodos Físico Matemáticos

Transformaciones Lineales 31

tiene como imagen bajo f un escalar que podemos escribir explicitamente,

f |bi = f

NX

j=1

j

|aj

i!

=NX

j=1

j

f |aj

i,

=NX

j=1

j

j

. (2.1)

Puesto que un espacio vectorial de dimension finita N es isomorfo a CN , entonces losvectores en V los podrıamos representar como vectores columna. Siguiendo esta lınea, laigualdad dada en la ecuacion (2.1) sugiere de alguna forma que un funcional lineal f ,visto como un vector, podrıa interpretarse como un vector reglon, pues el resultado de su“producto” f |bi serıa equivalente el producto matricial de un vector reglon por un vectorcolumna, que a su vez, es similar a la operacion de producto interno. Lo anterior sugiereentonces pensar el producto interno ha|bi entre dos vectore, se puede pensar como elresultado de aplicar una transformacion lineal, definida por un vector |ai, aplicada sobrevector |bi.

Sea |ai 2 V un vector en un espacio vectorial V y sea B = {|aj

i}Nj=1 una base en

dicho espacio vectorial. Vamos a definir un funcional lineal fa

como

fa

= ↵1f1 + ↵2f2 + · · ·+ ↵

N

fN

, (2.2)

y analogamentefa

⇤ = ↵

⇤1f1 + ↵

⇤2f2 + · · ·+ ↵

⇤N

fN

, (2.3)

siendo ↵

j

la j-esima componente de |ai en la base B. Entonces, el producto interno ha|bientre dos vectores |ai, |bi esta dado por,

ha|bi := fa

⇤ |bi =nX

j=1

⇤j

j

,

donde �

j

es la j-esima componente de |bi en la base B. En este sentido podemos ima-ginar que el vector original |ai sufre una “transformacion”, a fin de poder “aparearse”en producto interno con |bi. Nuestra declaracion puede hacerse precisa si definimos taltransformacion como la asociacion de un vector en V con un funcional lineal tal como loestablece la identidad 2.2, i.e., |ai 7! f

a

. Esta identificacion, sin embargo, no es suficientepara definir el producto interno, pues aun falta una segunda operacion; la que conjuga lascomponentes del vector original para dar lugar a f

a

⇤ definido en la igualdad 2.3. Estas dosoperaciones se pueden definir en una sola a traves de la definicion de la operacion de tras-conjugacion, tambien llamada operacion de dualidad, que en esencia es la identificaciondel funcional lineal f

⇤ con el vector “bra” ha|. Para ello introducimos la notacion

(|ai)† := ha| = fa

⇤,

Page 30: Notas Métodos Físico Matemáticos

32 Transformaciones Lineales

lo que nos permite interpretar a ha| como un vector del espacio dual V⇤. Pasar de “kets” a“bras” ya lo hemos especificado anteriormente cuando introdujimos el producto interno.Conviene sin embargo recapitular las reglas. Para pasar de un ket |ai a su correspondientebra utilizamos la operacion de dualidad (o transconjugacion) usando el sımbolo daga. Sitenemos una combinacion lineal de vectores |ci = ↵|ai + �|bi, su correspondiente bra seobtiene como sigue,

hc| := (↵|ai+ �|bi)† = ↵

⇤ha|+ �

⇤hb|.Mas adelante veremos que las transformaciones lineales en un espacio vectorial no operanidenticamente sobre vectores ket y bra, salvo en una gran excepcion que mas adelanteanalizaremos.

2.2. Algebra de Operadores

Ya hemos establecido que el conjunto de todos las transformaciones lineales entreespacios vectoriales forma en sı mismo un espacio vectorial. Esto se logro gracias a quela “suma” entre espacios vectoriales esta bien definida gracias a las mismas propiedadesde espacio vectorial que gozan tanto el dominio como la imagen de las transformacioneslineales y que ademas, esta preserva naturalmente estas estructuras por su misma defi-nicion. Vamos ahora a estudiar las transformaciones lineales desde otra perspectiva. Sibien entre transformaciones lineales pudimos definir naturalmente la “suma de vectores”ası como la correspondiente “multiplicacion por escalares”, podremos ver mas adelanteque tambien existe una manera natural de definir la correspondiente “multiplicacion” en-tre transformaciones. Cuando un espacio se dota de una “multiplitiplicacion”, obtenemosuna estructura conocida como algebra. Dependiendo del tipo de multiplicacion podemosobtener diversas estructuras tales como el algebra conmutativa, el algebra asociativa o elalgebra con identidad.

2.2.1. Algebras

En esta seccion revisaremos algunos conceptos elementales de las algebras. Las es-tructuras conocidas como “algebras” son abundantes en fısica, pues involucran una opera-cion de multiplicacion entre elementos de un espacio determinado que dan como resultadoun elemento del espacio en cuestion. Por citar un ejemplo, un producto entre vectores de-fine lo que conocemos como “momento angular” que es, a su vez, un (pseudo) vector. Elalgebra que se define naturalmente entre operadores es de particular utilidad especial-mente en mecanica cuantica.

Page 31: Notas Métodos Físico Matemáticos

Algebra de Operadores 33

Definicion 2.2.1. Un lgebra A sobre C (o sobre R) es un espacio vectorial V sobre

C (o sobre R) dotado de una operacion binaria µ : V⇥V ! V, llamada multiplicacion.

Si a,b 2 A son dos vectores

1entonces la multiplicacion entre estos se denota como

µ(a,b) = ab, y dicha operacion satisface

a(�b+ �c) = �ab+ �ac,

y

(�b+ �c)a = �ba+ �ca,

para cualesquiera tres vectores a,b, c 2 A y cualesquiera escalares ↵, �, � 2 C. La di-

mension del espacio vectorial recibe en este caso el nombre es dimension del algebra.

Un algebra se llama asociativa si la multiplicacion satisface a(bc) = abc y se llama

conmutativa si ab = ba. Un algebra con identidad es un algebra con un elemento 1 tal

que 1a = a1 = a. Un elemento b se llama inversa izquierda de a si ba = 1, y se

denomina inversa derecha de a si ab = 1.

Ejemplo 2.2.1. Defınase el siguente producto de vectores en R2: si (x1, x2), (y1, y2) 2R2 son dos vectores en el plano, definimos un tercer vector a traves de su multiplicacioncomo,

(x1, x2)(y1, y2) := (x1y1 � x2y2, x1y2 + x2y1)

Queda al lector la tarea de mostrar que efectivamente este producto define un algebraconmutativa en R2.

Ejemplo 2.2.2. El producto “cruz” en R3 definido en la vıa usual tambien defineun algebra. Si dos vectores (x1, x2, x3), (y1, y2, y3) 2 R3 entonces definimos un tercer vectorcomo resultado de la multiplicacion (llamado “producto cruz”) de dichos vectores comosigue,

(x1, x2, x3)⇥ (y1, y2, y3) := (x2y3 � y2x3, x3y1 � x1y3, x1y2 � y1x2).

Esta operacion de multiplicacion entre vectores en R3 define un algebra no asociativa yno conmutativa entre vectores en R3.

Ejemplo 2.2.3. El paradigma de las algrbras es sin duda el algebra matricialdefiniendo el producto entre matrices de la misma dimension en la vıa estandar. Esto es,dos matrices de n⇥ n da como resultado una matriz de n⇥ n. Esta algebra es asociativapero no es conmutativa.

1En esta definicion usamos letras en “negrita” (boldface) para denotar vectores con estructura de

algerbra.

Page 32: Notas Métodos Físico Matemáticos

34 Transformaciones Lineales

2.2.2. El algebra L(V)

Vamos ahora a investigar el algebra que se genera de manera natural en el espaciode las transformaciones lineales. Ya hemos establecido que el conjunto de todas las trans-formaciones lineales L(V ,W) de un espacio vectorial V en un espacio vectorial W tienenaturalmente una estructura de espacio vectorial. La “multiplicacion” entre transforma-ciones lineales tambien se puede definir de manera natural. Supongamos que tenemos unatransformacion lineal T de un espacio vectorial V en un espacio W , i.e., T : V ! W , yuna transformacion lineal S entre el espacio W y algun otro espacio U , i.e., S : W ! U .Entonces podemos intentar definir la multiplicacion entre la transformaciones lineales Ty S como la composicion: ST := S �T. Esta claro que transformacion resultante es unatransformacion lineal del espacio vectorial V en U . Por supuesto, ninguno de los tres vec-tores involucrados se encuentra en el mismo espacio vectorial, lo que nos impide satisfacerla condicion de algebra (que la multiplicacion sea cerrada en un espacio vectorial). Estohace necesario restringir los espacios en los que operan dichas transformaciones. En efecto,si hacemos V = W = U nuestro problema se resuelve y la operacion de “composicion”define una multiplicacion entre transformaciones lineales (vectores) y este a su vez, defineun algebra en el espacio vectorial L(V). A continuacion enunciaremos varios resultadosconcernientes con el algebra L(V). Aunque muchos de estos resultados son en primerainstancia intuitivos, los haremos preciso aquı.

Definicion 2.2.2. Dos operadores lineales T,S 2 L(V) son iguales si T|ai = S|aipara todo |ai 2 V.

De la hipotesis de linealidad, se sigue automaticamente que la igualdad entre dosoperadores lineales (o endomorfismos) ocurre cuando actuan de manera identica sobre losvectores de cualquier base en V . De hecho, ya hemos mostrado que un operador lienal sedefine de manera unica por su accion sobre los vectores de cualquier base. El siguiente teo-rema nos indica una manera alternativa de establecer la igualdad entre transformacioneslineales mediante el producto interno. En muchos casos esta alternativa resulta inclusoconveniente.

Teorema 2.2.1. Un endomorfismo (transformacion lineal) T en un espacio con

producto interno es igual al operador cero 0 si y solo si hb|T|ai = hb|Tai = 0 para todo

|ai, |bi 2 V.

Demostracion. Es claro que siT = 0 entonces hb|T|ai = 0 para todo |ai, |bi 2 V . Entonceslo que resta demostrar es que si hb|T|ai = 0 para todo |ai, |bi 2 V entonces T = 0. Perosi la hipotesis es cierta entonces podemos elegir particularmente |bi = |Tai, lo cual nosda como resultado que,

hTa|Tai = 0,

Page 33: Notas Métodos Físico Matemáticos

Algebra de Operadores 35

para todo |ai 2 V . Pero usando la propiedad (c) de la definicion de producto interno(positividad definida, cf. Definicion 1.2.1) tenemos que la unica posibilidad para el vector|Tai es que sea el vector cero, i.e., |Tai = |0i para todo |ai 2 V . Esto nos deja claro queT debe ser la transformacion cero 0 para que esto ultimo tenga sentido.

De hecho, el criterio para comprobar que un operador coincide con el operador cerose puede hacer aun mas fuerte.

Teorema 2.2.2. Un operador lineal T en un espacio con producto interno V es el

operador 0 si y solo si ha|T|ai = 0 para todo |ai 2 V.

Demostracion. Por supuesto, la parte facil de la desmostracion es clara: si T = 0 entoncesha|T|ai = 0 para todo |ai 2 V . Lo que nos resta es mostrar el recıproco. Supongamospues que ha|T|ai = 0 para todo |ai 2 V . Tomese a |ai como

|ai = �|bi+ �|ci,

para cualesquiera vectores |bi, |ci 2 V y cualesquiera escalares �, � 2 C, y notese que

ha|T|ai = h�b+ �c|T|�b+ �ci = (�⇤hb|+ �

⇤hc|)T (�|bi+ �|ci)= |�|2hb|T|bi+ |�|2hc|T|ci+ �

⇤�hb|T|ci+ ��

⇤hc|T|bi.

De la igualdad anterior obtenemos la siguiente identidad,

⇤�hb|T|ci+ ��

⇤hc|T|bi = h�b+ �c|T|�b+ �ci � |�|2hb|T|bi � |�|2hc|T|ci.

Por hipotesis tenemos que el lado derecho de la ecuacion anterior debe ser identico concero. Por tanto se tiene que

⇤�hb|T|ci+ ��

⇤hc|T|bi = 0.

Para cualesquiera escalares ↵, � 2 C. Si en particular tomamos ↵ = � = 1 se tieneque hb|T|ci + hc|T|bi = 2Re[hb|T|ci] = 0. Si tomamos ↵ = 1 y � = i obtenemos queihb|T|ci � ihb|T|ci = 2Im[hb|T|ci] = 0. Estas dos ecuaciones no indican que hb|T|ci =para cualesquiera |ai|bi 2 V . Finalmente, usando el Teorema 2.2.1 se demuestra nuestradeclaracion.

Page 34: Notas Métodos Físico Matemáticos

36 Transformaciones Lineales

Los dos teoremas anteriores nos permiten decidir si dos operadores lineales sonidenticos entre sı. La manera de hacerlo es tomar la diferencia de dichos operadores ymostrar que es identico al operador cero usando alguno de los criterios arriba enuncia-dos. Ademas de la transformacion cero 0, en el algebra L(V) tenemos presente tambien latransformacion identidad, la cual esta definida como la transformacion lineal (que denota-remos por 1) que deja invariante cualquier vector en el espacio vectorial V , i.e., 1|ai = |aipara todo |ai 2 V . Como tenemos el elemento “identidad” en el espacio L(V) convienepreguntarse si este juega el papel del elemento identidad en el sentido de algebra. Es decir,nos preguntamos si para una transformacion lineal T existe una transformacion T�1 talque TT�1 = 1. De hecho, solo los las transformaciones lineales biyectivas tienen inversasen el sentido arriba expuesto. Podemos entonces decir que L(V) es un algebra asociativacon identidad no necesariamente conmutativa ( TS generalmente no es igual a ST).

Un resultado que se desprende de los teoremas arriba enunciados nos arroja algunaspropiedades de las inversas de los operadores lineales.

Teorema 2.2.3. La inversa de un operador lineal es unica. Si T y S son dos

operadores invertibles entonces TS es invertible y ademas (TS)�1 = S�1T�1. Un endo-

morfismo T : V ! V es invertible si y solo si transforma los vectores de una base en Ven otra base para el mismo espacio.

Ejemplo 2.2.4. La transformacion lineal T : R3 ! R3 definida como,

T(x1, x2, x3) := (x1 + x2, x2 + x3, x3 + x1),

es invertible, ya que la unica solucion del sistema,

x1 + x2 = 0

x2 + x3 = 0

x3 + x1 = 0

es x1 = x2 = x3 = 0. Entonces es claro que ker(T) = {(0, 0, 0)} y por el Teorema 2.1.5tenemos que T es una biyecccion. Entonces tenemos que T debe tener una inversa, lacual deseamos calcular. Para este proposito necesitamos hallar una transformacion T�1

tal que T�1T(x1, x2, x3) = (x1, x2, x3), o bien,

(x1, x2, x3) = T�1(x1 + x2, x2 + x3, x3 + x1).

Si ahora definimos el vector (y1, y2, y3) cuyas componentes estan dadas por,

y1 = x1 + x2, y2 = x2 + x3, y3 := x3 + x1, (2.4)

entonces podemos observar que

T�1(y1, y2, y3) := (x1, x2, x3)

Page 35: Notas Métodos Físico Matemáticos

Operadores Lineales 37

Por lo que para tener explıcitamente la transformacion T�1 necesitamos despejar de lasecuaciones (2.4) a x1, x2 y x3 en terminos de y1, y2 y y3. Haciendo este ejercicio obtenemosque

T�1(y1, y2, y3) = (x1, x2, x3) =1

2(y1 � y2 + y3, y1 + y2 � y3 � y1 + y2 + y3) .

Finalmente es facil verificar que, efectivamente T�1T = 1.

2.3. Operadores Lineales

Ya hemos discutido el concepto de espacio dual de un espacio vectorial de manerageneral y hemos visto que estos espacios tienen muchas propiedades en comun. Ademasde compartir el hecho de ser espacios vectoriales de la misma dimension y que inclusoson isomorfos entre sı, hay una relacion mas ıntima entre estos espacios. Hemos visto quelos vectores “bra”, que inicialmente fueron introducidos como un artilugio para definiruna notacion mas compacta para el producto interno, pueden ser interpretados comovectores en el espacio dual. La operacion de “dualidad” quedo entonces bien definida atraves de un isomorfismo entre un vector de un espacio vectorial y un funcional lineal.La pregunta que ahora nos hacemos es si es posible que esta operacion de dualidad seatambien extendida hacia las transformaciones lineales mismas definidas sobre un espaciovectorial determinado. Si es esto posible tambien podriamos preguntarnos si un operadorlineal cualquiera puede actuar sobre vectores y vectores en el espacio dual de manerasimultanea y si esta accion es igual o no en ambos casos. Esto nos llevara a definir elconcepto de conjugacion de operadores que juega un papel particularmente importante enel desarrollo de la Teorıa de Sturm-Liouville, cuyas consecuencias son de gran importanciaen la resuolucion de problemas en varias ramas de la fısica.

2.3.1. Conjugacion de Operadores

Definicion 2.3.1. Sea T 2 L(V) y sea |ai, |bi 2 V. Definimos el operador

conjugado (o adjunto) de T como un operador T†tal que

ha|T|bi⇤ = hb|T†|ai.

Notese que, de la definicion anterior podemos obtener una regla sencilla para iden-tificar el operador conjugado. Ya que podemos escribir ha|T|bi⇤ = ha|Tbi⇤ = hTb|ai,entonces podemos darnos cuenta que

hTb|ai = hb|T†|ai,

Page 36: Notas Métodos Físico Matemáticos

38 Transformaciones Lineales

de donde se desprende que hb|T† = hTb| en virtud de la arbitrariedad de los vectoresinvolucrados. Usando la operacion de conjugacion sobre vectores entonces obtenemos que

(|Tbi)† = (T|bi)† = hb|T†. (2.5)

Este resultado nos indica que, si tomamos el vector congujado que se obtiene de unatransformacion lineal, es lo mismo que tomar el operador conjugado a T y hacerlo operarhacia la izquierda sobre el bra correspondiente. Los operadores T y T† son operadoresde la misma naturaleza y vamos a admitir que puedan ambos puedan operar tanto a laderecha como hacia la izquierda usando la operacion de conjugacion.

El siguiente teorema no brinda algunas propiedades de la operacion de conjugacionsobre operadores compuestos.

Teorema 2.3.1. Sean T,U 2 L(V) y sea ↵ 2 C. Entonces,

i. (T+U)† = T† +U†,

ii. (UT)† = T†U†,

iii. (↵T)† = ↵

⇤T†,

iv. (T†)† = T.

Hay que hacer enfasis en que la ultima identidad solo es valida en espacios vectorialesde dimension finita; en sistemas de dimension infinita puede no ser cierta.

Demostracion.

i. Notese que ha| (T+U) |bi se puede escribir como,

ha| (T+U) |bi = ha|T|bi+ ha|U|bi,

lo que nos dice que

ha| (T+U) |bi⇤ = ha|T|bi⇤ + ha|U|bi⇤ = hb|T†|ai+ hb|U†|ai = hb| �T† +U†� |ai.

lo que muestra efectivamente que

(T+U)† = T† +U†

Page 37: Notas Métodos Físico Matemáticos

Operadores Lineales 39

ii. De manera completamente analoga tenemos que

ha| (UT) |bi⇤ = ha|T|Ubi⇤ = hUb|T†|ai.

Usando la identidad (2.5) podemos ver que el operador U puede “salir” del bracorrespondiente pero conjugado,

ha| (UT) |bi⇤ = ha|T|Ubi⇤ = hb|U†T†|ai.

esto demuestra la identidad ii.

iii. Esta identidad se muestra directamente pues solo hace falta aplicar la definicion deconjugacion y el hecho de que el producto es lineal respecto de su primer argumento,

ha|↵T|bi⇤ = ha|↵Tbi⇤ = (↵ha|Tbi)⇤ = ↵

⇤ha|T|bi⇤ = ↵

⇤ha|T†|bi.

Como la constante ↵

⇤ se puede regresar al interior del producto interno tenemosautomaticamente que

(↵T)† = ↵

⇤T†

iv. Finalmente, para nuestra ultima identidad tenemos que calcular ha|T†|bi⇤. Noteseque el operador conjugado se puede “meter” dentro del bra sin conjugar, de modoque podemos observar que,

ha|T†|bi⇤ = hTa||bi⇤ = hb||Tai = hb|T|ai.

La ultima igualdad muestra automaticamente la identidad deseada.

Ejemplo 2.3.1. Vamos ahora a calcular la transformacion conjugada a la trans-formacion T : C ! C definida como

T

0

@↵1

↵2

↵3

1

A =

0

@↵1 � i↵2 + ↵3

i↵1 � ↵3

↵1 � ↵2 + i↵3

1

A,

donde los escalares ↵j

son las componentes del vector |ai sobre el que actua el operador T.Vamos tambien a introducir el vector |bi con componentes �

j

, con lo cual, ambos vectoresse escribe como,

|ai :=0

@↵1

↵2

↵3

1

A, |bi :=

0

@�1

�2

�3

1

A.

Page 38: Notas Métodos Físico Matemáticos

40 Transformaciones Lineales

Los correspondientes vectores duales ha| y hb| se representan como vectores reglon,

ha| = (↵⇤1,↵

⇤2,↵

⇤3), hb| = (�⇤

1 , �⇤2 , �

⇤3).

Si deseamos saber como actua el operador conjugado sobre un vector necitamos recurrira la definicion. Observemos que

ha|T†|bi = hb|T|ai⇤ ="(�⇤

1 , �⇤2 , �

⇤3)T

0

@↵1

↵2

↵3

1

A#⇤

=

"(�⇤

1 , �⇤2 , �

⇤3)

0

@↵1 � i↵2 + ↵3

i↵1 � ↵3

↵1 � ↵2 + i↵3

1

A#⇤

=⇥�

⇤1 (↵1 � i↵2 + ↵3) + �

⇤2 (i↵1 � ↵3) + �

⇤3 (↵1 � ↵2 + i↵3)

⇤⇤

=⇥↵1�

⇤1 � i↵2�

⇤1 + ↵3�

⇤1 + i↵1�

⇤2 � ↵3�

⇤2 + ↵1�

⇤3 � ↵2�

⇤3 + i↵3�

⇤3

⇤⇤

= ↵

⇤1�1 + i↵

⇤2�1 + ↵

⇤3�1 � i↵

⇤1�2 � ↵

⇤3�2 + ↵

⇤1�3 � ↵

⇤2�3 � i↵

⇤3�3 (2.6)

y agrupando los terminos que contienen ↵

⇤1, ↵

⇤2 y ↵

⇤3 obtenemos,

ha|T†|bi = ↵

⇤1 (�1 � i�2 + �3) + ↵

⇤2 (i�1 � �3) + ↵

⇤3 (�1 � �2 � i�3)

o bien, en forma de producto matricial, tenemos que

ha|T†|bi = (↵⇤1,↵

⇤2,↵

⇤3)

0

@�1 � i�2 + �3

i�1 � �3

�1 � �2 � i�3

1

A.

Como el resultado anterio vale para cualquier |ai 2 C3 tenemos que el operador conjugadoactua sobre |bi como sigue,

T†

0

@�1

�2

�3

1

A =

0

@�1 � i�2 + �3

i�1 � �3

�1 � �2 � i�3

1

A.

2.3.2. Operadores Hermitianos y Unitarios

En la seccion anterior hemos visto que la operacion de conjugacion de operadores esbastante similar a la operacion de conjugacion de numeros complejos. De hecho la hemosdesarrollado basados en las propiedades de conjugacion del producto interno entre dosvectores, cantidad que, por definicion, es un numero complejo en el caso mas general.Si hacemos una analogıa entre el espacio de operadores y el campo de los complejos, es

Page 39: Notas Métodos Físico Matemáticos

Operadores Lineales 41

entonces natural preguntarse sobre la contraparte correspondiente a los numero reales.Es decir, ¿existen operadores “reales” que en relacion al resto de los operadores jueguenun papel similar al de los numeros reales en relacion a los numeros complejos? La formade responder esta pregunta es justamente tomar la conjugacion de operadores y observarque operadores son invariantes bajo dicha operacion, tal como sucede con los numerosreales bajo la operacion de conjugacion. Estos operadores reciben el nombre de operadoreshermitianos (o hermıticos) en honor al matematico frances Charles Hermite (1822-1901).

Definicion 2.3.2. Un operador lineal H 2 L(V) se denomina hermitiano,

hermıtico o autoconjugado si H† = H. Un operador A se denomina anti-hermitiano,

antihermıtico o anti-autoconjugado si A† = �A.

Las propiedades que veremos a continuacion nos muestra que la conjugacion denumeros complejos y la conjugacion de operadores guardan tienen estructuras paralelasy guardan entre sı una relacion bastante estrecha.

Definicion 2.3.3. El valor esperado de un operador T en el “estado” |ai es unnumero complejo definido como

hTia

:= ha|T|ai.

Notese ahora que el complejo conjugado del valor esperado de un operador T puedeescribirse como,

hTi⇤a

= ha|T|ai⇤ = ha|T†|ai = hT†ia

.

Es decir, el complejo conjugado del valor esperado de un operador corresponde al valoresperado del operador conjugado en el mismo estado. En particular, si dicho operadorfuere hermitiano tendrıamos que el correspondiente valor esperado serıa un numero real(un numero cuyo conjugado fuera el mismo). De hecho podemos hacer aun mas. Sabemosque los numeros estan compuestos por dos partes: una real y otra imaginaria. Estaspartes tienen un propiedad que las diferencia en tre sı. La primera es invariante bajo laconjugacion mientras que la segunda cambia solo su signo. El analogo de estas partes en elcontexto de operadores corresponde a los operadores hermitianos y anti-hermitianos quecomparten las correspondiente propiedades enunciadas bajo la conjugacion. De hecho, unoperador cualquiera siempre puede escribirse como la suma de un operador hermitiano yun anti-hermitiano, pues debemos notar que,

T =1

2

�T+T†�+ 1

2

�T�T†� = H+A.

En este caso se puede constatar que efectivamente, el operador H := (T + T†)/2 es unoperador hermitiano, mientras que el operador A := (T � T†)/2 es un operador anti-hermitiano. Esta analogıa la podemos hacer aun mas precisa: notese que si A es un

Page 40: Notas Métodos Físico Matemáticos

42 Transformaciones Lineales

operador anti-hermitiano, entonces �iA resulta ser un operador hermitiano. Si llama-mos H0 := �iA entonces podemos darnos cuenta que un operador T cualquiera puedeescribirse como,

T = H+ iH0

siendo H y H0 ambos hermitianos. La analogıa es ahora precisa en el sentido de quetambien un numero complejo puede escribirse como z = x + iy, siendo x, y numerosreales.

Aun cuando un operador arbitrario puede descomponerse en una parte “real” y una“imaginaria”, de manera completamente paralela a los numeros complejos, la correspon-dencia entre ambos objetos no es del todo analoga. Por ejemplo, sabemos que el productode dos numeros reales debe ser un numero real. Sin embargo, en el caso de operadores,el producto de dos operadores autoconjugados no es necesariamente un operador auto-conjugado. Esto se debe esencialmente a que la multiplicacion entre operadores no esconmutativa. Si H y K son hermitianos, entonces,

(HK)† = K†H† = KH 6= HK.

Hasta aqui hemos analizado las propiedades de los operadores bajo conjugacion.Vamos ahora a establecer uno resultados en torno a su relacion con los valores esperados.

Teorema 2.3.2. Un operador lineal H es un operador hermitiano si y solo si

ha|H|ai es real para cualquier vector |ai.

Demostracion. Si tomamos como hipotesis el hecho de que H es hermitiano, entonces esclaro, por mera definicion de hermiticidad, que

ha|H|ai = ha|H†|ai = ha|H|ai⇤,

lo que implica que ha|H|ai es real. Analicemos el recıproco. Si asumimos que ha|H|ai esreal para cualquier vector |ai, entonces podemos ver que

ha|H|ai = ha|H|ai⇤ = ha|H†|ai

lo cual implica queha|H�H†|ai = 0

para todo vector |ai. Por el Teorema 2.2.2 se sigue inmediatamente que H�H† = 0. Porlo tanto H es hermıtico.

Page 41: Notas Métodos Físico Matemáticos

Operadores Lineales 43

Ejemplo 2.3.2. Veamos ahora un ejemplo ilustrativo de operadores hermitianos.Sabemos que una matriz puede ser considerada como una tranformacion lineal operandosobre vectores columna. Si tomamos como espacio vectorial el espacio C2 con campo enlos complejos, entonces una matriz de 2 ⇥ 2 con entradas complejas corresponde a unatransformacion lineal en C2. Consideremos la matriz H dada por,

H :=

✓0 �i

i 0

◆.

Tomemos un vector arbitrario |ai con componentes arbitrarias,

|ai =✓

↵1

↵2

◆,

y notese que

ha|H|ai = (↵⇤1,↵

⇤2)

✓0 �i

i 0

◆✓↵1

↵2

= (↵⇤1,↵

⇤2)

✓ �i↵2

i↵1

◆= �i↵

⇤1↵2 + i↵

⇤2↵1

= �i↵

⇤1↵2 + (�i↵2↵

⇤1)

⇤ = 2Re(�i↵

⇤1↵2), (2.7)

lo que indica que ha|H|ai es en efecto, un numero real para cualquier vector |ai tal comolo establece el teorema anterior.

Podemos ver aun mas cosas. Por ejemplo, ¿que significa hHa| y como se representamatricialmente? o ¿como actua un operador hermıtico sobre un vector bra que se encuentraa su izquierda?

En el caso de los operadores matriciales la repuesta es directa, pues sigue las reglashabituales de multiplicacion de matrices. Es decir, el resultado de la operacion ha|H esun vector bra, que se escribe como

ha|H = (↵⇤1,↵

⇤2)

✓0 �i

i 0

◆= (i↵⇤

2,�i↵

⇤1)

Mientras que el operador hHa| es el operador que indica que primero hay que hacerla operacion |Hai y luego trasconjugar el vector (i.e., encontrar su correspondiente bra):

H|ai = |Hai =✓

0 �i

i 0

◆✓↵1

↵2

◆=

✓ �i↵2

i↵1

◆.

Entonces el bra hHa| se escribe como

hHa| = (i↵⇤2,�i↵

⇤1)

Page 42: Notas Métodos Físico Matemáticos

44 Transformaciones Lineales

Podemos ver en este ejemplo que un operador hermitiano puede introducirse tanto enel ket como en el bra, sin ninguna operacion adicional. No obstante, en el caso en quetenemos operadores que no son autoconjugados, este no es el caso.

Ejemplo 2.3.3. Para contrastar con el caso de los operadores hermitianos, vamos aanalizar algunas operaciones con operadores que no posean la propiedad de hermiticidad.Consideremos el mismo espacio vectorial que en el ejemplo anterior y consideremos ahorauna matriz T definida como

T =

✓0 i

i 0

Podemos ver que si tomamos un vector arbitrario |ai, entonces

ha|T|ai = (↵⇤1,↵

⇤2)

✓0 i

i 0

◆✓↵1

↵2

◆= (↵⇤

1,↵⇤2)

✓i↵2

i↵1

◆,

lo que implica queha|T|ai = i↵

⇤1↵2 � (i↵⇤

1↵2)⇤ = 2iIm(i↵⇤

1↵2).

esto quiere decir que el valor esperado del operador T es un numero puramente imaginarioy por lo tanto no es hermıtico.

Veamos ahora como lucen los resultados de las operaciones hTa|, ha|T y hT†a|.

Para empezar, de los calculos de arriba ya tenemos que

T|ai = |Tai =✓

i↵2

i↵1

◆,

y por consecuencia es claro que

hTa| = (�i↵

⇤2,�i↵

⇤1).

Por otro lado tenemos que

ha|T = (↵⇤1,↵

⇤2)

✓0 i

i 0

◆= (i↵⇤

2, i↵⇤1),

de donde podemos observar que ha|T 6= hTa|. Sin embargo observemos que ha|T† =(T|ai)† y por lo tanto

ha|T† = (T|ai)† =✓

i↵2

i↵1

◆†

= (�i↵

⇤2,�i↵

⇤1),

Lo que implica que ha|T† = hTa|. Esto es consistente con nuestra regla de que lo operado-res se pueden meter en los vectores bra previamente conjugados. Hay que poner especialatencion en el hecho de que las operaciones matriciales hacia la derecha e izquierda soncompatibles con nuestras reglar de operacion.

Page 43: Notas Métodos Físico Matemáticos

Representacion Matricial de Operadores 45

2.4. Representacion Matricial de Operadores

Hasta ahora hemos visto que los espacios vectoriales tienen propiedades muy si-milares entre sı en incluso entre espacios generados por transformaciones lineales sobreestos. Por ejemplo, si tenemos el espacio vectorial que consiste de los polinomios de gradon� 1 con coeficiente complejos PC

n�1[t], entonces sabemos que este es isomorfo al espaciovectorial Cn. Si consideramos entonces transformaciones lineales en Cn es claro que estaspueden ser representadas como matrices. Como PC

n�1[t] es isomorfo a Cn esperarıamos quesus correspondientes espacios de transformaciones lineales tambien sean similares entresı o incluso, isomorfos. De hecho, esto es cierto, pues siempre podemos establecer un iso-morfismo por la sencilla razon de que todos los espacios PC

n�1,Cn

,L(Cn) y L(PC

n�1) tienenexactamente la misma dimension, lo que es suficiente para establecer un isomorfismo entreellos. Si es ası, entonces debe ser cierto que transformaciones entre polinomios o inclusotransformaciones entre funciones tenga una representacion matricial vıa un isomorfismo.Incluso los vectores mismos tendran una representacion como vectores columna, indepen-dientemente del espacio que se trate. En esta seccion nos dedicaremos a establecer lareglas operativas para este fin.

2.4.1. Matrices

Sea Vn

un espacio vectorial de dimension finita n. Ya sabemos que en un espaciovectorial siempre tiene una base a la que denotaremos por B

V

= {|aj

i}nj=1. Un vector

|xi 2 V puede expresarse de manera unica como combinacion lineal de los vectores de labase B

V

,

|xi =nX

j=1

j

|aj

i.

Si bien esta representacion explicita como combinacion lineal de vectores de base es de mu-cha utilidad, podemos ir mas alla y considerar representaciones alternativas. Una notacionque muchas veces resulta conveniente es representar al vector |xi como una “combinacionlineal simbolica” de la siguiente forma. Como podemos darnos cuenta, dada una base enel espacio vectorial, un vector esta definido por un unico conjunto de escalares, en estecaso denotados como {⇠

j

}nj=1. Escribir la representacion como suma o como conjunto solo

difiere en el orden en el que se encuentran los ecalares; de hecho, una sola permutacionde los escalares dado nos arrojarıa, el caso general, un vector diferente. Entonces pode-mos explıicitamente imponer un orden en el conjunto de escalares. Esta convencion noslleva al concepto de vector columna que es la representacion que buscamos. Si x es la

Page 44: Notas Métodos Físico Matemáticos

46 Transformaciones Lineales

representacion “simbolica” del vector |xi en la base BV

tendremos que x se escribe como,

x :=

0

BBB@

⇠1

⇠2...⇠

n

1

CCCA,

y entonces decimos que el vector columna x representa al vector |xi en la baseB

V

. Notese que los as llamados “vectores columna” se pueden interpretar como un vectoren Cn y que, por lo tanto, estamos haciendo uso de un isomorfismo para realizar laaccion que hemos denominado representacion. Se debe aclarar, sin embargo, que hay quetener cuidado con esta notacion. Si tenemos otra base B

V

= {|aj

i}nj=1 del mismo espacio

vectorial, entonces el mismo vector |xi tendrıa una unica representacion como combinacionlineal de vectores de dicha base,

|xi =nX

j=1

j

|aj

i.

No obstante, debe notarse que es ahora el conjunto de escalares {⇠j

}nj=1 el que define al

vector |xi pero en la base x,

x :=

0

BBB@

⇠1

⇠2...⇠

n

1

CCCA.

Es claro que x y x son representaciones diferentes del mismo vector. Que ambas repre-sentaciones sean distintas se debe esencialmente a la base utilizada y es por eso que enmuchos casos se debe especificar la base utilizada, especialmente cuando se trabaja enmas de una base. Dicho de otra forma, un espacio vectorial abstracto V es isomorfo adiferentes espacios vectoriales de la forma Cn.

No solo los vectores se pueden representar como arreglos ordenados (vectores co-lumna) sino tambien las transformaciones lineales mismas. Supongamos que una trans-formacion lineal T tiene como dominio el espacio vectorial V mientras que su imagen seencuentra en el espacio vectorial W . Supongamos que B

V

= {|aj

i}nj=1 es una base de V y

que BW

= {|bj

i}mj=1 es una base enW . Supongamos ademas que los vectores de la base B

V

se transforman en los vectores |wj

i := T|aj

i para 1 j n. Estos vectores pertenecenal espacio W y por lo tanto pueden descomponerse como combinaciones lineales de losvectores de la base B

W

. Dichas combinaciones lineales se pueden ver como,

|w1i =mX

j=1

j1|bji, |w2i =mX

j=1

j2|bji, . . . , |wn

i =mX

j=1

jn

|bj

i.

Page 45: Notas Métodos Físico Matemáticos

Representacion Matricial de Operadores 47

Los vectores arriba definidos tienen a su vez una representacion como vectores columna,

w1 =

0

BBB@

↵11

↵21...

m1

1

CCCA, w2 =

0

BBB@

↵12

↵22...

m2

1

CCCA, . . . , w

n

=

0

BBB@

↵1n

↵2n...

mn

1

CCCA.

Entonces, como una transformacion lineal esta bien definida si se define la accion sobre losvectores de base, entonces podemos decir que la coleccion de las imagenes de los vectoresde base en su representacion como vectores columna, definen la transformacion en elespacio de los vectores columna. En otras palabras, cuando realizamos la representacionde vectores abstractos en vectores del espacio euclideano Cn, la transformacion en elespacio abstracto tiene una transformacion equivalente (o “isomorfa”) en el espacio Cn,la cual tiene exactamente el mismo efecto sobre los correspondientes vectores. Entoncespodemos pensar que la transformacion equivalente mencionada arriaba no puede ser masque una matriz, que es como se representan las transformaciones lineales en el espacio Cn.Dicha matriz deberıa corresponder a la coleccion de los vectores columna que resultan dela imagen de los vectores de base. Por tanto, la representation de la transformacion linealT deberıa corresponder a la matriz A definida como,

A =

0

BBB@

↵11 ↵12 . . . ↵1n

↵21 ↵22 . . . ↵2n...

. . ....

m1 ↵

m2 . . . ↵

mn

1

CCCA.

Nos referiremos entonces a esta matriz como representacion de la transformacionlineal T en las bases B

V

y B

W

. Veamos ahora como actua la transformacion equivalentesobre los vectores columna. Sea |xi 2 V y sea x su representacion matricial. Como |xi sedesarrolla como combinacion lineal de los vectores de base como

nX

j=1

j

|aj

i,

entonces es claro que la accion de T sobre |xi viene dada por,

T|xi =nX

j=1

j

T|aj

i =nX

j=1

mX

k=1

j

kj

|bk

i =mX

k=1

nX

j=1

j

kj

!|b

k

i.

Sea y la representacion del vector T|xi en la base B

V

, cuyas componentes llamaremos{⌘

j

}nj=1. Entonces podemos ver, de la ecuacion anterior que, el vector columna y puede

Page 46: Notas Métodos Físico Matemáticos

48 Transformaciones Lineales

escribirse como,

y =

0

BBB@

Pn

j=1 ⇠j↵1jPn

j=1 ⇠j↵2j...P

n

j=1 ⇠j↵mj

1

CCCA=

0

BBB@

↵11 ↵12 . . . ↵1n

↵21 ↵22 . . . ↵2n...

. . ....

m1 ↵

m2 . . . ↵

mn

1

CCCA

0

BBB@

⇠1

⇠2...⇠

n

1

CCCA= Ax.

Esto nos dice que, esencialmente, la transformacion lineal T, representada por la matrizA, actua sobre el vector |xi exactamente como actua la matriz A multiplicando al vectorcolumna x, que representa al vector abstracto |xi. En notacion puramente matricial, latransformacion lineal a la que hemos hecho referencia puede escribirse como,

0

BBB@

⌘1

⌘2...⌘

m

1

CCCA=

0

BBB@

↵11 ↵12 . . . ↵1n

↵21 ↵22 . . . ↵2n...

. . ....

m1 ↵

m2 . . . ↵

mn

1

CCCA

0

BBB@

⇠1

⇠2...⇠

n

1

CCCA

o bien, usando una representacion compacta podemos escribir y = Ax.

La construccion que hemos hecho de una matriz a partir de una transformacionlineal nos indica que, una vez escogida una base, a cada operador lineal en L(V ,W) lecorresponde una unica matriz. Esta unicidad proviene de la unicidad de la representacionde cada vector como combinacion lineal de los vectores de base.

Ejemplo 2.4.1. Considerese la transformacion lineal T : R2R3 definida como,

T(x1, x2) := (x1 + x2, x1 � x2, 2x1 + 3x2).

Es claro que una transformacion lineal entre estos espacios vectoriales se suele denotar co-mo una matrz. Dicha matriz se puede identificar facilmente, si escribimos la transformaionT como un sistema de ecuaciones,

z1 = x1 + x2,

z2 = x1 � x2,

z3 = 2x1 + 3x2,

siendo z1, z2 y z3 las componentes de T. Entonces por simple inspeccion nos damos cuentaque el sistema de ecuaciones mostrado arriba se escribe, en forma matricial como,

T(x1, x2) =

0

@z1

z2

z3

1

A =

0

@1 11 �12 3

1

A✓

x1

x2

◆.

Page 47: Notas Métodos Físico Matemáticos

Representacion Matricial de Operadores 49

De esta forma, podemos decir que la transformacion lineal T tiene una respresentacionmatricial A dada por,

A =

0

@1 11 �12 3

1

A,

en las bases canonicas de R2 y R3.

Debemos resaltar el hecho de que el hallar la representacion matricial anterior fueuna tarea un tanto facil debido a que estamos acostumbrados a realizar este tipo derepresentaciones de transformaciones lineales. No obstante tambien debemos hacer enfasisen que en todo momento obviamos (u omitimos) el hecho de que nos encontrabamostrabajando en las bases canonicas de R2 y R3. De hecho, si cambiamos de base en unou otro de los espacios, hallar la correspondiente representacion matricial deja de ser unatarea sencilla.

Ejemplo 2.4.2. Consideremos nuevamente la transformacion lineal T definida enel ejemplo anterior (Ejemplo 2.4.1). Supongamos deseamos obtener la representacion deT que la base de R2 conformada por vectores,

a1 =

✓11

◆, a2 =

✓ �11

◆,

y en la base canonica de R3.

El primer paso consiste en obtener la accion de T sobre cada vector de la base,

T(1, 1) = (2, 0, 5), T(�1, 1) = (0,�2, 1).

Una vez obtenidos estos vectores, los debemos escribir como combinacion lineal de labase del espacio imagen. Como trabajamos en la base canonica de R3 esta es una tarearelativamente directa,

T(1, 1) = 2

0

@100

1

A+0

0

@010

1

A+5

0

@001

1

A, T(�1, 1) = 0

0

@100

1

A�2

0

@010

1

A+1

0

@001

1

A,

en donde hemos resaltado en negritas los coeficientes de la combinaciones lineales. Sirepresentamos los vectores de la base canonica de R3 como B(R3) = {e1, e3, e3} podemosescribir los vectores imagen de una manera mas compacta,

T(1, 1) = 2e1 + 0e2 + 5e3, T(�1, 1) = 0e1 � 2e2 + 1e3

Page 48: Notas Métodos Físico Matemáticos

50 Transformaciones Lineales

Los coeficientes de las combinaciones lineales son lo que en sı mismos son los que definenla representacion matricial A de la transformacion lineal T,

A =

0

@2 00 �25 1

1

A

en las bases B2 = {a1, a2} y B(R2) de R2 y R3 respectivamente. Notese que debido ala diferencia de las bases, las representaciones matriciales A y A de la misma transfor-macion lineal, no coinciden. Si las representaciones matriciales no coinciden, podemospreguntarnos que hay del resultado de aplicar ambas matrices a un vector determinado.Consideremos un vector v 2 R2 definido como,

v =

✓x

y

◆.

Si aplicamos la matriz A al vector v obtenemos

Av =

0

@1 11 �12 3

1

A✓

x

y

◆=

0

@x+ y

x� y

2x+ 3y

1

A, (2.8)

mientras que si aplicamos la matriz A al vector v obtendremos,

Av =

0

@2 00 �25 1

1

A✓

x

y

◆=

0

@x

�2y5x+ y

1

A, (2.9)

Las expresiones anteriores deben interpretarse de distintas formas. En la ecuacion (2.8)

tenemos que el vector

✓x

y

◆es la representacion de un vector en la base canonica B(R2),

mientras que en la ecuacion (2.9) el mismo arreglo indica un vector diferente, en la baseB2,

✓x

y

B(R2)

= xe1 + ye2 = x

✓10

◆+ y

✓01

✓x

y

B2

= xa1 + ya2 = x

✓11

◆+ y

✓ �11

vectores que, por supuesto, arrojan resultados diferentes cuando se introducen en la misma

transformacion lineal en sus distintas representaciones A y A.

Page 49: Notas Métodos Físico Matemáticos

Representacion Matricial de Operadores 51

2.4.2. Cambio de Base

En muchas ocasiones describir un problema fısico en una base particular puede serventajoso debido a que este puede tomar una forma mas simple. Sin embargo, la solucionen la base original puede ser de importancia, por lo que la descripcion de un problemaconcreto se debe conocer en mas de una base a la vez. No solo la descripcion misma esimportante sino la manera de ir de una base a otra es, en muchas ocasiones, requerida.

Dada una base B := {|aj

i}nj=1 podemos escribir un vector dado |ai de manera unica

como combinacion lineal de los elementos de la base,

|ai =nX

j=1

j

|aj

i,

siendo {↵1,↵2, . . . ,↵n

} las componentes de |ai en la base mencionada. Ahora supongamosque cambiamos a la base B0 := {|a0

j

i}nj=1. ¿Como son en esta nueva base las componentes

del vector |ai? Para responder esta pregunta necesitamos primero establecer la corres-pondencia entre las bases. Esto es, necesitamos escribir cada vector de la base original|a

j

i como combinacion lineal de vectores de la base nueva. Esta correspondencia es, porsupuesto, unica en virtud de la definicion misma de base. Supongamos que cada vector|a

j

i puede escribirse como,

|aj

i =nX

k=1

kj

|a0k

i,

y sustituyamos esta expresion en la combinacion lineal del vector |ai en la baseB. Podemosver entonces que,

|ai =nX

j=1

j

nX

k=1

kj

|a0k

i =nX

k=1

nX

j=1

j

kj

!|a0

k

i.

Si denotamos por ↵j

la j-esima componente del vector |ai en la base B0, entonces podemosdarnos cuenta que la relacion entre las componentes de la base original y la base nuevaesta dada por,

0j

=nX

j=1

kj

j

, para cada 1 j n.

En terminos de la representacion matricial tenemos que0

BBB@

01

02...↵

0n

1

CCCA=

0

BBB@

⇢11 ⇢12 . . . ⇢1n

⇢21 ⇢22 . . . ⇢2n...

. . ....

n1 ⇢

n2 . . . ⇢

nn

1

CCCA

0

BBB@

↵1

↵2...↵

n

1

CCCAo equivalentemente a0 = Ra

Page 50: Notas Métodos Físico Matemáticos

52 Transformaciones Lineales

La matriz R se le llama matriz de transformacion de bases. La matriz A toma vectoresexpresados en la base original y los transforma en vectores expresados en la base nueva.

Nos podemos preguntar ahora que sucede con los operadores lineales de un espaciovectorial T cuando realizamos un cambio de base. Supongamos que un vector |ai se trans-forma en un vector |bi bajo T. Si a es la representacion de |ai, b es la representacion de |biy A es la representacion de T, entonces tenemos que b = Aa. Si R es la transformacionde cambio de base, es claro que en la base B

0 tenemos que los vectores |ai y |bi tienensendas representaciones denotadas por a0 = Ra y b0 = Rb respectivamente. Entonces esclaro que

b0 = Rb = RAa = RAR�1Ra = RAR�1a0.

Esto es, un vector |ai se transforma bajo T en |bi, cuyas representaciones matricialesen la base B

0 se pueden escribir en terminos de las representaciones matriciales de labase B. Las transformaciones para a0 y b0 ya las conocemos. La representacion de unatransformcaion lineal A se transforma sin embargo como,

A0 = RAR�1.

Esta transformacion se conoce como transformacion de similaridad de A en A0 yademas A0 se dice similar a A.

Un caso especial de transformcion entre bases de un espacio vectorial con productointerno es el caso en que las bases son ortonormales. Cuando este es el caso tenemos que latransformacion que media entre las bases se puede obtener de manera directa ası como sucorrespondiente transformacion inversa. La simplicidad de esta transformacion reside enla propiedad de ortogonalidad de los vectores de base. Supongase que un espacio vectorialV con producto interno tiene una base ortonormal dada por B := {|e

j

i}nj=1. Un vector |ai

en V se escribe como una combinacion lineal de los elementos de la base,

|ai =nX

j=1

j

|ej

i.

Si deseamos pasar el vector |ai a otra base ortonormal B0 := {|e0j

i}nj=1 necesitamos expre-

sar cada vector |ej

i como combinacion lineal de elementos de la base B

0. Esto se escribecomo,

|ej

i =nX

k=1

kj

|e0k

i,

Hasta aquı la historia es completamente identica para cualquier par de base indepen-dientemente de si son ortonormales o no. Sin embargo, cuando las bases son ortonormales

Page 51: Notas Métodos Físico Matemáticos

Representacion Matricial de Operadores 53

podemos expresar explıcitamente los elementos de la transformacion entre las bases. Note-se que, gracias a la ortonormalidad, tenemos que,

he0i

|ej

i =nX

k=1

kj

he0i

|e0k

i = ⇢

ij

,

es decir, los elementos matriciales de la transformacion R se pueden calcular simplemente

como el producto interno entre los elementos de las bases de B

0y B,

(R)ij

= ⇢

ij

= he0i

|ej

i.

Notese ademas que los papeles de las bases B y B

0 se pueden invertir, pues nohay un distintivo especial entre la base original y la base nueva. Esto quiere decir que latrasformacion inversa R

0 debe tener componentes dadas por,

�R�1

�ij

= ⇢

0ij

= hei

|e0j

i.

Debe observarse sin embargo que

�R�1

�ij

= hei

|e0j

i = he0j

|ei

i⇤ = �R†�ij

.

La operacion † en este caso indica trasposicion y conjugacion simultaneamente. Estapropiedad es particular de las transformaciones entre bases ortonormales. Una matriz Rque satisface que R�1 = R

† se le llama unitaria. De hecho tenemos que

Teorema 2.4.1. Una matriz que transforma una base ortonormal en otra base

ortonormal es necesariamente unitaria.