52
1 Una estrategia de arbitraje estadístico. Tesis Premio Nacional BMV Presenta: El Quant Mexico D.F. 2012.

Una Estrategia de Arbitraje Estadistico

Embed Size (px)

DESCRIPTION

sdf

Citation preview

Page 1: Una Estrategia de Arbitraje Estadistico

1

Una estrategia de arbitraje estadístico.

Tesis

Premio Nacional BMV

Presenta:

El Quant

Mexico D.F. 2012.

Page 2: Una Estrategia de Arbitraje Estadistico

2

Índice

1. Introducción………………………………………………………………………………..

2. El modelo……………………………………………………………………………………

2.1. Introducción al modelo. ………………………………………………………………………

2.2. Un análisis cuantitativo de los factores de riesgo y neutralidad al mercado……

2.3. Un poco de teoría de componentes principales…………………………………..

2.4. Uso de componentes principales como factores de riesgo……………………….

2.5. Introducción a la teoría del cálculo estocástico. ……………………………………………

2.6. El modelo para el residual. …………………………………………………………………

3. La estrategia……………………………………………………………………………….

3.1. Reversión a la media pura. ………………………………………………………………

3.2. Reversión a la media con la desviación 훼 . ………………………………………………

4. Los parámetros. …………………………………………………………………………..

5. El portafolio. ……………………………………………………………………………….

6. Los datos. ………………………………………………………………………………….

6.1. Un análisis exploratorio a los datos. …………………………………………………………

6.2. El primer eigenportafolio. ………………………………………………………………………

7. Los resultados………………………………………………………………………………

7.1. Sin considerar la desviación 훼 . ……………………………………………………………

7.2. Considerando la desviación 훼 . ……………………………………………………………

7.3. Los parámetros en el tiempo. …………………………………………………………………

8. Algunos comentarios sobre la implementación. ………………………………………………

9. Conclusiones. ……………………………………………………………………………..

10. Los algoritmos. ……………………………………………………………………………

10.1 Los principales. ………………………………………………………………………

10.2 Los auxiliares. ……………………………………………………………………….

Referencias. ……………………………………………………………………………………

4

6

6

7

9

10

12

15

18

18

19

20

23

25

26

30

31

31

34

37

39

40

41

41

47

53

Page 3: Una Estrategia de Arbitraje Estadistico

3

1 Introducción.

La finalidad del arbitraje es aprovechar errores de los mercados para generar ganancias. En el

arbitraje puro no existe riesgo. Un ejemplo típico es si existieran dos bancos donde la tasa de

interés de préstamo de uno sea menor a la tasa de interés de rendimientos que da el otro.

Como uno podría aprovechar esto es pidiendo un préstamo en el primer banco y depositándolo

en el otro. Al final del periodo paga el préstamo y aún tendrá un excedente de dinero generado

por los intereses del otro banco. Es obvio que en la realidad este tipo de casos no suceden.

El arbitraje estadístico ocurre cuando se pretende aprovechar lo que se creen errores de

valuación en los mercados y se espera que se generen ganancias. Es claro que en el arbitraje

estadístico existe el riesgo ya que está basado en especulaciones. En este trabajo se explorará

una estrategia de arbitraje estadístico desarrollada por Avellaneda, M. y Lee, J-H. (2010), se

simulará su desempeño en el mercado de capitales de México y se analizarán los resultados.

La aportación de este tipo de estrategias a los mercados es que por su naturaleza agilizan la

correcta valuación de las acciones, ya que aprovechan los errores de valuación, e incentivan a

que el mercado sea más completo (más acciones y más instrumentos) y más líquido.

Este trabajo está estructurado de la siguiente forma. Consta de 10 capítulos:

El primer capítulo es esta introducción.

En el segundo capítulo se desarrolla el modelo que se usará para modelar los

mercados. Primeramente se muestra el modelo en el cual una acción es explicada por

factores de riesgo. Luego se da una propiedad de independencia con el mercado de los

factores de riesgo. En la tercera parte se introduce teoría de componentes principales

ya que éstas se usarán como factores de riesgo. En la cuarta parte se explica cómo se

usan las componentes principales como factores de riesgo. En la quinta parte se

muestra un resultado de cálculo estocástico que se usará en del desarrollo del modelo

del residual en la sexta parte.

En el tercer capítulo se explica cómo se aplicará la estrategia basada en este modelo.

Consta de dos partes, uno en el que considera una componente idiosincrática de cada

Page 4: Una Estrategia de Arbitraje Estadistico

4

acción y otro en el que no.

El cuarto capítulo explica cómo se estiman los parámetros necesarios para aplicar el

modelo.

El quinto capítulo explica como se manejará el portafolio de inversión en el que se usa

esta estrategia de arbitraje estadístico.

En el sexto capítulo se muestran los datos que se usarán para experimentar la

estrategia y también se incluyen un análisis exploratorio de los datos y un análisis al

primer eigenportafolio.

El séptimo capítulo se muestran los resultados de aplicar la estrategia. Consta de dos

partes, los resultados cuando se considera la componente idiosincrática de las acciones

y los resultados cuando no se considera.

En el octavo capítulo se dan algunas observaciones de la implementación real de este

portafolio de inversión.

El noveno capítulo incluye las conclusiones.

En el décimo capítulo se muestran los algoritmos que se usaron para simular la

estrategia con los datos.

En este trabajo se reúnen conocimientos de programación, economía, estadística y

matemáticas para crear una estrategia de inversión en la BMV que dé rendimientos atractivos y

bajo riesgo. Los conceptos que se usan de estadística y matemáticas no son de fácil

comprensión y se requiere conocimientos avanzados en ambas áreas. Por este punto este tipo

de estrategias no están muy exploradas en México ya que el capital humano que se requiere es

muy especializado. Como las estrategias de arbitraje estadístico agilizan la correcta valuación

de los instrumentos financieros es importante fomentar su uso en México.

Page 5: Una Estrategia de Arbitraje Estadistico

5

2 El modelo.

2.1 Introducción al modelo.

“Pairs trading” se considera el predecesor de las estrategias de arbitraje estadístico. La idea

básica es que si 푃 y 푄 son los precios de dos acciones de emisoras pertenecientes a la misma

industria, o que tienen características similares (un buen ejemplo serían acciones de la misma

empresa que emiten en diferentes países), uno espera que los rendimientos de las dos

acciones se comporten de manera similar. Esta situación se podría modelar a partir de la

siguiente ecuación que relaciona los precios a los tiempos 푡 y 푡 ; 푃 ,푃 ,푄 y 푄 :

ln푃푃 = 훼(푡 − 푡 ) + 훽 ln

푄푄 + 푋 ,

o en su forma diferencial respecto a t

푑푃푃 = 훼푑푡 + 훽

푑푄푄 + 푑푋

donde 푋 es un proceso de reversión a la media al que se le llamará el residual. En muchos

casos de interés 훼 es muy pequeño comparado con los cambios en el residual 푋 por lo que

puede ser ignorado. Esto significa que un portafolio corto-largo sobre estas acciones tenderá a

un equilibrio estadístico. La estrategia que se sigue de esta ecuación es ir un peso largo en la

acción 푃 y 훽 pesos corto en la acción 푄 si 푋 es negativo, y viceversa, ir un peso corto en la

acción 푃 y 훽 pesos largo en la acción 푄 si 푋 es positivo.

Existe la posibilidad que se espere que una acción dé mejores rendimientos que la otra durante

un periodo de tiempo largo. En esta estrategia no se considerarán esos escenarios.

“Pairs trading” generalizado es analizar las acciones por grupos en vez de por parejas. La idea

es esperar que una acción se comportará de manera similar a un grupo de acciones con

(1)

(2)

Page 6: Una Estrategia de Arbitraje Estadistico

6

características similares.

La estrategia consistirá en un portafolio corto-largo en acciones dependiendo del tamaño y el

signo del residual respecto a las acciones que la están explicando. Es decir, si para una acción

푃 con comportamiento similar a un grupo de acciones 푁, ocurre que el residual es positivo

entonces se tiene que ir corto, e irse largo en caso que el residual sea negativo.

Por lo tanto, el análisis de residuales será de gran importancia en la estrategia. Las señales de

entrada y salida de posiciones de las acciones serán dadas por los residuales del valor de

equilibrio de la acción dado por el grupo de acciones que la explican. La descomposición de la

acción se ve de la siguiente forma:

푑푃푡푃푡

= 훼푑푡 + 훽푗퐹푡(푗)

푗=1

+ 푑푋푡,

donde los términos 퐹( ), = 1 …푛 representan factores de riesgo asociados con el mercado en

consideración. La pregunta que surge de esta ecuación es la siguiente: ¿Qué constituye un

buen conjunto de factores de riesgo? En esta tesis se explora el uso de componentes

principales para construir el conjunto de factores de riesgo.

En la siguiente sección se presenta una definición de portafolio neutral al mercado

2.2 Un análisis cuantitativo de los factores de riesgo y neutralidad al

mercado.

Sean {푅 } los rendimientos de las acciones en periodos de un día (de cierre a cierre). Sea 퐹

el rendimiento de un portafolio de mercado (por ejemplo el IPC). Entonces para cada acción se

puede escribir:

푅 = 훽 퐹 + 푅∗.

(3)

(4)

Page 7: Una Estrategia de Arbitraje Estadistico

7

Esta ecuación define un modelo de regresión lineal simple sobre los rendimientos de la acción

que contiene un componente sin correlación con el mercado llamado 푅∗ al que le designamos

como rendimiento idiosincrático. De la misma forma podemos considerar una generalización de

este modelo usando varios factores de riesgo(푚), resultando el modelo de regresión lineal

múltiple definido por la siguiente ecuación:

푅 = 훽 퐹 + 푅∗.

Un portafolio se dice ser neutral al mercado si la cantidad de pesos {푄 } que se invierten en

cada acción cumplen la siguiente propiedad:

훽 = 훽 푄 = 0푗 = 1,2, … ,푚.

.

Los coeficientes 훽 corresponden a las betas de los portafolios, o a las proyecciones de los

rendimientos de los portafolios en los diferentes factores. De estas dos últimas ecuaciones se

sigue lo siguiente:

푄 푅 = 푄 훽 퐹 + 푄 푅∗

= 훽 푄 퐹 + 푄푖푅푖∗

푖=1

= 푄푖푅푖∗

푖=1

(5)

(6)

(7)

Page 8: Una Estrategia de Arbitraje Estadistico

8

Por lo tanto un portafolio neutral al mercado sólo es afectado por los rendimientos

idiosincráticos.

2.3 Un poco de teoría de componentes principales.

Como se usarán componentes principales como factores de riesgo, en este capítulo se explica

un poco de teoría de componentes principales.

Sea 푋 la matriz de datos centrados con n variables se desea encontrar un conjunto más

pequeño de vectores ortogonales {푤 } ,푘 ≤ 푛 que resuma en mayor porcentaje los datos

(es decir, explique la mayor varianza posible en los datos). Es decir, para el primer vector se

quiere que:

푤 = 푎푟푔 max

‖ ‖푉푎푟[푤 푋]

y

휆 = max‖ ‖

푉푎푟[푤 푋].

Ya teniendo 푤 , para encontrar los siguientes vectores se extrae la varianza explicada de la

matriz 푋, en general para encontrar el vector k-ésimo se extraen los k-1 vectores anteriores

definiendo

푋 = 푋 − 푤 푤 푋.

Entonces para encontrar el vector 푤

푤 = 푎푟푔max‖ ‖

푉푎푟 푤 푋

y

휆 = max‖ ‖

푉푎푟 푤 푋 .

(8)

(9)

(10)

(11)

(12)

Page 9: Una Estrategia de Arbitraje Estadistico

9

Si se desea explicar un porcentaje de varianza fijo p entonces se busca un conjunto {푤 } tal

que ∑ 휆 ≥ 푝pero ∑ 휆 < 푝.

2.4 Uso de componentes principales como factores de riesgo.

Para obtener las componentes principales como factores de riesgo inicialmente se usa la matriz

de precios diarios S de las N acciones a lo largo de M días. Por simplicidad del modelo se

ignorará la existencia de ciclos, es decir, se ignora la posibilidad de un comportamiento

intrínseco distinto de una temporada del año (como podría ser Diciembre) al resto del año. Se

obtiene la matriz de rendimientos de la siguiente forma:

푅 , = 푙푛푆 ,

푆 ,,

donde 푆 , es el precio de la acción 푖 al tiempo 푡 y 푅 , es el rendimiento de la acción 푖 al

tiempo 푡. Como hay acciones más volátiles que otras se estandariza la matriz de rendimientos.

푌 , = 푅 , − 푅

donde

푅 = 1푀 푅 ,

y

휎 = 1

푀− 1 푅 , − 푅 .

Entonces los elementos de la matriz de correlación se definen como

(13)

(14)

(15)

(16)

Page 10: Una Estrategia de Arbitraje Estadistico

10

휌 , = 1

푀 − 1 푌 , 푌 , ,

donde 휌 , están en la posición(푖, 푗) de la matriz.

Se hace el análisis de componentes principales sobre la matriz de correlación y ordenamos los

eigenvectores por el orden de sus eigenvalores de manera decreciente:

푁 ≥ 휆 ≥ 휆 ≥ ⋯ ≥ 휆 ≥ 0,

y denotamos sus correspondientes eigenvectores por

푣( ) = 푣( ),푣( ), … , 푣( ) 푗 = 1, … ,푁.

La cantidad de varianza explicada por cada eigenvalor irá decreciendo, por lo que sólo hay

interés en considerar los eigenvalores que sean significativos. Interesa usar los primeros m

eigenvalores (con sus respectivos eigenvectores) hasta el punto que el resto se puedan

considerar como solamente “ruido”. Se pueden hacer dos enfoques en este tema, usar un

número fijo de eigenvalores, o, usar la cantidad necesaria de eigenvalores para explicar al

menos un porcentaje fijo de varianza.

Sean 휆 , 휆 , … , 휆 푚 < 푁 los eigenvalores significativos en el sentido previamente explicado.

A cada uno de estos eigenvalores le corresponde un “eigenportafolio” en el cual la cantidad de

pesos invertida en cada acción se le asigna de la siguiente manera:

푄( ) = 푣( )

휎 푗 = 1, … ,푁,

por lo que los rendimientos de los eigenportafolios se obtienen como:

퐹 , = 푣( )

휎 푅 , 푗 = 1, … ,푚.

(17)

(18)

(19)

(21)

(20)

Page 11: Una Estrategia de Arbitraje Estadistico

11

Es fácil ver que los eigenportafolios no están correlacionados entre sí, ya que los

eigenvectores, resultantes del análisis de componentes principales, son ortogonales.

El primer eigenvector está asociado al portafolio del mercado (IPC) en el sentido que los

coeficientes 푣( ), 푖 = 1, … ,푁 conservan el mismo signo que los rendimientos promedio del IPC

en el periodo y, a largo plazo, son positivos. Como la cantidad de pesos invertida en cada

acción es de 푄( ) = ( )

se observa que es inversamente proporcional a la volatilidad de las

acciones. Esto implica que empresas más grandes tienen mayor peso ya que por lo general las

grandes empresas tienen menor volatilidad en sus acciones. Por lo tanto, este primer

eigenportafolio se comporta similar a un portafolio de mercado (IPC).

2.5 Introducción a la teoría de cálculo estocástico.

En esta sección se resume el capítulo 3.2 de Financial Calculus. An introduction to Derivative

Pricing con el fin de mostrar un resultado que será de ulitidad para la sección siguiente.

Un proceso 푊 = (푊 |푡 ≥ 0) es un movimiento Browniano si y sólo si:

푊 es continuo y 푊 = 0. 푊 ~푁(0, 푡). El incremento 푊 −푊 ~푁(0, 푡) y si [푡 , 푡 ] ∩ [푡 , 푡 ] = ∅ entonces 푊 −푊 y

푊 −푊 son variables aleatorias independientes.

Un proceso de difusión que es de interés en esta tesis es un proceso 푋 = (푋 |푡 ≥ 0) tal que

푋 puede ser escrito de la siguiente forma:

푋 = 푋 + 휇 푑푠 + 휎 푑푊 ,

(22)

Page 12: Una Estrategia de Arbitraje Estadistico

12

donde 휇 y 휎 son funciones continuas tales que

(휎 + |휇 |)푑푠 < ∞.

La forma diferencial de este proceso de difusión es

푑푋 = 휇 푑푡 + 휎 푑푊 .

Si se deseara evaluar la integral ∫ (푑푊 ) no es suficiente la integral de Riemman-Stieltjes ya

que si se asume que

(푑푊 ) = 2 푊푑푊 ⟹ 푊 = 2 푊푑푊 .

Ahora la pregunta es cómo integrar ∫ 푊 푑푊 . Considerando la partición 푖푡 푛 para alguna

n entonces podríamos aproximar la integral por la siguiente suma:

푊푑푊 = 푊푖푡푛 푊

(푖 + 1)푡푛 −푊

푖푡푛 .

Nótese que las diferencias dentro del paréntesis son incrementos de un movimiento Browniano,

que por definición tienen media 0 y también se sabe que hay independencia en los incrementos

con el valor en ese punto. Esto implica que todo el término dentro de la sumatoria es de media

0. Aquí hay una contradicción ya que se sabe que la media de 푊 es 휎 porque esa es la

varianza del movimiento Browniano. Por lo tanto,

(23)

(24)

(25)

(26)

Page 13: Una Estrategia de Arbitraje Estadistico

13

(푑푊 ) ≠ 2 푊푑푊 .

Es claro ahora que para evaluar la integral ∫ (푑푊 ) se deben usar otros medios. Ahora se

intenta aproximar mediante la siguiente suma:

(푑푊 ) ≈ 푊푖푡푛 −푊

(푖 − 1)푡푛 .

Usando la misma partición 푖푡 푛 .

Sea

푍 , = 푊 푖푡

푛 −푊 (푖 − 1)푡푛

푡 푛⁄.

Nótese que 푍 , es una muestra de variables aleatorias independientes idénticamente

distribuidas donde 푍 , ~푁(0,1) por lo que la aproximación ahora es

(푑푊 ) ≈ 푡푍 ,

푛 .

Por la ley de los grandes números ∑ , ⟶ 1 . Por lo tanto,

(푑푊 ) = 푡

o en su forma diferencial:

(푑푊 ) = 푑푡.

Este último resultado servirá para hacer un cálculo en el siguiente capítulo ya que se

presentará la necesitad de integrar una función como ésta.

(27)

(28)

(29)

(30)

(31)

(32)

Page 14: Una Estrategia de Arbitraje Estadistico

14

2.6 El modelo para el residual.

Se usará un modelo de tiempo continuo para los precios de las acciones 푆 (푡), … ,푆 (푡) donde

푡 es el tiempo medido en años desde un punto arbitrario de la base de datos. Basado en el

modelo de varios factores de riesgo, se asume que los rendimientos de las acciones cumplen

con las ecuaciones diferenciales estocásticas siguientes:

푑푆 (푡)푆 (푡) = 훼 푑푡 + 훽 , 퐹 (푡) + 푑푋 (푡)

Una forma de estimar los parámetros de esta ecuación es usando el método de mínimos

cuadrados en una discretización de (33). Los estimadores de las 훽′푠 son:

훽 , = 퐶표푣(푅 ,퐹 )푉푎푟(퐹 ) ,

por lo que la componente idiosincrática de los rendimientos está dada por:

훼 푑푡 + 푑푋 (푡).

Aquí 훼 representa la desviación de la componente idiosincrática, i.e., 훼 푑푡 es la diferencia de

los rendimientos en relación a los factores de riesgo en el periodo de observación. El término

푑푋 (푡) se asume que es un proceso estacionario. Usando pruebas estadísticas se puede

probar la hipótesis de que las acciones de interés satisfacen este supuesto.

La idea fundamental de este trabajo es aprovechar este comportamiento para construir una

estrategia de inversión y un portafolio que produzca rendimientos atractivos.

Ahora, es necesario considerar un modelo para el residual 푑푋 (푡), el cual en este trabajo se

considera como un proceso de difusión Ornstein – Uhlembeck definido por la siguiente

ecuación:

푑푋 (푡) = 휅 푚 − 푋 (푡) 푑푡 + 휎 푑푊 (푡),휅 > 0.

(35)

(34)

(33)

(36)

Page 15: Una Estrategia de Arbitraje Estadistico

15

Este proceso es estacionario y autorregresivo. En particular, este proceso cumple con lo

siguiente:

퐸[푑푋 (푡)] = 0

퐸[푑푋 (푡)|푋 (푠), 푠 ≤ 푡] = 휅 푚 − 푋 (푡) 푑푡

La esperanza condicional que se utiliza como el pronóstico de los rendimientos diarios es

proporcional al término 푚 −푋 (푡), que además determina su signo ya que 휅 > 0.

Los parámetros de la ecuación diferencial estocástica 훼 , 휅 , 푚 y 휎 son específicos para

cada acción. Se supone que varían lentamente en el tiempo de interés y que los parámetros

son constantes en una ventana de 60 días, por lo que los parámetros se estiman utilizando

periodos de esa longitud.

Si se asume que los parámetros del modelo son constantes, entonces se puede obtener la

ecuación integral del proceso del residual como:

푑푋 (푡) = 휅 푚 − 푋 (푡) 푑푡 + 휎 푑푊 (푡).

⇒ 푑푋 (푡) + 휅 푋 (푡)푑푡 = 휅 푚 푑푡 + 휎 푑푊 (푡).

⇒ (푑푋 (푡) + 휅 푋 (푡)푑푡)푒 = 휅 푚 푑푡 + 휎 푑푊 (푡) 푒

⇒ 푑(푋 (푡)푒 )∆

= 휅 푚 푒 푑푡∆

+ 푒 휎 푑푊 (푡)∆

⇒ 푋 (푡 + ∆푡) = 푒 ∆ 푋 (푡 ) + (1− 푒 ∆ )푚 + 푒 ( ∆ )푑푊 (푠)

Ahora dejando ∆푡 tender a infinito se observa que

lim∆ →

퐸[푋 (푡 + ∆푡)]

= 푒 ∆ lim∆ →

퐸[푋 (푡 )] +푚 − lim∆ →

푚 푒 ∆ + lim∆ →

퐸 푒 ( ∆ )푑푊 (푠)

= 푚

(38)

(37)

(39)

Page 16: Una Estrategia de Arbitraje Estadistico

16

y

푉푎푟[푋 (푡) + ∆푡] = 휎 푉푎푟 푒 ( ∆ )푑푊 (푠)∆

= 휎 푒 ( ∆ ) 푒 푑푠∆

= 휎 푒 ( ∆ ) 12휅 푒

=휎2휅

(1−푒 ∆ ) ∆ → ⎯⎯⎯⎯

휎2휅

Por lo tanto, 푋 (푡) tiene una distribución de probabilidad a largo plazo Normal con

퐸[푋 (푡)] = 푚

푉푎푟[푋 (푡)] =휎2휅

Al parámetro 휅 se le llama la velocidad de reversión a la media. Si 휅 ≫ 1 significa que la

acción tiene una reversión a la media rápida lo que hace que el efecto de desvío 훼 sea

despreciable. En nuestra estrategia, para ser consistentes con el método de estimación, nos

interesarán las acciones tales que:

1휅 = 휏 ≪ 푇 .

Ya que sólo se desea considerar acciones cuyo tiempo esperado de reversión a la media sea

menor al tiempo de estimación.

(40)

(41)

(42)

Page 17: Una Estrategia de Arbitraje Estadistico

17

3 La estrategia.

Se considera un periodo de estimación de 60 días, i.e. 푇 = 60 260⁄ . Esta ventana de

estimación se incorpora al ciclo de ganancias de una empresa (es decir, es menor a un

trimestre), por lo que se espera que se refleje el modelo en ventanas de ese periodo. Por eso

se elige acciones de reversión rápida a la media (휏 ≪ 푇 ).

3.1 Reversión a la media pura.

En esta sección se enfoca únicamente en el proceso 푋 (푡) ignorando el desvío 훼 . Sabemos

que la desviación estándar de equilibro es

휎 , =휎2휅 = 휎

휏2 .

Con esto se define la variable s-score como:

푠 = 푋 (푡) −푚

휎 ,.

Esta es una variable de posición, nos indica hacia dónde y en qué proporción está alejada la

acción de su punto de equilibrio teórico. Por esto mismo, ésta es la variable señal.

Las reglas básicas de la estrategia son las siguientes:

Abrir largo si 푠 < −푠̅

Abrir corto si 푠 > +푠̅

Cerrar largo si 푠 < +푠̅

Cerrar corto si 푠푖 > −푠푐푐

(43)

(44)

Page 18: Una Estrategia de Arbitraje Estadistico

18

donde abrir largo significa comprar un peso de la acción i y vender (o irse corto) en los factores

de riesgo con 훽 , pesos en cada factor de riesgo 퐹 .

3.2 Reversión a la media con desviación 훼 .

En la estrategia anterior se ignora la desviación, es decir, se asume que la desviación es

despreciable en comparación a la reversión a la media. Ahora incorporando la desviación 훼 al

valor esperado condicional se obtiene que:

퐸[훼 푑푡 + 푑푋 (푡)|푋 (푠), 푠 ≤ 푡] = 훼 푑푡 + 휅 푚 − 푋 (푡) 푑푡

= 휅훼휅 + 푚 − 푋 (푡) 푑푡

= 휅훼휅 −휎 , 푠 푑푡

Esto sugiere que la nueva variable señal a la cual se denominará como s-score modificada sea:

푠 , = 푠 −훼

휅 휎 ,= 푠 −

훼 휏휎 ,

.

Las reglas de la estrategia son las mismas, es decir:

Abrir largo si 푠 , < −푠̅

Abrir corto si 푠 , > +푠̅

Cerrar largo si 푠 , < +푠̅

Cerrar corto si 푠푚표푑,푖 > −푠푐푐

Se observa que si la desviación es positiva implica que la s-score modificada es menor al

s-score. Es decir, si la desviación es positiva se espera que la acción este desviada

positivamente en esa proporción del punto de equilibrio inicial. Y de forma análoga cuando la

desviación es negativa. También se puede ver que si la s-score es cero entonces la estrategia

se reduce a observar las desviaciones de cada acción, es decir, se reduce a una estrategia de

“momentum”.

(45)

(46)

Page 19: Una Estrategia de Arbitraje Estadistico

19

4 Los parámetros.

Ya se mencionó que

훽 , = 퐶표푣(푅 ,퐹 )푉푎푟(퐹 ) ,

por lo que las 훽′푠 se calculan con la covarianza y la varianza muestrales. Para calcular las

desviaciones se utiliza el estimador de la constante de un modelo de regresión lineal múltiple

por mínimos cuadrados ordinarios:

훼 = 260푑푆 (푡)푆 (푡) − 훽 ,

푑퐹(푡)퐹(푡) .

La forma de estimar estos parámetros es bastante intuitiva. El problema es calcular los

parámetros del proceso de difusión de Ornstein – Uhlembeck 휅 , 푚 y 휎 ya que éste es un

modelo en tiempo continuo y solamente tenemos observaciones en tiempo discreto.

Para poder estimar los parámetros 휅 , 푚 y 휎 se discretiza el proceso, donde

푋 (푡 + ∆푡) = 푒 ∆ 푋 (푡 ) + (1 − 푒 ∆ )푚 + 푒 ( ∆ )푑푊 (푠)

cambia a

푋 = 푎 + 푏푋 + 휉 푛 = 1, … ,60,

donde 휉 se distribuye 푁표푟푚푎푙(0,푉푎푟[휉]).

Es decir, para estimar estos parámetros se usarán únicamente los últimos 60 días de

observaciones. Entonces tenemos que

(47)

(48)

(49)

(50)

Page 20: Una Estrategia de Arbitraje Estadistico

20

푎 = (1 − 푒 ∆ )푚 ,

푏 = 푒 ∆

y

푉푎푟[휉] = 휎2휅

(1−푒 ∆ ).

Para estimar 푎, 푏 y 푉푎푟[휉] se usa la función de máxima verosimilitud, que es equivalente en

este caso a estimar por regresión lineal con mínimos cuadrados ordinarios sobre las

observaciones. Se eliminan las acciones que tengan una 푏 que contenga al 1 en su intervalo

de confianza para asegurar que la acción se modele como se desea. Entonces despejando de

las ecuaciones (51), (52) y (53) se obtiene:

휅 = −260 ∙ log(푏),

푚 = 푎

1 − 푏 ,

휎 = 푉푎푟[휉] ∙ 2휅

1 − 푏 ,

y

휎 , = 푉푎푟[휉]1 − 푏 .

Para calcular el s-score que se definió como

푠 = 푋 (푡) −푚

휎 ,

Se usa

(51)

(52)

(53)

(58)

(55)

(57)

(56)

(54)

Page 21: Una Estrategia de Arbitraje Estadistico

21

푠 = 푋 − 푎 − 푏푋

휎 ,.

Es decir, mide qué tan desviado está de su predicción. Se usa esta versión de s-score ya que

se encontró que funciona mejor que la original.

(59)

Page 22: Una Estrategia de Arbitraje Estadistico

22

5 El portafolio.

Hasta ahora solamente se han discutido los tiempos de entrada y de salida de cada posición,

pero no se ha dicho nada de los montos. ¿Se entra con el mismo monto a cada posición?

Mientras se está en una posición, ¿se mantiene el monto de entrada fijo? ¿Se mantiene todo el

capital invertido en las acciones o se tiene una porción bajo una tasa libre de riesgo? Ya dada

una estrategia, encontrar cuál es la forma óptima de manejar un portafolio es un tema más

extenso que el presente trabajo.

Con el fin de ilustrar el funcionamiento de la estrategia a lo largo del periodo y de no

profundizar en el manejo del portafolio se maneja de la siguiente forma:

Se mantiene todo el capital invertido a menos que no haya posición activa, de ser ese el

caso, no hay capital invertido.

Se invierte en cada posición 1 푝 proporción del capital, siendo 푝 el número de

posiciones que se mantiene.

Se actualizan diariamente los montos invertidos en cada una de las acciones según lo

que la estrategia establece como monto óptimo.

Expresando esto en forma matemática. Sea 휋 ∈ ℤ ,푛 siendo el número total de acciones en

consideración, tal que

휋 = 1푠푖푠 , < −푠̅ 0푠푖 − 푠̅ < 푠 , <

−1푠푖푠 , > +푠̅+ 푠̅

Es decir, 휋 es un indicador de posición en cada acción.

Sea el vector 훾 ∈ ℝ de los rendimientos de cada acción al tiempo 푡,

(60)

Page 23: Una Estrategia de Arbitraje Estadistico

23

훾 = 푙푛푆 ,

푆 ,.

Sea la matriz de las betas al tiempo 푡

ℬ , = 훽 , ,

y sea 휑 ∈ ℝ donde 푚 es el número de eigenportafolios en uso,

휑 = 푟푒푛푑푖푚푖푒푛푡표푑푒푙푒푖푔푒푛푝표푟푡푎푓표푙푖표퐹 .

Entonces el rendimiento diario del portafolio al tiempo 푡 se puede calcular como

푟 = 휋 ∙ (훾 − ℬ ∙ 휑)

‖휋‖ .

ya que 푟 representa el rendimiento promedio diario de las posiciones que se mantienen al

tiempo 푡.

(61)

(62)

(63)

Page 24: Una Estrategia de Arbitraje Estadistico

24

6 Los datos.

Se usarán 40 acciones que cotizan en la BMV que cumplen cierto criterio de liquidez para

asegurar que pueda funcionar la estrategia. Las acciones que se utilizaron son los siguientes:

Escribaaquílaecuación.

Nombre de accion Emisora Industria1 AC Arca Continal, S.A.B. de C.V. Consumo Frecuente2 ALFA 'A' Alfa, S.A.B. de C.V. Industrial3 ALSEA Alsea, S.A.B. de C.V. Consumo No Basico4 AMX 'L' America Movil, S.A.B. de C.V. Telecomunicaciones5 ARA Consorcio Ara, S.A.B. de C.V. Industrial6 ASUR 'B' Grupo Aeroportuario del Sureste Industrial7 AUTLAN 'B' Compañía Minera Autlan, S.A.B. de C.V. Materiales8 AZTECA CPO T.V. Azteca, S.A.B. de C.V. Telecomunicaciones9 BACHOCO 'B' Industrias Bachoco, S.A.B. de C.V. Consumo Frecuente

10 BIMBO 'A' Grupo Bimbo, S.A. de C.V. Consumo Frecuente11 CEMEX 'CPO' Cemex S.A.B. de C.V. Materiales12 CICSA 'B1' Carso Infraestructura y Construcción, S.A.B. de C.V. Industrial13 CIE 'B' Corporacion Internacional de entretenimiento, S.A.B. de C.V. Consumo No Basico14 COMERCI 'UBC' Controladora Comercial Mexicana, S.A.B. de C.V. Consumo Frecuente15 ELEKTRA Grupo Elektra, S.A. de C.V. Consumo No Basico16 FEMSA 'UBD' Fomento Economico Mexicano, S.A.B. de C.V. Consumo Frecuente17 GCARSO 'A1' Grupo Carso, S.A.B. de C.V. Industrial18 GEO 'B' Corporacion GEO, S.A.B. de C.V. Industrial19 GFINBUR 'O' Grupo Financiero Inbursa, S.A.B. de C.V. Servicios Financieros20 GFNORTE 'O' Grupo Financiero Banorte, S.A.B. de C.V. Servicios Financieros21 GMEXICO 'B' Grupo Mexico, S.A.B. de C.V. Materiales22 GMODELO 'C' Grupo Modelo, S.A.B. de C.V. Consumo Frecuente23 GRUMA 'B' Gruma, S.A.B. de C.V. Consumo Frecuente24 HOGAR 'B' Consorcio Hogar, S.A.B. de C.V. Industrial25 HOMEX Desarrolladora Homex, S.A.B. de C.V. Industrial26 ICA Empresas ICA, S.A.B. de C.V. Industrial27 IDEAL 'B-1' Impulsora del Desarrollo y el Empleo en America Latina, S.A.B. de C.V. Industrial28 COCA-COLA FEMSA 'L' Coca - Cola FEMSA, S.A.B. de C.V. Consumo Frecuente29 MEXCHEM Mexichem, S.A.B. de C.V. Materiales30 PAPPEL Bio Pappel, S.A.B. de C.V. Materiales31 PE&OLES Industrias Peñoles, S.A.B. de C.V. Materiales32 PINFRA Promotora y operadora de Infraestructura, S.A.B. de C.V. Industrial33 SARE 'B' SARE Holdings, S.A.B. de C.V. Industrial34 SIMEC 'B' Grupo Simec, S.A.B. de C.V. Materiales35 SORIANA 'B' Organización Soriana, S.A.B. de C.V. Consumo Frecuente36 TELMEX 'L' Telefonos de Mexico, S.A.B. de C.V. Telecomunicaciones37 TLEVISA CPO Grupo Televisa, S.A.B. Telecomunicaciones38 URBI URBI Desarrol los Urbanos, S.A.B. de C.V. Industrial39 VITRO 'A' Vitro, S.A.B. de C.V. Materiales40 WALMEX 'V' Wal - Mart de Mexico, S.A.B. de C.V. Consumo Frecuente

Tabla 1 Acciones en consideración

Page 25: Una Estrategia de Arbitraje Estadistico

25

El criterio de liquidez que se usa es que el precio de la acción tenga variación diaria (o casi

diaria), lo que asegura que hubo compra-venta diaria. Una consecuencia de buscar las

acciones de mayor liquidez es que la mayoría de ellas forma parte del IPC, aunque hay

acciones del IPC que no están en la base y hay acciones fuera del IPC que entraron en la

base.

Los datos que se utilizaron en esta tesis son datos diarios de cierre de cada acción del 19 de

diciembre del 2005 al 13 de marzo del 2012.

6.1 Un análisis exploratorio de los datos.

Antes de empezar a aplicar esta estrategia de arbitraje estadístico se hará un breve análisis

exploratorio de los datos con el fin de familiarizarse más con ellos.

Uno de los temas de interés para poder aplicar la estrategia es saber el número de

componentes principales que se deben usar. Como se mencionó previamente hay dos formas

de acercarse a esta cuestión:

Usar un número fijo de componentes principales que se consideren suficientemente

explicativas.

Usar el número mínimo necesario de componentes principales para explicar cierto

porcentaje fijo de varianza.

A continuación se presenta una gráfica del número de componentes principales necesarias

para explicar 55% de varianza a través del tiempo.

Page 26: Una Estrategia de Arbitraje Estadistico

26

Es claro que la moda de la mínima cantidad de componentes necesarias para explicar el 55%

de la varianza es de 10 componentes, y también se podría esperar que la mediana esté

cercana a este número por lo que se puede observar de la gráfica(1). Por esto mismo se

utilizaron 10 componentes principales de manera fija a lo largo de la aplicación de la estrategia

de inversión.

Tiempo en días

núme

ro de

comp

onent

es

Gráfica (1) Número de componentes necesarias para explicar 55% de la varianza

Page 27: Una Estrategia de Arbitraje Estadistico

27

En la siguiente gráfica se observa cómo se comporta el porcentaje de varianza que explica

cada una de las componentes principales a través del tiempo.

Se puede ver que la primera componente principal tiene un dominio sobre las demás, tan solo

la primera componente explica alrededor del 30% en la mayor parte del tiempo, es decir, para

explicar el 25% faltante se necesitan en promedio 9 componentes más. También se puede ver

que la segunda componente resalta sobre las demás en ciertos periodos. Por esto mismo el

interés de saber qué acciones son las principales participantes en estas dos componentes.

La gráfica(3) es una gráfica de dispersión sobre las primeras dos componentes principales de

las acciones con mayor participación en ellas en cada tiempo del periodo.

Tiempo en días

Var.

explic

ada

de

cada

C.P.

Gráfica (2) Varianza explicada por cada componente principal a través del tiempo

Page 28: Una Estrategia de Arbitraje Estadistico

28

Se observa que hay cierta simetría en la primera componente, el lado derecho son periodos en

los que hubo crecimiento en el IPC y el lado izquierdo cuando decreció (causado por la crisis

económica del 2008 en las que hubo fuertes caídas del IPC). Las acciones con mayor fuerza

en la primera componente (ICA, AMX, GEO Y CEMEX) se mantienen con una fuerza

relativamente constante respecto a ésta a lo largo del tiempo, su nivel en valor absoluto

siempre es mayor a .15 y menor a .25 . En cambio, las acciones con mayor fuerza respecto a la

segunda componente (CIE, COMERCI y PAPPEL) tienen una fuerza con mucha variación, por

ejemplo, en el caso de CIE llega a tener una fuerza de 0 a una fuerza superior a 0.4 .

-Negro es ICA -Verde es AMX -Amarillo es GEO -Rojo es CEMEX

-Cian es CIE -Magenta es COMERCI -Azul es PAPPEL

Primera componente principal

Segu

nda

comp

onent

e

princi

pal

Gráfica (3) Principales acciones graficadas sobre las primeras componentes

principales en diferentes tiempos

Page 29: Una Estrategia de Arbitraje Estadistico

29

6.2 El primer eigenportafolio.

Como se vio previamente la primera componente principal explica alrededor del 30% de la

varianza, por eso mismo interesa observar cómo se comporta el primer eigenportafolio.

En la gráfica se puede observar claramente que existe una correlación positiva alta entre el IPC

y el primer eigenportafolio. La interpretación de esto es que el mejor índice para resumir el

mercado de México es el IPC. También hay una clara separación después de la crisis, esta

separación probablemente es causada por que en esta tesis no se consideraron las acciones

que entraron al IPC después de la fecha inicial.

Rojo - IPC Azul - 1er Eigenportafolio

Dese

mpeñ

o de

los

portaf

olios

Tiempo en días

Gráfica (4) IPC y el Primer Eigenportafolio

Page 30: Una Estrategia de Arbitraje Estadistico

30

7 Los resultados.

Algo que no se desarrolla en el artículo de Avellaneda, M. y Lee, J-H. (2010). es la elección de

las parámetros de señalamiento de decisión 푠̅ , 푠̅ , 푠̅ y 푠̅ . De la elección de estos

parámetros dependerá el funcionamiento de la estrategia.

En esta tesis no se intentará encontrar un conjunto óptimo para estos parámetros pero se

ilustrará como se comporta la estrategia con diferentes conjuntos.

7.1 Sin considerar la desviación 훼 .

En la próxima tabla se presentan los rendimientos promedio diarios y anuales del portafolio con

diferentes conjuntos de parámetros sin considerar las desviaciones 훼 .

al cl ac cc rd ra al cl ac cc rd ra1 0.5 1 0.5 0.00000 0.00 2 0.5 2 0.5 0.0007 0.191 0.75 1 0.75 0.00000 0.00 2 0.5 2 0.75 0.0007 0.191 1 1 1 0.00010 0.03 2 0.5 2 1 0.0004 0.111 1.25 1 1.25 0.00010 0.03 2 0.75 2 0.5 0.0005 0.131 1.5 1 1.5 0.00010 0.03 2 0.75 2 0.75 0.0004 0.11

1.25 0.5 1.25 0.5 0.00020 0.05 2 0.75 2 1 0.0003 0.081.25 0.75 1.25 0.75 0.00010 0.03 2 1 2 0.5 0.0004 0.111.25 1 1.25 1 0.00010 0.03 2 1 2 0.75 0.0004 0.111.25 1.25 1.25 1.25 0.00010 0.03 2 1 2 1 0.0003 0.081.25 1.5 1.25 1.5 0.00010 0.03 2.25 0.5 2.25 0.5 0.0009 0.25

1.5 0.5 1.5 0.5 0.00030 0.08 2.25 0.5 2.25 0.75 0.0011 0.321.5 0.75 1.5 0.75 0.00010 0.03 2.25 0.5 2.25 1 0.0008 0.221.5 1 1.5 1 0.00020 0.05 2.25 0.75 2.25 0.5 0.0007 0.191.5 1.25 1.5 1.25 0.00000 0.00 2.25 0.75 2.25 0.75 0.0008 0.221.5 1.5 1.5 1.5 0.00010 0.03 2.25 0.75 2.25 1 0.0005 0.13

1.75 0.5 1.75 0.5 0.00020 0.05 2.25 1 2.25 0.5 0.0008 0.221.75 0.75 1.75 0.75 0.00010 0.03 2.25 1 2.25 0.75 0.0009 0.251.75 1 1.75 1 0.00000 0.00 2.25 1 2.25 1 0.0005 0.131.75 1.25 1.75 1.25 -0.00010 -0.02 2.5 0.5 2.5 0.5 0.0003 0.081.75 1.5 1.75 1.5 0.00000 0.00 2.5 0.5 2.5 0.75 0.0007 0.19

2 0.5 2 0.5 0.00070 0.19 2.5 0.5 2.5 1 0.0001 0.032 0.75 2 0.75 0.00040 0.11 2.5 0.75 2.5 0.5 -0.0003 -0.072 1 2 1 0.00030 0.08 2.5 0.75 2.5 0.75 0 0.002 1.25 2 1.25 0.00000 0.00 2.5 0.75 2.5 1 0 0.002 1.5 2 1.5 0.00000 0.00 2.5 1 2.5 0.5 -0.0003 -0.07

2.25 0.5 2.25 0.5 0.00090 0.25 2.5 1 2.5 0.75 -0.0002 -0.052.25 0.75 2.25 0.75 0.00080 0.22 2.5 1 2.5 1 -0.0001 -0.022.25 1 2.25 1 0.00050 0.13 0 0 0 0 0 0.002.25 1.25 2.25 1.25 0.00010 0.032.25 1.5 2.25 1.5 0.00000 0.00

Tabla 2.1 Cojunto de Estrategias Tabla 2.2 Cojunto de Estrategias

Page 31: Una Estrategia de Arbitraje Estadistico

31

En estas tablas se presentan los parámetros de entrada al, cl, ac y cc que abrevian abrir largo,

cerrar largo, abrir corto y cerrar corto respectivamente. Y se presentan también rd y ra que son

los rendimientos diarios promedio y los rendimientos anuales promedio que generó la

simulación de la estrategia con esos parámetros. En la tabla 2.1 se presenta un grupo de

estrategias donde al es igual a ac y cl es igual a cc. En la tabla 2.2 es un conjunto de

estrategias donde solamente al es igual a ac.

Observaciones:

Lo primero que se observa, y que alegra ver, es que en la gran mayoría de los casos los

rendimientos son positivos.

Se observa también que los parámetros de abrir posición, 푠̅ y 푠̅ , tienen un efecto

positivo mientras más alejados de 0 se elijan, aunque si se eligen demasiado lejos (2.5)

el efecto es negativo.

Por el otro lado, los parámetros 푠̅ y 푠̅ funcionan mejor para valores cercanos a 0.

La forma en la que se interpreta el segundo y el tercer punto es que la forma en que mejor

funciona la estrategia es ser ambicioso con las variables de entrada y esperar a que la acción

se desvíe mucho de su punto de equilibrio, y ser seguro con las variables de salida y dejar la

posición en el momento que se haya acumulado un ingreso suficiente.

Con el fin de analizar más de cerca el comportamiento de distintos conjuntos de parámetros se

ilustra cómo se comporta el portafolio a lo largo del tiempo con distintos conjuntos de

parámetros de entrada al, cl, ac y cc.

Page 32: Una Estrategia de Arbitraje Estadistico

32

Observaciones:

Pre-crisis: Se puede ver que inicialmente tienen un comportamiento similar aunque las

estrategias más agresivas empiezan mejor.

Crisis: Todas las estrategias tienen una caída al momento de iniciar la crisis, pero en el

momento que ya existe suficiente información de cómo se están comportando las

acciones a lo largo de la crisis se empieza un mar de oportunidades que dependiendo

de la agresividad de la estrategia, depende qué tanto logra aprovechar estas

oportunidades de arbitraje.

Post-crisis: Las estrategias vuelven a tener un comportamiento similar, pero se observa

que las estrategias más agresivas empiezan a tener mayores pérdidas, y las más

conservadores llegan a tener ganancias. Probablemente ya hay desequilibrios tan

Azul – [2.25, .5, 2.5, .75] Cian – [2.25, .75, 2.5, .5] Verde - [2, .75, 2, .5]

[1.75, 1.5, 1.75, 1.5]Magenta - [1.75, 1.5, 1.75, 1.5] Rojo - [1.75, 1.25, 1.75, 1.25]

Tiempo en años

Gráfica (5) Rendimientos de estrategias

Dese

mpeñ

o de

las

estrat

egias

Page 33: Una Estrategia de Arbitraje Estadistico

33

grandes en estos periodos por lo que ya no hay tantas oportunidades de entrada para

las estrategias más agresivas.

De esto se puede deducir que si se deseara elegir los parámetros de una forma teórica óptima

uno de los principales factores que se deben considerar es la volatilidad del mercado.

7.2 Considerando la desviación 훼 .

Es natural esperar que la estrategia considerando la desviación 훼 tenga un mejor desempeño

ya que ésta se considera cuál es la tendencia de la acción. El problema que se podría

presentar es que más que encontrar tendencias, lo único que genere es “ruido” que perjudique

a las predicciones.

A continuación se presenta el mismo conjunto de estrategias que se usó previamente pero

ahora considerando la desviación 훼 .

Page 34: Una Estrategia de Arbitraje Estadistico

34

Al comparar estas tablas con las tablas 2.1 y 2.2, se observa que en la primera columna en la

mayoría de los casos conviene ignorar la desviación ya que en tan solo 8 de las 30 estrategias

conviene considerar 훼 . Por el otro lado, en la segunda columna en las que pertenece las

mejores estrategias en tan solo 3 de los 28 casos no conviene ignorar 훼 .

El comportamiento general de las estrategias es similar en ambos casos como se muestra en la

gráfica 6 en la que se compara el uso de la desviación usando tres estrategias diferentes.

al cl ac cc rd ra al cl ac cc rd ra1 0.5 1 0.5 -0.0001 -0.02 2 0.5 2 0.5 0.0008 0.221 0.75 1 0.75 0.0000 0.00 2 0.5 2 0.75 0.0007 0.191 1 1 1 0.0001 0.03 2 0.5 2 1 0.0004 0.111 1.25 1 1.25 0.0001 0.03 2 0.75 2 0.5 0.0005 0.131 1.5 1 1.5 0.0001 0.03 2 0.75 2 0.75 0.0005 0.13

1.25 0.5 1.25 0.5 0.0002 0.05 2 0.75 2 1 0.0003 0.081.25 0.75 1.25 0.75 0.0001 0.03 2 1 2 0.5 0.0000 0.001.25 1 1.25 1 0.0001 0.03 2 1 2 0.75 0.0002 0.051.25 1.25 1.25 1.25 0.0001 0.03 2 1 2 1 0.0001 0.031.25 1.5 1.25 1.5 0.0001 0.03 2.25 0.5 2.25 0.5 0.0012 0.35

1.5 0.5 1.5 0.5 0.0003 0.08 2.25 0.5 2.25 0.75 0.0014 0.421.5 0.75 1.5 0.75 0.0001 0.03 2.25 0.5 2.25 1 0.0008 0.221.5 1 1.5 1 0.0001 0.03 2.25 0.75 2.25 0.5 0.0009 0.251.5 1.25 1.5 1.25 0.0000 0.00 2.25 0.75 2.25 0.75 0.0010 0.291.5 1.5 1.5 1.5 0.0001 0.03 2.25 0.75 2.25 1 0.0005 0.13

1.75 0.5 1.75 0.5 0.0002 0.05 2.25 1 2.25 0.5 0.0009 0.251.75 0.75 1.75 0.75 0.0001 0.03 2.25 1 2.25 0.75 0.0010 0.291.75 1 1.75 1 0.0001 0.03 2.25 1 2.25 1 0.0006 0.161.75 1.25 1.75 1.25 -0.0001 -0.02 2.5 0.5 2.5 0.5 0.0007 0.191.75 1.5 1.75 1.5 0.0000 0.00 2.5 0.5 2.5 0.75 0.0007 0.19

2 0.5 2 0.5 0.0008 0.22 2.5 0.5 2.5 1 0.0007 0.192 0.75 2 0.75 0.0005 0.13 2.5 0.75 2.5 0.5 -0.0001 -0.022 1 2 1 0.0001 0.03 2.5 0.75 2.5 0.75 0.0000 0.002 1.25 2 1.25 0.0001 0.03 2.5 0.75 2.5 1 0.0004 0.112 1.5 2 1.5 0.0001 0.03 2.5 1 2.5 0.5 -0.0001 -0.02

2.25 0.5 2.25 0.5 0.0012 0.35 2.5 1 2.5 0.75 0.0000 0.002.25 0.75 2.25 0.75 0.0010 0.29 2.5 1 2.5 1 0.0004 0.112.25 1 2.25 1 0.0006 0.162.25 1.25 2.25 1.25 0.0002 0.052.25 1.5 2.25 1.5 0.0000 0.00

Tabla 3.1 Cojunto de Estrategias Tabla 3.2 Cojunto de Estrategias

Page 35: Una Estrategia de Arbitraje Estadistico

35

En ambos casos, el comportamiento antes de la crisis es casi idéntico. A lo largo de la crisis,

que es el momento de toma de oportunidades, las estrategias que consideran la tendencia de

las acciones generan mejores resultados.

Rojo - sin desviación Azul - con desviación

Tiempo en días

Dese

mpeñ

o de

las

estrat

egias

Gráfica (6) Desviación v.s. No desviación

Page 36: Una Estrategia de Arbitraje Estadistico

36

7.3 Los parámetros en el tiempo.

Dado que la estrategia parece tener buen funcionamiento, es de interés saber si efectivamente

el modelo se está cumpliendo. Por eso mismo se grafican los parámetros de América Movil (la

acción más importante) a través del tiempo.

Se desea que 1 휅 = 휏푖 ≪ 푇1 = 60 260⁄ por lo que se desea que kappa sea mayor a 8.6

para que tenga una rápida reversión a la media. Es claro que para esta acción, efectivamente

se cumple esto.

Tiempo en días

Kapp

a

Gráfica (7) Kappa de América Móvil vs Tiempo

Page 37: Una Estrategia de Arbitraje Estadistico

37

En esta gráfica se observa que efectivamente, la media del residual es cercana a 0 a lo largo

de todo el periodo. También se observa que la sigmaEq (sigma de equilibrio) es mayor en los

tiempo de crisis y se reduce en los tiempos siguientes (post-crisis).

Tiempo en días

Pará

metro

Gráfica (8) Mu y sigmaEq de América Móvil vs Tiempo

Verde - SigmaEq Rojo - Mu

Page 38: Una Estrategia de Arbitraje Estadistico

38

8 Algunos comentarios sobre la implementación.

Si se deseara implementar esta estrategia de arbitraje en la vida real se deben considerar los

siguientes puntos:

La estrategia necesita entrar en posiciones sobre índices que no existen. Como no sería

costeable crear índices para implementar la estrategia, entonces se debe usar otro

método. Para poder replicar artificialmente los índices es necesario entrar en posición

en cada una de las acciones en consideración, en apalancamientos precisos que serían

el monto de la acción por el peso en la componente principal.

El modelo pide un apalancamiento preciso en cada componente, pero esto tal vez no

sea posible de implementar. Estos errores de precisión afectarían el portafolio de

manera negativa.

La estrategia también pide entrar en posición en cada uno de los eigenportafolios con

un monto igual a su respectiva 훽 para cada acción en la que hay posición activa. No es

posible invertir el monto que uno quiera en una emisora ya que cada acción tiene un

precio, entonces para poder aproximar las proporciones de estas 훽′푠 de la mejor

manera posible, se debe invertir grandes cantidades de dinero.

Por último, se debe considerar que hay un retraso de tiempo del momento en el que se

sabe que se debe entrar en alguna posición al momento que efectivamente se entró. En

ese diferencial de tiempo también se generó un diferencial de precio. Esto podría

afectar de manera negativa al desempeño del portafolio.

Page 39: Una Estrategia de Arbitraje Estadistico

39

9 Conclusiones.

Esta estrategia de arbitraje estadístico parece funcionar en México en este periodo ya que en la

gran mayoría de las diferentes selecciones de parámetros los rendimientos fueron positivos y,

en los casos que fueron negativos los rendimientos eran muy cercanos a cero.

Las acciones que se consideraron son las mismas durante todo el periodo, si en la

implementación se consideran las acciones nuevas que forman parte del IPC se conseguiría

mayor información del mercado, por lo que se esperaría que la estrategia funcione mejor.

La selección de parámetros de señalamiento parece que puede valer un trabajo entero. La

estrategia parece funcionar bien en tiempos de crisis y no tan bien en tiempos estables por lo

que sería natural pensar que la estrategia es dependiente de la volatilidad del mercado. Lo que

se intuye de los datos es que esta selección de parámetros debe de estar relacionada

directamente con la volatilidad del mercado. Sería posible implementar una estrategia donde

los parámetros de señalamiento sean dinámicos dependientes de la volatilidad y tal vez otros

factores. Se esperaría que esta implementación afecte positivamente a la estrategia.

En general se concluye que esta es una estrategia que vale la pena explorar más a detalle para

considerar que se use con dinero real.

Page 40: Una Estrategia de Arbitraje Estadistico

40

10 Los algorimtos.

10.1 Los principales.

function[g]=EstrategiaAE(al,cl,ac,cc,X,mod) %Este algoritmo simula como se comportaría la estrategia en el periodo. %Los parámetros de entrada es la matriz X de precios de acciones a lo largo % del tiempo siendo cada columna una acción. % al, cl , ac, cc son los parámetros de abrir(o cerrar) largo(o corto) % mod es uno si se considera la desviación y 0 si no se considera. %Matriz de rendimientos [a,b] = size(X); R = zeros(a-1,b); for i=1:a-1 for j=1:b R(i,j) = log(X(i+1,j)/X(i,j)); end end %La matriz F es la matriz de rendimientos de los eigenportafolios siguiendo %el mismo indice de tiempo que la matriz de rendimientos R. %Notese que las primeras 260 observaciones seran igual a cero. F=zeros(a-1,10); rendF=zeros(a-1,10); %DXt es la matriz de todos los residuales DXt = zeros(a-1,b); %Posicion es el vector que indica que posición se tiene sobre cada accion, %1 es "abierto largo", -1 es "abierto corto", 0 es sin posicion posicion = zeros(1,b); rend = 0; rendv = zeros(a-1-260,1); ing=1; for t=261:a-1 %Se calculan los residuales y se actualizan las matricez F y rendF y se %extrae la matriz de betas y el vector de alfas [DXt,F,rendF,betas,alfas] = CalculaResiduales(DXt,R,F,rendF,t,b); %rend = rend*(1+(posicion*((R(t,:)')-betas*(rendF(t,:)')))); %Contador de en cuantas posiciones hay posicion cont = 0; for k = 1:b if posicion(1,k)==0 cont = cont + 1;

Page 41: Una Estrategia de Arbitraje Estadistico

41

end end cont = b-cont; if cont > 0 rend = posicion*((R(t,:)')-betas*(rendF(t,:)')); if abs(rend) > 1 rend = abs(rend)/rend; end rend = rend/cont; rendv(t-260,1) = rend; end %Esta función regresa un vector de señales de cada acción que indica %que se debe hacer. posicion = senal(posicion,DXt,t,b,al,cl,ac,cc,alfas,mod); ing=ing*(1+rend); if rend < 0 plot(t,ing,'red') hold on else plot(t,ing,'red') hold on end t end g=mean(rendv);

Page 42: Una Estrategia de Arbitraje Estadistico

42

function[DXt,F,rendF,betas,alfas] = CalculaResiduales(DXt,R,F,rendF,t,b) %Esta función regresa el vector de residuales del proceso de difusión de O-U %sumados con el "dift" alfa %Actualiza los retornos de F %Actualiza los rendimientos de F %Regresa la matriz de betas al tiempo t %Regresa el vector de algas al tiempo t %F es un vector con los factores de riesgo. Cada uno formado por cada %componente principal Ft = zeros(1,10); %F es un vector con los factores de riesgo. Cada uno formado por cada %componente principal rendFt = zeros(1,10); %Sigmas es el vector de las desviaciones estandar del forex en el periodo sigmas = zeros(b,1); %betas es la matriz de las betas, el renglon es la accion y la columna el %factor de riesgo betas = zeros(b,10); %alfas es un vector vectical alfas = zeros(b,1); [coeff,score,vars] = PCA(R,t); %A es la sección de R de interés A = zeros(260,b); for i=1:260 for j=1:b A(i,j) = R(i+t-260,j); end end %Se calculas las sigmas for i=1:b sigmas(i,1) = sqrt(var(A(:,i))); end %Se calcula el rendimiento y el retorno de F for j=1:10 inversion = 0; for i=1:b Ft(1,j)=Ft(1,j) + coeff(i,j)*(1/sigmas(i,1))*R(t,i); inversion = inversion + coeff(i,j)*(1/sigmas(i,1)); end rendFt(1,j) = (Ft(1,j))/inversion; end %Se actualiza la matriz F F(t,:) = Ft; rendF(t,:) = rendFt;

Page 43: Una Estrategia de Arbitraje Estadistico

43

%Se toma la parte de F de interés "B" B = zeros(260,10); for i = 1:260 for j = 1:10 B(i,j) = F(t-260+i,j); end end %Se calculan las betas con las covarianzas for i=1:b for j=1:10 c = cov(A(:,i),B(:,j)); betas(i,j) = c(1,2)/(var(B(:,j))); end end %Se crea el vector de residuales dXt = zeros(1,b); for i=1:b dXt(1,i) = R(t,i)-betas(i,:)*Ft'; end DXt(t,:) = dXt; %Se calcula cada alfa para cada accion for i=1:b alfas(i,1) = 260*(mean(A(:,i))-betas(i,:)*(mean(B))'); end

Page 44: Una Estrategia de Arbitraje Estadistico

44

function[posicion] = senal(posicion,DXt,t,b,al,cl,ac,cc,alfas,mod) %Esta función indica que acción se debe hacer sobre la acción al tiempo t siv = zeros(1,b); for i = 1:b %v es la serie de tiempo de los residuales de la accion i v = zeros(60,1); %v1 es el vector retrazado un tiempo v1 = zeros(60,1); for j = 1:60 v(j) = DXt(t-60+j-1,i); v1(j) = DXt(t-60+j-2,i); end %Se calculan los parámetros del proceso autoregresivo c = cov([v v1]); p2 = c(2,1)/var(v1); p1 = mean(v)-p2*mean(v1); %rar son los residuales del proceso autoregresivo rx = zeros(60,1); for j = 1:60 rx(j) = v(j) - p1 - p2*v1(j); end %vx es la varianza de los residuales vx = var(rx); %Se calculan los parámetros de el O-U kappa = -log(p2)*260; m = p1/(1 - p2); sigmaEq = sqrt(vx/(1-p2*p2)); %si = (DXt(t,i)-m)/sigmaEq; si = (DXt(t,i)-p1-p2*DXt(t-1,i))/sigmaEq; %Se calcula s-mod si asi se indica if mod == 1 si = si - alfas(i,1)/(kappa*sigmaEq); end siv(1,b) = si; %Se analiza que hacer con la posición %Para las acciones en las que hay posicion no aplican filtros if posicion(1,i) == 1 if si > cl posicion(1,i) = 0; end end if posicion(1,i) == -1 if si < -cc posicion(1,i) = 0;

Page 45: Una Estrategia de Arbitraje Estadistico

45

end end %fil es una variable que indica cuantos filtros pasó la acción fil = 0; %Primer filtro, que el intervalo de confianza de p2 no incluya el 1 sp2 = sqrt(vx/(var(v)*59)); low = p2 - sp2*tinv(.97,58); high = p2 + sp2*tinv(.97,58); if low > 1 || high < 1 fil = fil + 1; end %Segundo filtro, que el tiempo de reversión a la media sea %suficientemente rápido if kappa > 8.66666 fil = fil + 1; end if low < 0 && high > 0 fil = fil + 1; end %Se analiza entrar a algún tipo de posición if posicion(1,i) == 0 && fil ==3 if si < -al posicion(1,i) = 1; end if si > ac posicion(1,i) = -1; end end end

function[coeff,score,vars] = PCA(X,t)

Page 46: Una Estrategia de Arbitraje Estadistico

46

%esta funcion regresa las componentes principales que corresponden a las %observaciones de hace un año a la fecha. [a,b]=size(X); A=zeros(260,b); for i=1:260 for j=1:b A(i,j) = X(i+t-261,j); end end %Se estandariza la matriz Z = zscore(A); [coeff,score,latent] = princomp(Z); vars = latent./sum(latent); end

10.2 Los auxiliaries.

%Analisis exploratorio [a,b]=size(X); R = zeros(a-1,b); for i=1:a-1 for j=1:b R(i,j)=log(X(i+1,j)/X(i,j)); end end suma=0; suma2=0; %suma3 es para ver cuantas componentes se necesitan para acumular 55% de %variaza explicada suma3=0; %vec es el vector promedio de los coeffs % vec = zeros(b,10); % Z = zscore(R); % [coeffs,score,latent] = princomp(Z); for t=261:a-1 [coeff,score,vars] =PCA(R,t); suma=suma + vars(1); suma2=suma2 + vars(2); s=0; q=1; while s < .55 s = s + vars(q); q = q + 1; end suma3 = suma3 + q; %Grafica de dispersion sobre las 2 primeras componentes principales plot(coeff(26,1),coeff(26,2),'black');

Page 47: Una Estrategia de Arbitraje Estadistico

47

hold on plot(coeff(4,1),coeff(4,2),'green'); plot(coeff(18,1),coeff(18,2),'yellow'); plot(coeff(11,1),coeff(11,2),'red'); plot(coeff(13,1),coeff(13,2),'cyan'); plot(coeff(14,1),coeff(14,2),'magenta'); plot(coeff(30,1),coeff(30,2),'blue'); %grafica a lo largo del tiempo de cuantas componentes se necesitan para %explicar 55% plot(t,q); hold on %grafica de varianza explicada de las primeras 6 componentes %principales plot(t,vars(1),'black'); hold on plot(t,vars(2),'blue'); plot(t,vars(3),'cyan'); plot(t,vars(4),'magenta'); plot(t,vars(5),'red'); plot(t,vars(6),'yellow'); t end suma/(a-1) suma2/(a-1) suma3/(a-1)

%Esta rutina genera la gráfica del primer eigenportafolio contra el IPC

%Matriz de rendimientos [a,b]=size(X); R = zeros(a-1,b); for i=1:a-1 for j=1:b R(i,j)=log(X(i+1,j)/X(i,j)); end end %La matriz F es la matriz de rendimientos de los eigenportafolios siguiendo %el mismo indice de tiempo que la matriz de rendimientos R. %Notese que las primeras 260 observaciones seran igual a cero. F=zeros(a-1,10);

Page 48: Una Estrategia de Arbitraje Estadistico

48

rendF=zeros(a-1,10); rend=1; DXt = zeros(a-1,b); for t=261:a-1 [DXt,F,rendF,betas] = CalculaResiduales(DXt,R,F,rendF,t,b); rend=rend*(1+rendF(t,1)); %Grafica del Primer Eigenportafolio plot(t,rend,'blue'); hold on %Grafica del IPC plot(t,IPC(t,1)/IPC(261,1),'red'); t end %Este algoritmo trata de buscar un buen conjunto de parametros de entrada y %salida del algoritmo Estrategia Est = zeros(30,5); cont = 0 %a es abrir posicion %c es cerrar posicion a=1; for i = 1:6 c=.5; for j=1:5 pars =[a c a c]; r = EstrategiaAE(pars(1,1),pars(1,2),pars(1,3),pars(1,4),X,1); cont = cont + 1 Est(cont,:)=[pars r]; c = c + .25; end a = a + .25; end Est

%Segundo algoritmo de búsqueda de parámetros de entrada y salida del %algoritmo Estrategia

Page 49: Una Estrategia de Arbitraje Estadistico

49

Est = zeros(28,5); %a es abrir posicion %c es cerrar posicion cont = 0 a=2; for i = 1:3 cl=.5; for j=1:3 cc=.5; for k=1:3 pars =[a cl a cc]; r = EstrategiaAE(pars(1,1),pars(1,2),pars(1,3),pars(1,4),X,1); cont = cont + 1 Est(cont,:)=[pars r]; cc=cc+.25; end cl = cl + .25; end a = a + .25; end Est %Esta rutina grafica los parametros kappa, simga y mu de America Movil [a,b] = size(X); R = zeros(a-1,b); for i=1:a-1 for j=1:b R(i,j) = log(X(i+1,j)/X(i,j)); end end %La matriz F es la matriz de rendimientos de los eigenportafolios siguiendo %el mismo indice de tiempo que la matriz de rendimientos R. %Notese que las primeras 260 observaciones seran igual a cero. F=zeros(a-1,10); rendF=zeros(a-1,10); %DXt es la matriz de todos los residuales DXt = zeros(a-1,b); %Posicion es el vector que indica que posición se tiene sobre cada accion, rend = 0; rendv = zeros(a-1-260,1); ing=1; for t=261:a-1 %Se calculan los residuales y se actualizan las matricez F y rendF y se %extrae la matriz de betas y el vector de alfas

Page 50: Una Estrategia de Arbitraje Estadistico

50

[DXt,F,rendF,betas,alfas] = CalculaResiduales(DXt,R,F,rendF,t,b); %Esta función regresa un vector de señales de cada acción que indica %que se debe hacer. [kappa,m,sigmaEq]=grafica(DXt,t,b,alfas); plot(t,kappa,'blue') hold on plot(t,m,'red') hold on plot(t,sigmaEq,'green') t end

function [kappaa,mm,sigmaa]=grafica(DXt,t,b,alfas) siv = zeros(1,b); for i = 1:b %v es la serie de tiempo de los residuales de la accion i v = zeros(60,1); %v1 es el vector retrazado un tiempo v1 = zeros(60,1); for j = 1:60 v(j) = DXt(t-60+j-1,i); v1(j) = DXt(t-60+j-2,i); end %Se calculan los parámetros del proceso autoregresivo c = cov([v v1]); p2 = c(2,1)/var(v1); p1 = mean(v)-p2*mean(v1); %rar son los residuales del proceso autoregresivo rx = zeros(60,1); for j = 1:60 rx(j) = v(j) - p1 - p2*v1(j); end %vx es la varianza de los residuales

Page 51: Una Estrategia de Arbitraje Estadistico

51

vx = var(rx); %Se calculan los parámetros de el O-U kappa = -log(p2)*260; m = p1/(1 - p2); sigmaEq = sqrt(vx/(1-p2*p2)); sigma = sigmaEq*sqrt(2*kappa); if i == 4 kappaa=kappa; mm=m; sigmaa=sigmaEq; end %si = (DXt(t,i)-m)/sigmaEq; si = (DXt(t,i)-p1-p2*DXt(t-1,i))/sigmaEq; %Se calcula s-mod si asi se indica siv(1,b) = si; end

Page 52: Una Estrategia de Arbitraje Estadistico

52

Referencias

Avellaneda, M. y Lee, J-H. (2010). Statistical Arbitrage in the U.S. Equity Markets. Quantitative

Finance, vol. 10, no. 7, pp 761 – 782.

Baxter, M. y Rennie, A. (1998) Financial Calculus. An introduction to Derivative Pricing.

Cambridge: Cambridge University Press.

Montgomery, Peck and Vining. (2006). Introduction to linear regression analysis.