Économétrie des Marchés Financiers Stratégies …yats.free.fr/doc/strategies-1-fr-ppt.pdf · Indice relatif d€’aversion au risque = 1, On tentera donc de maximiser la satisfaction

1

Page 1

Daniel HERLEMONT http://www.yats.com 1

Économétrie des Marchés Financiers

-Stratégies d'investissement


Utilité espérée

↑ Rendement↓ Risques

↓ Rendement↑ Risques

U ’(w) > 0U ’ ’(w) < 0

w

U

Agent risquophobe: préfère un revenu certain à un même revenu espéré (et donc aléatoire)

L'utilité est censée mesurer la satisfaction de l ’agent, fonction d'un revenu aléatoire

Il y autant de f.u. que d ’agents …. Dépend de l ’aversion pour le risque de l ’agent

ma préférée : f.u. en logarithme ….Indice relatif d ’aversion au risque = 1,

On tentera donc de maximiser la satisfaction de l ’agent: maximun E [U(w)]

Aversion relative pour le risque = -w U"/U' = γne dépend pas du niveau de la richesse

2

Page 2


Utilité - exemple

104 16

UAversion aux risques : concavité de la f.u. E[U(w)] < U(E[w])à revenu égal, préférence pour le certain sur l’aléatoire

U(w)=ln(w)loterie : w1=4 avec p=0.5, w2=16 avec 1-p=0.5E[w]=p w1 + (1-p) w2 = 0.5*4+0.5*16=10

E[U(w)] = p U(w1) + (1-p) U(w2) = 0.5*ln(4)+0.5*ln(16)=ln(8)=U(8)

Quel est le revenu certain équivalent au revenu aléatoirerevenu aléatoire = équivalent certain + prime de risque 10 = 8 + 2

8

Cas général: λ = prime de risque U(E[w]-λ) = E[U(w)]prime risque absolue ≈ - 1/2 U"/U' variance(W)prime risque relative (en %) ≈ - 1/2 W U"/U' variance(W)pour de faibles variations, par un développement de Tayloraversion relative = - <W> U"/U' = 1 pour une f/u. en log

Exemple : portefeuille d'actions, avec rendement=10% volatilité=40%,prime de risque = variance/2 = 0.42/2= 8%, équivalent certain (salaire) = 10%-8%=2%pour un équivalent salaire de 100 000 € par an,il faut générer une performance 5 fois plus grande 500 000 € sur un portefeuille de 5 millions €et encore l'aversion au risque est faible

U(w)

w

Quel revenu certain (salaire) souhaiteriez vous en échange d’un revenu incertain (investissement) ?

E[U(w)]

U(E[w])

Indifférence: équivalent certain (8) vs revenu aléatoire (10)préférence revenu certain si revenu certain > 8préférence revenu aléatoire si revenu certain < 8


Kelly

m Kelly (1956 Bell Labs) avec Shannon, pose le problème suivant:F gain = doublement de la mise, avec une probabilité 1/2<p<1F perte de la mise, avec probabilité q=1-p

m Quelle proportion f du capital doit on miser ? f =levierm si p=1 : levier infini …m si p<1

F Si f=1, correspond au critère du maximum de l'espérancemais c'est la ruine assurée dès la première perte ….

F Si f=0, on ne profite pas d'un réel avantageF => f compris entre 0 et 1 …

m Solution de Kelly : maximiser le taux de croissance ….

Wn = valeur du portefeuille à la période n

On cherche à maximiser la moyenne du taux de croissance <=>

maximiser la moyenne géométrique <=>

Taux de croissance équivalent certain<=>

Maximiser une fonction d'utilité logarithmiquesur une seule période

sous certaines conditions (ergodicité)1/n Wn/W0 = 1/n [log Wn/Wn-1+log Wn-1/Wn-2+ …. log W1/W0]

→ E log W1/W0

3

Page 3


Kelly (formules)

-0.15

-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25

0.3

0 0.2 0.4 0.6 0.8 1

G

f

f*

G*

En étroite relation avec la notion d'entropie …. H= -p log p - q log qMaximiser G <=> minimiser l'entropie H <=> maximiser la prédictibilité d'un signal (au sens Shannon)


Kelly (exemple)

p=0.7 q=0.3f*=p-q=0.4 et G* ~ 8%soit

Il vaut mieux sous estimer que surestimer f*pour f ~ 2*f* G<0, on perd …par contre pour f ~ f*/2 G ~ 6%,soit 25% de manque à gagner,seulement

-0.04

-0.02

0

0.02

0.04

0.06

0.08

0.1

0 0.2 0.4 0.6 0.8

G

f

f*

1.Pour un avantage aussi minime soitil (p=0.53), le taux de croissancereste respectable G*~ 1.8%(doublement en 385 coups) mais lelevier doit rester très faible : 6%2. Les pertes interviennent dès 12%de levier. à f ~ 60%, taux decroissance probable ~ -18% après 12périodes, le capital restant le plusprobable n'est plus que 11% ducapital initial … exp(-0.18*12)

-0.2

-0.18

-0.16

-0.14

-0.12

-0.1

-0.08

-0.06

-0.04

-0.02

0

0.02

0 0.2 0.4 0.6 0.8

G

f

p=0.53 q=0.47 f*=0.06

G*=0.01801

-0.05

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0 0.2 0.4 0.6 0.8 1

G

p=0.9, q=0.1f*=0.8 et G~36.8%gains très élevés,G chute très rapidement au delà de f*encore une fois mieux vautsous estimer f*

Il vaut mieux "sous-parier" que "sur-parier"En trading, faut faire comme les anglais: roulez à gauche

4

Page 4


Mieux comprendre KellyPortefeuilles exponentiels, fortement improbables

Quasi nul, mais pas derisque de ruine ….

L'espérance du portefeuilleE(Wn/W0) = E(W1/W0)n=((2p-1)f+1)n

est constituée de termes exponentiellement grandset fortement improbables

Propriétés analogues à la distribution log normale : de fait, log (Wn/W0) peut être approché par une loi normale

moyenne

variance

log (Wn/W0) ≈ gaussienne

(1+f)4

(1+f) 4(1-f)

(1+f)5

(1+f) 3(1-f)2

(1+f) 2(1-f)3

(1+f)(1-f)4

(1-f)5

(1+f)3

(1+f) 3(1-f)

(1+f) 2(1-f)2

(1+f)(1-f)3

(1-f)4

(1+f)2(1-f)

(1+f)(1-f)2

(1-f)3

(1-f)2

(1+f)(1-f)

(1+f)2

(1+f)

(1-f)

p

p

p

p

p

p

p

p

p

p

p

p

p

p

p1-p

1-p

1-p

1-p

1-p

1-p

1-p

1-p

1-p

1-p

1-p

1-p

1-p

1-p

Kelly ⇔ Maximiser le portefeuille médian⇔ Maximiser la moyenne géométrique des P&L

le portefeuille de Kelly est aussi le portefeuille médian


Le levier se traduit directement terme de niveau de risquesigma(levier) = levier * sigma,

si bien que l'on peut représenter la valeur terminale probable TWR en fonction du risque.

La performance n'est pas croissante avec le risque, mais atteint un maximumcorrespondant au levier optimal.

risque= levier*volatilité

performance

TWR = valeur terminale du portefeuilleaprès N périodes

5

Page 5


Kelly - Application modèle binomial et Futures (suite)

gain: w %, avec probabilité=p, perte: l %, avec probabilité=q=1-pg=p log(1+fw)+q log(1-fl) f*=(pw-ql)/(wl) = a/(wl) avec a= pw-ql espérance arithmétique

Exemple: contrat Future CAC40, stratégie de type brackettrading encadrement des gains + des pertesprofit exit à +20 pts et stoploss à -20pts, un trade par jour …

Capital par contrat = WL / (p W-qL)= Kn contrats = arrondi.inf(Capital/K)

0%

10%

20%

30%

40%

50%

60%

0 50 100 150 200 250

jours

cro

issa

nce

Kelly Buy&Hold

sous jacent en pts S 3000multiplicateur m 10valeur contrat m*S 30000Systeme de tradingdelta pts pts 20cout c 4gain/contrat W=m*pts-c 196perte/contrat L=m*pts+c 204proba gain p 0,54proba perte q=1-p 0,46probacritique pc=L/(W+L) 0,510gain en % sous jacent w 0,65%perte en % sous jacent l 0,68%Espérance a=p w-q l 0,040%Kellyf* f*=a/(w l) 9,00taux de croissance / trade G*=p ln(1+f w)+q ln(1-f l) 0,180%nb trades n 250taux de croissance global exp(nG*) 1,57% 56,96%catipal requis par contrat W L /(pW-qL) 3332capital 10 000nombre de contrats 3marge / contrat 2400n contat/marge 4,2


Kelly - Exemple Futures (suite)

Suppose être investi avec levier 22 sur future DAX :quasiment 100% de la marge !!!Avec 55 contrats en fin de période !!!

problèmes ?

P(gain) trop optimiste ?Stationnarité des probabilités ?slippage ? (gain et pertes réelles != attendues)avantage vs taille des ordres vs Liquidité ?Complexité opérationnelle avec la taille ?

Soit plus de 1000% / an !!!! Cherchez l'erreur …..

Exemple type contrat DAX, multiplicateur = 25delta trading à +/- 20 pts, probabilité gain = 0.58

0%200%400%600%800%

1000%1200%1400%1600%1800%2000%

0 50 100 150 200 250

jours

cro

issa

nce

Kelly Buy&Holdsous jacent en pts S 3 000multiplicateur m 25valeur contrat m*S 75 000Systeme de tradingdelta pts pts 20cout c 4gain/contrat W=m*pts-c 496perte/contrat L=m*pts+c 504proba gain p 0,58proba perte q=1-p 0,42probacritique pc=L/(W+L) 0,504gain en % sous jacent w 0,66%perte en % sous jacent l 0,67%Espérance a=p w-q l 0,101%Kellyf* f*=a/(w l) 22,80taux de croissance / trade G*=p ln(1+f w)+q ln(1-f l) 1,161%nb trades n 250taux de croissance global exp(nG*) 18,21% 1720,67%catipal requis par contrat W L /(pW-qL) 3 289capital 10 000nombre de contrats 3marge / contrat 2 400n contat/marge 4,2capital en fin de periode 182 067n contrats 55Buy & Holdf*/2 11G(f*/2) 0,87%

8,77

6

Page 6


Sensibilité

0

10

20

30

40

50

60

0.5 0.55 0.6 0.65 0.7

levier

p succès

Très grande sensibilité du levier enfonction de la probabilité de succès

delta(levier) = 2S/pts delta(p) = 600 delta(p)delta(p)=0.01 => delta(levier)=6 !!!

Grande sensibilité du levier vs estimation des gains et pertes.

exemple précédent : bracket trading autour de 20 pts sur DAX, avec p(succès)=0.58 => f* ≈ 22si le gain passe à 19 pts au lieu de 20 pts,ou la perte passe à 21 pts au lieu de 20,f* passe à 7 au lieu de 22 !!!

Or: l'espérance d'un perte est plus souvent plus grande qu'attendue et celle d'un gain plus faible …les raisons peuvent être multiples :spread (bid/ask), chasse aux ordres stop, pb de liquidité, stoploss en situation de krach, …


Désir et réalité

Taille des positions

Performance

Les positions ne peuvent par être multipliées àl'infinie sans tenir compte de facteurs quidétériorent la performance:- liquidité- profondeur de marché (impacts)

La stratégie de Kelly suppose le même succès avec 55 contrats qu'avec un seul: c'est faux … La probabilité gain décroît avec la tailleRappelez vous sur-estimer le levier est catastrophique …. or le levier est très sensible à la probabilité de gain ...

=>

estimation réaliste des probabilités de gain en fonction de la liquidité et autres facteurs de risquestratégie moins agressive (Kelly Fractionnel)diversification multi supports / multi stratégies

7

Page 7


Exemple levier optimal - marché action

LES DANGER D'UN LEVIER TROP ELEVE: exemple:

+ 25% ou -15% par mois avec probabilités 50/50

Avec une levier de 5, pour une mise de départ de 100, au bout de 12 mois, le capital probable est de 3 !!!!

Le levier optimal est 1.33 = (.5.025-.5*.15)/(.25*.15), gain géométrique moyen = 3%, gain probable au bout de 12 mois = 47%ce qui est fort différent d'une perte de -97% avec un levier de 5 !!!

Ruine certaine si levier = 1/perteMax = 6.67,

risque élevé et perte , si on utile un levier = 2 * levier optimal

En revanche : utiliser un levier prudent = levierOptimal/2, entraine un manque a gagner de 25% seulement.

!!!! Les rendements sont multiplicatifs ….Après une perte de 50%, il faut 100% de hausse pour se "refaire" ...

Le critère de Kelly est la stratégie optimale: le portefeuille le plus probable croit de manière exponentielleW(T)=exp(T sharpe 2) W0sharpe= µ/σ

Comparaison Buy&Hold et stratégie optimale active:


Exemples

Fonctionne mieux en ajustement intraday sur futures avec faibles coûts de transaction:levier de 2 du sous jacent <=> nContrats = 0.2 Capital / valeurSousJacentnContrats= levier Capital / multiplicateur * valeurSousJacent

Un levier constant amplifie les hausses

… et les baisses

un levier trop grand (5)conduit a des pertes rapides

8

Page 8


Exemples (suite)

NASDAQ

S&P 500Utilisation d'un levier constant ~ 2

Peut mieux faire en intraday future,avec une estimation dynamique des volatilités:taux sans risque : r ≈ 2%µ= rendement+σ2/2, rendement ≈ 5%levier optimal (σ)= (µ-r)/σ2 = ½ + 0.03/ σ2

Opportunités en ce moment (Nov. 2003) ?car faible volatilité (historique) et reprise économique=> autorise des leviers plus élevés …

Plus de 60 fois la valeurdu NASDAQ et pourtantle levier n'est que de 2


NASDAQ en levier 5

Levier 5démontre le caractère exponentielde la stratégie :NASDAQ * 3500 !!!bien loin de NASDAQ*5explosion à la hausse …

mais implosion à la baisse ….

Reste quelques cents …

9

Page 9


Ajustements dynamiques

Les stratégies de type Kelly (ou basées sur une fu isoélastique) nécessitent des ajustements permanents, afin demaintenir une proportion constante ("Constant Rebalanced Portfolios"):

f<1 ⇒ δq δS < 0 ⇒ CONTRARIENon doit ajuster en sens inverse de la variation:acheter lorsque l'actif baisse, vendre lorsquel'actif est en hausse.

f>1 ⇒ δq δS > 0 ⇒ SUIVEURon doit acheter lorsque l'actif monte et vendrelorsqu'il baisse.

f=1: on est investi à 100% dans l'actif risqué,et on le restera même en cas de hausse ou debaisse de l'actif.

Soit un portefeuille d'une valeur 1000 avec seul actif risqué de valeur unitaire 10, avec un levier de 4. On détient donc 400=(1000/10)*4unités de l'actif. Le mois suivant, l'actif perd 20%, l'actif passe à 80. Le levier étant de 4, la perte en capital est quatre fois plus importante,la valeur du portefeuille devient 3200=400*80 !!! Pour maintenir un levier constant de 4, il faut ajuster le nombre d'unités en fonction : desnouvelles valeurs du portefeuille (3200) et l'actif 80, soit un nombre d'unités : 160=(3200/80)*4, il faut donc alléger de 400-160=240 unités,soit de 60% =(4-1)*20% (cf ci dessous)

On doit ajuster la quantité pour vérifier :

Donc


Kelly - Distribution quelconque

f* ≈ <r>/<r2>2 f*f*/2

G*

3/4 G*

f

GG ≈ f<r>- f2 <r2>/2

p(r) distribution des rendements discrète ou continue

solutions approchées au second ordre:

Exemple:perteMax=20%alors f* << 5

Solution approchée (très grossière)

Distribution discrète desrendements ri, avec probabilité pi

f* solution de :f* solution de :

Distribution continue

10

Page 10


Allocation optimale inter-temporelle en temps continu

Merton - Continuous Time Finance

Recherche de l'allocation optimale x

On retrouve les mêmes résultats que dans le cas mono-périodiqueavec Γ la matrice de covariance, ρ le vecteur des rendements (ρi = µi-r),r le taux sans risque, γ l'aversion relative au risque.Solution par contrôle optimal stochastique (Hamilton-Jacobi-Bellman)

Cas d'actifs (ou stratégies) non corrélées

Résultat remarquable, sachant que µ et σ peuvent dépendre du temps

Mais: 1. suppose que les proportions sont ajustées en continu2 ne tient pas compte des coûts de transaction.

Cas mono actifrésultats analogues au CAPMà la différence essentielle que:- le CAPM est mono périodique- Kelly (ou Merton) est multi-périodique- dans le cas de Merton, les pondérationsvarient , mais faiblement=> réajustements toujours nécessaires

Applicable à tout processus,pas seulement I(1)Merton est applicable à des processus de retour à la moyenne(OU), …


Levier optimal - cas continu - exemple mono actif

Exemple d ’un modèle lognormal

la stratégie optimale consiste à maintenir un ratio constant dans l ’actif risqué :γ = aversion au risque γ=1, pour un f.u. en logarithme.

Exemple: action/indice classique: CAC40prime risque µ-r ≈ 4%,σ = volatilité ≈ 25%=> f=(µ-r) /σ2 = 0.04/0.25^2 = 0.64=> investi à 64% en CAC40 (si fu en log) :

MEDAF: le marché se comporte comme uninvestisseur ayant dont l'aversion au risque estγ = σ2 /(µ-r)

f* ~ 1 : traduit une hypothèse de non arbitrage Kelly vs Buy& Hold ?

Exemple f* tels que mesuréf* mesuré depuis

CAC40 0.91 1990DAX 1.3 1990E50 1.72 1990

DJI 1.54 1930NASDAQ 2 1984

11

Page 11


DJI

y = 0.7479x + 6E-05R2 = 0.3834

0

0.0005

0.001

0.0015

0.002

0.0025

0.003

0 0.0005 0.001 0.0015 0.002

<r>

sim

ga^

2

<r>/sigma^2pour les actions composant le DJI, depuis le 2 janvier 1962 au 6 mars 2002.

levier moyen f* ≈ 1.4

0 0.5 1 1.5 2 2.5 3

AA

AXP

BA

C

CAT

DD

DIS

EK

G E

G M

HD

HON

HWP

IBM

INTC

IP

JNJ

JPM

KO

MCD

MMM

M O

MRK

MSFT

PG

SBC

T

UTX

WMT

XOM


Comment gagner sur une actif qui perd …

si Rendement = 0, l'action reste stable

Une stratégie active permet néanmoins de gagneren restant investi à 50% à tout instant …

car R=0 => µ= σ2 /2 > 0 => levier f*=µ/σ2 =0.5taux de croissance optimal G*(r=0) = ½ µ2/σ2 = σ2 /8

si σ=40% G*(r=0)=2% / anpas trop mal pour une action qui stagne …et plus elle est volatile meilleure est la performance !!!si σ=100% G*(r=0)=12.5% / an

Source maslov, Zhang

Kelly gagnetout en restantà l'achat sur un actifqui perd !!!

!!! ln ST/S0 ~ gaussienne moyenne (µ - σ2/2)T et variance σ 2 T

La stratégie de type Kelly (portefeuille CRP)peut être vue comme un système de "capture"de la volatilité …

Compatible avec l'efficience des marchés: l'effet dela stratégie de Kelly sera de réduire de la volatilité …"une centrale hydraulique qui va capturer une énergieproduite par la hauteur des vagues, aura pour effet deréduire la hauteur des vagues, mais peut on imaginerun océan sans vagues ni tempêtes …. " COVER

Fonctionne aussi pour R<0, dans la limite µ>0 donc µ < σ2 /2, dans ce cas f<1/2

f* peut être négatif (vente à découvert)

Le rendement moyen peut donc être ≤ 0, mais µ>0

Non seulement on peut battre le sous jacent avec un levier < 1 …mais on peut gagner sur un sous jacent qui décline …

12

Page 12


Levier et Sharpe

Sharpe ~ µ/σ, une autre mesure du rendement corrigé du risque …

Relation Kelly avec Sharpe:

Optimiser le taux de croissance est assez proche de l'optimisation du ratio de Sharpe ….

Sharpe dépend du temps :

si un facteur d'échelle en 0.5le levier optimal ne dépend pas du temps f*(intraday)=f(jour)=f(mois)=f(année)

pour être considéré comme une bonne stratégie, le Sharpe annuel doit être > 2

f ~ µ/σ2 => f=Sharpe/ σ

donc si Sharpe=2 et σ=10%, sur un seul actif, suppose un levier f= 20 !!!

(En première approche)


Sharpe

r=(1-x) rf + x rmσ = x σm=> r=rf + σ (rm- rf)/ σm

Non faisable

Sous optimal

Optimal:pente = ratio de Sharpe

13

Page 13


Drawdowns

Drawdowns = perte historique depuis le dernier plus hautmesure de risque agressive: A

B

CE

DF

H

G

I

drawdownsA/BC/DC / FC / H…..

Drawdown

Loi universelle: les queues de distribution des drawdowns suivent une loi puissance

Avec Γ solution de

Modèle binomial: gain Λ avec probabilité p, perte - Λ avec 1-p

Cas gaussien

1/Γ représente le drawdown probable.

Le Drawdown s'exprime aussi en %: D% = (Wmax-W)/Wmax=1-1/D, Probabilité (D%>x%) = P(D>1/(1+x))

ratio de sterling = rendement / maxDrawDown%exemple exigence forte: 30% rendement annuel, max drawdown 10% (Sterling=3)


Kelly et les drawdowns

Portefeuille de Kelly se comporte comme un processus gaussien multiplicatif:

Exposant de la densité des Drawdowns

Hypothèse : investissement dans un actif risque de rendement (instantané) µ et volatilité σ2

Le drawdown est sur le point de divergerespérance et variance infinies

Justifie, encore une fois, l'intérêt d'utiliser des stratégies moins agressives (kelly fractionnel)

Avec f*/2, l'espérance et la variance sont finies

⇒

Résultat universel: indépendant de la distribution des rendements !!!

14

Page 14


Drawdowns (suite)

Exemplesτ = 4 Prob(perte historique > 50%) ~ 12,25%50% <=> capital/2 depuis le plus haut historique τ = 4 correspond à un Kelly/2

τ = 2 Prob(perte historique > 50%) ~ 50% !!!τ = 2 correspond à Kelly

Une méthode simple pour définir une gestion cohérente:

exigences de gestion:rendement 30% par anmax drawdown, ne doit pas dépasser 10% (au seuil de 5%)

=> τ > 30 DD%=10% DD=1/(1-0.1) P(> DD) ~ DD^(- τ-1)< 5% τ > 1+log(0.05)/ log(1-0.1)=29.43,

τ =2µ/σ2 et µ=30%=> σ < 15%=> sharpe = µ/σ > 2

P(D>-drawdown)DD% 10% 20% 30% 40% 50% 60% 70% 80%DD=Wmax/W 1.11 1.25 1.43 1.67 2.00 2.50 3.33 5.00tau 2 0.9000 0.8000 0.7000 0.6000 0.5000 0.4000 0.3000 0.2000

3 0.8100 0.6400 0.4900 0.3600 0.2500 0.1600 0.0900 0.04004 0.7290 0.5120 0.3430 0.2160 0.1250 0.0640 0.0270 0.00805 0.6561 0.4096 0.2401 0.1296 0.0625 0.0256 0.0081 0.00166 0.5905 0.3277 0.1681 0.0778 0.0313 0.0102 0.0024 0.00037 0.5314 0.2621 0.1176 0.0467 0.0156 0.0041 0.0007 0.00018 0.4783 0.2097 0.0824 0.0280 0.0078 0.0016 0.0002 0.00009 0.4305 0.1678 0.0576 0.0168 0.0039 0.0007 0.0001 0.0000

DD% = (Wmax-W)/Wmax=1-1/DDDD=1/(1-DD%)Probabilité (DD%>x%) = P(DD>1/(1+x))

Si une stratégie de type Kelly (proportion constante), sous entend d'utiliser un levier 15 fois inférieur à celui de Kellyaversion relative pour le risque de l'ordre de 15


Kelly Fractionnel

Malgré la prise en compte des risques, le levier optimal de kelly reste agressif,

Une mauvaise estimation des paramètres peut conduire à une sur estimation du levier et donc:décroissance rapide du capital dans des drawdowns sévères

Il est plus "prudent" d'utiliser des fractions du levier optimal: se placer à f*/2, f*/4.

Kelly Fractionnel: utiliser un levier f=δ f*, avec 0<δ<1<=>maximiser la fonction d'utilité U(w)= w 1- γ /(1- γ)

γ est l'indice d'aversion relatif pour le risque: plus γ est grand et plus l'agent est risquophobe.

À la limite γ = 1, la fonction d'utilité est le logarithme.

δ γ utilité G*(δ )/G*1/2 2 -w - 1 .751/3 3 -w - 2 .561/4 4 -w - 3 .44

le levier optimal est f*(γ)= 1/ γ µ/σ2

15

Page 15


Caculs des coûts de transaction


Investissement "optimal" et coûts de transactions

Cette stratégie exige un ajustement permanent pour maintenir un ratio constant dans l'actif risqué: soit "f" ce ratio,l'ajustement quotidien devrait être de l'ordre de (f-1)*variationActif

f=1 on est investi à 100% en permanence.f<1, on est contrarien ... hausse => vente, baisse => achatf>1 on est suiveur de tendance: hausse => achat, baisse => vente

Il existe des "no trade regions" : re-équilibrage uniquement lorsque le ratio sort de bornes fmax, fmin,

exemple µ=12,5%, σ=20%, f=0.6, avec des coûts de 0,5%, ne pas faire réajuster tant que f reste dans un intervalle del'ordre de 10% autour de f.

La région de "non trading est proportionnelle à la racine cubique des coûts (ref: Leland, Baviera, … )si c= coût %

Si µ/σ2 ≈ 0 ou 1, ∆f ≈ 0∆f maximum pour µ/σ2 ≈ 0.5, le sous jacent est quasi stable (rendement = µ - 0.5 σ2 ≈ 0)

permet de retrouver la variationnécessaire de l'actif pour sortir de la zone de "non trading"

Impact très important des coûts de transaction sur une gestion active

16

Page 16


Levier, coûts de transaction et taux de croissance


Quantités

Les quantités ne sont pas indivisibles …. Pour justifier d'un réajustement encore faut il que δq soit entier(peut poser probl ème sur futures notamment … )δq=1 ⇒

la pondération optimale w* réalise le maximum du taux de croissance =>

Conclusion : en raison des coûts et des quotités, il n'est pas possible d'ajuster en permanence:Quelle conséquence sur le taux de croissance ?

17

Page 17


Le levier optimal est très sensible aux plus fortes pertesdonc aux queues de distribution:

Levier optimal, asymétries, valeurs extrêmes

Cas d'une distribution, avec queue en loi puissance

Source: Thèse de Baviera

Le levier optimal est d'autant plus faible que:- la distribution a une asymétrie négative- la kurtosis est grande… ce qui est le cas de la plupart des actifs financiers !!! Mn= moment d'ordre n

=E(rn)


Estimation du levier optimal

Estimations indépendantes de µ et σ (voir après)

Estimation directes: résoudre

Méthodes adaptatives et itératives: voir Portefeuilles Universels

Cas multivarié et cas général:

Les contraintes pouvant être arbitraires (vente à découvert ou pas, contraintes sur actif particulier, secteurs, coût de transactions, …) : nécessite des programmes complexes d'optimisation dans le cas général

sinon, on pourra utiliserune premièreapproximation, du mondegaussien sans contraintes

Monde gaussien avec contraintes

L'erreur d'estimation du levier est en 1/σ ⇒ estimation d'autant meilleure que l'actif est volatile !!!

18

Page 18


Kelly-Conclusion (provisoire ….)

m Stratégie optimaleF avec le meilleur taux de croissance (si iid)F Le taux de croissance = taux de croissance certain équivalent (peut être comparé

au taux sans risque)F minimise aussi la durée pour atteindre un objectifF le risque de ruine n'existe pas … en principe

m Points critiques :F Stratégie très active : maintenir un ratio constant a tout moment => tenir

compte des coûts de transaction.F Risque importants en cas de dépassement du levier optimal, les drawdowns

peuvent être sévères …F Positions pouvant être importantes => Kelly FractionnelF Suppose une modélisation correcte: nécessité une estimation correcte des

rendements et risques attendus. le plus délicat étant l'estimation des rendementsF mais …. Il existe aussi des méthodes "non paramétriques"


Exemple Kelly adaptatif (et universel)

Phase d'apprentissage

Mesures de performance: Sharpe, Sterling

Sterling= performance/maxDrawDown

19

Page 19


Kelly adaptative (suite)

Krach de 87le levier est très sensible aux fortes pertesaura du mal a s'en remettre

Richesse finale = 737 506, soit ~ un facteur de l'ordre de 1000Échelles logarithmiques !!!

Gain > x 1000


^FCHI from:19900301 to:20031110constant leverage (f) Terminal wealth return: W(T)/W0

asset (f*=1.0) 1 3425.19 1.872 3232.15 1.765 41.52 0.02

optimal F in Hindsight 0.92 3335.66 1.82Adaptative 0.92 11888.23 6.49

^GDAXI from:19901126 to:20031110constant leverage (f) Terminal wealth return: W(T)/W0

asset (f*=1.0) 1 3746.24 2.62 4683.13 3.245 100.55 0.07

optimal F in Hindsight 1.3 4332.21 3Adaptative 1.3 23823.55 16.51

^SSMI from:19901109 to:20031110constant leverage (f) Terminal wealth return: W(T)/W0

asset (f*=1.0) 1 5242.2 3.782 12377.27 8.925 9128.01 6.58


^STOXX50E from:19911231 to:20031114constant leverage (f) Terminal wealth return: W(T)/W0

asset (f*=1.0) 1 2656.94 2.662 4024.5 4.025 449.04 0.45


A noter, la méthode adaptative fait mieux que le meilleure CRP a posteriori !!!

20

Page 20


Estimation de la tendance

Finalement, pour appliquer Kelly, dans un modèle paramétrique en f=µ /σ2 il faut estimer deux paramètres essentiels: µ et σle plus délicat est l'estimation de µ … a moins de le définir ex ante: en prenant par exemple le taux des dividendes …

Estimation à partir des rendements historiques: le meilleur estimateur est la moyenne:r = (∑ ri)/navec ri = ln(Si /Si-1)se réduisant à r = ln(Sn /Sà) /nles valeurs intermédiaires ne servent pas !!!On a interet à choisir la période la plus longue possible.

Pour un actif ~ lognormal (5%,20%)intervalle de confiance an à 95% ~ 5% ± 1.64*20% !!!N'est pertinent que lorsque r devirent ~ σ, c'est à dire au bout de T tq Tr ~ T½ σ, ie. T ~ σ2/r 2 =0.22/0.052 = 8 ans

nota: temps caractéristique = 1/sharpe2

Si Sharpe annuel = 2, on pourra juger de la pertinence du rendement au bout de 3 mois de tracking seulement !!!

Vous avez dit tendance ?


Estimations de la volatilité

L'estimation de la volatilité est essentielle: gestion du risque, pricing dérivés, leviers, …

Estimateur utilisant tous les ticks:

Zhouet variantes …

Les estimateurs utilisant les plus haut / plus bas sontbeaucoup plus efficaces (x10) et réactifs

La mesure du range (plus haut - plus bas) est parmi lesmeilleurs estimateurs de volatilité

Estimation à partir des cours de clôture (ou last)

Riskmetrics (JP Morgan)

µ=0.94 soit temps caractéristique de 16 jours ouvrés, soit 3 semaines environ≈ GARCH(1,1)

Méthodes utilisant les extremums:Rogers Satchell, Parkinson, Garman Klass, True RangeMaximum de vraisemblance de la distribution des +hautet +bas

21

Page 21


Estimations de la volatilité (suite)

Pourquoi utiliser les plus haut et plus bas ?

- utilise toutes les données disponibles

- les extremum sont des mesures agrégées sur toute une période: les open/close ne sont que photos à des moments précis

- permet d'effecteur des mesure plus précises, robustes et réactives (meilleur résultat avec moins d'historique)


Estimateur de volatilité par maximum de vraisemblance avec Open/Close/High/Low

Source: Malik MagdonIsmail, Amir F. AtiyaVolatility Estimation Using High, Low, and Close Data(Algorithmes implémentés dans YATS)

22

Page 22


Estimateurs de Volatilité

Les estimateurs utilisant les plus haut / plus bas sont :- plus réactifs aux changements de régime - plus lisses (indicant une moindre variance)


Backtests et Data Snooping

Risque de Data Snooping: Trouver des stratégies qui ne sont que des artefacts dans les données.

Essayer de très nombreux systèmes avec de très nombreux paramètres, éventuellement optimiser ces paramètresne sélectionner que les meilleurs, sans savoir pourquoi ils fonctionnent=> forte probabilité pour ne sélectionner que des Snoopy: c'est à dire des systèmes qui fonctionnent à merveille sur le passé et vont se révéler catastrophiques en réel.

DATA SNOOPING dans une marche aléatoire:Prenons le cas d'une marche aléatoire, avec un certain nombre de data générée, représentant un historique de marchédans ce cas E[gain de tout système] est <0 = coût de transactionon réalise des backtests de 900 trades de quoi donner confiance au trader, confiance illusoire …Essayons plusieurs milliers de systèmes …disons 10 000 (il suffit de tester un système avec 4 paramètres pouvant prendre 10 valeurs différentes)avec des performances additives: perf globale =∑ perf tradesla performance globale est une v.a. (gaussienne, le théorème de la limite centrale)de moyenne nulle et variance(perf globale)=n variance(trade) (1+2ρ)supposons σ(trade)=1500, et autocorrélation ρ=0.3> 0, car on utilise des stop loss.variance(900 trades) = 56921 au lieu de 45000 si pas d'AC (l'AC > 0 des trades entraîne un risque plus élevé)les 10 meilleurs systèmes sur 10 000 essayés correspondent au quantile 10/10000 de la gaussienne N(0, 45000)soit une espérance de gain de 195 par trade pour le plus mauvais des 10 meilleurs !!! Avec une bonne t-stat=3.9Si on a affaire à des queues plus épaisses, l'illusion sera encore plus aveuglante ….

Comment éviter le data snooping ?- modélisation + explication des anomalies

23

Page 23


Trading et modélisation

Modélisation = simplification du réel

Exemple de modèles: croissance optimale / capture de volatilité

mean reversion (series AR(1), ARIMA, avec coefficient de rappel)Pairs trading, co intégration,Chaînes de Markov,

recherche de solutions analytiques ou par simulation de Monte Carlo

Fit: Data réelle = Modèle + ε0

Simulations: Data Synthétiques = Modèle + ε1, avec ε1 ≡ ε0

A la différence essentielle que l'on peut générer autant de données que nécessaire pour"résoudre" le système, trouver les paramètres optimaux, le maximum de la fonctionobjectif (exemple utilité horaire), sans soupçon de data snooping ou suroptimisation.

On reporte le risque de data snooping sur le risque de modèle: Inadéquation du modèle,Mauvais usage du modèle, Approximations grossières, Bugs dans le développement,Données instables, …


backtesting

m Définir le système de trading: traduire l'idée en modèle, puis en règlesF claires et non ambiguës, pouvant donner lieu a programmationF cohérentesF complètes: prévoir tous les cas

m Définir sa fonction d'utilitém Se placer dans des conditions les plus fidèles

F Prise en compte des coûts de transactionF de la fourchette bid/ask, ou sinon du slippage (ersatz de spread lorsqu'on ne

dispose pas de tous les ticks)F délais de transmission des ordres et des priorités à l'exécution, …

m Tester et backtester sur les données du marché ou par simulation de montecarlo.

m Optimisations:F avec prudence sur les données réelles,F sans modération sur les modèles.

m études de sensibilitéF aux valeurs des paramètresF à des étalons : au système de trading idéal et parfait, au système aléatoire

24

Page 24


Critères de performance et contraintes

On doit choisir une fonction d'utilité à optimiser parmi:

- la fonction d'utilité classique : isoélactique (logarithme, puissance), …

- une utilité terminale ou utilité par unité de tempsexemple: on pourra chercher à optimiser l'utilité/jouren principe, l'utilité/jour devrait donner une idée du revenu certain équivalent (à comparer à un salaire, par exemple)

- le ratio de Sharpe : rendement/volatilité

- le ratio de Sterling : rendement/maxDrawDown

- une pénalisation des performances (pessimistic ratio de Pardo)

- minimiser la VaR

Ajouter à cela des contraintes Sur la fonction objectif: exemple: rejet de toute solution dont - le maxDrawDown serait > 10%- le nombre de trades serait jugé insuffisant (pour des raisons de signification statistiques, …)- etc … Sur les paramètres du système:marge ? la somme des pondérations libre ou contraintes = 1 ou =X avec X = levier uatorisévente à découvert ? (pondération<0?)maximum/minimum sur certaine actifs, classes d'actifs, contraintes sur les paramètres des indicateurs techniques, …


Stop Loss

Le Stop Loss est une pratique courante pour limiter les pertes

Exemple: position sur CAC40 Future, stop loss à -10pts deperte=> permet de s'assurer que la perte ne dépassera jamais 10pts….

Oui mais … si on continue et sans traitement complémentaire,le résultat sera le même

Si une stratégie est mauvaise, elle restera mauvaise, mêmeavec stop loss.

En général, le stop loss fait apparaître des autocorrélationspositives.

Stop loss

Stop loss

Stop loss

25

Page 25


Auto corrélation des trades

perte constatéearrêt trading réel, passage en mode virtuelgain virtuel:reprise du trading réel

Après traitement, il n'y a plus d'autocorrélation évidente

En général la série des trades d'un système de trading présente de fortes auto corrélations positives (mauvaisemodélisation, …). Tout n'est pas perdu: on peut appliquer un système "anti autocorrélation"

exemple: Win=20, Loss=-20 Cost=4 probabilité(win)=0.5Système brut : perte -1080 : Avec traitement Anti AC: gain de 544 !!!

Système ultra simpliste: si AC >0, alors les proba(perte|perte)>0.5,il suffit alors d'arrêter après une perte, et reprendre après le premier gain ...

Utilisation possible d'algorithmes plus sophistiqués de prédiction on line …

Documents

Économétrie des Marchés Financiers Stratégies …yats.free.fr/doc/strategies-1-fr-ppt.pdf · Indice relatif d€’aversion au risque = 1, On tentera donc de maximiser la satisfaction