Upload
ngonhu
View
222
Download
0
Embed Size (px)
Citation preview
1
Page 1
Daniel HERLEMONT http://www.yats.com 1
Économétrie des Marchés Financiers
-Stratégies d'investissement
Daniel HERLEMONT http://www.yats.com 2
Utilité espérée
↑ Rendement↓ Risques
↓ Rendement↑ Risques
U ’(w) > 0U ’ ’(w) < 0
w
U
Agent risquophobe: préfère un revenu certain à un même revenu espéré (et donc aléatoire)
L'utilité est censée mesurer la satisfaction de l ’agent, fonction d'un revenu aléatoire
Il y autant de f.u. que d ’agents …. Dépend de l ’aversion pour le risque de l ’agent
ma préférée : f.u. en logarithme ….Indice relatif d ’aversion au risque = 1,
On tentera donc de maximiser la satisfaction de l ’agent: maximun E [U(w)]
Aversion relative pour le risque = -w U"/U' = γne dépend pas du niveau de la richesse
2
Page 2
Daniel HERLEMONT http://www.yats.com 3
Utilité - exemple
104 16
UAversion aux risques : concavité de la f.u. E[U(w)] < U(E[w])à revenu égal, préférence pour le certain sur l’aléatoire
U(w)=ln(w)loterie : w1=4 avec p=0.5, w2=16 avec 1-p=0.5E[w]=p w1 + (1-p) w2 = 0.5*4+0.5*16=10
E[U(w)] = p U(w1) + (1-p) U(w2) = 0.5*ln(4)+0.5*ln(16)=ln(8)=U(8)
Quel est le revenu certain équivalent au revenu aléatoirerevenu aléatoire = équivalent certain + prime de risque 10 = 8 + 2
8
Cas général: λ = prime de risque U(E[w]-λ) = E[U(w)]prime risque absolue ≈ - 1/2 U"/U' variance(W)prime risque relative (en %) ≈ - 1/2 W U"/U' variance(W)pour de faibles variations, par un développement de Tayloraversion relative = - <W> U"/U' = 1 pour une f/u. en log
Exemple : portefeuille d'actions, avec rendement=10% volatilité=40%,prime de risque = variance/2 = 0.42/2= 8%, équivalent certain (salaire) = 10%-8%=2%pour un équivalent salaire de 100 000 € par an,il faut générer une performance 5 fois plus grande 500 000 € sur un portefeuille de 5 millions €et encore l'aversion au risque est faible
U(w)
w
Quel revenu certain (salaire) souhaiteriez vous en échange d’un revenu incertain (investissement) ?
E[U(w)]
U(E[w])
Indifférence: équivalent certain (8) vs revenu aléatoire (10)préférence revenu certain si revenu certain > 8préférence revenu aléatoire si revenu certain < 8
Daniel HERLEMONT http://www.yats.com 4
Kelly
m Kelly (1956 Bell Labs) avec Shannon, pose le problème suivant:F gain = doublement de la mise, avec une probabilité 1/2<p<1F perte de la mise, avec probabilité q=1-p
m Quelle proportion f du capital doit on miser ? f =levierm si p=1 : levier infini …m si p<1
F Si f=1, correspond au critère du maximum de l'espérancemais c'est la ruine assurée dès la première perte ….
F Si f=0, on ne profite pas d'un réel avantageF => f compris entre 0 et 1 …
m Solution de Kelly : maximiser le taux de croissance ….
Wn = valeur du portefeuille à la période n
On cherche à maximiser la moyenne du taux de croissance <=>
maximiser la moyenne géométrique <=>
Taux de croissance équivalent certain<=>
Maximiser une fonction d'utilité logarithmiquesur une seule période
sous certaines conditions (ergodicité)1/n Wn/W0 = 1/n [log Wn/Wn-1+log Wn-1/Wn-2+ …. log W1/W0]
→ E log W1/W0
3
Page 3
Daniel HERLEMONT http://www.yats.com 5
Kelly (formules)
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
0 0.2 0.4 0.6 0.8 1
G
f
f*
G*
En étroite relation avec la notion d'entropie …. H= -p log p - q log qMaximiser G <=> minimiser l'entropie H <=> maximiser la prédictibilité d'un signal (au sens Shannon)
Daniel HERLEMONT http://www.yats.com 6
Kelly (exemple)
p=0.7 q=0.3f*=p-q=0.4 et G* ~ 8%soit
Il vaut mieux sous estimer que surestimer f*pour f ~ 2*f* G<0, on perd …par contre pour f ~ f*/2 G ~ 6%,soit 25% de manque à gagner,seulement
-0.04
-0.02
0
0.02
0.04
0.06
0.08
0.1
0 0.2 0.4 0.6 0.8
G
f
f*
1.Pour un avantage aussi minime soitil (p=0.53), le taux de croissancereste respectable G*~ 1.8%(doublement en 385 coups) mais lelevier doit rester très faible : 6%2. Les pertes interviennent dès 12%de levier. à f ~ 60%, taux decroissance probable ~ -18% après 12périodes, le capital restant le plusprobable n'est plus que 11% ducapital initial … exp(-0.18*12)
-0.2
-0.18
-0.16
-0.14
-0.12
-0.1
-0.08
-0.06
-0.04
-0.02
0
0.02
0 0.2 0.4 0.6 0.8
G
f
p=0.53 q=0.47 f*=0.06
G*=0.01801
-0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0 0.2 0.4 0.6 0.8 1
G
p=0.9, q=0.1f*=0.8 et G~36.8%gains très élevés,G chute très rapidement au delà de f*encore une fois mieux vautsous estimer f*
Il vaut mieux "sous-parier" que "sur-parier"En trading, faut faire comme les anglais: roulez à gauche
4
Page 4
Daniel HERLEMONT http://www.yats.com 7
Mieux comprendre KellyPortefeuilles exponentiels, fortement improbables
Quasi nul, mais pas derisque de ruine ….
L'espérance du portefeuilleE(Wn/W0) = E(W1/W0)n=((2p-1)f+1)n
est constituée de termes exponentiellement grandset fortement improbables
Propriétés analogues à la distribution log normale : de fait, log (Wn/W0) peut être approché par une loi normale
moyenne
variance
log (Wn/W0) ≈ gaussienne
(1+f)4
(1+f) 4(1-f)
(1+f)5
(1+f) 3(1-f)2
(1+f) 2(1-f)3
(1+f)(1-f)4
(1-f)5
(1+f)3
(1+f) 3(1-f)
(1+f) 2(1-f)2
(1+f)(1-f)3
(1-f)4
(1+f)2(1-f)
(1+f)(1-f)2
(1-f)3
(1-f)2
(1+f)(1-f)
(1+f)2
(1+f)
(1-f)
p
p
p
p
p
p
p
p
p
p
p
p
p
p
p1-p
1-p
1-p
1-p
1-p
1-p
1-p
1-p
1-p
1-p
1-p
1-p
1-p
1-p
Kelly ⇔ Maximiser le portefeuille médian⇔ Maximiser la moyenne géométrique des P&L
le portefeuille de Kelly est aussi le portefeuille médian
Daniel HERLEMONT http://www.yats.com 8
Le levier se traduit directement terme de niveau de risquesigma(levier) = levier * sigma,
si bien que l'on peut représenter la valeur terminale probable TWR en fonction du risque.
La performance n'est pas croissante avec le risque, mais atteint un maximumcorrespondant au levier optimal.
risque= levier*volatilité
performance
TWR = valeur terminale du portefeuilleaprès N périodes
5
Page 5
Daniel HERLEMONT http://www.yats.com 9
Kelly - Application modèle binomial et Futures (suite)
gain: w %, avec probabilité=p, perte: l %, avec probabilité=q=1-pg=p log(1+fw)+q log(1-fl) f*=(pw-ql)/(wl) = a/(wl) avec a= pw-ql espérance arithmétique
Exemple: contrat Future CAC40, stratégie de type brackettrading encadrement des gains + des pertesprofit exit à +20 pts et stoploss à -20pts, un trade par jour …
Capital par contrat = WL / (p W-qL)= Kn contrats = arrondi.inf(Capital/K)
0%
10%
20%
30%
40%
50%
60%
0 50 100 150 200 250
jours
cro
issa
nce
Kelly Buy&Hold
sous jacent en pts S 3000multiplicateur m 10valeur contrat m*S 30000Systeme de tradingdelta pts pts 20cout c 4gain/contrat W=m*pts-c 196perte/contrat L=m*pts+c 204proba gain p 0,54proba perte q=1-p 0,46probacritique pc=L/(W+L) 0,510gain en % sous jacent w 0,65%perte en % sous jacent l 0,68%Espérance a=p w-q l 0,040%Kellyf* f*=a/(w l) 9,00taux de croissance / trade G*=p ln(1+f w)+q ln(1-f l) 0,180%nb trades n 250taux de croissance global exp(nG*) 1,57% 56,96%catipal requis par contrat W L /(pW-qL) 3332capital 10 000nombre de contrats 3marge / contrat 2400n contat/marge 4,2
Daniel HERLEMONT http://www.yats.com 10
Kelly - Exemple Futures (suite)
Suppose être investi avec levier 22 sur future DAX :quasiment 100% de la marge !!!Avec 55 contrats en fin de période !!!
problèmes ?
P(gain) trop optimiste ?Stationnarité des probabilités ?slippage ? (gain et pertes réelles != attendues)avantage vs taille des ordres vs Liquidité ?Complexité opérationnelle avec la taille ?
Soit plus de 1000% / an !!!! Cherchez l'erreur …..
Exemple type contrat DAX, multiplicateur = 25delta trading à +/- 20 pts, probabilité gain = 0.58
0%200%400%600%800%
1000%1200%1400%1600%1800%2000%
0 50 100 150 200 250
jours
cro
issa
nce
Kelly Buy&Holdsous jacent en pts S 3 000multiplicateur m 25valeur contrat m*S 75 000Systeme de tradingdelta pts pts 20cout c 4gain/contrat W=m*pts-c 496perte/contrat L=m*pts+c 504proba gain p 0,58proba perte q=1-p 0,42probacritique pc=L/(W+L) 0,504gain en % sous jacent w 0,66%perte en % sous jacent l 0,67%Espérance a=p w-q l 0,101%Kellyf* f*=a/(w l) 22,80taux de croissance / trade G*=p ln(1+f w)+q ln(1-f l) 1,161%nb trades n 250taux de croissance global exp(nG*) 18,21% 1720,67%catipal requis par contrat W L /(pW-qL) 3 289capital 10 000nombre de contrats 3marge / contrat 2 400n contat/marge 4,2capital en fin de periode 182 067n contrats 55Buy & Holdf*/2 11G(f*/2) 0,87%
8,77
6
Page 6
Daniel HERLEMONT http://www.yats.com 11
Sensibilité
0
10
20
30
40
50
60
0.5 0.55 0.6 0.65 0.7
levier
p succès
Très grande sensibilité du levier enfonction de la probabilité de succès
delta(levier) = 2S/pts delta(p) = 600 delta(p)delta(p)=0.01 => delta(levier)=6 !!!
Grande sensibilité du levier vs estimation des gains et pertes.
exemple précédent : bracket trading autour de 20 pts sur DAX, avec p(succès)=0.58 => f* ≈ 22si le gain passe à 19 pts au lieu de 20 pts,ou la perte passe à 21 pts au lieu de 20,f* passe à 7 au lieu de 22 !!!
Or: l'espérance d'un perte est plus souvent plus grande qu'attendue et celle d'un gain plus faible …les raisons peuvent être multiples :spread (bid/ask), chasse aux ordres stop, pb de liquidité, stoploss en situation de krach, …
Daniel HERLEMONT http://www.yats.com 12
Désir et réalité
Taille des positions
Performance
Les positions ne peuvent par être multipliées àl'infinie sans tenir compte de facteurs quidétériorent la performance:- liquidité- profondeur de marché (impacts)
La stratégie de Kelly suppose le même succès avec 55 contrats qu'avec un seul: c'est faux … La probabilité gain décroît avec la tailleRappelez vous sur-estimer le levier est catastrophique …. or le levier est très sensible à la probabilité de gain ...
=>
estimation réaliste des probabilités de gain en fonction de la liquidité et autres facteurs de risquestratégie moins agressive (Kelly Fractionnel)diversification multi supports / multi stratégies
7
Page 7
Daniel HERLEMONT http://www.yats.com 13
Exemple levier optimal - marché action
LES DANGER D'UN LEVIER TROP ELEVE: exemple:
+ 25% ou -15% par mois avec probabilités 50/50
Avec une levier de 5, pour une mise de départ de 100, au bout de 12 mois, le capital probable est de 3 !!!!
Le levier optimal est 1.33 = (.5.025-.5*.15)/(.25*.15), gain géométrique moyen = 3%, gain probable au bout de 12 mois = 47%ce qui est fort différent d'une perte de -97% avec un levier de 5 !!!
Ruine certaine si levier = 1/perteMax = 6.67,
risque élevé et perte , si on utile un levier = 2 * levier optimal
En revanche : utiliser un levier prudent = levierOptimal/2, entraine un manque a gagner de 25% seulement.
!!!! Les rendements sont multiplicatifs ….Après une perte de 50%, il faut 100% de hausse pour se "refaire" ...
Le critère de Kelly est la stratégie optimale: le portefeuille le plus probable croit de manière exponentielleW(T)=exp(T sharpe 2) W0sharpe= µ/σ
Comparaison Buy&Hold et stratégie optimale active:
Daniel HERLEMONT http://www.yats.com 14
Exemples
Fonctionne mieux en ajustement intraday sur futures avec faibles coûts de transaction:levier de 2 du sous jacent <=> nContrats = 0.2 Capital / valeurSousJacentnContrats= levier Capital / multiplicateur * valeurSousJacent
Un levier constant amplifie les hausses
… et les baisses
un levier trop grand (5)conduit a des pertes rapides
8
Page 8
Daniel HERLEMONT http://www.yats.com 15
Exemples (suite)
NASDAQ
S&P 500Utilisation d'un levier constant ~ 2
Peut mieux faire en intraday future,avec une estimation dynamique des volatilités:taux sans risque : r ≈ 2%µ= rendement+σ2/2, rendement ≈ 5%levier optimal (σ)= (µ-r)/σ2 = ½ + 0.03/ σ2
Opportunités en ce moment (Nov. 2003) ?car faible volatilité (historique) et reprise économique=> autorise des leviers plus élevés …
Plus de 60 fois la valeurdu NASDAQ et pourtantle levier n'est que de 2
Daniel HERLEMONT http://www.yats.com 16
NASDAQ en levier 5
Levier 5démontre le caractère exponentielde la stratégie :NASDAQ * 3500 !!!bien loin de NASDAQ*5explosion à la hausse …
mais implosion à la baisse ….
Reste quelques cents …
9
Page 9
Daniel HERLEMONT http://www.yats.com 17
Ajustements dynamiques
Les stratégies de type Kelly (ou basées sur une fu isoélastique) nécessitent des ajustements permanents, afin demaintenir une proportion constante ("Constant Rebalanced Portfolios"):
f<1 ⇒ δq δS < 0 ⇒ CONTRARIENon doit ajuster en sens inverse de la variation:acheter lorsque l'actif baisse, vendre lorsquel'actif est en hausse.
f>1 ⇒ δq δS > 0 ⇒ SUIVEURon doit acheter lorsque l'actif monte et vendrelorsqu'il baisse.
f=1: on est investi à 100% dans l'actif risqué,et on le restera même en cas de hausse ou debaisse de l'actif.
Soit un portefeuille d'une valeur 1000 avec seul actif risqué de valeur unitaire 10, avec un levier de 4. On détient donc 400=(1000/10)*4unités de l'actif. Le mois suivant, l'actif perd 20%, l'actif passe à 80. Le levier étant de 4, la perte en capital est quatre fois plus importante,la valeur du portefeuille devient 3200=400*80 !!! Pour maintenir un levier constant de 4, il faut ajuster le nombre d'unités en fonction : desnouvelles valeurs du portefeuille (3200) et l'actif 80, soit un nombre d'unités : 160=(3200/80)*4, il faut donc alléger de 400-160=240 unités,soit de 60% =(4-1)*20% (cf ci dessous)
On doit ajuster la quantité pour vérifier :
Donc
Daniel HERLEMONT http://www.yats.com 18
Kelly - Distribution quelconque
f* ≈ <r>/<r2>2 f*f*/2
G*
3/4 G*
f
GG ≈ f<r>- f2 <r2>/2
p(r) distribution des rendements discrète ou continue
solutions approchées au second ordre:
Exemple:perteMax=20%alors f* << 5
Solution approchée (très grossière)
Distribution discrète desrendements ri, avec probabilité pi
f* solution de :f* solution de :
Distribution continue
10
Page 10
Daniel HERLEMONT http://www.yats.com 19
Allocation optimale inter-temporelle en temps continu
Merton - Continuous Time Finance
Recherche de l'allocation optimale x
On retrouve les mêmes résultats que dans le cas mono-périodiqueavec Γ la matrice de covariance, ρ le vecteur des rendements (ρi = µi-r),r le taux sans risque, γ l'aversion relative au risque.Solution par contrôle optimal stochastique (Hamilton-Jacobi-Bellman)
Cas d'actifs (ou stratégies) non corrélées
Résultat remarquable, sachant que µ et σ peuvent dépendre du temps
Mais: 1. suppose que les proportions sont ajustées en continu2 ne tient pas compte des coûts de transaction.
Cas mono actifrésultats analogues au CAPMà la différence essentielle que:- le CAPM est mono périodique- Kelly (ou Merton) est multi-périodique- dans le cas de Merton, les pondérationsvarient , mais faiblement=> réajustements toujours nécessaires
Applicable à tout processus,pas seulement I(1)Merton est applicable à des processus de retour à la moyenne(OU), …
Daniel HERLEMONT http://www.yats.com 20
Levier optimal - cas continu - exemple mono actif
Exemple d ’un modèle lognormal
la stratégie optimale consiste à maintenir un ratio constant dans l ’actif risqué :γ = aversion au risque γ=1, pour un f.u. en logarithme.
Exemple: action/indice classique: CAC40prime risque µ-r ≈ 4%,σ = volatilité ≈ 25%=> f=(µ-r) /σ2 = 0.04/0.25^2 = 0.64=> investi à 64% en CAC40 (si fu en log) :
MEDAF: le marché se comporte comme uninvestisseur ayant dont l'aversion au risque estγ = σ2 /(µ-r)
f* ~ 1 : traduit une hypothèse de non arbitrage Kelly vs Buy& Hold ?
Exemple f* tels que mesuréf* mesuré depuis
CAC40 0.91 1990DAX 1.3 1990E50 1.72 1990
DJI 1.54 1930NASDAQ 2 1984
11
Page 11
Daniel HERLEMONT http://www.yats.com 21
DJI
y = 0.7479x + 6E-05R2 = 0.3834
0
0.0005
0.001
0.0015
0.002
0.0025
0.003
0 0.0005 0.001 0.0015 0.002
<r>
sim
ga^
2
<r>/sigma^2pour les actions composant le DJI, depuis le 2 janvier 1962 au 6 mars 2002.
levier moyen f* ≈ 1.4
0 0.5 1 1.5 2 2.5 3
AA
AXP
BA
C
CAT
DD
DIS
EK
G E
G M
HD
HON
HWP
IBM
INTC
IP
JNJ
JPM
KO
MCD
MMM
M O
MRK
MSFT
PG
SBC
T
UTX
WMT
XOM
Daniel HERLEMONT http://www.yats.com 22
Comment gagner sur une actif qui perd …
si Rendement = 0, l'action reste stable
Une stratégie active permet néanmoins de gagneren restant investi à 50% à tout instant …
car R=0 => µ= σ2 /2 > 0 => levier f*=µ/σ2 =0.5taux de croissance optimal G*(r=0) = ½ µ2/σ2 = σ2 /8
si σ=40% G*(r=0)=2% / anpas trop mal pour une action qui stagne …et plus elle est volatile meilleure est la performance !!!si σ=100% G*(r=0)=12.5% / an
Source maslov, Zhang
Kelly gagnetout en restantà l'achat sur un actifqui perd !!!
!!! ln ST/S0 ~ gaussienne moyenne (µ - σ2/2)T et variance σ 2 T
La stratégie de type Kelly (portefeuille CRP)peut être vue comme un système de "capture"de la volatilité …
Compatible avec l'efficience des marchés: l'effet dela stratégie de Kelly sera de réduire de la volatilité …"une centrale hydraulique qui va capturer une énergieproduite par la hauteur des vagues, aura pour effet deréduire la hauteur des vagues, mais peut on imaginerun océan sans vagues ni tempêtes …. " COVER
Fonctionne aussi pour R<0, dans la limite µ>0 donc µ < σ2 /2, dans ce cas f<1/2
f* peut être négatif (vente à découvert)
Le rendement moyen peut donc être ≤ 0, mais µ>0
Non seulement on peut battre le sous jacent avec un levier < 1 …mais on peut gagner sur un sous jacent qui décline …
12
Page 12
Daniel HERLEMONT http://www.yats.com 23
Levier et Sharpe
Sharpe ~ µ/σ, une autre mesure du rendement corrigé du risque …
Relation Kelly avec Sharpe:
Optimiser le taux de croissance est assez proche de l'optimisation du ratio de Sharpe ….
Sharpe dépend du temps :
si un facteur d'échelle en 0.5le levier optimal ne dépend pas du temps f*(intraday)=f(jour)=f(mois)=f(année)
pour être considéré comme une bonne stratégie, le Sharpe annuel doit être > 2
f ~ µ/σ2 => f=Sharpe/ σ
donc si Sharpe=2 et σ=10%, sur un seul actif, suppose un levier f= 20 !!!
(En première approche)
Daniel HERLEMONT http://www.yats.com 24
Sharpe
r=(1-x) rf + x rmσ = x σm=> r=rf + σ (rm- rf)/ σm
Non faisable
Sous optimal
Optimal:pente = ratio de Sharpe
13
Page 13
Daniel HERLEMONT http://www.yats.com 25
Drawdowns
Drawdowns = perte historique depuis le dernier plus hautmesure de risque agressive: A
B
CE
DF
H
G
I
drawdownsA/BC/DC / FC / H…..
Drawdown
Loi universelle: les queues de distribution des drawdowns suivent une loi puissance
Avec Γ solution de
Modèle binomial: gain Λ avec probabilité p, perte - Λ avec 1-p
Cas gaussien
1/Γ représente le drawdown probable.
Le Drawdown s'exprime aussi en %: D% = (Wmax-W)/Wmax=1-1/D, Probabilité (D%>x%) = P(D>1/(1+x))
ratio de sterling = rendement / maxDrawDown%exemple exigence forte: 30% rendement annuel, max drawdown 10% (Sterling=3)
Daniel HERLEMONT http://www.yats.com 26
Kelly et les drawdowns
Portefeuille de Kelly se comporte comme un processus gaussien multiplicatif:
Exposant de la densité des Drawdowns
Hypothèse : investissement dans un actif risque de rendement (instantané) µ et volatilité σ2
Le drawdown est sur le point de divergerespérance et variance infinies
Justifie, encore une fois, l'intérêt d'utiliser des stratégies moins agressives (kelly fractionnel)
Avec f*/2, l'espérance et la variance sont finies
⇒
Résultat universel: indépendant de la distribution des rendements !!!
14
Page 14
Daniel HERLEMONT http://www.yats.com 27
Drawdowns (suite)
Exemplesτ = 4 Prob(perte historique > 50%) ~ 12,25%50% <=> capital/2 depuis le plus haut historique τ = 4 correspond à un Kelly/2
τ = 2 Prob(perte historique > 50%) ~ 50% !!!τ = 2 correspond à Kelly
Une méthode simple pour définir une gestion cohérente:
exigences de gestion:rendement 30% par anmax drawdown, ne doit pas dépasser 10% (au seuil de 5%)
=> τ > 30 DD%=10% DD=1/(1-0.1) P(> DD) ~ DD^(- τ-1)< 5% τ > 1+log(0.05)/ log(1-0.1)=29.43,
τ =2µ/σ2 et µ=30%=> σ < 15%=> sharpe = µ/σ > 2
P(D>-drawdown)DD% 10% 20% 30% 40% 50% 60% 70% 80%DD=Wmax/W 1.11 1.25 1.43 1.67 2.00 2.50 3.33 5.00tau 2 0.9000 0.8000 0.7000 0.6000 0.5000 0.4000 0.3000 0.2000
3 0.8100 0.6400 0.4900 0.3600 0.2500 0.1600 0.0900 0.04004 0.7290 0.5120 0.3430 0.2160 0.1250 0.0640 0.0270 0.00805 0.6561 0.4096 0.2401 0.1296 0.0625 0.0256 0.0081 0.00166 0.5905 0.3277 0.1681 0.0778 0.0313 0.0102 0.0024 0.00037 0.5314 0.2621 0.1176 0.0467 0.0156 0.0041 0.0007 0.00018 0.4783 0.2097 0.0824 0.0280 0.0078 0.0016 0.0002 0.00009 0.4305 0.1678 0.0576 0.0168 0.0039 0.0007 0.0001 0.0000
DD% = (Wmax-W)/Wmax=1-1/DDDD=1/(1-DD%)Probabilité (DD%>x%) = P(DD>1/(1+x))
Si une stratégie de type Kelly (proportion constante), sous entend d'utiliser un levier 15 fois inférieur à celui de Kellyaversion relative pour le risque de l'ordre de 15
Daniel HERLEMONT http://www.yats.com 28
Kelly Fractionnel
Malgré la prise en compte des risques, le levier optimal de kelly reste agressif,
Une mauvaise estimation des paramètres peut conduire à une sur estimation du levier et donc:décroissance rapide du capital dans des drawdowns sévères
Il est plus "prudent" d'utiliser des fractions du levier optimal: se placer à f*/2, f*/4.
Kelly Fractionnel: utiliser un levier f=δ f*, avec 0<δ<1<=>maximiser la fonction d'utilité U(w)= w 1- γ /(1- γ)
γ est l'indice d'aversion relatif pour le risque: plus γ est grand et plus l'agent est risquophobe.
À la limite γ = 1, la fonction d'utilité est le logarithme.
δ γ utilité G*(δ )/G*1/2 2 -w - 1 .751/3 3 -w - 2 .561/4 4 -w - 3 .44
le levier optimal est f*(γ)= 1/ γ µ/σ2
15
Page 15
Daniel HERLEMONT http://www.yats.com 29
Caculs des coûts de transaction
Daniel HERLEMONT http://www.yats.com 30
Investissement "optimal" et coûts de transactions
Cette stratégie exige un ajustement permanent pour maintenir un ratio constant dans l'actif risqué: soit "f" ce ratio,l'ajustement quotidien devrait être de l'ordre de (f-1)*variationActif
f=1 on est investi à 100% en permanence.f<1, on est contrarien ... hausse => vente, baisse => achatf>1 on est suiveur de tendance: hausse => achat, baisse => vente
Il existe des "no trade regions" : re-équilibrage uniquement lorsque le ratio sort de bornes fmax, fmin,
exemple µ=12,5%, σ=20%, f=0.6, avec des coûts de 0,5%, ne pas faire réajuster tant que f reste dans un intervalle del'ordre de 10% autour de f.
La région de "non trading est proportionnelle à la racine cubique des coûts (ref: Leland, Baviera, … )si c= coût %
Si µ/σ2 ≈ 0 ou 1, ∆f ≈ 0∆f maximum pour µ/σ2 ≈ 0.5, le sous jacent est quasi stable (rendement = µ - 0.5 σ2 ≈ 0)
permet de retrouver la variationnécessaire de l'actif pour sortir de la zone de "non trading"
Impact très important des coûts de transaction sur une gestion active
16
Page 16
Daniel HERLEMONT http://www.yats.com 31
Levier, coûts de transaction et taux de croissance
Daniel HERLEMONT http://www.yats.com 32
Quantités
Les quantités ne sont pas indivisibles …. Pour justifier d'un réajustement encore faut il que δq soit entier(peut poser probl ème sur futures notamment … )δq=1 ⇒
la pondération optimale w* réalise le maximum du taux de croissance =>
Conclusion : en raison des coûts et des quotités, il n'est pas possible d'ajuster en permanence:Quelle conséquence sur le taux de croissance ?
17
Page 17
Daniel HERLEMONT http://www.yats.com 33
Le levier optimal est très sensible aux plus fortes pertesdonc aux queues de distribution:
Levier optimal, asymétries, valeurs extrêmes
Cas d'une distribution, avec queue en loi puissance
Source: Thèse de Baviera
Le levier optimal est d'autant plus faible que:- la distribution a une asymétrie négative- la kurtosis est grande… ce qui est le cas de la plupart des actifs financiers !!! Mn= moment d'ordre n
=E(rn)
Daniel HERLEMONT http://www.yats.com 34
Estimation du levier optimal
Estimations indépendantes de µ et σ (voir après)
Estimation directes: résoudre
Méthodes adaptatives et itératives: voir Portefeuilles Universels
Cas multivarié et cas général:
Les contraintes pouvant être arbitraires (vente à découvert ou pas, contraintes sur actif particulier, secteurs, coût de transactions, …) : nécessite des programmes complexes d'optimisation dans le cas général
sinon, on pourra utiliserune premièreapproximation, du mondegaussien sans contraintes
Monde gaussien avec contraintes
L'erreur d'estimation du levier est en 1/σ ⇒ estimation d'autant meilleure que l'actif est volatile !!!
18
Page 18
Daniel HERLEMONT http://www.yats.com 35
Kelly-Conclusion (provisoire ….)
m Stratégie optimaleF avec le meilleur taux de croissance (si iid)F Le taux de croissance = taux de croissance certain équivalent (peut être comparé
au taux sans risque)F minimise aussi la durée pour atteindre un objectifF le risque de ruine n'existe pas … en principe
m Points critiques :F Stratégie très active : maintenir un ratio constant a tout moment => tenir
compte des coûts de transaction.F Risque importants en cas de dépassement du levier optimal, les drawdowns
peuvent être sévères …F Positions pouvant être importantes => Kelly FractionnelF Suppose une modélisation correcte: nécessité une estimation correcte des
rendements et risques attendus. le plus délicat étant l'estimation des rendementsF mais …. Il existe aussi des méthodes "non paramétriques"
Daniel HERLEMONT http://www.yats.com 36
Exemple Kelly adaptatif (et universel)
Phase d'apprentissage
Mesures de performance: Sharpe, Sterling
Sterling= performance/maxDrawDown
19
Page 19
Daniel HERLEMONT http://www.yats.com 37
Kelly adaptative (suite)
Krach de 87le levier est très sensible aux fortes pertesaura du mal a s'en remettre
Richesse finale = 737 506, soit ~ un facteur de l'ordre de 1000Échelles logarithmiques !!!
Gain > x 1000
Daniel HERLEMONT http://www.yats.com 38
^FCHI from:19900301 to:20031110constant leverage (f) Terminal wealth return: W(T)/W0
asset (f*=1.0) 1 3425.19 1.872 3232.15 1.765 41.52 0.02
optimal F in Hindsight 0.92 3335.66 1.82Adaptative 0.92 11888.23 6.49
^GDAXI from:19901126 to:20031110constant leverage (f) Terminal wealth return: W(T)/W0
asset (f*=1.0) 1 3746.24 2.62 4683.13 3.245 100.55 0.07
optimal F in Hindsight 1.3 4332.21 3Adaptative 1.3 23823.55 16.51
^SSMI from:19901109 to:20031110constant leverage (f) Terminal wealth return: W(T)/W0
asset (f*=1.0) 1 5242.2 3.782 12377.27 8.925 9128.01 6.58
optimal F in Hindsight 2.8 17488.59 12.61Adaptative 2.8 46167.76 33.28
^STOXX50E from:19911231 to:20031114constant leverage (f) Terminal wealth return: W(T)/W0
asset (f*=1.0) 1 2656.94 2.662 4024.5 4.025 449.04 0.45
optimal F in Hindsight 1.73 3807.99 3.81Adaptative 1.73 32526.78 32.53
A noter, la méthode adaptative fait mieux que le meilleure CRP a posteriori !!!
20
Page 20
Daniel HERLEMONT http://www.yats.com 39
Estimation de la tendance
Finalement, pour appliquer Kelly, dans un modèle paramétrique en f=µ /σ2 il faut estimer deux paramètres essentiels: µ et σle plus délicat est l'estimation de µ … a moins de le définir ex ante: en prenant par exemple le taux des dividendes …
Estimation à partir des rendements historiques: le meilleur estimateur est la moyenne:r = (∑ ri)/navec ri = ln(Si /Si-1)se réduisant à r = ln(Sn /Sà) /nles valeurs intermédiaires ne servent pas !!!On a interet à choisir la période la plus longue possible.
Pour un actif ~ lognormal (5%,20%)intervalle de confiance an à 95% ~ 5% ± 1.64*20% !!!N'est pertinent que lorsque r devirent ~ σ, c'est à dire au bout de T tq Tr ~ T½ σ, ie. T ~ σ2/r 2 =0.22/0.052 = 8 ans
nota: temps caractéristique = 1/sharpe2
Si Sharpe annuel = 2, on pourra juger de la pertinence du rendement au bout de 3 mois de tracking seulement !!!
Vous avez dit tendance ?
Daniel HERLEMONT http://www.yats.com 40
Estimations de la volatilité
L'estimation de la volatilité est essentielle: gestion du risque, pricing dérivés, leviers, …
Estimateur utilisant tous les ticks:
Zhouet variantes …
Les estimateurs utilisant les plus haut / plus bas sontbeaucoup plus efficaces (x10) et réactifs
La mesure du range (plus haut - plus bas) est parmi lesmeilleurs estimateurs de volatilité
Estimation à partir des cours de clôture (ou last)
Riskmetrics (JP Morgan)
µ=0.94 soit temps caractéristique de 16 jours ouvrés, soit 3 semaines environ≈ GARCH(1,1)
Méthodes utilisant les extremums:Rogers Satchell, Parkinson, Garman Klass, True RangeMaximum de vraisemblance de la distribution des +hautet +bas
21
Page 21
Daniel HERLEMONT http://www.yats.com 41
Estimations de la volatilité (suite)
Pourquoi utiliser les plus haut et plus bas ?
- utilise toutes les données disponibles
- les extremum sont des mesures agrégées sur toute une période: les open/close ne sont que photos à des moments précis
- permet d'effecteur des mesure plus précises, robustes et réactives (meilleur résultat avec moins d'historique)
Daniel HERLEMONT http://www.yats.com 42
Estimateur de volatilité par maximum de vraisemblance avec Open/Close/High/Low
Source: Malik MagdonIsmail, Amir F. AtiyaVolatility Estimation Using High, Low, and Close Data(Algorithmes implémentés dans YATS)
22
Page 22
Daniel HERLEMONT http://www.yats.com 43
Estimateurs de Volatilité
Les estimateurs utilisant les plus haut / plus bas sont :- plus réactifs aux changements de régime - plus lisses (indicant une moindre variance)
Daniel HERLEMONT http://www.yats.com 44
Backtests et Data Snooping
Risque de Data Snooping: Trouver des stratégies qui ne sont que des artefacts dans les données.
Essayer de très nombreux systèmes avec de très nombreux paramètres, éventuellement optimiser ces paramètresne sélectionner que les meilleurs, sans savoir pourquoi ils fonctionnent=> forte probabilité pour ne sélectionner que des Snoopy: c'est à dire des systèmes qui fonctionnent à merveille sur le passé et vont se révéler catastrophiques en réel.
DATA SNOOPING dans une marche aléatoire:Prenons le cas d'une marche aléatoire, avec un certain nombre de data générée, représentant un historique de marchédans ce cas E[gain de tout système] est <0 = coût de transactionon réalise des backtests de 900 trades de quoi donner confiance au trader, confiance illusoire …Essayons plusieurs milliers de systèmes …disons 10 000 (il suffit de tester un système avec 4 paramètres pouvant prendre 10 valeurs différentes)avec des performances additives: perf globale =∑ perf tradesla performance globale est une v.a. (gaussienne, le théorème de la limite centrale)de moyenne nulle et variance(perf globale)=n variance(trade) (1+2ρ)supposons σ(trade)=1500, et autocorrélation ρ=0.3> 0, car on utilise des stop loss.variance(900 trades) = 56921 au lieu de 45000 si pas d'AC (l'AC > 0 des trades entraîne un risque plus élevé)les 10 meilleurs systèmes sur 10 000 essayés correspondent au quantile 10/10000 de la gaussienne N(0, 45000)soit une espérance de gain de 195 par trade pour le plus mauvais des 10 meilleurs !!! Avec une bonne t-stat=3.9Si on a affaire à des queues plus épaisses, l'illusion sera encore plus aveuglante ….
Comment éviter le data snooping ?- modélisation + explication des anomalies
23
Page 23
Daniel HERLEMONT http://www.yats.com 45
Trading et modélisation
Modélisation = simplification du réel
Exemple de modèles: croissance optimale / capture de volatilité
mean reversion (series AR(1), ARIMA, avec coefficient de rappel)Pairs trading, co intégration,Chaînes de Markov,
recherche de solutions analytiques ou par simulation de Monte Carlo
Fit: Data réelle = Modèle + ε0
Simulations: Data Synthétiques = Modèle + ε1, avec ε1 ≡ ε0
A la différence essentielle que l'on peut générer autant de données que nécessaire pour"résoudre" le système, trouver les paramètres optimaux, le maximum de la fonctionobjectif (exemple utilité horaire), sans soupçon de data snooping ou suroptimisation.
On reporte le risque de data snooping sur le risque de modèle: Inadéquation du modèle,Mauvais usage du modèle, Approximations grossières, Bugs dans le développement,Données instables, …
Daniel HERLEMONT http://www.yats.com 46
backtesting
m Définir le système de trading: traduire l'idée en modèle, puis en règlesF claires et non ambiguës, pouvant donner lieu a programmationF cohérentesF complètes: prévoir tous les cas
m Définir sa fonction d'utilitém Se placer dans des conditions les plus fidèles
F Prise en compte des coûts de transactionF de la fourchette bid/ask, ou sinon du slippage (ersatz de spread lorsqu'on ne
dispose pas de tous les ticks)F délais de transmission des ordres et des priorités à l'exécution, …
m Tester et backtester sur les données du marché ou par simulation de montecarlo.
m Optimisations:F avec prudence sur les données réelles,F sans modération sur les modèles.
m études de sensibilitéF aux valeurs des paramètresF à des étalons : au système de trading idéal et parfait, au système aléatoire
24
Page 24
Daniel HERLEMONT http://www.yats.com 47
Critères de performance et contraintes
On doit choisir une fonction d'utilité à optimiser parmi:
- la fonction d'utilité classique : isoélactique (logarithme, puissance), …
- une utilité terminale ou utilité par unité de tempsexemple: on pourra chercher à optimiser l'utilité/jouren principe, l'utilité/jour devrait donner une idée du revenu certain équivalent (à comparer à un salaire, par exemple)
- le ratio de Sharpe : rendement/volatilité
- le ratio de Sterling : rendement/maxDrawDown
- une pénalisation des performances (pessimistic ratio de Pardo)
- minimiser la VaR
Ajouter à cela des contraintes Sur la fonction objectif: exemple: rejet de toute solution dont - le maxDrawDown serait > 10%- le nombre de trades serait jugé insuffisant (pour des raisons de signification statistiques, …)- etc … Sur les paramètres du système:marge ? la somme des pondérations libre ou contraintes = 1 ou =X avec X = levier uatorisévente à découvert ? (pondération<0?)maximum/minimum sur certaine actifs, classes d'actifs, contraintes sur les paramètres des indicateurs techniques, …
Daniel HERLEMONT http://www.yats.com 48
Stop Loss
Le Stop Loss est une pratique courante pour limiter les pertes
Exemple: position sur CAC40 Future, stop loss à -10pts deperte=> permet de s'assurer que la perte ne dépassera jamais 10pts….
Oui mais … si on continue et sans traitement complémentaire,le résultat sera le même
Si une stratégie est mauvaise, elle restera mauvaise, mêmeavec stop loss.
En général, le stop loss fait apparaître des autocorrélationspositives.
Stop loss
Stop loss
Stop loss
25
Page 25
Daniel HERLEMONT http://www.yats.com 49
Auto corrélation des trades
perte constatéearrêt trading réel, passage en mode virtuelgain virtuel:reprise du trading réel
Après traitement, il n'y a plus d'autocorrélation évidente
En général la série des trades d'un système de trading présente de fortes auto corrélations positives (mauvaisemodélisation, …). Tout n'est pas perdu: on peut appliquer un système "anti autocorrélation"
exemple: Win=20, Loss=-20 Cost=4 probabilité(win)=0.5Système brut : perte -1080 : Avec traitement Anti AC: gain de 544 !!!
Système ultra simpliste: si AC >0, alors les proba(perte|perte)>0.5,il suffit alors d'arrêter après une perte, et reprendre après le premier gain ...
Utilisation possible d'algorithmes plus sophistiqués de prédiction on line …