Upload
vantuong
View
222
Download
0
Embed Size (px)
Citation preview
THÉORIE DES VALEURS EXTRÊMES
Julie Carreau IRDHydroSciences Montpellier
www.pages-perso-julie-carreau.univ-montp2.fr
lundi 10 mars 2014
Événements météorologiques majeurs 2012-2013Courrier international
lundi 10 mars 2014
OURAGAN SANDY : OCTOBRE 2012Une des plus grosse tempête à frapper les États-Unis : évacuation, fermeture du métro (4-5 jours), pénurie d’essence, ...
lundi 10 mars 2014
• 400 mm de pluie en 24 h• équivalent de 5 mois de
précipitation• pas d’événement semblable
depuis 1827
INONDATION DANS LE VAR : JUIN 2010Facteurs météorologiques
• mer chaude• relief montagneux• masses d’air chaud venant d’Afrique
lundi 10 mars 2014
INONDATIONS DU GARD EN SEPTEMBRE 2002
Septembre 2002 : 687 mm de pluie en 24hDébit de 830 m3/s
Barrage écréteur de crues de la Rouvière : • construit en 1978• débit de contrôl de 1 m3/s• niveau de retour de 50 ans• hauteur de 18m
L’étude des pluies extrêmes est indispensable pour le bon dimensionnement des ouvrages hydrauliques
lundi 10 mars 2014
TEMPÉRATURES EXTRÊMES
Montréal, Canada, 21 janvier 2013 : -27.3 0C
Froid extrême ?
lundi 10 mars 2014
Marseille, record de froid le 12 février 1956 : -16.8 0C
TEMPÉRATURES EXTRÊMES
Froid extrême ?
lundi 10 mars 2014
Europe : Août 2003
• plus de 20 000 morts en Europe• période la plus chaude depuis 500 ans• plusieurs pays européen : record de température
maximale
• niveaux des cours d’eau et des lacs très bas• feux de forêts• fonte des glaciers : chute de pierres et de glace
Impacts environnementaux
TEMPÉRATURES EXTRÊMES
lundi 10 mars 2014
58 ans d’observations météorologiques
Le risque de vague de chaleur extrême va vraisemblablement augmenter.
Des déficits de pluie en hiver dans le sud de l’Europe précède des étés chauds.
Vautard et al. 2007 Summertime European heat and drought waves induced by wintertime Mediterranean rainfall deficit, GRL
TEMPÉRATURES EXTRÊMES
Europe : Août 2003
lundi 10 mars 2014
CHANGEMENT CLIMATIQUE
Why a 4°C Warmer World Must be Avoided
Turn Down Heatth
e
Rapport de la Banque Mondiale par le Postdam Institute for Climate Impact Research and Climate Analytics, Novembre 2012
sans engagement, de nombreux scénarios prévoient une augmentation de 4 ˚C d’ici la fin du siècle
augmentation du niveau de la mer de 0.5 à 1 m
augmentation des températures élevées extrêmes : impacts importants sur l’agriculture et les écosystèmes
augmentation de l’intensité des cyclones tropicaux
augmentation de l’aridité et des sécheresses
lundi 10 mars 2014
Théorie des Valeurs Extrêmes
lundi 10 mars 2014
THÉORIE DES VALEURS EXTRÊMES
précipitation : pluie, neigedébit des rivièrestempératureniveau de la mervitesse du ventconcentration des polluants.....
Applications en climat et environnement
Caractériser le comportement de très grandes valeurs
Caractériser le comportement de très petites valeurs
EVT fondée sur le comportement asymptotique des grandes valeurs : maxima ou excédents
Les très grandes (petites) valeurs sont rares : modèles non-paramétriques inadéquats
lundi 10 mars 2014
FONCTION DE RÉPARTITION EMPIRIQUE
{X(1), . . . , X(n)} X(1) ≤ · · · ≤ X(n)
Observations i.i.d. tirées d’une même variable aléatoire telle que le niveau maximal annuel de la mer :
Statistiques d’ordre : tri des observations en ordre croissant
Loi forte des grands nombres
Fonction de répartition empirique
�Fn(x) =1
n
n�
i=1
I{X(i)≤x}p.s.−→ F (x)
n −→ ∞lorsque�Fn(x)p.s.−→ F (x)
{X1, . . . , Xn} X ∼ F
lundi 10 mars 2014
Queue légère à décroissance exponentielle
Queue lourdeà décroissance polynômiale
�Fn(x) =1
n
n�
i=1
I{X(i)≤x}p.s.−→ F (x)
�Fn(X(i)) = P (X ≤ X(i)) =i
n
P (X ≤ x) =i
n∀x ∈ [X(i), X(i+1))
P (X ≤ x) = 1 ∀x ≥ X(n)
P (X ≤ x) = 1− p ∀p ≤ 1
n
} 1
n
lundi 10 mars 2014
Modèles pour les maxima de variables aléatoires
Maurice Fréchetmathématicien français
1878 - 1973
Emil Julius Gumbelmathématicien allemand
1891 - 1966
Waloddi Weibullingénieur et
mathématicien suédois1887 - 1979
lundi 10 mars 2014
{X1, . . . , Xn} variables aléatoires indépendantes avec fonction de répartition F
Par exemple : cumul journalier de précipitation
Mn = max{X1, . . . , Xn}Objectif : modéliser les maxima
Cumul maximal journalier de précipitation
P (Mn ≤ x) = P (X1 ≤ x, . . . ,Xn ≤ x)
Dérivons la fonction de répartition des maxima :
= P (X1 ≤ x)× · · ·× P (Xn ≤ x)
= {F (x)}n
Estimateur possible de la fonction de répartition des maxima :
Une petite erreur dans l’estimation de F donnera une grande erreur dans Fn
➡ considérer des observations extrêmes et estimer Fn directement
Xi ∼ F
�Fn = { �F}n
lundi 10 mars 2014
Théorème central limite (presque) toute somme de variables aléatoires indépendantes et identiquement distribuées tend vers une variable aléatoire gaussienne
variables aléatoires indépendantes et identiquement distribuées
X1, X2, . . . , Xn
Si l’espérance et l’écart-type existent et
[Xi] = µ < ∞ 0 < V ar[Xi] = σ2 < ∞
Sn√n
d−→ N (µ,σ2)Alors
Sn = X1 +X2 + · · ·+XnSoit
Les paramètres de position et de dispersion des Xi sont également ceux de la distribution limite.
lundi 10 mars 2014
journalier mensuel trimestriel
semestriel
Convergence des cumuls de pluie
annuel
Normale
lundi 10 mars 2014
Maxima de données provenant d’une loi Log-Normale
• On retient le maximum un échantillon de taille 10 d’une loi Log-Normale• On répète l’expérience 10 000 fois
échantillon de taille 10
échantillon de taille 100
échantillon de taille 1000
• On recommence avec des échantillons de taille 100
• Et finalement avec des échantillons de taille 1000
Lorsque la taille de l’échantillon augmente, la distribution des maximas de loi Log-Normale se rapproche de la loi de Gumbel.
lundi 10 mars 2014
Densité et fonction de répartition de la loi de Gumbel
f(x) = exp{−x} exp{− exp{−x}} F (x) = exp{− exp{−x}}Pour la Gumbel standard (centrée réduite) :
Dans le cas général : x ← x− µ
σ
f(x) = exp
�−x− µ
σ
�exp
�− exp
�−x− µ
σ
��F (x) = exp
�− exp
�−x− µ
σ
��
lundi 10 mars 2014
Loi de Gumbel
• appropriée pour modéliser les maxima d’une variable suivant une loi Log-Normale
par exemple : les maxima des cumuls journaliers de précipitation
• mais aussi les maxima d’une variable suivant une loi Normale, Exponentielle, Gamma, etc ....
Pour de très grandes valeurs, la densité décroît très rapidement, à vitesse exponentielle, vers zéro.
Propriété des lois pour lesquelles la loi de Gumbel approxime bien les maxima : la queue supérieure de la distribution décroît de façon exponentielle
1− F (x) ≈ exp(−x) =1
exp(x)x ↑ ∞
lundi 10 mars 2014
La loi de Gumbel est parfois inappropriée en présence de très fortes valeurs
Maxima annuels de cumuls journaliers de précipitation
Graphique quantile-quantile de l’ajustement d’une loi de Gumbel
lundi 10 mars 2014
Maxima de données provenant d’une loi de Pareto généralisée
• On retient le maximum un échantillon de taille 10 d’une loi de Pareto généralisée• On répète l’expérience 10 000 fois• On recommence avec des échantillons de taille 100 et 1000
échantillon de taille 10
échantillon de taille 100
échantillon de taille 1000
Lorsque la taille de l’échantillon augmente, la distribution des maximas de loi de Pareto généralisée se rapproche de la loi de Fréchet.
lundi 10 mars 2014
Loi de Fréchet modèle pour les données ayant de très fortes valeurs
✴ appropriée pour modéliser les maxima de variables suivant des lois de Pareto, Student t, Cauchy
On appelle le paramètre de forme : ✦ plus est petit, plus la décroissance est lente, plus des valeurs extrêmes sont
susceptibles de se produire✦ plus est grand, plus la décroissance est forte, moins des valeurs extrêmes vont
se présenter
αα
α
Propriété des lois pour lesquelles la loi de Fréchet approxime bien les maxima : la queue supérieure de la distribution décroît de façon polynômiale
1− F (x) ≈ x−α =1
xαx ↑ ∞
lundi 10 mars 2014
Fonction de répartition de la loi de Fréchet comportement en fonction du paramètre de forme α
Décroissance polynômiale
➡ ➡ ➡
α = 10
α = 5α = 2
1− F (x) ≈ x−α =1
xαx ↑ ∞
lundi 10 mars 2014
Loi de Weibull : loi pour les données ayant une borne supérieure• modèle réaliste lorsque les données ne peuvent pas dépasser une valeur maximale• barrière physique qui borne les valeurs• peut être le cas pour des données de température
Maxima de données provenant d’une loi Uniforme
échantillon de taille 10
échantillon de taille 100
échantillon de taille 1000
✴ appropriée pour modéliser les maxima de variables suivant des lois Uniforme, Bêta
lundi 10 mars 2014
Il y a trois et seulement trois distributions possibles pour les maxima de variables aléatoires.
De façon analogue : la somme d’un grand nombre de variables aléatoires se comportent comme une loi Normale (théorème central limite).
Ce sont les trois lois des valeurs extrêmes : elles correspondent aux trois types de comportement de la queue de la distribution possibles
Gumbel Fréchet Weibull
Décroissance exponentielle Décroissance polynômiale Densité bornée
lundi 10 mars 2014
Théorème des types extrêmaux (Fisher-Tippett)Soit S’il existe des suites de constantes {an > 0} et {bn} telles que
où G est une f.d.r. non dégénérée, alors G appartient à l’une des familles suivantes :I. Gumbel
II. Fréchet
III. Weibull
pour des paramètres
G(x) = exp
�− exp
�−�x− b
a
���−∞ < x < ∞
a > 0, b et α > 0
Mn = max{X1, X2, . . . , Xn}
P
�Mn − bn
an≤ x
�d−→ G(x)
➡ Le comportement de la queue de distribution des Xi est lié au paramètre de la distribution limite.
α
G(x) = 1− exp�−�xa
�α�x ≥ 0
G(x) = exp
�−�xa
�−α�
x ≥ 0
lundi 10 mars 2014
MAX-STABILITÉGumbel, Fréchet et Weibull sont les distributions de valeurs extrêmes.Ce sont des distributions max-stables :
X1 + · · ·+Xnd= anX + bnStabilité par l’addition :
Relation entre les trois distributions max-stables :
X ∼ Frechet =⇒ Y = lnX ∼ GumbelX ∼ Weibull =⇒ Y = 1/X ∼ FrechetX ∼ Weibull =⇒ Y = ln (1/X) ∼ Gumbel
Mn = max{X1, X2, . . . , Xn}d= anX + bn
P
�Mn − bn
an≤ x
�= Fn(anx+ bn) = P (X ≤ x) = F (x)
Quelle(s) loi(s) sont stables par l’addition ?
lundi 10 mars 2014
DOMAINE D’ATTRACTION
X est dans le domaine d’attraction maximum de la loi G si :
Gumbel distribution non bornée , tous les moments sont finis
Ex : Normale, Log-Normale, Exponentielle, GammaCaractéristique : queue supérieure décroît à vitesse exponentielle
Queue légère
Queue lourde
Queue finieWeibull distribution bornée supérieurement
Ex : Uniforme, BêtaCaractéristique : queue supérieure finie
P (Mn−bn/an ≤ x)d−→ G(x)
Fréchet distribution non bornée, certains moments ne sont pas finis ; variance infinie si et
Ex : Cauchy, Student t, ParetoCaractéristique : queue supérieure décroît à vitesse polynômiale x−α
[Xr] < ∞ ↔ r < αα > 2
lundi 10 mars 2014
DISTRIBUTION VALEUR-EXTRÊME GÉNÉRALISÉE (GEV)
Gumbel Fréchet Weibullξ > 0ξ → 0 ξ < 0
G(x) =
�exp
�−�1 + ξ
�x−µσ
��−1/ξ�
si 1 + ξ(x− µ)/σ > 0 et ξ �= 0
exp�− exp
�−x−µ
σ
��avec x ∈ et ξ = 0
[Xr] < ∞ ↔ ξ < 1/r
Condition sur les momentsposition échelleforme
µσξ = 1/α
lundi 10 mars 2014
EN PRATIQUEBlock-MaximaOn crée des blocs de longueur n à partir des observations avec n «grand»
Mn,1, . . . ,Mn,m
Choix fréquent : bloc = 1 an
Maxima annuel : cumul journalier, horaire ou mensuel
Maximum de vraisemblance
L(µ,σ, ξ;Mn,1, . . . ,Mn,m) =m�
i=1
g(Mn,m;µ,σ, ξ)
g(x;µ,σ, ξ) =∂G(x;µ,σ, ξ)
∂xOù est la densité de la GEV
Minimisation de la log-vraisemblance négative
l(µ,σ, ξ;Mn,1, . . . ,Mn,m) = − ln (L(µ,σ, ξ;Mn,1, . . . ,Mn,m))
Sous contrainte : 1 + ξ(x− µ)/σ > 0 Cas à part : ξ = 0
➡ Bonnes propriétés de convergence en général et adaptabilitélundi 10 mars 2014
FONCTION DE QUANTILES
est un quantile de niveau xp 1− p ⇐⇒ G(xp) = 1− p
xp = µ− σ
ξ
�1− {− log(1− p)}−ξ
�
Niveau de retour xp de période de retour p : niveau dépassé en moyenne une fois par T = 1/p années
T = 2 ←→ p = 0.5
T = 5 ←→ p = 0.2
T = 10 ←→ p = 0.1
T = 20 ←→ p = 0.05
T = 50 ←→ p = 0.02
T = 100 ←→ p = 0.01
T = 1000 ←→ p = 0.001
10 %
90 %
Temps moyen entre les dépassements : environ 10 ans
p = 10%
lundi 10 mars 2014
Niveaux de retour
xp = µ− σ
ξ
�1− {− log(1− p)}−ξ
�
• Pour des niveaux de quantiles modérés, le paramètre de position de la GEV a le plus d’influence.
• Pour des niveaux de quantiles élevés, c’est le paramètre de forme qui est déterminant.
➡ L’estimation du paramètre de forme dépend des observations extrêmes et présente beaucoup de variance (sensibilité aux fortes observations).
µ = 10
µ = 100
σ = 1
T = 10 T = 20 T = 50 T = 100 T = 1000ξ = 0.2
ξ = 0
ξ = −0.2
Fréchet
Gumbel
Weibull
lundi 10 mars 2014
Graphique Quantiles-Quantiles
Statistiques d’ordre : {X(1), . . . , X(n)} telles que X(1) ≤ · · · ≤ X(n)
Fonction de répartition empirique
�Fn(x) =1
n
n�
i=1
I{X(i)≤x}p.s.−→ F (x)
➡ Correspondance entre les quantiles estimés par le modèle aux fréquences empiriques et les statistiques d’ordre (quantiles empiriques)
Fréquences empiriques�i
n
�n
i=1
=
�1
n, . . . ,
n− 1
n, 1
�
�i− 0.5
n
�n
i=1
=
�0.5
n, . . . ,
n− 0.5
n
�Fréquences empiriques de Hazen
lundi 10 mars 2014
Graphique Quantiles-Quantiles��
�F−1
�i− 0.5
n
�, X(i)
��n
i=1
=
���µ− �σ
�ξ
�1− {− log((i−0.5)/n)}−�ξ
�, X(i)
��n
i=1
Si le modèle est juste, le graphique quantiles-quantiles s’aligne sur la diagonale.
lundi 10 mars 2014
1948 - 19511948
CUMUL DE PRÉCIPITATION JOURNALIER À MARSEILLE
Propriétés des précipitations • intermittence• variabilité saisonnière• variabilité inter-annuelle• valeurs extrêmes
1948-2005 : 58 ans
lundi 10 mars 2014
MAX ANNUEL JOURNALIER À MARSEILLE1948-2005 : 58 ans
Ajustement d’une loi GEV par maximum de vraisemblance Paramètres estimés
location : 49.531 scale : 18.812 shape : 0.205
Erreurs standard location : 2.817 scale : 2.247 shape : 0.111
location : 49.461 scale : 18.182 shape : 0.133
location : 2.756 scale : 2.129 shape : 0.111
sans le plus grand max
lundi 10 mars 2014
DIAGNOSTIQUES
�xp = �µ− �σ�ξ
�1− {− log(1− p)}−�ξ
�
➡ Incertitude plus grande pour les grands niveaux de retour (grands quantiles) due à l’incertitude sur l’estimation du paramètre de forme
Quelle est la période de retour de la plus forte pluie (environ 200 mm ) ?
lundi 10 mars 2014
Comparaison avec un ajustement d’une loi de Gumbel ξ = 0
Paramètres estimés
Gumbel location : 51.79 (2.86) scale : 20.88 (2.25)GEV location : 49.53(2.82) scale : 18.81 (2.25) shape : 0.205 (0.111)
Log-vraisemblance nég.
Gumbel 268.5355GEV 270.9504
➡ Le paramètre de forme est-il significativement différent de zéro ?➡ Quelle distribution est plus adéquate ?
AIC (valeur élevée)
2 x -268.5 - 2 x 2 = -5412 x -271.0 - 2 x 3 = -548
BIC (valeur élevée)
2 x 268.5 - 2 x log(58) = -5452 x 271,0 - 2 x log(58) = -554
lundi 10 mars 2014
NIVEAU DE LA MER À VENISELe acque alte
+ 1 m
lundi 10 mars 2014
NIVEAU ANNUEL MAXIMAL
Ajustement d’une loi GEV par maximum de vraisemblance Paramètres estimés
location : 111.092 (2.628) scale : 17.174 (1.803) shape : -0.077 (0.074)
lundi 10 mars 2014
DIAGNOSTIQUES
Quel est le niveau de retour de 100 ans ?
�xp = �µ− �σ�ξ
�1− {− log(1− p)}−�ξ
�
lundi 10 mars 2014
TENDANCE ANNUELLEIntroduire une covariable pour le paramètre de position de la GEV : t année
µ(t) = µ0 + µ1t
Comment faire l’apprentissage des coefficients de la régression ?
Log-vraisemblance conditionnelle
l(µ0, µ1,σ, ξ|(t1, x1), . . . , (tn, xn)) =n�
i=1
ln g(xi|µ = µ0 + µ+ 1ti,σ, ξ)
µ0 = 111.65 (2.25)
µ1 = 8.39 (2.07)
σ = 14.58 (1.58)
ξ = −0.027 (0.083)
lundi 10 mars 2014
Log-vraisemblance conditionnelleSoit , des variables indépendantes qui influencent la distribution de x On fait l’hypothèse que :
z
µ(z) = h1(z;β1) σ(z) = h2(z;β2) ξ(z) = h3(z;β3)
où h1(·;β1), h2(·;β2), h3(·;β3) sont des fonctions des variables z
avec les vecteurs de paramètres β1, β1, β3 à apprendre en maximisant :
l(β1,β2,β3|(z1, x1), . . . , (zn, xn)) =
n�
i=1
ln g(xi|µ = h1(zi;β1),σ = h2(zi;β2), ξ = h3(zi;β3))
➡ On fait donc l’hypothèse que les maxima sont distribués selon une loi GEV conditionnellement à z
Niveaux de retour
Interprétation ?
xp(z) = µ(z)− σ(z)
ξ(z)
�1− {− log(1− p)}−ξ(z)
�
lundi 10 mars 2014
Vilfredo Pareto, sociologue et économiste italien 1848 - 1923
Loi de Pareto : répartition des richesses
« 20 % de la population détient 80% des richesses »
Modèles pour les excédents de variables aléatoires
Approche «Peaks-over-Threshold» PoT développée par les hydrologues
lundi 10 mars 2014
Fixer un seuil et utiliser les excédents au-delà du seuilPermet d’inclure plus d’observations dans l’estimation que l’approche des maxima
u
Z1
Z2
Z3
Z4
Z5
Z6
Z7
Z8
Z9
Z10
Z11
Z12
V1
V2
V3
V4
V5
V6
V7
Student Version of MATLAB
Distribution de Pareto généralisée GPD : modélise les excédents au-delà d’un seuil
Peaks-over-Threshold
X ∼ F
La distribution des excédents est donnée par :
Si F est connue alors :
Si on se sert d’une estimation de F pour estimer , on risque d’avoir des problèmes d’extrapolation car il y a peu d’observations extrêmes.
Fu(y)
Fu(y) = P {X ≤ u+ y|X > u}
∀0 < y < xF − u
Fu(y) =F (u+ y)− F (u)
1− F (u)
lundi 10 mars 2014
Distribution de Pareto généralisée approximation pour la distribution des excédents
H(y) =
�1−
�1 + ξ
y�σ�−1/ξ
si ξ > 0
1− exp�− y
�σ�
si ξ = 0
ξ > 0
ξ = 0
ξ < 0
lorsque , H est la distribution exponentielle de paramètreξ = 0 �σCas particuliers
lorsque , H est une distribution bornée supérieurementξ < 0
lorsque , H est une distribution de Pareto à queue lourde ξ > 0
➡ Le paramètre de forme définit trois classes de distributions tout comme les domaines d’attraction maximale Gumbel, Weibull et Fréchet.
[Xr] < ∞ ↔ ξ < 1/r
Condition sur les moments
lundi 10 mars 2014
Théorème de Pickands-Balkema-de HaanSoit X1, X2, ... Xn une suite de variables aléatoires indépendantes avec f.d.r. F et considérons
Soit X l’une des variables de la suite et supposons que, pour n grand, l’on ait :
où G est la f.d.r. de la GEV pour . Alors, pour u suffisamment grand, la distribution des excédents peut être approximée par
définie sur
où
Mn = max{X1, X2, . . . , Xn}
P{Mn ≤ x} ≈ G(x)
µ,σ et ξ
�σ = σ + ξ(u− µ)
{y : y > 0, (1 + ξy/�σ) > 0}{y : y > 0, (1 + ξy/�σ) > 0}
➡ Si les maxima sont approximativement distribués selon la GEV, alors les excédents sont approximativement distribués selon la GPD.
Fu(y) = P {X > u+ y|X > u} ≈ H(y) =
�1−
�1 + ξ
y�σ�−1/ξ
si ξ > 0
1− exp�− y
�σ�
si ξ = 0
lundi 10 mars 2014
STABILITÉ PAR SEUILLAGE
Pour une distribution donnée, si les maxima convergent vers la GEV, alors les excédents convergent vers la GPD.
Les paramètres de la GPD sont déterminés par ceux de la GEV :
Le paramètre de forme est le même : ‣ queue lourde (décroissance polynômiale) ‣ queue légère (décroissance exponentielle)‣ queue finie (bornée)
�σ = σ + ξ(u− µ)
ξ > 0
ξ = 0ξ < 0
La GPD possède la propriété de stabilité par l’opération seuil :
Y ∼ GPD =⇒ Y − u|Y > u ∼ GPD ∀u > 0
H(y) =
�1−
�1 + ξ
y�σ�−1/ξ
si ξ > 0
1− exp�− y
�σ�
si ξ = 0
lundi 10 mars 2014
{X(1), . . . , X(n)} =⇒ {X(k+1), . . . , X(n)}
Les excédents sont donnés par :
u = X(k)
EN PRATIQUEPeaks-over-ThresholdOn définit les excédents à partir des observations avec un seuil u «grand»Par exemple, on fixe k et on poseAlors, les observations qui dépassent le seuil sont :
{Y1 = X(k+1) − u, . . . , Yn−k = X(n) − u}
Maximum de vraisemblance
Minimisation de la log-vraisemblance négative
Sous contrainte : Cas à part : ξ = 0
➡ Bonnes propriétés de convergence en général et adaptabilité
L(�σ, ξ;Y1, . . . , Ynu) =nu�
i=1
h(Yi − u; �σ, ξ) Où est la densité de la GPD h(y; �σ, ξ)
l(�σ, ξ;Y1, . . . , Ynu) =nu�
i=1
lnh(Yi − u; �σ, ξ)
(1 + ξy/�σ) > 0
lundi 10 mars 2014
CHOIX DU SEUIL
Dilemme biais-variance
‣ plus le seuil est élevé, plus l’approximation asymptotique de la distribution des excédents par la GPD est juste et plus le biais diminue
‣ moins le seuil est élevé, plus le nombre d’excédents est grand pour l’estimation des paramètres de la GPD et plus leur variance est petite
‣ dilemme similaire avec le choix de la taille du bloc dans l’approche des maxima mais solution pragmatique bloc = année
➡ Adopter le seuil le plus bas tel que l’approximation asymptotique est à peu près valide
lundi 10 mars 2014
Mean Residual Life Plot graphique de l’espérance excédentaire
Si ξ < 1 [Y ] =σ
1− ξY ∼ GPD et alors
Supposons X − u0|X > u0 ∼ GPD alors
[X − u0|X > u0] =σu0
1− ξ
Aussi ∀u > u0 [X − u|X > u] =σu
1− ξ=
σu0 + ξu
1− ξ
Donc, pour la moyenne est une fonction linéaire de uu > u0
��u,
1
n− k
n�
i=k+1
(X(i) − u)
��
➡Tracer le graphique de l’espérance excédantaire et identifier la plus petite valeur de u pour laquelle il devient linéaire :
lundi 10 mars 2014
Precipitation journalière positive à Marseille graphique de l’espérance excédentaire
lundi 10 mars 2014
Stabilité des paramètres estimés par rapport au choix du seuil
��u, �ξu
��{(u, �σ∗
u)} où σ∗u = σu − ξu
lundi 10 mars 2014
NIVEAU DE RETOUR
Supposons que P{X > x|X > u} =
�1 + ξ
�x− u
σ
��−1/ξ
∀x > u
Il s’en suit : P{X > x} = ζu
�1 + ξ
�x− u
σ
��−1/ξ
∀x > u
Où ζu = P{X > u}
Pour trouver le niveau qui sera dépassé une fois sur m, il faut résoudre :
ζu
�1 + ξ
�xm − u
σ
��−1/ξ
=1
m
On obtient : xm = u+σ
ξ[(mζu)
ξ − 1] xm > u
Pour obtenir le niveau dépassé en moyenne une fois par N ans avec ny le nombre d’observations par année : m = N × ny
�ζu =k
nEstimation de la probabilité d’excéder le seuil :
lundi 10 mars 2014
Fixons le seuil u = 10 mm : 1029 excédents soit moins de 5% des données
Estimateurs MLE des paramètres de la GPD
�ξ = 0.21 (0.11)
Estimateur MLE du paramètre de forme de la GEV (58 max annuels)
Precipitation journalière positive à Marseille
�σ = 12.07(0.55) ξ = 0.13(0.033)
lundi 10 mars 2014
EXCÉDENTS CONDITIONNELLEMENT DÉPENDANTS
Log-vraisemblance conditionnelleSoit , des variables indépendantes qui influencent la distribution de x On fait l’hypothèse que :
z
ξ(z) = h3(z;β3)
où h1(·;β1), h2(·;β2), h3(·;β3) sont des fonctions des variables z
avec les vecteurs de paramètres β1, β1, β3 à apprendre en maximisant :
l(β1,β2,β3|(z1, x1), . . . , (zn, xn)) =
➡ On fait donc l’hypothèse que les maxima sont distribués selon une loi GPD conditionnellement à z
�σ(z) = h2(z;β2)u(z) = h1(z;β1)
n�
i=1
lnh(xi − u|u = h1(zi;β1), �σ = h2(zi;β2), ξ = h3(zi;β3))
lundi 10 mars 2014
Global Flood Risk under Climate ChangeNature Climate Change June 2013 ‣ 11 modèles de climat de CMIP5
‣ Calcul du niveau de retour 100 ans pour les crues au 20ème siècle (1971-2000)
‣ Sous le scénario RCP85 au 21ème siècle (2071-2100), calcul de la période de retour du niveau de retour 100 ans du 20ème siècle
‣ On considère la médiane des périodes de retour des 11 modèles.
lundi 10 mars 2014