THÉORIE DES VALEURS EXTRÊMES - Julie Carreau · 687 mm de pluie en 24h Débit de 830 m3/s Barrage écréteur de crues de la Rouvière : ... Stabilité par l’addition : n X + b

THÉORIE DES VALEURS EXTRÊMES

Julie Carreau IRDHydroSciences Montpellier

www.pages-perso-julie-carreau.univ-montp2.fr

lundi 10 mars 2014

http://www.pages-perso-julie-carreau.univ-montp2.fr

http://www.pages-perso-julie-carreau.univ-montp2.fr

Événements météorologiques majeurs 2012-2013Courrier international

lundi 10 mars 2014

OURAGAN SANDY : OCTOBRE 2012Une des plus grosse tempête à frapper les États-Unis : évacuation, fermeture du métro (4-5 jours), pénurie d’essence, ...

lundi 10 mars 2014

• 400 mm de pluie en 24 h• équivalent de 5 mois de

précipitation• pas d’événement semblable

depuis 1827

INONDATION DANS LE VAR : JUIN 2010Facteurs météorologiques

• mer chaude• relief montagneux• masses d’air chaud venant d’Afrique

lundi 10 mars 2014

INONDATIONS DU GARD EN SEPTEMBRE 2002

Septembre 2002 : 687 mm de pluie en 24hDébit de 830 m3/s

Barrage écréteur de crues de la Rouvière : • construit en 1978• débit de contrôl de 1 m3/s• niveau de retour de 50 ans• hauteur de 18m

L’étude des pluies extrêmes est indispensable pour le bon dimensionnement des ouvrages hydrauliques

lundi 10 mars 2014

TEMPÉRATURES EXTRÊMES

Montréal, Canada, 21 janvier 2013 : -27.3 0C

Froid extrême ?

lundi 10 mars 2014

Marseille, record de froid le 12 février 1956 : -16.8 0C


Froid extrême ?

lundi 10 mars 2014

Europe : Août 2003

• plus de 20 000 morts en Europe• période la plus chaude depuis 500 ans• plusieurs pays européen : record de température

maximale

• niveaux des cours d’eau et des lacs très bas• feux de forêts• fonte des glaciers : chute de pierres et de glace

Impacts environnementaux


lundi 10 mars 2014

58 ans d’observations météorologiques

Le risque de vague de chaleur extrême va vraisemblablement augmenter.

Des déficits de pluie en hiver dans le sud de l’Europe précède des étés chauds.

Vautard et al. 2007 Summertime European heat and drought waves induced by wintertime Mediterranean rainfall deficit, GRL


Europe : Août 2003

lundi 10 mars 2014

CHANGEMENT CLIMATIQUE

Why a 4°C Warmer World Must be Avoided

Turn Down Heatth

e

Rapport de la Banque Mondiale par le Postdam Institute for Climate Impact Research and Climate Analytics, Novembre 2012

sans engagement, de nombreux scénarios prévoient une augmentation de 4 ˚C d’ici la fin du siècle

augmentation du niveau de la mer de 0.5 à 1 m

augmentation des températures élevées extrêmes : impacts importants sur l’agriculture et les écosystèmes

augmentation de l’intensité des cyclones tropicaux

augmentation de l’aridité et des sécheresses

lundi 10 mars 2014

Théorie des Valeurs Extrêmes

lundi 10 mars 2014

THÉORIE DES VALEURS EXTRÊMES

précipitation : pluie, neigedébit des rivièrestempératureniveau de la mervitesse du ventconcentration des polluants.....

Applications en climat et environnement

Caractériser le comportement de très grandes valeurs

Caractériser le comportement de très petites valeurs

EVT fondée sur le comportement asymptotique des grandes valeurs : maxima ou excédents

Les très grandes (petites) valeurs sont rares : modèles non-paramétriques inadéquats

lundi 10 mars 2014

FONCTION DE RÉPARTITION EMPIRIQUE

{X(1), . . . , X(n)} X(1) ≤ · · · ≤ X(n)

Observations i.i.d. tirées d’une même variable aléatoire telle que le niveau maximal annuel de la mer :

Statistiques d’ordre : tri des observations en ordre croissant

Loi forte des grands nombres

Fonction de répartition empirique

�Fn(x) =1

n

n�

i=1

I{X(i)≤x}p.s.−→ F (x)

n −→ ∞lorsque�Fn(x)p.s.−→ F (x)

{X1, . . . , Xn} X ∼ F

lundi 10 mars 2014

Queue légère à décroissance exponentielle

Queue lourdeà décroissance polynômiale

�Fn(x) =1

n

n�

i=1

I{X(i)≤x}p.s.−→ F (x)

�Fn(X(i)) = P (X ≤ X(i)) =i

n

P (X ≤ x) =i

n∀x ∈ [X(i), X(i+1))

P (X ≤ x) = 1 ∀x ≥ X(n)

P (X ≤ x) = 1− p ∀p ≤ 1

n

} 1

n

lundi 10 mars 2014

Modèles pour les maxima de variables aléatoires

Maurice Fréchetmathématicien français

1878 - 1973

Emil Julius Gumbelmathématicien allemand

1891 - 1966

Waloddi Weibullingénieur et

mathématicien suédois1887 - 1979

lundi 10 mars 2014

{X1, . . . , Xn} variables aléatoires indépendantes avec fonction de répartition F

Par exemple : cumul journalier de précipitation

Mn = max{X1, . . . , Xn}Objectif : modéliser les maxima

Cumul maximal journalier de précipitation

P (Mn ≤ x) = P (X1 ≤ x, . . . ,Xn ≤ x)

Dérivons la fonction de répartition des maxima :

= P (X1 ≤ x)× · · ·× P (Xn ≤ x)

= {F (x)}n

Estimateur possible de la fonction de répartition des maxima :

Une petite erreur dans l’estimation de F donnera une grande erreur dans Fn

➡ considérer des observations extrêmes et estimer Fn directement

Xi ∼ F

�Fn = { �F}n

lundi 10 mars 2014

Théorème central limite (presque) toute somme de variables aléatoires indépendantes et identiquement distribuées tend vers une variable aléatoire gaussienne

variables aléatoires indépendantes et identiquement distribuées

X1, X2, . . . , Xn

Si l’espérance et l’écart-type existent et

[Xi] = µ < ∞ 0 < V ar[Xi] = σ2 < ∞

Sn√n

d−→ N (µ,σ2)Alors

Sn = X1 +X2 + · · ·+XnSoit

Les paramètres de position et de dispersion des Xi sont également ceux de la distribution limite.

lundi 10 mars 2014

http://fr.wikipedia.org/wiki/Variable_gaussienne

http://fr.wikipedia.org/wiki/Variable_gaussienne

journalier mensuel trimestriel

semestriel

Convergence des cumuls de pluie

annuel

Normale

lundi 10 mars 2014

Maxima de données provenant d’une loi Log-Normale

• On retient le maximum un échantillon de taille 10 d’une loi Log-Normale• On répète l’expérience 10 000 fois

échantillon de taille 10



• On recommence avec des échantillons de taille 100

• Et finalement avec des échantillons de taille 1000

Lorsque la taille de l’échantillon augmente, la distribution des maximas de loi Log-Normale se rapproche de la loi de Gumbel.

lundi 10 mars 2014

Densité et fonction de répartition de la loi de Gumbel

f(x) = exp{−x} exp{− exp{−x}} F (x) = exp{− exp{−x}}Pour la Gumbel standard (centrée réduite) :

Dans le cas général : x ← x− µ

σ

f(x) = exp

�−x− µ

σ

�exp

�− exp

�−x− µ

σ

��F (x) = exp

�− exp

�−x− µ

σ

��

lundi 10 mars 2014

Loi de Gumbel

• appropriée pour modéliser les maxima d’une variable suivant une loi Log-Normale

par exemple : les maxima des cumuls journaliers de précipitation

• mais aussi les maxima d’une variable suivant une loi Normale, Exponentielle, Gamma, etc ....

Pour de très grandes valeurs, la densité décroît très rapidement, à vitesse exponentielle, vers zéro.

Propriété des lois pour lesquelles la loi de Gumbel approxime bien les maxima : la queue supérieure de la distribution décroît de façon exponentielle

1− F (x) ≈ exp(−x) =1

exp(x)x ↑ ∞

lundi 10 mars 2014

La loi de Gumbel est parfois inappropriée en présence de très fortes valeurs

Maxima annuels de cumuls journaliers de précipitation

Graphique quantile-quantile de l’ajustement d’une loi de Gumbel

lundi 10 mars 2014

Maxima de données provenant d’une loi de Pareto généralisée

• On retient le maximum un échantillon de taille 10 d’une loi de Pareto généralisée• On répète l’expérience 10 000 fois• On recommence avec des échantillons de taille 100 et 1000




Lorsque la taille de l’échantillon augmente, la distribution des maximas de loi de Pareto généralisée se rapproche de la loi de Fréchet.

lundi 10 mars 2014

Loi de Fréchet modèle pour les données ayant de très fortes valeurs

✴ appropriée pour modéliser les maxima de variables suivant des lois de Pareto, Student t, Cauchy

On appelle le paramètre de forme : ✦ plus est petit, plus la décroissance est lente, plus des valeurs extrêmes sont

susceptibles de se produire✦ plus est grand, plus la décroissance est forte, moins des valeurs extrêmes vont

se présenter

αα

α

Propriété des lois pour lesquelles la loi de Fréchet approxime bien les maxima : la queue supérieure de la distribution décroît de façon polynômiale

1− F (x) ≈ x−α =1

xαx ↑ ∞

lundi 10 mars 2014

Fonction de répartition de la loi de Fréchet comportement en fonction du paramètre de forme α

Décroissance polynômiale

➡ ➡ ➡

α = 10

α = 5α = 2

1− F (x) ≈ x−α =1

xαx ↑ ∞

lundi 10 mars 2014

Loi de Weibull : loi pour les données ayant une borne supérieure• modèle réaliste lorsque les données ne peuvent pas dépasser une valeur maximale• barrière physique qui borne les valeurs• peut être le cas pour des données de température

Maxima de données provenant d’une loi Uniforme




✴ appropriée pour modéliser les maxima de variables suivant des lois Uniforme, Bêta

lundi 10 mars 2014

Il y a trois et seulement trois distributions possibles pour les maxima de variables aléatoires.

De façon analogue : la somme d’un grand nombre de variables aléatoires se comportent comme une loi Normale (théorème central limite).

Ce sont les trois lois des valeurs extrêmes : elles correspondent aux trois types de comportement de la queue de la distribution possibles

Gumbel Fréchet Weibull

Décroissance exponentielle Décroissance polynômiale Densité bornée

lundi 10 mars 2014

Théorème des types extrêmaux (Fisher-Tippett)Soit S’il existe des suites de constantes {an > 0} et {bn} telles que

où G est une f.d.r. non dégénérée, alors G appartient à l’une des familles suivantes :I. Gumbel

II. Fréchet

III. Weibull

pour des paramètres

G(x) = exp

�− exp

�−�x− b

a

��−∞ < x < ∞

a > 0, b et α > 0

Mn = max{X1, X2, . . . , Xn}

P

�Mn − bn

an≤ x

�d−→ G(x)

➡ Le comportement de la queue de distribution des Xi est lié au paramètre de la distribution limite.

α

G(x) = 1− exp�−�xa

�α�x ≥ 0

G(x) = exp

�−�xa

�−α�

x ≥ 0

lundi 10 mars 2014

MAX-STABILITÉGumbel, Fréchet et Weibull sont les distributions de valeurs extrêmes.Ce sont des distributions max-stables :

X1 + · · ·+Xnd= anX + bnStabilité par l’addition :

Relation entre les trois distributions max-stables :

X ∼ Frechet =⇒ Y = lnX ∼ GumbelX ∼ Weibull =⇒ Y = 1/X ∼ FrechetX ∼ Weibull =⇒ Y = ln (1/X) ∼ Gumbel

Mn = max{X1, X2, . . . , Xn}d= anX + bn

P

�Mn − bn

an≤ x

�= Fn(anx+ bn) = P (X ≤ x) = F (x)

Quelle(s) loi(s) sont stables par l’addition ?

lundi 10 mars 2014

DOMAINE D’ATTRACTION

X est dans le domaine d’attraction maximum de la loi G si :

Gumbel distribution non bornée , tous les moments sont finis

Ex : Normale, Log-Normale, Exponentielle, GammaCaractéristique : queue supérieure décroît à vitesse exponentielle

Queue légère

Queue lourde

Queue finieWeibull distribution bornée supérieurement

Ex : Uniforme, BêtaCaractéristique : queue supérieure finie

P (Mn−bn/an ≤ x)d−→ G(x)

Fréchet distribution non bornée, certains moments ne sont pas finis ; variance infinie si et

Ex : Cauchy, Student t, ParetoCaractéristique : queue supérieure décroît à vitesse polynômiale x−α

[Xr] < ∞ ↔ r < αα > 2

lundi 10 mars 2014

DISTRIBUTION VALEUR-EXTRÊME GÉNÉRALISÉE (GEV)

Gumbel Fréchet Weibullξ > 0ξ → 0 ξ < 0

G(x) =

�exp

�−�1 + ξ

�x−µσ

��−1/ξ�

si 1 + ξ(x− µ)/σ > 0 et ξ �= 0

exp�− exp

�−x−µ

σ

��avec x ∈ et ξ = 0

[Xr] < ∞ ↔ ξ < 1/r

Condition sur les momentsposition échelleforme

µσξ = 1/α

lundi 10 mars 2014

EN PRATIQUEBlock-MaximaOn crée des blocs de longueur n à partir des observations avec n «grand»

Mn,1, . . . ,Mn,m

Choix fréquent : bloc = 1 an

Maxima annuel : cumul journalier, horaire ou mensuel

Maximum de vraisemblance

L(µ,σ, ξ;Mn,1, . . . ,Mn,m) =m�

i=1

g(Mn,m;µ,σ, ξ)

g(x;µ,σ, ξ) =∂G(x;µ,σ, ξ)

∂xOù est la densité de la GEV

Minimisation de la log-vraisemblance négative

l(µ,σ, ξ;Mn,1, . . . ,Mn,m) = − ln (L(µ,σ, ξ;Mn,1, . . . ,Mn,m))

Sous contrainte : 1 + ξ(x− µ)/σ > 0 Cas à part : ξ = 0

➡ Bonnes propriétés de convergence en général et adaptabilitélundi 10 mars 2014

FONCTION DE QUANTILES

est un quantile de niveau xp 1− p ⇐⇒ G(xp) = 1− p

xp = µ− σ

ξ

�1− {− log(1− p)}−ξ

�

Niveau de retour xp de période de retour p : niveau dépassé en moyenne une fois par T = 1/p années

T = 2 ←→ p = 0.5

T = 5 ←→ p = 0.2

T = 10 ←→ p = 0.1

T = 20 ←→ p = 0.05

T = 50 ←→ p = 0.02

T = 100 ←→ p = 0.01

T = 1000 ←→ p = 0.001

10 %

90 %

Temps moyen entre les dépassements : environ 10 ans

p = 10%

lundi 10 mars 2014

Niveaux de retour

xp = µ− σ

ξ

�1− {− log(1− p)}−ξ

�

• Pour des niveaux de quantiles modérés, le paramètre de position de la GEV a le plus d’influence.

• Pour des niveaux de quantiles élevés, c’est le paramètre de forme qui est déterminant.

➡ L’estimation du paramètre de forme dépend des observations extrêmes et présente beaucoup de variance (sensibilité aux fortes observations).

µ = 10

µ = 100

σ = 1

T = 10 T = 20 T = 50 T = 100 T = 1000ξ = 0.2

ξ = 0

ξ = −0.2

Fréchet

Gumbel

Weibull

lundi 10 mars 2014

Graphique Quantiles-Quantiles

Statistiques d’ordre : {X(1), . . . , X(n)} telles que X(1) ≤ · · · ≤ X(n)

Fonction de répartition empirique

�Fn(x) =1

n

n�

i=1

I{X(i)≤x}p.s.−→ F (x)

➡ Correspondance entre les quantiles estimés par le modèle aux fréquences empiriques et les statistiques d’ordre (quantiles empiriques)

Fréquences empiriques�i

n

�n

i=1

=

�1

n, . . . ,

n− 1

n, 1

�

�i− 0.5

n

�n

i=1

=

�0.5

n, . . . ,

n− 0.5

n

�Fréquences empiriques de Hazen

lundi 10 mars 2014

Graphique Quantiles-Quantiles��

�F−1

�i− 0.5

n

�, X(i)

��n

i=1

=

��µ− �σ

�ξ

�1− {− log((i−0.5)/n)}−�ξ

�, X(i)

��n

i=1

Si le modèle est juste, le graphique quantiles-quantiles s’aligne sur la diagonale.

lundi 10 mars 2014

1948 - 19511948

CUMUL DE PRÉCIPITATION JOURNALIER À MARSEILLE

Propriétés des précipitations • intermittence• variabilité saisonnière• variabilité inter-annuelle• valeurs extrêmes

1948-2005 : 58 ans

lundi 10 mars 2014

MAX ANNUEL JOURNALIER À MARSEILLE1948-2005 : 58 ans

Ajustement d’une loi GEV par maximum de vraisemblance Paramètres estimés

location : 49.531 scale : 18.812 shape : 0.205

Erreurs standard location : 2.817 scale : 2.247 shape : 0.111



sans le plus grand max

lundi 10 mars 2014

DIAGNOSTIQUES

�xp = �µ− �σ�ξ

�1− {− log(1− p)}−�ξ

�

➡ Incertitude plus grande pour les grands niveaux de retour (grands quantiles) due à l’incertitude sur l’estimation du paramètre de forme

Quelle est la période de retour de la plus forte pluie (environ 200 mm ) ?

lundi 10 mars 2014

Comparaison avec un ajustement d’une loi de Gumbel ξ = 0

Paramètres estimés

Gumbel location : 51.79 (2.86) scale : 20.88 (2.25)GEV location : 49.53(2.82) scale : 18.81 (2.25) shape : 0.205 (0.111)

Log-vraisemblance nég.

Gumbel 268.5355GEV 270.9504

➡ Le paramètre de forme est-il significativement différent de zéro ?➡ Quelle distribution est plus adéquate ?

AIC (valeur élevée)

2 x -268.5 - 2 x 2 = -5412 x -271.0 - 2 x 3 = -548

BIC (valeur élevée)

2 x 268.5 - 2 x log(58) = -5452 x 271,0 - 2 x log(58) = -554

lundi 10 mars 2014

NIVEAU DE LA MER À VENISELe acque alte

+ 1 m

lundi 10 mars 2014

NIVEAU ANNUEL MAXIMAL

Ajustement d’une loi GEV par maximum de vraisemblance Paramètres estimés

location : 111.092 (2.628) scale : 17.174 (1.803) shape : -0.077 (0.074)

lundi 10 mars 2014

DIAGNOSTIQUES

Quel est le niveau de retour de 100 ans ?

�xp = �µ− �σ�ξ

�1− {− log(1− p)}−�ξ

�

lundi 10 mars 2014

TENDANCE ANNUELLEIntroduire une covariable pour le paramètre de position de la GEV : t année

µ(t) = µ0 + µ1t

Comment faire l’apprentissage des coefficients de la régression ?

Log-vraisemblance conditionnelle

l(µ0, µ1,σ, ξ|(t1, x1), . . . , (tn, xn)) =n�

i=1

ln g(xi|µ = µ0 + µ+ 1ti,σ, ξ)

µ0 = 111.65 (2.25)

µ1 = 8.39 (2.07)

σ = 14.58 (1.58)

ξ = −0.027 (0.083)

lundi 10 mars 2014

Log-vraisemblance conditionnelleSoit , des variables indépendantes qui influencent la distribution de x On fait l’hypothèse que :

z

µ(z) = h1(z;β1) σ(z) = h2(z;β2) ξ(z) = h3(z;β3)

où h1(·;β1), h2(·;β2), h3(·;β3) sont des fonctions des variables z

avec les vecteurs de paramètres β1, β1, β3 à apprendre en maximisant :

l(β1,β2,β3|(z1, x1), . . . , (zn, xn)) =

n�

i=1

ln g(xi|µ = h1(zi;β1),σ = h2(zi;β2), ξ = h3(zi;β3))

➡ On fait donc l’hypothèse que les maxima sont distribués selon une loi GEV conditionnellement à z

Niveaux de retour

Interprétation ?

xp(z) = µ(z)− σ(z)

ξ(z)

�1− {− log(1− p)}−ξ(z)

�

lundi 10 mars 2014

Vilfredo Pareto, sociologue et économiste italien 1848 - 1923

Loi de Pareto : répartition des richesses

« 20 % de la population détient 80% des richesses »

Modèles pour les excédents de variables aléatoires

Approche «Peaks-over-Threshold» PoT développée par les hydrologues

lundi 10 mars 2014

Fixer un seuil et utiliser les excédents au-delà du seuilPermet d’inclure plus d’observations dans l’estimation que l’approche des maxima

u

Z1

Z2

Z3

Z4

Z5

Z6

Z7

Z8

Z9

Z10

Z11

Z12

V1

V2

V3

V4

V5

V6

V7

Student Version of MATLAB

Distribution de Pareto généralisée GPD : modélise les excédents au-delà d’un seuil

Peaks-over-Threshold

X ∼ F

La distribution des excédents est donnée par :

Si F est connue alors :

Si on se sert d’une estimation de F pour estimer , on risque d’avoir des problèmes d’extrapolation car il y a peu d’observations extrêmes.

Fu(y)

Fu(y) = P {X ≤ u+ y|X > u}

∀0 < y < xF − u

Fu(y) =F (u+ y)− F (u)

1− F (u)

lundi 10 mars 2014

Distribution de Pareto généralisée approximation pour la distribution des excédents

H(y) =

�1−

�1 + ξ

y�σ�−1/ξ

si ξ > 0

1− exp�− y

�σ�

si ξ = 0

ξ > 0

ξ = 0

ξ < 0

lorsque , H est la distribution exponentielle de paramètreξ = 0 �σCas particuliers

lorsque , H est une distribution bornée supérieurementξ < 0

lorsque , H est une distribution de Pareto à queue lourde ξ > 0

➡ Le paramètre de forme définit trois classes de distributions tout comme les domaines d’attraction maximale Gumbel, Weibull et Fréchet.

[Xr] < ∞ ↔ ξ < 1/r

Condition sur les moments

lundi 10 mars 2014

Théorème de Pickands-Balkema-de HaanSoit X1, X2, ... Xn une suite de variables aléatoires indépendantes avec f.d.r. F et considérons

Soit X l’une des variables de la suite et supposons que, pour n grand, l’on ait :

où G est la f.d.r. de la GEV pour . Alors, pour u suffisamment grand, la distribution des excédents peut être approximée par

définie sur

où

Mn = max{X1, X2, . . . , Xn}

P{Mn ≤ x} ≈ G(x)

µ,σ et ξ

�σ = σ + ξ(u− µ)

{y : y > 0, (1 + ξy/�σ) > 0}{y : y > 0, (1 + ξy/�σ) > 0}

➡ Si les maxima sont approximativement distribués selon la GEV, alors les excédents sont approximativement distribués selon la GPD.

Fu(y) = P {X > u+ y|X > u} ≈ H(y) =

�1−

�1 + ξ

y�σ�−1/ξ

si ξ > 0

1− exp�− y

�σ�

si ξ = 0

lundi 10 mars 2014

STABILITÉ PAR SEUILLAGE

Pour une distribution donnée, si les maxima convergent vers la GEV, alors les excédents convergent vers la GPD.

Les paramètres de la GPD sont déterminés par ceux de la GEV :

Le paramètre de forme est le même : ‣ queue lourde (décroissance polynômiale) ‣ queue légère (décroissance exponentielle)‣ queue finie (bornée)

�σ = σ + ξ(u− µ)

ξ > 0

ξ = 0ξ < 0

La GPD possède la propriété de stabilité par l’opération seuil :

Y ∼ GPD =⇒ Y − u|Y > u ∼ GPD ∀u > 0

H(y) =

�1−

�1 + ξ

y�σ�−1/ξ

si ξ > 0

1− exp�− y

�σ�

si ξ = 0

lundi 10 mars 2014

{X(1), . . . , X(n)} =⇒ {X(k+1), . . . , X(n)}

Les excédents sont donnés par :

u = X(k)

EN PRATIQUEPeaks-over-ThresholdOn définit les excédents à partir des observations avec un seuil u «grand»Par exemple, on fixe k et on poseAlors, les observations qui dépassent le seuil sont :

{Y1 = X(k+1) − u, . . . , Yn−k = X(n) − u}

Maximum de vraisemblance

Minimisation de la log-vraisemblance négative

Sous contrainte : Cas à part : ξ = 0

➡ Bonnes propriétés de convergence en général et adaptabilité

L(�σ, ξ;Y1, . . . , Ynu) =nu�

i=1

h(Yi − u; �σ, ξ) Où est la densité de la GPD h(y; �σ, ξ)

l(�σ, ξ;Y1, . . . , Ynu) =nu�

i=1

lnh(Yi − u; �σ, ξ)

(1 + ξy/�σ) > 0

lundi 10 mars 2014

CHOIX DU SEUIL

Dilemme biais-variance

‣ plus le seuil est élevé, plus l’approximation asymptotique de la distribution des excédents par la GPD est juste et plus le biais diminue

‣ moins le seuil est élevé, plus le nombre d’excédents est grand pour l’estimation des paramètres de la GPD et plus leur variance est petite

‣ dilemme similaire avec le choix de la taille du bloc dans l’approche des maxima mais solution pragmatique bloc = année

➡ Adopter le seuil le plus bas tel que l’approximation asymptotique est à peu près valide

lundi 10 mars 2014

Mean Residual Life Plot graphique de l’espérance excédentaire

Si ξ < 1 [Y ] =σ

1− ξY ∼ GPD et alors

Supposons X − u0|X > u0 ∼ GPD alors

[X − u0|X > u0] =σu0

1− ξ

Aussi ∀u > u0 [X − u|X > u] =σu

1− ξ=

σu0 + ξu

1− ξ

Donc, pour la moyenne est une fonction linéaire de uu > u0

��u,

1

n− k

n�

i=k+1

(X(i) − u)

��

➡Tracer le graphique de l’espérance excédantaire et identifier la plus petite valeur de u pour laquelle il devient linéaire :

lundi 10 mars 2014

Precipitation journalière positive à Marseille graphique de l’espérance excédentaire

lundi 10 mars 2014

Stabilité des paramètres estimés par rapport au choix du seuil

��u, �ξu

��{(u, �σ∗

u)} où σ∗u = σu − ξu

lundi 10 mars 2014

NIVEAU DE RETOUR

Supposons que P{X > x|X > u} =

�1 + ξ

�x− u

σ

��−1/ξ

∀x > u

Il s’en suit : P{X > x} = ζu

�1 + ξ

�x− u

σ

��−1/ξ

∀x > u

Où ζu = P{X > u}

Pour trouver le niveau qui sera dépassé une fois sur m, il faut résoudre :

ζu

�1 + ξ

�xm − u

σ

��−1/ξ

=1

m

On obtient : xm = u+σ

ξ[(mζu)

ξ − 1] xm > u

Pour obtenir le niveau dépassé en moyenne une fois par N ans avec ny le nombre d’observations par année : m = N × ny

�ζu =k

nEstimation de la probabilité d’excéder le seuil :

lundi 10 mars 2014

Fixons le seuil u = 10 mm : 1029 excédents soit moins de 5% des données

Estimateurs MLE des paramètres de la GPD

�ξ = 0.21 (0.11)

Estimateur MLE du paramètre de forme de la GEV (58 max annuels)

Precipitation journalière positive à Marseille

�σ = 12.07(0.55) ξ = 0.13(0.033)

lundi 10 mars 2014

EXCÉDENTS CONDITIONNELLEMENT DÉPENDANTS

Log-vraisemblance conditionnelleSoit , des variables indépendantes qui influencent la distribution de x On fait l’hypothèse que :

z

ξ(z) = h3(z;β3)

où h1(·;β1), h2(·;β2), h3(·;β3) sont des fonctions des variables z

avec les vecteurs de paramètres β1, β1, β3 à apprendre en maximisant :

l(β1,β2,β3|(z1, x1), . . . , (zn, xn)) =

➡ On fait donc l’hypothèse que les maxima sont distribués selon une loi GPD conditionnellement à z

�σ(z) = h2(z;β2)u(z) = h1(z;β1)

n�

i=1

lnh(xi − u|u = h1(zi;β1), �σ = h2(zi;β2), ξ = h3(zi;β3))

lundi 10 mars 2014

Global Flood Risk under Climate ChangeNature Climate Change June 2013 ‣ 11 modèles de climat de CMIP5

‣ Calcul du niveau de retour 100 ans pour les crues au 20ème siècle (1971-2000)

‣ Sous le scénario RCP85 au 21ème siècle (2071-2100), calcul de la période de retour du niveau de retour 100 ans du 20ème siècle

‣ On considère la médiane des périodes de retour des 11 modèles.

lundi 10 mars 2014

Documents

THÉORIE DES VALEURS EXTRÊMES - Julie Carreau · 687 mm de pluie en 24h Débit de 830 m3/s Barrage écréteur de crues de la Rouvière : ... Stabilité par l’addition : n X + b