Upload
others
View
14
Download
0
Embed Size (px)
Citation preview
Mémoire présenté devant l’Université Paris Dauphine
pour l’obtention du diplôme du Master Actuariat
et l’admission à l’Institut des Actuaires
le _____________________
Par : Houda Afailal
Titre: Modélisation de la valeur contrat pour le pilotage du portefeuille moto
Confidentialité : X NON OUI (Durée : 1 an 2 ans)
Les signataires s’engagent à respecter la confidentialité indiquée ci-dessus
Membre présent du jury de l’Institut
des Actuaires : Signature :
Entreprise :
Nom : Run Services /AXA France
Signature :
Directeur de mémoire en entreprise :
Membres présents du jury du Master
Actuariat de Dauphine :
Nom : Thomas Gauthron (Manageur)
Vanessa Roger (Maître de stage)
Signature :
Autorisation de publication et de mise en ligne sur un site de diffusion de documents
actuariels (après expiration de l’éventuel délai de confidentialité)
Signature du responsable entreprise :
Secrétariat :
Bibliothèque : Signature du candidat :
Université Paris-Dauphine, Place du Maréchal de Lattre de Tassigny,75775 PARIS Cedex 16
Master Actuariat de Dauphine
Remerciements
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 2
Remerciements
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 3
Remerciements Bien qu’étant chargée d’études actuarielles stagiaire au sein de la société Run Services, ce stage a
eu la particularité de se dérouler dans les locaux d’AXA France, au sein de la Direction de Marché IARD,
dans le service « Auto Particuliers ». Avant toute chose, j’aimerai remercier toutes les personnes ayant eu
un rôle concernant la réalisation de ce mémoire. La richesse de cette expérience se manifeste autant sur le
plan professionnel que sur le plan humain. J’y ai construit mon intégration dans le monde de l’Actuariat,
développé des compétences telles que la rigueur du raisonnement et enfin réalisé que « tous les modèles
sont faux, mais certains sont utiles », (George Box).
Je souhaiterais d’abord remercier Hervé Gicquel, directeur général de Club 14 pour m’avoir
accueillie au sein de son entreprise.
Je remercie également Delphine Maisonneuve, directrice du marché IARD Particuliers d’Axa
France, et Bruno Foubert, directeur de la branche automobile du marché IARD d’ Axa France pour leur
accueil au sein de la direction de marché IARD.
Je remercie mon manageur Thomas Gauthron, pour m’avoir reçue au sein du service « Auto
Particuliers » et pour la confiance qu’il m’a témoignée.
Je remercie tout particulièrement Vanessa Roger, pour son encadrement durant ce stage, la
formation professionnelle qu’elle m’a apportée, ainsi que pour la richesse des conseils qu’elle a pu me
donner.
Je remercie l’ensemble de l’équipe Auto, dont mes voisins de bureau, pour leur bonne humeur
quotidienne ainsi que Claire Lafosse Marin et Valérie Robinet pour leur bienveillance et contribution au
bon déroulement de ce stage.
Je remercie enfin l’équipe pédagogique de l’université Paris Dauphine pour m’avoir fourni la
connaissance nécessaire au déroulement de cette expérience : Marc Hoffmann, responsable du Master 2
Actuariat de l’université Paris Dauphine pour son écoute, et Emmanuel Lépinette, maître de conférences à
l’université Paris Dauphine, pour son aide quant à la rédaction de ce mémoire.
Sommaire
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 4
Sommaire Remerciements .................................................................................................................................................. 3
Sommaire........................................................................................................................................................... 4
Résumé .............................................................................................................................................................. 6
Abstract ............................................................................................................................................................. 6
Synthèse ............................................................................................................................................................ 7
Summary .......................................................................................................................................................... 11
Cadre de l’étude et problématique ................................................................................................................. 15
Présentation institutionnelle ....................................................................................................................... 15
La valeur contrat : un outil de pilotage en marketing devant être modélisé .............................................. 17
Partie 0 : Extraction des données et établissement du périmètre .................................................................. 20
0.1 Choix de la base ..................................................................................................................................... 20
0.2 Structure des données ........................................................................................................................... 20
0.3 Périmètre de l’étude .............................................................................................................................. 25
Partie 1 : Modélisation de la prime pure ......................................................................................................... 26
I. Analyse descriptive pour la modélisation de la prime pure ..................................................................... 27
I.1 Analyse uni variée ............................................................................................................................... 27
I.2. Etude des corrélations ....................................................................................................................... 29
I.3. Tests de significativité d’ANOVA (Analyse de la variance) ................................................................ 32
I.4. Analyse en composantes multiples : une confrontation des résultats précédents .......................... 33
II. Construction du modèle de prime pure .................................................................................................. 36
II.1 Choix de l’approche et application de la théorie des modèles linéaires généralisés ........................ 36
II.2 Obtention d’un modèle de segmentation et d’explication de la prime pure ................................... 41
II.3. Validation du modèle de prime pure ............................................................................................... 43
III. Conclusion .............................................................................................................................................. 57
Partie 2 : Modélisation de la prime commerciale ........................................................................................... 58
I. Analyse descriptive pour la modélisation de la prime commerciale .................................................. 59
I.1 Analyse uni variée ............................................................................................................................... 59
I.2 Etude des corrélations entre la prime commerciale et l’ensemble des variables du support ......... 61
I.3 Tests de significativité des variables par analyse de la variance ........................................................ 62
II. Construction du modèle de prime commerciale ..................................................................................... 62
II.1 Modèle de segmentation et de prédiction de la prime commerciale ............................................... 64
II.2 Validation du modèle de prime commerciale ................................................................................... 65
III. Conclusion ....................................................................................................................................... 70
Partie 3 : Modélisation de la probabilité de résiliation ................................................................................... 72
I. Intérêt et cadre de la modélisation de la probabilité de résiliation ......................................................... 72
Sommaire
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 5
II. Analyse descriptive pour la modélisation de la probabilité de résiliation .......................................... 74
II.1 Analyse uni variée ............................................................................................................................. 74
II.2 Corrélations entre la variable de résiliation et le support ................................................................ 76
II.3 Analyse en composantes multiples ................................................................................................... 77
III. Construction du modèle de résiliation ................................................................................................... 78
III.1 Théorie sur la régression choisie ...................................................................................................... 78
III.2 Résultats de la sélection ................................................................................................................... 79
III.3 Analyse du pouvoir discriminant ...................................................................................................... 80
III.4 Les rapports de chance ..................................................................................................................... 82
III.5 Résultats obtenus sur la base de test et conclusion......................................................................... 84
Partie 4 : Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle .......................... 86
Conclusion de l’étude ...................................................................................................................................... 89
Bibliographie .................................................................................................................................................... 90
Table des illustrations ...................................................................................................................................... 91
Figures ......................................................................................................................................................... 91
Tableaux ...................................................................................................................................................... 93
Annexes : ......................................................................................................................................................... 95
Annexe 1 : Résultats et interprétations du tri à plat pour la prime pure .................................................... 95
Annexe 2 : Matrice des corrélations entre les variables du support et la prime pure .............................. 104
Annexe 3 : Coordonnées et contribution des modalités de l’ACM sur la sinistralité ................................ 105
Annexe 4 : Procédure itérative de Newton Raphson ................................................................................ 107
Annexe 5 : Pseudo Code de l’algorithme de sélection -segmentation ..................................................... 108
Annexe 6 : Code SAS de la procédure « Genmod » pour les modèles de fréquence et coût moyen ....... 110
Annexe 7 : Résultats du tri à plat pour la prime commerciale .................................................................. 112
Annexe 8 : Résultat du tri à plat pour la probabilité de résiliation .......................................................... 114
Annexe 9 : Matrice de corrélation entre les facteurs du support de la probabilité de résiliation ............ 117
Annexe 10 : Coordonnées et contribution des modalités de l’ACM sur la résiliation .............................. 118
Résumé / Abstract
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 6
Résumé Mots-Clés : Assurance moto, Analyse descriptive, GLM (Modèles linéaires généralisés), Résiliation,
Rentabilité, Segmentation, Valeur contrat.
La valeur contrat en assurance moto est un indicateur de rentabilité du contrat, correspondant à la
somme actualisée des résultats probables générés par le contrat sur un certain nombre d’années. Ce
mémoire met en place une méthodologie de calcul de cette dernière, ainsi que les limites que celle-ci
possède. Trois modèles seront mis en place :
Un modèle de segmentation et prédiction de la prime pure ayant un pouvoir explicatif moyen de
84%.
Un modèle de segmentation et prédiction de la prime commerciale dont le pouvoir explicatif est de
75%.
Un modèle d’évaluation de la probabilité de résiliation de l’assuré dont le taux de bon reclassement
est de 58%.
La dernière partie de ce mémoire établit une méthodologie de calcul de la valeur contrat et
débouche sur des pistes d’amélioration du modèle.
Cet outil de pilotage en marketing s’inscrit dans un cadre innovant dans la mesure où, peu utilisé en
assurance IARD, il permet d’avoir une vision de la rentabilité du portefeuille. Sa mise en place est
cependant complexe, et nécessite la prise en compte de l’ensemble des particularités du portefeuille.
Abstract Key - Words: Motorcycle insurance, Descriptive Statistics, GLM (Generalized Linear models), Termination,
Profitability, Segmentation, Policy value.
The value of a motorcycle policy indicates the contract profitability, and corresponds to the discounted
sum of the likely outcomes generated by the contract for a certain number of years. This thesis establishes
a methodology for calculating the latter, as well as its limitations. Three models were built:
A model of segmentation and prediction of the pure premium with an average explanatory power
of 84 %
A model of segmentation and prediction of the commercial premium with an explanatory power
of 75%.
A model that evaluates the probability of the contract termination of the insured with a rate of
correct reclassification of 58%.
The last part of this thesis establishes a methodology for calculating the contract value and leads
to ways to improve the model.
This portfolio management tool is part of an innovative framework because it is not very used in property
and casualty insurance. It enables to forecast the profitability of the policies but its establishment is
complex and requires taking into account the whole specificities of the portfolio.
Synthèse /Summary
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 7
Synthèse
Afin d’améliorer la politique de souscription et la fidélisation de ses clients, AXA a construit un indice client.
Ce dernier est une note comprise entre 1 et 5, allant de « client standard » à « très bon client ».
L’établissement de cet indice est réalisé, entre autres, à partir de la valeur des contrats en auto.
La valeur contrat en assurance moto est un indicateur de rentabilité du contrat, correspondant à la
somme actualisée des résultats probables générés par ce contrat sur un certain nombre d’années
Aujourd’hui, un détenteur d’automobiles et de motos assurées chez AXA possède un indice client au sein
duquel seule la valeur de ses contrats automobile est intégrée, et non celle de ses contrats moto.
L’utilité de cette étude réside dans le fait de faire entrer la valeur contrat moto dans cet indice, et au-delà
de cet objectif, faire en sorte que celle-ci devienne un outil de pilotage de portefeuilles en marketing. La
valeur contrat dépend de la prime pure du contrat, de sa prime commerciale ainsi que de sa probabilité de
présence dans le portefeuille, comme le montre la formule ci-dessous :
Équation 1 Formule de la valeur contrat
Les trois paramètres cités précédemment seront modélisées dans ce mémoire, constitué de cinq parties.
La première partie consiste en la description de la méthode d’extraction de l’échantillon servant de support
à la modélisation. Les trois parties suivantes illustrent respectivement comment les modèles de prime pure,
prime commerciale et probabilité de résiliation du contrat ont été construits. Enfin, la cinquième partie
dresse une méthodologie de calcul de la valeur contrat.
1. Extraction des données et établissement d’un périmètre
La partie préliminaire à la modélisation décrit comment les données ont été extraites : elle réside
principalement en une étude du degré de fiabilité des données concernant l’assuré. Le caractère prédictif
de la problématique fait qu’il est utile de disposer d’une « marge » dans le passé pour pouvoir tester la
stabilité du modèle, pour cela l’échantillon de support à la modélisation est celui de l’année 2011. Enfin, un
périmètre est dressé dans un souci d’homogénéité des données : l’étude ne prend en compte que les
∑ ⏞
( ) ⏟
( )⏞
( ( ))⏞
Prime commerciale de l’année k
Prime pure de l’année k
Produits financiers de l’année k
Frais d’acquisition et de gestion de l’année k
Taux d’actualisation entre l’année 0 et l’année k
Taux d’inflation de l’année k
( ) Probabilité de résiliation entre l’année 0 et l’année k.
Sommaire
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 8
contrats à tacite reconduction, exclut les motos de collection, ainsi que deux niveaux de garanties du
produit moto Club 14, qui sont des cas dérogatoires.
2. Modélisation
Les trois parties suivantes du mémoire ont une structure similaire. Elles consistent d’abord en une analyse
descriptive de la variable réponse en question. Elles débouchent par la suite sur la construction d’un
modèle de segmentation et de prédiction (prime pure et la prime commerciale) ou uniquement d’un
modèle de prédiction (probabilité de résiliation). Les modélisations font toutes appel à la théorie des
modèles linéaires généralisés.
Construction d’un modèle de segmentation et de prédiction de la prime pure
L’ensemble des facteurs qui seraient des potentiels éléments de la modélisation de la prime pure sont des
variables essentiellement tarifaires. Les « meilleurs » candidats ont été repérés par plusieurs outils qui sont
les suivants :
Une analyse uni-variée consistant en la représentation graphique de la prime pure en fonction du
facteur en question
Une étude des corrélations entre les facteurs ainsi qu’entre la prime pure et les facteurs
Une analyse de la variance confirmant la significativité de certains facteurs à un seuil de 5 %
Une analyse en composante multiples sur les individus sinistrés et ceux qui ne l’étaient pas a
permis de confronter les résultats précédents.
La modélisation a été effectuée selon une démarche fréquence/coût moyen. La sélection des meilleurs
éléments de prédiction et de segmentation de la prime pure a été réalisée grâce à une procédure
recherchant l’ensemble de variables qui maximise l’information de l’échantillon des primes pures, tout en
minimisant l’effectif de cet ensemble.
Il en résulte que les facteurs par lesquels la prime pure a été segmentée et prédite sont les suivants :
Modèle de fréquence : zone, formule de souscription, ancienneté de la carte grise, groupe (facteur
indiquant les caractéristiques techniques de la moto), ancienneté du permis.
Modèle de coût moyen : Niveau de prix du véhicule et formule de souscription.
Les deux modèles expliquent en moyenne 84 % de la variance de l’échantillon, ce qui est selon la
littérature un bon indicateur de qualité. Les plus grands écarts de prédiction sont observés pour les risques
peu exposés ou ayant eu peu de sinistres.
D’éventuelles pistes d’amélioration de ce modèle seraient :
Tester une paramétrisation du coût moyen selon la loi de Weibull
Prédire non pas le coût moyen mais la variation du coût moyen par rapport à un coût moyen
minimal.
Choisir une autre méthode de détermination de la meilleure segmentation, notamment celle
basées sur l’analyse de la variance.
Construction d’un modèle de segmentation et de prédiction de la prime commerciale
La prime commerciale n’est pas déterministe et pour cela il faut la modéliser: elle change en fonction des
modifications que l’assuré a décidé d’apporter à son contrat. Les mêmes outils que ceux utilisés lors de la
partie précédente sont utilisés (analyse uni variée, étude des corrélations, tests de significativité,
algorithme de sélection des facteurs).
Sommaire
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 9
Les «meilleurs » facteurs par lesquels la prime commerciale est segmentée puis prédite sont les suivants :
la formule de souscription, le groupe, l’ancienneté de permis ainsi que le coefficient technique. Les facteurs
sont globalement identiques à ceux utilisés dans le modèle de prime pure. L’ajustement de cette prime
commerciale prédite par rapport à l’individu est d’une bonne qualité, et en moyenne, cette dernière sera
pratiquement égale à celle évaluée par le modèle. Les erreurs de prédiction du modèle de prime
commerciale sont les plus élevées sur les cases tarifaires ayant peu d’effectif.
Construction d’un modèle de prédiction de la probabilité de résiliation
Probabiliser le flux du contrat l’année passe par la détermination de la probabilité de résiliation de
chaque assuré entre l’année 0 et l’année k. Le modèle d’explication de la probabilité de résiliation est basé
sur la projection d’une variable réponse binaire (Résiliation: Oui/ Non) via une régression logistique.
Les facteurs permettant de prédire la probabilité de résiliation sont les suivants : l’âge du conducteur, la
durée de détention du véhicule, l’ancienneté du contrat, la formule de souscription, le fractionnement de
ses cotisations, ainsi que le coefficient technique.
Ce modèle à un taux de bon reclassement de 58 %. Les rapports de chance ont permit d’isoler l’impact de
chaque variable du modèle et de cerner les groupes qui avaient plus de chances de perdurer dans le
portefeuille. Les résultats du modèle de résiliation sont assez corrects dans la mesure où l’objectif n’est pas
de prédire un acte de résiliation mais de calculer une probabilité de présence dans le portefeuille.
3. Méthodologie de calcul de la valeur contrat
L’ensemble des paramètres du modèle est à présent disponible et permettra de déterminer une valeur
contrat. La formule suivante explicite l’évaluation de la valeur contrat.
∑ ⏞
( ) ⏟
( )⏞
( ( ))⏞
∑∏
∏
∏
( )
( ) ( ∏ (
))
( ) ∏ (
) ∏
∑
∑
(
)
(
)
(
)
(
)
Sommaire
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 10
Sous réserve de stabilité sur les années 2011, 2012 et 2013, ces modèles seront implémentés dans un
programme SAS déroulant la méthodologie de calcul de la valeur contrat moto.
Conclusion Les différents facteurs entrant en compte dans ce modèle de valorisation sont plutôt classiques et
incorporent des variables autant liées à l’assuré lui même qu’à la politique de tarification de l’entreprise.
Les résultats montrent que la formule de souscription agit de façon prépondérante dans l’établissement de
la valeur contrat.
Par ailleurs, la valeur du contrat est évaluée en faisant abstraction des sinistres graves, leur intégration
consisterait probablement en une des pistes d’amélioration les plus notables. Le modèle en question
pourrait également être complexifié de part l’intégration de modèles de prédictifs pour d’autres facteurs,
ou par exemple la détention d’une formule de souscription deviendrait un évènement aléatoire à prédire
sur un horizon de temps à venir.
Le fait que les indicateurs de rentabilité prospectifs ne soient pas très utilisés en assurance non vie inscrit
cette étude dans un cadre novateur. Dans un contexte où la concurrence au sein du marché de l’assurance
moto devient de plus en plus importante, il est essentiel de développer cette typologie d’outils de pilotage
des portefeuilles. La valeur contrat peut, à terme, être une alternative au S/C ou encore être intégrée
comme facteur dans l’évaluation du tarif de l’assuré.
Synthèse /Summary
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 11
Summary In order to improve its customers underwriting policy and their loyalty, AXA has built a “customer index”.
This index is a score which can range from 1 ( standard customer) to 5 (great customer). Its establishment
depends on the customer’s car insurance policy value.
The value of a car insurance policy indicates the contract profitability, and it corresponds to the
discounted sum of the likely outcomes generated by the contracts for a certain number of years Now, the customer index of a car insurance policyholder , who has also insured its motorcycle within AXA,
is estimated on the basis of the value of its car insurance contracts and not its motorcycle insurance
contracts.
The main utility of this study relies on integrating motorcycle contract values in the customer index.
Beyond this, also make the motorcycle policy value become a management tool for motorcycle portfolios.
This policy value depends on the contract’s pure and commercial premiums, and the probability of the
contract termination. It is defined in a more mathematical approach in the formula below:
Equation 2 Policy value formula
The three previous parameters are going to be modeled in this thesis, which consists of five parts.
The first part of this study describes the extraction method used in order to collect the data on which the
model has been built. The three next steps respectively illustrate how the pure premium model, the
commercial premium model and the termination probability model have been set up. The last part
establishes a technical for the computation of the policy value.
Extracting the data and building the scope of the study
The preliminary part to the modeling describes how the data has been extracted. It mainly lies on analyzing
the level of reliability of the available information about the policy holder.
The predictive aspect of the problem requires that stability of the model in the future has to be tested. This
is why the sample on which the study is built is taken from 2011 data.
In order to have a homogeneous sample, a scope of the study is set up. It excludes the contracts which
aren’t evergreen, vintage motorcycles and two types of guarantees offered by Club 14’s motorcycle
insurance product.
∑ ⏞
( ) ⏟
( )⏞
( ( ))⏞
Commercial premium at year k
Pure premium at year k
Financial incomes at year k
Acquisition and management expenses at year k
Discount rate between instant 0 and instant k
Inflation at year k
( ) Probability of termination between 0 and instant k.
Sommaire
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 12
Modeling
The next three parts of this thesis have a similar structure. They primarily consist in a descripttive analysis
of response variable. They lead to the construction of a prediction and segmentation model (pure premium
and commercial premium) or only a prediction model (termination probability). All these models use the
generalized linear models theory.
Building a pure premium model of segmentation and prediction
All the factors that are candidate to modeling and segmenting the pure premium are tariff variables. The
best candidates for forecasting the pure premium have been highlighted with the next tools :
A univariate analysis consisting of the graphical representation of the pure premium based on the
factor in question
A study of correlations between factors as well as between the pure premium and factors
An analysis of variance confirmed the significance of certain factors with a threshold of 5%
The modeling was conducted using a frequency / medium cost approach. The selection of the the best
predictors and the segmentation of the pure premium has been achieved through a procedure looking for
the set of variables that maximizes the information from the sample of pure premiums , while minimizing
the size of this set.
It follows that the factors by which the premium was pure segmented and are predicted :
• Frequency model: Area , subscription form , length of the logbook, group ( factor of the technical features
of the bike ) , length of the drivers license.
• Average cost model : price level of the vehicle and subscription form .
Both models explain on average 84% of the sample variance, which is according to the literature a good
indicator of quality. The greatest differences were observed for predicting risk or have had little exposure
little claims.
Possible ways of improving this model are :
• Test a parameterization of the average cost using the Weibull
• Predict not the average cost but the change in the average cost over a minimum average cost.
• Select another method for determining the best segmentation , including that based on the analysis of
variance.
Building a model of segmentation and prediction of the commercial premium
The commercial premium is not deterministic and for that you need to model: it changes according to the
changes that the insured has decided to make to his contract. The same tools as those used in the previous
section are used (univariate analysis , correlation study , tests of significance, algorithm selection factors).
The "best” factors by which the commercial premium is then segmented and predicted are: the
subscription form, group, driving license maturity, and technical coefficient. The factors are essentially
identical to those used in the model of pure premium. The adjustment of the policy premium predicted
relative to the individual is of good quality, and on average, it will be nearly equal to that estimated by the
model. The prediction errors of the model commercial premium are highest within the groups with less
people.
Sommaire
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 13
Building a model to predict the probability of termination
Probabilize the flow of the contract of year k involves determining the probability of termination of each
insured between year 0 and year k . The model explaining the probability of termination is based on the
projection of a binary response variable (Termination : Yes / No) via logistic regression. Factors that predict
the probability of termination are: driver's age , the length of detention of the vehicle , length of contract,
subscription form , his contributions, as well as technical coefficient.
This model has a good reclassification rate of 58%. The odds ratios were allowed to isolate the impact of
each variable in the model and identify the groups that were more likely to persist in the portfolio. The
termination model results are quite correct to the extent that the objective is not to predict an act of
termination but to calculate a probability of presence in the portfolio.
Methodology for calculating the contract value
All parameters of the model are now available and will determine a value contract. The formula below
highlights the valuation of a contract value .
Subject to stability on the years 2011, 2012 and 2011, these models will be implemented in a SAS program
implementing the methodology of calculation of the motorcycle contract value.
∑ ⏞
( ) ⏟
( )⏞
( ( ))⏞
∑∏
∏
∏
( )
( ) ( ∏ (
))
( ) ∏ (
) ∏
∑
∑
(
)
(
)
(
)
(
)
Sommaire
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 14
Conclusion
The different factors that came into account in this valuation model are rather conventional and
incorporate variables related to the insured himself as well as to the pricing policy of the company. The
results show that the subscription form is predominant in the establishment of the contract value .
Furthermore, the contract value is estimated by ignoring serious claims , integration would probably be an
important improvement. The model in question could also be complicated by the integration of predictive
models for other factors, where a detention of a subscription formula would be a random event to predict
over a future period of time.
The fact that profitability indicators are not very used in non-life insurance places this study in an
innovative setting. In an environment where competition in the market for motorcycle insurance is
becoming increasingly important, it is essential to develop this type of portfolio management tools . The
contract value may eventually be an alternative to loss ratio or even be integrated as a factor in assessing
the rate of the insured.
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 15
Cadre de l’étude et problématique Cette partie du mémoire a pour vocation d’apporter des explications concernant le contexte au sein
duquel l’étude a été réalisée. Dans un premier temps, elle présentera les institutions impliquées ainsi que
le produit moto de Club 14, puis établira clairement la problématique liée à cette étude.
Présentation institutionnelle
Club 14 est une association loi 1901 créée en 1981 par Bruno Mier, Hervé Gicquel et Michel
Guenton. Un de ses principaux objectifs développés était de proposer des tarifs abordables et une offre
adaptée aux besoins des pratiquants de la moto. Pour faciliter la réalisation de ses idées, Club 14 s'est
associé avec un acteur majeur du monde de l'assurance : Axa France. Dans le cadre de ce partenariat
assurance / association, les motards assurant leur moto chez AXA bénéficient de l’adhésion à l’association
Club14. En 2012, Club 14 est le premier moto club de France. Pour l’anecdote, le nom Club 14 vient de la
populaire clé de 14, utilisée par les motards des années 80.
Le produit d’assurance moto Club 14 est constitué de quatre formules de souscription différentes,
numérotées de 1 à 4. Chaque formule est constituée de garanties de base et de garanties optionnelles.
Il existe une formule principale, « l’Essentiel » à partir de laquelle les autres formules sont obtenues en
élargissant le nombre de garanties.
Formule Garanties de base Garanties optionnelles
Formule 1
L’essentiel
Responsabilité civile : Imposée par la loi, assurance minimale du véhicule. Garantit la responsabilité civile de toutes les personnes assurées lorsque les dommages matériels ou corporels sont subis par un tiers lors de l’accident au sein duquel le véhicule assuré est impliqué.
Défense pénale et recours suite à un accident : Garantit l’exercice du recours de
l’assuré ainsi que la réparation des dommages subits par le véhicule assuré et ses occupants au cours de l’accident.
Décès du conducteur : Capital versé au conjoint survivant, concubin, ou héritier en cas de décès du conducteur.
Protection juridique : Assistance de la part des juristes de Juridica, entité d’AXA spécialisée dans la protection juridique.
Sécurité du conducteur : Indemnisation des dommages corporel du conducteur pour un montant s’élevant jusqu’à 15 000 €
Assistance 0 km : Dépannage, remorquage, poursuite de voyage, rapatriement en cas de panne, crevaison ou accident.
Casque du conducteur : Indemnisation du casque endommagé du conducteur dans la limite de 300 €.
Sécurité du conducteur étendue jusqu’à 200 000 €
Protection juridique confort : Intervention juridique à l’amiable et prise en charge des frais correspondants
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 16
Gilet Airbag : Indemnisation ou remise en état du gilet airbag du conducteur.
Formule 2
Le confort
Toutes les garanties de la formule 1 Incendie Vol Bris d’optique Remboursement des vêtements et
accessoires jusqu’ 450 € Valeur à neuf 1 ans :
Remboursement s’élevant au prix d’achat en cas de vol, destruction d’une moto ayant moins de 12 mois d’ancienneté
Toutes les garanties optionnelles de la formule 1
Vêtements et accessoires remboursés jusqu’à 12 000 €.
Formule 3
L’étendu
Toutes les garanties de la formule 2 Catastrophes naturelles, évènements
climatiques, catastrophes technologiques faisant l’objet d’un arrêté publié au journal officiel
Dommage collision : garantie des
dommages résultant d’une collision.
Toutes les garanties optionnelles de la formule 2
Formule 4
Le sur-mesure
Toutes les garanties de la formule 3 Tous dommages : garantie des dommages
résultant de la collision avec un ou plusieurs autres véhicules, choc entre le véhicule et un corps fixe ou mobile, acte de vandalisme etc.
Toutes les garanties optionnelles de la formule 3
Valeur à neuf étendue à deux ans
Véhicule de remplacement pour une période de huit jours en cas d’accident, 30 jours en cas de vol.
Tableau 1 Récapitulatif des garanties proposées dans le produit moto. Source : www.club14.com
En 2011, AXA /Club14 détient 15% des parts sur la marché moto, ce qui la place au deuxième rang.
Selon une publication de la Fédération Française de la société d’assurance, le parc des deux et trois roues
se présente comme suit au 31 décembre 2012.
Figure 1 Structure du parc deux roues à fin 2013. Source : FFSA
25%
24%
45%
6%
Total cyclomoteurs (scooters et mobilettes)
Motos légères
Motos 125 cm3
Autres deux/ trois roues
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 17
Le contexte au sein duquel l’étude a été réalisée ayant été établit, il s’agit à présent de définir la
problématique de l’étude.
La valeur contrat : un outil de pilotage en marketing devant être modélisé
Le projet CVM (« Customer Value Measurement ») consiste en une démarche marketing fondée sur la
valeur du client et non uniquement sur celle des contrats qu’il détient. Son objectif principal est
l’amélioration de la politique de souscription et la fidélisation des clients. Cette valeur se matérialise par le
concept de l’indice client. Le CRM, (Customer Relationship Management) octroie à chaque client un indice,
compris entre 1 et 5. L’indice vaut 1 si le client est considéré comme standard, 5 s’il s’agit d’un très bon
client. Cette note reflète deux éléments :
le taux de multi détention des contrats du client
la valeur de ces contrats
Dans cette étude, l’attention est portée sur la valeur contrat. Jusqu’ à présent, l’indice client est
actuellement uniquement construit à partir de la valeur des contrats auto. En effet, un client détenteur
d’une auto et d’une moto possède un indice client ne révélant que la valeur de ses contrats automobile et
non moto. L’objectif principal de la mission est d’intégrer la valeur des contrats motos dans l’indice.
L’enjeu consistera donc à trouver une procédure qui permette de valoriser les contrats deux et trois roues.
L’approche se base sur le résultat probable que génèrera ce contrat sur un certain nombre d’années : la
« Policy Net Present Value ». La PNPV est la somme actualisée des flux générés par le contrat. C’est un
indicateur de rentabilité qui dépend notamment de la prime pure, de la prime commerciale et du taux de
résiliation du contrat. Elle sera notée tout au long de l’étude.
Indice Client
Valeur Contrat Taux de multi détention
∑ ⏞
( ) ⏟
( )⏞
( ( ))⏞
Prime commerciale de l’année k
Prime pure de l’année k
Produits financiers de l’année k
Frais d’acquisition et de gestion de l’année k
Taux d’actualisation entre l’année 0 et l’année k
Taux d’inflation de l’année k
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 18
Au vu de cette formule, il faudra donc simuler sur N années la prime pure, la prime commerciale et la
probabilité de résiliation. Les autres paramètres en dehors des trois cités sont donnés. Ces simulations
reposent sur un effet vieillissement du contrat et du client via des variables temporelles (Exemple :
anciennetés de permis, de contrat et du véhicule).
Ainsi, divers modèles seront mis en place pour l’obtention de la PNPV.
- Un modèle de prime pure
- Un modèle de prime commerciale
- Un modèle de résiliation.
Le schéma ci-dessous résume la démarche d’obtention de la valeur contrat.
Figure 2 Schéma d’obtention de la valeur contrat
L’objectif de l’étude réside en trouver les meilleurs facteurs de prédiction pour chacun des modèles
mentionnés ci-dessus. Ce mémoire déroulera la méthodologie employée pour les déterminer. Une étape
préliminaire au cours de la quelle les techniques utilisées pour l’extraction et la fiabilisation des données
sera effectuée. Ensuite, la prime pure sera modélisée dans un premier temps : elle reflète le coût réel du
risque. Dans un second temps, la prime commerciale sera expliquée : elle est en partie constituée de cette
prime pure, à laquelle s’ajoutent des coûts opérationnels, une marge bénéficiaire ainsi que des taxes. En
troisième partie, la probabilité de résiliation de l’assuré sera prédite par l’intermédiaire de ses facteurs les
plus représentatifs. En dernier point, sera établie une méthodologie de calcul de la valeur contrat et les
limites du modèle ainsi obtenu seront abordées.
( ) Probabilité de résiliation entre l’année 0 et l’année k.
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 19
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 20
Partie 0 : Extraction des données et établissement du périmètre Une description des données sur lesquelles se base l’étude sera effectuée : elle exposera les raisons
du choix de l’échantillon, sa structure, la manière dont il a été fiabilisé et mettra en place périmètre de
l’étude.
0.1 Choix de la base La base de support de l’étude est celle du résultat technique à fin 2011. Elle correspond aux
contrats en cours entre le 1er janvier et le 31 décembre 2011. Constituée en mars 2012, elle a l’avantage de
prendre en compte les sinistres tardifs à fin 2011. Comme le calcul de la valeur contrat fait appel à la
projection des résultats du contrat dans le futur, il est utile de disposer d’une « marge » dans le passé pour
pouvoir tester la stabilité du modèle. Ainsi, la stabilité de ce modèle est testée sur les échantillons des
années 2011, 2012, 2013.
0.2 Structure des données Chaque ligne de la base est une image de contrat (représentation de l’exposition au risque d’un
contrat), présentée comme suit.
N° contrat Date de début d’image
Date de fin d’image
Année police
Montant de la cotisation
Données risque : Âge, sexe de l’assuré, marque du véhicule…
Données sinistres : Nombre de sinistres, charge
des sinistres
1
1
2
3
Figure 3 Structure de la base de données
Comme le montre le tableau ci-dessus, un même numéro de contrat peut figurer sur plusieurs lignes de la
base : il dispose de plusieurs images. La création des différentes images d’un contrat s’effectue de la
manière suivante. Pour un contrat donné, une image est créée en début de période d’observation, en
général au 1/1/N. A chaque modification du contrat (mise en demeure, remplacement de véhicule,
résiliation, échéance anniversaire du contrat…), une nouvelle image est créée. La dernière image d’un
contrat pour une année fixée prend toujours fin le 31/12/N. Une année police correspond à la durée
d’exposition comprise entre deux images du contrat, prenant des valeurs entre 0 et 1.
Un exemple concret sur la manière dont sont construites les images d’un contrat est donné. Il est supposé
qu’un assuré souscrit à un contrat moto le 5 septembre 2010. Sur la base du résultat technique en 2011,
une image débutant le 1/1/2011 est systématiquement créée. L’assuré remplace son véhicule le
16/4/2011 : la première image prend fin et une nouvelle image du contrat débute. Si aucun autre
changement n’a lieu pour ce contrat, elle prendra fin à sa date anniversaire du contrat (voir schéma ci-
dessous).
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 21
Image 1 Image 2 Image 3
----------------|-----------------|-----------------------|------------------------|--------------------------|------------------>
Affaire nouvelle : 5/9/2010 1/1/2011 Remplacement : 16/4/2011 Anniversaire : 5/9/2011 31/11/2011
Figure 4 Création des images d’un contrat
Les informations sur le risque ont du être collectées dans un premier temps, et fiabilisées par la suite. Il a
été jugé pertinent de prendre en compte des variables en majeure partie tarifaires, étant donné que la
prime pure, la prime commerciale en dépendent. La probabilité de résiliation d’un contrat est également
fortement liée au tarif appliqué. L’ensemble des données risques a été regroupé en catégories dans le
tableau ci-dessous.
Conducteur
Variable Signification Modalités
Âge du conducteur <21 ans / [21 ; 25 ans [/ [25 ; 30 ans [ /
[30 ; 35 ans [ / [40 ; 50 ans[ / >=50 ans
Sexe du conducteur Homme / Femme
Segment marketing
(Seg_Mkt)
Catégorie de personnes à laquelle
appartient le conducteur du
véhicule, caractérisée par son
âge, son statut marital, sa
profession ...
Etudiants / Jeunes CSP- / Jeunes CSP+ / Début de
carrière /Âge Mur / Célibataires CSP- / Familles
CSP-/ Agriculteurs / Artisans-Commerçants /
Professions Libérales /Chômeurs /Rentiers
/Seniors du quatrième âge / Seniors retraités /
Non renseigné
Ancienneté du
permis (ACP)
[0 ; 1 an[ / [1;2 ans [ / [2;3 ans [ / [3;4 ans [ / [5;9
ans[ / [10;14 ans [ / [15 ; 19 ans [ /[20 ; 29ans[ /
>= 29 ans
Antécédents (ANT) Révèle si le conducteur a été
assuré auparavant
Avec / Sans
Expérience (EXP) Indique si le conducteur à
l’habitude de conduire le
véhicule assuré.
Avec / Sans
Sinistralité
antérieure
Indique le nombre de sinistres
que le conducteur a eu sur les
trois dernières années
0 sinistres / 1 sinistre /2 sinistres /Plus de trois
sinistres
Non assuré sur la période (NA)
Véhicule
Ancienneté de la
carte grise (ANCCG)
<1an / 1an / 2ans / 3ans / 4ans / 5ans / 6-7ans / 8-
9ans /+10ans
Ancienneté du
véhicule (ACV)
<1 an / 1 an /2 ans /3 ans /4 ans /5 ans / 6-7 ans
/8-9 ans /10-14 ans / 15-19 ans /20-24 ans
/25-39ans
Durée de détention
du véhicule (DDV)
<1an /1an /2ans /3ans /4ans /5ans /6-7ans / 8-
9ans /10 ans et plus / Ancien produit /Non
renseigné
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 22
Type d’usage Motifs d’utilisation du véhicule :
déplacement pour la vie privée,
professionnelle … La modalité
« tournées » concerne les
personnes réalisant des visites
de clientèle, agences, chantiers
dans le cadre de leur profession
ou activité principale.
Privé / Privé et trajet domicile-lieu de travail/
Professionnel /Tournées
Marque de la moto
Aprilia/ BMW/Daelim/Ducati /Harley Davidson
/Honda /KTM /Kawasaki /Kymco /MBK /Peugeot
/Piaggio /Suzuki /Triumph /Yamaha /Autres
Genre de la moto
Indique la catégorie de la moto Trial / Cross / Enduro Immatriculé (END IM)
/Enduro non Immatriculé (END non IM) / Quad
Immatriculé (QUA IM) / Quad non Immatriculé
(QUA non IM) /Custom (CUS) /Trail (TRA) /Basique
(BAS) /Routière (ROU) /Sportive (SPO) /Hyper
sportive (HYP) / Super motard (SMO) /Grand
Tourisme (GTO) / Roadster (ROA) /Scooter (SCO)/
Scooter 3 roues (SC3)/Exotiques (EXO)
Groupe
Numéro compris entre 1 et 40,
indiquant les caractéristiques
techniques de la moto. Les
véhicules du groupe 40 sont des
risques refusés.
1 /2/3/4/5/6/30/31/32/33/34/35/36/37/38/39/40
Classe
Lettre indiquant le niveau de
prix du véhicule.
J/ K /L / M /N /O /P/Q/R
Cylindrée
Volume d’air balayé par le
piston lors d’un cycle,
caractérisant la puissance de la
moto
Moins de 125 cm3 / 125 cm3 / 126 à 500 cm3 /501
à 750 cm3 /Plus de 750 cm3.
Véhicule tout terrain
Indique si le véhicule est tout
terrain
Oui /Non
Type de roues
Indiqué seulement pour les
motos du genre scooter pour un
assuré ayant souscrit au
nouveau produit.
Petites / Grandes / Scooter Ancien produit /Non
scooter
Contrôle technique Indique si le conducteur a
réalisé un contrôle technique
pour son véhicule.
Oui/ Non
Géographie
Département du
portefeuille
Département du portefeuille
client auquel le conducteur
appartient.
1 à 98
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 23
Département du
risque
Département du lieu de
résidence du conducteur
1 à 98
Région du
portefeuille
Région du portefeuille client à
laquelle le conducteur
appartient
Ile de France/Nord Est /Ouest/Sud Est/Sud Ouest /
Natio / MSC /Axa part
Région du risque Région du lieu de garage du
propriétaire du véhicule.
Ile de France / Nord Est /Ouest/ Sud Est /Sud
Ouest / EOM
Zone Numéro indiquant le niveau de
danger de la zone de lieu de
garage du véhicule.
Zone 1 / Zone 2/ Zone 3 / Zone 4/Zone 5/ Zone
6/Zone 7/
Zone 8 /Zone 9 /Zone 10 /Zone 11 /Zone 12 /Zone
13
Contrat
Formule Différents niveaux de garanties
aux quelles le contrat a souscrit.
Elles ont été décrites
précédemment.
RC : Responsabilité Civile /RC+IV : Responsabilité
civile + Incendie Vol /RC+DC : Responsabilité civile
+ Dommages collisions /RC+TD : Responsabilité
civile + Tous dommages /RC+IV+DC /RC+IV+TD
Fractionnement Mode de paiement de la prime Mensuel /Trimestriel / Semestriel /Annuel
Réseau Réseau de distribution du
produit
Agent /Courtier / Salarie / Direct Assurances /
CCAS /Michelin /Natio / Run Services
Coefficient
technique (CT)
Rapport entre la prime issue de
la tarification et la prime
commerciale payée par l’assuré.
Moins de 0,50 / 0,50 à 0,69 /0,70 à 0,79 /0,80 à
0,89 /0,90 à 0,94 /0,95 à 0,99 /1,00 /1,01 à 1,05 /
1,06 à 1,10 / Plus de 1,10
Ancienneté du
contrat (ANCC)
<1an /1an/ 2ans /3ans /4ans /5ans /6-8ans /
9-13ans / plus de14ans Tableau 2 Informations sur le risque
Une fois ces dernières collectées, il s’agit de rendre fiable cette information. Cela passe soit :
- Par la non prise en compte de certaines variables du support car elles ne concernent qu’une part des
contrats de la base.par exemple, les variables de sinistralité antérieure : globale, RC (responsable et non
responsable), Incendie/ Vol, Bris de Glace ne prennent en compte que la sinistralité antérieure des
contrats dont la date d’effet est inférieure à 2010. Comme dans la base figurent des contrats dont la date
d’effet est postérieure à 2010, il n’est pas possible de s’en servir.
- Par la suppression des données ayant des modalités non renseignées (NR), lorsque leur proportion en
termes d’exposition est négligeable
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 24
.
La perte de données en nombre d’images ou en exposition serait élevée en cas de suppression des lignes
dont la durée de détention de véhicule n’est pas renseignée (près de 1/3 de la base). Il s’avère que les
contrats ou cette durée n’est pas renseignée sont concernés par l’ancien produit.
Le raisonnement est similaire pour le segment marketing (mais avec une perte moindre).Ces deux variables
continueront donc à faire partie du support, avec une modalité « Non renseigné ». Les autres modalités
non renseignées ne seront pas prises en compte pour le reste de l’étude.
Perte d’exposition en %
Ancienneté du permis -0,64%
Ancienneté du véhicule -0,40%
Âge -0,01%
Classe -1,08%
Seg.marketing NR -4,92%
Durée de détention -30,36%
Genre -3,74%
Groupe -0,53%
Sexe -0,17%
Type roue scooter -0,01%
Usage -3,72%
Zone -1,46%
Anc. Carte Grise -0,77%
Antécédents -0,51%
Expérience -0,52%
Tableau 3 Pertes d’expositions lors d’une suppression des données non renseignées
Conducteur Géographie
Age du conducteur Sexe du conducteur Segment marketing Ancienneté du permis Antécédents Expérience Sinistralité antérieure globale (sur 3 ans) Sinistralité antérieure (sur 3 ans) par garantie : (responsabilité civile, incendie vol, bris de glaces)
Zone Région Axa Région Axa du risque Département Département du Portefeuille
Véhicule Contrat
Ancienneté de la carte grise Marque de la moto Genre de la moto Groupe Classe Cylindrée Véhicule tout terrain Type de roues Contrôle technique Durée de détention du véhicule Ancienneté du véhicule Type d’usage
Formules Fractionnement Réseau de distribution Ancienneté du contrat Coefficient technique
Tableau 4 Support des variables après fiabilisation des données
Partie 0 : Cadre de l’étude et établissement du périmètre
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 25
Enfin, les données sinistres comprennent :
le nombre de sinistres par image ainsi que le nombre de sinistres graves. Un sinistre est considéré
comme grave s’il est supérieur à un seuil
la charge de ces sinistres, par image, ainsi que la charge des sinistres graves.
0.3 Périmètre de l’étude
L’établissement d’un périmètre permet de mettre en place une certaine homogénéité au sein de la
population à étudier. Les risques suivants ne seront pas pris en compte dans l’étude.
les motos de collection, risques devant être traités par une approche différente de celle utilisée ici.
les formules RC+ TD, RC+ DC qui sont des cas dérogatoires. .
les contrats qui ne sont pas à tacite reconduction, minoritairement présents en France.
les véhicules du groupe 40, qui représentent des risques refusés.
Enfin, un échantillon d’apprentissage correspondant à 70% des données de la base du résultat technique
à fin 2011 est tiré aléatoirement, selon une loi uniforme : les modèles de prime pure, prime commerciale et
résiliation seront construits à partir de celui-ci. Les 30% restants constitueront notre base de « test « sur
laquelle les résultats obtenus seront testés.
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 26
Partie 1 : Modélisation de la prime pure
La valeur du contrat que l’on cherche à modéliser est donnée par
Le résultat de l’année k dépendant de la prime pure, le premier volet de l’étude consiste en la modélisation
de cette dernière. Soit le nombre de sinistres survenus au sein d’un groupe, leurs coûts
respectifs, indépendants et identiquement distribués. est également indépendante de . Soit la
charge totale ∑ . La prime pure représente la moyenne de celle-ci. Elle est notée [ ]
Par conséquent :
[ ] [∑
] [ [∑
]] ⏟
[ [∑
]]
⏟ [
∑ [ ]]
⏟
[ [ ]] [ ]⏟
[ ]⏟
La problématique réside dans le fait de trouver les meilleurs facteurs pour la prédiction de la prime pure à
partir du support des informations sur le risque, Tableau 4 : Support des variables après fiabilisation des
données. Une analyse descriptive de la prime pure sera d’abord effectuée : elle permettra de se familiariser
à la variable qui sera expliquée, mettra en lumière les liens entre les différentes variables explicatives et
fera ressortir celles d’entre elles dont le caractère discriminant est le plus prononcé.
∑ ⏞
( ) ⏟
( )⏞
( ( ))⏞
Prime commerciale de l’année k
Prime pure de l’année k
Produits financiers de l’année k
Frais d’acquisition et de gestion de l’année k
Taux d’actualisation entre l’année 0 et l’année k
Taux d’inflation de l’année k
( ) Probabilité de résiliation entre l’année 0 et l’année k.
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 27
I. Analyse descriptive pour la modélisation de la prime pure
L’ensemble des étapes de cette partie de l’étude répondent à l’interrogation suivante : existe-t-il
un lien entre la prime pure et les modalités prises par une variable donnée ? Une analyse uni-variée isolera
l’effet de chaque variable en montrant l’évolution de la prime pure par rapport à chacune d’entre elles.
Ensuite, une étude des corrélations des variables réponses et explicatives révèlera leurs interactions. Une
analyse en composantes multiples donnera un aperçu des catégories d’individus les plus sinistrés. Enfin les
meilleurs modèles de fréquence et de coût moyen seront déterminés par un algorithme de sélection de
facteurs.
I.1 Analyse uni variée L’idée est de représenter graphiquement l’évolution de la prime pure en fonction des catégories de
population, afin de déduire si la variable étudiée discrimine bien la prime pure. La prime pure [ ] est
déterminée empiriquement sur l’échantillon à partir de la relation :
[ ] [ ]⏟
[ ]⏟
⏟
⏟
Ainsi, un niveau de prime pure donné peut s’expliquer soit par le nombre de sinistres survenus ou par le
coût que ces derniers ont engendré.
Il est rappelé qu’un sinistre est considéré comme grave si sa charge excède . Par exemple, le
graphique ci-dessous représente l’évolution de la prime pure en fonction de l’âge des assurés
Figure 5 Exposition et prime pure par âge
Une décroissance de la prime pure en fonction de l’âge est constatée. Cela s’explique par un comportement
de plus en plus prudent des conducteurs de plus en plus âgés. L’âge apparait bien comme étant une
variable discriminante.
Par souci de robustesse des méthodes statistiques, toutes les modalités doivent être suffisamment
représentées (au moins 4% d’exposition par modalité). Lorsque cela est possible, des regroupements de
groupes peu exposés avec d’autres groupes sont effectués, selon un critère de proximité des primes pures
obtenues. En particulier dans cet exemple, les moins de 21 ans ont une faible exposition et un niveau de
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 28
prime pure (Hors Graves) approximativement égal à celui des 21-25 ans: ces deux groupes sont réunis en
une seule modalité.
Figure 6 Exposition et prime pure par âge
Figure 7 Exposition et prime pure par zone, (HG : Hors graves, YG : Y compris graves)
Les niveaux de prime pure hors graves obtenus reflètent bien le niveau de dangerosité de la zone : la prime
pure croît en fonction de celui-ci, avec une légère exception pour la Zone 12 ; expliquée par la faible
exposition qu’a cette zone. La zone, comme l’âge, paraît discriminante.
Figure 8 Exposition et prime pure par groupe (HG : Hors graves, YG : Y compris graves)
J K L M N O P Q R
Exposition et Prime Pure par Classe
Exposition
Prime Pure HG
Prime Pure YG
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 29
La classe représente le niveau de prix de la moto. La prime pure plus ou moins croissante avec le
prix (l’indemnité reversée à l’assuré est plus élevée lorsque le prix de sa moto est important). La classe
semble être une variable discriminante.
Ce raisonnement est appliqué à l’ensemble des variables du support. Par ailleurs, certaines variables ne
semblent pas être discriminantes pour la prime pure ou contiennent des modalités trop peu représentées
ce qui risque de biaiser la modélisation. Elles seront écartées pour la suite de l’étude.
L’ensemble des résultats et interprétations obtenus pour les autres variables figure en annexe 1.
Le tableau ci-dessous représente l’ensemble des variables de l’étude considérées comme impactant la
prime pure. Celles qui ne l’impactent pas ont été barrées.
Remarque : la prime pure est calculée toutes formule de souscription confondues, et non pas en fonction
de la nature du sinistre. Cette même formule est introduite comme facteur dans le support
Un tri à plat n’est pas suffisant lorsqu’il s’agit d’expliquer le comportement de la prime pure. Le
raisonnement précédent a été fait « toutes choses égales par ailleurs », et ne permet pas d’étudier les liens
entre les variables. En effet, l’influence liée à un facteur sur la prime pure n’est pas isolée et des
comportements peuvent être induits par d’autres facteurs, ce qui rend utile l’étude des corrélations.
I.2. Etude des corrélations Cette partie décrit comment l’étude des corrélations inter variables ainsi qu’entre les variables
explicatives et la prime pure a été effectuée. Elle débouche sur un bilan des transformations subies par le
support des facteurs.
Conducteur Géographie
Age du conducteur Sexe du conducteur Segment marketing Ancienneté du permis Antécédents Expérience
Zone Région Axa Région Axa du risque Département Département du Portefeuille
Véhicule Contrat
Ancienneté de la carte grise Marque de la moto Genre de la moto Groupe Classe Cylindrée Véhicule tout terrain Type de roues Contrôle technique Durée de détention du véhicule Ancienneté du véhicule Type d’usage
Formule Fractionnement Réseau de distribution Ancienneté du contrat Coefficient technique
Tableau 5 Support des variables après analyse uni variée de la prime pure
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 30
Enjeux et outils statistiques utilisés Etudier les corrélations inter variables est important pour :
Révéler les liaisons entre les variables explicatives. Cela permet de mieux « cerner » le support dans
la mesure où le degré d’interaction entre les variables est quantifié.
Limiter des biais dans la modélisation. Dans le cadre de tout modèle de prédiction, il faudrait éviter
toute situation de colinéarité entre les variables afin d’obtenir la meilleure estimation possible des
paramètres.
La procédure est différente de celle utilisée lors du tri à plat : le raisonnement n’est pas « univarié ». En
effet, des niveaux de prime pure par sont établis pour des groupes d’individus basés non pas sur un seul
critère (variable) mais sur la combinaison de plusieurs critères. Ces groupes d’individus sont appelés cases
et ne sont autre qu’une sous-population ayant des caractéristiques communes.
Exemple :
Figure 9 Un exemple de case tarifaire
Une fréquence, un coût moyen et par conséquent une prime pure sont déterminés pour l’ensemble des cases de la base.
Pour quantifier les corrélations entre l’ensemble des variables, le coefficient de contingence est utilisé.
Un tableau de contingence est construit à partir de l’échantillon de la manière suivante : il s’agit d’une
matrice dont le coefficient est le nombre d’individus ayant à la fois une modalité donnée de la première
variable et une modalité donnée de la seconde variable. Un second tableau de contingence théorique est
construit, sous l’hypothèse que ces deux variables sont indépendantes. Le coefficient de contingence est
calculé de la manière suivante.
√
∑
( )
Etude des corrélations inter variables et bilan Si une trop forte corrélation entre deux variables est observée, soit l’une d’entre elles est exclue
(l’information étant déjà restituée par l’autre variable), soit elles sont croisées. Les différents niveaux de
corrélation obtenus ont été hiérarchisés de la manière suivante :
Figure 10 Hiérarchisation des niveaux de corrélation
Conducteur Age Sexe Segment Ancienneté du permis Antécédents Expérience
moins de 30 ans H Jeunes > 29 ans Avec Avec
Géographique Région Région du risque Zone
IDF IDF Zone9
Véhicule Marque Ancienneté de la carte grise Durée de détention Ancienneté du véhicule Genre Groupe Classe Cylindrée
Honda 1an 1an 6-7 ans Scooter 32 M 126 à 500 cm3
Contrat Coefficient technique Usage Formule Fractionnement Ancienneté du contrat
moins de 0.69 prive RC+IV+TD Annuel 3 ans
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 31
Tableau 6 Bilan de l’étude des corrélations inter variables
L’âge ne sera pas pris en compte dans le modèle : en plus de ne pas être très corrélé à la variable
explicative prime pure (27%) comme le montre le paragraphe suivant, son effet est retrouvé dans des
variables telles que l’Ancienneté de permis ou l’Ancienneté du contrat. Il en est de même pour la cylindrée :
n’étant corrélée qu’à 20% avec la prime pure, son effet est présent dans le genre, la classe et le groupe.
Dans la troisième colonne de ce tableau se trouvent des variables trop corrélées qui n’ont pas été exclues
lors de cette analyse, et pour lesquelles aucun croisement ne peut être proposé au vu du trop grand
nombre de modalités que cela engendrerait (et donc une trop faible exposition par modalité). L’outil qui
aidera à trancher entre ces variables est une méthode « forward ».
Corrélations entre les variables et la prime pure Une vérification du fait que les variables du support étaient bien corrélées à la variable à expliquer a été réalisée.
Variable Prime Pure
Zone 43%
Ancienneté du véhicule 38%
Durée de détention 34%
Marque Groupe 33%
Coefficient Technique Genre 32%
Ancienneté du contrat Région du portefeuille Classe 31%
Ancienneté du permis 30%
Ancienneté de la carte grise Cylindrée 29%
Segment marketing Âge 28%
Région du risque 24%
Antécédent*Expérience Usage 21%
Formule 20%
Fractionnement 13%
Sexe 11%
Tableau 7 Corrélations entre la prime pure et les variables du support
En rose apparaissent les variables les plus corrélées à la prime pure, variable à expliquer. Les liens entre les
variables ayant été étudiées, des outils sont déployés pour confirmer la significativité des variables vis-à-vis
de la variable réponse.
Variables exclues (corrélées avec de nombreuses variables)
Variables Groupées
Variables conservées en fonction de la qualité du modèle retenu (sélection « forward » )
Age Cylindrée
Antécédents-Expérience Groupe /Classe/Genre
Région du portefeuille /Région du risque/Zone
Anc. du véhicule/ Anc. de la carte grise/Durée de détention. / Anc. du contrat
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 32
I.3. Tests de significativité d’ANOVA (Analyse de la variance)
Ces tests ont été réalisés pour l’ensemble des variables du support grâce à la procédure « Anova » du
logiciel SAS.
Principe du test d’ANOVA Ce test est réalisé pour corroborer le fait que la variable est significative par rapport à la prime pure. Il se
base sur une égalité des moyennes. Ses hypothèses sont les suivantes.
Les quantités SCE, SCE résiduel et SCE Facteur (obtenu par différence des deux quantités précédentes) sont
déterminées.
∑ ∑(
) ⏟
∑
( ) ⏟
∑∑(
) ⏟
Où p est le nombre de modalités prises par une variable, l’effectif par groupes.
Sous H0,
suit une loi de Fisher de paramètres F (p-1, n-p).
On se donne un seuil de significativité qui correspond à la probabilité d’erreur de première espèce. Si p-value ≤ , l’hypothèse H0 est rejeté en faveur de H1 et le résultat du test est statistiquement significatif. Si p-value > l’hypothèse nulle n’est pas rejetée et il n’est pas possible de conclure.
Résultats obtenus P-value <=5% P-value >5%
Sexe
Segment marketing Région
Ancienneté du permis Marque
Ancienneté de la carte grise Usage
Antécédent*Expérience Coefficient technique
Région du risque
Zone
Genre
Groupe
Classe
Durée de détention du véhicule
Ancienneté du véhicule
Formule
Fractionnement
Ancienneté du contrat Tableau 8 Résultats des tests de significativité par analyse de la variance
La colonne de gauche contient l’ensemble des variables dont la p-value du test d’Anova est inférieure à 5%.
Pour celles-ci, l’hypothèse nulle est rejetée avec un seuil de significativité de 5%. Il y a donc de fortes
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 33
chances que celles-ci discriminent la prime pure. La colonne de droite contient la région, la marque, l’usage
et le coefficient technique. Pour ces facteurs, le résultat du test n’est pas statistiquement significatif, il n’est
pas possible de se prononcer quant à leur caractère discriminant vis-à-vis de la prime pure.
Les études précédentes ont donné lieu a de nombreux résultats qu’il est utile de confronte par une analyse
en composantes multiples.
I.4. Analyse en composantes multiples : une confrontation des résultats précédents
Principe et éléments de théorie L’objectif d’une analyse en composantes multiples est de rassembler les individus au vu de leurs
caractéristiques (modalités prises par les variables). Cet outil, généralisation de l’analyse factorielle des
correspondances a permis :
De grouper ou opposer des individus
D’émettre une hypothèse sur les classes d’individus qui seront sinistrés
D’identifier les variables qui seront significatives dans la suite de l’étude.
L’analyse en composantes multiples est réalisée à partir d’un tableau disjonctif complet (TDC)
[ ]
matrice dont le coefficient vaut 1 si l’individu i possède la modalité j, 0 sinon.
Cette matrice est de taille n X m ou m représente le total des modalités des variables de l’étude. A partir
du TDC, une autre matrice est construite, appelée tableau de Burt [ ]
, dont le coefficient
est l’effectif des individus possédant à la fois les modalités i et j. Cette matrice est symétrique et de taille
m x m. Par conséquent , . Soit p le nombre total de variables et la matrice diagonale de . Les
axes factoriels de l’analyse ont pour vecteur directeur les vecteurs propres de la matrice
.
Ainsi, une représentation des individus dans un repère constituée des axes précédents est obtenue. Il s’agit
par la suite de choisir la dimension dans laquelle il faut les représenter : combien faut-il retenir d’axes ?
Pour cela, est définie la notion d’inertie associée à l’axe k. valeur propre associée au k-ème
vecteur propre. L’ACM a été effectué ici selon la méthode de J.P Benzécri. Elle consiste en considérer non
pas l’inertie associée à un axe mais son inertie ajustée, donnée par la formule : (
)
.
Comme l’objectif de cette étape de l’étude est d’expliquer la prime pure, il s’agira de déterminer le type
d’individus qui sera sinistré. Pour cela, une variable « Sinistre » a été créée : elle vaut 1 si l’individu a été
sinistré, 0 sinon. Cette variable est créée en tant que variable supplémentaire : elle n’influence pas la
construction des axes.
Résultats obtenus et interprétation Les résultats suivants ont été obtenus grâce à la procédure « Corresp » du logiciel SAS.
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 34
Figure 11 Inertie ajustée sur les 10 premiers axes
Le critère du coude consiste à retenir le nombre d’axes tel que l’apport en inertie n’augmente plus
considérablement.
L’application de ce critère aboutit à la considération des trois premiers axes, cumulant au total 72,66% de
l’inertie.
Il s’agit ensuite de repérer les variables significatives de l’analyse, c’est-à-dire celles ayant participé à la
constitution de ces axes. Pour cela, les contributions des modalités de chaque variable sont considérées. La
contribution d’une modalité à un axe explique l’intensité de la présence de cette modalité sur cet axe.
Une modalité participe à la constitution d’un axe si sa contribution à l’axe en question est supérieure ou
égale à l’inertie moyenne
. Les trois premiers axes de l’analyse sont analysés.
Exemple : Significativité de la variable « genre » sur les trois premiers axes.
Tableau 9 Significativité de la variable « genre » sur les trois premiers axes
La troisième colonne du tableau donne les taux d’inertie de chaque modalité, les quatrième, cinquième et
sixième colonnes les coordonnées des modalités sur chaque axe. Les trois dernières colonnes donnent les
niveaux de contributions sur chaque axe : en rouge, les modalités significatives sur l’axe 1, en violet celles
sur l’axe 2, en orange celles sur l’axe 3.
Variable Modalités Inertie Axe 1 Axe 2 Axe 3 Axe 1 Axe 2 Axe 3
Genre BAS 1% 0,583 -0,228 -0,120 0,012 0,002 0,001
CUS 1% 0,452 -0,072 -0,811 0,002 0,000 0,010
GTO 1% -0,661 1,426 2,017 0,008 0,046 0,101
QUA IM/EXO 1% -0,301 0,352 -0,911 0,004 0,007 0,050
ROA 1% 0,751 0,027 -0,366 0,006 0,000 0,002
ROU 1% -0,969 -1,190 0,301 0,049 0,090 0,006
SCO 1% 0,370 0,574 -0,985 0,002 0,007 0,022
SPO/HYP 1% 0,789 0,020 0,124 0,026 0,000 0,001
TRA/SMO 1% -0,423 1,295 2,006 0,002 0,020 0,053
TT 1% 0,904 0,091 0,232 0,045 0,001 0,004
Inertie moyenne 0,011
Coordonnées Contributions
Significatif AXE1
Significatif AXE2
Significatif AXE3
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 35
Quelques remarques avant l’interprétation des résultats de l’analyse:
Le sexe est la seule variable qui ne participe à la construction d’aucun des trois premiers axes (voir
Annexe 3). Avec une quasi-totalité de conducteurs de sexe masculin dans la base, il est normal que
cette variable n’apparaisse pas dans l’analyse.
Quel que soit l’axe sur lequel l’analyse est faite, il est visible sur les graphes N° que la modalité « 0 »
de la variable supplémentaire sinistres se situe en plein centre du repère : cela s’explique par le fait
que 98% des individus de la base utilisée n’a jamais eu de sinistre auparavant.
Figure 12 Représentation des groupes d’individus sur les deux premiers axes
L’axe 1 fait ressortir une opposition entre les variables d’ancienneté (encadré rose). -Celles concernant le conducteur et son contrat : à gauche se situent les jeunes, dont l’ancienneté du
permis est inférieure à 4 ans et l’ancienneté du contrat inférieure à un an. A droite se situent les personnes
dont le contrat possède entre 4 et 13 ans d’ancienneté. Ces derniers correspondent aux individus les plus
sinistrés.
-Celles concernant son véhicule : à gauche se situent les anciennetés du véhicule et de la carte grise de
moins d’un an, durée de détention comprise entre 0 et 3 ans. A droite de l’axe se situent les anciennetés de
véhicule supérieur à 10 ans et les anciennetés de carte grise supérieure à 4 ans.
L’axe 2 fait ressortir une opposition au sein de la situation géographique du risque (encadré violet):
-En bas de l’axe se trouvent les zones 7 à 13, l’Ile de France, le Sud Est (Régions du risque et du
portefeuille), ce sont les caractéristiques géographiques des individus les plus sinistrés.
-En haut de l’axe se trouvent le Nord Est et l’Ouest ainsi que les zones 1 à 3.
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 36
Figure 13 Représentation des groupes d’individus sur le troisième axe
L’axe 3 oppose notamment les catégories de véhicules et les formules :
A gauche de l’axe se trouve la formule RC+IV+TD (tout risque) ainsi que les motos sportives, hyper
sportives et les roadsters, détenues par des jeunes conducteurs. Ces véhiculessont également caractérisés
par un niveau de prix élevé (classes P à R) . Ces groupes d’individus correspondent à ceux qui seront
sinistrés.
A droite de l’axe se trouve la formule RC (tiers) ainsi que les véhicules du genre tout terrain (groupe
inférieur à 6), les quads immatriculés et les exotiques.
Un bilan sur les thématiques de chaque axe ainsi que sur les variables les plus significatives de l’analyse en
composantes multiples peut donc être établit :
Axe 1 : Caractéristiques d’ancienneté
Axe 2 : Situation du risque Axe 3 : Catégories du véhicule& formules
Segment Ancienneté du permis Ancienneté du contrat Ancienneté de la carte grise Ancienneté du véhicule et durée de détention
Région Région du risque Zone
Genre Classe Formule
Tableau 10 Bilan des variables significatives et thématiques des axes
II. Construction du modèle de prime pure
Le cœur du sujet est maintenant abordé dans la mesure où cette partie révèlera le groupe de
facteurs parmi ceux analysés dans la partie précédente qui serviront de support pour la prédiction de la
prime pure. Dans un premier temps, l’approche choisie et la manière dont la théorie des modèles linéaires
généralisés a été appliquée seront décrites. Ensuite, une explication de la démarche d’obtention d’un
modèle de segmentation et de prédiction de la prime pure sera fournie. Enfin, le dernier paragraphe de
cette sous partie révèlera la mesure dans laquelle le modèle de segmentation et prédiction de la prime
pure obtenu à partir des facteurs sélectionnés a été validé.
II.1 Choix de l’approche et application de la théorie des modèles linéaires
généralisés Il s’agit à présent de sélectionner parmi le support de variables en question, le groupe de
variables le plus enrichissant en terme d’information sur la variable à expliquer : la prime pure.
Choix de l’approche
La prédiction de la prime pure peut être réalisée par deux approches différentes :
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 37
Une approche directe : les montants de prime pure sont calculés pour chaque case, puis prédits.
L’approche retenue : Fréquence * Coût moyen. Elle repose sur la modélisation de la fréquence
d’une part et sur celle du coût moyen d’autre part. Pour chaque case tarifaire, fréquence et coût moyen
sont calculés. Sont alors obtenus deux échantillons de données à expliquer (pour ce faire, la théorie de
modèles linéaires généralisées est appliquée). Cette approche permet de repérer les variables le plus
représentatives de la fréquence celles les plus représentatives du coût.
Il est démontrable qu’il y a équivalence entre ces deux approches.
Application de la théorie des modèles linéaires généralisés Il s’agit de prédire la fréquence et le coût moyen d’une case tarifaire, via des modèles linéaires généralisés.
Deux hypothèses sont émises.
H1 : Indépendance entre les niveaux de fréquence et de coût moyen de l’ensemble des cases.
H2 : Les niveaux de fréquence par case sont identiquement distribués. Les niveaux de coût moyen par case
sont identiquement distribués.
Les distributions en question font partie de la famille exponentielle. (Voir le paragraphe ci-dessous « Les
variables réponses »).
Un modèle linéaire généralisé est composé de trois composantes :
la variable à expliquer (le nombre de sinistres ou le coût moyen) : il s’agit de la composante
aléatoire
les variables explicatives : composantes déterministes
la fonction de lien retenue.
Les variables réponses
Soient { les observations de la variable à expliquer.
Cas du modèle de fréquence : la prédiction de la fréquence passe par celle du nombre de sinistres
. La durée d’exposition de la case sera mise en paramètre dans le modèle
(« offset ») afin que la fréquence puisse être obtenue (voir partie II.3 Modèle de prime pure).
Pour choisir la loi de la variable réponse, un test d’adéquation est réalisé sur les données en brut (nombre
de sinistres par individus).
Figure 14 Résultats des tests d’adéquations des données en brut (rouge)pour la loi binomiale négative (bleu) et la loi de poisson(vert)
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 38
Ces tests ont été réalisés de la manière suivante : par une méthode des moments, à partir de l’échantillon
constituée du nombre de sinistres, les paramètres d’une loi de poisson et d’une loi binomiale sont estimés.
Ensuite, un échantillon indépendant et identiquement distribué est simulé sur le logiciel SAS pour chacune
des deux lois précitées. L’histogramme ci-dessus montre en rouge, la distribution du nombre de sinistres :
ce sont les données en brut, il est visible est constituée de personnes ayant eu 0 (98%), 1, 2 ou 3(2%
restants) sinistres. En bleu et en vert, les distributions respectives de poisson et binomiale négative sont
rajoutées.
L’ensemble des lois choisies adhère d’une manière assez bonne. Il y a indifférence pour le choix de la loi.
Remarque : Estimation des paramètres par une méthode des moments.
( ) [ ] ( )
( )
( )
( ) [ ]
On suppose donc que le nombre de sinistres suit une loi de poisson : ( )
,
Cas du modèle de coût moyen:
.
Figure 15 Résultats des tests d’adéquations du coût moyen brut aux lois Gamma (vert) Log normale (rouge) et Weibull (bleu)
Les paramètres de ces loin sont obtenus par maximum de vraisemblance. Les deux lois adhérant le mieux
aux données sont les lois gamma et les lois de Weibull, inexistant sur SAS. Le coût moyen sera modélisé par
une loi gamma.
Le coût moyen suit donc une loi gamma : ( )
( )
, ( )
.
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 39
Remarque : Les charges de sinistres calculées au sein de chaque case ne prennent pas en compte les
charges de sinistres graves .Il en est de même pour le nombre de sinistres de chaque case. Ce choix repose
sur un souci de modélisation : la loi gamma est à queue fine et ne prend par conséquent que très rarement
des valeurs élevées. Par souci de temps, les sinistres graves n’ont pas été pris en compte dans la
modélisation de la valeur contrat.
Rappel sur la famille exponentielle : suit une loi de la famille exponentielle signifie que sa densité est sous
la forme
( ) ( )
( ) ( )
( ) , le plus souvent.
Paramètre canonique, Paramètre de dispersion.
( )définie sur , deux fois dérivable, de dérivée inversible. Cette fonction est à choisir selon la loi
retenue pour la variable à expliquer.
( ) ( ) une fonction définie sur .
Il est démontrable que les lois de poisson et gamma font partie de la famille exponentielle.
Les variables explicatives :
Pour chaque un p-uplet de variables explicatives est définit ( ). L’ensemble des variables
utilisées dans cette étude sont catégorielles et sont codées de la manière suivante.
Si m est le nombre de modalités d’une variable parmi celles qui figurent ci-dessus, alors cette variable est
codée en m-1 variables indicatrices. La modalité restante est appelée modalité de référence. Elle est choisie
de manière à ce qu’elle soit la modalité la plus représentée dans la base.
En notant = (
), β=(
), la quantité = est appelée prédicteur linéaire.
La fonction de lien
Elle est la relation entre les variables explicatives et le prédicteur linéaire, et notée . (Elle est définie sur ,
strictement monotone, dérivable).
Le modèle est donc : ( [ ]) β.
L’inverse de la dérivée de est appelé lien canonique.
Cas des modèles de fréquence et de coût moyen : La fonction de lien est la fonction ( ). Par
conséquent ( ). Ce choix de lien résulte du fait que l’on est sous la contrainte d’un modèle
multiplicatif (produit des exponentielles de chaque coefficient).
Estimation des paramètres
Rappel : .
β= ( ) est estimé par maximum de vraisemblance.
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 40
Soient ( ) ( )la vraisemblance de l’échantillon, et ( ) ( ) sa log-vraisemblance.
( ( ) ) ∏ ( ) ,
( ( ) ) ( ( ( ) )) ∑ ( ( ))
∑
( )
( ) ( ) ∑
(
)
( ) ( )
Le problème d’optimisation devient le suivant :
∑
( )
( ) ( )
Cette fonction admet un maximum qui est un point critique de la log vraisemblance. Il annule donc son
gradient
( ( ) ) ( ( ) )
( ( ) )
∑ ( ( ))
( ( ))
( )
On pose ( ) . ( )
( ( ))
( )
( )
( )
( )
( )
( )
( )
( )
Or ( ) et on prouve que ( ) ( ) ( ) donc
( ( ))
( )
( )
( )
( )
( )
( ) Réalise le maximum de la vraisemblance
( ( ) )
∑
( )
( )
Analytiquement, les p+1 équations de vraisemblance ne peuvent être résolues, mais leur solution peut
être approximée numériquement. La procédure utilisée pour l’estimation des paramètres du modèle est la
procédure « Genmod » du logiciel « SAS ». Cette dernière estime les solutions des équations de
vraisemblance en utilisant la procédure itérative de Newton-Raphson (voir annexe 4 : Procédure itérative
de Newton Raphson)
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 41
II.2 Obtention d’un modèle de segmentation et d’explication de la prime pure
Cette partie illustre comment la segmentation et l’explication de la prime pure par les facteurs a été
réalisée. Divers paramètres entrent en compte dans une méthode de sélection pas à pas :
-le modèle de régression choisi, détaillé dans les parties précédentes
-le chemin selon lequel la sélection est effectuée.
Implémentation de la sélection Il existe différentes manières de sélectionner un modèle statistique, qui s’effectuent soit :
En partant du modèle avec l’intégralité les variables à disposition et en les retirant une à une : il
s’agit du principe d’une sélection « Backward ».
En partant d’un modèle à 0 variables et en les ajoutant une à une : il s’agit du principe d’une
sélection « Forward ».
En partant d’un modèle à 0 variables et à chaque étape, ajouter ou retrancher des variables du
modèle : il s’agit du principe d’une sélection « Stepwise ».
La méthode implémentée dans la suite est la méthode « Forward ».
Pour mesurer la qualité du modèle, le critère Akaike d’information (AIC) est utilisé. En augmentant le
nombre de facteurs d’un modèle, il est possible d'augmenter la vraisemblance de l’échantillon. Cela dit, il
est nécessaire de décrire la variable réponse avec parcimonie, c’est-à-dire en sélectionnant le plus petit
nombre de paramètres possible. Le critère AIC établit un compromis entre ces deux éléments. Il est donné
par :
( ) ( )
Ainsi, il s’agit de trouver l’ensemble de variables qui maximise l’information de l’échantillon tout en
minimisant l’effectif de cet ensemble. Cela revient à opter pour le modèle qui possède le plus petit critère
AIC. Techniquement, la sélection des variables a été réalisée selon des macros codées sur SAS, dont le
fonctionnement est détaillé en Annexe 5. Ci-dessous se trouve un résumé de leur fonctionnement.
Etape 0 :
Aucune variable dans le modèle.
Etape k :
Recherche parmi les variables ne faisant pas partie du modèle de celle engendrant la plus
forte baisse du critère d’information d’Akaïke par rapport au modèle précédent.
Ajout de cette variable dans le modèle.
Obtention d’un modèle à k variables.
Arrêt de la recherche si :
Intégralité des variables incorporées au modèle ou diminution de l’AIC non significative à
partir d’un certain rang .
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 42
Résultats obtenus pour les modèles de fréquence et de coût moyen
Ci-dessous se trouvent les résultats obtenus pour la sélection « forward » pour le modèle du nombre de
sinistres.
Figure 16 Résultats de la sélection « forward »pour le modèle de fréquence
La courbe bleue représente les niveaux de l’AIC obtenus au fur et à mesure qu’une variable est ajoutée. La
courbe rouge détermine la variation relative (VR) de l’AIC d’un modèle à l’autre
Le graphique ci-dessous montre qu’à partir d’un modèle comprenant la zone, la formule, l’ancienneté de la
carte grise, le groupe et l’ancienneté du permis, l’ajout d’une variable supplémentaire n’augmente plus
l’information.
Pertinence des résultats : La zone apparait en premier lieu dans la sélection : hormis le fait que celle-ci soit
révélatrice du niveau de danger, l’étude des corrélations avait révélé que cette variable était la plus
corrélée à la prime pure. La formule apparait en second lieu : la prime pure augmente avec le nombre de
garanties souscrites ; plus la formule est « large », plus il est probable que le nombre de sinistres
s’accroisse. Il est aussi rappelé que le tri à plat avait montré un sens de variation de la prime pure en
fonction des variables d’ancienneté : celle de la carte grise et celle du permis. Il a été part ailleurs vérifié
qu’au sein de cet ensemble, il n’existait aucune forte corrélation entre les variables.
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 43
Figure 17 Résultats de la sélection « forward »pour le modèle de coût moyen
Les résultats ci-dessous inciteraient à retenir comme variables explicatives du coût moyen la classe, la
formule, le genre et l’ancienneté du permis. Seulement, l’étude des corrélations a montré que la classe et
le genre étaient corrélés à plus de 80%, et que leur grand nombre de modalités empêchait un croisement
de ces deux derniers. Il a donc été décidé de ne retenir que la classe et la formule pour le modèle de coût
moyen. .
Pertinence des résultats : La classe est révélatrice du niveau de prix de la moto : le montant du
remboursement d’un sinistre directement lié à cette variable. Le tri à plat avait également montré une
croissance de la prime pure par rapport à cette variable. Il est cohérent que cette dernière entre dans le
modèle en première position. Par ailleurs, le caractère fortement discriminant de la formule a été expliqué
lors du tri à plat. Les résultats de la sélection semblent être en accord avec ceux obtenus au préalable dans
cette étude.
Le tableau ci-dessous établit un bilan de la manière selon laquelle la prime pure sera segmentée et
expliquée. Cela signifie que les cases tarifaires seront établies à partir des variables ci-dessous et que les
coefficients obtenus lors de la régression correspondront aux modalités de ces mêmes variables.
Prime pure
Fréquence (Nombre de sinistres) Coût moyen
Zone
Formule
Ancienneté de la carte grise
Groupe
Ancienneté du permis
Classe
Formule
Tableau 10 : Bilan des variables retenues pour segmenter et expliquer la prime pure
II.3. Validation du modèle de prime pure
Implémentation de la régression pour la fréquence
Rappel :
⏟
⏟
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 44
Les coefficients du modèle sont estimés à partir d’un échantillon dont les différentes réalisations sont le
nombre de sinistres d’une case tarifaire.
Ainsi on note le nombre de sinistre observé pour la case i,
le nombre de sinistres
prédits par le modèle pour la case i, l’exposition de la case i (qui n’est autre que la somme des
années polices des individus faisant partie de la case en question).
Les cases permettant le calcul du nombre de sinistres sont segmentées de la manière suivante (voir II.2
Résultats obtenus pour les modèles de fréquence et de coût moyen.)
Tableau 11 : Variables retenues pour segmenter et expliquer la fréquence
Si est le nombre de modalités de la variable , alors le nombre total de cases obtenu sera
égal à ∏ .
Le modèle linéaire généralisé utilisé est un modèle Log-Poisson. On rappelle que les estimateurs des
coefficients ( ∑ ) sont déterminés par maximum de
vraisemblance. Le modèle s’écrit sous la forme :
{ ∏
} ( ) ( ) ∑
Ce qui revient à prédire
( ( ) ∑
)
( ∑
)
Le calcul des coefficients est réalisé grâce au logiciel SAS (procédure « Genmod). Le code correspondant
ainsi que les explications de ce dernier figurent en annexe 6.
Analyse des résultats du modèle de fréquence
Significativité des variables et des modalités Un test du rapport de vraisemblance a été effectué afin de tester la significativité du
modèle par variable ou par modalité. Ses hypothèses sont les suivantes :
S’il s’agit d’un test de significativité de la variable dont les coefficients des modalités
sont(
) alors :
( )
S’il s’agit d’un test de significativité de la modalité de la variable alors :
( )
Est alors calculé le rapport de log vraisemblance correspondant au rapport entre la vraisemblance du
modèle non contraint et celle du modèle contraint
Zone Formule Ancienneté de la carte grise Groupe Ancienneté de permis
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 45
( ( ) ( ))
( ) ( )
{
( ) .
Si la « p-value » est inférieure au seuil , la modalité ou la variable en question est significative dans
le modèle.
Les résultats du test pour le modèle de fréquence sont les suivants :
Variable Zone Formule
Ancienneté de la carte
grise Groupe
Ancienneté
de permis
« P-Value » du test de
significativité <0,0001 <0, 0001 <0, 0001 <0, 0001 <0, 0001
Tableau 11 Résultats des tests de rapport de vraisemblance par variable du modèle de fréquence
Les « p-values » sont inférieures à 5%.L’hypothèse de non significativité des variables dans le modèle est
rejetée avec un seuil 5%.
Tableau 12 Résultats des tests de rapport de vraisemblance par modalité du modèle de fréquence
En dépit du fait que l’ensemble des variables est significatif dans le modèle, les résultats des tests ci-dessus
montrent que certaines modalités ne sont pas significatives. Des regroupements doivent alors être
effectués pour augmenter la significativité de ces modalités.
P-Value P-Value P-Value P-Value P-Value
Zone1 0,15% RC <1an 0,00% <=6 0,00% 0-2 ans 0,00%
Zone2 0,46% RC+IV 0,00% 1an 0,00% 30 0,00% 3-4 ans 4,26%
Zone3 85,23% RC+IV+DC 0,00% 2ans 56,12% 31 0,00% 5-9ans 6,89%
Zone4 RC+IV+TD 0,00% 3ans 32 51,53% 10-14ans
Zone5 8,50% 4ans 4,07% 33 0,00% 15-19ans 14,39%
Zone6 0,00% 5ans 0,03% 34 91,07% 20-29ans 0,00%
Zone7 0,00% 6-7ans 0,00% 35 82,18% > 29 ans 0,00%
Zone8 0,00% 8-9ans 0,00% 36
Zone9 0,00% +10ans 0,00% 37 40,76%
Zone10 0,00% 38,39 0,00%
Zone11 0,00%
Zone12 0,00%
Zone13 0,00%
Zone Ancienneté carte grise Groupe Ancienneté permisFormule
"P- value" 5% "P- value" 5% Modalité de référence
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 46
Tableau 13 Résultats des tests de rapport de vraisemblance par modalité du modèle de fréquence
Ainsi, les zones 3 et 4 sont regroupées d’une part, les anciennetés de permis des 10-14 ans et des 15-19
ans d’autre part. Cela engendre la significativité de l’ensemble des modalités de ces deux variables. Les
groupes 34 et 35 sont regroupés et deviennent la modalité de référence. En dépit de ces changements la
significativité de la variable groupe évolue peu.
Qualité d’ajustement du modèle de fréquence Deux types d’écarts, représentatifs de la qualité du modèle, seront analysés.
-les résidus bruts issus du modèle : écart simple entre la valeur prédite et la valeur observée
- la différence entre le nombre de sinistres d’un individu et le nombre de sinistre moyen que lui affecte le
modèle. Cet écart mesure la qualité d’ajustement du modèle à l’individu.
Pour des raisons de confidentialité, certains chiffres du tableau suivant ont été notés et .
L’erreur brute totale du modèle est de l’ordre de .
Par ailleurs, un autre outil révélateur de la qualité du modèle est le pourcentage d’explication de la variable
réponse par le modèle. L’indicateur utilisé est le R². Ce dernier se définit comme étant le rapport entre la
somme des carrés expliquée (SCE) et la somme des carrés totale (SCT).
∑ ( )
∑ (
)
"P- value" 5% "P- value" 5% Modalité de référence
Nb cases
Exposition
(AP)
Nb sinistres
HG total observé
Nb sinistres
HG
total prédit
Erreur
brute
totale
Fréquence
globale
observée
Fréquence
globale
prédite
24459 247614 ,000018 -1,77E-05 % %
Tableau 14 Erreur brute totale pour le modèle de fréquence
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 47
Le modèle en question possède un R² de 88%. Cela signifie que ce dernier explique 88% du nombre de
sinistres, ce résultat est très correct selon la littérature.
A présent les résidus bruts sont analysés. Ils correspondent à la quantité
{ ∏
}
Figure 18 Résidus bruts du modèle de fréquence : à gauche, valeur obtenues par années police, à droite, leurs distributions
Près de 75% des résidus sont centrés en 0.
Toujours dans une optique d’analyse de la qualité du modèle, il est utile de connaître l’allure de la
distribution des résidus bruts. Pour cela, les statistiques suivantes sont calculées.
Statistique Formule Valeur obtenue
pour les résidus
bruts centrés
réduits
Moyenne ∑
∏
0
Ecart type
( ∑ (
∏
) )
1
Skewness
0,59
Kurtosis
(
)
34
Tableau 15 Valeurs de la moyenne, écart type, Skewness et Kurtosis obtenus sur l’échantillon des résidus centré réduits
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 48
Les résidus sont nuls en moyenne et possèdent un petit écart-type : cela confirme leur concentration
autour de 0. Les coefficients de Skewness et Kurtosis obtenus permettent de rejeter l’hypothèse du modèle
affirmant la normalité des résidus. Le Skewness vaut 0,59, ceci témoigne d’une distribution légèrement
décalée vers la gauche de la médiane et donc légèrement asymétrique, ce qui n’est pas le cas de la loi
normale. Le Kurtosis est plus grand que 3, ce qui suggère que les queues de distributions sont plus épaisses
que celle d’une loi normale.
Le test QQ plot réalisé ci-dessous confirme davantage que les queues de distributions des résidus bruts ne
s’ajustent pas correctement pas à celles d’une loi normale centrée réduite.
Figure 19 Test QQ plot sur l’échantillon des résidus centrés réduits
Enfin, un bon modèle ajuste bien l’écart entre le nombre de sinistres d’un individu et le nombre de sinistre
moyen que lui affecte le modèle. Le nombre de sinistre moyen affecté par le modèle dépend de la case
tarifaire à laquelle le risque appartient. Pour un risque , cet écart est noté . La base
d’apprentissage possède n=544 338 risques.
: Nombre de sinistres du risque
Nombre de sinistres prédit pour la case tarifaire à laquelle appartient le risque
: Exposition de la case tarifaire à laquelle appartient l’individu, qui n’est autre que la somme des
années polices des risques constituant cette case.
Exposition du risque.
Ainsi, le terme
n’est autre que le nombre de sinistres prédit pour un risque . Ce
terme peut être vu comme nombre de sinistres prédit pour la case à laquelle ce risque appartient pondéré
de la part d’exposition que possède l’individu au sein de cette case.
Moyenne 0,00003
Variance 0,01768
Ecart type 0,13295
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 49
Tableau 16 Moyenne, variance et écart type sur l’échantillon des ENS
En moyenne, le modèle ajuste bien par rapport à l’individu : ( ) est une variable centrée et peu
dispersée.
Ce graphe en figure 16 montre l’écart entre le nombre de sinistres observé pour un individu et le nombre
de sinistres prédit en fonction du nombre de sinistres observés. Le modèle ajuste de moins en moins bien
avec un nombre de sinistres croissant.
Figure 20 Boîte à moustache représentant ENS en fonction du nombre de sinistres par individu
Rappel de la formule de l’écart calculé
Le graphe en boîte à moustaches montre que l’écart se présente comme suit :
-Il est pratiquement nul pour les nombres de sinistres nuls. Sa distribution est condensée autour de 0 (1 er
quartile, médiane, troisième quartile, dernier déciles confondus en 0).
-Il est proche de 1 pour les individus qui ont eu 1 sinistre. De manière générale il est proche de x si l’individu
a eu x sinistres. Le nombre de sinistres prédits pour un risque est donc globalement nul.
Le modèle ajuste donc bien les personnes qui n’ont eu aucun sinistre. Cela s’explique au vu de l’échantillon
de départ en notre possession, avec 98 % des données qui n’avaient eu aucun sinistre.
Validation du modèle de fréquence sur la base de test Les valeurs des nombres de sinistres prédits sont obtenues sur la base de test en appliquant la formule :
( ( ) ∑
)
Les quantités et
sont analysées sur la base de test
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 50
Figure 21 Distribution des résidus bruts et statistiques obtenues pour les résidus bruts sur la base de test
Les résidus bruts sont concentrés à près de 85% autour de 0, nul en moyenne et peu dispersés.
Quant à l’ajustement du modèle par rapport à l’individu, un constat similaire à celui effectué sur
l’échantillon d’apprentissage peut être fait.
Figure 22 Boîte à moustache des ENS en fonction du nombre de sinistres par individu, et statistiques obtenues
Les ( ) sont nuls en moyenne et concentrés autour de 0. Selon l’allure des boîtes à moustache
obtenues, un contat similaire à celui effectué pour la base d’apprentissage peut être fait.
Conclusion pour le modèle de fréquence
Le modèle de fréquence est validé car il fournit globalement de bons ajustements.
Implémentation de la régression pour le coût moyen
Rappel :
⏟
⏟
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 51
Les coefficients du modèle sont estimés à partir d’un échantillon dont les différentes réalisations sont le
nombre de sinistres d’une case tarifaire. Ains , est noté le coût moyen observé pour la case i, note
coût moyen prédit par le modèle pour la case i, le nombre de sinistres de la case i Les
cases permettant le calcul du coût moyen sont segmentées selon les variables suivantes (cf. II.6.2 Résultats
obtenus pour les modèles de fréquence et de coût moyen).
Tableau 17 Variables retenues pour segmenter et expliquer le coût moyen
Si est le nombre de modalités de la variable , alors le nombre total de cases obtenu sera
égal à .
Le modèle linéaire généralisé utilisé est un modèle Log-Gamma. On rappelle que les estimateurs des
coefficients ∑ sont déterminés par maximum de
vraisemblance. Le modèle s’écrit sous la forme :
( ) ∑
Ce qui revient à prédire
( ∑
)
On suppose que le coût moyen suit une loi gamma.
Les codes sas ayant permit d’implémenter cette régression figurent en annexe 6.
Analyse des résultats du modèle de coût moyen
Significativité des variables et des modalités Un test de rapport de vraisemblance a également été effectué dans la cadre de la modélisation du
coût moyen. Dans ce cas aussi, la significativité des variables ainsi que celles des modalités est
Les résultats du test sont les suivants :
Tableau 18 Résultats des tests de rapport de vraisemblance par variable du modèle de coût moyen
Les « p-values » sont inférieures à 5%.L’hypothèse de non significativité des variables dans le modèle est
rejetée avec un seuil 5%.
Par ailleurs comme le montre la table ci-dessous, certaines modalités ne sont pas significatives. Etant
donné que l’échantillon sur lequel le modèle de coût moyen a été mis en place est de petite taille (36
cases), on se contentera de la significativité globale des variables. Aucun regroupement de modalités ne
sera effectué pu le faible nombre de modalités impliquées.
Classe Formule
Variable Classe Formule
« P-Value » <0,0001 <0, 0001
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 52
Figure 23Résultats des tests de rapport de vraisemblance par modalité du modèle de coût moyen
Qualité d’ajustement du modèle de coût moyen Un écart de 1,5 € (soit 0,06 %) est observé entre les coûts moyens observés et prédit sur l’ensemble de
l’échantillon.
Comme pour le nombre de sinistres, le R² est à nouveau calculé.
∑( )
∑(
)
∑ ( )
∑ (
)
Le modèle en question explique 80,9 % du coût moyen des sinistres.
Les erreurs brutes sont analysées,
, ainsi que les erreurs
brutes relatives,
.
Figure 24 Résidus bruts du modèle de coût moyen à gauche, et distribution des résidus relatifs à droite
P-Value P-Value
J 50,25% RC
K 28,44% RC+IV 85%
L 28,79% RC+IV+DC 0,01%
M RC+IV+TD 0,01%
N 0,02%
O 0,01%
P 0,01%
Q 0,01%
R 0,01%
Classe Formule
"P- value" 5% "P- value" 5% Modalité de référence
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 53
Comme le montre la partie droite de la figure 19, les résidus relatifs sont concentrés à près de 70% entre -
10% et 10%. La variation relative moyenne est de 4%.
Le coût moyen prédit est en moyenne supérieur de 51 € supérieur au coût moyen observé : les résidus
bruts ne sont pas nuls en moyenne et assez dispersés étant donnée la valeur de leur écart type.
La valeur du coefficient d Skewness est proche de 0 : elle témoigne d’une distribution légèrement
asymétrique. Le Kurtosis est inférieur à 3, les queues de distribution des résidus sont un peu plus fines que
celle d’une loi normale.
Les valeurs obtenues ci-dessus ne permettent pas cette fois-ci d’exclure l’hypothèse de normalité des
résidus, contrairement au modèle de fréquence.
Figure 26 Résultat du QQ plot sur l’échantillon de résidus bruts
Un test d’adéquation QQ plot a donc été réalisé. Ce dernier montre une assez bonne adéquation à la loi
normale dont les paramètres sont la moyenne et l’écart type mentionnés ci-dessus. Les points sont
pratiquement alignés sur la première bissectrice. Il est possible d’en déduire que l’erreur du modèle de
coût moyen est imputable à une erreur de mesure.
Un autre constat peut être effectué grâce au graphique ci-dessous.
Statistique Valeur obtenue
pour les résidus
bruts
Valeur
obtenue pour
les résidus
relatifs
Moyenne -51,35034 0,04
Ecart type
477,817893
0,22
Skewness
-0,344096
Kurtosis 1,29471854
Figure 25 Statistiques obtenues sur l’échantillon des résidus bruts et des résidus bruts relatifs
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 54
Figure 27 Résidus bruts relatifs du modèle de coût moyen représentés en fonction du nombre de sinistres par cases tarifaires.
En valeur absolue, la variation relative des résidus est la plus élevée pour les cases dont le nombre de
sinistres est faible : moins les sinistres sont nombreux au sein d’une certaine catégorie de personnes, moins
bien le modèle ajuste le coût moyen.
Par ailleurs, un bon modèle ajuste bien l’écart entre la charge des sinistres d’un individu et la charge de
sinistres que lui affecte le modèle. La charge affectée par le modèle dépend de la case tarifaire à laquelle
l’individu appartient. Pour un risque , cet écart est noté . La base d’apprentissage possède
n=544 338 risques.
}
: Charge de sinistres du risque
Charge de sinistres prédite pour la case tarifaire à laquelle appartient le risque . Elle
correspond au produit
.
Nombre de sinistres du risque
: Nombre de sinistres de la case à laquelle appartient le risque .
Ainsi, le terme
n’est autre que la charge de sinistres prédite pour un risque . Il
s’agit d’une pondération de la charge de sinistres de la case à laquelle l’individu appartient pondérée de la
part du nombre de sinistres que le risque a au sein de cette case.
Sur l’ensemble des données Sur les données sinistrées
Moyenne 0,02 1,5
Ecart type 456,37 3528
Tableau 19 Moyenne, variance et écart type sur l’échantillon des EC
Cet écart de charge est plus important et plus dispersé sur les données sinistrées.
Validation du modèle de coût moyen sur la base de test
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 55
Figure 28 Résidus relatifs du modèle de coût moyeneprésentés en fonction du nombre de sinistres par cases tarifaires sur la base de test
En valeur absolue, la variation relative des résidus est la plus élevée pour les cases dont le nombre de
sinistres est faible : ce phénomène avait également été observé sur la base de test.
En moyenne, le coût moyen observé est de 150 € inférieur au coût moyen prédit.
La charge prédite est en moyenne supérieure de 2,2 € à la charge observée sur l’ensemble des données, et
de 130€ supérieure sur les données sinistrées.
Conclusion pour le modèle de coût moyen
Le modèle obtenu est moins stable que le modèle de fréquence. D’éventuelles pistes d’amélioration de ce
modèle seraient : - Tester une paramétrisation selon la loi de Weibull étant donné que cette dernière adhérait mieux
aux données en question.
- Prédire non pas le coût moyen mais la variation du coût moyen par rapport à un coût moyen
minimal de la base en cases tarifaires.
Sans perdre de vue l’objectif de cette étude, il est à présent temps de tester les résultats des modèles de
fréquence et de coût moyen sur celui de la prime pure.
Calcul de la prime pure sur les échantillons de test et d’apprentissage
Rappel :
⏟
⏟
La procédure adoptée est la même pour les bases de test et les bases d’apprentissage. Pour chaque case
tarifaire construite à partir des modèles de segmentation du coût moyen et de la fréquence précédents,
sont calculés
La fréquence et le coût moyens observés
La fréquence et les coûts moyens prédits à partir des coefficients obtenus par le biais des deux
modélisations précédentes :
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 56
( ∑
)
(
∑
)
où
{ }
{ }
Les primes pures observées et prédites sont obtenues
Le delta observé –prédit est calculé
Figure 29 représentés en fonction du nombre de sinistres par cases tarifaires (à gauche) et l’exposition par cases tarifaires (à droite) sur la base d’apprentissage
Figure 30 représentés en fonction du nombre de sinistres par cases tarifaires (à gauche) et l’exposition par cases tarifaires (à droite) sur la base de test
Sur la base d’apprentissage, une différence moyenne de 60 centimes d’euros entre les primes pures
observées et prédites est observée ( [ ] ). Cela dit, la figure 22 ci-dessus montre que la valeur du
Partie 1 : Modélisation de la prime pure
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 57
delta est élevée lorsque le nombre de sinistres est faible ou lorsque la durée d’exposition l’est. Sur la base
de test, une différence moyenne de 23 € entre la prime pure observée et la prime pure prédite est
présente. Comme le montre la figure 23, le même type d’erreur de prédictions est observé sur la base de
test.
III. Conclusion Cette partie a dressé un modèle de segmentation et de prédiction de la prime pure. Comme vu
précédemment, ce dernier trouve ses limites lorsque le risque n’est pas très bien connu, en raison du fait
qu’il soit peu exposé au risque ou que la probabilité d’occurrence de ses sinistres soit faible.
En dehors des pistes d’amélioration du modèle de coût moyen (Partie II.3 Validation du modèle de
prime pure/Analyse des résultats du modèle de coût moyen /Conclusion pour le modèle de coût moyen),
d’autres éléments peuvent être proposés pour améliorer celui de la prime pure. Il est rappelé que les
facteurs en présence de la modélisation ont été obtenus par l’intermédiaire d’une méthode de sélection
pas à pas « forward » où les modèles de prédiction et de segmentation sont identiques. Ceci est un choix
qui a été fait lors de cette étude, et il aurait été possible de choisir d’autres techniques de segmentation
(notamment celles basées sur l’analyse de la variance), ou une procédure de sélection différente de la
procédure « forward ».
La première modélisation ayant à présent été effectuée, il est temps d’aborder la seconde partie de
l’étude concernant la modélisation de la prime commerciale.
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 58
Partie 2 : Modélisation de la prime commerciale Il est rappelé que l’objectif de l’étude est de modéliser la valeur contrat.
La prime pure ayant été modélisée en première partie, il s’agit à présent de modéliser la prime
commerciale, c’est-à-dire trouver les facteurs qui permettront de segmenter et prédire cette prime.
La prime commerciale est le montant de la cotisation que paie au final le client. Elle correspond à au coût
du risque, augmenté de frais opérationnels, d’une marge bénéficiaire, de taxes et se décompose de la
manière suivante :
La problématique est similaire à celle dans la partie « modélisation de la prime pure ». Il s’agit de
trouver l’ensemble des variables par lesquelles la prime commerciale sera dans un premier temps
segmentée, puis expliquée. En effet, cette dernière n’est pas déterministe : elle change en fonction des
modifications que l’assuré a décidé d’apporter à son contrat (remplacement etc..).
Une préparation des données est faite au préalable : chaque montant de prime commerciale est
annualisé : en effet, à chaque ligne (chaque image de contrat) est associé le montant de la prime
commerciale correspondant à la durée de l’image de contra t (Partie 0 / 0.2 Structure des données, figure
3). Ces derniers sont donc divisés par la durée d’exposition de l’image pour être annualisés. La prime
commerciale d’une case tarifaire correspondra à la prime commerciale annuelle moyenne reversée par
l’ensemble des membres de la case. Cela est résumé par la formule suivante.
∑
∑ ⏞
( ) ⏟
( )⏞
( ( ))⏞
Prime commerciale de l’année k
Prime pure de l’année k
Produits financiers de l’année k
Frais d’acquisition et de gestion de l’année k
Taux d’actualisation entre l’année 0 et l’année k
Taux d’inflation de l’année k
( ) Probabilité de résiliation entre l’année 0 et l’année k.
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 59
Une démarche similaire à celle adoptée lors de la partie 1 une sera entreprise. D’abord, une
analyse descriptive de la prime commerciale et des potentiels facteurs qui participeront à sa modélisation
sera réalisée, à partir d’outils similaires à ceux utilisés pour la prime pure. Une fois cette analyse effectuée,
la même démarche segmentation/prédiction que celle utilisée précédemment sera utilisée pour la
construction du modèle de prime commerciale, dont la validité sera étudiée.
Au départ de cette seconde partie de l’étude, le support des facteurs est globalement identique à
celui-utilisé pour la prime pure.
I. Analyse descriptive pour la modélisation de la prime commerciale
I.1 Analyse uni variée L’objectif est de repérer un lien entre le niveau de prime commerciale et les modalités prises par
une variable donnée. Le raisonnement s’effectue en uni varié : pour une modalité donnée, la moyenne des
primes commerciales est calculée. Les différents niveaux de prime commerciale sur chaque graphe sont
calculés de la manière suivante :
∑
Conducteur Géographie
Age
Sexe du conducteur
Segment marketing
Ancienneté du permis
Antécédents *Expérience
Zone
Région Axa
Région Axa du risque
Véhicule Contrat
Ancienneté de la carte grise
Marque de la moto
Genre de la moto
Groupe
Classe
Cylindrée
Durée de détention du véhicule
Ancienneté du véhicule
Type d’usage
Formule
Fractionnement
Ancienneté du contrat
Coefficient technique
Réseau
Tableau 20 Support des variables candidates à la modélisation de la prime commerciale
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 60
Figure 31 Part des images et niveaux de prime commerciale par coefficient technique
Il est rappelé que le coefficient technique correspond au rapport entre la prime commerciale et la prime
issue de la mécanique tarifaire AXA. A niveaux de primes machines égales, la prime commerciale est
croissante par rapport au CT, ce qui semble naturel et explique la croissance globale de la courbe obtenue
ci-dessus. Globalement, l’ensemble des variables semblent être utilisables pour la segmentation de la prime
commerciale.
Figure 32 Part des images et niveaux de prime commerciale par ancienneté de permis
Il est logique qu’un conducteur ayant eu son permis depuis longtemps paye en moyenne plus qu’un
autre l’ayant eu récemment.
Figure 33 Part des images et niveaux de prime commerciale par formule
Il est également naturel que la prime payée augmente avec la largeur de la formule de souscription.
En annexe « Résultats du tri à plat pour la prime commerciale » figurent les graphiques obtenus pour les
autres variables.
moins de 0.69
0.70 A 0.79
0.80 A 0.89
0.90 A 0.94
0.95 A 0.99
1.00 1.01 A 1.05
1.06 A 1.10
PLUS DE 1.10
Coefficient technique
Part des images
Prime commerciale moyenne
0-2 ans 3-4 ans 5-9ans 10-19ans 20-29ans > 29 ans
Ancienneté du permis
Part des images
Prime commerciale moyenne
RC RC+IV RC+IV+DC RC+IV+TD
Formule
Part des images
Prime commerciale moyenne
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 61
I.2 Etude des corrélations entre la prime commerciale et l’ensemble des variables
du support Pour chaque case tarifaire constituée des variables prises en compte lors du tri à plat, est
déterminé un niveau de prime commerciale moyen, comme expliqué dans le paragraphe d’introduction de
cette partie de l’étude. Les corrélations entre chaque variable et les niveaux de prime commerciales sont
ici aussi établies à partir du coefficient de contingence, utilisé dans la partie 1 /Modélisation de la prime
pure/Etude des corrélations. Les résultats apparaissent ci-dessous.
Tableau 21 Corrélations entre la prime commerciale et les variables du support
Les résultats obtenus pour la prime pure sont rappelés ci-dessous.
Variable Prime Pure
Zone 43%
Ancienneté du véhicule 38%
Durée de détention 34%
Marque Groupe 33%
Coefficient Technique Genre 32%
Ancienneté du contrat Région du portefeuille Classe 31%
Ancienneté du permis 30%
Ancienneté de la carte grise Cylindrée 29%
Segment marketing Âge 28%
Région du risque 24%
Antécédent*Expérience Usage 21%
Formule 20%
Fractionnement 13%
Sexe 11%
Tableau 22 Corrélations entre la prime pure et les variables du support.
En rose, figurent les variables respectivement les plus corrélées à la prime pure et à la prime commerciale.
Le constat suivant peut être fait : dans la première moitié des variables les plus corrélées à la prime
commerciale, se trouvent l’ensemble des variables les plus corrélées à la prime pure. Ceci semble naturel,
étant donné que la prime commerciale dépend directement de la prime pure.
Par ailleurs, les niveaux de corrélations des facteurs avec la prime commerciale sont élevés : ils varient
entre 93 % et 60%. Cela est rassurant vis- à-vis du degré de représentation de la prime commerciale par ces
facteurs.
PC
93%
92%
Classe Marque Groupe Durée de dét. Anc. Contrat CT Anc CG 91%
Ancienneté du permis Âge Région du portefeuille 87%
84%
81%
77%
76%
74%
65%
60%
Réseau
Fractionnement
Sexe
Variable
Ancienneté du véhicule
CylindréeRégion du risque
Formule
Antécédents* Expérience
Usage
Zone
Genre
Segment Marketing
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 62
L’étude des corrélations entre les facteurs réalisée précédemment avait montré que l’âge était corrélé à
l’ancienneté de permis. Ces deux facteurs sont par ailleurs corrélés de manière identique à la prime
commerciale. Cela dit, comme l’ancienneté de permis figure dans le modèle établit en partie 1, il est
préférable de garder cette dernière. D’autre part, la cylindrée est corrélée avec le groupe, le genre et la
classe, mais parmi ces dernières, il s’agit de la variable la moins corrélée à la prime commerciale. Elle ne
sera pas prise en compte dans le reste de l’étude vu que son effet est retrouvé dans les trois variables
précédentes.
Le paragraphe suivant traite des tests de significativité des variables vis-à-vis de la prime commerciale.
I.3 Tests de significativité des variables par analyse de la variance
Le principe de ce test a été expliqué dans la section I.3 de la partie 1. Il est tout de même rappelé
que l’hypothèse nulle du test stipule que les moyennes entre les groupes sont égales : un rejet de cette
dernière consiste à reconnaitre le caractère discriminant de la variable avec un seuil de 5 %. Il en résulte
que l’ensemble des tests d’ANOVA réalisés pour la prime commerciale renvoient une p-value inférieure à
5%. Les variables apparaissent comme étant toutes significatives par rapport à la prime commerciale.
II. Construction du modèle de prime commerciale L’échantillon sur lequel la sélection est effectuée correspond aux primes commerciales moyennes annuelles
sur chaque case tarifaire.
∑
Il faut à présent expliquer le choix du modèle linéaire généralisé utilisé dans la méthode de sélection. Il est
nécessaire d’émettre l’hypothèse suivante afin de pouvoir appliquer la théorie des modèles linéaires
généralisés.
Ainsi, le modèle utilisé dans l’algorithme de sélection des variables est le suivant :
( ) ∑
La fonction de lien « log » est encore une fois retenue car l’on est sous la contrainte d’un modèle
multiplicatif. est supposé être un échantillon indépendant et identiquement distribué
de loi gamma dont les paramètres sont estimés par maximum de vraisemblance. Un histogramme de ces
observations montre que cette loi semble appropriée à ces dernières. En effet, le graphique ci-dessous
illustre les tests d’adéquation de la prime commerciale à trois lois de la famille exponentielle : en rouge, la
loi Gamma, en bleu, la loi exponentielle, en vert, la loi de Weibull et en rose la loi log normale.
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 63
Figure 34 Tests d’adéquation de la prime commerciale aux lois de Weibull, Gamma, Lognormale et Exponentielle sur l’échantillon
segmenté par l’ensemble des variables
Les lois qui semblent le mieux ajuster la prime commerciale semblent être la log-normale et la loi gamma.
Le choix de la loi gamma a été retenu.
Remarque : La loi retenue est une loi gamma. En affinant ou épaississant la segmentation, la loi de
l’échantillon est peu perturbée, seulement les paramètres. Plus précisément, d’une segmentation à l’autre,
les niveaux de prime commerciales obtenus sont des moyennes pondérées des niveaux de prime
commerciales précédents. Ces derniers sont également indépendants. Or une moyenne pondérée de
variables aléatoires indépendantes ayant une loi gamma possède une loi gamma. Ceci est visible sur le la
figure ci-dessous.
Figure 35 Figure 28 : Tests d’adéquation de la prime commerciale à la loi Gamma sur l’échantillon sur une
segmentation plus fine que la figure 27
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 64
II.1 Modèle de segmentation et de prédiction de la prime commerciale La procédure « Forward détaillée en annexe 5 est adaptée au modèle de prime commerciale afin
de renvoyer les résultats ci-dessous. Elle est appliquée à l’échantillon des primes commerciales annuelles
moyennes par cases tarifaires. Les résultats de la sélection apparaissent dans le graphe ci-dessous.
Figure 36 Résultats de la sélection « forward » sur l’échantillon
Les résultats obtenus laissent entendre qu’il y a intérêt à retenir dans la segmentation de la prime
commerciale: la formule, le groupe, la zone, l’ancienneté du permis, le coefficient technique.
Pertinence des résultats obtenus par rapport aux informations collectées précédemment :
La pertinence des résultats obtenus est validée dans un premier temps par le fait que globalement,
l’ensemble des variables apparaissant dans la modélisation de la prime pure apparaissent dans celle de la
prime commerciale. La composante « commerciale » de la prime est mise en avant par l’entrée du
coefficient technique dans le modèle.
Position d’entrée
dans le modèle
Prime pure Prime Commerciale
Fréquence Coût moyen
1 Zone Formule Formule
2 Formule Classe Groupe
3 Anc. Carte grise Zone
4 Groupe Ancienneté. permis
5 Anc. du permis Coefficient technique
Tableau 23 Mise en parallèle des résultats obtenus pour la sélection de facteurs pour la modélisation de la prime pure et celle de la prime commerciale
Par ailleurs, les graphes obtenus lors du tri à plat et les niveaux de corrélation déterminés dans les points
I.1 et I.2 de cette partie viennent appuyer les résultats de la sélection « forward ». La formule est la
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 65
première variable à entrer dans le processus de sélection, son caractère discriminant avait été révélé lors
du tri à plat. De plus, elle est corrélée à 81% avec la variable réponse.
Figure 37 Prime commerciale moyenne en fonction du groupe
Le groupe représente les caractéristiques techniques de la moto. La prime commerciale augmente avec ce
dernier. Il est très corrélé (73%) avec la variable réponse.
Figure 38 Prime commerciale moyenne en fonction de la zone
La zone est la variable la plus corrélée à la prime commerciale. Révélatrice du niveau de danger, il parait
naturel que la prime commerciale augmente avec cette dernière.
Une forte décroissance de la prime commerciale est observable par rapport à l’ancienneté du permis, qui
est corrélée à 87 % avec la variable réponse. Enfin, le coefficient technique est corrélé à plus de 70% avec la
prime commerciale.
Maintenant que les variables du modèle ont été définies, il faudra mesurer son degré de validité.
II.2 Validation du modèle de prime commerciale Soient
la prime commerciale moyenne observée pour la case , la prime
commerciale prédite le modèle pour la case . Les cases permettant le calcul des primes commerciales sont
segmentées de la manière suivante (II.1 Modèle de segmentation et de prédiction de la prime
commerciale)
<=6 30 31 32 33 34-35 36 37 38,39Groupe
Part des images
Prime commerciale moyenne
Zone
Part des images
Prime commerciale moyenne
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 66
Formule Groupe Zone Anc. du permis Coefficient technique
Tableau 24 Variables retenues pour segmenter et expliquer la prime commerciale
Si est le nombre de modalités de la variable , alors le nombre total de cases
obtenu sera égal à ∏ .
Le modèle linéaire généralisé utilisé est un modèle Log-Gamma. On rappelle que les estimateurs
des coefficients ∑ sont déterminés par maximum de
vraisemblance. Le modèle s’écrit sous la forme :
{ ∏
} ( ) ∑
On suppose que la prime commerciale suit une loi gamma. Ici également, la procédure « Genmod » de Sas est utilisée.
Significativité des variables et des modalités Ici encore, des tests du rapport de vraisemblance sont effectués, dont le principe est expliqué en Partie 1
Modélisation de la prime pure/II.3 Validation du modèle de prime pure/Analyse des résultats du modèle de
fréquence. Ses hypothèses sont rappelées ci-dessous. Si la « p-value » est inférieure au niveau , la
modalité ou la variable en question est significative dans le modèle. Les résultats du test sont les suivants :
Significativité des variables:
Variable Formule Groupe Zone Anc. du permis Coefficient technique
« P-Value » <0,0001 <0, 0001 <0, 0001 <0, 0001 <0,0001
Tableau 25 Résultats des tests de rapport de vraisemblance par variable du modèle de prime commerciale
Significativité des modalités :
Tableau 26 Résultats des tests de rapport de vraisemblance par modalité du modèle de prime commerciale
Quelle que soit la variable et quelle que soit la modalité de cette variable, l’hypothèse de sa non
significativité peut être rejetée avec un seuil de 5%.
Qualité d’ajustement du modèle de prime commerciale Les résidus bruts issus du modèle ainsi que la différence entre la prime commerciale annuelle versée par
un individu et la prime commerciale prédite par le modèle sont étudiés. Cet écart mesure la qualité
"P-value" "P-value" "P-value" "P-value" "P-value"
RC <0,0001 <=6 <0,0001 Zone1 <0,0001 0-2 ans 0,01% moins de 0.69<0,0001
RC+IV <0,0001 30 <0,0001 Zone2 <0,0001 3-4 ans 0,01% 0.70 A 0.79 <0,0001
RC+IV+DC <0,0001 31 <0,0001 Zones 3-4 , 5-9ans 0,01% 0.80 A 0.89 <0,0001
RC+IV+TD 32 <0,0001 Zone5 <0,0001 10-19ans , 0.90 A 0.94 <0,0001
33 <0,0001 Zone6 <0,0001 20-29ans <0,0001 0.95 A 0.99 <0,0001
34-35 , Zone7 <0,0001 > 29 ans <0,0001 1.01 A 1.05 <0,0001
36 <0,0001 Zone8 <0,0001 1.06 A 1.10 ,
37 <0,0001 Zone9 <0,0001 1.00 <0,0001
38,39 <0,0001 Zone10 <0,0001 PLUS DE 1.10 <0,0001
Zone11 <0,0001
Zone12 <0,0001
Zone13 <0,0001
Coefficient techniqueFormule Groupe Zone Ancienneté du permis
"P- value" 5% "P- value" 5% Modalité de référence
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 67
d’ajustement du modèle à l’individu. Pour des raisons de confidentialité, certains chiffres du tableau
suivant ont été notés et .
Tableau 27 Erreur brute totale pour le modèle de prime commerciale
La variation relative entre la somme des primes commerciales prédites observées est nulle.
Le R² est également déterminé.
∑ ( )
∑ (
)
= 75%
75% de la prime commerciale est expliquée par la formule, le groupe, la zone, l’ancienneté du permis et le
coefficient technique.
Etude de l’erreur centrée réduite
(
) { ∏
} correspond à l’erreur brute,
correspond à
l’erreur brute centrée réduite.
Figure 39 Résidus bruts centré réduits du modèle de prime commerciale et test du QQ plot sur ces derniers
Cette distribution a l’air plus ou moins symétrique : la normalité des résidus est testée. Si le modèle est
correct, alors les écarts entre l’observé et le prédit sont entièrement imputables à des erreurs de mesure.
Les résidus doivent posséder les propriétés classiques d’une distribution normale : courbe « en cloche»,
symétrique autour de la valeur prédite, avec un aplatissement régulier des extrémités. Le test QQ plot
réalisé ci-dessus montre que les queues de distributions des résidus bruts ne s’ajustent pas correctement
pas à celles d’une loi normale centrée réduite.
Nb cases
Somme des Primes
commerciales observées
Somme des Primes
commerciale prédite ( ) ⁄
Variation
19172 0%
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 68
Cela dit, la figure 40 montre que 2% des valeurs des résidus s’écarte des queues de distribution : ils sont
inférieurs à -2,5 ou supérieurs à 2,5.
Figure 40 des résidus bruts centrés réduits sur trois intervalles ]-∞,-2,5[; [-2,5,2,5] ;]2,5 ,+∞[ .
Figure 41 Boite à moustaches représentant le nombre d’individus pas case en fonction des trois catégories de résidus centrés réduits définies précédemment
La boîte à moustache ci-dessous identifie les valeurs s’écartant des queues de distribution : elles
correspondent aux primes commerciales moyennes calculées sur des cases ayant peu d’individus.
La ou les individus par case sont peu nombreux, la prédiction de la prime commerciale versée s’ajuste mal.
Par ailleurs, pour un risque , l’écart entre la prime commerciale annuelle d’un individu et la prime
commerciale moyenne que lui affecte le modèle (qui dépend de la case tarifaire à laquelle le risque
appartient) est noté . La base d’apprentissage possède n=544 338 risques.
}
: Montant de la cotisation payée par le risque
Prime commerciale moyenne prédite pour la case
Moyenne 0,62
Ecart type 112
Tableau 28 Moyenne, écart type sur l’échantillon des ( )
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 69
En moyenne, le modèle la prime commerciale payée par l’individu est de 62 centimes supérieure à celle
que lui attribue le modèle ( ) .
Figure 42 Distribution des (
)
Cette distribution est plus ou moins symétrique : globalement sur l’ensemble des risques, la prime
commerciale affectée par le modèle est autant surestimée qu’elle est sous estimée
Validation du modèle sur la base de test Les valeurs des primes commerciales prédites sont obtenues en appliquant la formule :
( ( ) ∑
)
,
les résidus bruts centrés réduits associés à .
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 70
Figure 43 Les mêmes phénomènes sont constatés sur l’échantillon de test
La figure 43 montre que le même type de phénomènes est observé sur les échantillons de test et
d’apprentissage : la difficulté à bien prédire de ce modèle réside dans les cases tarifaires constituées de peu
d’individus.
Figure 44 Distribution des (
)sur l’échantillon de test
La distribution des ( ) sur la base de test est symétrique : globalement sur l’ensemble des risques, la
prime commerciale affectée par le modèle est autant surestimée qu’elle est sous estimée. En moyenne,
l’écart entre la prime annuelle payée par un individu et celle affectée par le modèle est de 28 centimes
d’euros sur la base de test.
III. Conclusion
Cette partie a déterminé un modèle de segmentation et de prédiction de la prime commerciale, dont les
facteurs sont globalement identiques à ceux utilisés dans le modèle de prime pure, déterminé en partie 1.
Les erreurs de prédiction du modèle de prime commerciale sont les plus élevées sur les cases tarifaires
ayant peu d’effectif. Cela dit, l’ajustement de cette prime commerciale prédite par rapport à l’individu est
d’une bonne qualité, et en moyenne, la prime commerciale reversée par un individu sera pratiquement
égale à celle que lui octroie le modèle. Les coefficients qui permettront de projeter le résultat sur les N
années à venir sont donc à présent disponibles. Ils doivent cependant être probabilisés via par la
détermination d’une probabilité de présence de l’assuré dans le portefeuille. Il s’agit de l’objet de la
troisième partie de ce mémoire.
Partie 2: Modélisation de la prime commerciale
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 71
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 72
Partie 3 : Modélisation de la probabilité de résiliation Cette partie a pour objectif de construire une probabilité de présence de l’assuré dans le
portefeuille. Sa structure est globalement similaire aux deux précédentes, une analyse descriptive de la
résiliation sera d’abord effectuée, puis un modèle de prédiction de la probabilité de résiliation d’un contrat
sera construit.
I. Intérêt et cadre de la modélisation de la probabilité de résiliation Il est rappelé que l’objectif de l’étude est de modéliser la valeur contrat.
Probabiliser le flux du contrat l’année passe donc par la détermination de la probabilité de
résiliation de chaque assuré entre l’année 0 et l’année k.
Lors de l’établissement du périmètre de l’étude, seuls les contrats à tacite reconduction ont été conservés:
ces derniers sont automatiquement renouvelés pour un an lors de leur échéance anniversaire.
L’assuré souhaitant résilier son contrat effectue cette demande via l’envoi d’un courrier de résiliation. Les
principaux motifs de résiliation de la part de l’assuré sont la vente de son véhicule, l’arrivée à échéance de
son contrat, la suspension de son permis de conduire … L’assureur peut également mettre fin au contrat de
l’assuré s’il y a défaut de paiement par exemple.
Par ailleurs, la probabilité de résiliation prédite par le modèle est la probabilité de résilier son
contrat sur une année, et non pas celle de la formule, ( ), qui correspond à la probabilité de résiliation
entre l’instant 0 et l’instant k. Ainsi, le terme ( ( )) de la formule ci-dessus peut se réécrire. En fait,
la probabilité d’ être présent dans le portefeuille à l’instant est égale au produit des probabilités d’être
présent dans le portefeuille entre l’instant et l’instant pour .
L’évaluation de la probabilité de résiliation s’effectuera par la mise en place d’une variable réponse
indicatrice « Résiliation» (R=1 ou R=0). La variable « nature de fin d’image » est extraite pour ce faire. Elle
prend les modalités suivantes :
∑ ⏞
( ) ⏟
( )⏞
( ( ))⏞
Prime commerciale de l’année k
Prime pure de l’année k
Produits financiers de l’année k
Frais d’acquisition et de gestion de l’année k
Taux d’actualisation entre l’année 0 et l’année k
Taux d’inflation de l’année k
( ) Probabilité de résiliation entre l’année 0 et l’année k.
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 73
Ainsi, s’il existe une image à la fin de laquelle le contrat a été résilié , sinon.
La base de résiliation est constituée de la manière suivante :
Numéro du contrat Données du contrat à la première image R
1 ou 0
Tableau 30 Structure des données dans la base de résiliation
Les données du contrat sont constituées des variables collectées précédemment, la résiliation étant en
partie sensible au tarif.
En notant , les différentes réalisations de la variable aléatoire sur toute la base, le taux de
résiliation peut être définit par
∑
Nature de fin d’image
Modalités Résiliation
Suspension
Remplacement
Echéance principale
Pas d’image suivante Tableau 29 Modalités de la variable nature de fin d’image
Conducteur Géographie
Âge
Sexe du conducteur
Segment marketing (Seg_Mkt)
Ancienneté du permis (Acp)
Antécédents* Expérience (Ant_exp)
Zone
Région du portefeuille
Région du risque
Véhicule Contrat
Marque de la moto
Genre de la moto
Groupe
Classe
Ancienneté de la carte grise (Anccg)
Durée de détention du véhicule (Ddv)
Ancienneté du véhicule (Acv)
Type d’usage
Cylindrée
Formules
Fractionnement
Réseau de distribution
Ancienneté du contrat (Ancc)
Coefficient technique (CT)
Tableau 31 Support des variables explicatives pour la modélisation de la probabilité de résiliation de chaque assuré.
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 74
Deux bases obtenues aléatoirement sont créées à partir de cette dernière : une base d’apprentissage à
partir de laquelle le modèle de résiliation sera élaboré (sur laquelle figurent 70% des contrats), et une base
de test sur laquelle ce dernier sera testé (sur laquelle figurent les 30% restants). Le périmètre de l’étude
reste inchangé.
II. Analyse descriptive pour la modélisation de la probabilité de résiliation
II.1 Analyse uni variée Comme effectué pour la prime pure ainsi que pour la prime commerciale, le but est de visualiser les
variables qui pourraient avoir un impact sur le taux de résiliation, et tenter de comprendre leur évolution
d’un groupe à l’autre. Pour l’ensemble des variables mentionnées en partie 1, le taux de résiliation de
chaque groupe est représenté sur un graphique. Certains résultats sont présentés ci-dessous.
Figure 45 Part des contrats et taux de résiliation par âge et par ancienneté de contrat
Le taux de résiliation a tendance à décroitre avec l’âge: les jeunes, plus susceptibles d’étudier les offres
concurrentes que les personnes plus âgées, auront tendance à davantage résilier leurs contrats.
Un constat similaire peut être fait vis-à-vis de l’ancienneté du contrat : le taux de résiliation décroit avec
cette dernière. Cela s’explique par l’enclenchement d’un mécanisme de fidélisation de la part de l’assuré :
plus le contrat est ancien, moindre est la propension à le résilier.
<25ans <30ans <35ans <40ans <50ans 50ans et +
Âge
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Ancienneté du contrat
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 75
Figure 46 Part des contrats et taux de résiliation par sexe
En revanche, le taux de résiliation semble être indépendant du fait d’être un homme ou une femme : il
est pratiquement identique pour les deux sexes.
Figure 47 Part des contrats et taux de résiliation par région du contrat (région du risque)
L’appartenance à une région semble également peu influer sur le fait de résilier (de manière générale, la
plupart des variable géographiques impactent peu le taux de résiliation).
Les résultats obtenus pour les autres variables figurent en annexe « Résultat du tri à plat pour la
probabilité de résiliation ». Le tableau ci-dessous retrace le bilan de l’analyse uni variée de la probabilité de
résiliation : il s’agit de celles dont le caractère discriminant a été jugé le plus prononcé. Les facteurs qui ne
semblaient pas avoir un impact significatif ont été barrés.
F H
Sexe
Part de contrats %
Taux de résiliation
Taux de résiliation moyen
Ancienneté du contrat
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 76
Tableau 32 Bilan de l’analyse uni variée pour la modélisation de la probabilité de résiliation
II.2 Corrélations entre la variable de résiliation et le support
Une matrice de corrélation entre les variables du support a été construite : vu que l’étude de la résiliation
repose sur un échantillon différent, (la base en question est une base contrats et non pas une base en
cases tarifaires), il a été nécessaire de réévaluer les corrélations entre les variables. Les mêmes résultats
que l’étude des corrélations pour la prime pure et la prime commerciale sont obtenus. La matrice de
corrélation correspondante figure en annexe 9.
Par ailleurs, le degré de liaison des variables du support avec l’acte de résiliation des assurés ( et donc avec
leur probabilité de résilier) est maintenant étudié. Les corrélations sont mesurées grâce au coefficient de
contingence sur l’échantillon des ou n est le nombre de contrats figurant dans le résultat
technique de 2011.
Variable Résiliation
Âge 11%
Durée de détention du véhicule 9%
Ancienneté du permis Segment Marketing 8%
Ancienneté du contrat Ancienneté de la carte grise 7%
Fractionnement 6%
Genre Marque Formule Classe Cylindrée 4%
Ancienneté du véhicule Coefficient technique Groupe 3%
Réseau Antécédents*Expérience Zone 2%
Région du risque Région du portefeuille Usage Sexe 1%
Tableau 33 Corrélations entre la variable R et le support
L’évaluation des corrélations ne semble pas mettre en place une visibilité sur les facteurs qui auront le plus
de lien avec l’acte de résilier. En effet, l’ensemble des corrélations varient entre 1 % et 11 %, ce qui
représente un faible niveau.
Conducteur Géographie
Sexe du conducteur
Segment marketing (Seg_Mkt)
Ancienneté du permis (Acp)
Antécédents (Ant)*Expérience (Exp)
Zone
Région du portefeuille
Région du risque
Véhicule Contrat
Marque de la moto
Genre de la moto
Groupe
Classe
Cylindrée
Ancienneté de la carte grise (Anccg)
Durée de détention du véhicule (Ddv)
Ancienneté du véhicule (Acv)
Type d’usage
Formules
Fractionnement
Réseau de distribution
Ancienneté du contrat (Ancc)
Coefficient technique (CT)
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 77
II.3 Analyse en composantes multiples Afin de mieux visualiser les catégories de personnes qui résilient le plus ou le moins et de confronter les
résultats obtenus précédemment, une analyse en composantes multiples incluant la variable de résiliation
est effectuée. La théorie portant sur les techniques utilisées a été décrite en partie 1 / I.4 Analyse en
composantes multiples. La variable de résiliation aura le statut de variable supplémentaire dans cette
analyse, et n’influera donc pas sur la construction des axes. Les résultats suivants sont encore une fois
obtenus grâce à la procédure « Corresp » de Sas.
Figure 48 Inertie ajustée sur les 10 premiers axes
Le critère du coude consiste à retenir le nombre d’axes tel que l’apport en inertie n’augmente plus
considérablement. L’application de ce critère aboutit à la considération du premier axe, possédant près de
40% de l’inertie.
Il s’agit de se pencher à présent sur les variables ayant joué un rôle significatif dans cette analyse. Comme
pour l’ACM précédente, les modalités contribuant à chaque axe sont repérées.
Rappel : Une modalité participe à la constitution d’un axe si sa contribution à l’axe en question est
supérieure ou égale à l’inertie moyenne
, p étant le nombre total de modalités.
Figure 49 Représentation des catégories d’individus sur le premier axe.
<25ans<30ans
acp+20
acp0-4 anccg0-3anccg4-7 anccg8-10
Autres
Autres asi.
CUSQUA IM/EXO
ROA
SCO
TRA/SMO
TT
30-3134-36
37-39
<=6 j à l
m à o
p à r
NR
ddv+8
ddv0-3acv0-3 acv10-19
acv20-39
ancc 4 à 8
Ancc 9-13Plus de 1.10Annuel
Moins de 0.79
NON
OUI
-1,5 -1 -0,5 0 0,5 1 1,5 2
AXE 1
Modalités des facteurs
Resiliation
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 78
La confrontation des résultats obtenus précédemment va s’effectuer de la manière suivante.
L’axe 1 possède comme thématique dominante l’ancienneté : une opposition temporelle (du point de vue
des contrats, des personnes ou des véhicules) peut être mise en place.
A gauche de l’axe se situent :
-Les moins de 30 ans, moins de 4 ans d’ancienneté de permis, moins de trois ans d’ancienneté de contrat,
avec des véhicules moins de trois ans d’ancienneté de la carte grise, de durée de détention et d’ancienneté
de véhicule. Leur coefficient technique est inférieur à 0,79 et sont détenteurs de motos urbaines (scooter
par exemple) ou tout terrain (groupe inférieur ou égal à 6).
Ces personnes auraient, selon les résultats obtenus, tendance à résilier (l’acte de résilier se situe du coté
gauche de l’axe). D’ailleurs, l’analyse uni variée avait montré que les catégories citées précédemment
avaient de forts taux de résiliation.
A droite de l’axe, se trouve la catégorie complémentaire de celles citées précédemment :
-Une ancienneté de contrat allant de 4 à 13 ans, plus de 20 ans d’ancienneté de permis, ayant de vieux
véhicules (plus de 20 ans d’ancienneté) et des coefficients techniques élevés.
Les coordonnées des modalités sur l’axe 1 figurent en annexe 10.
Cette analyse en composantes multiples a surtout confirmé les résultats obtenus lors de l’analyse uni variée
du taux de résiliation.
La section suivante a pour objectif de construire un modèle permettant la détermination de la probabilité
de résiliation d’un contrat.
III. Construction du modèle de résiliation
Le but de cette sélection est de voir quelles variables sont les plus significatives vis-à-vis de la probabilité de
résiliation. Comme précédemment, il s’agit de choisir un modèle de régression ainsi qu’une méthode de
sélection des variables. Les notions nécessaires à la compréhension d’un modèle linéaire avaient été
abordées en Partie 1 Modélisation de la prime pure/ II Construction du modèle de prime pure/ II.1 Choix de
l’approche et application de la théorie des modèles linéaires généralisés « Méthodologie adoptée pour la
modélisation de la prime pure ».
III.1 Théorie sur la régression choisie Rappel :
La probabilité de résiliation pour un assuré est la probabilité que la variable R vaille 1, conditionnellement
au fait que l’assuré ait les propriétés X. De manière mathématique cela se reformule de la manière
suivante :
( ) ( )
étant une indicatrice, cette variable suit une loi de Bernoulli. La probabilité de résilier n’est autre que
l’espérance de la variable aléatoire , conditionnellement au fait que l’assuré ait les propriétés X. Une
régression logistique permet d’estimer cette probabilité.
En effet : [ ] = ( )
Le modèle linéaire utilisé pour le calcul de ( ) ne peut être un modèle linéaire simple, c’est-à-
dire [ ] . peut prendre des valeurs sur tout et non exclusivement sur l’intervalle [0 ; 1],
alors que l’on cherche à estimer une probabilité.
Pour contourner cela, un modèle linéaire généralisé dont le lien est la fonction logit
( )
(et la loi une Bernoulli comme mentionné précédemment). Pour un individu de la base
ayant les propriétés X, (une ligne), on a :
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 79
( [ ])= [ ]= ( ) ( )
, qui prend bien des valeurs
comprises entre 0 et 1.
En notant les différentes réalisations de la variable aléatoire étant le nombre de contrats
dans la base d’apprentissage, (
) le vecteur des modalités codées façon binaire de chaque
contrat de la base, (
) le vecteur des coefficients de la régression, la régression logistique est formulée
de la manière suivante :
= ( )
Ainsi, pour chaque ligne de la base une probabilité de résiliation est estimée et sera égale à la quantité
suivante
.
Dans ce cas de figure également, une sélection « forward » est réalisée : elle permet de visualiser les
variables du support qui auront le plus d’impact sur l’acte de résiliation et la probabilité de résiliation des
assurés.
III.2 Résultats de la sélection La sélection des variables a été réalisée grâce à la même macro « forward » figurant en annexe 5. Des
modifications ont été apportées de manière à ce que la procédure de sélection soit adaptée aux données
(utilisation de la procédure « Logistic » de SAS notamment).
Figure 50 Résultats de la sélection « forward » pour le modèle de résiliation
La courbe bleue représente les niveaux de l’AIC obtenus au fur et à mesure qu’une variable est ajoutée. La
courbe rouge détermine la variation relative de ces niveaux d’AIC. Les résultats incitent à retenir les cinq
premières variables dans la sélection: l’âge, la durée de détention du véhicule, l’ancienneté du contrat, la
-0,014
-0,012
-0,01
-0,008
-0,006
-0,004
-0,002
0
0,002
250000
252000
254000
256000
258000
260000
262000
AIC
Variation relative
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 80
formule, le fractionnement, ainsi que le coefficient technique. Les variables entrant dans le modèle après le
coefficient technique n’apportent plus d’information de manière significative.
Deux « warnings » doivent être émis quant aux résultats de la sélection effectuée:
- La durée de détention est non renseignée sur le nouveau produit soit sur près d’un tiers des données.
-La durée de détention est corrélée à 75% avec l’ancienneté des contrats, ce qui risque de biaiser la
modélisation.
En raison des deux éléments cités précédemment, la modèle de résiliation comprendra donc : l’âge,
l’ancienneté du contrat, la formule, le fractionnement ainsi que le coefficient technique.
La pertinence des résultats obtenus est notable de part la nature de la thématique de ces variables. Elles
font pratiquement toutes partie de la famille de variables « contrat ». Cette fois- ci, les niveaux de
corrélations obtenus pour analyser la pertinence des résultats ne sont pas vraiment utilisables, car les
facteurs étaient très peu corrélés à la variable « résiliation ». Par ailleurs, la plupart des variables du
modèle en question avaient participé à la construction de l’axe selon lequel l’acte de résiliation avait été
représenté. A présent, le pouvoir discriminant du modèle mis en place doit être étudié.
III.3 Analyse du pouvoir discriminant
Les facteurs sélectionnés précédemment apparaissent comme étant les meilleurs. Il est tout de même
nécessaire de tester la qualité de discrimination du modèle par d’autres méthodes.
Concernant les chiffres obtenus, la probabilité de résiliation moyenne prédite pour l’ensemble des contrats
est bien égale au taux de résiliation déterminé au début de l’étude, ce qui est rassurant vis-à vis de la
vraisemblance du modèle.
L’aire sous la courbe ROC (« Receiver Operating Characteristic») est un indicateur de la qualité de la
régression logistique, et par conséquent sur la bonne estimation des probabilités de résiliation issues du
modèle. Elle se base sur la notion de sensibilité et de spécificité du modèle. Avant tout, un vocabulaire
essentiel à la compréhension de la démarche doit être définit.
Vrai positif : Prédiction d’une résiliation sachant que la personne a résilié.
Vrai négatif : Prédiction d’une non résiliation sachant que la personne n’a pas résilié.
Faux positif : Prédiction d’une résiliation sachant que la personne n’a pas résilié.
Faux négatif : Prédiction d’une non résiliation sachant que la personne a résilié.
Il est maintenant possible de définir les notions de sensibilité et spécificité
Il s’agit de la probabilité évaluée par le modèle, de résilier son contrat sachant qu’il a été résilié.
Plus est proche de 1, plus le modèle est dit sensible : il manque rarement de de prédire des résiliations.
Il s’agit de la probabilité évaluée par le modèle, de ne pas résilier son contrat sachant qu’il n’a pas été
résilié. Plus est proche de 1 et plus le modèle est dit spécifique : il manque rarement les non résiliations.
Un bon modèle maximise la sensibilité et la spécificité. Cela dit, ces deux maximisations ne peuvent se faire
de manière simultanée.
En effet, soit s la probabilité de résiliation à partir de laquelle l’individu est considéré comme étant dans le
groupe 1. Prenons des cas extrêmes :
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 81
s=0 : « Tout le monde résilie »
,
s=1 : « Personne ne résilie »
Il n’est donc pas possible d’augmenter la sensibilité sans baisser la spécificité, et inversement.
Le graphique ci-dessous montre qu’un compromis est établit en choisissant un seuil qui égalise ces deux
dernières.
Figure 51 Egalisation de la sensibilité et spécificité du modèle
Le graphique estime le seuil de probabilités de résiliations La sensibilité et la spécificité associées
sont appelées taux de bon reclassement. Cela veut dire qu’une proportion =58% des contrats
résiliés sont prédits comme étant résiliés et des contrats non résiliés sont prédits comme non résiliés. Ce
chiffre n’est pas excellent : une attention particulière à ce taux devrait être portée s’il s’agissait de prédire
l’acte de résiliation, mais l’objectif de l’étude se limite à estimer ses probabilités.
La courbe ROC (« Receiving Characteristic Operating ») va représenter en fonction de en faisant
varier le seuil évoqué précédemment. Idéalement, il faudrait avoir le plus proche de 1 et le plus
proche de 0, ce qui dans le meilleur des cas donnerait une aire sous la courbe égale à 1.
Dans le contexte présent cette aire vaut 0,609, ce qui selon la littérature est considéré comme étant un
modèle dont le pouvoir discriminant acceptable.
0
0,2
0,4
0,6
0,8
1
1,2
0,0
6
0,1
0
0,1
1
0,1
1
0,1
2
0,1
3
0,1
3
0,1
4
0,1
4
0,1
5
0,1
5
0,1
6
0,1
6
0,1
7
0,1
7
0,1
8
0,1
8
0,1
9
0,1
9
0,2
0
0,2
1
0,2
1
0,2
2
0,2
3
0,2
4
0,2
5
0,2
6
0,2
8
Seuil s égalisant la sensibilité et la spécificité
Seuil s
Spécificité
Sensibilité
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 82
Figure 52 Courbe Roc issue du modèle de résiliation
Dans le cadre en question, il s’agit de prédire la valeur contrat et non pas l’acte de résiliation ; le résultat
obtenu pour l’aire sous la courbe ROC est donc satisfaisant.
Le taux de paires concordantes est calculé de la manière suivante. Selon le groupe auquel l’individu
appartient (groupe 1 s’il a résilié, groupe 0 sinon), sa probabilité de résiliation est comparée à toutes celles
des individus du groupe opposé. Si la probabilité de résiliation d’un individu de groupe 1 est supérieure à
celle d’un individu du groupe 0, la paire est concordante. Sinon, elle est dite discordante.
Remarque : Par conséquent, la probabilité de ne pas résilier pour un individu du groupe 0 est supérieure à
la probabilité de ne pas résilier pour un individu du groupe 1. En notant la variable aléatoire
représentant le groupe auquel a été affecté le groupe après la régression,
( | ) ( | ) ⏟
( | ) ( | )
.
Ce taux doit être le plus proche possible de 1. Un taux de paires concordantes acceptable doit être
supérieur à 60 %, dans le contexte présent il vaut 60%.
Le de Somers est également révélateur de la qualité de la discrimination, d’une manière plus ou moins
similaire à celle du taux de paires concordantes.
.
Idéalement, il vaut 1, dans le pire des cas il vaut -1. Les résultats fournissent un égal à 0,198. Il est
conséquent plus proche de 1 que de -1.
III.4 Les rapports de chance L’avantage majeur des « odds ratio » est qu’ils permettent d’isoler l’influence d’une modalité sur la variable
réponse. Pour les définir, il est nécessaire de définir la notion d’ « odds ». L’ « odds » d’une modalité est le
rapport entre la probabilité de résiliation d’un individu qui possède la modalité en question ainsi que toutes
les autres modalités de référence, et la probabilité de non résiliation de ce même individu. Soit le
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 83
vecteur contenant les coordonnées (binaires) d’un individu possédant la modalité d’une variable donnée
ainsi que les modalités de référence des autres variables.
(
)
Soit le coefficient associé à cette modalité.
( ) (
)
( )
Si cet « Odds » vaut , cela signifie chez les individus ayant la modalité i les chances de résilier sont plus
élevées que celles de ne pas résilier.
L’ « Odds ratio » d’une modalité est le rapport entre l’ « Odds » de la modalité d’une variable et celui
de la modalité de référence associée à cette variable.
( ) ( )
( )
Si ( ) vaut , cela signifie que les chances de résilier contre celles de ne pas le faire d’un
individu ayant la modalité i sont plus élevées que celles d’un individu de référence.
Ainsi un « Odds ratio » plus grand que 1 (respectivement plus petit que 1) manifeste un fort
(respectivement faible) comportement de résiliation au sein du groupe en question par rapport au groupe
majoritairement présent dans l’échantillon. Un « Odds ratio » égal à 1 laisse entendre que le fait de résilier
ne dépend pas de la modalité en question.
Ci-dessous figure le calcul des Odds Ratio pour les variables formule et coefficient technique.
Figure 53 Odds ratios calculés pour la variable formule, modalité de référence RC+IV+TD
Relativement aux personnes qui détiennent la formule RC+IV+TD, les chances de résilier sont égales pour
les formules RC+IV, RC+IV+DC. La valeur des « Odds ratios » correspondants est cela dit proche de 1 : cela
révèle que la probabilité de résilier son contrat est pratiquement indépendante du fait que ces formules
1,05
1,1
1,15
1,2
1,25
1,3
formule RC vs RC+IV+TD formule RC+IV vs RC+IV+TD
formule RC+IV+DC vs RC+IV+TD
Formule
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 84
soient détenues par l’assuré. Il n’est pas possible d’en dire autant du groupe possédant la formule RC, dont
la valeur de l’ « Odds Ratio » révélatrice une tendance à résilier.
Figure 54 Odds ratios calculés pour la variable coefficient technique, modalité de référence 0,70 A 0,79
Relativement aux personnes dont le coefficient technique est plus élevé que 1,10, un coefficient technique
qui augmente fait croître la probabilité de résilier. Mis à part ceux qui ont un CT égal à 1,00, l’ensemble des
groupes sont moins susceptibles de résilier leurs contrats. Une explication potentielle du phénomène
observé au niveau du groupe « CT=1,00 » est que ce groupe, n’étant pas sous-tarifé, considèrerait que le
niveau de cotisations payé est trop élevé par rapport à sa charge de sinistres, ce qui l’inciterait à résilier
plus que les autres.
Cette technique a permis de voir quels étaient les groupes qui avaient le plus de chance de perdurer dans le
portefeuille.
III.5 Résultats obtenus sur la base de test et conclusion
La base de test correspondant aux 30% restants de l’échantillon est utilisée pour valider la modèle de
résiliation. Sur l’ensemble des graphes ci-dessous figurent, en rouge, le taux de résiliation observé au sein
de chaque catégorie
En bleu, la probabilité de résiliation moyenne prédite pour chaque catégorie. Pour un contrat donné, la
probabilité de résiliation prédite est obtenue par la formule suivante
Ou est le vecteur des coefficients qui ont été estimés précédemment, (
) le vecteur des
modalités du contrat, codées façon binaire.
0
0,2
0,4
0,6
0,8
1
1,2
1,4
ct moins de 0,69 vs 0,70 A
0,79
ct 0,80 A 0,89 vs 0,70 A 0,79
ct 0,90 A 0,94 vs 0,70 A 0,79
ct 0,95 A 0,99 vs 0,70 A 0,79
ct 1,00 vs 0,70 A 0,79
ct 1,01 A 1,05 vs 0,70 A 0,79
ct 1,06 A 1,10 vs 0,70 A 0,79
ct PLUS DE 1,10 vs 0,70 A 0,79
Coefficient technique
Partie 3: Modélisation de la probabilité de résiliation
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 85
Figure 55 Taux de résiliation observés et prédits sur la base de test à par fractionnement et formule
Figure 56 Taux de résiliation observés et prédits sur la base de test à par âge et coefficient technique formule
Figure 57 Taux de résiliation observés et prédits sur la base de test à par âge et coefficient technique
Conclusion
Globalement, les courbes taux de résiliation observé/ taux de résiliation prédit adhèrent. Les résultats du
modèle de résiliation sont assez corrects dans la mesure ou l’objectif n’est pas de prédire un acte de
résiliation mais de calculer une probabilité de présence dans le portefeuille.
L’ensemble des paramètres du modèle est à présent disponible et permettra de déterminer une valeur
contrat. La prochaine partie du mémoire déroule une méthodologie quant au calcul de cette dernière.
Annuel Autres
Taux de résilation observé
Probabilité de résilation moyenne prédite
RC RC+IV RC+IV+DC RC+IV+TD
Taux de résilation observé
Probabilité de résilation moyenne prédite
0
0,05
0,1
0,15
0,2
0,25
0,3
<25ans <30ans <35ans <40ans <50ans 50ans et +
Taux de résilation observé
Probabilité de résilation moyenne prédite
moins de
0.69
0.70 A
0.79
0.80 A
0.89
0.90 A
0.94
0.95 A
0.99
1.00 1.01 A
1.05
1.06 A
1.10
PLUS DE
1.10
Taux de résilation observé
Probabilité de résilation moyenne prédite
Taux de résilation observé
Probabilité de résilation moyenne prédite
Partie 4: Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 86
Partie 4 : Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle Cette partie dresse une méthodologie du calcul de la valeur contrat et propose des pistes d’amélioration de ce modèle. Il est rappelé que la méthode de projection des flux repose sur un vieillissement des variables temporelles :
Figure 58 Schéma d’obtention de la valeur contrat
Le tableau ci-dessus fait un récapitulatif des facteurs obtenus pour l’ensemble des modèles.
Prime pure Prime
Commerciale
Résiliation
Fréquence Coût moyen
Zone Formule Formule Age
Formule Classe Groupe Anc. COntrat
Anc. Carte grise Zone Formule
Groupe Ancienneté.
permis
Fractionnement
Anc. du permis Coefficient
technique
Coefficient technique
Tableau 34 Récapitulatif du modèle de la valeur contrat
Les variables surlignées correspondent à celles dont les modalités évoluent d’une année à l’autre, et qui
expliqueront en partie l’évolution du résultat du contrat. L’idée du fait que la probabilité de résilier à une
année fixée est égale au produit des probabilités entre cette même année et les années ultérieure est
rappelée (Partie 3, Intérêt et cadre de la modélisation de la probabilité de résiliation).
La formule exacte du calcul de la valeur contrat devient :
Partie 4: Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 87
Figure 59 Formule finale de la valeur contrat
En guise de fin à ce mémoire, les limites et pistes d’amélioration qui sont proposées pour ce modèle sont
les suivantes :
Comme précisé en partie 1 dans le cadre du modèle de coût moyen, un optique intéressante serait
de modéliser la variation du coût moyen plus tôt que le coût moyen ou essayer de le modéliser par
une loi de Weibull .
∑ ⏞
( ) ⏟
( )⏞
( ( ))⏞
∑∏
∏
∏
( )
( ) ( ∏ (
))
(
)
(
)
(
)
(
)
Prime commerciale de l’année k
Prime pure de l’année k
Produits financiers de l’année k
Frais d’acquisition et de gestion de l’année k
Taux d’actualisation entre l’année 0 et l’année k
Taux d’inflation de l’année k
( ) Probabilité de résiliation entre l’année 0 et l’année k, de manière plus précise
( ) ∏ ( ) ∏
∑
∑
Partie 4: Méthodologie de calcul de la valeur contrat et pistes d’amélioration du modèle
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 88
Il faut traîter avec une attention particulière les populations peu exposées aux risques, autrement
dit peu nombreuses ou ayant eu peu de sinistres. En effet, des erreurs de prédiction se creusent
pour ces catégories de personnes.
Incorporer les sinistres graves dans la modélisation rendrait plus vraisemblable l’évaluation de la
valeur contrat. Par souci de temps, cela n’a pas été effectué.
Le modèle de la valeur contrat en pourrait être complexifié par la mise en place de la projection
d’une variable aléatoire dans le futur, indiquant si le contrat détient toujours un niveau de garantie
donné
Conclusion
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 89
Conclusion de l’étude
L’objectif de cette étude était de développer une méthodologie permettant d’évaluer la valeur contrat
Dans cette perspective, trois modèles différents ont été mis en place :
Un modèle de segmentation et prédiction de la prime pure dont les facteurs sont la zone, la
formule de souscription, le groupe, la classe du véhicule, l’ancienneté de la carte grise et
l’ancienneté du permis.
Un modèle de segmentation et prédiction de la prime commerciale dont les facteurs sont la
formule, le groupe, la zone, l’ancienneté de permis et le coefficient technique.
Un modèle d’évaluation de la probabilité de présence de l’assuré dans le portefeuille, construit à
partir de l’âge du détenteur du contrat, de sa formule de souscription, du fractionnement de ses
cotisations ainsi que de son coefficient technique.
Les différents facteurs entrant en compte dans ce modèle de valorisation sont plutôt classiques et
incorporent des variables autant liées à l’assuré lui même qu’à la politique de tarification de l’entreprise.
Une particularité de cette étude résulte du fait que la modélisation de la prime pure n’a pas été réalisée
selon une catégorie de sinistres, mais toutes garanties confondues, en intégrant la formule de souscription
comme un élément de modélisation. Les résultats montrent que cette dernière agit de façon
prépondérante dans l’établissement de la valeur contrat.
De manière générale, ces modèles mis en place s’écartent de la réalité pour des risques peu connus. Par
ailleurs, la valeur du contrat est évaluée en faisant abstraction des sinistres graves, leur intégration
consisterait probablement en une des pistes d’amélioration les plus notables. Le modèle en question
pourrait également être complexifié de part l’intégration de modèles de prédictifs pour d’autres facteurs,
ou par exemple la détention d’une formule de souscription deviendrait un évènement aléatoire à prédire
sur un horizon de temps à venir.
Un des avantages de ce mémoire est issu du fait de l’absence d’un modèle de ce type, ce qui a présenté
peu de contraintes techniques. Sous réserve de stabilité sur les années 2011, 2012 et 2013, ces modèles
seront implémentés dans un programme SAS déroulant la méthodologie de calcul de la valeur contrat
moto.
Cette étude s’inscrit dans un cadre novateur, dans la mesure où les indicateurs de rentabilité prospectifs
ne sont pas très utilisés en assurance non vie, et en particulier dans la branche automobile. Dans un
contexte où la concurrence au sein du marché de l’assurance moto devient de plus en plus importante, il
est essentiel de développer cette typologie d’outils de pilotage des portefeuilles. La valeur contrat trouve
son atout majeur dans l’évaluation de la rentabilité future des affaires nouvelles et peut, à terme, être une
alternative au S/C ou encore être intégrée comme facteur dans l’évaluation du tarif de l’assuré.
Bibliographie
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 90
Bibliographie
Ouvrages :
DENUIT M., CHARPENTIER A. [2004] Mathématiques de l’assurance non-vie, Tome I : Principes
fondamentaux de théorie du risque, Economica.
DENUIT M., CHARPENTIER A. [2005] Mathématiques de l’assurance non-vie, Tome II :Tarification et
Provisionnement, collection « Economie et statistiques avancées », Economica.
Cours :
CHARPENTIER A. [2010-2011] Statistiques de l’assurance, Université de Rennes 1 et Université de
Montréal.
MONBET V. [2011] Analyse de données, Université de Rennes 1.
JACQUES J. Modélisation statistique, Poly Tech Lille.
SURU A. [2013-2014] Principes de base de l’assurance dommage, Université Paris Dauphine.
Mémoires :
DA SILVA L. [2013] Refonte de la structure tarifaire de la garantie assistance en assurance automobile.
Mémoire de fin d’études, Axa France.
PASQUINELLI S. [2014] Prédiction de l’acte de résiliation, Mémoire de fin d’études, Axa France.
VANNEAUX JC. [2009] Modélisation de la valeur contrat pour le pilotage du portefeuille automobile
particulier. Mémoire IA, Axa France.
Sites internet et références :
http://www.ffsa.fr/sites/jcms/p1_1264960/fr/lassurance-des-deux-roues-a-moteur-en-2012?cc=fn_7355
site consulté le 29 septembre 2014
https://www.club14.com/association/presentation/partenariat-club-14-axa.html (produit moto d’AXA
France Club 14, Dates clé de l’entreprise), site consulté le 2 octobre 2014
http://support.sas.com/documentation/, (utilisation des procédures su le logiciel SAS) site consulté sur une
base hebdomadaire
http://www.institutdesactuaires.com/
Table des illustrations
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 91
Table des illustrations
Figures
Figure 1 Structure du parc deux roues à fin 2013. Source : FFSA ................................................................... 16
Figure 2 Schéma d’obtention de la valeur contrat .......................................................................................... 18
Figure 3 Structure de la base de données ....................................................................................................... 20
Figure 4 Création des images d’un contrat ..................................................................................................... 21
Figure 5 Exposition et prime pure par âge ...................................................................................................... 27
Figure 6 Exposition et prime pure par âge ...................................................................................................... 28
Figure 7 Exposition et prime pure par zone, (HG : Hors graves, YG : Y compris graves) ................................. 28
Figure 8 Exposition et prime pure par groupe (HG : Hors graves, YG : Y compris graves) .............................. 28
Figure 9 Un exemple de case tarifaire ............................................................................................................. 30
Figure 10 Hiérarchisation des niveaux de corrélation ..................................................................................... 30
Figure 11 Inertie ajustée sur les 10 premiers axes .......................................................................................... 34
Figure 12 Représentation des groupes d’individus sur les deux premiers axes ............................................. 35
Figure 13 Représentation des groupes d’individus sur le troisième axe ........................................................ 36
Figure 14 Résultats des tests d’adéquations des données en brut (rouge)pour la loi binomiale négative
(bleu) et la loi de poisson(vert) ....................................................................................................................... 37
Figure 15 Résultats des tests d’adéquations du coût moyen brut aux lois Gamma (vert) Log normale (rouge)
et Weibull (bleu) .............................................................................................................................................. 38
Figure 16 Résultats de la sélection « forward »pour le modèle de fréquence ............................................... 42
Figure 17 Résultats de la sélection « forward »pour le modèle de coût moyen............................................. 43
Figure 18 Résidus bruts du modèle de fréquence : à gauche, valeur obtenues par années police, à droite,
leurs distributions ............................................................................................................................................ 47
Figure 19 Test QQ plot sur l’échantillon des résidus centrés réduits .............................................................. 48
Figure 20 Boîte à moustache représentant ENS en fonction du nombre de sinistres par individu ................ 49
Figure 21 Distribution des résidus bruts et statistiques obtenues pour les résidus bruts sur la base de test 50
Figure 22 Boîte à moustache des ENS en fonction du nombre de sinistres par individu, et statistiques
obtenues .......................................................................................................................................................... 50
Figure 23Résultats des tests de rapport de vraisemblance par modalité du modèle de coût moyen ........... 52
Figure 24 Résidus bruts du modèle de coût moyen à gauche, et distribution des résidus relatifs à droite ... 52
Figure 25 Statistiques obtenues sur l’échantillon des résidus bruts et des résidus bruts relatifs .................. 53
Figure 26 Résultat du QQ plot sur l’échantillon de résidus bruts ................................................................... 53
Figure 27 Résidus bruts relatifs du modèle de coût moyen représentés en fonction du nombre de sinistres
par cases tarifaires. .......................................................................................................................................... 54
Figure 28 Résidus relatifs du modèle de coût moyeneprésentés en fonction du nombre de sinistres par
cases tarifaires sur la base de test ................................................................................................................... 55
Figure 29 représentés en fonction du nombre de sinistres par cases tarifaires (à gauche) et l’exposition
par cases tarifaires (à droite) sur la base d’apprentissage .............................................................................. 56
Figure 30 représentés en fonction du nombre de sinistres par cases tarifaires (à gauche) et l’exposition
par cases tarifaires (à droite) sur la base de test ............................................................................................ 56
Figure 31 Part des images et niveaux de prime commerciale par coefficient technique ............................... 60
Figure 32 Part des images et niveaux de prime commerciale par ancienneté de permis ............................. 60
Figure 33 Part des images et niveaux de prime commerciale par formule .................................................... 60
Table des illustrations
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 92
Figure 34 Tests d’adéquation de la prime commerciale aux lois de Weibull, Gamma, Lognormale et
Exponentielle sur l’échantillon segmenté par l’ensemble des variables ................ 63
Figure 35 Figure 28 : Tests d’adéquation de la prime commerciale à la loi Gamma sur l’échantillon
sur une segmentation plus fine que la figure 27 ..................................................... 63
Figure 36 Résultats de la sélection « forward » sur l’échantillon .......................... 64
Figure 37 Prime commerciale moyenne en fonction du groupe ..................................................................... 65
Figure 38 Prime commerciale moyenne en fonction de la zone ..................................................................... 65
Figure 39 Résidus bruts centré réduits du modèle de prime commerciale et test du QQ plot sur ces derniers
......................................................................................................................................................................... 67
Figure 40 des résidus bruts centrés réduits sur trois intervalles ]-∞,-2,5[; [-2,5,2,5] ;]2,5 ,+∞[ . ................. 68
Figure 41 Boite à moustaches représentant le nombre d’individus pas case en fonction des trois catégories
de résidus centrés réduits définies précédemment ........................................................................................ 68
Figure 42 Distribution des ( ) ........................................................................................................... 69
Figure 43 Les mêmes phénomènes sont constatés sur l’échantillon de test .................................................. 70
Figure 44 Distribution des ( )sur l’échantillon de test .................................................................... 70
Figure 45 Part des contrats et taux de résiliation par âge et par ancienneté de contrat ............................... 74
Figure 46 Part des contrats et taux de résiliation par sexe ............................................................................. 75
Figure 47 Part des contrats et taux de résiliation par région du contrat (région du risque) .......................... 75
Figure 48 Inertie ajustée sur les 10 premiers axes .......................................................................................... 77
Figure 49 Représentation des catégories d’individus sur le premier axe. ...................................................... 77
Figure 50 Résultats de la sélection « forward » pour le modèle de résiliation ............................................... 79
Figure 51 Egalisation de la sensibilité et spécificité du modèle ...................................................................... 81
Figure 52 Courbe Roc issue du modèle de résiliation ..................................................................................... 82
Figure 53 Odds ratios calculés pour la variable formule, modalité de référence RC+IV+TD .......................... 83
Figure 54 Odds ratios calculés pour la variable formule, modalité de référence 0,70 A 0,79 ........................ 84
Figure 55 Taux de résiliation observés et prédits sur la base de test à par fractionnement et formule ........ 85
Figure 56 Taux de résiliation observés et prédits sur la base de test à par âge et coefficient technique
formule ............................................................................................................................................................ 85
Figure 57 Taux de résiliation observés et prédits sur la base de test à par âge et coefficient technique ...... 85
Figure 58 Schéma d’obtention de la valeur contrat ........................................................................................ 86
Figure 59 Formule finale de la valeur contrat ................................................................................................. 87
Figure 60 Exposition et prime pure par sexe ................................................................................................... 95
Figure 61 Exposition et prime pure par segment marketing........................................................................... 95
Figure 62 Exposition et prime pure par ancienneté de permis ....................................................................... 96
Figure 63 Exposition et prime pure par antécédents (à gauche) et par expérience (à droite) ....................... 96
Figure 64 Exposition et prime pure par département du portefeuille (à gauche) et du risque (à droite) ...... 97
Figure 65 Exposition et prime pure par région du portefeuille (en haut) et du risque (en bas) .................... 97
Figure 66 Exposition et prime pure par genre de la moto ............................................................................. 98
Figure 67 Exposition et prime pure par cylindrée ........................................................................................... 98
Figure 68 Exposition et prime pure par ancienneté de la carte grise ............................................................. 98
Figure 69 Exposition et prime pure par ancienneté du véhicule .................................................................... 99
Figure 70 Exposition et prime pure par marque ............................................................................................. 99
Figure 71 Exposition et prime pure par contrôle technique et véhicule tout terrain ................................... 100
Figure 72 Exposition et prime pure par durée de détention du véhicule ..................................................... 100
Figure 73 Exposition et prime pure par type de roues .................................................................................. 101
Figure 74 Exposition et prime pure par type d’usage ................................................................................... 101
Table des illustrations
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 93
Figure 75 Exposition et prime pure par formule de souscription ................................................................. 101
Figure 76 Exposition et prime pure par type de fractionnement.................................................................. 102
Figure 77 Exposition et prime pure par ancienneté du contrat .................................................................... 102
Figure 78 Exposition et prime pure par coefficient technique ...................................................................... 103
Figure 79 Exposition et prime pure par réseau ............................................................................................. 103
Figure 80 Matrice des corrélations entre la prime pure et la variable du support ....................................... 104
Figure 81 Hiérarchisation des niveaux de corrélations ................................................................................. 104
Figure 82: Part des images et niveaux de prime commerciale par âge et par sexe ..................................... 112
Figure 83 Part des images et niveaux de prime commerciale par segment marketing et par
antécédents/expérience ................................................................................................................................ 112
Figure 84 Figure : Part des images et niveaux de prime commerciale par région du portefeuille et du risque
....................................................................................................................................................................... 112
Figure 85Part des images et niveaux de prime commerciale par zone et par marque ................................ 112
Figure 86 Part des images et niveaux de prime commerciale par genre et par groupe .............................. 113
Figure 87 Part des images et niveaux de prime commerciale par classe et par durée de détention .......... 113
Figure 88 Part des images et niveaux de prime commerciale par ancienneté du véhicule et de carte grise 113
Figure 89 Part des images et niveaux de prime commerciale par type d’usage et par type de fractionnement
....................................................................................................................................................................... 113
Figure 90: Part des images et niveaux de prime commerciale par réseau de distribution et par ancienneté
de contrat ...................................................................................................................................................... 114
Figure 91 Part des images et taux de résiliation par segment marketing et ancienneté de permis ............. 114
Figure 92 Part des images et taux de résiliation par antécédents/ expérience et région du portefeuille ... 114
Figure 93 Part des images et taux de résiliation zone et ancienneté de la carte grise ................................. 114
Figure 94 Part des images et taux de résiliation par marque et par classe du véhicule ............................... 115
Figure 95Part des images et taux de résiliation par genre et groupe du véhicule ........................................ 115
Figure 96 Part des images et taux de résiliation en fonction de la durée de détention du véhicule et de
l’ancienneté du véhicule ................................................................................................................................ 115
Figure 97Part des images et taux de résiliation en fonction de la cylindrée et l’usage du véhicule............. 115
Figure 98 Part des images et taux de résiliation en fonction du réseau de distribution et de la formule de
souscription ................................................................................................................................................... 116
Figure 99 Part des images et taux de résiliation en fonction du coefficient technique et du fractionnement
de la prime commerciale ............................................................................................................................... 116
Figure 100 Hiérarchisation des corrélations .................................................................................................. 117
Figure 101 Matrice de corrélations entre les facteurs pour la modélisation de la probabilité de résiliation117
Tableaux
Tableau 1: Récapitulatif des garanties proposées dans le produit moto. Source : www.club14.com............ 16
Tableau 2 Informations sur le risque ............................................................................................................... 23
Tableau 3 Pertes d’expositions lors d’une suppression des données non renseignées ................................. 24
Tableau 4 Support des variables après fiabilisation des données ................................................................... 24
Tableau 5 Support des variables après analyse uni variée de la prime pure .................................................. 29
Tableau 6 Bilan de l’étude des corrélations inter variables ............................................................................ 31
Tableau 7 Corrélations entre la prime pure et les variables du support ......................................................... 31
Tableau 8 Résultats des tests de significativité par analyse de la variance .................................................... 32
Table des illustrations
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 94
Tableau 9 Significativité de la variable « genre » sur les trois premiers axes ................................................. 34
Tableau 10 Bilan des variables significatives et thématiques des axes .......................................................... 36
Tableau 11 Résultats des tests de rapport de vraisemblance par variable du modèle de fréquence ............ 45
Tableau 12 Résultats des tests de rapport de vraisemblance par modalité du modèle de fréquence .......... 45
Tableau 13 Résultats des tests de rapport de vraisemblance par modalité du modèle de fréquence .......... 46
Tableau 14 Erreur brute totale pour le modèle de fréquence ........................................................................ 46
Tableau 15 Valeurs de la moyenne, écart type, Skewness et Kurtosis obtenus sur l’échantillon des résidus
centré réduits .................................................................................................................................................. 47
Tableau 16 Moyenne, variance et écart type sur l’échantillon des ENS ......................................................... 49
Tableau 17 Variables retenues pour segmenter et expliquer le coût moyen ................................................. 51
Tableau 18 Résultats des tests de rapport de vraisemblance par variable du modèle de coût moyen ......... 51
Tableau 19 Moyenne, variance et écart type sur l’échantillon des EC ........................................................... 54
Tableau 20 Support des variables candidates à la modélisation de la prime commerciale ........................... 59
Tableau 21 Corrélations entre la prime commerciale et les variables du support ......................................... 61
Tableau 22 Corrélations entre la prime pure et les variables du support....................................................... 61
Tableau 23 Mise en parallèle des résultats obtenus pour la sélection de facteurs pour la modélisation de la
prime pure et celle de la prime commerciale ................................................................................................ 64
Tableau 24 Variables retenues pour segmenter et expliquer la prime commerciale ..................................... 66
Tableau 25 Résultats des tests de rapport de vraisemblance par variable du modèle de prime commerciale
......................................................................................................................................................................... 66
Tableau 26 Résultats des tests de rapport de vraisemblance par modalité du modèle de prime commerciale
......................................................................................................................................................................... 66
Tableau 27 Erreur brute totale pour le modèle de prime commerciale ......................................................... 67
Tableau 28 Moyenne, écart type sur l’échantillon des ( ) ............................................................... 68
Tableau 29 Modalités de la variable nature de fin d’image ............................................................................ 73
Tableau 30 Structure des données dans la base de résiliation ....................................................................... 73
Tableau 31 Support des variables explicatives pour la modélisation de la probabilité de résiliation de chaque
assuré. ............................................................................................................................................................. 73
Tableau 32 Bilan de l’analyse uni variée pour la modélisation de la probabilité de résiliation ...................... 76
Tableau 33 Corrélations entre la variable R et le support ............................................................................... 76
Tableau 34 Récapitulatif du modèle de la valeur contrat ............................................................................... 86
Tableau 35 Coordonnées et contribution des modalités de l’analyse en composantes multiples ............... 107
Tableau 36 Coordonnées et contribution des modalités de l'ACM sur la résiliation .................................... 118
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 95
Annexes :
Annexe 1 : Résultats et interprétations du tri à plat pour la prime pure
Partie I, Paragraphe I.1
Les significations de chaque variable ont été décrites en partie 0 dans le paragraphe « Structure des
données ». Pour des raisons de confidentialités, les chiffres ne figurent pas sur les graphiques suivants.
Abréviations :
YG : Y compris graves / HG : Hors graves
Sexe :
Figure 60 Exposition et prime pure par sexe
Le sexe semble avoir une influence sur la prime pure.
Segment marketing :
Figure 61 Exposition et prime pure par segment marketing
Cette variable n’est pas renseignée pour l’intégralité de la base. Près de la moitié de l’exposition est
constituée de familles. Des niveaux de prime pure globalement différents sont obtenus d’un segment à
F H
Exposition et Prime pure par Sexe
Exposition
Prime Pure HG
Prime Pure YG
étu
dia
nts
jeu
ne
s C
SP-
jeu
ne
s C
SP+
dé
b c
arri
ère
(CSP
+)
age
mu
r (C
SP+
)
célib
atai
res
CSP
-
fam
ille
s C
SP-
agri
cult
eu
rs
arti
san
s/co
mm
erç
ants
pro
fess
ion
s lib
chô
me
urs
ren
tie
rs
sen
iors
re
trai
tés
sen
iors
4è
me
age NR
Exposition et Prime pure par Segment Marketing
Exposition
Prime pure HG
Prime Pure YG
Exposition et Prime pure par Segment Marketing: regroupé
Exposition
Prime Pure HG
Prime Pure YG
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 96
l’autre, ce dernier semble donc avoir une influence sur la prime pure. Les regroupements suivants ont été
effectués.
Jeunes (CSP- et +) : Etudiants, jeunes CSP+, jeunes CSP-
Début de carrière et âge mur
Célibataires et familles : Célibataires (CSP-), familles (CSP-)
Artisans, commerçants, Professions libérales, Agriculteurs
Inactifs : Chômeurs, Rentiers, Seniors (retraités, quatrième âge).
Ancienneté du permis :
Figure 62 Exposition et prime pure par ancienneté de permis
L’exposition augmente avec l’ancienneté du permis. La prime pure diminue avec cette dernière. Cela
s’explique par le fait que l’ancienneté du permis est aussi liée à l’âge du conducteur, par conséquent des
comportements similaires de la prime pure sont observés. Les trois premières tranches d’ancienneté sont
regroupées en une seule tranche : 0-3ans. L’ancienneté du permis parait discriminante.
Antécédents et expérience :
Figure 63 Exposition et prime pure par antécédents (à gauche) et par expérience (à droite)
La majorité des contrats possède de l’expérience et des antécédents. Il est logique que la prime pure soit
plus élevée pour les personnes sans expérience de conduite. Il en est de même pour les sans antécédents
qui de manière générale sont des populations jeunes. A vue d’œil, la prime pure semble varier de manière
significative d’un groupe à l’autre, ces deux variables seront donc retenues.
Départements du risque et du portefeuille :
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 97
Figure 64 Exposition et prime pure par département du portefeuille (à gauche) et du risque (à droite)
Ces deux variables ne seront pas retenues : elles ne peuvent pas être exploitées car vu le nombre élevé de
modalités, l’ensemble des modalités présentent trop peu d’exposition au risque.
Région du portefeuille et région du risque :
Figure 65 Exposition et prime pure par région du portefeuille (en haut) et du risque (en bas)
Les régions du portefeuille Natio et MSC sont regroupées avec AXA Part. Un pic de prime pure est observé
pour ces régions. Il est proche du niveau de prime pure en Ile de France. Concernant la région du risque,
un pic de prime pure est observé en Ile de France. Des niveaux de primes pure assez différents en fonction
des groupes sont obtenus pour les deux variables de régions.
Genre :
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 98
Figure 66 Exposition et prime pure par genre de la moto
Les regroupements suivants son fait en terme de proximité de prime pure et de genre.
les motos tout terrain (trial, cross, enduros, quads non immatriculés)
les quads immatriculés et les exotiques
les motos sportives, hyper sportives
les scooters et les scooters à 3 roues
les super motards et les trails.
Le genre apparait comme étant une variable discriminante.
Figure 67 Exposition et prime pure par cylindrée
La cylindrée témoignant de la puissance de la moto, il est cohérent d’avoir une prime pure croissante en
fonction de cette ci : la charge d’un sinistre s’accroit lorsque la cylindrée est grande. Cette variable apparait
comme étant discriminante.
Ancienneté de la carte grise :
Figure 68 Exposition et prime pure par ancienneté de la carte grise
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 99
La prime pure décroit avec l’ancienneté de la carte grise. Elle révèle un comportement de plus en plus
prudent du conducteur avec un véhicule dont la carte grise est de plus en plus ancienne.
Ancienneté du véhicule :
Figure 69 Exposition et prime pure par ancienneté du véhicule
La décroissance de la prime pure s’explique par le fait que la charge du sinistre est moins élevée sur les
vieilles motos. Un autre axe d’interprétation serait celui de la fréquence des sinistres : une personne qui
détient un vieux véhicule a moins de chances de s’en servir.
Marque du véhicule:
Figure 70 Exposition et prime pure par marque
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 100
De nombreuses modalités sont sous représentées. Des regroupements sont effectués en conciliant l’origine
de la marque ainsi que le niveau de prime pure engendré par celle-ci.
Kymko, Daelim et MBK : « autres asiatiques »
Peugeot, Triumph et KTM : regroupées avec « autres »
Aprilia, Piaggio et Ducati : « italiennes ».
La marque apparait comme étant discriminante.
Contrôle technique et véhicules tout terrain:
Figure 71 Exposition et prime pure par contrôle technique et véhicule tout terrain
La modalité « Oui » de ces deux variables n’est pas suffisamment représentée, aucun regroupement ne
peut être réalisé. Ces variables ne seront pas prises en compte dans la suite.
Durée de détention du véhicule :
Figure 72 Exposition et prime pure par durée de détention du véhicule
Rappel : Près d’un tiers de l’exposition possède une durée de détention de véhicule non renseignée. Ce
graphe est interprété sans prendre en compte les contrats ou la durée de détention concerne l’ancien
produit. La prime pure décroit avec la durée de détention vu que plus celle-ci augmente, plus le conducteur
est habitué à conduire son véhicule, ce qui limiterait sa probabilité d’avoir un sinistre.
Cette variable semble être discriminante. Cela dit, un warning doit être fait sur le fait que la durée de
détention n’est pas renseignée sur 28% de l’exposition, tous les résultats relatifs à cette variable obtenus
par la suite doivent être traités avec précaution.
Type de roues si le véhicule est un scooter :
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 101
Figure 73 Exposition et prime pure par type de roues
Parmi les scooters, le type de roue n’est renseigné que s’il s’agit d’un scooter ancien produit. Une trop
faible exposition des grandes roues peut être constatée, pour lesquelles aucun regroupement ne peut être
proposé, la variable ne sera pas prise en compte.
Usage :
Entre un usage privé et un usage pour le trajet du travail, la prime pure est plus élevée pour le trajet du
travail. (Comme le trajet du travail est quotidien, la fréquence des sinistres y est de manière générale plus
élevée). Les usages privés/professionnels et tournées sont regroupés dans la modalité « autres ».
Trois groupes distincts sont obtenus. L’usage apparait comme étant discriminant.
Figure 74 Exposition et prime pure par type d’usage
Formule :
Figure 75 Exposition et prime pure par formule de souscription
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 102
Plus le nombre de garanties souscrites augmente, plus la fréquence des sinistres par garantie est élevée, ce
qui explique la croissance des deux courbes. La formule apparait comme étant discriminante.
Rappel : Non prise en compte des formules RC+TD, RC+DC dans le périmètre.
Fractionnement :
Figure 76 Exposition et prime pure par type de fractionnement
Le fractionnement des cotisations pourrait témoigner d’un manque d’entretien du véhicule, ce qui
expliquerait que la prime pure pour le fractionnement annuel soit plus basse que pour les autres
fractionnements. Les fractionnements sont regroupés en deux catégories, annuel et autres.
Deux groupes paraissant distincts sont obtenus, le fractionnement est retenu.
Ancienneté du contrat :
Figure 77 Exposition et prime pure par ancienneté du contrat
La décroissance de cette courbe peut s’expliquer par le fait que l’ancienneté du contrat est liée à l’âge de
l’assuré. L’ancienneté moyenne des contrats de la population est de 4,5 ans. La variable semble
discriminante et sera retenue.
Coefficient technique :
Le Coefficient Technique reflète une sur ou sous tarification dans la mesure où il se définit comme le
rapport entre la prime commerciale payée par l’assuré et la prime issue de la tarification.
Ainsi, il y a sous tarification si CT<1, sur-tarification si CT>1.
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 103
Figure 78 Exposition et prime pure par coefficient technique
Un pic de prime pure est observé pour la classe ou l’on n’est ni sur tarifé ni sous tarifé (CT=1). Les tranches
qui ont un CT strictement inférieur à 0.50 et un CT compris entre 0,50 et 0,69 sont regroupées. Le CT
semble être discriminant.
Réseau :
Run Service et Direct Assurance étant des courtiers, ils sont regroupés avec les courtiers. Les réseaux
salariés, Michelin et Natio sont regroupés en une seule modalité. Les groupes obtenus se distinguent peu
par leur niveau de prime pure. La variable réseau n’apparait pas comme étant discriminante.
Figure 79 Exposition et prime pure par réseau
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 104
Annexe 2 : Matrice des corrélations entre les variables du support et la prime pure
.
Partie 1, Paragraphe I.2
Figure 80 Matrice des corrélations entre la prime pure et la variable du support
Figure 81 Hiérarchisation des niveaux de corrélations
i age sexe seg_mkt acp anccg ant exp region regionrisquezone marque genre groupe classe cylindree ddv acv usage formule fractionnementancc ct
age 100%
sexe 10% 100%
seg_mkt 65% 5% 100%
acp 75% 9% 48% 100%
anccg 25% 3% 18% 31% 100%
ant 27% 2% 15% 29% 37% 100%
exp 24% 0% 14% 31% 44% 62% 100%
region 10% 1% 18% 11% 5% 3% 3% 100%
regionrisque 10% 1% 23% 10% 7% 4% 3% 85% 100%
zone 9% 2% 21% 7% 9% 4% 4% 51% 61% 100%
marque 24% 8% 21% 26% 17% 9% 8% 15% 19% 23% 100%
genre 34% 15% 29% 38% 26% 17% 16% 26% 32% 42% 73% 100%
groupe 21% 15% 18% 36% 22% 21% 20% 22% 27% 38% 68% 86% 100%
classe 24% 16% 17% 25% 15% 14% 16% 15% 18% 27% 61% 80% 83% 100%
cylindree 24% 14% 22% 36% 12% 20% 21% 14% 16% 23% 56% 71% 78% 72% 100%
ddv 31% 4% 22% 35% 83% 53% 49% 5% 6% 9% 17% 27% 26% 21% 18% 100%
acv 10% 5% 14% 14% 72% 11% 17% 11% 15% 17% 35% 50% 42% 36% 24% 54% 100%
usage 15% 4% 29% 14% 4% 5% 3% 16% 19% 21% 21% 34% 31% 18% 19% 5% 12% 100%
formule 17% 5% 12% 9% 18% 11% 7% 9% 10% 8% 27% 40% 37% 29% 27% 15% 43% 15% 100%
fractionnement 25% 3% 22% 24% 14% 7% 8% 7% 4% 5% 12% 19% 15% 11% 11% 16% 5% 14% 11% 100%
ancc 30% 5% 23% 32% 79% 45% 42% 4% 4% 6% 15% 22% 18% 14% 16% 75% 46% 8% 9% 13% 100%
ct 13% 4% 11% 15% 36% 21% 22% 10% 9% 9% 9% 19% 19% 17% 14% 40% 16% 6% 9% 6% 47% 100%
Légende
0% 25% 50% 70% 1
indépendant peu corrélé corrélé dépendant
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 105
Annexe 3 : Coordonnées et contribution des modalités de l’ACM sur la sinistralité
Partie 1, paragraphe I.4.
En rose : modalités significatives sur l’axe 1
En violet : modalités significatives sur l’axe 2
En jaune: modalités significatives sur l’axe 3
Inertie moyenne 0,01149 Coordonnées sur les axes Contributions aux axes
Variable Modalité Dim1 Dim2 Dim3 Contr1 Contr2 Contr3
Sexe F 1% -0,132 -0,109 -0,088 0,000 0,000 0,000
H 0% 0,014 0,012 0,009 0,000 0,000 0,000
Segment marketing Dcarr+Agemur 1% -0,109 -0,582 0,058 0,000 0,010 0,000
NR 1% -0,665 -0,626 0,237 0,005 0,005 0,001
agr+art+com+plib 1% 0,066 -0,018 0,328 0,000 0,000 0,006
cel+fam 1% 0,181 0,027 -0,074 0,005 0,000 0,001
inactif 1% 0,072 -0,299 0,557 0,000 0,002 0,008
jeunes 1% -0,705 0,851 -0,619 0,014 0,025 0,014
Anc. permis acp0-4 1% -0,804 0,697 -0,834 0,021 0,019 0,030
acp+20 1% 0,197 -0,213 0,401 0,005 0,006 0,025
acp10-19 1% 0,090 -0,100 -0,063 0,001 0,001 0,000
acp5-9 1% -0,115 0,289 -0,425 0,000 0,004 0,008
Anc. carte grise anccg+8 1% 1,291 -0,250 0,029 0,055 0,003 0,000
anccg1-3 1% -0,295 -0,040 -0,037 0,009 0,000 0,000
anccg4-7 1% 0,700 -0,287 0,344 0,029 0,006 0,009
anccg<1 1% -0,801 0,439 -0,261 0,043 0,016 0,006
Ant/Exp Avec-avec 0% 0,112 -0,111 0,059 0,003 0,004 0,001
Avec-sans 1% -0,741 0,524 -1,239 0,005 0,003 0,018
Sans-sans 1% -1,231 1,318 -0,200 0,025 0,035 0,001
Région Portefeuille Autres RP 1% -0,397 -0,814 -0,058 0,000 0,003 0,000
IDF RP 1% -0,476 -1,068 -0,061 0,006 0,038 0,000
NordEst RP 1% 0,266 0,490 -0,140 0,004 0,016 0,001
Ouest RP 1% 0,138 0,360 -0,379 0,001 0,011 0,013
SudEst RP 1% -0,240 -0,465 0,344 0,004 0,019 0,011
SudOuest RP 1% 0,175 0,318 0,288 0,001 0,005 0,004
Région Risque IdF RR 1% -0,535 -1,090 -0,130 0,011 0,055 0,001
NordEst RR 1% 0,308 0,582 -0,139 0,005 0,021 0,001
Ouest RR 1% 0,267 0,551 -0,418 0,004 0,021 0,013
SO/EOM RR 1% 0,164 0,279 0,285 0,001 0,004 0,005
SudEst RR 1% -0,239 -0,430 0,321 0,004 0,017 0,010
Zone z1-3 1% 0,294 0,636 -0,039 0,006 0,034 0,000
z10-13 1% -0,662 -1,172 0,143 0,017 0,067 0,001
z4-6 1% 0,188 0,305 -0,018 0,003 0,011 0,000
z7-9 1% -0,197 -0,434 -0,022 0,002 0,014 0,000
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 106
Marque Autres 1% -0,549 0,582 1,127 0,013 0,018 0,073
Autres asiat 1% -0,390 -0,136 1,034 0,002 0,000 0,018
BMW 1% 0,402 -0,203 -0,678 0,002 0,001 0,008
HarleyDavidson 1% 0,225 -0,495 -0,385 0,001 0,004 0,003
italiennes 1% -0,841 -1,221 0,033 0,015 0,040 0,000
japonaises 1% 0,247 0,079 -0,310 0,010 0,001 0,020
Groupe 30/31 1% 0,925 0,050 0,312 0,037 0,000 0,006
32/34 1% -0,549 -0,660 -0,040 0,028 0,050 0,000
356 1% 0,379 0,061 -0,487 0,009 0,000 0,020
37-39 1% 0,118 0,463 -1,010 0,001 0,009 0,049
<=6 1% -0,604 1,409 2,034 0,010 0,068 0,153
Genre BAS 1% 0,340 0,199 -0,155 0,002 0,001 0,001
CUS 1% 0,583 -0,228 -0,120 0,012 0,002 0,001
GTO 1% 0,452 -0,072 -0,811 0,002 0,000 0,010
QUA IM/EXO 1% -0,661 1,426 2,017 0,008 0,046 0,101
ROA 1% -0,301 0,352 -0,911 0,004 0,007 0,050
ROU 1% 0,751 0,027 -0,366 0,006 0,000 0,002
SCO 1% -0,969 -1,190 0,301 0,049 0,090 0,006
SPO/SMO/HY 1% 0,370 0,574 -0,985 0,002 0,007 0,022
TRA/SMO 1% 0,789 0,020 0,124 0,026 0,000 0,001
TT 1% -0,423 1,295 2,006 0,002 0,020 0,053
Classe J 1% 0,904 0,091 0,232 0,045 0,001 0,004
M 1% -0,426 -0,114 0,128 0,027 0,002 0,003
P 1% 0,229 0,199 -0,527 0,003 0,003 0,022
Durée de détention NR 1% 0,943 -0,295 0,405 0,059 0,007 0,014
ddv0-3 1% -0,613 0,226 -0,148 0,053 0,009 0,004
ddv10+ 1% 0,977 -0,167 -0,161 0,010 0,000 0,000
ddv4-5 1% 0,138 -0,248 -0,045 0,000 0,002 0,000
ddv6-9 1% 0,514 -0,243 -0,152 0,005 0,001 0,001
Anc. véhicule acv+20 1% 0,969 0,098 0,143 0,022 0,000 0,001
acv1-3 1% -0,759 -0,104 0,082 0,033 0,001 0,001
acv10-19 1% 0,622 0,083 -0,245 0,028 0,001 0,006
acv4-9 1% -0,062 -0,054 0,123 0,000 0,000 0,002
acv<1 1% -1,157 0,150 -0,076 0,022 0,000 0,000
Usage autres:Pri-Pro/tour 1% -0,749 -1,489 0,118 0,005 0,026 0,000
prive 1% 0,012 0,306 0,368 0,000 0,014 0,022
trajet-travail 1% 0,042 -0,171 -0,340 0,000 0,005 0,020
Formule RC 1% 0,224 0,176 0,444 0,005 0,004 0,024
RC+IV 1% 0,214 0,237 -0,283 0,001 0,002 0,003
RC+IV+DC 1% -0,421 0,309 0,479 0,005 0,003 0,008
RC+IV+TD 1% -0,141 -0,280 -0,400 0,002 0,011 0,024
Fractionnement Annuel 1% 0,130 -0,074 0,267 0,003 0,001 0,015
Autres 1% -0,201 0,115 -0,412 0,004 0,002 0,023
Anc. du contrat ancc1-3 1% -0,305 0,034 -0,083 0,010 0,000 0,001
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 107
ancc14+ 1% 1,025 -0,455 0,011 0,009 0,002 0,000
ancc4-8 1% 0,623 -0,273 0,291 0,028 0,007 0,008
ancc9-13 1% 0,978 -0,362 -0,059 0,022 0,004 0,000
ancc<1 1% -0,864 0,556 -0,219 0,038 0,020 0,003
Coefficient technique +1.10 1% 0,399 -0,538 0,011 0,008 0,019 0,000
0.90-0.99 1% 0,175 -0,121 0,044 0,001 0,001 0,000
1.00 1% -0,550 0,295 0,055 0,005 0,002 0,000
1.01-1.10 1% 0,413 -0,258 0,231 0,005 0,002 0,002
<=0.89 1% -0,217 0,258 -0,068 0,006 0,011 0,001
Sinistré 0 0,011 0,008 0,006
1 -0,626 -0,448 -0,328
Tableau 35 Coordonnées et contribution des modalités de l’analyse en composantes multiples
Annexe 4 : Procédure itérative de Newton Raphson
Partie 1, II.1 Choix de l’approche et application de la théorie des modèles linéaires généralisés
Rappel : β=(
) est solution des équations de vraisemblance si et seulement si
( ( ) )
∑
( )
( )
Ces équations ne sont pas linéaires en et sont résolues par procédure itérative de Newton-Raphson dont
l’algorithme est le suivant.
Initialisation : =
Faire tant que ‖ ‖
Calcul du gradient de la log-vraisemblance ( ( ) )
Calcul de la Hessienne ( ) de la log-vraisemblance
Détermination de la valeur de
( ( ) )
( )
Fin tant que.
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 108
Annexe 5 : Pseudo Code de l’algorithme de sélection -segmentation
Forward : Macro réalisant une sélection « Forward » pour un modèle de fréquence [hors sinistres graves] selon le
critère AIC. Cette procédure a été adaptée afin d’être réutilisée pour les explications du coût moyen, de la prime
commerciale, ainsi que l’acte de résiliation. Elle fait appel à la procédure « Genmod » de SAS ainsi qu’à une macro
exclusion, décrites ci-dessous.
Macro Genmod : Résumé du principe de la procédure « Genmod »
Genmod (base, réponse, modèle, loi, lien)
Modèle: liste des variables explicatives
Réponse : variable à expliquer
Loi : Loi de la variable réponse
Lien : Fonction de lien utilisée dans le GLM
Cette procédure calcule également l’AIC du modèle en question.
Macro Exclusion : Elle exclut un mot d’une liste de variables
Exclusion (liste , mot, nb_variable)
Entrée :
Liste : liste de mot
Mot : le mot à exclure
Nb_ variable : nombre de mots dans la liste
Sortie : Liste _nouvelle
Exclusion (liste, mot, nb_variable) /*Repérage de l’indice du mot à supprimer*/
Pour j allant de 1 à nb_variable faire
Si j-ème élément de la liste = mot faire
indice j
fin si
Fin pour /*Initialisation */
Liste_nouvelle vide
/*3 cas : mot en début, milieu ou fin de liste*/
Si (indice =1 ) faire
Pour k allant de 2 à Nb_variable faire
Liste_nouvelleListe_nouvelle + k-ème élément de la liste
Fin pour
Sinon si (indice=nb_variable) faire
Pour k allant de 1 à (Nb_variable-1 )faire
Liste_nouvelleListe_nouvelle + k-ème élément de la liste
Fin pour
Sinon
Liste_nouvelle1 vide
Liste_nouvelle2 vide
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 109
Pour k allant de 1 à (indice-1) faire
Liste_nouvelle1 Liste_nouvelle1 + k-ème élément de la liste
Fin pour
Pour k allant de 1 à (indice+1) faire
Liste_nouvelle2Liste_nouvelle2 + k-ème élément de la liste
Fin pour
Liste_nouvelle Liste_nouvelle1 +Liste_nouvelle2
Fin si
Retourner Liste_nouvelle
Fin
Forward (base, liste, nbvar, loi, lien)
Entrée :
Base : base dans laquelle se trouve la variable fréquence (hors graves) ainsi que l’ensemble des variables
explicatives.
Liste : Liste des variables qui feront l’objet de la sélection
Nbvar : Nombre de variables dans la liste
Loi : Loi choisie pour la prime pure [hors graves]
Lien : Fonction de lien utilisée dans le GLM
Sortie : Table « résumé » dans laquelle figurent, les modèles sélectionnés à chaque étape et la valeur de l’AIC leur
correspondant.
Forward (base, liste, nbvar,loi, lien)
Calcul de la valeur de l’ « intercept »
Résumé Valeur de l’ « intercept »
Liste_nouvelle Liste
Modèle Vide
Pour k allant de 1 à Nbvar faire ;
Nbvar_listenouvelle Nbvar-k+1 /*nombre de variables de la liste de départ qui ne font pas encore partie du modèle*/
Pour p allant de 1 à Nbvar_liste nouvelle faire ;
Genmod (base, PrimePure HG, modèle+ p-ème élément de liste_nouvelle,
loi, lien)
Récupération de l’AIC de « modèle +pème » élément de la liste nouvelle
Fin pour
Création de la table AIC_ EtapeK /*AIC_Etape K : table qui contient les AIC de tous les modèles obtenus dans la boucle précédente*/
Calcul de l’AIC minimal dans la table AIC_ EtapeKEtapeK
Variable_ajoutee Variable dont l’ajout au modèle engendre l’AIC minimal
ModèleVariable_ajoutee
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 110
Liste_nouvelle_tempListe_nouvelle
Liste_nouvelleExclusion (Liste_nouvelle_temp, variable_ajoutee,
Nbvar_listenouvelle)
RésuméRésumé + AIC_étape_k ;
Fin pour.
Fin.
Annexe 6 : Code SAS de la procédure « Genmod » pour les modèles de fréquence et coût moyen
Le calcul des coefficients est réalisé grâce au logiciel SAS (procédure « Genmod). Le code correspondant ainsi que les
explications de ce dernier figurent en annexe 6.
Modèle de fréquence :
%let modele =zone formule anccg groupe acp;
Procgenmod data=dataF order=data ;
Class&modele ;
ModelnbsinHG = &modele / offset=log_AP
dist=poisson
link=log
Predicted= nbsinHG_Pred
Resraw=nbsinHG_residus
Outputout= frequenceHG_Pred
;
run;
Quelques explications concernant ce code :
Offset=log_AP: Ajout du logarithme de l’année police à la combinaison linéaire des coefficients.
Dist = poisson : Emission de l’hypothèse que le nombre de sinistres suit une loi de Poisson.
Link=log : Choix du lien logarithmique
Predicted= nbsinHG_Pred Calcul des valeurs prédites du nombre de sinistres par case. Ce dernier est
obtenu en inversant par la formule énoncée ci-dessus.
( ( ) ∑
)
( ∑
)
Resraw=nbsinHG_residus : Calcul des résidus bruts, différence entre le nombre de sinistres observé et le
nombre de sinistres prédits.
Class &modele : Déclaration des variables qualitatives.
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 111
Model nbsinHG = &modele Demande à ce que la régression ( ) ( ) ∑ soit
réalisée.
Modèle de coût moyen :
%let modele= classe formule;
Procgenmod data=dataC order=data ;
Class&modele;
model CMHG= &modele/dist=gamma link=log type3;
weightnbsinHG;
ODSOUTPUTParameterEstimates = cmhg_Param
Type3 = cmhg_Var
Modelfit = cmhg_InfoModele;
outputout= cmhg_PredPredicted= cmhg_Predresraw=cmhg_residus ;
run;
Quelques explications concernant ce code :
Dist = gamma: Emission de l’hypothèse que le coût moyen suit une loi gamma.
Link=log : Choix du lien logarithmique
Class &modele : Déclaration des variables qualitatives.
Model CMHG= &modele Demande à ce que la
régression ( ) ∑
soit réalisée.
Weight nbsinHG: Pondération des observations de coût moyen par le nombre de sinistres à partir desquels
elles ont été calculées.
Predicted= cmhg_PredCalcul des valeurs prédites du coût moyen par case. Ce dernier est obtenu en inversant
par la formule énoncée ci-dessus.
( ∑
)
Resraw=cmhg _residus : Calcul des résidus bruts, différence entre le coût moyen observé et le coût moyen
prédit.
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 112
Annexe 7 : Résultats du tri à plat pour la prime commerciale
Partie 2, I.1, Analyse uni variée.
La prime commerciale moyenne reversée par la catégorie d’assurés figure en rouge, en bleu est représentée la part
des images associée à la modalité en question.
Figure 82: Part des images et niveaux de prime commerciale par âge et par sexe
Figure 83 Part des images et niveaux de prime commerciale par segment marketing et par antécédents/expérience
Figure 84 Figure : Part des images et niveaux de prime commerciale par région du portefeuille et du risque
Figure 85Part des images et niveaux de prime commerciale par zone et par marque
<25ans <30ans <35ans <40ans <50ans 50ans et +
Âge
Part des images
Prime commerciale moyenne
F H
Sexe
Part des images
Prime commerciale moyenne
Segment Marketing
Part des images
Prime commerciale moyenne
Autres IDF NordEst Ouest SudEst SudOuest
Région du portefeuille
Part des images
Prime commerciale moyenne
IdF NordEst Ouest Sud Ouest SudEst
Région du risque
Part des images
Prime commerciale moyenne
Zone
Part des images
Prime commerciale moyenne
Marque
Part des images
Prime commerciale moyenne
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 113
Figure 86 Part des images et niveaux de prime commerciale par genre et par groupe
Figure 87 Part des images et niveaux de prime commerciale par classe et par durée de détention
Figure 88 Part des images et niveaux de prime commerciale par ancienneté du véhicule et de carte grise
Figure 89 Part des images et niveaux de prime commerciale par type d’usage et par type de fractionnement
Genre
Part des images
Prime commerciale moyenne
<=6 30 31 32 33 34-35 36 37 38,39Groupe
Part des images
Prime commerciale moyenne
Durée de détention du véhicule
Part des images
Prime commerciale moyenne
Ancienneté du véhicule
Part des images
Prime commerciale moyenne
Ancienneté de la carte grise
Part des images
Prime commerciale moyenne
autres:Pri-Pro/tour prive trajet-travail
Usage du véhicule
Part des images
Prime commerciale moyenne
Annuel Autres
Fractionnement
Part des images
Prime commerciale moyenne
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 114
Figure 90: Part des images et niveaux de prime commerciale par réseau de distribution et par ancienneté de contrat
Annexe 8 : Résultat du tri à plat pour la probabilité de résiliation Pour une catégorie d’individus donnée, le taux de résiliation de cette dernière est donné par
En rouge apparait le taux de résiliation, en vert le taux de résiliation global sur la base, en bleu la part des contrats
associée à cette catégorie.
Figure 91 Part des images et taux de résiliation par segment marketing et ancienneté de permis
Figure 92 Part des images et taux de résiliation par antécédents/ expérience et région du portefeuille
Figure 93 Part des images et taux de résiliation zone et ancienneté de la carte grise
Segment Marketing
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Ancienneté du permis
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Avec-avec Avec-sans Sans-sans
Antécédents / Expérience
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Autres IDF NordEst Ouest SudEst SudOuest
Région du portefeuille
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Zone
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Ancienneté de la carte grise
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 115
Figure 94 Part des images et taux de résiliation par marque et par classe du véhicule
Figure 95Part des images et taux de résiliation par genre et groupe du véhicule
Figure 96 Part des images et taux de résiliation en fonction de la durée de détention du véhicule et de l’ancienneté du véhicule
Figure 97Part des images et taux de résiliation en fonction de la cylindrée et l’usage du véhicule
Marque
Part de contrats
Taux de résiliation
Taux de résiliation moyen
J K L M N O P Q R
Classe
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Genre du véhicule
Part de contrats
Taux de résiliation
Taux de résiliation moyen
<=6 30 31 32 33 34 35 36 37 38,39Groupe
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Durée de détention du véhicule
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Ancienneté du véhicule
Part de contrats
Taux de résiliation
Taux de résiliation moyen
<125 125 126-500 501-750 +750
Cylindree
Part de contrats
Taux de résiliation
Taux de résiliation moyen
autres:Pri-Pro/tour prive trajet-travail
Usage du véhicule
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 116
Figure 98 Part des images et taux de résiliation en fonction du réseau de distribution et de la formule de souscription
Figure 99 Part des images et taux de résiliation en fonction du coefficient technique et du fractionnement de la prime commerciale
Réseau
Part de contrats
Taux de résiliation
Taux de résiliation moyen
RC RC+IV RC+IV+DC RC+IV+TD
Formule
Part de contrats
Taux de résiliation
Taux de résiliation moyen
0%
5%
10%
15%
20%
25%
moins de 0.69
0.70 A 0.79
0.80 A 0.89
0.90 A 0.94
0.95 A 0.99
1.00 1.01 A 1.05
1.06 A 1.10
PLUS DE 1.10
Coefficient technique
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Annuel Autres
Fractionnement
Part de contrats
Taux de résiliation
Taux de résiliation moyen
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 117
Annexe 9 : Matrice de corrélation entre les facteurs du support de la probabilité de résiliation
Figure 100 Hiérarchisation des corrélations
Figure 101 Matrice de corrélations entre les facteurs pour la modélisation de la probabilité de résiliation
peu corrélé ,indépendantmoyennement corrélécorrélétres corrélé
i reseau age sexe seg_mkt acp anccg ant exp region ptf regionrisque zone marque genre groupe classe cylindree ddv acv usage formule fractionnement ancc ctreseau 100%age 4% 100%sexe 1% 9% 100%seg_mkt 32% 64% 5% 100%acp 2% 75% 9% 49% 100%anccg 6% 26% 2% 19% 31% 100%ant 2% 31% 3% 17% 33% 41% 100%exp 2% 29% 1% 17% 35% 45% 64% 100%region ptf 34% 10% 1% 18% 10% 5% 4% 3% 100%regionrisque 21% 10% 1% 23% 10% 7% 5% 4% 85% 100%zone 22% 9% 2% 21% 6% 9% 6% 5% 51% 61% 100%marque 8% 24% 8% 21% 26% 18% 11% 10% 15% 19% 24% 100%genre 16% 33% 15% 29% 37% 27% 22% 20% 26% 32% 42% 73% 100%groupe 15% 21% 14% 19% 36% 23% 27% 26% 22% 27% 38% 68% 86% 100%classe 10% 24% 15% 17% 25% 15% 17% 18% 14% 18% 27% 61% 80% 83% 100%cylindree 10% 25% 14% 22% 36% 13% 26% 27% 14% 16% 23% 56% 71% 78% 72% 100%ddv 6% 32% 5% 23% 35% 80% 55% 50% 5% 6% 9% 18% 28% 28% 23% 21% 100%acv 6% 11% 5% 15% 15% 72% 12% 16% 11% 14% 17% 36% 50% 42% 36% 25% 50% 100%usage 8% 15% 4% 28% 14% 5% 7% 5% 16% 18% 21% 21% 34% 31% 19% 20% 5% 12% 100%formule 1% 18% 5% 12% 9% 18% 13% 9% 9% 10% 8% 26% 41% 37% 29% 27% 16% 43% 15% 100%fractionnement 6% 25% 3% 22% 25% 15% 9% 9% 7% 4% 5% 11% 18% 14% 11% 11% 17% 5% 14% 11% 100%ancc 10% 30% 5% 23% 31% 81% 43% 42% 5% 4% 7% 16% 23% 20% 15% 17% 73% 46% 10% 10% 14% 100%ct 14% 15% 4% 15% 17% 41% 23% 24% 12% 9% 9% 11% 19% 20% 16% 15% 44% 18% 7% 10% 7% 52% 100%
Annexes
Houda Afailal - Mémoire d’actuariat - Université Paris Dauphine Modélisation de la valeur contrat pour le pilotage du portefeuille moto DM IARD Actuariat Moto Avril - Septembre 2014 Page 118
Annexe 10 : Coordonnées et contribution des modalités de l’ACM sur la résiliation Partie 3, section II.4
En rose apparaissent les contributions des modalités des variables significatives sur l’axe 1.
Inertie Moyenne 0,013 Coordonnées sur les axes
Contributions aux axes
variable Modalités des facteurs Inertie Dim1 Contr1
Âge <25ans 0,0170082 -1,309829563 0,021243
<30ans 0,0163524 -0,827668414 0,015035
Acp acp+20 0,0100008 0,314364869 0,011324
acp0-4 0,0155421 -1,015649719 0,034832
anccg anccg0-3 0,0059914 -0,515203126 0,045939
anccg4-7 0,0140914 0,813994039 0,036393
anccg8-10 0,0156315 1,369506365 0,060885
antécédents/ expérience Avec-sans 0,0172488 -0,633798957 0,003564
Sans-sans 0,0160827 -1,215212107 0,038221
marque Autres 0,0148314 -0,640210935 0,018089
Autres asiat 0,0169531 -0,359721266 0,001706
genre CUS 0,0155351 0,708895793 0,01702
QUA IM/EXO 0,0165127 -0,935902487 0,017177
ROA 0,014888 -0,399747236 0,00692
SCO 0,0143129 -0,657438565 0,022344
TRA/SMO 0,0149577 0,723256135 0,022122
TT 0,0171709 -0,649693177 0,004225
groupe 30-31 0,0148157 0,84892192 0,03197
34-36 0,011805 0,102113023 0,00092
37-39 0,0155466 0,047438664 7,58E-05
<=6 0,0158792 -0,869662725 0,02182
classe j à l 0,0140441 0,795997353 0,035239
m à o 0,0077132 -0,402769349 0,024002
p à r 0,013957 0,269336213 0,004127
durée de détention du véhicule NR 0,0130808 0,991206215 0,068447
ddv+8 0,0167177 0,94766248 0,014925
ddv0-3 0,007979 -0,655327517 0,061876
acv acv0-3 0,0126694 -0,766592931 0,044466
acv10-19 0,0128669 0,567247679 0,02342
acv20-39 0,0162465 0,887350124 0,018498
usage prive 0,009692 -0,050959695 0,000309
trajet-travail 0,0087913 0,064911694 0,000557
formule RC 0,0114678 0,144474041 0,001945
RC+IV+TD 0,0103172 -0,033919664 0,000127
fractionnement Annuel 0,0069654 0,172497341 0,004727
Autres 0,0108917 -0,269729941 0,007392
ancienneté du contrat ancc0-3 0,0062713 -0,502563628 0,042681
ancc4-8 0,0135244 0,816141267 0,042094
ancc9-13 0,0164651 1,150383258 0,02687
PLUS DE 1.10 0,0147305 0,631453118 0,018184
ct moins de 0.79 0,0109143 -0,363982329 0,013416
non 0,011 0,036980025
oui
-0,192119159
Tableau 36 Coordonnées et contribution des modalités de l'ACM sur la résiliation