130
Sinistralité en assurance santé : modélisation, estimation et application 29/11/12 Mémoire d’actuaire Rongcheng GU 1

Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Embed Size (px)

Citation preview

Page 1: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Sinistralité en assurance santé :modélisation, estimation et application

29/11/12

Mémoire d’actuaire

Rongcheng GU

1

Page 2: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 3: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Résumé

Mots clés : assurance santé, assurance non vie, modèles de la sinistralité, chaîne deMarkov, densité mélange, régression logistique, Panjer, distribution de la charge sinistres.

Ce mémoire a été effectué pendant la restructuration de l’entreprise et parti-culièrement, pour renforcer le pilotage technique de la couverture du risque santéde l’entreprise.

Pendant longtemps, les techniques de projection de la charge sinistres et latarification en assurance santé sont limitées dans le domaine de la statistique des-criptive et l’analyse de régression. L’objectif du mémoire consiste dans un premiertemps à enrichir la boîte à outils de modélisation en établissant formellement unlien entre le fondement technique de l’assurance santé et les modèles de base del’assurance non vie, où de nombreuses techniques pour appréhender l’évolution dusinistre ont été développées.

En dehors de l’application, nous tentons également l’innovation. Afin de ré-pondre aux besoins techniques en gestion des risques santé, parmi les solutionstrouvées, nous pouvons citer non-exhaustivement : adaptation du modèle indivi-duel selon les garanties santé, modélisation markovienne fournissant une meilleureappréhension du risque d’hospitalisation, calibration d’une distribution bimodalepar la densité mélange selon le critère d’Anderson-Darling, modèles alternatifs in-terprétant le taux d’achat, expressions fermées des caractéristiques importantes dela charge sinistres grâce à une modélisation à trois composantes etc.

L’esprit de modélisation et la volonté constante pour améliorer les solutions auxproblématiques actuarielles nous ont guidé tout au long de ces travaux. Nous ten-tons de proposer des approches alternatives et de les confronter avec des méthodesclassiques sur des plans divers.

Le fait de modéliser en soi par des techniques mathématiques poussées peutêtre remis en cause. Les contraintes et hypothèses impliquées par la modélisationferont l’objet de discussions, d’autocritiques et éventuellement de préconisationd’amélioration.

3

Page 4: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 5: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Abstract

Keywords: health insurance, non-life insurance, loss models, Markov chain, mixturedensity, logistic regression, Panjer, loss distribution.

This work has been done during the restructuring of the company and partic-ularly, with the purpose of strengthening the technical management of its HealthRisk.

For years, the methods of claim projection and rating in health insurance havebeen constrained in the field of descriptive statistics and regression analysis. Theaim of this work is initially to enrich the modeling toolbox by formally establishinga link between the technical basis of health insurance and base loss models of non-life insurance, where many techniques for appreciating the claim evolution havebeen developed.

In addition to application, we are trying to innovate as well. In order to meetthe technical needs in health risk management, among the solutions found, we cancite non-exhaustively: adaptation of the individual model according to the cov-erage of a medical procedure, markovian modeling that provides a better under-standing of the risk of hospitalization, calibration of the bimodal random expensesby the mixture model according to the criterion of Anderson-Darling, alternativemodels interpreting the purchasing rate, closed expressions of important featuresof the loss distribution through a three-component modeling etc.

The spirit of modeling and the constant will for a better solution have guidedus throughout our work. Thus, for each actuarial problem encountered, we try toprovide alternative approaches and compare different methods on various plans.

The fact of modeling in itself by advanced mathematical techniques can bequestioned. Constraints and assumptions involved in the methodology will bediscussed and possible suggestions for improvement will be given.

5

Page 6: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 7: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Remerciement

Ce mémoire a été effectuée pendant ma mission au sein du Groupe Humanis(issu de la fusion du Groupe Novalis Taitbout et Humanis). J’y ai bénéficié deconditions de recherches exceptionnelles pour lesquels je tiens à remercier mesresponsables Mesdames C. SOULARD et E. DECOLLONGE.

Je tiens à manifester ma profonde reconnaissance à Monsieur A. BIENVENÜEqui m’a guidé dans ce travail avec toute la compétence et la gentillesse qu’on luiconnaît. J’ai également bénéficié pendant ces derniers mois de précieux conseils deMonsieur M. BOUTCHICHE. Chargé de mission au sein de la Direction audit etmaîtrise des risques depuis plusieurs années, ses sensibilités professionnelles lui ontpermis de m’apprendre les intérêts pratiques dans mes études en assurance santé.

7

Page 8: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 9: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Introduction générale

Motivations

Les motivations d’origine environnementale et technique suivantes ont piloténos travaux.

Motivations environnementales

Après la fusion, le nouveau Groupe Humanis (dénommé le Groupe) se placeau 4ème rang en santé et au 1er rang en santé collective en France, avec plus de3,5 millions de personnes protégées. En 2011, le montant des cotisations encaisséesSanté du Groupe s’élève à 1,74 milliard d’euros.

Dans le domaine de la protection sociale, le désengagement de la Sécurité So-ciale a reporté une partie de ses charges sur les régimes complémentaires dont lecoût ne cesse d’augmenter. Par ailleurs, nous ne pouvons pas détourner le sujetde la nouvelle directive européenne Solvabilité 2. Des modélisations avancées etpertinentes du passif sont requises afin d’intégrer la nature aléatoire des donnéeset leurs distributions de probabilités.

Dans ce contexte, le Groupe est soucieux de maîtriser les budgets et d’anticiperl’évolution des charges futures. La nouvelle direction Santé se devra donc de ré-pondre pleinement aux besoins de la gestion prudentielle et piloter les offres Santépar le développement des modèles stochastiques de la sinistralité performants.

Motivations techniques

Nécessité d’adaptation En assurance hospitalisation, la prime pure annuellene peut être évaluée en se basant sur la supposition de l’indépendance entre lafréquence et le coût du sinistre : il suffit d’avoir un séjour hospitalisé de longuedurée pour contredire cette hypothèse. En assurance verres optiques, le modèleindividuel doit être adapté et ce pour deux raisons : premièrement, le coût desinistre individuel admet une distribution ayant une masse en 0, entraînant unedifficulté dans sa calibration ; deuxièmement, il est observé que la distribution desmontants du remboursement proportionnels à la dépense présente deux modes, sa

9

Page 10: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

10

calibration par une loi simple et uni-modale ne suffit donc pas pour donner unrésultat satisfaisant.

Nécessité d’un nouvel outil de tarification En assurance hospitalisation, unoutil de tarification permettant de tarifer une garantie avec franchise est souhaité.En effet, en cas du désengagement de la Sécurité sociale, la prestation assuméepar l’assureur est augmentée. Pour maintenir l’équilibre entre la prestation et lacotisation (i.e. que le ratio S/P soit proche de 1), la première solution est d’aug-menter le taux de cotisation. Cette mesure n’est pas optimale pour le long termeet ce pour les raisons suivantes :

1. Elle détériore l’image commerciale de l’assureur et affaiblit la compétitivitéde ce dernier.

2. Dans le cas d’un contrat collectif, les salariés-assurés seront moins bien rem-boursés.

3. Dans le cas d’un contrat individuel, chaque individu ayant un budget limité,un taux de cotisation ne cessant d’augmenter aura pour conséquence que lesindividus ne pourront plus s’assurer.

Vu ces désavantages, cette première solution pour équilibrer le ratio S/P ne serapas considéré dans nos études.

Une deuxième solution existe et consiste à maintenir le taux de cotisation mais“filtrer” les sinistres que l’assureur rembourse. Particulièrement, nous parlerons del’instauration d’une franchise. Dans le contexte de l’assurance d’hospitalisation,ceci signifie un remboursement à partir du K-ième jour hospitalisé (franchise =K − 1 jours). Ainsi, la conception de l’outil de tarification permettant la paramé-trisation de la franchise fera l’objet de notre étude en assurance hospitalisation.

Nécessité d’intégrer les spécificités propres à l’assurance santé La pres-tation pour certaines garanties santé est limitée à une fois par an (deux verres, unemonture, une prothèse coûteuse par exemple la prothèse auditive etc) ; la presta-tion pour certaines garanties est exprimée sur une base annuelle. C’est le cas, parexemple, d’une garantie Cure thermale sans limite du nombre de soins, mais avecle remboursement promis à la hauteur de 60% de la dépense engagée annuelle.Nous disons que ces types de garantie sont mono-sinistre.

De nombreux travaux ont été dédiés au sujet de la distribution du nombre desinistres de manière générale sans faire la distinction sur la sinistralité individuelle(mono-sinistre / multi-sinistres). Nous pouvons citer des lois discrètes usuelles :loi binomiale, loi binomiale négative, loi de Poisson ainsi que des lois dévelop-pées récemment à partir de la loi de Poisson : Poisson-lognormal, Poisson-inverseGaussien, Poisson-beta, Poisson-gamma-gamma (E. Gómez-Déniz & J. M. Sarabia

Page 11: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

11

(2008)). Néanmoins, peu d’articles traitent de la garantie mono-sinistre. Nous nousproposons donc de développer un modèle de la sinistralité spécialement pour cetype de garantie.

Nécessité des méthodes simples à réaliser Les professionnels en actuariatsont souvent confrontés au choix entre la performance d’un modèle poussé et lacomplexité de sa mise en place. Les questions que nous allons nous poser sont tellesque “Dans quelle mesure un modèle basé sur des techniques mathématiques avan-cées est-il plus performant ? Une méthode simple et classique admettant une miseen place immédiate est-elle vraiment obsolète ? ” Pour y répondre, nous redonne-rons la place aux méthodes simples en tenant compte de leurs degrés de facilité eten examinant les résultats obtenus.

Modèles de base de la sinistralité en assurance

non-vie

Nous adapterons le vocabulaire de Partrat et Besson (2005) et emploieronsle terme charge sinistres pour désigner, dans notre contexte de l’assurance santé,la prestation totale pour un ensemble d’assurés sur une période donnée. Nous parle-rons également de la charge individuelle et de la charge totale pour distinguerla charge sinistres causée par un assuré et la charge sinistres du portefeuille (unensemble des assurés).

Les deux modèles de référence portant sur la charge sinistres d’un portefeuilleen assurance non-vie (notée S) sont le modèle individuel et le modèle collectif.Leurs définitions sont données ci-dessous.

Modèle individuel Soit n l’effectif d’un portefeuille d’assurance non vie, lacharge totale de ce portefeuille S correspond à la somme des n charges individuelleséventuellement occasionnées (0 ou un montant positif). En notant Sk la chargeindividuelle de l’assuré k, le modèle individuel s’écrit

S =n∑k=1

Sk

Le modèle individuel recense donc les assurés composant le portefeuille.

Modèle collectif La charge total s’écrit dans ce modèle

S =N∑i=1

Xi

Page 12: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

12

avec N le nombre total de sinistres sur le portefeuille etXi la charge causée par le i-ième sinistre. Autrement dit, le modèle collectif comptabilise les sinistres réellementsurvenus.

Le modèle individuel servira de point de départ pour modéliser la sinistralitédes deux actes médicaux suivants :

1. Forfait journalier en assurance hospitalisation, dont nous calculerons la primepure ;

2. Verres en assurance optique, où nous étudierons la distribution de la chargesinistres.

L’équivalence entre les deux modèles sera démontrée pour une garantie particulièredes verres optiques.

Champs d’application

Les modèles de sinistralité que nous avons développés peuvent être utilisés entant que modèles de base de tarification et de provisionnement ; ils reconnaissentégalement des applications dans le cadre de la mise en place d’une démarche degestion des risques ou d’ERM (Entreprise Risk Management).

Les deux garanties santé retenues pour appliquer les modélisations (“forfaitjournalier” et “verres optiques”) sont en effet représentatifs des deux groupes desactes médicaux usuellement couverts par un contrat Santé. Les techniques étudiéesou développées dans le présent mémoire sont directement applicables à ces deuxgroupes d’actes. Ils sont :

– Groupe 1 : les actes dont la prestation d’un sinistre dépend du nombre dejours du soin médical ET dont la garantie journalière est un montant fixe.Exemples : Ces actes concernent essentiellement l’assurance hospitalisation.Sur un contrat standard, ces actes sont souvent : forfait journalier (indemni-sation journalière pour un séjour hospitalisé), chambre particulière (indem-nisation journalière pour un séjour hospitalisé en chambre particulière) et litaccompagnant (indemnisation journalière pour un parent accompagnant sonenfant hospitalisé).

– Groupe 2 : les actes dont la prestation d’un sinistre est proportionnelle à ladépense engagée ET le remboursement est limité à une fois par an et parpersonne.Exemples : Classiquement, les actes suivants remplissent ces conditions :une monture, deux verres, un vaccin refusé par la Sécurité sociale, une pro-thèse auditive, etc.

Les techniques étudiées ou développées dans ce mémoire peuvent être facilementadaptées pour la tarification et le provisionnement des actes du groupe suivant :

Page 13: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

13

– Groupe 2 bis : Ce groupe généralise le Groupe 2 au sens où la prestationest cette fois-ci proportionnelle à la dépense annuelle sans limite du nombred’actes.Exemples : Habituellement, nous pouvons citer : lentilles de contact, kéra-totomie radiaire, la plupart des actes dits hors nomenclature (ostéopathie,thérapie manuelle, acupuncture, patch anti-tabac...) etc.

Finalement, nous aimerions signaler que ces actes types sont donnés à titre indi-catif, sachant que l’expression de la garantie et le plafond du remboursement sontflexibles et peuvent varier d’un régime à l’autre.

Organisation du mémoire

L’objectif de ce mémoire est par conséquent de résoudre les problématiquespré-citées en proposant des modèles appropriés à l’environnement de l’assurancesanté. Nous rappelons que les deux actes médicaux en particulier sont choisis pourmatérialiser nos conceptions des résolutions. Ils sont :

1. Forfait journalier en assurance hospitalisation, dont nous calculerons la primepure ;

2. Verres en assurance optique, où nous étudierons la distribution de la chargesinistres.

Les deux grandes parties du mémoire portent successivement sur ces deux actes.L’organisation du mémoire et les sous-objectifs à atteindre sont comme suit :

Partie I : Prime pure de la garantie forfait journalier en assurance hos-pitalisation Cette première partie commence par présenter le modèle de la si-nistralité de référence (Section 1.1). La prime pure du portefeuille est exprimée parla somme des primes pures individuelles. Deux causes d’entrée en hospitalisationsont distinguées. Suite à cette distinction, la modélisation par états de situationqu’occupe un assuré à une date donnée est proposée (Section 1.2). Le dévelop-pement des primes pures, avec et sans franchise, débute dans la Section 1.3. Cedéveloppement s’arrête à la détermination des probabilités d’occupation des états.

Afin de poursuivre le développement, la modélisation par une chaîne de Mar-kov est mise en place (Section 1.4). Les primes pures individuelles, avec et sansfranchise, sont alors exprimées par la loi initiale µ et la matrice de transition Pde la chaîne de Markov modélisée (Section 1.4.2 et Section 1.4.3). µ et P sont deséléments estimables à partir des données disponibles.

Les estimateurs de µ et de P ainsi que leurs estimations de ces derniers sontprésentés dans la Section 2.1. Puis, pour dégager la tendance des probabilités detransition P en fonction de l’âge, la régression de Poisson est employée (Section

Page 14: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

14

2.2.1) et donne des résultats satisfaisants. En revanche, le lissage de µ n’est pasimmédiat. Après une première tentative échouée avec la régression par modèle ad-ditif, la méthode de Whittaker-Henderson est testée et s’avère cohérente (Section2.2.2.2). La différence entre l’hospitalisation médicale et l’hospitalisation chirurgi-cale surgit sur les graphiques des quantités lissées.

Finalement, les estimations lissées de µ et de P permettent de calculer la primepure du portefeuille étudié selon les formules établies précédemment (Section 2.3).La différence en prime pure entre les deux causes d’hospitalisation est confirmée.La Partie I termine par les discussions sur les hypothèses émises dans le cadre dela modélisation markovienne (Chapitre 3).

Partie II : Charge sinistres de la garantie Verres en assurance optiqueCette analyse commence par l’adaptation du modèle individuel (Chapitre 4) etteste un modèle de sinistralité à trois composantes adapté selon les caractéristiquesde la garantie étudiée : une constante, une variable aléatoire de la dépense et unevariable aléatoire d’indicatrice d’achat. Les deux chapitres qui suivent traitentsuccessivement les deux composantes aléatoires.

Dans un premier temps, la loi de la dépense aléatoire bimodale est modé-lisée par une densité mélange (Section 5.1). Cette dernière est ensuite calibréeselon trois méthodes : algorithme EM (Section 5.3.2), minimisation de la distanced’Anderson-Darling (Section 5.3.3) et méthode MCO (Section 5.3.4). La deuxièmeméthode emploie un critère de calibration non encore rencontré dans la littératureactuarielle : celui de la distance d’Anderson-Darling.

Dans un deuxième temps, l’indicatrice d’achat est étudiée par le biais du tauxd’achat. Ce dernier est ensuite modélisé comme la variable de réponse dans un mo-dèle de régression. Les cinq variables explicatives comprennent le sexe, la tranched’âge et la zone de résidence. Puis, les coefficients de régression sont estimés partrois méthodes : régression logistique (Section 6.4), calcul manuel des moyennespondérées (Section 6.5.1) et régression linéaire (Section 6.5.2). L’applicabilité et laperformance de chaque méthode sont comparées et discutées dans la Section 6.6.

Ses composantes aléatoires traitées, nous procédons le développement de lacharge sinistres, notamment ses caractéristiques statistiques importantes commeson espérance, sa variance et son coefficient d’asymétrie (Section 7.1). Un lienavec le modèle collectif est également établit (Section 7.2.1), la formule de Panjerpeut donc s’employer. Les approximations de la distribution de la charge sinistresdonnées par la loi normale et la loi Normal Power sont étudiées (Section 7.2.3).La simulation des réalisations de la charge sinistres est présentée et détaillée dansla Section 7.2. Finalement, les résultats numériques et graphiques sont donnés,comparés et commentés dans la Section 7.4. Ainsi termine la Partie II.

Page 15: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

15

Délimitation du champ d’étude

Nous ne traiterons pas le sujet de la représentation des données multidimen-sionnelles par analyse factorielle (ACP, AFC, cercle de corrélation etc.), ni de laclassification des actes ou des populations selon le niveau de consommation.

Lorsque des programmes informatiques sont disponibles, notamment pour ef-fectuer des estimations des modèles de régression, nous ne présenterons pas lesdétails de calcul ; nous accepterons les résultats donnés si les techniques utiliséessont précisées dans la documentation associée au logiciel.

Dans l’assurance hospitalisation, l’éventualité d’un décès sera négligée car cecirelève du périmètre de la garantie prévoyance de son entreprise et est donc horsdu périmètre de la présente étude.

Finalement, vu la flexibilité dans l’expression de la hauteur de garantie, iln’existe pas un modèle de la sinistralité universel pour l’ensemble des actes couvertspar un contrat Santé. Dans la section Champs d’application, nous avons définitles garanties concernées par ce mémoire. Voici quelques garanties type que nousavons laissées en dehors du périmètre d’études :

– les garanties Optiques exprimées en montant fixe comme par exemple en%BR (pourcentage de la Base de Remboursement de la Sécurité sociale), en%PMSS (pourcentage du Plafond Mensuel de Sécurité Sociale) ou encore en%TM (pourcentage du Ticket Modérateur) etc. ;

– les garanties dites multi-sinistres dont le remboursement peut avoir lieu plu-sieurs fois durant l’année : soins dentaires, pharmacie, consultations etc.

Page 16: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 17: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Première partie

Prime pure de la garantie Forfaitjournalier en assurance

hospitalisation

17

Page 18: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 19: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Introduction

L’objectif L’objectif de cette première partie est de déterminer la prime pureannuelle de la garantie “forfait journalier” en hospitalisation selon l’âge de l’as-suré. Cette garantie permet une indemnisation de 18€ par jour hospitalisé. Desfranchises (indemnisation à partir du deuxième jour d’hospitalisation par exemple)seront également étudiées en tant que mesure de réduction du coût de garantie.

Nous savons que la prime pure joue un rôle central dans la tarification. Étantune variable aléatoire, l’assureur souhaite connaître certaines de ses propriétés,son ordre de grandeur, voire sa valeur exacte moyennant des hypothèses réalistes,et ce afin de se préparer aux prestations à payer : tarifer et provisionner. Parailleurs, la garantie “forfait journalier” comprenant deux actes d’hospitalisationdifférents (hospitalisation médicale et hospitalisation chirurgicale), l’assureur sou-haite également savoir si l’un est plus coûteux que l’autre, et que cette conclusionest maintenue pour différents âges.

Présentation des données Les données mises à notre disposition pour alimen-ter des procédures d’estimation sont typiquement centralisées sous forme d’unetable de données dont chaque ligne correspond à un règlement de prestation. Cettetable est composée des colonnes suivantes :

– (1) Numéro de l’assuré : identifiant de l’assuré ;– (2) L’âge de l’assuré : plage d’âges choisie de 23 ans à 80 ans ;– (3) Durée de présence dans le portefeuille : en nombre de jours (=365 jours)– (4) Motif de l’hospitalisation : HC (hospitalisation chirurgicale) ou HM (hos-pitalisation médicale) ;

– (5) Date d’entrée en hospitalisation ;– (6) Durée de séjour dans l’hôpital (en nombre de jours).

Le périmètre de l’extraction des données est précisé ci-après :– Ces données concernent les enregistrements des prestations des contrats stan-dards et individuels.

– Des traitements sur les données manquantes ont été effectués ; uniquementles lignes avec les informations (1), (2), et (3) renseignées sont conservées.Des valeurs erronées (numéro de l’assuré incomplet, l’âge négatif ou excède140 ans, durée de séjour négative etc.) ont également été éliminées.

19

Page 20: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

20

Table 0.1: Résumé des données

Plage d’âgesélectionnée

23 ans à 80 ans

Min MaxTotal

(tout âge)

Nb. d’assurés52 3524 115986

correspond à l’âge de80 ans 46 ans 23 ans à 80 ans

Nb. de jours totalpassée dans HCau cours d’1 ans

16 863 20049correspond à l’âge de

23 ans 54 ans 23 ans à 54 ans

Nb. de jours totalpassée dans HMau cours d’1 ans

19 1219 24710correspond à l’âge de

23 ans 54 ans 23 ans à 80 ans

– Pour les assurés non-hospitalisés, les cases (4), (5) et (6) sont vides.– Destinés à estimer les paramètres, les enregistrements de quatre années (de

2007 à 2011) sont retenus afin de garantir la robustesse des estimations.– Les assurés concernés ont tous passé l’année entière soit 365 jours dans le

portefeuille.– La plage d’âges retenue est de 23 ans à 80 ans.

Certaines statistiques des données sont présentées dans la Table 0.1 (valeurs moyennessur les quatre années). La pyramide d’âge prend sa valeur minimale à 80 ans (52assurés) soit le dernier dans la plage d’âges sélectionnée. Elle prend son maximumà 46 ans (3524 assurés). En ce qui concerne le nombre de jours passés en hospitali-sation, l’âge du plus grand nombre d’assurés (46 ans) n’est pas l’âge où le nombrede jours d’hospitalisation est maximal (54 ans au lieux de 46 ans).

Il est judicieux de faire un zoom sur les deux extrémités de la plage d’âges, 23ans et 80 ans, ainsi que sur l’âge le plus peuplé 46 ans. La Table 0.2 est créée àcet effet. Elle servira également aux futures vérifications lorsque les primes puresseront estimées par nos modèles.

Premier aperçu de la différence HM v.s. HC Concernant nombre de jourstotal passés en hospitalisation, les âges correspondant aux minimums et aux maxi-mums des deux types d’hospitalisation coïncident (23 ans et 54 ans pour HC etHM. Voir Table 0.1). Dans le deuxième bloc de la Table 0.2, l’âge de 23 ans repré-sente l’ordre de grandeur de la durée d’hospitalisation minimale, l’âge de 46 anset de 80 ans représente respectivement l’ordre de grandeur de la durée moyenne etde la durée maximale. Par ailleurs, pour les trois âges, la durée HM est plus élevéeque la durée HC.

Page 21: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

21

Table 0.2: Zoom sur les âges clés

Âge23 ans 46 ans 80 ans

Nb d’assurés 430 3524 52Durée totalepassée dansHC (jours)

16 449 100

Durée totalepassée dansHM (jours)

19 672 147

Moyenne par anpar assuré dans

HC (jours)0,0366 0,1274 1,9324

Moyenne par anpar assuré dans

HM (jours)0,0430 0,1906 2,8357

Prestation18 €/j HC

0,66 € 2,29€ 34,81 €

Prestation18 €/j HM

0,77 € 3,43 € 51,08 €

Totalprestations

1,43 € 5,73 € 85,88 €

Le troisième bloc du tableau donne la prestation simulée de la garantie. Parexemple, une prestation HM de 3,43€ (=0,1906×18) par an par assuré âgé de 46ans, en tenant compte de la fréquence globale empirique sur tous les assurés dumême âge (0,1906 jours par an et par assuré). Pour les trois âges considérés, lescoûts moyens de HM sont plus élevés que HC.

Organisation de la Partie I Les primes pures avec et sans franchise sontd’abord modélisées en distinguant deux causes d’entrée dans l’hospitalisation. Lesexpressions de la prime pure se développent grâce à une modélisation par chaîne deMarkov. Les paramètres du modèle sont estimés et lissés. L’application numériquesont donnés tout au long de la procédure. Les primes pures sont ensuite calculéespour le cas sans franchise, avec deux niveaux de franchises et ce pour les âges de23 à 80 ans. Enfin, l’effet de l’âge et l’impact de la franchise sont commentés.

Page 22: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 23: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Chapitre 1

Modélisation de la prime pure

1.1 Le modèle de la sinistralité

Le modèle de référence utilisé est le modèle individuel en assurance non-vie :

S =n∑i=1

Si,

avec n effectif du portefeuille étudié et Si montant total des prestations sur la pé-riode considérée à verser à l’assuré i, i = 1, . . . , n. La prime pure du portefeuillecorrespondant à l’espérance de S s’écrit

E (S) = E (S1) + . . .+ E (Sn) .

Pour un âge donné, les {Si, i = 1, . . . , n} seront supposées indépendantes etidentiquement distribuées. L’équation ci-dessus devient alors

E (S) = nE .

où E = E (Si), i = 1, . . . , n. La détermination de la prime pure du portefeuilleconsiste donc à déterminer la prime pure individuelle, identique pour chaqueassuré du même âge, et à multiplier cette dernière par l’effectif de cet âge.

Dans la suite, la prime pure individuelle sera l’objet central de l’étude. Pouralléger la dénomination, elle sera occasionnellement appelée la prime pure ou,lorsque ceci est possible, la prime.

Recommandé par les professionnels, la modélisation de la prime pure indi-viduelle de la garantie “forfait journalier” doit distinguer deux causes d’entrée :l’hospitalisation médicale (abr. HM) et l’hospitalisation chirurgicale (abr. HC) 1.Cette différenciation a l’avantage de permettre une meilleure appréciation de ladurée d’indemnisation : selon les expériences, l’hospitalisation médicale dure gé-néralement plus longtemps et coûte donc plus cher à l’assureur. Une modélisationpar états de situation semble par conséquent nécessaire.

1. Même si dans la pratique un tarif global est donné pour les deux causes.

23

Page 24: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

24 CHAPITRE 1. MODÉLISATION DE LA PRIME PURE

Figure 1.1: Un système à trois états de parcours d’hospitalisation d’un assuré

1.2 Modélisation par état de situation

Suite à la distinction des deux causes d’entrée en hospitalisation, un assuré peutse retrouver dans un des trois états suivants : valide, hospitalisé pour une raisonchirurgicale et hospitalisé pour une raison médicale. Des transitions entre les deuxétats d’hospitalisation seront considérées possibles pour prendre en compte lesaffections de longue durée. Ce type de transition peut aussi être le cas pour unpatient initialement entré pour un traitement chirurgical mais ensuite transféré enhospitalisation médicale pour une récupération de plus longue durée. Inversement,une entrée initialement due à une maladie ne nécessitant pas immédiatement uneintervention chirurgicale peut l’être au bout de certains jours d’hospitalisation. LaFigure 1.1 présente le système que l’on vient de décrire en indiquant les transitionspossibles entre les états.

Les trois états forment ainsi un système de {ev, ec, em} où ev = “valide”, ec=“hospitalisé pour une raison chirurgicale” et em= “hospitalisé pour une raison mé-dicale”. On notera E = {“v”,“c”,“m”}, évidemment un espace fini et dénombrabledes états. L’histoire de chaque assuré est décrite par un processus {Xd; d ∈ N}à valeurs dans E, où pour tout entier naturel d, Xd donne l’état où se trouvel’individu à la date d.

Particularité du contrat collectif Par ailleurs, nous étudions le cas du contratcollectif. Contrairement aux assurances individuelles, les contrats santé collectifssont conclus avec l’entreprise pour le compte des salariés. Par conséquent, unassuré hospitalisé au jour de l’entrée en vigueur du contrat est couvert au mêmetitre que ses collègues (absence de la sélection médicale). Ainsi, à d = 1, un assurépeut occuper n’importe quel état y compris des états hospitalisés. La contraintedu type X1 = ev ne sera donc pas imposée pour un contrat collectif.

Page 25: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

1.3. EXPRESSIONS DE LA PRIME PURE 25

1.3 Expressions de la prime pure

Grâce au modèle établi dans la section précédente, la prime pure pourra êtreexprimée avec précision en tenant compte différentes causes d’hospitalisation. Pouralléger la notation, les développements qui suivent correspondent à un âge x fixé.

1.3.1 Prime pure sans franchise

Première expression de la charge individuelle De manière générale, lacharge individuelle Si s’écrit de la façon suivante :

Si =T∑d=1

1{Xd=ec}B(c)d + 1{Xd=em}B

(m)d (1.1)

avec

– 1{Xd=ec} =

1, si hospitalisé HC à la date d,

0, sinon.

– 1{Xd=em} =

1, si hospitalisé HM à la date d,

0, sinon.

– B(c)d (resp. B(m)

d ) le montant de l’indemnisation journalière à verser à l’assuréoccupant l’état ec (resp. em) à la date d.

Dans cette formulation, nous avons supposé qu’un assuré peut occuper les deuxétats ec et em dans le même jour afin d’inclure de telles observations présentesdans nos données. Nous remarquons d’ailleurs que l’indice de date d démarre à 1.

B(c)d et B(m)

d étant fixés par l’assureur, les indicatrices 1{•} restent les seulesinconnues et aléatoires. En supposant que B(c)

d et B(m)d sont indépendants de la

date d’observation d, la prime pure individuelle de la période [1, T ] notée E1 [1, T ]

s’écrit :

E1 [1, T ] = E (Si)

=T∑d=1

[Pr (Xd = ec)B

(c) + Pr (Xd = em)B(m)].

Pour le contrat étudié, les prestations pour les deux causes d’entrée sont iden-tiques B(c) = B(m). En les notant par une variable commune B, l’équation précé-dente se simplifie encore :

E1 [1, T ] = B ×T∑d=1

[Pr (Xd = ec) + Pr (Xd = em)] . (1.2)

La probabilité Pr (Xd = eα) sera appelée la probabilité d’occupation del’état eα à la date d avec α ∈ E. Les deux probabilités d’occupation dans (1.2)

Page 26: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

26 CHAPITRE 1. MODÉLISATION DE LA PRIME PURE

sont donc les quantités à déterminer avant d’obtenir la prime pure sans franchiseet au final la prime pure sans franchise d’un portefeuille constitué de n assurés.

Deuxième expression de la charge individuelle Lorsque B(c)d et B(c)

d nedépendent pas de la date d’observation d, (1.1) est équivalente à :

Si = B(c) ×T∑d=1

1{Xd=ec} +B(m) ×T∑d=1

1{Xd=em}, (1.3)

D’où la deuxième expression de la prime :

Si = DUR(c)B(c) +DUR(m)B(m) (1.4)

avec

DUR(c) =T∑d=1

1{Xd=ec} et DUR(m) =

T∑d=1

1{Xd=em}. (1.5)

DUR(c) (resp. DUR(m)) correspond en effet à la durée de présence totale sur[1, T ] de l’assuré i dans l’état ec (resp. em).

Ainsi, nous obtenons :

E1 [1, T ] = B ×[E(DUR(c)

)+ E

(DUR(m)

)]2èmeécriture

= B ×T∑d=1

[Pr (Xd = ec) + Pr (Xd = em)] 1èreécriture (1.6)

1.3.2 Prime pure avec franchise

Nous étudions à présent le cas où l’assureur verse des prestations uniquementà partir du K-ième jour passé dans l’hôpital (1 ≤ K < T ). En particulier, K = 1

correspond au cas sans franchise dont la prime est E1.Soit M (α)

d , α ∈ E la variable aléatoire représentant le nombre de jours passésconsécutivement dans eα observé à la date d. La charge individuelle avec unefranchise de K − 1 jours (remboursement à partir du Kème jour) s’écrit :

Si =T∑d=1

1{Xd=ec,M

(c)d ≥K

}B(c)d + 1{

Xd=em,M(m)d ≥K

}B(m)d .

La prime pure correspondant à cette charge notée EK [1, T ] s’écrit :

Page 27: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

1.4. MODÉLISATION PAR UNE CHAÎNE DE MARKOV 27

EK [1, T ]4= E (Si) (1.7)

= B ×T∑d=1

[Pr(Xd = ec,M

(c)d ≥ K

)+ Pr

(Xd = em,M

(m)d ≥ K

)]=⇒

EK [1, T ] = B ×T∑d=1

[d∑

k=K

Pr(Xd = ec,M

(c)d = k

)+ (1.8)

Pr(Xd = em,M

(m)d = k

)] (1.9)

où nous avons supposé que B(c)d et B(m)

d sont identiques et indépendants de d.La probabilité Pr

(Xd = eα,M

(α)d = k

)sera dénommée la probabilité de main-

tien dans l’état α depuis k jours avec α ∈ E.Pour avancer les développements de (1.6) et (1.7), de nouvelles modélisations

sont nécessaires. Nous verrons qu’à travers une modélisation markovienne du pro-cessus décrivant l’histoire d’un individu dans différents états, l’appréhension desprobabilités d’occupation et de maintien sera simple et réaliste.

1.4 Modélisation par une chaîne de Markov

Vu la nature du problème, le recours à une chaîne de Markov {Xn;n ∈ N}modélisant l’histoire d’un assuré est approprié.

1.4.1 Outils markoviens

Certaines propriétés d’une chaîne de Markov sont listées ci-dessous sans dé-monstrations.

1. La probabilité de transition entre les dates n et n + 1 et de l’état α àl’état β est définie par

pα→β4= Pr [Xn+1 = eβ | Xn = eα]

Pour un âge x donné, cette probabilité sera supposée constante et donc in-dépendante de n. Une chaîne possédant cette propriété est dite localementhomogène.

2. Les neuf probabilités de transition forment une matrice de 3 × 3 notée Ptelle que

P = (pα→β;α, β ∈ E)4=

pv→v pv→c pv→m

pc→v pc→c pc→m

pm→v pm→c pm→m

. (1.10)

Page 28: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

28 CHAPITRE 1. MODÉLISATION DE LA PRIME PURE

P est appelée matrice de transition.

3. Par l’homogénéité locale du point 1, nous en déduisons la probabilité detransition entre deux dates non-consécutives :

Pr (Xn+p = eβ | Xp = eα) = (P n)α→β . (1.11)

et

Pr (Xn = eβ | X1 = eα) =(P n−1)

α→β (1.12)

où (P )α→β désigne l’élément à la position α→ β de la matrice P .

4. La matrice P est dite markovienne, au sens où elle vérifie la propriété que∀α ∈ E, le vecteur ligne (pα→β; β ∈ E) est une mesure de probabilité sur E :

pα→β ≥ 0,∀β ∈ E;∑β∈E

pα→β = 1.

5. La loi initiale µ = (µα;α ∈ E) est définie comme la loi de X1 : µα =

Pr (X1 = eα), α ∈ E.

6. Une chaîne de Markov est entièrement définie par le couplet (µ,P ).

En résumé, le trajectoire d’hospitalisation d’un assuré sera modélisée par unechaîne de Markov :

– de trois états– irréductible– homogène pour l’âge de l’assuré (homogénéité locale).

Dans la suite, nous allons démontrer que, dans le cadre de la modélisation marko-vienne, la prime peut être exprimée seulement par (µ,P ) et les éléments définispar le contrat d’assurance. Pour alléger la rédaction, les développements présentésci-après ne feront pas intervenir la variable d’âge x, sachant que pour obtenir laprime pour un âge donné, nous n’avons qu’à remplacer le couplet (µ,P ) corres-pondant à cet âge.

1.4.2 Prime pure sans franchise

Le développement de E1 [1, T ] s’était arrêté aux probabilités d’occupation (équa-tion (1.6)) :

E1 [1, T ] = B × E[DUR(c) +DUR(m)

]= B ×

T∑d=1

(p(c)d + p

(m)d

)

Page 29: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

1.4. MODÉLISATION PAR UNE CHAÎNE DE MARKOV 29

où nous avons noté la probabilité d’occupation Pr (Xd = eα) par p(α)d , α ∈ E. Grâceaux hypothèses markoviennes, p(c)d et p(m)

d peuvent continuer à se développer :

p(c)d = Pr (Xd = ec)

= Pr (Xd = ec, X1 = ev) + Pr (Xd = ec, X1 = ec) + Pr (Xd = ec, X1 = em)

=∑β∈E

Pr (Xd = ec | X1 = eβ)µβ proba. conditionnelle

=∑β∈E

µβ(P d−1)

β→c chaîne de Markov

En notant∑

β∈E µβ (P n)β→α par (µP n)α , nous obtenons

p(c)d =

(µP d−1)

c

et par analogie

p(m)d =

(µP d−1)

m.

Finalement,

E1 [1, T ] = B ×T∑d=1

[(µP d−1)

c+(µP d−1)

m

](1.13)

1.4.3 Prime pure avec franchise

EK [1, T ] s’écrivait (équation 1.7)) :

EK [1, T ] = B ×T∑d=1

d∑k=K

Pr(Xd = ec,M

(c)d = k

)+

B ×T∑d=1

d∑k=K

Pr(Xd = em,M

(m)d = k

).

Le développement de la probabilité de maintien Pr(Xd = ec,M

(c)d = k

)néces-

site la distinction des deux cas de figure :

1. k = d : l’individu est hospitalisé dès le premier jour, sans avoir été validedurant l’observation. La probabilité de maintien s’écrit dans ce cas :

Page 30: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

30 CHAPITRE 1. MODÉLISATION DE LA PRIME PURE

Pr(Xd = ec,M

(c)d = k = d

)= Pr (X1 = ec, X2 = ec, . . . , Xd = ec)

= Pr (X1 = ec)× Pr (X2 = ec | X1 = ec)

× . . .× Pr (Xd = ec | Xd−1 = ec) chaîne de Markov

= µc · (pc→c)k−1

= µc · (pc→c)d−1

2. k < d : l’individu occupait d’autres états avant d’entrer dans ec et chacunde ces états historiques doit être examiné. La probabilité de maintien s’écritcette fois-ci

Pr(Xd = ec,M

(c)d = k

)= Pr (Xd−k = ev, Xd−k+1 = ec, . . . , Xd = ec) +

Pr (Xd−k = em, Xd−k+1 = ec, . . . , Xd = ec)

= Pr (Xd−k = ev)× Pr (Xd−k+1 = ec | Xd−k = ev)

× . . .× Pr (Xd = ec | Xd−1 = ec) +

Pr (Xd−k = em)× Pr (Xd−k+1 = ec | Xd−k = ev)

× . . .× Pr (Xd = ec | Xd−1 = ec) chaîne de Markov

=(µP d−k−1)

v· pv→c · (pc→c)k−1 +(

µP d−k−1)m· pm→c · (pc→c)k−1 par définition

En résumé

Pr(Xd = ec,M

(c)d = k

)=

µc · (pc→c)k−1 , si k = d

Ac (d, k) , si k < d

où on a noté

Ac (d, k) =(µP d−k−1)

v· pv→c · (pc→c)k−1 +(

µP d−k−1)m· pm→c · (pc→c)k−1

De façon analogue,

Pr(Xd = em,M

(m)d = k

)=

µm · (pm→m)k−1 , si k = d

Am (d, k) , si k < d

Nous avons ainsi terminé d’exprimer E1 et EK en fonction de µ et P . La pro-chaine étape consistera en estimation statistique de ces deux derniers.

Page 31: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Chapitre 2

Estimation des paramètres etapplications

L’estimation de la loi initiale µ et de la matrice de transition P est possible siles données appropriées et idéalement en grand volume sont disponibles. Ceci estheureusement souvent le cas dans la pratique.

Le double objectif de ce chapitre est de 1) déterminer les estimations de pardes méthodes statistiques et puis 2) ajuster ces estimations afin de permettre unemeilleure interprétation des évolutions de (µ,P ) en fonction de l’âge.

Les paramètres obtenus par les estimations statistiques seront marqués par unaccent circonflexe comme µv, alors que les valeurs ajustées seront signalées par untilde comme µv.

2.1 Estimations statistiques et résultats

La correction des montants as-if n’est pas nécessaire vu que les enregistrementssont récents. De plus, étant donné que µ et P sont indépendantes (chaîne homo-gène), leurs estimations peuvent être réalisées séparément.

Nous allons noter n l’effectif de l’ensemble des assurés d’un âge donné et [1, T ]

la période de validité du contrat. Dans les développements qui suivent, l’indice del’âge x n’interviendra pas explicitement, sachant que les estimations pour un âgequelconque peuvent être déterminées en prenant µ et P correspondants à cet âge.

2.1.1 Estimation de P

L’estimation de P s’effectue élément par élément. En outre, P étant une ma-trice markovienne, nous avons

pα→α = 1−∑β 6=α

pα→β, (α, β) ∈ E2.

31

Page 32: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

32 CHAPITRE 2. ESTIMATION DES PARAMÈTRES ET APPLICATIONS

Cette propriété élimine ainsi trois paramètres à estimer et les six restants sontpv→c, pv→m, pc→v, pc→m, pm→v et pm→c.

Les estimateursSoient

– n l’effectif– niα→β le nombre de transitions de eα à eβ effectuées par l’assuré i– n•α→β =

∑ni=1 n

iα→β le nombre total de transitions du portefeuille sur [1, T ]

– ERα (exposition au risque) le temps total passé dans eα par les n assurésau cours de [1, T ].

En supposant qu’une seule transition n’est possible par jour, un estimateur de laprobabilité de transition, entre deux dates consécutives de l’état eα à l’état eβ,proposé dans Denuit & Robert (2007) est tel que :

pα→β =n•α→βERα

, (α, β) ∈ E2, α 6= β. (2.1)

La Figure 2.1 montre l’allure des évolutions des probabilités de transition es-timées selon (2.1). D’une manière générale, les probabilités d’entrée (v → c etv → m) augmentent avec l’âge ; les probabilités de sortie (m→ v et c→ v) dimi-nuent avec l’âge. Entre les états hospitalisés, nous ne constatons pas de tendanceen fonction de l’âge ; nous remarquons ce pedant que pc→m se trouve au dessus depm→c et ce presque pour tous les âges.

Les intervalles de confiance (proportion) L’élément n•α→β dans (2.1) peut eneffet être vu comme le nombre de jours avant les transitions eα →eβ. L’estimateur(2.1) correspond donc à la proportion du nombre de jours “utilisés” pour effectuerune telle transition sur la présence totale de cette dernière, exprimée également ennombre de jours.

L’intervalle de confiance d’une proportion, de niveau asymptotique γ, est pro-posé dans Devore (2011) comme le suivant :

p′α→β ± z1−γ/2

√pα→β (1− pα→β) /ERα + z21−γ/2/4ER

1 + z21−γ/2/ERα

(2.2)

où p′α→β =pα→β+z

21−γ/2/2ERα

1+z21−γ/2/ERα

et zγ le γ-quantile d’une loi normale standard. Les

conditions d’application de cet intervalle de confiance sont 1) ERα est grande, 2)ERα · pα→β ≥ 10 et 3) ERα · (1− pα→β) ≥ 10.

2.1.2 Estimation de µ

Les quantités à estimer sont les composantes de µ = (µv, µc, µm).

Page 33: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

2.1. ESTIMATIONS STATISTIQUES ET RÉSULTATS 33

Figure 2.1: Estimation des probabilités de transition

Page 34: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

34 CHAPITRE 2. ESTIMATION DES PARAMÈTRES ET APPLICATIONS

Figure 2.2: Estimation de la loi initiale

Les estimateurs Nous rappelons que µα, α ∈ E est la probabilité d’occuperl’état eα à d = 1. Nous posonsN = (Nv, Nc, Nm) les nombres d’individus occupantrespectivement les états ev, ec et em à d = 1. N suit alors une loi multinomialede paramètres {n;µv, µc, µm}. L’estimateur du maximum de vraisemblance de µαα ∈ E = {"v","c","m"} est donc

µα =Nα

n, α ∈ E.

En appliquant ces estimateurs sur les observations par âge, nous constatonsune tendance générale où le taux d’activité diminue avec l’âge (Figure 2.2 haut)et que les deux taux d’hospitalisation augmentent avec l’âge (Figure 2.2 bas).

Les intervalles de confiance (proportion) Lorsque les conditions nµα ≥ 10

et n (1− µα) ≥ 10 sont remplies, le nombre d’assurés occupant eα à d = 1 noté Nα

suit approximativement une loi normale. Puisque µα est seulement Nα multipliépar une constante 1

n, µα suit aussi approximativement une loi normale. On a de

plus E (µα) = µα (sans biais) et Var (µα) = µα(1−µα)n

, ce qui implique :

Page 35: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

2.2. LISSAGE ET RÉSULTATS 35

Pr

(−z1−γ/2 <

µα − µα√µα (1− µα) /n

< z1−γ/2

)≈ 1− γ. (2.3)

D’où l’intervalle de confiance de µα de niveau asymptotique γ :

µ′α ± z1−γ/2

√µα (1− µα) /n+ z21−γ/2/4n

2

1 + z21−γ/2/n(2.4)

avec µ′α =µα+z21−γ/2/2n

1+z21−γ/2/n

et α ∈ E.

2.2 Lissage et résultats

Le lissage a deux objectifs : 1) dégager la tendance de l’évolution de(µ, P

)en

fonction de l’âge et 2) permettre une meilleure interprétation des différences entreles états.

2.2.1 Ajustement par régression de Poisson de P

2.2.1.1 L’idée

Le lissage portant sur l’âge, la variable âge x apparaîtra explicitement dans laformulation. L’objectif étant d’obtenir une courbe régulière de chaque composantede P par rapport à l’âge x, nous cherchons une fonctionnelle continue reliant cesdeux éléments. La fonctionnelle retenue est la suivante :pα→β (x) = exp (η (x)) , (α, β) ∈ E2, α 6= β,

pα→α (x) = 1−∑

β∈E,β 6=α pα→β (x) , α ∈ E(2.5)

avec

η (x) = b0 +J∑j=1

bjψj (x) (2.6)

pour les fonctions spécifiées ψj (x) de l’âge x servant de variables explicatives.Nous adopterons J = 2, ψ1 (x) = x et ψ2 (x) = x2 afin de décrire le fait que lesprobabilités d’hospitalisation augmentent avec l’âge et ce de plus en plus vite avecl’âge.

Les paramètres b = (b0, b1, b2) sont à déterminer. Parmi les méthodes pouvantpermettre cette tâche, le lissage par régression de Poisson a l’avantage de prendreen compte la loi sous-jacente du nombre de transitions (ici une loi de Poisson). Laprocédure de cette régression se résume en deux étapes :

1. Modélisation du nombre de transitions Nα→βx par une loi de Poisson dont le

paramètre est ERα · pα→β (x). Le terme ERα · pα→β (x) est considéré commeréalisation de ERα · pα→β (x). ERα est supposée connue.

Page 36: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

36 CHAPITRE 2. ESTIMATION DES PARAMÈTRES ET APPLICATIONS

Table 2.1: b par la méthode de Newton-Raphson généralisée

b0 b1 b2N v→cx -8,971476 -0,023098 0,00063893

N v→mx -10,16355 0,0092474 0,00039155N c→vx -0,786679 0,0042345 -0,0001626

Nm→vx -0,606184 -0,025392 0,0001653

N c→mx -4,799536 -0,007867 0,00020746

Nm→cx -4,372286 -0,048893 0,00055842

2. Estimation de b grâce à la méthode du maximum de vraisemblance en uti-lisant les relations (2.5) et (2.6).

2.2.1.2 La mise en œuvre

Nous notons [a1, a2] , (a1, a2) ∈ N2, a1 < a2 la plage d’âges étudiée. Nα→βx

est supposé suivre une loi de Poisson de paramètre ERα (x) pα→β (x). La suite{Nα→βa1

, x ∈ [a1, a2]}

est supposée i.i.d. La réalisation de cette suite est notée{nα→βa1

, x ∈ [a1, a2]}. Par conséquent, la fonction de vraisemblance de Nα→β

x , s’écrit(Denuit & robert (2007)) :

L (b) =

a2∏x=a1

e−ERα(x)pα→β(x)(ERα (x) pα→β (x))n

α→βx

Nα→βx !

(α, β) ∈ E2, α 6= β (2.7)

L’estimation de b par la méthode du maximum de vraisemblance s’obtienten maximisant la log-vraisemblance lnL (b), ce qui revient à résoudre le systèmesuivant pour b = (b0, b1, b2) :

∑x x[nα→βx − ERα · exp (b0 + b1x+ b2x

2)]

= 0∑x x

2[nα→βx − ERα · exp (b0 + b1x+ b2x

2)]

= 0∑x

[nα→βx − ERα · exp (b0 + b1x+ b2x

2)]

= 0

(2.8)

Les résolutions des bi par la méthode de Newton-Raphson généralisée (Nou-

gier (2001)) sont données dans la Table 2.1.

2.2.1.3 Résultats et interprétations

Grâce à ces valeurs de b, les neuf probabilités de transition lissées pα→β (x) , (α, β) ∈E2 s’obtiennent en utilisant (2.5). Dans la Figure 2.3, nous donnons, pour chaqueprobabilité de transition, son estimation avec l’intervalle de confiance associé, etsa valeur lissée. Nous constatons que sauf pour pm→v et pm→m, toutes les courbesont pu en général garder le positionnement à l’intérieur des intervalles de confiance

Page 37: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

2.2. LISSAGE ET RÉSULTATS 37

Fig

ure2.3:

Lissag

eet

intervallesde

confi

ance

Page 38: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

38 CHAPITRE 2. ESTIMATION DES PARAMÈTRES ET APPLICATIONS

correspondants. Pour pm→v (resp. pm→m), nous observons une tendance généralede diminution (resp. d’augmentation) avec l’âge mais les données sont trop fluc-tuantes pour que les lissages soient optimaux. Les âges où pm→v (resp. de pm→m)se situe en dehors de l’intervalle de confiance sont : 31 ans, 39 ans, 50 ans, 68 anset 77 ans (resp. 42 ans, 67 ans et 77 ans). Les primes pures calculées à partir deces valeurs lissées auront en conséquence les écarts assez importants par rapportaux valeurs observées.

Les Figures 2.4 et 2.5 ensemble mettent en évidence la différence entre deuxétats comparables. Ci-dessous nous commentons ces graphiques :

Commentaires sur la monotonie des courbes : Nous constatons sanssurprise que le taux des assurés valides (Figure 2.4 haut) et les taux de sortiedécroissent avec l’âge (Figure 2.4 bas). Les probabilités d’entrée (Figure 2.4 milieu),les probabilités de maintien (Figure 2.5 haut) et les probabilités de transition entreec et em (Figure 2.5 bas) s’accroissent avec l’âge.

Commentaires sur les positionnements relatifs des courbes : L’entréedans ec est plus fréquente que dans em (Figure 2.4 milieu). Néanmoins, une foisentré dans em, le séjour durera plus longtemps car la probabilité de maintien dansem est plus grande (Figure 2.5 haut) et que le taux de sortie de ec est plus élevé(Figure 2.4 bas). Ceci peut s’expliquer par le fait que la cause d’une hospitalisationmédicale serait, la plupart du temps, une maladie chronique et donc généralementde plus longue durée.

Maintenant examinons les transitions entre deux états d’hospitalisation (Figure2.5 bas). À tout âge, une hospitalisation chirurgicale suivie d’une hospitalisationmédicale est plus probable que l’inverse. Ceci confirme de nouveau que la caused’une hospitalisation médicale pourrait être une maladie chronique nécessitantpar la suite des interventions chirurgicale, alors qu’une entrée ec dès le débutmaintiendrait la plupart du temps cet état jusqu’à la sortie.

Commentaires sur la courbure : La probabilité d’entrée (resp. le taux devalidité) montre manifestement une augmentation (resp. une diminution) de plusen plus rapide avec l’âge. Les probabilités de maintien de ec et de em montrent peude courbure, elles peuvent être considérées linéaires en fonction de l’âge.

La sortie de ec décroît sensiblement de plus en plus vite avec l’âge tandis quela sortie de em décroît de plus en plus lentement et approche la constance vers53 ans. Autrement dit, l’âge n’a pas le même effet sur ces deux probabilités. Cecipourrait être interprété par le fait que la sortie de ec est souvent marquée par larécupération de l’état de santé et qu’en général les jeunes récupèrent plus vite,alors que pour une maladie de longue durée (maladies génétiques par exemple),qui est souvent le cas pour em, la taux de récupération ne peut plus être expliquésimplement par l’âge (pour les maladies génétiques, un jeune resterait hospitaliséaussi longtemps qu’un sénior).

Page 39: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

2.2. LISSAGE ET RÉSULTATS 39

Figure 2.4: Comparaison des états 1/2

Page 40: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

40 CHAPITRE 2. ESTIMATION DES PARAMÈTRES ET APPLICATIONS

Figure 2.5: Comparaison des états 2/2

En résumé : En comparant entre l’état d’hospitalisation chirurgicale ec etl’état d’hospitalisation médicale em, nous obtenons :

– pour ec, entrée plus fréquente, durée plus courte et sortie plus fréquente ;– pour em, entrée moins fréquente, durée plus longue et sortie moins fréquente.

2.2.1.4 Qualité de l’ajustement

La qualité du lissage peut être contrôlée par les trois critères suivants.

1. La déviance :

Dev = 2∑x

(Nα→βx ln

Nα→βx

ERα (x) pα→β (x)−(Nα→βx − ERα (x) pα→β (x)

))

2. Le pseudo-R2 :

R2Dev =

∑xN

α→βx ln

ERα(x)pα→β(x)

Nα→β•

−(Nα→βx − ERα (x) pα→β (x)

)∑

xNα→βx lnN

α→βx

Nα→β•

.

Page 41: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

2.2. LISSAGE ET RÉSULTATS 41

Table 2.2: Qualité de l’ajustement

Dev R2Dev Zα→β

pv→c 15,940 98,82 % 0,016pv→m 36,155 97,05 % 0,027pc→v 21,689 98,38 % 27,718pc→m 8,738 81,24 % 0,267pm→v 54,560 95,54 % 41,773pm→c 11,340 67,79 % 0,173

avec Nα→β• la moyenne des nombre de transition calculé sur l’ensemble des

assurés âgés de x années. Le Pseudo-R2 peut être interprété de façon similaireau R2 d’un modèle linéaire simple.

3. Le test du Chi-deux :

Zα→β =∑x

Nα→βx

(pα→β − pα→β)2

pα→β (1− pα→β).

La distribution de Zα→β est une loi de Chi-deux de d degrés de liberté avec

d = nb. d’âges-nb. paramètres e.m.v.+1.

Ici nous avons 3 paramètres e.m.v. b = (b0, b1, b2) et une plage d’âge allantde 23 à 80 ans, ce qui fait un d.d.l. de (80-23+1)-3+1=58.

Grâce à ces définitions, nous obtenons la Table 2.2 pour les six probabilités detransition traitées par la procédure de lissage. La déviance a servi pour calculerle R2

Dev. Les valeurs de pseudo-R2 nous indiquent un ajustement raisonnable. Lesestimations ont également validé le test du Chi-deux ce qui permet de retenirl’hypothèse nulle du bon ajustement (le test est validé si la valeur de Zα→β estinférieure à 74,468, soit le 0,95-quantile d’une loi de khi-deux de 58 d.d.l.). Nousremarquons particulièrement que pm→v a validé ce test même si son lissage se situepour certains âges en dehors de l’intervalle de confiance (Figure 2.3).

2.2.2 Lissage de µ

Avant toute opération, rappelons que la relation suivante devra être respectéepar les valeurs lissées :

µv (x) + µc (x) + µm (x) = 1, ∀x ∈ [a1, a2] (2.9)

Les estimations brutes de µv (x) = Pr (X1 (x) = ev), x ∈ [a1, a2] sont présentéesdans le premier graphique de la Figure 2.6. Visiblement cette quantité décroît avec

Page 42: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

42 CHAPITRE 2. ESTIMATION DES PARAMÈTRES ET APPLICATIONS

l’âge. Néanmoins, au point de vue lissage, une méthode paramétrique sera difficileà mettre en place car la tendance n’est apparemment ni linéaire ni polynomiale(ou exponentielle, logarithme...).

Par la suite, nous ferons une première tentative en utilisant la régression linéairecomprenant un terme au carré de l’âge. Nous verrons que l’ajustement n’est pasoptimal. Dans un second temps, une méthode non-paramétrique sera mise en placeavec les discussions sur son utilisation à l’égard de (2.9).

2.2.2.1 Première tentative : régression

Le modèle de lissage se présente de la façon suivante :

µα (x) = β0 + β1x+ β2x2 + ε, α ∈ E.

Le lissage de µv (x) est présenté par le deuxième graphique de la Figure 2.6. Lefait que le maximum se trouve à l’âge de 36 ans ne correspond pas à notre préférenceque le taux d’activité, décroissant avec l’âge, prenne son maximum à l’âge le plusjeune, en l’occurrence à 23 ans. Cette incohérence est due à la modélisation parune fonction polynomiale en général (car nous ne pouvons jamais nous assurer quele maximum se trouve à 23 ans). Cette première tentative a donc s’est traduit parun échec et nous amène à tester une méthode de lissage non-paramétrique.

2.2.2.2 Deuxième tentative : WH 1

Présentons d’abord µv obtenu par la méthode WH (Figure 2.7) avec le para-mètre de la régularité 2 h égal à 2. Nous constatons que le résultat est considérable-ment amélioré par rapport au lissage obtenu précédemment et correspond mieuxà nos attentes : la courbe ne s’arque pas au milieu et le maximum se trouve à l’âgede 23 ans. L’intervalle de confiance sur ce graphique est calculé selon (2.4).

Aussi efficace qu’elle soit, cette méthode ne peut être utilisée sans réserve. Lechoix entre fidélité et régularité est subjectif et il n’existe pas de meilleur lissage :tout dépend de ce que l’utilisateur entend par un bon ou un mauvais lissage. Dansl’illustration ci-dessus, que h soit égal à 3 ou 200, le résultat aurait été satisfaisant,mais à chaque choix différent de h, nous aurions obtenu des valeurs lissées diffé-rentes. Il est par conséquent important de garder à l’esprit la caractéristique de laméthode WH de par la flexibilité qu’elle offre, son utilisation doit être superviséesous peine de la violation de la relation (2.9).

Utilisation de la méthode Pour obtenir µ = (µv, µc, µm) par la méthode WH,trois démarches sont possibles :

1. Signifie la méthode de lissage de Whittaker-Henderson.2. Voir Planchet & Therond (2006) pour plus de détails sur la méthode WH.

Page 43: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

2.2. LISSAGE ET RÉSULTATS 43

Figure 2.6: µv par régression

Figure 2.7: µa par WH

Page 44: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

44 CHAPITRE 2. ESTIMATION DES PARAMÈTRES ET APPLICATIONS

Figure 2.8: Lissage de µc + µm par complément

– U n°1 Lisser les trois quantités successivement par la méthode de WH.Cette façon de procéder est évidemment à éviter car elle ne garantira pas larelation (2.9) pour tous les âges.

– U n°2 Lisser les deux entre elles par WH et calculer la troisième par (2.9).Les valeurs lissées valideront la relation (2.9) mais ce n’est non plus lameilleure option. En effet, nous obtenons des résultats variant selon le choixde la quantité à calculer par (2.9) et cette différence est évidemment dérai-sonnable.

Vu ces spécificités, nous ne pouvons que permettre d’utiliser une seule fois la mé-thode WH sur un des trois éléments à lisser afin de garantir la robustesse du lissage.Nous ferons le choix µv en raison de la réalisation plus fréquente de l’évènement{X1 = ev} par rapport aux évènements {X1 = ec} et {X1 = em}. Ceci nous donneUtilisation n°3 :

– U n°3 Appliquer WH aux µv et déterminer µc et µm par d’autres techniques.

µv étant obtenu dans la Figure 2.7, il nous reste à déterminer µc et µm. Unepartie de travail est déjà faite car en lissant µv, nous avons également lissé soncomplément par rapport à 1 : µc + µm (Figure 2.8).

Pour extraire µc de ˜µc + µm (valeurs lissées de µc + µm), il est souhaitable dedisposer d’un taux d’abattement τ pour que µc = τ

(˜µc + µm

), ou autrement dit,

un taux représentant la part de µc dans ˜µc + µm . Ce taux doit être bien entenduidentique pour tous les âges, sinon µc et µm ne seront pas lissés. L’existence du τconstant peut être justifiée par une analyse de régression.

Constance du taux d’abattement Soit le modèle linéaire ayant l’âge x commevariable explicative : τ (x) = ax+ b+ ε. L’idée est de conclure l’existence du taux

Page 45: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

2.2. LISSAGE ET RÉSULTATS 45

Table 2.3: Test de signe

Changements Nb d’âges p− valueµv 35 fois 58 0,148µc 27 fois 58 0,694µm 23 fois 58 0,148

unique par la nullité statistique du coefficient a. Cette nullité est souvent repéréepar le fait que l’intervalle de confiance de l’estimateur de a comprend 0.

La régression est réalisée avec les observations τ (x) = µc(x)µc(x)+µm(x)

, x ∈ [23, 80].Nous obtenons l’estimation a = −0, 0008051, son intervalle de confiance [−0, 0018,0, 00018] et la p− value associée 0,107. Ces chiffres corroborent notre position surla nullité de la pente a.

Nous pouvons dès à présent utiliser un τ correspondant à la moyenne des τ (x)

pondérés de l’effectif de chaque âge, ceci nous donne τ = 0, 4587. Le fait que lapart de µc sur µc + µm est légèrement inférieure à 50 % signifie que, dans un jourarbitrairement choisi, un assuré hospitalisé a légèrement moins de chance d’êtreen ec que d’être en em. Cette interprétation ne contredit pas les conclusions tiréessuite à la Figure 2.4 : l’entrée dans ec s’avère plus fréquente que dans em, mais lachance d’observer un em est favorisée par un séjour plus long dans cet état, ce quipeut faire qu’au global, une observation de em est plus probable qu’une observationde ec.

Grâce à la valeur de τ obtenue, µc et µm peuvent être séparées. Ces quantitéslissées sont présentées par la Figure 2.9a avec les intervalles de confiance. La diffé-rence entre µc et µm est illustrée dans la Figure 2.9b (gauche). Pour permettre unemeilleure visualisation de l’ajustement, nous avons repris le dernier graphique de laFigure 2.2 des taux bruts (Figure 2.9b droit). La courbe de µc se situe constammentau-dessous de celle de µc vu τ inférieur à 50 %.

2.2.2.3 Qualité du lissage

La qualité du lissage a été partiellement justifiée à travers des graphiques.Nous pouvons également réaliser un test de changement de signe, recommandépour valider un ajustement non-paramétrique (Planchet & Therond (2005)).Le résultat du test est donné dans la Table 2.3. Nous validons les valeurs ajustéespour un seuil de α = 0, 05 car les trois p− value sont supérieures à 0,05.

Page 46: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

46 CHAPITRE 2. ESTIMATION DES PARAMÈTRES ET APPLICATIONS

(a) Lissage et IC

(b) Comparaison de µc et µm

Figure 2.9: Lissage de µc et µm

Page 47: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

2.3. PRIME PURE ESTIMÉE 47

2.3 Prime pure estimée

Maintenant que nous disposons des estimations des paramètres, il s’agit d’unesimple application des formules obtenues dans Sections 1.4.2 et 1.4.3 pour calculerla prime pure avec ou sans franchise.

La Figure 2.10 montre, pour une garantie sans franchise, l’évolution des primespures du risque HC (hospitalisation chirurgicale) et du risque HM (hospitalisationmédicale) en fonction de l’âge. Nous constatons que la prime pure HM est en gé-néral supérieure à HC. D’une manière plus précise, la prime pure pour HM esten général 20 % plus élevée que celle pour HC. Ceci s’explique principale-ment par la durée plus longue de l’hospitalisation médicale. Les graphiques pources deux actes séparés avec respectivement une franchise d’un jour (K = 2) et dedeux jours (K = 3) sont similaires à la Figure 2.10, avec em se trouvant au-dessusde ec. La franchise n’affecte donc pas l’ordre relatif de la prime pure entre HM etHC.

La Table 2.4 montre ensuite numériquement l’influence de la franchise sur laprime pure ainsi que l’évolution de cette dernière en fonction de l’âge (échantillonde 7 âges). Nous lisons par exemple que la prime pure pour le risque HC d’unindividu âgé de 23 ans avec une indemnisation de 18€ versée dès le troisième jourd’hospitalisation est de 0,44€ par an. Pour le même âge et la même garantie, lerisque HM demande une prime pure de 0,55€ par an. Au total, les deux risquesseraient couverts pour une prime pure de 0,99€ par an. La prime diminue avecl’augmentation de K et cette diminution est plus ou moins considérable pour lesdifférents âges. On vérifie finalement que les écarts entre la Table 2.4 et la Table 0.2concernant les âges clés sont dus aux lissages. Finalement, pour les trois niveauxde franchise, la prime augmente avec l’âge.

L’effet de la franchise est de nouveau illustré par la Figure 2.11, mettant encomparaison les trois courbes de la prime totale (i.e. ec + em) pour respectivementune garantie sans franchise, avec une franchise d’un jour et une franchise de deuxjours. Encore une fois, la franchise n’a pas le même effet pour tous les âges. Pourexploiter cet aspect, la Table 2.5 compare le taux de diminution de la prime pourK = 2 et K = 3 par rapport à la prime sans franchise. On remarque que cettemesure de réduction du coût de garantie est plus efficace chez les jeunes que chezles sénior. Par exemple une franchise de 2 jours fairait diminuer par 59 % la primepour un assuré de 33 ans, alors que ce pourcentage serait seulement 40 % chez lesassurés de 80 ans.

Enfin, les montants de la prime pure obtenus ne paraissent pas très importants.Ceci est dû aux faibles taux de transition observés et à une garantie basse de 18€par jour.

Page 48: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

48 CHAPITRE 2. ESTIMATION DES PARAMÈTRES ET APPLICATIONS

Figure 2.10: Primes de risque pour ec et em

Table 2.4: Résumé numérique

Figure 2.11: Primes pures par niveau de franchise

Page 49: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

2.3. PRIME PURE ESTIMÉE 49

Table 2.5: Diminution de la prime par rapport à K = 1 (sans franchise)

Âge K = 2 K = 3

23 40 % 64 %33 36 % 59 %46 31 % 52 %56 28 % 48 %66 25 % 44 %76 23 % 41 %80 22 % 40 %

Page 50: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 51: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Chapitre 3

Hypothèses et réalité

Ce chapitre a pour objectif de revenir sur les hypothèses posées dans la mo-délisation et d’y proposer éventuellement des solutions. Parmi les cinq hypothèsesémises, les trois premières concernent la modélisation markovienne et les deuxdernières s’appliquent à l’estimation des paramètres du modèle.

Hypothèse 1 “La trajectoire d’hospitalisation d’un assuré obéit à unechaîne de Markov.”

Pour une chaîne de Markov, seul l’état occupé actuellement par l’assuré influencele futur. Bien entendu, cette hypothèse peut être mise en défaut, par exemplelorsque la durée du séjour dans un certain état influence vraisemblablement ledéroulement futur du contrat d’assurance. Dans le cas de la garantie d’hospitali-sation, un individu hospitalisé depuis un mois a moins de chance de revenir valideque s’il avait été hospitalisé depuis un jour. Autrement dit, la dépendance entrel’état du présent Xn et les états avant Xn−1 n’est pas complètement négligeable.

Une solution est de considérer un processus d’ordre supérieur qui inclut nonseulement Xn−1 pour expliquer Xn mais aussi Xn−2, Xn−3, ... , etc.

Hypothèse 2 : “La trajectoire d’hospitalisation d’un assuré obéit àune chaîne de Markov localement homogène.”

Par l’homogénéité locale, on entend que le processus est homogène par âge : laprobabilité de transition dépend uniquement du nombre de jours séparant les deuxdates d’observation mais non des dates calendaires, dès que les dates de survenancesont comprises dans la même période d’observation.

Selon Denuit & Robert (2007) : “l’homogénéité locale fournit le plus souventune bonne approximation de la réalité et permet des développements techniquesintéressants.”

Hypothèse 3 : “Pour un âge fixé, la chaîne est récurrente positive.”

Un état récurrent positif est tel que l’espérance du premier temps de visite à cet étatest finie. Une chaîne récurrente positive est telle que tous ses états sont récurrents

51

Page 52: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

52 CHAPITRE 3. HYPOTHÈSES ET RÉALITÉ

positifs. Vu le nombre d’états très limités (trois états) dans la chaîne modélisée etqu’aucune probabilité de transition n’est nulle, nous pouvons considérer que cettecondition est satisfaite.

Hypothèse 4 : “Les taux d’hospitalisation des assurés sont indépen-dants. De plus, les taux d’hospitalisation des assurés sont considérésindépendants d’une année à l’autre. ”

Pour une année fixée, la première moitié de l’hypothèse ne pose pas de problèmemajeur. En cas d’une observation étalée sur plusieurs années, l’indépendance entreles individus peut être remise en cause. Les observations portant sur le même indi-vidu à l’année N et à l’année N + 1 sont bien sûr dépendantes. Malheureusement,si nous avions gardé seulement une année d’observation, les données n’auraientpas été suffisantes pour alimenter les estimations et ce particulièrement pour lestransitions dites rares, par exemple entre les deux états hospitalisés.

Issus d’un grand portefeuille (116 000 assurés), la population pourrait êtreconsidérée mutualisée, comme si chaque année le portefeuille se renouvelait. L’hy-pothèse en question pourrait s’appliquer. Néanmoins, l’utilisation des observationspluriannuelles demeure une solution limitée et un compromis entre la disponibilitédes données et l’indépendance supposée des assurés.

Hypothèse 5 : “Le contrat Santé entre en vigueur au 1er janvier. Laloi initiale peut donc être estimée à cette date. ”

Ceci est “vrai” pour un contrat collectif. Néanmoins, dans le cas d’un contratindividuel auquel l’assuré peut souscrire à une date quelconque durant l’année,nous souhaitons avoir une loi initiale indépendante de la date de souscription.

La Figure 3.1 montre les observations sur le nombre d’assurés jounalier (sachantque l’effectif du portefeuille étudié est constant durant l’année) occupant l’état emde l’année 2010. Vu que la population retenue admet un effectif fixe, la variationsur ce graphique peut être considérée comme identique à la variation de µm selonla date. Nous voyons que le premier jour de l’année n’est pas la meilleure datepour estimer la loi initiale : le taux d’hospitalisation est plus bas que la plupartdes autres dates. En choisissant cette date pour conclure l’estimation, le taux dela sinistralité sera sous-estimé.

Page 53: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

53

Figure 3.1: Non constance de µm

Ce graphique montre d’ailleurs qu’entre d = 200 et d = 250, et entre d = 355

et d = 365 (zones grisées), deux fortes baisses se manifestent. Pendant ces dates,correspondant au mois d’août et à la fin d’année, la plupart des praticiens seraientabsents et/ou les assurés seraient moins souvent hospitalisés pendant les périodesde vacances.

Le choix de la date de l’évaluation devient donc problématique : il n’existepas une date pouvant représenter un niveau global du taux d’hospitalisation. Unesolution pourrait être la moyenne des estimateurs journaliers tel que l’estimateursuivant :

µα =1

T

(µ1α + . . .+ µTα

), α ∈ E.

Il existe cependant une difficulté dans la démarche statistique de cet estima-teur, par exemple le calcul de sa variance et de son l’intervalle de confiance, ainsique l’étude sur sa convergence. En effet, cette moyenne n’est pas la moyenne desvariables aléatoires indépendantes. Nous venons de voir que dans le cas de µm, lesestimateurs journaliers µ1

m, · · · , µTm varient selon la période d’observation, ils nesont donc pas indépendants entre eux.

Une analyse par la série temporelle, tenant compte de la saisonnalité du tauxd’hospitalisation, serait une amélioration possible pour étudier un contrat indivi-duel.

Page 54: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 55: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Conclusion

Les expériences des professionnels ont indiqué la séparation entre l’hospitali-sation médicale et l’hospitalisation chirurgicale en terme de la prime pure. Cettedistinction s’est vue confirmée dans nos démonstrations pour le portefeuille ob-servé. Nous sommes parvenus de plus à donner des explications : la prime pureélevée pour l’hospitalisation médicale est due à un séjour moyen en général pluslong.

Malgré les hypothèses fortes, le nouveau modèle de tarification, basé sur unechaîne de Markov, a su donner des estimations de la prime pure logiques et prochesde la réalité. C’est donc un modèle fiable. En plus de tarifer une garantie sansfranchise, ce modèle a permis :

1. d’exprimer mathématiquement les primes pures par des formules simples ;

2. d’appréhender l’évolution des probabilités de transition, d’occupation et demaintien en fonction de l’âge ;

3. de comparer ces probabilités entre elles ;

4. de tarifer une garantie d’hospitalisation avec franchise (une tâche que l’outilactuel de tarification de l’assureur ne peut pas assumer) et ainsi d’anticiperl’impact sur la prestation d’un éventuel désengagement de la Sécurité sociale.

En ce qui concerne l’effet de la franchise, nous avons obtenu les conclusions sui-vantes :

1. L’instauration d’une franchise est effectivement une mesure de réduction ducoût de garantie ;

2. L’ampleur de cette réduction est fonction de l’âge : pour une franchise d’unedurée fixée, les jeunes assurés bénéficient plus de cette mesure (cotisentmoins) que les assurés séniors.

Pourquoi modéliser ? Pourquoi ne pas estimer directement les duréesmoyennes et obtenir la prime pure ? Certes, l’utilité d’un modèle actuarieln’est pas jugée par sa complexité. Néanmoins, en plus de sa capacité à donnerla prime pure, le modèle markovien est plus adapté à l’évolution pathologique etdémographique que la durée de séjour. En voici quatre exemples :

55

Page 56: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

56 CHAPITRE 3. HYPOTHÈSES ET RÉALITÉ

1. Nouvelles maladies ou pandémies. Lorsqu’une nouvelle maladie ou une pan-démie apparaît, la hausse du taux d’hospitalisation en est une conséquencedirecte mais non la durée de séjour.

2. Développemet des technologies médicales. Avec la technologie, certaines ma-ladies génétiques seront soignées par des opérations chirurgicales, la haussedu taux de transition de l’hospitalisation médicale à l’hospitalisation chirur-gicale pourra alors être anticipée par le modèle markovien.

3. Spécificité du secteur d’activité des assurés. Selon une étude de l’Inserm, pourles femmes qui travaillent ou ont travaillé de nuit au cours de leur carrière,par exemple les infirmières, le risque de cancer du sein augmente de 30 %. Letaux d’hospitalisation à cause du cancer du sein serait donc plus élevé danscette population spécifique que la moyenne.

4. Viellissement de la population. Les hopitaux receuilleraient plus de personnesâgées qu’avant car l’Homme vit plus longtemps. Les taux d’hospitalisationaugmenteraient en conséquence.

Remarques importantes sur les données au-delà de 67 ans Dans la Figure2.9 (a), les intervalles de confiance pour les assurés âgés de plus de 67 ans noussignalent que les données ne sont pas suffisantes pour garantir la fiabilité desestimations à ces âges 1. Ainsi, il est possible que ces estimations soient au-dessousdes vrais taux d’hospitalisation. En effet, selon les expériences des professionnels,cette partie de la courbe aurait dû s’accroître plus rapidement que nos estimations,reflétant le fait que le risque d’hospitalisation pour les seniors est beaucoup plusélevé que pour le reste de la population. Ceci nous inspire de découper la plaged’âges en deux parties : inférieur ou égal à 67 ans et supérieur à 67 ans, et d’effectuerle lissage sur chaque partie. Cependant, la courbe globale obtenue admettra unpoint de discontinuité à x=67.

1. Ce manque de données provient du fait que les contrats étudiés sont des contrats collectifsdestinés aux salariés. Les observations après l’âge de 67 ans sont rares (observations possiblesnotamment pour les conjoints âgés ou les ascendants à charge).

Page 57: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Deuxième partie

Charge sinistres de la garantieVerres en assurance optique

57

Page 58: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 59: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Introduction

L’objectif et la garantie étudiée Dans le cadre de la modélisation stochas-tique préconisée par la réforme Solvabilité 2, la charge sinistres est considéréecomme une variable aléatoire et admet donc une distribution de probabilités.Lorsque l’évolution de la sinistralité est assez stable d’un exercice à l’autre, lemodèle dont les paramètres sont estimés par les données de l’année de survenanceN peut être utilisé pour prédire la distribution de la charge sinistres de l’année desurvenance N+1.

Dans ce contexte, la présente étude propose un modèle stochastique de la si-nistralité du risque verres optiques, l’objectif étant d’obtenir une approximation 2

de la distribution de la charge totale à partir des données de l’exercice précédent.Ainsi, un montant des fonds propres pour couvrir presque la totalité (99,5 % selonSolvabilité 2) des sinistres éventuels pour la prochain exercice pourra être donné.

La garantie étudiée Comme les garanties pour la monture et pour les lentillesde contacts, la garantie verres fait partie de la catégorie Optique figurant sur lecontrat de l’assurance santé.

Dans la plupart du temps, seulement deux verres sont remboursables par per-sonne et par an ; c’est le cas que nous allons étudier. Nous supposons de plus quela prestation est proportionnelle à la dépense engagée.

L’expression de la hauteur de garantie annuelle que pratiquent les assureurssanté peut être un montant fixe et forfaitaire comme 450€ par an, un pourcentagedu PMSS comme 8%PMSS ou bien un pourcentage de la base de remboursementdéfinie par la Sécurité sociale comme 2000%BR ; elle peut aussi être exprimée enpourcentage du montant de la dépense comme 95%FR. Nous adopterons cettedernière expression avec la part assurée a = 95%FR.

Présentation des données Pour alimenter les modèles mathématiques quenous allons établir, les données disponibles concernent les prestations en 2010 d’uncontrat appelé HTA. Il s’agit d’un contrat standard auquel les entreprises de toutsecteur peuvent souscrire. Les profils professionnels des assurés couverts sont donc

2. Le plus souvent, la distribution de la charge sinistres n’admet pas de forme fermée.

59

Page 60: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

60 CHAPITRE 3. HYPOTHÈSES ET RÉALITÉ

assez divers. La table de données fournie contient les informations suivantes dechaque assuré (une ligne correspond à un règlement) :

1. Numéro Sécurité Sociale : l’identifiant ;

2. Sexe : Homme ou Femme ;

3. Zone : zone de résidence. Île-de-France ou Province ;

4. Situation familiale : indique si l’assuré vit Seul ou en Couple (y comprismarié, pacsé et concubin) ;

5. Avoir enfant : Oui ou Non ;

6. Tranche d’âge : trois modalités : Jeune entre 18 ans et 34 ans, Moyen entre35 ans et 54 ans et Sénior à partir de 55 ans.

7. Montant de la dépense en euro pour deux verres. Vide pour les assurés non-consommateur.

Les colonnes 2 à 6 seront considérées comme les observations des variables explica-tives (ou facteurs) alors que la colonne 7, les observations de la variable de réponse.Toutes les variables explicatives ne seront pas retenues selon l’objectif partiel (lacharge sinistres sera décomposée en 3 parties) de l’étude.

Organisation de la Partie II L’étude se déroulera de la manière suivante :dans le chapitre qui suit, nous présenterons le modèle de référence de la chargesinistres de trois composantes : une constante et deux variables aléatoires. Lesdeux chapitres suivants traiteront respectivement les deux composantes aléatoires.Le dernier chapitre fera le retour sur la charge sinistres et présente notamment sescaractéristiques importantes et les approximations de sa distribution.

Page 61: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Chapitre 4

Le modèle de la sinistralité

Nous nous situerons dans le cadre du modèle individuel. Ainsi, sur un porte-feuille constitué de n assurés, en notant Sk, k = 1, · · · , n la charge individuelleéventuellement engendrée par l’assuré k, la charge totale du portefeuille s’écrit

S =n∑k=1

Sk. (4.1)

avec Sk prenant ses valeurs dans [0,∞) car les données comprennent les assuréssinistrés et non-sinistrés. Nous supposerons que les Sk, k = 1, · · · , n sont indépen-dantes et identiquement distribuées lorsque les assurés sont de profils similaires ausein d’une sous-population (spécifiée par les facteurs précités, colonnes 2 à 6 de latable de données).

L’étude de la distribution de S sous la formulation (4.1) est problématique carSk est une variable aléatoire du type mixte :

– Elle est discrète car une masse de probabilité est présente au {Sk = 0} :

Pr (Sk = 0) = Pr (l’assuré k n’achète pas de lunettes.)

Cette probabilité n’est évidemment pas nulle.– Elle est aussi continue car le montant de remboursement, lorsqu’il est supé-rieur à 0, est (considéré) continu.

Du point de vu échantillonnage de la v.a. Sk, on risque d’observer de nombreuxmontants nuls. En 2010 par exemple, la proportion moyenne des assurés non-acheteurs était de 58 %. La présence des zéros en grande quantité pouvant influen-cer la calibration de la loi de Sk, nous décomposons Sk de la façon suivante (leremboursement est proportionnel à la dépense) :

Sk = (a ·Xk) · Yk.

61

Page 62: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

62 CHAPITRE 4. LE MODÈLE DE LA SINISTRALITÉ

avec a ∈ (0, 1] la part assurée, Xk une v.a. continue représentant la dépense etYk une v.a. discrète de l’indicatrice de l’achat ou du non achat. Nous ferons leshypothèses suivantes :

– Yk, k = 1, · · · , n sont i.i.d que la v.a. Y ;– Xk, k = 1, · · · , n sont i.i.d que la v.a. X ;– Xk et Yk sout indépendants pour k = 1, · · · , n car la dépense est souvent

indépendante de la décision d’achat.Par cette décomposition, la charge totale S devient :

S =n∑k=1

(a ·Xk) · Yk. (4.2)

Ce nouveau modèle de base facilitera nos démarches d’aller plus loin sur la modéli-sation de S. D’un côté, l’évènement {S = 0} se comprend plus clairement qu’avant :{S = 0} ={aucun sinistre sur le portefeuille} = {Sk = 0 pour tout k = 1, · · · , n}car Sk ≥ 0 ; d’un autre côté, la probabilité de cet évènement s’écrit facilement :

Pr (S = 0) = Pr (Sk = 0 pour tout k = 1, · · · , n)

= [Pr (Sk = 0)]k Sk indép.

= [Pr (XkYk = 0, Yk = 1) + Pr (XkYk = 0, Yk = 0)]k proba. cond.

= [Pr (Xk = 0) Pr (Yk = 1) + 1× Pr (Yk = 0)]k Xk ⊥ Yk.

Puisque Xk est continue, Pr (Xk = a) est alors égale à 0 pour toute constante a ≥ 0

et on obtient finalement :

Pr (S = 0) = [Pr (Yk = 0)]k .

Autrement dit, la probabilité pour que la charge totale soit 0 est égale à laprobabilité que tous les assurés sont non-acheteurs.

En ce qui concerne la dépense Xk, son domaine demeure [0,∞) mais la chanced’observer un montant nul est minime. Une grande partie des occurrences nulles dela charge individuelle est ainsi transférée aux observations de l’indicatrice d’achat :si un assuré n’a pas consommé, nous aurons une réalisation de Yk égale à 0 et nousaurons par conséquent Sk = 0.

Yk s’assimile à une variable aléatoire de Bernoulli dont le paramètre s’interprètepar la probabilité d’achat ; Xk peut être modélisée comme une variable aléatoirepurement continue pour laquelle de nombreuses solutions sont disponibles pour lacalibration de sa loi. Étudier séparément Yk et Xk est par conséquent plus pratiqueque de modéliser directement la v.a. mixte Sk.

Dans la suite, la présentation se déroulera autour de l’équation (4.2) en com-mençant par la calibration de la loi de dépense.

Page 63: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Chapitre 5

Modélisation d’une dépensebimodale

Ce chapitre s’applique à la première composante aléatoire de la charge sinistresà savoir la dépense en verres optiques. On considère que la propriété i.i.d. de ladépense est respectée sur une sous-population du même sexe (deux modalités) etde la même tranche d’âge (trois modalités). Les six sous-populations (SP) sont lessuivantes : femme âgée de 18 à 34 ans (SP1) ; femme âgée de 35 à 54 ans (SP2) ;femme âgée de plus de 55 ans (SP3) ; homme âgé de 18 à 34 ans (SP4) ; hommeâgé de 35 à 54 ans (SP5) et homme âgé de plus de 55 ans (SP6).

5.1 Une dépense aléatoire bimodale

Nous appellerons la densité observée indirecte (abr. DOI) la densité es-timée par la méthode de noyau (voir Section 5.3.1). La figure suivante illustre laDOI de la dépense en 2010 pour la SP 2 (femmes âgées de 35 à 54 ans).

Figure 5.1: Dépense en verres optiques en 2010

63

Page 64: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

64 CHAPITRE 5. MODÉLISATION D’UNE DÉPENSE BIMODALE

Figure 5.2: Dépense en verres optiques en 2010 pour les 6 SP

Cette densité atypique manifeste deux maximums, nous indiquant la bi-modalitéde la dépense aléatoire. Traçons le même type de densité pour toutes les six sous-populations dans la Figure 5.2 : quatre sur six sous-populations nécessitent unemodélisation par variable aléatoire bimodale.

Par la suite, la sous-population des femmes âgées de 35 à 54 ans sera traitéeen particulier, la procédure étant bien évidemment similaire pour toutes les sous-populations dont la DOI comprend deux modes.

Page 65: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

5.2. MODÉLISATION PAR DENSITÉ COMBINÉE 65

5.2 Modélisation par densité combinée

Deux façons de visualiser la bi-modalité de X nous amènent aux deux modéli-sations différentes. La première consiste à supposer que la bi-modalité est issue dedeux évènements sous-jacents distincts, tandis que la deuxième met l’accent surl’approximation numérique de la DOI par une fonction par morceaux.

5.2.1 Modélisation par évènements

À l’observation des deux modes sur un graphique de DOI, l’explication premièreest telle que la source de données est mélangée des dépenses en deux types de verresdifférents. Ces deux types de verres peuvent être par exemple le cas des verres pourla myopie et les verres pour la hypermétropie, ou bien le cas des verres simples etles verres progressifs. L’ignorance du type de verres ne gênera pas la modélisation.

Soient X la v.a. bimodale de la dépense en verres optiques, fX (x) sa densitéabsolument continue et FX (x) sa fonction de répartition. Soient Ai l’évènementreprésentant le fait que l’assuré achète les verres du type i et Xi la dépense cor-respondante (i = 1, 2 ). X s’écrit alors

X = ZX1 + (1− Z)X2 (5.1)

avec

Z =

1, si A1 survient,

0, si A2 survient.

Cette écriture peut s’interpréter tel que : X est X1 si A1 survient et elle est X2

si A2 survient.Soit fi la densité de Xi et wi la probabilité que Ai survienne avec i = 1, 2,

w1 ≥ 0, w2 ≥ 0 et w1 + w2 = 1. Nous avons le résultat suivant (McLachlan &Peel (2000)) :

La densité f (x) peut être écrite comme la combinaison des deuxdensités f1 (x) et f2 (x) de pondérations respectives w1 et w2 :

fX (x) = w1 · f1 (x) + w2 · f2 (x) . (5.2)

De plus

Pr (Z = 1) = w1 et Pr (Z = 0) = w2.

Page 66: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

66 CHAPITRE 5. MODÉLISATION D’UNE DÉPENSE BIMODALE

La fonction fX (x) définie dans (5.2) est évidemment une densité. Par ailleurs, lemodèle correspond à (5.2) est connu sous le nom de modèle mélange (mixturemodel).

Hypothèse Gamma 1

Lorsque Xi ∼ Γ (θi) avec θi = (αi, βi) et i = 1, 2, notre modèle devientX = ZX1 + (1− Z)X2, Xi ∼ Γ (θi) , i = 1, 2

f (x; Ψ) = w1 · f1 (x;θ1) + w2 · f2 (x;θ2) , w2 = 1− w1

(5.3)

où Ψ = (w1, α1, β1, α2, β2) est le vecteur des paramètres et fi la densité d’une loiGamma Γ (θi) , i = 1, 2. La loi de X sera notée par Γcom (Ψ) ou X ∼ Γcom (Ψ). Lafonction de répartition de X se déduit facilement de (5.3), utile pour le contrôlede la qualité d’ajustement (goodness of fit) :

FX (x; Ψ) = w1f1 (x;θ1) + w2f2 (x;θ2) .

Un des avantages de la modélisation par évènements est qu’elle permet d’ex-primer certaines caractéristiques importantes de X par celles de X1 et X2 (Table5.1. Voir Annexe pour le calcul de la variance σ2

X).

5.2.2 Modélisation approximative

La méthode alternative pour appréhender la présence des deux modes sur legraphique de DOI est plus de nature numérique. En principe, elle découpe d’abordle domaine des valeurs de la dépense en deux au point du minimum de la DOI.Puis, elle approche chaque sous-courbe par une densité Gamma pondérée. De façonplus précise, nous supposons que la vraie densité de la dépense notée gX est unefonction par morceaux telle que :

gX (x) =

p1g1 (x) , si x < x0;

p2g2 (x) , si x > x0.(5.4)

avec x0 constante et correspondant au minimum de la DOI.Cette supposition est justifiée par la Figure 5.3 qui représente la décomposition

de la densité observée en deux cas spécifiques. Il apparaît que la DOI originale(Figure 5.3 gauche) provient des deux densités différentes et superposées : entre0 et x0, la densité A apparaît et à partir de x0, la densité B est observée. Ce

1. Lorsqu’une v.a. X suit une loi Gamma de paramètre α (shape parameter) et β (scaleparameter) notée Γ (α, β), sa densité est donnée par

fi (x;α, β) =xα−1e−

Γ (α)βα, α, β > 0.

Page 67: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

5.2. MODÉLISATION PAR DENSITÉ COMBINÉE 67

Table 5.1: Caractéristiques statistiques de X1, X2 et X

(a) Liste pour Xi ∼ Γ (θi) , i = 1, 2

Définition Notation Expression paramétriqueEspérance E (Xi) µi αiβiVariance V ar (Xi) σ2

i αiβ2i

MO-2∗ E (X2i ) m

(2)i σ2

i + µ2i

FGM∗ E(etXi

)Mi (t) (1− βit)−αi

MO-3 E (X3i ) m

(3)i αi (αi + 1) (αi + 2) β3

i

MC-3∗ E (Xi − µi)3 µ(3)i m

(3)i − µ3

i − 3µim(2)i + 3µ3

i

AsymétrieE(X3

i )V ar(Xi)

32

γiµ(3)i

σ3i

* MO-2 : Moment ordinaire d’ordre 2.* FGM : Fonction génératrice des moments.* MC-3 : Moment centré d’ordre 3.

(b) Liste pour X = ZX1 + (1− Z)X2

Notation Expression paramétriqueEspérance µX

∑2i=1wiµi

Variance σ2X

∑2i=1wi

[σ2i + (µi − µ)2

]MO-k∗ m

(k)X

∑2i=1wim

(k)i , k ∈ N

FGM MX (t)∑2

i=1wiMi (t)

MC-3 µ(3)X m

(3)X − µ3

X − 3µXm(2)X + 3µ3

X

Asymétrie γXµ(3)X

σ3X

* MO-2 : Moment ordinaire d’ordre 2.

graphique montre que la modélisation par fonction par morceaux est judicieuse.La Figure 5.3 (droite) reconstitue ces deux densités cachées en marquant les pointsclés.

Les pondérations p1 et p2 dans (5.4) sont nécessaires. En effet, à la présence deg2, g1 doit être minorée pour que gX soit une densité. Pour la même raison, g2 doitégalement être minorée. Les deux facteurs de minoration sont alors p1 et p2. À ladifférence de la modélisation par évènements (5.1), la relation p1 +p2 = 1 n’est pasautomatiquement respectée car p1 et p2 ne correspondent plus aux probabilités desévènements mutuellement exclusifs.

Hypothèse Gamma En supposant comme précédemment que gi est la fonctionde densité d’une loi Gamma Γ (ηi) avec ηi = (γi, δi) et i = 1, 2, l’équation (5.4)devient

gX (x; Φ) =

p1g1 (x;η1) , si x < x0

p2g2 (x;η2) , si x > x0(5.5)

Page 68: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

68 CHAPITRE 5. MODÉLISATION D’UNE DÉPENSE BIMODALE

Figure 5.3: Ajustement des deux densités - Gauche : DOI originale. Droite :densités composantes modélisées

où le vecteur des paramètres Φ = (p1, p2, γ1, γ2, δ1, δ2). Cette modélisation admetdes avantages et des inconvénients : vu que le nombre de paramètres à déterminerest augmenté à six au lieu de cinq, le modèle nous laisse anticiper une meilleureapproximation au sens de l’erreur quadratique moyenne de la DOI ; mais du fait dela modélisation par fonction par morceaux, les caractéristiques de X n’admettentpas de formes explicites. Cependant, nous pouvons toujours développer la fonctionde répartition de X notée GX (x; Φ) comme la suivante :

GX (x; Φ) =

ˆ x

0

gX (s; Φ) ds

=

´ x0p1 · g1 (s;η1) ds, x < x0´ x0

0p1 · g1 (s;η1) ds+

´ xx0p2 · g2 (s;η2) ds, x > x0

=

p1 ·G1 (x;η1) , x < x0

p1 ·G1 (x0;η1) + p2 ·G2 (x;η2)− p2 ·G2 (x0;η2) , x > x0.

avec Gi (x0;ηi) la fonction de répartition associée à gi (x;ηi) et i = 1, 2.

5.2.3 Point sur les modélisations

L’hypothèse Gamma était arbitraire. Des lois commeWeibull, Fréchet ou encorelog-normale aurait également pu ajuster la distribution de la dépense.

Nous avons fait remarquer que la modélisation par évènement possédait l’avan-tage d’exprimer explicitement des caractéristiques de la dépense comme l’espé-rance, la variance voire des moments d’ordre supérieur. Nous avons tout de mêmedécidé de présenter une modélisation alternative qui permet de diversifier et com-parer.

Page 69: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

5.3. ESTIMATION DES PARAMÈTRES 69

Les modèles étant établis, nous nous intéressons à présent à l’estimation deleurs paramètres inconnus, à savoir Ψ du modèle (5.3) et Φ du modèle (5.5).

5.3 Estimation des paramètres

L’estimation ne se fait pas sans donnée. En fonction de la modélisation de X etde la méthode d’estimation, deux échantillons différents et étroitement liés serontutilisés.

5.3.1 Préliminaires

Deux échantillons appariés Nous appelerons l’échantillon orignal la co-lonne du montant de la dépense dans la table de données observées. Lors d’uneestimation de la densité par la méthode de noyau (kernel density estimation), undeuxième échantillon des dépenses est généré sous forme d’une suite arithmétiquede dépense. Il n’est donc pas un ensemble des réalisations d’une variable aléatoire.Il admet la même étendue que l’échantillon original mais souvent de taille réduite.Ce deuxième échantillon sera désigné par l’échantillon modifié. La densité esti-mée par la méthode de noyau sera appelée la densité observée indirecte (abr. DOI,comme définie précédemment).

Par les constructions des deux modèles, l’échantillon original servira à l’estima-tion de Ψ du modèle par évènement (5.3) et l’échantillon modifié, à l’estimationde Φ du modèle approximatif (5.5).

Méthodes utilisées Notre objectif est d’estimer Ψ ou Φ. Plusieurs méthodessont envisageables à cet effet dont trois seront démontrées : l’algorithme EM, mini-misation de la distance Anderson-Darling (abr. minimisation A.-D.) et finalementla méthode des moindres carrés ordinaire (abr. MCO).

L’algorithme EM est applicable uniquement pour l’estimation de Ψ provenantd’un modèle mélange avec une v.a. non-observable Z. C’est une des solutions clas-siques lorsque les statisticiens sont confrontés à l’estimation d’un modèle mélange.

Outre cet algorithme nécessitant une programmation complexe, les deux mé-thodes alternatives suivantes admettent une mise en place plus simple (réalisablepar exemple avec le Solveur d’Excel) et des interprétations plus intuitives.

La première solution alternative et innovante que nous allons proposer consisteà minimiser la distance d’Anderson-Darling entre la fonction de répartition empi-rique et celle modélisée. Cette méthode peut s’appliquer à la fois à l’estimation deΨ et à l’estimation de Φ.

Page 70: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

70 CHAPITRE 5. MODÉLISATION D’UNE DÉPENSE BIMODALE

La deuxième alternative est celle de la MCO qui consiste à minimiser l’erreurquadratique moyenne de la DOI et de la densité modélisée. Cette méthode peutêtre utilisée pour estimer Ψ et Φ.

Schéma de comparaison La performance des méthodes sera comparée selondifférents critères et sur les résultats suivants :

1. L’estimation de Ψ donnée par l’algorithme EM en utilisant l’échantillon ori-ginal ;

2. L’estimation de Ψ donnée par la minimisation de la distance d’Anderson-Darling en utilisant l’échantillon original ;

3. L’estimation de Φ donnée par la méthode MCO en utilisant l’échantillonmodifié.

5.3.2 Algorithme EM 2

Cet algorithme est constitué des deux étapes dites Étape E et Étape M s’alter-nant en itération pour s’approcher des vraies valeurs des paramètres. L’itérationest considérée achevée lorsque la vraisemblance estimée est arbitrairement prochede sa valeur maximale.

Avant de démarrer l’itération, une valeur initiale de Ψ notée Ψ(0) doit êtrefixée. Ensuite, la première estimation de Ψ notée Ψ(1) est obtenue en maximisant laquantité Q

(Ψ; Ψ(0)

), qui est en effet un cas particulier de la quantité Q

(Ψ; Ψ(k)

)définie par l’équation suivante (en respectant la notation du modèle (5.3)) :

Q(Ψ; Ψ(k)

)=

2∑i=1

n∑j=1

τi

(xj; Ψ

(k)){

logw(k)i + log fi

(xj;θ

(k)i

)}.

τi

(xj; Ψ

(k))

=w

(k)i fi

(xj;θ

(k)i

)∑2

h=1w(k)h fh

(xj;θ

(k)i

)et {x1, . . . , xn} l’échantillon orignal de la dépense.

Du même principe, la (k + 1)-ième estimation de Ψ notée Ψ(k+1) est obtenue enminimisant la quantité Q

(Ψ; Ψ(k)

). Ceci signifie que la (k + 1)-ième estimation

de wi est donnée par

w(k+1)i =

1

n

n∑j=1

w(k)i τi

(xj; Ψ

(k)), i = 1, 2,

alors que θ(k+1) est la solution de l’équation

2. Consulter McLachlan & Peel (2000) pour une présentation plus détaillée.

Page 71: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

5.3. ESTIMATION DES PARAMÈTRES 71

∂Q(Ψ; Ψ(k)

)∂θ

= 0.

Le calcul de la quantité Q(Ψ; Ψ(k)

)est appelé Étape E et sa minimisation,

Étape M. Ces deux étapes s’alternent de manière répétitive à chaque valeur dek > 0, jusqu’à ce que la différence

| L(Ψ(k+1)

)− L

(Ψ(k)

)|

varie autour d’une valeur arbitrairement petite.

5.3.3 Minimisation de la distance d’Anderson-Darling

Contrairement aux procédures usuelles basées sur l’estimation statistique desparamètres inconnus et passées par la suite sous des tests de validation, cetteméthode inverse la démarche en partant directement d’une statistique de test re-présentative, en faisant celle-ci de mesure de différence. Le choix de la distanced’Anderson-Darling comme cette mesure est soutenue par sa propriété de surpon-dérer la queue de distribution, “une propriété à privilégier en assurance non-vie(Partrat & Besson (2005))”.

La distance d’Anderson-Darling entre la fonction de répartition modélisée FXet la fonction de répartition empirique est définie par

A2n (FX (x; Ψ)) = −n− 1

n

n∑i=1

(2i− 1){

lnFX(x(i); Ψ

)+ ln

[1− FX

(x(n−i+1); Ψ

)]}(5.6)

avec n la taille de l’échantillon original et x(i) la i-ième observation de l’échan-tillon original ordonné. Les paramètres cherchés sont donc ceux qui minimisent laquantité A2

n (FX (x; Ψ)).

5.3.4 Méthode MCO

Cette méthode consiste à trouver le Φ minimisant l’erreur quadratique moyenne(MSE) entre la DOI fn (xi) et la densité gX (xi; Φ) définie par l’équation (5.5). Surl’échantillon modifié x1, . . . xd, la quantité à minimiser s’écrit

MSE(Φ)

=1

d

d∑i=1

[fn (xi)− gX (xi; Φ)]2 . (5.7)

La fonction gX (xi; Φ) doit respecter certaines conditions afin que la minimisa-tion corresponde à nos attentes.

Page 72: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

72 CHAPITRE 5. MODÉLISATION D’UNE DÉPENSE BIMODALE

Recherche des conditions de la minimisation Bien que la modélisation pardeux évènements sous-jacents n’est pas appelée dans le modèle (5.5), le fait quefn est bimodale nous suggère la réelle existence de ces évènements. Les conditionsprincipales auxquelles gX

(xi; Φ

)devra respecter, portent donc logiquement sur

l’emplacement des deux modes de la DOI fn (xi) : il est souhaité que la densitémodélisée reproduise les mêmes modes que la DOI afin de conserver la doubleprovenance des données (dépenses sur deux types de verres différents). Sur laFigure 5.3 (droite), les valeurs-clé mises en évidence nous indiquent que la densitég1 (x; η1) doit satisfaire à ce qu’elle prenne son maximum z1 = g1 (x?1; η1) = 0, 0022

à x?1 = 211€ et que la densité g2 (x; η2) prenne son maximum z2 = g2 (x?2; η2) =

0, 0010 à x?2 = 570€. Ceci se traduit par les relations suivantes :

Conditions (1) et (2) :

p1g1 (x?1; η1) = z1

∂∂xg1 (x?1; η1) = 0

,

Conditions (3) et (4) :

p2g2 (x?2; η2) = z2

∂∂xg2 (x?2; η2) = 0

.

Étant donnée que la mode d’une loi Gamma 3 Γ (ηi) est (γi − 1) δi, les condi-tions (2) et (4) se simplifient :

Conditions (1) et (2) :

p1g1 (x?1; η1) = z1

(γ1 − 1) δ1 = x?1

,

Conditions (3) et (4) :

p2g2 (x?2; η2) = z2

(γ2 − 1) δ2 = x?2

.

Hormis l’emplacement des maximums, nous devons avoir´∞0gX (x) dx = 1, ou

de façon équivalente :

Condition (5) : p1 ·ˆ x0

0

g1 (t; η1) dt+ p2 − p2 ·ˆ x0

0

g2 (t; η2) dt = 1 (5.8)

avec x0 l’abscisse du point d’intersection.Selon la modélisation approximative (5.4), il nous reste à préciser le point de

séparation des deux densités pondérées. En effet, sur la Figure 5.3 (droite), nousconstatons tout d’abord un maximum, puis un minimum et enfin un deuxièmemaximum. Le point de séparation correspond à l’observation du minimum.

3. Pour une v.a. X ∼ Γ (α, β), nous avons

∂xfX (x) =

1

Γ (α)βα

((α− 1)xα−2e−

xβ + xα−1e−

(− 1

β

)),

Le maximum de fX (x) est atteint pour x∗ tel que ∂∂xf1 (x∗) = 0 ⇐⇒ (α− 1) = x∗

β ⇐⇒ x∗ =

(α− 1)β.

Page 73: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

5.3. ESTIMATION DES PARAMÈTRES 73

Table 5.2: Estimations par méthodes

EM A.-D. MCOw1 0,5519 0,5569 p1 0,6441α1 5,0724 5,3246 p2 0,5862α2 9,7956 10,2822 γ1 4,2400β1 47,2758 45,2901 γ2 6,4429β2 66,5334 63,5065 δ1 65,2181

δ2 92,8878

Discussion sur la méthode MCO En réalité, en augmentant le nombre decontraintes portant sur gX , Φ pourrait être exactement déterminée sans faire appelà l’approximation du type MCO. La condition suivante pourrait par exemple êtrerajoutée :

Condition (6) : g1 (x0; η1) = z0.

ou bien encore

Condition (7) : g1 (x0; η1) = g2 (x0; η2) .

Nous n’avons pas procédé en suivant cette piste en considérant que pour lephénomène étudié, le plus important était de respecter l’emplacement des modesafin de révéler l’hétérogénéité de la dépense. Le reste, nous avons souhaité nouslaisser guider par les données observées.

Cependant, l’idéal aurait été d’imposer seulement les Conditions (1) à (4). Nousavons toutefois conservé la Condition (5) de l’emplacement du point d’intersection,au lieu de laisser estimer ce dernier par le programme de minimisation. En effet,nous considérons que la donnée de x0 est nécessaire à la spécification du modèle, ilest donc connu. Dans le cas contraire où x0 est un inconnu à estimer, nous aurionseu d (la taille de l’échantillon modifié) différentes spécifications du modèle, ce quiaurait rendu fastidieuses les tâches d’optimisation et de validation.

5.3.5 Bilan de la méthodologie

5.3.5.1 Estimations par méthodes

La Table 5.2 nous montre que l’algorithme EM et la minimisation de la distanced’Anderson-Darling nous donnent des estimations similaires.

5.3.5.2 Qualité des estimations

Dans cette section, la lettre m désignera la taille de l’échantillon, original oumodifié, selon méthode. FX (resp. fX) signifiera la fonction de répartition (resp.

Page 74: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

74 CHAPITRE 5. MODÉLISATION D’UNE DÉPENSE BIMODALE

la densité) modélisée i.e. FX (resp. fX) correspond à FX (x; Ψ) (resp. fX (x; Ψ))pour la modélisation par évènements et à GX (x; Φ) (resp. gX (x; Φ)) pour la mo-délisation approximative.

Les critères nous aidant à décider entre les approches sont les suivants :

1. La distance d’Anderson-Darling définie comme suit :

A2m (FX) = −m− 1

m

m∑i=1

(2i− 1) {lnFX + ln (1− FX)}

2. La distance de Kolmogorov-Smirnov

Elle est définie par

Dm (FX)4= max

[D+m (FX) , D−m (FX)

]avec

D+m (FX)

4= max1≤i≤m

[i

m− FX

(x(i))]

D−m (FX)4= max1≤i≤m

[FX(x(i))− i− 1

m

]Sa forme modifiée 4 s’écrit D∗m

4= Dm

(√m− 0, 01 + 0,85√

m

).

3. L’écart de Cramér-Von Mises

Sa définition :

W 2m (FX)

4=

1

12m+

m∑i=1

[FX(x(i))− 2i− 1

2m

]2.

Sa forme modifiée : W ∗m

4=(W 2m −

0,4m

+ 0,6m2

) (1 + 1

m

).

Ces trois quantités sont généralement appelées statistiques EDF, destinées àcontrôler l’adéquation de la fonction de répartition ajustée.

4. MSE

À côté des statistiques EDF, nous disposons également d’un critère plusclassique et plus populaire qui est l’erreur quadratique moyenne (MSE). Lapopularité de cette mesure provient de sa définition intuitive et sa mise enplace pratique. Dans ce contexte précis, elle est définie par

1

m

m∑i=1

(fX − fm (xi))2

où fm (xi) est la DOI.4. La statistique modifiée neutralise l’effet de la taille de l’échantillon m pesant sur la statis-

tique originale (Partrat & Besson (2005)).

Page 75: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

5.3. ESTIMATION DES PARAMÈTRES 75

Table 5.3: Critères d’adéquation

(a) Résultats tests

Algo. EM Dist. A.-D. MCOA2m (F ) 1,2202 0,8951 5,0969

D∗m (F ) 1,0599 0,8457 25,3151W ∗m (F ) 0,1556 0,0959 2,2581MSE 4,25×10−9 4,25×10−9 1,47×10−9

(b) Quantiles d’ordre (1− α) destests

α =0,25 α =0,15Am 1,248 1,610D∗m 1,019 1,138

(W 2m)∗ 0,209 0,284

Les statistiques présentées ci-haut sont calculées pour les trois méthodes envi-sagées (Table 5.3a). Les estimations obtenues par la minimisation de la distanced’Anderson-Darling sont les meilleures parmi les trois méthodes au sens EDF. Afinde compléter le test, la Table 5.3b nous donne des quantiles d’ordre (1− α) de Am,D∗m et (W 2

m)∗. Nous remarquons que la minimisation A.-D. et l’algorithme EM ont

validé tous les tests au seuil α = 0, 05. La méthode MCO n’a validé aucun test auseuil α = 0, 05 mais elle admet la MSE la plus petite (nous rappelons que la MSEétait justement sa fonction cible à minimiser).

La Figure 5.4 d’exploite la performance MSE des méthodes au niveau de ladensité. Visiblement, les paramètres obtenus par la MCO ajuste le mieux la DOI.

MCO est-elle meilleure ? La visible contradiction entre la meilleure méthodeau sens EDF et la meilleure méthode au sens MSE s’explique par les deux échan-tillons différents utilisés pour les estimations.

Nous rappelons que l’échantillon utilisé pour l’algorithme EM ainsi que pourla minimisation A.-D. comprend l’intégralité des observations. Ainsi, chaque ob-servation a contribué à la construction de la fonction de répartition empirique.

En revanche, l’ajustement selon MSE a été établit sur un échantillon réduitqui est une suite arithmétique entre les deux extrêmités de l’échantillon original.En effet, la densité estimée par la méthode de noyau au point x correspond à lamoyenne calculée sur un nombre d’observations situant autour de x en un diamètrefixe. Nous pouvons bien entendu estimer la densité à n’importe quel point x, maisle plus souvent, l’estimation est faite pour des points fixes et équi-espacés appelésles nœuds. L’ensemble des nœuds forment un échantillon que nous avions définiprécédemment comme l’échantillon modifié. La méthode de noyau étant souventutilisée comme une technique de lissage, le nombre des nœuds doit évidemment

Page 76: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

76 CHAPITRE 5. MODÉLISATION D’UNE DÉPENSE BIMODALE

Figure 5.4: Qualité d’ajustement : densité

Page 77: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

5.3. ESTIMATION DES PARAMÈTRES 77

être inférieur au nombre d’observations pour que le lissage ait un sens pratique (Li

& Racine (2007)).

Revenons à notre semblable contradiction. Concernant la question posée au dé-but du paragraphe, la réponse est négative. L’écart entre la MSE de l’algorithmeEM (ou la minimisation A.-D.) et la MSE de la méthode MCO n’est autre quel’écart entre une approximation directe et une approximation basée sur l’approxi-mation (en prenant des valeurs moyennes sur des observations brutes), qui parconséquent subit doublement l’effet de la perte d’information.

5.3.5.3 Résumé

Algorithme EM :

– principe mathématique complexe : calcul de la vraisemblance conditionnelle àla présence d’une variable aléatoire non observable, minimisation nécessitantune résolution numérique et critère d’arrêt de l’itération arbitraire ;

– base théorique la plus adaptée : méthode destinée à l’estimation du mo-dèle mélange à la présence d’une variable aléatoire non-observable (type deverres) ;

– mise en place problématique : demande d’une programmation complexe.

Minimisation de la distance d’Anderson-Darling :

– tout d’abord, méthode innovante ;– principe théorique assez intuitif : minimisation de la distance d’Anderson-Darling entre la fonction de répartition empirique et la fonction de répartitionsupposée ;

– méthode adaptée : mesure destinée à contrôler la qualité de calibration, lafonction de répartition ainsi obtenue valide probablement le test d’EDF ;mesure de la distance prioritaire en assurance non-vie ;

– mise en place facile : réalisable sous Excel Solveur.

Méthode des moindres carrés ordinaires (MCO) :

– principe mathématique universellement accessible ;– méthode moins adaptée car ne tient pas compte la source de la bi-modalité.Il s’agit plutôt d’une approximation mécanique qu’une modélisation mathé-matique proprement dite.

– mise en place facile : réalisable sous Excel Solveur.

Page 78: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

78 CHAPITRE 5. MODÉLISATION D’UNE DÉPENSE BIMODALE

Figure 5.5: Validation par graphiques - Haut : Quantiles de la loi ajustée par laminimisation A.-D. contre quantiles empiriques. Bas : f.d.r. ajustée contre f.d.r.empirique.

5.4 Conclusion

Nous retenons le modèle par évènements dont les paramètres sont donnés parla minimisation de la distance d’Anderson-Darling.

Cependant, ceci reste notre choix pour la problématique confrontée. Il peut enaller différemment par exemple pour les utilisateurs tolérant l’invalidité des testsd’EDF de la méthode MCO : ces utilisateurs privilégieront cette méthode pourson accessibilité universelle. De plus, la qualité des estimations MCO peut êtreaméliorée en augmentant le nombre de nœuds de la DOI.

Revenons sur le modèle que nous retenons. Nous le validons par un QQ-plot (Fi-gure 5.5 haut) et un graphique de fonction de répartition empirique versus fonctionde répartition ajustée (Figure 5.5 bas). Dans la Figure 5.5 (bas), les deux courbesse confondent visiblement car les écarts entre elles sont minimes. L’ajustement estraisonnable, la méthode est validée.

Nous avons ainsi terminé à ajuster la loi de la dépense. Désormais, la v.a. X(avec son nom complet : dépense aléatoire en verres optiques qu’engagerait une

Page 79: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

5.4. CONCLUSION 79

femme âgée de 35 à 54 ans) admet la fonction de densité suivante :

f (x ; w1, α1, β1, α2, β2) = w1 · f1 (x ; α1, β1) + (1− w1) · f2 (x ; α, β2)

avec– fi (x ; αi, βi) la densité d’une loi Gamma Γ (αi, βi), i = 1, 2

– Ψ = (w1, α1, β1, α2, β2) donné dans la deuxième colonne de la Table 5.2.

Page 80: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 81: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Chapitre 6

Modélisation de la probabilitéd’achat

Ce chapitre traite la deuxième composante du modèle individuel : le compor-tement d’achat ou de non-achat de l’assuré.

Vu la nature binaire du problème, l’étude se dirigera rapidement vers le sujetde la probabilité d’achat, ou en d’autres termes la proportion des acheteurs sur unepopulation homogène. Nous commençons par l’estimation ponctuelle et l’estima-tion de l’intervalle de confiance de cette probabilité pour chaque sous-populationprédéfinie. Ces probabilités estimées sont ensuite traitées comme les réalisations dela variable de réponse dans le cadre des analyses de régression. Comme précédem-ment, nous préférons proposer plus d’une solution à la problématique rencontrée.Ainsi, la régression sera abordée par trois approches différentes qui feront l’objetdes discussions dans la Section 6.6 avant la conclusion du chapitre.

6.1 Modélisation préliminaire

L’assuré étant remboursé au plus une fois par an, l’achat ou le non-achat peutêtre modélisé par une v.a. Yi, i = 1, . . . , n telle que

Yi =

0, si l’assuré i n’achète pas de verres

1, si l’assuré i achète au moins une paire de verres.

avec n l’effectif de la sous-population considérée sur laquelle la suite des v.a.Y1, . . . , Yn sont i.i.d. Nous notons Y la v.a. parente i.e. ∀i, Y et Yi sont i.i.d.Soient p = Pr (Y = 1) la proportion des acheteurs et q = 1 − p = Pr (Y = 0), laproportion des non-acheteurs. Y suit alors une loi de Bernoulli de paramètre p i.e.Y ∼ Ber (p).

Le paramètre p correspond à la notion de la fréquence relative du sinistre dansl’assurance non-vie. Il sera notre variable d’intérêt à la place de Y , ou en langage

81

Page 82: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

82 CHAPITRE 6. MODÉLISATION DE LA PROBABILITÉ D’ACHAT

de l’analyse de régression, la variable à expliquer par les variables exogènes telsque le sexe et l’âge de l’assuré.

Dans nos formulations de la régression, la v.a. Y désignera de manière généralela variable parente de l’indicatrice d’achat sur une sous-population donnée. Y adu sens uniquement lorsqu’elle est associée à une sous-population spécifique.

6.2 Estimation de p

Estimation ponctuelle de p L’estimation se réalise à partir de l’échantillon(y1, ..., yn) de Y . L’estimateur du maximum de vraisemblance de p est donné par

p =

∑ni=1 yin

=m

n(6.1)

avec m le nombre de yi de valeur 1. Cet estimateur coïncide avec celui obtenu parla méthode de moment. Il est de plus sans biais, convergent et efficace.

Intervalle de confiance de p Lorsque les conditions np ≥ 10 et n (1− p) ≥ 10

sont remplies, nous pouvons utiliser l’intervalle de confiance d’une proportion :

p± z1−α/2

√pq/n+ z21−α/2/4n

2

1 + z21−α/2/n(6.2)

– p =p+z2

1−α/2/2n

1+z21−α/2/n

;– q = 1− p ;– zq le q-quantile d’une loi normale standard N (0, 1).

Les estimations calculées selon (6.1) et les intervalles de confiance du niveau α =

0, 05 calculés selon (6.2) pour toutes les sous-populations sont présentées dans laTable 7.8 (Annexe). Aucun intervalle ne comprend zéro mais la Ligne n° 43 neremplit pas la condition np ≥ 10. Par conséquent, l’intervalle de confiance pourcette sous-population n’est pas fiable.

Notre étude se poursuit avec l’influence des variables exogènes sur la probabilitéd’achat. Les variables disponibles pour exploiter cette probabilité sont les colonnes2 à 6 de la table de données. Il s’agit des informations suivantes de l’assuré : sexenoté x1, zone de résidence notée x2, situation familiale notée x3, avoir enfant ounon noté x4 et la tranche d’âge notée x5.

Nous nous intéressons dans un premier temps à l’influence individuelle dechaque facteur sur la probabilité d’achat.

Page 83: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

6.3. ETUDES DES VARIABLES EXPLICATIVES 83

6.3 Etudes des variables explicatives

Variables à considérer et l’absence d’effet du revenu sur la fréquenceLes facteurs considérés influençant potentiellement le comportement d’achat sontle sexe, la zone de résidence, la situation familiale, le fait d’avoir un enfant ounon et la tranche d’âge. Au début de l’étude, nous disposions également du facteurcatégorie socioprofessionnelle (CSP). Des tests statistiques effectués sur l’ensembledes facteurs ont montré que la CSP est sans conséquence sur le comportementd’achat. Afin de simplifier la présentation, nous avons donc décidé d’éliminer laCSP afin de ne retenir que cinq variables explicatives. Etant donné que le salairedes cadres est supérieur à celui des non-cadres dans une entreprise spécifique,ces tests confirment que le salaire n’a pas d’effet significatif sur le comportementd’achat. Ceci signifie, par exemple, qu’un salarié à bas revenu aurait la mêmeprobabilité qu’un cadre supérieur d’aller acheter des lunettes (le prix de celles-cin’a pas d’importance) au plus une fois par an.

Significativité des variables explicatives Ici est présentée la méthodologiepour tester si, isolé, chaque facteur a une importance significative sur la probabilitéd’achat. La Table 6.1a et la Table 6.1b donnent les distributions de l’effectif totalet l’effectif des acheteurs selon x1 à x5 vues isolément. Pour chaque facteur, la casegrisée signale la modalité de référence retenue.

Pour commencer, nous testons s’il existe une différence entre le taux d’achatdes femmes et celui des hommes. En notant p1 la proportion des femmes acheteurs,p2 celle des hommes acheteurs, le test s’établit comme le suivant :

H0 : p1 = p2, H1 : p1 6= p2.

Sont notés respectivement :– n1 et n2 nombres d’assurées et d’assurés ;– X1 et X2 nombres d’acheteurs femmes et d’acheteurs hommes ;– p1

4= X1

n1et p2

4= X2

n2les estimateurs sans biais des probabilités d’achat.

Sous H0 et lorsque n1 et n2 sont grands, la statistique

z4=

p1 − p2√p (1− p)

(1n1

+ 1n2

) (6.3)

suit asymptotiquement N (0, 1) avec p = n1

n1+n2p1 + n2

n1+n2p2. H0 sera donc rejetée

au niveau approximatif α = 0, 05 si z > 1, 96 ou z < −1, 96.Selon le même principe, nous calculons les valeurs de z pour tous les facteurs

(Table 6.2). La z-valeur de x1 était supérieure à 1,96. Nous rejetons donc H0 etconsidérons que le taux d’achat dans les deux populations opposées par le sexe est

Page 84: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

84 CHAPITRE 6. MODÉLISATION DE LA PROBABILITÉ D’ACHAT

Table 6.1: Nombre d’assurés par facteur

(a) Distribution de l’effectif

ModalitésNombred’assurés

TotalNombred’assurés

Total%

x1Homme 8700

1619753,7 %

100 %Femme 7497 46,3 %

x2Île-de-France 6669

1619741,2 %

100 %Province 9528 58,8 %

x3Seul 2866

1619717,7 %

100 %Couple 13331 82,3 %

x4Oui 12076

1619774,6 %

100 %Non 4121 25,4 %

x5

Jeune(de 18 à 34 ans)

376016197

23,2 %100%

Moyen(de 35 à 54 ans)

10306 63,6 %

Sénior(>55 ans)

2131 13,2 %

(b) Distribution des acheteurs

ModalitésNombre

d’acheteursTotal

%acheteurs

Total%

Surl’effectif

x1Homme 4687

932450,3 %

100 %53,9 %

Femme 4637 49,7 % 61,9 %

x2Île-de-France 3884

932441,7 %

100 %58,2 %

Province 5440 58,3 % 57,1 %

x3Seul 1482

932415,9 %

100 %51,7 %

Couple 7842 84,1 % 58,8 %

x4Oui 7111

932476,3 %

100 %58,9 %

Non 2213 23,7 % 53,7 %

x5

Jeune 17109324

18,3 %100 %

45,5 %Moyen 5963 64,0 % 57,9 %Sénior 1651 17,7 % 77,5 %

Page 85: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

6.4. RÉGRESSION LOGISTIQUE 85

différent. Dans ce tableau, x5 est scindée en deux variables nommées x5 et x6 tellesque

x5 =

1, si l’assuré est de la tranche d’âge jeune.

0, sinon.

x6 =

1, si l’assuré est de la tranche d’âge sénior.

0, sinon.

Table 6.2: Test de proportion

x1 x2 x3 x4 x5 x6

femme province seul non jeune séniorz 10,25 1,45 7,00 -5,82 -17,16 20,02

Ces valeurs nous indiquent que, vues séparément, presque toutes les variablesexaminées sont significatives au seuil approximatif α = 0, 05 sauf x2 (Zone). Lavaleur absolue de z peut également être utilisée comme mesure de distance. Parmiles variables significatives, x4 (avoir enfant) s’avère moins distinctive que x1 (sexe),x3 (situation familiale), x5 (jeune) et x6 (sénior). Ces résultats se verront confirmerdans les études qui suivent.

Les variables explicatives manifestant plus ou moins d’impact sur la probabilitéd’achat, nous pouvons judicieusement envisager des modèles de régression. Nousaborderons dans un premier temps le modèle de régression logistique qui sera lemodèle de référence pour deux méthodes alternatives : la méthode dite tabulaire(calcul des effets marginaux manuel directement à partir de la table de données)et la régression linéaire. Nous discuterons l’applicabilité des trois méthodes etcomparerons leurs résultats.

6.4 Régression logistique

Il s’agit d’un modèle de régression de référence en statistique lorsque la variablede réponse est binaire.

6.4.1 Pourquoi régression logistique ?

Ce modèle statistique consiste à prédire le logarithme du rapport de chance del’évènement achat en fonction du profil de l’assuré. Sans termes croisés, il s’écrit

logit (p)M1 = c0 +6∑i=1

cixi (6.4)

Page 86: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

86 CHAPITRE 6. MODÉLISATION DE LA PROBABILITÉ D’ACHAT

avec– p la probabilité d’achat ;– logit (p) = ln

(p

1−p

), la fonction logistique de p ;

– c0 l’intercepte de régression ;– ci le coefficients de régression du facteur xi, i = 1, . . . , 6.

Ce modèle assure que la probabilité prédite se trouve dans l’intervalle [0, 1]. Larégression logistique est d’ailleurs un cas particulier du modèle linéaire généraliséavec la fonction de lien logit et la famille de distribution binomiale.

Les prédictions données par le modèle de logistique nécessitent des transforma-tions pour être interprétable en terme de probabilité d’achat. En effet, l’équation(6.4) est équivalente à

p =ec0+

∑6i=1 cixi

1 + ec0+∑6i=1 cixi

. (6.5)

D’où la proportion d’achat pour la situation de référence 1

p0 =ec0

1 + ec0. (6.6)

et l’effet de chaque facteur xk, k = 1, . . . , 6

pk =ec0+ckxk

1 + ec0+ckxk− p0. (6.7)

6.4.2 Choix du modèle

Au lieu d’ambitionner toute combinaison possible des six variables, isolées oucroisées en deux, nous suivons une stratégie de présélection basée sur la significa-tivité indiquée par la p − valeur 2 . Ensuite, la sélection finale parmi les modèlescandidats retenus est effectuée en respectant le critère AIC.

6.4.2.1 Les prérequis

Utilité de la p − value du logiciel R Lors d’une procédure de régressionlogistique avec le logiciel R, ce dernier donne, pour un facteur xi :

– l’estimation de son coefficient de régression (notée ci par la suite)– l’erreur standard de l’estimation– la z-statistique de Wald 3

– la p− value associée.

1. La situation de référence est une sous-population où chaque variable explicative prend samodalité de référence.

2. La valeur p en français. Son appellation en anglais est employée ici pour ne pas confondreavec la probabilité d’achat p.

3. Cette statistique est définie par cisd(ci)

avec ci l’estimateur du maximum de vraisemblancede ci.

Page 87: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

6.4. RÉGRESSION LOGISTIQUE 87

L’avantage d’avoir la p− value à la disposition est double :

1. Elle nous indique le résultat du test de la significativité de xi, à un seuil αdéfini a priori. Ce test est bilatéral avec H0 : ci = 0. H0 est rejeté lorsque lap − value est supérieure à α, concluant que l’influence de xi sur l’achat estimportante.

2. Elle nous indique également si l’intervalle de confiance du niveau α (le mêmeα qu’au point 1) de ci comprend 0. Si une p − value supérieure à α estobservée, l’intervalle de confiance de ci comprendra 0.

Démonstration du point 2De nombreux utilisateurs du programme R tentent de vérifier si l’intervalle

de confiance d’un facteur non-significatif 4 comprend 0. Nous profitons de cetteoccasion pour démontrer que cette (double) vérification n’est pas nécessaire. Plusprécisément, la proposition à prouver est la suivante :

(p− value du test H0 : ci=0, H1 : ci 6=0) > α

⇐⇒ IC (α) de ci comprend 0.

La z-statistique de Wald W = cisd(ci)

suivant asymptotiquement la loi N (0, 1),en notant Wobs la statistique observée, nous avons

p− value > α ⇒ Pr (| W |>| Wobs |) > α

⇒ Pr (W >| Wobs |) + Pr (W < − | Wobs |) > α

⇒ Pr (W >| Wobs |) >α

2⇒ | Wobs |< z1−α/2

⇒ −z1−α/2 < Wobs < z1−α/2

⇒ −z1−α/2 · sd (ci)obs < (ci)obs < z1−α/2 · sd (ci)obs

Nous avons ainsi obtenu (ci)obs − z1−α/2 · sd (ci)obs < 0 et (ci)obs + z1−α/2 ·sd (ci)obs > 0 i.e. l’intervalle de confiance de ci comprend zéro. En conséquence, lavérification par l’intervalle de confiance est superflue : si en particulier α est fixéà 0,05 et une estimation donne une p− value plus grande que 0,05, l’intervalle deconfiance pour cette estimation du niveau 0, 05 comprendra 0.

Le critère AIC La valeur AIC d’un modèle de régression est définie par

AIC = 2k − 2 ln (L)

4. Sous R, la ligne d’estimation ne bénéficiera pas d’étoiles (*), un indicateur de significativité.

Page 88: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

88 CHAPITRE 6. MODÉLISATION DE LA PROBABILITÉ D’ACHAT

avec k le nombre des coefficients de régression du modèle et L la vraisemblance dumodèle. AIC augmente avec k et diminue avec L. Sur un ensemble de modèles àsélectionner, le meilleur est celui qui minimise AIC.

6.4.2.2 Modèles candidats et choix du modèle

Ces modèles ont été sélectionnés de la manière suivante : en considérant quele modèle simple (noté M1) avec uniquement des termes isolés n’est pas suffisantpour interpréter la consommation, alors que tous les termes dans le modèle com-plet (noté M2) incluant tous les termes isolés et croisés d’ordre 2 ne seraient passignificatifs, notre choix sera parmi les modèles intermédiaires entre M1 et M2.

M1 a été défini par (6.4) tandis que M2 est spécifié comme le suivant :

logit (p)M2 = c0 + c1x1 + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

+c12x1x2 + c13x1x3 + c14x1x4 + c15x1x5 + c16x1x6

+c23x2x3 + c24x2x4 + c25x2x5 + c26x2x36

+c34x3x4 + c35x3x5 + c36x3x46

+c45x4x5 + c46x4x6

(notations : x1 sexe=femme, x2 zone=Île-de-France, x3 situationfamiliale=couple, x4 avoir enfant ou non=oui, x5 tranche d’âge =jeune, x6

tranche d’âge=sénior)

Le troisième modèle candidat M3 est basé sur le M2 sur-paramétré. Il s’ob-tient en supprimant les termes non significatifs de M2, repérés par les p − valuesupérieures à 0,05. Le modèle M3 est tel que :

logit (p)M3 = c0 + c1x1 + c3x3 + c5x5 + c6x6

+c13x1x3 + c25x2x5. (6.8)

Les facteurs x2 (Île-de-France) et x4 (avoir enfant), en tant que termes isolés,ont été éliminées. Ils étaient également les deux facteurs les moins importants lorsdes tests de significativité (Table 6.2).

Dans M3, x2 apparait uniquement dans un terme croisé. Ceci pourrait gênerla compréhension du fonctionnement du modèle. Afin de privilégier la présenceexplicite des termes isolés, ceux-ci sont rajoutés dans M3 pour créer M4 :

logit (p)M4 = c0 + c1x1 + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

+c13x1x3 + c25x2x5. (6.9)

Page 89: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

6.4. RÉGRESSION LOGISTIQUE 89

Table 6.3: AIC des modèles

AIC Description

M1 21369 “Simple”(termes isolé uniquement)

M2 21341“Complet”

(tous les termes isolé et tousles termes croisés d’ordre 2)

M3 21329“Réduit”

(suppression des termesnon significatifs du M2)

M4 21331“Augmenté”

(rajout des termesisolés au M3)

Ainsi, l’interprétation pourra procéder de manière additive : le logarithme du rap-port de chance pour la situation de référence est de A, celui pour la populationféminine est de A + B, pour la population féminine habitant en Île-de-France estde A+B + C, et ainsi de suite.

La Table 6.3 récapitule les valeurs AIC pour les quatre modèles candidatsproposés ainsi qu’un aide-mémoire sur leurs spécifications. Comme prévu, M1 esttrop simpliste pour résumer toutes les informations apportées par les données. M2ne possède pas la valeur AIC la plus petite : ce modèle est sur-paramétré et doncpénalisé par son nombre de termes. La valeur AIC du M4 est également pénaliséepar les deux termes que nous avons rajoutés. Nous retenons donc M3.

La validation du modèle retenu s’effectue par le test d’adéquation de la dé-viance. L’hypothèse nulle et l’hypothèse alternative du test sont :

H0 : le modèle M3 à 7 paramètres est adéquat ;

H1 : le modèle M3 à 7 paramètres n’est pas adéquat.

La statistique du test est celle du rapport de vraisemblance notée G :

G = −2 logL (constante seule)

L (7 termes).

= −2 (logL (7 termes)− logL (constante seule))

Sous H0, G suit une loi du khi-deux à K degrés de liberté. La log-vraisemblancedu M3 est de -10656,26, celle du modèle avec uniquement l’intercepte est de -11040,74, ce qui donne une statistique G de -768,97 et une p − value nulle. Nousconsidérons donc que M3 est adéquat.

Page 90: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

90 CHAPITRE 6. MODÉLISATION DE LA PROBABILITÉ D’ACHAT

6.5 Autres techniques

Par la suite sont présentées deux méthodes alternatives au modèle logistiquequi prédisent la probabilité d’achat.

6.5.1 Méthode tabulaire

Dans cette section, nous cherchons à quantifier les effets des facteurs et obte-nir les “pseudo-coefficients de régression” par des opérations réalisées directementsur la table de données brutes. Nous démontrons, par la comparaison des sous-populations, la réelle existence de la différence dans la probabilité d’achat selonprofil de la population. Ces démarches ont pour effets 1) de nous aider à mieuxcomprendre des résultats obtenus (en un seul clic) par des logiciels statistiques et2) de préparer les discussions sur le modèle linéaire dans les prochaines sections.

Bien qu’il s’agisse des calculs primaires (essentiellement prendre la différenceet calculer la moyenne pondérée), un modèle mathématique fondamental est in-dispensable pour orienter notre travail. Afin d’être comparable aux études faitesauparavant, nous nous proposons de répliquer le modèle retenu en analyse de larégression logistique. Ainsi, le par un modèle à étudier s’écrit :

p = c0 + c1x1 + c3x3 + c5x5 + c6x6

+c13x1x3 + c25x2x5. (6.10)

(notations : x1 sexe=femme, x2 zone=Île-de-France, x3 situationfamiliale=couple, x5 tranche d’âge=jeune, x6 tranche d’âge=sénior)

Cette fois-ci, les coefficients c1, . . . , c25 seront calculés directement à partir dela table de données.

Vu que x4 (avoir enfant ou non) a été éliminée du M3, la table de données seréduit en 4 facteurs et contient 24 sous-populations : 2(sexe) × 2(zone)× 3(âge)× 2(situation familiale) = 24. La Table 6.4 nous donne l’effectif et le nombred’acheteurs répartis par sous-population. Comme précédemment, la variable x5(tranche d’âge) est scindée en deux et désignée par x5 pour la tranche jeune et parx6 pour la tranche sénior, la tranche moyenne étant la modalité de référence.

Certaines caractéristiques du modèle logistique M3 nous seront utiles. Nousrappelons que :

– Sa situation de référence : homme d’âge moyen, vit seul et en province. Cettepopulation se situe à la ligne n°22 de la Table 6.4 et compte au total 496assurés dont 49,60 % ont été acheteurs en 2010.

– Ses termes isolés : x1, x3, x5 et x6.– Ses termes croisés : interactions entre x1 et x3 ainsi qu’entre x2 et x5.

Page 91: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

6.5. AUTRES TECHNIQUES 91

Table 6.4: Table de données pour les calculs manuels (présentation n°1)

6.5.1.1 Coefficients des termes isolés

Nous souhaitons calculer maintenant l’effet de chaque modalité des 4 facteursisolés qui n’est pas de référence.

Par exemple pour la modalité de sexe féminin, le premier effet correspond à ladifférence des taux d’achat des lignes identiques en tout sauf pour le sexe. Il existeau total 12 différences de cette situation (Table 6.5 colonne 4p). La donnée de10,48 % de la première ligne est par exemple obtenue en faisant la différence entreles deux p de la ligne 1 et de la ligne 13 (Table 6.4). Nous remarquons d’ailleursque la population féminine s’avère plus consommatrice dans toutes les situations.

Pour encore synthétiser l’information, nous prenons la moyenne pondérée dece que représente chaque effectif par rapport à l’effectif total (Table 6.5 colonnePondération). Ainsi, l’effet du sexe féminin est fixé à 8,7 %, un chiffre positifindiquant que les femmes sont plus consommatrices que les hommes.

Les autres effets à deux modalités se calculent par analogie. Pour la tranched’âge à trois modalités, le principe reste inchangé pour l’effet de x5 et l’effet dex6, les calculs sont cependant réalisés sur deux tables de données différentes. Pourx5 (Jeune) par exemple, nous devons regrouper les modalités Moyen et Sénior. Lanouvelle base est présentée dans la Table (6.6). De la même manière, pour obtenirle coefficient de x6 (Sénior), les modalités Jeune et Moyen doivent être regroupées

Page 92: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

92 CHAPITRE 6. MODÉLISATION DE LA PROBABILITÉ D’ACHAT

Table 6.5: Calcul de l’effet x1 = femme

x2 x3 x5 4p Pondération(somme=1)

1 Île-de-France Jeune Couple 10,48 % 0,05492 Province Jeune Couple 10,95 % 0,09773 Île-de-France Moyen Couple 7,55 % 0,22834 Province Moyen Couple 5,59 % 0,32615 Île-de-France Sénior Couple 6,57 % 0,04936 Province Sénior Couple 0,17 % 0,06677 Île-de-France Jeune Seul 10,61 % 0,03468 Province Jeune Seul 19,66 % 0,04489 Île-de-France Moyen Seul 22,83 % 0,036910 Province Moyen Seul 20,23 % 0,044911 Île-de-France Sénior Seul 11,15 % 0,007712 Province Sénior Seul 10,91 % 0,0080

Moyennepondérée c1

8,70 %

Table 6.6: Table de données pour les calculs manuels (présentation n°2 : baseréduite)

pour produire une table de données “présentation n°3” à partir de laquelle lesmêmes calculs sont effectués.

En plus de la moyenne pondérée, nous calculons également l’écart-type pondérépour prendre en compte la dispersion. Dans la Table 6.8 lignes 1 à 5, la premièrecolonne indique que la sous-population de référence a pour proportion d’acheteursmoyenne de 49,60 %, une valeur venant directement de la ligne 22 de la Table6.4. Le fait d’être du sexe féminin, d’âge sénior, de vivre en couple ou résident enprovince fait augmenter le taux d’achat ; le fait d’être d’âge jeune le diminue. Lecoefficient de x3 (couple) admet une moyenne plus grande que l’écart-type.

Ceci montre que la tendance de la proportion d’acheteurs est irrégulière, ou

Page 93: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

6.5. AUTRES TECHNIQUES 93

Table 6.7: Variation de x3

n° ligne x1 x3 x5 x2 Effectif Nb. acheteurs p Effet4 F Couple Moyen Province 2573 1576 61,25 %

-8,58 %10 F Seul Moyen Province 232 162 69,83 %

15 H Couple Moyen Île-de-France 1890 1027 54,34 %9,99 %

21 H Seul Moyen Île-de-France 336 149 44,35 %

en d’autres termes, il existe de grandes variations dans les sous-effets constitutifs.Comme par exemple les deux couples de lignes dans la Table 6.7. Chacun de cesdeux couples de lignes est constitué de deux lignes identiques sauf pour la situationfamiliale. Les lignes 4 et 10 donnent un effet négatif, signalant que pour les femmesd’âge moyen résidant en province, le fait d’être mariée entraîne une baisse du tauxd’achat, tandis que pour les hommes d’âge moyen (lignes n°15 et 21) résidant enÎle-de-France, l’effet d’être marié est positif.

Nous pouvons bien entendu nous douter que cette variation puisse être la consé-quence d’autres facteurs comme par exemple le sexe ou la zone. À travers des testsde significativité, le facteur zone a été jugé non-significatif, cette possibilité peutdonc être négligée. A contrario, l’effet de sexe a été confirmé à plusieurs reprisesmais le sens a toujours été inverse (les femmes sont plus consommatrices que leshommes). Nous concluons donc que cette variation est causée effectivement parla situation familiale. Ce facteur était aussi le facteur le moins significatif dans larégression logistique M3 et le deuxième moins significatif dans les tests de signifi-cativité après l’indicateur d’avoir enfant ou non.

6.5.1.2 Coefficients des termes croisés

Commençons par étudier l’interaction entre x1(femme) et x3 (couple). Les sous-populations à comparer sont celles qui s’opposent uniquement et simultanémentpar ces deux facteurs, c’est-à-dire que les 6 sous-populations avec x1 = femmeet x3 = couple à comparer contre les 6 sous-populations avec x1 = homme etx3 = seul. Comme précédemment, 6 sous-effets sont calculés et leur moyennepondérée est de 4,69 %.

Ce 4,69 % s’interprète tel que le fait d’être femme et vivre en couple augmentela probabilité d’achat de 4,69 %. Pour en dégager l’effet d’interaction, il nous fautsoustraire l’effet de x1 obtenu auparavant de 8,70 % pour obtenir -4,01 %. Cecisignifie que la hausse de la probabilité d’achat dans la population des femmesmariées est due à leur sexe féminin mais non à leur situation familiale.

En ce qui concerne l’interaction entre x2 (Île-de-France) et x5 (jeune), le calculest le même mais effectué sur la base réduite (Table 6.6). Nous obtenons unemoyenne de -12,83 %, à soustraire par l’effet isolé de x5 soit -15,33 %, ce qui donne

Page 94: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

94 CHAPITRE 6. MODÉLISATION DE LA PROBABILITÉ D’ACHAT

Table 6.8: Coefficients calculé manuellement

Moyenne p Écart-type σ

c0

(Intercepte)Homme, Seul, Moyen

Île-de-France49,60 % (référence)

c1 Sexe (Femme) 8,70 % 5,95 %

c3Situation familiale

(couple)0,90 % 6,65 %

c5Tranche d’âge

(Jeune)-15,33 % 4,85 %

c6Tranche d’âge

(Sénior)22,82 % 3,63 %

c1:3 (Femme) : (Couple) -4,01 % 3,40 %c2:5 (Jeune) : (Île-de-France) 2,50 % 3,79 %

au final 2,50 %. Ce chiffre positif montre que la forte baisse du taux d’achat dansla population des jeunes franciliens est due à leur jeune âge même si en général, letaux d’achat en Île-de-France est supérieur à la moyenne (Table 6.2).

6.5.2 Régression linéaire

Le modèle pour le calcul manuel (6.10) s’assimilait à une régression linéaire.Malgré la simplification imposée, ce modèle a donné des résultats assez cohérents.

Le modèle linéaire répliquant le modèle logistique M3 (6.8) s’écrit

p (c) = c0 + c1x1 + c3x3 + c5x5 + c6x6

+c13x1x3 + c25x2x5 + ε (6.11)

(notations : x1 sexe=femme, x2 zone=Île-de-France, x3 situationfamiliale=couple, x5 tranche d’âge =jeune, x6 tranche d’âge=sénior)

avec ε le bruit blanc gaussien.

Avant de nous poser la question formellement sur l’applicabilité du modèlelinéaire, nous nous permettons la curiosité de comparer les coefficients qu’il estimeaux ceux obtenus par les deux méthodes précédentes (Table 6.9).

6.6 Point sur la méthodologie

Comparons les coefficients de régression estimés par les trois méthodes envi-sagées (Table 6.9), où les prédictions données par la régression logistique ont ététransformées préalablement selon (6.6) et (6.7). Nous constatons que, malgré les

Page 95: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

6.6. POINT SUR LA MÉTHODOLOGIE 95

Table 6.9: Comparatif des trois approches

Régressionlogistique

Calcultabulaire

Régressionlinéaire

c0

(Intercepte)Homme, Seul, Moyen

Île-de-France49,26 % 49,60 % 49,42 %

c1 Sexe (Femme) 18,61 % 8,70 % 17,63 %

c3Situation familiale

(couple)6,88 % 0,90 % 6,06 %

c5Tranche d’âge

(Jeune)-13,73 % -15,33 % -14,57 %

c6Tranche d’âge

(Sénior)22,66 % 22,82 % 19,97 %

c13 (Femme) : (Couple) -10,59 % -4,01 % -10,94 %c25 (Jeune) : (Île-de-France) 6,90 % 2,50 % 6,09 %

simplifications apportées à la méthode tabulaire, les estimations sont assez cohé-rentes. En ce qui concerne la régression linéaire, les coefficients estimés sont trèsproches de ceux donnés par le modèle logistique.

Discussion : le modèle linéaire peut-il appliquer ?

Pouvons-nous utiliser le modèle linéaire simplement parce qu’il est très prochede ce que nous pouvons dire des données ? La réponse classique est négative. PourAgresti (1990) :

The linear probability model has structural defect. Probabilities mustfall between 0 and 1, whereas linear functions take values over the entirereal line.

Cependant, selon Cibois (1999) :

La réponse classique a beau être négative, il faut bien se résoudreà la constatation que le modèle fonctionne toujours correctement, qu’ildonne toujours des probabilités comprises entre 0 et 1, que les log-vraisemblances de la régression linéaire et de la régression logistiquesont toujours extrêmement proches (car les probabilités estimées sonttrès proches). Nous sommes donc devant un cas particulier dont il fautrendre compte.

Pour illustrer ses assertions, un exemple simple, où il y a une proportion à expliquerà partir d’une seule variable qualitative, est donné dans cet article. Nous adaptonscet exemple et donnons nos interprétations. Considérons l’impact de la variablede la tranche d’âge sur la probabilité d’achat. C’est une variable qualitative de

Page 96: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

96 CHAPITRE 6. MODÉLISATION DE LA PROBABILITÉ D’ACHAT

trois modalités : Jeune, Moyen et Sénior, avec la modalité de référence la tranchemoyenne. La probabilité de la modalité de référence est notée p0.

En régression linéaire, la proportion est prédite par la formule :

pliné = p0 + c5x5 + c6x6 (6.12)

et en régression logistique, par la formule :

lnpliné

1− pliné= p0 + c′5x5 + c′6x6. (6.13)

Selon ces deux équations, les coefficients de régression d’un modèle se déduisentde l’autre. En effet, dans ce cas simple, les deux modèles ne font que reproduireles proportions observées : il y a l’équivalence entre les deux modèles.

La théorie pour une régression multiple reste à faire, mais nousdevinons que l’on s’écarte peu de la situation de l’exemple précédent(Cibois (1999)).

6.7 Conclusion

La probabilité d’achat est considérée dès à présent variante selon le profil del’assuré et obéit à la relation de prédiction suivante :

logit (p)M3 = c0+ c1x1 + c3x3 + c5x5 + c6x6

+c13x1x3 + c25x2x5.

(notations : x1 sexe=femme, x2 zone=Île-de-France, x3 situationfamiliale=couple, x5 tranche d’âge=jeune, x6 tranche d’âge=sénior)

Les coefficients sont estimés par la régression logistique à partir des prestationsde l’année 2010. Leurs valeurs sont données dans la Table 6.9 (première colonne).

Selon ces valeurs, la sous-population de référence (homme d’âge moyen, vitseul en province) correspond à un pourcentage d’achat de 49,26 %. L’effet du sexeféminin est de 18,61 % qui sera diminué de 10,59 % si l’assurée vit en couple. L’effetde du jeune âge est de -13,73 % qui sera augmenté de 6,90 % si l’assuré réside enÎle-de-France. Le fait de vivre en couple augmente de manière générale 6,88 %la probabilité d’achat (sans distinction du sexe), faisant de ce facteur le moinssignificatif parmi tous les termes isolés. Finalement, les assurés séniors bénéficientle plus de la “garantie verres” car ils représentent quasiment 1,5 fois plus d’acheteursque la sous-population de référence (71,92 % contre 49,26 %).

Page 97: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Chapitre 7

Charge sinistres

Dans le Chapitre 5, nous avons ajusté la loi de la dépense bimodale. Dans leChapitre 6, nous avons analysé l’influence des facteurs du sexe et de l’âge sur laprobabilité d’achat. L’objet de ce chapitre est de rassembler ces éléments modélisésen commençant par le développement des caractéristiques importantes de la chargesinistres, notamment son espérance, sa variance et son coefficient d’asymétrie.Quatre approches pour approximer la distribution de la charge sinistre sont ensuiteprésentées dans la Section 7.2. La Section 7.3 est consacrée spécialement à lavalidation de la simulation. Finalement dans la Section 7.4, la procédure complèteest démontrée en utilisant les données d’une une sous-population observée.

7.1 Caractéristiques des charges sinistres

Nous rappelons que la garantie verres consiste à rembourser au plus deux verrespar an et par assuré. La charge totale S s’écrivait :

S =n∑k=1

(a ·Xk)Yk = a ·n∑k=1

XkYk (7.1)

avec a la part garantie, n l’effectif du portefeuille, Yk une variable aléatoire deBernoulli indiquant si l’assuré k achète des verres ou non et Xk la variable aléatoiredu montant de la dépense éventuelle. Les Yk, k = 1, · · · , n sont supposées i.i.d ainsique les Xk, k = 1, · · · , n. De plus Xk et Yk sont indépendantes pour k = 1, · · · , n.Y ∼ Ber (p) est la v.a. parente des Yk, k = 1, · · · , n etX ∼ Γcom (Ψ) la v.a. parentedes Xk, k = 1, · · · , n. Les paramètres p et Ψ ont été estimés précédemment.

En définissant Dk = XkYk la dépense éventuelle, la charge individuelle de-vient alors

Sk = a ·XkYk = a ·Dk.

97

Page 98: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

98 CHAPITRE 7. CHARGE SINISTRES

7.1.1 La dépense éventuelle Dk et la charge individuelle Sk

Certaines caractéristiques stochastiques deDk et Sk sont développées ci-dessous(les quantités FX , fX , µX , σX ,MX (·), m(·)

X et µ(·)X sont disponibles dans la Section

5.2.1) :

Dk = XkYk, Xk ⊥ Yk.

Sk = a ·Dk, a constante.

– Fonctions de répartition et densités :

FDk (x) = p · FX (x) + (1− p)

FSk (x) = FDk

(xa

)

fDk (x) =

(1− p) , x = 0

p · fX (x) , x > 0,

fSk (x) =1

a· fDk

(xa

)– Espérances et variances :

E (Dk) = µDk = E (Yk) · E (Xk) = pµX ,

E (Sk) = µSk = a · µDk .

σ2Dk

= Var (Dk) = pσ2X + p (1− p)µ2

X ,

σ2Sk

= Var (Sk) = a2 · σ2Dk.

car selon le théorème de la variance totale, Var (Dk) = E [Var (Dk | Y )] +

Var (E (Dk | Y )). Nous avons la partie E [Var (Dk | Y )] = E [Y 2Var (X)] =

pσ2X et la partie Var (E (Dk | Y )) = Var [Y E (X)] = p (1− p)µ2

X .– Moments ordinaires d’ordre 2 : m(2)

Dk= σ2

Dk+ µ2

Dket m(2)

Sk= σ2

Sk+ µ2

Sk.

– Fonctions génératrices des moments :

MDk (t) = E(etDk

)= et·0 · Pr (Dk = 0) +

ˆ ∞0+

et·xfDk (x) dx

= (1− p) + pMX (t) ,

MSk (t) = MDk (at) .

Page 99: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.1. CARACTÉRISTIQUES DES CHARGES SINISTRES 99

En particulier, MSk (0) = 1.

– Moments ordinaires d’ordre 3 et moments centrés d’ordre 3 :

m(3)Dk

= E(D3k

)= M ′′′

Dk(0) = pM ′′′

X (0) = pm(3)X ,

m(3)Sk

= E(S3k

)= M ′′′

Sk(0) = a3M ′′′

Dk(0) = a3 ·m(3)

Dk;

µ(3)Dk

= E (Dk − µDk)3 = m

(3)Dk− µ3

Dk− 3µDkm

(2)Dk

+ 3µ3Dk,

µ(3)Sk

= E (Sk − µSk)3 = E (aDk − aµDk)

3 = a3 · µ(3)Dk.

– Coefficients d’asymétrie : γDk =µ(3)Dk

σ3Dk

et

γSk =µ(3)Sk

σ3Sk

=a3 · µ(3)

Dk

a3 · σ3Dk

= γDk .

Les deux coefficients d’asymétrie sont donc égaux.

7.1.2 La charge totale S

S =∑n

k=1 Sk, avec Sk, k = 1, . . . n i.i.d.

– Espérance et variance :

E (S) = µS =n∑k=1

E (Sk) = n · µSk ,

Var (S) = σ2S =

n∑k=1

Var (Sk) = n · σ2Sk.

– Moment ordinaire d’ordre 2 : m(2)S = σ2

S + µ2S.

– Fonction génératrice des moments :

MS (t) =n∏k=1

MSk (t) = (MSk (t))n

– Moment ordinaire d’ordre 3 et moment centré d’ordre 3 :

m(3)S = M ′′′

S (0) = n (n− 1) (n− 2)µ3Sk

+ 3n (n− 1)µSkm(2)Sk

+nm(3)Sk

µ(3)S = m

(3)S − µ

3S − 3µSm

(2)S + 3µ3

S.

(Voir Annexe pour le développement de m(3)S .)

– Coefficient d’asymétrie : γS =µ(3)S

σ3S.

Page 100: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

100 CHAPITRE 7. CHARGE SINISTRES

7.2 Simulation de la charge sinistres

Nous savons que la distribution de S n’admet pas de forme simple sauf pourcertains cas très particuliers. Une bonne approximation de cette distribution estdonc souhaitée. En plus de cette difficulté théorique, les professionnels confrontentl’indisponibilité de grands échantillons de la charge annuelle 1. Pour cette raison, lestechniques de simulation reconnaissent une utilisation extensive dans le domainede la gestion des risques.

7.2.1 Méthode de la simulation

La simulation de S se réalise grâce à la relation suivante :

S = a ·n∑k=1

[Z ·Xk + (1− Z) ·Xk]Yk. (7.2)

Cette relation est obtenue en combinant (7.1) et (5.1). D’où la formule pourobtenir la première réalisation de S notée s(1) :

s(1) = an∑i=1

(zix1,i + (1− zi)x2,i) yi (7.3)

avec– n l’effectif (fixé et constant) ;– a la part assurée (fixée et constante) ;– zi une réalisation 2 de Ber (w1) ;– x1,i une réalisation de Γ (θ1) ;– x2,i une réalisation de Γ (θ2) ;– yi une réalisation de Ber (p).

Chacun des quatre derniers éléments sont à simuler indépendamment n fois et àrassembler selon (7.3). Pour obtenirK réalisations de S, cette procédure se reprendpour produire s(2) jusqu’à s(K).

La formule (7.3) nous permet d’obtenir une réalisation de S en une seule étape.Néanmoins, dans l’optique du contrôle de la simulation, il convient de disposer desvaleurs simulées des variables intermédiaires telles que X1, X2, X, Dk et Sk. Lacorrespondance entre ces variables et les différentes parties de la formule (7.3) estdonnée dans la Table 7.1.

1. Pour un nouveau produit qui vient d’être commercialisé depuis un an, une seule observationest disponible.

2. Simulation de Y ∼ Ber (p) : Si u est une réalisation de U [0, 1], alors y = 1 si u < p et y = 0sinon.

Page 101: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.2. SIMULATION DE LA CHARGE SINISTRES 101

Table 7.1: Simulation des variables intermédiaires

i-ième réalisationX1 x1,iX2 x2,iX zix1,i + (1− zi)x2,iDk (zix1,i + (1− zi)x2,i) yiSk a (zix1,i + (1− zi)x2,i) yiS

∑ni=1 a (zix1,i + (1− zi)x2,i) yi

Nous remarquons qu’en réalité, une réalisation de Sk n’est pas simulée propre-ment dit mais calculée en multipliant une réalisation de Dk par une constante. Uneréalisation de S n’est non plus simulée mais calculée en sommant les réalisationsSk sur k = 1, . . . , n.

7.2.2 Validation de la simulation

Deux raisons pour contrôler la qualité de simulation des six variables aléatoires(5 v.a. intermédiaires et une v.a. finale S ) :

1. La charge sinistres S étant obtenue par intermédiaire des variables simulées(voir Section 7.2.1), de mauvaises simulations de ces dernières affecterontl’approximation de la distribution de S.

2. Les valeurs simulées de S serviront de l’échantillon remplaçant du vrai échan-tillon indisponible. Ainsi, l’évaluation d’une méthode d’approximation de ladistribution de S est réalisée grâce à l’écart classique entre “les simulés” (aulieu de “les observés”) et “les estimés”.

La validation des échantillons simulés est donc primordiale pour garantir la qualitéde l’approximation.

7.2.2.1 Les trois versions d’une variable aléatoire

Les trois versions d’une variable aléatoire dont nous parlerons sont : la versionobservée, la version modélisée et la version simulée.

Parmi les six variables de la Table 7.1, les observations dont nous disposonsdirectement sont celles de X et de Dk. Les versions observées de ces deux va-riables serviront évidemment de référence pour toute estimation ou approximationde la distribution de S.

Sauf pour S, nous avons explicité toutes les fonctions de densité des variablesintermédiaires (X1, X2, X, Dk et Sk) dont les paramètres ont été ajustés. Pour S,nous sommes également parvenus à exprimer ses caractéristiques importantes grâceaux paramètres de ses composantes. La version d’une variable aléatoire admettantune modélisation paramétrique sera appelée la version modélisée.

Page 102: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

102 CHAPITRE 7. CHARGE SINISTRES

Finalement, la version simulée d’une variable aléatoire est celle obtenue parles techniques de simulation en utilisant la distribution modélisée. Lorsque lestechniques de simulation sont appropriées et que le nombre de simulation est élevé,la version simulée et la version modélisée doivent être proches l’une de l’autre.

Nous parlerons également de l’échantillon observé et de l’échantillon si-mulé.

7.2.2.2 Critères et outils de la validation

La qualité de la simulation sera contrôlée au niveau de la dépense X et de ladépense éventuelleDk, où les observations directes sont disponibles. Concrètement,la vérification s’effectuera en comparant les moments et les distributions entrel’échantillon simulé et l’échantillon observé. Pour une variable aléatoire donnée,nous considérons que son échantillon simulé est validé

– si les quantités suivantes :

moyenne, écart-type, coefficient asymétrie, kurtosis, mode, ...

calculées sur son échantillon simulé et son échantillon observé sont prochesles unes des autres ;

– et que les courbes de densité (DOI) des deux échantillons sont proches l’unede l’autre.

Comme l’échantillon simulé est étroitement lié à sa modélisation (à partir de la-quelle la simulation est réalisée), ces vérifications impliqueront également la versionmodélisée de la v.a. en question.

La validation sera donc menée en deux actions :

1. Comparaison des caractéristiques stochastiques entre les trois versions d’unev.a. ;

2. Visualisation des DOI de l’échantillon observé et de l’échantillon simulé.

7.3 Loi de la charge sinistres

Nous nous intéressons maintenant particulièrement à la loi de S i.e. la probabi-lité Pr (S < x) pour un montant x fixé. La première méthode considérée consisteà rapprocher le modèle individuel (7.1) à un cas particulier du modèle collectif surlequel la formule récursive de Panjer est applicable.

7.3.1 Lien avec le modèle collectif et formule récursive de

Panjer

Équivalence au modèle collectif Soit le modèle collectif

Page 103: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.3. LOI DE LA CHARGE SINISTRES 103

Scollbin =

N∑k=1

aXk

où N ∼ Bin (n, p) et Xk i.i.d que X ∼ Γcom (Ψ) et k = 1, . . . , N . Nous montronsci-dessous l’équivalence en loi de distribution entre S et Scoll

bin .

Le relation suivante provient de Partrat & Besson (2005) :

MScoll (t) = gN [MX (at)]

avecMScoll (·) la fonction de génératrice des moments de Scoll et gN (·) et la fonctiongénératrice de probabilité de N . Pour N ∼ Bin (n, p), nous avons

gN (t) = [(1− p) + pt]n .

D’où

MScoll (t) = gN [MX (at)] = [(1− p) + pMX (at)]n = MS (t) .

L’égalité MS (t) = MScoll (t) est ainsi démontrée. Les v.a. S et Scollbin partagent donc

la même distribution. Nous pouvons dès présent étudier la distribution de Scollbin à

la place de celle de S.

Approximation poissonnienne Sous certaines conditions, la loi deN ∼ Bin (n, p)

peut être approximée par une loi de Poisson de paramètre λ = np. Soit Scollpoi la

charge sinistres correspondante. Cette approximation conserve l’espérance de lacharge :

E(Scoll

poi

)= E

(Scoll

bin

).

En revanche, la variance est devenue plus grande et rend l’estimation plusprudente car :

Var(Scoll

poi

)− Var

(Scoll

bin

)= a2np

(σ2X + µ2

X

)− a2np

(σ2X + (1− p)µ2

X

)= a2np2µ2

X

> 0.

Les critères usuels pour cette approximation sont n ≥ 50 et p ≤ 0, 10, alors quenous avons vu que, dans le Chapitre 6, la proportion d’achat variait autour de 60%. L’inadéquation de cette approximation sera constatée dans la suite.

Page 104: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

104 CHAPITRE 7. CHARGE SINISTRES

Formule récursive de Panjer De manière générale, cette formule s’écrit :

Pr(Scoll = 0

)= Pr (N = 0)

Pr(Scoll = x

)=

∑xy=1

(a+ b y

x

)Pr (aX = y) Pr (S = x− y) , x ≥ 1

avec a et b les paramètres de la loi de N . Cette formule s’applique aux montantsdiscrets de aXk. Nous devons donc discrétiser la loi de X. Nous savons d’ailleursque lorsque X est discrète, Scoll l’est aussi. En notant la version discrétisée de aXk

par aX et la charge totale discrète par Scoll, la formule récursive pour obtenir ladistribution de S est donnée par

Pr(Scoll = x

)=

x∑y=1

(a+ b

y

x

)Pr(aX = y

)Pr(Scoll = x− y

), x ≥ 1

où– a = 0, b = λ et Pr

(Scoll = 0

)= e−λ si N ∼ Poi (λ) ;

– a = − p1−p , b = (n+1)p

1−p et Pr(Scoll = 0

)= (1− p)n si N ∼ Bin (λ).

Discrétisation de la loi de X Soient xéch = {x1, x2, . . . , xl} un échantillon de

X, ρ un pas constant etm le nombre d’intervalles de la dépense : ρ =max(xéch)−min(xéch)

m.

Nous adoptons la discrétisation suivante

Pr(X = i

)=nil

où ni est le nombre d’observations de X incluses dans l’intervalle [ (i− 1) ρ, iρ)

avec i = 1, . . . ,m.Nous verrons que cette approximation a pour effet de surestimer légèrement la

moyenne et l’écart-type de la charge totale.

Remarques sur la formule de Panjer Pour démarrer l’algorithme, la proba-bilité Pr

(Scoll = 0

)= Pr (N = 0) ne doit pas être très petite 3 pour être reconnue

non-nulle informatiquement. Selon Kaas et al. (2009) :

Dans le cas où le nombre de sinistres suit une loi de Poisson de para-mètre λ, pour mettre en œuvre la formule de Panjer, λ ne doit pas êtretrès grand. Dans un système standard de Windows, le problème de un-derflow surgit si λ (1− p (0)) > 727, car f (0) (i.e. Pr

(Scoll = 0

))sera

trop petit.

Pour éviter cette difficulté informatique, nous calculerons la charge totale pour unportefeuille limité à 10 assurés.

3. À titre indicatif, le nombre 10−310 est reconnue 0 par Excel pour un processeur 64 bits.

Page 105: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.4. MISES EN PLACE ET RÉSULTATS NUMÉRIQUES 105

7.3.2 Approximation par des lois connues

La fonction de la répartition de S notée FS (x) peut être également approximéepar des lois connues. Par le théorème central limite, pour la suite S1, . . . , Sn i.i.d.ayant pour espérance E (S) et variance Var (S), nous avons

S − E (S)√Var (S)

→Ln→+∞ N (0, 1) .

d’où l’approximation

FS (x) ∼= Φ

(x− E (S)√Var (S)

).

Nous disposons également de l’approximation dite Normal Power qui améliorela qualité de l’approximation normale :

FS (x) ∼= Φ

[− 3

γS+

√9

γ2S+ 1 +

6

γS

(x− µSσS

)]où γS est le coefficient d’asymétrie de S. Nous remarquons que par rapport à la loinormale, la “loi Normal Power ” prend en compte des moments d’ordre supérieurpar le biais de γS.

7.3.3 Simulation

La légitimité de cette méthode s’appuie sur le résultat suivant :Soient S(1), . . . , S(K) un échantillon i.i.d. de S, la fonction de répartition empi-

rique associée FK est telle que

FK (x) =Nombre de S(i) < x

K

P−−−−−−→K → +∞FS (x) .

Autrement dit, nous pouvons approcher la distribution de S par la distributionempirique des K valeurs simulées de S.

7.4 Mises en place et résultats numériques

La loi de X a été calibrée pour la population du sexe féminin et de la tranched’âge moyenne (35~54ans) (voir Chapitre 5), tandis que le modèle logistique M3nous a permis de prédire la probabilité d’achat Pr (Y = 1) pour toute populationspécifiée par le sexe, la tranche d’âge, la zone de résidence et la situation familiale(voir Chapitre 6). L’étude de Y a donc été plus affinée que X en terme de lasegmentation démographique.

Afin d’appliquer les principes de calcul de S, les propriétés i.i.d. de la dépenseet de l’indicatrice d’achat doivent être respectées. C’est-à-dire qu’une population

Page 106: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

106 CHAPITRE 7. CHARGE SINISTRES

Table 7.2: Populations modélisées

SexeTranched’âge Zone

Situationfamiliale

plogit

1 F Moyen Île-de-France Couple 63,51 %2 F Moyen Île-de-France Seul 67,22 %3 F Moyen Province Couple 64,16 %4 F Moyen Province Seul 67,87 %

pour laquelle nous calculons S doit être déterminée. Nous prêtons attention denouveau sur la population des femmes de la tranche d’âge moyenne. Sur cettepopulation, la distribution de la dépense et unique, alors que la fréquence d’achatvarie selon que l’assurée vit seul ou en couple, en province ou en Île-de-France.

Ainsi, nous disposons des éléments pour calculer la charge sinistres des quatresous-populations dans la Table 7.2. La quatrième colonne de cette table contientles proportions d’achat prédites par le modèle logistique M3 (6.8).

Le calcul de S sur ces quatre sous-populations étant basé sur le même prin-cipe, les démonstrations seront réalisées en utilisant la première sous-population :femmes d’âge moyen vivant en couple et en Île-de-France.

Nous rappelons que les six variables d’intérêt sont : la première composante dela dépense (X1), la deuxième composante de la dépense (X2), la dépense (X), ladépense éventuelle (Dk), la charge individuelle (Sk) et finalement la charge totale(S). Nous avons souhaité disposer de 70000 réalisations de la charge totale d’unportefeuille de 10 assurés. Par conséquent, le nombre nécessaire de réalisations desX1, X2 et Dk est de 700000 chacune, correspondant également à 700000 valeurscalculées de Sk.

7.4.1 Simulation de S

La cohérence de l’échantillon simulé de S est assurée par la validation dessimulations intermédiaires.

7.4.1.1 Validation de la simulation de X1, X2 et X

Grâce à la Table 7.4, nous notons que les dépenses observées sont réparties entre24 € et 1800 €. Avec la modélisation par densité mélange de Gamma, cet intervalleest étendu jusqu’à 0 € à gauche et l’infini à droite. L’échantillon simulé de taille700000 basé sur cette modélisation a donné des occurrences à 9 € minimum età 2095 € maximum. Le domaine de la dépense est donc effectivement élargi auxdeux extrémités.

L’échantillon simulé a pu conserver la dépense moyenne de 424€ mais la dis-persion est légèrement sous-estimée (258 contre 261 en écart-type). Nous notons

Page 107: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.4. MISES EN PLACE ET RÉSULTATS NUMÉRIQUES 107

Table 7.3: Des dépenses composantes à la dépense mélange - obs : observée ; mod :modélisée ; sim : simulée

X

obs

X1

modèle

X2

modèle

X

modèle

X1

simu

X2

simu

X

sim

Min 24 0 0 0 9 95 9

Max 1800 ∞ ∞ ∞ 1086 2095 2095

Asy 0,91 0,87 0,62 0,83 0,87 0,62 0,83

Esp 424 241 653 424 241 653 424

Éca 261 105 204 258 104 204 258

Mode 230 196 589 197 594

MO-2 2,48E5 6,91E4 4,68E5 2,46E5 6,91E4 4,68E5 2,46E5

MO-3 1,79E8 2,29E7 3,65E8 1,74E8 2,29E7 3,65E8 1,75E8

MC-3 1,62E7 9,89E5 5,27E6 1,42E7 9,94E5 5,24E6 1,41E7

(a) Les composantes de X

(b) DOI des simulées v.s. DOI des observées (dépense)

Figure 7.1: Simulation de la dépense

Page 108: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

108 CHAPITRE 7. CHARGE SINISTRES

d’ailleurs que cette différence provient de la modélisation.Les coefficients d’asymétrie 4 sont tous plus grands que 0, indiquant que toutes

les trois variables aléatoires sont asymétriques, avec la plupart de valeurs concen-trées à gauche de la moyenne et une longue queue à droite. Dans l’ordre décroissantde ce coefficient, nous avons X1 puis X et finalement X2. X1 par exemple admetun coefficient d’asymétrie le plus élevé, elle est donc la plus dissymétrique, avecencore plus de valeurs plus petites que sa moyenne de 241 € (Figure 7.1a).

Cet ordre décroissant est également valable au niveau de l’espérance et lesmoments ordinaires. En revanche, cet ordre est perturbé pour les moments centrés(l’écart-type et MC-3) où l’ordre va de X puis X1 et finalement X2. Ceci est dû àla grande dispersion de X.

Tous les modes sont plus petits que leurs moyennes respectives car les coeffi-cients d’asymétrie sont supérieurs à 0. L’incohérence des modes modélisés de X1

et X2 (196 € et 589 €) comparés aux ceux marqués dans la Figure 5.3 (211 €et 570 €) est causée par deux modélisations différentes de la dépense X (voir laSection 5.3.5 et Figure 5.4).

La Figure 7.1b compare l’échantillon simulé et celui observé. C’est un graphiquesimilaire à la Figure 5.4 (milieu), vu que la version simulée est extrêmement prochede la version modélisée.

Nous validons l’échantillon simulé de X car il donne des valeurs des caractéris-tiques considérées très proches de celles modélisées et observées.

7.4.1.2 Validation de la simulation de Dk

Table 7.4: Des dépenses composantes à la dépense éventuelle

X

observée

Dk

observée

Dk

modélisée

Dk

simulée

Minimum 24 0 0 0

Maximum 1800 1800 ∞ 2080

Espérance 424 270 259 259

Écart-type 261 291 288 292

Mode 230 0 0 0

MO-2 1,58E+05 1,56E+05

MO-3 1,13E+08 1,11E+08

MC-3 2,56E+07 2,39E+07

Nous rappelons que le passage de X à Dk consiste en l’intégration de l’indica-teur d’achat Y , qui entraine une masse de probabilité en 0. À cause de cette trans-

4. Voir Annexe pour l’interprétation du coefficient d’asymétrie et du kurtosis.

Page 109: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.4. MISES EN PLACE ET RÉSULTATS NUMÉRIQUES 109

Figure 7.2: DOI des simulées v.s. DOI des observées (partie continue de la dépenseéventuelle)

formation, la chance d’observer des zéros est théoriquement augmentée (Pr (Y = 0) ≈0, 3649 contre Pr (X = 0) = 0), d’où la valeur minimale de 0 de Dk observée (Table7.4). L’échantillon simulé a reproduit ce minimum. Au contraire, le maximum ob-servé reste inchangé face à la transformation, car pour une dépense non nulle, nousavons l’identité entre les observations de X et Dk.

Sous la modélisation

Dk = XkYk, avec Xk ∼ Γcom (Ψ) , Yk ∼ Bin (p) ,

l’étendue à droit de Dk est élargie jusqu’à l’infini. Dans l’échantillon simulé, unmaximum de 2080 € est constaté, contre 1800 € dans l’échantillon observé.

Toujours à cause de la présence des 0 en masse, la moyenne de Dk modéliséeest diminuée par la proportion des non-acheteurs, sa variance est augmentée etsa valeur la plus rencontrée est 0. Par rapport à sa version observée, sa versionmodélisée a conservé la moyenne. En revanche, à cause de la sous-estimation de ladispersion dans l’échantillon simulé de X, la version modélisée de Dk sous-estimelégèrement l’écart-type (288 modélisé contre 291 observé).

En ce qui concerne les distributions de l’échantillon observé et de l’échantillonsimulé, nous rappelons qu’étant une variable aléatoire mixte, Dk admet une massede probabilité en 0 et une densité pour tout montant supérieur à 0. Dans la Figure7.2, les deux échantillons sont d’abord mis en comparaison pour la partie continue.Ce graphique est identique à la Figure 7.1b car lorsqueDk > 0, nous avonsDk = X.Ensuite, pour la partie discrète (i.e. la masse en 0), nous avons une proportion de0,3649 des observations nulles pour les Dk observées, très proche de la proportionde 0,3653 des montants nuls pour les Dk simulées. La distribution complète del’échantillon simulé peut donc être validée.

Page 110: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

110 CHAPITRE 7. CHARGE SINISTRES

Table 7.5: De Dépense à Charge Totale, en passant par Charge individuelle

X

simuléeDk

simuléeSk

calculéeS

(10 assurés)Minimum 9 0 0 0Maximum 2080 2080 1976 6937

Asymétrie 0,83 0,99 0,99 0,31Kurtosis 3,10 3,22 3,22 2,98

Espérance 423 269 255 2553Écart-type 257 289 275 866

Mode 423 0 0 0

7.4.1.3 Validation des quantités calculées Sk et S

Les valeurs simulées étant validées, nous pouvons avancer le calcul de la chargeindividuelle et de la charge totale. La Table 7.5 montre l’évolution du montantmonétaire suivant les trois niveaux : dépense, charge individuelle et charge totale.

Nous rappelons que la transformation de Dk à Sk s’effectue en multipliantle premier par une constante de 0,95, soit la part remboursée par l’assureur surla dépense éventuelle. De Dk à Sk, le minimum, le coefficient d’asymétrie et lekurtosis restent donc inchangés, tandis que le maximum, la moyenne, l’écart-typeet la mode 5 sont diminués de 5 %.

Passons finalement à la charge totale. Sur 70000 réalisations, nous avons constaté3 occurrences de 0. Ce nombre devrait diminuer avec l’augmentation de la taillede portefeuille (ici nous avons pris 10 assurés). Ces trois réalisation de zéro font lavaleur la plus rencontrées dans l’échantillon simulé.

L’ordre décroissant du coefficient d’asymétrie est tel que : Dk (ou Sk), puisX et finalement S. Dk prend la première place car à gauche de sa moyenne setrouvent de nombreux montants nuls. Nous avons le même ordre décroissant pour lekurtosis. Ainsi, suivant cet ordre, la distribution du montant devient de plus en plussymétrique, donnant l’impression que la distribution est “modérée” et “régularisée”tout en approchant une loi normale.

Finalement, la moyenne de S est 10 fois plus grande que celle de Sk et l’écart-type

√10 fois plus grand que celui de Sk. En revanche, le maximum de S est

logiquement plus petit que 10 fois le maximum de SK .

7.4.2 Distributions approximées de S

Les quatre méthodes envisagées sont : (1) approximation normale, (2) approxi-mation Normal Power, (3) formule récursive de Panjer avec le nombre de sinistre

5. Comme la mode de Dk était 0, le mode de Sk paraît inchangé.

Page 111: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.4. MISES EN PLACE ET RÉSULTATS NUMÉRIQUES 111

suivant une loi binomiale et (4) formule récursive de Panjer avec le nombre desinistre suivant une loi de Poisson.

Il est difficile d’arbitrer entre ces quatre méthodes selon leurs constructions carchacune a ses inconvénients. (1) et (2) sont basées sur l’hypothèse de la normalitéde S, qui, comme nous avons vu, admet certaine asymétrie avec un minimum de0. En outre, le test de normalité effectué sur l’échantillon simulé de S donne unep−value de 0, contredisant sa normalité. (3) est en effet une méthode exacte maissubit la perte de précision en transformant la distribution continue de la dépenseen une distribution discrète. En ce qui concerne (4), il s’agit d’une approxima-tion poissonienne de la loi binomiale qui n’a pas rempli les conditions de cetteapproximation (Section 7.3.1).

Une sélection par la performance numérique doit donc être mise en place. Nedisposant pas d’observations de S, l’idée est de comparer les caractéristiques desréalisations prévues par ces méthodes (moments, asymétrie etc.) avec un échan-tillon de référence remplaçant les observations non-existantes de S. Nous utilisonsl’échantillon simulé comme cet échantillon de référence car il a été doublementvalidé :

– D’un côté, l’ensemble des modèles servant à interpréter la sinistralité avaitété validé. Les simulations se sont réalisées à partir de ces modèles validés ;

– De l’autre côté, les résultats des simulations ont été validés.En d’autres termes, l’échantillon simulé de S sera considéré proche du vrai échan-tillon de la charge sinistres. Une réalisation extrême dans cet échantillon ne devraitpas être interprétée par un hasard extraordinaire mais une réalisation probable dela vraie charge sinistres. Prenons la ligne nommée Maximum de la Table 7.6 oùles méthodes sont numérotées de (1) à (4). L’échantillon simulé atteint 6973 €,alors que (1) atteint seulement 6705 €. Étant donné que ce montant de 6973 € estobtenu par des modélisations testées et des techniques de simulations validées, ilreprésente vraisemblablement une réalisation d’un très grand montant de la chargesinistres sur le long terme. Malheureusement, sur 70000 réalisations de (1), cettehauteur n’a pas été atteinte. Autrement dit, (1) subit l’incapacité de prévoir desgrands montants : une propriété indésirable en assurance non-vie.

Continuons à examiner d’autres lignes de la Table 7.6 en visualisant la Figure7.3. Si l’on pouvait négliger les montants négatifs que produisent (1) et (2) (cecipeut être éventuellement amélioré par les lois normales tronquées), (2) et (3) ap-prochent le mieux le coefficient d’asymétrie observé alors que (1) et (2) approchele mieux le kurtosis observé.

Les 4 méthodes semblent respecter la moyenne. (2), (3) et (4) surestiment ladispersion avec particulièrement (4) qui donne un écart-type de 1207 contre 866simulé.

Quant au 99,5 %-quantile de la distribution de S, c’est un montant seuil qui

Page 112: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

112 CHAPITRE 7. CHARGE SINISTRES

(a) Simulée v.s. (1) Normal

(b) Simulée v.s. (2) NP

(c) Simulée v.s. (3) Binomiale et (4) Poisson

Figure 7.3: Approximation de la charge totale selon méthode (résultat graphique)

Page 113: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.4. MISES EN PLACE ET RÉSULTATS NUMÉRIQUES 113

Table 7.6: Approximation de la charge totale par méthode(résultat numérique)

S

(10 assurés)

Approx.Normale

(1)

NormalPower

(2)

PanjerBinomiale

(3)

PanjerPoisson

(4)Minimum 0 -1435 -672 0 0Maximum 6937 6705 7650 7344 9000

Asymétrie 0,31 0,00 0,30 0,33 0,59Kurtosis 2,98 3,00 3,11 0,03 0,36

Espérance 2553 2553 2553 2579 2583Écart-type 866 865 867 896 1207

q99,5% 4989 4776 5025 5112 6300Pr (S > 6000) 0,019 % 0,004 % 0,030 % 0,026 % 0,808 %

plafonne 99,5 % des réalisations de S. C’est aussi le montant minimum dont l’assu-reur devrait disposer pour assumer 99,5 % de la prestation totale du portefeuille.Parmi des distributions candidates, celle qui donne le plus grand montant seuil estla plus prudente et elle serait caractérisée par une queue de distribution lourde àdroite. (1) est la seule méthode à donner un 99,5 % -quantile plus petit que celuisimulé, un fait prévisible vu que son coefficient d’asymétrie ne prévoyait pas dequeue de distribution à droite. (4) donne un montant près de 20 % plus grand lesautres méthodes.

Toujours pour un portefeuille de 10 assurés, nous avons également calculé laprobabilité que S excède 6000 €, un montant de remboursement que nous considé-rons assez grand pour un tel portefeuille. La chose prudente à faire est de surestimercette probabilité et donc de sur-provisionner, mais lorsque toutes les disponibili-tés sont mises en réserve, ceci affectera d’autres opérations de l’assureur tel quel’investissement financier. Comme il est attendu, (1) est la seule à sous-estimercette probabilité (0,004 % estimée contre 0,019 % simulée), tandis que (4) donnetoujours une probabilité conservatrice soit 40 fois plus grande que celle simulée,200 fois plus grande que (1), 25 fois plus grande que (2) et 30 fois plus grande que(3).

En résumé, (1) a été contestée dans plusieurs aspects : 1) distribution symé-trique non réaliste, 2) pas de queue de distribution à droite et 3) sous-estimationde la dispersion et du montant seuil de 99,5 %. Elle est donc éliminée. (2) estperformante mais prévoit des montants négatifs. (3) s’avère fiable. Même si ladistribution est un peu plus plate que la distribution simulée, nous pouvons consi-dérer que c’est un geste de prudence. (4) est conçue à partir de l’approximationpoissonienne qui, au départ, n’avait pas rempli les conditions usuelles de cette ap-proximation. Par conséquent, non seulement elle est d’une prudence exorbitante,

Page 114: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

114 CHAPITRE 7. CHARGE SINISTRES

Table 7.7: Charge sinistres moyennes par sous-population

SexeTranched’âge

ZoneSituationfamiliale

plogit E (S)

10 assurés1 F Moyen Île-de-France Couple 63,51 % 2558 €2 F Moyen Île-de-France Seul 67,22 % 2707 €3 F Moyen Province Couple 64,16 % 2584 €4 F Moyen Province Seul 67,87 % 2733 €

mais elle est aussi par construction non adéquate.Si nous devions choisir une méthode parmi (1) à (4), (3) serait notre choix.

Notes sur (3) Étant élue par sa performance numérique, il nous semble néces-saire d’insister sur certaines propriétés de la méthode (3) :

1. La surestimation de la moyenne et de l’écart-type sont principalement duesà la discrétisation de la loi de X. Nous rappelons que (3) et l’échantillonsimulé sont basés sur des modèles équivalents (voir 7.3.1).

2. Toujours à cause de la discrétisation, (3) donne une distribution empiriqueplus plate que la “pseudo-réalité” (i.e. l’échantillon simulé). (3) est donc uneapproximation prudente.

3. La discrétisation de la distribution de la dépense a été réalisé en regroupantles observations de X par tranches de 18 et en calculant la fréquence relativesur les données regroupées (voir 7.3.1). Pour nos configurations (taille duportefeuille, taux d’achat, loi du nombre de sinistres etc.), 18 a été la tranchela plus fine possible pour que l’algorithme soit convergent avant d’atteindrele nombre maximal de récursions. La qualité de l’approximation (3) n’estdonc pas améliorable par raffinement de la discrétisation.

Remarque finale : Obtenir les charges sinistres moyennes pour les quatresous-populations de la Table 7.2 Nous avons n = 10, a = 0, 95. De plus

E (S) = n · µSk= n · a · µDk= n · a · p · µX (7.4)

avec les taux d’achat p, pour les quatre sous-populations donnés dans Table 7.2.Sur l’échantillon simulé de X, nous venons d’obtenir la moyenne de µX =424

€. Les moyennes de la charge sinistres des quatre sous-populations peuvent êtrecalculées immédiatement grâce à (7.4). Leurs valeurs sont présentées dans la Table7.7.

Page 115: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Conclusion

Les modélisations préalables (modèle de la sinistralité de trois composantes,modélisation de la dépense par la densité mélange de Gamma et régression lo-gistique du taux d’achat) ont contribué pour donner les formes explicites des ca-ractéristiques importantes de la charge sinistres S notamment son espérance, savariance et sa fonction génératrice des moments. Notre objectif de maîtriser lasinistralité du risque “verres optiques” est donc accompli : nous connaissons désor-mais son ordre de grandeur et sa concentration autour de ses valeurs centrales. Deplus, l’approximation de la loi de S a permis de cerner la queue de distribution decette dernière en donnant le montant seuil de des fonds propores.

Par exemple, pour un portefeuille de 10 assurées d’âge moyen vivant en coupleet en Île-de-France, nous avons obtenu, par la méthode de simulation, que la chargetotale du risque admet une moyenne de 2558 € et un écart-type de 866. La distri-bution de cette charge est légèrement asymétrique avec une queue plus longue àdroite qu’à gauche (skewness=0,31) et légèrement plus plate qu’une distributionnormale (kurtosis=2,98). Le montant seuil des fonds propores pour couvrir 99,5 %de la prestation globale est de 4989 €. Enfin, la probabilité que la charge totaleexcède 6000 € est environ 0,019 %.

Outre la méthode de la simulation, l’approximation donnée par la formule ré-cursive de Panjer avec le nombre de sinistres suivant une loi binomiale a égalementdonné des résultats satisfaisants. Cette approximation peut donc être envisagéecomme une alternative de la méthode de la simulation.

Effet du revenu sur la consommation des verres en assurance optiques– Absence d’effet du revenu sur le comportement d’achatL’hypothèse que le comportement d’achat est indépendant du revenu estémise a priori dans cette étude (voir Section 6.3).

– Remarques importantes concernant l’effet du revenu sur la dépenseNous sommes de l’avis que le choix des différents types de verres (simples,progressifs, anti-rayures, antifatigue etc.) dépend du revenu, une donnée mal-heureusement non disponible dans notre exploitation. Cependant, le risqueVerres Optiques aurait été mieux piloté en intégrant le facteur « Salaire »dans un modèle explicatif de la dépense.

115

Page 116: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 117: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Conclusion générale

117

Page 118: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 119: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.4. MISES EN PLACE ET RÉSULTATS NUMÉRIQUES 119

Conclusions

Vu que nos travaux ont traité plusieurs problématiques actuarielles, nous par-venons aux neuf principales conclusions dont les applications peuvent être généra-lisées au-delà des garanties “forfait journalier” et “verres optiques” :

1. Pour évaluer la prime pure d’une garantie de prestations journalières, nousavons montré que la modélisation markovienne est appropriée et donne desrésultats cohérents. Les propriétés d’une chaîne de Markov permettent égale-ment les expressions simples de la prime pure. De plus, le modèle établi peutêtre paramétré en fonction des évolutions de la pathologie et des technologiesmédicales.

2. Pour évaluer la charge sinistres d’une garantie mono-sinistre où le rembour-sement est proportionnel à la dépense, la décomposition de la charge sinistresen trois composantes (la part assurée, la dépense et l’indicatrice d’achat) estjudicieuse et avantageuse.

3. Pour calibrer une loi continue bimodale, le modèle de la densité mélange està référencer. Lorsque les variables aléatoires composantes sont proprementchoisies, de nombreuses caractéristiques stochastiques de la charge sinistres(espérance, variance, skewness...) ont des formes explicites 6.

4. Lors de la calibration d’une loi continue, la méthode de la minimisation dela distance d’Anderson-Darling a été mise en place pour la première fois ets’est avérée à la fois performante et simple à réaliser. Nous avons démontréqu’au-delà de son utilité en tant que mesure de la qualité de calibration, ladistance d’Anderson-Darling peut également intervenir dans l’estimation desparamètres de la loi recherchée.

La confrontation de la méthode de minimisation A.-D avec d’autres ou-tils mathématiques avancés (algorithme EM, démarche MCO) s’est avéréeconcluante.

5. Nous avons prouvé heuristiquement que pour prédire une probabilité, la ré-gression linéaire peut être utilisée. Par rapport à la régression logistique, larégression linéaire est plus simple à mettre en place et l’interprétation desrésultats s’effectue d’une manière plus intuitive.

6. Pour évaluer la distribution de la charge sinistres, la formule récursive dePanjer requiert des conditions contraignantes avant utilisation. Néanmoins,pour un portefeuille de taille limitée (très limitée), les résultats donnés parcette méthode sont généralement bons.

6. Sous condition que le nombre de sinistres suive une loi discrète usuelle : binomiale, binomialenégative, Poisson, géométrique etc.

Page 120: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

120 CHAPITRE 7. CHARGE SINISTRES

7. Grâce à nos modèles de base et procédure de simulation, l’échantillon simulé aremplacé judicieusement les observations indisponibles de la charge sinistres.

8. Pour approximer la loi de la charge sinistres, la loi normale et la “loi NormalPower ” sont à transformer en lois tronquées avant d’être utilisables et ce afind’éviter des prédictions des charges négatives.

9. Pour modéliser la loi du nombre de sinistres en assurance santé, où la fré-quence de sinistres est souvent élevés pour la plupart des actes médicaux, laloi de Poisson est inappropriée. En revanche, nous avons démontré que la loibinomiale est plus adaptée.

Par ailleurs, l’approximation normale du nombre de sinistre est envisageableen assurance santé lorsque la taille du portefeuille est grande et que le tauxde sinistralité est proche de 0,5.

Prospectives de développement en modélisation

Dans le contexte de l’assurance hospitalisation, un processus de Markov d’ordresupérieur pourrait être envisagé pour modéliser le parcours d’un assuré entre lesétats hospitalisés et l’état valide. Dans ce modèle amélioré et plus complexe, laprime pure pour la prochaine période dépendra de l’ancienneté d’hospitalisationde l’assuré.

Le facteur saisonnier serait également à intégrer dans la modélisation marko-vienne. La loi initiale et la matrice de transition variant d’une façon mensuellepourraient donner une estimation plus précise de la prime pure annuelle.

Dans l’environnement de l’assurance optique et dans l’objectif de résoudre àla bi-modalité de la dépense, une approche pour détourner la modélisation par ladensité mélange et d’identifier les deux sources de données. Ceci implique l’identi-fication complète de l’étendu de la dépense pour chaque type de verres. Un indi-cateur possible pour cette séparation pourrait être par exemple la codification desactes médicaux publiée par la Sécurité sociale (dans notre exploitation, nous nedisposions malheureusement pas de cet indicateur). Une fois les données séparées,la calibration de la loi de la dépense pourrait se réaliser sur chaque jeu de donnéeshomogènes par une loi continue classique comme par exemple la loi Gamma ou laloi log-normale.

Concernant l’approximation de la loi de charge sinistres, des améliorations pourla formule de Panjer connaissent deux obstacles majeurs : 1) nécessité de discrétiserune dépense continue et 2) l’incapacité informatique de fonctionnement sur desportefeuilles de moyenne et grande taille (dépend de la proportion des assurés nonconsommants). En revanche, la “loi Normal Power ” pourrait être plus facilementaméliorée par une loi tronquée et ainsi éviter la prédiction des montants négatifs.

Page 121: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

7.4. MISES EN PLACE ET RÉSULTATS NUMÉRIQUES 121

Après cette amélioration, cette loi devrait être une bonne candidate comme loiapproximative de la charge sinistres.

Page 122: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 123: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Bibliographie

[1] PARDOUX E. (2007) Processus de Markov et applications - Algorithmes,réseaux, génome et finances. Dunod.

[2] DENUIT M., ROBERT C. (2007) Actuariat des assurances de personnes -Modélisation, tarification et provisionnement. Economica.

[3] PLACHET F., THEROND P (2006) Modèle de durée - Applications actua-rielles. Econominca.

[4] NOUGIER J.P. (2001) Méthode de calcul numérique Volume 1. Hermès.

[5] PARTRAT C, BESSON J.L. (2005) Assurance non-vie : modélisation, simu-lation. Economica.

[6] KAAS R. GOOVAERTS M., DHAENE J., DENUIT M. (2009) Moderne ac-tuarial risk theory using R. Springer.

[7] FRUHWIRTH-SCHNATTER S (2006) Finite Mixture And Markov SwitchingModels. Springer.

[8] SAPORTA G., LEJEUNE M., DROESBEKE J.-J. (2005) Méthodes statis-tiques pour données qualitatives. Editions Technip.

[9] MCLACHLAN G., PEEL D. (2000) Finite Mixture Models. Wiley.

[10] GÓMEZ-DÉNIZ E., SARABIA J. M. (2008) La distribución binomial-exponencial truncada con aplicaciones en el sector del seguro de automóviles.

[11] DEVOR J.L. (2011) Probability and Statistics for Engineering and the Sci-ences. Cengage Learning.

[12] LI Q., RACINE J.S. (2007) Nonparametric Econometrics: Theory and Prac-tice. Princeton University Press.

123

Page 124: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-
Page 125: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Annexe

Calcul de la variance de X

(réf. Table 5.1).

σ2X

4= E

[(X − µ)2

]= w1E

{[(X1 − µ1) + (µ1 − µX)]2

}+ w2E

{[(X2 − µ2) + (µ2 − µX)]2

}= w1E

{[(X1 − µ1)

2 + 2 (X1 − µ1) (µ1 − µX) + (µ1 − µX)2]}

+w2E{[

(X2 − µ2)2 + 2 (X2 − µ2) (µ2 − µX) + (µ2 − µX)2

]}= w1

{E[(X1 − µ1)

2]+ 2 (µ1 − µX)E [X1 − µ1] + E[(µ1 − µX)2

]}+w2

{E[(X2 − µ2)

2]+ 2 (µ2 − µX)E [X2 − µ2] + E[(µ2 − µX)2

]}= w1

[σ21 + (µ1 − µX)2

]+ w2

[σ22 + (µ2 − µX)2

]

Calcul du moment centré d’ordre 3 de S

(réf. Section 7.1.2)

M ′S = nMn−1

SkM ′

Sk

M ′′S = n (n− 1)Mn−2

Sk

(M ′

Sk

)2+ nMn−1

SkM ′′

Sk

M ′′′S = n (n− 1) (n− 2)Mn−3

Sk

(M ′

Sk

)3+ n (n− 1)Mn−2

Sk· 2 ·M ′

Sk·M ′′

Sk

+n (n− 1)Mn−2Sk

M ′SkM ′′

Sk+ nMn−1

SkM ′′′

Sk

m(3)S = M ′′′

S (0) = n (n− 1) (n− 2)µ3Sk

+ 3n (n− 1)µSkm(2)Sk

+nm(3)Sk.

Culture de la modélisation actuarielle

(Extrait de L’Argus de l’assurance, N°7271, article Les modèles sont partout)

125

Page 126: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

126 BIBLIOGRAPHIE

À chaque risque sa formule mathématique : telle pourrait être la devise des ac-tuaires. Les modèles de risque forment une représentation possible d’une situationcomplexe et changeante, grâce à un ensemble de relations mathématiques desti-nées à anticiper une situation future. Ils sont utilisés dans le calcul des primes,provisions et marge de solvabilité. Ces modèles doivent être facilement modifiableset suffisamment flexibles pour s’appliquer à différents scénarios.

L’innovation informatique a provoqué une explosion de la capacité de calcul etpermis l’élaboration de processus complexes. Toutefois, il n’est pas question pourautant d’ignorer le facteur humain.

En assurance non-vie, des méthodes de projection stochastiques sont de plusen plus utilisées mais les modèles simples servent encore souvent de référence.

Interprétation du coefficient d’asymétrie et du

kurtosis

– Coefficient d’asymétrie (skewness) : indicateur utilisé dans l’analyse de ladistribution comme mesure de l’asymétrie.– Skewness > 0 : La plupart des valeurs sont concentrées à gauche de la

moyenne. Il existe donc une queue de distribution étalée vers la droite.– Skewness < 0 : La plupart des valeurs sont concentrées à droite de la

moyenne. Il existe donc une queue de distribution étalée vers la gauche.– Skewness = 0 : moyenne=médiane. La distribution est symétrique par

rapport à la moyenne.– Kurtosis : indicateur utilisé dans l’analyse de la distribution comme un co-

efficient d’aplatissement (ou de la pointicité) d’une distribution.– Kurtosis > 3 : Distribution leptokurtique, plus aigüe qu’une distribution

normale, avec des valeurs concentrées autour de la moyenne et des queueslourdes.

– Kurtosis < 3 : Distribution platikurtique, plus plate qu’une distributionnormale avec un sommet plus large.

– Kurtosis = 3 : Distribution mésokurtique, par exemple la distribution nor-male.

Page 127: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

BIBLIOGRAPHIE 127

Données pour l’étude de la probabilité d’achat

Table 7.8: Données et intervalles de confiance (IC)

Page 128: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

Table des matières

Introduction générale 9

I Prime pure de la garantie Forfait journalier en assu-rance hospitalisation 17

1 Modélisation de la prime pure 231.1 Le modèle de la sinistralité . . . . . . . . . . . . . . . . . . . . . . . 231.2 Modélisation par état de situation . . . . . . . . . . . . . . . . . . . 24

Particularité du contrat collectif . . . . . . . . . . . . 241.3 Expressions de la prime pure . . . . . . . . . . . . . . . . . . . . . . 25

1.3.1 Prime pure sans franchise . . . . . . . . . . . . . . . . . . . 251.3.2 Prime pure avec franchise . . . . . . . . . . . . . . . . . . . 26

1.4 Modélisation par une chaîne de Markov . . . . . . . . . . . . . . . . 271.4.1 Outils markoviens . . . . . . . . . . . . . . . . . . . . . . . . 271.4.2 Prime pure sans franchise . . . . . . . . . . . . . . . . . . . 281.4.3 Prime pure avec franchise . . . . . . . . . . . . . . . . . . . 29

2 Estimation des paramètres et applications 312.1 Estimations statistiques et résultats . . . . . . . . . . . . . . . . . . 31

2.1.1 Estimation de P . . . . . . . . . . . . . . . . . . . . . . . . 312.1.2 Estimation de µ . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.2 Lissage et résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.2.1 Ajustement par régression de Poisson de P . . . . . . . . . . 35

2.2.1.1 L’idée . . . . . . . . . . . . . . . . . . . . . . . . . 352.2.1.2 La mise en œuvre . . . . . . . . . . . . . . . . . . . 362.2.1.3 Résultats et interprétations . . . . . . . . . . . . . 362.2.1.4 Qualité de l’ajustement . . . . . . . . . . . . . . . 40

2.2.2 Lissage de µ . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.2.2.1 Première tentative : régression . . . . . . . . . . . . 422.2.2.2 Deuxième tentative : WH . . . . . . . . . . . . . . 42

Utilisation de la méthode . . . . . . . . . . . . . . . . 42

128

Page 129: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

TABLE DES MATIÈRES 129

Constance du taux d’abattement . . . . . . . . . . . . 442.2.2.3 Qualité du lissage . . . . . . . . . . . . . . . . . . . 45

2.3 Prime pure estimée . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3 Hypothèses et réalité 51

Conclusion 55

II Charge sinistres de la garantie Verres en assuranceoptique 57

4 Le modèle de la sinistralité 61

5 Modélisation d’une dépense bimodale 635.1 Une dépense aléatoire bimodale . . . . . . . . . . . . . . . . . . . . 635.2 Modélisation par densité combinée . . . . . . . . . . . . . . . . . . 65

5.2.1 Modélisation par évènements . . . . . . . . . . . . . . . . . . 655.2.2 Modélisation approximative . . . . . . . . . . . . . . . . . . 665.2.3 Point sur les modélisations . . . . . . . . . . . . . . . . . . . 68

5.3 Estimation des paramètres . . . . . . . . . . . . . . . . . . . . . . . 695.3.1 Préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . 695.3.2 Algorithme EM . . . . . . . . . . . . . . . . . . . . . . . . . 705.3.3 Minimisation de la distance d’Anderson-Darling . . . . . . . 715.3.4 Méthode MCO . . . . . . . . . . . . . . . . . . . . . . . . . 715.3.5 Bilan de la méthodologie . . . . . . . . . . . . . . . . . . . . 73

5.3.5.1 Estimations par méthodes . . . . . . . . . . . . . . 735.3.5.2 Qualité des estimations . . . . . . . . . . . . . . . 735.3.5.3 Résumé . . . . . . . . . . . . . . . . . . . . . . . . 77

5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

6 Modélisation de la probabilité d’achat 816.1 Modélisation préliminaire . . . . . . . . . . . . . . . . . . . . . . . . 816.2 Estimation de p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 826.3 Etudes des variables explicatives . . . . . . . . . . . . . . . . . . . . 836.4 Régression logistique . . . . . . . . . . . . . . . . . . . . . . . . . . 85

6.4.1 Pourquoi régression logistique ? . . . . . . . . . . . . . . . . 856.4.2 Choix du modèle . . . . . . . . . . . . . . . . . . . . . . . . 86

6.4.2.1 Les prérequis . . . . . . . . . . . . . . . . . . . . . 866.4.2.2 Modèles candidats et choix du modèle . . . . . . . 88

6.5 Autres techniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 906.5.1 Méthode tabulaire . . . . . . . . . . . . . . . . . . . . . . . 90

Page 130: Sinistralité en assurance santé : modélisation, … · sinistre individuel admet une distribution ayant une masse en 0, entraînant une ... monture,uneprothèsecoûteuseparexemplelaprothèseauditiveetc);lapresta-

130 TABLE DES MATIÈRES

6.5.1.1 Coefficients des termes isolés . . . . . . . . . . . . 916.5.1.2 Coefficients des termes croisés . . . . . . . . . . . . 93

6.5.2 Régression linéaire . . . . . . . . . . . . . . . . . . . . . . . 946.6 Point sur la méthodologie . . . . . . . . . . . . . . . . . . . . . . . 946.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

7 Charge sinistres 977.1 Caractéristiques des charges sinistres . . . . . . . . . . . . . . . . . 97

7.1.1 La dépense éventuelle Dk et la charge individuelle Sk . . . . 987.1.2 La charge totale S . . . . . . . . . . . . . . . . . . . . . . . 99

7.2 Simulation de la charge sinistres . . . . . . . . . . . . . . . . . . . . 1007.2.1 Méthode de la simulation . . . . . . . . . . . . . . . . . . . 1007.2.2 Validation de la simulation . . . . . . . . . . . . . . . . . . . 101

7.2.2.1 Les trois versions d’une variable aléatoire . . . . . . 1017.2.2.2 Critères et outils de la validation . . . . . . . . . . 102

7.3 Loi de la charge sinistres . . . . . . . . . . . . . . . . . . . . . . . . 1027.3.1 Lien avec le modèle collectif et formule récursive de Panjer . 1027.3.2 Approximation par des lois connues . . . . . . . . . . . . . . 1057.3.3 Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

7.4 Mises en place et résultats numériques . . . . . . . . . . . . . . . . 1057.4.1 Simulation de S . . . . . . . . . . . . . . . . . . . . . . . . . 106

7.4.1.1 Validation de la simulation de X1, X2 et X . . . . 1067.4.1.2 Validation de la simulation de Dk . . . . . . . . . . 1087.4.1.3 Validation des quantités calculées Sk et S . . . . . 110

7.4.2 Distributions approximées de S . . . . . . . . . . . . . . . . 110

Conclusion 115

Conclusion générale 119

Bibliographie 123

Annexe 125

Table des matières 128