31
Application de l'analyse factorielle à l'étude de la mortalité Author(s): Jean Bourgeois-Pichat Source: Population (French Edition), 45e Année, No. 4/5 (Jul. - Oct., 1990), pp. 773-802 Published by: Institut National d'Études Démographiques Stable URL: http://www.jstor.org/stable/1533287 Accessed: 16/04/2009 21:57 Your use of the JSTOR archive indicates your acceptance of JSTOR's Terms and Conditions of Use, available at http://www.jstor.org/page/info/about/policies/terms.jsp. JSTOR's Terms and Conditions of Use provides, in part, that unless you have obtained prior permission, you may not download an entire issue of a journal or multiple copies of articles, and you may use content in the JSTOR archive only for your personal, non-commercial use. Please contact the publisher regarding any further use of this work. Publisher contact information may be obtained at http://www.jstor.org/action/showPublisher?publisherCode=ined. Each copy of any part of a JSTOR transmission must contain the same copyright notice that appears on the screen or printed page of such transmission. JSTOR is a not-for-profit organization founded in 1995 to build trusted digital archives for scholarship. We work with the scholarly community to preserve their work and the materials they rely upon, and to build a common research platform that promotes the discovery and use of these resources. For more information about JSTOR, please contact [email protected]. Institut National d'Études Démographiques is collaborating with JSTOR to digitize, preserve and extend access to Population (French Edition). http://www.jstor.org

Application de l'analyse factorielle à l'étude de la

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Application de l'analyse factorielle à l'étude de la

Application de l'analyse factorielle à l'étude de la mortalitéAuthor(s): Jean Bourgeois-PichatSource: Population (French Edition), 45e Année, No. 4/5 (Jul. - Oct., 1990), pp. 773-802Published by: Institut National d'Études DémographiquesStable URL: http://www.jstor.org/stable/1533287Accessed: 16/04/2009 21:57

Your use of the JSTOR archive indicates your acceptance of JSTOR's Terms and Conditions of Use, available athttp://www.jstor.org/page/info/about/policies/terms.jsp. JSTOR's Terms and Conditions of Use provides, in part, that unlessyou have obtained prior permission, you may not download an entire issue of a journal or multiple copies of articles, and youmay use content in the JSTOR archive only for your personal, non-commercial use.

Please contact the publisher regarding any further use of this work. Publisher contact information may be obtained athttp://www.jstor.org/action/showPublisher?publisherCode=ined.

Each copy of any part of a JSTOR transmission must contain the same copyright notice that appears on the screen or printedpage of such transmission.

JSTOR is a not-for-profit organization founded in 1995 to build trusted digital archives for scholarship. We work with thescholarly community to preserve their work and the materials they rely upon, and to build a common research platform thatpromotes the discovery and use of these resources. For more information about JSTOR, please contact [email protected].

Institut National d'Études Démographiques is collaborating with JSTOR to digitize, preserve and extend accessto Population (French Edition).

http://www.jstor.org

Page 2: Application de l'analyse factorielle à l'étude de la

APPLICATION DE L'ANALYSE FACTORIELLE A 1'ETUDE DE LA

MORTALITIE*

Avant d'6tablir divers rdseaux de tables-types de mor- talite, a partir d'un ensemble de 157 tables existantes, Sully Ledermann avait soumis cet echantillon d une analyse facto- rielle. II cherchait alors quelles dimensions de la mortalite il faudrait prendre en compte pour reconstituer, avec une prd- cision suffisante, une table graice d un nombre limite d'in- dices**. J. BOURGEOIS-PICHAT reprend ici ses conclusions et les applique a une analyse de la mortalite americaine. II pro- cedera de meme par la suite avec les departements fran- fais*** et l'dvolution seculaire ou recente de la mortalite en Norvege, en France et au Japon****. La definition d'indices synthetiques originaux, qui avait dejd orients ses travaux sur la mortalite infantile et sur la fecondite, continue donc de le prdoccuper.

L'analyse des statistiques de dec's est aussi ancienne que la demo-

graphie elle-meme. A la derniere reunion de la Population Association of America, John D. Durand montrait que l'origine de la demographie re- montait a Graunt et son analyse des listes de deces en Angleterre au milieu du xvIIW siecle. La recherche sur la mortalite est le domaine dans lequel la demographie a obtenu les plus belles reussites, et il est eclairant de lire sur ce point les actes des reunions de l'Institut International de Statistique tout au long du XIXI siecle. A chacune de ces reunions, une large place etait reserv6e a la discussion de divers aspects de la mortalite humaine. I1 semble un peu risque de proposer une nouvelle discussion de ce theme ancien, et je dois avouer que si les organisateurs de cette confdrence ne m'avaient pas demande une communication sur ce sujet et si j'etais venu a cette reunion comme simple participant, je me serais demande ce qu'on pouvait dire de nouveau sur ce sujet. J'imagine que vous partagez cet etat

d'esprit pour la plupart.

* Version franqaise de <Application of factor analysis to the study of mortality>> in: Emerging techniques in population research, New York, Milbank Memorial Fund, 1963.

*S. Ledermann et J. Breas: ?Les dimensions de la mortalite>, Population, 4, 1959. *** Rapport sur la situation demographique de la France en 1969. Paris, INED s.d.,

104 p. **** Dynamique des populations, DEA d'Economie appliqude. Institut d'Etudes politi-

ques de Paris; 1985-1986.

Population, 4-5, 1990, 773-802

Page 3: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALIT!

L'analyse d'un ensemble de donnees statistiques sur la mortalite peut s'orienter de deux facons tres differentes:

a) On peut d6terminer quel type de facteurs expliquent les variations des donnees, par exemple, le sexe, l'age, la classe sociale, le climat, le niveau de vie, l'instruction, l'alimentation, le syst/me de soins, le nombre de medecins et de lits hospitaliers par habitant, le regime de protection sociale, les causes de deces, etc. (la liste n'est qu'illustrative et ne pretend pas etre exhaustive).

On peut alors analyser les donnees selon ces divers facteurs et essayer de mesurer l'effet de chacun d'eux.

b) Mais on peut aussi (et c'est la deuxieme orientation annoncee) oublier un moment que l'ensemble des donnees traite de la mortalite. En d'autres termes, on peut adopter la position de quelqu'un qui trouverait l'ensemble des donnees dans des archives oubliees et qui ne saurait rien du domaine couvert par ces archives.

On pourrait alors appliquer a cet ensemble de donn6es des methodes d'analyse statistique pour determiner ainsi d'abord le nombre minimum de facteurs necessaires a l'explication des variations decrites par les donnees et pour mesurer ensuite la part de chaque facteur dans l'explication de ces variations. On peut enfin essayer d'identifier ces facteurs en les reliant a diverses caracteristiques, du type de celles mentionnees plus haut lorsque nous decrivions le premier mode d'analyse des donnees statistiques.

La majorite des analyses de la mortalite ont suivi jusqu'ici la premiere voie. La seconde fait l'objet de ce texte. Celui-ci a pour origine un article intitule <<Les dimensions de la mortalite6>>() ou les auteurs, Ledermann et Breas, ont applique leur methode a un ensemble de donnees compose des 157 tables de mortalite que les Nations Unies avaient utilisees pour construire un reseau de tables types(2). La methode implique des calculs importants. Nous donnerons d'abord un bref resume de la methode, puis les principaux resultats de l'analyse. Partant ensuite de ces resultats, nous proposerons alors une methode d'analyse qui, tout en conservant les prin- cipaux avantages de leur travail, apparait beaucoup plus simple que les methodes utilisees par Ledermann et Breas. Enfin, nous appliquerons le nouvel outil propose aux donnees americaines recentes.

Les methodes utilises Les auteurs ont analyse un ensemble de par Ledermann et Breas donnees compose de probabilites de

d6c's par intervalle d'age, rapportees a 'ge au debut de l'intervalle. Plus precisement, ils ont pris les logari- thmes de ces quotients, separement pour les hommes et les femmes des groupes d'ages suivants: moins de 1 an, 1-4 ans, 5-9 ans, 10-14 ans... et ainsi de suite par groupe quinquennal d'ages jusqu'a 80-84 ans. Dans cha-

(1) Population, 6, oct.-d6c. 1959, p. 637-682. (2) <<Sch6mas de variation de la mortalit6 selon 1'age et le sexe>. Nations Unies, Etudes

demographiques n? 22, 1956.

774

Page 4: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITI

que table, il y a ainsi 18 probabilit6s de d6ces pour les hommes et 18 pour les femmes, soit 36 au total. Dans un espace a 36 dimensions, une table de mortalite peut donc etre represent6e par un point, dont les coor- donnees sont les logarithmes des quotients definis ci-dessus. Pour simpli- fier, nous prendrons l'origine des coordonnees au point correspondant a la moyenne des 157 tables. Dans un tel espace, il y a 36 axes OX1, OX2, OX3...OX36. Les tables de mortalite sont numerot6es de 1 a 157, et la table n est reprdsentee par le point Mn. Les coordonnees de Mn sont respecti- vement egales aux 36 differences entre les logarithmes des 36 quotients de la table n et des 36 quotients de la moyenne des 157 tables.

Effectuons dans cet espace un changement d'axes de coordonnees(3). Nous prenons 36 nouveaux axes OR, OR2, OR3,...OR36, les nouvelles co- ordonnees etant liees aux anciennes par les equations suivantes:

1 1 1 R1 = al xi + a2 2 + ... + a36 x36

R2 =a2X1 +a2x2+ ... +ax36X36

a36 a36 36 R36=a l + 2 + 6 + a+ax36 [1]

Calculons, pour un changement d'axes donne, la variance de chaque coordonnee Rp, R2...R36 dans l'univers represente par les 157 tables de mor- talite. Pour un changement d'axe donne, il y a 36 variances dont une est la plus grande. La valeur de ce maximum depend evidemment du chan- gement d'axes, et quand on prend en compte tous les changements d'axes possibles on peut montrer que, parmi l'ensemble des valeurs maximales obtenues, une au moins est la plus forte. Notons R1 ce maximum maxi- morum. On peut voir en outre que ce maximum maximorum est commun a un nombre infini de changements d'axes ayant tous en commun l'axe OR, et se distinguant les uns des autres par les autres axes.

En appliquant la meme methode a ce nombre infini de changements d'axes, on peut determiner un deuxi~me axe OR2 correspondant a la plus grande variance possible de R, sauf R1 (R1 reste maintenant constant). En repetant a nouveau la meme methode, on determine un troisieme axe OR3 et ainsi de suite jusqu'a OR36.

On peut donner une illustration geometrique de cette methode. M1, M2,...M36 representant un nuage de points ayant a peu pres la forme d'un ellipsoide dans un espace a 36 dimensions. Les nouveaux axes OR,, OR2...0R36 sont les axes principaux de l'ellipsoide. I1 peut arriver que l'el- lipsoide soit <plat> dans certaines directions. Si cela se produit dans une seule direction, les coefficients sont nuls dans la derniere equation du sys- teme [1] a36 a36... a36. Dans ce cas, l'univers represente par les 157 points Mn, que nous croyons etre un univers a 36 dimensions, n'en aurait en fait que 35.

(3) Nous conservons la meme origine des coordonnees.

775

Page 5: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITt

En fait, l'ellipsoide n'est jamais completement plat dans aucune di- rection. Les coefficients du systeme [1] ne sont jamais nuls. II arrive seu- lement qu'ils soient faibles dans certaines directions. La methode utilisee pour determiner les axes successifs OR1,OR2...OR36 classe ceux-ci par ordre d'<<paisseur>. En d'autres termes, l'ellipsoide est moins plat dans la di- rection d'OR, que dans celle d'OR2 et moins plat dans la direction d'OR2 que dans celle d'OR3.

Ledermann et Breas ont decouvert qu'a partir du sixieme axe les coef- ficients etaient tres petits et ils ont considere que cinq dimensions suffi- saient a decrire l'univers des 157 tables. Ils ont montre que ces cinq dimensions permettaient d'expliquer 96 % des correlations entre les probabilites de dec's des divers groupes d'ages. Ce pourcentage donne une idee de l'erreur commise lorsqu'on neglige toutes les dimensions au-dela de la cin- quieme.

Mais des qu'on a etabli que l'univers des 157 tables pouvait etre decrit dans les termes d'un espace a cinq dimensions, on peut voir faci- lement que le systeme de cinq axes ORl, OR2, OR3, OR4 et OR5 obtenu par la methode exposee plus haut n'est qu'un systeme parmi beaucoup d'autres. Comme il est difficile de suivre un raisonnement dans un univers a cinq dimensions, imaginons qu'on ait trouve que l'univers des 157 tables n'a que deux dimensions.

Dans ce cas imaginaire, nous n'avons que deux axes, OR1 et OR2, et nous pouvons ecrire:

R1 =a x1 +a1x2 +.a3636

R = a2 xl + a2 x+ 636 [2] 2 1 2 36 X36 [2]

Chaque table est maintenant reduite a deux coordonnees obtenues par la formule [2]. Dans un systeme forme de deux axes perpendiculaires OR1 et OR2, chaque table de mortalite est representee par un point Mn. Les 157 points forment un nuage ayant a peu pres la forme d'une ellipse. OR1 et OR2 sont les axes principaux de cette ellipse, mais il y a evidemment un nombre infini de fagons de decomposer l'univers de la mortalite en deux composantes. Tout changement d'axes dans le plan defini par OR1 et OR2 permet d'obtenir une telle decomposition. Les deux axes OR1 et OR2 n'ont que le privilege d'etre les axes principaux de l'ellipse ayant la forme du nuage, OR1 le grand axe et OR2 le petit. D'autres changements d'axes possibles peuvent avoir d'autre proprietes utiles pour decrire un univers de 157 tables de mortalite. Etudions-en certains:

= ... bi R1 + b R

X 2 1 2 x2 =...' bi RI + b2 R2

X36=.* bl6R + 2 R2 [3]

776

Page 6: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITt

En general, bn et bn sont differents de zero. Ceci signifie que l'univers a deux dimensions pour les deux sexes et a tous les ages. Dans le systeme d'axes (OR1, OR2), si nous portons bf en abscisse et bn en ordonnee, nous obtenons 36 points, dont aucun n'est sur les deux axes, puisque b7 et bn sont diff6rents de z6ro.

Imaginons que la courbe liant les 36 points soit celle representee sur la figure 1. En d'autres termes, imaginons qu'entre 5 et 35 ans les points puissent etre correctement ajustes par une droite OF1. En prenant comme nouveaux axes OF1 et OF2 perpendiculaire a OF,, nous obtiendrons une nouvelle separation de l'univers en deux composantes, et de 5 a 35 ans la nouvelle seconde composante n'aura pas d'effet. Entre ces deux ages, le nouveau coefficient bn est egal a z6ro. En d'autres termes, dans cet

exemple imaginaire, 1'ensemble de la mortalit6 ne dependra que de deux facteurs. Mais les deux facteurs ne seront presents qu'avant 5 ans et au-

/ F2

/ /

/ /

/ /

/ /

I 5-

Groupe d'age

'5-

70-

65-

0-

*F

HOMMES - -- FEMMES

v

2679(

-~F'1

Figure 1. - Profil imaginaire correspondant au point M1 dont les co- ordonnees sont les coefficients bi et b2 du systeme [3].

F2

/

Az 4-

777

Page 7: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITE

dela de 35 ans. Entre 5 et 35 ans, la mortalite ne dependra que du premier facteur.

Les deux facons que nous avons decrites ici de separer la mortalite en deux composantes correspondent a deux problemes distincts.

La premiere separation associee aux axes ORI et OR2 donne une re- ponse a la question suivante: Si un univers de mortalite a deux dimensions, et si nous voulons <<mesurer>> un niveau de mortalite donne par un indi- cateur unique, quel est le meilleur indicateur ? La reponse est que nous devons choisir R1. En ne retenant qu'un indicateur, nous n6gligeons bien sur R2, mais dans tout systeme de coordonnees autre que (ORl OR2) l'erreur commise en negligeant la seconde dimension sera plus grande que dans le systeme (OR, OR2). Si au lieu de deux composantes nous en avons cinq, comme Ledermann et Breas dans l'univers des 157 tables de mor- talite, le probleme est exactement le meme. Si nous voulons mesurer, dans cet univers, un niveau de mortalite par un indicateur unique, le meilleur choix est R1. Pour deux indicateurs le meilleur choix sera R1 et R2. Pour trois indicateurs le meilleur choix sera R1, R2 et R3, et ainsi de suite.

Si nous revenons a notre univers imaginaire n'ayant que deux di- mensions, le second mode de separation en deux composantes, materialisE par les deux nouveaux axes OF1 et OF2, donne la solution d'un autre pro- bleme qui peut etre enonce comme suit:

Si un univers de mortalite a deux dimensions, il y a un nombre infini de faqons de definir deux <composantes>> qui nous permettent de recons- truire une serie de quotients de mortalite par sexe et age. Laquelle (ou lesquelles) choisir afin de reduire au minimum, pour autant de groupes d'ages que possible, le nombre de composantes a prendre en compte pour reconstruire les quotients de mortalite ? Dans le cas illustre par la figure 1, les nouveaux axes OF1 et OF2 sont une solution du probleme. Mais ce n'est qu'une solution, et le probleme peut en avoir plusieurs. Par exemple, le systeme d'axes (OF'1 OF'2) donne une autre separation de la mortalite en deux composantes. Dans ce systeme, la deuxieme composante n'est pre- sente qu'avant 5 ans, alors qu'au-dela de 5 ans les deux composantes sont presentes. Evidemment, cette nouvelle faqon d'obtenir deux composantes est moins simple que celle correspondant a (OF1 OF2). Mais on peut ai- sement imaginer que dans certains cas, on peut obtenir plusieurs fagons plus ou moins equivalentes. Par consequent alors que le premier probleme a une solution unique, le second offre une certaine incertitude. Nous devons cependant reconnaitre que la solution unique du premier probleme est ex- clusivement descriptive et il n'y a, a priori, aucune raison de penser que les deux composantes definies par (OR1 OR2) correspondent a quelque chose de fondamental dans le mecanisme complexe qui determine l'en- semble de la mortalite. En r6solvant le second probleme, nous ne sommes evidemment pas suir d'atteindre les fondements de ce mecanisme, mais nous avons des raisons de penser que nous l'atteignons. Il semble improbable que, par hasard, une composante ne soit pas presente dans une serie de

778

Page 8: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALIT7

groupes d'ages consecutifs. Nous pouvons esperer trouver quelque chose de fondamental derriere ce fait.

Apres les principes de la m6thode utilisee par Ledermann et Breas, donnons un resume des resultats.

Resume des resultats On l'a dit plus haut, Ledermann et Breas ont d6couvert qu'on pourrait donner une bonne

description de l'univers des 157 tables en admettant que cet univers avait cinq dimensions. Avec la notation pr6c6dente, le logarithme du quotient de mortalite a 1l'ge a est tel que :

Log = gg +bF b b F3 b F4 + bF5 [4]

Dans cette relation, b,b b, b, ba, b b ne dependent que de l'age et va- lent pour tous les niveaux de mortalite. F1, F2, F3, F4 et F5 ne dependent pas de l'age et varient avec le niveau de mortalite.

Enfin Qa est egal a la moyenne des quotients de mortalite6 l'age a dans les 157 tables de mortalit6.

En repassant du logarithme au quotient lui-meme, nous pouvons ecrire:

qa= Qa (Aa) F

(Ba) F2 (Ca) F3 (Da) F4 (Ea) F5

ou Aa, Ba, Ca, Da, Ea dependent de l'age et valent pour tous les niveaux de mortalite, F1 F2 F3 F4 F5 dependent du niveau de mortalite mais va- lent pour tous les ages. F1 F2 F3 F4 F5 sont les <composantes> de la mor- talite. Le niveau de mortalit6 correspondant a la moyenne des 157 tables est obtenu lorsque

F1 = F2 = F3 = F4 = F5 = 0.

Chaque table de mortalite est decrite par la relation [4], laquelle est calcul6e pour chaque groupe d'ages par r6f6rence a la valeur moyenne Qa. Si, par exemple pour une table donn6e, F, est tel que (Aa)FI=0,5, ceci signifie que, lorsque la premiere composante varie de z6ro A F,, le quotient de mortalite est r6duit de moitie par rapport a la valeur moyenne Qa. En utilisant une serie de diff6rentes valeurs pour F1, on peut calculer une serie de tables de mortalite faisant apparaitre comment on s'ecarterait des conditions moyennes si la premi6re composante variait selon les valeurs adoptees pour F1. Les resultats de ces calculs figurent au tableau 1. Ceci ne signifie pas qu'en procedant ainsi on obtient une serie de tables de mortalite qui seraient observables si la premiere composante agissait seule. Ce qu'on obtient est une serie de tables de mortalite correspondant a une serie de valeurs de la premiere composante associees a la valeur moyenne des quatre autres composantes. En d'autres termes, on ne peut parler de tables de mortalit6 dues a une composante donnee que pour un niveau donn6 des autres composantes. Ce niveau des autres composantes peut etre choisi arbitrairement. Il suffit qu'il reste constant lorsque varie la compo-

779

Page 9: Application de l'analyse factorielle à l'étude de la

TABLEAU 1. - MORTALITt PAR AGE POUR CERTAINS GROUPES DAGES CORRESPONDANT A DIVERS NIVEAUX DE LA PREMIERE COMPOSANTE ASSO-

CIlE, POUR LES AUTRES COMPOSANTES, AUX CONDITIONS MOYENNES DES 157 TABLES UTILIS?ES POUR CONSTRUIRE LES TABLES TYPES DE

MORTALITE DES NATIONS UNIES (MOYENNE DES TAUX QUINQUENNAUX POUR 10 000)

Taux de mortalitd par age et sexe Esperance de vie a la naissance Premiere (en annees)

composantea) Moins d'un an 1-4 ans 5-34 ans 45-64 ans 70-84 ans F1 Fi

Sexes Femmes Hommes Femmes Hommes Femmes Hommes Femmes Hommes Femmes Hommes Femmes Hommes u

2,3 3 390,08 3 712,78 934,23 906,08 188,40 155,37 338,86 409,18 1 377,4 1 498,3 22,6 22,5 22,6 1,9 2 616,99 2 918,34 610,22 601,77 140,24 121,74 293,62 360,06 1 302,1 1 428,1 29,7 29,0 29,3 1,6 2 170,21 2451,87 449,29 448,11 112,65 101,51 264,08 328,11 1 302,1 1 378,3 35,4 34,1 34,7 1,3 1 807,30 2 068,80 333,28 335,90 90,64 84,73 237,65 298,37 1 199,4 1 330,9 40,5 38,8 39,6 1,0 1 510,90 1 751,99 248,62 253,13 73,04 70,56 214,13 272,75 1 152,0 1 285,8 45,3 43,2 44,2 0,7 1 266,90 1 487,96 186,20 191,49 58,92 59,19 193,04 248,99 1107,1 1 242,7 49,9 47,1 48,5 0,4 1 064,90 1 267,02 139,88 145,28 47,58 49,52 174,18 227,64 1 064,5 1 201,5 53,6 50,5 52,0 0,1 897,04 1 081,05 105,31 110,46 38,45 41,45 157,28 208,01 1 024,1 1 162,2 57,4 53,8 55,6 0,0 847,52 1 025,72 95,84 100,86 35,83 39,07 152,03 201,92 1 011,0 1 149,4 58,5 54,8 56,6

0,1 800,87 973,44 87,24 92,09 33,38 36,82 146,99 196,03 998,2 1 136,9 59,4 55,8 57,6 0,4 676,45 832,87 65,85 70,19 27,22 30,85 132,86 179,45 960,9 1 100,3 62,0 58,4 60,2 0,7 572,09 713,56 49,75 53,56 21,87 25,85 120,17 164,37 925,5 1 065,3 64,5 60,9 62,7 1,0 484,35 612,02 37,62 40,89 17,71 21,68 108,72 150,65 891,7 1 031,8 66,6 62,9 64,7 1,3 410,44 525,45 28,46 31,25 14,36 18,18 98,47 138,06 859,5 999,6 68,5 64,8 66,6 1,6 348,07 451,48 21,55 23,88 11,64 15,25 89,22 126,77 828,8 968,8 70,2 66,5 68,3 1,9 295,37 388,21 16,31 18,28 9,45 12,80 80,84 116,39 800,1 939,1 71,8 68,1 69,9 2,3 237,50 317,71 11,26 12,77 7,15 10,14 70,95 103,93 762,3 901,5 73,6 69,9 71,7

3,2 145,78 202,99 4,90 5,72 3,83 6,00 53,04 80,80 686,5 823,6 76,7 73,2 74,9 4,5 72,16 106,78 1,43 1,79 1,56 2,82 35,05 56,53 596,6 725,7 79,9 76,5 78,2

(a) Fl est la variable utilisee par Ledermann et Breas dans leur article.

oo O

z >

I>

pn

m

0

r2i |4

Page 10: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALIT7

sante pour laquelle les tables de mortalit6 sont calculees. Pour simplifier, nous proposons de choisir les valeurs des diverses composantes corres- pondant aux conditions moyennes des 157 tables de mortalite. Les effets des diverses composantes peuvent alors etre mesures par les cinq multi- plicateurs

(Aa) F1, (Ba)F2 , (Ca) F3, (Da) F4, (Ee) F5

qui sont appliques a chaque age au quotient moyen Qa. Nous avons vu que toutes les composantes sont, en general, presentes

a chaque age. Nous avons vu aussi que, par une rotation appropri6e des axes de coordonnees, on pouvait choisir cinq composantes qui soient pre- sentes a certains ages et absentes a d'autres, et que ce choix etait en partie arbitraire. Ledermann et Breas ont essaye diverses rotations et ont finale- ment choisi cinq composantes ayant les proprietes suivantes4) :

a) la premiere composante est presente a tous les ages et pour les deux sexes;

b) la deuxieme composante a peu d'effet de 5 a 35 ans et au-dela de 65 ans. Son effet est maximal entre 45 et 65 ans. De plus, les effets au-dela de 35 ans et avant 5 ans sont de signes opposes. En d'autres termes, si la deuxieme composante accroit, au-dela de 35 ans, le quotient de mortalite correspondant aux conditions moyennes, elle diminue avant 5 ans le quotient de mortalite correspondant aux conditions moyennes;

c) la troisieme composante a peu d'effet entre 5 et 65 ans. Avant 5 ans et au-dela de 65 ans, les effets sont de meme signe;

d) la quatrieme composante n'a d'effet qu'avant 5 ans; e) la cinquieme composante n'a d'effet que pour les hommes. Avant

5 ans et apres 65 ans, les effets sont faibles. Les effets de la premiere composante sont, de loin, les plus impor-

tants. La variation de la premiere composante donne la tonalite dominante des variations de la mortalite. Les variations des quatre autres composantes n'introduisent que des ecarts limit6s par rapport a cette tonalite dominante. Le tableau 2 resume les effets des cinq composantes par sexe et grands

TABLEAU 2. - PRESENCE DES DIVERSES COMPOSANTES DE LA MORTALITE PAR GRANDS GROUPES D'AGES

Premiere Deuxieme Troisieme Quatrieme Cinquieme Groupe d'ages composante composante composante composante composante

Femmes Hommesemmes.HommesF emmesHoommesFemmesHommeFemmesHommes

Moins d'un an X X X X X X X X 1-4 ans X X X X X X X X

5-34 ans X X X 35-44 ans X X X 45-64 ans X X X X 65-69 ans X X X X 70-84 ans X X X X

781

Page 11: Application de l'analyse factorielle à l'étude de la

782 ANALYSE FACTORIELLE ET MORTALITE

groupes d'ages. Une croix indique que la composante est active. Un blanc indique que l'effet de la composante est faible. A partir de ces r6sultats, nous proposerons maintenant une methode pour analyser un ensemble de taux de mortalite par age et sexe.

Une methode pour analyser une serie de taux de mortalite par age et sexe

On decrira le principe de la methode en utilisant les quotients de mortalite utilises jusqu'ici. On expliquera ensuite comment la methode peut etre appliquee a un ensemble de taux(5) de mortalit6 par age et sexe.

a) Pour les femmes de 5 A 34 ans, selon le tableau 2, seule la pre- miere composante est active. A ces ages, la relation [4] se reduit a:

qa=Qa (Aa)F1.

I1 en resulte que, de 5 a 34 ans, les quotients de mortalite feminins peuvent etre utilises pour mesurer la premiere composante.

b) Pour les femmes encore, entre 45 et 64 ans, la premiere et la deuxieme composante sont actives. La relation [4] se reduit alors a:

q = Qa (Aa) F

(Ba) F2. [5]

Mais nous connaissons deja Qa (Aa) F puisque F1 a ete calcule en a). On peut donc calculer F2 a partir de la relation [5].

c) Entre 70 et 84 ans, toujours pour les femmes, les trois premieres composantes sont en jeu et on peut ecrire l'expression [4]:

qa = Qa (Aa) F (Ba) F2(Ca) F3.

Comme F, et F2 sont deja connus, cette expression nous permet de calculer F3.

d) On peut obtenir la quatrieme composante par la meme methode, en utilisant les quotients de mortalit6 avant 1 an et dans le groupe d'ages 1-4 ans.

e) Enfin on peut calculer la cinquieme composante en utilisant les quotients de mortalite des hommes entre 5 et 84 ans.

Les valeurs de F,, F2, F3, F4 et F5 obtenues par cette mEthode ne sont evidemment qu'approximatives. On pourrait penser que de 5 a 34 ans pour les femmes, la premiere composante est seule active, mais ce n'est pas tout a fait vrai. Les autres composantes ont aussi un leger effet a ces ages, et nous negligeons ces effets. II en va de meme pour les autres groupes d'ages.

(4) Les donn6es du tableau 1 se rdferent a la rotation adoptee par Ledermann et Breas. (5) Les taux de mortalite par age et sexe sont plus aisement disponibles que les quo-

tients. C'est pourquoi nous avons essayd de ddvelopper une mdthode qui puisse s'appliquer aux taux de mortalitd par age et sexe.

Page 12: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALIT7

Voyons maintenant comment appliquer la mdthode a un ensemble de taux de mortalit6 par age et sexe. Ce qu'on a dit de l'action des diverses composantes sur une s6rie de quotients de mortalite vaut aussi pour une serie de taux de mortalite. Prenons un exemple concret - les taux de mor- talite par age et sexe en 1955 aux Etats-Unis.

a) La moyenne des taux quinquennaux de mortalite de 5 a 34 ans etait de 7,15 pour 10000. Le tableau 1 montre qu'un tel taux est obtenu avec une valeur de la premiere composante F1 = -2,3 (premiere et sixieme colonnes du tableau 1). Le tableau 1 montre aussi que pour une telle valeur de la premiere composante, les taux quinquennaux moyens sont de 70,95 pour 10 000 femmes de 45-64 ans et 762,3 pour 10 000 femmes de 70- 84 ans, si les autres composantes correspondent aux conditions moyennes des 157 tables.

b) A 45-64 ans, le taux quinquennal moyen de mortalite f6minine etait de 89,5 p. 10 000 en 1955. Le rapport entre ce taux observe et celui calcule precedemment (70,95) est egal a 1,261 ; c'est le multiplicateur de la deuxieme composante pour les femmes de 45-64 ans.

c) Une fois connu le multiplicateur d'une composante pour un age et un sexe, on peut calculer le multiplicateur de cette composante pour tous les ages et pour l'autre sexe. Si on ramene a 100 le pourcentage de variation introduit par la seconde composante pour les femmes de 45 a 64 ans, les calculs de Ledermann et Br6as font apparaitre les pourcentages de variation suivants pour les autres groupes d'ages:

45 - 64 ans 70 - 84 ans

Femmes Hommes Femmes Hommes

100 125 50 70

d) Nous venons de voir en b) que le multiplicateur de la deuxieme composante etait egal a 1,261 en 1955 pour les femmes de 45-64 ans, soit un pourcentage de variation egal a + 26,1. En appliquant les proportions donnees en c) on obtient les multiplicateurs suivants pour la deuxieme composante:

Hommes 45-64 ans: 1,326 multiplicateurs de la Femmes 70-84 ans: 1,130 deuxieme composante Hommes 70-84 ans: 1,183

Le tableau 1 fait apparaitre les valeurs suivantes pour la moyenne des memes taux quinquennaux correspondant au niveau de la premiere composante en 1955 et aux conditions moyennes des 157 tables de mor- talite pour les autres composantes:

Hommes 45-64 ans: 103,93 Femmes 70-84 ans: 762,3 Tax P Hommes 70-84 ans: 901,5 remire composante)

783

Page 13: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITi

e) En appliquant les multiplicateurs calcules en d), on obtient la moyenne des taux quinquennaux de mortalit6 correspondant aux premiere et deuxieme composantes de 1955, assocides aux conditions moyennes des 157 tables de mortalite pour les autres composantes. Soit:

Hommes 45-64 ans: 137,8 Femmes 70-84 ans: 861,4 Taux p. 10 000 (Premiere et

Hommes 70-84 ans: 1 066,5 deuxieme composantes)

En 1955, la moyenne des taux quinquennaux de mortalite feminine observes a 70-84 ans 6tait de 700,3 p. 10 000. Le rapport de 700,3 A 861,4 est egal a 0,813, qui est le multiplicateur de la troisi6me composante pour les femmes de 70 a 84 ans.

Le pourcentage de variation correspondant a ce multiplicateur est egal a - 18,7.

f) Ici encore, quand on connait le multiplicateur d'un age et d'un sexe, on peut le calculer pour d'autres ages et l'autre sexe.

Les calculs de Ledermann et Breas montrent que, pour la troisieme composante, un pourcentage de variation egal a 100 pour les femmes de 70-84 ans donne un pourcentage de variation egal a 76 pour les hommes de 70-84 ans. Cette proportion, appliquee au pourcentage de variation ci- dessus (-18,7) donne un multiplicateur egal a 0,858 pour la troisieme composante des hommes ages de 70-84 ans.

g) En appliquant ce multiplicateur au taux calcule en e) on obtient, pour les hommes de 70-84 ans, un taux de 1 066,5 x 0,858 = 915,0 qui represente le taux des premiere, deuxieme et troisieme composantes de 1955 associees aux conditions moyennes des 157 tables de mortalite pour les autres composantes.

h) Enfin, pour les hommes, les trois premieres composantes, asso- ciees aux conditions moyennes des 157 tables de mortalite pour les qua- trieme et cinquieme composantes, donnent les resultats suivants:

Taux p. 10000 (premiere, 5-34 ans : 10,14 (76 col., Tab.l) deuxieme et troisi6me 45-64 ans: 137,8 (calcule en e)

composantes) 70-84 ans: 915,0 (calcule en g) I faut comparer ces taux aux taux moyens observes pour les hommes

en 1955, soit: 5-34 ans: 13,8

45-64 ans: 105,0 Taux observes pour 10000 70-84 ans: 924,0 Les rapports des taux observes aux taux calcules sont egaux aux

multiplicateurs de la cinquieme composante, soit: 5-34 ans: 1,361

45-64 ans: 1,197 Multiplicateurs de la cinquieme

70-84 ans: negligeable composante

784

Page 14: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALIT7

I1 faut maintenant prendre en compte la mortalite avant 5 ans. A cet age, selon le tableau 2, les quatre premieres composantes sont actives. On aurait pu appliquer a ces ages la meme methode qu'aux autres ages. Mais nous avons un peu hesite a prendre pour acquis les effets des deuxieme et troisieme composantes a ces ages.

Considerons la deuxieme composante. On a vu plus haut que les cal- culs de Ledermann et Breas ont fait apparaitre des effets de signes opposes pour la deuxieme composante avant 5 ans et apres 35 ans. Une 6tude de l'evolution a long terme de la deuxieme composante au-dela de 35 ans montre qu'elle a contribue a un accroissement du risque de mortalite, en meme temps que le developpement industriel s'amplifiait. Ce developpe- ment s'etant accompagne de mesures visant a reduire les taux de mortalite infantile, il n'est pas 6tonnant que la seconde composante agisse en sens oppose avant 5 ans et apres 35. Mais ce pourrait etre une coincidence his- torique, c'est-a-dire un fait qui ne se reproduirait pas dans d'autres cir- constances.

Voyons maintenant la troisieme composante. Les effets avant 5 ans et apres 65 sont cette fois de meme signe. Prenons le cas d'une troisieme composante reduisant le risque de mortalite aux grands ages. C'est sans doute la marque d'une evolution culturelle plus que d'une r6ussite medi- cale. Mais la mortalite des cinq premieres annees de vie depend non seu- lement des equipements medicaux et sanitaires mais aussi du niveau culturel, et ceci pourrait expliquer pourquoi la troisieme composante agit dans la meme direction avant 5 ans et apres 65.

De plus, les calculs de Ledermann et Breas montrent que les deuxieme et troisieme composantes ne suffisent pas a expliquer les varia- tions de la mortalite avant 5 ans. Ceci signifie que des forces specifiques sont en jeu a ces ages, les equipements medicaux et sanitaires se combinant sans doute a nouveau aux facteurs culturels. C'est pourquoi il nous a sem- ble preferable de regrouper en un multiplicateur unique les effets des deuxieme, troisieme et quatrieme composantes. Ce multiplicateur unique est tres facile a calculer. D'apres le tableau 1, colonnes 2 a 5, on a les resultats suivants pour les taux de mortalite avant 1 an et a 1-4 ans dus a la premiere composante associee aux conditions moyennes des 157 tables pour les autres composantes (taux p. 10 000):

Avant 1 an 1 - 4 ans

Femmes Hommes Femmes Hommes

Taux de la l"re composante: 237,50 317,71 11,26 12,77 Taux observes, 1955: 257 334 10 12 Multiplicateurs: 1,082 1,051 0,885 0,938

Finalement, le tableau 3 permet de r6capituler les r6sultats obtenus pour les Etats-Unis en 1955.

Pour une composante donnee, quand un multiplicateur est connu pour un age et un sexe, il est connu pour tous les ages et pour l'autre sexe.

785

Page 15: Application de l'analyse factorielle à l'étude de la

786 ANALYSE FACTORIELLE ET MORTALITI

TABLEAU 3. - LES CINQ COMPOSANTES DE LA MORTAL1TI AUX ETATS-UNIS EN 1955

(MOYENNE DES TAUX QUINQUENNAUX P.10 000)

Premiere composante Taux observe, femmes 5-34 ans 7,15 Taux, femmes 5-34 ans, correspondant aux condi-

tions moyennes 35,83 Multiplicateur 0,199

Deuxieme composante Taux observd, femmes 45-64 ans 89,5 Taux, femmes 45-64 ans, correspondant a la 1re

composante mesur6e ci-dessus, associ6e, pour les autres composantes, aux conditions moyennes 70,95

Multiplicateur 1,261

Troisieme composante Taux observd, femmes 70-84 ans 700,3 Taux, femmes 70-84 ans, correspondant aux 1' et 2e composantes mesur6es ci-dessus, assocides, pour les autres composantes, aux conditions moyennes 861,4

Multiplicateur 0,813

Effet global des 2e, 3e et 4e composantes sur la Femmes Hommes mortalite avant 5 ans

257 334 Taux observ6, avant 1 an Taux, avant 1 an, correspondant A la premiere

composante, associde, pour les autres compo- 237 santes, aux conditions moyennes 1,0 1,0

Multiplicateur

Taux observ6, 1-4 ans 10,0 12,0 Taux, 1-4 ans, correspondant a la premiere composante, associ6e, pour les autres compo- santes, aux conditions moyennes 11,26 12,77

Multiplicateur 0,885 0,938

Cinquiime composante 5-34 ans 45-64 ans 70-84 ans Taux observ6s, hommes 13,8 165,0 924,0 Taux correspondant aux le' 2e et 3e composantes mesurdes ci-dessus 10,14 137,8 915,0

Multiplicateur 1,361 1,197 N6gligeable

C'est pourquoi on peut considerer que les divers multiplicateurs du tableau 3 donnent une mesure des diverses composantes. Cette mesure est donnee par reference aux conditions moyennes correspondant a la moyenne des 157 tables de mortalite utilis6es par Ledermann et Br6as dans leur analyse.

Bien sur, la m6thode proposee est approximative et on ne peut pas s'attendre a obtenir exactement les memes r6sultats que Ledermann et Breas. II faut d'abord pr6ciser que les deux auteurs ont limit6 leurs calculs aux trois premieres composantes. Ils ont identifi6 les quatrieme et cin- quieme composantes mais n'ont pas men6 a leur terme les calculs qui nous

Page 16: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALrIT

permettraient de determiner ces composantes. C'est pourquoi les quatri6me et cinquieme composantes que nous calculons ne coincident pas avec celles que Ledermann et Br6as auraient obtenues avec leur methode.

Par ailleurs, pour les trois premieres composantes, notre methode est moins precise que celle utilis6e par Ledermann et Breas. Mais des calculs montrent que les deux methodes donnent des resultats pratiquement iden- tiques lorsqu'on compare diverses conditions de mortalit6.

Liens avec les tables types des La premiere composante 6tant, de Nations Unies loin, la plus importante, il est inte-

ressant de calculer une serie de ta- bles de mortalite pour une serie de valeurs de la premiere composante associee, pour les autres composantes, aux conditions moyennes. La s6rie des relations qa = Qa (Aa)Fl, calculees pour chaque valeur de Fl, donne les quotients de mortalite d'une telle table. La serie de quotients de mortalit6 ainsi obtenue est tr6s proche de la s6rie des tables types de mortalit6 des Nations Unies. C'est pourquoi la mesure des composantes de la mortalit6 au-dela de la premiere est une faqon d'etudier les 6carts entre les tables de mortalite observ6es et les tables des Nations Unies.

La serie des tables de mortalit6 de la premiere composante associee aux conditions moyennes peut ^tre considere comme un ?<univers? a une dimension, laquelle est precisement la premiere composante. Tout coeffi- cient n'ayant qu'un determinant dans chaque table de mortalite peut donc etre considere comme une mesure de la premiere composante. Nous avons choisi plus haut le taux de mortalite des femmes de 5-34 ans parce qu'il nous permettait de calculer un multiplicateur aussi facilement que pour les autres composantes. Mais on pourrait 6videmment utiliser le taux de tout autre groupe d'ages. On peut aussi utiliser l'esperance de vie a la naissance. Pour un ensemble donne de conditions de mortalite, cette es- perance de vie a la naissance est celle qu'on observerait si la premiere composante correspondant a ces conditions etait associ6e, pour les autres composantes, aux conditions moyennes des 157 tables de mortalit6. Les composantes au-delh de la premiere etant beaucoup moins importantes que la premiere composante, cette esp6rance de vie a la naissance n'est jamais tres eloignee de l'esperance de vie A la naissance observee. La diff6rence entre les deux donne une mesure globale des composantes au-dela de la premiere.

Evolution recente A titre d'illustration, nous 6tudie- des cinq composantes rons l'evolution r6cente des diverses

de la mortalite aux Etats-Unis composantes de la mortalit6 aux Etats-Unis. Les tableaux 4 et 5 four-

nissent les resultats obtenus sur la s6rie annuelle des taux de mortalit6 par age et sexe observee aux Etats-Unis depuis 1936. Les figures 2 et 3 il- lustrent ces deux tableaux.

787

Page 17: Application de l'analyse factorielle à l'étude de la

oo oo

TABLEAU 4. - EVOLUTION DES DIVERSES COMPOSANTES DE LA MORTALITE AUX ETATS-UNIS DE 1936 A 1959 (MOYENNE DES TAUX QUINQUENNAUX P. 10 000)

Annie Composantes et groupe d'ages

1936 1937 1938 1939 1940 1941 1942 1943 1944 1945

Femmes 5-34 ans Taux observes 25,3 23,5 21,0 19,3 18,2 17,0 15,5 15,7 14,7 14,0 Esp6rance de vie a la naissance >

(en annees)> a) Femmes: 1r composante 62,9 63,7 64,9 65,7 66,3 67,0 67,8 67,7 68,3 68,7

observde 60,6 62,4 65,3 65,4 65,2 66,8 67,9 64,4 66,8 67,9 m b) Hommes: re composante 59,3 60,1 61,3 62,0 62,6 63,3 64,1 64,0 64,6 65,0 >

observde 56,6 58,0 61,9 62,1 60,8 63,1 64,7 62,4 63,6 63,6

Femmes 45-64 ans Taux 1e composante 128,5 124,3 118,0 113,3 110,3 106,8 102,1 102,7 99,4 97,2 Taux observes 151,0 146,0 138,0 137,7 135,7 129,5 125,8 129,0 122,5 119,0 Multiplicateurs, 2e composante 1,175 1,175 1,169 1,215 1,230 1,213 1,232 1,256 1,232 1,224

0 Hommes 45-64 ans Taux I" composante 174,3 169,3 161,4 156,3 153,0 148,2 142,5 143,0 139,4 136,6 r Multiplicateurs, 2c composante 1,219 1,219 1,211 1,269 1,288 1,266 1,290 1,320 1,290 1,280 Taux er et 2e composantes 212,5 206,4 195,5 198,3 197,1 187,6 184,8 188,8 179,8 174,8 Taux observds 208,7 205,0 190,5 191,5 197,0 191,5 189,7 193,2 187,0 186,0 Multiplicateurs, 3e composante 0,983 0,993 0,974 0,966 1,000 1,021 1,032 1,023 1,040 1,064

Hommes 5-34 ans Taux Ire composante 29,1 27,1 25,0 23,3 22,2 21,0 19,4 19,6 18,5 17,8 Taux observes 30,3 28,8 25,0 23,5 22,8 22,5 21,7 19,3 24,5 25,3 Multiplicateurs, 5e composante 1,041 1,051 1,000 1,000 1,027 1,071 1,118 0,985 1,324 1,421

Page 18: Application de l'analyse factorielle à l'étude de la

TABLEAU 4. - (suite).

Ann6e Composantes et groupe d'ages

1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959

Femmes 5-34 ans Taux observes 12,7 11,7 10,7 9,8 9,2 9,0 8,5 8,0 7,3 7,2 7,3 7,3 7,0 7,0 Esperance de vie a la naissance>

(en annees) a) Femmes: re composante 69,5 70,0 70,8 71,5 71,9 72,1 72,5 72,9 73,4 73,5 73,4 73,4 73,6 73,6

observee 69,4 69,7 69,9 70,7 71,1 71,3 71,6 71,9 72,7 72,7 72,8 72,5 72,7 73,0 '

b) Hommes: re composante 65,8 66,3 66,1 67,8 68,2 68,4 68,8 69,2 69,7 69,8 69,7 69,7 70,1 70,1 . observ6e 64,4 64,4 64,6 65,2 65,6 65,6 65,7 65,9 66,7 66,6 66,6 66,3 66,4 66,5 a

Femmes 45-64 ans Taux 1' composante 92,7 89,2 85,5 82,0 79,6 78,8 76,7 74,5 71,4 70,8 71,4 71,4 70,0 70,0 Taux observes 114,0 112,5 108,2 104,2 103,5 102,2 99,5 96,8 91,5 89,5 87,5 89,0 87,0 84,5 Multiplicateurs, 2e composante 1,230 1,261 1,265 1,271 1,300 1,297 1,297 1,299 1,281 1,264 1,225 1,246 1,243 1,207

Hommes 45-64 ans Taux Ir composante 131,1 126,8 122,1 117,9 114,8 113,8 111,1 108,3 104,4 103,7 104,4 104,4 102,8 102,8 r Multiplicateurs, 2e composante 1,287 1,326 1,331 1,339 1,375 1,371 1,371 1,374 1,351 1,330 1,281 1,307 1,304 1,259 Taux leret 2e composantes 168,1 168,1 162,5 157,9 157,8 156,0 152,3 148,8 141,0 137,9 133,7 136,5 130,8 126,3 Taux observes 180,0 184,0 181,0 177,2 175,2 174,7 175,0 174,0 165,2 165,0 163,5 167,0 164,0 163,0 Multiplicateurs, 3e composante 1,067 1,095 1,114 1,122 1,111 1,120 1,149 1,169 1,172 1,196 1,223 1,223 1,254 1,291

Hommes 5-34 ans Taux 1 composante 16,4 15,3 14,2 13,2 12,5 12,3 11,7 11,1 10,3 10,2 10,3 10,3 9,9 9,9 Taux observes 19,3 17,3 16,5 15,7 15,2 15,3 15,5 14,8 13,8 13,8 13,7 13,7 13,0 13,3 Multiplicateurs, 5e composante 1,117 1,130 1,162 1,189 1,216 1,244 1,325 1,333 1,340 1,353 1,330 1,330 1,313 1,343

00 %0

Page 19: Application de l'analyse factorielle à l'étude de la

TABLEAU 5. - EVOLUTION DES DIVERSES COMPOSANTES DE LA MORTALITt AUX ETATS-UNIS DE 1948 A 1959 ;C (MOYENNE DES TAUX QUINQUENNAUX P. 10 000)

Annde Composantes et groupe d'ages

1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959

Femmes 70-84 ans Multiplicateurs, 2ecomposante 1,332 1,335 1,150 1,148 1,148 1,150 1,140 1,132 1,112 1,123 1,122 1,104 Taux, le composante 81,6 80,4 79,6 79,2 78,5 77,7 76,5 76,2 76,5 76,5 76,0 76,0 Taux, 101 et 21 composantes 92,4 91,2 91,5 90,9 90,0 89,3 87,2 86,3 85,1 85,9 85,3 83,9 Taux observ6s 75,1 76,3 73,4 73,7 72,2 72,7 68,9 70,0 69,2 69,2 68,5 66,7 Z

Multiplicateur, 3e composante 0,813 0,837 0,802 0,811 0,801 0,814 0,790 0,811 0,813 0,806 0,803 0,785

Femmes de moins d'l an" Taux, 1V composante 32,5 30,4 28,8 28,3 27,1 25,9 24,2 24,0 24,2 24,2 23,4 23,4 Taux observes 30,4 29,6 28,5 28,1 28,4 27,2 26,2 25,7 25,5 25,6 26,1 25,5 Multiplicateur, 21, 3' et 4e composantes 0,935 0,974 0,990 0,993 1,048 1,050 1,083 1,071 1,054 1,058 1,116 1,094

Hommes de moins d'l an* Taux, 11 composante 42,4 39,7 37,9 37,3 35,8 34,5 32,3 32,1 32,3 32,3 31,3 31,3 Taux observes 39,4 38,4 37,3 37,0 36,8 35,5 34,1 33,4 33,6 33,3 33,6 33,2 Multiplicateur, 2C, 3e et 4V composantes 0,929 0,964 0,984 0,992 1,028 1,032 1,056 1,041 1,040 1,031 1,074 1,061

0

Femmes 1-4 ans Taux, lecomposante 19,3 17,2 15,8 15,3 14,2 13,1 11,6 11,4 11,6 11,6 10,9 10,9 Taux observ6 14,0 14,0 13,0 13,0 13,0 12,0 11,0 10,0 10,0 10,0 10,0 10,0 Multiplicateur, 21, 3e et 4V composantes 0,725 0,814 0,823 0,823 0,915 0,916 0,957 0,877 0,862 0,862 0,917 0,917

Hommes 1-4 ans Taux, le composante 21,5 19,0 17,7 17,2 16,0 14,8 13,2 13,0 13,2 13,2 12,4 12,4 Taux observi 17,0 16,0 15,0 15,0 15,0 14,0 13,0 12,0 12,0 12,0 12,0 12,0 Multiplicateur, 2', 3' et 4e composantes 0,791 0,842 0,847 0,872 0,937 0,946 0,985 0,923 0,908 0,908 0,908 0,908

* Taux p. 1 000 pour la mortalit6 avant 1 an.

Page 20: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALIT!

Esp4rance de vie a la naissance (ans)

16re composante ............ Observ6e

FEMMES

HOMMES

1935 1940 1945 1950

Figure 2. - Evolution de I'esp6rance de vie Etats-Unis depuis 1936.

1955 1960 Ann6e

a la naissance aux

J5 I

791

70

65

60 -

I I

I

Page 21: Application de l'analyse factorielle à l'étude de la

792 ANALYSE FAC'FORIELLE ET MORTALrlt

0,70

0 .

1.00

1,20

1.10 - 2e composante, femmes 45-64 ans

Into ,oo I 26991

Ann6e

Figure 3. - Evolution des diverses composantes de la mortalit6 aux Etats-Unis depuis 1936.

I

111-- - I

I i

Page 22: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITI

La figure 2 permet de comparer l'evolution de l'esperance de vie a la naissance correspondant a la premiere composante(6) a l'evolution de 1'esperance de vie observee. A 1'exception des deux annees 1938 et 1942, les donnees observ6es sont inferieures aux resultats calcules. Ceci signifie qu'en general, aux Etats-Unis pendant la p6riode etudiee, les composantes de la mortalite au-dela de la premiere ont accru la mortalite par rapport aux conditions moyennes. En termes d'esperance de vie, cet accroissement de la mortalite n'est pas tres important pour les femmes. II a toujours ete inf6rieur a un an et il ne fait pas apparaitre de mouvement clairement defini. Au contraire, pour les hommes, la difference entre les esp6rances de vie observee et calculee s'est accrue constamment depuis 1944. Elle atteint 3,5 ans en 1959. La premiere composante est essentiellement de- terminee par ce qui a 6t6 r6alise dans le pays a un moment donn6 pour ameliorer la sant6 de la population. Elle montre ce que pourraient permettre d'obtenir les conditions actuelles de soins et de sante publique. L'accrois- sement de l'esperance de vie a la naissance de la premiere composante donne donc une mesure de ce qu'on pourrait appeler l'amelioration des <conditions sanitaires>> du pays. Quand l'accroissement de l'esp6rance de vie a la naissance observee est moins rapide que l'accroissement de l'es- perance de vie a la naissance de la premiere composante, ceci signifie qu'il y a des forces qui empechent la population de tirer pleinement profit des ameliorations du systeme de soins existant dans le pays.

C'est precisement le cas pour les hommes aux Etats-Unis depuis 1944, 1'esperance de vie a la naissance observee pour les hommes semble <<s'essouffler>> a essayer de suivre l'evolution de l'esp6rance de vie a la naissance de la premiere composante. Les forces responsables de cet es- soufflement sont mesurees par les composantes au-dela de la premiere. La figure 3 montre les variations de ces composantes.

La deuxieme composante a connu un accroissement continu de 1936 a 1950, puis un leger recul, qui semble s'accelerer dans les annees recentes. Pour calculer la troisieme composante, le taux a 70-84 ans n'est pas di- rectement disponible avant 1948(7), et nous avons donc limite l'application de la methode aux ann6es 1948 et suivantes. Pendant cette periode, les effets de la troisieme composante apparaissent remarquablement constants. La deuxieme composante tend a accroitre les taux de mortalite au-dela des conditions moyennes alors que la troisieme composante tend a r6duire les taux. La cinquieme composante avait des effets n6gligeables avant la guerre. Elle est devenue de plus en plus importante A mesure que le temps passait et elle tend a accroitre les taux de mortalite. A 45-64 ans, elle est du meme ordre de grandeur que la deuxi~me composante. L'6mergence de la cinquieme composante est liee au r6le accru des d6c6s accidentels chez les enfants et les adultes. Pour calculer l'effet global de la deuxieme, la

(6) Cette expression condensde signifie plus prdcisdment l'espdrance de vie a la nais- sance qu'on observerait si la premiere composante dtait associde aux conditions moyennes des 157 tables pour les autres composantes.

(7) Les donndes existent, mais les taux n'ont pas det calculds jusqu'a present et nous dtions contraint par le manque de temps a utiliser le matdriel existant.

793

Page 23: Application de l'analyse factorielle à l'étude de la

794 ANALYSE FACTORIELLE ET MORTALITt

troisieme et la quatrieme composantes sur la mortalite infantile et la mor- talite a 1-4 ans, nous avons la meme difficult6 que pour la troisieme composante. Les taux ne sont pas disponibles avant 1948. C'est pourquoi la m6thode n'a 6t6 appliqu6e qu'a partir de 1948. Le multiplicateur s'est accru jusqu'en 1954 et est reste plus ou moins constant ensuite.

En r6sum6, il semble que <l'essoufflement>, deja not6, de l'esp6rance de vie a la naissance observ6e soit principalement du a l' mergence de la cinquieme composante.

Les comparaisons geographiques a un moment donne pour les di- verses subdivisions territoriales d'un pays sont egalement int6ressantes. Pour les Etats-Unis nous avons a notre disposition pour 1949-1951 des taux de mortalit6 par age et sexe pour les 49 6tats y compris le district- capitale. Le tableau 6 donne les resultats de l'application de la methode a ces taux. Les figures 4 a 9 illustrent ce tableau. La troisieme composante pour les ages eleves n'a pas ete incluse dans le tableau parce que le taux de mortalite a 70-84 ans n'est pas disponible.

La figure 4 donne la repartition geographique de l'esp6rance de vie a la naissance correspondant a la premiere composante. Elle montre les conditions que connaissent les diverses regions en matiere de soins et de sante publique. Deux r6gions particulierement favorisees emergent de la carte. L'une est centr6e sur le nord du Middle West et l'autre sur le sud de la Nouvelle Angleterre. La cote ouest apparaft aussi en relativement bonne position. Les conditions semblent moins satisfaisantes dans le reste du pays, en particulier les zones montagneuses et le Sud. Pour la periode considere (1949-1951), les regions ayant les valeurs les plus elev6es de l'esperance de vie A la naissance pour la premibre composante 6taient au meme niveau que l'ensemble des Etats-Unis en 1961. Ces regions avaient dix ans d'avance sur l'ensemble du pays. Les r6gions les plus defavorisees etaient a peu pres au niveau de l'ensemble des Etats-Unis en 1942, c'est- a-dire qu'elles avaient a peu pres dix ans de retard. 20 ans de progres de la mortalite separaient donc les regions les plus et les moins favorisees.

La figure 5 se rapporte a la deuxieme composante. Celle-ci apparait particulierement active dans deux regions. L'une est centree dans la zone industrielle de l'Est et l'autre sur les etats du Sud. Le recul de la seconde composante d'est en ouest montre le lien entre cette composante et le ni- veau de d6veloppement industriel. Mais l'existence d'une deuxieme compo- sante active dans le Sud montre qu'il doit aussi y avoir d'autres facteurs. Peut-etre l'importance de la population de couleur est-elle une explication.

Les figures 6 et 7 se rapportent a la cinquieme composante. Celle-ci est fortement liee a la surmortalite masculine8s.

(8) Toutes les autres composantes ont aussi une part de surmortalite masculine, mais celle-ci varie tres lentement avec le niveau de la composante. La variation des autres compo- santes ne peut donc pas expliquer les variations d'une r6gion A I'autre de la surmortalit6 masculine observde.

Page 24: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITt

I 1705 <

: :: 70.5-71,4 72,5-73,4

71,5-72,4 73.5 >

ini; Al 2839

Vermont^

Ne m

Yf j

~ FRhode Island

;;;;j; 5t ^ConnecD>ut

'i^n 0st Csluta

3--V^ ^^^Vrg*ie Occ rohe -

Valeurs extremes Rhode Island 74.4 Minnesota 74,2 Connecticut 74.2

Arizona 68,2 Nouveau Mexique 68.2 Mississip 67.7

Figure 4. - Etats-Unis, 1949-1951. Repartition geographique de I'esperance de vie des femmes & la naissance correspondant a la

premiere composante (en ann6es).

NIO

New Jersey

*--Maryland '--Dit Cbolub

- vrgie Occ

I 0.95 <

I 0,95- 1.09

|i.]" : 110 - 124

V / Ypj ift) Valeurs extremes

!V?\ Vi Rhode Island 1,635 Caroline du sud 1.602 Pennsylvanie 1.534 Delaware 1530

_ 1,25 - 1,29 Oklahoma 0.956 Nouveau Mexique 0.954

_ 1,.40 > Wyoming 0.899 Arizona 0,887

Figure 5. - Etats-Unis, 1949-1951. Repartition g6ographique de la deuxieme composante de la mortalite (multiplicateur pour les

femmes de 45-64 ans).

795

- -

Page 25: Application de l'analyse factorielle à l'étude de la

TABLEAU 6. - REPART1TION GEOGRAPHIQUE DES DIVERSES COMPOSANTES DE LA MORTALITI AUX ETATS-UNIS - 1949-1951 (MOYENNE DU TAUX QUINQUENNAUX (p. 10 000)

IC composante Effets globaux des 2e, 3C et 4C composantes Deuxieme composante Cinquieme composante

Taux Esp6rance Moins d'un an (femmes) 1-4 ans (femmes) 45-64 ans (femmes) 45-64 ans (hommes) 5-34 ans (hommes) observ6 de vie a la 5-34 ans naissance Taux Taux Multi- Taux Taux Multi- Taux Taux Multi- Taux Taux Multi- Taux Taux Multi- (femmes) (ans) observe theorique plicateur observe th6orique plicateur observe theorique plicateur observe th6orique plicateur observe theorique plicateur

NEW ENGLAND 0,686 73,8 24,2 22,8 1,061 0,970 1,008 0,962 10,03 6,96 1,441 17,06 15,90 1,073 1,067 0,976 1,093 Maine 0,814 72,8 29,4 26,3 1,118 1,267 1,302 0,973 9,51 7,52 1,265 15,85 14,58 1,087 1,302 1,128 1,154 New Hampshire 0,758 73,2 23,6 25,0 0,944 1,039 1,202 0,864 9,42 7,29 1,292 16,56 14,53 1,139 1,206 1,062 1,136 ,

Vermont 0,837 72,6 25,6 26,8 0,955 1,116 1,308 0,853 9,16 7,63 1,201 16,09 13,89 1,159 1,365 1,156 1,181 Z Massachusetts 0,672 74,0 23,3 22,5 1,036 0,933 1,004 0,929 10,19 6,90 1,476 17,54 16,24 1,080 1,042 0,959 1,087 r Rhode Island 0,613 74,4 27,2 20,8 1,308 0,734 0,904 0,812 10,76 6,58 1,635 17,77 17,65 1,007 0,878 0,888 0,989 <

Connecticut 0,645 74,2 22,1 21,8 1,014 0,830 1,000 0,830 9,87 6,78 1,456 16,48 15,73 1,048 1,001 0,928 1,079 m

MIDDLE ATLANTIC 0,815 72,8 26,4 26,3 1,004 1,039 1,304 0,797 11,31 7,52 1,504 18,58 17,85 1,041 1,205 1,131 1,065 New York 0,817 72,8 25,4 26,4 0,962 1,047 1,304 0,803 11,15 7,56 1,475 18,52 17,47 1,060 1,221 1,135 1,076 0 New Jersey 0,777 73,0 25,6 25,3 1,012 0,940 1,206 0,779 11,16 7,76 1,438 18,62 16,66 1,118 1,137 1,085 1,048 x

Pennsylvania 0,829 72,8 28,1 26,6 1,056 1,073 1,306 0,822 11,63 7,58 1,534 18,67 18,41 1,014 1,306 1,147 1,139 r

EAST SOUTH CENTRAL 1,306 69,4 37,4 38,2 0,979 1,679 2,409 0,697 11,52 9,40 1,225 17,46 17,04 1,025 1,947 1,680 1,159

Kentucky 1,185 70,2 36,3 35,2 1,031 1,735 2,108 0,823 9,72 9,00 1,080 15,98 14,01 1,141 1,900 1,549 1,227 Tennessee 1,137 70,5 37,1 34,2 1,085 1,500 2,008 0,747 10,82 8,84 1,224 16,84 16,10 1,046 1,777 1,495 1,189 ? Alabama 1,410 68,7 37,1 40,4 0,918 1,691 2,706 0,606 13,14 9,74 1,349 19,48 22,36 0,871 2,066 1,791 1,154 x

Mississippi 1,590 67,7 39,4 44,4 0,887 1,904 3,022 0,630 13,11 10,34 1,268 17,95 19,22 0,934 2,166 1,978 1,095 >

WESTSOUm CENTRAL 1,112 70,7 36,2 33,4 1,084 1,849 2,000 0,925 9,60 8,74 1,098 16,56 13,96 1,186 1,813 1,468 1,235 t' Arkansas 1,142 70,4 26,7 34,2 0,781 1,676 2,008 0,835 9,56 8,84 1,081 14,89 13,85 1,075 1,765 1,500 1,177 Louisiana 1,104 70,7 36,4 33,2 1,096 1,619 1,908 0,849 12,54 8,70 1,441 19,96 19,24 1,037 1,778 1,458 1,219 Oklahoma 0,923 72,0 28,2 28,0 1,007 1,473 1,506 0,978 7,63 7,98 0,956 14,58 10,89 1,339 1,579 1,255 1,258 Texas 1,160 70,3 40,5 34,6 1,171 2,081 2,102 0,990 9,25 8,74 1,058 16,50 13,58 1,215 1,898 1,522 1,247

WESTNoRTH CENRAL 0,767 73,2 25,6 24,9 1,028 1,195 1,204 0,993 8,38 7,32 1,145 14,31 12,58 1,138 1,412 1,073 1,316 Minnesota 0,643 74,2 24,5 21,7 1,129 1,029 0,908 1,133 8,09 6,75 1,198 13,48 12,48 1,080 1,270 0,925 1,373 Iowa 0,656 74,0 23,6 22,0 1,073 1,004 1,002 1,002 7,67 6,81 1,127 13,34 11,65 1,144 1,294 0,940 1,377 Missouri 0,876 72,4 29,5 27,9 1,057 1,407 1,408 0,999 9,72 7,78 1,250 16,75 14,79 1,132 1,519 1,202 1,264 North Dakota 0,654 74,0 27,2 22,0 1,236 1,204 1,000 1,204 8,01 6,81 1,175 12,58 12,66 0,993 1,524 0,938 1,625 South Dakota 0,885 72,2 24,3 28,0 0,868 1,603 1,500 1,069 7,58 7,88 0,962 12,93 10,78 1,199 1,548 1,212 1,277 Nebraska 0,782 73,0 23,4 25,6 0,914 1,129 1,205 0,937 7,53 7,41 1,017 13,36 10,86 1,230 1,388 1,091 1,272 Kansas 0,822 72,7 24,3 26,4 0,920 1,214 1,304 0,931 7,80 7,57 1,030 13,54 11,43 1,184 1,507 1,140 1,322

Page 26: Application de l'analyse factorielle à l'étude de la

I'r composante Effets globaux des 2C, 3C et 4e composantes Deuxieme composante Cinquieme composante

Taux Esperance Moins d'un an (femmes) 1-4 ans (femmes) 45-64 ans (femmes) 45-64 ans (hommes) 5-34 ans (hommes) observ6 de vie a la 5-34 ans naissance Taux Taux Multi- Taux Taux Multi- Taux Taux Multi- Taux Taux Multi- Taux Taux Multi- (femmes) (ans) observe theorique plicateur observe theorique plicateur observe theorique plicateur observe theorique plicateur observe th6orique plicateur

AsTNoRTECENTRAL 0,849 72,6 26,4 27,1 0,974 1,113 1,400 0,795 10,19 7,68 1,325 17,07 15,63 1,092 1,419 1,171 1,212 0,829 72,5 26,4 26,5 0,996 1,151 1,306 0,881 10,09 7,58 1,331 16,86 15,60 1,081 1,426 1,147 1,243

1ni0 0,911 72,0 27,3 28,7 0,951 1,197 1,504 0,796 9,91 7,94 1,248 16,41 15,01 1,093 1,510 1,302 1,160 Indiana 0,841 72,6 26,3 27,0 0,974 1,065 1,308 0,814 10,85 8,10 1,339 18,59 15,80 1,176 1,428 1,161 1,230

Michigan 0,872 72,4 26,9 27,8 0,968 1,109 1,406 0,789 10,18 7,78 1,308 17,43 15,59 1,118 1,399 1,197 1,169 z Wisconsin 0,709 73,6 24,4 23,4 1,043 1,050 1,102 0,953 8,97 7,07 1,269 14,51 13,86 1,047 1,303 1,005 1,297 >

SOUTH ATLANTIC 1,161 70,4 33,7 34,6 0,974 1,425 2,102 0,678 11,92 8,92 1,336 20,09 17,98 1,117 1,848 1,523 1,213 Delaware 0,905 72,2 32,0 28,6 1,119 1,060 1,504 0,705 12,05 7,92 1,530 18,84 19,05 0,989 1,663 1,235 1,347 > Maryland 1,012 71,4 27,4 31,0 0,884 1,150 1,708 0,673 11,71 8,36 1,401 19,87 17,93 1,108 1,439 1,356 1,061 District of Columbia 1,150 70,4 34,7 34,0 1,021 1,416 2,100 0,674 11,94 8,88 1,344 23,04 18,05 1,276 1,669 1,510 1,105 Virginia 1,102 70,8 35,0 33,2 1,054 1,373 1,908 0,720 11,91 8,70 1,369 19,59 18,12 1,081 1,773 1,456 1,218 West Virginia 1,009 71,4 34,6 31,0 1,116 1,485 1,708 0,869 9,76 8,36 1,167 16,21 14,44 1,123 1,904 1,353 1,407 p North Carolina 1,103 70,8 35,4 33,2 1,066 1,397 1,908 0,732 11,32 8,70 1,301 18,82 17,07 1,103 1,802 1,457 1,237 South Carolina 1,386 68,9 35,5 40,0 0,888 1,660 2,606 0,637 15,51 9,68 1,602 24,74 23,87 1,037 2,212 1,766 1,253 | Georgia 1,352 69,1 33,0 39,0 0,846 1,544 2,600 0,594 13,28 9,54 1,392 21,87 20,09 1,089 2,079 1,730 1,202 S Florida 1,162 70,3 33,5 34,6 0,968 1,385 2,102 0,659 10,67 8,90 1,198 19,84 15,79 1,256 1,860 1,524 1,220 0

MOUNTAIN 1,126 70,6 36,7 34,0 1,079 1,911 2,005 0,953 8,62 8,80 0,979 15,70 12,21 1,285 1,891 1,484 1,274 C

Montana 1,005 71,4 27,6 31,0 0,890 1,546 1,708 0,905 8,64 8,36 1,033 16,32 12,43 1,313 1,830 1,349 1,357 Idaho 0,889 72,3 24,9 28,2 0,883 1,329 1,500 0,886 7,79 7,86 0,991 14,92 11,25 1,326 1,832 1,217 1,503 Wyoming 1,245 69,8 29,2 36,8 0,793 1,378 2,303 0,598 8,29 9,22 0,899 14,39 11,41 1,261 2,046 1,615 1,267 Colorado 0,928 72,0 32,6 29,2 1,116 1,422 1,509 0,942 8,63 8,02 1,077 14,50 12,69 1,143 1,545 1,261 1,225 New Mexico 1,512 68,2 63,9 42,6 1,500 3,015 3,001 1,005 9,64 10,10 0,954 14,25 13,29 1,329 2,238 1,898 1,179 Arizona 1,513 68,2 49,8 42,6 1,169 3,043 3,001 1,014 8,96 10,10 0,887 19,27 12,11 1,211 2,378 1,899 1,252 Utah 0,895 72,2 22,5 28,4 0,792 1,437 1,502 0,957 7,86 7,90 0,994 14,72 11,33 1,133 1,617 1,224 1,321 Nevada 1,274 69,6 31,4 37,2 0,844 1,381 2,308 0,598 9,79 9,28 1,054 20,41 14,03 1,403 2,315 1,646 1,406

PACIFIC 0,836 72,6 24,3 27,0 0,900 1,137 1,308 0,869 8,94 7,64 1,170 17,20 13,46 1,278 1,512 1,156 1,308 Washington 0,793 73,0 23,0 25,8 0,926 1,101 1,208 0,911 8,66 7,44 1,164 15,88 13,04 1,218 1,414 1,103 1,282 Oregon 0,797 72,9 21,2 26,0 0,815 1,124 1,300 0,865 7,95 7,48 1,063 15,03 11,74 1,280 1,741 1,109 1,570 California 0,851 72,5 24,8 27,2 0,912 1,148 1,400 0,820 9,14 7,68 1,190 17,83 13,78 1,294 1,505 1,173 1,283 %

Page 27: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITE

28in,

VW i Nm

oa.

Idaho 1.503 - 1.05 < N6vada 1.406

Or-gon 1,570

1 1,05- <14 1,25134 C u 40 [ i1.05-1,14 _1 ,25-1,34 New Yodr 1,076

NeoYaok 1,076 | 1,15-1,24 1,35 > NewJersy 1.048

Rhode Island 0,989

Figure 6. - Etats-Unis 1949-1951. Repartition geographique de la cinquieme composante de la mortalite (multiplicateur pour les

hommes de 5-34 ans).

A 5-34 ans (figure 6), cette surmortalitd est principalement due a 1'e- cart entre hommes et femmes des taux de mortalite par violence. A 45- 64 ans (figure 7), les morts violentes continuent de jouer un role important dans les variations de la surmortalite masculine, mais il faut aussi tenir compte d'autres facteurs. Sur ce point, une analyse des causes de dec6s est 6clairante. Prenons deux 6tats, New York et l'Idaho, qui avaient a peu pres la meme premiere composante en 1949-1951, mais des deuxieme et cinquieme composantes diff6rentes.

Le tableau 7 pr6sente le calcul des multiplicateurs des deuxieme et cinquieme composantes pour ces deux etats. Sur une base a peu pres commune, c'est-a-dire des taux f6minins tres proches a 5-34 ans, se gref- fent d'importantes diff6rences entre les deux 6tats pour les deuxieme et cinquieme composantes en 1949-1951. Le tableau 8 donne la d6composi- tion du taux f6minin a 45-64 ans en diverses causes de d6ces. Il est clair que l'ecart entre les deux etats est du a des diff6rences entre les taux de mortalite par cancer et par maladie cardio-vasculaire. Mais bien sur, ceci n'est pas explication. Il reste a expliquer l'6cart entre l'incidence du cancer et des maladies cardio-vasculaires chez les femmes de 45-64 ans en Idaho et a New York.

Le tableau 9 montre que la mortalit6 par violence et par maladie cardio-vasculaire est a l'origine des 6carts entre les multiplicateurs de la

__

798

Page 28: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITE

I 0,95 <

t:' 'J 0,95 -

1,04 1,15 -1,24

1,05 - 1,14 1,25 >

Valeurs extr&mes

N4vada 1,403 Oklahoma 1,339 Nouveau Mexique 1,329 Idaho 1,326 Montana 1,313

Muasipi 0.934 labmna 0,871

Figure 7. - Etats-Unis 1949-1951. Repartition geographique de la cinquieme composante de la mortalite (multiplicateur pour les

hommes de 45-64 ans).

TABLEAU 7. - CALCULS DES 1e, 2e ET 5e COMPOSANTES DE LA MORTAL1TE A NEW YORK ET EN IDAHO (1949-1951; MOYENNE DES TAUX QUINQUENNAUX P. 10000)

New York Idaho

Femmes 5-34 ans Taux observes 8,17 8,89 Esperance de vie a la naissance,

femmes (en annee) 72,8 72,3

Femmes 45-64 ans Taux re composante 75,6 78,6 Taux observes 111,5 77,9 Multiplicateurs, 2e composante 1,475 0,991

Hommes 45-64 ans Taux I1' composante 109,6 113,5 Multiplicateurs, 2e composante 1,594 0,989 Taux 1 et 2e composantes 174,7 112,3 Taux observes 185,2 149,2 Multiplicateurs, 5e composante 1,060 1,328

Hommes 5-34 ans Taux 1' composante 11,35 12,17 Taux observes 12,21 18,32 Multiplicateurs, 5? composante 1,076 1,503

799

I28

'I-

3-Rhode Iswid

l---:M)ha

-Dis C docc.

Page 29: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITt

TABLEAU 8. - MORTALITE FEMININE PAR CAUSE DE DECfS A NEW YORK ET EN IDAHO EN 1949-1951 (MOYENNE DES TAUX QUINQUENNAUX 45-64 ANS P. 100000)

Differences Cause de deces New York Idaho

Maladies cardio-vasculaires 561,4 384,7 176,7 Cancer 325,0 196,3 128,7 Violence 38,7 49,0 10,3 Diab6te 38,5 25,6 12,9 Maladies des voies digestives 17,0 18,5 1,5 Maladies infectieuses 21,2 13,4 7,8 Maladies respiratoires (yc. grippe) 19,0 10,0 9,0 Maladies du foie 22,2 3,6 18,6 Senilitd 4,3 16,5 12,2 Autres causes 67,6 61,0 6,6

Toutes causes 1 114,9 778,6 360,3 24,0

TABLEAU 9. - MORTALITI PAR CAUSE DE DICES A NEW YORK ET EN IDAHO A 1949-1951 (MOYENNE DES TAUX QUINQUENNAUX, 45-64 ANS, P. 100 000)

New York Idaho

Causes de d6ces Rapport de Rapport de Femmes Hommes surmortalit6 Femmes Hommes surmortalit6

masculine masculine

Maladies cardiovasculaires 561,4 1 014,3 1,807 384,7 813,0 2,113 Morts violentes 38,7 117,8 3,044 49,0 197,4 4,029 Autres causes 514,8 719,8 1,398 344,9 481,7 1,396 Toutes causes 1 114,9 1 851,9 1,662 778,6 1 492,1 1,917 Multiplicateurs,

5e composante 1,060 1,328

cinquieme composante a 45-64 ans. Si l'Idaho avait la meme surmortalite masculine par violence que l'etat de New York, le multiplicateur de la cinquieme composante serait de 1,277 au lieu de 1,328. Et si, en outre, la surmortalite masculine par maladie cardio-vasculaire etait la meme dans l'Idaho que dans l'etat de New York le multiplicateur de la cinquieme composante serait ramene a 1,172. En fait, en l'absence de cinquieme composante, la surmortalite masculine par maladie cardio-vasculaire de- vrait etre plus faible dans l'Idaho qu'a New York a cause de la deuxieme composante qui, plus elevee a New York qu'en Idaho, accrolt la surmor- talite masculine du premier etat par rapport a celle du second. Si on tenait compte de ce facteur, le multiplicateur de la cinquieme composante en Idaho tomberait encore au-dessous de 1,172 et serait voisin de la cinquieme composante de New York, soit 1,060. Au total a 45-64 ans, la mortalite par maladie cardio-vasculaire apparait davantage affectee par la cinquieme composante que la mortalite par violence.

800

Page 30: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITE

Int~ 27990

0 ton9 .51 4 . . . . . .. 2 . .

M.ta

/a |Orego;; z I t > Vernont

3\ <entucle) DiS1 I?l?i?i?lI. ?iB:i iDt Co4iumba

Valeurs extremes

Nouveau Mexique 1.500 Rhode Island 1,308

| | 0,a5 < Dakoa du Nord 1.236

t:::::i.- 0,85-0,94 _1,o5 1,19 Wyoming 0,793

...... i:": 0,95-1,04 _ 12 >Arkansas 0D781

/ 1,20 :>~~~~~~~~~~~M-W

Figure 8. - Etats-Unis, 1949-1957. Repartition g6ographique de I'ef- fet global des deuxieme, troisieme et quatrieme composantes de la

mortalite (multiplicateur pour les filles de moins d'un an).

1 New [j^-Hampshre

NMassachusetts

.. Rhode Idand "Connecbcrut

- New Jersey

-Drelawre -Mayand -Dist Coumbia

- Virgire Occ

1 0,65 <

: 0,65-0,74 0,85-094

:liJIII 0.75-0.84 _ 0,95 >

Figure 9. - Etats-Unis, 1949-1957. Repartition geographique de I'ef- fet global des deuxieme, troisieme et quatrieme composantes de la

mortalite (multiplicateur pour les filles de 1-4 ans).

801

I Valeurs extremes

Dakota du Nord 1.204 Minnesota 1,133 Dakota du Sud 1,069

Alabama 0,606 Nevada 0,598 Wyoming 0,598 Georgie 0,594

278 2789C

Page 31: Application de l'analyse factorielle à l'étude de la

ANALYSE FACTORIELLE ET MORTALITI

Enfin, les figures 8 et 9 donnent la repartition geographique des effets d'ensemble des deuxieme, troisieme et quatrieme composantes sur la mor- talite infantile et juvenile des filles.

Pour la mortalite infantile, deux regions ne font pas plein usage de leurs conditions sanitaires. Une est sur la frontiere mexicaine et I'autre sur le bord de la zone industrielle de l'Est. La situation est satisfaisante dans le reste du pays. A 1-4 ans on retrouve les deux memes regions en mauvaise position mais il est 6tonnant de trouver aussi avec elles des 6tats qui etaient en bonne position pour la mortalite infantile. La comparaison de deux etats comme le Nord et le Sud Dakota donne un exemple d'une telle discordance.

TABLEAU 10. - MORTALITT FfMININE AVANT 1 AN ET A 1-4 ANS, AUX DAKOTA NORD ET SUD EN 1949-1951 (TAUX P. 1000)

Moins d'un an 1-4 ans

Dakota Nord 27,2 1,204 Dakota Sud 24,3 1,603

Conclusion Les methodes que nous proposons pour analyser un ensemble de taux de mortalite par age et sexe

n'a ete appliqu6e aux Etats-Unis qu'h titre d'exemple, et cette application ne pretend pas mettre un point final au sujet. La courte incursion dans le champ des causes de dec's a montre qu'on peut souvent discerner des causes specifiques derriere les cinq composantes de la mortalite. Mais ce n'est qu'un aperqu de ce qui peut etre fait.

En debut d'article nous definissions deux modes possibles d'analyse des donnees de mortalite. Nous soulignions que dans la seconde methode, celle precisement que nous avons suivie ici, une fois les composantes de- gagees par des methodes statistiques, il fallait les raccorder a divers indi- cateurs economiques et sociaux pour d6couvrir leur signification. Cette seconde partie du travail reste a faire.

Jean BOURGEOIS-PICHAT

802