14
Département fédéral de l’intérieur DFI Office fédéral de la statistique OFS Tirages coordonn´ es d’´ echantillons poissoniens Desislava Nedyalkova, Lionel Qualit´ e, Yves Till´ e Office f´ ed´ eral de la statistique et Universit´ e de Neuchˆ atel 19 octobre 2010 : c BFS1

Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Tirages coordonnes d’echantillonspoissoniens

Desislava Nedyalkova, Lionel Qualite, Yves Tille

Office federal de la statistique et Universite de Neuchatel

19 octobre 2010

: c©BFS1

Page 2: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Coordination d’enquetes

I But : repartir le plus equitablement possible la charged’enquete sur la population.

I La charge totale d’enquete est dictee par la precision quel’on veut obtenir, on ne peut la reduire, mais seulementmieux la repartir.

I Coordination : correlation entre la selection d’une unite adeux enquetes differentes.

I Coordination negative : permet d’avoir des echantillonsdisjoints, donc de repartir la charge.

I Coordination positive : permet d’obtenir des panels, etdonc d’estimer precisement des evolutions.

: Introduction - definitions c©BFS2

Page 3: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Besoins de l’OFS

I Methode qui permet de gerer toutes les enquetes :coordinations positives et negatives en meme temps, pourdes enquetes simples, des panels et des panels rotatifs,

I apporte des resultats pour chaque unite : coordinationindividuelle la meilleure possible,

I est adaptee a une population dynamique : naissances,deces mais aussi scissions, fusions, reprises, etc.

I fournit des echantillons poissoniens : independance detraitement entre les unites, probabilites inegales, formulesde variance simples.

: Introduction - definitions c©BFS3

Page 4: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Methodes existantes

I On trouve dans Hesse (1999) un tour d’horizon,

I la plupart des methodes fournissent des plans simples oustratifies, au prix de beaucoup de difficultes lorsque lapopulation est dynamique,

I Ne permettent pas toujours d’avoir des enquetescoordonnees positivement et d’autres negativement.

: Introduction - definitions c©BFS4

Page 5: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Definitions

I Population envisagee a differents instants t, Ut ,t = 1, . . . ;

I Probabilite d’inclusion de l’individu k a l’enquete t : πtk ;

I Probabilite d’inclusion aux dates t et s : πtsk ;

I Sur T enquetes, l’unite k sera selectionnee en moyenneπ1k + . . .+ πTk fois.

: Introduction - definitions c©BFS5

Page 6: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Methode de BrewerI Numero aleatoire permanent ;I Zones de selection :

I pour la coordination negative,

0 π1 π1+π2 1

I pour la coordination positive,

0 π2 π1 1

I Avantages :I les naissances et les deces ne posent pas de probleme,I la coordination est optimale.

I Tailles d’echantillons aleatoires, ce qui impose d’adapternotre planification.

: Methode proposee c©BFS6

Page 7: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Generalisation

I Decider d’un ordre de priorite pour la coordination. Parexemple, on privilegie la coordination avec l’enqueteprecedente.

I Attribuer un score a chaque intervalle en fonction du sensde coordination voulu et des priorites. Ce score definit unordre sur les intervalles.

I Au temps t, determiner une zone de selection delongueur πt qui contient les intervalles avec les scores lesplus eleves, plus le bout qui manque pour arriver a labonne longueur.

: Methode proposee c©BFS7

Page 8: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

I Apres la vague t, [0, 1] est coupe en t + 1 intervalles.

I Chaque intervalle correspond a un echantillonlongitudinal.

Exemple : 3eme enquete coordonnee d’abord positivementavec la 2eme puis negativement avec la 1ere.

0 π2 π1

π3

1

: Methode proposee c©BFS8

Page 9: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Proprietes

I Plan transversal poissonien ;

I Coordination optimale entre une enquete et celle aveclaquelle elle devait etre coordonnee en priorite ;

I Parmi les plans qui fournissent cette coordinationoptimale, donne la coordination optimale avec la secondeenquete dans l’ordre de priorite.

: Methode proposee c©BFS9

Page 10: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Cas d’enquetes coordonnees negativement

I plan longitudinal systematique,

I nombre de selections pour chaque unite egal a au nombreentier avant ou a l’entier apres

∑πtk ;

I Le nombre moyen de selections ne peut etre change maisil n’y a plus d’unites tres “chanceuses” ou tres“malchanceuses”.

: Methode proposee c©BFS10

Page 11: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Mise en œuvre

I Necessite de conserver le plan joint des t vaguesprecedentes pour pouvoir coordonner la suivante (et nonpas seulement les echantillons selectionnes), et lesnumeros aleatoires permanents : taille des donneesO(tN) ;

I Temps de calcul acceptable meme pour de grandespopulations (env. 30 minutes pour 8 millions d’individus).

I Possibilite d’effacer d’anciennes enquetes avec lesquelleson ne veut plus coordonner activement ;

I Calcul rapide des probabilites d’inclusion jointes πtsk ;

: Utilisation c©BFS11

Page 12: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Avantages

On dispose d’un cadre unique dans lequel tous les plans ettirages sont stockes.

1. On peut donc evaluer qualite de la coordination,

2. suivre la charge d’enquete,

3. et l’estimation de la covariance entre des estimateursbases sur des echantillons differents est facilitee.

: Utilisation c©BFS12

Page 13: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Mise en production a l’OFS

I Le systeme de coordination est utilise depuis octobre2009 pour les enquetes aupres des entreprises.

I Effet de la coordination encore peu sensible, mais seraplus important apres un plus grand nombre d’enquetes :

I les grandes entreprises sont toujours selectionnees carelles sont indispensables a la bonne precision desresultats,

I les petites entreprises sont tres nombreuses et tres peusollicitees, donc naturellement epargnees.

I En ce moment, on procede a l’actualisation du cadre desondage, en essayant de suivre tous les evenementsdemographiques, bientot on procedera au tirage denouveaux echantillons pour 2011 et a la mise a jour despanels.

: Utilisation c©BFS13

Page 14: Titre de la présentation Sous-titre (en caractères non gras) · Département fédéral de l intérieur DFI Office fédéral de la statistique OFS Titre de la présentation Coordination

Département fédéral de l’intérieur DFIOffice fédéral de la statistique OFS

Titre de la présentationSous-titre (en caractères non gras)

Auteur de la présentationDate de la présentation (év. contexte)

Brewer, K., Early, L., and Joyce, S. (1972).Selecting several samples from a single population.Australian Journal of Statistics, 3 :231–239.

Cotton, F. et Hesse, C. (1992).Tirages coordonnes d’echantillons. Document de travail de laDirection des Statistiques Economiques E9206.Technical report, INSEE, Paris.

Hesse, C. (1999).Sampling co-ordination : a review by country.Technical Report E9908, INSEE.

Nedyalkova, D., Qualite, L. et Tille, Y. (2009).General framework for the rotation of units in repeated surveysampling.Statistica Neerlandica, 63-3 :269–293.

: References c©BFS14