Upload
truongtuong
View
218
Download
0
Embed Size (px)
Citation preview
Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage
2.2. Comparaison de deux échantillonsComparaison de deux échantillons
3.3. Comparaison de trois échantillons ou plusComparaison de trois échantillons ou plus
4.4. Corrélation et régressionCorrélation et régression
Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage
1.1. La loi normaleLa loi normale
2.2. Théorème de la limite centraleThéorème de la limite centrale
3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique
4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur
2.2. La puissance dLa puissance d’’un testun test
Quelques logiciels Quelques logiciels ……
Statistica (www.statsoft.com)
SPSS (www.spss.com)
Sigmastat (www.spss.com)
etc …
Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage
1.1. La loi normaleLa loi normale
2.2. Théorème de la limite centraleThéorème de la limite centrale
3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique
4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur
2.2. La puissance dLa puissance d’’un testun test
Deux objectifsDeux objectifs
•• Obtenir une information descriptive Obtenir une information descriptivesur la population à partir de laquellesur la population à partir de laquellell’é’échantillon a été constituéchantillon a été constitué
•• Tester des hypothèses Tester des hypothèses
Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.
Distribution de la taille des martiensDistribution de la taille des martiens
Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.
Distribution de la taille des martiensDistribution de la taille des martiens
Effectif de la population = 200 sujetsEffectif de la population = 200 sujetsMoyenne de la taille de la population = 40 cmMoyenne de la taille de la population = 40 cmÉcart type de la taille de la population = 5 cmÉcart type de la taille de la population = 5 cm
68%
Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.
Distribution de la taille des martiensDistribution de la taille des martiens
Effectif de la population = 200 sujetsEffectif de la population = 200 sujetsMoyenne de la taille de la population = 40 cmMoyenne de la taille de la population = 40 cmÉcart type de la taille de la population = 5 cmÉcart type de la taille de la population = 5 cm
68%
95%
Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage
1.1. La loi normaleLa loi normale
2.2. Théorème de la limite centraleThéorème de la limite centrale
3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique
4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur
2.2. La puissance dLa puissance d’’un testun test
Population :Population :Groupe de personnes (ou autre) qui ont au moins unecaractéristique en commun.
Définie par deux paramètres : µ et σExemple : hommes âgés de 31 à 40 ans qui ne pratiquent aucune activité physique.Varier genre, âge ou niveau d’activité physique
Échantillon :Échantillon :Groupe de personnes (ou autre) tirées de la population.
Définie par deux statistiques : ξ et SDExemple : réentraînement post-chirurgical du membre inférieur
Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.
PopulationPopulationn = 200µ = 40 cmσ = 5 cm
Échantillon 1n = 10ξ = 41.5 cmSD = 5 cm
Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.
PopulationPopulationn = 200µ = 40 cmσ = 5 cm
Échantillon 2n = 10ξ = 36 cmSD = 5 cm
Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.
PopulationPopulationn = 200µ = 40 cmσ = 5 cm
Échantillon 3n = 10ξ = 39.5 cmSD = 5 cm
Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.
PopulationPopulationn = 200µ = 40 cmσ = 5 cm
1016 possibilitésn = 10ξ = 40 cmSuit loi normale
Théorie de la limite centraleThéorie de la limite centrale
La distribution des moyennes dLa distribution des moyennes d’é’échantillons estchantillons estapproximativement normale, quelle que soit laapproximativement normale, quelle que soit lapopulation à partir de laquelle les échantillonspopulation à partir de laquelle les échantillonssont constitués.sont constitués.
La moyenne de lLa moyenne de l’’ensemble de toutes les moyennesensemble de toutes les moyennesdd’é’échantillons possibles est égale à la moyenne dechantillons possibles est égale à la moyenne dela population.la population.
Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage
1.1. La loi normaleLa loi normale
2.2. Théorème de la limite centraleThéorème de la limite centrale
3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique
4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur
2.2. La puissance dLa puissance d’’un testun test
Hypothèse nulle (notée HHypothèse nulle (notée H00))Il n’existe aucune relation ou aucune différence entre lesgroupes.Exemple : il n’existe pas de différence de force maximale des membresinférieurs entre les garçons et les filles de 10 ans.
Hypothèse alternative (notée HHypothèse alternative (notée H11))Il existe une relation ou une différence entre les groupes.Exemple : il existe une différence de force maximale des membres inférieursentre les garçons et les filles de 10 ans.
Sous Sous H0 :Garçons et filles appartiennent à la même population.Les différences observées sont dues à lLes différences observées sont dues à l’’erreur derreur d’é’échantillonnagechantillonnage
Sous HSous H11 : :Garçons et filles appartiennent à deux populationsdistinctesLes différences observées sont dues à lLes différences observées sont dues à l’’erreur derreur d’é’échantillonnage etchantillonnage età la différence imputable au genreà la différence imputable au genre
QUELLE LIMITE ?QUELLE LIMITE ?
Deux échantillons R1 et F1 : Différence D1.Deux échantillons R1 et F1 : Différence D1.Deux échantillons R2 et F2 : Différence D2.Deux échantillons R2 et F2 : Différence D2.Et ainsi de suite Et ainsi de suite ……
EXEMPLE :EXEMPLE :Consommation annuelle dConsommation annuelle d’’anti-inflammatoires dans deuxanti-inflammatoires dans deuxpopulations différentes (Rugbymen vs Footballeurs)populations différentes (Rugbymen vs Footballeurs)
Rugby vs Footballeurs: mêmepopulation??
R100R….R6R5R4R3R2R1
Dosage(mg)
Rugbymen
F100F….F6F5F4F3F2F1
Dosage(mg)
Footballeurs
D100D….D6D5D4D3D2D1
Dosage(mg)
R-F
Théorie de la limite centraleThéorie de la limite centrale
• La distribution des différences (D1, D2,…, Dn) suit une loi normale
• La moyenne de toutes les différences estégale à la différence moyenne entre lesdeux populations.
Si la population est la même
VALEURS DES DIFFERENCES
FREQUENCES
0
Si la population est differenteProche 0
Emprunté à Vincent WJ. Statistics in kinesiology. Human Kinetics, Champaign, Illinois, 1999.
La différenceentre les deuxpopulations
est nulle
Erreur dErreur d’é’échantillonnagechantillonnage : même s : même s’’il nil n’’y pas de différence entre lesy pas de différence entre lesdeux populations, la probabilité de trouver Z = 0 est très faibledeux populations, la probabilité de trouver Z = 0 est très faible
Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage
1.1. La loi normaleLa loi normale
2.2. Théorème de la limite centraleThéorème de la limite centrale
3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique
4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur
2.2. La puissance dLa puissance d’’un testun test
Deux types dDeux types d’’erreur statistiqueerreur statistique
Erreur de type I (ou de première espèce, ou faux positif)Erreur de type I (ou de première espèce, ou faux positif)
LL’’expérimentateur conclue à une différence entre les groupesexpérimentateur conclue à une différence entre les groupesalors qualors qu’’en réalité il nen réalité il n’’y en a pas.y en a pas.
Risque Risque αα (5%, ou 0.05) (5%, ou 0.05)
Erreur de type II (ou de seconde espèce, ou faux négatif)Erreur de type II (ou de seconde espèce, ou faux négatif)
LL’’expérimentateur conclue à lexpérimentateur conclue à l’’absence de différence entre lesabsence de différence entre lesgroupes alors qugroupes alors qu’’en réalité il y en a une.en réalité il y en a une.
Risque Risque ββ (20%, ou 0.20)(20%, ou 0.20)
Erreur deErreur detype IItype II
ConclusionConclusioncorrectecorrecte
HH00 est estacceptéeacceptée
ConclusionConclusioncorrectecorrecte
Erreur deErreur detype Itype I
HH00 est estrejetéerejetée
HH00 est fausse est fausseHH00 est vraie est vraie
RéalitéRéalité
α et β sont déterminés en fonction durisque d’erreur qui est le moins coûteux.
QuQu’’est ce qui est le plus grave : accepterest ce qui est le plus grave : accepterll’’hypothèse nulle alors quhypothèse nulle alors qu’’elle est fausse, ouelle est fausse, ou
la rejeter alors qula rejeter alors qu’’elle est vraie ?elle est vraie ?
Erreur de mesureErreur de mesureββ trop petit (pas assez sujets) trop petit (pas assez sujets)αα trop petit (0.01) trop petit (0.01)Traitement mal appliquéTraitement mal appliqué
Erreur de mesureErreur de mesureÉchantillon non aléatoireÉchantillon non aléatoireαα trop grand (0.10) trop grand (0.10)Biais induit par le chercheurBiais induit par le chercheurUtilisation incorrecte dUtilisation incorrecte d’’ununtest unilatéraltest unilatéral
Type IIType IIType IType ISources dSources d’’erreurerreur
Erreur de mesureErreur de mesureββ trop petit (pas assez sujets) trop petit (pas assez sujets)αα trop petit (0.01) trop petit (0.01)Traitement mal appliquéTraitement mal appliqué
Erreur de mesureErreur de mesureÉchantillon non aléatoireÉchantillon non aléatoireαα trop grand (0.10) trop grand (0.10)Biais induit par le chercheurBiais induit par le chercheurUtilisation incorrecte dUtilisation incorrecte d’’ununtest unilatéraltest unilatéral
Type IIType IIType IType ISources dSources d’’erreurerreur
Erreur de mesureErreur de mesureββ trop petit (pas assez sujets) trop petit (pas assez sujets)αα trop petit (0.01) trop petit (0.01)Traitement mal appliquéTraitement mal appliqué
Erreur de mesureErreur de mesureÉchantillon non aléatoireÉchantillon non aléatoireαα trop grand (0.10) trop grand (0.10)Biais induit par le chercheurBiais induit par le chercheur
Type IIType IIType IType ISources dSources d’’erreurerreur
Erreur de mesureErreur de mesureββ trop petit (pas assez sujets) trop petit (pas assez sujets)αα trop petit (0.01) trop petit (0.01)Traitement mal appliquéTraitement mal appliqué
Erreur de mesureErreur de mesureÉchantillon non aléatoireÉchantillon non aléatoireαα trop grand (0.10) trop grand (0.10)Biais induit par le chercheurBiais induit par le chercheur
Type IIType IIType IType ISources dSources d’’erreurerreur
Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage
1.1. La loi normaleLa loi normale
2.2. Théorème de la limite centraleThéorème de la limite centrale
3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique
4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur
2.2. La puissance dLa puissance d’’un testun test
La puissance dLa puissance d’’un test statistiqueun test statistiqueCapacité de rejeter lCapacité de rejeter l’’hypothèse nulle lorsquhypothèse nulle lorsqu’’elle estelle estfausse (évite de commettre une erreur de type 2)fausse (évite de commettre une erreur de type 2)
Puissance = 1 - Puissance = 1 - ββ (soit 0.80, ou 80%) (soit 0.80, ou 80%)
Paramètres de la puissance :Paramètres de la puissance :
•• la taille de l la taille de l’é’échantillonchantillon
•• l l’’effet minimum recherchéeffet minimum recherché
•• la variabilité du paramètre mesuré la variabilité du paramètre mesuré
•• le risque le risque αα retenu (5%, 0.05) retenu (5%, 0.05)
Intérêt de la puissance statistiqueIntérêt de la puissance statistique
Contrôler le risque de commettre une erreurContrôler le risque de commettre une erreurde type IIde type II
Estimer le nombre de sujets nécessaires pourEstimer le nombre de sujets nécessaires pourgarantir une puissance supérieure ou égale àgarantir une puissance supérieure ou égale à80% (comité d80% (comité d’é’éthique, organismesthique, organismessubventionnaires)subventionnaires)