Upload
internet
View
120
Download
2
Embed Size (px)
Citation preview
Statistique II Chapitre 3: Tests d’hypothèses
Pr. Abdelkrim EL MOUATASIM
Site internet : www.el-mouatasim.webs.com
Estimation : On suppose inconnu le paramètre de la population et on cherche à l’estimer au moyen d’une statistique définie à partir d’un échantillon aléatoire.
Test d’hypothèses : On suppose au départ que l’on a une certaine connaissance de la valeur du paramètre et on essaie d’en vérifier la véracité. Cette valeur constitue l’hypothèse de base.
La différence entre une estimation et un test d’hypothèsesLa différence entre une estimation et un test d’hypothèses
* Hypothèse statistique : C’est un énoncé (une affirmation) concernant les caractéristiques (valeurs des paramètres, forme de la distribution des observations) d’une population
* Test d’hypothèses : C’est une démarche qui a pour but de fournir une règle de décision permettant, sur la base des résultats d’échantillon, de faire un choix entre deux hypothèses statistiques.
Définitions Définitions
Développer les hypothèses nulle et alternative
Les tests d’hypothèses permettent de déterminer si une affirmation au sujet de la valeur d’un paramètre de la population doit être rejetée
L’hypothèse nulle est une hypothèse sur la valeur d’un paramètre de la population. Elle est notée H0. C’est l’hypothèse qui sera rejetée uniquement s’il y a suffisamment d’évidence contre elle: H0: =30
30 est la valeur paramétrique hypothétique
Développer les hypothèses nulle et alternative
L’hypothèse alternative correspond à l’opposé de ce qui est établi dans l’hypothèse nulle. Elle est notée Ha ou H1 ou H’. C’est l’hypothèse qui sera acceptée si H0 est rejetée.
Hypothèses simples: H0: =30
Ha: = 20
Hypothèses composées: H0 : μ = 30 Ha : μ > 30 ou Ha : μ < 30 ou Ha : μ 30
H0 : μ 30 ou H0 : μ ≤ 30 Ha : μ < 30 Ha : μ > 30
Développer les hypothèses nulle et alternative
Tester les hypothèses de recherche L’hypothèse de recherche correspond à l’hypothèse
alternative On ne peut pas conclure que l’hypothèse de
recherche est vraie si les données de l’échantillon ne permettent pas de rejeter l’hpothèse nulle
Exemple: nouveau moteur qui fait plus de kilomètres par litre d’essence, : nombre moyen de kilomètres par litre H0: ≤24
Ha: >24 Nouvelle affirmation, hypothèse alternative
Développer les hypothèses nulle et alternative
Tester la validité d’une affirmation L’affirmation d’un manufacturier est habituellement formulée
comme l’hypothèse nulle. On cherche à vérifier si les données de l’échantillon permettent de rejeter l’hypothèse nulle. On accorde ainsi le bénéfice du doute au manufacturier
On conclut que l’affirmation du manufacturier est fausse si les données de l’échantillon permettent de refuter l’hypothèse nulle
Exemple: Producteur de boisson non alcoolisée prétend que les bouteilles de 2 litres contiennent en moyenne au moins 2,028 litres H0: ≥ 2,028
Ha: 2,028
Développer les hypothèses nulle et alternative
Tests d’hypothèses dans un contexte de prise de décision
Un décideur peut avoir à choisir entre deux actions, l’une associée à l’hypothèse nulle et l’autre à l’hypothèse alternative
Par exemple, sur la base d’un échantillon de pièces, un inspecteur de contrôle de qualité doit décider s’il accepte ou refuse un lot de pièces qui vient d’êre livré
Supposons que les critères de qualité d’une pièce particulière correspondent à une longueur moyenne de 2 pouces. Si la longueur moyenne est supérieure ou inférieure à 2 pouces, les pièces poseront problème dans le processus d’assemblage. Dans ce cas, on peut formuler:
H0: =2 (On donne le bénéfice du doute au manufacturier) Ha: 2
Quelle conclusion tirer?
Rejeter H0 ? Ou ne pas rejeter H0 ?
On rejette H0 si la statistique estimée à partir de l’échantillon est éloignée de la valeur du paramètre supposée dans H0 (valeur hypothétique).
On rejette H0 lorsque l'écart entre la valeur hypothétique du paramètre et la valeur de la statitstique est grand, ce qui signifie que l'écart n'est pas uniquement dû au hasard de l’échantillonnage.
Règle de décisionRègle de décision
Exemple: Metro EMS
Une compagnie de service ambulancier dessert la grande région de Québec. Elle opère 20 unités médicales mobiles. Son objectif de service est de répondre aux appels d’urgence en un temps moyen de 12 minutes ou moins.
Le directeur des services médicaux veut formuler un test d’hypothèses basé sur un échantillon de temps de réponse aux urgences afin de vérifier si l’objectif de temps de service moyen de 12 minutes est atteint ou non.
Exemple: Metro EMS
Formulation de test d’hypothèses
Hypothèses Conclusion et Action
H0: Le service d’urgence rencontre son objectif, donc aucun changement est
nécessaire
Ha: Le service d’urgence ne rencontre pas
son objectif, donc il faut s’ajuster
où = le temps moyen de réponse pour la population des appels d’urgence
Zones de rejet (régions critiques)
La région critique d’un test est l’ensemble des valeurs possibles de la statistique provenant de l’échantillon aléatoire qui entraînent le rejet de H0 au niveau de signification .
La région critique est définie à partir d’une valeur critique
On calcule une statistique à partir de l’échantillon et on la compare avec la valeur critique afin de vérifier si la statistique calculée à partir de l’échantillon se trouve dans la région critique. Si oui, on rejettera H0.
Zones de rejet (régions critiques)Zones de rejet (régions critiques)
/2
Régions de rejet
Valeur(s) z critiques
H0: 0 ou H0: =0
H1: < 0
H0: 0 ou H0: =0
H1: > 0
H0: 0
H1: 0
Test unilatéral inférieur
Test unilatéral supérieur
Test bilatéral
Région critique
Pour les tests d'hypothèses sur une moyenne par exemple, il existe deux façons de se situer par rapport à la région critique: On compare la statistique à la valeur z critique za
(test par la statistique z) On calcule une valeur critique et on rejette l’hypothèse
nulle selon le type de région critique et la position de par rapport à ( Test par la méthode des valeurs critiques)
cx
cxx
0
x
xz
Tests unilatéraux concernant la moyenne d’une population: cas des grands échantillons(n > 30)
Hypothèses
H0: ou H0:
Ha:
Statistique de test z connu inconnu
Règle de rejet (de décision) au seuil de signification Rejeter H0 si z > z
zest la valeur z critique: valeur comparée à la statistique de test z pour déterminer si H0 doit être rejetée au seuil de signification
z xn
0
/z x
n
0
/z x
s n 0
/z x
s n 0
/
Tests unilatéraux concernant la moyenne d’une population: cas des grands échantillons(n > 30)
Hypothèses
H0: ou H0:
Ha:
Statistique de test z connu inconnu
Règle de rejet (de décision) au seuil de signification Rejeter H0 si z < -z
-z est la valeur z critique: valeur comparée à la statistique de test pour déterminer si H0 doit être rejetée au seuil de signification
z xs n
0
/z x
s n 0
/z x
n
0
/z x
n
0
/
Tests bilatéraux concernant la moyenne d’une population: cas des grands échantillons(n > 30)
Hypothèses H0:
Ha:
Statistique de test connu inconnu
Règle de rejet (de décision)
Rejeter H0 si |z| > z
n
xz
/0
ns
xz
/0
Tests sur la moyenne: Calcul des valeurs critiques cas des grands échantillons(n > 30)Tests sur la moyenne: Calcul des valeurs critiques cas des grands échantillons(n > 30)
Test bilatéral :
Test unilatéral à droite :
Test unilatéral à gauche :
)(0 nzxc
)(0 nzxc
cxx s i H rejetteon 0
cxx s i H rejetteon 0
H0: 0 ou H0: =0
H1: < 0
H0: 0 ou H0: =0
H1: > 0
H0: 0 H1:
0
)(z
)(z
20
20
2
1
nx
nx
c
c
2
1
ou
si H rejetteon 0
c
c
xx
xx
Si inconnu , utiliser s
Exemple: Metro EMS- test par la statistique z
Soit n = 40, = 13,25 minutes, s = 3,2 minutes
(L’écart-type de l’échantillon s peut être utilisé pour estimer l’écart-type de la population .)
Puisque 2,47 > 1,645, on rejette H0.
Conclusion: Nous sommes confiants à 95% que Metro EMS ne rencontre pas son objectif de réponse de 12 minutes; le service devrait donc être amélioré
47,240/2,3
1225,13
/0
ns
xz
x
Exemple: Dentifrice Brille
La chaîne de production du dentifrice Brille est conçue pour remplir les tubes de dentifrice de poids moyen de 6 onces. Les données disponibles ont montré que l’écart-type est 0,2 onces. Régulièrement, on choisit 30 tubes au hasard pour vérifier si le processus de remplissage fonctionne adéquatement. Si l’échantillon ne supporte pas l’hypothèse que la moyenne de remplissage pour la population est de 6 onces, le procédé est arrêté et ajusté.
Exemple: Dentifrice Brille
Un test d’hypothèse sur la moyenne de la population peut aider à déterminer si le procédé de remplissage fonctionne tel que planifié.
Hypothèses
H0:
Ha: Règle de rejet (de décision)
En supposant un niveau de signification de 0,05: Rejeter H0 si |z| > 1,96
Exemple: Dentifrice Brille
Supposons qu’un échantillon de 30 tubes de dentifrice fournisse une moyenne échantillonnale de 6,1 onces.
Puisque n = 30, = 6,1 onces, s = 0,2 onces
Puisque 2,74 > 1,96, on rejette H0.
Conclusion:
On est confiant à 95% que le poids de remplissage moyen des tubes de dentifrice n’est pas 6 onces. Ajuster le mécanisme de remplissage
Supposons qu’un échantillon de 30 tubes de dentifrice fournisse une moyenne échantillonnale de 6,1 onces.
Puisque n = 30, = 6,1 onces, s = 0,2 onces
Puisque 2,74 > 1,96, on rejette H0.
Conclusion:
On est confiant à 95% que le poids de remplissage moyen des tubes de dentifrice n’est pas 6 onces. Ajuster le mécanisme de remplissage
x
6 6 1 62 74
0 2 30sn
x ,z ,
, /
Étapes d’un test d’hypothèses
1. Déterminez les hypothèses nulle et alternative appropriées à l’étude
2. Sélectionnez la statistique de test qui sera utilisée pour décider du rejet ou du non rejet de l’hypothèse nulle
3. Spécifiez le seuil de signification du test
4. Utilisez pour définir la règle de rejet qui indique les valeurs de la statistique de test qui conduiront au rejet de H0
5. Collectez les données d’échantillon et calculez la valeur de la statistique de test
Étapes d’un test d’hypothèses
6a- Comparez la statistique z avec z (ou zsi le test est bilatéral)
OU6b- Comparer avec la valeur critique (ou avec
et si le test est bilatéral) (Test par valeur critique)
7- Appliquer la règle de décision pour déterminer si H0 doit être rejetée
x cx1cx
2cx
Tests sur la moyenne d’une population: cas de petits échantillons (n < 30)
Statistique de test inconnu
Cette statistique de test t suit une distribution du t avec (n - 1) degrés de liberté, en supposant que la population suit une loi normale et que est inconnu. (Dans le cas où connu, on utilise la statistique z)
Règle de rejet
Unilatéral Bilatéral
Ha: > Rejeter H0 si t > tHa: < Rejeter H0 si t < -tHa: Rejeter H0 si |t| > t
txs n
0
/t
xs n
0
/
Tests sur la moyenne d’une population (n < 30) Calcul des valeurs critiques, inconnu
Tests sur la moyenne d’une population (n < 30) Calcul des valeurs critiques, inconnu
Test bilatéral :
Test unilatéral à droite :
Test unilatéral à gauche :
)(t 1)d.-(n 20 nsxc
0 1 tc ( n )d .l .x ( s n )
0 1 tc ( n )d .l .x ( s n )
2
1
ou
si H rejetteon 0
c
c
xx
xx
cxx s i H rejetteon 0
cxx s i H rejetteon 0
Si on suppose que la populationsuit une loi normale et σ est inconnu
Note
Pour un petit échantillon, connu, et une population qui suit une loi normale, on utilise les mêmes approches que pour les grands échantillons
Exemple :
Le boucher M. Simon affirme qu'il vend en moyenne 86 kg de bœuf par jour. Un employé de la boucherie pense que son patron exagère et veut démontrer que la boucherie vend moins de bœuf que le patron le prétend. Pour un échantillon de 20 jours choisis au hasard, on trouve qu'on y a vendu en moyenne 81 kg de bœuf par jour. En supposant que les ventes quotidiennes de bœuf obéissent à une loi normale d’écart type 10 kg et en utilisant un seuil de signification = 0,05, doit-on rejeter l'affirmation du patron ?
Test d’hypothèses paramétriques usuelsTest d’hypothèses paramétriques usuels
Solution
H0: =86 H1: <86
On calcule la statistique:
On compare cette statistique avec la valeur critique
-z0,05=-1,64 Puisque -2,23 est plus petite que -1,64, on rejette
l'hypothèse nulle et l'affirmation que le patron vend 86 kg de boeuf par jour
0 81 862 23
1020
xz ,
n
Avant le règlement de leur conflit de travail, les policiers de la ville de Charlesbourg effectuaient en moyenne 20 arrestations par jour. Au cours des 10 jours qui ont suivi le règlement du conflit, on a relevé le nombre X d'arrestations quotidiennes suivantes :
X = 20, 18, 25, 19, 17, 22, 16, 23, 12, 15
De ces observations, on déduit :
Au niveau de signification = 0,05, y a-t-il lieu de croire que le règlement du conflit a fait diminuer de façon significative le nombre d'arrestations effectuées par les policiers de Charlesbourg ? On suppose que le nombre d'arrestations suit une loi normale.
Réponse: On ne rejettera pas l’hypothèse nulle H0:=20 car la valeur t critique
qu’on obtient est égale à –1,04 ce qui n’est pas plus petit que -t
Test d’hypothèses paramétriquesTest d’hypothèses paramétriques
x i 187 et xi2 3637