8/14/2019 Cours Stat Descriptive
1/73
Cours de statistique - DM 2009/2010 1
STATISTIQUE
Statistique descriptive
8/14/2019 Cours Stat Descriptive
2/73
Introduction
Faire parler les sries de donnes statistique descriptive Dgager les caractristiques :
Tendance centrale Dispersion Distribution Valeurs extrmes Temps
statistique infrentielle
Utilisation de tests ou de lois
8/14/2019 Cours Stat Descriptive
3/73
Statistique descriptive
1 - Distribution de frquences
2 - Mthodes graphiques
3 - Mesures de tendance centrale 4 - Mesures de dispersion
5 - Mesures de positionnement
6 - Analyse exploratoire des donnes
8/14/2019 Cours Stat Descriptive
4/73
1 Distribution de frquences
Dans un tableau de donnes, les frquencesreprsentent le nombre de fois o chaquevaleur apparat
Critres dfinir : Nombre de classes
Largeur des classes
Frquences relatives Frquences cumules
8/14/2019 Cours Stat Descriptive
5/73
Exercice 1 : ctes sur coquilledAmmonites
Tableau de donnes
Dtermination du nombre de classes (k) pour n valeurs,par la rgle de Sturges :
K = 1 + 3,322 log nsoit 5,52366, arrondi 6
Dtermination de la larguer des classes :
(35 16)/6 = 3,16666
donnes en vrac 2donnes tries 1
8/14/2019 Cours Stat Descriptive
6/73
Exercice 1 : ctes sur coquilledAmmonites
Tableau de donnes
donnes en vrac 2donnes tries 1Classes
de frquenc
8/14/2019 Cours Stat Descriptive
7/73
Exercice 1 : ctes sur coquilledAmmonites
Tableau de donnes
donnes en vrac 2donnes tries 1Classes
de fr uenc
8/14/2019 Cours Stat Descriptive
8/73
0
5
10
15
20
25
17 20 23 26 29 32 35
Classes de frquences
nombred'in
dividus
Histogramme des frquences cumules
0
1
2
3
4
5
6
7
17 20 23 26 29 32 35
Classes de frquences
Nombred
'individus
Histogramme des frquences
0%
5%
10%
15%
20%
25%
30%
17 20 23 26 29 32 35
Classes de frquences
Nombred
'individus
Histogramme des frquences relatives
8/14/2019 Cours Stat Descriptive
9/73
Nombre de ct
n
Importance du choix du nombre de classes
8/14/2019 Cours Stat Descriptive
10/73
Exercice 2 Hauteurs despeupliers
Application la mise en vidence de
diffrences dans les rsultats
8/14/2019 Cours Stat Descriptive
11/73
Exercice 2 Hauteurs despeupliers
Tableau de frquence
Classesde frquence
8/14/2019 Cours Stat Descriptive
12/73
Exercice 2 Hauteurs despeupliers
3 traitements : Nombre de classes avec n = 30
K = 1 + 3,322 log n
soit 5.907, arrondi 6- Largeur des classes :
6,8/6 = 1,1333Choix de classes de 1 unit
8/14/2019 Cours Stat Descriptive
13/73
Exercice 2 Hauteurs despeupliers
Classesde frquence
Tableau de frquence
8/14/2019 Cours Stat Descriptive
14/73
Exercice 2 Hauteurs despeupliers
0%5%
10%
15%
20%
25%
30%35%
40%
45%
50%
1,9 2,9 3,9 4,9 5,9 6,9 7,9 8,9
Classes de hauteur (limites suprieures des classes)
frquencerelativ
e
Contrle
Irrigation
Irrigation et fertilisati
Hauteur des plants de Peupliers en mtre ; distribution en frquences relativesen fonction du traitement.
8/14/2019 Cours Stat Descriptive
15/73
2 Mthodes graphiques
Histogrammes des frquences
Polygones des frquences
Le Dotplot Le Trac en tige et feuilles
Le diagramme de btons
Le diagramme circulaire Les sries chronologiques
8/14/2019 Cours Stat Descriptive
16/73
Le polygone des frquences
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8 9 10
8/14/2019 Cours Stat Descriptive
17/73
Courbe cumulative
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8
8/14/2019 Cours Stat Descriptive
18/73
Courbe cumulative (2)
I = point dinflexion
8/14/2019 Cours Stat Descriptive
19/73
Courbe cumulative (3)
0
5
10
15
20
25
1 2 3 4 5 6
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8 9 10
0
1
2
3
4
5
6
7
1 2 3 4 5 6
Un point dinflexion un modeDeux points dinflexion deux modes
i1
i2
i
8/14/2019 Cours Stat Descriptive
20/73
Le diagramme circulaire
2% 6%
15%
25%
21%
17%
10%
4%
1
2
3
4
5
67
8
8/14/2019 Cours Stat Descriptive
21/73
Le diagramme en bton
900
8/14/2019 Cours Stat Descriptive
22/73
Le diagramme de dispersion
0
2
4
6
8
10
12
14
0 5 10 15
valeurs des x
valeursdey
8/14/2019 Cours Stat Descriptive
23/73
Le diagramme de dispersion
0
2
4
6
8
10
12
14
0 5 10 15
valeurs des x
valeursdey
Graphique en courbe
8/14/2019 Cours Stat Descriptive
24/73
Le diagramme de dispersion
y = 0,4659x + 5,2198
0
2
4
6
8
10
12
14
0 5 10 15
valeurs des x
valeursdey
Courbe de tendanceCorrlation
8/14/2019 Cours Stat Descriptive
25/73
8/14/2019 Cours Stat Descriptive
26/73
Le Dotplot
1 32 54 76 8
1 32 54 76 8
1 32 54 76 8
Contrle
Irrigation
Irrigation & fertilisation
8/14/2019 Cours Stat Descriptive
27/73
Le trac tige et feuilles
1 92 9
Contrle Irrigation Irrigation & fertilisation
8/14/2019 Cours Stat Descriptive
28/73
Exercice 3
sexe M Mpoids enfant 62,5 64,poids mre 66 58
Mise en vidence dune relation entre le poids de la mre et celui des enfants masculins.
60,0
62,0
64,0
66,0
68,0
70,0
72,0
74,0
76,0
55 60 65 70 75
P o i d s d e l a m
Poids
de
l'enfant
8/14/2019 Cours Stat Descriptive
29/73
Exercice 3 (2)
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
55 60 65 70 75
Mise en vidence dune relation entre le poids de la mre et celui des enfants masculins.
ATTENTION AUX ECHELLES
DES X et DES Y
8/14/2019 Cours Stat Descriptive
30/73
Exercice 3
sexe M Mpoids enfant 62,5 64,poids mre 66 58
Mise en vidence dune relation entre le poids de la mre et celui des enfants masculins.
y = 0 ,3941x + 42
60,0
62,0
64,0
66,0
68,0
70,0
72,0
74,0
76,0
55 60 65 70 75
P o i d s d e l a m
Poids
de
l'enfant
8/14/2019 Cours Stat Descriptive
31/73
Exercice 4
35.5 35.7 39.2 39.641.1 41.2 41.3 41.4
Classe de
34-35,936-37,90%10%20%30%
40%
50%
60%
70%
35 37 39 41 43
classes de primtre (cm)
frquence
%
Histogrammedes primtrescrniens desenfants de deux
mois
8/14/2019 Cours Stat Descriptive
32/73
Exercice 4 (2)
35 5,73637
35 3736 3938 4140 42 43
8/14/2019 Cours Stat Descriptive
33/73
3 Mesures de tendance centrale
a) La moyenne
Ex : teneur en plomb dans latmosphre (norme = 1,5 g/m3)
5,40 1,10 0,42 0,73 0,48 1,10 g/m3
n
xmoyenne
=
538,16/23,9 ==x
8/14/2019 Cours Stat Descriptive
34/73
3 Mesures de tendance centrale (2)
moyenne dun chantillon
moyenne dune population
n
x
x
=
N
x=
8/14/2019 Cours Stat Descriptive
35/73
3 Mesures de tendance centrale (3)
b) La mdiane : valeur du milieu
Si nb dindividus impair, mdiane = valeur delindividu moyen ou central
Ex 15 valeurs tries ; mdiane = 8me valeur enpartant de la plus basse
Si nb dindividus pair, mdiane = moyennedes deux individus moyens
Ex 6 valeurs de plomb :
mdiane = (1,10 + 0,73)/2 = 0,915
8/14/2019 Cours Stat Descriptive
36/73
3 Mesures de tendance centrale (4)
c) Le mode
= valeur qui est prsente le plus grand nombre
de foisEx : primtre crnien unimodal
multimodal
0%
10%
20%
30%
40%
50%
60%
70%
35 37 39 41 43
classes de primtre (cm)
frquence%
8/14/2019 Cours Stat Descriptive
37/73
3 Mesures de tendance centrale (5)
c) Le midrange
= moyenne arithmtique des deux valeurs
extrmes
midrange = (min + max)/2
Ex Plomb (5,40 + 0,42)/2 = 2,91
8/14/2019 Cours Stat Descriptive
38/73
Exercice 6
CONTRLEmoyenne
diIRRIGATIONIRRIGAT &
8/14/2019 Cours Stat Descriptive
39/73
3 Mesures de tendance centrale (6)
c) La moyenne pondre
=
).( xxpondremoyenne
==
tscoefficiendessommetcoefficien
8/14/2019 Cours Stat Descriptive
40/73
Exercice 7
5,81
100
)5075()3090()2085(=
++ xxx
33,833
759085=
++
Moyenne pondre
Moyenne arithmtique
8/14/2019 Cours Stat Descriptive
41/73
Exercice 8
Moyenne de frquence
50,179100
)5450()3350()35250()30150()5050(=
++++ xxxxx
8/14/2019 Cours Stat Descriptive
42/73
Avantages etMeure de
tendance
centrale
Uti
8/14/2019 Cours Stat Descriptive
43/73
8/14/2019 Cours Stat Descriptive
44/73
4 Mesures de dispersion
Ex : temps de file dattente dans deuxcliniques : une ou 3 files dattente
Moyenne = 6 mn Variation ?Une seule filT is fil s d
8/14/2019 Cours Stat Descriptive
45/73
4 Mesures de dispersion (2)
4.1 Ltendue
Premier cas : 7 4 = 3 mn
Deuxime cas : 14 1 = 13 mn
Facilit dutilisation
mais ne tient compte que des valeurs extrmes
imalevaleurimalevaleurEtendue minmax =
8/14/2019 Cours Stat Descriptive
46/73
4 Mesures de dispersion (3)
4.2 Lcart type
Premier cas
Deuxime cas
ou
2*3
)18()774(32222
++=s 732,13
6
18
6
324342===
=s
2*3
)18()1431(3 2222 ++
=s749
6
294
6
324618===
=s
)1(
)()( 22
=
nn
xxns
1
)( 2
=
n
xxs
8/14/2019 Cours Stat Descriptive
47/73
4 Mesures de dispersion (4)
Pourquoi diviser parn 1 ? Seulement n 1 valeurs indpendantes
n 1 = nombre de degr de libert
Cas dune population
N
xx =2)(
8/14/2019 Cours Stat Descriptive
48/73
4 Mesures de dispersion (5)
La variance Cas dun chantillon : s2
Cas dune population : 2
Le coefficient de variation CV
chantillon Population%100x
sCV = %100
=CV
8/14/2019 Cours Stat Descriptive
49/73
4 Mesures de dispersion (6)
Interprtation de lcart type : 1) valeur de s et dispersion
s1 s2
S1 > S2
Grande dispersion Faible dispersion
8/14/2019 Cours Stat Descriptive
50/73
4 Mesures de dispersion (7)
Interprtation de lcart type : 2) 95 % des observations sont moins de 2 s
95 % des observations
ss
8/14/2019 Cours Stat Descriptive
51/73
8/14/2019 Cours Stat Descriptive
52/73
4 Mesures de dispersion (9)
Ex 1
IRRIGATI3,2 4,43 9 5 3
8/14/2019 Cours Stat Descriptive
53/73
Exercice 17
A%Lf%L %
8/14/2019 Cours Stat Descriptive
54/73
IMC 19x2 384moyenne 25
2
Exercice 10
8/14/2019 Cours Stat Descriptive
55/73
4 Mesures de dispersion (10)
Ex 2 : primtre crnien
0%
10%
20%
30%
40%
50%
60%
70%
35 37 39 41 43
classes de primtre (cm)
frquence%
Primtres de 35,5 et 35,7 considrs plus petits que la normale
moy
8/14/2019 Cours Stat Descriptive
56/73
4 Mesures de dispersion (11)
- 5) rgle des 68 95 99,7
2
3
+
+2
+3
68 % moins dun s
95 % moins de 2 s
99,7 % moins de 3 s
8/14/2019 Cours Stat Descriptive
57/73
Ex
taille des femmoyenne de 1145 et 181 cor
Exercice 12
8/14/2019 Cours Stat Descriptive
58/73
Exercice 13
Tailles
Conclusion : la variation du poids est plus importante que celle de la taille
5 Mesures de positionnement
8/14/2019 Cours Stat Descriptive
59/73
5 Mesures de positionnementrelatif
5.1 - Le score-z : combien dcart type lavaleur se trouve-t-elle de la moyenne ?Ex : JordanLobo mesures
xxz
=
=xzou
5 Mesures de positionnement
8/14/2019 Cours Stat Descriptive
60/73
5 Mesures de positionnementrelatif (2)
La taille de Jordan se trouve + 3,23 fois lcart type de
la moyenne des hommes
La taille de Lobo se trouve 5,04 fois lcart type de lamoyenne des femmes
Lobo est relativement plus grande parmi les
femmes que Jordan parmi les hommes
Jordan23,3
0711,0
75,198,1===
xz
04,50635,0
61,193,1=
=
=
xz
5 Mesures de positionnement
8/14/2019 Cours Stat Descriptive
61/73
5 Mesures de positionnementrelatif (3)
Valeurs ordinaires et valeurs inhabituelles
0 +1 +2 +3-1-2-3
Valeurs ordinaires Valeurs inhabituellessuprieures
Valeurs inhabituellesinfrieures
5 Mesures de positionnement
8/14/2019 Cours Stat Descriptive
62/73
5 Mesures de positionnementrelatif (4)
5.2 Quartiles et percentiles QUARTLIES
Q1 = premier% 25 % d
5 Mesures de positionnement
8/14/2019 Cours Stat Descriptive
63/73
5 Mesures de positionnementrelatif (5)
5.2 Quartiles et percentiles
Les PERCENTILES sparent les donnes en
100 parties gales avec 1 % des donnes danschaque groupe.
5 Mesures de positionnement
8/14/2019 Cours Stat Descriptive
64/73
5 Mesures de positionnementrelatif (6)
5.2 Quartiles et percentiles
Comment trouver le percentile qui correspond unevaleur particulire ?
100
inf
valeursdestotalnombre
xrieuresvaleursdenombrexvaleurdepercentile =
301004012112 ==depercentile
5 Mesures de positionnement
8/14/2019 Cours Stat Descriptive
65/73
5 Mesures de positionnementrelatif (7)
5.2 Quartiles et percentiles
Comment trouver la valeur qui correspond unpercentile particulierk? On cherche le localisateurL
dune valeur particulire parmi n valeurs.
nk
L100
=
i L t
5 Mesures de positionnement
8/14/2019 Cours Stat Descriptive
66/73
5 Mesures de positionnementrelatif (8)
5.2 Quartiles et percentiles
Ex : cotinine2,274010068
==L
5 Mesures de positionnement
8/14/2019 Cours Stat Descriptive
67/73
5 Mesures de positionnementrelatif (9)
5.2 Quartiles et percentiles
Q1 = P25 ; Q2 = P50 ; Q3 = P 75
Distance interquartile : DIQ = Q3 Q1
tendue 10 90 % : = P90 - P10
Exercice 14
8/14/2019 Cours Stat Descriptive
68/73
Exercice 14
P20
840100
20==L
3040100
75==L
4,040100
1==L
Distance Int1040
10025 ==L
Exercice 14 (suite)
8/14/2019 Cours Stat Descriptive
69/73
Exercice 14 (suite)
Etendue 10
440100
10==L
3640100
90
==L
6 Analyse exploratoire des
8/14/2019 Cours Stat Descriptive
70/73
6 Analyse exploratoire desdonnes
6.1 Valeurs extrmes
Valeurs extrmes = valeurs aberrantes
6 Analyse exploratoire des
8/14/2019 Cours Stat Descriptive
71/73
6 Analyse exploratoire desdonnes (2)
6.2 Botes moustaches (Boxplot)
minimum
mdiane
Q1 Q3 maximum
6 Analyse exploratoire des
8/14/2019 Cours Stat Descriptive
72/73
6 Analyse exploratoire desdonnes (3)
6.3 - Botes moustaches de Tukey
minimum
mdiane
Q1 Q3maximum
DIQ
1,5 DIQ1,5 DIQ
Q3 + 1,5 DIQ= vibrisse suprieure
Q3 - 1,5 DIQ= vibrisse infrieure
Valeurs normalesValeurs
anomaliques
suprieures
=
outliers
Valeurs
anomaliques
infrieures
=
outliers
6 Analyse exploratoire des
8/14/2019 Cours Stat Descriptive
73/73
6 Analyse exploratoire desdonnes (4)
6.3 - Botes moustaches de Tukey
Application aux teneurs en Cd des sols franais