CAPÍTULO V.-DISTRIBUCIONES DE FRECUENCIAS
MULTIDIMENSIONALES
ESTADÍSTICA (GRUPO 12)
TEMA 11.- ANÁLISIS DE MÁS DE DOS CARACTERÍSTICAS.
DIPLOMATURA EN CIENCIAS EMPRESARIALES
UNIVERSIDAD DE SEVILLA
2© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.
1
2
j
N
x11, x21 , x31
X1X2X3
x12, x22 , x32
p332313
m222212
k112111
x...,,x,x:Xx...,,x,x:Xx...,,x,x:X
x1j, x2j , x3j
x1N, x2N , x3N
3© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.Distribución de frecuencias tridimensional de (X1, X2 , X3)
1i 2 j 3t ijt[(x , x , x ); n ]
i 1, 2, ... k; j 1, 2, ... m; t 1, 2, ... p∀ = ∀ = ∀ =
CARACTERÍSTICAS GENERALES DE LA DISTRIBUCIÓN TRIDIMENSIONAL
Frecuencias absolutas conjuntas de las distintas tripletas de valores de X1, X2 y X3 (nijt): número de veces que aparecen conjuntamente los valores x1i, x2j y x3t
∑ ∑ ∑= = =
=k
1i
m
1j
p
1tijt Nn
4© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.CARACTERÍSTICAS GENERALES DE LA DISTRIBUCIÓN
TRIDIMENSIONALFrecuencia relativa conjunta de la tripleta de valores de x1i, x2j y x3t :
N
nf ijtijt = ∑ ∑ ∑
= = ==
k
1i
m
1j
p
1tijt 1f
Frecuencias acumuladas de la tripleta de valores de x1i, x2j y x3t :
∑ ∑ ∑== = =
i
1u
j
1v
t
1zuvzijt nN
∑ ∑ ∑== = =
i
1u
j
1v
t
1zuvzijt fF
Frecuencias absolutas
acumuladas
Frecuencias relativas
acumuladas
5© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.
8519145801844479188437317643811794262169417016741701744061166405916340X3X2X1
Ej.: Caracterización de 10 alumnos en cuanto al nº de zapato quecalzan, su altura (en cm.) y su peso (en kg.).Valores Observados:(40,174,70); (44,184,80); (40,163,61); (41,167,70); (45,191,85); (40,166,61); (43,188,79); (42,179,81); (41,169, 62); (43,17673)
77-8570-7777-8559-70
59-70
X3
3111
4
nijt
180-19142-45170-18042-45170-18040-42170-18040-42
163-17040-42
X2X1
Agrupación
6© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES MARGINALES
Concepto.- Son las distribuciones de frecuencias de los valores de cada una de las tres variables, sin considerar los valores concretos que tomen las otras; y las de los valores de dos ellas, sin considerar el valor concreto que tome la otra.
Tipos de distribuciones marginales.-Distribuciones marginales unidimensionales:
Distribución marginal de X1Distribución marginal de X2Distribución marginal de X3
Distribuciones marginales bidimensionales:Distribución marginal de (X1,X2)Distribución marginal de (X2,X3)Distribución marginal de (X1,X3)
7© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES MARGINALES
DISTRIBUCIONES MARGINALES UNIDIMENSIONALES
( ) k...,,2,1i;n,x ..ii1 =∀ ∑∑=
p
1tijt
m
1=j..i n = nX1
( ) m...,,2,1j;n,x .j.j2 =∀ ∑∑=
p
1tijt
k
1=i.j. n = nX2
( ) p...,,2,1t;n,x t..t3 =∀ ∑∑=
m
1jijt
k
1=it.. n = nX3
8© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES MARGINALES
DISTRIBUCIONES MARGINALES BIDIMENSIONALES
( )1i 2 j ij.x , x ;n ; i 1,2,...,k; j 1,2,...,m⎡ ⎤ ∀ = ∀ =⎣ ⎦p
ij. ijtt 1
n n=
= ∑(X1, X2)
( )1i 3t i.tx , x ;n ; i 1,2,..., k; t 1,2, ...,p⎡ ⎤ ∀ = ∀ =⎣ ⎦ ∑=
m
1jijtt.i n = n(X1, X3)
( )2 j 3t .jtx , x ;n ; j 1,2,...,m; t 1,2,...,p⎡ ⎤ ∀ = ∀ =⎣ ⎦ ∑=
k
1iijtjt. n = n(X2, X3)
9© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES MARGINALES
Nnnnnnnm
1j
p
1tjt.
k
1i
p
1tt.i
k
1i
m
1j.ij
p
1tt..
m
1j.j.
k
1i..i ====== ∑ ∑∑ ∑∑ ∑∑∑∑
= == == ====
Propiedad General.- La suma de las frecuencias absolutas de cualquiera de las distribuciones marginales siempre es igual al total de observaciones (N), coincidiendo también, por tanto con la suma de las frecuencias absolutas de la distribución conjunta.
pk m
ijti 1 j 1 t 1
n N= = =
=∑∑∑
10© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.
8519145801844479188437317643811794262169417016741701744061166405916340X3X2X1
Ej.: Para la distribución acerca del nº de zapato calzado, altura (en cm.) y peso (en kg.) de 10 alumnos, determinemos la distribución marginal del número de zapato calzado.
1451212
3
ni..
44434241
40
X1
Distr. Marginal de X1
11© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.Ej.: Para la distribución conjunta acerca del nº de zapato que calza, altura (en cm.) y peso (en kg.) de 10 alumnos, agrupada en intervalos, determinemos la distribución marginal del número de zapato calzado y el peso.
Distr. Marginal de
X1 y X3
77-8570-7777-8559-70
59-70
X3
3111
4
nijt
180-19142-45170-18042-45170-18040-42170-18040-42
163-17040-42
X2X1
3115ni.t
77-8542-4570-7742-4577-8540-4259-7040-42
X3X1
12© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES CONDICIONADAS
Concepto.- Son las distribuciones de frecuencia de una o dos de las variables de la distribución tridimensional cuando la otra o las otras cumplen una determinada condición (se presenta un determinado valor o conjunto de valores o una determinada pareja de valores o conjunto de parejas de valores).
Tipos de distribuciones condicionadas.-
Distribuciones condicionadas unidimensionales
Distribuciones condicionadas bidimensionales
13© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES CONDICIONADAS
(X1/X2=x2i, X3=x3t): DISTRIBUCIÓN DE X1 CONDICIONADA A QUE (X2, X3) TOME LA PAREJA DE VALORES (x2j, x3t)
.jtk
1iijt
k
1iti/j, nnn)1 =∑=∑
==
k
ijk.jti 1
i / j,ti 1 .jt .jt
n nf 1
n n=
=
= = =∑
∑
Frec. Abs.Vals. X1
nk/j,t=nkjtx1k
……ni/j,t=nijtx1i
......n2/j,t=n2jtx12
n1/j,t=n1jtx11
ijti/j,t
.jt
n2) f = n
14© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES CONDICIONADAS
(X1,X2/ X3=x3t): DISTRIBUCIÓN DE (X1, X2) CONDICIONADA A QUE X3 TOME EL VALOR x3t
( )1i 2 j i,j / tx , x ,n ; i 1,2,...,k; j 1,2,...m⎡ ⎤ = =⎣ ⎦k m k m
i,j/t ijt ..ti 1 j 1 i 1 j 1
1) n n n= = = =
= =∑∑ ∑∑
ijti,j/t
..t
n2) f = n
k m
ijtk mi 1 j 1 ..t
i,j / ti 1 j 1 ..t ..t
nn
f 1n n
= =
= =
= = =∑∑
∑∑
15© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.
8519145801844479188437317643811794262169417016741701744061166405916340X3X2X1
145121
ni/j,t
444342
X1/ X2>175, X3>70Distr. de X1 condicionadaa que X2 sea superior que
175 y que X3 sea superior que 70
Ej.: Para la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos, determinemos la distribución del número de zapato calzado de los estudiantes con altura superior a los 175 cm. y peso superior a los 70 kg.
16© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.
Distribución de frecuencias n-dimensional para el vector(X1, X2 , X3, ..., Xn)
( )1i 2 j 3t nv ijt...vx , x , x ,..., x ; n⎡ ⎤⎣ ⎦
i 1, 2, ... k∀ =Distribuciones marginales
Concepto.- Son las distribuciones de frecuencias de cualquier subconjunto (de dimensión 1, 2, n-1) de las variables del vector.
j 1, 2, ... m∀ = v 1, 2, ... z∀ =...
Ejemplos:Distrib. marginal de X1, distr. marginal de X2, ..., distr. marginal de XnDistr. marg. de (X1,X2), distr. marg. de (X1,X3), ..., distr. marginal de (Xn-1,Xn)[...]Distr. marg. de (X1,X2,...,Xn-1), ..., distr. marg. de (X2,X3,...,Xn)
17© Antonio Pajares Ruiz
1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.
GENERALIZACIÓN AL CASO N-DIMENSIONAL.
Distribución de frecuencias n-dimensional para el vector(X1, X2 , X3, ..., Xn)
Concepto.- Son las distribuciones de frecuencias de cualquier subconjunto (de dimensión 1, 2, n-1) de las variables del vector, condicionada a que cualquiera de los otros componentes o cualquier subconjunto del resto de componentes tome un valor concreto o conjunto de valores concretos.
Distribuciones condicionadas
Ejemplos:Distrib. condicionada de X1 a que X2 presente el valor x2jDistr. condicionada de (X1,X2) a que el vector (X3,X4) presente un conjunto de valores concretos[...]Distr. condicionada de (X1,X2,...,Xn-1) a que Xn presente un valor xnv
18© Antonio Pajares Ruiz
2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.VECTOR DE MEDIAS
1
2
3
xM x
x
⎛ ⎞⎜ ⎟= ⎜ ⎟⎜ ⎟⎝ ⎠
Propiedades de C23
22
21 sssC0:adacotA)3
0C:positivadaSemidefini)2
Simétrica)1
⋅⋅≤≤
≥
MATRIZ DE VARIANZAS Y COVARIANZAS
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
=233231
232221
131221
sssssssss
C
19© Antonio Pajares Ruiz
2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.MATRIZ DE VARIANZAS Y COVARIANZAS
Propiedades de los elementos de C
( ) ( )1 2 1 21) Cov a X ,X a Cov X ,X⋅ = ⋅
( ) ( ) ( )1 2 3 1 3 2 32) Cov X X , X Cov X , X Cov X , X+ = +
( ) ( ) ( )1 2 3 1 3 2 33) Cov a X b X ,c X a c Cov X ,X b c Cov X ,X⋅ + ⋅ ⋅ = ⋅ ⋅ + ⋅ ⋅
( )14) Cov X ,a 0= ( ) ( )1 1 15) Cov X ,X Var X=
( ) ( ) ( ) ( )1 2 1 2 1 26) Var X X Var X Var X 2 Cov X ,X± = + ± ⋅
( ) ( ) ( )1 2
1 2 1 2
Si X X son independientes o incorreladas :
Var X X Var X Var X± = +
20© Antonio Pajares Ruiz
2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.
MATRIZ DE CORRELACIÓN
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=
1rrr1rrr1
R
3231
2321
1312
Propiedades de R
1) Simétrica
Silas var iables están tipificadas : C R=
3) A cot ada : 0 R 1≤ ≤
2) Semidefinida positiva : R 0≥
2 2 21 2 3
4) El det erminante de C se puede expresar en función del de R :
C s s s R= ⋅ ⋅ ⋅
21© Antonio Pajares Ruiz
2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.
RANGO DE LA DISTRIBUCIÓN
Concepto.- Es el rango de la matriz C ó de la matriz R
Tipos de distribuciones:
Distribuciones singulares: Rango<3⇒|C|=0 ó |R|=0(existe multicolinealidad entre las variables)
Distribuciones no singulares: Rango=3⇒|C|≠0 ó |R|≠0
22© Antonio Pajares Ruiz
2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.
Total 72017574198519145801844479188437317643811794262169417016741701744061166405916340X3X2X1
Ej.: Determinar la caracterización de la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos.Para ello, calculamos primero el vector de medias de la misma.
1
2
3
419x 41,9
101757
x 175,710
720x 72
10
= =
= =
= =
1
2
3
x 41,9M x 175,7
x 72
⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟= =⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
23© Antonio Pajares Ruiz
2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.Ej.: Para determinar la caracterización de la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos, calculamos en segundo lugar su matriz de varianzas y covarianzas.
2 21
2 22
2 23
17585s 41,9 2,89
10309549
s 175,7 84,4110
52602s 72 76,2
10
= − =
= − =
= − =
21 12 13
221 2 23
231 32 3
s s s 2,89 13,87 12,7C s s s 13,87 84,41 74,1
s s s 12,7 74,1 76,2
⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟= =⎜ ⎟ ⎜ ⎟
⎜ ⎟⎜ ⎟ ⎝ ⎠⎝ ⎠
12
13
23
73757s 41,9 175,7 13,87
1030295
s 41,9 72 12,710
127245s 175,7 72 74,1
10
= − ⋅ =
= − ⋅ =
= − ⋅ =
24© Antonio Pajares Ruiz
2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.
Ej.: Finalmente, completamos la caracterización de la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos, calculando su matriz de correlación.
12 13
21 23
31 32
1 r rR r 1 r
r r 1
1 0,8880 0,85580,8880 1 0,92390,8558 0,9239 1
⎛ ⎞⎜ ⎟= =⎜ ⎟⎜ ⎟⎝ ⎠
⎛ ⎞⎜ ⎟= ⎜ ⎟⎜ ⎟⎝ ⎠
12
13
23
13,87r 0,8880
2,89 84,4112,7
r 0,85582,89 76,2
74,1r 0,9239
84,41 76,2
= =⋅
= =⋅
= =⋅
25© Antonio Pajares Ruiz
2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.Ej.: Determinada la caracterización de la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos, parece interesante concretar si la misma es singular.En este caso, se trata de una distribución de frecuencias no singular, ya que los determinantes de las matrices C y R son distintos de cero.
2,89 13,87 12,7C 13,87 84,41 74,1 551,8336
12,7 74,1 76,2= =
1 0,8880 0,8558R 0,8880 1 0,9239 0,0297
0,8558 0,9239 1= =
2 2 21 2 3
C 551,8336R 0,0297
s s s 2,89 84,41 76,2= = =
⋅ ⋅ ⋅ ⋅