Distribuciones Estadistica

Selección de distribuciones de probabilidad

Georgina Flesia

30 de abril, 2013

Análisis estadístico de datos simulados

I Los sistemas reales tienen fuentes de aleatoriedad:

Tipo de sistema Fuente de aleatoriedad

Fabricación Tiempos de procesamientoTiempos de fallaTiempos de reparación de máquinas

Defensa Tiempos de arribo y carga útilde aviones o misiles.Errores de lanzamiento.

Comunicaciones Tiempos entre llegadas de mensajes.Longitudes de mensajes.

Transporte Tiempo de embarqueTiempos entre arribos a un subte...

Simulación a partir de los datos

Para simular un sistema real es necesario:I Representar cada fuente de aleatoriedad de acuerdo a una

distribución de probabilidad.I Elegir adecuadamente la distribución, para no afectar los

resultados de la simulación.

¿Cómo elegir una distribución? ¿Cómo simular un sistema a partirde un conjunto de observaciones?

I Utilizando los datos directamente.I Realizando el muestreo a partir de la distribución empírica de los

datos.I Utilizando técnicas de inferencia estadística.

I Elección de una distribución teórica.I Estimación de parámetros.I Tests de bondad de ajuste.I Simulación a partir de la distribución teórica.

Elección de una distribución

Utilizar los datos directamente:I Sólo reproduce datos históricos.I En general es una información insuficiente para realizar

simulaciones.I Es útil para comparar dos sistemas, para hacer una validación

del modelo existente con el simulado.Distribución empírica:

I Reproduce datos intermedios (datos continuos).I Es recomendable si no se pueden ajustar los datos a una

distribución teórica.

Inferencia estadística de un modelo

Inferencia estadística vs. distribución empírica:I Las distribuciones empíricas pueden tener irregularidades si hay

pocos datos, una distribución teórica suaviza los datos.I Puede obtenerse información aún fuera del rango de los datos

observados.I Puede ser necesario imponer un determinado tipo de

distribución, por el tipo de modelo que se desea simular.I No es necesario almacenar los datos observados ni las

correspondientes probabilidades acumuladas.I Es fácil modificar los parámetros.I Puede no existir una distribución adecuada.I Generación de valores extremos no deseados.

Distribuciones de probabilidad más utilizadas

Continuas:I Uniforme: Para cantidades que varían "aleatoriamente" entre

valores a y b, y que no se conocen más datos.I Exponencial: Tiempos entre llegadas de "clientes" a un sistema,

y que ocurren a una tasa constante. Tiempos de falla demáquinas.

I Gamma, Weibull: Tiempo de servicio, tiempos de reparación.I Normal: Errores. Sumas grandes→ Teorema central del límite.I Otras: (Law & Kelton, cap. 6)

Parámetros:I de posición: (normal, uniforme)I de escala: (normal, uniforme, exponencial, lognormal)I de forma: (Gamma, Weibull, lognormal)

Distribución uniforme

I f (x) = 1b−a I(a,b)(x)

I a: posición, b − a: escala.I Rango: a < x < b.I Media: a+b

I Varianza: (b−a)2

Distribución Gamma(α, β)

I f (x) = β−αxα−1 exp(−x/β)Γ(α)

I α: forma, β: escala.I Rango: x > 0.I Media: αβ.I Varianza: αβ2.I NOTACIÓN para βI α = 1⇒ Exponencial

Distribución Weibull (α, β)

I f (x) = αβ−αxα−1 e−(x/β)α

I α: forma, β: escala.I Rango: x > 0.I Media: β

αΓ( 1α

Distribución Normal(µ, σ2)

I f (x) =1√2πσ

exp(−(x − µ)2/(2σ2))

I µ: posición, σ: escala.I Rango: R.I Media: µ.I Varianza: σ2.

Distribución Lognormal(µ, σ2)

I f (x) = 1x√

2πσ2e−(log(x)−µ)2/(2σ2)

I σ: forma, µ: escala.I Rango: x > 0.I Media: eµ+σ2/2.I Varianza: e2µ+σ‘

(eσ2 − 1).

Distribuciones de probabilidad más utilizadas

Discretas:I Bernoulli.I Uniforme discreta.I Geométrica: número de observaciones hasta detectar el primer

error.I Binomial negativa: número de observaciones hasta detectar el

n-ésimo error.I Poisson: Número de eventos en un intervalo de tiempo, si

ocurren a tasa constante.

Distribución Binomial

n = 5, p = 0.1 n = 5, p = 0.5 n = 5, p = 0.8

Distribución Geométrica

p = 0.25 p = 0.5

Distribución Poisson

Corresponde a λ = 25.

Distribución empíricaI Supongamos que se tienen disponibles los datos observados

Y1 = y1, Y2 = y2, . . . ,Yn = yn Y1,Y2, . . . ,Yn, se define ladistribución empírica de la muestra a la función

Fe(x) =#{i | Yi ≤ x}

I Fe(x): proporción de valores observados menores o iguales a x .I Si se ordena los datos en forma creciente :

y(j) = j − ésimo valor más pequeño

y(1) < y(2) < · · · < y(n).

Distribución empírica ⇒ Fe(x) =

0 x < y(1)1n y(1) ≤ x < y(2)

...jn y(j) ≤ x < y(j+1)

...1 y(n) ≤ x

Gráficamente

y(1) y(3)y(2) y(4) y(5)

Técnicas de prueba de independencia

Para ciertos tests, es necesario asumir independencia de los datosobservados.Ejemplos de no independencia:

I Datos de temperaturas a lo largo de un día.I Tiempos de demora en una cola de espera.

TécnicasI Gráficos de correlación: ρj .I Diagramas de dispersión (scattering): (Xi ,Xi+1).I Tests no paramétricos.

Inferencia estadística de un modelo1. Elegir una o más distribuciones apropiadas.2. Estimación de parámetros de la distribución elegida.3. Pruebas (tests) de bondad de ajuste.

I Hipótesis nula: Fe(x) es “cercana” a F (x).I Estadístico de Kolmogorov-Smirnov

D ≡ maxx|Fe(x)− F (x)| , −∞ < x <∞.

4. Si es necesario, corregir la distribución adoptada.

Elegir una distribuciónI Conocer el origen de los datos.I Estimar algunas medidas a partir de los datos:

I Media, mediana, máximo y mínimo, coeficiente de variación,desviación estándar, coeficiente de asimetría.

I Histograma.I q-cuantiles, diagramas de caja (box-plots)I Q −Q plots y P − P plots.

Medidas útiles

Parámetro Estimador EstimaMin, Max X(1), X(n) rangoMedia µ X (n) Tendencia central

Mediana m =

{X(n+1)/212 (Xn/2 + X(n/2+1))

Tendencia central.

Varianza σ2 S2(n) Variabilidad

c.v.=σµ cv(n) =

√S2(n)

X(n)Variabilidad

τ τ = S2(n)

X(n)Variabilidad

Asimetría ν = E [(X−µ)3](σ2)3/2 ν(n) =

∑i (Xi−X(n))3/n[S2(n)]3/2 Simetría

Distribuciones Estadistica

Documents

estadistica-tema1-parte1nuevo€¦ · 2 Índice Introducción Variables estadísticas Distribuciones de frecuencias ... que es el objeto de nuestro estudio. Por ejemplo, todos los

169-Estadistica CD 065-2018eco.unca.edu.ar/Programas/169-2018.pdf · 169-Estadistica CD 065-2018 ... Unidad Nº 5: Distribuciones de Probabilidad Variables aleatorias discretas y

Distribuciones de Probabilidad - Distribuciones Discretas · Distribuciones de Probabilidad Distribuciones Discretas EdimerDavidJaramillo-Bioestadística1 Marzode2019 Edimer David

EJERCICIOS DE ESTADISTICA VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

DISTRIBUCIONES BIDIMENSIONALES - rodas5.us.es · resumen 1 distribuciones bidimensionales distribucion conjunta distribuciones marginales distribuciones condicionadas 2 representaciones

Jose arreaza distribuciones de propiedades discretas estadistica 2

6.3. Distribuciones continuas - Facultad de Ciencias ...fcm.ens.uabc.mx/~chelo/estadistica/doc-pdf/dis-continuas.pdf · La probabilidad de que haya m´as de tres personas ... El soporte

MAESTRIA EN DESARROLLO EDUCATIVO ESTADISTICA DESCRIPTIVA DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS ASESOR: JOSE LUIS VILLEGAS VALLE

1. DISTRIBUCIONES CONTINUAS · DISTRIBUCIONES CONTINUAS Las distribuciones de probabilidad de variable continua son idealizaciones de las distribuciones estadísticas de variable

Distribuciones Multivariantes Distribuciones Multivariantes

Distribuciones de Probabilidad, Distribuciones discretas

S£RIE GEOLOGICAredciencia.cu/geobiblio/paper/1987_Caceres.pdf1977, Teoria y problemas de estadistica), basado en l as distribuciones de £recuencias relativas o porcentuales, con

Distribuciones de Probabilidad - Página Principal de Jhon ...jpadilla.docentes.upbbga.edu.co/Estadistica/8-Distribuciones de... · distribuciones de probabilidad contínuas que

Distribucion de frecuencias - fcps.uaq.mxfcps.uaq.mx/descargas/prope2014/estadistica/2/frecuencias.pdf · TAMAÑO MUESTRAL DATO DISTRIBUCIONES DE FRECUENCIAS FRECUENCIA ABSOLUTA

III. Variables aleatorias Discretas y sus Distribuciones ...economia.unam.mx/profesores/blopez/estadistica-discretas.pdf · Distribución de Probabilidad discreta Definición Li d

Presentacion estadistica numero 2 VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

2 Variables aleatorias 3 Vectores aleatoriosmatematicas.uam.es/~patricio.cifuentes/EPS/estadistica/... · 2017-10-31 · 3 Vectores aleatorios: Distribuciones conjunta, marginales

Distribuciones de probabilidad - Página Principal de …jpadilla.docentes.upbbga.edu.co/Estadistica/7... · 2012-02-16 · generar una falsa alarma en un control estadístico PiPoisson

Capítulo 4 Distribuciones Muestrales - aprehender.netaprehender.net/Estadistica/Ch4SPSS/CH4F.pdf · 1 Capítulo 4 Distribuciones Muestrales Objetivos • Tomar una muestra de una