20
DETERMINAR LAS VARIABLES SIGNIFICATIVAS ING MARTA GABRIELA RIOS NAVA

DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

DETERMINAR LAS VARIABLES

SIGNIFICATIVAS

ING MARTA GABRIELA RIOS NAVA

Page 2: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

Definir el problema

Describir el problema

Medición capaz y estable

Evaluar estabilidad y Cp

Determinar y validar variables. Ajustar el proceso

Evaluar el estado actual y potencial

Mejorar

D

FLUJO DMAIC

M

M

A

M

S

A

I

1

N

Capaz?

Eliminar causas especiales

Optimizar

Proceso estable?

Controlar

Mejorar

1

S

N

C

C

S

N

2

2

1

Page 3: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

MÉTODOS ESTADÍSTICOSExisten varios métodos para analizar un proceso:ü INTUICIONü EXPERIENCIAü ESTADÍSTICAü DISEÑO Y ANÁLISIS DE EXPERIMENTOS

Los métodos estadísticos proveen medios efectivos para desarrollar nuevas formas de hacer las cosas y mejorar la calidadDe que depende un diagnostico correcto:ü ACTITUDü CONOCIMIENTO DEL TRABAJOü ENCONTRAR CAUSAS VITALES

Page 4: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

PRUEBAS DE HIPOTESISUna hipótesis estadística es una proposición o supuesto sobre los parámetrosde una o más poblaciones. Una prueba de hipótesis es una prueba estadísticaque se utiliza para determinar si existe suficiente evidencia en una muestra dedatos para inferir que cierta condición es válida para toda la población

Es importante recordar que las hipótesis siempre son proposiciones sobre lapoblación o distribución bajo estudio, no proposiciones sobre la muestra. Por logeneral, el valor del parámetro de la población especificado en la hipótesis nulase determina en una de tres maneras diferentes:1. Puede ser resultado de la experiencia pasada o del conocimiento del

proceso, entonces el objetivo de la prueba de hipótesis usualmente esdeterminar si ha cambiado el valor del parámetro.

2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con elproceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis esverificar la teoría o modelo.

3. Cuando el valor del parámetro proviene de consideraciones externas, talescomo las especificaciones de diseño o ingeniería, o de obligacionescontractuales. En esta situación, el objetivo usual de la prueba de hipótesises probar el cumplimiento de las especificaciones.

Page 5: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

Un procedimiento que conduce a una decisión sobre una hipótesis en particularrecibe el nombre de prueba de hipótesis. Los procedimientos de prueba dehipótesis dependen del empleo de la información contenida en la muestraaleatoria de la población de interés. Si esta información es consistente con lahipótesis, se concluye que ésta es verdadera; sin embargo si esta información esinconsistente con la hipótesis, se concluye que esta es falsa.

La hipótesis nula, representada por Ho, es la afirmación sobre una o máscaracterísticas de poblaciones que al inicio se supone cierta (es decir, la"creencia a priori").

La hipótesis alternativa, representada por H1, es la afirmación contradictoria aHo, y ésta es la hipótesis del investigador.

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si laevidencia muestral sugiere que Ho es falsa. Si la muestra no contradicedecididamente a Ho, se continúa creyendo en la validez de la hipótesis nula.Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesisson rechazar Ho o no rechazar Ho.

Page 6: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que determinan si la decisión final es correcta o errónea.

Decisión Ho es verdadera Ho es falsaAceptar Ho No hay error Error tipo II ó 𝛽Rechazar Ho Error tipo I ó 𝛼 No hay error

El error tipo I se define como el rechazo de la hipótesis nula Ho cuando éstaes verdadera. También es conocido como 𝜶ó nivel de significancia

El error tipo II ó error 𝜷 se define como la aceptación de la hipótesis nulacuando ésta es falsa.

Page 7: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

DISEÑO DE EXPERIMENTOSEl diseño de experimentos ha sido creado por matemáticos y estadísticos, por loque posee su propio lenguaje, el cual es necesario conocer para su mejorcomprensión y utilización. A continuación se describen los términos másimportantes Beauregard [6](1992):v Factor: Una de las variables dependientes que son estudiadas en el

experimento( cualitativa, o cualitativa)v Nivel: Son los valores que puede tener el factor a estudiar.v Combinación: Es la asignación de un solo nivel a un factor, o de varios

niveles a todos los factores en una corrida experimental.v Variable de respuesta: Es el resultado de una corrida experimental.v Efecto: Es el cambio en la variable de respuesta por el cambio de el nivel de

un factor.v Interacción: Cuando uno o más factores trabajan juntos para producir un

efecto diferente que los efectos producidos por aquellos factores de maneraindividual.

v Corrida experimental: Implementación de cada una de las combinaciones.v Bloque: Agrupación planeada de factores o combinaciones (ejemplo puede

ser el turno o día de la semana).v Replicación: Repetición de la corrida experimental.

Page 8: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

ANOVA (ANALISIS DE VARIANZA)

Un análisis de varianza (ANOVA) prueba la hipótesis de que las mediasde dos o más poblaciones son iguales. Los ANOVA evalúan laimportancia de uno o más factores al comparar las medias de lavariable de respuesta en los diferentes niveles de los factores. Lahipótesis nula establece que todas las medias de la población (mediasde los niveles de los factores) son iguales mientras que la hipótesisalternativa establece que al menos una es diferente.

Tipo de ANOVA Modelo y propiedades del diseñoDe un solo factor Un factor fijo (niveles establecidos por el investigador) que

puede tener un número desigual (no balanceado) o igual (balanceado) de observaciones por tratamiento.

Balanceado El modelo puede contener cualquier número de factores aleatorios y fijos (los niveles se seleccionan de manera aleatoria) y factores anidados y cruzados, pero requiere un diseño balanceado.

Modelo lineal general

Expande los ANOVA balanceados al permitir diseños no balanceados y covariables (variables continuas).

Page 9: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver
Page 10: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

NOMENCLATURA

Page 11: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

FÓRMULAS

𝑆𝐶𝐵 = *(𝐶𝐴𝐷𝐴𝐷𝐴𝑇𝑂)1−(𝑆𝑈𝑀𝐴𝑇𝑂𝑇𝐴𝐿)1

𝑁

𝑆𝐶𝑊 =∑(𝐶𝐴𝐷𝐴𝑆𝑈𝑀𝐴𝐷𝐸𝐺𝑅𝑈𝑃𝑂)1

𝑛 −(𝑆𝑈𝑀𝐴𝑇𝑂𝑇𝐴𝐿)1

𝑁

𝑆𝐶𝑇 = 𝑆𝐶𝐵 − 𝑆𝐶𝑊

𝐶𝑀𝐵 =𝑆𝐶𝑊𝑘 − 1 𝐶𝑀𝑊 =

𝑆𝐶𝑊𝑁 − 𝑘 𝐹 =

𝐶𝑀𝐵𝐶𝑀𝑊

Page 12: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

PRUEBA CHI-CUADRADO• Chi-Cuadrado ( ) es el nombre de una prueba de

hipótesis que determina si dos variables estánrelacionadas o no.

• Pasos:1) Realizar una conjetura.2) Escribir la hipótesis nula y la alternativa.3) Calcular el valor de .4) Determinar el valor de p y el grado de libertad.5) Obtener el valor crítico.6) Realizar una comparación entre el chi-cuadrado calculado y el

valor crítico.7) Interpretar la comparación.

12

Page 13: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

FORMULACIÓN DE HIPÓTESIS

• NULA (H0): Es aquella en la que seasegura que los dos parámetrosanalizados son independientes uno delotro.

• ALTERNATIVA (H1): Es aquella en la quese asegura que los dos parámetrosanalizados sí son dependientes.

13

Page 14: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

𝜒1 = **(𝐴𝑖𝑗 − 𝐸𝑖𝑗)1

𝐸𝑖𝑗

D

EFG

H

IFG

FÓRMULAS

donde:Aij = frecuencia real en la i-ésima fila, j-ésima columnaEij = frecuencia esperada en la i-ésima fila, j-ésima columnar = número de filasc = número de columnas

Un valor bajo de χ2 es un indicador de independencia. Comose puede ver en la fórmula, χ2 siempre es positivo ó 0, y es 0solo si Aij = Eij para todo i,j.

Los grados de libertad de la columna son el número de filas (categorías)menos 1, o bien, r-1 .Los grados de libertad de cada fila es igual alnúmero de columnas (muestras) menos 1, o bien,k-1 .

Page 15: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

La prueba t-Student se utiliza para contrastar hipótesissobre medias en poblaciones con distribución normal.También proporciona resultados aproximados para loscontrastes de medias en muestras suficientementegrandes cuando estas poblaciones no se distribuyennormalmente (aunque en este último caso es preferiblerealizar una prueba no paramétrica). Para conocer si sepuede suponer que los datos siguen una distribuciónnormal, se pueden realizar diversos contrastes llamadosde bondad de ajuste, de los cuales el más usado es laprueba de Kolmogorov.

PRUEBA t student

Page 16: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

Existen dos versiones de la prueba t-Student: una que supone quelas varianzas poblacionales son iguales y otra versión que noasume esto último. Para decidir si se puede suponer o no laigualdad de varianza en las dos poblaciones, se debe realizarpreviamente la prueba F-Snedecor de comparación de dosvarianzas.Elementos a considerar:n1 y n2 son los tamaños muestrales

𝑋G𝑦𝑋1 = 𝑚𝑒𝑑𝑖𝑎𝑠𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠

𝑋G =∑ UVWXV

y 𝑋1 =∑UYWX1

S1 y S2 = desviaciones muestrales

𝑆G =G

XVZG∑ 𝑋GI − 𝑋G 1 ; 𝑆1 =

GXYZG

∑ 𝑋1I − 𝑋1 1

t = estadistico𝑡 = UVZUY

[Y V\V÷ V\Y

y con g.l.= (n1 + n2) - 2

Page 17: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

ANALISIS DE CORRELACION

Las relaciones estadísticas se obtienen medianteuna primera fase de exploración conocida comoanálisis de correlación. Consiste en analizar losdatos muestrales para saber el grado deasociación o correlación entre dos o másvariables de una población.El grado de correlación se expresa como unnúmero comprendido entre -1 y +1 y se le conocecomo coeficiente de correlación.

Page 18: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

Para avanzar a una descripción cuantitativa se procede adividir el diagrama de dispersión en cuatro regiones,dibujando líneas paralelas a los ejes por un punto central. Elpunto central puede ser el de las medianas o el de lasmedias; se considerará el punto central correspondiente alas medias (x,y), llamado también centroide.

METODO DE LAS MEDIANAS O MEDIAS

Page 19: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

Cualquier punto ubicado en la región I o III apoya una correlaciónpositiva; cualquier punto en la región II o IV apoya en cambio unacorrelación negativa. Tomando en cuenta que se trabaja con muestrasde n puntos o datos, puede llamarse n(I) al número de puntos en laregión I y de igual forma n(II), n(III) y n(IV) el numero de puntos de lasregiones II, III y IV respectivamente.

A la clase de números a quepertenece c se les conocegenéricamente como coeficiente decorrelación .

𝑐 =𝑛 𝐼 + 𝑛 𝐼𝐼𝐼 − 𝑛 𝐼𝐼 − 𝑛(𝐼𝑉)

𝑛

Propiedades del coeficiente de correlación c.a) Si todos los puntos están en I y III, entonces c = 1 .b) Si todos los puntos están en II y IV, entonces c = −1.c) Si los puntos están repartidos equitativamente en las cuatro regiones, entonces c = 0 . d) Si todos los puntos están en tres o cuatro regiones, entonces c estara entre -1 y +1: si los puntos están predominantemente en I y III, entonces c sera positivo, pero si los puntos están predominantemente en II y IV, entonces c sera negativo.

Page 20: DETERMINAR LAS VARIABLES SIGNIFICATIVASfiles.iindustrial7.webnode.com/200000331-3042e313b1/ANALIZAR.pdf · Un valor bajo de χ2 es un indicador de independencia. Como se puede ver

http://www.ugr.es/~bioestad/_private/cpfund3.pdf

BIBLIOGRAFIA

http://catarina.udlap.mx/u_dl_a/tales/documentos/lii/granados_m_d/capitulo6.pdf

http://support.minitab.com/es-mx/minitab/17/topic-library/modeling-statistics/anova/basics/what-is-anova/

www.seqc.es/dl.asp?175.145.205.255.15.30..

http://docentesinnovadores.net/Archivos/5942/PRUEBA%20DE%20HIP%C3%93TESIS%20CON%20CHI%20CUADRADO%20EMPLEANDO%20EXCEL%20Y%20WINSTATS.pdf

http://virtual.uptc.edu.co/ova/estadistica/docs/libros/tstudent.pdf

http://www.mcgraw-hill-educacion.com/pye01e/cap13/13analisis_de_correlacion_y_regresion.pdf

http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01d.html

http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-and-graphs/hypothesis-tests/basics/what-is-a-hypothesis-test/