816

Click here to load reader

Probabilidad y Estadística Para Ingeniería y Ciencias, Ronald E. Walpole (Novena Edición)

Embed Size (px)

DESCRIPTION

ExerciseData https://onedrive.live.com/redir?resid=F77DE8627486245F!300&authkey=!AHUJF0zMyskzydE&ithint=folder%2crar http://1drv.ms/10gtXzT Al elaborar la novena edición de esta obra, el interés principal de los autores no fue tan sólo incluir material nuevo, sino brindar claridad y una mejor exposición, así como conservar el equilibrio entre la teoría y las aplicaciones. Está dirigido a estudiantes que hayan cursado el equivalente a un semestre de Cálculo diferencial e integral. El Álgebra lineal es útil aunque no indispensable. Con la finalidad de motivar al estudiante, muchos ejercicios se refieren a aplicaciones científicas y de ingeniería en la vida real. En varios capítulos se agregaron proyectos para la clase y más estudios de caso, con el fin de ayudar a los usuarios a entender los métodos estadísticos que se presentan en el contexto de una situación cotidiana. Para lograr que los estudiantes adquieran experiencia en la lectura e interpretación de listas de resultados y gráficas por computadora, los estudios de caso muestran impresiones de listas de resultados por computadora y material gráfico generado con los programas SAS y MINITAB. En algunas situaciones, los ejemplos y los estudios de caso se complementan con diversos tipos de gráficas residuales, cuantilares, de probabilidad normal y de otros tipos.

Citation preview

  • 1. Probabilidad y estadsticapara ingeniera y ciencias

2. Probabilidad y estadsticapara ingeniera y cienciasNovena edicinRonald E. WalpoleRoanoke CollegeRaymond H. MyersVirginia TechSharon L. MyersRadford UniversityKeying YeUniversity of Texas at San AntonioTraduccinLeticia Esther Pineda AyalaTraductora especialista en estadsticaRevisin tcnicaRoberto Hernndez RamrezDepartamento de Fsica y MatemticasDivisin de Ingeniera y TecnologasUniversidad de MonterreyLinda Margarita Medina HerreraDepartamento de Fsica y MatemticasEscuela de Diseo, Ingeniera y ArquitecturaInstituto Tecnolgico y de Estudios Superiores de Monterrey,Campus Ciudad de Mxico 3. Authorized translation from the English language edition, entitled PROBABILITY & STATISTICS FOR ENGINEERS& SCIENTISTS 9th Edition, by RONALD E. WALPOLE, RAYMOND H. MYERS, SHARON L. MYERS and KEYINGYE, published by Pearson Education, Inc., publishing as Pearson, Copyright 2012. All rights reserved.ISBN 9780321629111Traduccin autorizada de la edicin en idioma ingls, titulada PROBABILIDAD Y ESTADSTICA PARA INGENIERAY CIENCIAS 9 edicin por RONALD E. WALPOLE, RAYMOND H. MYERS, SHARON L. MYERS y KEYING YE,publicada por Pearson Education, Inc., publicada como Pearson, Copyright 2012. Todos los derechos reservados.Esta edicin en espaol es la nica autorizada.Edicin en espaolDireccin Educacin Superior: Mario ContrerasEditor sponsor: Gabriela Lpez Ballesterose-mail: [email protected] de desarrollo: Felipe Hernndez CarrascoSupervisor de Produccin: Juan Jos Garca GuzmnDiseo de portada: Dream Studio/Edgar MaldonadoGerencia editorialEducacin Superior Latinoamrica: Marisa de AntaNOVENA EDICIN, 2012D.R. 2012 por Pearson Educacin de Mxico, S.A. de C.V.Atlacomulco 500-5o. pisoCol. Industrial Atoto53519, Naucalpan de Jurez, Estado de MxicoCmara Nacional de la Industria Editorial Mexicana. Reg. nm. 1031.Reservados todos los derechos. Ni la totalidad ni parte de esta publicacin pueden reproducirse, registrarse otransmitirse, por un sistema de recuperacin de informacin, en ninguna forma ni por ningn medio, sea electrnico,mecnico, fotoqumico, magntico o electroptico, por fotocopia, grabacin o cualquier otro, sin permiso previo porescrito del editor.El prstamo, alquiler o cualquier otra forma de cesin de uso de este ejemplar requerir tambin la autorizacin deleditor o de sus representantes.ISBN VERSIN IMPRESA: 978-607-32-1417-9ISBN VERSIN E-BOOK: 978-607-32-1418-6ISBN E-CHAPTER: 978-607-32-1419-3Impreso en Mxico. Printed in Mexico.1 2 3 4 5 6 7 8 9 0 - 15 14 13 12www.pearsonenespaol.comRONALD E. WALPOLE, RAYMOND H. MYERS,SHARON L. MYERS Y KEYING YEProbabilidad y estadstica para ingeniera y cienciasNovena edicinPEARSON EDUCACIN, Mxico, 2012ISBN: 978-607-32-1417-9rea: IngenieraFormato: 18.523.5 cm Pginas: 816 4. AGRADECIMIENTOSPearson agradece a los profesores usuarios de esta obra y a los centros de estudio por su apoyo y retroali-mentacin,elementos fundamentales para esta nueva edicin de Probabilidad y estadstica para ingeniera yciencias.COLOMBIAEscuela Colombiana de IngenieraDepartamento de MatemticasSusana Rondn TroncosoPontificia Universidad JaverianaCaliDepartamento de CienciasNaturales y MatemticasDaniel Enrique Gonzlez GmezMara del Pilar Marn GaviriaSandra Milena Ramrez BuelvasUniversidad Catlica de ColombiaDepartamento de Ciencias BsicasQueeny Madueo PintoUniversidad de La SalleDepartamento de Ciencias BsicasMaribel Mndez CortsMartha Tatiana Jimnez ValderramaMilton Armando Reyes VillamilMyrian Elena Vergara MoralesCOSTA RICAInstituto Tecnolgico de Costa RicaEscuela de Ingeniera enProduccin IndustrialIvannia Hasbum FernndezUniversidad de Costa RicaEscuela de EstadsticaFacultad de Ciencias EconmicasAna Teresa Garita SalasMXICOEstado de MxicoFacultad de Estudios SuperioresCuautitln C-4Armando Aguilar MrquezFermn Cervantes MartnezHctor Coss GarduoJuan Carlos Axotla GarcaMiguel de Nazareth Pineda BecerrilVicente Vzquez JurezTecnolgico de Estudios Superioresde CoacalcoMara de la Luz Dvila FloresMartha Nieto LpezHctor Feliciano Martnez OsorioJeanette Lpez AlansTecnolgico de Estudios Superioresde EcatepecHctor Rodrguez Carmonangel Hernndez EstradaDaniel Jaimes SerranoRamn Jordn RochaJaliscoUniversidad de GuadalajaraCentro Universitario de CienciasExactas e Ingenieras (CUCEI)Departamento de MatemticasAgustn Rodrguez MartnezCarlos Florentino Melgoza CaedoCecilia Garibay LpezDalmiro Garca NavaDeliazar Pantoja EspinozaGloria Arroyo CervantesJavier Nava GmezJorge Luis Rodrguez GutirrezJos ngel Partida IbarraJos de Jess Bernal CasillasJos de Jess Cabrera ChavarraJos de Jess Rivera PradoJos Sols RodrguezJulieta Carrasco GarcaLaura Esther Corts NavarroLizbeth Daz CalderaMaribel Sierra FuentesMario Alberto Prado AlonsoOsvaldo Camacho CastilloRosala Buenrostro ArceoSamuel Rosalo CuevasUniversidad del Valle de Mxico,ZapopanDepartamento de IngenieraAbel Vzquez PrezIrene Isabel Navarro GonzlezJorge Eduardo Aguilar RosasMiguel Arturo Barreiro GonzlezSinaloaInstituto Tecnolgico de CuliacnCiencias BsicasCecilia Norzagaray GmezInstituto Tecnolgico de Los MochisCiencias BsicasJess Alberto Bez Torres 5. ContenidoPrefacio .......................................................................................................xv1 Introduccin a la estadstica y al anlisis de datos ..............................11.1 Panorama general: inferencia estadstica, muestras, poblaciones y el papelde la probabilidad ............................................................................................................11.2 Procedimientos de muestreo; recoleccin de los datos ....................................................71.3 Medidas de localizacin: la media y la mediana de una muestra ..................................11Ejercicios ...................................................................................................................131.4 Medidas de variabilidad .................................................................................................14Ejercicios ...................................................................................................................171.5 Datos discretos y continuos ...........................................................................................171.6 Modelado estadstico, inspeccin cientfica y diagnsticos grficos .............................181.7 Tipos generales de estudios estadsticos: diseo experimental,estudio observacional y estudio retrospectivo ...............................................................27Ejercicios ...................................................................................................................302 Probabilidad .........................................................................................352.1 Espacio muestral ............................................................................................................352.2 Eventos...........................................................................................................................38Ejercicios ...................................................................................................................422.3 Conteo de puntos muestrales .........................................................................................44Ejercicios ...................................................................................................................512.4 Probabilidad de un evento ..............................................................................................522.5 Reglas aditivas ...............................................................................................................56Ejercicios ...................................................................................................................592.6 Probabilidad condicional, independencia y regla del producto .....................................62Ejercicios ...................................................................................................................692.7 Regla de Bayes...............................................................................................................72Ejercicios ...................................................................................................................76Ejercicios de repaso ..................................................................................................77 6. viii Contenido2.8 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos ...........................................................................................................793 Variables aleatorias y distribuciones de probabilidad ......................813.1 Concepto de variable aleatoria .......................................................................................813.2 Distribuciones discretas de probabilidad .......................................................................843.3 Distribuciones de probabilidad continua .......................................................................87Ejercicios ...................................................................................................................913.4 Distribuciones de probabilidad conjunta .......................................................................94Ejercicios .................................................................................................................104Ejercicios de repaso ................................................................................................1073.5 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos .........................................................................................................1094 Esperanza matemtica .......................................................................1114.1 Media de una variable aleatoria ...................................................................................111Ejercicios .................................................................................................................1174.2 Varianza y covarianza de variables aleatorias ..............................................................119Ejercicios .................................................................................................................1274.3 Medias y varianzas de combinaciones lineales de variables aleatorias .......................1284.4 Teorema de Chebyshev ................................................................................................135Ejercicios .................................................................................................................137Ejercicios de repaso ................................................................................................1394.5 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos .........................................................................................................1425 Algunas distribuciones de probabilidad discreta ............................1435.1 Introduccin y motivacin ...........................................................................................1435.2 Distribuciones binomial y multinomial .......................................................................143Ejercicios .................................................................................................................1505.3 Distribucin hipergeomtrica.......................................................................................152Ejercicios .................................................................................................................1575.4 Distribuciones binomial negativa y geomtrica ...........................................................1585.5 Distribucin de Poisson y proceso de Poisson.............................................................161Ejercicios .................................................................................................................164Ejercicios de repaso ................................................................................................1665.6 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos .........................................................................................................169 7. Contenido ix6 Algunas distribuciones continuas de probabilidad .........................1716.1 Distribucin uniforme continua ...................................................................................1716.2 Distribucin normal .....................................................................................................1726.3 reas bajo la curva normal ..........................................................................................1766.4 Aplicaciones de la distribucin normal .......................................................................182Ejercicios .................................................................................................................1856.5 Aproximacin normal a la binomial ............................................................................187Ejercicios .................................................................................................................1936.6 Distribucin gamma y distribucin exponencial .........................................................1946.7 Distribucin chi cuadrada ............................................................................................2006.8 Distribucin beta ..........................................................................................................2016.9 Distribucin logartmica normal ..................................................................................2016.10 Distribucin de Weibull (opcional) ..............................................................................203Ejercicios .................................................................................................................206Ejercicios de repaso ................................................................................................2076.11 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos ........................................................................................................2097 Funciones de variables aleatorias (opcional) ...................................2117.1 Introduccin .................................................................................................................2117.2 Transformaciones de variables ....................................................................................2117.3 Momentos y funciones generadoras de momentos ......................................................218Ejercicios .................................................................................................................2228 Distribuciones de muestreo fundamentalesy descripciones de datos .....................................................................2258.1 Muestreo aleatorio .......................................................................................................2258.2 Algunos estadsticos importantes ................................................................................227Ejercicios .................................................................................................................2308.3 Distribuciones muestrales ............................................................................................2328.4 Distribucin muestral de medias y el teorema del lmite central .................................233Ejercicios .................................................................................................................2418.5 Distribucin muestral de S 2 ............................................................................................2438.6 Distribucin t ..................................................................................................................2468.7 Distribucin F .................................................................................................................2518.8 Grficas de cuantiles y de probabilidad ..........................................................................254Ejercicios .................................................................................................................259Ejercicios de repaso ................................................................................................260 8. x Contenido8.9 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos ........................................................................................................2629 Problemas de estimacin de una y dos muestras ............................2659.1 Introduccin .................................................................................................................2659.2 Inferencia estadstica ...................................................................................................2659.3 Mtodos de estimacin clsicos ...................................................................................2669.4 Una sola muestra: estimacin de la media ...................................................................2699.5 Error estndar de una estimacin puntual ....................................................................2769.6 Intervalos de prediccin ...............................................................................................2779.7 Lmites de tolerancia ....................................................................................................280Ejercicios .................................................................................................................2829.8 Dos muestras: estimacin de la diferencia entre dos medias .......................................2859.9 Observaciones pareadas ...............................................................................................291Ejercicios .................................................................................................................2949.10 Una sola muestra: estimacin de una proporcin ........................................................2969.11 Dos muestras: estimacin de la diferencia entre dos proporciones .............................300Ejercicios ................................................................................................................3029.12 Una sola muestra: estimacin de la varianza ...............................................................3039.13 Dos muestras: estimacin de la proporcin de dos varianzas ......................................305Ejercicios .................................................................................................................3079.14 Estimacin de la mxima verosimilitud (opcional) .....................................................307Ejercicios .................................................................................................................312Ejercicios de repaso ................................................................................................3139.15 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos .........................................................................................................31610 Pruebas de hiptesis de una y dos muestras ..................................31910.1 Hiptesis estadsticas: conceptos generales .................................................................31910.2 Prueba de una hiptesis estadstica ..............................................................................32110.3 Uso de valores P para la toma de decisiones en la prueba de hiptesis ......................331Ejercicios .................................................................................................................33410.4 Una sola muestra: pruebas respecto a una sola media .................................................33610.5 Dos muestras: pruebas sobre dos medias .....................................................................34210.6 Eleccin del tamao de la muestra para la prueba de medias ......................................34910.7 Mtodos grficos para comparar medias .....................................................................354Ejercicios .................................................................................................................35610.8 Una muestra: prueba sobre una sola proporcin ..........................................................36110.9 Dos muestras: pruebas sobre dos proporciones ...........................................................363Ejercicios .................................................................................................................36510.10 Pruebas de una y dos muestras referentes a varianzas .................................................366Ejercicios .................................................................................................................369 9. Contenido xi10.11 Prueba de la bondad de ajuste ......................................................................................37110.12 Prueba de independencia (datos categricos) ..............................................................37410.13 Prueba de homogeneidad .............................................................................................37610.14 Estudio de caso de dos muestras ..................................................................................380Ejercicios .................................................................................................................382Ejercicios de repaso ................................................................................................38410.15 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos .........................................................................................................38711 Regresin lineal simple y correlacin .............................................38911.1 Introduccin a la regresin lineal.................................................................................38911.2 El modelo de regresin lineal simple (RLS) ................................................................39011.3 Mnimos cuadrados y el modelo ajustado ...................................................................394Ejercicios .................................................................................................................39811.4 Propiedades de los estimadores de mnimos cuadrados ..............................................40011.5 Inferencias sobre los coeficientes de regresin ............................................................40311.6 Prediccin ....................................................................................................................408Ejercicios .................................................................................................................41111.7 Seleccin de un modelo de regresin ..........................................................................41411.8 El mtodo del anlisis de varianza ...............................................................................41411.9 Prueba para la linealidad de la regresin: datos con observaciones repetidas .............416Ejercicios .................................................................................................................42111.10 Grficas de datos y transformaciones ..........................................................................42411.11 Estudio de caso de regresin lineal simple ..................................................................42811.12 Correlacin ..................................................................................................................430Ejercicios .................................................................................................................435Ejercicios de repaso ................................................................................................43611.13 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos .........................................................................................................44212 Regresin lineal mltiple y ciertos modelosde regresin no lineal .......................................................................44312.1 Introduccin .................................................................................................................44312.2 Estimacin de los coeficientes .....................................................................................44412.3 Modelo de regresin lineal en el que se utilizan matrices ...........................................447Ejercicios .................................................................................................................45012.4 Propiedades de los estimadores de mnimos cuadrados ..............................................45312.5 Inferencias en la regresin lineal mltiple ..................................................................455Ejercicios .................................................................................................................46112.6 Seleccin de un modelo ajustado mediante la prueba de hiptesis .............................462 10. xii Contenido12.7 Caso especial de ortogonalidad (opcional) ..................................................................467Ejercicios .................................................................................................................47112.8 Variables categricas o indicadoras .............................................................................472Ejercicios .................................................................................................................47612.9 Mtodos secuenciales para la seleccin del modelo ....................................................47612.10 Estudio de los residuales y violacin de las suposiciones(verificacin del modelo) .............................................................................................48212.11 Validacin cruzada, Cp, y otros criterios para la seleccin del modelo .......................487Ejercicios .................................................................................................................49412.12 Modelos especiales no lineales para condiciones no ideales .......................................496Ejercicios .................................................................................................................500Ejercicios de repaso ................................................................................................50112.13 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos .........................................................................................................50613 Experimentos con un solo factor: generales ..................................50713.1 Tcnica del anlisis de varianza ...................................................................................50713.2 La estrategia del diseo de experimentos ....................................................................50813.3 Anlisis de varianza de un factor: diseo completamente aleatorizado(ANOVA de un factor) .................................................................................................50913.4 Pruebas de la igualdad de varias varianzas ..................................................................516Ejercicios .................................................................................................................51813.5 Comparaciones de un grado de libertad .......................................................................52013.6 Comparaciones mltiples .............................................................................................523Ejercicios .................................................................................................................52913.7 Comparacin de un conjunto de tratamientos en bloques ...........................................53213.8 Diseos de bloques completos aleatorizados ...............................................................53313.9 Mtodos grficos y verificacin del modelo ................................................................54013.10 Transformaciones de datos en el anlisis de varianza .................................................543Ejercicios .................................................................................................................54513.11 Modelos de efectos aleatorios ......................................................................................54713.12 Estudio de caso ............................................................................................................551Ejercicios .................................................................................................................553Ejercicios de repaso ................................................................................................55513.13 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos .........................................................................................................55914 Experimentos factoriales (dos o ms factores) ..............................56114.1 Introduccin .................................................................................................................56114.2 Interaccin en el experimento de dos factores .............................................................56214.3 Anlisis de varianza de dos factores ............................................................................565Ejercicios .................................................................................................................575 11. Contenido xiii14.4 Experimentos de tres factores ......................................................................................579Ejercicios .................................................................................................................58614.5 Experimentos factoriales para efectos aleatorios y modelos mixtos ..........................588Ejercicios .................................................................................................................592Ejercicios de repaso ................................................................................................59414.6 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos ........................................................................................................59615 Experimentos factoriales 2k y fracciones .......................................59715.1 Introduccin .................................................................................................................59715.2 El factorial 2k: clculo de efectos y anlisis de varianza .............................................59815.3 Experimento factorial 2k sin rplicas ...........................................................................604Ejercicios .................................................................................................................60915.4 Experimentos factoriales en un ajuste de regresin .....................................................61215.5 El diseo ortogonal ......................................................................................................617Ejercicios .................................................................................................................62515.6 Experimentos factoriales fraccionarios ........................................................................62615.7 Anlisis de experimentos factoriales fraccionados ......................................................632Ejercicios .................................................................................................................63415.8 Diseos de fracciones superiores y de filtrado ............................................................63615.9 Construccin de diseos de resolucin III y IV,con 8, 16 y 32 puntos de diseo ...................................................................................63715.10 Otros diseos de resolucin III de dos niveles; los diseos de Plackett-Burman ........63815.11 Introduccin a la metodologa de superficie de respuesta ...........................................63915.12 Diseo robusto de parmetros ......................................................................................643Ejercicios .................................................................................................................652Ejercicios de repaso ................................................................................................65315.13 Posibles riesgos y errores conceptuales; relacin con el materialde otros captulos .........................................................................................................65416 Estadstica no paramtrica ..............................................................65516.1 Pruebas no paramtricas ..............................................................................................65516.2 Prueba de rango con signo ...........................................................................................660Ejercicios .................................................................................................................66316.3 Prueba de la suma de rangos de Wilcoxon ..................................................................66516.4 Prueba de Kruskal-Wallis ............................................................................................668Ejercicios .................................................................................................................67016.5 Pruebas de rachas .........................................................................................................67116.6 Lmites de tolerancia ....................................................................................................674 12. xiv Contenido16.7 Coeficiente de correlacin de rango .............................................................................674Ejercicios .................................................................................................................677Ejercicios de repaso ................................................................................................67917 Control estadstico de la calidad .....................................................68117.1 Introduccin .................................................................................................................68117.2 Naturaleza de los lmites de control .............................................................................68317.3 Objetivos de la grfica de control ................................................................................68317.4 Grficas de control para variables ................................................................................68417.5 Grficas de control para atributos ................................................................................69717.6 Grficas de control de cusum .......................................................................................705Ejercicios de repaso ................................................................................................70618 Estadstica bayesiana .......................................................................70918.1 Conceptos bayesianos ..................................................................................................70918.2 Inferencias bayesianas .................................................................................................71018.3 Estimados bayesianos mediante la teora de decisin .................................................717Ejercicios .................................................................................................................718Bibliografa ...............................................................................................721Apndice A: Tablas y demostraciones estadsticas ................................725Apndice B: Respuestas a los ejercicios impares(no de repaso) ...........................................................................................769ndice .........................................................................................................785 13. PrefacioEnfoque general y nivel matemticoAl elaborar la novena edicin, nuestro inters principal no fue tan slo agregar materialnuevo sino brindar claridad y mejor comprensin. Este objetivo se logr en parte al in-cluirmaterial nuevo al final de los captulos, lo cual permite que se relacionen mejor.Con cierto afecto llamamos contratiempos a los comentarios que aparecen al final delos captulos, pues son muy tiles para que los estudiantes recuerden la idea general y laforma en que cada captulo se ajusta a esa imagen; as como para que entiendan las limi-tacionesy los problemas que resultaran por el uso inadecuado de los procedimientos.Los proyectos para la clase favorecen una mayor comprensin de cmo se utiliza la es-tadsticaen el mundo real, por lo que aadimos algunos proyectos en varios captulos.Tales proyectos brindan a los estudiantes la oportunidad de trabajar solos o en equipo, yde reunir sus propios datos experimentales para realizar inferencias. En algunos casos, eltrabajo implica un problema cuya solucin ejemplifica el significado de un concepto, obien, favorece la comprensin emprica de un resultado estadstico importante. Se am-pliaronalgunos de los ejemplos anteriores y se introdujeron algunos nuevos para crearestudios de caso, los cuales incluyen un comentario para aclarar al estudiante un con-ceptoestadstico en el contexto de una situacin prctica.En esta edicin seguimos haciendo nfasis en el equilibrio entre la teora y las apli-caciones.Utilizamos el clculo y otros tipos de conceptos matemticos, por ejemplo, delgebra lineal, casi al mismo nivel que en ediciones anteriores. Las herramientas analti-caspara la estadstica se cubren de mejor manera utilizando el clculo en los casosdonde el anlisis se centra en las reglas de los conceptos de probabilidad. En los captulos2 a 10 se destacan las distribuciones de probabilidad y la inferencia estadstica. Enlos captulos 11 a 15, en los cuales se estudian la regresin lineal y el anlisis de varian-za,se aplica un poco de lgebra lineal y matrices. Los estudiantes que utilizan este librodeben haber cursado el equivalente a un semestre de clculo diferencial e integral. Ellgebra lineal es til aunque no indispensable, siempre y cuando el instructor no cubra laseccin sobre regresin lineal mltiple del captulo 12 utilizando lgebra de matrices. Aligual que en las ediciones anteriores, y con la finalidad de desafiar al estudiante, muchosejercicios se refieren a aplicaciones cientficas y de ingeniera a la vida real. Todos losconjuntos de datos asociados con los ejercicios estn disponibles para descargar del sitioweb http://www.pearsonenespaol.com/walpole.xv 14. xvi PrefacioResumen de los cambios en la novena edicin r 1BSBCSJOEBSVOBNBZPSDPNQSFOTJOEFMVTPEFMBFTUBETUJDBFOFMNVOEPSFBM FOvarios captulos se agregaron proyectos para la clase. Los estudiantes tienen que ge-neraro reunir sus propios datos experimentales y realizar inferencias a partir de ellos. r 4FBHSFHBSPONTFTUVEJPTEFDBTPZPUSPTTFBNQMJBSPOQBSBBZVEBSBMPTVTVBSJPTa comprender los mtodos estadsticos que se presentan en el contexto de una si-tuacinreal. Por ejemplo, la interpretacin de los lmites de confianza, los lmitesde prediccin y los lmites de tolerancia se exponen utilizando situaciones de lavida real. r 4FBHSFHBSPOiDPOUSBUJFNQPTuBMOBMEFBMHVOPTDBQUVMPTZFOPUSPTTFBNQMJBSPOlos que ya se incluan. El objetivo de dichos comentarios es presentar cada captuloen el contexto de la idea general y analizar la forma en que los captulos se relacio-nanentre s. Otro objetivo es advertir acerca del uso inadecuado de las tcnicasestadsticas examinadas en el captulo. r MDBQUVMPTFNFKPSZBIPSBJODMVZFNTFTUBETUJDPTEFVOBTPMBDJGSBZUDOJ-cas grficas. Tambin se incluy nuevo material fundamental sobre muestreo ydiseo experimental. r -PTFKFNQMPTRVFTFBHSFHBSPOFOFMDBQUVMPTPCSFMBTEJTUSJCVDJPOFTEFNVFT-treo tienen la finalidad de motivar a los estudiantes a realizar las pruebas de hip-tesisy de los valores P. Esto los prepara para el material ms avanzado sobre lostemas que se presentan en el captulo 10. r MDBQUVMPDPOUJFOFNTJOGPSNBDJOTPCSFFMFGFDUPRVFUJFOFVOBTPMBWBSJBCMFde regresin en un modelo que presenta una gran colinealidad con otras variables. r MDBQUVMPBIPSBJOUSPEVDFNBUFSJBMTPCSFFMJNQPSUBOUFUFNBEFMBNFUPEPMPHBde superficie de respuesta (MSR). El uso de las variables del ruido en la MSR permiteejemplificar los modelos de la media y la varianza (superficie de respuesta doble). r OFMDBQUVMPTFJOUSPEVDFFMEJTFPDPNQVFTUPDFOUSBM r MDBQUVMPJODMVZFNTFKFNQMPTZVONFKPSBOMJTJTEFDNPTFVUJMJ[BOMPTmtodos bayesianos para la toma de decisiones estadsticas.Contenido y planeacin del cursoEste libro est diseado para un curso de uno o dos semestres. Un plan razonable para elcurso de un semestre podra incluir los captulos 1 a 10, lo cual dara como resultadoun programa que concluye con los fundamentos de la estimacin y la prueba de hipte-sis.Los profesores que desean que los estudiantes aprendan la regresin lineal simplepodran incluir una parte del captulo 11. Para quienes deseen incluir el anlisis devarianza en vez de la regresin, el curso de un semestre podra incluir el captulo 13 envez de los captulos 11 y 12. El captulo 13 trata el tema del anlisis de varianza de unfactor. Otra opcin consiste en eliminar partes de los captulos 5 o 6, as como el captulo7. Al hacer esto se omitiran las distribuciones discretas o continuas, mismas que inclu-yenla binomial negativa, la geomtrica, la gamma, la de Weibull, la beta y la logartmi-canormal. Otros contenidos que se podran omitir en un programa de un semestre sonla estimacin de mxima verosimilitud, la prediccin y los lmites de tolerancia del 15. Prefacio xviicaptulo 9. El programa para un semestre suele ser flexible, dependiendo del inters queel profesor tenga en la regresin, el anlisis de varianza, el diseo experimental y losmtodos de superficie de respuesta (captulo 15). Existen varias distribuciones discretasy continuas (captulos 5 y 6) que tienen aplicaciones en diversas reas de la ingeniera ylas ciencias.Los captulos 11 a 18 incluyen una gran cantidad de material que se podra agregaral segundo semestre, en caso de que se eligiera un curso de dos semestres. El materialsobre la regresin lineal simple y mltiple se estudia en los captulos 11 y 12, respecti-vamente.El captulo 12 puede ser muy flexible. La regresin lineal mltiple incluyetemas especiales, como variables categricas o indicadoras, mtodos secuencialespara la seleccin de modelos, por ejemplo, la regresin por etapas, el estudio de residua-lespara la deteccin de violaciones de supuestos, la validacin cruzada y el uso de losestadsticos PRESS, as como el de Cp y la regresin logstica. Se hace hincapi en el usode regresores ortogonales, un precursor del diseo experimental en el captulo 15. Loscaptulos 13 y 14 ofrecen hasta cierto grado material abundante sobre el anlisis de va-rianza(ANOVA), con modelos fijos, aleatorios y mixtos. En el captulo 15 se destaca laaplicacin de los diseos con dos niveles en el contexto de los experimentos factorialesfraccionarios y completos (2k). Tambin se ejemplifican los diseos especiales de selec-cin.En el captulo 15 se incluye asimismo una nueva seccin sobre la metodologa desuperficie de respuesta (MSR), para ejemplificar el uso del diseo experimental con lafinalidad de encontrar condiciones ptimas de proceso. Se analiza el ajuste de un modelode segundo orden utilizando un diseo complejo central. La MSR se ampla para abarcarel anlisis de problemas sobre el diseo de un parmetro robusto. Las variables de ruidose utilizan para ajustar modelos dobles de superficie de respuesta. Los captulos 16, 17 y18 incluyen una cantidad moderada de material sobre estadstica no paramtrica, controlde calidad e inferencia bayesiana.El captulo 1 es un bosquejo de la inferencia estadstica, presentada a un nivel ma-temticosencillo, pero de manera ms amplia que en la octava edicin con el propsitode examinar ms detalladamente los estadsticos de una sola cifra y las tcnicas grficas.Este captulo est diseado para brindar a los estudiantes una presentacin preliminar delos conceptos fundamentales que les permitirn entender los detalles posteriores de mayorcomplejidad. Se presentan conceptos clave sobre muestreo, recoleccin de datos y diseoexperimental, as como los aspectos rudimentarios de las herramientas grficas y la infor-macinque se obtiene a partir de un conjunto de datos. Tambin se agregaron las grficasde tallo y hojas, y las de caja y bigotes. Las grficas estn mejor organizadas y etique-tadas.El anlisis de la incertidumbre y la variacin en un sistema se ilustra de formadetallada. Se incluyen ejemplos de cmo clasificar las caractersticas importantes de unsistema o proceso cientfico, y esas ideas se ilustran en ambientes prcticos, como procesosde manufactura, estudios biomdicos, y estudios de sistemas biolgicos y cientficos deotros tipos. Se efecta una comparacin entre el uso de los datos discretos y continuos;tambin se hace un mayor nfasis en el uso de modelos y de la informacin con respecto alos modelos estadsticos que se logran obtener mediante las herramientas grficas.En los captulos 2, 3 y 4 se estudian los conceptos bsicos de probabilidad, as comolas variables aleatorias discretas y continuas. Los captulos 5 y 6 se enfocan en las distri-bucionesdiscretas y continuas especficas, as como en las relaciones que existen entreellas. En estos captulos tambin se destacan ejemplos de aplicaciones de las distribucio-nesen estudios reales cientficos y de ingeniera. Los estudios de caso, los ejemplos yuna gran cantidad de ejercicios permiten a los estudiantes practicar el uso de tales distri-buciones.Los proyectos permiten la aplicacin prctica de estas distribuciones en la vida 16. xviii Prefacioreal mediante el trabajo en equipo. El captulo 7 es el ms terico del libro; en l se ex-ponela transformacin de variables aleatorias, y podra ser que no se utilice a menos queel instructor desee impartir un curso relativamente terico. El captulo 8 contiene mate-rialgrfico, el cual ampla el conjunto bsico de herramientas grficas presentadas yejemplificadas en el captulo 1. Aqu se analizan las grficas de probabilidad y se ilustrancon ejemplos. El muy importante concepto de las distribuciones de muestreo se presentade forma detallada, y se proporcionan ejemplos que incluyen el teorema del lmite centraly la distribucin de una varianza muestral en una situacin de muestreo independiente ynormal. Tambin se presentan las distribuciones t y F para motivar a los estudiantes autilizarlas en los captulos posteriores. El nuevo material del captulo 8 ayuda a los estu-diantesa conocer la importancia de la prueba de hiptesis mediante la presentacin delconcepto del valor P.El captulo 9 contiene material sobre la estimacin puntual y de intervalos de unamuestra y dos muestras. Un anlisis detallado y con ejemplos destaca las diferenciasentre los tipos de intervalos (intervalos de confianza, intervalos de prediccin e interva-losde tolerancia). Un estudio de caso ilustra los tres tipos de intervalos estadsticos en elcontexto de una situacin de manufactura. Este estudio de caso destaca las diferenciasentre los intervalos, sus fuentes y los supuestos en que se basan, as como cules son losintervalos que requieren diferentes tipos de estudios o preguntas. Se aadi un mtodode aproximacin para las inferencias sobre una proporcin. El captulo 10 inicia con unapresentacin bsica sobre el significado prctico de la prueba de hiptesis, con un nfasisen conceptos fundamentales como la hiptesis nula y la alternativa, el papel que desem-peanla probabilidad y el valor P, as como la potencia de una prueba. Despus, sepresentan ejemplos de pruebas sobre una o dos muestras en condiciones estndar. Tam-binse describe la prueba t de dos muestras con observaciones en pares (apareadas). Unestudio de caso ayuda a los estudiantes a entender el verdadero significado de una inte-raccinde factores, as como los problemas que en ocasiones surgen cuando existen in-teraccionesentre tratamientos y unidades experimentales. Al final del captulo 10 seincluye una seccin muy importante que relaciona los captulos 9 y 10 (estimacin yprueba de hiptesis) con los captulos 11 a 16, donde se destaca el modelamiento esta-dstico.Es importante que el estudiante est consciente de la fuerte relacin entre loscaptulos mencionados.Los captulos 11 y 12 incluyen material sobre la regresin lineal simple y mltiple,respectivamente. En esta edicin ponemos mucho ms atencin en el efecto que tienela colinealidad entre las variables de regresin. Se presenta una situacin que muestracmo el papel que desempea una sola variable de regresin depende en gran parte decules son los regresores que la acompaan en el modelo. Despus se revisan los proce-dimientossecuenciales para la seleccin del modelo (hacia adelante, hacia atrs, poretapas, etctera) con respecto a este concepto, as como los fundamentos para utilizarciertos tipos de valores P con tales procedimientos. En el captulo 12 se estudia materialsobre los modelos no lineales con una presentacin especial de la regresin logstica, lacual tiene aplicaciones en ingeniera y en las ciencias biolgicas. El material sobre la re-gresinmltiple es muy extenso, de manera que, como antes se expuso, plantea una granflexibilidad. Al final del captulo 12 se incluye un comentario que lo relaciona con loscaptulos 14 y 15. Se agregaron varios elementos para fomentar la comprensin del ma-terialen general. Por ejemplo, al final del captulo se describen algunas dificultades yproblemas que podran surgir. Se indica que existen tipos de respuestas que ocurren deforma natural en la prctica, por ejemplo, respuestas de proporciones, de conteo y mu-chasotras, con las cuales no se debe utilizar la regresin estndar de mnimos cuadrados 17. Prefacio xixdebido a que los supuestos de normalidad no se cumplen, y transgredirlos causara erro-resmuy graves. Se sugiere utilizar la transformacin de datos para reducir el problemaen algunos casos. Nuevamente, los captulos 13 y 14 sobre el tema del anlisis de varian-zatienen cierta flexibilidad. En el captulo 13 se estudia el ANOVA de un factor en elcontexto de un diseo completamente aleatorio. Algunos temas complementarios incluyenlas pruebas sobre las varianzas y las comparaciones mltiples. Se destacan las compara-cionesde tratamientos en bloque, junto con el tema de los bloques completos aleatoriza-dos.Los mtodos grficos se extendieron al ANOVA para ayudar al estudiante acomplementar la inferencia formal con una inferencia pictrica que facilita la presenta-cindel material a los cientficos y a los ingenieros. Se incluye un nuevo proyecto dondelos estudiantes incorporan la aleatoriedad adecuada a cada plan, y se utilizan tcnicasgrficas y valores P en el informe de los resultados. En el captulo 14 se ampla el mate-rialdel captulo 13 para ajustar dos o ms factores dentro de una estructura factorial. Lapresentacin del ANOVA en el captulo 14 incluye la creacin de modelos aleatorios yde efectos fijos. En el captulo 15 se estudia material relacionado con los diseos facto-riales2k; los ejemplos y los estudios de caso plantean el uso de diseos de seleccin yfracciones especiales de orden superior del factorial 2k. Dos elementos nuevos y espe-cialesson la metodologa de superficie de respuesta (MSR) y el diseo de parmetrosrobustos. Son temas que se relacionan en un estudio de caso que describe e ilustra undiseo doble de superficie de respuesta, as como un anlisis que incluye el uso de super-ficiesde respuesta de la media y la varianza de procesos.Programa de cmputoLos estudios de caso, que inician en el captulo 8, muestran impresiones de listas deresultados por computadora y material grfico generado con los programas SAS yMINITAB. El hecho de incluir los clculos por computadora refleja nuestra idea de quelos estudiantes deben contar con la experiencia de leer e interpretar impresiones de listasde resultados y grficas por computadora, incluso si el software que se utiliza en el librono coincide con el que utiliza el profesor. La exposicin a ms de un tipo de programasaumentara la experiencia de los estudiantes. No hay razones para creer que el progra-mautilizado en el curso coincidir con el que el estudiante tendr que utilizar en laprctica despus de graduarse. Cuando sea pertinente, los ejemplos y los estudios decaso en el libro se complementarn con diversos tipos de grficas residuales, cuantilares,de probabilidad normal y de otros tipos. Tales grficas se incluyen especialmente en loscaptulos 11 a 15.ComplementosManual de soluciones para el instructor. Este recurso contiene respuestas a todos losejercicios del libro y se puede descargar del Centro de Recursos para Profesor de Pearson.Diapositivas de PowerPoint ISBN-10: 0-321-73731-8; ISBN-13: 978-0-321-73731-1.Las diapositivas incluyen la mayora de las figuras y las tablas del libro; se pueden des-cargardel Centro de Recursos para el Profesor de Pearson. 18. xx PrefacioReconocimientosEstamos en deuda con los colegas que revisaron las anteriores ediciones de este libro yque nos dieron muchas sugerencias tiles para esta edicin. Ellos son David Groggel, deMiami University; Lance Hemlow, de Raritan Valley Community College; Ying Ji, deUniversity of Texas at San Antonio; Thomas Kline, de University of Northern Iowa;Sheila Lawrence, de Rutgers University; Luis Moreno, de Broome County CommunityCollege; Donald Waldman, de University of Colorado-Boulder y Marlene Will, de SpaldingUniversity. Tambin queremos agradecer a Delray Schulz, de Millersville University,Roxane Burrows, de Hocking College y Frank Chmely por asegurarse de la exactitud deeste libro.Nos gustara agradecer a la editorial y a los servicios de produccin suministradospor muchas personas de Pearson/Prentice Hall, sobre todo a Deirdre Lynch, la editora enjefe, a Christopher Cummings, el editor de adquisiciones, a Christine OBrien, la editorade contenido ejecutivo, a Tracy Patruno, la editora de produccin y a Sally Lifland, laeditora de produccin. Apreciamos los comentarios y sugerencias tiles de Gail Magin,la correctora de estilo. Tambin estamos en deuda con el Centro de Asesora Estadsticade Virginia Tech, que fue nuestra fuente de muchos conjuntos reales de datos.R.H.M.S.L.M.K.Y. 19. CAPTULO 1Introduccin a la estadsticay al anlisis de datos1.1 Panorama general: inferencia estadstica, muestras, poblaciones1y el papel de la probabilidadDesde inicios de la dcada de los ochenta del siglo pasado y hasta lo que ha transcurridodel siglo xxi la industria estadounidense ha puesto una enorme atencin en el mejora-mientode la calidad. Se ha dicho y escrito mucho acerca del milagro industrial enJapn, que comenz a mediados del siglo xx. Los japoneses lograron el xito en dondeotras naciones fallaron, a saber, en la creacin de un entorno que permita la manufacturade productos de alta calidad. Gran parte del xito de los japoneses se atribuye al uso demtodos estadsticos y del pensamiento estadstico entre el personal gerencial.Empleo de datos cientficosEl uso de mtodos estadsticos en la manufactura, el desarrollo de productos alimenti-cios,el software para computadoras, las fuentes de energa, los productos farmacuticosy muchas otras reas implican el acopio de informacin o datos cientficos. Por su-puestoque la obtencin de datos no es algo nuevo, ya que se ha realizado por ms de milaos. Los datos se han recabado, resumido, reportado y almacenado para su examencuidadoso. Sin embargo, hay una diferencia profunda entre el acopio de informacincientfica y la estadstica inferencial. Esta ltima ha recibido atencin legtima en dca-dasrecientes.La estadstica inferencial gener un nmero enorme de herramientas de los mto-dosestadsticos que utilizan los profesionales de la estadstica. Los mtodos estadsticosse disean para contribuir al proceso de realizar juicios cientficos frente a la incerti-dumbrey a la variacin. Dentro del proceso de manufactura, la densidad de producto deun material especfico no siempre ser la misma. De hecho, si un proceso es discontinuoen vez de continuo, la densidad de material no slo variar entre los lotes que salen de lalnea de produccin (variacin de un lote a otro), sino tambin dentro de los propios lo-tes.Los mtodos estadsticos se utilizan para analizar datos de procesos como el anterior;el objetivo de esto es tener una mejor orientacin respecto de cules cambios se debenrealizar en el proceso para mejorar su calidad. En este proceso la calidad bien podra 20. 2 Captulo 1 Introduccin a la estadstica y al anlisis de datosdefinirse en relacin con su grado de acercamiento a un valor de densidad meta en armo-nacon qu parte de las veces se cumple este criterio de cercana. A un ingeniero podrainteresarle un instrumento especfico que se utilice para medir el monxido de azufre enestudios sobre la contaminacin atmosfrica. Si el ingeniero dudara respecto de la efica-ciadel instrumento, tendra que tomar en cuenta dos fuentes de variacin. La primeraes la variacin en los valores del monxido de azufre que se encuentran en el mismolugar el mismo da. La segunda es la variacin entre los valores observados y la cantidadreal de monxido de azufre que haya en el aire en ese momento. Si cualquiera de estasdos fuentes de variacin es excesivamente grande (segn algn estndar determinadopor el ingeniero), quiz se necesite remplazar el instrumento. En un estudio biomdicode un nuevo frmaco que reduce la hipertensin, 85% de los pacientes experimentaronalivio; aunque por lo general se reconoce que el medicamento actual o el viejo aliviaa 80% de los pacientes que sufren hipertensin crnica. Sin embargo, el nuevo frmacoes ms caro de elaborar y podra tener algunos efectos colaterales. Se debera adoptarel nuevo medicamento? ste es un problema con el que las empresas farmacuticas,junto con la FDA (Federal Drug Administration), se encuentran a menudo (a veces esmucho ms complejo). De nuevo se debe tomar en cuenta las necesidades de variacin.El valor del 85% se basa en cierto nmero de pacientes seleccionados para el estudio.Tal vez si se repitiera el estudio con nuevos pacientes el nmero observado de xitossera de 75%! Se trata de una variacin natural de un estudio a otro que se debe tomar encuenta en el proceso de toma de decisiones. Es evidente que tal variacin es importante,ya que la variacin de un paciente a otro es endmica al problema.Variabilidad en los datos cientficosEn los problemas analizados anteriormente los mtodos estadsticos empleados tienenque ver con la variabilidad y en cada caso la variabilidad que se estudia se encuentraen datos cientficos. Si la densidad del producto observada en el proceso fuera siemprela misma y siempre fuera la esperada, no habra necesidad de mtodos estadsticos. Si eldispositivo para medir el monxido de azufre siempre diera el mismo valor y ste fueraexacto (es decir, correcto), no se requerira anlisis estadstico. Si entre un paciente yotro no hubiera variabilidad inherente a la respuesta al medicamento (es decir, si el fr-macosiempre causara alivio o nunca aliviara), la vida sera muy sencilla para los cient-ficosde las empresas farmacuticas y de la FDA, y los estadsticos no seran necesariosen el proceso de toma de decisiones. Los investigadores de la estadstica han originadoun gran nmero de mtodos analticos que permiten efectuar anlisis de datos obtenidosde sistemas como los descritos anteriormente, lo cual refleja la verdadera naturaleza dela ciencia que conocemos como estadstica inferencial, a saber, el uso de tcnicas que, alpermitirnos obtener conclusiones (o inferencias) sobre el sistema cientfico, nos permitenir ms all de slo reportar datos. Los profesionales de la estadstica usan leyes funda-mentalesde probabilidad e inferencia estadstica para sacar conclusiones respecto de lossistemas cientficos. La informacin se colecta en forma de muestras o conjuntos deobservaciones. En el captulo 2 se introduce el proceso de muestreo, el cual se continaanalizando a lo largo de todo el libro.Las muestras se renen a partir de poblaciones, que son conjuntos de todos los indivi-duoso elementos individuales de un tipo especfico. A veces una poblacin representa unsistema cientfico. Por ejemplo, un fabricante de tarjetas para computadora podra deseareliminar defectos. Un proceso de muestreo implicara recolectar informacin de 50 tarje-tasde computadora tomadas aleatoriamente durante el proceso. En este caso la poblacin 21. 1.1 Panorama general: inferencia estadstica, muestras, poblaciones y el papel de la probabilidad 3sera representada por todas las tarjetas de computadora producidas por la empresa en unperiodo especfico. Si se lograra mejorar el proceso de produccin de las tarjetas paracomputadora y se reuniera una segunda muestra de tarjetas, cualquier conclusin que seobtuviera respecto de la efectividad del cambio en el proceso debera extenderse a toda lapoblacin de tarjetas para computadora que se produzcan en el proceso mejorado. Enun experimento con frmacos se toma una muestra de pacientes y a cada uno se le admi-nistraun medicamento especfico para reducir la presin sangunea. El inters se enfocaen obtener conclusiones sobre la poblacin de quienes sufren hipertensin. A menudo,cuando la planeacin ocupa un lugar importante en la agenda, es muy importante el acopiode datos cientficos en forma sistemtica. En ocasiones la planeacin est, por necesidad,bastante limitada. Con frecuencia nos enfocamos en ciertas propiedades o caractersticasde los elementos u objetos de la poblacin. Cada caracterstica tiene importancia de inge-nieraespecfica o, digamos, biolgica para el cliente, el cientfico o el ingeniero quebusca aprender algo acerca de la poblacin. Por ejemplo, en uno de los casos anterioresla calidad del proceso se relacionaba con la densidad del producto al salir del proceso.Un(a) ingeniero(a) podra necesitar estudiar el efecto de las condiciones del proceso, latemperatura, la humedad, la cantidad de un ingrediente particular, etctera. Con ese finpodra mover de manera sistemtica estos factores a cualesquiera niveles que se sugie-ran,de acuerdo con cualquier prescripcin o diseo experimental que se desee. Sinembargo, un cientfico silvicultor que est interesado en estudiar los factores que influyenen la densidad de la madera en cierta clase de rbol no necesariamente tiene que disearun experimento. Este caso quiz requiera un estudio observacional, en el cual los datosse acopian en el campo pero no es posible seleccionar de antemano los niveles de losfactores. Ambos tipos de estudio se prestan a los mtodos de la inferencia estadstica. Enel primero, la calidad de las inferencias depender de la planeacin adecuada del experi-mento.En el segundo, el cientfico est a expensas de lo que pueda recopilar. Por ejemplo,si un agrnomo se interesara en estudiar el efecto de la lluvia sobre la produccin deplantas sera lamentable que recopilara los datos durante una sequa.Es bien conocida la importancia del pensamiento estadstico para los administrado-resy el uso de la inferencia estadstica para el personal cientfico. Los investigadoresobtienen mucho de los datos cientficos. Los datos proveen conocimiento acerca del fe-nmenocientfico. Los ingenieros de producto y de procesos aprenden ms en sus es-fuerzosfuera de lnea para mejorar el proceso. Tambin logran una comprensin valiosaal reunir datos de produccin (supervisin en lnea) sobre una base regular, lo cual lespermite determinar las modificaciones que se requiere realizar para mantener el procesoen el nivel de calidad deseado.En ocasiones un cientfico slo desea obtener alguna clase de resumen de un con-juntode datos representados en la muestra. En otras palabras, no requiere estadsticainferencial. En cambio, le sera til un conjunto de estadsticos o la estadstica descrip-tiva.Tales nmeros ofrecen un sentido de la ubicacin del centro de los datos, de la va-riabilidaden los datos y de la naturaleza general de la distribucin de observaciones enla muestra. Aunque no se incorporen mtodos estadsticos especficos que lleven a lainferencia estadstica, se puede aprender mucho. A veces la estadstica descriptiva vaacompaada de grficas. El software estadstico moderno permite el clculo de medias,medianas, desviaciones estndar y otros estadsticos de una sola cifra, as como eldesarrollo de grficas que presenten una huella digital de la naturaleza de la muestra.En las secciones siguientes veremos definiciones e ilustraciones de los estadsticos ydescripciones de recursos grficos como histogramas, diagramas de tallo y hojas, diagra-masde dispersin, grficas de puntos y diagramas de caja. 22. 4 Captulo 1 Introduccin a la estadstica y al anlisis de datosEl papel de la probabilidadEn los captulos 2 a 6 de este libro se presentan los conceptos fundamentales de la pro-babilidad.Un estudio concienzudo de las bases de tales conceptos permitir al lectorcomprender mejor la inferencia estadstica. Sin algo de formalismo en teora de proba-bilidad,el estudiante no podra apreciar la verdadera interpretacin del anlisis de datosa travs de los mtodos estadsticos modernos. Es muy natural estudiar probabilidadantes de estudiar inferencia estadstica. Los elementos de probabilidad nos permitencuantificar la fortaleza o confianza en nuestras conclusiones. En este sentido, los con-ceptosde probabilidad forman un componente significativo que complementa los m-todosestadsticos y ayuda a evaluar la consistencia de la inferencia estadstica. Porconsiguiente, la disciplina de la probabilidad brinda la transicin entre la estadsticadescriptiva y los mtodos inferenciales. Los elementos de la probabilidad permiten ex-presarla conclusin en el lenguaje que requieren los cientficos y los ingenieros. Elejemplo que sigue permite al lector comprender la nocin de un valor-P, el cual a menudoproporciona el fundamento en la interpretacin de los resultados a partir del uso demtodos estadsticos.Ejemplo 1.1: Suponga que un ingeniero se encuentra con datos de un proceso de produccin en el cualse muestrean 100 artculos y se obtienen 10 defectuosos. Se espera y se anticipa queocasionalmente habr artculos defectuosos. Obviamente estos 100 artculos representanla muestra. Sin embargo, se determina que, a largo plazo, la empresa slo puede tolerar5% de artculos defectuosos en el proceso. Ahora bien, los elementos de probabilidadpermiten al ingeniero determinar qu tan concluyente es la informacin muestral respec-tode la naturaleza del proceso. En este caso la poblacin representa conceptualmentetodos los artculos posibles en el proceso. Suponga que averiguamos que, si el procesoes aceptable, es decir, que su produccin no excede un 5% de artculos defectuosos, hayuna probabilidad de 0.0282 de obtener 10 o ms artculos defectuosos en una muestraaleatoria de 100 artculos del proceso. Esta pequea probabilidad sugiere que, en reali-dad,a largo plazo el proceso tiene un porcentaje de artculos defectuosos mayor al 5%.En otras palabras, en las condiciones de un proceso aceptable casi nunca se obtendra lainformacin muestral que se obtuvo. Sin embargo, se obtuvo! Por lo tanto, es evidenteque la probabilidad de que se obtuviera sera mucho mayor si la tasa de artculos defec-tuososdel proceso fuera mucho mayor que 5%.A partir de este ejemplo se vuelve evidente que los elementos de probabilidad ayu-dana traducir la informacin muestral en algo concluyente o no concluyente acerca delsistema cientfico. De hecho, lo aprendido probablemente constituya informacin in-quietantepara el ingeniero o administrador. Los mtodos estadsticos (que examinare-moscon ms detalle en el captulo 10) produjeron un valor-P de 0.0282. El resultadosugiere que es muy probable que el proceso no sea aceptable. En los captulos si-guientesse trata detenidamente el concepto de valor-P. El prximo ejemplo brinda unasegunda ilustracin.Ejemplo 1.2: Con frecuencia, la naturaleza del estudio cientfico sealar el papel que desempean laprobabilidad y el razonamiento deductivo en la inferencia estadstica. El ejercicio 9.40en la pgina 294 proporciona datos asociados con un estudio que se llev a cabo en elVirginia Polytechnic Institute and State University acerca del desarrollo de una relacinentre las races de los rboles y la accin de un hongo. Los minerales de los hongos setransfieren a los rboles, y los azcares de los rboles a los hongos. Se plantaron dosmuestras de 10 plantones de roble rojo norteo en un invernadero, una de ellas contena 23. 1.1 Panorama general: inferencia estadstica, muestras, poblaciones y el papel de la probabilidad 5plantones tratados con nitrgeno y la otra plantones sin tratamiento. Todas las demscondiciones ambientales se mantuvieron constantes. Todos los plantones contenan elhongo Pisolithus tinctorus. En el captulo 9 se incluyen ms detalles. Los pesos engramos de los tallos se registraron despus de 140 das y los datos se presentan en latabla 1.1.Tabla 1.1: Conjunto de datos del ejemplo 1.2Sin nitrgenoCon nitrgeno0.32 0.260.53 0.430.28 0.470.37 0.490.47 0.520.43 0.750.36 0.790.42 0.860.38 0.620.43 0.460.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90Figura 1.1: Grfica de puntos de los datos de peso del tallo.En este ejemplo hay dos muestras tomadas de dos poblaciones distintas. El objeti-vodel experimento es determinar si el uso del nitrgeno influye en el crecimiento de lasraces. ste es un estudio comparativo (es decir, es un estudio en el que se busca compararlas dos poblaciones en cuanto a ciertas caractersticas importantes). Los datos se debengraficar como se indica en el diagrama de puntos de la figura 1.1. Los valores represen-tanlos datos con nitrgeno y los valores los datos sin nitrgeno.Observe que la apariencia general de los datos podra sugerir al lector que, en pro-medio,el uso del nitrgeno aumenta el peso del tallo. Cuatro observaciones con nitrge-noson considerablemente ms grandes que cualquiera de las observaciones sin nitrgeno.La mayora de las observaciones sin nitrgeno parece estar por debajo del centro de losdatos. La apariencia del conjunto de datos parece indicar que el nitrgeno es efectivo.Pero, cmo se cuantifica esto? Cmo se puede resumir toda la evidencia visual aparentede manera que tenga algn significado? Como en el ejemplo anterior, se pueden utilizarlos fundamentos de la probabilidad. Las conclusiones se resumen en una declaracinde probabilidad o valor-P. Aqu no demostraremos la inferencia estadstica que producela probabilidad resumida. Igual que en el ejemplo 1.1, tales mtodos se estudiarn en elcaptulo 10. El problema gira alrededor de la probabilidad de que datos como stos sepuedan observar, dado que el nitrgeno no tiene efecto; en otras palabras, dado queambas muestras se generaron a partir de la misma poblacin. Suponga que esta probabi-lidades pequea, digamos de 0.03; un porcentaje que podra constituir suficiente eviden-ciade que el uso del nitrgeno en realidad influye en el peso promedio del tallo en losplantones de roble rojo (aparentemente lo aumenta). 24. 6 Captulo 1 Introduccin a la estadstica y al anlisis de datosCmo trabajan juntas la probabilidad y la inferencia estadstica?Es importante para el lector que comprenda claramente la diferencia entre la disciplinade la probabilidad, una ciencia por derecho propio, y la disciplina de la estadstica infe-rencial.Como sealamos, el uso o la aplicacin de conceptos de probabilidad permiteinterpretar la vida cotidiana a partir de los resultados de la inferencia estadstica. Enconsecuencia, se afirma que la inferencia estadstica emplea los conceptos de probabili-dad.A partir de los dos ejemplos anteriores aprendimos que la informacin muestral estdisponible para el analista y que, con la ayuda de mtodos estadsticos y elementos deprobabilidad, podemos obtener conclusiones acerca de alguna caracterstica de la pobla-cin(en el ejemplo 1.1 el proceso al parecer no es aceptable, y en el ejemplo 1.2 pareceser que el nitrgeno en verdad influye en el peso promedio de los tallos). As, para unproblema estadstico, la muestra, junto con la estadstica inferencial, nos permiteobtener conclusiones acerca de la poblacin, ya que la estadstica inferencial utilizaampliamente los elementos de probabilidad. Tal razonamiento es inductivo por natu-raleza.Ahora, cuando avancemos al captulo 2 y los siguientes, el lector encontrar que,a diferencia de lo que hicimos en nuestros dos ejemplos actuales, no nos enfocaremos enresolver problemas estadsticos. En muchos de los ejemplos que estudiaremos no utili-zaremosmuestras. Lo que haremos ser describir claramente una poblacin con todassus caractersticas conocidas. Las preguntas importantes se enfocarn en la naturaleza delos datos que hipotticamente se podran obtener a partir de la poblacin. Entonces, po-dramosafirmar que los elementos de probabilidad nos permiten sacar conclusionesacerca de las caractersticas de los datos hipotticos que se tomen de la poblacin,con base en las caractersticas conocidas de la poblacin. Esta clase de razonamientoes deductivo por naturaleza. La figura 1.2 muestra la relacin bsica entre la probabilidady la estadstica inferencial.ProbabilidadPoblacin MuestraInferencia estadsticaFigura 1.2: Relacin bsica entre la probabilidad y la estadstica inferencial.Ahora bien, en trminos generales, cul campo es ms importante, el de la proba-bilidado el de la estadstica? Ambos son muy importantes y evidentemente se comple-mentan.La nica certeza respecto de la didctica de ambas disciplinas radica en el hechode que, si la estadstica se debe ensear con un nivel mayor al de un simple libro decocina, entonces hay que comenzar por ensear la disciplina de la probabilidad. Estaregla se basa en el hecho de que un analista no podr aprender nada sobre una poblacina partir de una muestra hasta que aprenda los rudimentos de incertidumbre en esa muestra.Considere el ejemplo 1.1; en el que la pregunta se centra en si la poblacin, definidapor el proceso, tiene o no ms de 5% de elementos defectuosos. En otras palabras, lasuposicin es que 5 de cada 100 artculos, en promedio, salen defectuosos. Ahora bien,la muestra contiene 100 artculos y 10 estn defectuosos. Esto apoya o refuta la supo- 25. 1.2 Procedimientos de muestreo; recoleccin de los datos 7sicin? Aparentemente la refuta porque 10 artculos de cada 100 parecen ser un trozogrande. Pero cmo podramos saber esto sin tener nociones de probabilidad? La nicamanera en que podremos aprender las condiciones en las cuales el proceso es aceptable(5% de defectuosos) es estudiando el material de los siguientes captulos. La probabilidadde obtener 10 o ms artculos defectuosos en una muestra de 100 es de 0.0282.Dimos dos ejemplos en donde los elementos de probabilidad ofrecen un resumenque el cientfico o el ingeniero pueden usar como evidencia para basar una decisin. Elpuente entre los datos y la conclusin est, por supuesto, basado en los fundamentos dela inferencia estadstica, la teora de la distribucin y las distribuciones de muestreos quese examinarn en captulos posteriores.1.2 Procedimientos de muestreo; recoleccin de los datosEn la seccin 1.1 estudiamos muy brevemente el concepto de muestreo y el proceso demuestreo. Aunque el muestreo parece ser un concepto simple, la complejidad de laspreguntas que se deben contestar acerca de la poblacin, o las poblaciones, en ocasionesrequiere que el proceso de muestreo sea muy complejo. El concepto de muestreo seexaminar de manera tcnica en el captulo 8, pero aqu nos esforzaremos por dar algu-nasnociones de sentido comn sobre el muestreo. sta es una transicin natural hacia elanlisis del concepto de variabilidad.Muestreo aleatorio simpleLa importancia del muestreo adecuado gira en torno al grado de confianza con que elanalista es capaz de responder las preguntas que se plantean. Supongamos que slo hayuna poblacin en el problema. Recuerde que en el ejemplo 1.2 haba dos poblacionesimplicadas. El muestreo aleatorio simple significa que cierta muestra dada de un tamaomuestral especfico tiene la misma probabilidad de ser seleccionada que cualquieraotra muestra del mismo tamao. El trmino tamao muestral simplemente indica elnmero de elementos en la muestra. Evidentemente, en muchos casos se puede utilizaruna tabla de nmeros aleatorios para seleccionar la muestra. La ventaja del muestreoaleatorio simple radica en que ayuda a eliminar el problema de tener una muestra querefleje una poblacin diferente (quiz ms restringida) de aquella sobre la cual se nece-sitanrealizar las inferencias. Por ejemplo, se elige una muestra para contestar diferentespreguntas respecto de las preferencias polticas en cierta entidad de Estados Unidos. Lamuestra implica la eleccin de, digamos, 1 000 familias y una encuesta a aplicar. Ahorabien, suponga que no se utiliza el muestreo aleatorio, sino que todas o casi todas las1 000 familias se eligen de una zona urbana. Se considera que las preferencias polticas enlas reas rurales difieren de las de las reas urbanas. En otras palabras, la muestra obte-nidaen realidad confin a la poblacin y, por lo tanto, las inferencias tambin se tendrnque restringir a la poblacin confinada, y en este caso el confinamiento podra resultarindeseable. Si, de hecho, se necesitara hacer las inferencias respecto de la entidad comoun todo, a menudo se dira que la muestra con un tamao de 1 000 familias aqu descritaes una muestra sesgada.Como antes sugerimos, el muestreo aleatorio simple no siempre es adecuado. Elenfoque alternativo que se utilice depender de la complejidad del problema. Con frecuen-cia,por ejemplo, las unidades muestrales no son homogneas y se dividen naturalmenteen grupos que no se traslapan y que son homogneos. Tales grupos se llaman estratos, y 26. 8 Captulo 1 Introduccin a la estadstica y al anlisis de datosun procedimiento llamado muestreo aleatorio estratificado implica la seleccin al azarde una muestra dentro de cada estrato. El propsito de esto es asegurarse de que ningu-node los estratos est sobrerrepresentado ni subrepresentado. Por ejemplo, suponga quese aplica una encuesta a una muestra para reunir opiniones preliminares respecto de unreferndum que se piensa realizar en determinada ciudad. La ciudad est subdividida envarios grupos tnicos que representan estratos naturales y, para no excluir ni sobrerrepre-sentara algn grupo de cada uno de ellos, se eligen muestras aleatorias separadas decada grupo.Diseo experimentalEl concepto de aleatoriedad o asignacin aleatoria desempea un papel muy importanteen el rea del diseo experimental, que se present brevemente en la seccin 1.1 y esun fundamento muy importante en casi cualquier rea de la ingeniera y de la cienciaexperimental. Estudiaremos este tema con detenimiento en los captulos 13 a 15. Sinembargo, es conveniente introducirlo aqu brevemente en el contexto del muestreo alea-torio.Un conjunto de los llamados tratamientos o combinaciones de tratamientos sevuelven las poblaciones que se van a estudiar o a comparar en algn sentido. Un ejem-ploes el tratamiento con nitrgeno versus sin nitrgeno del ejemplo 1.2. Otro ejemplosencillo sera placebo versus medicamento activo o, en un estudio sobre la fatiga porcorrosin, tendramos combinaciones de tratamientos que impliquen especmenes conrecubrimiento o sin recubrimiento, as como condiciones de alta o de baja humedad, alas cuales se somete el espcimen. De hecho, habran cuatro combinaciones de factoreso de tratamientos (es decir, 4 poblaciones), y se podran formular y responder muchaspreguntas cientficas usando los mtodos estadsticos e inferenciales. Considere primerola situacin del ejemplo 1.2. En el experimento hay 20 plantones enfermos implicados.A partir de los datos es fcil observar que los plantones son diferentes entre s. Dentrodel grupo tratado con nitrgeno (o del grupo que no se trat con nitrgeno) hay variabi-lidadconsiderable en el peso de los tallos, la cual se debe a lo que por lo general se de-nominaunidad experimental. ste es un concepto tan importante en la estadstica infe-rencialque no es posible describirlo totalmente en este captulo. La naturaleza de lavariabilidad es muy importante. Si es demasiado grande, debido a que resulta de unacondicin de excesiva falta de homogeneidad en las unidades experimentales, la variabi-lidadeliminar cualquier diferencia detectable entre ambas poblaciones. Recuerdeque en este caso eso no ocurri.La grfica de puntos de la figura 1.1 y el valor-P indican una clara distincin entreesas dos condiciones. Qu papel desempean tales unidades experimentales en el pro-cesomismo de recoleccin de los datos? El enfoque por sentido comn y, de hecho, es-tndar,es asignar los 20 plantones o unidades experimentales aleatoriamente a las doscondiciones o tratamientos. En el estudio del medicamento podramos decidir utilizarun total de 200 pacientes disponibles, quienes sern claramente distinguibles en algnsentido. Ellos son las unidades experimentales. No obstante, tal vez todos tengan unacondicin crnica que podra ser tratada con el frmaco. As, en el denominado diseocompletamente aleatorio, se asignan al azar 100 pacientes al placebo y 100 al medica-mentoactivo. De nuevo, son estas unidades experimentales en el grupo o tratamiento lasque producen la variabilidad en el resultado de los datos (es decir, la variabilidad en elresultado medido), digamos, de la presin sangunea o cualquier valor de la eficacia deun medicamento que sea importante. En el estudio de la fatiga por corrosin las unidadesexperimentales son los especmenes que se someten a la corrosin. 27. 1.2 Procedimientos de muestreo; recoleccin de los datos 9Por qu las unidades experimentales se asignan aleatoriamente?Cul es el posible efecto negativo de no asignar aleatoriamente las unidades experi-mentalesa los tratamientos o a las combinaciones de tratamientos? Esto se observa msclaramente en el caso del estudio del medicamento. Entre las caractersticas de los pa-cientesque producen variabilidad en los resultados estn la edad, el gnero y el peso.Tan slo suponga que por casualidad el grupo del placebo contiene una muestra depersonas que son predominantemente ms obesas que las del grupo del tratamiento.Quiz los individuos ms obesos muestren una tendencia a tener una presin sanguneams elevada, lo cual evidentemente sesgar el resultado y, por lo tanto, cualquier resul-tadoque se obtenga al aplicar la inferencia estadstica podra tener poco que ver con elefecto del medicamento, pero mucho con las diferencias en el peso de ambas muestrasde pacientes.Deberamos enfatizar la importancia del trmino variabilidad. La variabilidad ex-cesivaentre las unidades experimentales disfraza los hallazgos cientficos. En seccio-nesposteriores intentaremos clasificar y cuantificar las medidas de variabilidad. En lassiguientes secciones presentaremos y analizaremos cantidades especficas que se calcu-lanen las muestras; las cantidades proporcionan una idea de la naturaleza de la muestrarespecto de la ubicacin del centro de los datos y la variabilidad de los mismos. Un an-lisisde varias de tales medidas de un solo nmero permite ofrecer un prembulo de quela informacin estadstica ser un componente importante de los mtodos estadsticosque se utilizarn en captulos posteriores. Estas medidas, que ayudan a clasificar la natu-ralezadel conjunto de datos, caen en la categora de estadsticas descriptivas. Estematerial es una introduccin a una presentacin breve de los mtodos pictricos y gr-ficosque van incluso ms all en la caracterizacin del conjunto de datos. El lector de-beraentender que los mtodos estadsticos que se presentan aqu se utilizarn a lo largode todo el texto. Para ofrecer una imagen ms clara de lo que implican los estudios dediseo experimental se presenta el ejemplo 1.3.Ejemplo 1.3: Se realiz un estudio sobre la corrosin con la finalidad de determinar si al recubrir unaaleacin de aluminio con una sustancia retardadora de la corrosin, el metal se corroemenos. El recubrimiento es un protector que los anunciantes afirman que minimiza eldao por fatiga en esta clase de material. La influencia de la humedad sobre la magnitudde la corrosin tambin es de inters. Una medicin de la corrosin puede expresarse enmillares de ciclos hasta la ruptura del metal. Se utilizaron dos niveles de recubrimiento:sin recubrimiento y con recubrimiento qumico contra la corrosin. Tambin se conside-rarondos niveles de humedad relativa, de 20% y 80%, respectivamente.El experimento implica las cuatro combinaciones de tratamientos que se listan en lasiguiente tabla. Se usan ocho unidades experimentales, que son especmenes de alumi-niopreparados, dos de los cuales se asignan aleatoriamente a cada una de las cuatrocombinaciones de tratamiento. Los datos se presentan en la tabla 1.2.Los datos de la corrosin son promedios de los dos especmenes. En la figura 1.3 sepresenta una grfica con los promedios. Un valor relativamente grande de ciclos hasta laruptura representa una cantidad pequea de corrosin. Como se podra esperar, al parecerun incremento en la humedad hace que empeore la corrosin. El uso del procedimientode recubrimiento qumico contra la corrosin parece reducir la corrosin.En este ejemplo de diseo experimental el ingeniero eligi sistemticamente lascuatro combinaciones de tratamiento. Para vincular esta situacin con los conceptos conlos que el lector se ha familiarizado hasta aqu, deberamos suponer que las condiciones 28. 10 Captulo 1 Introduccin a la estadstica y al anlisis de datosTabla 1.2: Datos para el ejemplo 1.3Humedad20001000Con recubrimiento qumicocontra la corrosinque representan las cuatro combinaciones de tratamientos son cuatro poblaciones sepa-radasy que los dos valores de corrosin observados en cada una de las poblacionesconstituyen importantes piezas de informacin. La importancia del promedio al captar yresumir ciertas caractersticas en la poblacin se destacar en la seccin 1.3. Aunque apartir de la figura podramos sacar conclusiones acerca del papel que desempea la hu-medady del efecto de recubrir los especmenes, no podemos evaluar con exactitud losresultados de un punto de vista analtico sin tomar en cuenta la variabilidad alrededordel promedio. De nuevo, como sealamos con anterioridad, si los dos valores de corro-sinen cada una de las combinaciones de tratamientos son muy cercanos, la imagende la figura 1.3 podra ser una descripcin precisa. Pero si cada valor de la corrosin enla figura es un promedio de dos valores que estn ampliamente dispersos, entonces estavariabilidad podra, de hecho, en verdad eliminar cualquier informacin que parezcadifundirse cuando tan slo se observan los promedios. Los siguientes ejemplos ilustranestos conceptos:1. La asignacin aleatoria a las combinaciones de tratamientos (recubrimiento/humedad) de las unidades experimentales (especmenes).2. El uso de promedios muestrales (valores de corrosin promedio) para resumirla informacin muestral.3. La necesidad de considerar las medidas de variabilidad en el anlisis de cual-quiermuestra o conjunto de muestras.Promedio de corrosinRecubrimiento en miles de ciclos hasta la rupturaSin recubrimiento 20% 97580% 350Con recubrimientoqumico contra la corrosin20% 175080% 1550020% 80%HumedadCorrosin promedioSin recubrimientoFigura 1.3: Resultados de corrosin para el ejemplo 1.3. 29. 1.3 Medidas de localizacin: la media y la mediana de una muestra 11Este ejemplo sugiere la necesidad de estudiar el tema que se expone en las seccio-nes1.3 y 1.4, es decir, el de las estadsticas descriptivas que indican las medidas de laubicacin del centro en un conjunto de datos, y aquellas con las que se mide la variabilidad.1.3 Medidas de localizacin: la media y la mediana de una muestraLas medidas de localizacin estn diseadas para brindar al analista algunos valorescuantitativos de la ubicacin central o de otro tipo de los datos en una muestra. En el ejem-plo1.2 parece que el centro de la muestra con nitrgeno claramente excede al de lamuestra sin nitrgeno. Una medida obvia y muy til es la media de la muestra. La me-diaes simplemente un promedio numrico.Definicin 1.1: Suponga que las observaciones en una muestra son x1, x2, ..., xn. La media de la mues-tra,que se denota con x , esx =n=i 1xin=x 1 +x 2 + +x nn.Hay otras medidas de tendencia central que se explican con detalle en captulosposteriores. Una medida importante es la mediana de la muestra. El propsito de lamediana de la muestra es reflejar la tendencia central de la muestra de manera que no seainfluida por los valores extremos.Definicin 1.2: Dado que las observaciones en una muestra son x1, x2, ..., xn, acomodadas en orden demagnitud creciente, la mediana de la muestra esx =x(n+1)/2, si n es impar,12(xn/2+xn/2+1), si n es par.Por ejemplo, suponga que el conjunto de datos es el siguiente: 1.7, 2.2, 3.9, 3.11 y14.7. La media y la mediana de la muestra son, respectivamente,x = 5.12, x = 3.9.Es evidente que la media es influida de manera considerable por la presencia de laobservacin extrema, 14.7; en tanto que el lugar de la mediana hace nfasis en el verda-derocentro del conjunto de datos. En el caso del conjunto de datos de dos muestras delejemplo 1.2, las dos medidas de tendencia central para las muestras individuales sonx (sin nitrgeno) = 0.399 gramos,0.38+ 0.42x (sin nitrgeno) =2= 0.400 gramos,x (con nitrgeno) = 0.565 gramos,0.49 0.52x (con nitrgeno) =2= 0.505 gramos.+Es evidente que hay una diferencia conceptual entre la media y la mediana. Para ellector con ciertas nociones de ingeniera quiz sea de inters que la m