99
Darrell Huff Cómo mentir con estadísticas 1 Darrell Huff CÓMO MENTIR CON ESTADÍSTICAS Traducción de Denes Martos Edición Original: 1954 Segunda Edición Electrónica: 2014 lanuevaeditorialvirtual.blogspot.com

Como Mentir Con Estadisticas

Embed Size (px)

DESCRIPTION

Las estadísticas se relacionan con un amplio conocimiento ofrecidos por los métodos cualitativos y cuantitativos de una investigación, pero muchas veces es se convierte en un instrumento para el engaño y la depravación causadas al querer mantener una mentira... gran mentira.

Citation preview

  • Darrell Huff Cmo mentir con estadsticas

    1

    Darrell Huff

    CMO MENTIR CON

    ESTADSTICAS

    Traduccin de Denes Martos

    Edicin Original: 1954

    Segunda Edicin Electrnica: 2014

    lanuevaeditorialvirtual.blogspot.com

  • Darrell Huff Cmo mentir con estadsticas

    2

    INDICE

    PREFACIO ..................................................................................................................................................... 3 INTRODUCCIN ............................................................................................................................................. 4 1. LA MUESTRA CON EL SESGO INCORPORADO ....................................................................................................... 6 2. EL PROMEDIO BIEN ELEGIDO........................................................................................................................ 18 3. LAS PEQUEAS CIFRAS QUE FALTAN .............................................................................................................. 26 4. MUCHO RUIDO Y PRCTICAMENTE POCAS NUECES ............................................................................................ 36 5. EL GRFICO FANTSTICO ............................................................................................................................ 41 6. GRFICOS CON PERSONAJES ........................................................................................................................ 46 7. EL NMERO SEMI RELACIONADO .................................................................................................................. 53 8. EL REGRESO DEL "POST HOC" ...................................................................................................................... 63 9. COMO ESTADISTICULAR ............................................................................................................................. 72 10. CMO RESPONDER A LAS ESTADSTICAS ....................................................................................................... 85

  • Darrell Huff Cmo mentir con estadsticas

    3

    Prefacio

    Darrell Huff (1913-2001) naci en Gowrie (Iowa) y se educ en la universidad de ese estado. Fue el editor de dos revistas antes de dedicarse por completo a escribir como autor independiente una cantidad numerosa de artculos sobre el tema de "Cmo hacer . . . " (o "How to" en ingls) adems de 16 libros sobre diversas cuestiones.

    Su obra ms conocida es la que presentamos a continuacin. How to Lie with Statistics Cmo Mentir con Estadsticas se ha convertido a lo largo del tiempo en un verdadero clsico para

    quienes desean desentraar los vericuetos y los trucos empleados por quienes pretenden describir la realidad mediante el mtodo estadstico no siempre con intenciones enteramente confesables.

    Publicado en 1954, la obra no ha perdido actualidad al da de hoy y sigue siendo utilizada como texto bsico en muchas aulas. Sin pecar de superficial, Huff no se interna en el complejo formuleo matemtico concentrndose en darle al lector una visin clara, prctica y concisa acerca de la forma de entender y dado el caso desenmascarar las estadsticas que usualmente se pueden encontrar en diarios, revistas y hasta en algunas publicaciones profesionales.

    En la traduccin hemos prestado especial atencin a mantener el tono coloquial, no exento de un formidable sentido del humor, con el cual el autor ha hecho por dems llevadera una materia que, de otro modo, sufrira de la aridez que tienen todos los trabajos relacionados con las matemticas.

  • Darrell Huff Cmo mentir con estadsticas

    4

    Las notas incluidas en el texto, salvo indicacin en contrario, son del traductor. Las ilustraciones estn adaptadas del original de 1954 y pertenecen a Irving Geis.

    Introduccin

    "Hay una gran cantidad de crmenes por aqu", dijo mi suegro poco despus de haberse mudado de Iowa a California. Y as era en el diario que lea. Ese diario es uno de sos que no pasa por alto ningn crimen en su propia rea y tiene fama de prestar ms atencin a un asesinato en Iowa que el mismo diario principal de esa localidad.

    La conclusin de mi suegro fue estadstica, aunque de un modo informal. Estaba basada en una muestra y, si vamos al caso, en una muestra notoriamente distorsionada. Como muchas de las estadsticas ms sofisticadas, era tendenciosa: presupona que el espacio dado por el diario a la informacin sobre los crmenes cometidos es una medida de la tasa de criminalidad.

    Hace un par de inviernos una docena de investigadores informaron independientemente cifras sobre pldoras antihistamnicas. Cada una de de esas investigaciones mostraba que un porcentaje considerable de los resfros ceda despus del tratamiento. Se produjo un gran alboroto, al menos en los anuncios comerciales, y la campaa de productos mdicos tuvo su auge. Esa campaa estuvo basada sobre la eterna esperanza y tambin sobre una curiosa negativa a mirar ms all de las estadsticas y ver un hecho que se conoce desde hace mucho tiempo. Tal como Henry G. Felsen un humorista y para nada una autoridad en medicina seal ya hace bastante tiempo, con tratamiento un resfro dura siete das; sin tratamiento dura una semana.

    Lo mismo sucede con muchas cosas que usted lee y oye. Los promedios, las relaciones, las tendencias y los grficos no siempre son lo que parecen. Pueden contener ms de lo que se ve, y tambin pueden contener bastante menos.

  • Darrell Huff Cmo mentir con estadsticas

    5

    El lenguaje secreto de las estadsticas, tan atrayente en una cultura orientada a los hechos, se emplea para el sensacionalismo, para exagerar, confundir y sobre-simplificar. Los mtodos y los trminos estadsticos son necesarios en los informes que tratan el cmulo de datos que hacen a las tendencias sociales y econmicas, a las condiciones comerciales, a las encuestas de "opinin" y a los censos. Pero en ausencia de redactores que empleen las palabras con honestidad y entendimiento, y careciendo de lectores que sepan lo que significan, el resultado solo puede ser un sinsentido semntico.

    En la literatura popular sobre cuestiones cientficas el abuso estadstico resalta la figura del hroe de guardapolvo blanco trabajando horas-extras por falta de tiempo en un mal iluminado laboratorio. Al igual que "un toque de maquillaje y un poco de carmn" las estadsticas hacen que un hecho importante "parezca ser lo que ella no es" gracias al maquillaje. Una estadstica bien empaquetada es hasta mejor que la "gran mentira" del dictador: engaa, pero nadie lo puede acusar de engao.

    Este libro es una especie de gua sobre cmo usar estadsticas para engaar. Puede ser que se parezca demasiado a un manual para estafadores. Quizs pueda justificarlo en la forma en que lo hizo el ladrn retirado cuyas memorias publicadas terminaron siendo un curso avanzado sobre como violentar una cerradura y amortiguar el ruido de una pisada: los ladrones ya conocen esos trucos; las personas honestas tienen que aprenderlos en defensa propia.

  • Darrell Huff Cmo mentir con estadsticas

    6

    1. La muestra con el sesgo incorporado

    La revista Time public en cierta oportunidad que "el egresado promedio de Yale, de la promocin 1924, gana $25.111 por ao". 1

    Bueno, felicitaciones!

    Pero esperen un minuto. Qu significa esta cifra tan impresionante? Tal como est, parecera ser la prueba de que, si usted enva a su hijo a estudiar a Yale, no tendr que trabajar cuando sea viejo, y su hijo tampoco.

    Ya a primera vista hay dos cosas sospechosas en cuanto a la cifra. Por de pronto es sorprendentemente precisa. Y es muy improbable que est limpia.

    Es muy poco probable que el ingreso promedio de cualquier grupo numeroso pueda ser jams conocido con una precisin exacta. Incluso no es muy probable que usted mismo conozca su propio ingreso del ao pasado de una manera tan exacta, a menos que todo ese ingreso haya provenido de un salario fijo. Por otra parte, ingresos del orden de los $25.000 no suelen representar solamente salarios; es muy probable que las personas de ese nivel tengan tambin inversiones bien diversificadas.

    Ms all de eso, este hermoso promedio est sin duda alguna calculado sobre la base de los montos que los egresados de Yale dijeron haber ganado. Incluso si en New Haven se empleaba ya el sistema del honor en 1924, no podemos estar seguros de que este sistema siga funcionando tan bien despus de un cuarto de siglo y que todos estos informes sean honestos. Algunas personas, cuando se les pregunta acerca de sus ingresos, exageran por vanidad o por optimismo. Otros minimizan, especialmente si los ingresos son

    1 Seran equivalentes a unos $ $327.563 de 2012 aproximadamente. (Cf. http://www.dollartimes.com/calculators/inflation.htm Consultado el 2/9/2012) (N. del T.)

  • Darrell Huff Cmo mentir con estadsticas

    7

    imponibles, y habiendo mentido una vez prefieren no contradecirse. Quin sabe qu es lo que puede llegar a ver la autoridad impositiva? Es posible que estas dos tendencias la de presumir y la de minimizar se cancelen mutuamente, pero es improbable. Una de las tendencias puede ser mucho ms fuerte que la otra y no sabemos cul de las dos podra ser.

    Estamos empezando a explicarnos una cifra de la que ya el sentido comn nos dice que difcilmente sea cierta. Pues bien, pongamos ahora el dedo sobre la probable fuente del mayor error; una fuente que puede producir la cifra de $ 25.111 como el "ingreso promedio" de personas cuyo promedio real podra muy bien estar ms cerca de la mitad de ese nmero.

    Esta fuente es el mtodo del muestreo que constituye la columna vertebral de la gran mayora de las estadsticas que usted puede encontrar sobre toda una serie de temas. Su principio es muy simple, aun cuando en la prctica sus refinamientos han conducido a toda clase de caminos laterales, algunos de ellos muy poco respetables. Si tenemos un barril lleno de bolitas, algunas rojas y otras blancas, hay un solo mtodo para saber exactamente cuntas de cada color tenemos: contndolas. Sin embargo, podemos averiguar aproximadamente cuantas rojas hay de un modo mucho ms simple: sacando un puado de bolitas, contando cuntas hay solamente en ese puado y presuponiendo, adems, que la proporcin ser la misma en todo el barril. Si la muestra es lo suficientemente grande y ha sido seleccionada adecuadamente, representar a la totalidad de un modo bastante satisfactorio para la mayora de los propsitos. Pero, si no lo es, puede llegar a ser por lejos menos confiable que una estimacin inteligente y no se justificar ms que con un espurio aire de precisin cientfica. Desgraciadamente la verdad es que, detrs de gran parte de lo que leemos o creemos saber, no hay sino conclusiones sacadas de muestras que estn sesgadas, o son demasiado pequeas, o ambas cosas a la vez.

    El informe sobre los egresados de Yale est basado sobre una muestra. Podemos estar bastante seguros de ello porque ya la razn nos dice que nadie puede tomar contacto con todos los miembros

  • Darrell Huff Cmo mentir con estadsticas

    8

    vivos de la promocin de 1924. Despus de 25 aos, forzosamente tienen que existir muchos cuyas direcciones particulares se desconocen.

    Y de aquellos cuyas direcciones son conocidas, muchos no querrn contestar, especialmente tratndose de una cuestin muy personal. Para ciertos tipos de cuestionario una tasa de respuesta del 5% al 10% ya se considera bastante alta. El que estamos comentando podr haber tenido un resultado mejor, pero nada parecido a un 100%.

    De modo que llegamos a la conclusin que la cifra del ingreso est basada sobre una muestra compuesta por todos los miembros de la promocin cuyas direcciones eran conocidas y que, adems, contestaron el cuestionario. Es representativa esta muestra? Esto es: puede considerarse que este grupo tena los mismos ingresos que el otro formado por aquellos cuya direccin ya no se conoca, ms aquellos que no quisieron contestar?

    Quines son las ovejas perdidas de Yale que figuran en las listas con "direccin desconocida"? Acaso son los poseedores de grandes ingresos, los hombres de Wall Street, los directores corporativos, los ejecutivos de la industria y los servicios? No; las direcciones de los ricos no sern difciles de conseguir. Muchos de los miembros ms prsperos de la promocin pueden ser hallados consultando el Quin es Quin en Amrica 2 y otras fuentes de referencia, incluso si no se han mantenido en contacto con la oficina de ex-alumnos. La suposicin ms probablemente cierta es que los nombres perdidos pertenecen a quienes, 25 aos despus de obtener su licenciatura, no llegaron a cumplir con ninguna brillante promesa. Son los oficinistas, los mecnicos, los vagos, los alcohlicos desempleados, los artistas y los escritores que apenas si consiguen sobrevivir personas de las que habra que juntar una docena, o ms, para llegar a un ingreso anual de $25.111. Estas personas no suelen aparecer en

    2 El Quin es Quin (o bien Who's Who por su nombre en ingls) es el ttulo de una serie de publicaciones de referencia que incluye las biografas de personalidades famosas. La publicacin ms antigua y conocida es la publicacin anual britnica de ese nombre. (N. del T.)

  • Darrell Huff Cmo mentir con estadsticas

    9

    las reuniones de ex-alumnos aunque ms no sea porque no pueden solventar el costo del viaje y la estada.

    Quines son los que tiraron el cuestionario al tacho de basura ms cercano? No podemos estar tan seguros acerca de stos, pero sera al menos una suposicin razonable pensar que son aquellos que no estn haciendo suficiente dinero como para vanagloriarse de ello. Son un poco como el sujeto que se encontr con una nota anexada al cheque de su sueldo en la que se le aconsejaba tratar la suma de su salario como algo confidencial que no deba ser comentado entre sus colegas. "No se preocupe" le dijo al jefe "Estoy por lo menos tan avergonzado de este sueldo como lo est usted".

    As se vuelve bastante evidente que la muestra ha omitido dos grupos que tenan una alta probabilidad de bajar el promedio. La cifra de $ 25.111 est empezando a explicarse. Si es una cifra real en absoluto, lo es meramente para ese grupo especial de la promocin de 1924 cuyas direcciones eran conocidas y cuyos integrantes estuvieron dispuestos a manifestar cuanto ganaban. Adems, incluso eso requiere presumir que esos caballeros dijeron la verdad.

    Y una presuncin as no es para hacerla a la ligera. La experiencia obtenida de una clase especial de estudio por muestreo el llamado "estudio de mercado" sugiere que difcilmente se la pueda hacer en absoluto. Una vez se hizo un relevamiento casa-por-casa para analizar las preferencias de los lectores de revistas en el cual la pregunta clave fue: "Qu revistas se leen en su casa?" Despus de tabular y analizar las respuestas pareci ser que una gran cantidad de gente prefera Harper's 3 y no muchos lean True Story. 4 Ahora

    3 Harper's Magazine es una revista mensual norteamericana que, desde una perspectiva generalmente liberal (en sentido norteamericano) trae noticias sobre literatura, poltica, cultura, economa y artes. Es la segunda revista ms antigua de los Estados Unidos despus del Cientific American. (N. del T.)

    4 True Story (Historia Verdadera) fue una revista que, supuestamente, publicaba historias de la vida real bajo el subttulo de "la verdad es ms extraa que la ficcin". No obstante, muchos de sus artculos estaban escritos por escritores profesionales y no eran ms que fantasas sensiblemente alejadas de la realidad pero que agradaban a un gran pblico vido de romanticismos y sensacionalismos. (N. del T.)

  • Darrell Huff Cmo mentir con estadsticas

    10

    bien, existan por la misma poca cifras de circulacin publicadas que claramente indicaban que True Story distribua millones de ejemplares 5 mientras que Harper's solo tena una circulacin de cientos de miles. Los diseadores de la encuesta se dijeron: "Quizs entrevistamos a la gente equivocada". Pero no, el cuestionario haba sido utilizado en toda clase de vecindarios y a lo largo y ancho de todo el pas. La nica conclusin razonable fue que los entrevistados simplemente no dijeron la verdad. Casi todo lo que la entrevista revel fue nada ms que el esnobismo de los entrevistados.

    Al final se lleg a la conclusin de que, si uno quiere saber qu es lo que leen determinadas personas, no tiene ningn sentido hacerle preguntas a los lectores. Uno podra llegar a saber mucho ms yendo a sus casas ofrecindoles comprar sus revistas viejas y todas las publicaciones que hayan comprado. Despus de eso, lo nico que habra que hacer es contar cuantas Yale Review 6 y cuantas Love Romance 7 hay. Y, por supuesto, incluso este recurso algo dudoso no nos dira qu lee la gente; solo nos dira qu es lo que ha comprado.

    De un modo similar, la prxima vez que lea que el Norteamericano Promedio (se oye hablar de l un buen montn estos das y la mayor parte de lo que se dice es solo tenuemente probable) se lava los dientes 1.02 veces al da una cifra que acabo de inventar pero que podra ser tan buena como cualquier otra hgase la siguiente pregunta: "Cmo pudo alguien averiguar una cosa as? Una mujer que, en innumerables anuncios comerciales, ha ledo que las personas que no se lavan los dientes prcticamente atentan contra la convivencia social, le confesara a un extrao que no se lava los dientes en forma regular?

    Esa estadstica puede llegar a tener sentido para alguien que quiere saber qu dicen las personas acerca del lavarse los dientes. Pero no

    5 Hacia 1929 True Story tena una circulacin de cerca de 2 millones de ejemplares. (N. del T.)

    6 Revista literaria publicada por la Universidad de Yale. (N. del T.)

    7 "Romances de Amor" - quizs un ttulo de revista inventado por el autor.

  • Darrell Huff Cmo mentir con estadsticas

    11

    revelar gran cosa acerca de la frecuencia con la cual esas mismas personas efectivamente se cepillan la dentadura.

    Se nos dice que un ro no puede subir por sobre el nivel de su fuente. Es cierto . . . pero puede parecer que lo hace si hay una estacin de bombeo por algn lado. Tambin es igualmente cierto que ningn estudio por muestreo es mejor que la muestra sobre la que se basa. Para cuando los datos han sido filtrados a travs de capas de manipulacin estadstica y reducidos a un promedio expresado con decimales, el resultado empieza a adquirir un aura de persuasin que quedara desmentida por una mirada ms atenta al muestreo.

    El diagnstico temprano del cncer, salva vidas? Probablemente. Pero de las cifras que usualmente se utilizan para demostrarlo lo mejor que se puede decir es que no lo demuestran. Estas cifras, recopiladas por el Connecticut Tumor Registry, se remontan a 1935 y parecen mostrar un aumento sustancial en la tasa de supervivencia original de cinco aos durante el perodo 1935/1941. En realidad, sin embargo, los datos comenzaron a registrarse efectivamente en 1941 y todo lo anterior se obtuvo rastreando para atrs. Muchos de los pacientes ya se haban mudado de Connecticut y no se pudo saber si haban sobrevivido o fallecido. De acuerdo con Leonard Engel, el sesgo as creado es "suficiente como para explicar la totalidad del supuesto aumento de la tasa de mejora".

    Para ser til, un informe basado sobre una muestra tiene que partir de una muestra representativa y una muestra representativa es aquella en la cual se han eliminado todas las fuentes de distorsin o sesgo. Ah es donde nuestra cifra de Yale demuestra su inutilidad. Y en esto mismo revelan su falta de sentido una gran cantidad de cosas que podemos leer en los diarios y revistas.

    Cierta vez un psiquiatra manifest que prcticamente todo el mundo es neurtico. Dejando de lado que semejante utilizacin del trmino destruye cualquier significado que la palabra "neurtico" pueda tener, pguele un vistazo a la muestra que us el hombre. Esto es: a quin estuvo observando ese psiquiatra? Resulta que lleg a esa edificante conclusin estudiando a sus propios pacientes que estn a

  • Darrell Huff Cmo mentir con estadsticas

    12

    aos luz de constituir una muestra representativa de toda la poblacin. Si una persona es normal, nuestro psiquiatra jams se encontrara con ella.

    chele esa clase de segunda mirada a las cosas que lee y no podr evitar darse cuenta de que todo un montn de cosas no son lo que se dice de ellas.

    Vale la pena tener en mente que la confiabilidad de una muestra puede ser destruida no solamente por esta clase de fuentes visibles sino y con la misma facilidad por fuentes invisibles de distorsin. Es decir: an si no encuentra una fuente con sesgo demostrable, permtase algn grado de escepticismo en cuanto a los resultados mientras exista la posibilidad de que haya cierto sesgo en alguna parte. Siempre lo hay. Y si quedase alguna duda sobre esto, las elecciones presidenciales de 1948 y 1952 bastan para demostrarlo.

    Para mayores datos, retrocedamos hasta el ao 1936 y recordemos el sonado fiasco del Literary Digest. Los diez millones de encuestados, entre llamadas telefnicas y suscriptores del Digest, le aseguraron a esa ya desaparecida revista que Landon obtendra 370 votos y Roosevelt 161. La lista de personas a encuestar fue la misma que haba sido utilizada para predecir con toda exactitud la eleccin de 1932. Cmo pudo haber un sesgo en una lista que ya haba sido utilizada con xito? Por supuesto que hubo un sesgo, tal como despus, ex post facto, demostraron varios estudios acadmicos y otros anlisis. Las personas que en1936 podan darse el lujo de tener un telfono y de suscribirse a una revista, no constituan una muestra representativa de todos los votantes. Econmicamente, formaban una clase especial de personas y la muestra se hallaba sesgada porque result ser que estaba cargada con votantes republicanos. La muestra eligi a Landon, pero el electorado no estuvo de acuerdo.

    La muestra bsica es la llamada "aleatoria". Se la extrae completamente al azar de la "poblacin", una palabra que los tcnicos en estadsticas utilizan para referirse a la totalidad de la cual

  • Darrell Huff Cmo mentir con estadsticas

    13

    la muestra es una parte. Por ejemplo, se extrae cada dcimo nombre de un conjunto de fichas. O se sacan cincuenta tarjetas de un sombrero lleno de ellas. O se entrevista a una de cada 20 personas que transitan por la calle Market Street. (Pero recuerde que esto ltimo no es una muestra de la poblacin mundial, ni de los Estados Unidos, ni tampoco de San Francisco, sino nicamente de las personas que estaban en Market Street y en ese momento). Una de las encuestadoras de cierta agencia dijo que se dedicaba a encuestar a la gente de una estacin ferroviaria porque "en una estacin de tren uno encuentra a toda clase de personas". Hubo que aclararle que madres con nios muy pequeos podan no estar adecuadamente representadas en ese lugar.

    La verificacin de la calidad de una muestra al azar se hace preguntando: Cada objeto o persona del grupo total tiene las mismas probabilidades de estar en la muestra?

    La muestra enteramente aleatoria es la nica que puede ser analizada con entera confianza con las herramientas estadsticas, pero hay un problema con ella. Es tan difcil y cara de obtener que ya la mera cuestin del costo hace que sea descartada. Un sustituto ms econmico, que se usa casi universalmente en reas tales como encuestas de opinin y anlisis de mercado, es la llamada muestra al azar por estratos.

    Para obtener esta muestra estratificada se divide a la poblacin total en varios grupos respetando en la integracin de cada grupo la proporcionalidad que tiene en el conjunto total. Y ah es donde pueden empezar los problemas: la informacin que se dispone sobre esa proporcionalidad puede no ser correcta. Lo que se hace es decirle a los entrevistadores que entrevisten pongamos por caso a una cantidad X de negros, a N% de personas de cada una de varias bandas salariales, a un nmero determinado de granjeros, y as sucesivamente. Adems, supongamos que cada grupo debera estar compuesto en partes iguales por personas de ms de 40 y menos de 40 aos de edad.

  • Darrell Huff Cmo mentir con estadsticas

    14

    Suena muy bien, pero qu pasa? En materia de negro o blanco el encuestador juzgar correctamente la mayora de las veces. En materia de salarios ya cometer ms errores. Y, en cuanto a granjeros, cmo clasificara usted a una persona que trabaja parte de su tiempo en la granja pero que tambin trabaja en la ciudad? Hasta la cuestin de la edad presenta algunos problemas que pueden resolverse fcilmente seleccionando entrevistados que estn notoriamente o bien por encima, o bien por debajo de los 40 aos. Pero en ese caso la muestra va a estar sesgada por la virtual ausencia de personas de entre, digamos, 37 y 43 aos. No hay escapatoria.

    Para colmo de males, cmo obtener una muestra al azar dentro de la estratificacin? Lo ms obvio sera empezar con una lista que incluya a todo el mundo y extraer de ella nombres al azar; pero esto resultara demasiado caro. De modo que el encuestador sale a la calle y sesga su muestra con las personas que se han quedado en casa. Yendo de casa en casa se pierde la enorme mayor parte de los que salieron a trabajar. Si opta por hacer sus entrevistas a la tarde, despus del horario laboral, se perder a los que se fueron al cine o a un club nocturno.

    En ltima instancia, la realizacin de una encuesta se convierte en una constante lucha contra fuentes de distorsin y es una lucha que libran constantemente todas las encuestadoras serias. Lo que el lector de dichas encuestas tiene que saber es que en esa lucha no se gana nunca. Una conclusin al estilo de "el 67% de los norteamericanos est en contra de" una cosa u otra, jams debera ser leda sin hacerse la pregunta: "El 67% de cuales norteamericanos?".

    Pas con el "Informe sobre la Mujer Norteamericana" del doctor Alfred C. Kinsey. El problema, como en todo lo basado sobre muestreos, es el de cmo leerlo (o cmo leer un resumen simplificado del mismo) sin aceptar demasiadas cosas que no necesariamente son tal como se las presenta. En este caso tenemos tres niveles del muestreo a considerar. Las muestras de la poblacin utilizadas por el Dr. Kinsey (primer nivel) estn lejos de haber sido tomadas al azar y no son particularmente representativas, si bien son

  • Darrell Huff Cmo mentir con estadsticas

    15

    muy grandes en comparacin con cualquier otro estudio hecho en este campo y sus nmeros tienen que ser aceptados como reveladores e importantes, si bien tampoco es cuestin de tomarlos al pie de la letra. Posiblemente ms importante que eso es recordar que cualquier cuestionario es solamente una muestra (segundo nivel) de todas las preguntas posibles y que las respuestas dadas por una mujer no son ms que una muestra (tercer nivel) de sus actitudes y experiencias en lo referido a cada pregunta.

    Las personas que forman el equipo de encuestadores tambin pueden matizar el resultado de una manera interesante. Hace algunos aos, durante la Segunda Guerra Mundial, el National Opinion Research Center envi a dos grupos de encuestadores a hacerle tres preguntas a 500 negros de una ciudad del Sur de los EE.UU. Uno de los grupos estuvo integrado por encuestadores negros, el otro por blancos.

    Una de las preguntas fue: "Los negros seran tratados aqu mejor o peor si los japoneses conquistaran a los Estados Unidos?" Los encuestadores negros informaron que el 9% de los entrevistados respondi: "mejor". Los encuestadores blancos hallaron solo un 2% de entrevistados que contestaron del mismo modo. Adems, mientras que a los encuestadores negros solo un 25% les respondi: "peor", a los encuestadores blancos un 45% les dio la misma respuesta.

    Cuando se sustituy la palabra "japoneses" por la de "nazis", los resultados fueron similares.

    La tercera de las preguntas se diriga hacia actitudes que podan obedecer a sentimientos revelados por las dos anteriores. "Qu piensa usted que es ms importante; concentrarse en vencer al Eje o hacer que la democracia funcione mejor aqu en nuestro pas?" Segn los encuestadores negros la respuesta del 39% de los entrevistados fue: "vencer al Eje". Segn los encuestadores blancos, el 62% dio esa misma respuesta.

    Aqu tenemos un sesgo introducido por factores desconocidos. Parece ser probable que el factor ms importante haya sido una

  • Darrell Huff Cmo mentir con estadsticas

    16

    tendencia que siempre tiene que ser tenida en cuenta al evaluar resultados de encuestas: el deseo de dar una respuesta que agrade al que hace la pregunta. No sera ningn milagro si, en tiempos de guerra, un negro del Sur le dijese a un hombre blanco algo que suena bien en lugar de lo que cree realmente. Tambin es posible que los diferentes grupos de encuestadores eligieron diferentes clases de personas para entrevistar.

    En todo caso, los resultados estn tan obviamente sesgados que la encuesta es inservible. Puede ahora usted juzgar por s mismo y hacerse una idea de cuantas conclusiones basadas sobre encuestas estn exactamente tan sesgadas y son exactamente tan inservibles solo que usted no tiene la posibilidad de verificarlas y descubrir la distorsin.

    No obstante, tendr una base de partida bastante slida para formarse una opinin si sospecha que, en general, las encuestas estn sesgadas en una direccin especfica, como por ejemplo la direccin del error del Literary Digest. Este sesgo apunta hacia la persona con ms dinero, ms educacin, ms informacin, ms lucidez, mejor apariencia, mayor comportamiento convencional, y hbitos ms arraigados que las personas a las que debera representar.

    Es fcil de ver lo que esto produce. Supongamos que usted es un encuestador parado en una esquina al que le han asignado la tarea de realizar una sola entrevista. De pronto ve a dos personas que caen dentro de la categora que le han asignado: ms de cuarenta aos, negro, urbano. Uno de ellos es de buen aspecto, bien vestido y pulcro. El otro est todo sucio y tiene un aire de abandono. Para cumplir con lo asignado, es mucho ms probable que usted se dirija a la persona de aspecto agradable. Y los dems entrevistadores tambin tomarn una decisin similar a la suya.

    Algunas de las crticas ms fuertes en contra de las encuestas de opinin pblica provienen de los crculos de izquierda en los cuales es usual creer que las encuestas estn generalmente amaadas. Detrs de esto est el hecho que las encuestas fallan con tanta

  • Darrell Huff Cmo mentir con estadsticas

    17

    frecuencia en coincidir con la opinin y los deseos de personas cuyo pensamiento difiere de la tendencia conservadora. Estas personas sealan que las encuestas parecen elegir siempre a republicanos, incluso cuando los votantes hacen lo contrario poco despus de su publicacin.

    En realidad, tal como hemos visto, no es necesario que una encuesta est amaada es decir: que los resultados se distorsionen en forma deliberada para crear una falsa impresin. Una tendencia en la muestra misma, sesgada en una direccin determinada, puede amaar la encuesta automticamente.

  • Darrell Huff Cmo mentir con estadsticas

    18

    2. El promedio bien elegido

    No creo que usted sea un esnob del mismo modo en que yo, por cierto, no estoy en el negocio inmobiliario. Pero supongamos por un momento que usted lo es y yo me dedico a vender inmuebles. Hagamos de cuenta, adems, que est usted buscando comprar una vivienda situada sobre una ruta no muy lejos del valle de California que es donde yo vivo.

    Pues bien; habindolo semblanteado y descubierto su esnobismo, me tomo un gran trabajo en explicarle que el ingreso promedio de las personas de este vecindario est en el orden de los $15.000 anuales. Es probable que eso despierte su inters en vivir aqu. Sea como fuere, supongamos que usted me compra una vivienda y esa atractiva suma le queda grabada en la mente. Algo que es ms que probable, desde el momento en que estamos suponiendo que usted es al menos un poco esnob y no se va a privar de mencionarlo de un modo pretendidamente casual cuando le diga a sus amigos donde est viviendo.

    Un ao o algo as ms tarde nos volvemos a encontrar. Pero esta vez soy miembro de un comit de contribuyentes y estoy haciendo circular una peticin para reducir impuestos, o para reducir el monto de las valuaciones fiscales o para solicitar una rebaja en los costos del transporte. En esa peticin, mi argumento es que no podemos solventar un aumento ya que, despus de todo, el ingreso promedio del vecindario es de $3.500 al ao. Quizs usted me acompae en la peticin y en mi comit supongamos que no solo es esnob sino tambin algo tacao pero no podr evitar sorprenderse de escuchar esa miserable suma de $3.500 anuales. Estoy mintiendo ahora o le ment el ao pasado?

    No puede usted demostrar que lo hice, ni ahora ni antes. Esa es la belleza esencial del mentir con estadsticas. Ambas cifras son promedios legtimos, calculados legalmente. Ambas representan los

  • Darrell Huff Cmo mentir con estadsticas

    19

    mismos datos, las mismas personas y los mismos ingresos. Aun as es obvio que al menos una de las dos tiene que ser tan engaosa que bordea lo que sera una mentira flagrante.

    Mi truco consisti en usar un promedio distinto en cada una de las dos oportunidades, siendo que la palabra "promedio" tiene un significado muy elstico. Es un truco usado frecuentemente, a veces de un modo inocente pero la mayora de las veces con culpabilidad, por sujetos que desean influir sobre la opinin pblica o vender espacio publicitario.

    Cuando le digan que algo es un promedio, seguir sin saber demasiado a menos que le digan tambin cual de los promedios ms comunes fue el utilizado. Fue una "media", una "mediana" o una "moda"?

    La cifra de $15.000 que utilic cuando quise una cantidad grande es una media, es decir: es la media aritmtica de todos los ingresos de todas las familias del vecindario. Se obtiene sumando todos los ingresos y dividindola por la cantidad de personas involucradas. La cifra menor es una mediana. Nos est diciendo que la mitad de las familias en cuestin tiene un ingreso anual mayor de $3.500 mientras que la otra mitad vive con un ingreso anual menor de $3.500. Tambin podra haber usado la moda estadstica, que es el nmero que aparece con mayor frecuencia en una serie de nmeros. Por ejemplo, si en nuestro vecindario hay ms personas con ingresos de, digamos, $5.000 que personas con ingresos de cualquier otro monto, pues entonces $5.000 ser el ingreso modal de la poblacin.

    En el caso que estamos viendo, al igual que en la mayora de los casos referidos a ingresos anuales, un "promedio" no explicitado carece virtualmente de significado. Uno de los factores que contribuye a aumentar la confusin es que, en determinadas clases de informacin, todos los diferentes tipos de promedio arrojan resultados tan similares que, a los efectos prcticos, puede no ser tan importante mencionar cual se ha aplicado.

  • Darrell Huff Cmo mentir con estadsticas

    20

    450,00

    61,00

    870,00

    930,00

    650,00

    870,00

    15.000,00

    200,00

    650,00

    Media Aritmtica 2.168,78

    Mediana 650,00

    Media Geomtrica 662,22

    Moda 870,00

    Diferencia entre media, mediana, media geomtrica y moda. Observe como un solo nmero con gran desvo (15.000) lleva

    la media aritmtica a ms del triple de la mediana. La moda es el nmero ms frecuente de la serie (870 es el

    nmero que figura ms veces). 8

    Si leemos que la estatura promedio de los hombres de determinada tribu primitiva es tan solo de 1.5 metros, podemos llegar a tener una idea bastante concreta de la estatura de estas personas. No vamos a tener que preguntar si ese promedio es una media, una mediana o una moda; los tres promedios arrojaran aproximadamente el mismo resultado. (Por supuesto, si estamos en el negocio de la fabricacin de ropa, solicitaramos ms informacin que la dada por cualquier promedio. Esto tiene que ver con rangos y desviaciones, algo a lo cual nos dedicaremos en el prximo captulo).

    Los distintos promedios arrojan resultados similares cuando se trata de datos que nos hacen el favor de aproximarse a lo que se llama una distribucin normal como lo son, por ejemplo, los relacionados con muchas caractersticas humanas. Si graficamos estos datos mediante una curva, la misma se parece a una campana y la media, la mediana y la moda se ubican prcticamente en el mismo punto.

    8 Para evitarse engorrosos clculos puede utilizar sencillamente una planilla de Microsoft Excel empleando las funciones estadsticas que ofrece dicha aplicacin. Las funciones en castellado y en ingles son Media = PROMEDIO (AVERAGE); Mediana = MEDIANA (MEDIAN); Media Geomtrica = MEDIA.GEOM (GEOMEAN) y Moda = MODA (MODE). (N. del T)

  • Darrell Huff Cmo mentir con estadsticas

    21

    Por consiguiente un promedio ser tan bueno como cualquier otro para describir la estatura de las personas, pero no lo es para describir los libros de cierto tamao que esas personas compraron. Si listramos todos los ingresos anuales de todas las familias de una ciudad determinada, podramos hallar que van desde casi nada hasta $50.000 o algo as y hasta podramos toparnos con unos pocos realmente muy grandes. Ms del 95% de los ingresos estara por debajo de $10.000, con lo que quedaran muy hacia la izquierda de la curva. La campana, en vez de ser simtrica, estara sesgada. Su contorno sera como el de un tobogn, con la parte izquierda subiendo empinadamente hasta un punto mximo y el resto bajando suavemente en pendiente. La media se hallara a bastante distancia de la mediana. Es fcil ver lo que esto implicara para la validez de una comparacin entre el "promedio" (media) de un ao contra un "promedio" (mediana) de otro.

  • Darrell Huff Cmo mentir con estadsticas

    22

    En el vecindario en el que le vend a usted una casa los dos promedios estn particularmente lejos el uno del otro porque la distribucin est marcadamente sesgada. Sucede que la mayora de los vecinos son pequeos granjeros, o personas asalariadas, o personas de edad que viven de pensiones. Pero tres de los habitantes son millonarios que vienen los fines de semana y estos tres empujan enormemente la media aritmtica para arriba. Lo empujan a una cifra que prcticamente nadie en el vecindario gana. Lo que se obtiene en realidad suena como una broma o solo una forma de hablar: casi todo el mundo est por debajo del promedio.

    Por eso es que, cuando lea el anuncio del ejecutivo o del dueo de una corporacin afirmando que el sueldo promedio de las personas que trabajan en esa empresa es de tal o cual monto, la cifra mencionada puede significar algo y tambin puede no significar nada. Si el promedio es una mediana, podr usted extraer algo significativo de ella: la mitad de los empleados gana ms que eso y la otra mitad gana menos. Pero si es una media (y crame, es muy posible que lo sea si no se dice nada al respecto), lo que le estn diciendo no es nada ms revelador que el promedio entre un salario de $45.000 el del propietario y los salarios del montn de trabajadores mal retribuidos. Un "sueldo promedio anual de $5.700" puede estar escondiendo la suma de los salarios anuales de $2.000

  • Darrell Huff Cmo mentir con estadsticas

    23

    de la mayor parte de los empleados a la cual se le han sumado los beneficios del propietario calculados como un salario sensacional.

    Echmosle un vistazo a este ltimo. La pgina principal nos muestra cuantas personas ganan cuanto de sueldo. Al patrn le gustar expresar la situacin como un "sueldo promedio de $5.700" utilizando la media engaosa. La moda, sin embargo, es ms reveladora: el sueldo ms frecuente en esta empresa es de $2.000 al ao. Como de costumbre, la mediana nos dice ms acerca de la situacin que cualquier otro nmero tomado aisladamente: la mitad de los empleados gana ms de $3.000 y la otra mitad gana menos.

    Con mucha facilidad esto se puede convertir en todo un sistema en donde, mientras peor sea la situacin real, mejor aparecer en algunos informes. Intentmoslo con una pequea prueba.

    Supongamos que usted es uno de los tres socios propietarios de una pequea empresa manufacturera. Est al final de un muy buen ao. Le ha pagado $198.000 a los 90 empleados que hacen el trabajo de fabricar y vender las sillas, o lo que sea que la empresa fabrica. Tanto usted como sus socios se han asignado $11.000 cada uno en concepto de salario. Tambin hay $ 45.000 de beneficio neto anual a distribuir entre los tres socios y en partes iguales. Cmo describira usted la situacin? Para que sea fcil de entender, decide expresarla en promedios. Desde el momento en que todos los empleados hacen aproximadamente el mismo trabajo por un salario similar, no habr mucha diferencia usando una media o una mediana. Y esto es lo que usted calcula:

    Sueldo Promedio de los empleados........... : $ 2.200 Sueldo promedio + ganancia de los socios: $ 26.000

    Se ve horrible no es cierto? Probemos de otra forma.

    Quite $30.000 de las ganancias y distribuya esta cantidad entre los tres socios en concepto de premios extraordinarios. Y esta vez, cuando haga el promedio de los salarios, incluya el suyo y el de sus socios. Y asegrese de usar una media.

  • Darrell Huff Cmo mentir con estadsticas

    24

    Sueldo Promedio o salario........................... : $ 2.806,45 Ganancia promedio de los dueos..............: $ 5.000,00

    Ahora s. Esto ya tiene mejor aspecto. No tan bueno como se lo podra presentar pero suficientemente bueno de todos modos. Menos del 6% del dinero disponible se ha distribuido en ganancias y, si usted quiere, se podra ir ms lejos todava mostrando eso tambin. De todos modos, se han obtenido nmeros que se pueden publicar o usar para regateos.

    Lo expuesto es algo crudo porque el ejemplo est simplificado, pero no es nada comparado con lo que se ha hecho en nombre de la contabilidad. Dada una corporacin compleja con jerarquas que van desde el aprendiz de oficinista hasta el presidente con un premio anual de varios cientos de miles de dlares, se puede cubrir toda una serie de cosas de esta manera.

    De modo que, cuando vea una cifra referida al salario promedio, pregntese primero: Promedio de qu? Quin est incluido? La United States Steel Corporation 9 afirm una vez que el salario semanal promedio de sus empleados haba aumentado en un 107% entre 1940 y 1948. Realmente, fue as. Pero parte de lo espectacular del aumento se desvanece cuando uno se da cuenta de que la cifra de 1940 incluye una cantidad mucho mayor de personas empleadas a media jornada. Si usted trabaja a media jornada durante un ao y a jornada completa al ao siguiente, sus ingresos se duplicarn pero eso no indica absolutamente nada acerca del nivel real de su salario.

    Quizs haya ledo en el diario que el ingreso de la familia norteamericana promedio era de $3.100 en 1949. No debera tratar de hacer mucho con ese nmero a menos que sepa qu es lo que se quiso decir con "familia" as como qu clase de promedio se utiliz en el clculo. (Y quin es el que lo dice, cmo lo sabe, y qu tan exacto es ese nmero).

    9 Corporacin Norteamericana del Acero (N. del T.)

  • Darrell Huff Cmo mentir con estadsticas

    25

    El que acabamos de mencionar proviene casualmente de la Oficina del Censo. Si dispone usted del informe de la Oficina, no tendr dificultad en encontrar justo all el resto de la informacin que necesita: es una mediana y "familia" significa "dos o ms personas relacionadas entre s y que conviven". (Si incluye en el grupo a las personas que viven solas la mediana baja a $2.700, lo que ya es algo bastante diferente). Si vuelve a las tablas y lee con atencin, tambin se enterar de que la cifra est basada sobre una muestra con un tamao tal que existe una probabilidad de 19 sobre 20 de que el promedio estimado que fue de $3.107 antes del redondeo es correcto con un margen de, ms/menos $59.

    Esa probabilidad y ese margen indican una estimacin bastante buena. La gente del Censo tiene suficiente dinero y conocimientos profesionales como para llevar su muestra a un aceptable grado de precisin. Presumiblemente tampoco tienen algn inters creado. No todas las cifras que se ven han nacido en circunstancias tan felices, y tampoco estn acompaadas de informacin alguna en absoluto para mostrar qu tan precisas o imprecisas pueden ser. Nos referiremos a esto ltimo en el captulo siguiente.

    Mientras tanto, quizs usted quiera ejercitar su escepticismo con algunos puntos de "Una carta del editor" de la revista Time. De los suscriptores nuevos se dice: "La mediana de su edad es de 34 aos y el ingreso familiar anual promedio es de $7.270". Una encuesta anterior hecha a antiguos suscriptores del Time revel que, entre stos, la "la mediana de la edad fue de 41 aos . . . el ingreso promedio de $9.535 . . ." Naturalmente, la pregunta es por qu se indica en ambos casos la mediana cuando se trata de la edad y se calla cuidadosamente el tipo de promedio empleado para calcular el ingreso. Ser que se utiliz la media porque es mayor y con ello se le est ofreciendo un pblico lector ms adinerado a los anunciantes a modo de carnada?

    Tambin podramos jugar al juego de qu-clase-de-promedio-se-us con la supuesta prosperidad de los ex-alumnos de Yale de 1924 mencionada al principio del Captulo 1.

  • Darrell Huff Cmo mentir con estadsticas

    26

    3. Las pequeas cifras que faltan

    El gran titular dice: "Usuarios informan 23% menos de caries con dentfrico Doakes". Puesto que le vendra muy bien un 23% menos de dolor de muelas, usted sigue leyendo. Encuentra que esos resultados provienen de un laboratorio garantidamente "independiente" y que el informe se halla certificado por un contador pblico registrado. Qu ms quiere?

    Aun as, si no es extraordinariamente crdulo u optimista, recordar por experiencia que un dentfrico rara vez es mucho mejor que cualquier otro. Si esto es as, cmo puede la gente de Doakes anunciar semejantes resultados? Pueden tener xito mintiendo, y con mentiras de semejante magnitud? No. Pero tampoco tienen que hacerlo. Hay formas ms fciles y ms efectivas de hacerlo.

    El comodn principal en este caso es la muestra inadecuada; vale decir: estadsticamente inadecuada; para Doakes es adecuada por dems. El grupo entrevistado, como se puede descubrir leyendo la letra chica, estuvo integrado por escasamente una docenas de personas. Hay que hacerle justicia a Doakes por ser tan deportivamente equitativo y darnos ese dato. Algunos anunciantes omitiran esa informacin y dejaran hasta a los expertos en estadsticas con tan solo la posibilidad de adivinar qu clase de chicana se utiliz. La muestra de una docena, al fin y al cabo, no es tan mala despus de todo, considerando como se hacen estas cosas. Algo llamado "Polvo Dental del Dr. Cornish" sali al mercado hace unos aos pretendiendo haber obtenido "un xito considerable en la correccin de . . . caries dentales". La idea era que el polvo contena urea, la cual supuestamente haba demostrado su utilidad para ese propsito en estudios de laboratorio. El sinsentido de esto de esto fue que ese trabajo haba sido puramente preliminar y se haba efectuado sobre exactamente seis casos.

    Pero volvamos al caso de Doakes para ver qu tan fcil les result obtener un gran titular sin falsedades y con todo certificado para colmo. Dejen que cualquier grupo pequeo lleve la cuenta de sus

  • Darrell Huff Cmo mentir con estadsticas

    27

    caries durante seis meses y luego cambien a Doakes. Suceder una de tres cosas: el grupo tendr ms caries, menos caries o aproximadamente la misma cantidad de caries. Si ocurre la primera o la ltima de las posibilidades, Doakes y Ca. archiva los resultados (en alguna parte, bien lejos de la vista del pblico) y lo intenta de nuevo con otro grupo. Tarde o temprano, por mero azar, un grupo testigo mostrar una gran mejora digna de un gran titular y quizs de toda una campaa publicitaria. Y esto hubiera sucedido incluso si el grupo adoptaba Doakes, polvo de hornear o simplemente hubiera seguido usando el mismo antiguo dentfrico.

    La importancia de usar un grupo pequeo es sta: en un grupo grande, cualquier diferencia producida por el azar ser probablemente pequea y difcilmente merecedora de una gran tipografa. Una supuesta mejora del 2% no vendera gran cantidad de dentfrico.

    El modo en que se pueden producir por puro azar resultados que no son indicativos de nada dada una pequea cantidad de casos es algo que usted mismo puede verificar a muy bajo costo. Simplemente empiece a tirar una moneda al aire. Cuntas veces caer de "cara"? La mitad de las veces, por supuesto. Todo el mundo sabe eso.

    Bueno; verifiquemos eso y veamos. . . . Acabo de hacer la prueba con diez lanzamientos y obtuve "cara" ocho veces, lo cual demuestra que las monedas caen con la cara para arriba en el 80% de los casos. Bueno, al menos lo hacen as en las estadsticas de los dentfricos. Ahora intntelo usted. Puede que obtenga un resultado de igual cantidad de "caras" que de "cecas", pero no es muy probable que le resulte as. El resultado de usted, al igual que el mo, tiene buenas probabilidades de quedar lejos del 50%. Pero si tiene la suficiente paciencia de lanzar la moneda mil veces puede usted estar casi (pero no totalmente) seguro de arribar a un resultado muy cercano a la misma cantidad de "caras" que de "cecas", lo cual constituye la probabilidad real. La ley de los promedios es til para describir o predecir solamente cuando hay una cantidad sustancial de casos o eventos.

  • Darrell Huff Cmo mentir con estadsticas

    28

    Cuntos son suficientes? sa es otra pregunta capciosa. Depende, entre otras cosas, de qu tan grande y de cun variada es la poblacin que se est estudiando por muestreo. Y a veces el nmero de la muestra no es lo que parece ser.

    Un caso notorio de esto apareci hace algunos aos en relacin con la prueba de una vacuna contra la poliomielitis. Pareci ser un impresionante experimento a gran escala considerando lo usual en materia de estudios mdicos. Se vacun a 450 nios de una comunidad y se dej sin vacunar a 680 como grupo de control. Poco despus la comunidad fue atacada por una epidemia. Ni uno de los nios vacunados tuvo un caso demostrado de poliomielitis.

    Tampoco lo tuvo ninguno del grupo de control. Lo que los experimentadores haban pasado por alto, o fallado en entender, al disear su proyecto fue la baja incidencia de la parlisis infantil. Con la tasa actual, solo se hubieran podido esperar dos casos en un grupo de esos tamaos, por lo cual el experimento estuvo condenado al fracaso desde el principio. Se hubieran necesitado al menos grupos de un tamao entre quince a veinte veces mayor para obtener un resultado que significara algo en absoluto.

    Ms de un gran aunque efmero descubrimiento mdico ha sido lanzado de un modo similar. Tal como lo dijo uno de los mdicos: "Aprense a usar un nuevo remedio antes de que sea tarde".

    La culpa no recae nicamente sobre la profesin mdica. La presin del pblico y un periodismo ansioso muchas veces lanzan un tratamiento que no est debidamente probado, particularmente cuando la demanda es grande y el respaldo estadstico es nebuloso. Sucedi con las vacunas contra el resfro que fueron populares hace algunos aos y con los antihistamnicos ms recientemente. Buena parte de la popularidad de estas "curaciones" fallidas provino de la naturaleza errtica de la enfermedad y de una falla de lgica. Si le damos tiempo, un resfro se cura solo.

    Cmo puede uno evitar ser engaado por resultados que no demuestran lo que pretenden demostrar? Es necesario que cada persona se convierta en un experto en estadstica y estudie por su

  • Darrell Huff Cmo mentir con estadsticas

    29

    propia cuenta todos los datos recibidos "en crudo"? No es tan terrible; hay una prueba de significacin que es fcil de entender. Es simplemente el modo de informar sobre la probabilidad de que la cifra de la estadstica represente algo real en lugar de algo producido por el azar. Esta es la pequea cifra que falta y de la que se presume que usted el lector profano no la comprendera. O que s lo hara si hay algo para ocultar.

    Si la fuente de informacin tambin expresa el grado de significado, tendr usted una idea mejor acerca de dnde est parado. La forma ms simple de expresar este grado de significado es mediante una probabilidad, como cuando la Oficina del Censo nos deca que exista una probabilidad de 19 entre 20 de que sus cifras tuviesen un determinado grado de precisin. Para la mayora de los casos prcticos no ms importantes que ste, un significado del 5% es aceptable. Para otros, el nivel exigido es del 1% lo cual quiere decir que existe una probabilidad de 99 entre 100 de que el resultado se condice con la realidad. Cualquier cosa que tenga esta probabilidad se considera como "prcticamente cierto".

    Adems, existe otra clase de pequea cifra que generalmente falta, y es una cifra cuya ausencia puede ser igual de daina. Es la que nos informa sobre el rango de las cosas, o su desvo de la media o la mediana que se est comunicando. Con frecuencia un promedio sea media o mediana es una simplificacin tan abusiva que resulta peor que inservible. El no saber nada acerca de un asunto frecuentemente es ms saludable que saber lo que no es as y una informacin parcial puede ser una cosa peligrosa.

    Por ejemplo, gran parte de la reciente planificacin de viviendas en los Estados Unidos ha sido diseada para la familia promedio estadstica de 3.6 personas. Lo cual, traducido al lenguaje real, significa tres o cuatro personas; lo cual, a su vez, implica dos dormitorios. Y la familia de este tamao, aunque sea el "promedio", constituye en realidad una minora entre todas las familias. Los constructores dicen: "Construimos casas promedio para las familias promedio" y dejan de lado a la mayora compuesta por familias que son, o bien ms grandes, o bien ms pequeas. Como

  • Darrell Huff Cmo mentir con estadsticas

    30

    consecuencia, en algunas reas sobran casas con dos dormitorios y faltan casas con menos y con ms dormitorios. De modo que aqu tenemos una estadstica cuyas engaosas falencias han tenido consecuencias muy caras. Al respecto, la American Public Health Association 10 ha dicho: "Si miramos ms all del promedio aritmtico y vemos el rango real al que falsamente describe, hallamos que las familias de tres o cuatro personas constituyen solamente el 45% del total. Un 35% de la necesidad de viviendas es para una o dos personas, y el 20% de las familias est compuesta por ms de cuatro personas."

    Parece ser que el sentido comn claudic ante ese convincente y autoritariamente exacto 3.6. De algn modo pes ms que lo que todo el mundo sabe por simple observacin directa: que muchas familias son pequeas y relativamente pocas son grandes.

    De una manera similar, las pequeas cifras que faltan de las llamadas "normas de Gesell" han ocasionado dolor en padres y madres. Dejen que un padre lea, como lo han hecho muchos en lugares tales como la revista de los sbados, que "un nio" aprende a sentarse erguido a la edad de tantos o cuantos meses y el padre inmediatamente pensar en su propio hijo. Si el nio no llega a sentarse erguido al tiempo indicado, el padre no tendr ms remedio que pensar que su hijo es "retardado" o "anormal". Desde el momento en que probablemente la mitad de los nios no llegar a sentarse as al tiempo mencionado, una buena cantidad de padres se sentirn desdichados. Por supuesto que, hablando en trminos matemticos, esta desdicha se contrarrestar con la alegra del otro 50% de los padres que descubrirn que sus hijos estn "avanzados". Pero el esfuerzo que harn los padres desdichados para forzar a sus hijos a actuar de acuerdo con la norma puede producir sus daos.

    Todo esto no es culpa del Dr. Gesell ni de sus mtodos. La culpa reside en el proceso de filtrado que va desde el investigador, pasa por el desinformado o sensacionalista escritor y termina en el lector que

    10 Asociacin de Salud Pblica Norteamericana (N. del T.)

  • Darrell Huff Cmo mentir con estadsticas

    31

    no llega a echar de menos las cifras que han desaparecido durante el proceso. Se puede evitar una buena cantidad de desinformacin si a la "norma" o promedio se le agrega una indicacin acerca del rango. Los padres que vean que sus nios caen dentro de ese rango dejarn de preocuparse por pequeas y poco significativas diferencias. Difcilmente cualquiera de nosotros es exactamente "normal" en cualquier sentido, de la misma manera en que una moneda lanzada al aire 100 veces raramente caer exactamente 50 veces de "cara" y 50 veces de "seca".

    El confundir "normal" con "deseable" solo lo hace peor. El Dr. Gesell simplemente afirm hechos observados; fueron los padres quienes, leyendo los libros y los artculos, concluyeron que el nio que tarda un da o un mes en aprender a caminar tiene que ser inferior.

    Una buena parte de la crtica estpida al muy conocido (pero mucho menos correctamente ledo) informe del Dr. Kinsey provino de entender lo "normal" como equivalente a "bueno", "correcto" o "deseable". Kinsey fue acusado de corromper a la juventud dndole ideas inadecuadas y, en especial, por catalogar de normal a toda clase de prcticas sexuales populares pero socialmente desaprobadas. Sin embargo, lo nico que dijo fue que encontr que esas prcticas eran usuales, que es lo que "normal" significa, y no las etiquet con ningn sello de aprobacin. Si eran escabrosas, o no, eso fue algo que el Dr. Kinsey consider que estaba fuera de su mbito. Consecuentemente, choc contra algo que le ha agriado la vida a ms de un observador: es peligroso mencionar cualquier cosa con alto contenido emocional sin rpidamente aclarar que uno est a favor o en contra del asunto.

    Lo decepcionante de la pequea cifra que no aparece es que su ausencia pasa desapercibida con tanta frecuencia. se, por supuesto, es el secreto de su xito. Los crticos del periodismo tal como hoy se practica han deplorado la falta de ese antiguo y bien probado "caminar la calle" lamentando cidamente que hoy "los corresponsales de escritorio" vivan copiando sin crtica alguna los boletines informativos del gobierno. Como ejemplo de este periodismo sin compromisos vea este caso tomado de una lista de

  • Darrell Huff Cmo mentir con estadsticas

    32

    "nuevos desarrollos industriales" en la revista de noticias: "un nuevo bao fro de temple que triplica la dureza del acero, de Westinghouse."

    Bueno, eso s que suena a desarrollo . . . hasta que uno trata de entender qu significa en realidad. Porque, cuando se quiere poner el dedo en lo esencial, toda la noticia se escurre como una bolita de mercurio. Ese nuevo bao de temple hace que el acero se vuelva tres veces ms duro que cualquier acero anterior? O qu hace? Parece ser que el periodista repiti unas cuantas palabras sin preguntar qu significan y se espera que usted las lea tan acrticamente por la sola feliz ilusin de creer que ha aprendido algo. Recuerda demasiado a la vieja definicin del mtodo de enseanza antiguo segn el cual el contenido del manual del profesor pasaba al cuaderno del alumno sin hacer escala en la mente de ninguno de los dos.

    Hace unos minutos, mientras estaba tratando de encontrar algo en el Time, descubr otra de esas afirmaciones que se derrumban cuando uno la considera dos veces. Apareci en un anuncio comercial de 1948 publicado por un grupo de compaas de electricidad. "Hoy en da, las tres cuartas partes de las granjas norteamericana tienen corriente elctrica a su disposicin." Suena muy bien. Esas compaas de electricidad s que trabajan fuerte. Por supuesto, si quisiera ser custico dira que se podra parafrasear la noticia diciendo: "una cuarta parte de las granjas norteamericanas todava no tiene electricidad a su disposicin". El verdadero truco, sin embargo, est en el concepto de "tener a disposicin" Al utilizarlo, las compaas de electricidad han quedado habilitadas para decir casi cualquier cosa que se les ocurra. Obviamente, lo anunciado no significa que todos esos granjeros tienen, efectivamente, la electricidad conectada a sus granjas porque, de haber sido se el caso, lo hubieran destacado con precisin. Los granjeros simplemente tienen "a su disposicin" la electricidad y eso, por todo lo que s, poda significar que los cables pasan al lado de las granjas o hasta que estn a cien kilmetros de ellas.

    Permtanme citar el titular de un artculo de 1952 publicado en el Collier's: "SEPA AHORA QUE ESTATURA TENDR SU HIJO."

  • Darrell Huff Cmo mentir con estadsticas

    33

    Junto al artculo aparecen conspicuamente dos tablas, una para nias y otra para varones, mostrando a qu porcentaje de su estatura final llegan los nios a determinada edad. "Para determinar la estatura que tendr su hijo cuando llegue a la edad adulta" dice un subttulo "compare su estatura actual con la que figura en la tabla".

    Lo gracioso de todo esto es que el artculo mismo si uno sigue leyendo advierte sobre la fatal debilidad que tienen las tablas. No todos los nios crecen de la misma forma. Algunos empiezan de a poco y luego pegan el estirn; otros arrancan con estaturas altas y luego se estabilizan de a poco; para otros ms, el proceso es gradual y sostenido. La tabla, como habr adivinado usted, est basada sobre promedios tomados de un gran nmero de mediciones. Entendida como el promedio de estatura de unos 100 jvenes seleccionados al azar es, sin duda, bastante precisa. Pero un padre est interesado solamente en una estatura puntual y, para eso, la tabla es poco menos que inservible. Si desea conocer la estatura a la que llegar su hijo, probablemente podr adivinarla mucho mejor echndole una mirada a sus padres y a sus abuelos. Este mtodo no es tan cientfico y numricamente tan preciso como la tabla, pero es por lo menos tan confiable.

    Me causa gracia al comprobar que, si tomo mi propia estatura cuando ingres en un liceo militar a la edad de 14 aos y termin entre los ms bajos del escuadrn, segn la tabla tendra que haber terminado teniendo una estatura de 1.72 metros. En realidad, hoy mido 1.78 metros de altura. Seis centmetros de error en materia de estaturas humanas significan que la estimacin predictiva fue por dems pobre.

    Tengo ante m dos cajas de copos de avena. Son de dos ediciones levemente diferentes, tal como indican sus etiquetas: una menciona a "Pete dos pistolas" y la otra dice: "Si quieres ser como Hoppy . . . tienes que comer como Hoppy!". Ambas tienen grficos para mostrar ("Los cientficos demostraron que es cierto!") que estos copos "empiezan a darte energa en 2 minutos!" En uno de los casos, el grfico escondido detrs de este bosque de exclamaciones tiene nmeros en uno de sus lados; en el otro los nmeros han sido

  • Darrell Huff Cmo mentir con estadsticas

    34

    omitidos. En realidad, da lo mismo porque de cualquier manera en ninguno de los dos casos est explicado qu es lo que esos nmeros significan. Ambos grficos muestran una empinada lnea roja ("liberacin de energa"), pero uno de ellos empieza un minuto despus de haber comido los copos de avena y el otro dos minutos despus. Tambin, una de las lneas es el doble de empinada que la otra, lo que sugiere que ni el dibujante pens que estos grficos significaban algo en absoluto.

    Por supuesto, semejante tontera se puede encontrar solamente en grficos orientados a los ojos de un adolescente o a los semi-dormidos ojos maaneros de sus padres. Nadie insultara la inteligencia de un gran hombre de negocios con semejante bobada estadstica . . . o s?

    Djeme contarle acerca de un anuncio utilizado por una agencia de publicidad publicado en las supuestamente especializadas pginas de la revista Fortune. La lnea de este grfico mostraba la impresionante tendencia hacia arriba del crecimiento anual de la agencia. Pero no mostraba ningn nmero aparte de los aos.

  • Darrell Huff Cmo mentir con estadsticas

    35

    Con la misma honestidad, este grfico podra haber representado tanto un tremendo crecimiento, con un ingreso duplicndose o creciendo en millones de dlares al ao, o bien el lento arrastrarse de una pequea empresa esttica que agrega un dlar o dos a su facturacin anual. Pero como dibujo, no deja de ser impresionante.

    Otorgue poca fe a un promedio, a un grfico, o a una tendencia cuando esas importantes cifras no estn presentes. De otro modo estar usted tan ciego como la persona que elije un lugar para acampar basndose solamente en el informe meteorolgico que informa sobre la temperatura media del sitio. Podra considerar 16C como una media anual agradable, lo cual en California le dara a elegir entre dos lugares tan diferentes como el desierto y la isla de San Nicols sobre la costa Sur. Pero puede congelarse, o asarse al spiedo, si desconoce el rango. En San Nicols las temperaturas oscilan en un rango de 8.3C a 30.5C mientras que en el desierto las temperaturas van de 9.4C a +40C.

    La Ciudad de Oklahoma presenta una temperatura anual promedio similar durante los ltimos 60 aos: 15.6C. Pero, como puede ver en cualquier tabla meteorolgica seria, esa agradable y confortable cifra oculta un rango de 54.4C entre un extremo y otro.

  • Darrell Huff Cmo mentir con estadsticas

    36

    4. Mucho ruido y prcticamente pocas

    nueces

    Si no se ofende, comenzaremos por adjudicarle un hijo y una hija. Los llamaremos Peter y Linda (aunque podramos haberlos bautizado con nombres ms de moda). Ambos han completado tests de inteligencia, tal como sucede con muchos nios en edad escolar. Ahora bien, el test de aptitud mental, de cualquier variedad que sea, es uno de los principales fetiches brujos de nuestro tiempo, de modo que tendr que discutir un poco si quiere que le expliquen los resultados. Esta informacin es tan esotrica que muchas veces se la considera segura solamente en las manos de psiclogos y docentes. Y puede ser que tengan razn en eso. De todos modos, un buen da usted se entera que el Cociente Intelectual (CI) de Peter es de 98 y el de Linda es de 101. Por supuesto, usted sabe que el CI se basa sobre un promedio de 100, que es lo que se considera "normal".

    Aj! De modo que Linda es su retoo ms inteligente. Adems, est por sobre el promedio. Peter est debajo del promedio pero no nos amarguemos por eso.

    Cualquier conclusin como la que acabo de hacer es pura tontera.

    Tanto como para despejar el ambiente, empecemos por apuntar que, sea lo que fuere que miden los tests de inteligencia, no es exactamente lo que muchas veces entendemos como producto de la inteligencia. Por ejemplo, no miden cosas tan importantes como capacidad de liderazgo ni creatividad imaginativa. No reflejan valoracin social, ni aptitudes musicales o artsticas, para no mencionar aspectos de la personalidad tales como esmero o equilibrio emocional. Para colmo, los tests que se hacen en las escuelas son con frecuencia del tipo barato-y-rpido que dependen fuertemente de la lectura. Sea lcido o no, el lector mediocre no tiene posibilidades.

    Supongamos que hemos descubierto todo eso y que estamos de acuerdo en considerar al CI simplemente como una medida de algo

  • Darrell Huff Cmo mentir con estadsticas

    37

    definido como la capacidad para resolver problemas dados. Y que Peter y Linda completaron al test que se considera que es el mejor de todos, el de Stanford-Binet corregido, que se completa en forma individual y que no requiere ninguna aptitud especial en materia de lectura.

    Ahora bien, lo que el CI pretende ser es una muestra de la capacidad intelectiva. Como cualquier otro resultado del mtodo de muestreo, el CI es una nmero que contiene un error estadstico siendo que este error estadstico expresa la precisin, o confiabilidad, del nmero.

    El hacer las preguntas que contiene el test es aproximadamente lo mismo que uno hara para estimar la calidad del maz en un sembrado recorrindolo y arrancando una mazorca aqu y otra all al azar. Pelando y observando de este modo, digamos, unas cien mazorcas, uno podra llegar a tener una idea bastante aproximada de la calidad del maz en todo el campo. La informacin as obtenida sera lo suficientemente exacta para hacer una comparacin con otro campo de trigo suponiendo que los dos campos no fuesen muy similares. Si lo fuesen, tendramos que analizar muchas ms mazorcas, calificndolas segn algn criterio preciso de calidad.

    En qu medida nuestra muestra representa con suficiente precisin a todo el campo es algo que puede expresarse en dos nmeros: el error probable y el error estndar.

    Para entenderlo, supongamos que debe usted medir el largo de unos cuantos campos caminando y contando los pasos que da. Lo primero que podra hacer es recorrer algunos de ellos, contar los pasos que dio, calcular la distancia segn los pasos dados y medir despus los largos reales con una cinta mtrica. Probablemente encontrara que, midiendo el largo en pasos, en promedio se ha equivocado usted por una mediana de 2.7 metros. Esto es: en la mitad de los casos, dando pasos, usted calcul una distancia 2.7 metros menor que la real y, en la otra mitad de los casos, una distancia 2.7 metros mayor que la efectivamente medida con la cinta mtrica.

  • Darrell Huff Cmo mentir con estadsticas

    38

    Supongamos que todas las distancias que usted midi a pasos de hombre tenan, en realidad, 100 metros de largo. Su error probable sera entonces de 2.7 metros en 100, es decir, algo as como del 3% a los efectos prcticos. Por consiguiente, la prxima vez que mida esa distancia dando pasos podra registrarla como 100 3 metros.

    (La mayora de los expertos en estadstica prefieren ahora utilizar otro error, similar al que acabamos de ver, llamado error estndar. Toma aproximadamente dos tercios de los casos, en lugar de exactamente la mitad como acabamos de hacer y es considerablemente ms prctica en un sentido matemtico. Para nuestros propsitos, nos quedaremos con el error probable, que es el que generalmente se utiliza al aplicar el test de Stanford-Binet).

    Al igual que en el caso hipottico de nuestra medicin por pasos, se ha hallado que el error probable del Stanford-Binet es de un 3%. Esto no tiene nada que ver con qu tan bueno es el test bsicamente. Solo tiene que ver con la consistencia de sus mediciones. De modo que el CI de Peter podra ser ms correctamente expresado como 98 3 y el de Linda como 101 3.

    Esto significa que el CI de Peter podra, en realidad, caer entre 95 y 101 con la misma probabilidad de un 50% con la que el de Linda podra estar entre 98 y 104. A partir de esto, no es muy difcil de ver que hay una posibilidad en cuatro de que el CI real de Peter sea de ms de 101 y el real de Linda caiga por debajo de 98. En ese caso Peter no estara por debajo de Linda sino que la sobrepasara, y por un margen de cualquier valor desde 3 puntos o ms.

    A lo que nos conduce todo esto es a que la nica manera de pensar en Cocientes Intelectuales y en los resultados de muchas otras muestras es en rangos. Lo "normal" no es 100 sino el rango entre, digamos, 95 y 105 y tendra sentido comparar un nio de este rango con otro de un rango superior o inferior. Pero comparaciones entre nmeros con pequeas diferencias carecen de sentido. Debera usted tener siempre en mente ese "ms/menos", incluso (y especialmente) cuando no est explicitado.

  • Darrell Huff Cmo mentir con estadsticas

    39

    El ignorar estos errores, que estn implcitos en todos los estudios por muestreo, ha llevado a algunos comportamientos notoriamente estpidos. Existen editores de revistas para los cuales las encuestas de lectores son la Biblia, principalmente porque no las entienden. Con 40% de lectores masculinos informados para un artculo y slo 35% para otro, salen a exigir ms artculos como el primero.

    La diferencia entre un 35% y un 40% de lectores puede ser importante para una revista, pero como diferencia de encuesta puede no ser real. Cuestiones de presupuesto con frecuencia limitan las muestras de lectores a unos pocos centenares de personas, en especial despus de haber eliminado a todos los que no leen esa revista en absoluto. Para una revista que se orienta especialmente a las mujeres, los hombres en la muestra pueden ser muy pocos. Para cuando estos pocos han sido divididos entre quienes responden que han "ledo todo", los que han "ledo la mayor parte", los que han "ledo algo" y los que "no han ledo" el artculo en cuestin, la conclusin del 35% puede estar basada tan solo en un puado de personas. El error probable, oculto detrs del sonoro porcentaje, puede ser tan grande que el editor que confa en el nmero est, en realidad, movindose al borde de un precipicio.

  • Darrell Huff Cmo mentir con estadsticas

    40

    A veces se hace un gran escndalo a raz de una diferencia que es matemticamente real y demostrable pero tan pequea que no tiene ninguna importancia. Esto desafa el antiguo dicho que dice que una diferencia es una diferencia solo si hace la diferencia. Un caso como se, de una grana batahola por prcticamente nada, fue el impulsado de un modo tan efectivo como rentable por la gente de los cigarrillos Old Gold.

    Comenz de un modo inocente con el editor del Reader's Digest, que fuma cigarrillos pero, con todo, no los tiene en gran estima. Su revista se puso a trabajar y contrat a una serie de gente de laboratorio para analizar el humo y todo lo dems de varias marcas de cigarrillos. La revista public luego los resultados y lo que result de los nmeros publicados fue que todas las marcas eran virtualmente idnticas y que no haba ninguna diferencia en fumar la una o la otra. Ahora bien, uno pensara que se fue un duro golpe para los fabricantes de cigarrillos y para los sujetos dedicados a crear nuevos enfoques de publicidad en las agencias. Uno hubiera credo que hara explotar todos los anuncios acerca de gargantas secas y dientes manchados.

    Pero alguien descubri algo. En la lista de venenos casi idnticos, un cigarrillo tena que estar al principio y otro al final, y el que qued al final fue Old Gold. Salieron los telegramas e inmediatamente aparecieron grandes anuncios en los diarios con la tipografa ms grande disponible. Los ttulos y los artculos decan simplemente que, de todos los cigarrillos analizados por esa gran revista de alcance nacional, Old Gold tena la menor cantidad de cosas indeseables en su humo. Por supuesto: se excluyeron todos los nmeros y cualquier pista sobre el hecho de que la diferencia era despreciable.

    Al final, a la gente de Old Gold se le orden que "cesara y desistiera" de una publicidad tan engaosa. Lo cual, por supuesto, no cambi la situacin en nada; el beneficio ya haba sido cosechado haca mucho. Tal como lo dijo la publicacin New Yorker: siempre habr alguien de publicidad a mano.

  • Darrell Huff Cmo mentir con estadsticas

    41

    5. El grfico fantstico

    Los nmeros causan terror en alguna medida. En "Alicia en el Pas de las Maravillas", la confianza de Humpty-Dumpty al decirle a Alicia que l era el Seor de las palabras que usaba no se contagiara a muchas personas tratndose de nmeros. Quizs sufrimos de un trauma inducido por la aritmtica de la escuela primaria.

    Sea cual fuere la causa, ese miedo le crea un problema al escritor que quiere ser ledo, al hombre de publicidad que quiere vender un producto, al editor que quiere que sus libros y revistas se hagan populares. Pero cuando los nmeros en forma tabulada se vuelven tab y las palabras no alcanzan para lograr el objetivo, como es el caso con frecuencia, siempre queda todava un recurso posible: dibujar un grfico.

    Probablemente el dibujo estadstico, o grfico, ms simple es del tipo lineal. Es muy til para mostrar tendencias, algo que prcticamente todo el mundo est interesado en mostrar, o en saber, o en lamentar, o en predecir. Bueno, hagamos que nuestro grfico muestre cmo el ingreso nacional ha aumentado un 10% en un ao.

    Comience con un papel cuadriculado. Ponga el nombre de los meses abajo en forma horizontal. Indique billones de dlares sobre el costado izquierdo en forma vertical. Ubique los puntos de las cantidades mensuales y nalos por una lnea. Su grfico tendr este aspecto:

  • Darrell Huff Cmo mentir con estadsticas

    42

    Bien. Esto qued bastante claro. Muestra lo que sucedi durante el ao y lo muestra mes por mes. El que lo mire puede ver y comprender, porque todo el grfico es proporcionado y hay un lnea de cero en la base para comparar. Nuestro 10% parece un 10%, es decir: una tendencia ascendente que podr ser importante pero nada tan extraordinario.

    Y eso est muy bien si todo lo que queremos hacer es transmitir informacin. Pero supongamos que queremos ganar una discusin, o asombrar a un lector, o moverlo a que tome una decisin, o venderle algo. Para todo eso a este grfico le falta salero. As que, eliminemos la parte inferior.

    Bueno, eso parece mejor. (Tambin ahorramos papel, lo cual no deja de ser otro argumento si algn sujeto insufrible objeta el manipuleo de nuestro grfico). Los nmeros son los mismos y la curva tambin es la misma. Es el mismo grfico. Nada ha sido falsificado . . .

  • Darrell Huff Cmo mentir con estadsticas

    43

    excepto la impresin que causa. Lo que el lector superficial ve ahora es una lnea del ingreso nacional que sube por una pendiente pronunciada en doce meses, y todo ello porque la mayor parte del grfico ya no est. Es como la parte faltante de una oracin de las que se estudian en las clases de gramtica: queda "sobreentendida". Por supuesto, el ojo no "sobreentiende" lo que no est all y, visualmente, un pequeo aumento se ha convertido en un aumento importante.

    Bien, ahora que hemos aprendido a engaar, por qu limitarnos a truncar? Tenemos un truco adicional que vale por una docena del que ya aplicamos. Har que nuestro modesto 10% aparezca como algo ms extraordinario de lo que hasta un 100% est autorizado a parecer. Simplemente procedemos a cambiar la proporcin entre las ordenadas y las abscisas. No hay ninguna regla que lo impida y le dar a nuestro grfico un aspecto totalmente diferente. Todo lo que hay que hacer es que cada divisin de la escala a la izquierda (la de los dlares) represente solo una dcima parte de lo que antes representaba. Con ello, la escala de los dlares se "estira" hacia arriba, se hace ms larga y queda as:

  • Darrell Huff Cmo mentir con estadsticas

    44

    Esto s que es impresionante, no es cierto? Cualquiera que lo mire hasta puede sentir la prosperidad subiendo por las arterias del pas. Es una forma sutil de sustituir: "El ingreso nacional subi un 10%" por " . . . y el ingreso nacional tuvo un aumento espectacular del 10%". Sin embargo, el grfico es infinitamente ms efectivo porque no contiene adjetivos ni adverbios que arruinen la ilusin de objetividad. Y nadie puede acusarlo a usted de nada.

    Por lo dems, estar usted en buena o al menos respetable compaa. Truncando el grfico y eliminado todo lo que estaba por debajo de la marca de 80, la revista Newsweek us este mtodo para mostrar que "La suba de las acciones registr el rcord de los ltimos 21 aos" en 1951. Al ao siguiente, un anuncio de la Columbia Gas System public un grfico en el Time mostrando "Nuestro Nuevo Informe Anual". Si uno se fijaba en los nmeros impresos en tipografa minscula y los analizaba, hallaba que durante un perodo de 10 aos los costos haban subido un 60% y el costo del gas haba bajado un 4%. Es un resultado favorable pero, aparentemente, no lo suficientemente favorable para Columbia Gas. Truncaron su grfico en la marca del 90% (sin ningn hueco u otra indicacin de advertencia) de modo que el ojo le deca al lector que el costo de vida se haba ms que triplicado y el gas se haba abaratado en un tercio!

    Las compaas siderrgicas han utilizado mtodos grficos similarmente engaosos para alinear a la opinin pblica en contra de aumentos de salarios. Con todo, el mtodo est lejos de ser nuevo y su incorreccin fue denunciada hace mucho tiempo y no solo en las publicaciones tcnicas dirigidas a expertos en estadstica. Un editorial del Dun's Review de 1938 reprodujo el grfico de un anuncio publicado por la publicidad de Washington D.C. El argumento se hallaba prolijamente explicitado en el ttulo puesto arriba del grfico: "CRECE LA NMINA DEL GOBIERNO!". La lnea del grfico acompaaba bien la exclamacin, aun cuando los nmeros que expresaba no lo hacan. Lo que mostraron fue un aumento de cerca de $19.500.000 a $ 20.200.000. Pero la lnea roja se disparaba desde la esquina inferior izquierda del grfico hasta el borde superior haciendo que un aumento de menos del 4%

  • Darrell Huff Cmo mentir con estadsticas

    45

    apareciera como uno de ms de 400. Al lado de esa reproduccin, la revista public su propia versin del grfico, con los mismos nmeros y una lnea roja honestamente generada, todo ello bajo el ttulo de: "NMINA DEL GOBIERNO, ESTABLE!"

    Collier's ha utilizado el mismo tratamiento con un grfico de barras en anuncios periodsticos. Note usted que la mitad del grfico ha sido recortado:

    De un anuncio del 24 de Abril de 1953

    para el Collier's

  • Darrell Huff Cmo mentir con estadsticas

    46

    6. Grficos con personajes

    Hace una dcada o algo as, uno poda escuchar muchas cosas acerca del "pequeo ciudadano", en referencia a prcticamente todos nosotros. Cuando esto empez a sonar como algo demasiado condescendiente, nos convertimos de pronto en "el ciudadano comn". Pero tambin esto se olvid, lo cual probablemente no fue lamentado por nadie. Pero el pequeo hombrecillo todava sigue entre nosotros. Es el personaje del grfico.

    Un grfico en el cual un hombrecillo representa a un milln de habitantes, o bien una bolsa de dinero o una pila de monedas que representan miles o millones de dlares, o el contorno de un novillo ilustrando nuestra provisin de carne para el ao siguiente; todo ello es un grfico pictrico. Es una herramienta til. Es lo que me temo que se conoce como visualmente atrapante. Pero el personaje tiene la capacidad de convertirse en un mentiroso que miente con fluidez, tortuosidad y mucho xito.

    El padre del grfico pictrico, o pictograma, es el grfico de barras comn. Es un simple y popular mtodo de representar cantidades cuando se quiere comparar a dos o ms de ellas entre s. Una barra tambin es capaz de engaar. Sospeche de toda versin en la cual las barras cambian de ancho tanto como de alto siendo que representan el mismo factor; y sospeche tambin de los grficos en dnde se muestran objetos tridimensionales cuyos volmenes no son fcilmente comparables. Un grfico de barras truncado tiene y merece la misma reputacin que el grfico de lnea truncado del que ya hemos hablado. El hbitat usual del grfico de barras es el libro de geografa, el informe corporativo, y la revista de noticias. Y esto es vlido tambin para su vstago visualmente atrapante.

    Quizs se me ocurra querer mostrar una comparacin entre dos nmeros digamos que entre el sueldo semanal promedio de un carpintero de los Estados Unidos y el de un pas que llamaremos

  • Darrell Huff Cmo mentir con estadsticas

    47

    Rotundia, tanto como para darle un nombre. Las sumas podran ser de $60 y de $30 para cada caso. Pero como quiero atrapar su mirada con esto, no me conformo con mostrarle solamente los nmeros. Por lo tanto, construyo un grfico de barras. (Dicho sea de paso: si ese nmero de $60 no coincide con la sustancial suma que usted le pag a su carpintero cuando su porche necesit una nueva baranda el verano pasado, recuerde que su carpintero puede no haber tenido tanta suerte todas las semanas del ao como la que tuvo trabajando para usted. Y de cualquier modo, yo no dije qu clase de promedio utilic, ni cmo lo calcul, de modo que no le servir de nada tratar de entrar en sutilezas. Puede ver ahora qu fcil es esconderse detrs de la estadstica ms indecorosa si no se incluye ninguna informacin adicional? Probablemente usted ya ha adivinado que acabo de inventar ese nmero; pero no hubiera sospechado tanto si en vez de $60 yo hubiera usado algo as como $59.83).

    Pues ah lo tiene. Con los dlares indicados sobre el lado izquierdo. Es un grfico honesto y claro. El doble de dinero es el doble de grande en el grfico y se ve como tal.

    Ahora, nuestro grfico carece de esa "visualidad atrapante" de la que hablbamos, no es cierto? Puedo remediar eso con facilidad utilizando algo que se parezca ms al dinero que una simple barra: por ejemplo, bolsas de dinero. Una bolsa para la miseria rotundia y dos bolsas para el salario norteamericano. O tres para el rotundio y

  • Darrell Huff Cmo mentir con estadsticas

    48

    seis para el americano. De cualquier de las dos formas, el grfico sigue siendo honesto y claro, y no engaar a la mirada superficial. sa es la forma en que se hace un grfico honesto.

    Me quedara satisfecho con eso si todo lo que quisiera hacer es comunicar informacin. Pero quiero ms. Quiero decir que el trabajador norteamericano est muchsimo mejor que el rotundio y mientras ms pueda dramatizar la diferencia que hay entre 30 y 60, tanto mejor ser para mi argumento. A decir verdad (que es precisamente lo que me propongo no hacer), lo que quiero es que usted infiera algo, que tenga una impresin exagerada, pero no quiero que me pesquen con mis trucos. Hay una forma de hacerlo, y se la usa todos los das para engaarlo a usted.

    Simplemente dibujo una bolsa de dinero para representar los 30 dlares rotundios y despus dibujo una bolsa el doble de grande para representar los 60 norteamericanos. Eso es proporcional, o no?

    Bueno, ahora s. Eso ya da la impresin que estoy buscando. Al lado del salario norteamericano el de Rotundia parece un enano.

    La trampa, por supuesto, es la siguiente. Desde el momento en que la segunda bolsa es el doble de alta que la primera, tambin es el doble de ancha. Por eso, ocupa no el doble sino cuatro veces ms superficie sobre la pgina. Los nmeros expresarn una relacin de 2 a 1 pero la impresin visual que es la que predomina la mayor parte del tiempo dir que la relacin es de 4 a 1. O ms. Desde el momento en que se trata de imgenes que en realidad tienen tres dimensiones,

  • Darrell Huff Cmo mentir con estadsticas

    49

    la segunda imagen tambin debera ser no solo el doble de ancha sino tambin el doble de gruesa. Como cualquier libro de geometra nos puede decir, los volmenes de slidos similares varan segn el cubo de cualquiera de sus dimensiones. Dos, por dos, por dos es igual a ocho. Por lo tanto, si una de las bolsas contiene $30, la otra, con ocho veces ese volumen, tendra que contener no $60 sino $240.

    Y sa es justamente la impresin que mi ingenioso pequeo grfico produce. Diciendo "doble" he dejado la duradera impresin de una impresionante relacin de 8 a 1.

    Adems, se ver usted en dificultades para acusarme de cualquier intencin criminal. Solo estoy haciendo lo que mucha otra gente importante hace tambin. La revista Newsweek lo ha hecho y precisamente con bolsas de dinero.

    El American Iron and Steel Institute 11 lo hizo, con los dibujos de unos altos hornos. La idea consisti en mostrar como la capacidad de la industria para producir acero haba aumentado extraordinariamente entre las dcadas de los 1930 y los 1940, argumentando que la industria estaba haciendo por su cuenta una labor tan excelente que cualquier intervencin gubernamental resultaba indeseable. Haba ms mrito en el principio que en la forma en que fue presentado. El alto horno que representaba la capacidad de 10 millones de toneladas agregadas en los aos 30 estaba dibujado justo dos tercios ms chico que el otro de 14.25 millones de toneladas agregado durante los 40. El ojo vea dos hornos, uno de ellos casi tres veces ms grande que el otro. Decir "casi uno y medio" y lograr una impresin de "tres" eso es lo que el dibujo unidimensional puede lograr.

    11 Instituto Norteamericano del Hierro y del Acero (N. del T.)

  • Darrell Huff Cmo mentir con estadsticas

    50

    Esta pieza de arte hecha por la gente de la siderurgia tena algunos otros puntos de inters adicionales. De alguna manera, el segundo horno haba engo