15
I. CONCEPTOS BÁSICOS. Dr. Pedro Fernando Pinto Guerrero Estadística: es una ciencia formal 1 que constituye parte de la ciencia matemática aplicada y que estudia los métodos, técnicas y procedimientos relacionados a la recolección, elaboración y análisis de datos y su transformación en información que permita tomar decisiones en condiciones de incertidumbre. Es una parte de la matemática porque emplea todo el conocimiento matemático: Aritmética: sumatorias, productorias, potencias y raíces, proporciones, regla de tres, etc. Algebra: despeje de fórmulas, resolución de ecuaciones, regresión lineal y no lineal, etc. Análisis matemático: derivación e integración en el manejo de modelos de distribución, funciones bivariantes y multivariantes, Probabilidades y geometría analítica (gráficas y regresiones, series cronológicas, etc.). Y es de las matemáticas aplicada, porque utiliza los conocimientos teóricos de la matemática formal para la gestión de los datos en información. Método 2 : es un conjunto sistemático y ordenado de normas y de reglas, cuyo cumplimiento facilita alcanzar metas, objetivos y fines particulares y específicos. Por ejemplo, para la recolección de datos, podemos aplicar métodos empíricos: la observación o la experimentación, para elegir una población se puede aplicar el método del muestreo, etc. Técnica: es el ordenamiento de la conducta o determinadas formas de actuar y usar saberes y herramientas como medio para alcanzar un fin determinado. Esta conformada por uno o varios procedimientos. Por ejemplo, para calcular probabilidades se utiliza las técnicas de contar 3 : combinaciones, permutaciones, variaciones. Procedimiento: es una sucesión cronológica de operaciones concatenadas entre sí, que se constituyen en una unidad de función para la 1 En la clasificación de las ciencias que emplea Mario Bunge (ciencias formales y ciencias fácticas), las formales están constituidas por la lógica y las matemáticas, en ese sentido la estadística como parte de las matemáticas aplicada se constituye en una ciencia formal. 2 Empleamos modificaciones al concepto desarrollado por Luis Piscoya Hermoza en Investigación Científica y educacional, p.23. 3 Seymor Lipzshut. Probabilidad, p.

Primer Capitulo Conceptos Básicos

Embed Size (px)

DESCRIPTION

conceptos basicos para iniciar el estudio de la estadistica

Citation preview

Page 1: Primer Capitulo Conceptos Básicos

I. CONCEPTOS BÁSICOS.Dr. Pedro Fernando Pinto Guerrero

Estadística: es una ciencia formal1 que constituye parte de la ciencia matemática aplicada y que estudia los métodos, técnicas y procedimientos relacionados a la recolección, elaboración y análisis de datos y su transformación en información que permita tomar decisiones en condiciones de incertidumbre.

Es una parte de la matemática porque emplea todo el conocimiento matemático:

Aritmética: sumatorias, productorias, potencias y raíces, proporciones, regla de tres, etc. Algebra: despeje de fórmulas, resolución de ecuaciones, regresión lineal y no lineal, etc. Análisis matemático: derivación e integración en el manejo de modelos de distribución, funciones

bivariantes y multivariantes, Probabilidades y geometría analítica (gráficas y regresiones, series cronológicas, etc.).

Y es de las matemáticas aplicada, porque utiliza los conocimientos teóricos de la matemática formal para la gestión de los datos en información.

Método2: es un conjunto sistemático y ordenado de normas y de reglas, cuyo cumplimiento facilita alcanzar metas, objetivos y fines particulares y específicos. Por ejemplo, para la recolección de datos, podemos aplicar métodos empíricos: la observación o la experimentación, para elegir una población se puede aplicar el método del muestreo, etc.

Técnica: es el ordenamiento de la conducta o determinadas formas de actuar y usar saberes y herramientas como medio para alcanzar un fin determinado. Esta conformada por uno o varios procedimientos. Por ejemplo, para calcular probabilidades se utiliza las técnicas de contar3: combinaciones, permutaciones, variaciones.

Procedimiento: es una sucesión cronológica de operaciones concatenadas entre sí, que se constituyen en una unidad de función para la realización de una actividad o tarea específica dentro de un ámbito predeterminado de aplicación. Todo procedimiento involucra actividades y tareas del personal, determinación de tiempos de métodos de trabajo y de control para lograr el cabal, oportuno y eficiente desarrollo de las operaciones. Por ejemplo el procedimiento para estimar la media poblacional a partir de la media muestral.

Los tres conceptos anteriores tipifican la definición de la estadística, estableciendo una jerarquía de tal manera que los métodos incluyen técnicas y estos procedimientos.

Incertidumbre: es el grado de desconocimiento de una condición futura, originada en la falta o contradicción de información.

Ejemplo1. Un paciente muestra signos y síntomas que hacen suponer la presencia de hiperglicemia, el médico refiere y solicita un examen de sangre para cuantificar el nivel de glucosa en la sangre. Al obtener una muestra de sangre, desconocemos si el valor de la glicemia esta dentro o fuera de un rango normal, por lo tanto existe incertidumbre, esta situación se resolverá el instante en el que aplicando:

El método de Somogyi-Nelson4, sobre la base del principio que el reactivo de Somogyi al actuar con la glucosa, reduce al ion cúprico en ion cuproso, en medio alcalino caliente,

1 En la clasificación de las ciencias que emplea Mario Bunge (ciencias formales y ciencias fácticas), las formales están constituidas por la lógica y las matemáticas, en ese sentido la estadística como parte de las matemáticas aplicada se constituye en una ciencia formal.2 Empleamos modificaciones al concepto desarrollado por Luis Piscoya Hermoza en Investigación Científica y educacional, p.23.3 Seymor Lipzshut. Probabilidad, p. 4 http://www.unal.edu.co/ingenieria/revista/revista/articulos/art1.pdf

Page 2: Primer Capitulo Conceptos Básicos

La técnica de la espectrofotometría mediante el uso del fotocolorímetro, El procedimiento correspondiente,

Se obtendrá un resultado que con cierto nivel de confianza señalará la glicemia de la muestra y por estimación el nivel de glucosa del individuo, con esta información se procederá a ejecutar un tratamiento.

Clasificación de la estadística: Se clasifica en descriptiva e inferencial. La estadística descriptiva se circunscribe al estudio de los métodos, técnicas y procedimientos que permiten la recolección, elaboración y análisis de los datos y su transformación en información, tanto en poblaciones como muestras. De acuerdo al número de variables “descritas” la estadística descriptiva puede ser unidimensional ó univariante, bidimensional ó bivariante, o finalmente multidimensional ó multivariante. Aunque el término “descriptiva” es limitante, el alcance de la estadística descriptiva abarca el nivel comparativo, el correlacional y el experimental.

La estadística inferencial, estudia los métodos, técnicas y procedimientos que permiten la toma de decisiones sobre la base de información procedente de muestras, respecto a fenómenos de la población. Inferir es suponer, estimar “algo” a partir de otro conocimiento.

La estadística inferencial, emplea como base de su desarrollo el estudio de la teoría de probabilidades, que mide el grado de incertidumbre en la toma de decisiones, de allí que los principales temas de estudio son: la teoría de conjuntos, las técnicas de contar, la teoría de las probabilidades, la teoría del muestreo, la prueba de hipótesis, las estimaciones, etc.

Población y muestra: Población es un conjunto de elementos5 que presentan al menos una característica6 común. Las poblaciones se clasifican por el número de elementos en finitas e infinitas, las poblaciones finitas tienen un número determinado de elementos, que pueden ser enumerados, las infinitas presentan un número ilimitado de elementos, pueden ser numerables (que se pueden contar) y no enumerables (que no se pueden contar).

Existen poblaciones finitas, pero donde no se puede determinar su número, dichas poblaciones se consideran finitas hipotéticamente infinitas, ejemplos: Población finita:

a) Alumnos matriculados en la facultad durante la gestión 2007. b) Muestras de orina procesadas en el SELADIS durante el mes de enero de 2008.c) Tabletas de Bisacodilo envasadas por un laboratorio durante una semana.

Población infinita enumerable:a) Lanzamientos de una moneda sobre una mesa.b) Giros completos de una rueda en movimiento permanente.c) Oscilaciones de un péndulo de movimiento radial constante.

Población infinita no enumerable:a) Las coordenadas de los puntos que constituyen una línea rectab) Los valores del nivel de glicemia existentes en el intervalo de normalidad.c) Los valores del ácido úrico compatible con la vida por encima del intervalo de normalidad.

Población finita hipotéticamente infinita:a) Las personas con gripe en el presente día en la ciudad de La Paz.b) Las muestras de agua de 5 ml que se pueden obtener de un río.c) Las partículas de carbón que desprenden las chimeneas del área industrial en un día determinado.

5 Algunas veces se restringe el concepto de población a un conglomerado humano, tal apreciación es errónea, pues se asume el concepto de población como equivalente al concepto de UNIVERSO, que se estudia en la teoría de conjuntos.6 Es una propiedad que distingue a un elemento de otro, el color de los ojos, el nivel de glicemia, la tenencia de cerebro, la opinión sobre un problema, etc.

Page 3: Primer Capitulo Conceptos Básicos

Muestra es un subconjunto de una población. Se clasifican en aleatoria y determinística, Es aleatoria cuando la base de selección de sus elementos consiste en la premisa: “ todo elemento de la población debe tener la misma probabilidad de ser elegido como parte de la muestra”. Cuando se rompe este criterio la muestra se convierte en deterministica. Por lo tanto, una muestra es deterministica cuando los criterios de selección de los elementos no incluyen la aleatoriedad, en su lugar pueden ser la accesibilidad, la comodidad, el costo o finalmente la voluntad o conocimiento del “muestrista”.

Se trabaja con muestras cuando no es posible ejecutar el estudio completo de la población7, pero debe quedar claro que el objetivo es conocer información sobre la población, por ende la muestra debe ser “representativa” de la población. Pero, surge una pregunta ¿cómo puede ser “algo” representativo de un “algo mayor” desconocido?, por ello que el criterio de representatividad se circunscribe a la aleatoriedad, es decir, para que una muestra sea “representativa estadísticamente” debe ser aleatoria ó sus sinónimos “estocástica”, “probabilística”.

El proceso de conocer sobre la población a partir de la muestra se conoce como inferencia estadística, es decir, se pretende conocer los “parámetros poblacionales” a partir de los “estadísticos muestrales”. Esta acción la realizamos de manera empírica a diario, lo que hace la estadística es medir la “certidumbre” de la estimación.

Ejemplo 2. En relación al ejemplo 1. para conocer la Glicemia del individuo, le tomamos una “muestra conveniente” de sangre, y ejecutamos la pericia del laboratorio correspondiente, obtenemos un resultado, dicho resultado es sobre la muestra de sangre, sin embargo, asumimos (de manera no conciente) que la muestra es representativa de toda la sangre del individuo y por último afirmamos que el nivel de glicemia es del individuo, es obvio que el tratamiento lo realizaremos no a la muestra sino al individuo.

Ejemplo 3. Hay la denuncia que el vino “Rica uva” esta provocando trastornos en sus consumidores, existe la sospecha que el nivel de metanol sobrepasa los máximos permitidos, se remite al laboratorio una muestra de botellas de vino, a su vez de una de las botellas se toma una muestra que es sometida al análisis bromatológico, se encuentra que el nivel de metanol esta en los niveles permitidos, la pericia concluye que el trastorno atribuido al vino no se origina en el contenido de metanol y se infiere (estima) que el resto del vino producido esta en la misma condición de la muestra.

La estimación es un proceso que se desarrolla sobre la base del análisis de probabilidades, de tal manera que se mide la “certidumbre” de una decisión tomada, que no es lo mismo que la “adivinación”, donde no existe medición de la incertidumbre.

Características de una población: constantes y variables. Característica es una peculiaridad que distingue a un elemento de una población, por ejemplo, en una población de pacientes, la edad es una característica de cada paciente, el tratamiento al que es sometido, la respuesta a los fármacos administrados, la opinión acerca del servicio hospitalario, el estado de animo, su frecuencia cardiaca, nivel de acido úrico, la zona de domicilio, número de hijos vivos (no los tontos), operaciones a las que fue sometido, etc., etc. Podríamos decir que un paciente es un conjunto de características.

7 Las razones para estudiar muestras en lugar de la población son varias, entre ellas: a. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo. b. Como consecuencia del punto anterior ahorraremos costes. c. Estudiar la totalidad de los pacientes o personas con una característica determinada en muchas ocasiones puede ser

una tarea inaccesible o imposible de realizar. d. Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las observaciones y mediciones realizadas a

un reducido número de individuos pueden ser más exactas y plurales que si las tuviésemos que realizar a una población.

La selección de muestras específicas nos permitirá reducir la heterogeneidad de una población al indicar los criterios de inclusión y/o exclusión.

Page 4: Primer Capitulo Conceptos Básicos

Las características se clasifican en constantes y variables. Las características constantes son aquellas que admiten un único valor, por ejemplo en una población de mesas de madera, la característica tipo de material de la mesa, admitirá sólo una respuesta: madera.

Si todas las características fueran constantes, sólo existiría la nada, de esa manera, lo que da la razón de existencia son las diferencias, que se traducen en las variables.

Variable, son características que pueden asumir mas de un valor, por ejemplo, en una población de muestras de sangre procesadas en un laboratorio, el nivel de la glicemia puede adoptar diferentes valores.Las variables se clasifican de diversa manera:

Por la forma de valoración: cualitativa, cuantitativa discreta y cuantitativa continua.• Variable cualitativa, se valora empleando la “observación8 ”.• Variable cuantitativa discreta, se valora empleando el “conteo” o recuento.• Variable cuantitativa continua, se valora empleando la “medición” o mensuración.

Por el tipo de nivel9 de medición10 . Existen cuatro tipos de niveles: nominal, ordinal, de intervalo y de razón (ratio). La idea empirica de “nivel” nos lleva ineluctablemente a una valoración cualitativa ordinal, es decir, existe un orden conceptual de ubicación del nivel mas bajo hacia un nivel mas alto.

Esta forma de clasificación surgió al conceptualizar la medición como la aplicación de un valor numérico a las modalidades en que se presenta una característica variable, por ejemplo, la variable sexo, se puede clasificar en dos modalidades: masculino y femenino, por razones de codificación se puede asignar un número 1 a masculino y 2 a femenino, estos números asignados representan sólo una forma numérica de codificar las categorías de la variable sexo, pero no implican ningún tipo de orden. Otro tanto, ocurre cuando la variable escala de calificación (nota de aprovechamiento) se transforma de su valoración cuantitativa a su percepción cualitativa. Estos dos niveles de escala sólo se pueden aplicar cuando la variable adopta diferentes categorías nominales y por ende sus datos no son numéricos. En cambio, en las variables cuantitativas el dato es un valor numérico que no requiere transformación y sólo necesita organización, sin embargo, la variable puede adoptar formas que posibilitan la existencia de un cero absoluto o de un cero relativo, y que obligan a la existencia de la escala de intervalo (cero relativo) y la escala de razón (cero absoluto).

1) Nominal, cuando la variable se clasifica en categorías que constituyen sustantivos, adjetivos, etc. literales, es decir nominales , y entre los que sólo se establecen criterios comparativos de igualdad y no igualdad. Ej. Sexo, estado civil, procedencia de colegio, zona de domicilio, color de la orina, aspecto de las heces, etc.

2) Ordinal, cuando la variable se clasifica en categorías nominales, pero entre las que existe un orden relativo a un criterio de ordenamiento. De esa manera, se establece entre las categorías, además de los juicios de igualdad y no igualdad, los criterios de desigualdad (mayor y menor) y de orden. Ej. Departamento de origen del nacimiento (Chuquisaca, Potosí, La Paz, Santa Cruz, Cochabamba, Oruro, Tarija, Beni, Pando) el orden relativo es a la fecha de fundación. Otros autores clasifican a los departamentos por abecedario, zona geográfica o criterios conjugados. Lo que es cierto que se establece un orden relativo entre los departamentos. Si asignamos un valor numérico, este puede cambiar de acuerdo al tipo de ordenamiento elegido.

8 Se entiende desde el punto de vista amplio, es decir, la observación sensorial (a través de los sentidos) y la que proviene como respuestas no cuantitativas.9 En la obra original figura la denominación de “scales” es decir escalas, por esta razón en variados libros emplean en lugar de niveles de medición el término escalas de medición.10 Stanley Smith Stevens, desarrollo el análisis de los niveles de medición (level of measurements) de gran uso e influencia no sólo en el campo de la psicología experimental y que ha originado que otros estudiosos de la estadística rechacen los aportes del autor.Stevens S. S. “On the Theory of Scales of Measurement”. In Science v. 103, n. 2384, june 1946.

Page 5: Primer Capitulo Conceptos Básicos

En algunos casos se realiza un procedimiento inverso, es decir a un valor numérico convencional se le asigna una percepción cualitativa, es el caso de la variable escala de calificación vigente hasta junio 1972 en certificados de estudios universitarios en la UMSA: 1 = pésimo; 2 = malo; 3 = deficiente; 4 = regular; 5 = bueno; 6 = muy bueno y 7 = excelente ó la variable escala de calificación vigente en la UMSA a partir de julio 197211.

Se puede verificar que la categoría muy bueno es mayor que la categoría bueno, pero, no es posible diferenciar numéricamente.

Estos dos tipos de escala son exclusivos de las variables cualitativas.

3) De intervalo, cuando los datos de la variable son números, que pueden formar parte de intervalos en los que se clasifica la escala de la variable, de tal manera, que la diferencia entre valores de la variable se puede comparar con la diferencia de otro par de valores, es decir si los valores son 2, 5 y 8, puedo establecer que 8 – 5 = c ( 5 – 2), en otras palabras podemos establecer una razón geométrica al despejar el valor de “c”.

Lo anterior, lleva a que se establezca un “cero relativo”, es decir un valor origen, que sólo representa una valoración de la variable, por ejemplo en la escala de temperatura el 0º C es una temperatura, es un cero relativo, es un valor, pero de ninguna significa que no exista temperatura. Otros ejemplos, los años de la era cristiana, el año 0 (nacimiento de Cristo) no significa que no exista dicho año; la calificación porcentual de un examen, el que obtiene 0 % no es igual al que no ha asistido, 0% es una nota, no significa que no rindió el examen.

En la escala ordinal no se puede conocer cuanto mayor es “excelente” de “muy bueno”, en cambio, en la escala ordinal 35ºC es mayor en 5ºC a la temperatura de 30ºC. De igual manera, se puede multiplicar y dividir las diferencias entre dos valores de la escala, sin embargo, no tiene sentido interpretativo la multiplicación y división entre los valores mismos de la escala de intervalo.

4) De razón (ratio o proporcional), es una escala de intervalo en la que existe un cero absoluto, que significa ausencia de la característica, y se puede multiplicar o dividir los valores mismos de la escala, ejemplo: la variable número de cigarrillos diarios que una persona fuma. El valor cero significa que la persona “no fumo”, La variable número de hermanos varones vivos, el dato 0 significa ningún hermano.

La escala de razón es el mas alto nivel de escalas, con sus valores se puede sumar, restar, multiplicar y dividir.

Por el tipo de relación: dependiente e independiente

Cuando se relacionan dos conjuntos de elementos, es posible establecer correspondencia univoca y biunívoca, entre los elementos de los conjuntos, asimismo se puede caracterizar a uno de los conjuntos como de partida y el otro de llegada. Si la relación adopta la forma biunívoca se establece una función, de tal manera que esta constituida por pares ordenados, en los que el primer elemento corresponde al conjunto de partida y el segundo al conjunto de llegada. Se denomina función al conjunto de pares ordenados, donde la única restricción es que no pueden existir dos o mas pares ordenados con el mismo primer elemento.

11 La escala de calificación vigente da primacía a la forma porcentual, sin embargo, existe la equivalencia cualitativa siguiente: 1-50 reprobado; 51-63 suficiente; 74-76 bueno; 77-89 distinguido; 90-100 sobresaliente, este aspecto se encuentra detallado al pie de las certificaciones de estudio.

Page 6: Primer Capitulo Conceptos Básicos

Los conjuntos se simbolizan por letras a las que denominamos variables, de tal manera que el conjunto de partida corresponde a la variable independiente y el conjunto de llegada a la variable dependiente, esto se explica por la regla de correspondencia y = f (x).

Estadística unidimensional y multidimensional: La estadística se puede clasificar por el número de variables estudiadas. Unidimensional o univariante cuando el objeto de estudio es una sola variable, y multidimensional o multivariante cuando se estudian las relaciones entre varias variables, destaca en este grupo la estadística bidimensional o bivariante, que estudia las relaciones entre dos variables.

EJERCICIOS Y PROBLEMAS UNO.

1. Establecer 5 poblaciones finitas relacionadas al campo de la bioquímica.2. Establecer 5 poblaciones infinitas numerables relacionadas al campo de la bioquímica3. Establecer 5 poblaciones infinitas no enumerables relacionadas al campo de la bioquímica.4. Establecer 5 poblaciones finitas hipotéticamente infinitas relacionadas al campo de la bioquímica.5. Identificar en cada una de las poblaciones de los anteriores ejercicios a) 4 variables cualitativas nominales b) Cuatro variables cualitativas ordinales c) Cuatro variables cuantitativas discretas y cuatro variables cuantitativas continuas.6. En cada caso del ejercicio 5. establecer: a) la definición b) dimensión c) escala de medición, d) Clasificación de la escala de medición.7. Identificar en una población de a) pacientes, b) muestras de sangre y c) muestras de orinaDos variables en escala nominal, dos en escala ordinal, dos en escala de intervalo y dos en escala de razón.

On the Theory of Scales of MeasurementAuthor(s): S. S. StevensSource: Science, New Series, Vol. 103, No. 2684 (Jun. 7, 1946), pp. 677-680Published by: American Association for the Advancement of ScienceStable URL: http://www.jstor.org/stable/1671815Accessed: 26/11/2008 09:14

Your use of the JSTOR archive indicates your acceptance of JSTOR's Terms and Conditions of Use, available at http://www.jstor.org/page/info/about/policies/terms.jsp . JSTOR's Terms and Conditions of Use provides, in part, that unless you have obtained prior permission, you may not download an entire issue of a journal or multiple copies of articles, and you may use content in the JSTOR archive only for your personal, non-commercial use.

Please contact the publisher regarding any further use of this work. Publisher contact information may be obtained at http://www.jstor.org/action/showPublisher?publisherCode=aaas .

Each copy of any part of a JSTOR transmission must contain the same copyright notice that appears on the screen or printed page of such transmission.

Page 7: Primer Capitulo Conceptos Básicos

JSTOR is a not-for-profit organization founded in 1995 to build trusted digital archives for scholarship. We work with the scholarly community to preserve their work and the materials they rely upon, and to build a common research platform that promotes the discovery and use of these resources. For more information about JSTOR, please contact [email protected].

American Association for the Advancement of Science is collaborating with JSTOR to digitize, preserve and extend access to Science.

http://www.jstor.org

Page 8: Primer Capitulo Conceptos Básicos
Page 9: Primer Capitulo Conceptos Básicos
Page 10: Primer Capitulo Conceptos Básicos
Page 11: Primer Capitulo Conceptos Básicos