Upload
lamxuyen
View
218
Download
0
Embed Size (px)
Citation preview
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
1
Instituto Profesional Valle Central
Guía Metodológica
Asignatura
TÉCNICAS DE
ESTADÍSTICA SOCIAL
AUTOR: Marcela Alejandra Ulloa González
CONCEPCIÓN - MARZO - 2013
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
2
AUTOR
Marcela Alejandra Ulloa González
Estudios superiores:
Licenciada en Sociología y Socióloga. Universidad de Concepción, Concepción.
Diplomado en Metodologías Participativas Para la Intervención Social y Comunitaria.
Universidad Academia de Humanismo Cristiano, Santiago.
Experiencia profesional:
Municipalidad de Concepción, Oficina de Protección de Derechos de Infancia.
Socióloga y sistematizadora, área gestión comunitaria.
Desde marzo 2011 a septiembre 2012.
Municipalidad de Concepción, Secretaria comunal de planificación.
Encuestadora, programa Barrio en Paz Comercial, Seguridad Ciudadana.
Durante noviembre 2012.
Municipalidad de Las Cabras, Programa Chile Crece Contigo.
Socióloga apoyo a la gestión de la Red Chile Crece Contigo, encarga de elaborar mapa de
oportunidades, flujograma y catastro de Red.
Desde diciembre 2012 a marzo 2013.
Sociedad de Capacitación y Asistencia “La Protectora de la Infancia” – Fundación Telefónica.
Socióloga encarga de realizar sistematización del impacto del programa de Prevención y
Erradicación de trabajo Infantil en las comunas de Hualpén y Talcahuano.
Desde enero 2013 al presente.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
3
BIENVENIDA
Estimado Estudiante:
La presente guía metodológica aborda temas relacionados con el campo de la
estadística, correspondiente a “Estadística Social I”, permitiéndoles a las y los
alumnos adquirir una serie de herramientas que a futuro les permitirán llevar a cabo
estudios e investigaciones de corte cualitativo, así como aplicar estos conocimientos
y técnicas apropiadamente en sus respectivos contextos laborales y desarrollo de
sus profesiones.
El estudio que usted realizará entorno a los contenidos de la guía
metodológica contempla un recorrido por tres unidades esquematizadas de tal modo
de brindar una comprensión holística del uso de la estadística. Estas unidades
corresponden en un principio a una introducción a la estadística y ordenación y
presentación de datos. Seguida por la unidad de análisis de datos y administrador de
datos, respectivamente. Por último la tercera unidad apunta a herramientas
computacionales aplicables al área social y a la utilización integrada de estas
herramientas dentro del área social.
En su conjunto los contenidos le posibilitaran a usted contar tanto con
conocimientos teóricos como conceptos, formulas, descripciones de herramientas,
así como conocimientos prácticos orientados a la aplicación de técnicas, realización
de cálculos y análisis de datos numéricos. Estas dos líneas contribuirán a su futuro
tanto académico como profesional.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
4
Esta Guía Metodológica, busca desarrollar las siguientes competencias de
acuerdo al Perfil Profesional del Trabajo Social:
Competencias Profesionales Competencias de Egreso
Contar con una aproximación al
campo de la estadística como
futuros profesionales del área
social.
Describir con mayor exactitud
hallazgos arrojados en la
investigación científica.
Realizar estimaciones adecuadas
y confiables de los valores
necesarios para definir cursos de
acción dentro del estudio
cuantitativo y estadístico.
Capacidad para aplicar aspectos
básicos dentro del campo de la
estadística, como lo son
estimaciones de tipo muestral.
Habilidades para escoger y
construir instrumentos de datos.
Pensamiento crítico entorno a la
recolección, clasificación,
presentación e interpretación de
datos numéricos.
Elaboración de informes de
análisis de datos numéricos.
Para lo anterior, esta Guía Metodológica se ha dividido en las siguientes unidades de
estudio con sus respectivos Objetivos de Aprendizaje y Contenidos.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
5
OBJETIVOS
OBJETIVO GENERAL.
Aplicar instrumentos estadísticos para la recolección, presentación, análisis e
interpretación de información, provenientes de procesos de investigación social, a
través de medios y herramientas manuales y computacionales.
OBJETIVOS ESPECÍFICOS
Conocer la terminología básica de la Estadística y su aplicación a la Investigación
Social.
Presentar la información obtenida en investigación a través del uso de gráficos y
tablas, manuales y computacionales.
Demostrar conocimientos aplicados en el dominio del cálculo y la interpretación de
estadígrafos de tendencia central, posición y dispersión.
Emplear herramientas estadísticas computacionales aplicables al área social en
conjunto con soportes tecnológicos de la informática.
Desarrollar trabajo práctico del área social usando integradamente herramientas
computacionales.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
6
UNIDADES TEMÁTICAS
Materia Página
1. UNIDAD I Introducción a la estadística 06
1.1 La estadística
1.1.1 Glosario de términos estadísticos 1.1.2 Recolección de datos y tipos de muestreo
07
07 08
1.2 Ordenación y presentación de datos
1.2.1 Distribuciones de frecuencia 1.2.2 Presentación gráfica de los datos
11
11 13
2. UNIDAD II Análisis de datos
2.1 Medidas y cálculos
2.1.1 Medidas de tendencia central 2.1.2 Medidas de orden 2.1.3 Medidas de dispersión
2.2 Administrador de datos
19
20
20
21
23
2.2.1 Definición y creación de base de datos 2.2.2 Modificación e impresión de base de datos
24
27
3. UNIDAD III Herramientas computacionales y su relación con el
área social
3.1 Utilidad en el área social
3.1.1 Programas estadísticos 3.1.2 Elementos computacionales: correo electrónico;
internet.
31
31
32
34
BIBLIOGRAFÍA 37
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
7
ÍNDICE FIGURAS
Nº Figura Título Página
Fig. Nº1 Ejemplo tabla de frecuencia 11
Fig. Nº2 Ejemplo diagrama de barras 14
Fig. Nº3 Ejemplo polígonos de frecuencia 15
Fig. Nº4 Ejemplo gráfico de sectores 15
Fig. Nº5 Ejemplo pirámides de población 16
Fig. Nº6 Ejemplo base de datos 25
Fig. Nº7 Ejemplo visualización Excel para construcción de base de datos
26
Fig. Nº8 Ejemplo ingreso de datos
27
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
8
Unidad I
INTRODUCCIÓN A LA ESTADÍSTICA
OBJETIVOS APRENDIZAJES
ESPERADOS CONTENIDOS
Conocer la terminología
básica de la Estadística y su
aplicación a la investigación
social.
Presentar la información
obtenida en investigación a
través del uso de gráficos y
tablas (manuales y
computacionales).
Manejar un lenguaje
conceptual entorno a la
estadística.
Ser capaz de identificar los
distintos tipos variables:
cualitativas-cuantitativas-
continuas-discontinuas.
Reconocer los tipos de
frecuencia.
Disponer de herramientas
para aproximarse a técnicas
de muestreo.
Concepto de estadística y
clasificación.
Concepto de variable,
frecuencia y valor.
Clasificación de variables.
Niveles de medición.
Tipos de frecuencia.
Concepto de muestro,
muestreo.
Muestra y representatividad.
Relación de la estadística
con la investigación social.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
9
I.- INTRODUCCIÓN A LA ESTADÍSTICA
1.1 La estadística
La estadística es una ciencia que se encarga de recolectar y analizar datos, para
transformarlos en información que ayude a la toma de decisiones.
La estadística está ligada con el método científico y apoya la investigación en las diversas
disciplinas, principalmente en lo referente a la recopilación de datos, organización de los
mismos, presentación y análisis de ellos. Por lo tanto, es más que sólo números, es la forma
de interpretar estos números.
El análisis de datos recopilados a través de métodos y técnicas estadísticas, permite
describir el comportamiento de ciertos fenómenos, pronosticar situaciones relacionadas con
estos fenómenos, y sobre los resultados obtenidos.
El uso de la estadística es aplicable a diferentes disciplinas ya sean del área social o de las
ciencias económicas, administrativas, la medicina, la biología, y toda aquella área de estudio
que requiera de estas herramientas para las investigaciones cuantitativas.
El campo de la estadística puede ser a grandes rasgos dividido en dos áreas: la estadística
descriptiva y la estadística inferencial o inductiva. La estadística descriptiva como su
nombre lo indica corresponde al conjunto de procedimientos utilizados para recolectar,
presentar y describir datos numéricos. El término inferencia o inducción estadística se refiere
en cambio a las diversas técnicas y procedimientos de interpretación de los valores
resultantes en la parte descriptiva para usarlas en la toma de decisiones y diseño de
conclusiones acerca de la población.
1.1.1 Glosario de términos estadísticos
Población o universo: es una colección o conjunto de individuos u objetos cuyas
propiedades, características o dimensiones serán analizadas dentro de un estudio o
investigación. Corresponde a la colección completa de los individuos u objetos que son de
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
10
interés del investigador. La población no solo corresponde a personas humanas, puede ser
objetos, animales, países, etc.
Existen dos tipos de poblaciones: finitas e infinitas. La población es finita cuando todos sus
miembros pueden ser físicamente enumerados o individualizados. Y al contrario la población
es infinita cuando sus miembros no pueden ser enumerados físicamente.
Muestra: corresponde a un subconjunto de la población. Corresponde a un grupo de
individuos, objetos o mediciones, que el investigador selecciona desde la población.
Variable: son las características o dimensiones de interés analítico que tienen los elementos
individuales de una población o muestra. Ejemplos: edad, altura, peso, etc.
Dato: es el valor de una variable asociado con un elemento de una población o muestra, en
otras palabras son las características de un solo individuo.
Datos: es el conjunto de valores recolectados para las variables desde los elementos que
constituyen la población o muestra, es decir la base de datos completa.
Experimento: es una actividad planificada por el investigador cuyos resultados proporcionan
o generan datos.
Parámetro: es una característica numérica de toda la población, es como el dato procesado.
El parámetro es un valor que describe a toda la población. Ejemplo: “La estatura promedio
de todos los estudiantes que ingresan a la Universidad en el año 2002”.
Estadístico o estadígrafo: es una característica numérica de una muestra. Ejemplo: “La
estatura promedio de 70 estudiantes que ingresan a la Universidad en el año 2002”.
Datos cualitativos o atributos: son los resultados de un proceso que describe o categoriza
un elemento de una población o muestra. No toman valores numéricos, sino que describen
netamente cualidades y son expresados en categorías verbales.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
11
Datos cuantitativos o numéricos: son los resultados de un proceso que cuantifica la
información de las variables, es decir, las cuenta (cantidad) o las mide (longitud, peso, edad).
Se dividen a su vez en dos categorías: datos discretos o discontinuos, que corresponde a
aquellos que toman únicamente valores enteros, y en general apuntan a contar la cantidad
de veces que ocurre un suceso. Y datos discontinuos, que son aquellos que toman valores
en un intervalo como tiempo o longitud.
1.1.2 Recolección de datos y tipos de muestreo
Una de las técnicas más utilizadas para recolectar datos en la investigación científica es el
survey social. El survey social consiste básicamente en generalizar hacia la población los
datos que se han obtenido mediante muestras. Los siguientes son algunos de los conceptos
más importantes del muestreo estadístico:
1. Censo: un censo es un survey efectuado al 100% de la población. Es un estudio en que
son considerados todos los elementos de la población. Los censos son rara vez utilizados
porque son caros, requieren mucho tiempo y dificultan la organización y ejecución.
2. Marco o esquema de muestreo: cuando se selecciona una muestra para un survey es
necesario construir un esquema de muestreo. Este esquema o marco es la lista de todos los
elementos que pertenecen a la población desde la cual la muestra será diseñada.
3. Diseño de la muestra o plan de muestreo: son los procedimientos utilizados para
seleccionar los elementos de la muestra. Existen diferentes tipos de diseños de muestreo.
Sin embargo, los principales tipos de diseños de muestras son de dos tipos: muestras
probabilísticas o muestras no probabilísticas (intencionadas o por juicio).
4. Muestras intencionadas o por juicio: son muestras que son seleccionadas sobre las
bases de ser "típicas". Cuando se diseña este tipo de muestras, las personas que
seleccionan la muestra eligen aspectos que piensan son representativos de la población. La
validez de este tipo de muestreo siempre es un reflejo de la exactitud del juicio de la persona
que lo realiza.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
12
5. Muestras probabilísticas: son aquellas en que los elementos a ser seleccionados lo son
en función de probabilidad. Cada elemento en una población tiene una probabilidad conocida
de ser seleccionado como parte de la muestra.
6. Muestra aleatoria: una muestra aleatoria es aquella en que todos los elementos de la
población tienen una igual probabilidad de ser seleccionados para conformar la muestra.
Las muestras aleatorias son obtenidas mediante muestreo con reemplazo en poblaciones
finitas y mediante muestreo sin reemplazo en poblaciones infinitas. El procedimiento
apropiado para seleccionar una muestra aleatoria es usar una tabla de números aleatorios o
un generador de números aleatorios.
7. Muestra sistemática: es aquella en que cada k-ésimo caso en el marco o esquema de
muestreo es seleccionado para constituir la muestra, después de haber elegido
aleatoriamente el primer caso entre los primeros k casos.
Para seleccionar una muestra sistemática del 5% en una población determinada, se debe
primero determinar la posición del primer caso utilizando una tabla de números aleatorios
para seleccionar un número entre 1 y 20 (100/5 = 20). Supongamos que el número
seleccionado sea el 17. Entonces el primer caso de nuestra muestra será el ubicado en la
posición 17 del esquema o marco de muestreo. El segundo caso seleccionado será
17+20=37, o sea el caso 37, el tercero será 37+20=57, y así se continúa en adelante.
8. Muestra estratificada: es aquella en que primero la población se subdivide en estratos y
entonces se extrae una sub muestra de cada estrato. Estas sub muestras pueden obtenerse
de cada estrato aleatoria o sistemáticamente. Posteriormente las sub muestras son
combinadas para extraer las conclusiones globales de toda la muestra.
9. Muestra clúster o por conglomerados: primero la población se subdivide en estratos,
posteriormente se seleccionan al azar o sistemáticamente algunos de esos estratos cuyos
casos pasan todos a constituir la muestra. Posteriormente las sub muestras se combinan
para llegar a las conclusiones finales.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
13
1.2 Ordenación y presentación de los datos
1.2.1 Distribuciones de frecuencia
Las distribuciones o las tablas de frecuencia son las formas más comunes para presentar
organizadamente los datos. Posibilitan efectuar un resumen de los datos, permitiendo
computar algunos valores que sintetizan toda la distribución de la variable. Es decir, la
distribución de frecuencia ayuda a la reducción de la información relativa a un número muy
grande de casos, sintetizándolos en una forma más simple.
En el sitio web youtube es posible encontrar una amplia gama de videos entorno a la
construcción de tablas de frecuencia.
Figura N° 1: ejemplo tabla de frecuencia.
Para profundizar en estos temas, consultar los siguientes links: http://www.youtube.com/watch?v=5d-X3d_X3wQ
http://www.youtube.com/watch?v=bKK0kXzwpgs
http://www.youtube.com/watch?v=ScFNnmIv_8w
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
14
Pasos en la construcción de la distribución de frecuencia: (tener presente la figuran
anterior)
1. Ubicar el valor mínimo y máximo de la variable. El valor mínimo en la figura es 1, y
el valor máximo es 10.
2. Ordenar los datos de forma ascendente o descendente.
3. Contar las frecuencias o casos para cada estrato o categorías de la variable. Es
necesario tener precaución al momento de realizar el cálculo, ya que cualquier error
puede desvirtuar la validez de la distribución, influyendo en las medidas posteriores
calculadas. Si se incurre en un error, se tiene que rehacer la tabla (volver a
construirla).
Componentes de la tabla de frecuencia:
Columna X (Xi): corresponde a la variable estudiada, que es definida por el investigador.
Columna frecuencia absoluta: corresponde al número de casos que tiene cada estrato de
la variable, la suma de la frecuencia absoluta es igual a la totalidad de casos (letra n).
Columna frecuencia relativa: expresa el número de casos de cada estrato de la variable en
términos de proporciones. Se obtiene dividiendo cada frecuencia absoluta por el número total
de casos. La suma total tiene que corresponden al 100% de los casos.
n: es el tamaño de la muestra o el número de casos recolectados para la variable
considerada.
Columna frecuencia absoluta acumulada ascendente (+): indica el número de casos que
son iguales o menores que un valor determinado de la variable. Se obtiene acumulando los
valores de la frecuencia absoluta desde arriba hacia abajo. El último valor de esta columna
debe ser igual a n.
Columna frecuencia absoluta acumulada descendente (-): indica el número de casos que son
iguales o mayores que un valor determinado de la variable. Se obtiene acumulando los
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
15
valores de la frecuencia absoluta desde abajo hacia arriba. El primer valor de esta columna
debe ser igual a n.
Columna frecuencia relativa acumulada ascendente (+): permite expresar en términos
proporcionales el número de casos que son menores o iguales que un valor determinado de
la variable. El último valor de esta columna debe ser igual a 1.00.
Columna frecuencia relativa acumulada descendente (-): permite expresar la proporción
de casos que son iguales o mayores que un valor determinado de la variable. El primer valor
de esta columna debe ser igual a 1.00.
1.2.2 Presentación gráfica de los datos
Existen varios modos gráficos de describir información. El método utilizado siempre está
determinado por el tipo de datos y por la idea a ser representada.
Diagramas de barras (gráfico de barras verticales): muestran los valores de las
frecuencias absolutas sobre un sistema de ejes cartesianos, cuando la variable es discreta o
cualitativa. En la abscisa se coloca la variable nominal o atributo a representar y en la
ordenada la frecuencia o número de casos correspondiente. La altura de cada rectángulo
representa la magnitud de la categoría específica.
Las frecuencias acumuladas ascendentes y descendentes permiten construir un gráfico denominado ojivas de Galton. Que permite además realizar un cálculo rápido e intuitivo de la mediana.
La utilidad de las columnas de frecuencia relativa acumulada ascendente y descendente está dada por el hecho de que permiten colocar en términos relativos o porcentuales las columnas de una tabla de frecuencias, facilitando el análisis comparativo con distribuciones de frecuencias similares.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
16
Figura N° 2: Ejemplo diagrama de barras
Histogramas: es un gráfico de barras que se utilizan en variables cuantitativas continuas,
ubicando en el eje de las abscisas la variable, y en el eje de las ordenadas se representan
las densidades de frecuencia. Las densidades de frecuencia son el cociente entre un tipo de
frecuencia y la amplitud del intervalo que tengamos. En el caso de que los intervalos
presenten la misma amplitud, en vez de utilizar las densidades de frecuencia, se utilizan las
frecuencias absolutas.
Polígonos de frecuencias: Para construir polígonos de frecuencias, se trazan las
frecuencias absolutas o relativas de los valores de la variable en un sistema de ejes
cartesianos y se unen los puntos resultantes mediante trazos rectos. Con ello se obtiene una
forma de línea poligonal abierta. Presenta mayor utilidad su uso en variables cuantitativas o
en las cualitativas ordinales.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
17
Figura N° 3: ejemplo polígonos de frecuencia.
Gráficos de sectores: es también conocido como gráfico de torta, corresponde a una
representación circular, en donde a cada categoría de la variable nominal o atributo se le
otorga un trozo porcentual proporcional. La fórmula para su cálculo es:
360 x fi (frecuencia) X= --------------- n Figura N°4: ejemplo gráfico de sectores
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
18
Pictogramas y cartogramas: corresponden a imagines pictóricas representativas del valor
de las variables, permiten una presentación rápida de los datos estadísticos. El pictograma
es la representación mediante figuras y el cartograma es la representación mediante mapas
geográficos que utilizan distintos tramas de colores e intensidades para indicar diferencias
entre los datos.
Pirámides de población: es una forma de representación visual de los datos estadísticos,
indica información demográfica, económica o social. Comúnmente clasifican datos de la
población considerando escalas diferenciadas de sexo o edad. Hay tipos de pirámide de
acuerdo a la agrupación de la población: expansiva, regresiva, estacionaria.
Figura N° 5: pirámides de población
Diagrama de puntos: representa los datos de una variable discreta, graficándolos con un
punto en una escala, la escala puede ser vertical u horizontal. La frecuencia de los valores
es representada colocando un punto sobre otro en la escala (los datos se ordenan de forma
ascendente).
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
19
ACTIVIDADES DE APRENDIZAJE
Definir los siguientes conceptos:
Muestra aleatoria:
Columna frecuencia relativa acumulada ascendente (+):
Pictogramas y cartogramas:
Polígonos de frecuencia:
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
20
COMPRUEBA TUS RESPUESTAS
Conceptos:
Muestra aleatoria: una muestra aleatoria es aquella en que todos los elementos de la
población tienen una igual probabilidad de ser seleccionados para conformar la muestra.
Las muestras aleatorias son obtenidas mediante muestreo con reemplazo en poblaciones
finitas y mediante muestreo sin reemplazo en poblaciones infinitas. El procedimiento
apropiado para seleccionar una muestra aleatoria es usar una tabla de números aleatorios o
un generador de números aleatorios.
Columna frecuencia relativa acumulada ascendente (+): permite expresar en términos
proporcionales el número de casos que son menores o iguales que un valor determinado de
la variable. El último valor de esta columna debe ser igual a 1.00.
Pictogramas y cartogramas: corresponden a imagines pictóricas representativas del valor
de las variables, permiten una presentación rápida de los datos estadísticos. El pictograma
es la representación mediante figuras y el cartograma es la representación mediante mapas
geográficos que utilizan distintos tramas de colores e intensidades para indicar diferencias
entre los datos.
Polígonos de frecuencias: Para construir polígonos de frecuencias, se trazan las
frecuencias absolutas o relativas de los valores de la variable en un sistema de ejes
cartesianos y se unen los puntos resultantes mediante trazos rectos. Con ello se obtiene una
forma de línea poligonal abierta. Presenta mayor utilidad su uso en variables cuantitativas o
en las cualitativas ordinales.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
21
Unidad II
ANÁLISIS DE DATOS
OBJETIVOS APRENDIZAJES ESPERADOS
CONTENIDOS
Demostrar conocimientos
aplicados al dominio del
cálculo y la interpretación de
estadígrafos de tendencia
central, posición y
dispersión.
Identificación clara de los
conceptos que aluden a los
diferentes tipos de medidas
ya sean estas de tendencia
central, de orden y de
dispersión.
Familiarización con los
procedimientos principales
para calcular e interpretar
correctamente las medidas o
recursos estadísticos
utilizados para describir la
concentración o tendencia
central de los datos, la
dispersión o variabilidad y el
órden o posición de la
información recolectada y
analizada.
Medidas de tendencia
central: moda, mediana y
media.
Medidas de orden.
Medidas de dispersión.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
22
2.- UNIDAD II ANÁLISIS DE DATOS
2.1 Medidas y cálculos
La estadística descriptiva proporciona los denominados estadígrafos o medidas de posición
para indicar la manera en que los datos se reúnen o concentran en determinadas posiciones.
Así como medidas de tendencia central que apuntan al comportamiento que tiene un grupo
determinado en estudio; o bien la distancia que se establece entre los elementos dados por
las medidas de orden.
2.1.1 Medidas de tendencia central
Las medidas de tendencia central corresponden a la media, mediana y moda, estas sirven
como puntos de referencia que permiten la interpretación de los datos, su uso más común se
aplica en la educación al querer obtener la concentración de notas.
Es así como las medidas de tendencia central presentan utilidad para:
- Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
- Sirve como un método para comparar o interpretar cualquier puntaje en relación con
el puntaje central o típico.
- Sirve como un método para comparar el puntaje obtenido por una misma persona en
dos diferentes ocasiones.
- Sirve como un método para comparar los resultados medios obtenidos por dos o más
grupos.
La media aritmética ha sido conocida comúnmente como media o promedio, se representa
mediante la letra M o por una .
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
23
Se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. Es
decir, corresponde a la suma de un conjunto de datos dividida por el número total de dichos
datos.
Ejemplo de cálculo:
La mediana es el puntaje que se ubica en el centro de una distribución, representada como
Md. Para reconocer la mediana, es necesario tener ordenados los valores ya sea de forma
ascendente o descendente, y se procede a dividir el total de casos (n) por dos, este
resultado corresponde a la mediana en la distribución.
La moda es el puntaje que se presenta con mayor frecuencia en una distribución,
representado como Mo. Es decir, aquel dato que se repite más dentro de una distribución.
2.1.2 Medidas de orden (posición)
Las medidas de orden o posición dividen un conjunto de datos en grupos con el mismo
número de individuos. Para poder calcular algún tipo de medida de posición es necesario
que los datos se encuentren ordenados de menor a mayor.
Cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes
al 25%, al 50% y al 75% de los datos. El Q2 coincide con la mediana.
Para su cálculo se deben seguir los siguientes pasos:
1. Ordenamos los datos de menor a mayor.
2. Buscamos el lugar que ocupa cada cuartil mediante la expresión .
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
24
Deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. El
D5 coincide con la mediana.
Para su cálculo se deben seguir los siguientes pasos:
En primer lugar buscamos donde se encuentra , en la tabla de las
frecuencias acumuladas.
Li es el límite inferior de la clase donde se encuentra la mediana.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
Percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. El
P50 coincide con la mediana.
Para su cálculo se deben seguir los siguientes pasos:
En primer lugar buscamos la clase donde se encuentra , en la tabla
de las frecuencias acumuladas.
Li es el límite inferior de la clase donde se encuentra la mediana.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
25
2.1.3 Medidas de dispersión
Las medidas de dispersión son aquellas que nos informan acerca de cuánto se alejan del
centro los valores de la distribución.
Rango o recorrido corresponde a la diferencia entre el mayor y el menor de los datos en
una distribución estadística.
Desviación media es la diferencia entre cada valor de la variable estadística y la media
aritmética. Simbolizada como Di = x – x. La desviación media es la media aritmética de
los valores absolutos de las desviaciones respecto a la media.
La desviación media se representa por , siendo la siguiente su fórmula de cálculo:
Varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de
una distribución estadística. La varianza se representa por , siendo la siguiente su fórmula
de cálculo:
Dentro de las propiedades de la varianza, se contempla:
Para profundizar en estos temas, consultar el siguiente link:
http://www.ditutor.com/estadistica/medidas_posicion.html
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
26
1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones
sean iguales.
2. Si a todos los valores de la variable se les suma un número la varianza no varía.
3.Si todos los valores de la variable se multiplican por
un número la varianza queda multiplicada por el cuadrado de dicho número.
4. Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas varianzas se puede calcular la varianza total.
Desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la media
de los cuadrados de las puntuaciones de desviación. La desviación típica se representa
por σ, siendo la siguiente su fórmula de cálculo:
Dentro de las propiedades de la varianza, se contempla:
1. La desviación típica será siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un número la desviación típica no varía.
3. Si todos los valores de la variable se multiplican por un número la desviación
típica queda multiplicada por dicho número.
4. Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones típicas se puede calcular la desviación típica total.
2.2 Administrador de datos
Las bases de datos son una herramienta ampliamente utilizada por profesionales de diversas
disciplinas, permitiendo manejar de organizada y planificada un conjunto de datos que
constituyen estudios, investigaciones, o información en contextos laborales.
2.2.1 Definición y creación de base de datos
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
27
Se define como un documento, físico o digital, que contiene una colección de datos
compuesta por casos y variables; filas y columnas. Una base de datos puede referirse a
una muestra o una población, por lo que puede abarcar de unos cuantos casos hasta
millones de casos. Cuando las bases de datos son presentadas en documentos digitales,
generalmente son de formato de texto simple, Microsoft Excel o de IBM SPSS, siendo los
formatos más comunes en investigaciones del ámbito de las ciencias sociales.
Los formatos más comunes de almacenamiento de datos en Ciencias Sociales son texto
simple, Planilla de Microsoft Excel e IBM SPSS. Dados los avances en la tecnología de
cómputo y la necesidad de integración de herramientas computacionales, la mayoría de los
paquetes estadísticos se han visto en la obligación de ofrecer compatibilidad entre los
formatos de bases de datos (data sheet), por lo tanto la generalidad es que las bases de
datos sean generados en formato Excel.
La forma más común de organizar una base de datos es mediante la herramienta de
Microsoft “Excel”, a continuación se presenta una forma de visualizar nuestras bases de
datos:
Figura N° 7: Visualización Excel para construcción de base de datos
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
28
Una vez abierto el libro de excel es posible comenzar a ingresar los datos y construir la base
de datos.
Figura N° 8: Ejemplo ingreso de datos
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
29
La primera columna corresponde a la variable “filtro” generalmente es una referencia para
individualizar los casos, en este ejemplo se asigna un número para ingresar cada caso. Y asi
se van asignando variables a las siguientes columnas, como la segunda columna que
corresponde a la variable “nota”.
Cuando se ha completado el ingreso de la totalidad de los datos en la base, se procede a
guardar siguiendo el comando “Guardar como-libro de Excel” en la barra de herramientas.
Cuando en un caso no existe un valor asignado (porque el encuestado no responde, o
responde mal), este valor se denomina “valor perdido o missing value”. Generalmente se los
paquetes estadísticos excluyen estos datos de los cálculos, y de este modo el investigador
tiene la claridad de la cantidad de valores perdidos (es un elemento a tener en consideración
para no generar cálculos erróneos en la investigación).
El ingreso de estos valores puede ser a través de un punto “.” o un valor que,
convencionalmente es un 9, 99, 999, etc. según la cantidad de dígitos que la variable
necesite para ser ingresada.
2.2.2 Modificación e impresión de base de datos Si es necesario modificar la base de datos, ya sea porque se ha ingresado mal o porque se
requiere modificar la codificación de alguna variable, hay que tener precaución de modificar
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
30
el caso que corresponda y evitar errores de digitación y por ende no incurrir en cálculos
estadísticos erróneos.
Para la impresión de la base de datos se deben considerar aspectos previos de formato,
como lo es la configuración de páginas a imprimir, para lo cual se recomienda realizar una
vista previa del documento que se enviará a imprimir.
La vista preliminar es una herramienta que permite visualizar el documento antes de
imprimirlo. Es aconsejable ver la Vista de Diseño de página para poder ver los saltos de
página, márgenes, encabezados y pies de página, el formato completo de la hoja.
Si ya tenemos lista la hoja de cálculo para su impresión, se hace clic sobre Imprimir.
Automáticamente se abre un cuadro de dialogo desde donde es posible modificar opciones
de impresión. En el recuadro Impresora aparecerá el nombre de la impresora
predeterminada que se tiene instalada en el computador.
En el recuadro Intervalo de páginas, se indica si se desea imprimir todo o un rango que va
Desde: y Hasta. En el recuadro Imprimir se indica si se desea imprimir todo el libro, o solo las
Hojas activas las cuales son aquellas que se encuentran seleccionadas.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
31
ACTIVIDADES DE APRENDIZAJE
1. Calcular la media aritmética para el siguiente caso:
En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (número total de datos)
2. Calcular la moda para el siguiente caso:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de
niñas de un Jardín Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
3. Calcular la desviación media de la siguiente distribución:
9, 3, 8, 8, 9, 8, 9, 18
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
32
COMPRUEBA TUS RESPUESTAS
1. Calcular la media aritmética para el siguiente caso:
En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (número total de datos)
La media aritmética de las notas de esa asignatura es 4,8. Este número representa
el promedio.
2. Calcular la moda para el siguiente caso:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de
niñas de un Jardín Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de
valores no tiene moda.
3.Calcular la desviación media de la siguiente distribución:
9, 3, 8, 8, 9, 8, 9, 18
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
33
Unidad III
HERRAMIENTAS COMPUTACIONALES Y SU RELACIÓN CON EL ÁREA SOCIAL
OBJETIVOS APRENDIZAJES
ESPERADOS CONTENIDOS
Emplear herramientas estadísticas computacionales aplicables al área social en conjunto con soportes tecnológicos de la informática.
Conocimiento de
herramientas estadísticas
computacionales que sean
aplicables en contextos
laborales vinculados a las
ciencias sociales.
Actualización respecto de
recursos computacionales
que facilitan el trabajo
estadístico dentro del
desarrollo de futuras
profesiones como lo es el
trabajo social.
Reconocer la utilidad de los
elementos computacionales.
Aproximación teórica a los
programas estadísticos SAS
y SPSS.
Elementos computacionales
como correo electrónico e
internet, que permiten
compartir conocimientos,
adjuntar bases de datos y
análisis estadísticos.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
34
III.- HERRAMIENTAS COMPUTACIONALES Y SU RELACIÓN CON EL ÁREA SOCIAL.
3.1 Utilidad en el área social
La utilidad que presentan los recursos computacionales para las profesiones del área social
conducen directamente a una actualización en cuanto a conocimiento que permitan generan
una mayor validez de las investigaciones, mediante programas estadísticos y software que
permiten manejar un lenguaje común con otras profesiones.
El uso de la informática en los análisis del área social permiten ahorran tiempo y esfuerzo en
la organización de la información, realizando en segundo trabajos que requeriría de horas al
realizarlo de forma manual.
Permite generar cálculos más exactos, evitando redondeos y aproximaciones del cálculo
manual. Además de posibilitar un trabajo con grandes cantidades de datos.
El aprendizaje del manejo de paquetes de programas estadísticos requiere de esfuerzo.
3.1.2 Programas estadísticos SAS proporciona un entorno de software diseñado especialmente para el acceso,
transformación y presentación de reportes de datos. Incluye un lenguaje de programación de
cuarta generación, con programas listos para ser usados para manipulación de datos,
almacenamiento y recuperación de información, estadística descriptiva y creación de
reportes, y una poderosa función de macros que reduce el tiempo de programación y los
problemas de mantenimiento.
Dentro de sus principales beneficios se considera:
- Integra datos entre entornos.
- Lee, da formato y analiza todo tipo de datos.
- Hace de la programación una tarea fácil y rápida.
- Simplifica la creación de reportes
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
35
- Maximiza el uso de todos los recursos informáticos.
Sus principales características son:
- Completas funciones de análisis de datos
- Lenguaje flexible de cuarta generación
- Compatible con una amplia variedad de formatos de datos
- Desempeño y escalabilidad
- Interoperabilidad e implementación en múltiples plataformas
- Fácil manejo
- Presentación de datos.
SPSS es un programa estadístico informático permite administrar bancos de datos de
manera eficiente y desarrollar perfiles de usuarios, hacer proyecciones y análisis de
tendencias que permitirán planificar actividades a largo plazo y, en general, hacer un mejor
uso de la información capturada en forma electrónica.
Dentro de sus principales beneficios se consideran:
- El programa utiliza una serie de cuadros de diálogo (dialog boxes) que permiten, en
forma secuencial, determinar las acciones a tomar y seleccionar aquellos análisis
útiles.
- Compatibilidad con la mayoría de los sistemas operativos que existen en el mercado
privado y de código abierto.
- También cuenta con tutoriales en la Web que permiten a los usuarios contar con
elemento que permitan su correcto uso.
- Ésta herramienta cumple con todas las fases que implica un análisis de datos como la
Planificación, Elaboración de una Base de Datos, Preparación de estos Datos,
Análisis de los mismos y Elaboración de un Informe, permitiendo así un análisis
integral de los Datos.
Sus principales características son:
- Facilita crear un archivo de datos en una forma estructurada y también organizar
una base de datos que puede ser analizada con diversas técnicas estadísticas.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
36
- SPSS permite capturar y analizar los datos sin necesidad de depender de otros
programas.
- Por otro lado, también es posible transformar un banco de datos creado en
Microsoft Excel en una base de datos SPSS.
3.1.2 Elementos computacionales: correo electrónico; internet.
El correo electrónico es un servicio de red que permite a los usuarios registrados enviar y
recibir información. Existen una serie de plataformas donde es posible crear más de una
cuenta de correo electrónico, tales como: gmail, Hotmail, yahoo.
La capacidad del correo electrónico permite adjuntar una gran cantidad de documentos,
indicar links con información, redactar incluyendo aspectos de formato (tamaño de letra,
color).
Gracias al avance de las tecnologías el uso de internet móvil permite adherir estas cuentas
de correo electrónico a la telefonía celular y estar en contacto en todo momento con otros
usuarios, y recibir información al instante.
Internet corresponde a un conjunto de redes de comunicación que se encuentran
interconectados entre sí. La utilidad de esta herramienta permite acceder a un sinfín de
información al instante, estar en contacto con redes internacionales y enterarse de
situaciones que ocurren en el preciso momento.
Internet permite la descarga de información como lo son los programas estadísticos, diversos
software, y herramientas computacionales que ayudan el quehacer profesional.
Para acceder a internet se requiere de una conexión ya sea por cable establecida, wi-fi o
banda ancha móvil, además de contar con un navegador instalado en el computador para
poder revisar páginas, los dos más comunes son google chrome e internet explorer.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
37
ACTIVIDADES DE APRENDIZAJE
Responda las siguientes preguntas de desarrollo en un máximo de 4 líneas, relacionadas
con la utilidad de los programas estadísticos.
1. ¿Cuál es la utilidad de SPSS para el quehacer profesional?
______________________________________________________________
______________________________________________________________
______________________________________________________________
______________________________________________________________
2.¿Cuáles son las principales características del programa SAS?
______________________________________________________________
______________________________________________________________
______________________________________________________________
______________________________________________________________
3.¿Que permite realizar un correo electrónico?
______________________________________________________________
______________________________________________________________
______________________________________________________________
______________________________________________________________
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
38
COMPRUEBA TUS RESPUESTAS
1. ¿Cuál es la utilidad de SPSS para el quehacer profesional?
SPSS es un programa estadístico informático permite administrar bancos de datos de
manera eficiente y desarrollar perfiles de usuarios, hacer proyecciones y análisis de
tendencias que permitirán planificar actividades a largo plazo y, en general, hacer un mejor
uso de la información capturada en forma electrónica.
2.¿Cuáles son las principales características del programa SAS?
- Completas funciones de análisis de datos
- Lenguaje flexible de cuarta generación
- Compatible con una amplia variedad de formatos de datos
- Desempeño y escalabilidad
3.¿Que permite realizar un correo electrónico?
La capacidad del correo electrónico permite adjuntar una gran cantidad de documentos,
indicar links con información, redactar incluyendo aspectos de formato (tamaño de letra,
color).
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
39
BIBLIOGRAFÍA
Calero, Jl. 2000. Investigación cualitativa y cuantitativa. Problemas no resueltos en los
debates actuales. Disponible en:
http://www.bibliocomunidad.com/web/libros/investigacion.pdf
Hernandez, S. et al. 2006. Metodología de la investigación. McGraw-Hill. México.
SPSS Inc. Manual de usuario de SPSS Statistics Base 17.0. Chicago.
Disponible en:
http://web.udl.es/Biomath/Bioestadistica/SPSS/v17/SPSS%20Statistcs%20Base%20User's%
20Guide%2017.0.pdf
Stockburger, David W. 1996. Introductory Statistics: Concepts, Models, and Applications.
www version 1.0 first published 7/15/96 http://www.psychstat.smsu.edu
Vieytes, R. 2004. Metodología de la investigación en organizaciones, mercado y sociedad:
epistemología y técnicas. Editorial de las Ciencias. Buenos Aires, Argentina.
INSTITUTO PROFESIONAL VALLE CENTRAL Guía Metodológica Técnicas de Estadística Social
40