Download pdf - estadistica para la toma decisiones.pdf

1

ESTADISTICA PARA LA TOMA DE DECISIONES.

Po

rcen

taje

40

30

20

10

0

Hábito de estudio

AltoIntermedioBajo

Dr. CLETO DE LA TORRE DUEÑAS

[email protected]

2011

mailto:[email protected]

2

1RA EDICION

Hecho el Depósito Legal en la Biblioteca Nacional del Perú REGISTRO Nº : 2009-09684

Todos los derechos reservados.

Prohibida la reproducción total o parcial de este libro en forma idéntica o

modificada por cualquier medio mecánico o electrónico, incluyendo fotocopia,

grabación o cualquier sistema de almacenamiento y recuperación de

información no autorizada por el autor.

Impreso en Perú, 2009.

3

CAPITULO I

INVESTIGACION CIENTIFICA.

1.1 INVESTIGACIÓN CIENTÍFICA

La investigación científica, se puede entender como un conjunto de actividades

que realizamos para obtener conocimientos nuevos, sobre problemas nuevos

que afectan la realidad, pero que sean nuevos, respecto a la ciencia, es decir,

respecto al conjunto de conocimientos ya provisionalmente establecidos y

sistematizados por la humanidad, conocimientos nuevos que, como aportes, se

sumarán a la Ciencia.

¿Qué es investigar?

Investigar viene del latín investigare.

Es la forma más adecuada de aproximarse al conocimiento de la verdad

mediante verdades parciales.

Desarrollar actividades con el objetivo de registrar, indagar o descubrir

la verdad.

En términos generales, es agregar algo nuevo a los conocimientos

humanos.

Es un proceso que, mediante la aplicación del método científico, procura

obtener información relevante y fidedigna. De entender, verificar,

corregir o aplicar el conocimiento

4

EELL PPRROOCCEESSOO DDEE IINNVVEESSTTIIGGAACCIIÓÓNN

IINNTTEERRRROOGGAANNTTEESS PPAARRAA EELL PPRROOCCEESSOO:: DDIISSEEÑÑOO

¿¿QQuuéé eessttuuddiiaarr?? SSeelleecccciióónn ddeell tteemmaa..

CCuuááll eess llaa ssiittuuaacciióónn aaccttuuaall?? PPllaanntteeaammiieennttoo ddeell pprroobblleemmaa

¿¿CCuuáálleess ssoonn llaass pprreegguunnttaass ddee

iinnvveessttiiggaacciióónn qquuee ddeebbeenn sseerr

rreessppoonnddiiddaass??

FFoorrmmuullaacciióónn ddeell pprroobblleemmaa

¿¿QQuuéé pprrooppóóssiittooss ttiieennee llaa

iinnvveessttiiggaacciióónn qquuee ssee ppllaanntteeaa??

OObbjjeettiivvooss..

¿¿CCuuáálleess ssoonn llooss mmoottiivvooss ppaarraa

hhaacceerr eell eessttuuddiioo pprrooppuueessttoo??

JJuussttiiffiiccaacciióónn..

¿¿QQuuiiéénneess hhaann iinnvveessttiiggaaddoo

aanntteerriioorrmmeennttee ssoobbrree eell tteemmaa

ppllaanntteeaaddoo??

MMaarrccoo HHiissttóórriiccoo

¿¿QQuuéé hhaayy eessccrriittoo aall rreessppeeccttoo?? MMaarrccoo TTeeóórriiccoo..

¿¿QQuuéé ssee pprreetteennddeerr pprroobbaarr?? HHiippóótteessiiss..

¿¿CCóómmoo ssee vvaa aa rreeaalliizzaarr llaa

iinnvveessttiiggaacciióónn??

MMeettooddoollooggííaa..

¿¿CCuuáánnttoo ttiieemmppoo ssee rreeqquuiieerree ppaarraa eell

eessttuuddiioo pprrooppuueessttoo??

PPrrooggrraammaacciióónn

¿¿QQuuéé rreeccuurrssooss ssee nneecceessiittaann?? PPrreessuuppuueessttoo..

¿¿AA qquuee ffuueenntteess eessccrriittaass ssee vvaa aa

rreeffeerriirr eell iinnvveessttiiggaaddoorr??

BBiibblliiooggrraaffííaa..

IINNTTEERRRROOGGAANNTTEESS PPAARRAA EELL PPRROOCCEESSOO:: DDEESSAARRRROOLLLLOO

¿¿QQuuéé ttiippoo ddee iinnffoorrmmaacciióónn ssee

nneecceessiittaa ppaarraa ccuummpplliirr llooss oobbjjeettiivvooss,,

rreessppoonnddeerr llaa pprreegguunnttaa ((ss)) ddee

IIddeennttiiffiiccaacciióónn ddee iinnffoorrmmaacciióónn..

5

iinnvveessttiiggaacciióónn yy vveerriiffiiccaarr llaass

hhiippóótteessiiss??

¿¿DDóónnddee eennccuueennttrroo llaa iinnffoorrmmaacciióónn?? DDeeffiinniicciióónn ddee ffuueenntteess ddee

iinnffoorrmmaacciióónn..

SSii uuttiilliizzoo ffuueenntteess pprriimmaarriiaass,, ¿¿aa

ccuuáánnttaass ppeerrssoonnaass ddeebboo rreeqquueerriirr

ppaarraa oobbtteenneerr iinnffoorrmmaacciióónn??

DDeetteerrmmiinnaacciióónn ddee llaa mmuueessttrraa

¿¿DDee qquuéé ffoorrmmaa ppuueeddoo oobbtteenneerr llaa

iinnffoorrmmaacciióónn??

TTééccnniiccaass ddee rreeccoolleecccciióónn::

OObbsseerrvvaacciióónn,, eennccuueessttaa,, eettcc..

¿¿CCóómmoo oorrggaanniizzaarr llaa iinnffoorrmmaacciióónn

oobbtteenniiddaa??

TTaabbuullaacciióónn,, pprroocceessaammiieennttoo yy

oorrddeennaammiieennttoo ddee llaa


¿¿CCóómmoo ssee uuttiilliizzaa llaa iinnffoorrmmaacciióónn

pprroocceessaaddaa yy oorrddeennaaddaa??

EEllaabboorraacciióónn yy aannáálliissiiss ddee llaa


¿¿CCóómmoo ssee ppuueeddee pprreesseennttaarr eell

iinnffoorrmmee ddee llooss rreessuullttaaddooss ddeell

aannáálliissiiss??

PPrreesseennttaacciióónn ddee llooss rreessuullttaaddooss ddee

llaa iinnvveessttiiggaacciióónn..

1.2 PROBLEMA DE INVESTIGACIÓN

Es un hecho, fenómeno o situación que incita a la reflexión o al estudio y es

importante puesto que permite conocer la situación que se va a estudiar

mostrando sus principales rasgos.

CRITERIOS BASICOS PARA IDENTIFICAR PROBLEMAS.

De manera general se considera que hay un problema cuando lo que

DEBERÍA SER, difiere de lo que ES.

El DEBERÍA SER, es el marco referencial, el patrón comparativo, el

ideal, el modelo, el paradigma.

Lo que ES, representa la realidad, es la práctica.

DEBERÍA SER diferente a ES, entonces existe Problema

6

Determinación de Necesidades Educativas

DISCREPANCIA

COMPORTAMIENTO

REAL

COMPORTAMIENTO

DESEADO

LO QUE DEBE

SERLO QUE ES

NECESIDAD EDUCATIVA

SITUACIÓN

PROBLEMÁTICA

7

PROBLEMA DE INVESTIGACION.

Para la presentación del POI, es necesario considerar cuatro momentos: el

diagnóstico, el pronóstico, el control del pronóstico y la formulación de la

pregunta o preguntas o la redacción de un texto a manera de pregunta.

El diagnóstico es la descripción de los síntomas o problemas.

El pronóstico es la serie consecuencias de los problemas.

El control del pronóstico es la serie de acciones para superar las

consecuencias de los problemas.

Formulación del problema

Aspectos a integrar en la conceptualización y en la definición de un

problema de investigación.

Pensar en: Elementos del enunciado:

Qué se investigará? Variable/s

Quiénes participarán Sujetos a estudiar

8

Qué estrategia se seguirá? Diseño

Dónde se realizará? Ámbito de estudio

Cuándo se realizará? Período de Tiempo.

ELEMENTOS DE DEL TITULO DE UN PROBLEMA

Especificidad Situación

problemática

Unidad de

estudio

Espacio Tiempo

Situación problemática

Responde a la pregunta ¿Qué investigar?

Por ejemplo: Rendimiento académico, gestión educativa, desempeño

profesional,..

La especificidad

Es el aspecto o los aspectos concretos que se quiere investigar acerca

del hecho o situación problemática.

Por ejemplo: causas, consecuencias, características, importancia,

influencia, tendencia, modalidades, incidencia, prevalencia, implicancias,

estructura, función, nivel, relación, evolución, etc.

Unidades de estudio.

Son aquella en las se ponen de manifiesto los hechos o situaciones

problemáticas y constituyen, desde el punto de vista estadístico, la

población o muestra a la que se refiere la investigación. Son: Personas,

grupos sociales, seres, acontecimientos, instituciones, objetos,

procesos.

Espacio

Esta referido al lugar en el que ocurre el hecho o situación problemática.

Puede ser geográfico o administrativo. ¿Dónde?; Perú, Ciudad del

Cusco, Zona Franca, Aceros Arequipa, etc.

Tiempo

Está referido al momento en que ocurre el hecho o situación

problemática. ¿Cuándo?

9

1.3 FORMULACION DE OBJETIVOS

Son los propósitos o fines que se pretenden lograr al realizar la

investigación.

Los objetivos son de dos tipos:

El objetivo general (singular). Es un enunciado proposicional integral y

un Logro terminal a alcanzar en la investigación.

Los objetivos específicos (plural). Los Objetivos Específicos, Son

enunciados desagregados del objetivo general orientados al logro de

propósitos concretos y están en relación a lo que aspira alcanzar con el

estudio.

Los objetivos deben ser verificables

Al definir los objetivos, debemos pensar inmediatamente en la manera

de verificar si éstos se han cumplido o no (pensar en métodos o

herramientas para ello)

Lo anterior nos permitirá ir dibujando el perfil metodológico de nuestra

investigación

Los objetivos se convierten así en la carta de navegación de la

investigación a realizar

Los objetivos deben ser precisos y no muy ambiciosos: deben ser

acordes con los recursos disponibles (tiempo) y ello delimitará el nivel de

detalle esperable.

Estar expresados en verbos en infinitivo (determinar, analizar,

identificar, evaluar, diagnosticar, conocer, explicar, refutar,

comprobar, etc.)

Elementos a tomar en cuenta para redactar un objetivo

Sujeto Elemento de estudio.

Contenido Expresa el cambio requerido

Acción Conjunto de actividades que se desarrollan.

Ejemplo 1: Reforzar la capacidad de gestión en los centros de educación inicial

del país para la atención de los dominios del aprendizaje de los niños de 4 y 5

años de edad.

10

Acción : Reforzar la capacidad de gestión en los centros de

educación inicial del país.

Contenido: La atención de los dominios del aprendizaje.

Sujeto : Niños de 4 a 5 años de edad

1.4 JUSTIFICACION Y DELIMITACION DE LA INVESTIGACIÓN

Criterios de justificación.

Originalidad

Relevancia

Interés

Factibilidad

Criterios para delimitar

Espacial - Geográfica

Cronológica

VVIIAABBIILLIIDDAADD::

EEss nneecceessaarriioo ppllaanntteeaarrssee llaass ssiigguuiieenntteess pprreegguunnttaass::

¿¿SSee ddiissppoonnee ddee RReeccuurrssooss??

¿¿EEss ffaaccttiibbllee rreeaalliizzaarr eenn eell ttiieemmppoo pprreevviissttoo??

¿¿EEss ffaaccttiibbllee llooggrraarr llaa ppaarrttiicciippaacciióónn ddee llooss ssuujjeettooss uu oobbjjeettooss nneecceessaarriiooss??

¿¿EEss ffaaccttiibbllee ccoonndduucciirr eell eessttuuddiioo ccoonn llaa mmeettooddoollooggííaa nneecceessaarriiaa??

¿¿LLaa mmeettooddoollooggííaa aa sseegguuiirr,, ccoonndduuccee aa ddaarr rreessppuueessttaa aall pprroobblleemmaa??

¿¿SSee ccoonnooccee yy ssee ddoommiinnaa llaa mmeettooddoollooggííaa sseelleecccciioonnaaddaa??

¿¿HHaayy pprroobblleemmaass ééttiiccoo mmoorraalleess eenn eell ddeessaarrrroolllloo??

1.5 MARCO TEORICO

En el marco teórico se integra con las teorías, enfoque teóricos, estudios y

antecedentes en general que se refieran al problema de investigación.

Para elaborar el marco teórico es necesario detectar, obtener y consultar la

literatura y otros documentos pertinentes para el problema de investigación,

así como extraer y recopilar de ellos la información de interés.

11

La revisión de la literatura puede iniciarse manualmente o

acudiendo a un banco de datos al que se tenga acceso por

computadora.

La construcción del marco teórico depende de lo que

encontremos en la revisión de la literatura:

Marco Teórico: Fundamentación teórica dentro de la cual se

enmarca la investigación

Marco Conceptual: Definición de conceptos relevantes utilizados en

el estudio

Marco Normativo: Normas, leyes referentes al estudio

¿Qué funciones cumple el marco teórico?

Sirve de guía al Investigador

Provee un marco para la interpretación de resultados

Prevenir errores.

Orientar el estudio,

Ampliar el horizonte del estudio y guiar al investigador,

Delimitar el área de investigación,

Establecer los antecedentes del problema,

Fundamentar el contenido del problema,

Facilitar la formulación de las hipótesis,

Implicar nuevas líneas y áreas de investigación,

Proveer un marco de referencia para interpretar los resultados de

estudio.

1.6 HIPOTESIS DE INVESTIGACION

Afirmaciones o suposiciones que hace el investigador respecto al

problema de investigación.

Es una suposición que permite establecer relaciones entre hechos. El

valor de una hipótesis reside en su capacidad de establecer esas

relaciones entre los hechos y de esa manera, explicarnos por qué se

produce el fenómeno de estudio.

12

¿Qué Funciones cumple?

Direccionar el problema objeto de investigación

Identificar variables objeto de análisis

Orientar el uso de métodos y técnicas de obtención de información

Elementos estructurales de la hipótesis

1. Las unidades de análisis, que puedan ser los individuos, grupos,

viviendas, instituciones, etc.

2. Variables, las características o propiedades cualitativas o

cuantitativas que presentan las unidades de análisis.

3. Los elementos lógicos, son los que relacionan las unidades de

análisis con las variables y estas entre sí.

Requisitos para estructurar las hipótesis

Las hipótesis deben referirse sólo a un ámbito determinado de la

realidad social. Las hipótesis en las ciencias sociales sólo pueden

someterse a prueba en un universo y contexto bien definidos.

Los conceptos de las hipótesis deben ser claros y precisos. En las

hipótesis, los conceptos son las variables y las unidades de

análisis.

Los conceptos de las hipótesis deben contar con realidades o

referencias empíricas observables (verificables).

El planteamiento de las hipótesis deben prever las técnicas para

probarlas. Se deben formular hipótesis que están relacionadas

con técnicas disponibles para su verificación.

RREEQQUUIISSIITTOOSS PPAARRAA FFOORRMMUULLAARR LLAA HHIIPPÓÓTTEESSIISS

Debe referirse a hechos reales.

Debe ser formulada en términos de relación o causalidad.

Las variables y su relación, tienen que ser comprensibles,

precisos y concretos.

Tener fundamentación teórica.

Deben ser de poder predictivo y explicativo.

13

CCARACTERÍSTICAS

Ser específicas (E):

Debe indicar un asunto concreto por investigar.

Ser lógica (L):

- La relación de las variables debe ser racionalmente pertinentes

- Debe tener poder explicativo, debe ser respuesta a su problema.

- Debe ser compatible con los conocimientos actuales (Teoría)

Ser Contrastable (C) :

Es decir, ser comprobable

- Necesita tener referencia empírica, capacidad de ser probada y

verificada en los hechos.

- Debe ser operacional.

- Fundamentarse en un cuerpo teórico.

Estar de acuerdo con las técnicas y recursos disponibles para probarlas.

ELEMENTOS ESTRUCTURALES DE LA HIPÓTESIS

Las unidades de análisis:, que pueden ser individuos, familias,

grupos, instituciones y otros.

Las Variables: Independiente y dependiente.

Los elementos lógicos, que relacionan las unidades de análisis

con las variables y a estas entre sí.

1.7 NIVELES DE INVESTIGACIÓN.

El nivel de una investigación viene dado por el grado de profundidad y alcance

que se pretende con la misma

14

INVESTIGACIÓN DESCRIPTIVA

Orientada al descubrimiento de las propiedades particulares del hecho o

situación problemática y también a la determinación de la frecuencia con que

ocurre el hecho o situación problemática.

Responde a las preguntas ¿Cómo son? ¿Cuántos son? ¿Dónde están? Se

refiere a las características cualidades internas y externas, propiedades y

rasgos de la población de estudio

Problema

Pregunta ¿Cuál es grado de .....? ¿Qué nivel…?

Ejemplo 2:

Nivel de conocimiento de las estrategias cognitivas por los profesores, de la

población de la ciudad de Cusco, 2011.

INVESTIGACIÓN EXPLICATIVA

Orientada al descubrimiento de las causas o consecuencias o

condicionantes de la situación problemática

Está dirigida a responder a las causas de los eventos físicos o sociales y

su interés se centra en explicar por qué y en qué condiciones ocurre un

fenómeno, o por qué dos o más variables se relacionan.

¿Por qué? La finalidad es determinar por qué un hecho o fenómeno de

la realidad tiene tales y cuales características.

Problema Pregunta ¿En que medida .....? ¿Cómo influye..?

Ejemplo 3:

Principales causas de la deserción escolar en la región andina del Perú, 2010.

INVESTIGACIÓN COMPARATIVA

Orientada al estudio de las semejanzas o diferencias de un hecho o situación

problemática en dos circunstancias diferentes.

Ejemplo 4:

Nivel de aplicación de metodologías de enseñanza por los profesores de las

instituciones educativas A y B de Cusco, 2010.

15

INVESTIGACIÓN RELACIONAL

Orientada al descubrimiento de la influencia de un hecho o situación

problemática en otro hecho o situación problemática.

Ejemplo 5:

Influencia de la internet en la lectura de los estudiantes de secundaria de la

Ciudad del Cusco, 2011.

INVESTIGACIÓN CORRELACIONAL

Orientada a descubrir la covariación o correspondencia entre los valores de dos

hechos o situaciones problemáticas.

Ejemplo 6:

Correlación entre hábitos de estudio y aprendizaje en los estudiantes de la

Universidad de Nacional San Antonio Abad del Cusco, 2011.

INVESTIGACIÓN EXPERIMENTAL

Orientada a descubrir la validez de un hecho para la modificación de una

situación problemática.

¿Qué cambios y modificaciones se han producido? ¿Qué mejoras se

han logrado?.

Problema Pregunta ¿Es más eficaz …..….que……....?

Ejemplo 7:

Evaluación del efecto del uso de tres tipos de materiales didácticos en el

rendimiento académico, en las I.E de la ciudad de Cusco, 2011.

1.8 TIPOS DE INVESTIGACION

Los Tipos de investigación se determinan mediante la aplicación de distintos

criterios, a continuación se refieren algunos de ellos.

INVESTIGACION BASICA. Solo busca aplicar y profundizar el conocimiento

científico existente acerca de la realidad.

16

INVESTIGACION APLICADA. Se investiga para transformar, modificar o

producir cambios en un determinado sector de la realidad.

INVESTIGACION SUSTANTIVA. Se orienta a resolver problemas facticos, su

propósito es dar respuesta objetiva a interrogantes que se plantea en un

determinado fragmento de la realidad y del conocimiento con el objeto de

contribuir en la estructuración de las teorías científicas.

INVESTIGACION TECNOLOGICA. Se relaciona esencial, objetiva y

metodológicamente con el nivel experimental, se busca cambios mediante la

aplicación de nuevos sistemas.

1.9 DISEÑOS DE INVESTIGACION.

Conjunto de estrategias procedimentales y metodológicas definidas

y elaboradas para el desarrollo del proceso de investigación.

El diseño de investigación puede ser pensado como la estructura

de la Investigación.

El investigador debe seleccionar un diseño de investigación. Esto

se refiere a la manera práctica y precisa que el investigador adopta

para cumplir con los objetivos de su estudio, ya que el diseño de

investigación indica los pasos a seguir para alcanzar dichos

objetivos. Es necesario por tanto que previo a la selección del

diseño de investigación se tengan claros los objetivos de la

investigación.

Las maneras de cómo conseguir respuesta a las interrogantes o

hipótesis planteadas dependen de la investigación. Por esto,

existen diferentes tipos de diseños de investigación, de los cuales

debe elegirse uno o varios para llevar a cabo una investigación

particular (Hernández, Fernández y Baptista, 2000; Castillo, 2005).

La precisión, la profundidad así como también el éxito de los

resultados de la investigación dependen de la elección adecuada

del diseño de investigación. He aquí un esquema donde se

resumen los diferentes tipos de investigación según Hernández,

Fernández y Baptista (2000).

17

Diseños experimentales

Son aquellos en los que se cumple que:

Los grupos a ser investigados han sido asignados al azar, por

procedimientos aleatorios y los grupos resultantes son equivalentes, de

tal manera que se tiene un grupo control equivalente a los grupos

experimentales.

Diseños cuasi-experimentales.

Entendemos por diseños cuasi-experimentales cuando se cumplen las

siguientes condiciones:

Los grupos sobre los que se lleva a cabo la investigación no han

podido establecerse como equivalentes en las características

fundamentales. Los grupos no han sido asignados al azar, sino

que han sido establecidos por algún otro procedimiento de

muestreo.

Como dice Hernández et al.“En los diseños cuasi-experimentales

los sujetos no son asignados al azar a los grupos no

emparejados; sino que dichos grupos ya estaban formados antes

18

del experimento, son grupos intacto (la razón por la que surgen y

la manera como se formaron fueron independientes o aparte del

experimento.”

También algunos autores denominan CUASI-EXPERIMENTAL,

cuando el investigador aplica un tratamiento a un solo grupo de

sujetos, sin grupo de control, observándolo antes y después de

aplicar el tratamiento.

Diseños no-experimentales.

Se establece que un diseño no-experimental es: “la que se realiza sin

manipular deliberadamente variables. Es decir, se trata de investigación donde

no hacemos variar intencionadamente las variables independientes. Lo que

hacemos en la investigación no experimental es observar fenómenos tal y

como se dan en su contexto natural, para después analizarlos.” (Hernández,

184)

La diferencia con los diseños experimentales y cuasi- experimentales se ve con

claridad, porque en estos dos siempre hay algún tipo de intervención del

investigador, que manipula las variables independientes para averiguar su

influencia en las variables dependientes.

Método transversal: Es el diseño de investigación que recolecta datos de un

solo momento y en un tiempo único. El propósito de este método es describir

variables y analizar su incidencia e interrelación en un momento dado.

Diseños transversales descriptivos: son aquellos que tienen como objetivo

indagar la incidencia y los valores en que se manifiesta una o más variables.

Diseños transversales correlacionales: Se encargan de describir relaciones

entre dos o más variables en un momento determinado.

Diseños transversales explicativos: Son aquellos en los cuales las

causas y efectos ya ocurrieron en la realidad (estaban dados y manifestados)

y el investigador los observa y explica.

19

Diseños longitudinales: Son aquellos que analizan cambios a través del

tiempo (en variables o sus relaciones), dentro de alguna población en general.

1.10 VARIABLES

A las características objeto de estudio en la población se les llama variables, ya

que pueden variar de un individuo a otro y se representara por letras

mayúsculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que

hay, lo cual nos va a permitir utilizar las herramientas estadísticas apropiadas.

TIPOS DE VARIABLES.

Las variables estadísticas pueden ser de dos tipos:

Variables cualitativas o atributos: describen cualidades y no toman

valores numéricos, estas a su vez pueden ser:

Nominales.- Las cualidades no presentan ningún orden. Ejemplo Sexo

del estudiante (Femenino, Masculino), Procedencia, I.E.

Ordinales.- Este tipo de variables presentan orden Ejemplo: Grado de

estudios (Analfabeto, primaria, secundaria, superior), Nivel de

conocimiento de Docentes.

Variables cuantitativas: toman valores numéricos. A su vez pueden ser:

Discretas.- Solo toman un número finito o infinito numerable de valores

distintos (generalmente números naturales o enteros). Ejemplos:

número de estudiantes por secciones, número de profesores, número

de aulas, etc.

Continuas.- Toman valores en un intervalo. Generalmente

corresponden a medir magnitudes continuas. Ejemplo, Rendimiento

académico, altura, ingreso del docente, etc.

Una característica esencial de este tipo de variables es que sus valores nunca

son observables con exactitud, sino que dependen (las observaciones) de la

precisión del instrumento de medida.

20

Ejemplo 7

Un especialista estudia, el nivel de introversión en niños menores de 4 años en

las instituciones educativas de la ciudad de Cusco. Defina los conceptos

previos para este estudio.

Solución:

Población: Niños menores de 4 años de las I.E de la ciudad de Cusco.

Muestra: Niños de 3 años de las I.E de la ciudad de Cusco.

Variable: Nivel de Introversión.

Tipo de variable: Cuantitativa

Unidad de estudio: Niño menor de 4 años.

1.11 ESCALAS DE MEDICION

Se llama medición al proceso de atribuir números a las características.

Tenemos las siguientes escalas de medición: nominales, ordinales,

cuantitativas de intervalo y cuantitativas de razón.

Escala nominal. La clave de estas escalas de medida es que sólo

informan de la igualdad o desigualdad de los individuos en una

característica, pero no de posibles ordenaciones, puesto que la

característica a la que se refieren no se tiene en mayor o menor medida,

sino que simplemente adopta formas cualitativamente distintas. Los

números solo sirven para distinguir valores o categorías diferentes de la

variable.

Esta escala se emplea para variables cualitativas nominales.

Ejemplo 8: El sexo 1=Masculino y 2=Femenino esto simplemente es un

proceso de codificación pero no significa que la mujer sea mayor que el

hombre, ni el doble, ni que existe sexo intermedio.

Escala Ordinal. Los números además de servir para distinguir reflejan un

orden existente sobre los valores de la variable.

21

Se obtiene clasificando objetos o arreglándolos en un orden con respecto

a alguna variable común. La pregunta es simplemente, si el objeto tiene

más o menos de esta variable que algún otro objeto.

Esta escala se emplea para variables cualitativas ordinales.

Ejemplo 9: Nivel de conocimientos de estrategias cognitivas por parte de

los docentes. Excelente=5, bueno =4, regular =3 y malo = 2.” es cierto la

relación de orden 2<3<4<5.

Escala de Intervalo: La ubicación del punto origen no es fija, puesto que

0 no denota la ausencia del atributo. Aquí los números para clasificar los

objetos representan también incrementos iguales del atributo que se esta

midiendo. Esto significa que los números pueden ser comparados. La

diferencia en 1 y 2 es la misma que entre 2 y 3, pero es solo la mitad de

la diferencia entre 2 y 4.

Las temperaturas Fahrenheit y Centígrados son medidas que tiene

diferentes escalas de intervalo y diferentes puntos de 0.

Escala de Razón: Medida numéricas en las cuales cero es un valor fijo

en cualquier escala y la diferencia entre valores es diferente

Además de la distancia de orden e intervalo, se añade un origen absoluto

de forma que no solo cabe hallar distancias (ya en la escala de intervalo),

si no también múltiplos exactos. En este caso, el valor representado por 4

tiene doble cantidad medida que él representado por un 2.

Ejemplo 10: Edad del profesor expresada en años.

40 años y 20 años son edades distintas y 40 años es superior a 20

años

Entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 30.

El 0 tiene sentido. Una persona con 0 años, realmente no tiene edad

todavía no ha nacido.

En el siguiente cuadro se muestra un resumen de las características de

las escalas de medición.

22

Resumen de escalas de medición

Tipo Información

deducible

Transform.

admisibles

Significa

orden

Significa

distancia

Significa

Origen Ejemplos

Nominal

Relaciones

“igual que” o

“distinto que”

Aplicaciones

inyectivas

No No No Procedencia

del Profesor,

tipo de

metodologia

Ordinal

Relaciones

“mayor que”

o “igual que”

Funciones

crecientes

Si No No Grado de

planificación,

Nivel de

utilización de

materiales

educativos.

Intervalo

Igualdad o

desigualdad

de

diferencias

A + b.x

(b 0)

Si Si No

Temperatura,

inteligencia

Razón

Igualdad o

desigualdad

de razones

B .x

(b 0)

Si Si Si Rendimiento

académico,

Número de

estudiantes.

ESCALAS PARA LA MEDICION DE ACTITUDES

La escala de clasificación por categorías es la que usan ampliamente los

investigadores de ciencias de la salud y sociales.

Escala de clasificación por categorías:

Existen cuatro categorías a partir de las cuales los entrevistados pueden

elegir para señalar su nivel general de satisfacción.

- Muy satisfecho (+2)

- Satisfecho (+1 )

- Algo satisfecho (0)

- No del todo satisfecho (-1)

Escala De Comparación:

Es una versión de la escala de categorías, califica a estas categorías

como: “excelente”, “muy bueno”, “bueno”, “regular” y “deficiente”,

23

eliminando de esta forma la comparación implícita. El problema con tal

escala es que el punto de referencia es poco claro y diferentes

entrevistados pueden usar diferentes puntos de referencia o estándares.

Escala de Likert:

La escala de Likert requiere que un entrevistado indique un grado de

acuerdo o desacuerdo con respecto a una variedad de afirmaciones

(reactivos) relacionadas con el objeto de las actitudes.

Es un tipo de instrumento de medición o de recolección de datos que

disponemos en la investigación social.

Es una escala para medir las actitudes.

Consiste en un conjunto de ítems bajo la forma de afirmaciones o juicios

ante los cuales se solicita la reacción (favorable o desfavorable, positiva

o negativa) de los individuos.

Alternativas o puntos en la escala de Likert

Asignación

Numérica

I

Asignación

Numérica

II

Alternativa

A

Alternativa

B

Alternativa

C

Alternativa

D

2 5 Muy de

acuerdo

Totalmente

de acuerdo

Definitivamen

te sí

Completame

nte

verdadero

1 4 De acuerdo De acuerdo Probablemen

te sí

Verdadero

0 3 Ni de

acuerdo, ni

en

desacuerdo

Neutral o

indiferente

Indeciso Ni falso, ni

verdadero

-1 2 En

desacuerdo

En

desacuerdo

Probablemen

te no

Falso

-2 1 Muy en

desacuerdo

Totalmente

en

desacuerdo

Definitivamen

te no

Completame

nte falso

24

Para obtener las puntuaciones de la escala de Likert, se suman los valores

obtenidos respecto de cada items. El puntaje mínimo resulta de la

multiplicación del número de ítems por 1. Una puntuación alta está dada por el

número de ítems o afirmaciones multiplicado por 5.

PM--------------------I----------------------I----------------------I------------------

PA

Donde: PM: Puntaje mínimo y PA: Puntaje Máximo.

Ejemplo 11: Ha encontrado en la institución educativa el apoyo y las

facilidades necesarias para que usted desarrolle de modo óptimo su trabajo.

( ) Definitivamente sí

( ) Probablemente sí

( ) Indeciso

( ) Probablemente no

( ) Definitivamente no

Ejemplo 12: El Director de la UGEL se preocupa por el bienestar del recurso

humano.

Categorías de Respuesta Frecuencia Porcentaje Asignación de

puntajes

Totalmente de acuerdo (5) 2 4.4% 2(5)

De acuerdo (4) 4 9% 4(4)

Indeciso (3) 7 15.6% 7(3)

En desacuerdo (2) 9 20% 9(2)

Totalmente en desacuerdo (1) 23 51% 23(1)

n=45 100% Total=88

Para interpretar el puntaje se ubica en los tramos de la escala de likert.

25

Totalmente

En desacuerdo

(1)

En

desacuerdo

(2)

Indeciso

(3)

De acuerdo

(4)

Totalmente de

Acuerdo (5)

45*1=45 45*2=90 45*3=135 45*4=180 45*5=225

La puntuación 88 se aproxima a 90, por lo tanto se ubica en la parte que indica

en desacuerdo.

1.12 TIPOS DE VARIABLES UTILIZADAS EN LA INVESTIGACION

CIENTIFICA.

Toda característica de estudio se conoce como variable.

Variable independiente

Es aquella que juega un rol determinante, causal o de influencia en

otra u otras variables, supone cierta autonomía con relación a las

demás variables, pero es necesario, señalar que las variables

independientes en determinados problemas, pueden cambiar, según

sea la posición que ocupen en el enunciado, debido a que la realidad

está en movimiento y que todos los hechos están concatenados.

Este tipo de variable se encuentra en las siguientes investigaciones:

1. Explicativa,

2. Relacional

3. Experimental ( en la experimental se le conoce como estímulo)

4. Correlacional

Variable dependiente

Es aquella que juega un rol de consecuencia, al ser determinada,

originada o influida por la variable independiente. Esto significa que

no pueden existir variables dependientes sin las independientes.

Considerando el tiempo, las independientes son más antiguas que

las dependientes. Se encuentran en las siguientes investigaciones:

1. Explicativa

26

2. Relacional

3. Correlacinal

4. Experimental (La variable dependiente en una investigación

experimental se le conoce como respuesta)

Ejemplo 13:

En el problema influencia del uso de mapas mentales en el rendimiento

académico de los estudiantes de las I.E de la región de Cusco, 2011.

Variable independiente: Rendimiento Académico

Variable dependiente: Uso de mapas mentales

Variable Intermedia

Es aquella que juega un rol de factor condicionante, pues su

presencia entre la variable independiente y variable dependiente

hace que sin tener el carácter de factor causal o determinante,

modifique le resultado más complejas y de mayor profundidad.

Ejemplo 14:

En el estudio de formación académica y rol de la experiencia en el

desempeño profesional, Quillabamba. 2011.

Variable independiente: formación académica.

Variable Dependiente: Desempeño profesional

Variable Intermedia : Experiencia

Variable interviniente

Es aquella que en ciertas medida juega un rol pasivo en el problema,

pues permite medir las características, atributos, estructuras,

incidencia, elementos o aspectos que se son inherentes.

La variable interviniente, la encontramos en investigaciones:

1. Descriptiva

2. Comparativa.

27

Ejemplo 15:

En el problema: Niveles de desnutrición de los estudiantes de las

instituciones educativas de la ciudad de Sicuani, 2011.

Variable interviniente : Nivel de desnutrición.

Variables Asociadas

Son aquellas que no guardan mayor nivel de dependencia, no hay

relación causal entre ellas y considerando el criterio tiempo vienen a

ser más o menos contemporáneas, pues para que aparezca el

problema surgen de manera simultánea.

Este tipo de variables, se encuentra en la investigación descriptiva

multivariable, se trata de dos o más variables intervinientes, por lo

que nunca van acompañadas de algún otro tipo de variables.

Ejemplo 16:

En el problema: Rasgos sociales y culturales de los profesores de la

ciudad de Cusco , 2011.

Las variables asociadas son rasgos sociales y rasgos culturales

Variables Interdependientes

Son aquellas que indistintamente pueden ser consideradas como

causa o como consecuencia una de otra. Corresponden a la

investigación correlacional.

Ejemplo 17:

En el problema: Correlación entre tipo de alimentación y obesidad

de los estudiantes de la ciudad de Cusco, 2010.

Las variables interdependientes, son tipo de alimentación y obesidad

28

Resumen del tipo de variables según tipo de investigación.

Descriptiva

Interviniente

Asociada

Comparativa

Interviniente

Explicativa

Independiente(s)

Dependiente(s)

Relacional

Independiente

Dependiente

Correlacional

Interdependiente

Interdependiente

Experimental

Estimulo (Factor)

Respuesta

Observaciones:

1. Las variables según su naturaleza se clasifican en cuantitativas y

cualitativas.

2. Las variables según su relación casual se clasifican en:

independiente, dependiente, interviniente.

En el área de las ciencias de la salud, se tiene los siguientes tipos de

investigación biomédica.

1.13 RECOPILACIÓN DE DATOS.

Dentro de un proceso de investigación una de las actividades que se realizan

es la recopilación de datos, la cual es el acopio de información y se incluye

desde elaborar fichas bibliográficas hasta la aplicación de cuestionarios con el

empleo de técnicas de muestreo.

Para Hernández et.al. (2006) un instrumento de medición es un recurso que

utiliza el investigador para registrar información o datos sobre las variables que

tiene en mente.

La construcción de instrumento consiste en generar un número suficiente de

ítems para medir todas las variables con todas sus dimensiones.

La recopilación de datos, se puede realizar mediante:

Investigación documental

Investigación de campo

29

La investigación documental. Consiste en el estudio de documentos

escritos sobre un objeto determinado, es decir son todos aquellos

documentos registrados en diferentes dispositivos físicos a los que

podemos tener acceso en forma directa o indirecta para su consulta y se

puede clasificar en:

1.- Documental bibliográfica 4.- Documental audiográfica

2.- Documental hemerográfica 5.- Documental videográfica

3.- Documental escrita 6.- Documental iconográfica

La investigación de campo. Consiste en obtener información directa

mediante diferentes actividades por contacto directo con el hecho que se

quiere investigar así como las personas relacionadas y se puede

realizar:

a) Por observación directa

b) Por interrogación

La observación. Es el procedimiento empírico básico, el cual consiste

en realizar la percepción intencionada de una actividad determinada

mediante la experimentación la cual consiste en la obtención de datos

cuantitativos por medio de la medición del fenómeno que se este

observando. Para realizar la observación se utilizan diversos

instrumentos auxiliares los cuales son:

1.- La ficha de campo 3.- La entrevista

2.- Estudio de Actividades 4.- La encuesta

La Entrevista. Es una de las técnicas más comunes y es considerada

como la relación directa entre el investigador y el objeto de estudio a

través de individuos o grupos con el fin de obtener testimonios reales.

a) Entrevistas formales

b) Entrevistas informales

La Encuesta. Consiste en recopilar información sobre una parte de la

población.

30

La información recopilada puede emplearse para un análisis cuantitativo

con el fin de identificar las magnitudes del problema.

El Cuestionario. Es un eficaz auxiliar en la observación científica que

contiene aspectos del fenómeno esenciales, las cuales son preguntas

formuladas por escrito y no es necesaria la presencia del investigador.

- Cuestionarios por correo

- Cuestionario administrado por el entrevistado

- Cuestionario administrado por el entrevistador

La Cedula. Tiene carácter de anónimo, donde el encuestador es quien

llena la cedula de entrevista, además de que es posible aclara la

información sobre las preguntas y es utilizada cuando una persona tiene

un bajo nivel cultural.

1.14 VALIDACIÓN DEL INSTRUMENTO

La validación de los instrumentos se realiza con el fin de conseguir una mayor

objetividad al seleccionar los ítems en los respectivos cuestionarios.

VALIDEZ DE CONTENIDO

El proceso de validación de contenido es eminentemente lógico, si bien pueden

utilizarse jueces expertos en el tema para valorar la congruencia entre los

diversos items y los diversos objetivos.

Existen procedimientos cuantitativos diversos para que cada experto valore el

grado en que un ítem sirve para evaluar el objetivo al que corresponde. El

procedimiento cuantitativo más sencillo sería el siguiente:

Especificar los diversos objetivos (v.gr. áreas diferentes de contenidos)

que se Pretenden evaluar.

Elaborar varios ítems para cada objetivo.

Seleccionar una muestra de expertos en el contenido del test.

Pedirles que, según su opinión, asignen cada ítem al objetivo que

pretende medir.

31

Seleccionar los ítems en los que los expertos manifiestan mayor acuerdo

en sus clasificaciones.

CRITERIO DE EXPERTOS

Método 1:HOJA DE PREGUNTAS PARA LA VALIDACIÓN

PREGUNTAS ESCALA DE VALORACION

1. ¿Considera usted que los ítems del instrumento

miden lo que se pretende medir?

1 2 3 4 5

2. ¿Considera usted que la cantidad de ítems

registrados en esta versión son suficientes para

tener una comprensión de la materia de estudio?

1 2 3 4 5

3, ¿Considera usted que los ítems contenidos

en este instrumento, son una muestra representativa del

universo materia del estudio?

1 2 3 4 5

4. ¿Considera usted que si aplicamos en reiteradas

oportunidades este instrumento a muestras similares,

obtendríamos también datos similares?

1 2 3 4 5

5. ¿Considera usted que los conceptos utilizados en

este instrumento, son todos y cada uno de ellos, propios

de las variables del estudio?

1 2 3 4 5

6. ¿Considera usted que todos y cada uno de los ítems

contenidos en este instrumento tienen los mismos

objetivos?

1 2 3 4 5

7. ¿Considera usted que el lenguaje utilizado en

el presente instrumento es claro, sencillo y no da lugar

a diversas interpretaciones?

1 2 3 4 5

8. ¿Considera usted que la estructura del presente

instrumento es adecuada al tipo de usuario a quien se

dirige el instrumento?

1 2 3 4 5

9. ¿Estima usted que las escalas de medición

utilizadas son pertinentes a los objetos materia de

estudio?

1 2 3 4 5

10. ¿Que aspectos habría que modificar, que aspectos tendrían que incrementarse o que aspectos

habría que suprimirse?…………

32

PROCEDIMIENTO

El método DPP mide la adecuación de los instrumentos, para medir la variable

de interés, en función a la valoración de los expertos.

Ejemplo 18.

En el presente estudio la valoración de los expertos es:

Item

EXPERTOS

1 2 3 4 Promedio

1 5 4 5 5 4.75

2 5 5 5 5 5

3 5 4 5 4 4.5

4 5 5 4 4 4.5

5 5 5 5 5 5

6 5 5 5 5 5

7 4 5 3 4 4

8 4 4 5 4 4.25

9 4 4 5 5 4.5

2. Con los promedios hallados, se determina la distancia de punto múltiple

(DPP), mediante la siguiente ecuación:

2 2 2

1 1 2 2 9 9................DPP = (X Y ) +(X Y ) + (X Y )

Donde:

Xi = Valor máximo en la escala para el ítem i.

Yi = El promedio del ítem i.

2 2 25 4.75 5 5 ................ 5 4.5 1.541DPP = ( ) +( ) + ( )

Determinar la distancia máxima (Dmax) del valor obtenido respecto al punto de

referencia Cero (0), con la ecuación:

2 2 2

1 2(1)(1)...................(1)Max nDx x x

Donde:

Xi = Valor máximo en la escala concedido para el ítem i.

1 = Valor mínimo de la escala para cada ítem.

33

2 2 2(5 1) (5 1) ...................(5 1) 12MaxD

La Dmax hallada fue de 12

La Dmax se divide entre el valor máximo de la escala, lo que nos da un valor

de 12/5=2.4

5. Con el valor hallado anteriormente (apartado 4) se construye una nueva

escala valorativa a partir de cero, hasta llegar a Dmax. Dividiéndose en

intervalos Iguales entre si, llamándose con las letras A, B, C, D, y E.

Siendo:

Escala Valoración Valoración de

Expertos

0-2.4 A = Adecuación Total DPP=1.541

2.4-4.8 B = Adecuación en gran medida

4.8-7.2 C = Adecuación Promedio

7.2-9.6 D = Escasa Adecuación

9.6-12 E = inadecuación

6. El punto DPP debe caer en las zonas A o B; en caso contrario, la encuesta

requiere reestructuración y/o modificación, luego de las cuales se somete

nuevamente a juicio de expertos. El valor hallado del DPP fue de 1.541

cayendo en la zona A, lo que indica la Adecuación del instrumento y que

puede ser aplicado.

34

Método 2

Cuadro 1. Formato para validar instrumentos a incluir en el instrumento de

validación.

ÍTEM Criterios a evaluar observaciones

( si debe

eliminarse o

modificarse un

favor indique)

Claridad

En la

redacció

n

Coherencia

interna

Inducción

a la

respuesta

(sesgo)

Lenguaje

Adecuado

Con el nivel

Del

informante

Mide lo

que

pretend

e medir

Si No Si No Si No Si No Si No

1

..

n

Aspectos generales Si No *************

El instrumento contiene instrucciones claras y precisas

para responder el cuestionario

Los ítems permiten el logro del objetivo de la investigación

Los ítems están distribuidos en forma lógica y secuencial

El número de ítems es suficiente para recoger la

información. En caso de ser negativa su respuesta, sugiera

los ítems a añadir

Validez

Aplicable ( ) No aplicable ( )

Validado por:

Firma:

35

1.5.10 CONFIABILIDAD del INSTRUMENTO

Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario

sobre un pequeño grupo de población. Esta prueba piloto ha de garantizar las

mismas condiciones de realización que el trabajo de campo real. Se

recomienda un pequeño grupo de sujetos que no pertenezcan a la muestra

seleccionada pero sí a la población o un grupo con características similares a la

de la muestra del estudio, aproximadamente entre 14 y 30 personas. De esta

manera se estimará la confiabilidad del cuestionario.

La confiabilidad responde a la pregunta ¿con cuánta exactitud los ítems,

reactivos o tareas representan al universo de donde fueron seleccionados?. El

término confiabilidad “…designa la exactitud con que un conjunto de puntajes

de pruebas miden lo que tendrían que medir” (Ebel, 1977, citado por Fuentes,

op. cit., p. 103).

Entre los métodos para estimar la confiabilidad, se tienen:

Método Test-Retest: una forma de estimar la confiabilidad de un test o

cuestionario es administrarlo dos veces al mismo grupo y correlacionar las

puntuaciones obtenidas.

El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad

porque denota la coherencia de las puntuaciones en el tiempo

Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 0,95

(Popham, 1980, citado por Fuentes, op. cit.).

Se usa la correlación por el método de los puntajes directos (Correlación r de

Pearson):

2 22 2*

i i i i

xy

i i i i

n x y x yr

n x x n y y

Donde:

xyr : es el coeficiente de correlación

n: número de sujetos

X: valores de X (1ª aplicación)

36

Y: valores de Y (2ª aplicación)

Método común de división por mitades o Hemitest: este método computa el

coeficiente de correlación entre los puntajes de las dos mitades del test o

cuestionario aplicado. Esto supone que las dos test mitades son paralelos,

tienen igual longitud y varianza entre sí. Se estima a través del coeficiente de

confiabilidad de Spearman-Brown:

Se establece la correlación entre los dos puntajes de las dos mitades del test a

través del método de los puntajes directos, Correlación r de Pearson:

1 2 1 2

122 22 2

1 1 2 2*

n x x x xr

n x x n x x

Estimación del test completo (Spearman-Brown) con la fórmula:

12

12

2

1tt

rr

r

Se interpreta la prueba de hemitest como coeficiente de consistencia

interna, ya que una sola prueba contiene las dos formas equivalentes y su

énfasis lo pone en las puntuaciones de los sujetos, no en los ítemes.

El método de división por mitades de Rulon: utiliza la división del test en

mitades, pero su método no supone necesariamente varianzas iguales en los

sub-tests. coeficiente de consistencia interna.

2

21 d

tt

t

sr

s

Donde:

ttr : coeficiente de confiabilidad

2

ds : varianza de la diferencia entre las puntuaciones de las mitades

2

ts : varianza de las puntuaciones del test total

El método de división por mitades de Guttman: también se denomina

coeficiente de consistencia interna. Su fórmula es:

37

2 2

22 1 a b

tt

t

s sr

s

Donde:

ttr : coeficiente de confiabilidad

2

as : varianza de las puntuaciones de los ítemes pares

2

bs : varianza de las puntuaciones de los ítemes impares

2

ts :varianza de las puntuaciones del test total

ALFA DE CRONBACH

Para evaluar la confiabilidad o la homogeneidad de las preguntas o ítems es

común emplear el coeficiente alfa de Cronbach cuando se trata de alternativas

de respuestas policotómicas, como las escalas tipo Likert; la cual puede tomar

valores entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa

confiabilidad total. El coeficiente α de Cronbach puede ser calculado por medio

de la varianza de los ítems y la varianza del puntaje total (Hernández Sampieri

et al, 2003). Para calcular el coeficiente de confiabilidad se usó el

”COEFICIENTE ALFA DE CROMBACH ( )” Córdova (2009), cuya ecuación

es:

donde:

: coeficiente de confiabilidad de la prueba o cuestionario

número de ítems del instrumento

: Varianza total del instrumento.

: Sumatoria de las varianzas de los ítems.

Método de Kuder-Richarson 21: permite obtener la confiabilidad a partir de

los datos obtenidos en una sola aplicación del test. La suposición básica es

considerar que todos los ítemes presentan igual varianza. Coeficiente de

consistencia interna.

38

21 21

1 t

M n MnKR

n ns

Donde:

n: número total de ítems

M: media aritmética de las puntuaciones obtenidas por los individuos

2

ts : varianza de las puntuaciones totales

Para la interpretación de la confiabilidad se utiliza el siguiente cuadro:

TABLA DE CATEGORÍAS

ESCALA CONFIABILIDAD

r>0.89

Muy alta

Alta

Aceptable

Moderada

Baja

Muy baja

Despreciable

39

Ejemplo 19.

Determine la confiabilidad, utilizando alfa de cronbach, para la siguiente

información

Encuestados

Preguntas (Ítems) Puntos

1 2 3 4 5 6 7 8 9 10

1 0 0 0 1 1 1 0 0 0 0 3

2 0 1 1 1 2 1 1 1 2 2 12

3 0 1 0 2 1 1 0 0 0 0 5

4 0 0 0 1 1 0 0 1 0 0 3

5 0 0 1 1 1 1 2 1 0 0 7

6 0 0 0 1 1 1 0 1 0 0 4

7 0 0 0 2 1 2 2 1 0 2 10

8 0 0 0 0 0 1 0 0 0 0 1

9 1 0 0 1 1 0 0 0 0 0 3

10 0 1 0 2 2 2 0 2 2 2 13

11 0 0 1 1 1 1 0 1 2 2 9

12 0 1 0 1 2 2 0 2 0 1 9

13 0 0 0 1 2 2 0 0 0 0 5

14 1 0 0 2 2 0 0 1 0 0 6

15 1 1 0 0 0 0 1 0 0 3

Total 3 5 3 17 18 15 5 12 6 9 93

0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83

varianza del instrumento

40

Varianza de cada pregunta

El índice de confiabilidad es alto de conformidad con la tabla de categorías.

BAREMACIÓN DEL INSTRUMENTO, UTILIZANDO ESCALA DE LIKERT.

Para medir la variable de estudio se aplico una encuesta utilizando la escala de

likert, la misma que presenta en cada ítems cinco alternativas, a partir de las

cuales los entrevistados pueden elegir, con la finalidad de señalar su nivel de

acuerdo.

Alternativa Asignación

numérica

a 5

b 4

c 3

d 2

e 1

Para obtener las puntuaciones de la variable de estudio, se suman los valores obtenidos

respecto de cada ítem. El puntaje mínimo (PM) resulta de la multiplicación del número de ítems

(x) por 1. Una puntuación alta (PA) está dada por el número de ítems o afirmaciones

multiplicado por 5.

PM--------------------I----------------------I----------------------I------------------PA

El promedio del puntaje del instrumento se obtiene mediante:

41

PrPuntaje

omedion

Para facilitar la interpretar las puntuaciones de la variable de estudio se transforman a una

escala cualitativa, según el siguiente criterio.

Puntaje Obtenido Categoría

Pr 1.49omedio Deficiente

1.5 Pr 2.5omedio Malo

1.5 Pr 2.5omedio Regular

1.5 Pr 2.5omedio Bueno

Pr 4.5omedio Muy

bueno

BAREMACIÓN DEL INSTRUMENTO, UTILIZANDO ESCALA DE INTENSIDAD.

Para medir las variables de estudio se aplica encuestas, las mismas que

presentan en cada ítem cuatro alternativas, a partir de las cuales los entrevistados

pueden elegir, con la finalidad de señalar su nivel de acuerdo.

El tipo de escala que se utiliza es ordinal (Escala de intensidad), asignación un

valor a cada alternativa como se muestra en el siguiente cuadro:

Alternativa Asignación

numérica

a 4

b 3

c 2

d 1

Con la finalidad de realizar un análisis estadístico de las variables con sus respectivas

dimensiones previamente se realizo la baremación del instrumento (Medición de la

variable)

42

Para medir la variable de estudio (Puntuación), se suman los valores obtenidos respecto de

cada ítem. El puntaje mínimo (PM) resulta de la multiplicación del número de ítems (x) por 1. El

puntaje máximo (PA) está dada por el número de ítems multiplicado por 4.

PM--------------------I----------------------I----------------------I------------------PA

En el cuadro siguiente se muestra el resumen de la puntuación:

Características Puntuación original

Puntuación transformada A escala vigesimal

Nro. de preguntas (Ítems)

m m

Mínimo m 1

Máximo 4m 20

Puntaje Obtenido T x

La puntuación original se transformación a una escala vigesimal utilizando la siguiente relación

11

4m-1 19

xT

Despejando el valor de x, se obtiene la puntuación del individuo en escala vigesimal.

19 11

4 1

Tx

m

Finalmente la escala vigesimal es transformada a una escala cualitativa:

Puntaje

Obtenido

Categoría

0-8 Deficiente

9-10 Malo

11-13 Regular

14-17 Bueno

18-20 Muy

bueno

43

5.11 MATRIZ DE CONSISTENCIA.

Esta referido a la estructura del proyecto de Investigación y que para fines didácticos se presenta en el siguiente esquema:

TITULO:………

PROBLEMA OBJETIVO HIPOTESIS VARIABLES

General

¿…………………….?

Formulación de problemas

específicos.

1. ¿………………….?

2. ¿………………

General

……………

Objetivo específico

..

General

………….

Formulación de hipótesis

operativas.

…

Variable independiente

……………

Variable Dependiente

TIPO DE ESTUDIO POBLACIÓN Y

MUESTRA

RECOLECCIÓN DE DATOS PRUEBAS

ESTADISTICAS

Nivel de investigación….

Tipo de investigación………….

Diseño de investigación………

Población….

Muestra…………

Guía de observación

Cuestionario encuestas

Entrevistas

…………….

VARIABLES DIMENSIONES INDICADORES Ubicación de ítems

…. …….. ………….. ………

44

MODELO DE TESIS

TÍTULO DE LA TESIS:

CAPITULO I: PROBLEMA DE INVESTIGACIÓN

PLANTEAMIENTO DEL PROBLEMA

FORMULACIÓN DEL PROBLEMA DE INVESTIGACIÓN

OBJETIVOS

JUSTIFICACIÓN

ORIGINALIDAD:

PERTINENCIA:

RELEVANCIA:

OPORTUNIDAD:

FACTIBILIDAD:

IMPORTANCIA

LIMITACIÓN

ÁREA DE ESTUDIO

DELIMITACIÓN

DELIMITACIÓN ESPACIAL

DELIMITACIÓN TEMPORAL

CAPITULO II: MARCO TEÓRICO

ANTECEDENTES DE ESTUDIO

MARCO CONCEPTUAL

MARCO NORMATIVO

MARCO TEÓRICO

CONCEPTUALIZACIÓN EN TÉRMINOS

HIPÓTESIS DE INVESTIGACION.

CAPITULO III: DISEÑO METODOLÓGICO

Estadística para la toma de decisiones Dr. Cleto De La Torre Dueñas

45

NIVEL DE INVESTIGACIÓN

TIPO DE NVESTIGACION.

DISEÑO DE INVESTIGACIÓN

POBLACIÓN Y MUESTRA

VARIABLES

OPERACIONALIZACIÓN DE VARIABLES

TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS

TÉCNICAS DE ANÁLISIS DE DATOS.

CAPITULO IV: PRESENTACION DE RESULTADOS

CONCLUSIONES

RECOMENDACIONES

BIBLIOGRAFIA

ANEXOS

46

EJERCICIOS PROPUESTOS.

1. Influencia del uso de materiales didácticos en el rendimiento académico de

los estudiantes de la ciudad de Cusco. Especifique.

a. La(s) variable(s) de estudio y el tipo de variable.

b. La escala de medición a emplear.

c. Nivel de investigación.

d. Tipo de investigación

e. Diseño de investigación

2. Se realizo el estudio de la calidad de vida y servicio educativo de los

profesores de las I.E de la UGEL Cusco. Especifique

a. Proponer un titulo para esta investigación.

b. La(s) variable(s) de estudio y el tipo de variable.

c. La escala de medición a emplear.

d. Nivel, tipo y diseño de investigación.

3. Se hizo una encuesta a una muestra representativa de profesores de la

UGEL La Convención sobre el nivel de acuerdo con la carrera pública

magisterial propuesta por el gobierno.

Carrera publica magisterial. Frecuencia

Totalmente de acuerdo 15

De acuerdo 40

Indeciso 25

En desacuerdo 10

Totalmente en desacuerdo 6

En base a la información, realice el análisis correspondiente.

4. Clasificar cada una de las siguientes variables :

a. Rendimiento Académico (Bajo, Medio, Alto).

b. Sexo.

c. Edad.


47

d. Nivel educativo (primario secundario, superior).

e. Años de estudios completados.

f. Tipo de enseñanza (privada o pública).

g. Estrato social (bajo, medio o alto).

h. Numero Telefónico

i. Numero de DNI de un profesor.

j. Método de enseñanza.

k. Nivel de congruencia entre la sumilla y el silabo.

5. En los siguientes temas de investigación

Causas de la deserción escolar en la Región Cusco, 2011.

Influencia del Uso de TIC en el rendimiento académico de los

estudiantes de la carrera Profesional de Educación, Universidad A,

2011.

Calidad de vida y desempeño pedagógico de los profesores de la

UGEL Cusco, 2011.

Elabore la matriz de consistencia para cada uno de los casos.

6. Se aplico un test para medir la competitividad del magisterio a una

muestra piloto de 5 profesores, obteniendo los siguientes resultados.

Profesor Ítems

1 2 3 4 5 6

1 1 0 1 0 0 0

2 0 0 1 1 0 1

3 1 0 0 1 1 1

4 1 0 1 1 0 0

5 0 0 1 0 1 1

Determine la confiabilidad y validez del instrumento.

48

CAPITULO II

ORGANIZACIÓN Y PRESENTACIÓN

La presentación de datos a través de tablas estadísticas es una actividad

importante dentro de los sistemas de información, estas se fortalecen

significativamente cuando se la acompañan con gráficos descriptivos ilustrativos.

En el contexto de los sistemas de información, en más de una oportunidad se

encontrara que un buen grafico resume y expresa mucho más que párrafos

completos de comentarios e interpretaciones literales.

Resumir los datos es un procedimiento útil para conseguirlo y puede hacerse

mediante tablas, gráficos o valores numéricos. A lo largo de este tema veremos las

principales técnicas numéricas y gráficas que nos permiten describir una

característica de interés observada en una población, poniendo en relieve sus

rasgos más importantes.

2.1 TABLA DE FRECUENCIAS.

Un primer resumen de la información contenida en un conjunto de datos

observado se obtiene al organizarlos en lo que se llama una tabla de

frecuencias. En ésta se recogen los distintos valores (números o categorías)

que toma la variable junto con sus correspondientes frecuencias de aparición.


49

2.1.1 TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS

Si en una muestra de n elementos, se observa k categorías diferentes C1,

C2,…, Ck de una variable cualitativa X.

Para resumir la información, previamente definimos algunos conceptos:

La frecuencia absoluta de un valor Ci es el número de veces que dicho valor

aparece en la muestra. Se representa por fi y cumple

1 2

1

......k

ki

i

f f f f n

La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta

(fi) entre el tamaño de la muestra (n), se representa por hi

ii

fh

n, se cumple

1

1k

i

i

h

La frecuencia absoluta acumulada del valor i-ésimo es la suma de las

frecuencias absolutas hasta dicho valor, se denota por Fi

1 2 ...... iiF f f f

La frecuencia relativa acumulada del valor i-ésimo es la suma de las

frecuencias relativas hasta dicho valor, se denota por Fi

1 2 ...... iiH h h h , ii

FH

n

Una tabla de frecuencias tiene la siguiente estructura:

50

Categoría

de la

variable X

Frecuencias

absolutas

fi

Frecuencias

relativas

hi

Frecuencias

Porcentuales

pi

frecuencias

absolutas

acumuladas

Fi

frecuencias

relativas

acumuladas

Hi

C1 f1 h1 p1 F1 H1

C2 f2 h2 pi F2 H2

…. … … … … …

Ck fk hk pk Fk=n Hk=1

Total n 1.00 100.00

GRAFICAS.

Las representaciones gráficas prácticamente están orientadas de acuerdo con

las necesidades del investigador o estadístico, de todas formas se tienen

algunas normas de trabajo y representación, que tienen por objeto facilitar la

lectura de los datos e información que se maneja estadísticamente.

La calidad de un gráfico estadístico consiste en comunicar ideas complejas

con precisión, claridad y eficiencia, de tal manera que:

• Induzca a pensar en el contenido más que en la apariencia

• No distorsione la información proporcionada por los datos

• Presente mucha información (números) en poco espacio

• Favorezca la comparación de diferentes grupos de datos o de relaciones

entre los mismos (por ejemplo una secuencia temporal)

La finalidad de los gráficos estadísticos es:

– Organizar los datos.

– Observar patrones.

– Observar agrupamientos.

– Observar relaciones.

– Comparar distribuciones.

– Visualizar rápidamente la distribución de los datos.


51

– Visualizar, obtener y comparar medidas estadísticas.

El cuadro anterior se puede representar utilizando los siguientes gráficos.

Diagrama de barras o rectangulos

Es la representación gráfica usual para variables cuantitativas sin agrupar o

para variables cualitativas.

Para el caso de variables cualitativas se construye dibujando sobre la

categoría correspondiente un rectángulo con altura igual a la frecuencia

(absoluta o relativa). También es válido para variables cuantitativas discretas,

considerando en el eje de abscisas los valores de la variable en orden

creciente en lugar de las categorías, sobre cada valor levantamos una barra

de altura igual a la frecuencia (absoluta o relativa).

Diagrama de Pareto.

Se ordenan las categorías de mayor a menor importancia y se dibujan los

rectángulos correspondientes.

Diagrama de sectores.

Es el más usual en variables cualitativas. Se representan mediante

círculos. A cada valor de la variable se le asocia el sector circular

proporcional a su frecuencia.

Para hallar el ángulo usamos la siguiente proporción: al tener una

circunferencia 360º, el cociente entre la frecuencia absoluta (o relativa) total y

la frecuencia absoluta (o relativa) que queramos representar será igual al

cociente entre los 360º de la circunferencia y el ángulo a determinar, así :

360º 1 360º

i i

n

f h

Donde es el ángulo a determinar.

Pictogramas.

Expresan con dibujos alusivos al tema de estudio las frecuencias de las

modalidades de la variable. La escala de los dibujos debe ser tal que el área

52

de cada uno de ellos sea proporcional a la frecuencia de la modalidad que

representa.

2.1.2 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS

DISCRETAS

Una vez obtenida una muestra de cualquier población y observados los

valores que toma la variable en los individuos de la muestra, estos valores se

suelen ordenar. Si la variable es cuantitativa la ordenación será de menor a

mayor.

Dada una variable X, consideramos una muestra de tamaño n que toma k

valores distintos, x1, . . . , xk (x1 < x2 < . . . < xk).

La organización es en forma similar al caso cualitativo.

Categoría

de la

variable

X

Frecuencias

absolutas fi

Frecuencias

relativas hi

Frecuencias

Porcentuales

pi

frecuencias

absolutas

acumuladas

Fi

frecuencias

relativas

acumuladas

Hi

x1 f1 h1 p1 F1 H1

x2 f2 h2 pi F2 H2

…. … … … … …

xk fk hk pk Fk=n Hk=1

Total n 1.00 100.00

La grafica para representar esta información es Bastones.


53

Observaciones

Los datos iniciales se pueden representar utilizando los gráficos.

Diagrama de cajas(box-plot)

Presentación visual que describe al mismo tiempo varias características

importantes de un conjunto de datos, tales como el centro, la dispersión, el

alejamiento de la simetría, y la identificación de valores extremos (puntos

atípicos), es decir, de valores que se alejan de una manera poco usual del

resto de los datos. Presenta los tres cuartiles, (y los valores mínimos y

máximos) alineados sobre una caja vertical u horizontalmente. El

procedimiento Para el diagrama de cajas y bigotes es:

1. Dibujar un segmento con extremos en los valores menor y mayor que

aparecen en la muestra paralelo a uno de los ejes .

2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos

en ella la mediana.

3. Se hallan los límites interiores (Q1 – 1.5 IQR y Q3 + 1.5 IQR) y los límites

exteriores (Q1 – 3 IQR y Q3 + 3 IQR).

Donde Qi : Cuarteles que seran desarrollados más adelante.

4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores adyacentes

de la muestra.

5. Por último se indican los valores atípicos

Tallos y Hojas (stem & leaf)

Procedimiento semigráfico para el que se preparan los datos resumiéndolos

en dos o tres cifras (expresándolos en las unidades adecuadas). A

continuación se disponen en una tabla de dos columnas del siguiente modo:

1. Si los datos son de dos dígitos, a la izquierda (en el tallo) aparece la cifra

de las decenas, a la derecha separada por una línea aparecen las hojas y se

escriben ordenadas y todas seguidas.

2. Si hay tres dígitos el tallo está formado por los dos primeros. Las hojas son

las unidades.

54

2.1.3 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS

CONTINUAS.

A veces se hace necesario trabajar con datos agrupados. Definimos entonces

como clase a cada uno de los intervalos en que se agrupan los datos. Las

frecuencias harán ahora referencia al número de datos que hay en cada

intervalo.

Para construir distribución de frecuencias por intervalos, se tiene los

siguientes pasos:

Elegir un numero de intervalos de clase (K)

Puede utilizar la regla de Sturges, 1 3.3log( )k n

Donde k: Numero de intervalos.

n: Numero de datos.

Determinar el rango , max minR x x

Determinar la amplitud de las clases /A R k

Determinación de los intervalos:

1 min min 1 1, ,I x x A LI LS

2 min min 2 2, 2 ,I x A x A LI LS

………………………..

min min( 1) , ,k k kI x k A x kA LI LS

Determinación de las marcas de clase, 2

i ii

LI LSm

Donde LI : Limite inferior

LS : Limite superior.

Realizar la clasificación y el conteo de datos en cada clase construida.


55

Intervalos

Ii

Marcas

de clase

mi

Frecuencia

s absolutas

fi

Frecuencia

s relativas

hi

Frecuencias

relativas

hi

Frecuencias

Porcentuales

pi

frecuencias

absolutas

acumuladas

Fi

frecuencias

relativas

acumuladas

Hi

I1 m1 f1 h1 h1 p1 F1 H1

I2 m2 f2 h2 h2 pi F2 H2

…. … … … … … … …

Ik mk fk hk hk pk Fk=n Hk=1

Total n 1.00 1.00 100.00

Cuando las variables son continuas, utilizamos como diagramas diferenciales

los histogramas y los polígonos de frecuencias.

Este cuadro se representa mediante los siguientes gráficos:

Histograma de frecuencias

Un histograma es la representación más frecuente con datos agrupados, se

construye a partir de la tabla estadística, representando sobre cada intervalo,

un rectángulo que tiene a este segmento como base. El criterio para calcular

la altura de cada rectángulo es el de mantener la proporcionalidad entre las

frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.

Polígono de frecuencias

El polígono se construye fácilmente si tenemos representado previamente el

histograma, ya que consiste en unir mediante líneas rectas los puntos del

histograma que corresponden a las marcas de clase. Para representar el

polígono de frecuencias en el primer y último intervalo, suponemos que

adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia

nula, y se unen por una línea recta los puntos del histograma que

corresponden a sus marcas de clase.

Curva de frecuencias.

Resulta de suavizar el polígono de frecuencias, en sus puntos angulosos.

Ojivas

56

EJERCICIOS RESUELTOS

1) En un estudio realizado sobre el impacto que presenta aplicar una estrategia

comercial en las ventas , se obtuvo siguiente información en el incremento

mensual de utilidades en miles de soles de 90 sucursales de la empresa.

12.2 16.4 17.8 18.4 19 19.5 20 20.9 23

13.1 16.8 17.8 18.4 19.1 19.5 20 20.9 23

14.3 16.9 17.8 18.4 19.1 19.7 20.2 21 23.2

15.5 17.1 17.8 18.4 19.2 19.7 20.3 21.1 23.3

15.5 17.2 18 18.5 19.2 19.7 20.3 21.4 23.5

15.6 17.3 18.1 18.5 19.3 19.7 20.5 21.6 23.5

15.9 17.4 18.2 18.5 19.3 19.7 20.6 21.7 24.1

16.1 17.6 18.3 18.5 19.4 19.8 20.6 22 24.2

16.2 17.8 18.3 18.8 19.4 19.9 20.8 22.4 24.8

16.2 17.8 18.3 19 19.5 19.9 20.8 22.7 26.2

a) Construya la tabla de distribución de frecuencias

b) Represente la información obtenida, mediante un grafico.

Solución.

a) Para construir una tabla de frecuencia se tiene los siguientes pasos.

Elegir el número de clases.

Usando la relación de sturges se tiene:

1 3.3log( ) 1 3.3log(90) 7.44 7k n

Determinar la amplitud de los intervalos

max min 26.2 12.2 14R x x

Determinar el tamaño del intervalo de clases (c),

14

A 27

R

k

Establecimiento de los límites y construcción de la tabla:


57

LI - LS mi fi Fi hi= fi/n pi Hi

[12.2 – 14.2) 13.2 2 2 0.02 2.22 0.02

[14.2 – 16.2) 15.2 6 8 0.07 6.67 0.09

[16.2 – 18.2) 17.2 18 26 0.2 20 0.29

[18.2 – 20.2) 19.2 36 62 0.4 40 0.69

[20.2 – 22.2) 21.2 16 78 0.18 17.8 0.87

[22. 2– 24.2) 23.2 9 87 0.1 10 0.97

[24.2 – 26.2) 25.2 3 90 0.03 3.33 1

TOTAL n=90 1 100

b) Histograma de frecuencias relativas.

Histograma

12 15 18 21 24 27

0

10

20

30

40

fre

cu

en

cia

2.- SUNAT pone a disposición de sus clientes cuatro nuevos planes de

tributación. La gerencia desea saber si se nota alguna preferencia por uno u

otro tipo de tributación. A continuación se presenta los resultados de la

encuesta aplicada a 37 usuarios.

D, A, D, B, C, D, D, A, D, D, A, D, B, D, D, C, A, B, A, D, D, D A, C, B, A, A, B,

D, C, B, A, B, B, D, A, D.

Represente la información mediante un gráfico apropiado.

58

Solución.

Tipo de capital. fi hi Pi

A 10 0.2703 27.03

C 4 0.1081 10.81

B 8 0.2162 21.62

D 15 0.4054 40.54

Total n=37 1 100

0

3

6

9

12

15

fre

cu

en

cia

{[}

{\}

{]}

{^}

{_}

{`}

A B C D

T ributación

A

B

C

D

27.03%

21.62%

10.81%

40.54%

3.- Se realizo un estudio sobre el tipo de error en la facturación en la ciudad de

Cusco, registrándose los siguientes resultados.


59

Tipo de Error en la facturación

45 22.4

70 34.8

86 42.8

201 100.0

Calculo

Concepto

Otros

Total

Frecuencia Porcentaje

Represente gráficamente la información.

Po

rcen

taje

50

40

30

20

10

0

Tipo de error en la facturación

OtrosConceptoCalculo

4.- En una ciudad, se realizo un estudio sobre el conocimiento que presentan los 41

administradores de empresa, respecto a planes de marketing. Los resultados

se muestran a continuación.

Conocimiento

26 63.4

8 19.5

7 17.1

41 100.0

Deficiente

Regular

Bueno

Total

Frecuencia Porcentaje

60

Represente la información mediante un grafico.

Po

rcen

taje

60,0%

40,0%

20,0%

0,0%

Conocimiento

BuenoRegularDeficiente

EJERCICIOS PROPUESTOS

1. Los datos del Cuadro siguiente corresponden a saldos en cuenta corriente de 48

empresas en miles de soles.

87 106 114 120 129 140 155 183

93 107 116 122 133 141 155 194

101 107 117 122 133 146 162 197

104 109 118 125 134 146 167 204

105 110 118 125 135 148 173 212

105 114 119 128 138 152 176 230

a) Construya la tabla de frecuencias.

b) Grafique el histograma.


61

c) Establezca si los datos siguen una distribución simétrica.

2. En una muestra aleatoria de 35 pequeños empresarios, se determino la

inversión que estos realizan en la bolsa de valores , obteniéndose los siguientes

resultados en miles de soles :

34,35,36,36,38,38,38,39,39,39,39,40,40,40,40,40,41,41,41,41,42,42,42,

42,44,44,44,44,44,45,45,47,47,48,50.

a) Identifique los siguientes conceptos:

i) Población analizada. iii) Variable en estudio.

ii) Elementos de la población. iv) Tipo de dato analizado.

b) Construya una tabla de frecuencias completa e interprete: 3 4 5 4, , ,n f N F

c) Construya un gráfico estadístico adecuado para la tabla construida en la parte a)

e interprételo.

d) Se desea determinar el porcentaje de empresarios cuya inversión, pertenece al

intervalo 2 , 2X XX S X S .

e) Determine el porcentaje exacto de empresarios con una inversión que fluctue

entre 39.5 y 42.5 miles de soles.

3.- Se llevó a cabo un estudio de mercado con el fin de describir el nivel de

consumo mensual en unidades, de los compradores de cierto producto de

venta masiva. Para ello se realizó una encuesta a un grupo de individuos

elegidos al azar y los datos reunidos se muestran a continuación: 4, 8, 4, 6, 8, 6,

7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5,

7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.

a).- Construir una distribución de frecuencias de estos pesos.

b).- Encontrar las frecuencias relativas.

c).- Encontrar las frecuencias acumuladas.

d).- Encontrar las frecuencias relativas acumuladas.

f).- Dibujar un histograma con los datos de la parte a).

g).- ¿Por qué se ha utilizado un histograma para representar estos datos, en lugar

de una gráfica de barras

62

5.- SUNAT esta realizando un estudio sobre la evasión de impuestos por parte de

una empresa, con tal fin se realiza una auditoria respecto al volumen mensual

de las ventas de los últimos 50 meses.

110 110 126 112 117 113 135 107 122

113 98 122 105 103 119 100 117 113

124 118 132 108 115 120 107 123 109

117 111 112 101 112 111 119 103 100

108 120 99 102 129 115 121 130 134

118 106 128 94 114

a).- ¿Cuál es la amplitud total de la distribución de los datos?

b).- Obtenga la distribución de frecuencias absolutas y relativas.

c).- Obtenga la distribución de frecuencias acumuladas, absolutas y relativas, con

los intervalos anteriores.

d).- Calcular la media y la varianza con los intervalos del apartado b y después

calcúlense las mismas magnitudes sin ordenar los datos en una tabla

estadística. ¿Con qué método se obtiene mayor precisión?

e).- Dibuje el polígono de frecuencias relativas.

f).- Dibuje el polígono de frecuencias relativas acumuladas.

9.- El gerente de ventas de una empresa a registrado los siguientes montos de sus

ventas diarias en cientos de soles:

24.1 21.0 26.6 26.0 25.7 21.8 20.9 20.4 20.0

28.8 20.2 25.9 21.2 26.2 22.0 24.2 24.7 20.7

25.9 26.7 30.0 24.0 21.3 26.6 21.0 22.1 21.8

21.8 22.9 21.6 25.3 24.9 25.9 26.5 25.4 22.4

a) Construya una distribución de frecuencia con 5 clases. Incluya los limites

dados, la frecuencia absoluta y la frecuencia relativa acumulada "a menos

de".

b) Dibuje el polígono de frecuencias.


63

10.- Suponga que usted es el estadístico oficial de líneas aéreas KLM y que el

presidente del consejo de administración le ha pedido que recoja y organice datos

relativos a las operaciones de vuelo. Su interés principal a partir de los valores

diarios se centra en la variable de número de pasajeros.

Ha obtenido estos datos de los diarios de vuelo de los últimos 50 días y ha

reflejado esta información:

68 72 50 70 65 83 77 78 80 93 71 74 60 84 72 84 73 81 84 92 77 57 70 59 85 74 78 79 91

102 83 67 66 75 79 82 93 90 101 80 79 69 76 94 71 97 95 83 86 69

a. Construir la tabla de distribución de frecuencias.

b. Construir un histograma y un polígono de frecuencias.

c. Construir una ojiva.

11.- U asesor de una pequeña empresa de corretaje, intenta diseñar programas de

inversión que fuesen atractivos para jubilados. El asesor sabe que si un

inversionista potencial pudiera obtener un cierto nivel de intereses, estaría

dispuesto a invertir su capital, pero debajo de un cierto nivel de intereses, no

estaría dispuesto a hacerlo. De un grupo de 50 sujetos, el asesor obtuvo los datos

siguientes con respecto a los diferentes niveles de réditos requeridos por cada

individuo para que pueda invertir 1000 dólares:

Punto de diferencia ($) fi

70 – 75)

75 – 80)

80 – 85)

85 – 90)

90 – 95)

95 – 100)

100 – 105)

105 – 110)

2

5

10

14

11

3

3

2

a. Construya la distribución de frecuencia acumulativa.

b. Grafique la distribución de la parte (a) convirtiéndola en ojiva de

frecuencia relativa.

64

c.

CAPITULO III

MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIÓN DE

DATOS

Las técnicas estudiadas anteriormente permiten una descripción visual de la

distribución de una variable. En muchos casos, el resumen puede hacerse

eficazmente de una forma más sencilla y precisa: utilizando valores numéricos que

den idea de la ubicación o del centro de los datos -medidas de posición- usando

cantidades que informen de la concentración de las observaciones alrededor de

dicho centro -medidas de dispersión- y mediante números que reflejen la forma

(asimetría y apuntamiento) de la distribución -medidas de forma.

La conjunción de técnicas numéricas y gráficas permite una buena descripción de

la variable.

Los estadísticos resúmenes tratan de reflejar numéricamente distintos aspectos de

la variable en estudio. Podemos distinguir 4 aspectos o características principales

que pueden resumirse en una distribución. (Ver cuadro siguiente)


65

Medidas

descriptivas

Centralización

Media Nos dan un centro de

la distribución de

frecuencias

Mediana

Moda

Posición

Percentiles Son valores de la

distribución que

dividen en partes

iguales

Cuartiles

Deciles

Dispersión

Varianza Las medidas de

dispersión cuantifican

la separación, la

dispersión, la

variabilidad de los

valores de la

distribución respecto al

valor central

Desviación típica

Coeficiente de variación

Rango

Recorrido Intercuartilico

Forma

Coeficiente de Asimetría Comparan la forma

que tiene la

representación gráfica

Coeficiente de Apuntamiento

o Curtosis

3.1 Medidas de tendencia central

Los promedios o medidas de tendencia central son valores representativos de

un conjunto de datos. Pretenden resumir todos los datos en un único valor.

Las medidas de tendencia central son fundamentales ya que permiten

localizar cuantitativamente la zona central o de mayor acumulación de

información de un conjunto de datos correspondientes a una variable,

obtenidos de una muestra seleccionada de una población específica o de un

conjunto de resultados del espacio muestral de un experimento aleatorio.

Definimos tres medidas de tendencia central: media, mediana y moda.

66

Media, ( x )

Media para datos sin agrupar:

Dado un conjunto de observaciones x1, . . . , xn, la media se representa

mediante x , se obtiene mediante:

1 2 1.....

n

i

n i

xx x x

xn n

Media para datos agrupados

Consideremos el caso en que tenemos una distribución de frecuencia para

variables cuantitativas discretas, en este caso la media es:

1 1 2 2

1

..... kk k

i i

i

f x f x f xx x h

n

Si los datos están agrupados por intervalos, para hallar la media tomamos la

marca de las clases,

1 1 2 2

1

..... kk k

ii

i

f m f m f mx h m

n

La media se mide en las mismas unidades que la variable, y tiene el

inconveniente de verse muy afectada por la presencia de datos que sean

extremadamente grandes o pequeños (datos atípicos).

Mediana, (Me)

Se calcula para variables cuantitativas; es el valor de la serie de datos que se

sitúa justamente en el centro de la muestra una vez se ha ordenado ésta,

corresponde a un 50% de valores son inferiores y otro 50% son superiores.

Mediana para datos sin agrupar

La mediana es el valor del dato central y depende del tamaño de la muestra.

1

2

nMe x , para n impar


67

12 2

2

n nx x

Me , Si n es par.

Mediana para datos agrupados

Cuando trabajamos con variables agrupadas por intervalos es imposible

determinar con precisión los valores que toman los datos, ya que esa

información se ha perdido en privilegio del agrupamiento intervalo. Por lo

tanto, en este caso, debemos buscar otro método para determinar el valor de la

mediana.

110.52

ii

i i

nF

HMe LI A LI A

f h

La mediana sólo tiene en cuenta la posición de los valores en la muestra y por

lo tanto tiene mejor comportamiento que la media cuando hay observaciones

anómalas.

Moda, (Mo)

Es el valor con mayor frecuencia. Si hay más de una moda, la variable se dice

multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o

cualitativas).

Si los datos están agrupados hablamos de clase modal y será aquella para la

que la frecuencia absoluta sea mayor.

11

1 2 1 1

i i

i i i i

f fMo LI A LI A

f f f f

Donde:

1 1i if f

1 1i if f

68

¿Cómo elegir entre las medidas de tendencia central?- En general, la media

es la medida de tendencia central más útil y más empleada. El uso de la media

es el más apropiado cuando y la distribución de los datos es unimodal y

aproximadamente simétrica. Cuando valores extremos distorsionan la

distribución de los datos, el uso de la mediana es más apropiado pues se ve

menos afectada, pero en la práctica esta medida de tendencia central no se

utiliza demasiado. Si se trata de una variable ordinal, o sólo necesitas una

descripción rápida y aproximada de la tendencia central, puedes utilizar la

moda, que también es útil cuando la distribución está distorsionada por

valores extremos o la distribución es bimodal.

Clases de Distribuciones

Distribución Simétrica se presenta si todas las observaciones están

concentradas en un solo valor de la variable, en este caso la media, mediana y

moda coincidirían en el mismo.

x Me Mo

Distribución asimétrica sesgada a la izquierda

Supongamos ahora que las observaciones de la parte izquierda se alejan del

valor central más que las observaciones de la parte derecha, generando una

distribución asimétrica hacia la izquierda; en este caso como la media es la

suma de los valores de las observaciones dividido por la cantidad total de

observaciones, su valor se correrá a la izquierda también y por el mismo


69

motivo, la media será menor que la mediana y ambas menor que la moda, es

decir:

x Me Mo

Distribución asimétrica sesgada a la derecha.

En este caso la media, es mayor que la mediana y que la moda.

Mo Me x

.

3.2 Medidas de Posición.

Cuartiles

Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se

denotan por Qi , i=1,2,3

1

.

4k

i i

k

i nF

Q LI Af

- Q1, primer cuartil, al menos el 25% de los datos son menores o iguales

que él y al menos el 75% de los datos son mayores o iguales que él.

- Q2, segundo cuartil, es la mediana, Q2 = Me.

- Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales

que él y al menos el 25% de los datos son mayores o iguales que él.

Percentiles

Dividen la muestra ordenada en 100 partes iguales.

70

1

.

100k

i i

k

i nF

P LI Af

El i-ésimo percentil, Pi (1 99i ) es un valor tal que al menos el i% de los

datos son menores o iguales que él y al menos el (100-i) % de los datos son

mayores o iguales que él.

A partir de las definiciones de los cuartiles y percentiles, es claro que Q1 =

P25, Q2 = P50 =Me y que Q3 = P75.

Deciles

Dividen el conjunto de datos en 10 partes iguales y se denota con Di , i=1,…9

1

.

10k

i i

k

i nF

D LI Af

3.3 Medidas de dispersión

Mientras los estadísticos de tendencia central nos indican los valores

alrededor de los cuales se sitúan un grupo de observaciones, los estadísticos

de variabilidad o dispersión muestran si los valores de las observaciones

están próximos entre sí o están muy separados. Dos conjuntos de datos

pueden tener la misma localización central y no obstante, ser muy distintos si

uno se halla más disperso que el otro.

La dispersión es el grado en que los datos numéricos tienden a extenderse

alrededor de un valor medio. La dispersión de la distribución suministra

información complementaria que permite juzgar la confiabilidad de nuestra

medida de tendencia central. Si los datos están ampliamente dispersos, la

localización central será menos representativa de los datos en su conjunto de

lo que sería en el caso de datos que se acumulasen más alrededor de la


71

media. Además, si no conviene tener una amplia dispersión de valores

respecto al centro o si esa dispersión implica un riesgo inaceptable,

deberemos ser capaces de reconocerlo y no escoger las distribuciones que

presentan la máxima dispersión.

Por ejemplo, a los analistas financieros les interesa la dispersión de las

ganancias de una empresa, las utilidades con una fuerte dispersión indican

un riesgo mayor parar los accionistas que las utilidades que permanecen

relativamente estables.

Varianza.

Sólo tienen sentido para variables cuantitativas y se define:

2 2

2 21 1

n n

i i

i i

x x x

S xn n

, Para datos no tabulados.

2 2

2 21 1

n n

i i i i

i i

x x f f x

S xn n

, Para datos tabulados de variable discreta

2 2

2 21 1

n n

i i i i

i i

m x f f m

S xn n

, Para datos tabulados por intervalos, para

variables continuas.

Observaciones sobre la varianza:

Las unidades de la varianza son los cuadrados de las unidades de los datos

y en muchas ocasiones no son fáciles de interpretar.

Puede sufrir un cambio desproporcionado por la existencia de valores

extremos en el conjunto.

Desviación típica (S)

Es la raíz cuadrada positiva de la varianza

2s s

72

La desviación típica poblacional suele denotarse por .

Observaciones sobre la desviación típica:

Nos permite determinar con mayor grado de precisión dónde se sitúan los

valores de una distribución de frecuencia en relación con la media.

Las unidades de la desviación típica se expresan en las mismas unidades de

los datos.

Puede sufrir un cambio desproporcionado por la existencia de valores

extremos en el conjunto.

Variables tipificadas

Los distintos conjuntos de datos están asociados por lo general a diferentes

medias, ya sea porque son de naturaleza diferente (escalas de medidas

diferentes). Con el propósito de reducir los datos a un mismo punto de

referencia y a una escala común, se realiza entre ellos una transformación

llamada tipificación.

Se conoce por tipificación de una variable “x” a efectuar el cambio de origen

y de escala de la variable.

Fórmulas:

población para -x

z

muestras para s

xxz

Esta nueva variable (z), carece de unidades de medida y permite comparar

dos o más cantidades que en un principio no son comparables porque aluden

a conceptos diferentes. También es aplicable a casos en que se quieran

comparar individuos semejantes de poblaciones diferentes. Por ejemplo, si

deseamos comparar el nivel académico de dos estudiantes de diferentes

universidades, nos indica cuántas desviaciones estándar está un valor por

arriba o por debajo de la media del conjunto de datos al cual pertenece.


73

Ejemplo:

Un Docente de la Universidad A obtuvo 84 puntos en sistemas de tributación

, en el que la nota media fue 76, y la desviación típica 10; Otro Docente de la

Universidad B obtuvo 90 puntos, siendo la media 82 y la desviación típica 16.

¿ Cual de los Docentes presenta mejor nivel de conocimientos de sistemas de

tributación?.

Docente de la

Universidad A

Docente de la

Universidad B

x = 76

s = 10

x = 84

z = 8,010

7684

x = 82

s = 16

x = 90

z = 5,016

8290

Sobresalió más el Docente de la Universidad A.

Coeficiente de variación Muestral de Pearson

Las medidas de dispersión anteriores dependen de las unidades de medida,

el coeficiente de variación es, en cambio, una medida de dispersión relativa y

adimensional.

|| X

SCV

CV es apropiado en poblaciones donde los datos son positivos.

Si 0<CV<1.5, los datos provienen de una población homogénea

Si CV>1.5, los datos provienen de una población heterogénea.

El coeficiente de variación es útil, en razón de su carácter adimensional, para

comparar muestras con medias desiguales, donde las unidades de medida de

las observaciones son diferentes. También para decidir cual muestra es más

homogénea o menos variable

74

Recorrido o rango

Es la diferencia entre el mayor y menor valor de una muestra.

max minR x x

Rango semiintercuartílico y amplitud intercuartil

El rango semiintercuartílico es la mitad de la diferencia entre el tercer y

primer cuartil, Q = (Q3 – Q1)/2.

La amplitud intercuartil es el doble del valor anterior,

2Q = IQR = (Q3 – Q1).

¿Cómo elegir entre las medidas de dispersión?- La medida de dispersión

más útil es la desviación típica. Sólo debes usar el rango cuando dispones de

pocas medidas o cuando todo lo que necesitas conocer es la dispersión

general de las medidas. Utiliza el coeficiente de variación cuando quieras

tener una idea de la variabilidad relativa de dos o más variables cuyas

medias son muy diferentes en magnitud. Esto se ve facilitado por su carácter

adimensional, es decir, no depende de las unidades en que se mida la media

3.4 MEDIDAS DE FORMA

Miden la mayor o menor cantidad de datos que se agrupan en torno a la

moda y Hacen referencia a la forma de la distribución, simétrica, asimetría a

la derecha o a la izquierda. En general la mejor manera de verlo es por la

representación gráfica, pero si no la tenemos existen coeficientes que nos

indican la forma de la distribución. Los más utilizados son:

Coeficiente de asimetría de Pearson,

El coeficiente de asimetría de una variable mide el grado de asimetría de la

distribución de sus datos en torno a su media, es adimensional y se define

como sigue:


75

op

x MA

S

Este coeficiente puede ser:

0pA , entonces la media igual que la moda, distribución simétrica

0pA , entonces la media mayor que la moda, asimetría a la derecha

positiva

0pA , entonces la media menor que la moda, asimetría a la izquierda

negativa.

Curtosis.

hace referencia al mayor o menor apuntamiento que tiene una distribución

de frecuencias respecto a una distribución Normal, por lo tanto sólo se

estudia en comparación con la campana de Gauss, se determina mediante:

75 25

90 10

0.5P P

KP P

Este coeficiente puede ser:

0K , la curva es igual que la normal, se llama Mesocúrtica

0K , la curva es más puntiaguda que la normal se llama Leptocúrtica

0K , la curva es más aplastada que la normal, se llama Platicúrtica

76

EJERCICIOS RESUELTOS.

1) La siguiente tabla muestra los coeficientes de inteligencia de 480 trabajadores de

una empresa.

C.I 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126

fi 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2

Calcule:

a) El C.I. medio de los trabajadores.

b) Su desviación típica.

c) Si el gerente de la empresa afirma que exactamente la mitad de los

trabajadores de la empresa tienen un C.I. superior al del trabajador Juan,

¿qué C.I. tiene Juan?

d) Supongamos que se desea realizar un estudios sobre mercadotecnia , para

ello se debe seleccionar a un grupo de trabajadores con mayor C.I., pero la

empresa solo puede utilizar al 15% de los trabajadores. ¿Qué C.I. deberá

tener un trabajador como mínimo para ser considerado dentro de ese grupo

de elegidos?

e) Se van a preparar unas clases de apoyo en gestión empresarial , para un 25%

de los trabajadores de la empresa , precisamente para aquellos que tengan

menor C.I. ¿Hasta que trabajador de qué C.I. deberemos considerar en estas

clases?

SOLUCION:

La variable de estudio es el cociente intelectual (X)


77

xi fi fixi fixi2 Fi Hi

70 4 280 19600 4 0.0083

74 9 666 49284 13 0.0271

78 16 1248 97344 29 0.0604

82 28 2296 188272 57 0.1188

86 45 3870 332820 102 0.2125

90 66 5940 534600 168 0.35

94 85 7990 751060 253 0.5271

98 72 7056 691488 325 0.6771

102 54 5508 561816 379 0.7896

106 38 4028 426968 417 0.8688

110 27 2970 326700 444 0.925

114 18 2052 233928 462 0.9625

118 11 1298 153164 473 0.9854

122 5 610 74420 478 0.9958

126 2 252 31752 480 1

1470 n=480 46064 4473216

a) Media

1 21 2 ..... 46064

95.96480

kkf x f x f x

xn

b) Varianza y desviación.

2 2

22 21 1 447321695.96 110.88

480

n n

i i i i

i i

x x f f x

S xn n

110.88 10.52s

c) Mediana.

n=480 ( Par)

480 4801 1

240 2412 2 2 2 94 9494

2 2 2 2

n nx x x x

x xMe

78

d) Percentil 85

85 106P

e) Percentil 25

25 90P

2) Una empresa contrata los servicios de un corredor de bolsa, para decidir su

inversión en una de las dos acciones A y B. Los resultados de las utilidades de

estas acciones en los últimos 7 meses en miles de dólares esta dado en el

cuadro siguiente.

Acción Utilidades en miles de dólares.

1 2 3 4 5 6 7

A 57 55 54 52 62 55 59

B 80 40 62 72 46 80 40

a) Halle e interprete la media, mediana y moda de las utilidades.

b) Estadísticamente ¿Cuál de las acciones es más recomendable para la

empresa que esta interesado en una mayor utilidad? ¿Cuál de las acciones

es más recomendable para la empresa que esta interesado en un menor

riesgo de inversión? Fundamente su respuesta.

SOLUCION:

XA XB XA2 xB2

57 80 3249 6400

55 40 3025 1600

54 62 2916 3844

52 72 2704 5184

62 46 3844 2116

55 80 3025 6400

59 40 3481 1600

394 420 22244 27144


79

a) Estadísticos de A.

1 2 1..... 39456.28

7

n

i

n iA

xx x x

xn n

1

2

A nMe x , para n impar n=7

1 7 1 4

2 2

55A nMe x x x

55AMo

Estadísticos de B.

1 2 1..... 42060

7

n

i

n iB

xx x x

xn n

1

2

B nMe x , para n impar n=7

1 7 1 4

2 2

62B nMe x x x

1 40BMo

2 80BMo

b) Calcular la varianza

2 2

2 2 21 1 22244(56.28) 10.27

7

n n

i i

i iA A

x x x

S xn n

10.27

0.05756.28| |

A

A

SCV

X

2 2

2 2 21 1 2714460 277.7

7

n n

i i

i iB B

x x x

S xn n

277.70.277

60| |B

B

SCV

X

La información se ilustra en el grafico siguiente.

80

Acción

BA

Util

idad

80,00

70,00

60,00

50,00

40,00

3.- Con el fin de realizar un estudio sobre las retenciones económicas de quinta

categoría a los trabajadores de una empresa, se selecciono aleatoriamente a 24

trabajadores, obteniéndose las siguientes cantidades de retención económica en

cientos de soles.

Retención

Económica.

Número de

trabajadores

[0, 1> 2

[1, 2> 2

[2, 3> 3

[3, 4> 6

[4, 5> 7

[5, 6> 1

[6, 7> 1

[7, 8> 1

[8, 9> 1

a) Halla la media, varianza, la desviación típica y coeficiente de variación.


81

b) Mediana

c) Moda.

SOLUCION:

I fi mi mifi mi2fi Fi

[0, 1> 2 0.5 1 0.5 2

[1, 2> 2 1.5 3 4.5 4

[2, 3> 3 2.5 7.5 18.75 7

[3, 4> 6 3.5 21 73.5 13

[4, 5> 7 4.5 31.5 141.75 20

[5, 6> 1 5.5 5.5 30.25 21

[6, 7> 1 6.5 6.5 42.25 22

[7, 8> 1 7.5 7.5 56.25 23

[8, 9> 1 8.5 8.5 72.25 24

Total 24 40.5 92 440

a) Media, varianza, desviación y coeficiente de variación.

Media.

923.83

24

i if m

xn

Varianza.

2

2 2 4403.83 3.66

24

i im f

S xn

Desviación.

3.66 1.91s

Coeficiente de Variación.

1.910.498

3.83| |

SCV

X

Mediana

12 73 *1 3.833

6Me

82

Moda

1

1 2

Mo Li A

1 7 6 1

1 7 1 6

14 *1 4.14

1 6Mo

a. El colegio de administradores aplico un test de conocimientos en una escala

de 0 a 20 a 60 profesionales del área, respecto a riesgo de inversión ,

obteniendo los siguientes resultados.

Nivel de

conocimientos de

riesgo de inversion.

Nro de

administradores

0-5 10

5-10 15

10-13 25

13-18 8

18-20 2

a) Calcule la media, varianza y la desviación.

b) Determine la mediana y la moda

c) Determine e interprete Q1, Q3, P10 y P90

d) Coeficiente de curtosis y de asimetría.

SOLUCION:

Intervalo fi. Fi mi mifi mi2fi

0-5 10 10 2.5 25 62.5

5 -10 15 25 7.5 112.5 843.75

10-13 25 50 11.5 287.5 3306.25

13-18 8 58 15.5 124 1922

18-20 2 60 19 38 722

60 56 587 6856.5


83

a) Media y varianza

Media.

5879.78

60

i if m

xn

Varianza.

2

2 2 26856.59.78 18.63

60

i im f

S xn

Desviación:

18.63 4.31s

b) Mediana y moda

Mediana

12

k

K

nF

Me Li Af

Determinamos 60

302 2

n

1 30 252 10 3 10.625

k

K

nF

Me Li Af

Moda

1

1 2

Mo Li A

1 25 15 10

1 25 8 17

1

1 2

1010 3 11.11

10 17Mo Li A

c) Determine e interprete Q1, Q3, P10 y P90

84

Para obtener los cuarteles se tiene la relación.

1

.

4k

i

K

i nF

Q Li Af

Cuartil 1

1

1

1.15 104 5 5 6.67

15

k

K

nF

Q Li Af

El 25% de los administradores presentan nivel de conocimientos de riesgo de

inversión a 6.67

Cuartil 3

1

3

3.45 254 10 3 12.4

25

k

K

nF

Q Li Af

El nivel de conocimientos máximo de riesgo de inversión del 75% de los

administradores es de 12.4.

Para obtener los percentiles se tiene la relación.

1

.

100k

i

K

i nF

P Li Af

Percentil 10

1

10

10.

6 0100 0 5 310

k

K

nF

P Li Af

El 10% de los administradores tienen nivel de conocimientos de riesgo de

inversión entre 0 a 3


85

Percentil 90

1

90

90.

54 50100 13 5 15.58

k

K

nF

P Li Af

d) Coeficiente de Asimetría.

9.78 11.11-0.308

4.31

ox MAp

s

Puesto que Ap < 0 la distribución es asimétrica negativa o a izquierdas

(desplazada hacia la izquierda).

Coeficiente de curtosis de fisher.

3 1

90 10

12.4 6.670.5 0.5 -0.0416

15.5 3

Q QK

P P

Si 0k , entonces la distribución es platicúrtica.


1. Las utilidades de empresas dedicadas al rubro de alimentos, en una región del

país presenta el siguiente comportamiento:

Utilidades en miles

de soles.

[0, 40[ [40,70[ [70, 90[ [90,110[ [110,120]

Número de empresas 7 8 10 20 5

Calcule e interprete:

La media aritmética, mediana y moda.

Varianza, coeficiente de variación.

Cuartel 1, Decil 6 y Percentil 85.

86

2.- Una muestra de pequeñas empresas se clasifica en función de su antigüedad en

el mercado y del porcentaje de deudas sobre el capital que presentan, con los

siguientes resultados:

Deudas Empresas antiguas Empresas Nuevas

0-15 19 29

15-30 13 10

30-50 7 11

50-70 4 32

En base a los resultados, ¿ Puede admitirse que el porcentaje de deudas de las

empresas es independiente de su antigüedad?. Fundamente su respuesta.

3. En una empresa donde los salarios tienen una media de 700 dólares y una

desviación estándar de 150 dólares, el sindicato solicita un reajuste de 25%

más un incentivo de 10 dólares. El Directorio acoge parcialmente la petición

rebajando los salarios solicitados en un 10%.

a) El Sindicato se declara satisfecho en sus negociaciones si el sueldo

promedio final aumenta por lo menos en un 20% respecto de su valor

actual. ¿Se logra esto aceptando la proposición del Directorio? Justifique

su respuesta.

b) El Sindicato pretende con su proposición aumentar la homogeneidad de

los sueldos de sus afiliados ¿Se logra este objetivo aceptando la

proposición del Directorio? Fundamente su respuesta.

c) Si en la Empresa laboran 500 funcionarios ¿En qué porcentaje aumentó la

planilla de sueldos respecto a la planilla inicial?.

4. Una empresa constructora tiene 2 secciones A y B. Las distribuciones de

ingresos diarios de sus empleados son los siguientes:


87

Sección A

Ingresos ($) Frecuencia

80-100) 30

100-120) 80

120-140) 40

140-160) 10

160-180) 4

180-200) 1

Sección B

Ingresos ($) Frecuencia

60-90) 10

90-120) 20

120-150) 50

150-180) 20

180-210) 15

210-240) 10

240-270) 4

Calcular la media aritmética y varianza de la sección A y B.

Compare los ingresos.

5. Un consultor de una empresa de planificación financiera que asesora a quienes

quieren establecer sus carteras de inversión personales. Hace poco el consultor

estaba interesado en las tasas de rendimiento que habían ofrecido dos fondos de

inversión diferentes a lo largo de los 5 últimos años. FIVENEZ presentaba tasas de

retorno a lo largo de ese período de 12, 10, 13,9 y 11%; mientras que Corporación

Dinámica había producido 13, 12, 14, 10, y 6%. Un cliente se puso en contacto con

el consultor expresó su interés por uno de estos fondos de inversión. ¿Cuál de

ellos deberá elegir el consultor para su cliente?

88

6.- En las siguientes tablas se registran los sueldos quincenales (en dolares) de 50

obreros de dos fábricas.

Fábrica A

Fábrica B

Sueldo fi sueldo fi

45 – 55) 18 45 – 55) 12

55 – 65) 24 55 – 65) 28

65 – 75) 26 65 – 75) 30

75 – 85) 20 75 – 85) 22

85 – 95) 12 85 – 95) 8

a) ¿En cuál fábrica hay mayor dispersión relativa?

b) Un obrero que gana 140 mensuales. ¿Dónde estaría mejor remunerado con

respecto a sus compañeros?

c) ¿Cuál de las dos distribuciones es más simétrica?


89

CAPITULO IV

DISTRIBUCIONES BIDIMENSIONALES

Si resumir la información de una variable es de por si interesante, en investigación

lo es mucho más el poner de manifiesto la posible relación entre dos de ellas.

El análisis de la relación de dos variables, X e Y, depende del tipo de variables y

Según sean los tipos de cada una de ellas se usa técnicas estadísticas diferentes.

4.1 CUALITATIVA-CUALITATIVA.

Cuando las variables de estudio son cualitativas (categóricas) o cuantitativas

discretas con poca modalidades, se suele presentar las observaciones de las

variables X e Y, mediante pares ordenados (xi, yi), esta forma de presentaciones

se denomina tablas de contingencia. Las tablas de contingencia son de doble

entrada organizada por filas y columnas y donde se presenta la distribución de

frecuencias conjuntas de las dos variables.

Dada una variable bidimensional ( X, Y ), consideramos una muestra de

tamaño n en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores

distintos, y1, . . , yl, obtenemos, por tanto, observaciones del tipo (xi, yj).

La frecuencia absoluta de un valor (xi, yj) es el número de veces que dicho

valor aparece en la muestra. Se representa por fij , se cumple

1 1

k l

ij

i j

f n

90

La frecuencia relativa de un valor (xi, yj) es el cociente de la frecuencia

absoluta fij entre el tamaño de la muestra n, se representa por hij

ij

ij

fh

n, se cumple:

1 1

1k l

ij

i j

h

Distribuciones marginales Nos indican el comportamiento aislado de cada

una de las variables X e Y que dan lugar a una variable bidimensional.

Frecuencia absoluta marginal de xi, . 1 2

1

l

i i i il ij

j

f f f f f

Frecuencia relativa marginal de xi, .

.i

if

hn

Frecuencia absoluta marginal de yj, 1 2.

1

j j kj

k

ijj

i

f f f f f

Frecuencia relativa marginal de yj, .

.j

j

fh

n

Una tabla de doble entrada de una variable bidimensional sigue la estructura

que se presenta a continuación, en la que tienen cabida las frecuencias

marginales (representadas en la última fila y última columna). Puede ser de

frecuencias absolutas o relativas.

Y

X

y1 y2 . . . . . yl ni.

x1 f11 f12 . . . . . f1l f1.

x2 f21 f22 . . . . . f2l f2.

. . . . . . . . . . . . . . .

xk fk1 fk2 . . . . . fkl fk.

n.j f.1 f.2 . . . . . f.l n

Ejemplos.

1.- El gerente de ventas de la firma A desea determinar el comportamiento de las

ventas de cuatro productos (I, II, III y IV), en función de la clase de clientes


91

clasificados en cuatro grupos. Una muestra aleatoria de las ventas suministro la

siguiente información.

Grupo de

clientes

Producto

I II III IV

Profesionales 30 35 55 40

Comerciantes 155 50 125 80

Obreros 130 30 105 50

Amas de casa 35 15 20 45

¿Las ventas de los cuatro grupos son homogéneas?

Solución

30 35 55 40 160

18.8% 21.9% 34.4% 25.0% 100.0%

155 50 125 80 410

37.8% 12.2% 30.5% 19.5% 100.0%

130 30 105 50 315

41.3% 9.5% 33.3% 15.9% 100.0%

35 15 20 45 115

30.4% 13.0% 17.4% 39.1% 100.0%

350 130 305 215 1000

35.0% 13.0% 30.5% 21.5% 100.0%

Frecuencia

Porcentaje

Frecuencia

Porcentaje

Frecuencia

Porcentaje

Frecuencia

Porcentaje

Frecuencia

Porcentaje

Grupo de clientes

Profesionales

Comerciantes

Obreros

Ama de casa

Total

I II III IV

Producto

Total

92

0

20

40

60

80

100

120

140

160

Profesionales Comerciantes Obreros Amas de casa

I

II

III

IV

4.2 CUALITATIVA-CUANTITATIVA.

Supongamos que tenemos datos numéricos para varias categorías, por

ejemplo en un experimento donde hacemos mediciones numéricas en dos o

más grupos. En estos casos, lo que se realiza es un estudio descriptivo de la

variable numérica en cada una de las muestras y se comparamos los

resultados.

Ejemplo

La estructura financiera de una firma se refiere a la forma en que se dividen

los activos de la empresa por debe y haber, y el apalancamiento financiero se

refiere al porcentaje de activos financiados por deuda. En un estudio

financiero se afirma que el apalancamiento financiero puede utilizarse para

aumentar la tasa de rendimiento sobre la inversión, es decir que, los

accionistas pueden recibir rendimientos más altos con la misma cantidad de

inversión gracias a su uso. Los siguientes datos muestran las tasas de

rendimiento utilizando 3 diferentes niveles de apalancamiento financiero y

un nivel de control (deuda cero) de empresas seleccionadas al azar:


93

Tasas de Rendimiento

Control Bajo Medio Alto

4.6 2 7 7.9

2 7.4 4.5 6.8

6.8 1.8 11.6 5.8

4.2 3.2 6 9.2

1.6 4 6.8 11

¿Son las tasas medias de rendimiento en los niveles de apalancamiento

financiero bajo, medio, alto y control diferentes?

Solución.

Nivel de

Apalancamiento Mean Variance CoefVar Median

Alto 8.140 4.158 25.05 7.900

Bajo 3.68 5.13 61.56 3.20

Control 3.840 4.468 55.05 4.200

Medio 7.18 7.07 37.04 6.80

MedioControlBajoAlto

12

10

8

6

4

2

Nivel de apalancamiento

Ta

sas d

e r

en

dim

ien

to

94

4.3 CUANTITATIVA-CUANTITATIVA.

Análisis de dos variables cuantitativas y establecimiento de una relación

entre ellas. La forma mas sencilla de estudiar la posible asociación entre estas

variables es el diagrama de dispersión (Nube de puntos). Si reconocemos

una tendencia, entonces el interés ahora será el análisis de regresión.

Media y varianza

La información de las dos variables X e Y se puede resumir usando la media

y la varianza como se muestra a continuación:

Media de la variable X: i if xx

n

Media de la variable Y: i if yy

n

Varianza de la variable X: 2

22 i i

x

f xs x

n

Varianza de la variable Y: 2

22 i i

y

f ys y

n

La covarianza

Es una medida de la asociación lineal existente entre dos variables. Resume la

información contenida en el diagrama de dispersión. Presenta la siguiente

expresión:

cov( , ) .i i i

xy

f x yx y s x y

n

Si la covarianza está muy próxima a cero, no existe relación entre las

variables o si existe es marcadamente no lineal, si es positiva, hay asociación

lineal positiva, y si es negativa, hay asociación lineal negativa. Sin embargo,

como la covarianza depende de las unidades de medida de las variables, no

nos permite cuantificar el grado de asociación lineal ni comparar la


95

asociación existente entre distintos pares de variables. Para dar solución a

este problema se obtiene el coeficiente de correlación.

Correlación.

Estudia la relación o dependencia que existe entre dos variables que

intervienen en una distribución bidimensional.

Coeficiente de correlación lineal.

Es un número que mide el grado de dependencia entre las variables X e Y.

Se mide mediante la siguiente fórmula: yx

xy

ss

sr

.

Su valor está comprendido entre – 1 y 1.

Si r = -1 ó r = 1 todos los valores de la variable bidimensional se

encuentran situados sobre una recta.

Si – 1< r < 0 se dice que las variables X e Y están también en

dependencia aleatoria. La correlación es negativa.

Si 0 < r < 1 la correlación es positiva. Las variables X e Y están también

en dependencia aleatoria.

La correlación es tanto más fuerte a medida que r se aproxima a –1 ó 1 y es

tanto más débil a medida que se aproxima a 0.

Análisis de Regresión.

Regresión: conjunto de técnicas que son usadas para establecer una relación

entre una variable cuantitativa llamada variable dependiente y una o más

variables independientes, llamadas predictoras. Estas también deberían ser

cuantitativas, sin embargo algunas de ellas podrían ser cualitativas.

Modelo de regresión. Ecuación que representa la relación entre las variables

Y X

Estimación de la línea de regresión usando Mínimos Cuadrados

96

Se debe Minimizar el error cuadrático medio:

2 2

1 1

, ( )n n

i i i

i i

Q e y x

1 1 1

2 2

1 1

ˆ

( )

n n n

i i i ixyi i i

n n

xxi i

i i

n x y x yS

Sn x x

ˆˆ y x

La pendiente ˆ , indica el cambio promedio en la variable de respuesta

cuando la variable predictora aumenta en una unidad adicional.

El intercepto ˆ , indica el valor promedio de la variable de respuesta cuando

la variable predictora vale 0. Sin embargo carece de interpretación práctica si

es irrazonable pensar que el rango de valores de x incluye a cero.

A partir de la recta ˆˆ ˆY X podemos calcular los valores de y conocidos

los de x. La fiabilidad que podemos conceder a los cálculos obtenidos viene

dada por el coeficiente de correlación: si r es muy pequeño no tiene sentido

realizar ningún tipo de estimaciones.

Si r es próximo a – 1 ó 1, las estimaciones realizadas estarán cerca de los

valores reales.

Si r = 1 o r = -1, las estimaciones realizadas coincidirán con los valores reales.

Ejemplos

1. Se realizo un estudio sobre el conocimiento(X) y aplicación (Y) del software

para la toma de decisiones. La información se muestra a continuación.

X 14.8 15.2 14.4 15.2 13.2 14 14.4 12.4 14.8 14 14.4 14.8 13.2 16.4 12.4

Y 14 14.7 12 16 12.67 15.3 13.3 12.7 16 12.7 15.3 16 13.3 13.33 12

a) Trace un diagrama de dispersión.

b) Ajuste una recta de regresión.

c) Calcule la correlación lineal e interprete dicho valor.


97

Solución:

X

Y

171615141312

16

15

14

13

12

Scatterplot of Y vs X

Resumen de calculos.

X Y X.Y X2 Y2

14.8 14 207.2 219.04 196

15.2 14.67 222.984 231.04 215.2089

14.4 12 172.8 207.36 144

15.2 16 243.2 231.04 256

13.2 12.67 167.244 174.24 160.5289

14 15.33 214.62 196 235.0089

14.4 13.33 191.952 207.36 177.6889

12.4 12.67 157.108 153.76 160.5289

14.8 16 236.8 219.04 256

14 12.67 177.38 196 160.5289

14.4 15.33 220.752 207.36 235.0089

14.8 16 236.8 219.04 256

13.2 13.33 175.956 174.24 177.6889

16.4 13.33 218.612 268.96 177.6889

12.4 12 148.8 153.76 144

213.6 209.33 2992.208 3058.24 2951.8801

98

213.614.24

15

ixx

N;

209.3313.96

15

iyy

N;

22

2 23058.2414.24 1.11

15

i

x

xs x

N

22

2 22951.8813.96 1.91

15

i

y

ys y

N;

2992.208. (14.24).(13.96) 0.69

15

i i

xy

x ys x y

N

Recta de regresión

1 1 1

22 2

1 1

0.69ˆ 0.621.11

( )

n n n

i i i ixyi i i

n n

xi i

i i

n x y x yS

Sn x x

ˆˆ 13.96 0.62(14.24) 5.13y x

ˆˆ ˆ 5.13 0.62Y X X

0.690.47

. 1.11. 1.91

xy

x y

sr

s s

Ejercicios propuestos.

1. Un asesor financiero quiere conocer las diferencias en la estructura de capital

de varios tamaños de empresas en cierta industria. Hace una encuesta en un

grupo de firmas que tienen distintas cantidades de activos y las divide en tres

grupos. Clasifica cada una según, que su deuda sea mayor o menor que el

capital contable de los accionistas. A continuación se dan los resultados de una

encuesta.


99

Deuda Tamaño de activos de la firma (En miles de

dólares)

<500 500-2000 >2000 Total

< que el capital

social

7 10 8 25

> que el capital

social

10 18 9 37

Total 17 28 17 62

¿Se puede concluir que las empresas tienen idéntica estructura de capital?

2. Un especialista trabaja como corredor de bolsa para una empresa. Sus registros

muestran que las tasas de rendimiento ( en porcentajes) de dos acciones para 8

meses seleccionados fueron de :

Acciones A 15.5 3.6 21.7 27.2 7.8 2.2 5.0 12.2

Acciones B 4.5 6.2 5.5 7.2 3.5 4.2 4.1 12

a) En que acción invertiría la empresa, si el interés es tener un rendimiento

mas alto.

b) Que acción debería aconsejar el especialista a la empresa que prefieren

menos riesgo.

3. En la contabilidad de costos, con frecuencia se trata de estimar los gastos

indirectos basándose en el número de unidades producidas. La gerencia de la

empresa ha reunido información sobre esos gastos y las unidades producidas

en diferentes plantas.

Gastos

indirectos

191 170 272 155 280 173 234 116 153 178

Unidades 40 42 53 35 56 39 48 30 37 40

a. Estimar la ecuación.

b. Prediga el gasto general cuando se produce 50 unidades.

4. Sea Y el índice de precios al consumidor, tomado como base el año 1990, es

decir 2000 el índice es 100.

100

Año 2001 2002 2003 2004 2005 2006 2007

Y 106 111.1 117.2 121.3 125.2 128 132.6

Predecir el índice de precios para el año 2008 ¿En que año podemos esperar

que el índice de precios sea de 150.57?

5. Una gran compañía llevó a cabo un estudio para ubicar las variables que

pudieran determinar el sueldo de un egresado universitario dos años después

de haberse graduado como Técnico Superior Universitario en un área

Administrativa. Los datos recogidos se presentan en la siguiente tabla:

(La columna del sueldo es en cientos de miles).

Edad Sexo E. Civil Inglés Sueldo

1 24 F C A 6,75

2 25 M C M 6,90

3 26 M S B 6,90

4 27 F C B 6,80

5 27 M D A 7,10

6 27 F C M 6,50

7 27 M S A 7,25

8 25 F C B 6,80

9 23 M S B 6,75

10 24 M S B 6,80

11 26 F C M 6,75

12 29 F D M 7,00

13 25 M C A 7,15

14 31 F D A 7,50

15 26 M S B 6,20

16 24 F D M 7,40

17 26 F C B 6,70

18 28 F S M 6,95

19 25 M C B 6,95

20 29 M C M 7,10


101

- Utilice la técnica de estadística descriptiva más apropiada para

analizar cada variable individualmente. Interprete lo obtenido.

- Realice diagramas de cajas que le ayuden a visualizar como influye

cada una de las variables en el sueldo que gana el individuo.

- Como futuro Técnico Superior en el área Administrativa, ¿cuál seria

la(s) características que usted debería tomar en consideración para

obtener el sueldo al que usted aspiraría al egresar?

6. Se desea estudiar la relación entre los aumentos de precios y los salarios en 8

empresas tomadas al azar, tal que se define “x: % de aumento de salarios” e

“y: % de aumento de precios”

2 2169.3, 3630.89, 2731.82, 126.9, 2498.01x x xy y y

a) Calcular la recta de ajuste e interpretar las componentes en función del

problema

b) ¿Qué porcentaje del análisis queda explicado por la recta de regresión?

Que podría Ud. Decir al respecto?

c) Estimar el porcentaje de aumento en los precios, si se produce un aumento

del 20% en los salarios, es lógico estimar dado el resultado obtenido en b)

?

7. Una aplicación importante del análisis de regresión en contabilidad es para

estimar costos. Al reunir datos sobre volumen y costo y aplicar el método de

mínimos cuadrados para determinar la ecuación de regresión donde se

relacionan estas variables, un contador puede estimar el costo asociado con

determinada operación de manufactura.

Se obtuvo la siguiente muestra de volúmenes de producción y costo total

para una operación de manufactura.

Volumen de producción (unidades) : 400 450 550 600 700 750

Costo total (en miles de $) : 4 5.0 5.4 5.9 6.4 7.0

102

a) Estimar la ecuación de regresión con la que se pueda predecir el costo total

para determinado volumen de producción. Interprete el significado de las

componentes de la recta, en función del problema.

b) Calcular el coeficiente de determinación. Comentar su resultado en función

de las variables en estudio.

c) El programa de producción de la empresa indica que el mes próximo se

deben producir 500 unidades. ¿Cual será el costo total estimado para esta

operación?

8. Suponga que usted tiene a su cargo el dinero de la región de Piedmont, se le

dan los siguientes datos de antecedentes sobre el suministro de dinero y el

producto nacional bruto (ambos en millones de dólares):

Suministro de

dinero

Producto Nacional

Bruto

2 5

2.5 5.5

3.2 6

3.6 7

3.3 7.2

4 7.7

4.2 8.4

4.6 9

4.8 9.7

5 10

(a) Desarrolle la ecuación de estimación para predecir el PNB del suministro de

dinero.

(b) ¿Cómo interpreta la pendiente de la línea de regresión?.

(c) Calcule e interprete el error estándar de la estimación.


103

CAPITULO V

PROBABILIDADES

El Cálculo de Probabilidades se ocupa de estudiar ciertos experimentos que se

denominan aleatorios, cuya característica fundamental es la incertidumbre del

resultado, esto significa que es imposible predecir los resultados porque hay más

de uno posible.

En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su

calificativo probable, considerando probable a aquellos eventos en los que

tenemos alto grado de creencia en su ocurrencia. En esta línea probabilidad es un

concepto asociado a una medida del azar.

El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos

eventos inciertos.

5.1 EXPERIMENTO ALEATORIO.

Es una acción que da lugar a resultados identificables y se caracteriza por:

Todos los posibles resultados son conocidos previamente.

Repeticiones en situaciones análogas pueden dar resultados diferentes.

104

No se puede predecir el resultado del mismo antes de realizarlo, es decir,

no se sabe cuál de los posibles resultados aparecerá al final.

Los experimentos pueden ser aleatorios o deterministas. Aleatorio significa

relativo a todo acontecimiento incierto, por depender de la suerte o del azar,

mientras que los deterministas son aquellos que se caracterizan por el hecho

de que las mismas causas producen los mismos efectos.

Espacio muestral.

Es el conjunto de todos los resultados posibles del experimento y se denota

por . A cada elemento de se denomina punto muestral w , es decir:

/ es un punto muestralw w .

Evento o Suceso Aleatorio.

Un evento aleatorio es un subconjunto del espacio muestral y se denota con

letras mayúsculas.

El evento seguro , es aquel que ocurre siempre al realizar el experimento.

El evento imposible , es aquel que no ocurre nunca.

Lo s eventos elementales solo tienen un punto muestral.

El evento complementario cA , esta dado por todo los puntos muestrales

que no están en A

5.2 OPERACIONES DE EVENTOS.

Unión de eventos: Dados dos eventos A y B de un mismo espacio muestral

su unión se representa por A B y es el evento que contiene los elementos

que están en A o en B o en ambos. El evento A B ocurre si al menos uno de

los dos eventos ocurre.

Intersección de eventos: Dados dos eventos A y B de un mismo espacio

muestral su intersección se representa por A B y es el evento que contiene

los elementos que están en A y B al mismo tiempo.

El evento A B ocurre cuando ambos eventos ocurren simultáneamente.


105

Evento Complemento: El complemento de un evento A se representa por cA

y es el evento que contiene todos los elementos que no están en A. El evento

cA ocurre si A no ocurre.

5.3 DEFINICIÓN CLÁSICA DE PROBABILIDAD:

La probabilidad de un suceso A se calcula como el número de casos

favorables al suceso A, partido por el número de casos posibles del

experimento aleatorio.

( )casos favorables

p Acasos posibles

5.4 DEFINICIÓN AXIOMÁTICA DE PROBABILIDAD.

La probabilidad es una función que asigna a cada suceso A un número

real que varia entre 0 a 1.

P : y que verifica:

A p(A)

i) 0 ( ) 1p A A

ii) 1p

iii) Si A y B son sucesos incompatibles,

p A B p A p B

Como consecuencia de estos tres axiomas, se verifican además las siguientes

propiedades:

iv) ( ) 1cp A p A

v) ( ) 0p

vi) Si A B , ( ) ( )p A p B

vii) )()()\( BAPAPBAP , A,B

viii) Si A 1 , A 2 , ...... , A n son incompatibles dos a dos, entonces

1 2 1 2... ...n np A A A p A p A p A

ix) Si A, B son dos sucesos cualesquiera, entonces

106

p A B p A p B p A B

x) Si A, B son dos sucesos cualesquiera, entonces

( ) cp A p A B p A B

5.5 PROBABILIDAD CONDICIONADA.

Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se

conoce que otro evento B ha ocurrido. En este caso habria que referirse a la

probabilidad de A condicionada a B como la probabilidad de que ocurra A

sabiendo que ha ocurrido B, la denotamos por P(A|B)

)(

)()|(

BP

BAPBAP , P(B) 0.

En consecuencia,

p(A B) = ( ) ( )Bp A pA

Independencia.

Dos sucesos A, B se dicen independientes si:

( ) ( | )p A p A B , o bien ( ) ( | )p B p B A

Es decir, se cumplirá que:

( ) ( ). ( )p A B p B p A

Si A y B son independientes, entonces A y B C son independientes, A C y B

son independientes, y A C y B C son independientes.

Observación. Decimos que n sucesos 1 2, , nA A A son independientes si para

cada par (Ai, Aj), )()()( jiji APAPAAP si ji , si para cada trío (Ai, Aj, Ak)

)()()()( kjikji APAPAPAAAP si kji y así sucesivamente. En general,

)()()()( 2121 nn APAPAPAAAP


107

Teorema de la probabilidad compuesta.

Dados n sucesos A 1 , A 2 , ......., A se verifica:

)|()|()|()()( 12121312121 nnn AAAAPAAAPAAPAPAAAP

Teorema de la probabilidad total.

Si suponemos que los eventos A1, A2, A3, ...., An, forman una partición de un

espacio muestral ; esto es, que los eventos Ai son mutuamente excluyentes

y su unión es .

Si A 1 , A 2 , ......., A n son un sistema completo de sucesos tal que :

i) 1 2A A i j ( disjuntos dos a dos)

ii) 1

n

ii

A

iii) ( ) 0ip A , ni ,....1 .

La probabilidad de un suceso B cualquiera es:

1

( ) ( ) ( | )n

i i

i

p B p A p B A

1 21 2

( ) ( ) ( ) ( ) ( ) ....... ( ) ( )nn

B B Bp B p A p p A p p A pA A A

Teorema de Bayes.

El procedimiento que se utiliza para encontrar probabilidades posteriores, a

partir de probabilidades previas, se llama regla Bayesiana. Las

probabilidades apriori o previas se conocen antes de obtener información

A1 A2 An …

108

alguna del experimento en cuestión. Las probabilidades aposteriori se

determinan después de conocer los resultados del experimento.

El teorema de Bayes consiste en un método para encontrar la probabilidad de

una causa específica cuando se observa un efecto particular. Esto es, si el

evento B ha ocurrido, ¿Cuál es la probabilidad de que fue generado por el

evento A1 (que es una causa posible ) o por el A2 (otra causa posible)?.

Si A 1 , A 2 , ......., A n son un sistema completo de sucesos tal que ( ) 0ip A ,

ni ,....1 , entonces para un suceso B cualquiera se verifica:

1

( ) ( ) ( | )( | )

( ) ( ) ( | )

i i ii

ni i

i

p A B p A p B Ap A B

p B p A p B A, i = 1, ...., n.

1 21 2

( ) ( | )( | )

( ) ( ) ( ) ( ) ....... ( ) ( )

i ii

nn

p A p B Ap A B

B B Bp A p p A p p A pA A A

Problemas Resueltos.

1) SUNAT realiza un estudio respecto a tres cuentas de una empresa para

confirmar o descartar la presencia de irregularidades en el sistema de cobro de

impuestos.

a) Cual es el espacio muestral.


109

b) ¿Cual es la probabilidad de que dos de las cuentas presente

irregularidades.

c) Cual es la probabilidad de que la primera cuenta presente irregularidades

y la ultima no presente irregularidades.

d) Cual es la probabilidad de que por lo menos una cuenta presente

irregularidades

Solución.

Denotemos con P, si la cuenta presenta irregularidades y con N, si la cuenta no

presente irregulardades.

a) 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3, , , , , , ,PP N PP P PN N PN P N P P N P N N N P N N N

b) Sea el evento A: Se presenta dos irregularidades

1 2 3 1 2 3 1 2 3, ,A PP N PN P N P P

( ) 3( )

( ) 8

n Ap A

n

c) Sea el evento B: Primera cuenta presenta irregularidades y el último no

presenta.

1 2 3 1 2 3,C PP N PN N

( ) 2( )

( ) 8

n Cp C

n

d) Sea el evento D: Por lo menos una cuenta presenta irregularidades.

1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3, , , , , ,D PP N PP P PN N PN P N P P N P N N N P

( ) 7( )

( ) 8

n Dp D

n

2) Un administrador de empresas con el propósito de incrementar sus utilidades,

diseña tres estrategias de marketing A, B y C. En el 40% de las sucursales, se

aplica la estrategia A , de estas en el 1% de los casos no se presentan

incrementos en las utilidades, en el 30% de las sucursales se aplica la estrategia

B y en el 2% no se presentan incrementos en las utilidades. En el resto de las

110

filiales se utiliza la estrategia C, observándose que en el 3% de las mismas no se

presentan incrementos en las utilidades. Si se selecciona aleatoriamente una

filial de la empresa. Cual es la probabilidad de que :

a) No presente incrementos en las utilidades.

b) No presente incrementos en la utilidad y se haya aplicada la estrategia B.

c) La filial haya empleado la estrategia C, dado que no se presento

incremento en su utilidad.

Solución

Sean los eventos.

A: La filial de la empresa, aplica la estrategia A

B: La filial de la empresa , aplica la estrategia B

C: La filial de la empresa , aplica la estrategia C

D: No se presenta incrementos en la utilidad.

a) ( ) ( ) ( ) ( ) ( ) ( ) ( )D D Dp D p A p p B p p C pA B C

( ) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03) 0.019 1.9%p D

b) p(B D) = ( ) ( )Dp B pB

p(B D) =0.3*(0.02) 0.006 0.6%

Estrategia

A

B

C

No incrementa

No incrementa

No incrementa

Incrementa

Incrementa

40%

30%

30%

1%

2%

3%

99%

98%

97% Incrementa


111

c) ( ) ( ) ( | )

( | )( ) ( ) ( | ) ( ) ( | ) ( ) ( | )

p C D p C p D Cp C D

p D p A p D A p B p D B p C p D C

0.3*(0.03)

( | ) 0.473 47.3%0.4*(0.01) 0.3*(0.02) 0.3*(0.03)

p C D

3) Los siguientes datos pertenecen a 50 comercios de la ciudad de Cusco

divididos en 3 categorías y clasificados según el pago de deudas bancarias.

Pago de deudas

bancarias

CATEGORIAS

A B C

Al día 7 6 12

En mora 9 8 8

Si se elige un comercio al azar ¿cuál es la probabilidad de que:

a) esté en mora?

b) pertenezca a la categoría A o B?

c) pertenezca a la categoría C o esté en mora?

d) pertenezca a la categoría A y esté en mora?

e) Dado que el pago de sus deudas bancarias esta al día. ¿ Cual es la

probabilidad de que la empresa pertenezca a la categoría B?.

Solucion.

Sean los eventos:

A: Comercio pertenece a la categoría A.

B: Comercio pertenece a la categoría B.

C: Comercio pertenece a la categoría C.

D: Pago deudas bancarias en mora. E: Pago de deudas al día.

a) ( ) 25

( ) 0.5( ) 50

n Dp D

n

b) ( ) ( ) ( )

( ) ( ) ( ) ( )( ) ( ) ( )

n A n B n A Bp A B p A p B p A B

n n n

16 14 0 30( ) 0.6

50 50 50 50p A B

112

c) ( ) ( ) ( )

( ) ( ) ( ) ( )( ) ( ) ( )

n C n D n C Dp C D p C p D p C D

n n n

20 25 8 37( ) 0.74

50 50 50 50p C D

d) ( ) 9

( ) 0.18( ) 50

n A Dp A D

n

e)

( )

( ) ( ) 8( )( | )

( )( ) ( ) 25

( )

n B E

P B E n B EnP B E

n EP E n E

n

4) Se hizo una auditoria a tres empresas A, B, y C, para tal efecto se analiza 3

cuentas de la empresa A, 2 cuentas de la empresa B y 5 cuentas de la empresa C.

La probabilidad de que se presenten irregularidades en las cuentas de la

empresa A es de 1/3, que se presente en B es de 2/3 y que se presente en C es

de 1/7. Se analiza una cuenta aleatoriamente y se encuentra que hay

irregularidades. ¿Cuál es la probabilidad de que se trate de la empresa C?

Solución

Sean los eventos

A: Cuentas de la s empresa A.

B: Cuentas de la s empresa B.

C: Cuentas de la s empresa C.

E: La cuenta presenta irregularidades.


113

( ) ( ) ( | )( | )

( ) ( ) ( | ) ( ) ( | ) ( ) ( | )

p C E p C p E Cp C E

p E p A p E A p B p E B p C p E C

3 1*

2110 3( | ) 32.8%3 1 2 2 5 1 64

* * *10 3 10 3 10 7

p C E

Problemas Propuestos.

1.-Un auditor tiene sobre su mesa dos grupos de 20 facturas cada uno. En el

primer lote hay dos facturas con errores de cálculo y en el segundo tres. Una

corriente de aire hace que las facturas caigan de la mesa y, al recogerlas, una del

primer grupo se confunde en el segundo. ¿Cuál es la probabilidad de que, al

revisar una factura del segundo grupo tenga un error?

2.- María Campos, gerente del departamento de crédito de un banco, sabe que la

compañía utiliza 3 métodos para conminar a pagar a las personas con cuentas

morosas. De los datos que se tiene registrados, ella sabe que 70% de los

deudores son visitados personalmente, 20% se le sugiere que paguen vía

telefónica y al restante 10% se le envía una carta. Las probabilidades de recibir

alguna cantidad de dinero debido a los pagos de una cuenta con estos 3

métodos son 0,75 0,60; y 0,65 respectivamente. La señorita Campos acaba de

D

3/10

2/10

5/10

1/3

2/3

1/7

A

B

C

E

D

D

E

E

114

recibir el pago de una de las cuentas vencidas. Calcular la probabilidad de que

la petición de pago se haya hecho:

a. Personalmente

b. Por teléfono

c. Por correo

3.- Una empresa compra cierto tipo de pieza que es suministrada por 3

proveedores: el 45% de las piezas son compradas al 1er proveedor resultando

defectuoso el 1%, el 2do proveedor suministra 30% de las piezas y de ellas es

defectuoso el 2%. Las restantes piezas provienen del 3er proveedor, siendo

defectuoso el 3% de las mismas.

En un control de recepción de artículos se selecciona una pieza al azar y es

defectuosa. Calcular la probabilidad de que la haya suministrado el 2do

proveedor.

4.- Una compañía de ventas por correo tiene tres empleados de almacén

denominados U, V y W quienes toman productos de la bodega y los ensamblan

para la subsiguiente verificación y empaquetado. U comete un error en un

pedido (toma un producto equivocado o la cantidad equivocada del producto)

una de cada 100 veces, V comete un error en un pedido 5 veces de cada 100 y W

se equivoca tres de cada 100. Si U, V y W cubren respectivamente el 30%, el

40% y el 30% de todos los pedidos. ¿Cuál es la probabilidad de que si se

encuentra un error en un pedido, éste haya sido cometido por V?

5. En una encuesta entre alumnos de maestría en administración se obtuvieron los

datos siguientes acerca de “el principal motivo del alumno para solicitar su

ingreso a la escuela donde está matriculado”.

Motivo

Tipo est.

Calidad de la

escuela

Costo o

comodidad

Otros

Totales

Tiempo 421 393 76 890


115

completo

Tiempo parcial 400 593 46 1039

Totales 821 986 122 1929

a. Si un alumno es de tiempo completo. ¿Cuál es la probabilidad de que la

calidad de la institución sea el principal motivo para elegir su escuela?.

b. Si un alumno es de tiempo parcial. ¿Cuál es la probabilidad de que la

calidad de la escuela sea el motivo para elegirla?

c. Sea A el evento en que el alumno es de tiempo completo y sea B el evento

que el alumno menciona que la calidad de la escuela es el 1er motivo de su

solicitud. ¿Son independientes los eventos A y B?. Justifique su respuesta.

6. Antes de que un libro sea lanzado al mercado se recogen las reacciones de un

grupo de personas a las que se les permite leer el libro previamente.

Posteriormente a las ventas del libro se les asigna el calificativo de altas,

moderadas o bajas de acuerdo a las noemas del mercado. Los resultados se

muestran en la siguiente tabla:

Reacciones

Ventas

Favorables Neutral Desfavorables

Altas 173 101 61

Moderadas 88 211 70

Bajas 42 113 141

a) ¿Cuál es la probabilidad de que las ventas sean altas?

b) ¿Cuál es la probabilidad de que las reacciones sean favorables?

c) Si la reacción del grupo es favorable?. ¿Cuál es la probabilidad de que las ventas

sean altas?

d) Si las ventas son bajas ¿Cual es la probabilidad de que las opiniones hayan sido

desfavorables?

e) ¿Cuál es la probabilidad de que las opiniones sean favorables y las ventas sean

altas?

116

f) ¿Cuál es la probabilidad de que las ventas sean favorables o desfavorables?.

¿Son esos sucesos mutuamente excluyentes? Justifique

g) ¿Son los sucesos “Opiniones desfavorables” y “Ventas Bajas” independientes?

Justifique.

7. En un estudio realizado para un supermercado se clasifican los clientes en

aquellos que visitan el establecimiento de una manera frecuente u ocasional y

de acuerdo a la frecuencia en que adquieren cierto alimento. En la siguiente

tabla se presentan las proporciones correspondientes a cada uno de los grupos.

Compra de

productos

Frecuencia

en las visitas

Regular

Ocasional

Nunca

Frecuentes 0,12 0,48 0,19

No Frecuentes 0,07 0,06 0,08

a) ¿Cual es la probabilidad de que un cliente visite frecuentemente el

supermercado y compre regularmente el producto alimenticio?

b) ¿Cuál es la probabilidad de que un cliente que nunca compra el producto visite

el supermercado frecuentemente?

c) ¿Son los sucesos “Nunca compra productos alimenticios” y “Visita el mercado

frecuentemente” independientes?. Justifique.

d) ¿Cuál es la probabilidad de que un cliente realice compras ocasionales?

e) ¿Cuál es la probabilidad de que un cliente no realice nunca compras del

producto?

f) ¿Cuál es la probabilidad de que un cliente visite el establecimiento

frecuentemente o compre el producto regularmente?

8. Un proceso se puede ejecutar con uno de tres algoritmos posibles, digamos A, B

y C. En el 20% de los casos se emplea el algoritmo A, mientras que los

algoritmos B y C son usados el mismo número de veces. En algunas ocasiones


117

en que se realiza el proceso se producen atrasos. Esto ocurre el 10% de las

ocasiones en que se usa el algoritmo A, siendo estos porcentajes del 15% en el

caso en que se aplica el algoritmo B y el 5% en el caso en que se usa el

algoritmo C.

a) ¿En qué porcentaje de las ejecuciones del proceso no se producen atrasos?

b) ¿Qué porcentaje de los atrasos de las ejecuciones del proceso son atribuibles

al algoritmo B?

c) Elegida, al azar, una ejecución ¿Qué probabilidad hay que no tenga retraso

en su ejecución y corresponda al uso del algoritmo A o C?

Entre las ejecuciones que no han sufrido retraso en su ejecución, ¿Cuál es el

porcentaje de las que corresponden al uso de los algoritmos A o C

9.- Las previsiones sobre la inflación de un determinado país para el próximo año

la sitúan por debajo del 2% con probabilidad 0,65, entre el 2% y el 3% con

probabilidad 0,25 y por encima del 3% con probabilidad 0,1. Si la probabilidad

de crear más de 700.000 empleos es de 0,7 con inflación baja, de 0,4 cuando

ésta se sitúa entre el 2% y el 3% y nula en otro caso, calcule:

a) La probabilidad de que se creen más de 700.000 empleos.

b) Si antes de conocer el dato de inflación anual, se sabe que se han creado más

de 700.000 empleos, ¿cuál es la probabilidad de cada uno de los tres niveles de

inflación considerados?

10.- Una fábrica produce tres productos, 1, 2 y 3, cada uno de ellos en calidad extra

y comercial. La probabilidad de producir una unidad de calidad extra en cada

uno de esos productos es: 0,75, 0,5 y 0,8, respectivamente. A su vez esos

productos se fabrican en las siguientes proporciones: 45%, 35% y 20%,

respectivamente. Con esa información responda a las siguientes cuestiones:

a) Si se selecciona al azar una unidad producida, ¿cuál es la probabilidad de

que sea de calidad comercial?

b) Si se selecciona al azar una unidad producida y es de calidad comercial, ¿de

qué producto es más probable que sea?

118

11.- Los siguientes datos pertenecen a 50 comercios de la ciudad de Cusco

divididos en 3 categorías y clasificados según tengan o no deudas impositivas:

Impuestos Categoría A Categoría B Categoría C

Al día 7 6 12

En mora 9 8 8

Si se elige un comercio al azar ¿cuál es la probabilidad de que: a) esté en mora?

b) pertenezca a la categoría A o B? c) pertenezca a la categoría C o esté en mora?

d) Suponga que ahora se eligen 3 comercios al azar. ¿Cuál es la probabilidad de

que todos estén al día con los impuestos?

12.- El personal del Bco. A atiende distintos tipos de consultas, de las cuales una

parte corresponde a autorizaciones de giros en descubierto. Se observa que sólo

30% de los clientes aceptan las condiciones del banco: el 35 % a la tasa normal y

el resto a una tasa mayor. La mitad de los clientes que no aceptan indica que la

tasa ofrecida es mayor a la normal.

a) Calcular la probabilidad de que si se recibe una consulta, ésta corresponda a

operaciones en descubierto a tasa mayor.

b) Si la última consulta sobre descubierto se ofreció a tasa mayor, ¿cual es la

probabilidad de que el cliente la acepte?

119

CAPITULO VI

VARIABLE ALEATORIA Y DISTRIBUCIONES DE

PROBABILIDAD.

6.1 Definiciónes

Una variable aleatoria (v.a) X es cualquier función, que transforma cada elemento

del espacio muestral , en un numero real.

:X

X

Al conjunto de posibles valores de X se le llama rango de X (Rx)

Si Rx es finito o enumerable (rango discreto), entonces X es una v.a Discreta.

Si Rx no es enumerable (rango continuo), entonces X es una v.a Continua.

Función de Probabilidad.

Si X es una v.a discreta, la función de probabilidad de X viene dada por:

/XP x P X x P X x , tal que ( ) 1X

x Rx

P x

Función de densidad

ESTADISTICA

120

Si X es una v.a continua, la función de densidad de X es una aplicación

: 0,Xf tal que ( )

b

X

a

P a X b f x dx ,tal que ( ) 1Xf x dx

Función de distribución

La función de distribución de una v.a X esta dada por:

( ) ( ) ( / ( ) )XF x P X x P X x

Propiedades.

F es continua por la derecha y es creciente

Si X es una v.a discreta , entonces P a X b F b F a P X a

Si X es una v.a continua , entonces P a X b F b F a

Si X es una v.a continua , entonces ' ( )( ) ( )

dF xF x f x

dx

lim ( ) 0x XF x y lim ( ) 1x XF x

Definición.-

La esperanza o media de una variable aleatoria X, denotada por ( )E X o X

se

define según sea la variable discreta o continua, mediante:

. ,

. ( ) ,

x Rx

x Rx

x P X x si X es discreta

E Xx f x dx si X es continua

Propiedades:

El valor esperado de una constante es dicha constante

E a bX a bE X

Definición.-

La varianza de una variable aleatoria X cuya media o esperanza es X

, se define

como

22 22 2

X XV X E X E X E X E X E X

Propiedades.

CLETO DE LA TORRE

121

La raíz cuadrada de la varianza se llama desviación estándar.

22 2

X XE X

2 ( )V aX b a V X

Desigualdad de Chebyshev.

Si X es una variable aleatoria, entonces para cualquier k se cumple

2

11X XP X k

k

Ejercicio resuelto.

1. Sea X la variable aleatoria definida como la suma de los valores que aparecen al

lanzar dos dados.

a) Determine la distribución de probabilidad.

b) Calcule la probabilidad P(5<X<8)

c) La media y su varianza.

Solución.

a)

Resultados en

los dos dados

1 2 3 4 5 6

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

X: Suma de los valores de los dos dados

Rx 2 3 4 5 6 7 8 9 10 11 12

P(X) 1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36

ESTADISTICA

122

b) (5 8) (6) (7) 5/36 6/36 11/36p X p p

c) Media

. ,x Rx

E X x P X x si X es discreta

1 2 3 4 5 6 5 4 3 2 12 3 4 5 6 7 8 9 10 11 12

36 36 36 36 36 36 36 36 36 36 36E X

252

36E X

Varianza.

22 2

X E X E X

2 2 2 2 2 2 2 2 2 2 2 21 2 3 4 5 6 5 4 3 2 12 3 4 5 6 7 8 9 10 11 12

36 36 36 36 36 36 36 36 36 36 36E X

2 1974

36E X

222 2 1974 252

36 36X E X E X

6.2 DISTRIBUCIONES IMPORTANTES.

Existen, como en el caso de la última variable ejemplificada, otras variables cuyas

funciones de probabilidad o densidad resultan ser modelos de mucha utilidad

para una serie de aplicaciones. Nosotros citaremos brevemente algunos de los

modelos de mayor importancia.

DISTRIBUCIONES DISCRETAS.

Un experimento de Bernoulli, es un experimento aleatorio con solo dos posibles

resultados: Éxito y Fracaso. Sea p = P (Éxito).

Distribución Binomial.

La distribución binomial aparece cuando se dan las condiciones siguientes:

-Tenemos un experimento aleatorio simple, con una situación dicotómica, es decir

Éxito y Fracaso.

- Repetimos este experimento simple n veces de manera independiente.

CLETO DE LA TORRE

123

X = Número de Éxitos en n experimentos independientes de Bernoulli.

Función de Probabilidad:

.,0

,...,2,1,0,1

casootroen

nxsippCxP

xnxnx

X

Valor esperado: .npX Varianza: .12 pnpX

Notación: X B(n, p).

Distribución de Pascal o Binomial Negativa. Notación: X BN(r, p).

X = Número de ensayos (experimentos independientes de Bernoulli) hasta

conseguir el r-ésimo Éxito.


.,0

,...2,1,,111

casootroen

rrrxsippCxP

rrxxr

X

Valor esperado: .p

rX Varianza: .

12

2

p

prX

Nota: Si r = 1, X se dice que es una variable aleatoria con distribución geométrica

de parámetro p, y se le denota por X G(p).

Distribución Hipergeométrica. Notación: X H(N, M, n).

Considérese una población de N elementos, M de los cuales son de un tipo A, y

supongamos se extraen sin reemplazo una muestra de n elementos de esta

población. Entonces:

X = Número de elementos de tipo A en la muestra.


.,0

,...,2,1,0,

casootroen

nxsiC

CC

xP Nn

MNxn

Mx

X

Valor esperado: .N

MnX Varianza: .

112

N

nN

N

M

N

MnX

ESTADISTICA

124

Notas:

1. En PX se esta usando la convención que ,0baC si a > b.

2. Si la elección de la muestra fuera con reemplazamiento, entonces X

.,N

MpnB

Distribución de Poisson.

La distribución de Poisson aparece en situaciones en las que se cuenta el número

de apariciones de un determinado suceso o bien en un intervalo de tiempo dado

(como el número de partículas emitidas en un segundo por un material

radioactivo, o el número de pacientes que llegan a un servicio en un intervalo de

tiempo dado) o bien en un recinto físico (como el número de fallos en un metro

de alambre de hierro producido.

X = Número de eventos en t,0 .


.,0

,...2,1,0,!

casootroen

xsix

e

xP

x

X

Valor esperado: .X Varianza: .2X

DISTRIBUCIONES CONTINUAS.

Distribución Uniforme. Notación: X U .,ba

Esta distribución se da cuando la variable aleatoria X puede tomar

indistintamente cualquier valor en el intervalo a, b .

Función de densidad:

.,0

,,1

casootroen

baxsiabxf X

Valor esperado: .2

baX Varianza: .

12

22 abX

CLETO DE LA TORRE

125

Distribución Normal. Notación: X N( , 2).

Función de densidad:

2

22

1

2

1 x

X exf

Valor esperado: .X Varianza: .22X

Nota: Cuando = 0 y 2 = 1, a X se le denota por Z y se le llama una variable

aleatoria con distribución normal estándar; vale decir, Z N (0, 1). Toda v.a.

normal X N ( , 2) puede convertirse con una v.a. normal estándar

(estandarizarse) a través de la transformación:

XZ


1.- Un auditor analiza 10 facturas, se sabe que por estudios anteriores que el 25% de las

facturas presentan algún tipo de error. Calcular la probabilidad de que:

a) Exactamente 4 facturas presenten error.

b) Ninguno de las facturas presenten error.

c) Todos presenten error.

d) Por lo menos 8 presenten error.

e) A lo sumo 3 presenten error.

f) Calcular la Media y varianza

Solución

Consideremos los sucesos

A = La factura presenta error, P (A) = 0.25

A = La factura no presenta error, P ( A ) = 0.75

Se trata de una distribución Binomial de parámetros B (10, 0.25 )

Sea X la variable aleatoria que representa el número de facturas presenta error

ESTADISTICA

126

a) P(Exactamente 4 facturas presenten errores) =

1460.0)75.0()25.0(4

104 64XP

b ) P (Ninguno presenten errores) = 0563.0)75.0()25.0(0

100 100XP

c) P(Todo presenten errores) = 0)75.0()25.0(10

1010 010XP

d) P(Por lo menos 8 presenten error) = 10988 XPXPXPXP

005.00)75.0()25.0(9

10)75.0()25.0(

8

10928

e) P( A lo sumo 3 presenten error ) =

P 32103 XPXPXPXPX

7759.0)75.0()25.0(3

10)75.0()25.0(

2

10)75.0()25.0(

1

10)75.0()25.0(

0

10738291100

f) Media y Varianza

5.2)25.0(10np

875.1)75.0)(25.0(10)1(2 pnp

2.- El treinta por ciento de los administradores de supermercados utilizan estrategias

de marketing. Si se selecciona siete administradores, determinar la probabilidad

de que.

a) Ninguno de los 7 utiliza estrategias de marketing.

b) Todos utilizan estrategias

c) Al menos 2 utilizan marketing

Solución

Consideremos los sucesos:

A = Utilizan software, P(A) = 0.3

CLETO DE LA TORRE

127

A = No utilizan software, P ( A ) = 0.7

Por tanto se trata de una distribución Binomial de parámetros B (7, 0.3)

Sea X la variable aleatoria que representa el número de administradores que

utilizan estrategias de marketing.

a) 0824.0)7.0()3.0(0

70 70XP

b) 0002.0)7.0()3.0(7

77 07XP

c) 6705.0)7.0()3.0(1

7)7.0()3.0(

0

71101112 6170XPXPXPXP

3.- El Ingreso medio diario de los gerentes de empresas en una ciudad es 60 dólares y la

desviación típica es $6 . Suponiendo que los ingresos están distribuidos

normalmente.

a) Cual es la probabilidad de que un gerente tenga ingresos menores a $ 64

b) Cual es la probabilidad de que un gerente tenga ingresos de $57 a más ?

c) Cual es la probabilidad de que un gerente tenga ingresos mayores de $63?

d) Cual es la probabilidad de que un gerente tenga ingresos entre $57 a $65 ?

e) Cual es la probabilidad de que un gerente tenga ingresos menores de $50?

f) Cual es la probabilidad de que un gerente tenga ingresos entre $64 a $70 ?

g) Si en total hay 200 gerentes en esa ciudad, .Cuantos cabe esperar que presenten

ingresos mayores a $57 y menores de $64?

Solución.

X: Ingreso de los gerentes.

60 (Media poblacional)

6 (Desviación)

a) 64 64 60

( 64) ( ) ( ) ( 0.67)6

XP X P P Z P Z

ESTADISTICA

128

0 z=0.67

(0.67)

0.5 (0.67) 0.5 0.24857=0.74857=74.857%

b) 57 57 60

( 57) ( ) ( ) ( 0.5) (0.5) 0.56

XP X P P Z P Z

0z= 0.5

(0.5)

0.19146+0.5=0.69146=69.146%

c) 63 63 60

( 63) ( ) ( ) ( 0.5) 0.5 (0.5)6

XP X P P Z P Z

0 z=0.5

(0.5)

0.5 0.19146=0.30854=30.854%

d) 57 65 57 60 65 60

(57 65) ( ) ( )6 6

XP X P P Z

( 0.50 0.83) (0.50) (0.83) 0.19146+0.29373=0.48519=48.519%X

P

CLETO DE LA TORRE

129

0

z=0.83z= 0.50

(0.5) (0.83)

e) 50 50 60

( 50) ( ) ( ) ( 0.167)6

XP X P P Z P Z

0z= 0.167

(0.167)

0.5 (0.167) 0.5 0.0675=0.4325=43.25%

f) 64 70 64 60 70 60

(64 70) ( ) ( )6 6

XP X P P Z

(0.67 1.67) (1.67) (0.67) 0.45254-0.24857=0.20397=20.397%X

P

0 z=1.67z=0.67

(1.67)

(0.67)

g) 57 64 57 60 64 60

(57 64) ( ) ( )6 6

XP X P P Z

ESTADISTICA

130

( 0.5 0.67) (0.5) (0.67) 0.19146+0.24857=0.44003=44.003%X

P

Cabe esperar el 44.003% de los gerentes, es decir 0.44003*200 88


1.- La empresa de asuntos financieros Tax Service se especializa en las devoluciones de

importes de impuestos federales. Una reciente auditoría de las declaraciones indicó

que se cometió un error en el 10% de las que manifestó el año pasado. Suponiendo

que tal tasa continúe en este periodo anual y elabore 60 declaraciones. ¿Cuál es la

probabilidad de que realice:

a) Más de 9 errores?

b) Por lo menos 9 errores?

2.- Los salarios de los trabajadores en cierta industria son en promedio $11,9 por hora y

la desviación estándar de $0,4. Si los salarios tienen una distribución normal. ¿Cuál

es la probabilidad de que un trabajador seleccionado al azar:

a) Reciba salarios entre $10,9 y $11,9?

b) Reciba salarios inferiores a $11?

c) Reciba salarios superiores a $12,95?

d) ¿Cuál debe ser el salario menor que gana un trabajador que se encuentra entre el

10% de los trabajadores que más ganan?

e) Si el dueño de la industria va a aumentarle el salario al 15% de los trabajadores que

menos ganan. ¿Cuál será el salario máximo que deberá ganar un trabajador para ser

beneficiado con el aumento?

3.- El volumen de acciones negociadas en la Bolsa es normal con una media de 646

millones de acciones y una desviación de 100 millones de acciones.

a) ¿Cuál es la probabilidad de que el volumen negociado sea menor de 400 millones?

CLETO DE LA TORRE

131

b) ¿Cuál es la probabilidad de que el volumen negociado de acciones oscile entre las

400 y las 600 acciones?

c) Si la Bolsa quiere emitir un boletín de prensa sobre el 5% de los días más activos

¿Qué volumen publicará la prensa?

4.- Se toma una muestra de 12 trabajadores de una gran empresa para estudiar su

actitud frente a un cambio en el método de trabajo. Si el 60% de todos los trabajadores

de la empresa están a favor del cambio. ¿Cuál es la probabilidad de que menos de 5 de

los miembros de la muestra estén a favor?

5.- La tasa real de desempleo es de 15%. Suponga que se seleccionan al azar 15 personas

en posibilidad de trabajar.

a) ¿Cuál es la cantidad esperada de desempleados?

b) ¿Cuál es la varianza y la desviación estándar de los desempleados?

c) ¿Cuál es la probabilidad de que al menos 3 estén desempleados?

d) ¿Cuál es la probabilidad de que haya entre 3 y 5 desempleados?

6.- Se sabe que el 30% de los clientes de una tarjeta de crédito a nivel nacional dejan en

cero sus saldos para no incurrir en intereses morosos. En una muestra de 8

poseedores de esa tarjeta:

a) ¿Cuál es la probabilidad de que de 4 a 6 clientes paguen sus cuentas antes de incurrir

en el pago de intereses?

b) ¿Cuál es la probabilidad de que 3 clientes o menos paguen sus cuentas antes de

incurrir en pago de intereses?

7.- Sabiendo que la recaudación diaria de cierto comercio minorista se distribuye

normalmente con un monto promedio de $830 y un desvío estándar de $125:

a) ¿Cuál es la probabilidad de que mañana se recaude menos de $885?

b) ¿Cuál es la probabilidad de que mañana se recaude más de $600?

c) ¿En qué porcentaje de los días se recauda entre $700 y $800?

d) ¿En qué porcentaje de los días se recauda entre $900 y $1500?

ESTADISTICA

132

e) ¿Cuál es el monto no superado en el 20% de los días?

f) ¿Cuál es el monto sólo superado en el 30% de los días?

8.-Las ventas mensuales de un producto tienen distribución normal. Se sabe que el 15%

de los meses se venden menos de 1.500 unidades , mientras que el 7% de los meses

las ventas superan las 1800 unidades.

a) Definir la variable aleatoria e identificar sus parámetros.

b) ¿Cuál es la probabilidad de que las ventas mensuales sean de 1600 unidades?

c) ¿Cuál es la venta garantizada el 90% de los meses?

9.- La creciente recesión económica lleva a las empresas a modificar, entre otras cosas,

sus condiciones de pago. En cierta industria se determinó que en el último año las

cobranzas se realizaron a los 120 días fecha factura en promedio, con un desvío típico

de 20 días (sin considerar los incobrables y clientes en gestión judicial) y que la

variable “días de cobranza” se distribuye normalmente.

a) Si no varían las condiciones económicas ni comerciales para el año próximo ¿cree que

es muy probable que en la industria estudiada lleguen a cobrar a más de 150 días?

b) ¿En cuántos días como máximo se espera cobrar el 85 % de las operaciones ?

c) Si la última cobranza se efectivizó en un plazo inferior al promedio de días, ¿cuál es

la probabilidad de que la empresa haya cobrado después de los 100 días ?

10.- El costo de un producto que se procesa en forma automática está formado por el

costo de los materiales del envase (0,07 m2/unidad) y el costo del producto en sí mismo

(5 gramos/unidad), tomándose como unidad el envase de presentación.

Debido a ciertas fluctuaciones, dichos costos son variables aleatorias independientes

que pueden considerarse normalmente distribuidas:

- el costo de materiales (x) con media 180$/m2

y desvío estándar de 2$/m2.

- el costo del producto (y) con media 20$/gramo, y desvío estándar de 1,5 $/gramo.

a) ¿Cuál es la probabilidad de que el costo del producto de una unidad supere los $ 122?

b) ¿Cuál es la probabilidad de que el costo de un pack de 25 unidades supere los 2950$?

CLETO DE LA TORRE

133

CAPITULO VII

INTRODUCCION AL MUESTREO

7.1 INTRODUCCION.

El objetivo de la estadística es hacer inferencias acerca de una población con base

en la información contenida en una muestra. Este mismo objetivo motiva el

estudio del problema de muestreo. Consideraremos el problema particular del

muestreo de una población finita (colección finita de mediciones).

En lo referente al muestreo, la inferencia consiste en la estimación de un parámetro

de población, tal como una medida, un total o una proporción con un límite para

el error de estimación (precisión).

Para un buen entendimiento del problema de muestreo, introduciremos

enseguida, ciertos aspectos técnicos comunes a las encuestas de muestreo.

7.2 DEFINICION DE TÉRMINOS, REVISIÓN DE CONCEPTOS.

Población (UNIVERSO): Es una colección finita o infinita de individuos o

elementos. No necesariamente se refiere a una colección de organismos vivientes.

En el muestreo, usualmente se distingue el significado de los términos universo y

población, indicando con el primero un conjunto de elementos, individuos,

unidades, seres y objetos, y con el segundo un conjunto de mediciones de los

mismos.

ESTADISTICA

134

Una tarea importante para el investigador es definir cuidadosa y completamente

la población antes de recolectar la muestra. La definición debe contener una

descripción de los elementos que serán incluidos y una especificación de las

mediciones que se van a considerar, ya que estas dos componentes están

interrelacionadas.

Muestra: Es un subconjunto de la población. Una muestra puede ser

probabilística (aleatoria) o no probabilística.

Unidad de Muestreo: Es una colección de uno o más elementos de la población.

Las unidades de muestreo cubren toda la población. Una unidad de muestreo

debe ser claramente definida, identificable y observable.

Unidad Reportante: Es la que suministra la información estadística requerida o de

la cual la información la información puede ser convenientemente averiguada.

Marco de Muestreo: Se presenta en forma de lista o mapa de las unidades de

muestreo que conforman la población. Forma el material básico para la selección

de la muestra.

El marco muestral debe contener todas las unidades de muestreo que conforman

la población bajo estudio, y debe excluir unidades de cualquier otra población.

Parámetro: Es un valor numérico de la población usualmente desconocido que

representa cierta característica de la población.

Estadístico: Es una función real de la muestra aleatoria, usado para estimar un

parámetro, si un parámetro se denota con , el estimador se denotará con ˆ .

Estimación: Es el valor que toma el estimador en los datos de la muestra.

Error de Estimación: Es la diferencia absoluta entre el parámetro y su estimador,

es decir || . Como se puede apreciar, es imposible conocer con exactitud el

CLETO DE LA TORRE

135

error de estimación, pero podemos, al menos aproximadamente encontrar un

límite E tal que:

)|ˆ(| EP

Para cualquier entre 0 y 1.

Si ˆ tiene distribución aproximadamente normal, entonces para

)ˆ(96.1 VE se cumple:

95.0)|ˆ(| EP

Limite para el error de estimación: Denotado por E es dado por )ˆ(96.1 VE . El

factor E es llamado también precisión. Si E esta expresado en las mismas unidades

de la medida de la variable, se le llama precisión absoluta. Si E está expresado

como un porcentaje del parámetro que se está estimando, se le llama precisión

relativa.

Una ves estimado el límite E, podemos afirmar que el parámetro se encuentra en

el intervalo EE ˆ,ˆ con una confianza del 95%. El intervalo anterior es

llamado intervalo de confianza.

Error de Muestreo: Este error se debe a que una muestra no produce información

completa sobre una población. Puede ser controlado por un diseño cuidadoso de

la muestra y es estimado en gran parte por el factor E. Por esta razón, algunos

autores denominan al factor E, error de muestreo.

Error de no Muestreo: Son los errores que se introducen imperceptiblemente a la

encuesta y estos son más difíciles de controlar, infortunadamente estos errores no

se pueden medir fácilmente, y aumentan a medida que aumenta el tamaño de la

muestra. Los tipos errores no muestrales que suelen presentarse son:

- Definición equivocada del problema.

- Definición defectuosa de la población.

- Marco imperfecto o desactualizado.

ESTADISTICA

136

- La no respuesta.

- El sesgo de respuesta.

- Diseño pobre del instrumento de medición.

Sin embargo, los errores de no muestreo pueden ser controlados mediante una

atención cuidadosa en todas las etapas de la encuesta.

7.3 ENCUESTA.

La función de la encuesta es la medición del comportamiento, actitudes o

características del encuestado, que es un individuo de la población en estudio

seleccionado para la muestra.

Diseño de la encuesta

Pasos a seguir:

Definir los objetivos

Determinar el marco

Diseñar el procedimiento de muestreo

Diseñar el cuestionario

Diseñar y realizar el trabajo de campo

Codificar, depurar y analizar las respuestas

Redactar el informe

Diseño de la muestra

El diseño de la muestra incluye:

La elección del procedimiento de muestreo

La determinación del tamaño de la muestra

Existen varios procedimientos de muestreo, entre las principales se tiene

muestreo: aleatorio simple, estratificado y sistemático.

CLETO DE LA TORRE

137

7.4 MUESTREO ALEATORIO SIMPLE

Definición. Si una muestra de tamaño n, es seleccionado de una población de

tamaño N de tal manera que cada muestra posible tiene la misma probabilidad de

ser seleccionada, el procedimiento de muestreo se llama Muestreo Aleatorio

Simple (M. A. S.)

El M. A. S. puede ser de 2 formas, sin preposición (muestreo irrestricto aleatorio)

y con reposición.

Procedimiento de selección.

El procedimiento de selección de una Muestra Aleatoria Simple (M.A.S.) consiste

en:

i) Enumerar las unidades de la población, desde 1 hasta N.

ii) Usando la tabla de números aleatorios seleccionar la primera unidad para la

muestra.

iii) Continuar la selección excluyendo las unidades repetidas (si es sin

reposición) o incluyendo las unidades repetidas (si es con reposición) hasta

completar el tamaño de muestra n.

Tamaño de la muestra

Una parte fundamental para realizar un estudio estadístico de cualquier tipo es

obtener unos resultados confiables y que puedan ser aplicables. Como ya se

comentó anteriormente, resulta casi imposible o impráctico llevar a cabo algunos

estudios sobre toda una población, por lo que la solución es llevar a cabo el

estudio basándose en un subconjunto de ésta denominada muestra. Sin embargo,

para que los estudios tengan la validez y confiabilidad buscada es necesario que

tal subconjunto de datos, o muestra, posea algunas características específicas que

permitan, al final, generalizar los resultados hacia la población en total.

Esas características tienen que ver principalmente con el tamaño de la muestra y

con la manera de obtenerla. El muestro, implica algo de incertidumbre que debe

ESTADISTICA

138

ser aceptada para poder realizar el trabajo, pues aparte de que estudiar una

población resulta ser un trabajo en ocasiones demasiado grande.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

- El porcentaje de confianza con el cual se quiere generalizar los datos desde la

muestra hacia la población total.

- El porcentaje de error que se pretende aceptar al momento de hacer la

generalización.

- El nivel de variabilidad que se calcula para comprobar la hipótesis.

1. Tamaño de muestra para Estimar

Si se desea estimar , con precisión fijada por el investigador, el tamaño de

muestra necesario es dado por:

2 2

(1 / 2)

22 2

(1 / 2)

*

* ( 1)

Z Nn

Z N Población finita.

2 2

(1 / 2)

2

*Zn , Población infinita.

Donde

2 Es la varianza poblacional

En la practica el valor de 2 estimado por S2 a partir de una encuesta anterior o

de una muestra piloto.

2. Tamaño de la muestra para estimar P.

De manera simular, la fórmula del tamaño de muestra n para la estimación de p

con error máximo de estimación de y un nivel de confianza del

100(1 - )%:

2

(1 / 2)

22

(1 / 2)

* * (1 )

* (1 ) ( 1)

Z N p pn

Z p p N, Población finita.

y si N :

CLETO DE LA TORRE

139

2

(1 / 2)

2

* (1 )Z p pn , Población infinita.

En este caso el valor de esta entre 0 y 1, el valor de P es desconocido, por lo que

debe ser estimado preliminarmente a partir de una encuesta anterior, o de una

muestra piloto. En última instancia el valor de P se puede sustituir por 0.5 y se

obtendrá un tamaño de muestra mayor que el requerido.

Recomendaciones para el uso del M. A. S.

Generalmente el M. A. S. Esta orientada a encuestas de pequeña escala y raras

veces a encuestas de gran escala, debido a que otros diseños proporcionan mayor

o igual precisión a menor costo.

En las encuestas por muestreo a gran escala, el M. A. S. es usado como

parte de un diseño de muestreo mucho más complejo.

El M. A. S. es muy eficiente cuando la población es homogénea.

7.5 MUESTREO ESTRATIFICADO.

Una muestra estratificada es la obtenida mediante la separación de los elementos

de la población en grupos heterogéneos disjuntos, llamados estratos y la selección

posterior de una muestra aleatoria simple en cada estrato.

Consideremos una población de tamaño N, la cual es dividida en k estratos (sub

poblaciones) de tamaños Ni, i=1,2…., k, tal que 1 2 ... kN N N N

El tamaño de muestra se estima mediante:

N1 N2 NK …

ESTADISTICA

140

2 2

(1 / 2)

1

2 2 2

(1 / 2)

1

* (1 ) /

* (1 )

k

i i i i

i

k

i i i

i

Z N p p w

n

N Z N p p,

es iw el % de observaciones asignados al estrato i

El tamaño de muestra necesario de cada estrato, se puede obtener por afijación

proporcional al tamaño de cada estrato, es decir:

* * , 1,...,ii i

Nn n n w i k

N

Cuando se realiza un muestreo estratificado, los tamaños muestrales en cada uno

de los estratos, ni, los elige quien hace el muestreo, Así en un estrato dado, se

tiende a tomar una muestra más grande cuando:

- El estrato es más grande;

- El estrato posee mayor variabilidad interna (varianza);

- El muestreo es más barato en ese estrato.

7.6 MUESTREO SISTEMATICO

Definición.- Una muestra obtenida al seleccionar aleatoriamente un elemento de

los primeros k elementos en el marco y después cada k-ésimo elemento, se

denomina muestra sistemática de intervalo de selección k.

El muestreo sistemático puede ser de dos formas, muestreo sistemático simple y

muestreo sistemático circular.

Procedimiento de selección del muestreo sistemático simple.

Una muestre sistemática simple se obtiene cuando el intervalo de selección k es

exactamente un numero entero.

El procedimiento de selección de una muestra sistemática simple consiste:

i) Las unidades del marco deben ser ordenados en magnitud de acuerdo con

algún esquema de ordenación (población ordenada) es base al orden se establece

la numeración desde 1 hasta N

ii) Determinar el intervalo de selección N

kn

(k exactamente un numero entero)

CLETO DE LA TORRE

141

iii) Seleccionar un numero aleatorio entre 1 y k (arranque aleatorio) sea “a” el

arranque aleatorio elegido, entonces los elementos de la muestra sistemática, son

los que ocupan las posiciones en el marco:

a, k+a, 2k+a, 3k+a,......(n-1)k+a

ESTADISTICA

142


1. Un empresario dedicado al rubro de pizzería, desea hacer una estimación del gasto

que realizan las personas en pizza por semana, con 99% de confianza, suponiendo

que el máximo error permitido es de un soles, además de una muestra piloto se

obtuvo una varianza de 25. También se sabe la ciudad tiene 2500 ciudadanos ¿Que

tamaño de muestra necesitara para investigar?

Solución.

2

(1 /2)2500, 1, 25, 2.58N Z

2 2 2(1 / 2)

2 22 2 2

(1 / 2)

* 2.58 *2500*25156.08 157

* ( 1) 2.58 *25 (2500 1) 1

Z Nn

Z N

2. Las compañías de auditoría generalmente seleccionan una muestra aleatoria de los

clientes de una banco y verifican los balances contables reportados por el banco. Si

una compañía de este tipo se encuentra interesada en estimar la proporción de

cuentas para las cuales existe una discrepancia entre el cliente y el banco, ¿cuántas

cuentas deberán seleccionarse del banco si esta tiene 25000 clientes, de manera tal

que con una confianza del 95% la proporción muestral se encuentre a no más de

5% unidades de la proporción real?.

Solución.

Consideremos que no se tiene ningún estudio de este tipo, por tanto 0.5P , del

problema: (1 /2)25000, 0.05, 1.96N z

2

(1 / 2)

22

(1 / 2)

* (1 )

* (1 ) ( 1)

Z NP Pn

Z P P N

2

22

1.96 *25000*0.5(1 0.5)378.361 379

1.96 *0.5(1 0.5) (25000 1) 0.05n

CLETO DE LA TORRE

143

3. El administrador de una empresa A desea hacer un estudio de investigación de

mercado en cierta región, respecto al posicionamiento que tiene su marca, con un

nivel de confianza del 95% y un error del 5%. Suponiendo que en estudio realizado

hace 10 años, el nivel de posicionamiento de su marca es de 15% ¿Cual debe ser el

tamaño de muestra para este estudio?

Solución.

La población materia de estudio, no es finita, por tanto la relación para estimar el

tamaño de muestra es:

2

(1 / 2)

2

* (1 )Z P Pn

Del problema se tiene los siguientes datos

(1 /2)0.15, 0.05, 1.96P z

2

2

1.96 *0.15(1 0.15)195.92 196

0.05n

4. Se desea lanzar un nuevo producto al mercado, para ello usted tiene que realizar

un estudio de la demanda de este producto. Suponiendo que esta ciudad se divide

en tres distritos, cuyo tamaño poblacional se muestra en el cuadro siguiente:

Distrito Tamaño de población.

A 2000

B 1200

C 5000

Total 8200

Considere que el tamaño de muestra es 245, calcule el tamaño de muestra por cada

ciudad, necesario para este estudio.

Solución.

En este ejemplo, los distritos forman los estratos:

ESTADISTICA

144

Ciudad Ni wi

A 2000 =2000/8200=0.24

B 1200 =1200/8200=0.15

C 5000 =5000/8200=0.61

Total N=8200 1

n=245.

Usando la relación,

* * , 1,...,ii i

Nn n n w i k

N, Se determina el tamaño de muestra para cada

distritos.

* * 0.24*245 59.76 60AA A

Nn n n w

N

* * 0.15*245 35.85 36BB B

Nn n n w

N

* * 0.61*245 149.39 149CC C

Nn n n w

N

EJERCICIOS PROPUESTOS.

1. SUNAT tiene previsto realizar una auditoria a cuentas de un grupo de

empresas con la finalidad de estimar la proporción de empresas que presentan

desbalance financiero ¿cuántas cuentas empresas deberán seleccionarse de

manera tal que con una confianza del 99% la proporción muestral se encuentre a

no más de 0.02 unidades de la proporción real?.

2. Unos grandes almacenes tienen 1000 empleados en uno de sus centros. Calcular

el tamaño muestral necesario para estimar su salario anual medio con un error

máximo de 80 soles para un nivel de confianza del 95%. (Por estudios anteriores

se sabe que el salario anual sigue una distribución normal con desviación típica

de 70 soles).

3. Una tienda se interesa en estimar su volumen de ventas diarias. Supóngase que

el valor de la desviación típica es de 50 soles. Si el volumen de ventas se puede

modelizar por una distribución normal, ¿cuál debe ser el tamaño de la muestra

CLETO DE LA TORRE

145

para que con una confianza del 95% la media muestral se encuentre a no más de

20 soles del verdadero volumen medio de ventas?

4. Se esta realizando una auditoria respecto al incumplimiento de entrega de

facturas en un región que tiene 4 provincias (A, B, C y D). Se sabe también que

la provincia A tiene el 45% de la poblacional regional, la provincia B 10%, la

provincia C el 22% y la provincia D el resto de la población regional.

Determine el tamaño de muestra para este estudio, suponiendo que la región

tiene 12000 centros comerciales.

5. Para un mercado de prueba, encuentre el tamaño de muestra necesario para

estimar proporción real de consumidores satisfechos con un cierto producto

nuevo, dentro de ± 0,04 nivel de confianza de 90%. Suponga que no tiene una

buena idea del valor de la proporción.

6. Una tienda local vende bolsas de plástico para basura y ha recibido unas cuantas

quejas con respecto a la resistencia de tales bolsas. Parece ser que las bolsas que

se venden en la tienda son menos resistentes que las que vende su competidor y,

en consecuencia, se rompen más a menudo. Gustavo, gerente encargado de

adquisición, está interesado en determinar el peso máximo promedio que puede

resistir una de las bolsas para basura sin que se rompa. Si la desviación estándar

del peso límite que puede aguantar una bolsa es de 1,2 Kg., determine el número

de bolsas que deben ser probadas con el fin de que Gustavo tenga una certeza de

95% de que el peso límite promedio está dentro de 0,5 Kg., del promedio real.

7. Elena acaba de adquirir un programa de computación que afirma escoger

acciones que aumentarán su precio durante la semana siguiente con un índice de

precisión de 85%. ¿En cuántas acciones deberá Elena probar el programa con el

fin de estar 98% segura de que el porcentaje de acciones que realmente subirán

de precio durante la semana próxima estará dentro de ±0,05 de la muestra de la

población?.

8. Se planea una investigación para determinar los gastos médicos familiares

promedios por año. La administración de la compañía desea tener 95% de

confianza de que el promedio muestral es correcto dentro de ± $50 del promedio

ESTADISTICA

146

real familiar. Un estudio piloto indica que la desviación estándar se puede

estimar como $400. ¿Qué tamaño de muestra se requiere?

9. El Gerente de un banco desea 90% de confianza de tener un resultado correcto

dentro de ± 0,05 de la proporción de la población real de ahorradores que tienen

cuantas de ahorros y de cheques en el banco. ¿De cuántos ahorradores debe ser

su cuenta?

10. Un grupo de consumidores desea estimar el monto de facturas de energía

eléctrica para el mes de julio para las viviendas unifamiliares en una ciudad

grande. Con base a estudios realizados en otras ciudades se supone que la

desviación estándar es de 25 dólares. El grupo desea estimar el monto promedio

para le mes de julio de ± 5 dólares del promedio verdadero con 99% de

confianza. ¿Qué tamaño de muestra se necesita?

CLETO DE LA TORRE

147

CAPITULO VIII

ESTIMACION POR INTERVALOS Y PRUEBAS DE

HIPOTESIS

8.1 DISTRIBUCIONES MUESTRALES.

DISTRIBUCION NORMAL.

En este capitulo abordaremos el estudio de la distribución normal y de otras

distribuciones asociadas a funciones de una muestra al azar de esta variable. El

porque de la importancia de la distribución normal se ilustra a través de las

siguientes propiedades y distribuciones.

PROPOSICION

1. Teorema del limite central (TLC). Si nXXX ,...,, 21 son n v.a.’s independientes,

donde cada Xi tiene la misma distribución de valor esperado y varianza 2,

entonces para n suficientemente grande (en la práctica n 30) se cumple que

aproximadamente

n

X

n

nXZ

n

i i

/

1 N (0, 1).

2. Aproximación de la Binomial por la Normal. Si X B (n, p) y n es

suficientemente grande, entonces aproximadamente:

pnp

npXZ

1 N (0, 1).

ESTADISTICA

148

Aquí, para el cálculo de probabilidades, se recomienda utilizar la llamada

corrección por continuidad: Si a b son dos números naturales, entonces

aproximadamente:

.112

1

2

1 21

21

pnp

npaFz

pnp

npbFzbXaPbXaP

LA DISTRIBUCION CHI-CUADRADO.

Una v.a. X tiene distribución chi-cuadrado con n grados de libertad, y se le denota

por X 2 (n).

PROPOSICION.

1. Si Z N (0, 1), entonces Z2 2 (1).

2. Propiedad reproductiva. Si 2 2 2

1 2 k ... son k variables aleatorias

independientes con distribuciones chi-cuadrado de respectivamente knnn ,...,, 21

grados de libertad, entonces

2 2

1

k

i

i

Es también una v.a. con distribución chi-cuadrado de k

i inn1

grados de

libertad.

3. Si nXXX ,...,, 21 es una m.a de X N ( , 2), entonces

2

21 SnW 2 (n -1).

LA DISTRIBUCION T DE STUDENT.

Una v.a. X tiene distribución t de Student con n grados de libertad, y se le denota

por X t(n).

PROPOSICION.

1. Sea X t(n). Si n es grande, entonces aproximadamente X N (0, 1).

2. Si Z N (0, 1) y 2 2 (n) son v.a’s independientes, entonces

CLETO DE LA TORRE

149

2

n

ZT t(n). En particular, dada una m.a. nXXX ,...,, 21 de X N ( , 2), se

cumple que:

nS

XT

/ t (n -1).

LA DISTRIBUCION F DE FISHER.

Una v.a. X tiene distribución F de Fisher con n grados de libertad en el numerador y

m grados de libertad en el denominador, y se le denota por X F (n, m).

PROPOSICION.

1. Si X F (n, m), entonces X1 F (m, n).

2. Si 2

1 2(n) y 2

2 2(m) son v.a’s independientes, entonces

2

1

2

2

/

/

nF

m F (m, n). En particular, si nXXX ,...,, 21 es una v.a. de X N ( 1, 12),

e mYYY ,...,, 21 una m.a de una v.a. Y N ( 2, 22), donde X e Y son independientes,

entonces

21

22

22

21

S

SF F (n -1, m - 1),

Siendo 2

1S y 22S las varianzas muestrales asociadas a las poblaciones estadísticas

determinadas por X e Y, respectivamente.

Nota: La distribución normal estándar, t de Student, chi-cuadrado y F de Fisher

poseen todas tablas en la que se tabulan algunos valores de su función de

distribución.

8.2 INTERVALOS DE CONFIANZA.

Cuando tratamos la estimación puntual, uno de los problemas que se plantearon

es que el valor de la estimación es solo uno de los valores (posiblemente infinitos)

ESTADISTICA

150

del estimador, obtenido al extraer una muestra concreta, de forma que si

extraemos dos muestras distintas, las estimaciones serán distintas.

Al hacer cualquier estimación se está cometiendo un error, y seria deseable

proporcionar una medida de la precisión de la estimación del parámetro. En este

tema vamos a introducir el concepto de intervalo de confianza como un intervalo

cuyos extremos son variables que dependen de la muestra, y en el cual se confía

que esté el valor de parámetro. El intervalo se obtendrá a partir de un estadístico

generalmente relacionado con un estimador puntual, cuya distribución no

depende del parámetro desconocido, y una medida de la validez del intervalo es

el nivel de confianza, que indica la proporción de intervalos de todos los que se

podrían construir a partir de muestras distintas, que realmente contienen al

parámetro.

Definición.

Un intervalo de confianza (IC) al 100(1 - )% para un parámetro poblacional de

una v.a. X es un intervalo con estadísticas L1 y L2 en los extremos (IC = L1, L2 ) tal

que .121 LLP

Intervalo de confianza para la media

El IC al 100(1 - )% para , cuando 2 es conocida, se obtiene usando como

pivote a n

XZ

/ N (0, 1) y vienen dado por

2 21 1

X z X zn n

Donde 2

1z denota al valor de la distribución normal estándar, X es el valor de

la media muestral.

CLETO DE LA TORRE

151

Z(1 Z(1

1

/2 /2

El IC al 100(1 - )% para , cuando 2 es desconocida se obtiene usando como

pivote a nS

XT

/ t (n -1) y vienen dado por

2 2(1 , 1) (1 , 1)

,n n

S SX t X t

n n

t(1 t(1

1

/2 /2

Donde 12

1nt denota al valor de la distribución t de Student con n – 1 grados de

libertad y la varianza muestral dado por

2

2 1

1

n

i

i

x x

Sn

Intervalo de confianza para la varianza 2

El IC al 100(1 - )% para 2, se obtiene usando como pivote a 2

21 SnW 2 (n -

1) y vienen dado por :

2 2

2 2

2

2 2

1

1 1

1 1

n S n S

n n

ESTADISTICA

152

1

2

(1 /2)

2

( /2)

Donde 12

2

n y 12

12

n denotan a los valores en la distribución chi-

cuadrado con n – 1 grados de libertad y la varianza muestral dado por:

2

2 1

1

n

i

i

x x

Sn

Intervalo de confianza para la razón de dos varianzas 2 2

1 2/

El IC al 100(1 - )% para 2 2

1 2/ , se obtiene usando como pivote a

2 2

1 11 22 2

2 2

/1, 1

/

SF F n n

S y vienen dado por

2 1 2 1

2 2 2

1 1 1/ 2, 1, 1 1 / 2, 1, 12 2 2

2 2 2

n n n n

S Sf f

S S

Donde 2 1/ 2, 1, 1n nf y

2 11 /2, 1, 1n nf denotan a los valores en la distribución

F. 2

1S y 2

2S son las varianzas de dos muestras aleatorias independientes de tamaños

1n y 2n

Intervalo de confianza para la diferencia entre dos medias. 1 2

El IC al 100(1 - )% para 1 2

, cuando 2

1y 2

2 es conocida se obtiene usando como

pivote a 1 2 1 2

2 2

1 2

1 2

( )X Xz

n n

y vienen dado por:

CLETO DE LA TORRE

153

2 2 2 2

1 2 1 21 2 (1 / 2) 1 2 1 2 (1 / 2)

1 2 1 2

( ) * ( ) *X X z X X zn n n n

Intervalo de confianza para la proporción p

El IC al 100(1 - )% para p , se obtiene usando como pivote a

1p p

n

p pZ N (0, 1),

y vienen dado por:

2 2

1 1

1 1

p p p p

n np z p p z

Intervalo de confianza para la diferencia entre dos proporciones 1 2p p

El IC al 100(1 - )% para 1 2p p , se obtiene usando como pivote a

1 1 2 2

1 2

1 2 1 2)

1 1

( ) (

p p p p

n n

p p p pZ

N (0, 1),

y vienen dado por:

1 1 2 2 1 1 2 2

1 2 1 22 2

1 1 1 1

1 2 1 2 1 21 1( ) * ( ) ( ) *

p p p p p p p p

n n n np p z p p p p z

RESUMEN DE INTERVALO DE CONFIANZA.

ESTADISTICA

154

Intervalos de confianza de: Limite inferior Limite Superior

La Media

Si se asume 2 conocido

-Nota: Si la población no es normal

pero n 30

21

X zn

21

SX z

n

21

X zn

21

SX z

n

La Media

Si se asume que 2 es

desconocido

2(1 , 1)n

SX t

n

2(1 , 1)

,n

SX t

n

La diferencias de Medias

21 y

22 Conocidos

--Nota: Si las poblaciones no son

normales pero n1 30 y n2 30

2 2

1 21 2 (1 / 2)

1 2

( ) *X X zn n

2 2

1 21 2 (1 / 2)

1 2

( ) *S S

X X zn n

2 2

1 21 2 (1 / 2)

1 2

( ) *X X zn n

2 2

1 21 2 (1 / 2)

1 2

( ) *S S

X X zn n

La diferencia de Medias

Asumiendo que: 22

21 y

desconocidos

1 2 0

1 2

1 1( ) * pX X t S

n n

2

11

21

222

211

nn

SnSnpS

1 2 0

1 2

1 1( ) * pX X t S

n n

1 2(1 /2,n + n -2)ot t

La diferencia de Medias

22

21 y desconocidos

2 2

1 21 2 (1 / 2, )

1 2

( ) *v

S SX X t

n n

12

2)2/22

(

11

2)1/21

(

2

1

21

1

21 )(

n

nS

n

nS

n

S

n

S

v

2 2

1 21 2 (1 / 2, )

1 2

( ) *v

S SX X t

n n

La varianza

2

2

2

1

1

1

n S

n

2

2

2

1

1

n S

n

La razón de varianzas.

2 1

2

1/ 2, 1, 12

2

n n

Sf

S 2 1

2

11 / 2, 1, 12

2

n n

Sf

S

La proporción

2

1

1

p p

np z

2

1

1

p p

np z

CLETO DE LA TORRE

155

La diferencia de proporciones

1 1 2 2

1 22

1 1

1 2 1( ) *

p p p p

n np p z

1 1 2 2

1 22

1 1

1 2 1( ) *

p p p p

n np p z


1.- En una muestra de 250 empresas se estimo el monto de recaudación en un día,

obteniéndose un monto medio de 5900 soles y una desviación típica de 94 soles.

Obtener un intervalo de confianza (al 95%) para el monto medio de recaudación

diaria.

Solución.

21

250, 5900, 94, 1.96n X z

Reemplazando en la relación

2 21 1

X z X zn n

Z(1 Z(1

1

/2 /2

94 945900 1.96 5900 1.96

250 250

5888.34 5911.65

2. Se realizo un estudio en 30 minimercados sobre el pago por derecho de

impuestos, obteniéndose un pago medio de 256 soles y un desvío de 32 soles.

Encontrar el intervalo de confianza para el 95%.

Solución.

2(1 , 1)

30, 256, 32, 2.045n

n X s t

ESTADISTICA

156

Reemplazando en la relación

2 2(1 , 1) (1 , 1)

,n n

S SX t X t

n n

32 32256 2.045 256 2.045

30 30

244.05 267.9

3. Un investigador entrevisto a 200 profesionales sobre el conocimiento que estas

tienen de la inversión en la bolsa de valores de Lima, de los cuales 140 afirman que

conocen adecuadamente. Construir un intervalo de confianza del 95% para la

proporción de profesionales que conocen aspectos de inversión de BVL.

Solución.

1400.7

200p ,

21

1.96z , n=200

2 2

1 1

1 1

p p p p

n np z p p z

0.7(1 0.7) 0.7(1 0.7)

200 2000.7 1.96 0.7 1.96p

4. SUNAT con el propósito de incrementar la recaudación fiscal, diseña dos sistemas

(A y B) de control para cumplimiento de entrega de facturas o boletas. El sistema

A, se utiliza para controlar a 250 empresas, el sistema B a 200 empresas. Después

de un periodo de vigilancia de los sistemas se observo que 75 empresas vigiladas

con el sistema A no entregan boletas o facturas A y 80 vigiladas con el sistema B

también incumplieron con la entrega de facturas. Utilizando un intervalo de

confianza del 95% ¿ Se puede aceptar que los dos sistemas presentan similar

eficiencia ?

Solución.

Sistema A

1

750.3

250p ,

1 250n

Sistema B

CLETO DE LA TORRE

157

2

800.4

200p ,

1 200n

21

1.96z

1 1 2 2 1 1 2 2

1 2 1 22 2

1 1 1 1

1 2 1 2 1 21 1( ) * ( ) ( ) *

p p p p p p p p

n n n np p z p p p p z

0.3 1 0.3 0.4 1 0.4 0.3 1 0.3 0.4 1 0.4

1 2250 200 250 200(0.3 0.4) 1.96* ( ) (0.3 0.4) 1.96*p p

1 2-0.18 ( ) -0.011p p

El intervalo contiene solo valores negativos, entonces.

1 2 1 2( ) 0p p p p

De la relación anterior se concluye que el sistema de control A presenta menor

nivel de eficiencia que el sistema B.

5. Se realizo un estudio sobre las utilidades que presenta una empresa en dos

provincias del Perú ,con tal fin se selecciona aleatoriamente un grupo de 50

cuentas de la provincia A y 40 c de cuentas de la provincia B, observándose que en

promedio en la ciudad A se genera una utilidad de 13 miles de soles y 15 miles

de soles en la ciudad B y las desviaciones estándar de la ciudad A y B

respectivamente son 3 y 4 miles de soles. Utilizando un intervalo de confianza del

95% para la diferencia de medias ¿Podemos concluir que las utilidades de la

empresa en la ciudad B es mayor que la de A?

Solución.

Ciudad A

1 1 113, 3, 50x n

Ciudad B

2 2 215, 4, 40x n

21

1.96z

2 2 2 2

1 2 1 21 2 (1 / 2) 1 2 1 2 (1 / 2)

1 2 1 2

( ) * ( ) *X X z X X zn n n n

ESTADISTICA

158

1 2

9 16 9 16(13 15) 1.96* (13 15) 1.96*

50 40 50 40

1 23.49 0.50

Como 1 2 0 , entonces

1 2.


1. De una muestra de 134 auditores empleados en grandes empresas de auditorias, 82

de ellos declararon que siempre que recibían un nuevo encargo de auditoria,

preguntaban al auditor anterior cuál había sido la razón del cambio de auditor.

Calcular un intervalo de confianza del 95% para la proporción poblacional.

2. En una muestra aleatoria de personas que visitan un famoso centro turístico, 84 de

250 hombres y 156 de 250 mujeres compraron recuerdos de su visita. Construya un

intervalo de confianza con un nivel del 95% para la diferencia entre las proporciones

reales de hombres y mujeres que compran recuerdos.

3. La Cámara de Comercio de una ciudad está interesada en estimar la cantidad media

de dinero que gasta una persona que asiste a convenciones por día. De las distintas

convenciones que se llevan a cabo en la ciudad, se seleccionaron 16 personas y se les

preguntó la cantidad que gastaban por día. Se obtuvo la siguiente información (en

dólares): 150, 175, 163, 148, 142, 189, 135, 174, 168, 152, 158, 184, 134, 146, 155, 163. Si

se supone que la cantidad de dinero gastado en un día es una v.a. normal, obtener

los intervalos de confianza a un nivel de 95 % para la cantidad media real.

4. La Cámara de Comercio de la ciudad A afirma que el ingreso medio de una familia

de esta ciudad es de 500$ más que el ingreso medio de una familia de la ciudad B. La

Cámara de Comercio de B discute esto, y encarga un estudio sobre el tema. Se toman

dos muestras, una en cada ciudad, y se obtienen los resultados siguientes :

Ciudad A: 2

A A514, x 23468, s 29043.221An

Ciudad B: 2

B A627, x 22919, s 41948.337Bn

Calcular el intervalo de confianza para la diferencia de los ingresos medios reales a

un nivel del 99%. Conclusiones. (Suponer que las poblaciones son independientes).

CLETO DE LA TORRE

159

5. Jesús es un corredor de la Bolsa de Valores y tiene curiosidad acerca de la cantidad

de tiempo que existe entre la colocación de una orden de venta y su ejecución. Jesús

hizo un muestreo de 45 órdenes y encontró que el tiempo medio para la ejecución

fue de 24,3 minutos, con una desviación estándar de 3,2 minutos. Ayude a Jesús en

la construcción de un intervalo de confianza de 95% para el tiempo medio para la

ejecución de una orden

6. Una muestra de 70 ejecutivos de una empresa fue investigada con respecto al pobre

desempeño que ésta tuvo en noviembre, 65% de los ejecutivos creía que la

disminución en las ventas se debió al alza inesperada de la temperatura, lo cual trajo

como consecuencia que los consumidores retardaran la adquisición de productos de

invierno. Encuentre el límite de confianza para esta porción, dado un nivel de

confianza igual a 0,95.

7. El dueño de una empresa investigó aleatoriamente 150 de las 3000 cuentas de la

compañía y determinó que 60% de éstas estaban en una posición excelente.

a.- Encuentre un intervalo de confianza de 95% para la proporción de cuentas que

están en posición excelente.

b.- Basándose en el inciso anterior, ¿Qué tipo de estimación de intervalo podrá usted

dar para dar el número absoluto de cuentas que cumplen con los requisitos de

excelencia, manteniendo el mismo nivel de confianza de 95%?

8. Un investigador de mercado de una compañía de productos electrónicos desea

estudiar los hábitos televisivos de los residentes de una pequeña ciudad. Selecciona

una muestra aleatoria de 40 participantes y les pide que mantengan un registro

detallado de lo que ven en televisión durante una semana. Los resultados son los

siguientes:

Tiempo frente al televisor: x = 15,3 h. s = 3,8 h.

27 participantes ven las noticias al menos 3 noches por semana

a) Establezca un intervalo de confianza de 95% para el promedio semanal de

tiempo que ven televisión en esta ciudad.

b) Establezca un intervalo de confianza de 95% para la proporción de participantes

que ven las noticias al menos 3 noches por semana.

ESTADISTICA

160

c) ¿Qué tamaño de muestra necesita si desea tener 95% de confianza de que su

resultado es correcto dentro de ± 2 horas y supone que la desviación estándar

de la población es igual a 5 horas?

d) ¿Qué tamaño de muestra necesita si desea una confianza de 95% de estar dentro

de ± 0,035 de la proporción real de los que ven las noticias al menos 3 noches

por semana si no disponía de estimaciones anteriores?

e) Con base en (c) y (d), ¿qué tamaño de muestra debe seleccionar si sólo realiza

un estudio?

9. Se toma una muestra de 12 empleados de una planta productora, el número de horas

extra que estos empleados hicieron durante el último mes fueron: 22 ;16 ; 28 ; 12 ; 18

; 36 ; 23 ; 11 ; 41 ; 29 ; 26 ; 31

a) Calcular un estimador puntual para la proporción de empleados que trabajan

más de 20 horas

b) Calcular un estimador puntual para el número medio de horas extras que

trabajan los empleados.

10. Las negociaciones salariales entre su empresa y el sindicato que representa a sus

trabajadores están al borde de la ruptura. Hay un desacuerdo considerable sobre el

nivel salarial medio de los trabajadores de la sucursal A y B. Los salarios fueron

establecidos por el antiguo convenio colectivo firmado hace tres años y se basa en la

estricta antigüedad. Como los salarios están muy controlados por el convenio

colectivo, se supone que la variación salarial es la misma en las dos sucursales y que

los salarios siguen una distribución normal. Pero se piensa que hay diferencia entre

los niveles salariales medios a causa de las diferentes estructuras de antigüedad

entre las dos sucursales. El negociador del convenio colectivo por parte de la

dirección le pide que elabore un intervalo de confianza del 98% para la diferencia

entre los niveles salariales medios. Si existe una diferencia entre las medias, habrá

que hacer ajustes para elevar los salarios más bajos hasta el nivel de los más altos.

Con los datos que se dan a continuación,¿ qué ajustes habrá que hacer, en caso de ser

necesario?.

Sucursal A 2

A A23, x =17.53 $ por hora, s =93.10 An

Sucursal B 2

A A19, x =15.50 $ por hora, s =87.10 An

CLETO DE LA TORRE

161

ESTADISTICA

162

8.4 PRUEBAS DE HIPOTESIS

En muchas situaciones el investigador tiene alguna idea o conjetura sobre el

comportamiento de una o más variables en la población.

El diseño de la investigación debe permitir probar la veracidad de sus ideas sobre

la población en estudio, en base a los datos de la muestra.

La idea o conjetura es una hipótesis y el procedimiento de toma de decisión sobre

la hipótesis se conoce como prueba de hipótesis.

Una hipótesis estadística es una conjetura sobre el comportamiento probabilística

de una población.

Si la hipótesis estadística identifica por completo la distribución, recibe el nombre

de “hipótesis simple”, y si no la especifica recibe el nombre de “hipótesis

compuesta”. El contraste de hipótesis tiene por finalidad decidir si una conjetura

puede considerarse cierta, o debe rechazarse, basándonos en la información

suministrada por una muestra.

Hipótesis nula (denotada como H0). Esta hipótesis nula es la que se somete a

comprobación, y es la que se acepta o rechaza, como la conclusión final de un

contraste.

Hipótesis alternativa (denotada como Ha). Se denomina hipótesis alternativa

aquella hipótesis contra la cual queremos contrastar la hipótesis nula. Esta

hipótesis puede ser simple o compuesta. Podemos cometer dos tipos de error:

rechazar la hipótesis nula siendo ésta cierta (error de tipo I) y aceptar la hipótesis

nula cuando esta es falsa (error de tipo II).

Aceptar Ho Rechazar Ho

Ho verdadera Decisión correcta Error Tipo I

Ho falsa Error Tipo II Decisión correcta

Denominamos nivel de significación ( ) de un contraste a la máxima

probabilidad de cometer un error del tipo I que estamos dispuestos a sumir.

CLETO DE LA TORRE

163

La decisión de rechazar, o no, la hipótesis nula la tomamos a partir de la

información proporcionada por la muestra (estadístico de prueba). Realizamos una

partición del espacio muestral en dos regiones, la región crítica en la que se rechaza

la hipótesis nula (tiene probabilidad si 0H es cierta) y la región de aceptación, en la

que se acepta la hipótesis nula.

A continuación se dan una serie de regiones de aceptación para ciertos contrastes

de hipótesis con nivel de significación .

Antes de definir los pasos de una prueba de hipótesis se define algunos conceptos

básicos.

1. Nivel de significación del contraste es la probabilidad de cometer un error del tipo I,

es decir, de rechazar la hipótesis nula siendo cierta, y se acostumbra a denotar por

2. El contraste de hipótesis, es pues, un mecanismo mediante el cual se rechaza la

hipótesis nula cuando existan diferencias significativas entre los valores

muestrales y los valores teóricos, y se acepte en caso contrario. Estas variables

se medirán mediante una variable denominada estadígrafo de contraste, que

sigue una distribución determinada conocida, y que para cada muestra tomará

un valor particular.

3. La región crítica es el conjunto de valores del estadístico de contraste que nos induce a

rechazar la hipótesis nula

PASOS DE UNA PRUEBA DE HIPOTESIS.

Los pasos que son convenientes seguir para realizar el contraste de hipótesis son:

1. Formulación de hipótesis.

0 0:H Vs

0:aH ó 0:aH ó

0:aH

2. Elegir el nivel de significación, .

3. Estadístico de prueba.

4. Determinar la región crítica. La forma de la región crítica depende de la

hipótesis alterna.

Para 0:aH

ESTADISTICA

164

Z(1

Z(1

R.A. H0R.R. H0

R.R. H0

/2 /2

1

Para 0:aH

Z(1

R.A. H0 R.R. H0

1

Para 0:aH

Z(1

R.A. H0R.R. H0

1

La región de rechazo de la hipótesis nula es la sombreada. Se rechaza H0 cuando el

estadístico de prueba toma un valor comprendido en la zona sombreada y se

acepta Ho cuando el valor del estadístico de prueba cae en la región de aceptación,

región no sombreada.

CLETO DE LA TORRE

165

5. Conclusión. Determinar las conclusiones estadísticas del contraste (aceptar o

rechazar Ho).

A continuación se presentan las pruebas de hipótesis en forma de resumen.

PRUEBAS DE HIPOTESIS EN POBLACIONES NORMALES.

Pruebas de Hipótesis.

Estadística de

Prueba

Criterio de rechazo de H0

Hipótesis Nula Hipótesis

Alternativa

Prueba de Medias

H0: = 0 vs:

Si 2 conocido

-Si la población no es

normal pero n 30

Ha: 0

Ha: > 0

Ha: < 0

0

/

X

c nZ

0

/

X

c s nZ

21cZ z

1cZ z

1cZ z

Prueba de Medias

H0: = 0 vs

Si se asume que :

2 es desconocido

Ha: 0

Ha: > 0

Ha: < 0

0

/

X

c S nT

21

1cT t n

1 1cT t n

1 1cT t n

Prueba de

diferencias de

Medias

H0: 1 = 2 vs:

Asumiendo

21 y 2

2 Conocidos

--Si las poblaciones no

son normales pero

n1 30 y n2 30

Ha: 1 2

Ha: 1 > 2

Ha: 1 < 2

1 2

2 21 2

1 2n n

X X

cZ

1 2

2 21 2

1 2

s s

n n

X X

cZ

21cZ z

1cZ z

1cZ z

Prueba de diferencia

de Medias

H0: 1 = 2 vs

Ha: 1 2

Ha: 1 > 2

1 2

1 1

1 2p n n

X X

c ST

21 21

2cT t n n

1 1 2 2cT t n n

ESTADISTICA

166

Asumiendo que:

22

21 y

desconocidos

Ha: 1 < 2

2

11

21

222

211

nn

SnSnpS

1 1 2 2cT t n n


de Medias

H0: 1 = 2 vs

Asumiendo que:

22

21 y

desconocidos

Ha: 1 2

Ha: 1 > 2

Ha: 1 < 2

1 2

2 21 2

1 2

S S

n n

X X

cT

12

2)2/22

(

11

2)1/21

(

2

1

21

1

21 )(

n

nS

n

nS

n

S

n

S

v

21cT t v

1cT t v

1cT t v

Prueba de varianzas

H0: 2 = 20 vs

Ha: 20

2

Ha: 20

2

Ha: 20

2

2

20

12 n S

c

2 2

2 2 2 2

11 1c cn ó n

2

1 1c n

2 1c n

Prueba de razón de

varianzas.

H0: 22

21 vs

Ha: 22

21

Ha: 22

21

Ha: 22

21

2max

2min

S

c SF

2 2max min 1

1, 1c cF F n n ó F F

1 1 21, 1cF F n n

1 21, 1cF F n n

Prueba de

proporciones

H0: p =p0 Vs

Ha: p p0

Ha: p > p0

Ha: p < p0

0

(1 ) /

p p

c p p nZ

21cZ z

1cZ z

1cZ z


de proporciones

H0: p1 =p2 Vs

Ha: p1 p2

Ha: p1 > p2

Ha: p1 < p2

1 2

1 2

(1 ) (1 )c c c c

p p

c p p p p

n n

Z

1 1 2 2

1 2

c

n p n pp

n n

21cZ z

1cZ z

1cZ z

CLETO DE LA TORRE

167


1.- El pago en promedio por concepto de impuestos de los establecimientos comerciales

en una ciudad es de 355 soles. Se Sospecha que estos establecimientos evaden el pago

de impuestos, pagando menos del debido. Para contrastar esta hipótesis se analiza

las ventas de 60 establecimientos comerciales. Resulto una media muestral de 580

soles por concepto de impuestos. Proporcionan estos datos suficiente evidencia

estadística, al nivel de 95% de confianza, a favor de la hipótesis de que el pago de

impuestos es mayor al contribuido actualmente? . Use 180

Solución

Formulación de hipótesis.

H0: = 355

Ha: > 355

Nivel de significancia, 5%

Estadística de prueba.

0

/

X

c nZ

180 , 1 1.645z ,

160, 580n x

580 355

180/ 609.68cZ

Región critica

Z =1.6450Z =9.68

c

RegiónAceptación

RegiónCrítica

=5%

Conclusión.

Como c oZ Z

Se rechaza la hipótesis nula, por lo tanto se debe pagar más de lo que actualmente

se contribuye.

2- Se aplico una estrategia diferenciadora para colocar un producto en el mercado.

ESTADISTICA

168

En el cuadro siguiente se muestra las utilidades antes y después de aplicar la

estrategia en miles de dólares.

Antes 25 25 27 44 30 67 53 53 52

Después 27 29 37 56 46 82 57 80 61

Diferencia 2 4 10 12 16 15 4 27 9

Hay suficiente evidencia estadística (al nivel de significación 0,05) a favor de que la

estrategia presenta un efecto positivo?.

Solución


H0: d = 0

Ha: d 0



0

/

X

c S nT

7.76s , (1 /2, 1) 2.262nt

19, 11n x

11 04.25

7.76 / 9cT

Región critica

t =4.25ct =2.260t =–2.260

R.A. H0R.R. H

0R.R. H

0

Conclusión.

Como 2.262ct se rechaza la hipótesis nula.

CLETO DE LA TORRE

169

3.- Se desea comparar el nivel de posicionamiento de dos empresas A y B en una

ciudad, para tal efecto se recopilo información de las recaudaciones diarias de las

dos empresas. Los resultados del estudio se muestran a continuación.

Empresa A 2

1 1 113 , 138.6 , 29.16n x S

Empresa B 2

2 2 216 , 125.8 , 26.7n x S

En base a la información, cual es su conclusión al 95% de confianza.

Solución.


H0: 1 = 2

Ha: 1 2



Supongamos que las varianzas poblacionales son iguales, entonces el estadístico de

prueba es:

1 2

1 1

1 2p n n

X X

c ST t (n1 + n2 -2)

De la información se tiene:

Empresa A 2

1 1 113 , 138.6 , 29.16n x S

Empresa B 2

2 2 216 , 125.8 , 26.7n x S

2 21 1 2 2

1 2

1 1 13 1 *29.16 16 1 *26.7

2 13 16 25.27

n S n S

p n nS

1 2

1 1

1 21 1

13 16

138.6 125.86.50

5.27*p n n

X X

c ST

Región critica

20 1 2 0.975 0.9751

2 13 16 2 27 2.052T t n n t t

ESTADISTICA

170

t =2.0520

t =6.50ct =–2.0520

R.A. H0R.R. H

0R.R. H

0

Conclusión.

Como 0cT T , entonces se rechaza H0.

4- El Ministerio de Economía viene desarrollando programas destinados a la población,

con la finalidad de que exijan la entrega de Boletas o facturas por todo servicio en

dos regiones (A y B) del país. Se selecciona a pobladores de ambas regiones que no

presentaban esta cultura y se observo que de 600 residentes de la Región A, 20% en

la actualidad exige boleta o factura, en cambio de 600 residentes de la Región B , 15

% en la actualidad exige la entrega de boletas. ¿Es posible concluir con 95% de

confianza que el programa a tenido similar resultado en las provincias A y B ?

Solución.


H0: p1 =p2

Ha: p1 p2



1 2

1 2

(1 ) (1 )c c c c

p p

c p p p p

n n

Z

Provincia A.

1 0.2p , 1 600n

Provincia B.

2 0.15p , 2 600n

1 1 2 2

1 2

600*0.2 600*0.150.175

600 600c

n p n pp

n n

CLETO DE LA TORRE

171

1 2

1 2

0.20 0.15

(1 ) (1 ) 0.175(1 0.175) 0.175(1 0.175)

600 600

2.279c c c c

p p

c p p p p

n n

Z

Región critica

Z =1.960Z =2.279c

RegiónAceptación

RegiónCrítica

=5%

Conclusión.

Como c oZ Z , se rechaza la hipótesis nula, por tanto p1 p2


1) Un especialista trabaja como corredor para una empresa. Sus registros muestran las

tasas de rendimiento ( en porcentajes) para 10 meses en dos tipos de acciones

Acción 1 5.6 7.2 6.3 6.3 7.1 8.2 7.9 5.3 6.2 6.2

Acción 2 7.5 7.3 6.2 8.3 8.2 8.0 8.1 7.3 5.9 5.3

Que tipo de Acción debería recomendar el especialista a sus clientes que prefieren:

a) Menos riesgo de inversión

b) Mayor utilidad.

Justifique adecuadamente sus respuestas.

2) Un grupo de economistas esta realizando un estudio sobre el comercio internacional

del Perú: consideran que en el actual contexto de continuas y profundas

transformaciones, el comercio entre países debería asumir un papel activo con el fin

de ayudar al crecimiento de los países que lo llevan a cabo.

Se esta enfocando en un primer momento el comercio por el lado de las

exportaciones ya que determinan la cantidad de dólares que ingresan al país por vía

ESTADISTICA

172

intercambio comercial y porque la estructura de las mismas mostrara un mayor o

menor ingreso en divisas.

A continuación se presenta la información con la que cuenta el grupo de

economistas sobre las exportaciones (en millones de dólares) para el Perú a lo largo

de 31 años (desde 1960 -1990).

Tradicionales 1 11478 818X y s y No tradicionales

2 2340 357X y s

En base a la información que se tiene se puede concluir que:

a) Las exportaciones tradicionales en promedio anual es de 1500 millones de dólares.

b) La diferencia entre las exportaciones tradicionales en promedio y las no

tradicionales es mayor que 1000 millones de dólares.

Justifique adecuadamente sus respuestas. Usar 1%

3) Un auditor quiere estimar el monto promedio de las cuentas por cobrar de la

compañía A. Una muestra de 10 cuentas por cobrar seleccionadas al azar de un total

de 400 cuentas que tiene esta compañía revela los siguientes datos.

500, 600, 750, 480, 900, 790, 860, 900, 500, 760.

Estime la media de toda las cuentas cobrar utilizando un intervalo de confianza del

98%.Interprete el resultado brevemente.

4) La reacción de un pequeño inversionistas con respecto a un cambio de política que

modifique las reglas de juego de la economía es : retirar su inversión (A) o

continuar con la inversión inicial(B). Un investigador quiere estimar la proporción

de inversionistas que reaccionan de manera A.

a) ¿ Que tan grande debería ser la muestra si se desea que el estimado del

porcentaje de inversionistas de la población que retiran su inversión tenga error de

estimación menor que 0.04 con un nivel de confianza del 95%, además de una

prueba piloto se obtuvo que 90% retiraría su inversión

b) El investigador realiza la encuesta con una m.a de pequeños inversionistas de

tamaño igual al que obtuvo en a) y obtiene que 300 inversionistas reacción de

manera A. Desarrolla el intervalo de confianza del 97% para el porcentaje de

inversionistas que retirarían su inversión.

CLETO DE LA TORRE

173

5) El gerente de una cadena muy conocida de tiendas sospecha que su principal

competidor esta intentando vender los mismos productos a precios más bajos.

Anteriormente las dos tiendas habían mantenido un balance en los precios de forma

tal que la mitad de los artículos de una eran ligeramente más caros que los de la otra

y viceversa, para investigar esta posibilidad, envió un comprador a la otra tienda

para ver los precios de 50 artículos seleccionados al azar, observándose:

1,1,1,0,1,0,1,1,1,0,1,1,0,0,0,1,0,1,0,1,1,1,0,0,1,1,1,0,0,1,0,0,0,1,1,0,1,0,1,0,1,0,0,0,1,1,1,0,1,1.

Donde 1 indica precios más bajos y 0 indica que los precios se mantienen igual que

antes. ¿Se confirma la sospecha del gerente?

1. Cuando Eastern Airlines se acogió a la protección de las leyes de bancarrota en 1989

en virtud del capítulo 11, se hizo evidente que muchas de las mayores empresas de la

nación estaban en dificultades financieras. Durante una sesión de un subcomité del

Senado, el senador Kennedy estimó que las empresas que buscan liberarse de las

presiones de los acreedores debían, de media, más de 2200 millones de dólares. Una

comprobación de 17 juicios recientes en virtud del capítulo 11 reveló que las

empresas implicadas debían 2430 millones de dólares, con una desviación típica de

900 millones de dólares. ¿Está respaldada la afirmación de Kennedy al nivel del

10%?.

2. De una muestra de 361 propietarios de pequeños comercios que quebraron en un

período determinado, 105 no tuvieron asesoramiento profesional antes de abrir el

negocio. Por experiencia se sabe que lo que ha venido ocurriendo es que a lo sumo el

25% de los comercios que no reciben asesoramiento quiebran. Analice si estos

resultados prueban que ha habido un aumento en el porcentaje de quiebras. Utilice

un nivel del 90%.

3. Un investigador de marketing quiere determinar si existe alguna diferencia en la

proporción de hombres que responden favorablemente a un determinado anuncio y

la proporción de mujeres que lo hacen. De 875 hombres, 412 informan que tienen una

impresión positiva; de las 910 mujeres encuestadas, sólo 309 están a favor. Contrastar

las hipótesis a nivel de significancia del 5%

4. Una corporación bancaria quiere comparar el nivel medio de las cuentas de ahorro

abiertas en bancos comerciales del Lima con las de Cusco. Muestras de 230 agencias

ESTADISTICA

174

bancarias del Lima y 302 en Cusco, tienen medias de 1512 dólares y 1317 dólares,

respectivamente. Se sabe que la desviación típica en las cuentas para cada estado son

517 dólares para el Lima y 485 dólares para Cusco. Contrastar la hipótesis de que no

hay diferencia de ahorros medios al nivel del 5%.

5. Muchos estudios económicos se ocupan de sectores en los cuales una gran parte del

dominio del mercado se concentra en manos de unas pocas empresas. Se teme que

las empresas poderosas en sectores de tan alta concentración dominen el mercado

con fines egoístas. Se emparejaron las empresas de nueve sectores concentrados con

las de un número igual de sectores en los cuales el poder económico estaba más

disperso. Se hicieron coincidir las empresas de cada grupo en cuanto a competencia

extranjera, estructuras de costo y todos los demás factores que pueden afectar a los

precios industriales. A continuación se indican los incrementos medios del precio en

porcentajes de cada sector. Al nivel del 5%, ¿parece que los sectores concentrados

presentan una presión inflacionaria más pronunciada que los sectores menos

concentrados?

Pareados de sectores Sectores concentrados Sectores menos concentrados

1 3.7 3.2

2 4.1 3.7

3 2.1 2.6

4 -0.9 0.1

5 4.6 4.1

6 5.2 4.8

7 6.7 5.2

8 3.8 3.9

9 4.9 4.6

CLETO DE LA TORRE

175

CAPITULO IX

PRUEBA DE CHI-CUADRADO

Las pruebas de hipótesis desarrolladas anteriormente, están basadas en el supuesto de

que la muestra pertenezca a una población con distribución conocida.

Muchas de las investigaciones científicas

Aquí abordaremos dos problemas muy interesantes dentro de lo que se conoce con el

nombre de estadística no paramétrica. La prueba de homogeneidad y la prueba de

independencia.

La justificación de estos problemas es comparar las frecuencias esperadas y las

observadas.

9.1 TABLA DE CONTINGENCIA

Es relativamente frecuente encontrarse con información referida a la observación

de dos características de una población, en las que se establecen modalidades o

categorías, mediante las cuales se clasifican los individuos o elementos que

constituyen una muestra de la misma. Este tipo de distribución bidimensional de

frecuencias suele presentarse en forma de tabla de doble entrada, también llamada

tabla de contingencia.

La información obtenida del estudio generalmente se presenta en una tabla de

contingencias, en esta se tiene un conjunto de n elementos clasificados de acuerdo

a dos criterios, X e Y, cada uno de los cuales tiene una serie de categorías

mutuamente excluyentes:

ESTADISTICA

176

1Y 2Y ...... jY

cY Total

1X 11o

12o 1 jo

1co 1.n

2X 21o

22o 2 jo

2co 2.n

... ... ... ... ... ...

iX 1io

2io ijo

ico .in

... ... ... ... ... ...

rX 1ro

2ro rjo

rco .cn

Total .1n

.2n . jn

.cn n

En esta tabla, ijo representa la frecuencia observada, es decir, el número de

individuos que pertenecen simultáneamente a las categorías iX e jY .

.

1

r

j ij

i

o n y .

1

c

i ij

j

o n

En esta sección se verán las pruebas de homogeneidad y de independencia. Si

bien ambas pruebas presentan el mismo procedimiento de cálculo, las

hipótesis a probar son diferentes y por lo tanto las conclusiones obtenidas

también.

9.2 PRUEBA DE HOMOGENEIDAD.

En ocasiones ocurre que tenemos a varias poblaciones clasificadas de acuerdo con

las categorías definidas para una determinada variable. La pregunta que se

sugiere inmediatamente es si la proporción de individuos pertenecientes a cada

una de las clases es la misma en todas las poblaciones. Si, con la información

suministrada por las muestras obtenidas, se puede aceptar que esto es así, diremos

que las poblaciones son homogéneas con respecto a la variable de clasificación

utilizada.

Existen r poblaciones y una muestra aleatoria es extraída desde cada población.

Sea ni. el tamaño de la muestra extraída de la i-ésima población. Cada

observación de cada muestra puede ser clasificada en una de c categorías

CLETO DE LA TORRE

177

diferentes. Los datos son arreglados en la siguiente tabla de contingencia r c:

Categoría

1

Categoría

2

... Categoría

c

Total

Población 1 O11 O12 .. .

.

O1c n1•.

Población 2 O21 O22 …

..

. .

O2c n2•

Población r Or2 Or2 .... orc nr.

nr- Total n.1 n.2 … n.c n..

En la tabla, oij es el número de observaciones de la muestra i clasificadas en la

categoría j; n.j es el número total de observaciones en la categoría j extraídas

desde las r poblaciones y n.. es el total de observaciones extraídas desde las r

poblaciones.

Hipótesis:

Sea ij la probabilidad de que una observación seleccionada de la población i

sea clasificada en la categoría j. Entonces las hipótesis son:

Ho: 1j =... = rj para todo j = 1, 2,…c

H1: Al menos una igualdad no se cumple.

Las hipótesis pueden expresarse equivalentemente de la siguiente manera:

H0: La variable aleatoria tiene la misma distribución de probabilidades en las r

poblaciones.

H1: La variable aleatoria tiene una distribución de probabilidades diferente en

al menos una de las poblaciones.

La estadística de prueba esta dado por:

)1)(1()(

2

11

2 crxe

eox

ij

ijijc

j

r

j

c donde

..

..

n

nxne

j

iij

Regla de decisión:

La hipótesis nula se rechaza con un nivel de significación a si el 2

cx resulta mayor

que el valor de tabla 2

1 ,( 1)( 1)r cx

ESTADISTICA

178

9.3 PRUEBA DE INDEPENDENCIA

Esta prueba permite analizar si dos variables aleatorias son o no independientes.

Dado una muestra aleatoria de tamaño n.. es extraída, y cada observación de

la muestra es clasificada de acuerdo a dos criterios (variables X y Y).

Usando el primer criterio cada observación es clasificada en una de r filas y

usando el segundo criterio en una de c columnas. Los datos son arreglados en la

siguiente tabla de contingencia rxc:

Columna

1

Columna

2

... Columna c Total

Fila 1 011 012 . . . Oic n i .

Fila 2 021 022 ... 02c n2.

Fila r Or2 Or2 . . . 0rc nro

Total

n .i n .2 . . . n . , n . .

En la tabla, ojj es el número de observaciones clasificadas en la fila i

columna j, ni. es el número total de observaciones en la fila i y n.j es el

número total de observaciones en la columna j.

Hipótesis:

Sea ij

la probabilidad de que una observación sea clasificada en la fila i

columna j, .i la probabilidad de que una observación sea clasificada en la

fila i y . j

la probabilidad de que una observación sea clasificada en la columna

j. Entonces las hipótesis son:

Ho: . .ij i j

para todo i = 1, ... r, j = 1, ... c.

H1: Al menos una igualdad no se cumple.

Las hipótesis pueden expresarse, en forma equivalente de la siguiente manera:

Ho: Las variables X y Y son independientes.

HI: Las variables X y Y no son independientes.

Estadístico de prueba:

CLETO DE LA TORRE

179

)1)(1()(

2

11

2 crxe

eox

ij

ijijc

j

r

j

c donde

..

..

n

nxne

j

iij

Regla de decisión:

Se adopta la siguiente regla de decisión:

Si 2 2

( 1)( 1)c r c entonces se acepta la hipotes

0H

Si 2 2

( 1)( 1)c r c entonces se rechaza la hipotes

0H

Como puede observarse el procedimiento es muy similar al de la prueba de

homogeneidad, y a veces suelen confundirse.


8.2.1 En una investigación realizada sobre las preferencias de 3 marcas, se obtuvo los

siguientes resultados.

Preferencias

Marcas

A B C Total

Si 70 100 150 320

No 130 100 50 280

Total 200 200 200 600

¿Podemos concluir con 95% de confianza que las preferencias de las marcas es

similar?

Solución.

H0: Las preferencias de las tres marcas son similares.

H1: Las preferencias de los tres marcas no son similares

11

320*200106.67

600e , 12

320*200106.67

600e , 13

320*200106.67

600e

21

280*20093.33

600e , 22

280*20093.33

600e , 23

280*20093.33

600e

2 2 2 2 2 2

270 106.67 100 106.67 150 106.67 130 93.33 100 93.33 50 93.33

106.67 106.67 106.67 93.33 93.33 93.33c

ESTADISTICA

180

2 65.625c

De la tabla de chi-cuadrado , 2

0 5.991

1

R.A. H0 R.R. H0

2=5.99

o

2=65.625

o

Como 2 2

0c, se rechaza la hipótesis nula

Las preferencias de los tres marcas no son similares.

2.- En un estudio sobre el uso de tres técnicas de valorización de empresas de

distinto tamaño, se obtuvo los siguientes resultados.

Técnicas de

valorización

Tamaño de la empresa

Alto Medio Bajo Total

Actualmente 51 22 43 116

En el pasado 92 21 28 141

Nunca 68 9 22 99

Total 211 52 93 356

¿El uso de técnicas de valorización es independiente del tamaño de la empresa?

Solución.

Ho: El uso de técnicas de valorización es independiente del tamaño de

empresa.

HI: El uso de técnicas de valorización es dependiente del tamaño de la

empresa..

Las frecuencias observadas y esperadas (frecuencias esperadas entre

paréntesis) se presentan en la siguiente tabla:

CLETO DE LA TORRE

181

Uso de software

Tamaño de la empresa

Alto Medio Bajo Total

Actualmente 51 (68.75) 22(16.94) 43(30.30) 116

En el pasado 92(83.57) 21(20.60) 28(36.83) 141

Nunca 68(58.68) 9(14.46) 22(25.86) 99

Total 211 52 93 356

Con estos datos el estadístico de prueba es:

23 3

2

1 1

18.510ij ij

c

i j ij

o ex

e

Los grados de libertad para el estadístico de prueba son (3-1)(3-1) = 4. El

valor de tabla para un nivel de significación del 5% es 2

(0.95,4) 9.488x . Como el

valor calculado es mayor que el valor de tabla se rechaza Ho y se concluye que

existe suficiente evidencia estadística para aceptar que el uso de técnicas

de valorización depende del tamaño de la empresa .

3.- Un asesor financiero quiere conocer las diferencias en la estructura de capital de

varios tamaños de empresa en cierta industria. Hace una encuesta en un grupo de

firmas que tienen distintas cantidades de activos y las dividen tres grupos.

Clasifica cada una según que su deuda sea mayor que el capital contable de las

acciones o que su deuda total sea menor. A continuación se dan los resultados de

la encuesta:

Deuda con respecto

al capital social

Tamaño de activos de la firma( en miles) Total

< $ 500 $500-2000 >$2000

Menor 12 13 4 29

Mayor 5 15 13 33

Total 17 28 17 62

ESTADISTICA

182

¿Tienen idéntica estructura de capital los 3 tamaños de empresa?

Solución

Ho: La Estructura de capital es similar en los distintos tipos de empresa.

(Independientes)

HI: La Estructura de capital es similar en los distintos tipos de empresa

(Dependientes)

12 13 4 29

70.6% 46.4% 23.5% 46.8%

5 15 13 33

29.4% 53.6% 76.5% 53.2%

17 28 17 62

100.0% 100.0% 100.0% 100.0%

Frecuencia

Porcentaje

Frecuencia

Porcentaje

Frecuencia

Porcentaje

Estructura

de capital

Menor

Mayor

Total

< $ 500 $500-2000 >$2000

Tamaño de activos de la firma

Total

Chi-cuadrado=7.563 , P-valor=0.023

EL p-valor, juega un papel muy importante en la decisión de las hipótesis. Si p-

valor < 0.05 se acepta la hipótesis alterna con un nivel de confianza del 95%, en

este caso influye el factor; en el caso que p > 0.05 la decisión es aceptar la hipótesis

nula, no influye el factor.

En nuestro ejemplo p-valor<0.05, se rechaza la hipótesis nula. La estructura de

capital es similar en los distintos tipos de empresa.


1) Durante la ultima ronda negociaciones del GATT (acuerdo general de tarifas y

comercio), un grupo de investigadores de Latinoamérica evaluó en base a encuestas

la actitud de los representantes de los países desarrollados respecto al

proteccionismo de sus mercados individuales, específicamente su posición frente a

la importación de ciertos bienes manufacturados de piases en vías de desarrollo

como los Latinoamericanos. Se interrogo a representantes de EEUU, Japón y de la

Comunidad Económica Europea (CEE).

CLETO DE LA TORRE

183

Numero de representantes por paises.

EEUU Japon CEE

A favor de la importancia 35 76 37

En contra de la

importancia

65 74 43

En base a los datos ¿puede inferir los investigadores que el GATT ha cumplido su

objetivo de liberalizar el comercio y homogeneizar las tendencias comerciales de sus

países miembros mas importantes. Use 1% . Redacte un informe técnico sobre

este estudio.

2) Un investigador quiere averiguar si hay diferencias significativas en las tasas de

rendimiento de valores, bonos y fondos mutuos. Con tal motivo se ha seleccionado

muestras aleatorias de inversión y ha registrado las tasas de rendimiento en cuatro

entidades financieras.

Entidades Financieras

A B C D

Valores 4.5 6.0 2.0 4.1

Bonos 4.0 3.1 2.2 5.3

Fondos

mutuos

3.5 3.1 2.9 6

¿ Influye en la tasa de rendimiento el tipo de inversión y la entidad financiera?.Use

5% . Redacte Adecuadamente sus conclusiones.

3) El departamento de tarjetas de crédito bancarias del California Bank sabe que por

su larga experiencia, que 5% de los tarjeta habientes han tenido algunos estudios de

bachillerato, 15% han terminado dicho nivel escolar, 25% han tenido ciertos estudios

universitarios, y 55% han concluido la instrucción en universidad. De los 500 tarjeta

habientes que fueron reportados por falta de pago en este mes, 50 tenían estudios de

bachillerato, 100 terminaron tal nivel escolar, 190 tenían cierta preparación

universitaria y 160 concluyeron la instrucción en la universidad. ¿Se puede concluir

ESTADISTICA

184

que la distribución de tarjeta habientes que no han pagado sus cuentas es diferente

de la de los demás?. Aplique el nivel de significancia de 0,01

4) Doscientos hombres de diversos niveles de gerenciales, seleccionados al azar,

fueron entrevistados con respecto a su interés o preocupación acerca de asuntos

ambientales. La respuesta de cada persona se registró en una de tres categorías:

interés nulo, algo de interés y gran preocupación. Los resultados fueron:

Nivel de gerencial Preocupación

Sin interés Algo de interés Gran preocupación

Gerencia alta 15 13 12

Gerencia media 20 19 21

Supervisor 7 7 6

Jefe de grupo 28 21 31

Utilice el nivel de significancia de 0,01 para determinar si existe relación entre el nivel

directivo o gerencial y el interés en asuntos ambientales.

5) Un administrador de marca está preocupado porque su producto puede estar mal

distribuido a lo largo de todo el país. En una encuesta en la que el país fue dividido

en 4 regiones geográficas, se investigó una muestra aleatoria de 100 consumidores de

cada región, obteniéndose los siguientes resultados:

Adquisiciones Región

NE NO SE SO

Adquirieron la

marca

40 55 45 50

No la adquirieron 60 45 55 50

Si el nivel de significancia es de 0,05. ¿Cuál es su conclusión?

6) Se encuestó a varios directores generales de empresas y se les pidió que valoraran

la dependencia entre el rendimiento financiero de su empresa y la estrategia de la

misma, siendo los resultados los siguientes:

CLETO DE LA TORRE

185

Estrategia Rendimiento financiero

Bajo Medio Alto

Baja 15 25 18

Media 30 52 23

Alta 23 49 61

¿A qué conclusión llega usted? Utilice un nivel de confianza del 90% para su prueba.

7) Se clasificó una muestra de agencias inmobiliarias según su número de empleados

y por si tenían o no un plan de marketing, para estudiar si había o no dependencia

entre ambas variables

Número de empleados Con plan de Marketing Sin plan de Marketing

Menos de 100 13 10

Entre 100 y 500 18 12

Más de 500 32 6

Utilizando un nivel de significación del 1% realice la prueba correspondiente.

8) El incluir en las etiquetas de los productos alimenticios el precio unitario del

producto tiene por objeto el facilitar a los compradores la elección. Sin embargo, un

experto en estudios sobre el comportamiento de los consumidores , han encontrado

que aquellos de nivel soioeconómico bajo no están usando la ventaja que representa

el tener exhibido en la etiqueta el precio unitario.

En un estudio posterior, y a manera de corroboración de los resultados reportados,

un economista observó el proceso de selección de 1000 compradores en tres

supermercados. Estos se encontraban ubicados en tres áreas distintas de la ciudad, y

correspondían a clases sociales de nivel bajo, medio y alto respectivamente. Se habían

puesto paquetes de productos de la misma marca pero conprecios unitarios distintos.

Los datos sobre los 1000 compradores, clasificados de acuerdo a su clase

socioeconómica y al hecho de haber comprado con base en los precios unitarios o no,

fueron:

BAJA MEDIA ALTA

Usó pp.uu. 249 494 201

ESTADISTICA

186

No usó pp.uu. 26 26 4

¿Muestran los datos al nivel 0.05 evedencia que respalde los reportes del experto ?

9) Con el objeto de asesorar correctamente a sus clientes, un banco pidió la opinión

de 50 analistas en inversión de cada una de tres firmas consultoras distintas, todas

miembros de la bolsa . A cada uno le fué preguntado específicamente cual de los tres

tipos de inversión, bonos, acciones o bonos convertibles recomendaría. Las

respuestas se presentan en la siguiente tabla:

FIRMAS CONSULTORAS

A B C

Acciones 13 16 7

Bonos 31 24 35

Bonos convertibles 6 10 18

¿Proporcionan éstos datos evidencia al nivel 0.10 de que las tres firmas consultoras

opinan distinto?

10) En un día dado, el gerente de un supermercado observó el número de clientes

que escogieron cada una de las 6 cajas de pago distintas de la salida. Los resultados

fueron:

Caja número 1 2 3 4 5 6

Frecuencia 84 110 146 152 61 47

¿Presentan los datos suficiente evidencia de que hay cajas preferidas al nivel 0.05?

11) Se ha realizado un estudio sobre la utilización de ciertas fuentes de financiación

externas para las pequeñas y medianas empresas (PYMES). Para ello se han

seleccionado aleatoriamente 500 PYMES de una región. Las empresas se clasifican

según su tamaño en tres categorías (micros, pequeñas y medianas) y según hayan

utilizado o no alguna de las fuentes de financiación especificadas en el cuestionario.

Los datos obtenidos son:

Si utiliza financiación No utiliza financiación

Micros 115 325

CLETO DE LA TORRE

187

Pequeñas 20 20

Medianas 15 5

¿Existe alguna relación entre el tamaño de la empresa y el hecho de recurrir o no a las

fuentes de financiación indicadas?. Utilice un nivel de significación del 5%.

ESTADISTICA

188

CAPITULO X

TOMA DE DECISION.

Una decisión es una elección consciente y racional, orientada a conseguir un objetivo,

que se realiza entre diversas posibilidades de actuación (o alternativas). Antes de tomar

una decisión deberemos calcular cual será el resultado de escoger una alternativa. En

función de las consecuencias previsibles para cada alternativa se tomará la decisión.

Así, los elementos que constituyen la estructura de la decisión son: los objetivos de

quién decide y las restricciones para conseguirlos; las alternativas posibles y

potenciales; las consecuencias de cada alternativa; el escenario en el que se toma la

decisión y las preferencias de quien decide.

Los problemas de decisión que vamos a estudiar se plantean cuando una persona

(decisor) tiene que elegir una opción entre un conjunto de posibilidades sabiendo que

las consecuencias que acarrea su decisión no dependen solo de la opción que elija, sino

también de una serie de factores externos que no controla. Trataremos de estudiar

criterios objetivos para tomar una decisión de forma que las consecuencias nos sean

favorables.

10.1 OBSERVACIONES

Se llama espacio de acciones (Aj) al conjunto de todas las posibles alternativas

entre las que el decisor puede elegir.

CLETO DE LA TORRE

189

Se llama espacio de estados o eventos (Ei) de la naturaleza, al conjunto de todos

los posibles valores de los factores externos que no controla el decidor, pero

determinan el nivel de éxito de una acción determinada.

La teoría de decisión consiste en un conjunto de técnicas para elegir la mejor

acción.

10.2 PASOS EN LA TEORIA DE DECISIONES.

En un problema de decisión, lo primero que debemos identificar son las opciones

entre las que debemos elegir.

El segundo paso del planteamiento consiste en identificar los factores externos

que no puede controlar el decisor pero que incluyen en las consecuencias, en este

paso se asigna probabilidades (pi) a los posibles eventos.

En el tercer paso se construye una tabla de pago, la misma que debe contener la

lista de las acciones alternativas, posibles eventos y los pagos.

El cuarto paso es el proceso de la toma de decisiones, para ello existen varios

criterios, la mismas que se desarrollaran posteriormente.

Tablas de pago.

El pago se define como la utilidad neta es decir ventas menos costos.

Los pagos ijX de la tabla de pagos son valores que consisten de pérdidas o

ganancias que dependen del evento Ei y de la acción Aj.

Tabla de pagos.

Eventos Probabilidades Acciones

A1 A2 ... An

E1 P1 11X 12X … 1nX

E2 P1 21X 22X … 2nX

E3 P1 31X 32X … 3nX

…

EK P1 1kX 2kX knX

10.3 TOMA DE DECISIONES.

I. Criterios basados solo en probabilidades.

ESTADISTICA

190

Este criterio consiste en decidir por el evento que tiene la máxima

probabilidad.

II. Criterios Basados solo en las consecuencias económicas.

a. Criterio Maximin.

Consiste en determinar el valor mínimo que resulta de cada acción a

tomar en la tabla de pagos, y elegir como la mejor acción aquella cuya

resultante es mayor.

Este es el criterio más conservador ya que está basado en lograr lo mejor

de las peores condiciones posibles. El criterio maximin, corresponde a un

pensamiento pesimista, pues razona sobre lo peor que le puede ocurrir al

decisor cuando elige una alternativa.

b. Criterio Maximax.

Consiste en determinar el valor máximo que resulta de cada acción a

tomar en la tabla de pagos, y elegir como la mejor acción aquella cuya

resultante es mayor

c. Criterio de pérdida de oportunidad condicional (Arrepentimiento

mínimas).

El arrepentimiento o pérdida de oportunidad condicional se define como

la cantidad de pago perdido al no tomar la acción del pago más alto para

cada evento posible. Este criterio toma como la mejor acción aquella para

la cual el arrepentimiento máximo posible es menor.

III. Criterios basados solo en probabilidades y consecuencias económicas

a. Criterio del pago esperado (PE)

Llamado también Criterio Bayesiano, bajo este criterio la mejor acción es

aquella que tiene el mayor resultado económico esperado (promedio)

b. Criterio de la pérdida de oportunidad esperada(POE)

La mejor acción es aquella que minimiza las perdidas de oportunidad

esperada. Los cálculos son similares de PE excepto que se usa perdidas de

oportunidades en vez de pagos.

Ejemplo 1

CLETO DE LA TORRE

191

Un vendedor al menudeo adquiere cierto producto a 3000 dólares la caja y lo vende

en 5000 dólares. El elevado margen de utilidad refleja que los productos son

perecedores, puesto que se pierde 500 dólares después de cinco días. Con base en

experiencias en productos similares el vendedor confía en que la demanda del

producto esta entre 9 y 12 cajas.

Si los valores de probabilidad estimadas para las demandas de 9 a 12 cajas son: 0.3,

0.4, 0.2, y 0.1 respectivamente.

a. Describa todo los posibles eventos y las posibles acciones a tomar.

b. Construya una tabla de ganancias.

c. Determine las mejores decisiones utilizando el criterio de probabilidad

máxima.

d. Determine las mejores decisiones desde el punto de vista de los criterios:

i) maximin, ii) máximax.

e. Determine la mejore decisión desde el punto de vista del criterio del pago

esperado (PE)

f. Determine la mejore decisión desde el punto de vista del criterio del

perdida de oportunidad condicional (Criterio de arrepentimiento

condicional)

g. Construya una tabla de perdidas de oportunidades esperadas y determine

la mejor decisión utilizando este criterio.

Solución:

a. Posibles eventos:

E1: Vender 9 cajas.

E2: Vender 10 cajas.


ESTADISTICA

192


Posibles acciones a tomar:

A1: Comprar 9 cajas.




b. Tabla de ganancias.

Demanda de

mercado

Probabilidades Comprar

A1: 9 A2: 10 A3: 11 A4: 12

E1: 9 P1 = 0.3 18000 14500 11000 7500

E2 : 10 P2 = 0.4 18000 20000 16500 13000

E3 : 11 P3 = 0.2 18000 20000 22000 18500

E4 : 12 P4 = 0.1 18000 20000 22000 24000

Si se compra 9 cajas (C = 9), las ganancias (G) para las 4 demandas (D)

respectivas D=9, 10, 11, 12 son iguales a:

G=9x5000-9x3000-0x500=18000.

Si se compra 10 cajas (C = 10), las ganancias (G) para :

D = 9 es G = 9x5000-10x3000- 1x500=14500.

D = 10, 11, 12 es G = 10x5000-10x3000- 0x500=20000.


D = 9 es G = 9x5000-11x3000 - 2x500=11000.

D = 10 es G = 10x5000-11x3000 - 1x500=16500.

D = 11, 12 es G = 11x5000-11x3000- 0x500=22000.


D = 9 es G = 9x5000-12x3000 - 3x500=7500.

D = 10 es G = 10x5000-12x3000 - 2x500=13000.

D = 11 es G = 11x5000-12x3000 - 1x500=18500.

D = 12 es G = 12x5000-12x3000 - 0x500=24000.

CLETO DE LA TORRE

193

c. Criterio de probabilidad máxima.

En base a este criterio, la mejor elección es comprar 10 cajas.

d. Criterio maximin:

Demanda de

mercado

Comprar

A1: 9 A2: 10 A3: 11 A4: 12

E1: 9 18000 14500 11000 7500

E2 : 10 18000 20000 16500 13000

E3 : 11 18000 20000 22000 18500

E4 : 12 18000 20000 22000 24000

Mínimos 18000 14500 11000 7500

El mayor de estos cuatro valores mínimos es 18000, por tanto la mejor acción

es comprar 9 cajas.

Criterio maximax:

Demanda de

mercado

Comprar

A1: 9 A2: 10 A3: 11 A4: 12

E1: 9 18000 14500 11000 7500

E2 : 10 18000 20000 16500 13000

E3 : 11 18000 20000 22000 18500

E4 : 12 18000 20000 22000 24000

Máximos 18000 20000 22000 24000

El mayor de estos cuatro valores es 24000, por tanto la mejor acción es

comprar 12 cajas.

e. Criterio de pago esperado (PE)

Demanda de

mercado

Comprar

A1: 9 A2: 10 A3: 11 A4: 12

E1: 9 18000 14500 11000 7500

E2 : 10 18000 20000 16500 13000

E3 : 11 18000 20000 22000 18500

ESTADISTICA

194

E4 : 12 18000 20000 22000 24000

Pago

esperado

18000 18625 17875 15750

Se elige la acción que tiene mayor PE, esto es comprar 10 cajas.

f. Criterio de pérdida de oportunidad condicional.

Si la demanda fuera de 9 unidades (D=9), lo correcto es producir 9 para tener

una ganancia de G = 9x5000-9x3000=18000 no hay pérdida de oportunidad,

sin embargo si se produce 10 unidades, cuando la demanda es 9, la ganancia

es G = 9x5000-10x3000- 1x500=14500, para este caso la pérdida de

oportunidades es: 18000-14500=3500

Tabla de pérdida de oportunidad condicional

Demanda de

mercado

Comprar

A1: 9 A2: 10 A3: 11 A4: 12

E1: 9 18000 – 18000

0

18000 – 14500

3500

18000 – 11000

7000

18000 – 7500

11500

E2 : 10 20000 – 18000

2000

20000 – 20000

0

20000 – 16500

3500

20000 – 13000

7000

E3 : 11 22000 – 18000

4000

22000 – 20000

2000

22000 – 22000

0

22000 – 18500

3500

E4 : 12 24000 – 18000

6000

24000 – 20000

4000

24000 – 22000

2000

24000 – 24000

0

Máximos 6000 4000 7000 11500

El menor de estos máximos es 4000, la acción optima es A2, comprar 10 cajas.

g. Tabla de perdidas de oportunidades esperadas (POE)

Demanda de

mercado

Comprar

A1: 9 A2: 10 A3: 11 A4: 12

E1: 9 0 3500 7000 11500

E2 : 10 2000 0 3500 7000

CLETO DE LA TORRE

195

E3 : 11 4000 2000 0 3500

E4 : 12 6000 4000 2000 0

POE

(Promedios)

3000 2375 3125 5500

La menor de estas perdidas de oportunidades esperadas es de 2375, por el criterio

POE, la mejor acción es comprar 10 cajas.

10.4 ARBOL DE DECISIONES

Es utilizado para estructurar el proceso de Toma de decisiones bajo

Incertidumbre.

Variable de decisión: Son las alternativas disponibles

Variable de estado : Estados de la naturaleza, estados futuros, ocurrencias

probables.

El esquema de un árbol de decisión es la siguiente.

Nodo de Alternativas Nodo Ramas de Decisión de decisión de azar estado Resultados

Los nodos finales representan todos los posibles resultados, asociados con cada

una de las alternativas de decisión

10.5 Toma de decisión Bayesiana.

Mientras que los criterios de decisión analizados anteriormente ignoran las

probabilidades para los estados naturales respectivos, la toma de decisión

ESTADISTICA

196

bayesina la toma en cuenta, específicamente se elige la alternativa con la mejor

retribución esperada.

Retribución esperada=VME=1

i i

i

p m

Donde:

Pi: Probabilidad de que ocurra el estado natural i.

Mi: La retribución si se selecciona esta alternativa y ocurre el estado natural i.

EJEMPLO

Un inversionista debe decidir si realiza una inversión de $ 50000 en la ciudad A o

B para construir un mercado en una área residencial, no se sabe si esta área

residencial crecerá para convertirse en un mercado grande o moderado. Si invierte

en la ciudad A y el mercado es grande la ganancia neta se estima en $75000; si el

mercado es moderado habrá una perdida de $ 30000. Si invierte en la ciudad B y el

mercado es grande, la ganancia neta será de $150000, si el mercado es moderado la

ganancia será de $50000. Si el inversionista estima una probabilidad de 40% de

que el mercado sea grande. Determine si el inversionista debe realizar o no el

deposito.

Solución. Alternativa Probabilidad de Retribución Cada estado natural en dólares

Invertir en la ciudad A

0.4 Mercado es grande

0.6 Mercado es moderado

$ 75000

-$ 30000

VME ciudad A=0.4x75000+0.6x(-30000)=$12000

CLETO DE LA TORRE

197

Al comparar las retribuciones esperadas se deduce que debe invertir en la ciudad

B.

EJERCICIOS.

1. Una tienda de moda tiene la oportunidad de abrir un local en un centro

comercial muy conocido y con mucho éxito. Alternativamente, puede abrir la

tienda en un nuevo centro comercial a un coste mucho mas bajo, de forma que si

ese nuevo centro tiene gran ausencia calculan que los beneficios anuales serán de

300000 euros, si la ausencia es moderada serán de 135000 euros y si es baja

esperan unas perdidas de 23000 euros. Si abren la tienda en el centro comercial

ya establecido, los beneficios que calculan dependen, también, del grado de éxito

del nuevo centro, ya que son competidores directos. Si la ausencia al nuevo

centro es baja, los beneficios para la tienda instalada en el centro comercial

conocido. Utilice por lo menos tres criterios para la toma de decisión

2. Un vendedor de computadoras adquiere una computadora en 1000 dólares y lo

vende en 1800 dólares, el valor de la computadora se deprecia en seis meses en

600 dólares. En base a la experiencia el vendedor confía en que la demanda del

producto esta entre 10 y 14 unidades en un periodo de seis meses.

Si los valores de probabilidad estimadas para las demandas de 10 a 14 unidades

son: 0.3, 0.25, 0.19, 0.15 y 0.11 respectivamente.

a. Describa todo los posibles eventos y las posibles acciones a tomar.

Invertir en la

ciudad B

0.4 Mercado es grande

0.6 Mercado es moderado

$ 150000

$ 50000

VME Ciudad B=0.4x150000+0.6x(50000)=$90000

ESTADISTICA

198

b. Construya una tabla de ganancias.

c. Determine las mejores decisiones utilizando el criterio de probabilidad

máxima.

d. Determine las mejores decisiones desde el punto de vista de los criterios:

i) maximin, ii) máximax.

e. Determine la mejore decisión desde el punto de vista del criterio del pago

esperado (PE)

f. Determine la mejore decisión desde el punto de vista del criterio del

perdida de oportunidad condicional (Criterio de arrepentimiento

condicional)

g. Construya una tabla de perdidas de oportunidades esperadas y determine

la mejor decisión utilizando este criterio.

3. Cada hotel de cierta cadena debe decidir cual de las tres posibles promociones

que ofrece la compañía matriz lanzara para la próxima campaña de invierno. La

promoción playa depende mucho del tiempo. Si es calido y soleado, calculan

unos beneficios de unos 90000 soles, si es frió y lluvioso de 5000 soles y si es

intermedio de unos 25000 soles. Al contrario para la promoción ski calculan una

perdidas de 6000 soles si el tiempo el calido, unos beneficios de 15000 soles si es

intermedio 70000 soles si es frió y lluvioso. La promoción relax es independiente

del tiempo y con ella esperan unos beneficios de unos 55000 soles.

a) Uno de los hoteles de dicha cadena esta situado en una zona en la el 80% de

los inviernos son calidos y soleados y nunca son fríos y lluviosos, ¿que

promoción deberán lanzar?, ¿con que valor asociado?

b) Otro hotel esta situado en una zona en la que el 40% de las veces el invierno

es frió y lluvioso y el 30% es intermedio, ¿que opción recomendarías para este

otro hotel?

CLETO DE LA TORRE

199

ESTADISTICA

200

CAPITULO XI

DISEÑO EXPERIMENTAL

El diseño de experimentos es en la actualidad una de las herramientas principales

utilizados en la investigación estadística, el objetivo que se tiene es estudiar el efecto de

un factor sobre una variable respuesta.

Diseñar un experimento, simplemente significa planear un experimento de modo que se

reúna la información que sea pertinente al problema bajo investigación. Muy a menudo

se coleccionan datos que pueden tener muy poco o ningún valor, en la solución del

problema.

El diseño de un experimento, es entonces, la secuencia completa de pasos tomados de

antemano para asegurar que los datos apropiados se obtendrán de modo que permitan

un análisis objetivo que conduzca a deducciones válidas con respecto al problema

establecido.

11.1 CONCEPTOS BASICOS

FACTOR.

Son todas aquellas variables cuyo efecto se desea medir, en algunos casos se les

llama tratamiento.

NIVEL

Es el conjunto de valores que tiene la variable independiente o factor en el

experimento.

CLETO DE LA TORRE

201

UNIDAD EXPERIMENTAL

Es la entidad más pequeña a lo que se aplica el tratamiento, es decir; es el

elemento donde se realiza la medición.

ERROR EXPERIMENTAL

Es la medida de la variación, existente entre observaciones de las unidades

experimentales.

En un Diseño Experimental se tiene variabilidad inherente a la unidad

experimental y otra variabilidad debida a los tratamientos.

Para reducir el error experimental se siguen algunos pasos:

Repetir el experimento

Adicionar más tratamientos

Introducir variables o bloques

El proceso o sistema bajo estudio puede representarse por medio del modelo:

Podemos pensar que el proceso es una combinación de maquinarias, personas y otros

recursos que transforman alguna entrada, en una salida que tienen una o más

respuestas observadas

11.2 OBJETIVOS DEL DISEÑO EXPERIMENTAL

Determinar las variables con mayor influencia en la respuesta

ESTADISTICA

202

Determinar el mejor valor de las variables que influyen en la respuesta de

manera que:

La respuesta se aproxime al valor deseado

La variabilidad de la respuesta sea pequeña

Se minimiza el efecto de las variables incontrolables

11.3 DISEÑO UNIFACTORIAL (Diseño completamente aleatorio)

Es el Diseño Experimental más simple.

En este Diseño los tratamientos (niveles) se distribuyen al azar en todas las

unidades experimentales. Este diseño es muy útil cuando las unidades

experimentales tienen variabilidad uniformemente repartidos

(homogeneidad)

VENTAJAS Y DESVENTAJAS

VENTAJAS

Este Diseño es fácil de planear y es flexible en cuanto al número de

repeticiones y unidades experimentales del tratamiento

DESVENTAJAS

Solo es aplicable, cuando el material experimental es homogéneo

Los resultados del experimento se pueden agrupar de la siguiente forma:

factor variedad ijy

niveles

D

C

B

A

A Y C Y B Y D Y

B Y A Y D Y C Y

B Y C Y A Y D Y

A Y D Y C Y B Y

11 31 21 41

22 12 42 32

23 33 13 43

14 44 34 24

Donde ( yij ) es el resultado de la medición del i-ésimo tratamiento en la j-ésima

repetición.

CLETO DE LA TORRE

203

En resumen:

Tratam 1 2 i a

Y Y Y Y

Y Y Y Y

Y Y Y Y

Y Y Y Y

i a

i a

j j ij aj

n n in an

11 21 1 1

12 22 2 2

1 2

1 2

TOTAL

TOTALES Y Y Y Yi a1 2. . . . . .Y

Medias ani YYYY ..2.1

..Y

Varianzas s s s si a1

2

2

2 2 2

. . . . 2

..s

Donde:

n

j

iji YY1

. , Total del i-ésimo tratamiento

Y YY

ni ij

j

ni

.

.

1

, Media del i-ésimo tratamiento

a

i

n

j

ij

a

i

i YYY1 11

... , Total

an

YY . .

. . , Media total

En esta parte desarrollaremos el Análisis de Varianza para el modelo de Efectos

fijos del Diseño Completamente al Azar. (DCA).

11.4 ANALISIS DE VARIANZA

Es la técnica mediante el cual se mide los efectos de los tratamientos puesto que

descompone la Varianza Total en diferentes fuentes de variabilidad definida por el

ESTADISTICA

204

modelo.

Para el cual se siguen los siguientes pasos:

H a0 1 2:

H i j1: , para algún par (i,j)

La fórmula asumida para calcular la suma de los cuadrados es la siguiente:

22

....

1 1 1 1

,a n a n

ij ij

i j i j

ySCT y y y N an

N

2 2

. ..

1

ai

i i

y ySCA N an

n N

SCE SCT SCA

Los cuadrados medios son los estimadores de las varianzas y son obtenidos de la

siguiente forma:

1

SCACMA

a

2)()1(

ijVna

SCECME ó varianza del error.

Por otra parte el cociente de 2 variables 2 se distribuye mediante la distribución

de Fisher

1

( 1)

c

SCA

aFSCE

a n

fa a n gl1 1,

1

f(1

R.A. H0 R.R. H

0

CLETO DE LA TORRE

205

Análisis de la varianza.

Fuentes de

Varianza

g.l SC CM FCAL

Tratamiento a-1 SCA CMA CMA

CME

Error a(n-1) SCE CME

Total an-1 STT

Conclusiones:

Si Fc F0 Se rechaza H0

Si Fc F0 Se acepta H0

11.5 DISEÑO EXPERIMENTAL DE DOS FACTORES

El análisis de la varianza de dos factores esta formado como su nombre indica

por dos factores que a su vez tienen la misma importancia en este tipo de análisis

existen “a” niveles del factor A y “b” niveles de factor B.

Este tipo de análisis se determinan según el numero de observaciones; si cada

unidad experimental tiene una observación, el modelo del análisis univariado de

la varianza de dos factores se denomina sin replica, en este caso no existe

interacción entre los dos factores. En este tipo de análisis el control local (unidad

experimental) por el factor A l cual esta constituido por todo los del factor B o

variantes repetidas una sola vez siendo el factor A una repetición con la condición

de que los del factor B están dentro del factor A . de donde se puede afirmar que

cada factor A contiene los elementos del factor B el cual disminuye el error

experimental.

TABLA DE ANALISIS DE VARIANZA

Fuentes de

Varianza

g.l SC CM FCAL

Factor A a-1 SCA CMA

CME

CMA

ESTADISTICA

206

Factor B b-1 SCB CMB

CME

CMB

Interacción

AB

(a-1)(b-1) SCAB CMAB

CME

CMAB

Error ab(n-1) SCE CME

Total abn-1

Donde:

a

i

b

j

n

kijk abn

SCT YY

1 1 1

2

...2,

abnbnSCA YYa

i

i

2

...

1

2

.. , b

j

j

abnanSCB YY

1

2

...

2

.. ,

b

j

ija

i

SCBSCAabnn

SCAB YY1

2

...

2

.

1

SCE = SCT-(SCA+SCB+SCAB)

El cuadrado medio, se obtiene:

Para el factor A : 1a

SCACMA

Para el factor B : 1b

SCBCMB

Para la interacción AB : )1)(1( ba

SCABCMAB

Para el error : )1(nab

SCABCME

INTERACCIÓN. En estadística, la idea de una interacción, es medir el efecto de una

CLETO DE LA TORRE

207

variable (factor), manteniendo constante los demás.

Figura: Interacción de factores.

De la gráfica anterior se concluye que geométricamente existe interacción cuando

las líneas no son paralelas, en cambio no existe interacción, cuando las líneas son

paralelas.

APLICACIONES.

1.- Se desea evaluar la efectividad de tres estrategias de marketing A, B y C en las

ventas. En el cuadro siguiente se observa las ventas semanales de un producto de

miles de unidades.

A B C

35 22,6 16,6

30,6 14,4 12,1

26,8 26,3 7,2

37,9 13,8 6,6

13,7 17,4 12,5

49 18.5 15,1

¿Se puede concluir que el efecto de las tres estrategias es diferente?

Solución

La hipótesis estadística esta dado por:

H a0 1 2:

H i j1:

Estrategia A Estrategia B Estrategia C

35 36 37

30.6 30.7 30.8

26.8 26.9 26.10

37.9 37.10 37.11

13.7 13.8 13.9

ESTADISTICA

208

49 50 51

Totales 1.y 84 2.y 86

3.y 88 ..y 258

N 6 6 6 N=18

Media 1.y =14 2.y =14.3333333

3.y =14.6666667 ..y =14.3333333

2 22 2 2 2..

1 1

25835 30.6 26.8 .... 51 2194.57

18

a n

ij

i j

ySCT y

N2 2 2 2 2

. ..

1

84 86 88 2580.7059

6 18

ai

i i

y ySCA

n N

2193.87SCE SCT SCA

Análisis de la varianza.

Fuentes de

Varianza

g.l SC CM FC

Tratamiento 2 0.7059 0.35295 0.00220775

Error 15 2193.87 146.258

Total 17 2194.57

ffc

0

De la tabla FO=3.68, Se acepta HO, por lo tanto las tres estrategias de ventas presenta

similar efecto.

2.- Un investigador analiza el efecto de 5 tipos de publicidad en cinco áreas geográficas,

los resultados se mide en términos del incremento en las ventas. La información

obtenida del estudio se muestra en el cuadro siguiente.

CLETO DE LA TORRE

209

Area

geográfica Publicidad

Incremento

en las ventas Tiempo Tratamiento

Incremento

en las ventas

R1 E1 85 R3 E3 100

R1 E1 45 R4 E3 200

R2 E1 100 R4 E3 250

R2 E1 20 R5 E3 260

R3 E1 85 R5 E3 340

R3 E1 95 R1 E4 0

R4 E1 73 R1 E4 70

R4 E1 87 R2 E4 30

R5 E1 250 R2 E4 100

R5 E1 170 R3 E4 100

R1 E2 110 R3 E4 180

R1 E2 30 R4 E4 210

R2 E2 100 R4 E4 200

R2 E2 20 R5 E4 350

R3 E2 90 R5 E4 420

R3 E2 80 R1 E5 30

R4 E2 50 R1 E5 60

R4 E2 110 R2 E5 110

R5 E2 120 R2 E5 100

R5 E2 250 R3 E5 170

R1 E3 60 R3 E5 150

R1 E3 0 R4 E5 10

R2 E3 40 R4 E5 20

R2 E3 45 R5 E5 40

R3 E3 50 R5 E5 20

Con 95% cual es su conclusión de este estudio.

ESTADISTICA

210

Análisis de Varianza para Ventas

Fuente de variación Suma de Cuadrados Gl Cuadrado Medio Fc Valor-P

Factores

A:Publicidad 54658.0 4 13664.5 7.92 0.0003

B:Region 182098. 4 45524.5 26.40 0.0000

INTERACCION

AB 170472. 16 10654.5 6.18 0.0000

Error 43110.5 25 1724.42

TOTAL 450339. 49

Del análisis de varianza que se muestra en el cuadro anterior se puede concluir con 95%

de confianza que el factor publicidad influyen en el incremento de las ventas. (P-valor

< 0.05), es decir algunos de estos tipos de publicidad genera mayor incremento en las

ventas.

También del mismo cuadro se puede desprender que el factor región influye (p-valor

< 0.05) es decir que en determinados regiones las ventas son mayores que los otros.

Para determinar que publicidad tiene mejor efecto en las ventas se aplica las pruebas

de comparación de múltiples que se ilustra gráficamente.

E1 E2 E3 E4 E5

Public idad

50

80

110

140

170

200

Ve

nta

s

De este grafico se observa que el tipo de publicidad, E4 estadísticamente tienen mejor

efecto en las ventas en comparación con los otros tipos de publicidad.

Por otra parte los tipos de publicidad E1 y E2 tienen similar efecto y el tipo de

publicidad E5 tiene el menor efecto en las ventas.

CLETO DE LA TORRE

211

En el grafico siguiente se observa el análisis del incremento en las ventas por Región.

R1 R2 R3 R4 R5

Region

0

50

100

150

200

250

Ve

nta

s

Las ventas en las región 5, son mayores en promedio que las otras regiones, en cambio

las ventas en las regiones 3 y 4 son similares y menor a las ventas de la región 5.

Public idad

0

100

200

300

400

Ve

nta

s

E1 E2 E3 E4 E5

Region

R1

R2

R3

R4

R5

El tipo de publicidad E5, no presenta efecto en las regiones 4 y 5.

EJERCICIOS

ESTADISTICA

212

1. Una empresa, con el propósito de mejorar sus ventas diseña 4 tipos de oferta, en

tres regiones del país. En el cuadro siguiente se muestra los resultados del

incremento de ventas en dólares.

Región Tipos de oferta

A B C D

I 109 110 108 110

110 115 109 108

II 110 110 111 114

112 111 109 112

III 116 119 124 120

114 115 119 117

Con 95% de confianza ¿Cual es su conclusión respecto del efecto de la oferta?

2. El propietario de una empresa ha probado tres políticas diferentes de cambio de

cheques para reducir el gran número de cheques sin fondo que recibia su empresa.

El desea saber cual política minimiza el problema. En el cuadro siguiente se muestra

la reducción del número de cheques sin fondos que recibe esta empresa.

Política

A B C

48 42 68

54 59 71

78 62 87

83 80 98

96 92 10

Pruebe si hay diferencia entre los tres tipos de política, usando un nivel de

significación de 5%

3. La tabla siguiente muestra el posicionamiento de un producto de 4 marcas (A, B, C

y D) en una región del país. Contrastar a un nivel de confianza de 95%, la hipótesis

nula de que no existe diferencia en el posicionamiento en le mercado de las 4 marcas.

Posicionamiento (%)

CLETO DE LA TORRE

213

Marca A 10 37 12 31 11 9 23

Marca B 4 35 32 19 33 18 8

Marca C 15 5 10 12 6 6 15

Marca D 7 11 1 8 2 5 3

4.- La estructura financiera de una firma se refiere a la forma en que se dividen los

activos de la empresa por debe y haber, y el apalancamiento financiero se refiere al

porcentaje de activos financiados por deuda. En un estudio financiero se afirma que

el apalancamiento financiero puede utilizarse para aumentar la tasa de rendimiento

sobre la inversión, es decir que, los accionistas pueden recibir rendimientos más altos

con la misma cantidad de inversión gracias a su uso. Los siguientes datos muestran

las tasas de rendimiento utilizando 3 diferentes niveles de apalancamiento financiero

y un nivel de control (deuda cero) de empresas seleccionadas al azar:

Tasas de Rendimiento

Control Bajo Medio Alto

4.6 2 7 7.9

2 7.4 4.5 6.8

6.8 1.8 11.6 5.8

4.2 3.2 6 9.2

1.6 4 6.8 11

En función de la información cual su conclusión de este estudio.

ESTADISTICA

214

Tabla Normal Estándar

Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0 0 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.0279 0.03188 0.03586

0.1 0.03983 0.04395 0.04776 0.05172 0.05567 0.05962 0.06356 0.0675 0.07124 0.07534

0.2 0.07926 0.08617 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409

0.3 0.11781 0.12172 0.12552 0.1293 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173

0.4 0.15542 0.1591 0.16276 0.1664 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793

0.5 0.19146 0.19497 0.19847 0.20194 0.2054 0.20884 0.21226 0.21566 0.21904 0.2224

0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.2549

0.7 0.25804 0.26115 0.26424 0.2673 0.27035 0.27337 0.27637 0.27935 0.2823 0.28524

0.8 0.28814 0.29103 0.29389 0.29373 0.29955 0.30234 0.3051 0.30785 0.31057 0.31327

0.9 0.31594 0.31859 0.32124 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891

1 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214

1.1 0.36433 0.3665 0.36864 0.37076 0.37286 0.37923 0.37698 0.379 0.381 0.38298

1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39616 0.39796 0.39973 0.40147

1.3 0.4032 0.4049 0.40658 0.40824 0.40988 0.41149 0.41308 0.41466 0.41621 0.41774

1.4 0.41924 0.42073 0.4222 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189

1.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408

1.6 0.4452 0.4463 0.44738 0.44845 0.4495 0.45053 0.45154 0.45254 0.45352 0.45449

1.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46079 0.46164 0.46246 0.46327

1.8 0.46407 0.46485 0.46562 0.46637 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062

1.9 0.47128 0.47193 0.47257 0.4732 0.47381 0.47441 0.475 0.47558 0.47615 0.4767

2 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.4803 0.48077 0.48124 0.48169

2.1 0.48214 0.48257 0.48299 0.48341 0.48382 0.48422 0.48461 0.485 0.48537 0.48574

2.2 0.4861 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.4884 0.4887 0.48899

2.3 0.48928 0.48956 0.48983 0.49001 0.49036 0.49061 0.49086 0.4911 0.49134 0.49158

2.4 0.4918 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361

2.5 0.49379 0.49396 0.49413 0.4943 0.49446 0.49461 0.49477 0.49491 0.49506 0.4952

2.6 0.49534 0.49547 0.4956 0.49573 0.49585 0.49597 0.49609 0.49621 0.49632 0.49643

2.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.4972 0.49728 0.49736

2.8 0.49744 0.49752 0.4976 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807

2.9 0.49813 0.49819 0.49825 0.4983 0.49836 0.49841 0.49846 0.49851 0.49856 0.4986

3 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49897 0.499

3.1 0.49903 0.49906 0.4991 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929

3.2 0.49931 0.49934 0.49936 0.49938 0.4994 0.49942 0.49944 0.49946 0.49948 0.4995

3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.4996 0.49961 0.49962 0.49964 0.49965

3.4 0.49956 0.49968 0.49969 0.4997 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976

3.5 0.49977 0.49978 0.49978 0.49979 0.4998 0.49981 0.49981 0.49982 0.49983 0.49983

3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989

3.7 0.49989 0.4999 0.4999 0.4999 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992

3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995

3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997

CLETO DE LA TORRE

215

TABLA DE LA DISTRIBUCION T-STUDENT 1p x c

gl 1

0.75 0.80 0.85 0.9 0.95 0.975 0.99 0.995

1 1 1.376 1.963 3.078 6.314 12.706 31.821 63.657

2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925

3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841

4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604

5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707

7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499

8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355

9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250

10 0.7 0.879 1.093 1.372 1.812 2.228 2.764 3.169

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106

12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055

13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012

14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977

15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947

16 0.69 0.865 1.071 1.337 1.746 2.120 2.583 2.921

17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898

18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878

19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861

20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845

21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831

22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819

23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807

24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797

25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779

27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771

28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763

29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756

30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750

40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704

60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660

120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617

0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576

ESTADISTICA

216

TABLA DE LA DISTRIBUCION CHI CUADRADO ( 1p x c )

gl 0.01 0.01 0.025 0.05 0.1 0.2 0.4 0.6 0.8 0.9 0.95 0.975 0.99 0.995

1 0 0 0 0 0.02 0.06 0.27 0.71 1.64 2.71 3.84 5.02 6.63 7.88

2 0.01 0.02 0.05 0.1 0.21 0.45 1.02 1.83 3.22 4.61 5.99 7.38 9.21 10.6

3 0.07 0.11 0.22 0.35 0.58 1.01 1.87 2.95 4.64 6.25 7.81 9.35 11.34 12.84

4 0.21 0.3 0.48 0.71 1.06 1.65 2.75 4.04 5.99 7.78 9.49 11.14 13.28 14.86

5 0.41 0.55 0.83 1.15 1.61 2.34 3.66 5.13 7.29 9.24 11.07 12.83 15.09 16.75

6 0.68 0.87 1.24 1.64 2.2 3.07 4.57 6.21 8.56 10.64 12.59 14.45 16.81 18.55

7 0.99 1.24 1.69 2.17 2.83 3.82 5.49 7.28 9.8 12.02 14.07 16.01 18.48 20.28

8 1.34 1.65 2.18 2.73 3.49 4.59 6.42 8.35 11.03 13.36 15.51 17.53 20.09 21.95

9 1.73 2.09 2.7 3.33 4.17 5.38 7.36 9.41 12.24 14.68 16.92 19.02 21.67 23.59

10 2.16 2.56 3.25 3.94 4.87 6.18 8.3 10.47 13.44 15.99 18.31 20.48 23.21 25.19

11 2.6 3.05 3.82 4.57 5.58 6.99 9.24 11.53 14.63 17.28 19.68 21.92 24.73 26.76

12 3.07 3.57 4.4 5.23 6.3 7.81 10.18 12.58 15.81 18.55 21.03 23.34 26.22 28.3

13 3.57 4.11 5.01 5.89 7.04 8.63 11.13 13.64 16.98 19.81 22.36 24.74 27.69 29.82

14 4.07 4.66 5.63 6.57 7.79 9.47 12.08 14.69 18.15 21.06 23.68 26.12 29.14 31.32

15 4.6 5.23 6.26 7.26 8.55 10.31 13.03 15.73 19.31 22.31 25 27.49 30.58 32.8

16 5.14 5.81 6.91 7.96 9.31 11.15 13.98 16.78 20.47 23.54 26.3 28.85 32 34.27

17 5.7 6.41 7.56 8.67 10.09 12 14.94 17.82 21.61 24.77 27.59 30.19 33.41 35.72

18 6.26 7.01 8.23 9.39 10.86 12.86 15.89 18.87 22.76 25.99 28.87 31.53 34.81 37.16

19 6.84 7.63 8.91 10.12 11.65 13.72 16.85 19.91 23.9 27.2 30.14 32.85 36.19 38.58

20 7.43 8.26 9.59 10.85 12.44 14.58 17.81 20.95 25.04 28.41 31.41 34.17 37.57 40

21 8.03 8.9 10.28 11.59 13.24 15.44 18.77 21.99 26.17 29.62 32.67 35.48 38.93 41.4

22 8.64 9.54 10.98 12.34 14.04 16.31 19.73 23.03 27.3 30.81 33.92 36.78 40.29 42.8

23 9.26 10.2 11.69 13.09 14.85 17.19 20.69 24.07 28.43 32.01 35.17 38.08 41.64 44.18

24 9.89 10.9 12.4 13.85 15.66 18.06 21.65 25.11 29.55 33.2 36.42 39.36 42.98 45.56

25 10.5 11.5 13.12 14.61 16.47 18.94 22.62 26.14 30.68 34.38 37.65 40.65 44.31 46.93

30 13.8 15 16.79 18.49 20.6 23.36 27.44 31.32 36.25 40.26 43.77 46.98 50.89 53.67

35 17.2 18.5 20.57 22.47 24.8 27.84 32.28 36.47 41.78 46.06 49.8 53.2 57.34 60.27

40 20.7 22.2 24.43 26.51 29.05 32.34 37.13 41.62 47.27 51.81 55.76 59.34 63.69 66.77

45 24.3 25.9 28.37 30.61 33.35 36.88 42 46.76 52.73 57.51 61.66 65.41 69.96 73.17

50 28 29.7 32.36 34.76 37.69 41.45 46.86 51.89 58.16 63.17 67.5 71.42 76.15 79.49

55 31.7 33.6 36.4 38.96 42.06 46.04 51.74 57.02 63.58 68.8 73.31 77.38 82.29 85.75

60 35.5 37.5 40.48 43.19 46.46 50.64 56.62 62.13 68.97 74.4 79.08 83.3 88.38 91.95

65 39.4 41.4 44.6 47.45 50.88 55.26 61.51 67.25 74.35 79.97 84.82 89.18 94.42 98.1

70 43.3 45.4 48.76 51.74 55.33 59.9 66.4 72.36 79.71 85.53 90.53 95.02 100.4 104.2

75 47.2 49.5 52.94 56.05 59.79 64.55 71.29 77.46 85.07 91.06 96.22 100.8 106.4 110.3

80 51.2 53.5 57.15 60.39 64.28 69.21 76.19 82.57 90.41 96.58 101.88 106.6 112.3 116.3

85 55.2 57.6 61.39 64.75 68.78 73.88 81.09 87.67 95.73 102.1 107.52 112.4 118.2 122.3

90 59.2 61.8 65.65 69.13 73.29 78.56 85.99 92.76 101.05 107.6 113.15 118.1 124.1 128.3

95 63.3 65.9 69.92 73.52 77.82 83.25 90.9 97.85 106.36 113 118.75 123.9 130 134.3

CLETO DE LA TORRE

217

PRUEBAS DE HIPÓTESIS

Número

de

Grupos

Prueba Z para la media

Prueba T para la media

Prueba del signo para la mediana

Prueba Z para la diferencia de medias

Prueba T para la

diferencia de medias

Prueba T para la diferencia

de medias con ajuste de

grados de libertad.

Distribución

Normal

n≥20

Varianzas

iguales

Prueba de Mann Whintney para

comparación de poblaciones

Distribución

normal

n≥30 i

n

d

e

p

e

n

d

i

e

n

t

e

s

Prueba Z para la media de la diferencia en

datos apareados

Prueba T para la media de la

diferencia en datos apareados

Prueba del signo o de Wilcoxon

para datos apareados

Distribución

normal

Distribución normal

con varianzas

semejantes

n≥30

i

n

d

e

p

e

n

d

i

e

n

t

e

s

ANOVA – comparación de tratamientos

Prueba de Krusskal – Wallis –

comparación de tratamientos.

ANOVA en bloque - comparación de

tratamientos.

Prueba de Friedman - comparación de

tratamientos.

SI

SI

SI

SI

SI

SI

SI

SI

SI

SI

Distribución normal

con varianzas

semejantes

SI

NO

NO

NO

NO

NO

NO

NO

NO

NO

NO

NO

2

grupos

3 o más

grupos

1

grupo

ESTADISTICA

218


SI

Número

de

Grupos

Prueba Z para la proporción poblacional

Muestra grande

nP y n(1-P) > 5

Frecuencias

esperadas

pequeñas

i

n

d

e

p

e

n

d

i

e

n

t

e

s

i

n

d

e

p

e

n

d

i

e

n

t

e

s

SI

SI

SI

NO

NO

NO

2

grupos

3 o más

grupos

1

grupo

Prueba Binomial para la proporción poblacional

Prueba exacta de Fisher – comparación de

proporciones

Prueba Z o Ji-Cuadrado para comparación de

proporciones

Prueba de McNeman

Comparación de proporciones

Frecuencias

esperadas

pequeñas

SI

SI

NO

NO

Prueba Ji - Cuadrado (reunir categorías)

Para comparación de proporciones

Prueba Ji-Cuadrado para comparación de

proporciones

Prueba Q de Cockran

Comparación de proporciones

No

No

CLETO DE LA TORRE

219


Escala de

medición

para

ambas

variables.

Continua Coeficiente de correlación lineal de pearson

Coeficiente de correlación por rangos de

Spearman

SI

NO

-Prueba de chi-cuadrado (Coeficiente de

contingencia)

-Riesgos relativos( Estudios Cohorte).

-Odds Ratio( Estudios caso-control)

-Coeficiente de correlación

Prueba de chi-cuadrado para

independencia de variables (Coeficiente

de contingencia)

Cada variable

tiene dos

categorías

(Tabla 2x2)

Ordinal y/o

cardinal

Nominal

ESTADISTICA

220

MÉTODOS ESTADÍSTICOS DE ACUERDO AL TIPO DE VARIABLES y NIVEL DE

INVESTIGACION.

Tipo de

Descripción

Tipo de variable Nivel de

investigación

Método o Técnica

Estadística.

Variables

individuales

Cualitativa

(Nominal y

Ordinal)

Escala de actitud

de Likert)

DESCRIPTIVA Tabla de Frecuencias,

proporciones, o

porcentajes.

Representados por

grafico de barras,

sectores o pictogramas.

Intervalo de confianza y

prueba de hipótesis de la

proporción.

Variables

individuales

Cuantitativa

(Intervalo o

razón)

DESCRIPTIVA -Distribución de

frecuencias por

intervalos.

-Medias, desviación , ,

varianza, percentiles.

-Intervalo de confianza y

prueba de hipótesis de la

media.

-Análisis factorial, análisis

de compontes

principales.

Asociación

entre

variables

V. Ind: Cualitativa

con V.Dep:

Cualitativa

EXPLICATIVA -Tablas de contingencia.

-Calculo de riesgos.

-Pruebas de chi-

cuadrado: independencia

-Grafico de barras de

doble entrada.

-Pruebas de Kendall, de

Spearman.

CLETO DE LA TORRE

221

-Análisis de

correspondencias

Asociación

entre

variables

V. Ind: :

Cualitativa(s)

(Grupos)

con V.Dep:

Cuantitativa

(Rpta)

COMPARATIVA,

-Tablas con clasificación

categórica, con

promedios, desviaciones,

etc.

-prueba t-student

Asociación

entre

variables

V. Ind: :

Cualitativa(s)

(factores)

con V.Dep:

Cuantitativa(Rpta)

EXPERIMENTAL,

CUASI

EXPERIMENTAL

Diseño experimental

(ANOVA)

-Prueba de comparación

de medias.

Asociación

entre

variables

V. Ind: :

Cuantitativa(s)

con V.Dep:

Cuantitativa

RELACIONAL,

CORRELACIONAL

-Grafico de dispersión.

- Análisis de regresión.

-coeficiente de

correlación de pearson.

Asociación

entre

variables

V. Ind: :

Cuantitativa(s),

cualitativa(s)

Con V.Dep:

Cualitativa

EXPLICATIVA -Regresión Logística.

-Análisis Discriminante.

ESTADISTICA

222

PRUEBAS ESTADÍSTICAS DE ACUERDO A LA ESCALA DE MEDICIÓN DE LA

VARIABLE.

Tipo de

Descripción

Escala de la

variable

Método o Técnica Estadística.

Variables

individuales

Nominal -Prueba Z para una proporción

poblacional.

-Prueba de chi-cuadrado para varias

proporciones en una sola población.

-Intervalos de confianza para

proporciones.

-Prueba de McNemar,

-Prueba de Mantel Haenzel

Variables

individuales o

más de una

variable

Ordinales

-Prueba de signos o binomial para la

media poblacional.

-Pruebas de wilcoxon para rangos.

Prueba de U Mann Whitney( dos o más

poblaciones)

-Prueba de Kruskal Wallis.

-Prueba de Friedman.

Variables

individuales

Intercalar o de

razón.

-Prueba de t para una media poblacional.

-intervalos de confianza.

Mas de una

variables

Intercalar o de

razón

-Prueba de hipotes e intervalos de

confianza para diferencia de medias.

-Prueba de varianzas