7
Introducción El propósito fundamental que guía este trabajo es presentar el análisis de asociación como una técnica estadística de apoyo para la investigación social. La búsqueda de este objetivo nos remite de lleno al tema de la relación entre teoría e información ‘ en la investigación social. Es imprescindible referirnos a algunos aspectos involucrados en el vínculo entre teoría e información estadística. La relación entre teoría y estadística suele darse en varios momentos a lo largo de una investigación; a veces predominan las consideraciones teóricas y otras las estadísticas. EI análisis de asociación es un instrumento estadístico concebido para analizar relaciones entre variables ligadas a las relaciones entre conceptos planteadas en el campo teórico. En estadística se da el nombre genérico de variable a la resultante del proceso que conecta los conceptos teóricos con los indicadores (información susceptible de tratarse estadísticamente). Por tanto, hay una conexión entre la variable estadística y el concepto que nos servirá para establecer el vínculo que nos interesa. En efecto, si a partir de los desarrollos teóricos establecemos el conjunto de conexiones lógicas que les corresponden (que denominaremos proposiciones teóricas) y hacemos explícitos los pasos que ligan los conceptos con las variables estadísticas (es decir, con los índices e indicadores) entonces a cada relación entre dos o más conceptos corresponderá una relación análoga entre dos o más variables (que en este texto denominamos proposición empírica). Hemos sostenido que en el proceso de investigación es usual que haya múltiples puntos de contacto entre la teoría y el manejo estadístico de la información. En efecto, nuestra imagen del proceso es muy diferente; para nosotros la investigación empírica (es decir, el tipo de investigación que incorpora a los indicadores e índices provenientes de la realidad de manera sistemática y no a título de mero ejemplo) avanza sobre la base de la discordancia entre teoría e información. En nuestra concepción el vínculo que liga teoría y realidad es esencialmente dinámico. El orden de la exposición de los

Fernando Cortes_Metodos Estadísitocos Aplicados a La Investigación en Ciencias Sociales

Embed Size (px)

DESCRIPTION

texto de fernado cortés sobre los métodos estadísticos

Citation preview

Page 1: Fernando Cortes_Metodos Estadísitocos Aplicados a La Investigación en Ciencias Sociales

Introducción

El propósito fundamental que guía este trabajo es presentar el análisis de asociación como una técnica estadística de apoyo para la investigación social. La búsqueda de este objetivo nos remite de lleno al tema de la relación entre teoría e información ‘ en la investigación social. Es imprescindible referirnos a algunos aspectos involucrados en el vínculo entre teoría e información estadística.

La relación entre teoría y estadística suele darse en varios momentos a lo largo de una investigación; a veces predominan las consideraciones teóricas y otras las estadísticas.

EI análisis de asociación es un instrumento estadístico concebido para analizar relaciones entre variables ligadas a las relaciones entre conceptos planteadas en el campo teórico.

En estadística se da el nombre genérico de variable a la resultante del proceso que conecta los conceptos teóricos con los indicadores (información susceptible de tratarse estadísticamente). Por tanto, hay una conexión entre la variable estadística y el concepto que nos servirá para establecer el vínculo que nos interesa. En efecto, si a partir de los desarrollos teóricos establecemos el conjunto de conexiones lógicas que les corresponden (que denominaremos proposiciones teóricas) y hacemos explícitos los pasos que ligan los conceptos con las variables estadísticas (es decir, con los índices e indicadores) entonces a cada relación entre dos o más conceptos corresponderá una relación análoga entre dos o más variables (que en este texto denominamos proposición empírica).

Hemos sostenido que en el proceso de investigación es usual que haya múltiples puntos de contacto entre la teoría y el manejo estadístico de la información. En efecto, nuestra imagen del proceso es muy diferente; para nosotros la investigación empírica (es decir, el tipo de investigación que incorpora a los indicadores e índices provenientes de la realidad de manera sistemática y no a título de mero ejemplo) avanza sobre la base de la discordancia entre teoría e información.

En nuestra concepción el vínculo que liga teoría y realidad es esencialmente dinámico. El orden de la exposición de los resultados de una investigación no constituye su historia real. El proceso de investigación está lleno de avances y retrocesos. La investigación raras veces avanza linealmente. Representarlo gráficamente deberíamos recurrir a una espiral.

1) En el dominio de la teoría hay una serie de conceptos que no pueden observarse o que no es posible poner en correspondencia con lo empírico. 2) Estos son susceptibles de ponerse en correspondencia con la información a través de su objetivación en conceptos observables. 3) El concepto se liga con la realidad a través de indicadores. A partir de este tipo de conceptos se recorta un segmento de la realidad y de la interacción surge la información. La información estadística (susceptible de tratarse con el análisis de asociación) es el resultado del registro empírico de los indicadores. 4) Hay que notar que la noción de indicador se refiere a un elemento que surge de la realidad y que está vinculado a un concepto observable. Sus propiedades son que existe en el mundo empírico y que es susceptible de registrarse. Además, todo indicador forma parte de una relación. La materia prima para la estadística son los indicadores, a los que se denomina variables. La

Page 2: Fernando Cortes_Metodos Estadísitocos Aplicados a La Investigación en Ciencias Sociales

estadística no considera el componente relacional del indicador. Esto quiere decir que para utilizar el conocimiento estadístico en el proceso de la investigación en general, y de la social en particular, es necesario llenar de contenido teórico a las variables. En la investigación social es lo habitual que a un concepto se le asocie más de un indicador. 5) Una idea general que se desprende de la gráfica es que las variables solo tienen sentido si están relacionadas con un cuerpo teórico. Los indicadores o los índices son referentes empíricos de los conceptos observables. Las variables que reflejan propiedades observables de las unidades para las cuales se registra la información sólo tienen pleno sentido cuando se llenan de contenido conceptual.

Nos preocuparemos por destacar cómo las proposiciones empíricas orientan el análisis estadístico de la información. Analizaremos en abstracto el punto en que se establece el vínculo entre el mundo de la teoría y el de la información. Por abstracto queremos significar no referirlo a ningún momento preciso dentro del proceso de investigación.

No suponemos que en el proceso de investigación lo empírico esté determinado por lo teórico, sino que se justifica en gran medida porque es la óptica que nos pareció razonable para incorporar el material de investigación que sirve de base a los desarrollos propiamente estadísticos y porque, además, es una manera simple de introducir al estudioso de la estadística en las complejidades del uso de esta técnica en la investigación en ciencias sociales. Para observar la homogeneidad/heterogeneidad de la fuerza de trabajo Nun toma como indicador el grado de calificación que tenían al momento del despido los obreros de algunas plantas automovilísticas de Buenos Aires, usa el tipo de ocupación al momento del estudio como indicador de la segmentación del mercado de trabajo. La calificación laboral origina una variable que clasifica a los obreros despedidos según tengan o no calificación (variable dicotómica), mientras que la ocupación distingue entre ocupaciones en la industria y en los servicios. Las primeras se abren en ocupaciones dependientes en plantas industriales, grandes, que proveen los puestos estables y bien remunerados, y en plantas pequeñas en las que se pagan salarios bajos y los empleos son poco estables. El primer tipo de ocupación es el característico del mercado de trabajo primario y el segundo el del secundario. Si interesase analizar por separado los procesos de segmentación del mercado de trabajo y el de homogeneidad/heterogeneidad de la fuerza de trabajo bastaría con analizar la información de cada indicador también por separado. Sin embargo, en el último párrafo de la larga cita de Nun se plantea la hipótesis de que mientras mayor sea la calificación del obrero despedido, más probable es que reingrese a las plantas fabriles. Esto quiere decir que al nivel de los conceptos se plantea una clara relación entre la heterogeneidad de la fuerza de trabajo y su acceso a los mercados.

Es a partir de estas consideraciones que Marín se preocupa por el análisis empírico de las proposiciones ideológicas dominantes. Basa su estudio en información periodística que le permite dar cuenta de 8 509 hechos armados acontecidos en Argentina de mayo de 1973 a marzo de 1976. A pesar de que somete a contrastación varias proposiciones ideológicas nosotros sólo incluiremos a título de ilustración la que subyace al cuadro 3 del mencionado estudio. La primera proposición que analiza (proposición teórica) establece una relación entre fuerza social y tipo de violencia. El primer concepto lo objetiva en el de acción social y el segundo en acción contra el cuerpo. De manera que la proposición empírica consistente con la proposición ‘ teórica sostendría que existiría una relación entre la acción social y la acción contra el cuerpo.

Page 3: Fernando Cortes_Metodos Estadísitocos Aplicados a La Investigación en Ciencias Sociales

El concepto observable acción social lo dicotomiza en acción subversiva y antisubversiva y la acción contra el cuerpo la divide en dos categorías: las que producen bajas y las que no las producen.

Estableceremos las proposiciones teóricas y las relaciones con sus correspondientes proposiciones empíricas y a partir de estas últimas se derivará la distribución esperada de las observaciones que contrastada con la distribución observada, nos entregará criterios para juzgar el grado de concordancia entre la teoría y los datos.

Consideraciones sobre el uso de la estadística en las ciencias sociales. Estar a la moda o pensar un poco.

INTRODUCCIÓN

Los análisis (una serie de tabulaciones cruzadas) son realmente poco sofisticados dada la cantidad de datos disponibles. La investigación social se ha caracterizado, entre otros rasgos, por la aplicación de técnicas de moda.

En los estados unidos, entre los años 50 y 60, se utilizaban profusamente métodos estadísticos para realizar clasificaciones (análisis factorial, de conglomerados, discriminante) y analizar relaciones entre variables (regresión, correlación, análisis de contingencia y de asociación).

En los años 60 se popularizó el entonces llamado análisis causal, que se percibía como una generalización del análisis multivariado y que tuvo un fuerte impacto sobre la investigación social. Pasó a tomar el nombre con el cual se le conoce hasta hoy: análisis de trayectorias o de senderos. En este método, las complejidades de cálculo no superaban a las del análisis de regresión.

Por la misma época se desarrolla una generalización del análisis multivariado (modelo loglineal) que permite modelar un conjunto de relaciones entre variables no métricas (años 80).

En lugar de seguir la moda se puede tomar en cuenta la diversidad de criterios que se han propuesto para orientar la selección de “el mejor” método estadístico. La información que se obtiene a través de métodos antropológicos (observación participante, directa, historia oral, filmación…) no es susceptible, se dice, de análisis cuantitativo. Es cierto que presenta dificultades particulares pero no son un impedimento insoslayable para aplicar la estadística.

El uso adecuado de los instrumentos estadísticos en una investigación requiere también identificar el isomorfismo entre las estructuras lógicas de la técnica y de las respuestas provisorias (hipótesis) a las preguntas que orientan la investigación. Sostenemos que no basta considerar únicamente el nivel de medición de las variables y los procedimientos de observación, sino que, además, debe examinarse la concordancia entre las preguntas de investigación, las hipótesis de trabajo expresadas en términos de relaciones entre las observaciones o entre las variables y las técnicas que ofrecen diversas posibilidades para el análisis empírico de dichas relaciones.

El nivel de medición de las variables, los procedimientos que generaron los datos y las relaciones entre variables derivadas de las preguntas de investigación no necesariamente

Page 4: Fernando Cortes_Metodos Estadísitocos Aplicados a La Investigación en Ciencias Sociales

conducen a la selección de una técnica estadística en particular, aunque si delimitan un subconjunto de ellas.

La coincidencia entre el uso razonado de la estadística (que lleva en sí la correspondencia entre los planteamientos teóricos, las preguntas de investigación, los métodos y técnicas empleadas para recopilar la información y los modelos estadísticos) y la aplicación de moda sólo pueden ser un hecho fortuito.

En este trabajo nos proponemos mostrar una gama de técnicas estadísticas que expondremos desde el punto de vista de la correspondencia de sus estructuras con las estructuras de las relaciones entre observaciones y entre variables propuestas por los esquemas teóricos.

MATRIZ DE DATOS: punto de encuentro entre las operaciones teóricas, metodológicas y estadísticas.

El análisis estadístico procede sólo si se dispone de un conjunto de mediciones de los atributos de las unidades de observación (o unidades de análisis o casos). Para cada una de ellas se registran, con el fin de caracterizarlas, una serie de rasgos o propiedades que se denominan variables.Nosotros preferimos llamar unidades de registro a las unidades cuyos atributos se han registrado, con el fin de enfatizar que los datos no surgen de una percepción casi inmediata sino de operaciones que se apoyan en consideraciones teóricas y técnicas. Las unidades de registro y las variables se ordenan en la matriz de datos, que no es más que un arreglo rectangular con tantos renglones como unidades haya y con una columna para cada variable. Las casillas de la matriz, definidas por la intersección de renglones y columnas contienen “los valores” de las variables.

Las variables de la matriz de datos corresponden a los indicadores de los conceptos teóricos.La medición engloba tanto la operacionalización de conceptos como la confiabilidad y validez de los indicadores. La calidad de los indicadores se juzga por su grado de consistencia, estabilidad o precisión y por la certidumbre de que miden lo que queremos medir.Cuando se tiene más de un indicador para un concepto se presenta el problema de sintetizar la información.La matriz de datos es independiente de las fuentes de información y de los métodos e instrumentos con que ésta se registre. Lo que sí es esencial es que los datos sean numéricos, entendiendo por ello tanto los números que corresponden a variables métricas como los que pueden asociarse como códigos a variables no métricas.Tampoco importa si la cobertura del estudio es censal o muestral. La aleatoriedad incorporada a la mayoría de las técnicas estadísticas multivariadas, se justifica no sólo por la selección de las unidades de registro a través del muestreo aleatorio, sino también por la imposibilidad de considerar todos los factores asociados a un fenómeno.No es trivial decidir cuál o cuáles son las unidades de registro pertenecientes al problema que se investiga.Las operaciones que habitualmente se aplican a la matriz de datos no se agotan en la eliminación de os indicadores que no pasaron las pruebas de confiabilidad y validez, ni en la construcción de índices sino que, en ocasiones, la investigación requiere transformar las unidades de registro. En estos casos se aprecia el doble carácter de las unidades de registro: son tales en cuanto sirvieron

Page 5: Fernando Cortes_Metodos Estadísitocos Aplicados a La Investigación en Ciencias Sociales

de base al registro empírico pero sólo constituirán unidades de análisis en tanto sean las relevantes para la teoría.Se presenta una complicación adicional cuando la investigación requiere del manejo estadístico simultáneo de unidades de registro heterogéneas, que deben combinarse en una única matriz de datos que refiera todas las variables a una misma unidad de análisis. En los casos en que la estratificación se basa en pocas variables se pueden aplicar procedimientos estadísticos relativamente simples: representación gráfica, comparación de promedios y descomposición de varianza; pero cuando son muchas, estos métodos no son eficientes y se requiere de algunos más elaborados: análisis de conglomerados, análisis discriminante, etc.

Debemos hacer notar que la matriz de datos experimenta sucesivas transformaciones. Las transformaciones aparecen como “casi naturales” si la investigación se conceptúa como un proceso que combina fases de continuidad con rupturas y reordenaciones, es decir, como un proceso caótico.