Inferencia causal -...

Inferencia causal Francisco Gallego PUC Chile y J-PAL Santiago, 9 de abril de 2013

I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal IV. Análisis causal y Efectos Tratamiento

1. Motivación

• Las preguntas empíricas más difíciles en ciencias sociales y en políticas públicas involucran relaciones causa-efecto del tipo:

– ¿Mejora la descentralización de las escuelas la calidad de la

educación? – ¿Un año de capacitación causa mayores ingresos? Y, más

importante quizás, ¿qué tipo de capacitación causa mayores aumentos de ingresos?

– ¿Mejoran las transferencias condicionadas los resultados de salud y educación de los niños? O, ¿lo hacen porque condicionan o porque entregan dinero adicional?

• Responder estas preguntas es importante porque:

– Ayudan a responder preocupaciones de política • ¿Logran los programas reducir la pobreza? ¿Podrían

reducirla más rápido con los mismos recursos?

– Problemas que enfrentan los tomadores de decisiones

– Consideraciones teóricas de estudio en ciencias sociales

1. Motivación

I. Motivación II. Evaluación de Impacto y Contrafactual

2. ¿Cómo responder las preguntas?: Evaluación de Impacto

El impacto de un programa es la diferencia entre:

1. Los resultados que los participantes del programa obtienen un tiempo después de participar en el programa y

2. Los resultados que esos mismos participantes hubieran obtenido en ese mismo momento si no hubiesen participado en el programa.

• Tomamos la diferencia entre Qué ocurrió (con el programa) y

- Qué habría ocurrido (sin el programa) = IMPACTO del programa

• Este último escenario se denomina el contrafactual

2.1. Evaluación de impacto

2.1.2. Impacto: ¿Qué es?

Tiempo

Impacto

Intervención

Tiempo

Intervención

2.1.3. ¿Cómo Evaluar Impacto?

Impacto

Tiempo

Intervención

Impacto

2.1.3. ¿Cómo Evaluar Impacto?

• El contrafactual representa el estado del mundo que participantes del programa habrían experimentado en la ausencia del programa

• Problema: No se puede observar el contrafactual • Solución: Tenemos que “replicar” o “construir” el

contrafactual

2.2. Contrafactual

I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal

3.1. Análisis estadístico estándar

• Herramientas: probabilidad y otras técnicas de estimación

• Objetivo: inferir parámetros de una distribución a partir de muestras de esta distribución

• Uso: Con la ayuda de los parámetros, uno puede: – Inferir asociación entre variables, – Estimar probabilidad de ocurrencia de eventos pasados o

futuros – Actualizar pro;

• Condición: las condiciones experimentales no pueden cambiarse

3.2. Análisis causal

• Va un paso más allá que el análisis estadístico estándar

• Objetivo: inferir aspectos del proceso de generación de datos

• Uso: Con la ayuda de tales aspectos, se puede: – Deducir la probabilidad de ocurrencia si el contexto no

cambia (análisis “estático”) – Predecir como cambian las variables si cambia el contexto

(análisis “dinámico”)

• La idea de dinámica de los eventos cuando cambian las condiciones incluye: – Predecir los efectos de intervenciones – Predecir los efectos de cambios espontáneos – Identificar las causas de los eventos

• Distinción entre causalidad y correlación – Nuevo lenguaje – Causalidad es la clave para decisiones de políticas

• ¿Si hacemos XXX, lograremos YYYY? No basta con saber que XXX está asociado con YYY…

3.2. Análisis causal

3.2.1. Modelo Causal de Neyman (1923), Rubin (1974)

• Modelo de resultados potenciales • Definamos a la población por la letra U.

– Cada unidad en U se denota u.

• Para cada u ϵ U: – Y(u): variable de respuesta – A: atributo de las unidades en U.

• Idea: exponer a cada unidad a la acción de una causa • Rubin asume que las causas son acciones que,

hipotéticamente, podrían ser tratamientos

3.2.2. Modelo Causal y tratamientos

• Supongamos, por simplicidad que hay sólo 2 causas o niveles de tratamiento.

• Sea D una variable que indica la causa a la que cada unidad en U es expuesta:

• En un estudio controlado, D es construido por el experimentador/evaluador

• En un estudio no controlado, D es determinado por factores que van más allá del experimentador/evaluador

= control al expuesta es unidad la si0

to tratamienal expuesta es unidad la si1uu

I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal IV. Análisis causal y Efectos Tratamiento

4.1. Modelo Causal y tratamientos

• Y son afectados potencialmente por t o c. • O sea puede haber 2 variables de respuesta para el

mismo u: – Y1(u): valor de la respuesta si la unidad u fuera expuesta al

tratamiento. – Y0(u) : valor de la respuesta si la unidad u fuera expuesta al

control.

• Entonces, el resultado de cada individuo puede ser escrito como (si es que no hay externalidades):

( ) )(1)()( 01 uYDuDYuY −+=

• Tomamos la diferencia entre Qué ocurrió (con el programa) y

- Qué habría ocurrido (sin el programa) = IMPACTO del programa

• Este último escenario se denomina el contrafactual

• ¿Cómo se traduce esto al lenguaje del modelo causal de Rubin?

4.2. Evaluación de Impacto y modelo causal

4.3. Modelo Causal y evaluación de impacto

• Para cada unidad u, el tratamiento causa: • Problema Fundamental de Inferencia Causal:

– Para el mismo u, no se puede observar Y1(u) y Y0(u)

• O sea no tenemos el contrafactual para cada u – Un individuo no puede estar al mismo tiempo recibiendo y

no recibiendo el tratamiento…

• ¿Qué hacemos?

)()( 01 uYuYu −=δ

• ¿Y el efecto causal en promedio? • El efecto tratamiento promedio (ATE) sobre U (o una sub-

población de U es):

• O sea la solución estadística reemplaza el efecto causal a nivel de cada unidad por el efecto causal promedio en una población de U unidades.

[ ][ ] [ ]

−=−=

)()()()(

uYEuYEuYuYEATE

• Obviamente las esperanzas de Y1(u) y Y0(u) no pueden ser calculadas pero sí estimadas…

• Los métodos econométricos de evaluación de impacto intentan construir (bajo diferentes supuestos) estimaciones con consistentes de:

• La “bondad” de estos estimadores se define justamente por la razonabilidad/plausibilidad de los supuestos utilizados.

[ ] [ ] 0011 )(y )( YuYEYuYE UU ==

• Obviamente las esperanzas de Y1(u) y Y0(u) no pueden ser calculadas pero sí estimadas…

• Los métodos econométricos de evaluación de impacto intentan construir (bajo diferentes supuestos) estimaciones con consistentes de:

• La “bondad” de estos estimadores se define justamente por la razonabilidad/plausibilidad de los supuestos utilizados.

[ ] [ ] 0011 )(y )( YuYEYuYE UU ==

• Entonces consideremos estimar:

• Usando el siguiente estimador: • (1) está definida para la población • (2) se estima usando una muestra de la población

[ ](1)

uYuYEATE UU

[ ] [ ] (2) 0|ˆ1|ˆˆ01 =−== DYDYδ

• Sea π la proporción de la población asignada al grupo tratamiento

• Entonces ATE se puede descomponer como:

{ } ( ) { }

[ ] ( )[ ][ ] ( )[ ]{ }

[ ] ( )[ ]{ }0|11|

=−+=

−=−+==

=−−+=−=

−+= ==

DYYDYYDD

δπδπδ

• Supongamos que:

• Entonces:

• Lo que se puede estimar de modo consistente por:

[ ] [ ][ ] [ ]0|1|

y 0|1|

[ ] ( )[ ]{ }[ ] ( )[ ]{ }

[ ] [ ]0|1|

=−==

=−+=

−=−+==

ππδ

[ ] [ ] (2) 1|ˆ1|ˆˆ01 =−== DYDYδ

• ¿Tienen sentido

• O sea: – El resultado promedio:

• Bajo el tratamiento no difiere en entre los grupos de tratamiento y control • Bajo el control no difiere en entre los grupos de tratamiento y control

• Para satisfacer estas condiciones es suficiente que la asignación del tratamiento D no esté correlacionada con los resultados potenciales de Y1(u) y Y0(u)

• La forma principal de lograr esta no-correlación es a través de la asignación aleatoria del tratamiento. – En la siguiente clase hablaremos de esto con más detalle.

[ ] [ ][ ] [ ]0|1|

y 0|1|

• En muchos casos simplemente no hay información disponible sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento – …y viceversa, como los del grupo tratamiento hubieran reaccionado si

hubiesen recibido el control…

• Ésta es la base para comprender los sesgos del estimador (2). • De hecho usando un poco de álgebra, se puede demostrar

[ ] [ ]{ }( ) { } { }[ ]

to tratamienefecto de idadHeterogene

ientosin tratam Diferencia

0|1|ˆ

== −−+

=−=+=

δδπ

• Dos grandes fuentes de sesgo de selección: 1. Sesgo de selección 2. Heterogeneidad en los efectos del tratamiento

• La mayoría de los métodos disponibles se enfocan en 1.,

asumiendo que los efectos tratamiento son homogéneos en la población (o redefiniendo los parámetros de interés en la población)

[ ] [ ]{ } ( ) { } { }[ ]

nto tratamieefecto de idadHeterogene

mientosin trata Diferencia

00 10|1|ˆ== −−+=−=+= DDDYDY δδπδδ

4.4. Otros parámetros de interés

• ATE no siempre es el parámetro de interés de política pública. • En ocasiones, por ejemplo, interesa más el efecto tratamiento

promedio para la persona bajo intervención, o sea:

• Notar que la diferencia entre ATE y TOT sólo tiene sentido si hay heterogeneidad en los efectos tratamiento en la población U (si no, todos son iguales…)

[ ][ ] [ ]1|)(1|)(

1|)()(

=−===−=

DuYEDuYEDuYuYETOT

• ¿Cuándo nuestro estimador (2) estima consistentemente TOT?

• Como es evidente, este estimador lo hace bien si:

[ ] [ ] (2) 0|ˆ1|ˆˆ01 =−== DYDYδ

[ ] [ ] 0|1| 00 === DYDY

• En algunas situaciones de políticas pública interesa conocer el efecto promedio de ofrecer el programa (ITT)

– ¿“Qué le ocurrió al niño promedio que está en una escuela tratada en

esta población?” – “¿Qué le ocurrió a la persona promedio que recibió una oferta del

tratamiento?”

• Suponga que la intención de tratar ¿Es este el número adecuado a buscar?, ¿Es el efecto del tratamiento?

• La lógica es exactamente la misma que en los estimadores

previos pero en este caso D=1 refleja la oferta del tratamiento y no que las personas hayan sido efectivamente tratadas.

Inferencia causal -...

Documents

blogjgh.files.wordpress.comFalacias lógicas La lóuica de la comprobación de hipótesis 4.1. Fuentes de hipótesis 4.2. Pasos en la comprobación de las hipótesis Inferencia causal

La inferencia causal: Condiciones necesarias para ...finsalud.com/wp-content/uploads/2016/10/Inferencia_Causal_Alfonso-Muriel.pdfLa inferencia causal: Condiciones necesarias para argumentar

Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

Cálculo del estimador de diferencias en diferencias ... · 2 RESUMEN : El estimador de diferencias en diferencias es un método de estimación de la inferencia causal estadística

Causal inference - pubdocs.worldbank.orgpubdocs.worldbank.org/.../13-b-Technical-Causal-Inference-Leite-ENG… · Fundamental problem of causal inference o For a given unit u, we

Inferencia Estadística - Introducción · Inferencia Métodosdeinferenciaestadística: Clásico Bayesiano Inferencia: Estimación Puntual Intervalos Pruebasdehipótesis EdimerDavidJaramillo-Bioestadística1

Inferencia tema4

Inferencia causal y métodos quasi-experimentalessiteresources.worldbank.org/INTDEVIMPEVAINI/...Inferencia causal y métodos quasi-experimentales DAVID EVANS BANCO MUNDIAL ieGovern

Causalidad e Inferencia Causal

CENTRO UNIVERSITARIO DE LOS ALTOS DIVISIÓN … · Epidemiología Moderna. Inferencia causal en epidemiología. Ediciones Diaz de Santos. Madrid. 1987. pp 11-27. Jenicek M. Epidemiología

Inferencia porque

Interpretando la Inferencia Causal - GEDIC · PDF filede diseño o en el análisis de los resultados . Enfrentando los “confundidores” (relación efecto-efecto) durante la fase

Introducción a la Inferencia Estadística - unex.es · inferencia paramétrica e inferencia no paramétrica. Inferencia paramétrica ... la distribución de probabilidad correspondiente

La inferencia causal VictoriaZunzuneguifinsalud.com/wp-content/uploads/2016/10/La-inferen... · La fracción de casos legalmente atribuible (AJPH 2014;104(8):e60- e66)• Algunos

Process Tracing: Induction, Deduction, and Causal Inference · PROCESS TRACING. INDUCCIÓN, DEDUCCIÓN E INFERENCIA CAUSAL 663 ya que las inferencias causales construidas en estos

Método Científico, Método Epidemiológico e Inferencia Causal en Epidemiología

INFERENCIA CAUSAL Y ANLISIS COMPARADO: NUEVAS …metodos-avanzados.sociales.uba.ar/wp-content/... · INFERENCIA CAUSAL Y ANÁLISIS COMPARADO: NUEVAS TENDENCIAS CUALITATIVAS ... un

Inferencia Causal y Analisis Comparado Lucas Jolia

Inferencia estadistica.para.economia.y.administracion.de.empresas

Inferencia Bayesiana