View
223
Download
0
Category
Preview:
Citation preview
Mapa
I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal IV. Análisis causal y Efectos Tratamiento
2
1. Motivación
• Las preguntas empíricas más difíciles en ciencias sociales y en políticas públicas involucran relaciones causa-efecto del tipo:
– ¿Mejora la descentralización de las escuelas la calidad de la
educación? – ¿Un año de capacitación causa mayores ingresos? Y, más
importante quizás, ¿qué tipo de capacitación causa mayores aumentos de ingresos?
– ¿Mejoran las transferencias condicionadas los resultados de salud y educación de los niños? O, ¿lo hacen porque condicionan o porque entregan dinero adicional?
3
• Responder estas preguntas es importante porque:
– Ayudan a responder preocupaciones de política • ¿Logran los programas reducir la pobreza? ¿Podrían
reducirla más rápido con los mismos recursos?
– Problemas que enfrentan los tomadores de decisiones
– Consideraciones teóricas de estudio en ciencias sociales
4
1. Motivación
2. ¿Cómo responder las preguntas?: Evaluación de Impacto
El impacto de un programa es la diferencia entre:
1. Los resultados que los participantes del programa obtienen un tiempo después de participar en el programa y
2. Los resultados que esos mismos participantes hubieran obtenido en ese mismo momento si no hubiesen participado en el programa.
• Tomamos la diferencia entre Qué ocurrió (con el programa) y
- Qué habría ocurrido (sin el programa) = IMPACTO del programa
• Este último escenario se denomina el contrafactual
7
2.1. Evaluación de impacto
• El contrafactual representa el estado del mundo que participantes del programa habrían experimentado en la ausencia del programa
• Problema: No se puede observar el contrafactual • Solución: Tenemos que “replicar” o “construir” el
contrafactual
2.2. Contrafactual
3.1. Análisis estadístico estándar
• Herramientas: probabilidad y otras técnicas de estimación
• Objetivo: inferir parámetros de una distribución a partir de muestras de esta distribución
• Uso: Con la ayuda de los parámetros, uno puede: – Inferir asociación entre variables, – Estimar probabilidad de ocurrencia de eventos pasados o
futuros – Actualizar pro;
• Condición: las condiciones experimentales no pueden cambiarse
13
3.2. Análisis causal
• Va un paso más allá que el análisis estadístico estándar
• Objetivo: inferir aspectos del proceso de generación de datos
• Uso: Con la ayuda de tales aspectos, se puede: – Deducir la probabilidad de ocurrencia si el contexto no
cambia (análisis “estático”) – Predecir como cambian las variables si cambia el contexto
(análisis “dinámico”)
14
• La idea de dinámica de los eventos cuando cambian las condiciones incluye: – Predecir los efectos de intervenciones – Predecir los efectos de cambios espontáneos – Identificar las causas de los eventos
• Distinción entre causalidad y correlación – Nuevo lenguaje – Causalidad es la clave para decisiones de políticas
• ¿Si hacemos XXX, lograremos YYYY? No basta con saber que XXX está asociado con YYY…
15
3.2. Análisis causal
3.2.1. Modelo Causal de Neyman (1923), Rubin (1974)
• Modelo de resultados potenciales • Definamos a la población por la letra U.
– Cada unidad en U se denota u.
• Para cada u ϵ U: – Y(u): variable de respuesta – A: atributo de las unidades en U.
• Idea: exponer a cada unidad a la acción de una causa • Rubin asume que las causas son acciones que,
hipotéticamente, podrían ser tratamientos
16
3.2.2. Modelo Causal y tratamientos
• Supongamos, por simplicidad que hay sólo 2 causas o niveles de tratamiento.
• Sea D una variable que indica la causa a la que cada unidad en U es expuesta:
• En un estudio controlado, D es construido por el experimentador/evaluador
• En un estudio no controlado, D es determinado por factores que van más allá del experimentador/evaluador
17
= control al expuesta es unidad la si0
to tratamienal expuesta es unidad la si1uu
D
Mapa
I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal IV. Análisis causal y Efectos Tratamiento
18
4.1. Modelo Causal y tratamientos
• Y son afectados potencialmente por t o c. • O sea puede haber 2 variables de respuesta para el
mismo u: – Y1(u): valor de la respuesta si la unidad u fuera expuesta al
tratamiento. – Y0(u) : valor de la respuesta si la unidad u fuera expuesta al
control.
• Entonces, el resultado de cada individuo puede ser escrito como (si es que no hay externalidades):
19
( ) )(1)()( 01 uYDuDYuY −+=
• Tomamos la diferencia entre Qué ocurrió (con el programa) y
- Qué habría ocurrido (sin el programa) = IMPACTO del programa
• Este último escenario se denomina el contrafactual
• ¿Cómo se traduce esto al lenguaje del modelo causal de Rubin?
20
4.2. Evaluación de Impacto y modelo causal
4.3. Modelo Causal y evaluación de impacto
• Para cada unidad u, el tratamiento causa: • Problema Fundamental de Inferencia Causal:
– Para el mismo u, no se puede observar Y1(u) y Y0(u)
• O sea no tenemos el contrafactual para cada u – Un individuo no puede estar al mismo tiempo recibiendo y
no recibiendo el tratamiento…
• ¿Qué hacemos?
21
)()( 01 uYuYu −=δ
• ¿Y el efecto causal en promedio? • El efecto tratamiento promedio (ATE) sobre U (o una sub-
población de U es):
• O sea la solución estadística reemplaza el efecto causal a nivel de cada unidad por el efecto causal promedio en una población de U unidades.
22
[ ][ ] [ ]
δ=
−=
−=−=
01
01
01
)()()()(
YY
uYEuYEuYuYEATE
UU
UU
4.3. Modelo Causal y evaluación de impacto
• Obviamente las esperanzas de Y1(u) y Y0(u) no pueden ser calculadas pero sí estimadas…
• Los métodos econométricos de evaluación de impacto intentan construir (bajo diferentes supuestos) estimaciones con consistentes de:
• La “bondad” de estos estimadores se define justamente por la razonabilidad/plausibilidad de los supuestos utilizados.
23
[ ] [ ] 0011 )(y )( YuYEYuYE UU ==
4.3. Modelo Causal y evaluación de impacto
• Obviamente las esperanzas de Y1(u) y Y0(u) no pueden ser calculadas pero sí estimadas…
• Los métodos econométricos de evaluación de impacto intentan construir (bajo diferentes supuestos) estimaciones con consistentes de:
• La “bondad” de estos estimadores se define justamente por la razonabilidad/plausibilidad de los supuestos utilizados.
24
[ ] [ ] 0011 )(y )( YuYEYuYE UU ==
4.3. Modelo Causal y evaluación de impacto
• Entonces consideremos estimar:
• Usando el siguiente estimador: • (1) está definida para la población • (2) se estima usando una muestra de la población
25
[ ](1)
)()(
01
01
YY
uYuYEATE UU
−=
−=
[ ] [ ] (2) 0|ˆ1|ˆˆ01 =−== DYDYδ
δ̂
4.3. Modelo Causal y evaluación de impacto
• Sea π la proporción de la población asignada al grupo tratamiento
• Entonces ATE se puede descomponer como:
26
{ } ( ) { }
[ ] ( )[ ][ ] ( )[ ]{ }
[ ] ( )[ ]{ }0|11|
0|11|
0|11|
1
00
11
0101
01
=−+=
−=−+==
=−−+=−=
−+= ==
DYDY
DYDY
DYYDYYDD
ππ
ππ
ππ
δπδπδ
4.3. Modelo Causal y evaluación de impacto
• Supongamos que:
• Entonces:
• Lo que se puede estimar de modo consistente por:
27
[ ] [ ][ ] [ ]0|1|
y 0|1|
00
11
===
===
DYDY
DYDY
[ ] ( )[ ]{ }[ ] ( )[ ]{ }
[ ] [ ]0|1|
0|11|
0|11|
01
00
11
=−==
=−+=
−=−+==
DYDY
DYDY
DYDY
ππ
ππδ
[ ] [ ] (2) 1|ˆ1|ˆˆ01 =−== DYDYδ
4.3. Modelo Causal y evaluación de impacto
• ¿Tienen sentido
• O sea: – El resultado promedio:
• Bajo el tratamiento no difiere en entre los grupos de tratamiento y control • Bajo el control no difiere en entre los grupos de tratamiento y control
• Para satisfacer estas condiciones es suficiente que la asignación del tratamiento D no esté correlacionada con los resultados potenciales de Y1(u) y Y0(u)
• La forma principal de lograr esta no-correlación es a través de la asignación aleatoria del tratamiento. – En la siguiente clase hablaremos de esto con más detalle.
28
[ ] [ ][ ] [ ]0|1|
y 0|1|
00
11
===
===
DYDY
DYDY
4.3. Modelo Causal y evaluación de impacto
• En muchos casos simplemente no hay información disponible sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento – …y viceversa, como los del grupo tratamiento hubieran reaccionado si
hubiesen recibido el control…
• Ésta es la base para comprender los sesgos del estimador (2). • De hecho usando un poco de álgebra, se puede demostrar
que:
29
[ ] [ ]{ }( ) { } { }[ ]
to tratamienefecto de idadHeterogene
01
ientosin tratam Diferencia
00
1
0|1|ˆ
== −−+
=−=+=
DD
DYDY
δδπ
δδ
4.3. Modelo Causal y evaluación de impacto
• Dos grandes fuentes de sesgo de selección: 1. Sesgo de selección 2. Heterogeneidad en los efectos del tratamiento
• La mayoría de los métodos disponibles se enfocan en 1.,
asumiendo que los efectos tratamiento son homogéneos en la población (o redefiniendo los parámetros de interés en la población)
[ ] [ ]{ } ( ) { } { }[ ]
nto tratamieefecto de idadHeterogene
01
mientosin trata Diferencia
00 10|1|ˆ== −−+=−=+= DDDYDY δδπδδ
4.3. Modelo Causal y evaluación de impacto
4.4. Otros parámetros de interés
• ATE no siempre es el parámetro de interés de política pública. • En ocasiones, por ejemplo, interesa más el efecto tratamiento
promedio para la persona bajo intervención, o sea:
• Notar que la diferencia entre ATE y TOT sólo tiene sentido si hay heterogeneidad en los efectos tratamiento en la población U (si no, todos son iguales…)
31
[ ][ ] [ ]1|)(1|)(
1|)()(
01
01
=−===−=
DuYEDuYEDuYuYETOT
• ¿Cuándo nuestro estimador (2) estima consistentemente TOT?
• Como es evidente, este estimador lo hace bien si:
32
[ ] [ ] (2) 0|ˆ1|ˆˆ01 =−== DYDYδ
[ ] [ ] 0|1| 00 === DYDY
4.4. Otros parámetros de interés
• En algunas situaciones de políticas pública interesa conocer el efecto promedio de ofrecer el programa (ITT)
– ¿“Qué le ocurrió al niño promedio que está en una escuela tratada en
esta población?” – “¿Qué le ocurrió a la persona promedio que recibió una oferta del
tratamiento?”
• Suponga que la intención de tratar ¿Es este el número adecuado a buscar?, ¿Es el efecto del tratamiento?
• La lógica es exactamente la misma que en los estimadores
previos pero en este caso D=1 refleja la oferta del tratamiento y no que las personas hayan sido efectivamente tratadas.
33
4.4. Otros parámetros de interés
Recommended