Upload
buitu
View
223
Download
1
Embed Size (px)
Citation preview
Minicurso
Introdução à Econometria Espacial
Prof. Gervásio F. Santos & Daniela Lima Ramos
Salvador, 14 de julho de 2014
Estrutura do Curso
• Informação espacializada e padrões espaciais
• O impulso teórico e a Nova Geografia Econômica
• As bases da Econometria Espacial?
• Sistema de Informações Geográficas (SIG)
• Análise Exploratória de Dados Espaciais
• Modelos Econométricos Espaciais
Informação espacializada e padrões espaciais
Saldo comercial industrial por Município - 2000
Crime no estado da Bahia
Fonte: Mapa da Violência, 2012
Existe um padrão espacial de ocorrência de homicídios no estado Bahia?
Retorno local à educação e habilidads no Brasil
Retornos da Educação nas Regioes Metropolitanas
Existe um padrão espacial de atração dos mais habilidosos no Brasil?
Fonte: Dissertação de Mestrado: Distribuição Espacial dos Efeitos dos Ganhos de Aglomeração
Sobre os Retornos à Educação no Brasil. Autora: Diana L. Gonzaga (2012)
Retornos da Educação, excluindo habilidades individais, nas Regioes Metropolitanas
Distribuição espacial da população de Salvadorpor cor/raça em 2010
Existe um padrão espacial de distribuição da população de Salvador por cor/raça?
Fonte: Censo 2010
As bases da Econometria Espacial?
Desenvolvimento Recente
• Os impulsos técnicos e teóricos em economia estão possibilitando que a interação entre agentes ou unidades espaciais possa ser medida
• Violações de pressupostos e aproximações entre diferentes abordagens teóricas em economia exigem cada vez mais das técnicas econométricas
• Teoria econômica: modelos sobre interação espacial, contágio, efeito spillover, externalidades, imitação, etc.
• Profusão de dados georreferenciados (GIS)
• Capacidade computacional
.. em busca do “espaço” na economia
• Von Thunen (1826): Modelo de uso da terra (a cidade isolada e abastecida porfazendeiros…custos de tranporte..
• Weber (1909) com o Triângulo de Localização e Hoteling (1926) com a análise dadistribuiçao geográfica de recursos naturais focalizam nas decisões estratégicas de localizaçao das empresas
• Alonso (1964): Resgata o modelo de Von Thunen substituindo fazendeiros portrabalhadores em seu caminho até o trabalho, e a cidade isolada por uma regiao comercialcentral….
• Hoover (1948): Associa o conceito de economias externas de Marshal à realidade daconcentraçao espacial
• Mills (1967): e Henderson (1974): introduz um modelo da economia como um sistemaurbano (coleção de cidades)
…..A modelagem da geografia econômica progrediu ao longo de dois caminhosindependentes. A Economia Urbana progrediu como parte da economia convencional, com uma modelagem meticulosa, mas negligenciou a explicação da formaçao das cidadese a relaçao espacial uma com a outra. … Proveniente da tradiçao Alemã, através dos seminários de Walter Isard (1956), a Ciência Regional, procurou desenvolver modelosvaliosos para planejamento (práticos), porém, pouco reconhecidos teoricamente entre oseconomistas por serem “descuidados” e vagos em relaçao às estruturas de mercado
A Nova Geografia Econômica e a Economia Espacial
• Dixit, A. and Stiglitz, J. (1977). Monopolistic competition and optimum product diversity. American Economic Review, 67, 297–308.
• Krugman, P. (1979) 'Increasing returns, monopolistic competition, and international trade'. Journal of International Economics 9, pp. 469–79. (NTT)
• Krugman, P. (1980) 'Scale economies, product differentiation, and the pattern of trade'. American Economic Review 70, pp. 950–59. (NTT)
• Krugman, P. (1991). Increasing returns and economic geography. Journal of Political Economy, 99, 484–99.
(NEG e o Modelo Centro-Periferia) - “O efeito do mercado doméstico” que Krugman descobriuna Nova Teoria do Comércio foi utilizado para a Nova Geografia Econômica , que explicaaglomercação como resultado da interação e retornos crescentes , custos de comércio e diferenciais de preços dos fatores”.
• (1995) 'Globalization and the inequality of nations,' (with Anthony J. Venables). Quarterly Journal of Economics 110, pp. 857–880.
• Krugman, P (1998). Space: the final frontier. Journal of Economic Perspective, v. 12, n. 2 p. 161-174.
• Fujita, M., Krugman, P. and Venables, A. (1999). The Spatial Economy: Cities, Regions, and International Trade. Cambridge, MA: MIT Press.
Qual é o perfil dos economistas que trabalham com economia espacial?
• São economistas que em geral reconhecem que não estão “sozinhos no planeta”......
..... Trabalhar com modelos sobre interação espacial, contágio, efeito spillover, externalidades, imitação e
outros, geralmente requer contato com abordagens teóricas diferentes e profissionais de outras áreas...
Referências Básicas
• Anselin, L. 1988. Spatial Econometrics: Methods and Models, (Dorddrecht: Kluwer Academic Publishers).
• Le Sage J. (1999). Spatial Econometrics. Department of Economics University of Toledo. (http://www.rri.wvu.edu/WebBook/LeSage/spatial/wbook.pdf)
• Almeida, E. S. (2012) Econometria Espacial Aplicada. Campinas, SP, Editora Alínea.
Por que Econometria Espacial?
Existência de Diferenças
• Poder existir padrões de interação socioeconômica entre os agentes num sistema (rico -> pobre!?)
• Pode existir características estruturais do sistema (...semiárido baiano!?)
Natureza multidirecional do padrão de interação produz efeitos espaciais
• Violação de pressupostos vitais do modelo clássico de regressão linear ...(variância não exógena de
regressores)
Econometria Espacial
A distinção entre econometria espacial e a econometria tradicional decorre do fato de que quandoos dados possuem um componente locacional doisproblemas surgem:
•Dependência espacial entre as observações
•A heterogeneidade espacial ocorre nosrelacionaments que estão sendo modelados
Heterogeneidade Espacial
• Refere-se à variação no relacionamento entre as variáveis no espaço
• Diz respeito a aspectos da estrutura socioeconômica no espaço
...... a instabilidade estrutural (heterogeneidade nos coeficientes β) implicaria em ter que uma estimativa do parâmetro para cada ponto no espaço
Heterogeneidade Espacial
....implicações para os modelos econométricos e procedimentos de estimação tradicionais (linear – MQO)
•Coeficientes variáveis (instabilidade estrutural)
•Variância não constante (heterocedasticidade)
•Formas funcionais diferentes para determinados subconjuntos de dados
.... novos desafios para a Teoria Econométrica
Dependência Espacial
• Em uma coleção de dados amostrais, a dependênciaespacial refere-se ao fato de que uma observaçãoassociada à localização i, depende de outrasobservações nas localizações j≠ i
yi = f(yj), i = 1,…, n j ≠ i
Autocorrelação Espacial: fundamento básico
• Por que esperar que uma amostra de dados em um ponto no espaço seja dependente de valoresobservados em outras localizações?
... erros de medida para observações em lugares contíguos podem causar dependência no espaço, uma vez que os limites administrativos da coleta de dados pode não refletir a natureza do processo gerador de dados ... ex.: taxas de desemprego superestimadas, quando trabalhadores podem se deslocar para áreas vizinhas,
... existe uma variedade de padrões de interação social difusão de tecnologia ou conhecimento... Imitação e outros
Sistema de Informações Geográficas (SIG)
Sistema de Informações Geográficas (SIG)
� Precisamos utilizar o SIG quando queremos:
• Informação sobre locais na superfície da Terra
• Conhecimento sobre onde alguma coisa se localiza
• Conhecimento sobre o que está em uma dada localização
� O SIG é um tipo de sistema de informações
� ... estabelecer a localização de um objeto requer que seja definida sua posição relativa a outro objeto ou a um sistema de coordenadas
Dados espaciais
• Ao trabalhar com econometria espacial precisamos utilizar dados geograficamente referenciados
• Utiliza-se arquivos GIS, em que os dados tem sua posição definida em relação à superfície da terra
• É necessária a utilização de um arquivo shapefile
Shapefile
� Refere-se ao arquivo com as informações que queremos trabalhar
� Onde podem ser obtidos?• Internet: IBGE, INPE, etc• Criado utilizando um software GIS (ArcGIS,
QuantumGIS, etc
Arquivos que compõem um shapefile
• .shp: Armazena a geometria das entidades, ou seja, ponto, linha ou polígono (área do município de Feira de Santana) - Arquivo dos vetores
• .dbf: Contém a informação descritiva das entidades. Arquivo de banco de dados
• .shx: Armazena as ligações entre as entidades e a sua geometria. Arquivo de índices
• .sbn/.sbx: Realizam as ligações entre as entidades vetoriais e a sua informação descritiva. Podem não existir caso não tinha sido feita uma operação de análise espacial
• .prj: Definição do sistema de projeção cartográfica. Existente quando o shapefile possuir um sistema de coordenadas associado
• .ain/.aih: Somente existem quando se procedem a operações de joining (concatenação) de banco de dados.
Geometrias
• Pontos: ex.: escolas, domicílios, árvores (pela duas coordenadas)
• Linhas: ex.: ruas, estradas, rios, etc
• Polígonos: ex.: bairros, estados, países
Geometrias do Bairro Centro de Salvador
• Pontos
• Linhas
• Polígonos
Softwares
• ArcGis
• QuantumGIS
• SpaceStat
• OpenGeoda
• IpeaGeo
https://geodacenter.asu.edu/
Diretório: Área de Trabalho/Minicurso/Material Econometria Espacial
Shape Bahia
Ir no Excel e abrir o arquivo DBF
O código dos municípios (COD_IBGE) e o ID são as informações relevantes. O restante são as variáveis socioeconômicas de cada município. O ID faz a comunicação entre o arquivo DBF e os demais. A ordem dos polígonos não pode ser alterada.
Abrir o Geoda
Abrir o arquivo .SHP (com a Geometria das entidades (no caso, os polígonos dos municípios
Ver os menus do Geoda. Em Maps, fazer mapa de desvio padrão da variável PIB2010
Abrir a tabela de dados
Fazer um cartograma
Exploratória de Dados Espaciais (AEDE)
Análise Exploratória de Dados Espaciais (AEDE)
• Discutir, sistematicamente, a distribuição espacial dos valores assumidos por uma dada variável (buscar padrões)
• Investigar a correspondência entre valores de uma variável e a localização da unidade regional que os apresenta
Fonte: SEI
AEDE
Base de Análise
•Relações de coincidência entre valores semelhantes e pontos semelhantes do espaço
•Incorporar a noção de vizinhança e contigüidade através de matrizes de pesos espaciais
Conceitos técnicos e estatísticos importantes
•Pesos espaciais
•Defasagem espacial
•Autocorrelação espacial
Matriz de Pesos Espaciais – W
• W representa uma certa estrutura espacial na qual uma determinada interação socioeconômica entre os agentes ocorre
• Tipos de W:
– Binária;
– Distância inversa;
– Econômica (fluxos de comércio, fluxos migratórios, etc.)
Matriz de Pesos Espaciais – W
• Matriz binária:
• Matriz de “zeros” e “uns”
• A unidade i é vizinha da unidade j se a célula aij da matriz de pesos espaciais apresentar valor 1
• Matriz normalizada – soma de cada linha é unitária
• Matrizes: rook, queen, bishop, k-nearest...
BA PE AL SE CE RN PI MA PB
BA 1 0 1 0 0 0 0 0
PE 1 1 1 0 0 0 0 0
AL 0 1 1
SE 1 1 1 0 0 0 0
CE 0 0 0 0 1 1 1 0
RN …
PI …
MA …
PB …
Matriz Binária
Matriz de pesos W
BA PE AL SE CE RN PI MA PB
BA 0 1 0 1 0 0 0 0 0 2
PE 1 0 1 1 0 0 0 0 0 3
AL 0 1 0 1 0 0 0 0 0 2
SE 1 1 1 0 0 0 0 0 0 3
CE 0 0 0 0 0 1 1 1 0 3
RN 0 0 0 0 1 0 1 0 1 3
PI 0 0 0 0 1 1 0 1 0 3
MA 0 0 0 0 1 0 1 0 0 2
PB 0 1 1 0 0 0 0 0 0 2
BA PE AL SE CE RN PI MA PB
BA 0 0.5 0 0.5 0 0 0 0 0 1
PE 0.3333 0 0.3333 0.3333 0 0 0 0 0 1
AL 0 0.5 0 0.5 0 0 0 0 0 1
SE 0.3333 0.3333 0.3333 0 0 0 0 0 0 1
CE 0 0 0 0 0 0.3333 0.3333 0.3333 0 1
RN 0 0 0 0 0.3333 0 0.3333 0 0.3333 1
PI 0 0 0 0 0.3333 0.3333 0 0.3333 0 1
MA 0 0 0 0 0.5 0 0.5 0 0 1
PB 0 0.5 0.5 0 0 0 0 0 0 1
W=
Matriz de Pesos Espaciais – W
• Matriz binária:
• Rook: somente fronteiras em comum com extensões não-nulas são consideradas
• Queen: fronteiras em comum com extensões não-nulas e nós comuns
• Bishop: somente nós comuns são considerados
Esquema explicativo dos conceitos de vizinhança Rook e Queen
RookRook QueenQueen
Matriz de Distância
BA PE AL SE CE RN PI MA PB
BA 0 150 250 100 350 300 350 400 280
PE 150 0 50 50 200 250 200 250 130
AL 250 50 0 50 200 100 100 250 100
SE 100 50 50 0 250 150 200 300 100
CE 350 200 200 250 0 150 100 200 100
RN 300 250 100 150 150 0 100 150 100
PI 350 200 100 200 100 100 0 150 150
MA 400 250 250 300 200 150 150 0 200
PB 280 130 100 100 100 100 150 200 0
BA PE AL SE CE RN PI MA PB
BA 0 0,007 0,004 0,01 0,003 0,003 0,003 0,003 0,004
PE 0,0067 0 0,02 0,02 0,005 0,004 0,005 0,004 0,008
AL 0,004 0,02 0 0,02 0,005 0,01 0,01 0,004 0,01
SE 0,01 0,02 0,02 0 0,004 0,007 0,005 0,003 0,01
CE 0,0029 0,005 0,005 0,004 0 0,007 0,01 0,005 0,01
RN 0,0033 0,004 0,01 0,007 0,007 0 0,01 0,007 0,01
PI 0,0029 0,005 0,01 0,005 0,01 0,01 0 0,007 0,007
MA 0,0025 0,004 0,004 0,003 0,005 0,007 0,007 0 0,005
PB 0,0036 0,008 0,01 0,01 0,01 0,01 0,007 0,005 0
distância inversa
BA PE AL SE CE RN PI MA PB
BA 0 200 300… …. … …. … ….
PE 200 0 545
AL 300 545 0
SE ..
CE …
RN …
PI …
MA
PB
Matriz de Comércio (transações em R$ ou toneladas)
Escolha da Matriz
• A escolha é mais “subjetiva” do que técnica
• Depende da teoria/definição sobre quem são os vizinhos relevantes
• Exemplo: fenômeno em que se espera que a estrutura espacial seja concentrada ao redor de localizações específicas – escolhe-se uma matriz em que os vizinhos sejam definidos como as localizações imediatamente adjacentes
• Se não houver, ex ante, base teórica suficiente para a escolha da matriz de pesos, pode-se criar diferentes matrizes e explorar a sensibilidade dos resultados em relação às diversas especificações
Autocorrelação Espacial
• Pode manifestar-se na variável dependente, nas variáveis explicativas ou no termo de erro– Incorporação de termos de defasagem– Wy, WX, Wu, representam o processo espacial
subjacente
Variável defasada espacialmente
BA PE AL SE CE RN PI MA PB
BA 0 0.1863 0.1118 0.2794 0.0798 0.0931 0.0798 0.0699 0.0998
PE 0.0921 0 0.2764 0.2764 0.0691 0.0553 0.0691 0.0553 0.1063
AL 0.0482 0.241 0 0.241 0.0602 0.1205 0.1205 0.0482 0.1205
SE 0.1266 0.2532 0.2532 0 0.0506 0.0844 0.0633 0.0422 0.1266
CE 0.0589 0.103 0.103 0.0824 0 0.1374 0.2061 0.103 0.2061
RN 0.0581 0.0698 0.1744 0.1163 0.1163 0 0.1744 0.1163 0.1744
PI 0.0508 0.089 0.178 0.089 0.178 0.178 0 0.1186 0.1186
MA 0.0673 0.1076 0.1076 0.0897 0.1345 0.1794 0.1794 0 0.1345
PB 0.0568 0.1222 0.1589 0.1589 0.1589 0.1589 0.1059 0.0795 0
Matriz de pesos espaciais PIB Estado PIB R$
BA 2000.00
PE 1500.00
AL 500.00
SE 300.00
CE 1000.00
RN 400.00
PI 150.00
MA 350.00
PB 250.00
0 0.1863 0.1118 0.2794 0.0798 0.0931 0.0798 0.0699 0.0998
0.0921 0 0.2764 0.2764 0.0691 0.0553 0.0691 0.0553 0.1063
0.0482 0.241 0 0.241 0.0602 0.1205 0.1205 0.0482 0.1205
0.1266 0.2532 0.2532 0 0.0506 0.0844 0.0633 0.0422 0.1266
0.0589 0.103 0.103 0.0824 0 0.1374 0.2061 0.103 0.2061
0.0581 0.0698 0.1744 0.1163 0.1163 0 0.1744 0.1163 0.1744
0.0508 0.089 0.178 0.089 0.178 0.178 0 0.1186 0.1186
0.0673 0.1076 0.1076 0.0897 0.1345 0.1794 0.1794 0 0.1345
0.0568 0.1222 0.1589 0.1589 0.1589 0.1589 0.1059 0.0795 0
*
2000.00
1500.00
500.00
300.00
1000.00
400.00
150.00
350.00
250.00
=
597.6381
552.888
703.6145
899.789
522.0314
569.7674
671.1864
643.4978
690.1484
PIB dos vizinhosponderado pela relaçãode vizinhança
Calcular um matriz de pesos espaciais no GeodaTools -> Weights -> Creates (escolher o arquivo shape)
Calcular um matriz analisar a matriz de pesos Ir em Bloco de Notas -> Abrir o arquivo DVPA_BA_2000_poligono. gal
Defasagem Espacial (Spatial Lag)
• Conceito diferente de séries de tempo• Wy: é a média de uma variável nos lugares vizinhos
(por exemplo: PIB dos vizinhos)• Exemplo:
– Gráfico de dispersão (PIB e PIB defasado espacialmente)
Criar duas variáveis defasadas espacialmenteWPIBPC2010
WN_IDHM2010•Table -> Add Variable ->WPIBPC2010•Table-> Add Variable ->WN_IDHM2010
•Table -> Variable Calculation -> Spatial Lag
Autocorrelação Espacial Global
• Gráfico de dispersão de Moran
– Plota-se em um gráfico o valor da variável contra a sua defasagem espacial
– Cada quadrante corresponde a um diferente tipo de autocorrelação espacial
– Coeficiente de autocorrelação espacial global:
• Inclinação da linha de regressão (pista!)
• Estatística I de Moran (considera desvios em relação à média)
Quadro esquemático do diagrama de dispersão de Moran
Estatística I de Moran
• Medida de autocorrelação espacial global:
• Inferência: pseudo-nível de significância– Permutações– Hipótese nula: aleatoriedade espacial
( )( )( )∑
∑∑∑∑ −
−−=
2yy
yyyyw
w
nI
i
jiij
ij
# de localidades# de localidades
Valor do atributo Valor do atributo em anem anááliselise
Peso Peso espacial espacial para para i,ji,j
Calcular o PIB per capita 2010
Table -> Add FileTable -> Field Calculation -> Bivariate
Valor observadoValor observado
Autocorrelação Espacial Local
• Análise baseada apenas nos procedimentos de Moran ignora a possibilidade de instabilidades locais no sistema global
• Caráter local dos processos espaciais
– Do global para o local
• Análise de clusters espaciais
• Indicador: LISA (local indicator of spatial analysis)
LISA
• Proporciona, para cada observação, uma indicação da existência de clusters espaciais (estatísticos) significativos, de valores similares, ao redor daquela observação
• Teste da hipótese nula de aleatoriedade local
LISA
• Relevante para identificação de clusters
espaciais locais significantes
– Autocorrelação espacial local positiva
• Diagnóstico de instabilidade local (outliers
espaciais)
– Autocorrelação espacial local negativa
LISA
• Medida de autocorrelação espacial local:
( )n
yym i
o
2−
=
( ) ( )yywm
yyI jij
o
i
i −−
= ∑j
ATENATENÇÇÃO: ÃO:
••Neste caso, somente os Neste caso, somente os
valores vizinhos a valores vizinhos a jj são são
incluincluíídosdos
••Como a soma Como a soma éé apenas em apenas em
jj, calcula, calcula--se um se um I para cada iI para cada i
LISA
• Valores positivos de Ii significam que existem clusters
espaciais com valores similares (altos ou baixos);
• Valores negativos de Ii significam que existem clusters
espaciais com valores diferentes entre a região e seus vizinhos
ClustersClusters espaciaisespaciais
OutliersOutliers espaciaisespaciais
Modelos Econométricos Espaciais
Supostos do MRLC
• S1) Relacionamento linear entre x e y
• S2) A matriz de regressores tem rank coluna pleno
(não existe relacionamento linear exato entre as
variáveis independentes)
• S3) Exogeneidade das variáveis independentes
• S4) Homocedasticidade e não-autocorrelação
• S5) No precesso gerador de dados as variáveis
explicativas (X) são fixadas em amostras repetidas
• S6) Os termos aleatórios são distribuídos normalmente
Violações dos supostos do MRLC
Dependência espacial entre as observações
• Viola o suposto S5 de que as variáveis explicativas sãofixadas em amostras repetidas e o suposto S4 de queos termos aleatórios são homocedásticos e não-autocorrelacionados
Heterogeneidade espacial
• Viola o suposto S1 de que existe um relacionamentolinear exato entre as observações de dados amostrais, pois o relacionamento varia à medida em que se move entre a amostra de dados espaciais
Modelo de Defasagem Espacial
• Autocorrelação na forma Wy
• Sugere um processo de difusão ou contágio– Difusão espacial quando um atributo é adotado por
uma população fixa– Espraiamento espacial no caso em que a própria
população espalha-se no espaço
εβρ ++= XWyy
Parâmetro da defasagem auto-regressiva
Modelo de Defasagem Espacial
• Conseqüência:– Mínimos Quadrados Ordinários (MQO) não gera
estimativas consistentes – Problema de omissão de variável relevante
Modelo de Erro Auto-regressivo Espacial
• Defasagem espacial no erro• Instrumento para detectar erros de especificação no
modelo– Ausência de variáveis explicativas– Heterocedasticidade– Variáveis não-observáveis
Modelo de Erro Auto-regressivo Espacial
• Formalmente:
Processo autoProcesso auto--regressivo regressivo
de primeira ordem: exprimede primeira ordem: exprime
uma autocorrelauma autocorrelaçção do erro maisão do erro mais
ampla, afetando todo o sistemaampla, afetando todo o sistema
(e.g. praga generalizada)(e.g. praga generalizada)
( )I
WuWuu
uXy
σε
εεγελ
β
,0~
ou +=+=
+=
Processo de mProcesso de méédiasdias
mmóóveis de primeira ordem:veis de primeira ordem:
ididééia de alcance localizadoia de alcance localizado
(e.g. polui(e.g. poluiçção de um rio)ão de um rio)
Modelo de Erro Auto-regressivo Espacial
• Conseqüência da omissão do problema no erro:• Os coeficientes estimados por MQO continuam não-
viesados, mas se tornam menos eficientes (os erros-padrão são maiores)
Defasagem nas Covariadas
• Autocorrelação pode ocorrer nas variáveis explicativas
ετβ ++= WXXy
Estratégia Básica
• Estimar modelo por MQO• Testar normalidade dos erros: Jarque-Bera• Diagnosticar dependência espacial
– Teste global: I de Moran (erro)– Testes específicos: Multiplicador de Lagrange (LM)
• Em caso de detecção de dependência espacial, re-estimar o modelo (aquele com menor p-valor nos testes LM)– Modelo de erro auto-regressivo espacial– Modelo de defasagem espacial
Resumo
• Estimação de modelos econométricos espacializados• Problemas possíveis:
– Termo de erro explicado pelo espaço– Defasagem espacial explicando os dados
• Testes para regimes espaciais (Moran, LM test, LMrobust test)
• Estimação por máxima verossimilhança