Anlise de correla§£o

  • View
    282

  • Download
    0

Embed Size (px)

Text of Anlise de correla§£o

Ps-Graduao "Lato Sensu"

Ps-Graduao "Lato Sensu" ERU 502 - Introduo ao Agronegcio

em Gesto do Agronegcio

Anlise de correlao

Introduo

Nesta unidade sero estudados os princpios da anlise de correlao e de regresso. Estas tcnicas estatsticas so apropriadas para analisar o relacionamento entre variveis de qualquer natureza. No nosso caso, estamos interessados no relacionamento entre variveis do agronegcio, sejam elas de natureza econmica, financeira ou contbil. A anlise de correlao tem por objetivo apenas medir o grau de relacionamento entre variveis, enquanto a anlise de regresso estabelece uma relao de dependncia entre as variveis e desenvolve mtodos para estimar, com base em uma amostra de dados, os parmetros que caracterizam essa relao.

Correlao e regresso so tcnicas bastante relacionadas e, de certa forma, complementares em muitos aspectos. Podemos estar interessados, por exemplo, no relacionamento entre o preo a vista e o preo futuro de caf, entre gastos com propaganda e volume de vendas de uma empresa, ou entre salrio do trabalhador e seu nvel educacional. Pela correlao, vamos procurar medir o grau de relacionamento entre as variveis, que ser dado pelo coeficiente de correlao. Este coeficiente vai nos dizer se a relao forte ou fraca e se no mesmo sentido ou em sentido contrrio. J a regresso procura estimar o relacionamento entre as variveis por meio de uma equao matemtica que melhor descreve a relao.

Embora a anlise de correlao e de regresso lide com a dependncia de uma varivel em relao a outra, elas no implicam necessariamente relao de causalidade de uma varivel para outra. A especificao das variveis a serem analisadas tanto na correlao quanto na regresso deve ser feita com base na teoria subjacente ou no conhecimento a priori relacionado com a rea em estudo. Um relacionamento forte entre as variveis no identifica uma relao causa-efeito. Isto significa que, estatisticamente, podemos relacionar qualquer coisa, mas, na prtica, s devemos relacionar aquilo que faz sentido de acordo com nosso conhecimento do problema. Nos estudos relacionados com o agronegcio, vamos usar com freqncia a teoria econmica para estabelecer relaes causais a serem investigadas pela estatstica.

Os dados utilizados em anlise emprica de correlao e regresso podem ser de srie temporal ou de seo cruzada. Os dados de srie temporal so aqueles coletados para perodos de tempo sucessivos e regulares. O perodo pode ser ano, ms, semana, dia, etc. Por exemplo, dados referentes rea, produo e produtividade de milho em Minas Gerais no perodo de 1980 a 2000 e dados mensais de preos de milho, arroz e feijo no mercado atacadista de Belo Horizonte, no perodo de janeiro de 1990 a dezembro de 2000, so dados de srie temporal.

Os dados de seo cruzada, tambm chamados de dados de corte seccional, so dados referentes a uma ou mais variveis coletados em unidades amostrais (famlia, consumidor, firma, propriedade rural, estado, regio, pas) no mesmo perodo de tempo. Por exemplo, dados sobre a produo de soja, milho e trigo nos municpios do Estado do Paran em 2000, ou dados sobre a produo diria de leite, nmero de vacas em lactao, nmero de empregados permanentes e quantidade usada de rao, coletados de uma amostra de 200 produtores de Minas Gerais em julho de 2000, so dados de seo cruzada.

possvel combinar dados de seo cruzada e de srie temporal para anlise estatstica. Neste caso, refere-se a dados de combinao de srie temporal e seo cruzada. Quando as unidades amostrais de seo cruzada so as mesmas ao longo do tempo, denomina-se dados em painel.

Tanto os dados de srie temporal quanto os de seo cruzada podem ser de natureza quantitativa ou qualitativa. Dado quantitativo aquele que se apresenta na forma numrica, como renda, produo, preo, etc. J o dado qualitativo aquele expresso na forma de um atributo ou uma caracterstica qualitativa da unidade de observao. Normalmente, este dado refere-se presena ou ausncia de uma caracterstica, ou tomada ou no de uma deciso, como, por exemplo, dado referente a homem ou mulher, a casado ou solteiro, a empregado ou desempregado, ao setor rural ou setor urbano, se adota ou no adota certa tecnologia, se perodo com ou sem tabelamento de preos, se perodo com ou sem acordo comercial, etc.

Os dados para a anlise de correlao e de regresso provm de observaes de variveis emparelhadas. preciso ter vrias observaes (amostra) de cada varivel. Por exemplo, um estudo com dados de seo cruzada sobre empresas do setor de alimentos pode focalizar volume de vendas, nmero de empregados, gastos com propaganda e parcela de mercado. Cada observao, que representa os dados de cada empresa, composta de quatro valores, um para cada varivel. Pode-se imaginar os dados dispostos em uma planilha em que as linhas so as observaes e as colunas representam as variveis.

Objetivos especficos

Ao finalizar esta unidade, voc dever ser capaz de:

Entender o significado e a finalidade da anlise de correlao e de regresso.

Relacionar e explicar as premissas ou pressuposies fundamentais da anlise de correlao e de regresso.

Diferenciar anlise de correlao de anlise de regresso.

Entender que o modelo de regresso linear pode ser usado para estimar vrios tipos de modelos no-lineares.

Entender as limitaes da anlise de correlao e de regresso.

Calcular coeficientes de correlao e estimar modelos de regresso para anlise de relaes entre variveis.

Entender e ser capaz de explicar resultados de anlise de correlao e de regresso.

1. Anlise de correlao

1.1. Introduo

A estatstica fornece vrios mtodos para se medir a associao entre variveis, sendo a correlao um dos mais simples destes mtodos. A anlise de correlao constitui uma tcnica prpria de anlise estatstica com aplicaes em inmeras reas. A correlao intimamente ligada regresso. O entendimento dos conceitos de correlao facilita muito o estudo das tcnicas de regresso.

1.2. O significado da correlao entre variveis

O termo correlao significa literalmente co-relacionamento e indica at que ponto os valores de uma varivel esto relacionados com os de outra. Na anlise de correlao procura-se uma medida que sintetize o grau de relacionamento entre as variveis.

Tem-se um relacionamento forte entre duas variveis sempre que valores altos de uma estejam relacionados com valores tambm altos ou baixos da outra varivel. Por outro lado, se valores altos de uma varivel ocorrem em conjunto com valores altos e baixos da outra varivel, o grau de relacionamento entre elas no forte.

Muitos exemplos podem ser dados de variveis que apresentam certo tipo de relacionamento: a) grau de escolaridade e nvel de renda; b) notas de microeconomia e notas de matemtica; c) idade e resistncia fsica; d) produtividade e quantidade utilizada de fertilizante; e) idade e altura de uma planta; f) tempo depois do corte e resistncia fsica da madeira; g) preo em nvel de consumidor (varejo) e em nvel de atacado; h) tamanho da propriedade e consumo de energia eltrica; i) preo e quantidade demandada de certa mercadoria; j) ordem de classificao em um concurso e sucesso profissional.

O interesse de se conhecer melhor o relacionamento entre variveis, como os casos citados anteriormente, conduz naturalmente anlise de correlao. O resultado uma medida do grau de correlao, denominada coeficiente de correlao.

A principal utilidade da medida de correlao que se pode dizer o que se espera para uma varivel com base no conhecimento de outra. Pode-se inferir uma com base na outra.

Contudo, chama-se a ateno para o fato de que esse processo de inferncia no significa que uma varivel causa a outra. Ou seja, no implica, em hiptese alguma, a existncia de relao causal entre as variveis. Apenas o relacionamento esperado indicado pela anlise de correlao. Por exemplo, se existir um relacionamento forte na mesma direo entre grau de escolaridade e renda, s se pode inferir que pessoas com grau de instruo formal mais elevado devero apresentar tambm nveis de renda mais altos.1.3. Formas de correlao

A correlao entre duas variveis (X e Y) pode ser de vrias formas:

a) Correlao linear - quando todos os pontos (X, Y) colocados num diagrama de disperso tendem a se concentrar ao longo de uma reta.

b) Correlao no-linear - quando os pontos (X, Y) tendem a se concentrar em torno de uma curva.

c) Correlao positiva - duas variveis apresentam correlao positiva se elas tendem a mudar na mesma direo, ou seja, aumentam ou diminuem ao mesmo tempo. Exemplo deste tipo de correlao a relao entre preo e quantidade ofertada (Figuras 2.1 e 2.2).

Figura 2.1 - Correlao positiva linear. Figura 2.2 - Correlao positiva no-linear.d) Correlao negativa - neste caso, as variveis tendem a mudar em direes opostas. Por exemplo, preo e quantidade demandada (Figuras 2.3 e 2.4).

Figura 2.3 - Correlao negativa linear. Figura 2.4 - Correlao negativa no-linear.e) No-correlao ou correlao nula - duas variveis so no-correlacionadas quando no possvel identificar nenhuma conexo entre elas. O diagrama de disperso no apresenta forma definida (Figura 2.5).

Figura 2.5 - Correlao nula.A correlao entre duas variveis tambm ser nula quando uma delas no apresentar variao, ou seja, assumir um valor constante (Figura 2.6).

Figura 2.6 - Correlao nula.

Quando, porventura, todos os pontos (X, Y) se localizarem exatamente sobre uma reta ou uma curva, diz-se que a correlao perfeita. Quando a maioria dos pontos se concentra ao longo da reta ou da curva, a correlao ser forte; caso contrrio, a correlao ser fraca.

A teoria da correlao desenvolve medidas prprias e diretas somente para a correlao linear. A correlao no-linear estudada de forma