Análise e apresentação de resultados Armando Traini Ferreira Jose Jorge Chaguri Junior Heber...

Preview:

Citation preview

Análise e apresentação de resultados

Armando Traini FerreiraJose Jorge Chaguri Junior

Heber Martins de PaulaRodrigo Argenton Freire

Osmar da Silva Laranjeiras

IC043 Metodologia de pesquisa e redação científica

Universidade Estadual de Campinas - Unicamp

Medidas e Probabilidade• A medição é um procedimento no qual um pesquisador atribui

números (números ou outros símbolos) para propriedades empíricas (variáveis) de acordo com as regras que estão intimamente ligadas às abordagens de pesquisa.

• Esta apresentação enfoca estes níveis de medições a fim de preparar o terreno para a próxima parte que são as análises dos resultados.

• E fornece uma introdução sobre probabilidade que é um termo importante entender em testar a sua hipótese de pesquisa.

Análise de Resultados

Níveis de Medidas

Escala Nominal Ex.: Matrículas de

automóveis, códigos postais

Escala Ordinal Ex.: Escala social

Escala Métrica

Escala Intervalar – Ex.: escalas de

temperatura Celsius e Fahrenheit

Escala de razão Ex.: escalas de razão são

a idade, salário, preço

Probabilidade e Estatística

Análise de Resultados

ProbabilidadeA história da teoria das probabilidades, teve início com os jogos de cartas, dados e de roleta. A teoria da probabilidade permite que se calcule a chance de ocorrência de um número em um experimento aleatório.• Experimento Aleatório

– É aquele experimento que quando repetido em iguais condições, podem fornecer resultados diferentes, ou seja, são resultados explicados ao acaso. Quando se fala de tempo e possibilidades de ganho na loteria, a abordagem envolve cálculo de experimento aleatório.

• Espaço Amostral– É o conjunto de todos os resultados possíveis de um experimento aleatório. A

letra que representa o espaço amostral, é S.

A Probabilidade dirá se as diferenças nos resultados são devidos à sua manipulação das variáveis, como previsto pelo sua hipótese de pesquisa

ou se as diferenças são apenas devido à flutuações aleatórias.

• Usamos a palavra 'provavelmente' quase todos os dias para expressar nossos pontos de vista sobre determinado coisas. Considere as seguintes afirmações:1 - Provavelmente vai chover na próxima semana.2 - Eu provavelmente vou visitar o meu amigo amanhã.3 - Com certeza vou passar no meu exame de matemática.

• O termo 'Probabilidade' é definido como a porcentagem que ocorre um evento em um número de vezes. É calculado para determinar a direção de seu estudo.

Conceito de Probabilidade

Se em um fenômeno aleatório as possibilidades são igualmente prováveis, então a probabilidade de ocorrer um evento A é:

𝑃 ( 𝐴)=n úmero  de   casos   favor á veisn ú mero  de   casos   poss í veis

• A análise de dados tem as suas raízes no positivismo lógico e por isso é uma categoria descritiva;

• A análise de dados em forma de gráficos, tabela, equações, deve ser descrita ao longo da pesquisa e não se recomenda analisá-la somente ao término da dissertação/tese;

• No caso de várias análises na revisão bibliográfica recomenda-se uma análise abrangente relacionando as análises anteriores ao final da tese/dissertação.

Análise de dados

• Após a análise dos dados de formato descritivo, partir para a teorização e estabelecer conexões de modo a interpretar um dado ou fenômeno além da descrição;

• Os dados coletados devem ter uma inter-relação e numa perder o foco com o problema da pesquisa;

• Coletar e analisar dados que tenham “afinidade” com a questão ou problema

Análise de dados

Fonte: www.ime.unicamp.br

Análise de dados

Ranking da ONU: China 101 – Brasil 84

Análise de dados

Análise de dados exploratóriosAnálise de dados exploratórios Codificação de perguntas abertas

Registro de informações

Estatísticas descritivas

Distribuição de frequência

Medidas de tendências centrais

Desvio padrão

Distribuição normal

Etapas antes e depois das estatísticas inferenciais

Estatística inferencial (bivariada)

O teste t

O teste qui-quadrado

Coeficiente de correlação Spearman rank

Coeficiente de correlação de momento produto Pearson

Codificação de perguntas abertas

• Utilização em questionários postais, ou entrevistas;• Separação das questões em códigos em função de ideias e

temas;• Utiliza-se as seguintes etapas:

Etapa 1

Juntar todas as respostas similares

Etapa 2

Dividir os grupos em sub-categorias – estabelecer códigos

Etapa 3

Definir métodos de análise

Registro de informações

• Coloca em uma planilha os códigos correspondes das respostas de questionários (abertas ou fechadas);

• Avalia-se as questões por números correspondentes:

Método de estatística descritiva

• Frequência de distribuição

– Tabulação– Gráfico de barras (histogramas)– Gráfico pizza

Método de estatística descritiva

• Medição de tendências centrais

– Média– Mediana– Modo

Método de estatística descritiva

• Medição de dispersão baseada na média

– Desvio Médio– Desvio padrão– Distribuição Normal

Dispersão baseada na média

• Descreve o quanto os dados analisados distam de um valor central (média)

• Também chamado de variabilidade

Medidas de dispersão

Desvio (absoluto) médio

Variância

Desvio Padrão

Desvio (absoluto) médio Média dos desvios absolutos

Variância Média do quadrado dos desvios

Desvio Padrão Raiz quadrada da variância

ou variabilidade

¿∑(𝑋 −𝑋 ´ )

𝑁

¿∑(𝑋 −𝑋 ´ )²

𝑁

¿√ ∑(𝑋 −𝑋 ´ )²𝑁

(25,28,23,18,31,27)

X´= média aritmética das

amostras

X´ =

Ex. X´ = 25,33

Desvio Padrão

¿∑ √( 𝑋−𝑋 ´ ) ²𝑁

Porque é a raiz quadrada da variância?• Valores positivos• Mesma medida dos dados fornecidos inicialmente

Distribuição NormalInforma sobre a dispersão ou distribuição de determinado dado.

Princípios (Nachmias and Nachmias, 1996):

1. Simétrico e curva em forma de sino

2. A média, modo e meio coincidem no centro da distribuição

3. A curva é baseada em um infinito número de observações

4. Uma única fórmula matemática permite descrever como as

frequências se relacionam com o valor da variável

5. Regra 68%, 95%, 99,7% (1SD, 2SD, 3SD)

68% 95% 99,7%

Método de estatística inferencial• Métodos para estimar a respeito das propriedades de uma

população amostral baseando-se nas informações obtidas de

uma amostra.

• Permite estabelecer relações de causa-efeito, estimativas e

diferenças entre grupos.

Paramétricos

• Exigem uma distribuição normal, principalmente com amostras menores de 30

• Acima de 30, a curva aproxima-se da distribuição normal.

Ex. (t-test)

Não-Paramétricos

• Não necessita de requisitos como a normalidade. Indicados para amostras pequenas

• Amostra com distribuição não normal.

• Conclusões mais conservadoras

Ex. (chi-square test)

Método de estatística inferencial1. Formulação da hipótese

Municípios maiores de 300.000 hab. apresentam maiores índices de

alfabetismo do que municípios com menos de 300.000

2. Hipótese nulaNão existe relação entre o tamanho (em habitantes) do município e o índice de

alfabetismo.

3. Escolha do tipo de testeParamétricos ou não-paramétricos

4. Cálculo e resultado das estatísticas do testeManualmente ou através de um software (SPSS, Minitab, Stastmaster)

5. Observar significância ou não do teste.Após o cálculo estatístico deve-se analisar o resultado obtido com uma tabela

estatística referente ao tipo de teste aplicado.

Cada tabela possui valores críticos para qual o resultado obtido de ve ser

comparado.

Se o valor do teste for menor do que o valor crítico, então os resultados

encontrados não são significantes.

Tabela para o teste t

Grau de liberdade

• Utilizado para encontrar os valores críticos em uma tabela.

• Determinado pelo número exato de elementos em uma amostra, ou número de elementos – 1, ou pelo número de categorias.

Teste t : exemplo

Amostra 1 (Contrato pelo sistema projeto e

construção)

Amostra 2(Contrato normal)

564 505521 557445 465560 458480 530540 480585 665426 525530 605475 495

Valores em R$/m²

X1´= R$512.60 X2´= R$528.50

Teste t : exemplo1. Formulação da hipótese

O custo por m² de contratos do tipo tradicional é mais alto do que o modelo

projeto-construção.

2. Hipótese nulaNão existe diferença significativa entre os dois tipos de projeto.

3. Escolha do tipo de teste tComparação entre duas amostras

Amostras em distribuição normal

4. Cálculo e resultado das estatísticas do teste

X1´ = Média da amostra 1

X2´ = Média da amostra 2

SD1 = Desvio padrão da amostra 1

SD2 = Desvio padrão da amostra 2

n1 e n2 = n° de elementos da amostra 1 e 2

Teste t : exemplo5. Análise do resultado

Verifica-se o grau de liberdade por:

Teste t : exemplo

Para se confirmar a hipótese, portanto, valor de t deve ser

maior do que o valor crítico de 2.10

No entanto,

¿ 2.10

A hipótese não pode ser aceita.

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

Mês R$ / m2

mai/11 5568jun/11 5616jul/11 5732

ago/11 5955set/11 6065out/11 6123nov/11 6190dez/11 6223jan/12 6291fev/12 6402mar/12 6346abr/12 6340

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

Que dados obter?• Média?• Desvio Padrão?• Correlação?...Pergunta: Qual a tendência de preços para o final do ano?

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12 Apr/125000

5200

5400

5600

5800

6000

6200

6400

6600

R$ / m2

R$ / m2

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12 Apr/125000

5200

5400

5600

5800

6000

6200

6400

6600

f(x) = 2.51729565247805 x − 96716.138513868R² = 0.904875822359211

R$ / m2

R$ / m2Linear (R$ / m2)

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

Conclusões:• Tendência de crescimento? Alta• Valor provável dez /12:• P = 76,829 (18) – 5571,5 ≅ R$ 6954,00• R2?

Pergunta: E se fosse outra curva?

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

1 2 3 4 5 6 7 8 9 10 11 125000

5200

5400

5600

5800

6000

6200

6400

6600

f(x) = − 7.33391608391608 x² + 172.16958041958 x + 5349.06818181818R² = 0.980202656252514

R$ / m2

R$ / m2Polynomial (R$ / m2)

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

Conclusões:• Tendência de crescimento? Queda• Valor provável dez /12: ≅ R$ 6072,00• R2 = 0,9802

E assim por diante ...

Análise de Dados – Teste Qi Quadrado - AderênciaExemplo: Existe dependência entre o número de filhos e a renda

da família?

N° de filhos Renda

(R$) 0 1 2 >2 Total< R$ 2.000 25 17 40 53 135R$ 2.000 a R$ 5.000 35 20 10 10 75

> R$ 5.000 11 12 9 8 40TOTAIS 71 50 61 71 250

Análise de Dados – Teste Qi Quadrado – Aderência

N° de filhos Renda

(R$) 0 1 2 >2 Total< R$ 2.000 38 28 31 38 135R$ 2.000 a R$ 5.000 21 15 17 21 74

> R$ 5.000 11 8 9 11 40TOTAIS 71 52 59 71 250

Proporção esperada: (71*135)/250 ≅ 38

Análise de Dados – Teste Qi Quadrado – Aderência

No caso em questão: (Excel)=TESTE.CHI(intervalo_real;intervalo_esperado)≅ 0,000213% < 5% => NÃO HÁ DEPENDÊNCIA!

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

Mês R$ / m2

mai/11 5568jun/11 5616jul/11 5732

ago/11 5955set/11 6065out/11 6123nov/11 6190dez/11 6223jan/12 6291fev/12 6402mar/12 6346abr/12 6340

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

Que dados obter?• Média?• Desvio Padrão?• Correlação?...Pergunta: Qual a tendência de preços para o final do ano?

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m² imóveis venda bairro Lapa - SP

May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12 Apr/125000

5200

5400

5600

5800

6000

6200

6400

6600

R$ / m²

R$ / m2

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP

May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12 Apr/125000

5200

5400

5600

5800

6000

6200

6400

6600

f(x) = 2.51729565247805 x − 96716.138513868R² = 0.904875822359211

R$ / m2

R$ / m2Linear (R$ / m2)

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m² imóveis venda bairro Lapa - SP

Conclusões:• Tendência de crescimento? Alta• Valor provável dez /12:• P = 76,829 (18) – 5571,5 ≅ R$ 6954,00• R2?

Pergunta: E se fosse outra curva?

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m² imóveis venda bairro Lapa - SP

1 2 3 4 5 6 7 8 9 10 11 125000

5200

5400

5600

5800

6000

6200

6400

6600

f(x) = − 7.33391608391608 x² + 172.16958041958 x + 5349.06818181818R² = 0.980202656252514

R$ / m²

R$ / m2Polynomial (R$ / m2)

Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m² imóveis venda bairro Lapa - SP

Conclusões:• Tendência de crescimento? Queda• Valor provável dez /12: ≅ R$ 6072,00• R2 = 0,9802

E assim por diante ...

Análise de Dados – Teste Qi Quadrado - AderênciaExemplo: Existe dependência entre o número de filhos e a renda

da família?

N° de filhos Renda

(R$) 0 1 2 >2 Total< R$ 2.000 25 17 40 53 135R$ 2.000 a R$ 5.000 35 20 10 10 75

> R$ 5.000 11 12 9 8 40TOTAIS 71 50 61 71 250

Análise de Dados – Teste Qi Quadrado – Aderência

N° de filhos Renda

(R$) 0 1 2 >2 Total< R$ 2.000 38 28 31 38 136R$ 2.000 a R$ 5.000 21 15 17 21 74

> R$ 5.000 11 8 9 11 40TOTAIS 71 52 59 71 250

Proporção esperada: (71*135)/250 ≅ 38

Análise de Dados – Teste Qi Quadrado – Aderência

No caso em questão: (Excel)=TESTE.CHI(intervalo_real;intervalo_esperado)≅ 0,000213% < 5% => NÃO HÁ DEPENDÊNCIA!

BIBLIOGRAFIADANTAS, Carlos Alberto "Testes Qui-Quadrado: Aderência e Independência" - 2010 – USP, disponível no site: www.zapimoveis.com.br acessado.em13/05/2012,.às10:00h.

NAOUM, Shamil. Dissertation Research and Writing for Construction Students. Londres: Elsevier, 2007.

ONU – Organização das Nações Unidas, disponível no site www.onu.org. site visitado em 13/05/2012, às 18h00

RICHARDSON, R. J. Pesquisa Social: Métodos e Técnicas. São Paulo: Atlas, 1999.

Instituto de Matemática e estatística. Disponível em: www.ime.unicamp.br. Acesso em: 14/05/2012

Stanford. The Normal Distribution. Disponível em: http://www-stat.stanford.edu/~naras/jsm/NormalDensity/NormalDensity.html. Acesso em 14/05/2012

Recommended