9
ANÁLISE ESTATÍSTICA com o SPSS Statistics João Marôco 5 a. Edição

Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

ANÁLISEESTATÍSTICAcom o SPSS Statistics

João MarôcoJOÃO MARÔCO (Ph. D., Washington State University) é professor asso-ciado do ISPA - Instituto Universitário onde leciona disciplinas de Esta-tística, Metodologias de Investigação e Análise de Dados nos diferentes ciclos de estudo e coordena a área científico-pedagógica de Estatística. É também professor associado convidado do programa doutoral da Faculdade de Psicologia da Universidade de Lisboa e do Mestrado e Programa Doutoral em Neurociências da Faculdade de Medicina da Universidade de Lisboa. É beta tester do SPSS Statistics e do AMOS e pertence ao Authors programme da IBM SPSS. Os seus interesses de investigação incluem aplicações de regressão, modelos de equações estruturais, estatística multivariada e análise classificatória nas Ciências Biológicas, Medicina e Ciências Sociais e Humanas. É autor / coautor de quatro livros de Estatística e de Avaliação Psicométrica e de uma centena de artigos, com revisão por pares, publicados em revistas nacionais e internacionais nos domínios da Psicometria, Estatística, Ciências Biológicas e Ciências Sociais e Humanas.

ANÁLISE ESTATÍSTICA com o SPSS Statistics é a súmula da ex-periência de docência, formação profissional e de investigação aplicada do autor nas Ciências Biológicas, Medicina e Ciências Sociais e Huma-nas. O livro apresenta, numa linguagem acessível mas sem descurar o formalismo matemático, os fundamentos teóricos das diferentes técni-cas de análise estatística e exemplifica, passo-a-passo, a utilização do software IBM® SPSS® Statistics com ênfase nos desenvolvimentos das novas versões 18 a 20.

www.reportnumber.pt/ae

5a.Edição

João Marôco

Análise Estatísticacom

o SPSS Statistics5a.

Edição

9 7 8 9 8 9 9 6 7 6 3 2 9

ISBN 978-989-96763-2-9

Page 2: Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

ANÁLISE ESTATÍSTICA

com o SPSS Statistics

5ª Edição

JOÃO MARÔCO

Page 3: Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

ii

É proibida toda e qualquer reprodução desta obra por qualquer meio físico ou digital, nomeadamente por fotocópia, digitalização e distribuição em formato eletrónico, sem a expressa autorização do autor. Excetua-se, naturalmente, a transcrição de pequenos tex-tos ou passagens para apresentação ou crítica do livro. As transgressões serão passíveis das penalizações previstas na lei. O autor é o produtor desta obra, sem uma editora comercial intermediária, o que possi-bilita a redução do preço final de venda. O preço deste livro pretende ser adequado à sua dimensão e foi decidido após consulta a potenciais interessados, como, por exemplo, alunos universitários, sobre o que seria um “preço justo e adequado”. Se o leitor fizer a contabilidade, verá que a fotocópia integral não será mais barata que a compra do livro editado numa livraria física ou online. Para além do mais, a fotocópia e a sua encaderna-ção não têm a mesma qualidade do livro editado. A fotocópia não valoriza, nem incen-tiva, a dedicação e o trabalho que um livro técnico exige ao autor e ao circuito comercial que o disponibiliza ao público. Pense nisto, por favor, antes de adicionar um volume de inestéticas fotocópias à sua estante.

Sitio online de apoio ao livro: www.reportnumber.pt/ae

FICHA TÉCNICA: Título: Análise Estatística com o SPSS Statistics

Autor: João Marôco Capa: João Marôco © João Marôco 5ª. edição Pero Pinheiro, 2011 Impressão e acabamentos: Rolo & Filhos II, SA. Depósito Legal: 331687/11 ISBN: 978-989-96763-2-9

Rua 5 de Outubro, 12 – 3 FT 2715-085 Pero Pinheiro Telef: 965044458 e-mail: [email protected] www.reportnumber.pt

Page 4: Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

iii

Índice

Prefácio ix Como usar este livro? 1 

Capítulo 1  

Variáveis, Populações e Amostras 5 1.1. Variáveis estatísticas e escalas de medida 7 1.2. População vs. Amostra 8 1.3. Teoria da Amostragem 9 1.4. Amostras independentes vs. amostras emparelhadas 13 1.5. Tipos de estudos de investigação 14

Capítulo 2  

Estatística Descritiva 15 2.1. Medidas de tendência central 17 2.2. Medidas de dispersão 19 2.3. Medidas de forma 20 2.4. Medidas de associação 22 2.5. Representações gráficas 27 

Capítulo 3  

Inferência Estatística 33 3.1. Funções de distribuição com utilização frequente em inferência 35 

3.1.1. Distribuição Normal 35 3.1.2. Distribuição Qui-quadrado (2) 38 3.1.3. Distribuição t-Student 39 3.1.4. Distribuição F-Snedecor 40 3.1.5. Distribuição Binomial 41 

3.2. Distribuições Amostrais e Teorema do Limite Central 42 3.3. Teoria da Estimação 46 3.4. Teoria da Decisão 50 

3.4.1. P-values e Erros estatísticos 54 3.4.2. Intervalos de confiança vs. testes de hipóteses 59 3.4.3. Como ‘escolher’ um teste de hipóteses? 60 

Capítulo 4  

Introdução ao SPSS Statistics 63 

Page 5: Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

iv

Capítulo 5  

Comparação de Contagens e Proporções 87 5.1. O Teste Binomial 89 

5.1.1. A aproximação da binomial à normal 90 5.2. O teste do Qui-Quadrado 99 

5.2.1. O Teste do Qui-quadrado por Simulação de Monte Carlo 105 5.3. O teste de Fisher 108 5.4. Modelos Log-lineares 113 

5.4.1. Estimação dos parâmetros do modelo Log-linear 117 5.4.2. Chances e Rácio de Chances 120 5.4.3. Avaliação da qualidade do ajustamento do modelo Log-linear 122 5.4.4. Independência parcial de variáveis 133 5.4.5. Análise dos parâmetros do modelo saturado 137 5.4.6. Modelação Log-linear Hierárquica 141 5.4.7. Modelos Log-lineares com variáveis ordinais 154 5.4.7.1. Modelo Log-linear de Associação Linear-linear 156 5.4.7.2. Modelo Log-linear de Efeitos em Linha (ou em Coluna) 161 

5.5. Testes para contagens em amostras emparelhadas 164 5.5.1. Teste de McNemar para duas populações 165 5.5.2. Teste Q de Cochran para mais de duas populações 170 5.5.2.1. Comparação múltipla de proporções no teste Q de Cochran 176 

Capítulo 6  

Testes Paramétricos para Amostras Independentes 183 6.1. Condições de aplicação dos testes paramétricos 185 

6.1.1. Teste de Kolmogorov-Smirnov 185 6.1.2. Teste de Shapiro-Wilk 187 6.1.3. Teste de Levene 188 6.1.4. Violação dos pressupostos da normalidade e da homogeneidade de variâncias 189 

6.2. Teste t-Student para uma amostra 196 6.3. Teste t-Student para duas amostras 199 6.4. Análise de Variância (ANOVA) 205 

6.4.1. ANOVA a um fator (one-way ) 207 6.4.2. Comparação múltipla de médias one-way 212 6.4.3. ANOVA fatorial 223 6.4.3.1. ANOVA a dois fatores 223 6.4.3.2. ANOVA com mais de 2 fatores 230 6.4.4. Comparações múltiplas nos designs fatoriais 231 6.4.4.1. Testes Post-hoc 231 6.4.4.2. Contrastes 238 6.4.5. Dimensão do efeito 248 6.4.6. Análise da Potência do teste 251 

Page 6: Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

v

6.5. A Análise de Covariância (ANCOVA) 258 6.5.1. Pressupostos da ANCOVA 261 6.5.2. E se os declives não forem homogéneos? 269 

6.6. Análise de variância multivariada (MANOVA) 276 6.6.1. MANOVA one-way ou a um fator 277 6.6.2. MANOVA two-way ou a dois fatores 282 6.6.3. Validação dos pressupostos da MANOVA 285 6.6.3.1. Distribuição Normal multivariada 285 6.6.3.2. Homogeneidade das matrizes de variâncias-covariâncias 286 6.6.4. Considerações adicionais sobre a MANOVA 287 

Capítulo 7  

Testes Não Paramétricos para Amostras Independentes 299 7.1. Teste de Wilcoxon para uma mediana 303 7.2. Teste de Wilcoxon-Mann-Whitney 307 7.3. Teste de Kruskal-Wallis 317 

7.3.1. Comparação múltipla de médias das ordens para amostras independentes 322 7.4. Transformações matemáticas para homogeneizar variâncias e normalizar variáveis 331 7.5. ANOVA two-way não paramétrica 339 7.6. MANOVA não paramétrica 345 7.7. ANCOVA não paramétrica 356 

Capítulo 8  

Testes para Amostras Emparelhadas 363 8.1. Teste t-Student 367 8.2. ANOVA de medições repetidas 372 

8.2.1. Pressupostos da ANOVA de Medições Repetidas 372 8.2.2. ANOVA de medições repetidas a um fator 375 8.2.3. ANOVA de medições repetidas a dois fatores 376 8.2.4. ANOVA de medições repetidas mista 379 8.2.5. Comparação múltipla de médias 391 8.2.5.1. Testes Post-hoc 391 8.2.5.2. Contrastes 405 

8.3. Teste de Wilcoxon para amostras emparelhadas 412 8.4. ANOVA de Friedman 419 

8.4.1. Comparação múltipla de médias de ordens para amostras emparelhadas 424 

Capítulo 9  

Análise de Componentes Principais 439 9.1. O modelo das Componentes Principais 441 9.2. Estimação das componentes principais 443 

Page 7: Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

vi

9.3. ACP com o SPSS Statistics: Categorical Principal Components Analysis (CATPCA) 450 

9.4. Quantas componentes principais se devem extrair? 459 9.5. Utilização das componentes principais 466 

Capítulo 10  

Análise Fatorial 469 10.1.  O modelo da Análise Fatorial Exploratória 472 10.2.  Extração de fatores 476 

10.2.1. Método das Componentes principais 479 10.2.2. Método da Fatorização do Eixo Principal 480 10.2.3. Método da Máxima Verosimilhança 480 10.2.4. Quantos fatores se deve reter? 482 

10.3.  Rotação de Fatores 484 10.4.  Estimação dos valores dos fatores (Factor Scores ) 489 

10.4.1. Método de Bartlett 489 10.4.2. Método de Thompson 489 10.4.3. Método de Anderson-Rubin 490 

10.5.  Avaliação da qualidade do modelo fatorial 490 10.6. Análise Fatorial com variáveis qualitativas 516 10.7.  Considerações finais: AF vs. ACP 527 

Capítulo 11  

Análise de Clusters 529 11.1. Medidas de Semelhança e Dissemelhança 531 11.2.  Agrupamento Hierárquico de Clusters 538 

11.2.1.  Que tipo de método hierárquico se deve utilizar? 540 11.2.2.  Quantos Clusters se devem reter? 550 11.2.3.  Análise de Clusters hierárquica com variáveis 554 

11.3. Agrupamento não hierárquico de Clusters 557 

Capítulo 12  

Escalonamento Multidimensional 565 12.1.  Modelos de MDS 568 12.2.  MDS Clássico 569 12.3.  Algoritmos de MDS: ALSCAL e PROXSCAL 574 12.4.  Medidas da qualidade da solução de MDS 578 12.5.  MDS Replicado 600 12.6.  MDS a partir de dados em bruto 609 

Page 8: Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

vii

Capítulo 13  

Análise Discriminante 623 13.1.  Seleção das variáveis discriminantes 626 13.2.  Estimação das funções discriminantes 628 

13.2.1.  Avaliação da contribuição relativa das variáveis originais na função discriminante 635 13.2.2. Significância das funções discriminantes 638 

13.3.  Classificação por recurso às funções discriminantes 640 13.4.  Análise Discriminante Stepwise 654 

13.4.1.  Critérios de seleção de variáveis na Análise Discriminante Stepwise 655 

Capítulo 14  

Regressão Linear 671 14.1.  O modelo de regressão linear univariado tipo I 674 14.2.  Estimação dos coeficientes de regressão: O método dos mínimos quadrados 676 14.3.  Inferência sobre o modelo de regressão linear 679 

14.3.1.  A análise de variância do modelo de regressão linear 680 14.3.2.  Testes aos coeficientes do modelo de regressão 682 14.3.3.  O coeficiente de determinação 683 

14.4.  Validação dos pressupostos do modelo de regressão linear 690 14.4.1. A análise de resíduos 691 14.4.2.  Multicolinearidade 712 

14.5.  Métodos de seleção de preditores 718 14.6.  Comentários adicionais sobre diagnósticos de colinearidade 742 14.7.  Estimação do valor médio de yj e previsão de novas observações 743 14.8. Outras utilizações para o modelo de regressão linear 747 

14.8.1.  O modelo de regressão linear com variáveis qualitativas 747 14.8.2.  Testes a efeitos de moderação (interação) com o modelo de regressão linear 755 14.8.3.  Testes a efeitos de mediação com o modelo de regressão linear 761 14.8.4.  Análise de Trajetórias (Path Analysis) 769 

14.9.  O modelo de regressão linear univariado de tipo II 788 14.9.1.  Eixo principal reduzido ou regressão da média geométrica 791 14.9.2.  Método de ajustamento robusto de Kendall 794 14.9.3.  Método dos três grupos de Bartlett 796 

Capítulo 15  

Regressão Categorial 801 15.1.  Regressão Logística 804 

15.1.1. Regressão Logística ou Regressão Linear? 804 15.1.2. O Modelo de Regressão Logística 807 

Page 9: Universidade de Lisboa. É ANÁLISE ESTATÍSTICA

viii

15.1.3. Ajustamento do modelo de Regressão Logística: O Método da Máxima Verosimilhança 812 

15.1.4. Significância e qualidade do modelo de regressão logística 815 15.1.5. Seleção de variáveis com poder preditor na regressão logística múltipla 821 15.1.6. Diagnóstico de outliers e de observações influentes 823 15.1.7. Classificação por recurso à Regressão Logística 826 

15.2.  Regressão Multinomial 859 15.2.1. O modelo de regressão multinomial 859 15.2.2. Classificação por recurso à regressão multinomial 862 

15.3.  Regressão Ordinal 878 15.3.1. O Modelo de Regressão Ordinal 879 15.3.2.  Avaliação da qualidade do modelo 885 15.3.3. Teste à homogeneidade dos declives 885 15.3.4. Classificação com o modelo de regressão ordinal 886 

15.4.  Notas finais sobre os modelos de regressão categorial: Problemas numéricos 910 

Capítulo 16  

Modelos Lineares Hierárquicos 913 16.1. O Modelo Linear Hierárquico (HLM) 917 16.2. Estimação dos parâmetros do modelo 923 

16.2.1. Centragem das covariáveis 926 16.3. Estratégia de Análise e Qualidade do modelo HLM 928 

16.3.1. Teste do Rácio de Verosimilhanças 930 16.3.2. Critérios de Informação do Modelo 931 16.3.3. Teste à significância dos parâmetros 932 

16.4. Modelos Lineares Hierárquicos Generalizados (GHLM) 959  ANEXOS  

1. Distribuição Normal reduzida 967 2. Distribuição t-Student 968 3. Distribuição do Qui-quadrado 969 4. Distribuição de Fisher-Snedecor 971 

Índice Remissivo 975 Referências Bibliográficas 983