Upload
lamkhue
View
213
Download
0
Embed Size (px)
Citation preview
íNDICE
Os Autores
Prólogo
XI
XIII
PARTE 1- O Sistema R
1. Introdução ao Sistema R
1.1. O que é o R?
1.2. Instalar o R
1.3. Edição de Comandos e Ambientes de Desenvolvimento
1.4. Objetos, Funções e Packages
1.5. Ajuda e Documentação
1.6. Gravar e Recuperar uma Sessão
3
444678
2. Vetores e Tipos Primitivos
2.1. Atribuição de Valores a um Objeto
2.2. Valores Numéricos e Operadores Aritméticos
2.3. Vetores Numéricos
2.4. Acesso aos Elementos de Vetores
2.5. Funções sobre Vetores Numéricos
2.6. Vetores Lógicos
2.7. Strings e Vetores de Strings
2.8. Fatores
2.9. Valores Omissos
Exercícios Resolvidos
9
10
10
11
15
162022242526
VI Análise e Exploração de Dados com R
3. Estruturas de Dados e Funções 31
3.1. Matrizes 32
3.2. Arrays 36
3.3. Lists 37
3.4. Data Frames 39
3.5. Datas e Horas 44
3.6. Conversões entre Estruturas de Dados 45
Exercícios Resolvidos 46
4. Leitura e Escrita de Dados 51
4.1. Definição da Diretoria de Trabalho 52
4.2. Leitura de Dados 53
4.3. Escrita de Dados no Ecrã e em Ficheiro 55
Exercícios Resolvidos 57
5. Programação em R 59
5.1. Definição de Novas Funções 60
5.2. Instruções Condicionais 61
5.3. Instruções Cíclicas 62
Exercícios Resolvidos 65
6. R Markdown 71
6.1. Introdução ao R Markdown 72
6.2. Linguagem R Markdown 72
6.3. Exemplo 74
Exercícios Resolvidos 77
PARTE 11- Análise de Dados com o Sistema R 81
7. Representação, Sumariação e Pré-Processamento dos Dados 83
7.1. Estrutura e Representação dos Dados 84
7.2. Verificação da Estrutura dos Dados 86
7.3. Estatística Descritiva para Sumariação dos Dados 88
7.4. Tratamento de Valores Omissos 90
7.5. Discretização de Variáveis Numéricas 93
7.6. Estandardização dos Dados 94Exercícios Resolvidos 95
índice VII
8. Visualização Gráfica de Dados 101
8.1. Gráficos de Dispersão 102
8.2. Boxplots 107
8.3. Histogramas 1118.4. Gráficos de Barras e Pie Charts 113
8.5. Sobreposição de Objetos Gráficos 115
8.6. Formatação e Exportação de Gráficos 118
8.7. Package ggplot2 120
Exercícios Resolvidos 126
9. Inferência e Modelação Estatística 131
9.1. Distribuições de Probabilidade em R 132
9.2. Verificar a Normalidade dos Dados 142
9.3. Amostragens 144
9.4. Intervalos de Confiança 145
9.5. Testes Estatísticos 146
9.6. Análise de Variância 155
9.7. Análise de Regressão 158
Exercícios Resolvidos 166
10. Redução de Dimensionalidade 173
10.1. Análise de Componentes Principais 174
10.2. Decomposição em Valores Singulares 176
10.3. Análise Multidimensional 179
Exercícios Resolvidos 181
11. Clustering 187
11.1. Clustering Hierárquico 188
11.2. Clustering K-Means 192
Exercícios Resolvidos 194
12. Análise Preditiva e Aprendizagem Máquina: Conceitos Básicos 197
12.1. Introdução 198
12.2. Métricas de Erro 200
12.3. Método dos K-Vizinhos Mais Próximos 203
~12.4. Árvores 205
e 12.5. Modelos de Regressão para Análise Preditiva 208
VIII Análise e Exploração de Dados com R
12.6. Máquinas de Vetar de Suporte
12.7. Redes Neuronais Artificiais
12.8. Métodos Probabilísticos: Naive Bayes
Exercícios Resolvidos
210
212
213
214
13. Aprendizagem Máquina: Tópicos Complementares 221
13.1. Estimação do Erro com Validação Cruzada 222
13.2. Comparação de Modelos e Algoritmos 224
13.3. Otimização de Modelos 225
13.4. Sobreajustamento e Subajustamento: Complexidade dos Modelos 226
13.5. Seleção de Atributos 227
13.6. Conjuntos de Modelos 228
13.7. Package caret 230
Exercícios Resolvidos 236
PARTE 111- Casos de Aplicação 239
14. Reconhecimento de Atividades Humanas Usando Telemóveis 241
14.1. Descrição dos Dados
14.2. Pré-Processamento dos Dados
14.3. Análise Exploratória dos Dados
14.4. Análise Estatística Univariada
14.5. Análise de Regressão
14.6. Análise Estatística Multivariada
14.7. Análise Preditiva
242
243
247
252254
257
263
15. Análise da Qualidade de Vinhos
15.1. Descrição dos Dados
15.2. Pré-Processamento e Análise Exploratória dos Dados
15.3. Análise de Regressão
15.3.1. Modelo de Regressão
15.3.2. Avaliação do Modelo
15.3.3. Importância de Cada Variável
15.3.4. Potenciais Problemas
15.4. Comparação de Modelos de Aprendizagem Máquina
269
270
271
274
274
277
278
282
284
índice IX
16. Análise de Dados de Crédito Bancário
16.1. Descrição e Carregamento dos Dados
16.2. Análise Exploratória dos Dados
16.3. Análise Estatística dos Dados
16.4. Análise Agregada dos Dados
16.5. Aprendizagem Máquina
297
298
300
309311
318
17. Análise de Dados de Expressão Genética em Pacientes com Cancro 325
17 .1. Descrição dos Dados 326
17.2. Representação e Acesso aos Dados: O Projeto Bioconductor 327
17.3. Filtragem por Variabilidade 332
17.4. Identificação de Genes Diferencialmente Expressos 334
17.5. Clustering 338
17.6. Classificação de Amostras 340
Recursos e Conjuntos de Dados Adicionais 343
Livros 343
Repositórios de Dados e Coleções de Dados 345
Propostas Complementares de Análise de Dados 347
Ferramentas 348
Bibliografia 351
índice Remissivo 353