37
1 Introducció a Deducer VI Congrés Català / Internacional de Sociologia Taller d’introducció a l’anàlisi de dades amb el programari R 25 d’abril de 2013 Pedro LópezRoldán Departament de Sociologia http://pagines.uab.cat/plopez/content/r

Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

1

Introducció a Deducer

VI Congrés Català / Internacional de Sociologia

Taller d’introducció a l’anàlisi de dadesamb el programari R

25 d’abril de 2013

Pedro López‐RoldánDepartament de Sociologia

http://pagines.uab.cat/plopez/content/r

Page 2: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

2

DeduceR Presentació

Deducer és una interfície gràfica d’usuari (GUI) per a R que facilita l’anàlisi de les dades per menús sense programar

Permet millorar igualment l'eficiència d’un programador expert estalviant-li feina d’escriptura.

Dissenyat com a alternativa als programaris comercials com l’SPSS Disposa també d’un editor de dades visualitzar i editar bases de dades Està dissenyat per funcionar amb JGR

(la consola d’R basat en Java)

(“Jaguar” Java GUI for R)Creat per Ian Fellows

Ajuda: botó Web i Deducer Manual: http://www.deducer.org/pmwiki/index.php?n=Main.DeducerManual

Tutorial Video: http://www.youtube.com/watch?v=iZ857h2j6wA&lr=1

Page 3: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

3

DeduceR Instal·lació

Baixar des del web (Windows / MAC / Linux): http://www.deducer.org/pmwiki/index.php?n=Main.DownloadingAndInstallingDeducer

Es requereix R instal·lat de la versió 2.10.0 o superior Per a Windows existeix la possibilitat d’instal·lar el programa

directament sense necessitat de passar per R seleccionant l’opció Download Installer

Des de R, una vegada obert, cal escriure:install.packages(c("JGR","Deducer","DeducerExtras")) library(JGR) JGR()

S’obre la consola JGR Per obrir Deducer cal anar al menú de la consola:

Packages & Data\ Package Manager

i seleccionar: Deducer i DeducerExtras

Page 4: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

4

DeduceR Consola

En obrir Deducer s’obre laconsola d’R i es carreguen els paquets necessaris per poder utilitzar els menús

La finestra principal superiorcontindrà els resultats de lesanàlisis així com les instruccions d’R executades

En la finestra inferior es pot introduir sintaxi d’R addicionali executar amb <CRTL><R>

Page 5: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

5

DeduceR Editor de dades

En obrir Deducer també s’obre l’editor de dades

Podem crear noves dades O obrir un arxiu existent

Page 6: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

6

DeduceR Editor de dades: crear

Si fem New data: entren al visor Data Viewer

Pestanya Data View Pestanya Variables View

Page 7: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

7

DeduceR Editor de dades: obrir i editar

Si fem Open data: triem el tipus de dades i es veuen o s’editen al visor

Obrirdades

Desar dadesFormats:R workspace (extensió .rda i .rdata) R object (extensió .robj) Comma separated (extensió .csv) Tab delimited (extensió .txt) DBase (extensió .dbf) Stata (extensió .dta) ARFF (extensió .arff) 

Attribute‐Relation File Format 

Dades de l’espai de treball

Esborrales dadesde l’espaide treball

Botó dret

Visor de Dades

Page 8: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

8

DeduceR Editor de dades: obrir i editar

Observacions:

Es poden obrir més d’una base de dades alhora. Des de la pestanya Data Set podem seleccionar quina volem visualitzar

En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes

La ruta física on es troba la base de dades no pot contenir accents. Tampoc el nom de la base de dades

Page 9: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

9

DeduceR Editor de dades: obrir i editar

Diccionari de les dades: nom de les variables, tipus i etiquetes

Visor de VariablesNom de les variables

Tipus de variableCadena o textCategòriques: nominals o ordinalsQuantitatives contínues Quantitatives discretes Lògiques DataTempsAltre tipus 

Nivells (valors-etiquetes) de les categòriques

Page 10: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

10

DeduceR Menú Data

Destinat al tractament de matrius i la transformació de les dades

Editar els valors de les variables categòriques (Factors) Recodificar les variables Transformar les variables Renumerar els registres Ordenar les dades Transposar matrius Fusionar arxius Seleccionar un subconjunt de dades

Page 11: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

11

DeduceR Menú Data

Recodificar variables

> GSS1993[c("educ2")] <-recode.variables(GSS1993[c("educ")] , "Lo:12 -> 1;13:Hi -> 2;")

Page 12: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

12

DeduceR Menú Data

Transformació i creació de variables

> GSS1993[['educ.tr']] <- (GSS1993[['educ']] -mean(GSS1993[['educ']],na.rm=TRUE)) / sd(GSS1993[['educ']],na.rm=TRUE)> onesample.plot(d(GSS1993[['educ']], GSS1993[['educ.tr']]))

Page 13: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

13

Ordenar la matriu de dades

DeduceR Menú Data

> GSS1993<- sort(GSS1993, by=~ sexo -edad)

Page 14: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

14

Selecció de casos

DeduceR Menú Data

> GSS1993.sub<-subset(GSS1993,sexo == 'Hombre‘ & edad <= 30)

Page 15: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

15

Fusió d’arxius

DeduceR Menú Data

> data.merged<-merge(Datos.de.empleados.A.temp,Datos.de.empleados.B.temp,by.x=c("ID"),by.y=c("ID"),incomparables = NA,all.x =T,all.y=T)> rm(list=c("Datos.de.empleados.A.temp","Datos.de.empleados.B.temp"))

Page 16: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

16

Procediments d’anàlisi de les dades

DeduceR Menú Analysis

Page 17: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

17

Freqüències

DeduceR Menú Analysis

> frequencies(GSS1993[c("educ","sexo")] , r.digits = 1)

Page 18: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

18

Freqüències

DeduceR Menú Analysis

• Els resultats es poden copiar i enganxar en un processador de textos

• Hi ha funcions d’R per exportar a Excel o Latex

Page 19: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

19

Descriptius

DeduceR Menú Analysis

> descriptive.table(vars = d(educ) ,+ strata = d(sexo),data= GSS1993,+ func.names =c("Mean","St. Deviation","Valid N","Median","25th Percentile","75th Percentile","Minimum","Maximum","Skew",+ "Kurtosis"))

Page 20: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

20

Descriptius

DeduceR Menú Analysis

Page 21: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

21

Taules de contingència

DeduceR Menú Analysis

> tables<-contingency.tables(+ row.vars=d(voto),+ col.vars=d(diarios),data=GSS1993)> tables<-add.chi.squared(tables)> print(tables,prop.r=T,prop.c=T,prop.t=F)

Page 22: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

22

Taules de contingència

DeduceR Menú Analysis

Page 23: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

23

Regressió lineal

DeduceR Menú Analysis

> model.lm <- lm(formula=indsocec ~ educ,data=GSS1993,na.action=na.omit)> Anova(model.lm,type='II')> summary(model.lm)

Exploració model

Construcció model

Page 24: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

24

Regressió lineal: exploració model

DeduceR Menú Analysis

Supòsits del model-No outliers-Funció ben definida-Igual variància-Mostra gran o residus normals

Torna a l’especificaciódel model

Page 25: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

25

Regressió lineal: exploració model

DeduceR Menú Analysis

Supòsit distribuciónormal dels residus

Allunyament de la linealitat

Supòsit d’homoscedasticitat

Outliers influents

Page 26: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

26

Regressió lineal: exploració model

DeduceR Menú Analysis

Ajustamentlineal i desviació la linealitat

Page 27: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

27

Regressió lineal: exploració model

DeduceR Menú Analysis

Ajustamentlineal, mirar si l’anterior no hi és.

Page 28: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

28

Regressió lineal

DeduceR Menú Analysis

Page 29: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

29

Gràfics (ggplot, ggplot2)

DeduceR Menú Plot

Assistent per a elaborar gràfics

Importació de plantilles

Obrir un gràfic

Elecció ràpida d’un gràfic i accés a Plot Builder

Gràfics interactius

Page 30: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

30

Gràfics: Plot Builder

DeduceR Menú Plot

Plantilles: gràfics habituals

Elements geomètrics: afegeix una capa de com es veuran les dades

Elements estadístics: afegeix una capa de com es calculen les dades

Escales: aplica transformacions a les dades

Canvia el sistema de coordenades

Divideix en panells

Altresaparences

Edició del component Activar/desactivar

Suprimeix

Page 31: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

31

Gràfics: Plot Builder. Histograma

DeduceR Menú Plot

Page 32: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

32

Gràfics: Plot Builder. Histograma

DeduceR Menú Plot

Page 33: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

33

Gràfics: Plot Builder. Histograma

DeduceR Menú Plot

Page 34: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

34

Gràfics: Plot Builder. Histograma

DeduceR Menú Plot

Page 35: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

35

DeduceR Utilitats addicionals

Menú File Obrir, crear i desar arxius de dades

Editor d’instruccions

Page 36: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

36

DeduceR Utilitats addicionals

Menú Edit

Amb Copy Special/Copy Commands es poden copiar totes les instruccions utilitzdes en la sessió

Configuració de preferències de la consola

Page 37: Pàgines de la UAB - Introducció a Deducer...En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes La ruta física on es troba la base de dades

37

DeduceR Utilitats addicionals

Menú Packages & Data: instal·lar i carregar paquets addicionals

A Package Manager podem triar quinspaquets es carreguen de manera automática:DeducerExtras: Distribution quantiles, single/multiple sample proportiontests, paired t‐test, Wilcoxon signed rank test, Levene's test, Bartlett'stest, k‐means clustering, Hierarchical clustering, factor analysis, andmulti‐dimensional scaling. DeducerMMR: Moderated multiple regression and simple slopes analysis. DeducerPlugInScaling: Reliability and factor analysis. DeducerSpatial: A GUI for Spatial Data Analysis and Visualization. DeducerSurvival: Survival analysis. DeducerText (Experimental): Text Mining. gMCP (Experimental): A graphical approach to sequentially rejectivemultiple test procedures. RGG (Experimental): A GUI Generator.