Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
1
Introducció a Deducer
VI Congrés Català / Internacional de Sociologia
Taller d’introducció a l’anàlisi de dadesamb el programari R
25 d’abril de 2013
Pedro López‐RoldánDepartament de Sociologia
http://pagines.uab.cat/plopez/content/r
2
DeduceR Presentació
Deducer és una interfície gràfica d’usuari (GUI) per a R que facilita l’anàlisi de les dades per menús sense programar
Permet millorar igualment l'eficiència d’un programador expert estalviant-li feina d’escriptura.
Dissenyat com a alternativa als programaris comercials com l’SPSS Disposa també d’un editor de dades visualitzar i editar bases de dades Està dissenyat per funcionar amb JGR
(la consola d’R basat en Java)
(“Jaguar” Java GUI for R)Creat per Ian Fellows
Ajuda: botó Web i Deducer Manual: http://www.deducer.org/pmwiki/index.php?n=Main.DeducerManual
Tutorial Video: http://www.youtube.com/watch?v=iZ857h2j6wA&lr=1
3
DeduceR Instal·lació
Baixar des del web (Windows / MAC / Linux): http://www.deducer.org/pmwiki/index.php?n=Main.DownloadingAndInstallingDeducer
Es requereix R instal·lat de la versió 2.10.0 o superior Per a Windows existeix la possibilitat d’instal·lar el programa
directament sense necessitat de passar per R seleccionant l’opció Download Installer
Des de R, una vegada obert, cal escriure:install.packages(c("JGR","Deducer","DeducerExtras")) library(JGR) JGR()
S’obre la consola JGR Per obrir Deducer cal anar al menú de la consola:
Packages & Data\ Package Manager
i seleccionar: Deducer i DeducerExtras
4
DeduceR Consola
En obrir Deducer s’obre laconsola d’R i es carreguen els paquets necessaris per poder utilitzar els menús
La finestra principal superiorcontindrà els resultats de lesanàlisis així com les instruccions d’R executades
En la finestra inferior es pot introduir sintaxi d’R addicionali executar amb <CRTL><R>
5
DeduceR Editor de dades
En obrir Deducer també s’obre l’editor de dades
Podem crear noves dades O obrir un arxiu existent
6
DeduceR Editor de dades: crear
Si fem New data: entren al visor Data Viewer
Pestanya Data View Pestanya Variables View
7
DeduceR Editor de dades: obrir i editar
Si fem Open data: triem el tipus de dades i es veuen o s’editen al visor
Obrirdades
Desar dadesFormats:R workspace (extensió .rda i .rdata) R object (extensió .robj) Comma separated (extensió .csv) Tab delimited (extensió .txt) DBase (extensió .dbf) Stata (extensió .dta) ARFF (extensió .arff)
Attribute‐Relation File Format
Dades de l’espai de treball
Esborrales dadesde l’espaide treball
Botó dret
Visor de Dades
8
DeduceR Editor de dades: obrir i editar
Observacions:
Es poden obrir més d’una base de dades alhora. Des de la pestanya Data Set podem seleccionar quina volem visualitzar
En desar la sessió de treball (workspace) es guardaran totes les bases de dades obertes
La ruta física on es troba la base de dades no pot contenir accents. Tampoc el nom de la base de dades
9
DeduceR Editor de dades: obrir i editar
Diccionari de les dades: nom de les variables, tipus i etiquetes
Visor de VariablesNom de les variables
Tipus de variableCadena o textCategòriques: nominals o ordinalsQuantitatives contínues Quantitatives discretes Lògiques DataTempsAltre tipus
Nivells (valors-etiquetes) de les categòriques
10
DeduceR Menú Data
Destinat al tractament de matrius i la transformació de les dades
Editar els valors de les variables categòriques (Factors) Recodificar les variables Transformar les variables Renumerar els registres Ordenar les dades Transposar matrius Fusionar arxius Seleccionar un subconjunt de dades
11
DeduceR Menú Data
Recodificar variables
> GSS1993[c("educ2")] <-recode.variables(GSS1993[c("educ")] , "Lo:12 -> 1;13:Hi -> 2;")
12
DeduceR Menú Data
Transformació i creació de variables
> GSS1993[['educ.tr']] <- (GSS1993[['educ']] -mean(GSS1993[['educ']],na.rm=TRUE)) / sd(GSS1993[['educ']],na.rm=TRUE)> onesample.plot(d(GSS1993[['educ']], GSS1993[['educ.tr']]))
13
Ordenar la matriu de dades
DeduceR Menú Data
> GSS1993<- sort(GSS1993, by=~ sexo -edad)
14
Selecció de casos
DeduceR Menú Data
> GSS1993.sub<-subset(GSS1993,sexo == 'Hombre‘ & edad <= 30)
15
Fusió d’arxius
DeduceR Menú Data
> data.merged<-merge(Datos.de.empleados.A.temp,Datos.de.empleados.B.temp,by.x=c("ID"),by.y=c("ID"),incomparables = NA,all.x =T,all.y=T)> rm(list=c("Datos.de.empleados.A.temp","Datos.de.empleados.B.temp"))
16
Procediments d’anàlisi de les dades
DeduceR Menú Analysis
17
Freqüències
DeduceR Menú Analysis
> frequencies(GSS1993[c("educ","sexo")] , r.digits = 1)
18
Freqüències
DeduceR Menú Analysis
• Els resultats es poden copiar i enganxar en un processador de textos
• Hi ha funcions d’R per exportar a Excel o Latex
19
Descriptius
DeduceR Menú Analysis
> descriptive.table(vars = d(educ) ,+ strata = d(sexo),data= GSS1993,+ func.names =c("Mean","St. Deviation","Valid N","Median","25th Percentile","75th Percentile","Minimum","Maximum","Skew",+ "Kurtosis"))
20
Descriptius
DeduceR Menú Analysis
21
Taules de contingència
DeduceR Menú Analysis
> tables<-contingency.tables(+ row.vars=d(voto),+ col.vars=d(diarios),data=GSS1993)> tables<-add.chi.squared(tables)> print(tables,prop.r=T,prop.c=T,prop.t=F)
22
Taules de contingència
DeduceR Menú Analysis
23
Regressió lineal
DeduceR Menú Analysis
> model.lm <- lm(formula=indsocec ~ educ,data=GSS1993,na.action=na.omit)> Anova(model.lm,type='II')> summary(model.lm)
Exploració model
Construcció model
24
Regressió lineal: exploració model
DeduceR Menú Analysis
Supòsits del model-No outliers-Funció ben definida-Igual variància-Mostra gran o residus normals
Torna a l’especificaciódel model
25
Regressió lineal: exploració model
DeduceR Menú Analysis
Supòsit distribuciónormal dels residus
Allunyament de la linealitat
Supòsit d’homoscedasticitat
Outliers influents
26
Regressió lineal: exploració model
DeduceR Menú Analysis
Ajustamentlineal i desviació la linealitat
27
Regressió lineal: exploració model
DeduceR Menú Analysis
Ajustamentlineal, mirar si l’anterior no hi és.
28
Regressió lineal
DeduceR Menú Analysis
29
Gràfics (ggplot, ggplot2)
DeduceR Menú Plot
Assistent per a elaborar gràfics
Importació de plantilles
Obrir un gràfic
Elecció ràpida d’un gràfic i accés a Plot Builder
Gràfics interactius
30
Gràfics: Plot Builder
DeduceR Menú Plot
Plantilles: gràfics habituals
Elements geomètrics: afegeix una capa de com es veuran les dades
Elements estadístics: afegeix una capa de com es calculen les dades
Escales: aplica transformacions a les dades
Canvia el sistema de coordenades
Divideix en panells
Altresaparences
Edició del component Activar/desactivar
Suprimeix
31
Gràfics: Plot Builder. Histograma
DeduceR Menú Plot
32
Gràfics: Plot Builder. Histograma
DeduceR Menú Plot
33
Gràfics: Plot Builder. Histograma
DeduceR Menú Plot
34
Gràfics: Plot Builder. Histograma
DeduceR Menú Plot
35
DeduceR Utilitats addicionals
Menú File Obrir, crear i desar arxius de dades
Editor d’instruccions
36
DeduceR Utilitats addicionals
Menú Edit
Amb Copy Special/Copy Commands es poden copiar totes les instruccions utilitzdes en la sessió
Configuració de preferències de la consola
37
DeduceR Utilitats addicionals
Menú Packages & Data: instal·lar i carregar paquets addicionals
A Package Manager podem triar quinspaquets es carreguen de manera automática:DeducerExtras: Distribution quantiles, single/multiple sample proportiontests, paired t‐test, Wilcoxon signed rank test, Levene's test, Bartlett'stest, k‐means clustering, Hierarchical clustering, factor analysis, andmulti‐dimensional scaling. DeducerMMR: Moderated multiple regression and simple slopes analysis. DeducerPlugInScaling: Reliability and factor analysis. DeducerSpatial: A GUI for Spatial Data Analysis and Visualization. DeducerSurvival: Survival analysis. DeducerText (Experimental): Text Mining. gMCP (Experimental): A graphical approach to sequentially rejectivemultiple test procedures. RGG (Experimental): A GUI Generator.