Upload
others
View
10
Download
0
Embed Size (px)
Citation preview
Ciencias de Datos con R:
Fundamentos Estadısticos
Daniela Rodriguez ([email protected])Mariela Sued ([email protected])
2018
¿Que espera de la materia?
Mejorar mis conceptos teoricos sobre estadıstica
Tener mınimas herramientas de programacion
Ampliar mis conocimientos en estadıstica y programacioncon R
Aprender rudimentos de programacion
Tener R como lenguaje de progamacion para estadistica.
Otras preguntas
Carrera de Doctorado:
43% Biologıa14 % Quımica10 % Computacion
Indique el lenguaje de programacion que mejor maneja:25 % Ninguno
¿Que es R?
R es un lenguaje de programacion.
Fue disenado para el analisis de datos y la elaboracion degraficos.
Software libre, corre en diferentes sistemas operativos.
Interaccion por linea de comandos (reglas de sintaxis).
https://www.r-project.org/
Pagina de R
¿Que es Rstudio?Es un entorno amigable donde ejecutar R.
https://www.rstudio.com/
Rstudio: Pantalla
Pantalla de Rstudio
Console: Ejecuta comandos y muestra los resultados.
Editor: Aca se escribe lo que se quiere ejecutar (script)
History - Environment
Files - Plots - Packages - Help - Viewer
R como calculadora
2+79*3potencia ?62/3sqrt(4)log(1)exp(1)cos(pi)
Asignacion - Creacion de objetos.
Podemos darle nombre a las cosas y asociarles un valor. Estose llama asignar un valor a una variable.
< −
< − se consigue con el menor, seguido del guion.
pepe< − 3: crea el objeto pepe y le asigna el valor 3.
vector prueba < − c(1,2,4): crea el objeto vector pruebay le asigna los valores 1,2 y 4.
Vectores
c(a,b,c) crea vector concatenando a,b,crep (a,n) repite a n-veces
seq(1:n) equivale a 1:n (1, 2, 3, . . . , n)seq(a,b,by=c) (a, a+ c, a+ 2c, . . . ) hasta b
x[4] selecciona la cuarta coordenada del vector xx[c(2,5)] selecciona la segunda y quinta coordenada del vector xlength(x) calcula la longitud del vector x
Tarea 1 - Graficos
xx< −c(1, 2, 3, 4, 5, 6, 7)yy< −c(1, 4, 9, 16, 25, 36, 49)plot(xx,yy)
Tarea 1 - Graficosxx< −c(1, 2, 3, 4, 5, 6, 7)yy< −c(1, 4, 9, 16, 25, 36, 49)plot(xx,yy)
Grafico en el continuo
Grafico en el continuo
xxcont<−seq ( 0 , 7 , by =0.01)#armo g r i l l a#n e c e s i t o ahora e l e v a r cada e l e m e n t o a l cuadrado .nxx<−l e n g t h ( x x c o n t )yycont<−r e p (NA, nxx )f o r ( i i n 1 : nxx ){y y c o n t [ i ]<− x x c o n t [ i ] ˆ 2}
p l o t ( xxcont , yycont , t y p e=” l ”)
Bucles: for
Bucles que se utiliza para repetir cierta accion. Es util siconocemos de antemano el numero de veces que hay que
repetir la accion (iteraciones).
for (val in sequence){statement}
Tarea 2: Analisis Matematico I - Biologıa
Practica 5: Regla de L’Hospital - Estudio de funciones
Sea f(x) = 15x4 − 32x3 + 23x2 − 8x+ 17.
Calcule
f(−1) =f(−0.8) =f(−0.5) =
Funcion - Ejemplo
f u n c i o n 1<−f u n c t i o n ( mongo ){
s a l i d a <−15∗mongoˆ4−32∗mongoˆ3+23∗mongoˆ2−8∗mongo+17
r e t u r n ( s a l i d a )}
#l l a m o a l a f u n c i o nf u n c i o n 1 (−0.8)
Funcion
Es un tipo de construccion que permite encerrar un pedacitode codigo, para realizar una misma tarea en diferentes
situaciones
NombreFuncion<−f u n c t i o n ( argumentos ){c u e r p o f u n c i o nr e t u r n ( )}
#l l a m o a l a f u n c i o nNombreFuncion ( v a l o r e s pa ra l o s argumentos )
Graficamos:
Grafique f(x) = 15x4−32x3+23x2−8x+17 para x en [−1, 1]
Tarea 3:
Sea g(x) =
{x2 si x ≤ 12x− 1 si x > 1
Implemente una funcion funciong que dado un numerodevuelva el valor de la funcion g en ese numero.
Grafique la funcion g(x) para x ∈ [−13, 14].
Tarea 3:
Sea g(x) =
{x2 si x ≤ 12x− 1 si x > 1
Implemente una funcion funciong que dado un numerodevuelva el valor de la funcion g en ese numero.
Grafique la funcion g(x) para x ∈ [−13, 14].
Estructura de control: if
Permite ejecutar una serie de instrucciones si se cumple ciertacondicion.
i f ( t e s t e x p r e s s i o n ) {s t a t e m e n t}
i f ( t e s t e x p r e s s i o n 1 ) {s t a t e m e n t 1} e l s e i f ( t e s t e x p r e s s i o n 2 ) {s t a t e m e n t 2} e l s e {s t a t e m e n t 4}
Estructura de control: if
Permite ejecutar una serie de instrucciones si se cumple ciertacondicion.
i f ( t e s t e x p r e s s i o n ) {s t a t e m e n t}
i f ( t e s t e x p r e s s i o n 1 ) {s t a t e m e n t 1} e l s e i f ( t e s t e x p r e s s i o n 2 ) {s t a t e m e n t 2} e l s e {s t a t e m e n t 4}
Album de Figuritas
Album Vacıo
Compramos Figuritas
Album Lleno
Completando el album:
Album con 640 figuritas.
Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.
Cada paquete incluye 5 figuritas.
¿Que preguntas podemos plantear?
¿Cuantos paquetes hay que comprar para llenar el album?
EN PROMEDIO, ¿cuantos paquetes hay que comprarpara llenar el album?
¿Que chances tengo de completar el album si puedocomprar a lo sumo 800 paquetes?
Completando el album:
Album con 640 figuritas.
Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.
Cada paquete incluye 5 figuritas.
¿Que preguntas podemos plantear?
¿Cuantos paquetes hay que comprar para llenar el album?
EN PROMEDIO, ¿cuantos paquetes hay que comprarpara llenar el album?
¿Que chances tengo de completar el album si puedocomprar a lo sumo 800 paquetes?
Completando el album:
Album con 640 figuritas.
Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.
Cada paquete incluye 5 figuritas.
¿Que preguntas podemos plantear?
¿Cuantos paquetes hay que comprar para llenar el album?
EN PROMEDIO, ¿cuantos paquetes hay que comprarpara llenar el album?
¿Que chances tengo de completar el album si puedocomprar a lo sumo 800 paquetes?
Completando el album:
Album con 640 figuritas.
Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.
Cada paquete incluye 5 figuritas.
¿Que preguntas podemos plantear?
¿Cuantos paquetes hay que comprar para llenar el album?
EN PROMEDIO, ¿cuantos paquetes hay que comprarpara llenar el album?
¿Que chances tengo de completar el album si puedocomprar a lo sumo 800 paquetes?
Simplificacion: se venden figuritas individualmente.
Album con 6 figuritas.
Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.
Compramos figuritas de a una.
EN PROMEDIO, ¿cuantas figuritas hay que comprar parallenar el album?
Compremos figuritas y...¡a experimentar!
¿Como podemos experimentar sin comprar figuritas?
Simplificacion: se venden figuritas individualmente.
Album con 6 figuritas.
Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.
Compramos figuritas de a una.
EN PROMEDIO, ¿cuantas figuritas hay que comprar parallenar el album?
Compremos figuritas y...¡a experimentar!
¿Como podemos experimentar sin comprar figuritas?
Simplificacion: se venden figuritas individualmente.
Album con 6 figuritas.
Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.
Compramos figuritas de a una.
EN PROMEDIO, ¿cuantas figuritas hay que comprar parallenar el album?
Compremos figuritas y...¡a experimentar!
¿Como podemos experimentar sin comprar figuritas?
TODOS PENSANDO y CIERRE PARA ALBUM CON 6FIGURITAS
Vamos a resolver la guıa.
Operadores
Aritmeticos Comparativos Logicos
+ Adicion == Igual a & Y logico- Substraccion != Diferente de ! NO logico∗/ Multiplicacion Division <,> Menor que, Mayor que | O logico
Funciones
Funciones matematicas Funciones estadısticas
sqrt(x) Raız de x mean(x) Mediaexp(x) Exponencial de x sd(x) Desviolog(x) Logaritmo natural de x var(x) Varianzalog10(x) Logaritmo base 10 median(x) Medianalength(x) Numero de elementos quantile(x,p) Quantilessum(x) Suma los elementos de x max(x) El maximoprod(x) Producto de los elementos min(x) El mınimosin(x) Seno summary(x) Resumencos(x) Coseno sort(x) Ordena (creciente)tan(x) Tangenteround(x,n) redondea a n dıgitoscumsum(x) calcula las sumas acumuladaschoose(n, k) calcula en combinatorio
Use variable < − value to assign a value to a variable inorder to record it in memory.
Objects are created on demand whenever a value isassigned to them.
The function length gives the number of elements in avector
Use object[i] to select a the i-th element from object.
Use from:to to specify a sequence that includes theindices from from to to.
All the indexing and subsetting that works on data framesalso works on vectors.
Use # to add comments to programs.
Use apply to calculate statistics across the rows orcolumns of a data frame.
Use plot to create scatterplot visualizations. content...
Graficos
plot(x,y) grafica los pares x vs. y - help(plot)hist(x) realiza un histograma con los valores del vector x - help(hist)
boxplot(x) realiza un boxplot con los valores del vector x - help(boxplot)barplot(x) realiza grafico de barras de x - help(barplot)
pie(table(x)) realiza grafico de torta de la tabla de x - help(pie)par(mfrow = c(1, 2)) particiona el entonrno grafico
Dos referencias
http://cms.dm.uba.ar/academico/materias/1ercuat2016/probabilidades y estadistica C/
http://cms.dm.uba.ar/academico/materias/1ercuat2016/estadisticaQ/practicas
Bucles
Hay dos tipos de bucles dependiendo de si conocemos deantemano el numero de veces que hay que repetirlo
(iteraciones).
La construccion for es muy util especialmente cuando sesabe el total de trabajo a realizar (por ejemplo sumartodos los elementos de un vector).
El while tambien permite recorrer, pero es mas flexiblerespecto a cuando dejar de hacerlo.
El while ofrece mas posibilidades para elegir condicionesde corte del ciclo. interesantes.
while
while (condition){statement}
Comparaciones
< menor
<= menor o igual
> mayor
>= mayor o igual
== igual
!= diferente
Combinando comparaciones
Tambien se pueden compbinar distintas condiciones utilizandooperadores logicos
& se usa x & y. Solo da TRUE cuando x y y son TRUE
or Da TRUE cando alguna de las dos condiciones (o lasdos) es TRUE.