18
Trabajando con Datos Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Trabajando con datos

Embed Size (px)

DESCRIPTION

Guía simple para trabajar con datos.

Citation preview

Page 1: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Trabajando con Datos

Page 2: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

¿Cómo empezamos a trabajar?

Page 3: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Es muy simple.

Comenzamos con una o muchas preguntas.

¿Qué sucede en mi país?¿En qué se gasta el presupuesto público?

¿Cuántos partidos ganó mi selección?Y muchas más.

Page 4: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Hacerse algunas preguntas es una buena manera de iniciar una búsqueda de datos.

Te ayuda a concentrarte y encontrar argumentos que te servirán para resolver tus

dudas.

Page 5: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

También te ayuda a seleccionar al tipo de audiencia interesada en la temática de tu

pregunta, y así crear tu historia.

Page 6: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

De cualquier manera, si tienes una pregunta en mente o no, siempre debes de estar atento a los

patrones inesperados que encuentres en las bases de datos.

Page 7: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Cualquier dato que no esperabas, o aquellos que consideres sorprendentes, te ayudarán a contar

una historia.

Generalmente, las mejores historias salen de cosas que no esperas.

Page 8: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

De los datos a la información y al conocimiento

Page 9: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Los datos recolectados y estructurados son mucho más útiles. Crear una tabla para

ordenarlos es muy eficiente.

Eso sí, cada uno de los datos por sí mismo no nos dan información.

Para crear información de los datos, necesitamos interpretarlos.

Page 10: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Esto es información, pero todavía no es conocimiento.

El conocimiento se crea cuando la información es aprendida, aplicada y comprendida.

Page 11: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

DATA PIPELINE

Page 12: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Adquisición / Fuentes de datos¿Qué es? Es cuando describimos el acceso a los datos.

¿Cómo?Mediante la generación de nuevos datos. Por ejemplo a través

de una encuesta u observaciones.

O haciendo uso de pedidos de acceso a la información

HACKEANDO

Page 13: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Nerd Moment

Extracción (Hackeand0). Acá los datos se convierten desde cualquier formato de entrada que se ha adquirido (por ejemplo, archivos XLS,

PDF o incluso documentos de texto plano) en una forma que se puede utilizar para su

posterior procesamiento y análisis.

La mayoría de veces implica cargar los datos en un sistema de base de datos, como MySQL o PostgreSQL. O si eres más c00l MongoDB, Redis, SQLite, etc.

Page 14: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

La limpieza y la transformación

En esta etapa nos dedicaremos a limpiar y transformar los datos.

¿Qué es eso?En los datos muchas veces necesitamos eliminar registros inválidos y

traducir algunas columnas a un conjunto legible de valores. También podemos combinar conjuntos de datos de diferentes tablas

en una sola, eliminar las valores y muchas más cosas.Conforme adquirimos datos, nos daremos cuenta que tales datos a veces tienen muchas inconsistencias: nombres mal

escritos, cantidades escritas en números mal formateados y algunos datos pueden que no sean utilizados. Sí, hasta los

datos están corruptos.

Page 15: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

En resumenLos datos siempre necesitan ser limpiados y

procesados. De hecho, la mayoría de veces el procesamiento

y la limpieza de los datos son los que más tiempo y mano de obra necesitan.

Page 16: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

El análisis de los datos

¿Para qué?Para responder a tus preguntas.

Page 17: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

¿Cómo?Existen distintos tipos de herramientas que nos

van a permitir hacer un trabajo de análisis.

=3+5*2

Page 18: Trabajando con datos

Antonio Cucho | @antoniocuga | ODPE | School of Data Fellow 2014

Presentación de datos

Es el momento en el que veremos el resultado final de nuestros datos.

Es la visualización que creamos para representar los datos, teniendo en consideración uno de

nuestro objetivo final.