13

Click here to load reader

Iniciación al BiG Data - español

Embed Size (px)

Citation preview

Page 1: Iniciación al BiG Data - español

BiG DataGranada Giménez-Vacas

Consultor en Big Data, Data Discovery

Page 2: Iniciación al BiG Data - español

¿Qué es BiG Data?

En las noticias:◦ http://www.elconfidencial.com/tecnologia/2014-10-10/el-big-data-

demuestra-que-espana-es-el-peor-pais-para-comprar-videojuegos_228888/

◦ http://www.elconfidencial.com/alma-corazon-vida/2013-11-25/big-data-el-nuevo-poder-absoluto-que-controlara-nuestras-vidas_57943/

◦ http://blogs.elconfidencial.com/economia/big-data/2014-01-23/igualdad-pobreza-manipulacion-y-estadistica_79656/

Big Data es un paradigma con tres aspectos principales:

Marketing por parte de la industria del SW (vendedores de SW y HW)

Tecnológico con el NoSql en su centro

Negocio, nuevas formas de afrontar nuevos y viejos problemas. Nuevas compañías

Granada Giménez-Vacas - Consultor

BiG Data

Page 3: Iniciación al BiG Data - español

BiG Data: Marketing

Granada Giménez-Vacas - Consultor

BiG Data

Page 4: Iniciación al BiG Data - español

BiG Data: Tecnología

Tecnología NoSql

Nuevas Bases de datos Distribuidas

◦ Libre distribución

◦ Relativamente recientes

◦ Start-up universitarias que concluyen en o

bien la adquisión por parte de una

compañía de SW tradicional (Netezza

IBM, Aster Teradata) o la creación de una

compañía de SW mediante capitalización

mediante fondos de inversión (Couldera,

Mongodb, Casandra) Granada Giménez-Vacas - Consultor

BiG Data

Page 5: Iniciación al BiG Data - español

BiG Data: Tecnología

Nuevas tecnologías de procesamiento de información no estructurada (Attivio)

Relanzamiento de lenguajes de programación

SAS

R

Mathlab

Aparición de tecnologías para el procesamiento de información in-motion. (Coherence de Oracle)

Granada Giménez-Vacas - Consultor

BiG Data

Page 6: Iniciación al BiG Data - español

BiG Data: Tecnología

Área de BI:

◦ Data Discovery

◦ Visual Analytics

◦ Predictive Analytics

◦ Event Analytics

Proceso de eventos (Stream)

Realmente todas las compañías de

Hw y Sw están “adaptándose” al

nuevo paradigma con más o menos

éxito Granada Giménez-Vacas - Consultor

BiG Data

Page 7: Iniciación al BiG Data - español

BiG Data: Who is who?

Nombre

Creación

Descripción

Hadoop 2007 Es un framework de sw que soporta

aplicaciones distribuidas bajo licencia libre.

Introduce el concepto MapReduce. Es

soportado por comunidades de usuarios que

utilizan Java. Su principal instalación es

Yahoo.

Couldera 2009 Es una compañía de SW americana que

distribuye una serie de productos basados

sobre Hadoop sobre Apache. Proporciona

SW, soporte, servicios y training.

Cassandra 2011 Es un SGBD para bases de datos distribuidas

de libre licenciamiento. Es capaz de gestionar

grandes cantidades de datos en diferentes

servidores con una arquitectura sin puntos de

fallo. La versión comercial se inicia en 2014.Granada Giménez-Vacas - Consultor

BiG Data

Page 8: Iniciación al BiG Data - español

BiG Data: Who is who?

Nombre

Creación

Descripción

Aster 2005 Es una distribución de SW sobre Hadoop. No

es unicamente una BD al estilo de Couldera

sino que es un suit estadistico capaz de

utilizar una base de datos NoSQL. Fue

adquirida en 2013 por Teradata.

Netezza 1999 Es una base de datos más tradicional para el

almacenamiento de grandes cantidades de

datos al estilo de Teradata. Fue adquirida por

IBM y forma parte de su suit de BiG Data.

MongoDB 2007 Es un sistema de base de datos noSqL

desarrollado bajo el concepto de código

abierto. Se basa en la gestión de documentos

JSON y no usa SQL. El acceso a los datos es

mediante código no por consultas

Granada Giménez-Vacas - Consultor

BiG Data

Page 9: Iniciación al BiG Data - español

BiG Data: Negocio

En 2013 comienzan los primeros

pilotos en empresas no tecnológicas

(Google, Yahoo, Facebook están

sustentadas en este paradigma)

Concepto de “Data Driven Company”

Existen numerosos casos de uso

(teóricos) donde aplicar el paradigma

Granada Giménez-Vacas - Consultor

BiG Data

Page 10: Iniciación al BiG Data - español

BiG Data: Negocio

Industria Caso de Uso

Finanzas Fraude

Regulación (Basilea III)

Logística /

Distribución

Optimización

Gestión de Compras

Geolocalización: Indoor/outdoor

Farma Investigación clínica

Turismo Calculo de rutas áreas

Previsión de reservas

Marketing Gestión de la reputación

Upselling/Cross Selling

Digital Marketing

Telco Facturación

Fraude

Internet

Granada Giménez-Vacas - Consultor

BiG Data

Page 11: Iniciación al BiG Data - español

BiG Data: Retos

Las expectativas no se han cumplido en tanto

a proyectos e inversiones:

Alto Coste (gratis es el peor precio)

Crisis económica

Desconfianza hacia la tecnología

Los proyectos de BiG Data no son percibidos

como una necesidad real en muchas

empresas

Las voces críticas dicen que es un Buzz-

word

¡

Granada Giménez-Vacas - Consultor

BiG Data

Page 12: Iniciación al BiG Data - español

Big Data: Retos No obstante se prevé que el Big data

entre antes que tarde en la vida real:

Nuevas profesiones asociadas:

1M de puestos de aquí a 10 años en

USA, 3 en EMEA

Negocio:

Data Scientist,

BD Marketer,

Data Specialist

IT: Hadoop, Couldera developer

¡ Granada Giménez-Vacas - Consultor

BiG Data

Page 13: Iniciación al BiG Data - español

BiG Data Jobs (08/12/2014)

Granada Giménez-Vacas - Consultor

BiG Data

http://empleo.trovit.es/empleo-data-

scientist-en-madrid-provincia