Click here to load reader
Upload
granada-gimenez-vacas
View
164
Download
1
Embed Size (px)
Citation preview
BiG DataGranada Giménez-Vacas
Consultor en Big Data, Data Discovery
¿Qué es BiG Data?
En las noticias:◦ http://www.elconfidencial.com/tecnologia/2014-10-10/el-big-data-
demuestra-que-espana-es-el-peor-pais-para-comprar-videojuegos_228888/
◦ http://www.elconfidencial.com/alma-corazon-vida/2013-11-25/big-data-el-nuevo-poder-absoluto-que-controlara-nuestras-vidas_57943/
◦ http://blogs.elconfidencial.com/economia/big-data/2014-01-23/igualdad-pobreza-manipulacion-y-estadistica_79656/
Big Data es un paradigma con tres aspectos principales:
Marketing por parte de la industria del SW (vendedores de SW y HW)
Tecnológico con el NoSql en su centro
Negocio, nuevas formas de afrontar nuevos y viejos problemas. Nuevas compañías
Granada Giménez-Vacas - Consultor
BiG Data
BiG Data: Marketing
Granada Giménez-Vacas - Consultor
BiG Data
BiG Data: Tecnología
Tecnología NoSql
Nuevas Bases de datos Distribuidas
◦ Libre distribución
◦ Relativamente recientes
◦ Start-up universitarias que concluyen en o
bien la adquisión por parte de una
compañía de SW tradicional (Netezza
IBM, Aster Teradata) o la creación de una
compañía de SW mediante capitalización
mediante fondos de inversión (Couldera,
Mongodb, Casandra) Granada Giménez-Vacas - Consultor
BiG Data
BiG Data: Tecnología
Nuevas tecnologías de procesamiento de información no estructurada (Attivio)
Relanzamiento de lenguajes de programación
SAS
R
Mathlab
Aparición de tecnologías para el procesamiento de información in-motion. (Coherence de Oracle)
Granada Giménez-Vacas - Consultor
BiG Data
BiG Data: Tecnología
Área de BI:
◦ Data Discovery
◦ Visual Analytics
◦ Predictive Analytics
◦ Event Analytics
Proceso de eventos (Stream)
Realmente todas las compañías de
Hw y Sw están “adaptándose” al
nuevo paradigma con más o menos
éxito Granada Giménez-Vacas - Consultor
BiG Data
BiG Data: Who is who?
Nombre
Creación
Descripción
Hadoop 2007 Es un framework de sw que soporta
aplicaciones distribuidas bajo licencia libre.
Introduce el concepto MapReduce. Es
soportado por comunidades de usuarios que
utilizan Java. Su principal instalación es
Yahoo.
Couldera 2009 Es una compañía de SW americana que
distribuye una serie de productos basados
sobre Hadoop sobre Apache. Proporciona
SW, soporte, servicios y training.
Cassandra 2011 Es un SGBD para bases de datos distribuidas
de libre licenciamiento. Es capaz de gestionar
grandes cantidades de datos en diferentes
servidores con una arquitectura sin puntos de
fallo. La versión comercial se inicia en 2014.Granada Giménez-Vacas - Consultor
BiG Data
BiG Data: Who is who?
Nombre
Creación
Descripción
Aster 2005 Es una distribución de SW sobre Hadoop. No
es unicamente una BD al estilo de Couldera
sino que es un suit estadistico capaz de
utilizar una base de datos NoSQL. Fue
adquirida en 2013 por Teradata.
Netezza 1999 Es una base de datos más tradicional para el
almacenamiento de grandes cantidades de
datos al estilo de Teradata. Fue adquirida por
IBM y forma parte de su suit de BiG Data.
MongoDB 2007 Es un sistema de base de datos noSqL
desarrollado bajo el concepto de código
abierto. Se basa en la gestión de documentos
JSON y no usa SQL. El acceso a los datos es
mediante código no por consultas
Granada Giménez-Vacas - Consultor
BiG Data
BiG Data: Negocio
En 2013 comienzan los primeros
pilotos en empresas no tecnológicas
(Google, Yahoo, Facebook están
sustentadas en este paradigma)
Concepto de “Data Driven Company”
Existen numerosos casos de uso
(teóricos) donde aplicar el paradigma
Granada Giménez-Vacas - Consultor
BiG Data
BiG Data: Negocio
Industria Caso de Uso
Finanzas Fraude
Regulación (Basilea III)
Logística /
Distribución
Optimización
Gestión de Compras
Geolocalización: Indoor/outdoor
Farma Investigación clínica
Turismo Calculo de rutas áreas
Previsión de reservas
Marketing Gestión de la reputación
Upselling/Cross Selling
Digital Marketing
Telco Facturación
Fraude
Internet
Granada Giménez-Vacas - Consultor
BiG Data
BiG Data: Retos
Las expectativas no se han cumplido en tanto
a proyectos e inversiones:
Alto Coste (gratis es el peor precio)
Crisis económica
Desconfianza hacia la tecnología
Los proyectos de BiG Data no son percibidos
como una necesidad real en muchas
empresas
Las voces críticas dicen que es un Buzz-
word
¡
Granada Giménez-Vacas - Consultor
BiG Data
Big Data: Retos No obstante se prevé que el Big data
entre antes que tarde en la vida real:
Nuevas profesiones asociadas:
1M de puestos de aquí a 10 años en
USA, 3 en EMEA
Negocio:
Data Scientist,
BD Marketer,
Data Specialist
IT: Hadoop, Couldera developer
¡ Granada Giménez-Vacas - Consultor
BiG Data
BiG Data Jobs (08/12/2014)
Granada Giménez-Vacas - Consultor
BiG Data
http://empleo.trovit.es/empleo-data-
scientist-en-madrid-provincia