12
Thought Leadership, documento técnico Junio de 2013 IBM Software Las cinco mejores formas de abordar big data

Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

  • Upload
    vudang

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

Thought Leadership, documento técnico

Junio de 2013IBM Software

Las cinco mejores formas de abordar big data

Page 2: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

2 Las cinco mejores formas de abordar big data

Big data: una oportunidad de alto riesgo¿Se acuerda de cómo era el mundo antes de big data? Este término está tan extendido en el lenguaje empresarial que a veces nos cuesta recordar que big data es un fenómeno relativamente reciente. Algunos lo consideran como una moda pasajera; sin embargo el volumen de datos que generan las personas, los procesos y las máquinas no para de crecer, por lo que no parece que big data vaya a desaparecer.

No nos engañemos: los datos son valiosos, pero no cuando se pierde el control sobre ellos. En la actual era de la información, los recursos más preciados también pueden convertirse en su perdición si su organización no sabe cómo sacarles partido. Por lo tanto la pregunta es: ¿qué se puede hacer con los datos?

Preste atención a las siguientes situaciones reales:

•El fraude en el sector de la atención sanitaria supone un gasto anual de aproximadamente 250.000 millones de dólares. Se estima que para 2016, la cifra supere los 400.000 millones de dólares al año.1 En EE.UU., este sector podría generar un valor anual de más de 300.000 millones de dólares si utilizara big data para mejorar la eficacia y la calidad del servicio prestado.2

•En una firma mundial de servicios financieros, un comercial deshonesto generó unas pérdidas de 2.000 millones de dólares que casi suponen la quiebra de la empresa. Hoy en día, las instituciones financieras disponen de más datos para evitar los fraudes externos (clientes, titulares de cuentas o pólizas) e internos, así como las incidencias con los clientes.

•En Europa, los gobiernos podrían ahorrar más de 100.000 millones de euros (149.000 millones de dólares) con las mejoras operativas que pueden obtenerse con el uso de big data3, sin incluir el uso de big data para reducir el fraude y los errores o mejorar la recaudación de impuestos.

•Los comerciantes minoristas pierden cada año unos 93.000 millones de dólares por no tener existencias de los productos adecuados para satisfacer las demandas de los clientes. Se estima que gracias a big data, cada comerciante podría incrementar su margen operativo en más de un 60%.4

•En el sector de las telecomunicaciones, 6.000 millones de abonados (una cifra que registra un crecimiento anual de dos dígitos)5 demandan servicios exclusivos, personalizados y localizados que se ajusten a sus estilos de vida.

Ante estos costes y oportunidades, el mercado está preparado para las soluciones de big data. En un reciente estudio realizado por el IBM Institute for Business Value en colaboración con el Saïd Business School de la Universidad de Oxford, se analizó el nivel de actividades de big data realizadas actualmente en las organizaciones de los encuestados. Los resultados obtenidos indican que existen cuatro fases en la adopción y progresión del big data: Educación, Exploración, Organización y Ejecución (vea la figura 1).6

Ejecución

24% 47% 22% 6%

Recopilación de información y

datos del mercado

Porcentaje de encuestados

Porcentaje de encuestados

Porcentaje de encuestados

Porcentaje de encuestados

Total de encuestados = 1061La suma de los porcentajes no equivale al 100% debido al redondeo.

Identificación del estado actual de las actividades de big data en las organizaciones de los encuestados.

Patrón de adopción de big data

Exploración OrganizaciónEducación

Desarrollo de estrategias y

hojas de ruta en base a los retos y

necesidades del negocio

Iniciativas piloto de big data

para validar los requisitos y el valor

Implementación de dos o más iniciativas

de big data y aplicación de análisis avanzados

Figura 1. Cuatro fases de la adopción de big data

Page 3: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

3IBM Software

Pese a que solo el 6% de los encuestados usa iniciativas de big data, una cuarta parte tiene en marcha iniciativas piloto, la mitad está en fase de desarrollo de estrategia y en vías de realizar compras de soluciones y otra cuarta parte se encuentra en la fase de recopilación de información.

Si no utiliza ninguna estrategia de big data, tenga en cuenta que probablemente la competencia sí la utilice. La dificultad está en determinar en cómo y dónde abordar el big data.

Casos de uso de big dataEn el pasado, gran parte de la actividad del mercado relacionada con big data se ha centrado en el aprendizaje de tecnologías de big data. Por ello, los proveedores no han realizado esfuerzos conjuntos en ayudar a las organizaciones a comprender los problemas que puede abordar big data. Sin embargo, IBM ha sido la excepción.

Iniciativas como, por ejemplo, las encuestas, el estudio de conclusiones de analistas, las conversaciones mantenidas con más de 300 clientes y clientes potenciales, así como la implementación de cientos de soluciones de big data, ha permitido a IBM identificar cinco casos de uso que pueden servir de guía a la hora de adoptar big data:

1. Exploración de big data: búsqueda, visualización ycomprensión de big data para mejorar la toma de decisiones.

2. Perspectiva integral mejorada del cliente: ampliación de laperspectiva actual de los clientes con la incorporación defuentes de información internas y externas.

3. Mejora de la inteligencia/seguridad: reducción de riesgos yfraudes y supervisión de la ciberseguridad en tiempo real.

4. Análisis de operaciones: análisis de datos informáticos paraobtener mejores resultados de negocio y aumentar la eficacia.

5. Modernización de los data warehouse: integración de bigdata con las capacidades de almacenamiento para obtenerperspectivas de negocio y optimizar la infraestructuraexistente.

Caso de uso 1: exploración de big dataEl primer paso para abordar big data es determinar los recursos de los que dispone y usarlos para mejorar la toma de decisiones, así como las operaciones del día a día. Esto se conoce como exploración de big data.

La mayoría de las conversaciones sobre big data giran en torno a tres dimensiones: volumen, velocidad y variedad. Estos valores identifican las dimensiones de los retos a los que se enfrentan a diario las organizaciones para extraer valor de los recursos de información, tomar decisiones más acertadas, mejorar las operaciones y reducir el riesgo. Toda decisión importante, interacción con clientes o análisis requiere información de distintas fuentes de datos. La solución IBM® InfoSphere® Data Explorer, que forma parte de la plataforma IBM Big Data, permite navegar fácilmente tanto por la información de sistemas empresariales como por los datos externos a la organización.

El crecimiento del volumen de datos “brutos” de sensores, registros de sistemas, secuencias de clics, sitios web, etc. plantea otro reto: ¿cómo pueden las organizaciones añadir contexto a estos datos para mejorar los procesos de análisis y toma de decisiones? Nuevamente, la capacidad de InfoSphere Data Explorer y de otras funciones de la plataforma IBM Big Data para fusionar la información de estas fuentes semiestructuradas con los datos empresariales puede aportar contexto que ayuda a las organizaciones a obtener mayor valor de los datos.

Las capacidades de exploración de big data de IBM ayudan a contener el riesgo. Las organizaciones que no tienen capacidad para explorar su propia información corren el riesgo de perder datos confidenciales como, por ejemplo, la información de identificación personal (PII), revelar secretos comerciales o de estrategia a la competencia, así como de no poder recuperar ni comprobar la información cuando sea necesario en caso de litigios u otras situaciones de gestión corporativa.

Page 4: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

4 Las cinco mejores formas de abordar big data

Caso de uso 2: perspectiva integral mejorada del clienteObtener una perspectiva detallada de los clientes (preferencias de hábitos de compra, motivos de cambio, artículos preferidos o razones para recomendar una empresa a otros clientes) es importante para todas las empresas. Sin embargo, esto requiere utilizar las fuentes de información internas y externas para evaluar el ánimo de los clientes, así como para comprender qué acciones permitirán consolidar las relaciones con estos.

Un reciente informe del IBM Institute for Business Value sobre el uso de big data recomienda a las organizaciones canalizar sus esfuerzos en materia de big data sobre todo en el análisis de clientes para poder “comprender las necesidades de los clientes y anticiparse a futuros comportamientos”. En este caso, el término “cliente” se utiliza en sentido general: pacientes en el sector de la atención sanitaria, funcionarios de la administración o proveedores del sector de la fabricación.

Además de estos análisis que proporcionan perspectivas estratégicas sobre el comportamiento del cliente, la importancia del enfoque integral se aplica a los empleados de primera línea. Las organizaciones más innovadoras reconocen la necesidad de proporcionar a estos profesionales información que ayude a comprometer a los clientes, consolidar las relaciones y obtener resultados positivos como, por ejemplo, al solucionar problemas de clientes o fomentar las ventas cruzadas y complementarias de productos. Para ello, estos empleados deben contar con medios para analizar rápidamente grandes volúmenes de información e identificar las necesidades específicas de los clientes.

IBM InfoSphere Data Explorer trabaja con IBM InfoSphere Master Data Management (MDM) para combinar la información en contexto procedente de todas las aplicaciones y repositorios que contienen información sobre el cliente (CRM, ECM, cadena de suministro, bases de datos de seguimiento de pedidos, correo electrónico, etc.) y mostrar una perspectiva completa del cliente, sin que el usuario tenga que iniciar sesión y realizar búsquedas en distintos sistemas.

En esta perspectiva unificada, los profesionales en contacto con el cliente tienen acceso a toda la información: productos comprados, incidencias recientes, noticias sobre sus empresas, conversaciones recientes, etc. Las noticias de actividad muestran, en el centro de la pantalla, las actualizaciones más recientes del cliente, el producto u otras entidades. También se muestran análisis de InfoSphere BigInsights™, InfoSphere Streams, IBM Cognos® Business Intelligence e IBM SPSS® con el contexto de las analíticas definidas por la aplicación. De este modo, el empleado dispone de más tiempo para interactuar con el cliente de forma personalizada. A su vez, esto ayuda a ofrecer las respuestas adecuadas y a recomendar oportunidades de ventas complementarias. Esta mayor visibilidad fomenta la lealtad del cliente, mejora su satisfacción y, en última instancia, incrementa los ingresos.

Tal como se muestra en la figura 2, la gestión de datos maestros mejora la precisión y fiabilidad de los datos en todos los sistemas de la organización. Esta homogeneidad garantiza que las

¿Es la exploración de big data el caso de uso adecuado para usted?

Hágase las preguntas siguientes:

• ¿Cómo separa el “ruido” del contenido útil?• ¿Cómo explora los datos en volúmenes de información

grandes y complejos?• ¿Cómo extrae perspectivas de tipos datos nuevos y no

estructurados (medios sociales y correo electrónico)?• ¿Utilizan los usuarios la información para tomar decisiones

de negocio acertadas o supone la incapacidad paraacceder a la información una traba para las buenasprácticas de negocio?

• ¿De qué medios disponen sus empleados para navegar yexplorar contenido de la empresa y externo? ¿Puedeaunarlos en una única interfaz de usuario?

• ¿Cómo identifica las áreas de riesgo para los datos antes deque se conviertan en un problema?

• ¿Cuál es su punto de partida en las iniciativas de big data?

Page 5: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

5IBM Software

perspectivas que ofrezca InfoSphere Data Explorer contarán con datos homogéneos y precisos sobre las entidades. En cierto modo, InfoSphere Data Explorer proporciona a los usuarios de negocio una interfaz de datos maestros fiables que se combina con otros orígenes de datos estructurados y no estructurados.

Caso de uso 3: mejora de la inteligencia/seguridadPara combatir las nuevas amenazas de seguridad cada vez más sofisticadas, las organizaciones deben adoptar enfoques que ayuden a detectar anomalías e indicadores de ataques imperceptibles. Muchas de las organizaciones de hoy en día usan tecnologías de big data para argumentar y desarrollar las soluciones de seguridad tradicionales con el fin de mejorar la inteligencia, la seguridad y el cumplimiento de las normativas.

El enfoque de mejora de la seguridad/inteligencia permite a las organizaciones:

• Filtrar los datos (tanto internos como externos) para detectarrelaciones ocultas y patrones, así como para evitar amenazas deseguridad.

• Detectar casos de fraude al correlacionar el historial deactividad de las cuentas con los datos en tiempo real y, de estemodo, localizar transacciones o comportamientos sospechosos.

• Examinar nuevas fuentes de datos para obtener pruebas deactividades delictivas como, por ejemplo, Internet, losdispositivos móviles, las transacciones, el correo electrónico olos medios sociales.

El caso de uso de mejora de la seguridad/inteligencia tiene tres aplicaciones:

1. Mejora de la inteligencia y la vigilancia: las organizacionespueden analizar los datos en movimiento y estáticos paralocalizar asociaciones o detectar patrones. Esta perspectiva entiempo real tiene un valor incalculable e incluso vital.

2. Predicción y lucha contra ataques en tiempo real: Elcreciente número de delitos de alta tecnología (terrorismocibernético, el espionaje, los accesos no autorizados a sistemaso el fraude cibernético) es una amenaza real. Gracias al análisisdel tráfico de red, las organizaciones pueden anticiparse yactuar casi en tiempo real.

¿Es la perspectiva integral del cliente el caso de uso adecuado para usted?

Hágase las preguntas siguientes:

• ¿Cómo identifica y proporciona datos sobre clientes,productos o competidores a aquellos usuarios que losnecesitan?

• ¿Cómo combina los datos estructurados y no estructuradospara ejecutar análisis e identificar perspectivas?

• ¿Qué hace para fomentar la homogeneidad en sus recursosde información al representar a clientes y socios?

• ¿Ofrece una perspectiva completa del cliente que permite alos usuarios de la línea de negocio obtener mejoresresultados?

• ¿Cómo aplica las perspectivas y lleva a cabo acciones?

Figura 2. Información sobre el cliente mostrada en una aplicación creada con InfoSphere Data Explorer Application Builder, que utiliza InfoSphere Master Data Management para mostrar una perspectiva fiable de los datos del cliente.

Page 6: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

6 Las cinco mejores formas de abordar big data

3. Predicción y prevención del crimen: la capacidad paraanalizar datos de telecomunicaciones (por ejemplo, registrosde detalles de llamadas) y de los medios sociales ayuda a lasautoridades a localizar amenazas criminales y recopilarpruebas. De este modo, en lugar de esperar a que se cometa elcrimen, pueden evitar que se produzca y arrestar a losresponsables de una forma más proactiva.

Dependiendo del escenario, las organizaciones pueden necesitar una de las siguientes plataformas de seguridad/inteligencia: Criminal Information Tracking System, Surveillance Monitoring System o Security Information and Event Management (SIEM).

Hoy en día, estas plataformas acceden a datos de una amplia gama de orígenes de datos estructurados (de transacciones, bases de datos, redes, cortafuegos y otros). Los datos de la plataforma se almacenan y administran en una base de datos o warehouse

propios. Sin embargo, estos sistemas no pueden gestionar las nuevas tendencias de big data que requieren del análisis de datos en tiempo real o de tipos de datos no estructurados (vea la figura 3).

Las tecnologías de big data como la informática de flujos (InfoSphere Streams) y el análisis empresarial Apache Hadoop (InfoSphere BigInsights) mejoran estas plataformas tradicionales de análisis de inteligencia y seguridad al acceder de forma nativa a los orígenes de datos no estructurados o de flujos de big data como, por ejemplo, los registros de telecomunicaciones, dispositivos inteligentes, flujos de Twitter, publicaciones de Facebook, correo electrónico, supervisión de puntos de ventas, sensores basados en ubicaciones, vídeo, audio o datos generados por otros sistemas.

Figura 3. Creación de perspectivas de seguridad detalladas mediante conjuntos de datos integrales.

Informaciónde configuración

Registros de auditoría de sistemas

Tecnología y operaciones tradicionales de seguridad

Texto de página web

Transacciones de los clientes

Analítica debig data

Identificación y protección contra las amenazas gracias a las perspectivas obtenidas de conjuntos de datos

RegistrosEventos Alertas

Anomalías y flujos de red

Datos de inteligencia sobre

amenazas externas

Datos de vigilancia de vídeo/audio

Datos de procesos de negocio

Correo electrónico y medios sociales

Nuevas consideracionesRecopilación, almacenamiento y procesamiento• Recopilación e integración Tamaño y velocidad Correlación y enriquecimiento•

Analítica y flujos de trabajo• Visualización Análisis de datos no estructurados Aprendizaje y predicción Personalización Uso compartido y exportación

Contexto de identidad

Page 7: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

7IBM Software

Los datos en tiempo real se pueden procesar y analizar mediante InfoSphere Streams y el resultado puede guardarse en un datawarehouse o InfoSphere BigInsights. Los clientes que usan la solución IBM i2® Analyst’s Notebook® pueden ver y analizar directamente los datos en tiempo real gracias a la integración de InfoSphere Streams.

Caso de uso 4: análisis de operacionesLa abundancia y el aumento de los datos de sistemas (generados por equipos y dispositivos de red, sensores, medidores y dispositivos GPS) es otro factor clave para las soluciones de big data. Estos datos se generan en grandes volúmenes y en una amplia gama de formatos, incluidos los datos en movimiento o de flujo. Esta información requiere complejas funciones de análisis y correlación en distintos conjuntos de datos, así como capacidades de visualización exclusivas según el tipo de datos, el sector o la aplicación.

Las organizaciones que desestiman esta amplia fuente de información toman sus decisiones de negocio en base a un pequeño subconjunto de los datos que tienen a su disposición. La combinación de los datos de sistemas con los datos empresariales existentes mediante análisis de operaciones permite a las organizaciones:

• Obtener visibilidad en tiempo real de las operaciones, laexperiencia del cliente, las transacciones y loscomportamientos.

• Realizar una planificación proactiva para incrementar laeficacia operativa.

• Identificar e investigar las anomalías.• Supervisar la infraestructura para evitar de forma proactiva las

incidencias o la degradación de los servicios.

¿Es la mejora de la inteligencia/seguridad el caso de uso adecuado para su empresa?

Hágase las preguntas siguientes:

• ¿Necesita enriquecer sus sistemas de seguridad ointeligencia con datos en tiempo real procedentes deorígenes de datos no usados (vídeo, audio, dispositivosinteligentes, redes, registros de datos de llamadas o mediossociales)?

• ¿Necesita sistemas de detección, identificación y resolucióninmediata para amenazas físicas o en línea?

• ¿Necesita vigilar las actividades de criminales o terroristas?• ¿Necesita correlacionar grandes volúmenes de orígenes y

datos de inteligencia técnica o humana para buscar patroneso asociaciones (análisis de big data)?

• ¿Necesita mejorar su solución SIEM con datos noestructurados (correo electrónico y medios sociales) paramejorar la detección y neutralización de amenazascibernéticas?

Page 8: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

8 Las cinco mejores formas de abordar big data

Tal como se muestra en la figura 4, su organización puede manejar grandes volúmenes de datos de sistemas en múltiples formatos o datos de flujos que llegan al Hadoop Distributed File System (HDFS) y que no funcionan como es debido. La solución InfoSphere BigInsights, que incorpora un acelerador de datos de sistemas, es capaz de gestionar y procesar grandes volúmenes de datos de sistemas para ofrecer perspectivas de negocio detalladas. Esto permite correlacionar la información de sistemas con otros datos empresariales como, por ejemplo, de clientes o productos.

Al combinar los datos de sistemas con los de negocio, podrá ponerlos a disposición de los responsables de las decisiones operativas, lo que redunda en una mayor eficacia e inteligencia operativa. Por su parte, los responsables de las decisiones pueden visualizar datos de múltiples sistemas para obtener perspectivas basadas en datos y reaccionar rápidamente ante sucesos y cambios.

Figura 4. El análisis de operaciones combina los datos empresariales y de sistemas para proporcionar perspectivas detalladas..

Datos empresariales Indexación, búsquedas

Dat

os d

e si

stem

as

Zona de recepción Preprocesamiento Analítica Almacenamiento

Estructurados

No estructurados

Flujo Analítica entiempo real

Sistema Hadoop

Modelado de estadísticas

Detección y navegación federada

Análisis de causa raíz

¿Es el análisis de operaciones el caso de uso adecuado para usted?

Hágase las preguntas siguientes:

• ¿Trabaja con grandes volúmenes de datos de sistemascomo, por ejemplo, datos sin procesar de registros,sensores, medidores inteligentes, colas de mensajes,sistemas de suministros, sistemas de instalaciones, datosde secuencias de clics, archivos de configuración, registrosde auditoría de bases de datos y tablas?

• ¿Es capaz de realizar análisis complejos para correlacionarinformación e indicadores claves de rendimiento en distintosconjuntos de datos y sucesos en tiempo real?

• ¿Puede realizar búsquedas y acceder a todos los datos desus sistemas?

• ¿Es capaz de visualizar datos de flujos y reaccionar entiempo real?

• ¿Es capaz de utilizar dichos datos para analizar la raíz de losproblemas?

Page 9: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

9IBM Software

La segunda necesidad básica es la optimización de la infraestructura de data warehouse. Los volúmenes de datos de hoy en día están llegando a niveles de big data, lo que incrementa la carga que soporta el almacenamiento. Esta infraestructura en sí no es costosa, pero el almacenamiento y el análisis de todo el contenido del entorno sí repercuten en el rendimiento y los costes.

Existen tres formas de modernizar los data warehouse (vea la figura 5):

1. Hub de preprocesamiento: se utiliza en instalaciones Hadoop empresariales (InfoSphere BigInsights) cuando se necesita una área de espera o “zona de recepción” para los datos antes de determinar qué información debe moverse al data warehouse. InfoSphere Data Explorer puede utilizarse para la exploración anticipada con el fin de determinar qué datos deben moverse a soluciones de analíticas detalladas o a sistemas de almacenamiento de menor coste. Este paso no es obligatorio, pero puede usarse en áreas en las que las organizaciones deseen conservar datos.

Figura 5. La modernización de los data warehouse ayuda a maximizar el valor de los datos.

Entorno de datos empresariales existente

Entorno de big data

Gestión e integración de la información

Analítica en tiempo real

Entorno Hadoop

Informesyanalíticas

Zona de recepción/

hub de preprocesamiento

Almacén LOB/fragmentado

Almacén de detección/exploración

MDM Otros sistemas de datos relacionales

Detección/analítica

Consultas en almacén de datos

Datos estructurados y no estructuradosDatos de flujo

Caso de uso 5: modernización de los data warehouseEl último caso de uso, la modernización de los data warehouse, se basa en la infraestructura de los data warehouse existente para aplicar las tecnologías de big data e incrementar su valor. No se trata de reemplazar el entorno de los data warehouse existente, sino de maximizar su valor.

La modernización de los data warehouse surge de dos necesidades básicas. La primera es la necesidad de utilizar los datos para obtener nuevas perspectivas de negocio. Las organizaciones necesitan analizar datos multiestructurados; sin embargo, los data warehouse no están diseñados para ello. Al depender solo de los data warehouse, las empresas se ven obligadas a descartar información muy valiosa. Además, las organizaciones demandan cada vez más una menor latencia: necesitan la información en horas o minutos, no en semanas o meses. Por último, las organizaciones requieren acceso de consulta a los datos.

Page 10: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

10 Las cinco mejores formas de abordar big data

La informática de flujos (InfoSphere Streams) también puede usarse como componente en tiempo real de procesamiento y análisis de datos de flujos, sin tener que almacenar la información a priori para determinar qué datos deben guardarse en el HDFS o en el data warehouse. En algunos casos los datos no se guardarán, lo que implica que podrá procesar y emprender acciones en base a la información sobre la marcha, reduciendo el volumen en el data warehouse. Con este enfoque de zona de recepción, podrá depurar y transformar la información antes de cargarla al data warehouse.

2. Detección/analítica: este enfoque se basa en la analítica de datos en movimiento de la informática de flujos, lo que proporciona a las organizaciones capacidad para realizar analíticas que antes se hacían en el data warehouse. Esto redunda en la optimización del data warehouse y en laposibilidad de realizar nuevos tipos de análisis. Al podercombinar distintos tipos de datos con la información del data warehouse, es posible realizar análisis más detallados yobtener perspectivas que antes no eran factibles. Además, lainformática de flujos puede actuar como un filtro capaz delocalizar datos de gran valor que pueden almacenarse enInfoSphere BigInsights o en el data warehouse.

3. Almacén de datos habilitados consultables: con este enfoque, los datos antiguos o no usados con frecuencia se pueden descargar del data warehouse y de las bases de

¿Es el caso de uso de la modernización del data warehouse el punto de partida más adecuado para su organización?

Hágase las preguntas siguientes:

• ¿Tiene problemas para controlar grandes conjuntos dedatos (terabytes o petabytes)?

• ¿Utiliza su entorno de data warehouse como repositorio paratoda la información?

• ¿Almacena grandes cantidades de datos poco relevantes?• ¿Desecha datos porque no es capaz de almacenarlos o

procesarlos?• ¿Necesita analizar los datos en movimiento para determinar,

en tiempo real, qué información debe almacenar?• ¿Necesita explorar grandes volúmenes de datos complejos?• ¿Quiere analizar datos no operativos?• ¿Le interesa usar los datos para realizar nuevos tipos de

analíticas y analíticas tradicionales?

datos de aplicaciones mediante herramientas y programas de integración de información. Esto ayuda a las organizaciones a almacenar los datos poco relevantes en sistemas de almacenamiento de bajo coste sin que dejen de estar disponibles en InfoSphere BigInsights gracias a las herramientas BI o de consulta. InfoSphere Data Explorer puede usarse para visualizar y desplazarse por los datos almacenados en InfoSphere BigInsights.

Page 11: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

11IBM Software

Plataforma IBM Big DataLos cinco casos de uso de big data descritos en este documento ofrecen valiosos puntos de partida a aquellas empresas que quieran empezar a aprovechar big data. La plataforma IBM Big Data puede desempeñar un papel muy importante en esta transformación.

Los casos de uso de big data requieren tecnologías específicamente diseñadas para abordar los retos del trabajo con grandes volúmenes de datos variados y de alta velocidad. No se trata de problemas únicos que requieren soluciones únicas: la plataforma de IBM ayuda a las empresas a reducir el plazo y los costes de los proyectos de big data a la vez que ofrece una rápida recuperación de la inversión (ROI) mediante el uso de componentes previamente integrados. Además, los servicios avanzados y basados en estándares proporcionan sólidas bases para la implementación. De este modo, puede comenzar por un caso de uso inicial y continuar con otros casos a medida que progresa con big data.

Más informaciónPara obtener más información sobre los casos y sobre la plataforma IBM Big Data, póngase en contacto con su representante de IBM o socio empresarial de IBM, o visite: ibm.com/software/data/bigdata/use-cases.html

Además, IBM Global Financing puede ayudarle en la adquisición de las capacidades de software que su empresa necesita de la forma más rentable y estratégica posible. IBM Global Financing se alía con clientes de crédito para personalizar una solución de financiación que se ajuste a sus objetivos de desarrollo y empresariales, facilite la gestión de flujo de efectivo y mejore el coste total de adquisición. IBM Global Financing proporciona los recursos de inversión de TI críticos que necesita para que su negocio siga avanzando. Para obtener más información, visite: ibm.com/financing

Page 12: Las cinco mejores formas de abordar big data€¦ ·  · 2014-03-26Thought Leadership, documento técnico IBM Software Junio de 2013 Las cinco mejores formas de abordar big data

IMW14710-ESES-00

© Copyright IBM Corporation 2013

IBM Corporation Software Group Route 100 Somers, Nueva York 10589

Producido en los Estados Unidos de América Junio de 2013

IBM, el logotipo de IBM, ibm.com, Analyst's Notebook, BigInsights, Cognos, i2, InfoSphere y SPSS son marcas comerciales de International Business Machines Corp, registradas en muchas jurisdicciones de todo el mundo. El resto de nombres de servicios y productos pueden ser marcas comerciales de IBM o de otras empresas. Encontrará una lista actualizada de las marcas registradas de IBM en la web, en el apartado sobre información de Copyright y marcas registradas en ibm.com/legal/copytrade.shtml

Este documento está actualizado a la fecha inicial de publicación e IBM puede modificarlo en cualquier momento.

LA INFORMACIÓN DE ESTE DOCUMENTO SE PROPORCIONA “TAL CUAL” SIN NINGÚN TIPO DE GARANTÍA, TANTO EXPRESA COMO IMPLÍCITA DE COMERCIABILIDAD, IDONEIDAD PARA UN FIN DETERMINADO Y SIN NINGÚN TIPO DE GARANTÍA O CONDICIÓN DE NO INFRACCIÓN. Los productos de IBM se garantizan según los términos y condiciones de los acuerdos en virtud de los cuales se proporcionan.

El cliente es responsable del cumplimiento de las leyes y normativas aplicables. IBM no presta ningún servicio de asesoramiento legal ni garantiza que la utilización de sus servicios o productos por parte del cliente esté conforme a ninguna ley o normativa.

1 Financial Crimes Report to the Public: Fiscal Years 2010-2011. www.fbi.gov/stats-services/publications/financial-crimes-report-2010-2011

2 McKinsey Global Institute. “Big data: The next frontier for innovation, competition, and productivity.” Mayo de 2011. www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation

3 McKinsey Global Institute. “Big data: The next frontier for innovation, competition, and productivity.” Mayo de 2011. www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation

4 McKinsey Global Institute. “Big data: The next frontier for innovation, competition, and productivity.” Mayo de 2011. www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation

5 International Telecommunication Union. “Measuring the Information Society.” Septiembre de 2012.

Recicle este documento

6 IBM Institute for Business Value in collaboration with the Saïd Business School at the University of Oxford. “Analytics: The real-world use of big data.” Noviembre de 2012. http://www-935.ibm.com/services/us/gbs/thoughtleadership/ibv-big-data-at-work.html

7 IBM Institute for Business Value in collaboration with the Saïd Business School at the University of Oxford. “Analytics: The real-world use of big data.” Noviembre de 2012. http://www-935.ibm.com/services/us/gbs/thoughtleadership/ibv-big-data-at-work.html