Upload
daniela-petruzalek
View
74
Download
0
Embed Size (px)
Citation preview
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle DayInovações em Banco de Dados e Big Data Analytics
Daniela PetruzalekSales ConsultantIndirect SalesJaneiro 2016
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Safe Harbor StatementThe following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code, or functionality, and should not be relied upon in making purchasing decisions. The development, release, and timing of any features or functionality described for Oracle’s products remains at the sole discretion of Oracle.
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Pilares Tecnológicos
Big Data
Database as a Service
Cloud
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Prioridades Tecnológicas para 2016
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
NIST – Definição de Cloud Computing
• Cloud computing é um modelo que permite o acesso de rede ubiquo, conveniente e sob-demanda a um pool de recursos computacionais configuráveis (ex.: redes, servidores, storage, aplicações e serviços) que podem ser rapidamente provisionados e liberados com mínimo esforço de gerenciamento ou interação de um fornecedor de serviços. Este modelo de nuvem é composto por cinco características essenciais, três modelos de serviço, e quatro modelos de distribuição.
Fonte: NIST Definition of Cloud Computing - September 2011
3 Modelos de Serviço• SaaS• PaaS• IaaS
4 Modelos de Distribuição• Nuvem Privada• Nuvem Comunitária• Nuvem Pública• Nuvem Híbrida
5 Características Essenciais• On-demand self-service• Amplo acesso a rede• Pool de recursos• Rápida Elasticidade• Medição de serviço
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Database – Inovação ContínuaPreservando o investimento dos clientes
Stored ProceduresPartitioning
Parallel QueryUnstructured Data
Resource ManagementReal Application Clusters
Data GuardXML
Big Data SQLMultitenantIn-Memory
JSON
Big Data & CloudInternetClient-Server
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Estratégia Oracle Platform-as-a-ServicePortabilidade completa em núvem híbrida
Mesma arquiteturaMesmo software
Mesmas habilidadesOn Premises Oracle Cloud
Enterprise Manager gerencia tanto On Premises como Cloud
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
O Caminho para o Database as a Service
Silos
Complexo
Padronizado
Simples
Consolidado
Eficiente
Cloud
Ágil
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Dens
idad
e de
Con
solid
ação
Consolidação de Banco de Dados na CloudMétodo Tradicional
Compartilha Servidores Compartilha Servidores e SO Compartilha Servidores, SO e banco de dados
Máquinas Virtuais Bancos Dedicados Consolidação de Schema
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Security & Compliance
Big Data & Data Warehousing
Consolidation
Database as a Service
Application Development
High Availability
In-Memory
Performance & Scalability
Data Optimization
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle MultitenantAlta densidade de consolidação, transparente para aplicações existentes
Compartilha Servidores Compartilha Servidores e SO Compartilha Servidores, SO e banco de dados
Máquinas Virtuais Bancos Dedicados Pluggable Database
Dens
idad
e de
Con
solid
ação
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
AP OE GL
Nova Arquitetura MultitenantMemória e processos ao nível de container
Recursos do Sistema
GL OE AP
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
GL OE AP
Arquitetura Oracle DatabaseUso mais eficiente de recursos do sistema
Recursos do Sistema
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
PDBs vs Instâncias Separadas
• OLTP benchmark– 3GB de memória vs.
20GB de memória utilizada para 50 databases
– Número de PDBs: 250 enquanto o máximo de instâncias separadas foi 50
Alta Eficiência: 6x Menos recursos de HW, 5x mais escalável
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Quantificando os Benefícios do Multitenant
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Heat Map
Smart Compression
Automated Tiering
In Database Archiving
Network Compression
Automatic Data OptimizationOtimizar dados de storage baseado na utilização
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automatic Data OptimizationSimplificando o ciclo de vida dos dados
Um “mapa de calor” (heat map) em memória rastreando acesso de segmentos e blocosDados são periodicamente escritos para o discoInformação é acessível por views ou stored procedures
É possível anexar políticas a tabelas para compactar ou “tierizar” dados baseados no acessoTabelas ou Partições podem ser movidos entre níveis de compressão enquanto os dados são acessados
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automatic Data OptimizationCompressão de dados ao longo do ciclo de vida
Partitioned By Time
Least Active Data Most Active Data
No CompressionAdvanced RowCompression
Hybrid Columnar Query
Compression
Hybrid Columnar Archive
Compression
3XCompression
OLTP
10XCompression
Reporting
15XCompression
Compliance
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automatic Data OptimizationPolíticas de compressão e tierização
Partitioned By Time
Oldest Data Most Recent Data
Comprime partição com compressão de linha (Adv. Compression) se não foram modificadas em 30 dias
Comprime partição com HCC se não foi modificada em 180 dias
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automatic Data OptimizationO mapa de calor registra a atividade dos segmentos e blocos
Partitioned By Time
Oldest Data Most Recent Data
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automatic Data OptimizationPolíticas são automaticamente aplicadas nas tabelas
Partitioned By Time
Oldest Data Most Recent Data
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automatic Data OptimizationPolíticas são automaticamente aplicadas nas tabelas
Partitioned By TimeOldest Data Most Recent Data
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automatic Data OptimizationPolíticas são automaticamente aplicadas nas tabelas
Partitioned By TimeOldest Data Most Recent Data
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automatic Data OptimizationReduz uso de storage, lê dados compactados mais rapidamente
Partitioned By TimeOldest Data Most Recent Data
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automatic Data OptimizationAutomaticamente “tieriza” dados para reduzir custos de storage
Partitioned By TimeOldest Data
Most Recent Data
Tier 1 Storage
Tier 2 Storage
Se o tablespace está quase cheio, compacta a partição mais antiga com archive e move para storage mais barata
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Acelerar OLTPReal Time Analytics Sem mudanças na aplicação
Explorar HW de última geração
CPU
Oracle Database In-Memory
100x 2x
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Até então precisávamos escolher um formato e assumir as consequências
Banco de Dados Linear vs. Colunar
Linha
Transações são mais rápidas– Exemplo: Insert ou select em uma tabela– Rápido processamento de poucas linhas, muitas colunas
Coluna
Analytics são mais rápidas– Exemplo: Relatório no total de vendas por região– Rápido processamento de poucas colunas, muitas linhas
SALES
SALES
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
In-Memory Option: Na memória
Oracle Database 12c:Formato Dual In-Memory• Ambos os formatos para a mesma tabela• Simultaneamente ativos e
transacionalmente consistentes• Analytics & relatórios usam o novo
formato colunar• OLTP usa o formato tradicional (linha)
Memory Memory
SALES SALESRow
FormatColumnFormat
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
In-Memory Option: No disco
Oracle Database 12c:Formato Único no Disco• O In-Memory não altera o formato dos
dados no disco• Portanto todas as tecnologias
consagradas do Oracle funcionam transparentemente
• Não há necessidade de reorganização de dados ou migração
RAC
ASM
RMAN
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Lentificação no OLTP devido a Índices Analiticos
Taxa de inserts diminui a medida que aumenta o
número de índices
# of Fully Cached Indexes (Disk Indexes are much slower)
38
Row
s Ins
erte
d pe
r sec
ond
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle In-Memory: Simples para Implementar
1. Configura Área de Memóriainmemory_size = XXX GB
2. Configura tabelas ou partições para serem in memoryalter table | partition … inmemory;
3. Remove índices analíticos para acelerar OLTP
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Database In-Memory Customer ExperienceSchneider Electric
2B 300K 30K0
20
40
60
80
100
Analytics Query Results
Row Format Column Format
Seconds
• Analytic 7-128x mais rápido• OLTP 5-9x mais rápido• 76% de economia de storage
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle In-Memory Não Requer Mudanças na Aplicação
Completo - Sem restrições no SQLFácil Implementação - Sem migração de dadosCompatível - Todas as aplicações rodam sem mudançasMultitenant - Oracle In-Memory compatível com Cloud
Todos os benefícios do In-Memory sem mudanças nas aplicações
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Pilares Tecnológicos
Database as a Service
Cloud Big Data
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
O que é Big Data?
Big data é um termo “exotérico” para descrever um volume expressivo de dados tanto estruturados como não estruturados que é tão grande que é difícil de processar utilizando técnicas convencionais de banco de dados e data warehouse.
Definição simples: um volume de dados grande o suficiente para não comportar em uma única máquina
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Mais Variedade de Dados—Melhores Modelos Preditivos• Aumentar o número de
fontes de dados relevantes pode melhorar muito a precisão do modelo
“Chute”
100%
0% Population Size
Resp
onde
rs
Modelo com 20 variáveis
Modelo com 75 variáveis
Modelo com 250 variáveis
Modelo com “Big Data” e centenas ou milhares de variáveis:• Demografia• Compras POS• Textos e comentários• Geoposicionamento• Histórico de longo prazo e
recente• Navegação web• Sensores• etc.
100%
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Caso de Uso: Ecommerce
• Visão 360 graus do cliente – preferências sociais, dados de cartão de crédito, padrão de compras, dados geográficos, informação familiar;
• Rastrear buscas online, filtrar condições, que páginas visitam, onde gastam mais tempo, quanto tempo ficam, quando saem.
• Identificar produtos relacionados e mostrar recomendações ou ofertas de desconto/promoções
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Dados, dados em todo lugar
Requisitos desejáveis para plataforma de análise de dados:
• Ser extremamente poderosa e manipular grandes volumes de dados
• Ser fácil de aprender• Ser altamente automatizada
O crescimento dos dados é exponencialmentemaior que o crescimento da sua respectiva análise
http://www.delphianalytics.net/more-data-than-analysts-the-real-big-data-problem/ http://uk.emc.com/collateral/analyst-reports/ar-the-economist-data-data-everywhere.pdf
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Data Warehouses
BusinessAnalytics
Cenário Corporativo de Big Data Analytics
TransactionalApplications
OperationalReporting
Social Media
Internet of Things73°
Big Data Platform
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
O Desafio da Análise dos DadosSilos separados com interfaces de acesso aos dados separadas
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
O que os clientes querem: Oracle Big Data SQLAcesso SQL completo a todos os dados da companhia
O Poder do Oracle SQL - Variedade de tipos de dados
Structured dataNumeric, string, date, …
Unstructured dataLOBs, Text, XML, JSON, Spatial, Graph, Multimedia
- Funções AnalíticasRanking, Windowing, LAG/LEAD, Aggregate, Pattern Matching, Cross Tabs, Statistical, Linear Regression, Correlations, Hypothesis Testing, Distribution Fitting, …
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
O que dá ao Exadata extrema performance?
Oracle Database 12c
SQL
Offload Query toExadata Storage Servers
Small data subsetquickly returned
Hadoop
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Arquitetura Oracle Big Data SQL
Oracle Database 12c
Offload Query toExadata Storage Servers
Small data subsetquickly returned
Hadoop & NoSQL
Offload Query toData Nodes
SQL
data subset
SQL
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Análise Preditiva & Data Mining
• Direcionar a oferta certa ao cliente certo• Como o cliente provavelmente responderá a oferta?• Achar as oportunidades de crescimento mais rentáveis• Prevenir a perda de clientes• Maximizar o impacto de negócios “cross”• Segurança e detecção de atividades suspeitas• Análise de sentimentos em conversas de clientes• Entender influenciadores em redes sociais
Casos de Uso Típicos
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Automaticamente analisar grandes volumes de dados para criar modelos que encontrem padrões ocultos, descobram novos “insights” e façam predições
•Identificar o fator mais importante (Attribute Importance)
•Prever o comportamento do consumidor(Classification)
•Prever ou estimar um valor (Regression)
•Encontrar perfil de pessoas ou itens (Decision Trees)
•Segmentar a população (Clustering)
•Encontrar fraudes ou eventos “raros” (Anomaly Detection)
•Achar itens complementares em “cestas” (Associations)
O que é Análise Preditiva & Data Mining?
A1 A2 A3 A4 A5 A6 A7
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Entendendo o Oracle’s Advanced AnalyticsSQL Tradicional
– Consultas “manuais”– Requer domínio do negócio– Quaisquer regras precisam ser
definidas e gerenciadas
Consultas SQL– SELECT– DISTINCT– AGGREGATE– WHERE– AND OR– GROUP BY– ORDER BY– RANK
Oracle Advanced Analytics - SQL & – Descoberta automática de conhecimento,
construção e implementação de modelos– Domínio do negócio para montar o conjunto
certo de dados para analizar/minerar
“Verbos” do SQL Analítico– PREDICT– DETECT– CLUSTER– CLASSIFY– REGRESS– PROFILE– IDENTIFY FACTORS– ASSOCIATE
+
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Advanced Analytics
• Consulta pontual de um registro usando SQL analítico. (ex.: callcenter)Mais detalhes
Dear Customer,These Offers are just for you for your Loyalty…
Call CenterGet Advice
Web Mobile
Branch Office
Social Media
R
Select prediction_probability(CLAS_DT_1_2, 'Yes' USING 7800 as bank_funds, 125 as checking_amount, 20 as
credit_balance, 55 as age, 'Married' as marital_status,250 as MONEY_MONTLY_OVERDRAWN, 1 as house_ownership)
from dual;
Likelihood to respond:
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Prevendo ComportamentosIdentificar “Comportamento Provável” e seus Perfis
Considera: • Demografia• Compras passadas• Compras recentes• Comentários & tweets de clientesDados não
estruturados
Dados transacionais do POS
Gera scripts para implementação
Modelo preditivo
SQL Joins e outras transformações SQL – todo o potencial do SQL
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Projetado para Cloud e Big Data
Big Data
Database as a Service
Cloud