92
COMUNICAÇÃO DIGITAL CRP-0420 AULA 04: BIG DATA

Aula CRP-0420-2016-04: Big Data 1

Embed Size (px)

Citation preview

Page 1: Aula CRP-0420-2016-04: Big Data 1

COMUNICAÇÃODIGITAL

CRP-0420

AULA 04: BIG DATA

Page 2: Aula CRP-0420-2016-04: Big Data 1

PROGRAMA:4/8 - CONTEXTO

11/8 - PÓS-MODERNO E EMERGÊNCIA

18/8 - DEBATES 1

25/8 - BIG DATA

1/9 - DATA SCIENCE E LIVRE ARBÍTRIO

8/9 - SEMANA DA PÁTRIA

15/9 - INTELIGÊNCIA ARTIFICIAL

22/9 - VR, AR

29/9 - DEBATES 2

6/10 - IoT E SMART CITIES

13/10 - DATASFERA E DATACRACIA

20/10 - CIBERATIVISMO, HACK E CODE

27/10 - DEBATES 3

3/11 - EDUCAÇÃO

10/11 - INTERFACES

17/11 - UX/UI, VR, AR

24/11 - PECHA KUCHA 1

1/12 - PECHA KUCHA 2

Page 3: Aula CRP-0420-2016-04: Big Data 1

BIG DATA

Page 4: Aula CRP-0420-2016-04: Big Data 1

FUCKIN’ BIG DATA.

Page 5: Aula CRP-0420-2016-04: Big Data 1
Page 6: Aula CRP-0420-2016-04: Big Data 1
Page 7: Aula CRP-0420-2016-04: Big Data 1

BIG FUCKIN’ DATA.

Page 8: Aula CRP-0420-2016-04: Big Data 1
Page 9: Aula CRP-0420-2016-04: Big Data 1
Page 10: Aula CRP-0420-2016-04: Big Data 1

FERORMÔNIOTRANSAÇÕES ONLINE DEIXAM RASTRO OU

DIGITAL

Page 11: Aula CRP-0420-2016-04: Big Data 1
Page 12: Aula CRP-0420-2016-04: Big Data 1

DADOS ESTRUTURADOS PARA OPERAÇÕES AUTOMÁTICAS,

SÃO INFORMAÇÕES COM ALTO GRAU DE ORGANIZAÇÃO, DE FORMA QUE SUA INCLUSÃO EM UM BANCO DE

DADOS É TRANSPARENTE E FACILMENTE ACESSÍVEL.

Page 13: Aula CRP-0420-2016-04: Big Data 1

NÃO ESTRUTURADOS JÁ OS DADOS

PARECEM FICÇÃO CIENTÍFICA: NÃO TEM UM MODELO DE REGISTRO, ESTÃO MISTURADOS OU NÃO ESTÃO

ORGANIZADOS DA FORMA ESPERADA, SUA LEITURA TEM IRREGULARIDADES E

AMBIGUIDADES QUE OS TORNAM DIFÍCIL DE ENTENDER POR VIAS TRADICIONAIS.

Page 14: Aula CRP-0420-2016-04: Big Data 1
Page 15: Aula CRP-0420-2016-04: Big Data 1

DADOSESTRUTURADOS

• 2.7 ZETABYTES NO MUNDO DIGITAL

• FACEBOOK ARMAZENA E ANALISA MAIS DE 30 PETABYTES DE DADOS GERADOS POR USUÁRIOS.

• AKAMAI (MÍDIA PUBLICITÁRIA) ANALISA 75 MILHÕES DE EVENTOS POR DIA PARA DESCOBRIR

OS MELHORES LOCAIS PARA ANÚNCIOS.

• A MAIOR BASE DE DADOS DA AT&T TEM UM BANCO DE DADOS DE 312 TERABYTES, COM 1,9 TRILHÕES DE ITENS, INCLUINDO REGISTROS TELEFÔNICOS.

Page 16: Aula CRP-0420-2016-04: Big Data 1

DADOSNÃO ESTRUTURADOS

• A CADA MINUTO, USUÁRIOS DO YOUTUBE AGREGAM CERCA DE 300H DE NOVOS VÍDEOS.

• DROPBOX RECEBE DIARIAMENTE CERCA DE UM BILHÃO DE DOCUMENTOS.

• ESTIMA-SE QUE A PRODUÇÃO DE DADOS EM 2020 SERÁ 43 VEZES MAIOR DO QUE ERA EM 2009.

• A CADA SEGUNDO CERCA DE 6000 MENSAGENS ENVIADAS PARA O TWITTER, 500 MILHÕES/DIA.

• A NSA ESTÁ CONSTRUINDO UM DATA CENTER EM

UTAH COM CAPACIDADE ESTIMADA ENTRE 5 ZETTABYTES E "ALGUNS YOTTABYTES”

Page 17: Aula CRP-0420-2016-04: Big Data 1
Page 18: Aula CRP-0420-2016-04: Big Data 1

FACEBOOK:• 1,4 BILHÃO DE USUÁRIOS, 890 MILHÕES ATIVOS

DIARIAMENTE. 6% DO TEMPO GASTO NA INTERNET.

• 250 BILHÕES DE FOTOS, CRESCE A CERCA DE 350

MILHÕES POR DIA.

• USUÁRIOS COMPARTILHAM 4,75 BILHÕES DE ITENS DE CONTEÚDO E 10 BILHÕES DE MENSAGENS/DIA.

• EMPRESAS TEM CERCA DE 50 MILHÕES DE PÁGINAS ARMAZENADAS NO SERVIÇO DIGITAL.

• 100 TERABYTES DE DADOS ENVIADOS DIARIAMENTE PARA O FACEBOOK.

(DADOS DE 2015)

Page 19: Aula CRP-0420-2016-04: Big Data 1

BASE DE DADOS:CPU DE COMPUTADOR VS.

COMO FUNCIONA?

Page 20: Aula CRP-0420-2016-04: Big Data 1

BASE DE DADOS:ALIMENTAÇÃO DE UMA

1ª FASE: FUNCIONÁRIOS 2ª FASE: USUÁRIOS 3ª FASE: MÁQUINAS

Page 21: Aula CRP-0420-2016-04: Big Data 1

MUITOS DADOSE QUANDO SE TEM

QUASE INSTANTÂNEOS?

Page 22: Aula CRP-0420-2016-04: Big Data 1

YOUTUBE E FACEBOOKOU SEJA: COMO FAZEM

ENTRE OUTROS?

COMO EVITAR UMA SOBRECARGA DO SISTEMA?

Page 23: Aula CRP-0420-2016-04: Big Data 1

TRANSFERIDOSOS DADOS NÃO SÃO

PARA O PROCESSADOR

PROCESSADORES DIVERSOS ANALISAM CONJUNTOS DE DADOS.

Page 24: Aula CRP-0420-2016-04: Big Data 1

HADOOPTECNOLOGIAS DE BIG DATA:

COMMODITY HARDWARE(QUALQUER LINUX BOX COM JVM BASTA)

FLEXÍVEL, ESCALÁVEL E BARATA

É O LEGO DOS DATA CENTERS

Page 25: Aula CRP-0420-2016-04: Big Data 1

MAPREDUCETECNOLOGIAS DE BIG DATA:

TABELA DE REFERÊNCIA (INDICA O QUE CADA MÁQUINA FAZ COM OS DADOS)

TODAS AS TRANSAÇÕES SÃO REGISTRADAS E ANALISADAS

POR PROCESSADORES EM PARALELO

Page 26: Aula CRP-0420-2016-04: Big Data 1

REVOLUCIONAMHADOOP E MAPREDUCE

A ANÁLISE DE DADOS

RÁPIDOS (SEM ENTRADA E SAÍDA) COMPATÍVEIS (DADOS BRUTOS, CRUS) ARMAZENÁVEIS EM MEMÓRIA FLASH

TODAS AS TRANSAÇÕES SÃO REGISTRADAS E ANALISADAS.

Page 27: Aula CRP-0420-2016-04: Big Data 1

BIG DATA:APRENDIZADO DE MÁQUINA E VISÃO COMPUTACIONAL

Page 28: Aula CRP-0420-2016-04: Big Data 1

NOVO EMPIRISMO• TEORIA QUE DEFINE QUE O CONHECIMENTO

VEM PRIMARIAMENTE DA EXPERIÊNCIA.

• ELA ENFATIZA O PAPEL DA EVIDÊNCIA, DE PREFERÊNCIA SENSORIAL, NA FORMAÇÃO DAS IDEIAS SOBRE A NOÇÃO DE IDEIAS INATAS OU TRADIÇÕES.

• É A BASE DO MÉTODO CIENTÍFICO

Page 29: Aula CRP-0420-2016-04: Big Data 1

BIG DATA: PREVISÕESAPLICA ANÁLISES ESTATÍSTICAS PARA ENORMES QUANTIDADES DE DADOS, A

FIM DE INFERIR PROBABILIDADES: PROCURAR OS MELHORES SINAIS E

PADRÕES À MEDIDA QUE MAIS DADOS SÃO ALIMENTADOS, O QUE LEVA A UMA NATURAL MELHORIA DE SEUS

RESULTADOS AO LONGO DO TEMPO.

Page 30: Aula CRP-0420-2016-04: Big Data 1

RECOMENDAÇÕES• AMAZON: LIVRO IDEAL

• GOOGLE: WEBSITE MAIS RELEVANTE

• FACEBOOK: CONTEÚDOS COM BASE NAS

PREFERÊNCIAS DE SEUS USUÁRIOS

• WAZE: INDICAR CAMINHOS

• NETFLIX: NOVOS FILMES

• AS MESMAS TECNOLOGIAS PODERÃO SER APLICADAS PARA DIAGNOSTICAR DOENÇAS E

RECOMENDAR TRATAMENTOS.

Page 31: Aula CRP-0420-2016-04: Big Data 1

SCHRÖDINGER: EFEITO

OBSERVAÇÃO E INFLUÊNCIA.

Page 32: Aula CRP-0420-2016-04: Big Data 1

PRECISO?BIG DATA É

ISSO É RELEVANTE?

Page 33: Aula CRP-0420-2016-04: Big Data 1

AMOSTRAGEM E ESCASSEZ

• A AMOSTRAGEM É FRUTO DE ESCASSEZ DE INFORMAÇÃO, TÍPICA DE TEMPOS ANALÓGICOS.

• AMOSTRAS MUITO MAIORES, NA ORDEM DE

BILHÕES DE REGISTROS, OU ATÉ A BASE DE DADOS INTEIRA, É POSSÍVEL VER DETALHES QUE AMOSTRAS PEQUENAS NÃO AVALIARIAM SEM UMA GRANDE MARGEM DE ERRO.

• BASES DE DADOS MAIORES DESOBRIGAM A BUSCA

POR EXATIDÃO. QUANDO O VALOR É ENORME, NÃO É POSSÍVEL NEM RELEVANTE CONTÁ-LO. O RESULTADO SATISFATÓRIO É APROXIMADO.

Page 34: Aula CRP-0420-2016-04: Big Data 1

BIG DATA E EXATIDÃO

• PENSE NA QUANTIDADE DE AUTOMÓVEIS, CRIANÇAS OU ANIMAIS EM UMA CASA (VALORES PEQUENOS, DISCRETOS E IMPORTANTES) EM

COMPARAÇÃO COM O NÚMERO DE GRÃOS DE AREIA, MOLÉCULAS OU ESTRELAS.

• VOLUMES PEQUENOS PRECISAM SER COMPUTADOS COM EXATIDÃO. VALORES MUITO GRANDES PRECISAM DE UM SENSO DE DIREÇÃO GERAL, EM

VEZ DE SUA ANÁLISE EM DETALHE. 

Page 35: Aula CRP-0420-2016-04: Big Data 1

BIG DATA: DIREÇÃO GERAL

O QUE SE PERDE EM PRECISÃO NO NÍVEL MICRO, GANHA-SE EM

PERCEPÇÃO NO NÍVEL MACRO.

Page 36: Aula CRP-0420-2016-04: Big Data 1

PRINCÍPIOS: IMPRECISÃO

• AUMENTAR O VOLUME FACILITA A INEXATIDÃO. 

• NÚMEROS ERRADOS E AMOSTRAS CORROMPIDAS SEMPRE PENETRARAM CONJUNTOS DE DADOS. 

• O QUE NUNCA FOI CONSIDERADO, APESAR DE INEVITÁVEL, ERA APRENDER A VIVER COM ELES. 

• AO PARTIR DE AMOSTRAS PEQUENAS, BUSCAVA-SE A MAIOR PRECISÃO POSSÍVEL. EM AMOSTRAGEM, A BUSCA POR EXATIDÃO ERA

CRÍTICA, O QUE FAZIA COMPLETO SENTIDO.

• UM NÚMERO LIMITADO DE DADOS PODERIA INCORRER NA AMPLIFICAÇÃO DOS ERROS E REDUZIR A PRECISÃO DOS RESULTADOS GLOBAIS.

Page 37: Aula CRP-0420-2016-04: Big Data 1

PRINCÍPIOS: CORRELAÇÃO

• CORRELAÇÕES QUANTIFICAM RELAÇÕES ESTATÍSTICAS ENTRE DOIS VALORES DE DADOS. 

• CORRELAÇÃO FORTE: QUANDO UM DOS VALORES

DE DADOS MUDA, HÁ GRANDE PROBABILIDADE DO OUTRO TAMBÉM MUDAR.

• CORRELAÇÃO FRACA: QUANDO UM VALOR MUDA, O OUTRO POUCO SE ALTERA.

CORRELAÇÕES FORTES NÃO SÃO PERFEITAS.É POSSÍVEL QUE DOIS FATOS SE COMPORTEM DE FORMA SEMELHANTE POR COINCIDÊNCIA.

Page 38: Aula CRP-0420-2016-04: Big Data 1

PRINCÍPIOS: REUTILIZAÇÃO

• ÀS VEZES O VALOR DE UMA BASE DE DADOS SÓ PODE SER DESENCADEADO QUANDO COMBINADO COM OUTRA, GERANDO RELAÇÕES IMPENSADAS. 

• OS RESULTADOS NÃO ERAM DESCOBERTOS ANTES PORQUE A AMOSTRA ESTUDADA ERA PEQUENA, O PERÍODO DE TEMPO COBERTO ERA CURTO, OU OS DADOS NÃO ERAM MEDIDOS, MAS RELATADOS.

• COM BIG DATA A SOMA É MAIS VALIOSA DO QUE

SEUS COMPONENTES INDIVIDUAIS.

Page 39: Aula CRP-0420-2016-04: Big Data 1
Page 40: Aula CRP-0420-2016-04: Big Data 1

QUATRO Vs: VOLUMEO TAMANHO DA BASE DE DADOS DETERMINA O VALOR

E POTENCIAL DOS DADOS EM QUESTÃO. EXEMPLOS:

• TRANSAÇÕES ARMAZENADAS AO LONGO DOS ANOS

• INTERAÇÕES DE MÍDIA SOCIAL

• SENSORES E COMUNICAÇÃO MÁQUINA-A-MÁQUINA

• SE NO PASSADO O VOLUME EXCESSIVO DE DADOS GERAVA UM PROBLEMA DE ARMAZENAMENTO, COM

A DIMINUIÇÃO DOS CUSTOS OUTRAS QUESTÕES EMERGEM, COMO A RELEVÂNCIA DAS RELAÇÕES EM GRANDES VOLUMES DE DADOS.

Page 41: Aula CRP-0420-2016-04: Big Data 1

QUATRO Vs: VELOCIDADE

• NOVOS DADOS SÃO ACUMULADOS A UMA VELOCIDADE SEM PRECEDENTES, PRECISAM

SER ADMINISTRADOS EM TEMPO HÁBIL.

• SISTEMAS DE BIG DATA PRECISAM LIDAR COM ENXURRADAS DE DADOS EM TEMPO QUASE REAL;

Page 42: Aula CRP-0420-2016-04: Big Data 1

QUATRO Vs:VARIEDADE

• DADOS HOJE CHEGAM EM DIVERSOS TIPOS E FORMATOS. ESTRUTURADOS E NÃO-

ESTRUTURADOS, EM DIVERSAS MÍDIAS, FORMATOS, TAMANHOS E FORMAS DE INTERCONEXÃO.

• GERIR, FUNDIR E ADMINISTRAR DIFERENTES VARIEDADES DE DADOS É FUNDAMENTAL;

Page 43: Aula CRP-0420-2016-04: Big Data 1

QUATRO Vs:VERACIDADE

• A QUALIDADE DOS DADOS CAPTURADOS PODE VARIAR MUITO.

• A PRECISÃO DA ANÁLISE DEPENDE DA QUALIDADE DOS DADOS DE ORIGEM.

Page 44: Aula CRP-0420-2016-04: Big Data 1

MAIS Vs:• VARIABILIDADE - FLUXOS DE DADOS PODEM SER

ALTAMENTE INCONSISTENTES, TANTO EM VOLUME, COM PICOS PERIÓDICOS, QUANTO EM QUALIDADE.

• VALOR DA INFORMAÇÃO - INFORMAÇÕES PASSÍVEIS DE ANÁLISE E CONVERSÃO EM MATERIAL APLICÁVEL NA TOMADA DE DECISÃO.

• VIABILIDADE - A GESTÃO DE DADOS PODE SE TORNAR UM PROCESSO MUITO COMPLEXO. OS

DADOS TEM QUE SER CONECTADOS E CORRELACIONADOS, PARA QUE SEJA POSSÍVEL SE EXTRAIR A INFORMAÇÃO DESEJADA.

Page 45: Aula CRP-0420-2016-04: Big Data 1

METADADOS • "DADOS SOBRE DADOS"

PODEM SER DE DOIS TIPOS:

• ESTRUTURAIS, DIZEM RESPEITO AO PROJETO E ESPECIFICAÇÕES DA ESTRUTURA DOS DADOS; E

• DESCRITIVOS, QUE DIZEM RESPEITO AO CONTEÚDO DOS DADOS.

• UMA DAS PRIMEIRAS APLICAÇÕES DE METADADOS FORAM FICHAS CATALOGRÁFICAS DE BIBLIOTECAS. À MEDIDA QUE A INFORMAÇÃO

TORNOU-SE CADA VEZ MAIS DIGITAL, METADADOS TAMBÉM PASSARAM A SER USADOS PARA DESCREVER DADOS DIGITAIS. 

Page 46: Aula CRP-0420-2016-04: Big Data 1

RADICAL.Precisamos de transparência

Quero saber QUEM usa meus dados,COMO e QUANDO.

Page 47: Aula CRP-0420-2016-04: Big Data 1

PROPRIEDADECOMO RESOLVER O PROBLEMA DA

DOS DADOS?

IDENTIFICÁ-LOS COMPLETAMENTE PODE SER UMA SOLUÇÃO?

Page 48: Aula CRP-0420-2016-04: Big Data 1

BOLHA DE FILTRO.ISSO SEM LEVAR EM CONTA A

Page 49: Aula CRP-0420-2016-04: Big Data 1

LIBERDADE E PRIVACIDADE?

TUDO É MUITO LINDO, MAS COMO FICAM

BIG DATA, PARA TER VALOR, PRECISA SER BEM ADMINISTRADA. 

ELA NÃO SIGNIFICA INFINITUDE

AUTOMÁTICA NEM SUBSTITUTO PARA A VISÃO. MUITO PELO CONTRÁRIO.

MÁS ANÁLISES PODEM GERAR RESULTADOS CATASTRÓFICOS.

Page 50: Aula CRP-0420-2016-04: Big Data 1
Page 51: Aula CRP-0420-2016-04: Big Data 1

VANTAGENS

Page 52: Aula CRP-0420-2016-04: Big Data 1

VANTAGENS• DETECÇÃO DE FRAUDES - ANALISA TRANSAÇÕES

EM TEMPO REAL, IDENTIFICANDO PADRÕES DE COMPORTAMENTO ANÔMALO

• ANÁLISE DE REGISTRO DE CHAMADAS DE SUPORTE TELEFÔNICO – REGISTROS E DADOS DE

RASTREAMENTO PODEM SER BEM APROVEITADOS, IDENTIFICANDO OPORTUNIDADES DE OTIMIZAÇÃO DE DESEMPENHO INCREMENTAL;

• SEGMENTAÇÃO – PARA ENTENDER MELHOR OS CLIENTES, COMPORTAMENTOS E PREFERÊNCIAS.

AS EMPRESAS OS UTILIZAM PARA EXPANDIR BANCOS DE DADOS COM DADOS DE MÍDIA SOCIAL.

Page 53: Aula CRP-0420-2016-04: Big Data 1

VANTAGENS• CRIAÇÃO DE MODELOS PREDITIVOS – GOVERNOS E

EMPRESAS OTIMIZAM CAMPANHAS UTILIZANDO ANÁLISE DE BIG DATA;

• COMPREENSÃO E OTIMIZAÇÃO DE PROCESSOS –OTIMIZAR VAREJO E DESCOBRIR TENDÊNCIAS, DE

MARKETING A LOGÍSTICA

• QUANTIFICAÇÃO PESSOAL – DE RELÓGIOS A PRIVADAS, SENSORES PODEM DAR A SEUS USUÁRIOS RICOS INSIGHTS. MAS O VALOR REAL ESTÁ NA ANÁLISE DOS DADOS COLETIVOS.

SERVIÇOS DE RELACIONAMENTO ONLINE APLICAM FERRAMENTAS DE BIG DATA E ALGORITMOS PARA ENCONTRAR OS PARES MAIS ADEQUADOS.

Page 54: Aula CRP-0420-2016-04: Big Data 1

DESVANTAGENS

Page 55: Aula CRP-0420-2016-04: Big Data 1

http://www.google.com.br/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&docid=_drQP5Vo8ilLpM&tbnid=4ioKWlxpf3DKaM:&ved=0CAUQjRw&url=http%3A%2F

%2F981theriver.com%2Fhand-picked%2F&ei=4zbZU8i8JpHgsASRy4HgDA&bvm=bv.

71778758,d.cWc&psig=AFQjCNHdbi0P8BkMh3YNi9xamMBcSFReWA&ust=1406830683992231

CEGUEIRA SISTÊMICA: A ILUSÃO DA

COMPREENSÃO.O que é correlação?

O que é coincidência?

O que é erro estatístico?

Page 56: Aula CRP-0420-2016-04: Big Data 1

99,9% NÃO É 100%NÚMEROS SÃO MAIS FALÍVEIS DO QUE

APARENTAM. DADOS NÃO REPRESENTAM A VERDADE, SOMENTE UMA AMOSTRA ESTATÍSTICA.

Page 57: Aula CRP-0420-2016-04: Big Data 1

MENSURAÇÃO E ANÁLISE DE DADOS

SÃO ÓTIMAS. SEM ELAS É QUASE IMPOSSÍVEL PROGREDIR. MAS É PRECISO CAUTELA NO USO.

A IGNORÂNCIA NUNCA É UMA BÊNÇÃO. OS BENEFÍCIOS DO CONHECIMENTO SÃO ÓBVIOS.

Page 58: Aula CRP-0420-2016-04: Big Data 1

NÃO BASTACOLETAR OS DADOS

DEVE-SE REFLETIR E PLANEJAR NOVAS METAS PERIODICAMENTE, IDENTIFICANDO PADRÕES DE COMPORTAMENTO NOCIVOS E RECORRENTES NA

BASE DE DADOS E NO PESQUISADOR.

Page 59: Aula CRP-0420-2016-04: Big Data 1

PROBLEMAS• REUTILIZAÇÃO DE DADOS

• RECOMBINAÇÃO DE DADOS

• PUNIÇÃO PREVENTIVA (PROFILING)

• SEGREGAÇÃO E PRECONCEITO

• PESSOAS VERSUS PREVISÕESDITADURA DE DADOS (FETICHE)

• RISCOS DE PRIVACIDADE E SEGURANÇA

• PRIVACIDADE VS. PRESTAÇÃO DE CONTAS

• CORRELAÇÃO NÃO É CAUSALIDADE. 

Page 60: Aula CRP-0420-2016-04: Big Data 1

DATACRACIA• BIG DATA PODE ÚTIL PARA A TOMADA DE DECISÕES

RACIONAIS. USADA DE FORMA IMPRUDENTE, PODE SE TORNAR UM INSTRUMENTO DE REPRESSÃO,

CONTROLE OU RETALIAÇÃO.

• DECISÕES ESTRATÉGICAS SÃO TIRADAS DE DADOS VÁLIDOS EM UM CONTEXTO VÁLIDO. QUANDO ALGUMA DESSAS CONDIÇÕES NÃO É VERDADEIRA OU NÃO PODE SER VERIFICADA, O RESULTADO PODE

SER, NO MÍNIMO, IRRELEVANTE. OU PIOR, PERIGOSO.

Page 61: Aula CRP-0420-2016-04: Big Data 1
Page 62: Aula CRP-0420-2016-04: Big Data 1

QUESTÃO ÉTICACOMO FICA A

DE BIG DATA?

Page 63: Aula CRP-0420-2016-04: Big Data 1
Page 64: Aula CRP-0420-2016-04: Big Data 1

DADOS:FONTE DE RENDAQUANDO VOCÊ NÃO PAGA PELO PRODUTO VOCÊ É O PRODUTO.

QUANDO PAGA TAMBÉM É.

Page 65: Aula CRP-0420-2016-04: Big Data 1

DATA BROKERSFACEBOOK E GOOGLE SÃO BONZINHOS.

SÃO OS CORRETORES DE DADOS QUE OS COLETAM DADOS DE VÁRIAS

FONTES, EM GRANDE PARTE SEM CONHECIMENTO DE QUEM OS FORNECE.

Page 66: Aula CRP-0420-2016-04: Big Data 1

DATA BROKERS COMBINAM DADOS ONLINE E OFF-LINE.

• COMBINAM E ANALISAM DADOS PARA FAZER INFERÊNCIAS, INCLUINDO RELAÇÕES POTENCIALMENTE SENSÍVEIS.

• ALEGAM TER: • INFORMAÇÕES SOBRE 1,4 BILHÃO DE TRANSAÇÕES

REALIZADAS E MAIS DE 700 BILHÕES ELEMENTOS DE DADOS AGREGADOS

• UM TRILHÃO DE DÓLARES EM TRANSAÇÕES DE CONSUMO;

• TRÊS BILHÕES DE NOVOS REGISTROS POR MÊS A SEUS

BANCOS DE DADOS;

• CERCA DE 3000 REGISTROS DE DADOS PARA QUASE TODOS OS CONSUMIDORES DOS ESTADOS UNIDOS;

Page 67: Aula CRP-0420-2016-04: Big Data 1

ACXIOMFATURAMENTO ENTRE 800 MILHÕESE 1,1 BILHÃO DE DÓLARES POR ANO, O QUE REPRESENTA MAIS DE 12% DO SETOR DE MARKETING E SERVIÇOS

DIRETOS NOS EUA.

Page 68: Aula CRP-0420-2016-04: Big Data 1

SERASAÉ UM DOS MAIORES CORRETORES DE

DADOS FINANCEIROS NO BRASIL. COMPRADO PELA IRLANDESA

EXPERIAN EM 2007.

EM 2014, A RECEITA DA FILIAL BRASILEIRA US$ 819 MILHÕES, 17% DO FATURAMENTO GLOBAL DA EMPRESA.

Page 69: Aula CRP-0420-2016-04: Big Data 1

DADOS COLETADOS• DADOS DE IDENTIFICAÇÃO:

• NOME ANTERIOR, HISTÓRICO DE ENDEREÇO, TELEFONE, IDENTIFICAÇÃO

GOVERNAMENTAL, DATA DE NASCIMENTO DE CADA MEMBRO DA FAMÍLIA

• DADOS DEMOGRÁFICOS: • RAÇA E ETNIA, PAÍS DE ORIGEM, RELIGIÃO, LÍNGUA FALADA, PAI IDOSO,

CRIANÇAS, ESCOLARIDADE, LAÇOS FAMILIARES, DEMOGRAFIA DOS MEMBROS

DA FAMÍLIA EM CASA, NÚMERO DE SOBRENOMES EM CASA, CHEFE DE FAMÍLIA HISPÂNICO OU LATINO, EMPREGO E OCUPAÇÃO DE CADA MEMBRO DA FAMÍLIA, DURAÇÃO DA POSSE OU ALUGUEL DA RESIDÊNCIA, DISTRITO ELEITORAL,

FAMÍLIAS SOMENTE COM PAI OU MÃE, FILIAÇÕES RELIGIOSAS OU ÉTNICAS

• DADOS JURÍDICOS: • FALÊNCIAS, INFRAÇÕES PENAIS E CONDENAÇÕES, JULGAMENTOS, REGISTROS,

LICENÇAS (CAÇA OU PROFISSIONAL), IDENTIFICAÇÃO PARTIDÁRIA;

• DADOS DE TECNOLOGIA E MÍDIAS SOCIAIS: • COMPRAS DE ELETRÔNICOS, AMIGOS E CONEXÕES, TIPO DE CONEXÃO,

PROVEDOR DE ACESSO, NÍVEL DE USO E EXPERIÊNCIA, PARTICIPAÇÃO EM REDES SOCIAIS, MEMBRO DE MAIS DE 5 REDES SOCIAIS, INFLUENCIADOR ON-LINE,

SISTEMA OPERACIONAL, COMPRAS DE SOFTWARE, TIPO DE MÍDIA PUBLICADA

Page 70: Aula CRP-0420-2016-04: Big Data 1

DADOS COLETADOS• DADOS RESIDENCIAIS E DE VIZINHANÇA:

• MORADIA PÚBLICA OU GOVERNAMENTAL, TIPO DE HABITAÇÃO, AQUECIMENTO E

REFRIGERAÇÃO, VALOR DA RESIDÊNCIA, HIPOTECA E JUROS, TAMANHO DA CASA, CRIMINALIDADE NO BAIRRO, NÚMERO DE CÔMODOS, ANO DE CONSTRUÇÃO

• DADOS DE INTERESSE GERAL: • PREFERÊNCIAS DE VESTUÁRIO, PARTICIPAÇÃO EM EVENTOS ESPORTIVOS,

DOAÇÕES, HÁBITO DE JOGO - CASINOS, LOTERIAS, ACONTECIMENTOS DA VIDA (APOSENTADORIA, CASAMENTO, GRAVIDEZ), ASSINATURAS DE REVISTAS, CANAIS DE TV ASSISTIDOS, ANIMAIS DE ESTIMAÇÃO, INCLINAÇÕES POLÍTICAS,

CELEBRIDADES DE PREFERÊNCIA, GÊNEROS DE FILME E MÚSICA PREDILETOS, HOBBIES, ESTILO DE VIDA (MOTOCICLISMO, OUTDOOR / CAÇA E TIRO, NATIVO,

NEW AGE / ORGÂNICO), MEMBRO DE MAIS DE 5 SITES DE COMPRAS, DADOS FINANCEIROS, INADIMPLÊNCIA, CATEGORIA DE CRÉDITO DO CARTÃO, DIFICULDADES FINANCEIRAS, NÍVEL DE RENDA, CRÉDITO ATIVO

• DADOS DO VEÍCULO: • PREFERÊNCIAS DE MARCA, RENOVAÇÃO DO SEGURO, MARCA E MODELO,

NÚMEROS DE IDENTIFICAÇÃO DE CADA VEÍCULO DE PROPRIEDADE, PROPENSÃO À COMPRA DE VEÍCULO NOVO OU USADO, PROPRIETÁRIO DE MOTOCICLETA,

DATA DE AQUISIÇÃO, INFORMAÇÕES DE COMPRA, INTENÇÃO DE COMPRA

Page 71: Aula CRP-0420-2016-04: Big Data 1

DADOS COLETADOS• DADOS DE VIAGENS:

• PREÇO MAIS ALTO PAGO POR UMA VIAGEM, DATA DA ÚLTIMA VIAGEM,

PASSAGEIRO FREQUENTE, PROPRIEDADE DE FÉRIAS, TIPO DE FÉRIAS (CASINO, TIME SHARE, CRUZEIROS), DESTINO PREFERIDO, COMPANHIA AÉREA PREFERIDA

• DADOS DE COMPORTAMENTO DE COMPRA: • MONTANTE GASTO EM BENS, FORMA DE PAGAMENTO PREFERIDO, CANAL DE

PREFERÊNCIA (INTERNET, CORREIO, TELEFONE), TIPO DE ENTRETENIMENTO COMPRADO, TIPO DE ALIMENTOS ADQUIRIDOS, MÉDIA DE DIAS ENTRE COMPRAS, ÚLTIMA COMPRA (ON-LINE E OFF-LINE), COMPRAS EM CATÁLOGOS POPULARES E

ENCOMENDAS EM CATÁLOGOS DE ALTO PADRÃO, TAMANHOS DAS ROUPAS, VOLUME E TIPO DE LIVROS COMPRADOS

• DADOS DE SAÚDE: • PROPENSÃO A BUSCA POR DADOS DE SAÚDE, DOENÇAS E PRESCRIÇÕES ONLINE,

FUMANTE EM CASA, SUPRIMENTOS GERIÁTRICOS, USO DE LENTES CORRETIVAS, ALERGIAS, PLANO DE SAÚDE INDIVIDUAL, USUÁRIO DE SAÚDE PÚBLICA, MARCA

MAIS USADA DE REMÉDIO, PERDA DE PESO E SUPLEMENTOS, COMPRAS EM TÓPICOS DE SAÚDE INCLUINDO: ALERGIAS, ARTRITE, COLESTEROL, DIABETES, DIETA, FISICULTURISMO, MEDICINA ALTERNATIVA, PRODUTOS DE BELEZA,

REMÉDIOS HOMEOPÁTICOS, ORTOPEDIA ETC

Page 72: Aula CRP-0420-2016-04: Big Data 1

FONTE: GOVERNO• A. GOVERNO FEDERAL

• CENSO: DEMOGRAFIAS DE BAIRROS, COMO A ETNIA, IDADE, NÍVEL DE ESCOLARIDADE, COMPOSIÇÃO FAMILIAR, RENDA, OCUPAÇÕES, E O TEMPO DE DESLOCAMENTO. ESTRADAS, ENDEREÇOS, DISTRITOS ELEITORAIS E LIMITES DAS

CIDADES, MUNICÍPIOS, SUBDIVISÕES, E DISTRITOS DE VOTO

• ADMINISTRAÇÃO DE SEGURIDADE SOCIAL: NOMES DE CONSUMIDORES,

REGISTROS FEDERAIS (EQUIVALENTES A CPFS) E DATAS DE ÓBITO

• SERVIÇO POSTAL: ENDEREÇO E MUDANÇAS

• FBI E SERVIÇO SECRETO: LISTAS DE TERRORISTAS E CRIMINOSOS PROCURADOS;

• AGÊNCIAS FEDERAIS E INTERNACIONAIS: INDIVÍDUOS INELEGÍVEIS PARA RECEBER CONTRATOS COM O GOVERNO OU OUTROS BENEFÍCIOS

• TRIBUNAIS FEDERAIS FORNECEM INFORMAÇÕES SOBRE FALÊNCIAS

Page 73: Aula CRP-0420-2016-04: Big Data 1

FONTE: GOVERNO• B.  GOVERNOS ESTADUAIS E MUNICIPAIS:

• LICENÇAS PROFISSIONAIS (PILOTOS, MÉDICOS, ADVOGADOS, ARQUITETOS)

• LICENÇAS RECREATIVAS (CAÇA E PESCA)

• IMÓVEIS E REGISTROS: IMPOSTOS, PATRIMÔNIO, DÉBITOS, HIPOTECAS,

INFORMAÇÕES SOBRE PROPRIEDADES (ÁREA, CÔMODOS, BENEFÍCIOS)

• INFORMAÇÕES ELEITORAIS (NOME, ENDEREÇO, E FILIAÇÃO PARTIDÁRIA);

• REGISTROS: DE VEÍCULOS, JUDICIAIS, CRIMINAIS, AÇÕES CÍVEIS E JUÍZOS, CERTIDÕES DE NASCIMENTO, CASAMENTO, DIVÓRCIO E ÓBITO.

• NA MAIOR PARTE DAS VEZES OS CORRETORES DE DADOS CONTRATAM PESSOAS PARA VISITAR REGISTROS LOCAIS E COMPILAR A INFORMAÇÃO. 

Page 74: Aula CRP-0420-2016-04: Big Data 1

FONTE: COMERCIAL• DADOS ESPECÍFICOS DE TRANSAÇÕES DETALHADAS SOBRE

COMPRAS DIRETO DE VAREJISTAS. POR EXEMPLO: • SAPATOS DE LUXO, ALIMENTOS NATURAIS, CREME DENTAL, ITENS

RELACIONADOS A DEFICIÊNCIAS OU PROBLEMAS ORTOPÉDICOS), O VALOR DA COMPRA, A DATA E O TIPO DE PAGAMENTO UTILIZADO. VÁRIOS DOS

CORRETORES DE DADOS TAMBÉM OBTER INFORMAÇÕES DE EDITORAS DE REVISTAS SOBRE OS TIPOS DE ASSINATURAS VENDIDAS.

• OUTRAS FONTES: • LISTAS DE CLIENTES DE SITES DE VAREJO, NOTÍCIAS E VIAGENS, COMPRAS

RELACIONADAS À SAÚDE

• EMPRESAS DE TELEFONIA

• EMPRESAS DE SERVIÇOS BANCÁRIOS

• CONCESSIONÁRIAS DE VEÍCULOS E CORRETORES DE IMÓVEIS

• GRANDES VAREJISTAS

• PESQUISAS DE MARKETING, REGISTROS DE GARANTIA, CONCURSOS.

Page 75: Aula CRP-0420-2016-04: Big Data 1

AXCIOM VS. NSAQUAL É PIOR?

Page 76: Aula CRP-0420-2016-04: Big Data 1

VIESES E HEURÍSTICAS

Page 77: Aula CRP-0420-2016-04: Big Data 1

DANIEL KAHNEMAN: • DOIS MODOS DE PENSAMENTO:

• SUBCONSCIENTE, RÁPIDO, EMOCIONAL, AUTOMÁTICO, FREQUENTE, INSTINTIVO E

ESTEREOTÍPICO; E

• CONSCIENTE, MAIS LENTO, DELIBERATIVO, CALCULADO, LÓGICO E POUCO FREQUENTE.

Page 78: Aula CRP-0420-2016-04: Big Data 1

HEURÍSTICAS: ATALHOS MENTAIS

INFERIMOS RESULTADOS A PARTIR DA EXPERIÊNCIA VIVIDA.

Page 79: Aula CRP-0420-2016-04: Big Data 1

VIESES: ERROS NOS ATALHOS

NEM SEMPREO CAMINHO MAIS RÁPIDO É O MELHOR

Page 80: Aula CRP-0420-2016-04: Big Data 1

VIESES:• ANCORAGEM

• O CÉREBRO HUMANO BUSCA POR COMPARAÇÕES. PONTOS DE REFERÊNCIA PARA

DEFINIR TAMANHOS, PESOS, PREÇOS, CONFORTO, VIABILIDADE ETC. PREÇOS MUITO ALTOS EM UM CARDÁPIO, PODEM LEVAR SEUS CLIENTES A CONSIDERAR OS

VALORES MENORES COMO OPORTUNIDADES

• DISPONIBILIDADE • JULGAMOS A PROBABILIDADE DE EVENTOS DE ACORDO COM A FACILIDADE DE

IMAGINÁ-LOS."SE ALGO PODE SER IMAGINADO, DEVE SER IMPORTANTE." A

PERCEPÇÃO DAS CONSEQUÊNCIAS ASSOCIADAS A UMA AÇÃO ESTÁ DIRETAMENTE RELACIONADA À PERCEPÇÃO DE SUA MAGNITUDE

• SUBSTITUIÇÃO • SUBSTITUIR UMA IDEIA OU QUESTÃO DIFÍCIL POR OUTRA MAIS SIMPLES. 

JULGAMENTO INTUITIVO AUTOMÁTICO, EM VEZ DO REFLEXIVO.

• OTIMISMO E AVERSÃO À PERDA • O VIÉS OTIMISTA GERA A ILUSÃO DE CONTROLE, QUE PODE TER UMA UTILIDADE

NA ADAPTAÇÃO DA ESPÉCIE AOS DIFERENTES AMBIENTES. O OTIMISMO PROTEGE

O INDIVÍDUO DA AVERSÃO À PERDA, A TENDÊNCIA DE TEMER A PERDA MAIS DO QUE SE VALORIZA OS GANHOS.

Page 81: Aula CRP-0420-2016-04: Big Data 1

VIESES:• ENQUADRAMENTO (FRAMING)

• AS PESSOAS REAGEM A UMA ESCOLHA DE ACORDO COM O CONTEXTO EM QUE

ELA É APRESENTADA

• CUSTOS IRRECUPERÁVEIS • QUANDO UMA DESPESA JÁ FOI REALIZADA E NÃO PODERÁ SER RECUPERADA, A

MAIORIA CONTINUA A INVESTIR EM VEZ DE RECONSIDERAR. NÃO É

SURPREENDENTE QUE O MERCADO TENHA DIFICULDADES EM SE COMPORTAR DE MANEIRA QUE OS ECONOMISTAS CONSIDERARIAM "RACIONAL".

• VIESES COGNITIVOS • “ATALHOS” DE PENSAMENTO, COMO EXCESSO DE CONFIANÇA; PESSIMISMO;

EFEITO PLACEBO; RACIONALIZAÇÃO PÓS-COMPRA; PROCRASTINAÇÃO; RECIPROCIDADE; E ESTEREÓTIPOS.

Page 82: Aula CRP-0420-2016-04: Big Data 1
Page 83: Aula CRP-0420-2016-04: Big Data 1

VIESES COGNITIVOS:• APOIO À ESCOLHA

• TENDÊNCIA A SE SENTIR BEM APÓS UMA TOMADA DE DECISÃO POR TER RESOLVIDO

UM CONFLITO

• AVESTRUZ • AVERSÃO A FATOS PERIGOSOS OU NEGATIVOS

• CLUSTERING • BUSCAR PADRÕES EM EVENTOS ALEATÓRIOS

• CONFIRMAÇÃO • ESCUTAR SOMENTE A INFORMAÇÃO QUE CONFIRMA CERTEZAS E PRECONCEITOS

• CONFORMIDADE • ADAPTAÇÃO AO GRUPO

• CONSERVADORISMO • DAR PREFERÊNCIA A FATOS ANTERIORES DO QUE A ELEMENTOS QUE OS CONTESTEM

Page 84: Aula CRP-0420-2016-04: Big Data 1

VIESES COGNITIVOS:• DESCOMPASSO DE EMPATIA

• QUEM ESTÁ EM UM ESTADO DE ESPÍRITO NÃO CONSEGUE ENTENDER QUEM ESTÁ

EM OUTRO ESTADO DE ESPÍRITO

• DISPONIBILIDADE HEURÍSTICA • SUPERESTIMAR A IMPORTÂNCIA DA INFORMAÇÃO DISPONÍVEL

• EXPECTATIVA • INFLUENCIA INCONSCIENTEMENTE A PERCEPÇÃO DE UM RESULTADO

• FREQUÊNCIA • PALAVRA, PESSOA OU OBJETO QUE SE ACABOU DE APRENDER PARECE ESTAR

EM TODOS OS LUGARES

• HALO • UM ATRIBUTO POSITIVO DE ALGUÉM É ASSOCIADO COM A PESSOA COMO UM

TODO

• MANADA • ADOTAR UMA CRENÇA COM BASE EM SUA POPULARIDADE

Page 85: Aula CRP-0420-2016-04: Big Data 1

VIESES COGNITIVOS:• NEGAÇÃO DE DURAÇÃO

• A DURAÇÃO DE UM EVENTO TRAUMÁTICO É MENOSPREZADA

• NEGATIVIDADE • COLOCAR MAIS ÊNFASE EM EXPERIÊNCIAS NEGATIVAS DO QUE

POSITIVASPERCEPÇÃO SELETIVA

• EXPECTATIVAS INFLUENCIAM A VISÃO DE MUNDO

• PONTO CEGO • DEIXAR DE RECONHECER VIESES COGNITIVOS

• RESULTADO • JULGAR DECISÕES COM BASE EM SEUS RESULTADOS, MESMO QUE TENHAM SIDO

EFEITO DE SORTE A PARTIR DE DECISÕES IMPRUDENTES, TÍPICOS DE HISTÓRIAS VISTAS EM RETROSPECTO

• RETORNO IMEDIATO • PARECE MAIS INTERESSANTE DO QUE UM GANHO MAIOR NO FUTURO;

Page 86: Aula CRP-0420-2016-04: Big Data 1

FIM

Page 87: Aula CRP-0420-2016-04: Big Data 1

TAREFAS:

Page 88: Aula CRP-0420-2016-04: Big Data 1

PALESTRAS TED:HANS ROSLING: LET MY DATASET CHANGE YOUR MINDSET

DAVE DEBRONKART: MEET E-PATIENT DAVE ALESSANDRO ACQUISTI: WHAT WILL A FUTURE WITHOUT

SECRETS LOOK LIKE? JOEL SELANIKIO: BIG-DATA REVOLUTION IN HEALTHCARE

JESSICA DONOHUE: THE UP-SIDE OF DATA CHRISTOPHER SOGHOIAN: GOVERNMENT SURVEILLANCE —

THIS IS JUST THE BEGINNING ANNE MILGRAM: WHY SMART STATISTICS ARE THE KEY TO

FIGHTING CRIME

MALTE SPITZ: YOUR PHONE COMPANY IS WATCHING

Page 89: Aula CRP-0420-2016-04: Big Data 1

LEITURASDATABASE NATION - CAPS 2, 8, 11

TAMING THE BIG DATA TIDAL WAVE - CAPS 3 E 4 DATACLYSM - CAPS 13, 14

SOCIAL PHYSICS - CAPS 1, 3, 10 BIGA DATA: A REVOLUTION - CAPS 2, 3 E 9

Page 90: Aula CRP-0420-2016-04: Big Data 1

FICÇÃOTHE TRUMAN SHOW MINORITY REPORT

ENEMY OF THE STATE

Page 91: Aula CRP-0420-2016-04: Big Data 1

DOCUMENTÁRIOS:HORIZON: THE AGE OF BIG DATA THE HUMAN FACE OF BIG DATA

THE WALL STREET CODE

Page 92: Aula CRP-0420-2016-04: Big Data 1

PENSADOR DO TEMA:DANIEL KAHNEMAN: BIT.LY/1L8WI1N