42
CLOUD & BIG DATA Diapositive a cura di: Lorenzo Nardo e Manuel Boscolo

Cloud e big data

Embed Size (px)

DESCRIPTION

Cloud & Big Data

Citation preview

Page 1: Cloud e big data

CLOUD & BIG DATA

Diapositive a cura di: Lorenzo Nardo e Manuel Boscolo

Page 2: Cloud e big data

CLOUD ALLA RISCOSSA!Negli ultimi anni tutte le maggiori aziende, i social network e il mobile per una maggiore praticità e risparmio di risorse proprie, si affidano ai servizi di Cloud Computing. Ed ormai tutto ciòche carichiamo nel web viene assorbito nella nuvola.

Page 3: Cloud e big data

CLOUD BIG DATALa simbiosi di Big Data e Cloud Computing è inequivocabile, i dati e tutti i contenuti sensibili per le esigenze di chi ne richiede l’analisi oramai sono pressochè interamente ospitate nella nuvola che ora ha un valore inestimabile.

Page 4: Cloud e big data
Page 5: Cloud e big data

CLOUD COMPUTING

Page 6: Cloud e big data

CLOUD COMPUTING

Cloud computing: è un insieme di tecnologie informatiche che permettono l'utilizzo di risorse, i data service e le funzionalità offerte in remoto.

Page 7: Cloud e big data

CARATTERISTICHE CHIAVE

On-demand self-service

Broad network access

Resource pooling

Rapid elasticity

Measured Service

Il consumatore può unilateralmente disporre di capacità di calcolo.Le risorse di calcolo sono messe al servizio di tutti i consumatori.I Sistemi Cloud automaticamente controllano e ottimizzano le risorse.Le capacità sono disponibili in rete e sono accessibili tramite meccanismi standard.Le risorse possono essere rapidamente ed elasticamente incrementate per scalare la potenza e rapidamente ed elasticamente liberate per rilasciarla.

Page 8: Cloud e big data

TRE ATTORI PRINCIPALI• Fornitore di servizi (il provider): offre servizi (server

virtuali, storage, applicazioni complete) generalmente secondo un modello "pay-per-use“ o free.

• Cliente amministratore: sceglie e configura i servizi offerti dal fornitore, generalmente offrendo un valore aggiunto come ad esempio applicazioni software.

• Cliente finale: utilizza i servizi opportunamente configurati dal cliente amministratore.

(In determinati casi d'uso il cliente amministratore e il cliente finale possono coincidere)

Page 9: Cloud e big data

3 LIVELLI DI SERVIZI

Application

Platform

Infrastructure

SaaS (Software as a Service)

PaaS (Platform as a Service)

Iaas (Infrastructure as a Service)

Page 10: Cloud e big data

I PRINCIPALI PLAYER

Page 11: Cloud e big data

VANTAGGI vs

SVANTAGGI

Page 12: Cloud e big data

VANTAGGI PER L’UTENTE• Nessun software da scaricare e installare sul proprio

computer.• Non si deve acquistare una licenza software. Ci si abbona

al servizio, che spesso è gratuito.• Nessuna necessità di upgrade del software quando

vengono aggiunte nuove funzioni o eliminati problemi esistenti.• Si può accedere ai propri documenti da ogni computer

connesso in rete.• È possibile condividere i documenti con altri utenti, senza

bisogno di un proprio server• Nessun problema in caso di crash del proprio computer: i documenti sono al sicuro sul server.

Page 13: Cloud e big data

SVANTAGGI PER L’UTENTE• È necessaria una connessione internet con banda adeguata.

• Data security, tutti i dati risiedono su un server remoto, di cui non si ha il controllo (anche se si possono effettuare regolari

backup).

• Data privacy, i dati sono visibili ed utilizzabili da terzi che non sempre agisco in buona fede.

• Completezza funzionale. Attualmente, le funzioni fornite dalle applicazioni “cloud” sono meno complete di quelle fornite dai software tradizionali.

• Non è agevole lavorare off-line, per ricevere e trasmettere le modifiche occorre essere connessi.

Page 14: Cloud e big data

VANTAGGI PER LE AZIENDEriduzione dei costi

• Eliminazione/riduzione delle infrastrutture software/hardware e dei costi del personale per la gestione dei sistemi.

• Riduzione/eliminazione dei costi fissi • Scalabilità dei servizi, tutto quello che serve, quando

serve, solo se serve.

• Costi “pay-per-use”

Page 15: Cloud e big data

VANTAGGI PER LE AZIENDE

Taglio costi fissi

Es. scalabilità

Page 16: Cloud e big data

migliori servizi

• Servizi sviluppati e gestiti dai migliori professionisti, con le migliori competenze.

• Servizi sempre aggiornati e in continua evoluzione.

• Servizi altamente flessibili.

VANTAGGI PER LE AZIENDE

Page 17: Cloud e big data

SVANTAGGI PER LE AZIENDE• I dati risiedono su un server remoto, di cui si ha

scarso controllo, ne conseguono possibili problemi d’integrità dei dati. (es. caso Amazon)

• Più alto rischio di furto di dati e informazioni, non sempre tutelata della privacy. (es. Playstation Network)

• Servizi standardizzati, non sempre soddisfano a pieno le esigenze aziendali.

• Non è agevole lavorare off-line, per ricevere e trasmettere le modifiche occorre essere connessi.

Page 18: Cloud e big data

IN FUTURO…

Page 19: Cloud e big data

OBIETTIVI e SFIDE PER IL FUTURO• Incremento dei sistemi di sicurezza per la tutela

della privacy e per la salvaguardia dei dati.• Incremento delle collaborazioni tra le diverse

aziende fornitrici di servizi “Cloud”. • Incremento dei servizi in termini di quantità e

qualità (velocità, affidabilità, grado di personalizzazione).

• Crescita di nuove competenze.• Stabilire “regole” e “codici” comuni, adottabili

tra i diversi produttori.

Page 20: Cloud e big data
Page 21: Cloud e big data

CONCETTI DI BASE

Page 22: Cloud e big data

“BIG DATA”

Definizione:

Big data è il termine per descrivere una raccolta di dataset così grande e complessa da richiedere strumenti differenti da quelli tradizionali, in tutte le fasi del processo: dall‘acquisizione, alla curation, passando per condivisione, analisi e visualizzazione.

Da Wikipedia, l'enciclopedia libera.

Page 23: Cloud e big data

Terminologia• Un dataset (o data set) è una collezione

di dati.• Il Datacenter o Centro Elaborazione

Dati (CED) è l'unità organizzativa che coordina e mantiene le

apparecchiature ed i servizi di gestione dei dati.

Page 24: Cloud e big data

Terminologia• Data curation: è la gestione dei dati al fine di

scoprire, recuperare, mantenere, aggiungere valore, permettere il riutilizzo dei dati, garantendone contemporaneamente l'autenticazione, l'archiviazione, la gestione e la preservazione.

Page 25: Cloud e big data

A COSA SERVONO?

Page 26: Cloud e big data

Perché utilizzare i Big Data?Il motivo principale è la possibilità di effettuare Business Analytics in contesti dove oggi non sarebbe possibile o lo sarebbe con tempi e costi inaccettabili.

Si pensi poi a Facebook, Linkedin, Twitter:

alcune tecnologie Big Data si sono sviluppate

proprio in ambito social network.

E il motivo è piuttosto evidente, visto che i Big Data applicati ai

social mettono nelle mani dei dipartimenti marketing potenti strumenti di analisi

su potenziali clienti finali.

Page 27: Cloud e big data

Ambiti di utilizzo

• Sicurezza (lotta alla criminalità, prevenzione di disastri).

• Scienza (meteorologia, medicina).• Tecniche di marketing (individuazione dei

trend di vendita in particolari contesti).• Rilevazioni real-time (monitoraggi di sistemi

complessi).

Page 28: Cloud e big data

ANALISI DEI BIG DATA

Page 29: Cloud e big data

Una crescita esponenziale

L’utilizzo sempre più diffuso dei social media, e degli smartphones che raccolgono e generano dati costantemente, il crescente uso di Internet, così come l’utilizzo di sensori che misurano e monitorano ogni cosa, fa sì che il volume dei dati prodotti in tutto il mondo stia crescendo in modo vertiginoso.

Il 90% dei dati oggi esistenti sono stati generati negli ultimi 2 anni. Il ritmo con cui queste informazioni sono prodotte è talmente alto che ogni due giorni è creato un volume di dati pari alla quantità di informazioni generate dall’umanità intera fino al 2003.

Page 30: Cloud e big data

Paradigma delle “V”

• VOLUME : quantità dei dati trattati• VELOCITA’ : l’estrazione di queste informazioni deve avvenire

velocemente, i dati devono essere utilizzabili prima che diventino inutili

• VARIETA’: i dati da trattare sono ETEROGENEI (testo, video, ricerche web, transazioni finanziarie, pagamenti con carta di credito, etc.)

• VARIABILITA’: (Valore/Veridicità) occorre contestualizzare il dato (da che ambito proviene? è indispensabile filtrarlo oppure no?)

• VIRALITA’: i Big Data stanno crescendo in maniera esponenziale nella rete e si espandono come un vero e proprio virus.

Page 31: Cloud e big data

BIG DATA & PRIVACY

Page 32: Cloud e big data

BIG DATA & PRIVACYEnormi banche dati, che possono anche essere

istituzionali, raccolgono un’infinità di dati sensibili che riguardano gli utenti della rete.

La semplice trasformazione in forma anonima delle informazioni raccolte non garantisce la loro protezione quando vengono elaborate, sono quindi allo studio sistemi alternativi.

Page 33: Cloud e big data

Questi sistemi alternativi in genere fanno riferimento alla cosiddetta crittografia omomorfica che consente di eseguire calcoli su dati cifrati senza prima decrittarli.

La IBM sostiene chel'informatico Craig Gentry aveva sviluppato un sistema pratico, completamente omomorfico, già nel 2009, ma i critici hanno detto che la tecnologia era troppo complessa, lenta e poco pratica per un uso

effettivo sul cloud. Siamo quindi ancora in attesa…

BIG DATA & PRIVACY

Page 34: Cloud e big data

BIG DATA & PRIVACYA volte, infatti, le informazione possono trapelare ed

essere usate al di fuori del loro ambito specifico come nello scandalo denominato “Datagate”…

Vedi : http://it.wikipedia.org/wiki/Datagate

Page 35: Cloud e big data

SCENARI

Page 36: Cloud e big data

CHI SFRUTTA I BIG DATA?Si può cominciare a parlare di Big Data quando la mole di dati

presa in considerazione è nell’ordine degli Zettabyte (miliardi di Terabyte).

Da considerare sono anche le agenzie governative come l’NSA(National Security Agency).

Page 37: Cloud e big data

Ambito italianoIn Italia, quando si parla di “Big Data”, in realtà si

intendono Business Intelligence e Data Mining, data la ridotta quantità di dati da analizzare.

Esempi:• L’ultima edizione di Sanremo, 150 mila tweet durante la finale; un

volume che può essere racchiuso in 77 MB (Foglio Excel)• Analisi politiche sui tweet del corpo elettorale italiano (3,5M di italiani

hanno utilizzato Twitter durante la campagna elettorale) svolte con strumenti tradizionali.

Page 38: Cloud e big data

IL FUTURO DEI BIG DATA

Page 39: Cloud e big data

CONCLUSIONI

La grande sfida, per le aziende che stanno investendo sui big data, sembra essere la

• capacità di formulare domande intelligenti e• concorrere alla nascita di competenze in

grado di gestire le risposte.

Page 40: Cloud e big data

La figura del data scientist sarà centrale nei prossimi anni.Sia matematico che Informatico, deve capire di statistica, saper usare un foglio excel ed aiutare l’azienda per la quale lavora a interpretare il presente per prevedere il

prossimo futuro. Non è una figura mistica ma un nuovo professionista, lo“scienziato dei dati”.

CONCLUSIONI

Page 41: Cloud e big data

L'aumento esponenziale della conoscenza porta alla “preveggenza” e dalla somma delle parti si può comprendere il tutto; ma solo l’uomo può formulare delle ipotesi.

Chi meglio di altri riuscirà ad estrapolare e plasmare questa enorme quantità di dati a disposizione avrà un posto

privilegiato nel mercato di domani.

CONCLUSIONI

Page 42: Cloud e big data

SITOGRAFIA• http://it.wikipedia.org/wiki/Big_data• http://blog.debiase.com/2013/05/che-cosa-pensereste-se-vi-

dicessero-che-in-italia-i-big-data-non-esistono/• http://www.beantech.it/blog/articoli/big-data-cosa-sono-e-

loro-utilizzo/• http://www.lescienze.it/news/2014/03/10/news/

privacy_big_data_crittografia_raccolta_dati-2044533/• http://www.linkiesta.it/cosa-fare-dei-big-data• http://www.rainews.it/dl/rainews/articoli/data-scientist-il-

lavoro-sexy-50712477-5a83-4682-8f73-522428eb3281.html