Upload
manuel-boscolo
View
452
Download
2
Embed Size (px)
DESCRIPTION
Cloud & Big Data
Citation preview
CLOUD & BIG DATA
Diapositive a cura di: Lorenzo Nardo e Manuel Boscolo
CLOUD ALLA RISCOSSA!Negli ultimi anni tutte le maggiori aziende, i social network e il mobile per una maggiore praticità e risparmio di risorse proprie, si affidano ai servizi di Cloud Computing. Ed ormai tutto ciòche carichiamo nel web viene assorbito nella nuvola.
CLOUD BIG DATALa simbiosi di Big Data e Cloud Computing è inequivocabile, i dati e tutti i contenuti sensibili per le esigenze di chi ne richiede l’analisi oramai sono pressochè interamente ospitate nella nuvola che ora ha un valore inestimabile.
CLOUD COMPUTING
CLOUD COMPUTING
Cloud computing: è un insieme di tecnologie informatiche che permettono l'utilizzo di risorse, i data service e le funzionalità offerte in remoto.
CARATTERISTICHE CHIAVE
On-demand self-service
Broad network access
Resource pooling
Rapid elasticity
Measured Service
Il consumatore può unilateralmente disporre di capacità di calcolo.Le risorse di calcolo sono messe al servizio di tutti i consumatori.I Sistemi Cloud automaticamente controllano e ottimizzano le risorse.Le capacità sono disponibili in rete e sono accessibili tramite meccanismi standard.Le risorse possono essere rapidamente ed elasticamente incrementate per scalare la potenza e rapidamente ed elasticamente liberate per rilasciarla.
TRE ATTORI PRINCIPALI• Fornitore di servizi (il provider): offre servizi (server
virtuali, storage, applicazioni complete) generalmente secondo un modello "pay-per-use“ o free.
• Cliente amministratore: sceglie e configura i servizi offerti dal fornitore, generalmente offrendo un valore aggiunto come ad esempio applicazioni software.
• Cliente finale: utilizza i servizi opportunamente configurati dal cliente amministratore.
(In determinati casi d'uso il cliente amministratore e il cliente finale possono coincidere)
3 LIVELLI DI SERVIZI
Application
Platform
Infrastructure
SaaS (Software as a Service)
PaaS (Platform as a Service)
Iaas (Infrastructure as a Service)
I PRINCIPALI PLAYER
VANTAGGI vs
SVANTAGGI
VANTAGGI PER L’UTENTE• Nessun software da scaricare e installare sul proprio
computer.• Non si deve acquistare una licenza software. Ci si abbona
al servizio, che spesso è gratuito.• Nessuna necessità di upgrade del software quando
vengono aggiunte nuove funzioni o eliminati problemi esistenti.• Si può accedere ai propri documenti da ogni computer
connesso in rete.• È possibile condividere i documenti con altri utenti, senza
bisogno di un proprio server• Nessun problema in caso di crash del proprio computer: i documenti sono al sicuro sul server.
SVANTAGGI PER L’UTENTE• È necessaria una connessione internet con banda adeguata.
• Data security, tutti i dati risiedono su un server remoto, di cui non si ha il controllo (anche se si possono effettuare regolari
backup).
• Data privacy, i dati sono visibili ed utilizzabili da terzi che non sempre agisco in buona fede.
• Completezza funzionale. Attualmente, le funzioni fornite dalle applicazioni “cloud” sono meno complete di quelle fornite dai software tradizionali.
• Non è agevole lavorare off-line, per ricevere e trasmettere le modifiche occorre essere connessi.
VANTAGGI PER LE AZIENDEriduzione dei costi
• Eliminazione/riduzione delle infrastrutture software/hardware e dei costi del personale per la gestione dei sistemi.
• Riduzione/eliminazione dei costi fissi • Scalabilità dei servizi, tutto quello che serve, quando
serve, solo se serve.
• Costi “pay-per-use”
VANTAGGI PER LE AZIENDE
Taglio costi fissi
Es. scalabilità
migliori servizi
• Servizi sviluppati e gestiti dai migliori professionisti, con le migliori competenze.
• Servizi sempre aggiornati e in continua evoluzione.
• Servizi altamente flessibili.
VANTAGGI PER LE AZIENDE
SVANTAGGI PER LE AZIENDE• I dati risiedono su un server remoto, di cui si ha
scarso controllo, ne conseguono possibili problemi d’integrità dei dati. (es. caso Amazon)
• Più alto rischio di furto di dati e informazioni, non sempre tutelata della privacy. (es. Playstation Network)
• Servizi standardizzati, non sempre soddisfano a pieno le esigenze aziendali.
• Non è agevole lavorare off-line, per ricevere e trasmettere le modifiche occorre essere connessi.
IN FUTURO…
OBIETTIVI e SFIDE PER IL FUTURO• Incremento dei sistemi di sicurezza per la tutela
della privacy e per la salvaguardia dei dati.• Incremento delle collaborazioni tra le diverse
aziende fornitrici di servizi “Cloud”. • Incremento dei servizi in termini di quantità e
qualità (velocità, affidabilità, grado di personalizzazione).
• Crescita di nuove competenze.• Stabilire “regole” e “codici” comuni, adottabili
tra i diversi produttori.
CONCETTI DI BASE
“BIG DATA”
Definizione:
Big data è il termine per descrivere una raccolta di dataset così grande e complessa da richiedere strumenti differenti da quelli tradizionali, in tutte le fasi del processo: dall‘acquisizione, alla curation, passando per condivisione, analisi e visualizzazione.
Da Wikipedia, l'enciclopedia libera.
Terminologia• Un dataset (o data set) è una collezione
di dati.• Il Datacenter o Centro Elaborazione
Dati (CED) è l'unità organizzativa che coordina e mantiene le
apparecchiature ed i servizi di gestione dei dati.
Terminologia• Data curation: è la gestione dei dati al fine di
scoprire, recuperare, mantenere, aggiungere valore, permettere il riutilizzo dei dati, garantendone contemporaneamente l'autenticazione, l'archiviazione, la gestione e la preservazione.
A COSA SERVONO?
Perché utilizzare i Big Data?Il motivo principale è la possibilità di effettuare Business Analytics in contesti dove oggi non sarebbe possibile o lo sarebbe con tempi e costi inaccettabili.
Si pensi poi a Facebook, Linkedin, Twitter:
alcune tecnologie Big Data si sono sviluppate
proprio in ambito social network.
E il motivo è piuttosto evidente, visto che i Big Data applicati ai
social mettono nelle mani dei dipartimenti marketing potenti strumenti di analisi
su potenziali clienti finali.
Ambiti di utilizzo
• Sicurezza (lotta alla criminalità, prevenzione di disastri).
• Scienza (meteorologia, medicina).• Tecniche di marketing (individuazione dei
trend di vendita in particolari contesti).• Rilevazioni real-time (monitoraggi di sistemi
complessi).
ANALISI DEI BIG DATA
Una crescita esponenziale
L’utilizzo sempre più diffuso dei social media, e degli smartphones che raccolgono e generano dati costantemente, il crescente uso di Internet, così come l’utilizzo di sensori che misurano e monitorano ogni cosa, fa sì che il volume dei dati prodotti in tutto il mondo stia crescendo in modo vertiginoso.
Il 90% dei dati oggi esistenti sono stati generati negli ultimi 2 anni. Il ritmo con cui queste informazioni sono prodotte è talmente alto che ogni due giorni è creato un volume di dati pari alla quantità di informazioni generate dall’umanità intera fino al 2003.
Paradigma delle “V”
• VOLUME : quantità dei dati trattati• VELOCITA’ : l’estrazione di queste informazioni deve avvenire
velocemente, i dati devono essere utilizzabili prima che diventino inutili
• VARIETA’: i dati da trattare sono ETEROGENEI (testo, video, ricerche web, transazioni finanziarie, pagamenti con carta di credito, etc.)
• VARIABILITA’: (Valore/Veridicità) occorre contestualizzare il dato (da che ambito proviene? è indispensabile filtrarlo oppure no?)
• VIRALITA’: i Big Data stanno crescendo in maniera esponenziale nella rete e si espandono come un vero e proprio virus.
BIG DATA & PRIVACY
BIG DATA & PRIVACYEnormi banche dati, che possono anche essere
istituzionali, raccolgono un’infinità di dati sensibili che riguardano gli utenti della rete.
La semplice trasformazione in forma anonima delle informazioni raccolte non garantisce la loro protezione quando vengono elaborate, sono quindi allo studio sistemi alternativi.
Questi sistemi alternativi in genere fanno riferimento alla cosiddetta crittografia omomorfica che consente di eseguire calcoli su dati cifrati senza prima decrittarli.
La IBM sostiene chel'informatico Craig Gentry aveva sviluppato un sistema pratico, completamente omomorfico, già nel 2009, ma i critici hanno detto che la tecnologia era troppo complessa, lenta e poco pratica per un uso
effettivo sul cloud. Siamo quindi ancora in attesa…
BIG DATA & PRIVACY
BIG DATA & PRIVACYA volte, infatti, le informazione possono trapelare ed
essere usate al di fuori del loro ambito specifico come nello scandalo denominato “Datagate”…
Vedi : http://it.wikipedia.org/wiki/Datagate
SCENARI
CHI SFRUTTA I BIG DATA?Si può cominciare a parlare di Big Data quando la mole di dati
presa in considerazione è nell’ordine degli Zettabyte (miliardi di Terabyte).
Da considerare sono anche le agenzie governative come l’NSA(National Security Agency).
Ambito italianoIn Italia, quando si parla di “Big Data”, in realtà si
intendono Business Intelligence e Data Mining, data la ridotta quantità di dati da analizzare.
Esempi:• L’ultima edizione di Sanremo, 150 mila tweet durante la finale; un
volume che può essere racchiuso in 77 MB (Foglio Excel)• Analisi politiche sui tweet del corpo elettorale italiano (3,5M di italiani
hanno utilizzato Twitter durante la campagna elettorale) svolte con strumenti tradizionali.
IL FUTURO DEI BIG DATA
CONCLUSIONI
La grande sfida, per le aziende che stanno investendo sui big data, sembra essere la
• capacità di formulare domande intelligenti e• concorrere alla nascita di competenze in
grado di gestire le risposte.
La figura del data scientist sarà centrale nei prossimi anni.Sia matematico che Informatico, deve capire di statistica, saper usare un foglio excel ed aiutare l’azienda per la quale lavora a interpretare il presente per prevedere il
prossimo futuro. Non è una figura mistica ma un nuovo professionista, lo“scienziato dei dati”.
CONCLUSIONI
L'aumento esponenziale della conoscenza porta alla “preveggenza” e dalla somma delle parti si può comprendere il tutto; ma solo l’uomo può formulare delle ipotesi.
Chi meglio di altri riuscirà ad estrapolare e plasmare questa enorme quantità di dati a disposizione avrà un posto
privilegiato nel mercato di domani.
CONCLUSIONI
SITOGRAFIA• http://it.wikipedia.org/wiki/Big_data• http://blog.debiase.com/2013/05/che-cosa-pensereste-se-vi-
dicessero-che-in-italia-i-big-data-non-esistono/• http://www.beantech.it/blog/articoli/big-data-cosa-sono-e-
loro-utilizzo/• http://www.lescienze.it/news/2014/03/10/news/
privacy_big_data_crittografia_raccolta_dati-2044533/• http://www.linkiesta.it/cosa-fare-dei-big-data• http://www.rainews.it/dl/rainews/articoli/data-scientist-il-
lavoro-sexy-50712477-5a83-4682-8f73-522428eb3281.html