View
1.882
Download
0
Category
Preview:
DESCRIPTION
Accesso e analisi di Open Data: come gestire l'anarchia dei formati
Citation preview
Accesso e analisi di Open Data: come gestire l’anarchia dei formati
Matteo Picozzipicozzi@elet.polimi.it
home.dei.polimi.it/picozziPhD Student
Politecnico di MilanoDipartimento di Elettronica e
Informazione
Eugenio Minardieugenio.minardi@gmail.com
Web DeveloperWellnet S.r.l.
Diego Bancherodbanchero@wellnet.it
PM / AnalistaWellnet S.r.l.
domenica 25 marzo 12
• Acquisizione Dati• Reasoning• Visualizzazioni
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }
2
Agenda
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Open Government• Insieme di linee guida date dal
governo americano• definizione di Open Data:
– indipendente dalla piattaforma– disponibile al pubblico– riutilizzabile– elaborabile da dispositivi automatici
3domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }I dati aperti• Abbiamo i dati aperti, questi sono i formati più
comunemente a disposizione• Ci troviamo elenchi interminabili di numeri e
termini• sono disponibili ma NON necessariamente
fruibili dal pubblico• Sono difficili da correlare perché non strutturati
e non solo...
4
CSV
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Come rendere fruibili i dati?• Esporre i dati in un formato più ricco:
– Necessita di maggior lavoro da parte di chi espone– Implica l’uso di piattaforme specifiche
• Arricchire il formato non strutturato– Prevede strumenti di annotazione, filtri e semantica– Richiede forte intervento manuale
5domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }• Selezione delle colonne di interesse• Annotazione con meta dati• Selezione del tipo (non solo primitivo)• Eventuali suggerimenti sulla
presentazione del dato• Esportazione dei dati in un formato
riusabile da elaboratori
6
Arricchire il formato tabellare
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Il nostro strumento
7
Estratto della tabella
Selezione Colonne
Annotazione Colonne
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Mashup per Open Data
8
Mashup Framework
Binding Controller
Composition Controller
Event Handler
Data Manager
Data Proxy
mQuery Dispatcher
mQuery Interpreter
Result Set Formatter
Sources registry
Reasoner
Client
SPARQL
Web UI
ComponentsUI View Controller
RDF
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }DEMO
9domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }L’importanza delle Visualizzazioni
10
Visualization of data makes it possible for researchers, analysts, engineers, and the
lay audience to obtain insight in these data in an efficient and effective way,
thanks to the unique capabilities of the human
visual system, which enables us to detect interesting features and patterns in
short time.(Jarke J. van Wijk, The Value of
Visualization, Visualization 2005)
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Visualizzare Open Data• Gli Open Data sono dati “grezzi”• Perché siano veramente utilizzabili da un
essere umano è necessario:– mostrarli in un formato human-readable– fornire visualizzazioni che ne aiutino la
comprensione– poterli arricchire e confrontare con altre fonti– poterli aggregare
11domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Mashup e Open Data• Gli Open Data vengono messi a disposizione perché
altri utenti possano:– analizzarli– riusarli– creare valore a partire dalle informazioni contenute in essi
• I mashup sono un valido strumento per semplificare questo processo di integrazione di Open Data con sorgenti, servizi ed API pubbliche o private, proprietarie o di terze parti
12domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Mashup
• Sui tre layer applicativi (data, logic e presentation)• Applicazioni Web, recentemente anche mobile• Termine spesso abusato, i mashup che si possono
trovare in giro non esprimono al massimo le potenzialità del paradigma di composizione
13
I mashup sono applicazioni che combinano, integrano e sincronizzano dati, funzionalità e visualizzazioni di più sorgenti dati, servizi o Web API
def mashup =
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
http://www.housingmaps.com
14domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Pro e controFacile da sviluppare per chi conosce le tecnologie giusteAlto riuso del codiceModulareFlessibileArricchisce i dati di una sorgente con dati di un’altra sorgente senza dover integrare le diverse sorgentiMigliora l’esperienza degli utenti
15
SituazionaleVerticalePoco investimento di tempo da parte degli sviluppatoriFunzionalità limitateSpesso non si adatta a diversi scenariUn utente generico non è in grado di sviluppare un proprio mashup
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Mashup 2.0• Gli utenti sono protagonisti del Web 2.0
– Producono contenuti– Sono abituati ad usare strumenti lightweight per produrli
• Vedendo un mashup vorrebbero poterlo modificare ed adattare alle proprie esigenze ma non ne hanno le capacità
• Per questo sono nati diversi tool per la creazione facilitata di mashup (per esempio Yahoo! Pipes)
16domenica 25 marzo 12
• Visualizzazioni– grafiche– tabellari– tree map– UI Component (per
es. Google Maps)• Possibilità di
aggiungere grafici e di sincronizzarli tra loro
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Strumenti per l’End User Development
17
DashMash
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Strumenti per l’End User Development
• Composizione a livello di presentazione
• Crazione di mashup basata su linguaggio visuale
• Orientato agli utenti finali
18
PEUDOM
domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Conclusioni• Uno degli scopi per cui esistono gli Open Data è proprio quello di favorire la cultura della
partecipazione• Open Data hanno grandissime potenzialità
– tecnologiche– sociali (cooperazione)
• Limiti di Open Data– scarso numero di fonti– difficoltà nel reperimento– soprattutto in formati destrutturati– non utilizzabili per il calcolo automatico– senza visualizzazioni
• I destinatari di Open Data sono gli utenti finali– hanno diversi background e competenze– possono generare valore a partire da essi
• Necessità di strumenti che aiutino gli utenti finali ad utilizzare gli Open Data
19domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Work in Progress• Acquisizione dei dati da fonti eterogenee• Conciliazione ed omogeneizzazione dei dati• Ragionamento sui dati• Knowledge Discovery• Visualizzazioni complesse• Aggregazioni, Correlazioni e Mashup• Esposizione dei dati importati
20domenica 25 marzo 12
Diego Banchero, Eugenio Minardi, Matteo Picozzidbanchero@wellnet.it, eugenio.minardi@gmail.com, picozzi@elet.polimi.it
Wellnet S.r.l. e Politecnico di Milano - DEI
{ }Domande
21domenica 25 marzo 12
Recommended