Upload
federico-morando
View
331
Download
0
Embed Size (px)
Citation preview
Public Sector Information / Open Dataopportunità e sfide
i Venerdì dell’AGCOM
Federico Morando([email protected])
NEXA Center for Internet & Society, Politecnico di Torino(http://nexa.polito.it)
Roma, 23 Settembre 2011
Questa presentazione è rilasciata con licenza Creative Commons Attribuzione Italia 3.0 (http://creativecommons.org/licenses/by/3.0/it/)
Agenda
● PSI / open data: di cosa stiamo parlando?
● potenziale economico● il tempo è denaro
● trasparenza & efficienza
● principi e linee guida● diritto (normativa, licenze, tutela dei dati personali);
● economia (costo marginale, costi di transazione);
● tecnologia (raw data, accenno ai linked data).
● in pratica● le principali esperienze internazionali e nazionali.
● i protagonisti del processo di apertura in Italia
● conclusioni● punti fermi (“Raw data now!”)
● sfide per il futuro
<open data: di cosa stiamo parlando?>
Mashups
● Mapumental: trovare casa (v. 3.0)● prezzi case
– Land Registry for England and Wales
● tempi di viaggio– National Public Transport Data Repository
● Mappe– OpenStreetMap (UGC + PSI)
● "amenità"– mySociety > game ScenicOrNot (UGC)
www.mysociety.org
Documenti UE traduttori→
punto chiave:queste applicazioni non le fa il pubblico
i dati pubblici sono “solo” un'infrastruttura abilitante per riusi da parte dei privati
(for profit o meno)
</open data: di cosa stiamo parlando?>
<potenziale economico>
valore economico direttomercati già affermati
● dati catastali● dati camerali● dati meteorologici● dati geografici● dati normativi e giurisprudenziali
valore economico direttomercati nascenti/potenziali
<il tempo è denaro>
PA: tanti punti di forza...
● le PA detengono dati di grande utilità● uniche fonti di alcuni;● qualità superiore
– affidabilità– imparzialità– completezza– raccolta nel lungo periodo
● es. orari di apertura di negozi, farmacie, uffici pubblici, etc.
...e qualche debolezza
● normalmente, le PA non sono i soggetti più capaci di far arrivare questi dati ai cittadini (o alle imprese) in modo efficace● limiti normativi e regolamentari● limiti di risorse (€, tempo)
✔ l'intelligenza è sempre là fuori✔ vale per Google o Microsoft come per la PA➔ creare occasioni di incontro!
es. orari & percorsi trasporti
● GoogleMaps, OpenStreetMap, mashups● facile da trovare ed usare per chiunque
– es., turisti stranieri interfaccia tradotta↔
● applicazioni per iPhone, Android, etc.● la PA non spende per N sviluppi
– (così evitando sospetti di favori mirati a Apple, Google...) ● incamera tasse sui profitti sviluppatori
fare di più spendendo meno:possibile ? !
fare di più spendendo meno:possibile ? !
● dati online, come servizio● site scraping apps per iPhone & Android→
● dati a disposizione di Google● GoogleMaps
● stessi dati, grezzi, a disposizione di tutti● miglioramento delle apps + varie applicazioni per
TorinoOpenDataContest
</il tempo è denaro>
diamo i numeri
● studi internazinali sul valore potenziale PSI (diretto)● Pira: $750 bln US vs. €68 bln EU● MEPSIR: € 27 bln EU● UK OFT: £ 600 mln UK
● valori (forse più realistici) rivisti da Dialogic● ~ €5 bln EU● ma con effetti indiretti, si ripropongono € 30 bln
✔ il bello è che non credere a stime faraoniche➔ portali nazionali europei hanno costi ragionevoli
• voci di corridoio: (150.000, 300.000) € + vari costi indiretti per partire
➔ si possono fare anche progetti a costo ~0
potenziale economico indiretto
● concorrenza
● legalità (“rule of law”)
<trasparenza & efficienza>
trasparenza
● “No taxation without representation”➔ “No taxation without
Web publication”– UK, Grecia...
www.wheredoesmymoneygo.org
FarmSubsidy.org
Source:http://www.bbc.co.uk/news/health11831159
ma la trasparenza non è “solo” partecipazione e controllo democratico sulla spesa..
Operazione trasparenza 2.0
● esempio (& suggerimento)● pubblicare informazioni relative a contratti, fornitori, bandi, etc.
– meno problemi di privacy (rispetto ai CV dell'Operazione trasparenza)
● immaginate che tutti i produttori sappiano in tempo reale quali PA comprano beni & servizi simili a quelli che offrono● dalle matite alla manutenzione degli orologi...
● immaginate che tutti quelli che cercano un lavoro sappiano esattamente quali bandi siano aperti● magari con informazioni sui profili simili al loro
Operazione trasparenza 2.0
● non parliamo di un superservizio della PA!
● pubblichiamo i dati● tabelle (CSV, XLS) o dati strutturati (XML, RDF)
● qualcuno vedrà l'opportunità di business● es. VoglioIlRuolo
– graduatorie per i posti di ruolo nella scuola
</trasparenza & efficienza></potenziale economico>
<principi e linee guida>
ovvero:cosa serve per fare
le cose che abbiamo discusso?
principi
● partire da cose semplici● es. no dati personali (salvo si abbiano consultenti legali super
esperti che danno l'OK tranquillamente e sicuramente)● es. no dati attualmente usati come mezzo cruciale per finanziare
istituzioni (es. Camere di Commercio)
● raw data● nella forma in cui li si usa
– XML, RDF... fantastico, ma può essere un passo successivo
– NO (solo) PDF
● licenze aperte esplicitare la libertà di riuso→
● libere anche per riuso commerciale
paure standard
● “vizi” tipici della PA “di buona volontà”,in ordine decrescente di gravità:● divieto di uso commerciale● obbligo di registrazione● obbligo di contribuzione (delle correzioni)● obbligo di attribuzione (citazione della fonte)
il profitto non è male!
● pochi hanno da ridire su progetti come OpenStreetMaps● esempio di Haiti e mappe per i soccorritori
● non sempre così per i progetti “for profit”● “arricchimento” con risorse pubbliche● “perdita di risorse” per la PA, se non si “spremono”
prezzi significativi
tesi (in pillole)
non è il profitto di qualcuno a dover far paura,ma il profitto di uno solo
la giusta cautela rispetto agli usi commerciali è che tutti possano accedere alla pari alla PSI per
fare business
obbligo di registrazione: perché?
● perché gli utenti dovrebbero registrarsi per scaricare e riusare i dati?● non per prevenire abusi dolosi
– tipicamente, chi volesse compierli non avrebbe difficoltà ad aggirare la registrazione (salvo sia così complicata che il costo salirebbe troppo anche per gli onesti)
● non per avvisare di errori e correzioni
– chi riusa davvero i dati, torna spesso alla fonte per aggiornarli
● non per monitorare il riuso
– quando si registra, il riutilizzatore non sa ancora se e come riuserà e non vuole perder tempo
● meglio dare incentivi per segnalare ex post i casi di riuso● es.: segnala la tua app; racconta la tua storia
● importante beneficio: dati accessibili nel “surface web”, non nel “deep web” motori di ricerca↔
obbligo di contribuzione delle modifiche (e/o sharealike)
● se non c'è redistribuzione, obbligo astratto e di difficile enforcement
● se c'è redistribuzione, il modello sperimentato è quello dello “share alike”● ma serve ad evitare il “free riding” su nuove creazioni e può
inibire non pochi usi commerciali– val la pena per informazioni già create per altri scopi dalla PA?
● nell'etica del web, questo è un tipico caso da “inviti informali”● condivido liberamente e ti chiedo di aiutarmi, se ti costa poco e
puoi far sì che io ti dia un servizio migliore
attribuzione: il peccato veniale
● probabilmente, sarebbe meglio non pretenderla, ma “raccomandarla” semplicemente● in alcuni contesti tecnologici, ha un costo
(specie se si impongono certe modalità)● dove il costo è basso, spesso ci sarebbe comunque
interesse a citare la fonte– credibilità; completezza
● l'attribuzione può, però, avere un ritorno positivo sugli incentivi di chi facilita il riuso● carriera, visibilità sostenibilità politica, soddisfazione↔
● il bilancio è più incerto...
<diritto>
<normativa>
EU: Direttiva PSI – 2003/98/CE
IT: Decreto Legislativo 36/2006 (& L. 96/2010)
linee guida piemontesiDGR 3111679 del giugno 2009
DGR 361109 del novembre 2010(legge regionale già in bozza)
delibere comunali
</normativa>
<licenze>
favore per le licenze standard
importanti per ridurre i costi di transazione
Creative Commons
(Open Data Commons)
[Altre licenze, es. IODL]
¡disclosure: sono membro di CCItalia!
struttura modulare
AttribuzioneAttribuzione
Non Non CommercialeCommerciale
Non Non OpereOpere DerivateDerivate
Condividi allo stesso modoCondividi allo stesso modo
Le Licenze Creative Commons
6 combinazioni possibili6 combinazioni possibili
Attribuzione Non commerciale Non opere derivate
Attribuzione Non commerciale Condividi allo stesso modo
Attribuzione Non commerciale
Attribuzione Non opere derivate
Attribuzione Condividi allo stesso modo
Attribuzione
Le Licenze Creative Commons
solo alcune OK per PSIsolo alcune OK per PSI
Attribuzione Non commerciale Non opere derivate
Attribuzione Non commerciale Condividi allo stesso modo
Attribuzione Non commerciale
Attribuzione Non opere derivate
Attribuzione Condividi allo stesso modo
Attribuzione
Pubblico Dominio
alcuni intangible sono nel PD “per legge”● le opere del passato (es. Dante o Manzoni)● le “idee”, che restano “libere come l'aria”● le libere utilizzazioni (es. citazione)
● altre possono entrarvi “per scelta”● Creative Commons Zero
e altre liberatorie/dediche al PD
liberi tutti: CC0
● rinunciare a tutti i diritti d’autore e connessi (inclusi quelli sulle banche di dati) su un’opera● in ogni caso, allentare il più possibile i legami
giuridici con quell’opera
● waiver of rigths: rinuncia ad ogni diritto● in subordine, licenza gratuita ed irrevocabile● in subordine, impegno a non esercitare i diritti
rimasti in capo al detentore
licenze comprensibili per computer: i metadati
</licenze>
<tutela dei dati personali>
hic sunt leonesla privacy rappresenta un'area delicata
finalità vs. serendipità
può essere opportuno affrontare il tema dopo aver ben avviato un progetto di apertura dei dati
anonimizzazione; aggregazione; consenso
</tutela dei dati personali>
</diritto>
<economia>
regola di base:prezzo = costo marginale ≈ 0
se ci sono tariffe:non scordarsi i costi di transazione
</economia>
<tecnologia>
le stelle di Berners Lee
★ dati sul Web, in qualsiasi formato★★ dati strutturati (es. formato Excel)★★★ formati nonproprietari/aperti (es. CSV)★★★★ URLs (stabili) per creare puntatori★★★★★ dati collegati ad altri dati per fornire un contesto
5 + Open Linked Open Data★ →
<geek mode>
“No taxation without representation”
“No taxation withoutOpen Linked Data implementation”
</geek mode>
(for the records)
● i Linked Open Data sono ancora un lusso, ma...● NO ai (soli) PDF è un must● PDF = ottimo per paper & slides
● solido come fosse scolpito nel marmo per la pubblicazione
● (in)utile come fosse un pezzo di marmo per gli sviluppatori!
● tabelle: CSV, ODS, eventualmente anche XLS
</tecnologia>
<in pratica>
c'è chi è già partito
● www.dati.piemonte.it● approccio “beta permanente”
● pubblicare subito
● continuare a piccoli passi
● cominciare dalle cose semplici● dati non sensibili
● già in digitale (magari già online, come servizi!)
● pubblicati così come le si usa internamente
● costi ridotti
● massima apertura di default (CC0)● la massima apertura è la regola...
● ...chi ha ragioni per fare diversamente, (le spieghi e) lo faccia
Piemonte – l'ecosistema● ricerca multidisciplinare
● evpsi.org– Università, Politecnico (Centro NEXA),
Fondazione Rosselli
● contatti internazionali
● Creative Commons
● Open Knowledge Foundation
● communiaproject.eu
● lapsiproject.eu
● supporto alla policy
● Centro NEXA, TopIX, CSP
● infrastruttura informativa (CSI)
● CC0 come soluzione di default,con una precisazione:
+ …esplicito riferimento al possesso dei diritti
● licenza diretta ed automatica, tramite Delibera, di tutti i dataset anonimi ed aggregati già online tramite CC0
● caso di studio sui costi di transazione(situazione passata)● 50.000 € = introiti annui da vendita geodati● costo = 1 persona full time + riunioni, etc.
c'è chi può aiutare
● “Open Data Manual” (OKFN) http://opendatamanual.org/
● “Come si fa Open Data” http://www.datagov.it/
● centri di competenza● Piemonte
– EVPSI e LAPSI (UniTO, Centro NEXA, Fondazione Rosselli)
– tavolo di lavoro regionale (Regione Piemonte, CSI, TopIX, NEXA, CSP)
● Toscana: Scuola Superiore Sant'Anna, ITTIG CNR
● Associazione Italiana per l’Open Government
● CISIS Centro di competenza Open Data
– Piemonte, EmiliaRomagna, Liguria, Lombardia, Sicilia, Toscana, Pro. Trento, Veneto...
● communities● SpaghettiOpenData.org
● IT.CKAN.NET
● LinkedOpenData.it
subito è meglio
● fermento nelle comunities & fame di dati● attivisti● sviluppatori● ricercatori
● aprire i dati ORA➔ massima visibilità
– Torino Open Data Contest (esempio passato)– APPS4ITALY (opportunità attuale!)
➔ massimo supporto (gratuito)
ricette dagli antipodi
Laurence Millar (NZ): con 3/4 di questi fattori si può avere successo:● leadership
● anche/principalmente politica
● crisi● crisi finanziaria; tagli di budget
● eroi (nel governo/amministrazione)● gente che scommetta e ci metta la faccia
● pressione da parte dei cittadini
</in pratica></principi e linee guida>
<conclusione>
l'esempio val più dei consigli
✔ abbiamo le licenze● pubblico dominio / solo attribuzione
– standard internazionali: CC0 / CC BY● Italian Open Data License v. 1.0
– riuso (anche) commerciale– compatibilità con licenze “copyleft” standard
● CC BYSA, ODC ODbL
➔ ora è prioritario dare l'esempio sui dati
dati grezzi, subito!
il passo successivo:cambiare una PA sulla base
dell'apertura dei dati e dell'interazione relativa