Tentazioni e rischi legali, tecnici e politici per le Pubbliche Amministrazioni che si preparano ad aprire i loro dati

(Paywall-free popularization like this is what I do for a living. To support me, see the end of this post)

questa pagina è la parte centrale di questo articolo

Breve nota sui formati di file più adatti per la pubblicazione di dati pubblici

Senza entrare in dettagli tecnici, che sono comunque discussi più in dettaglio nel rapporto ODOS, è necessario ricordare che i dati pubblici sono davvero aperti soltanto se vengono pubblicati in formati effettivamente aperti e analizzabili automaticamente. Nel caso dei documenti da ufficio (testi, fogli elettronici e presentazioni) questo significa usare varianti di XML come OpenDocument (standard ISO/IEC 26300). In altri casi sono più adatti formati come RDF.

Quello che è importante evidenziare in questa sede, perchè spesso è un problema più culturale che tecnico, è che la pubblicazione online in formato PDF, tanto comune fra Amministrazioni ed Enti Pubblici di qualunque tipo, non è affatto una soluzione adeguata. Il formato PDF, essendo una mera fotografia della parte stampabile di un documento, non facilita affatto quelle analisi automatiche o manuali la cui necessità è una delle giustificazioni più importanti per l’apertura dei dati.

Per capire la profonda differenza basta un semplice esempio: un bilancio pubblicato come file PDF anzichè come il foglio elettronico che era in origine (in formato .xls o, meglio, .ods) non contiene più le formule che generano certi numeri a partire da altri. Di conseguenza, valutare la correttezza di quel bilancio a partire dalla sua sola versione PDF è enormemente più complicato. A parte alcune eccezioni, come le scansioni di documenti cartacei firmati, pubblicare dati in formato PDF è quindi accettabile come soluzione temporanea, non come prassi normale.

Preoccupazioni sulla qualità dei dati

Il primo ostacolo da superare è senz’altro, anche se contraddice parzialmente quanto scritto nel paragrafo precedente, quello di preoccuparsi a tal punto della qualità dei dati che è possibile pubblicare subito, dal rinunciare a farlo.

Diversi studi approfonditi (citati in ODOS) concordano nel raccomandare esplicitamente agli Enti Pubblici di rendere disponibili i loro dati non appena potrebbero essere utili ad aziende e cittadini, anche se sono considerati incompleti, privi di errori e formattati a regola d’arte. In pratica, questo significa “pubblicare prima possibile, senza preoccuparsi troppo della qualità”.

La motivazione più importante di questo consiglio sta nel fatto che i dati grezzi sono come mattoni, con cui si può possono costruire anche edifici inconcepibili per il fabbricante dei mattoni stessi, o come suolo fertile, su cui possono crescere anche piante utilissime ma sconosciute al proprietario del terreno: chi produce dati non può, per definizione, sapere in anticipo quali saranno tutti i loro possibili usi, proprio come chi produce mattoni. La conseguenza è che, molto spesso, nemmeno chi produce dati ha davvero a disposizione tutte le informazioni necessarie per giudicare se i dati stessi sono “pronti” per essere pubblicati e se potrebbero già essere utili a qualcuno.

Al contrario, la pubblicazione online prima possibile facilita il miglioramento graduale dei dati nel tempo (e di tutti i servizi che su essi vengono costruiti!), per non dire che lo rende automatico e inevitabile. Questo avviene proprio perchè pubblicando presto aumenta moltissimo il numero di coloro che possono individuare difetti e omissioni, cioè collaborare con le PA per migliorare i dati. Volontariamente e gratuitamente.

Tentazione di decidere sui dati con analisi tradizionali di business case

Le considerazioni appena esposte sulla natura dei dati sono alla base anche di un altro consiglio pratico: meglio evitare di cercare giustificazioni o autorizzazioni all’apertura dei dati tentando di costruire un business case tradizionale.

Su questo argomento Zijlstra ha scritto: “C’è una lunga storia di business case usati, abusandone, come scuse per fermare il cambiamento: le analisi da business case vanno bene quando bisogna scegliere fra due sole alternative, per ognuna delle quali sono già noti in anticipo tutti i possibili costi e conseguenze, e quando quei costi e conseguenze avverranno tutti all’interno della stessa organizzazione che sta analizzando il business case."

Quando si parla di dati aperti invece, secondo molti esperti, è molto difficile, se non impossibile in alcuni casi, quantificare in anticipo i benefici economici dell’apertura dei dati, proprio perché i dati sono come il suolo agricolo o come i mattoni.

Un altro motivo per cui i business case in questo ambito possono essere fuorvianti è che rendono più visibili costi che con l’apertura c’entrano poco o niente ma che andrebbero sostenuti comunque, per tutt’altre ragioni. L’uso di formati di file aperti per i documenti pubblici, ad esempio, è già previsto dalla legge in diversi paesi dell’UE, quindi è un costo che prima o poi va pagato, indipendentemente dalla pubblicazione online dei documenti stessi.

Tentazione di ricostruire da zero, in casa, strumenti per la gestione dei dati già disponibili online

Altre esperienze di successo in Europa, come quella del Datastore di Londra hanno evidenziato altri criteri da seguire per ottenere i massimi benefici dall’apertura dei dati pubblici. Uno è non sprecare mai per aprire i dati risorse interne tecniche, umane o finanziarie, in progetti, consulenze e nuovi siti Web a meno che non sia assolutamente necessario. Nuovi portali pubblici costosi e pieni di funzioni sofisticate per l’analisi dei dati possono essere utili, ma raramente sono indispensabili e comunque quasi mai sono sufficienti, sempre perchè i dati sono come mattoni di cui è impossibile prevedere tutti i possibili usi. Come provano i numerosi esempi contenuti nel rapporto ODOS, pubblicare online i dati grezzi su siti già esistenti basta, in molti casi, a stimolare le comunità nazionali e locali di attivisti, aziende e organizzazioni non-profit a rielaborarli, combinarli e ripubblicarli online (a loro spese!) nei modi che corrispondono alle esigenze effettive di quelle comunità. L’unica accortezza da seguire è fare in modo che i dati pubblicati originariamente dalle PA siano visibili ai motori di ricerca e scaricabili anche automaticamente.

Who writes this, why, and how to help

I am Marco Fioretti, tech writer and aspiring polymath doing human-digital research and popularization.
I do it because YOUR civil rights and the quality of YOUR life depend every year more on how software is used AROUND you.

To this end, I have already shared more than a million words on this blog, without any paywall or user tracking, and am sharing the next million through a newsletter, also without any paywall.

The more direct support I get, the more I can continue to inform for free parents, teachers, decision makers, and everybody else who should know more stuff like this. You can support me with paid subscriptions to my newsletter, donations via PayPal (mfioretti@nexaima.net) or LiberaPay, or in any of the other ways listed here.THANKS for your support!

« Riflessioni su alcuni problemi giuridici, tecnici e gestionali per le Pubbliche Amministrazioni che si prepararano ad aprire i loro dati Dati pubblici, un grosso impegno organizzativo e culturale per le PA e per i loro dipendenti »

Stop a Zona-M