Se aspettiamo gli Open Data buoni non li avremo mai

Giorni fa sono mi sono trovato in mezzo a in una conversazione via email in cui Tizio, rispondendo a Caio che chiedeva come muoversi per stimolare il suo Comune a produrre Open Data ha detto più o meno:

Prima di tutto non pubblicare come Open Data dati effettivamente liberi, ma comunque inutilizzabili perché contenenti errori, o sfilze di codici senza legenda e significato. Non pubblicare semplici copie grezze, senza struttura o contesto, dei database esistenti. Rendere i dati disponibili significa rendere chiari anche i relativi metadati! Se scarico un set di dati e non riesco a capirne il significato a che serve?

La mia personalissima risposta a obiezioni di questo genere è che sì, è tutto vero, e in senso stretto per Open Data si intendono solo dati con quante più stelle possibile su questa scala internazionale.

Però certi discorsi fanno il paio con “negli Open Data il “come” è tutto” e sarebbe ora di buttarli, o almeno di ridimensionarli seriamente: nell’Italia di oggi, pretendere o aspettare che i dati di una qualsiasi Pubblica Amministrazione siano “davvero pronti” per rilasciarli senza rischi del genere è un’ottima scusa per non fare NULLA, MAI. È come dire a un archeologo “se scavando trovi una stele sumera senza dizionario allegato non perdere tempo, lasciala sottoterra”.

È ovvio che oggi in Italia (ma il resto del mondo mica sta tanto meglio, in generale!) gran parte dei dati, quand’anche esistano, sono lontanissimi dalle 5 stellette di quella classifica (che non c’entrano nulla col Movimento 5 Stelle, tant’è che loro in generale si fanno un dovere di ignorare completamente l’argomento. Aprire quello che c’è, anche solo mettendolo online con la licenza giusta è quindi un passo necessario per arrivare lì.

Idem per la qualità e correttezza intrinseca dei dati, cioè completezza, precisione eccetera. Uno degli scopi degli Open Data è proprio facilitare la scoperta dei dati che non vanno bene, per arrivare prima al loro miglioramento, anche (anzi possibilmente) da parte di altri. Tanto di cappello a chi pubblica online subito quello che ha, per quanto “brutto”, se lo fa con la licenza giusta. Perché se non si parte da lì, cosa si migliora E CHI lo fa (quando è un altro discorso), se la PA non ha un Euro che è uno?

Se si pubblicano colonne “incomprensibili” ma con la licenza giusta, poi chiunque potrà chiedere cosa sono quelle colonne, o scoprirlo da sè in qualche modo, e poi pubblicare legalmente il risultato, sempre con quella licenza. E da zero stellette sei passato a una, poi si potrà passare a due eccetera.

Mentre se dici i dati li voglio aperti e aperti davvero, non mi date roba inutilizzabile… teoricamente hai ragione, in pratica morirai gonfio nell’attesa, come si dice a Roma, e ti starà bene.

Perché con l’aria che tira l’unica cosa che puoi sperare nel breve termine dal 99% delle PA italiane con i fondi e le risorse digitali che hanno è che ti si levino di torno senza spendere, pubblicando quel che c’è. Chi lo fa o lo fa fare è bravo e (a meno che non li chiami “Open Data a tutti gli effetti” e si senta “arrivato”!) ha ragione a esserne contento.