Rassegne stampa inutili al Comune di Roma e nel Governo. Chi paga? /img/collage_rassegne_stampa_inutili.png
Rassegne stampa inutili al Comune di Roma e nel Governo. Chi paga? /img/collage_rassegne_stampa_inutili.png

Sapete cos’è la schermata di cui vedete l’anteprima qui a fianco? È (in senso orario) un collage di:

Deprimente, vero? Ma l’esempio viene dall’alto. La stessa cosa si trova sul sito del Governo Italiano. Ecco la scansione PDF di quello stesso articolo fatta a Palazzo Chigi, anche questa probabilmente fatta a mano ma da qualcun altro, perché impaginata diversamente, ed ecco la relativa versione OCR dallo stesso sito, anche questa formattata malissimo e piena d’errori d’ortografia, cioè anche questa sicuramente ottenuta da una versione PDF. [![

Rassegne stampa inutili al Comune di Roma e nel Governo. Chi paga? /img/confronti_ocr.png
Rassegne stampa inutili al Comune di Roma e nel Governo. Chi paga? /img/confronti_ocr.png

Che ci siano state due diverse conversioni a testo indipendenti è evidente perché (vedi figura) ci sono molti errori diversi nelle due versioni OCR da esse ottenute. Tanto per fare un esempio:

Io con gli esempi mi fermo qui, potete (e dovreste!) trovarne da voi a decine, sia in quei due siti sia in tutti gli altri di tante altre Pubbliche Amministrazioni che ancora si fanno la loro rassegna stampa come un secolo fa. La situazione è chiara. In certe aziende ti fanno fare lavori così idioti e inutili solo per punizione, quando vogliono costringerti a dimetterti. Mobbing a parte, qui abbiamo almeno due persone, tutte e due pagate dai contribuenti, che ogni mattina:

  • ricevono (a caro prezzo) copie cartacee di tutti i giornali in circolazione

  • e fanno scrupolosamente il taglia e incolla (forse quello vero di una volta con forbici e coccoina, mica quello di oggi col mouse, che sarebbe molto più veloce. Ma sempre ridicolo e inutile, vedi sotto) di decine di articoli che sono quasi tutti liberamente e gratuitamente leggibili su Internet in tempo reale o quasi (nel caso dei parlamentari, anche con gli iPad ricevuti in regalo)

  • poi, dopo aver finito il taglia e incolla:

    • fanno scansioni a mano di tutti i ritaglini, se li hanno ottenuti in cartaceo

    • li passano in ogni caso al software OCR per avere versioni testuali ma piene di errori di roba che avrebbero potuto copiare direttamente da Internet

    • mettono tutto sul sito di rassegna stampa

    • (probabilmente) stampano bei libroni da distribuire in tutti gli uffici

    • (forse, se non hanno convenzioni particolari) strafregandosene del diritto d’autore.

Più o meno dovrebbe essere così che va, visto che il risultato finale sono comunque PDF e scansioni OCR di articoli leggibili direttamente via Internet.

Selezionare e organizzare, fra le migliaia che arrivano ogni giorno, le notizie più rilevanti per un particolare gruppo di utenti, rimane un’attività importantissima e necessaria. Però oggi queste cose si fanno direttamente in digitale, spendendo poco o nulla, con servizi tipo paper.li. Perché, soprattutto in un momento in cui Stato ed Enti Locali devono risparmiare ogni centesimo possibile ancora avviene una cosa così inutile (e inquinante)? Quanto costa? Chi è che ancora autorizza spese del genere?

Spero che queste assurdità finiscano presto e bene, cioè passando a rassegne stampa pubbliche almeno quanto oggi, ma esclusivamente digitali. Anche se, confesso, qualche timore che l’unico risultato pratico sarà che quelle pagine diventeranno accessibili solo con password, e che scansioni e fotocopie inutili continueranno a porte chiuse, ce l’ho. Speriamo bene.

Aggiornamenti (man mano che le scopro o me le segnalate, metterò qui altre Istituzioni che hanno lo stesso problema):

Dimenticavo: si potrebbe anche parlare del fatto che nella rassegna stampa ufficiale di un Governo del G8 non c’è nemmeno una testata straniera, ma in fondo al nostro Governo del resto del mondo che importa? Mica c’è la globalizzazione, no?