Scoprire (anche a scuola) com'è davvero la disoccupazione in Italia o negli USA
Qualche giorno fa, leggendo un pezzo dell’economista americano Paul Krugman sulla disoccupazione negli Stati Uniti, ho chiesto su Twitter: voi sapreste trovare al volo i dati più omogenei e attendibili per fare una versione italiana del primo grafico di quell’articolo?
(vedi sotto). Vincenzo Patruno, specialista di dati e di Information Technology presso Istat, ha risposto alla grande. Lascio quindi la parola a lui.
Cosa significa quel grafico di Krugman?
Krugman ritiene che il tasso di disoccupazione standard di fatto sottostimi le dimensioni del problema. Il motivo è che quando un lavoratore rinuncia a cercare attivamente lavoro questo non viene più conteggiato come disoccupato. Di conseguenza, Krugman ritiene più opportuno, per meglio capire le dimensioni reali del fenomeno della disoccupazione, calcolare il tasso di occupazione come numero di occupati sulla popolazione residente. Non però su tutta. È preferibile infatti soffermarsi sui lavoratori più giovani, guardando esclusivamente cosa accade all’interno della classe di età 25-54 anni.
E in Italia?
Per vedere, facendo lo stesso ragionamento, come starebbero le cose in Italia dobbiamo cercare di riprodurre lo stesso grafico partendo dai dati italiani sulla occupazione. Per farlo abbiamo bisogno della serie storica dei dati sugli occupati per la classe di età 25-54 anni nonché della popolazione residente, sempre riferita a quella classe. Fenomeni come il lavoro e la popolazione sono monitorati costantemente dall’Istat. Possiamo quindi andare a vedere cosa viene diffuso sul data warehouse di Istat (“magazzino dati”). Oltre a quelli della popolazione (vedi figura precedente) all’interno del tema lavoro troviamo i dati sugli occupati, disponibili a partire dall’anno 2004. IMPORTANTE: è opportuno sempre leggere tutte le informazioni che vengono rilasciate a corredo del dataset. Sono quelli che vengono chiamati “metadati” e servono a capire come i dati sono stati ottenuti, cosa quel dato esprime e quindi come utilizzare correttamente il dato.
Il sistema di navigazione all’interno del dataset consente di ottenere i dati per classe di età. In realtà la classe 25-54 non è presente ma ci sono le classi 25-34, 35-44 e 45-54. Possiamo quindi pensare di prendere i dati per questi singole classi di età e sommarli successivamente, in modo da avere un unico dato per tutta la classe 25-54. Il dato che prendiamo in considerazione è il totale per sesso e come livello territoriale prendiamo l’intera italia. Ci soffermiamo esclusivamente sul dato annuale e vediamo che riusciamo a ottenere i dati fino all’anno 2012. Possiamo scaricare i dati, sia dei residenti sia degli occupati, con questa funzione:
Ora ci servono i dati sulla popolazione residente. Selezioniamo il tema “popolazione e famiglie” e poi il sottotema popolazione. Anche in questo caso ci servirà la serie storica. Possiamo arrivarci attraverso la funzione che consente di modificare la disposizione degli assi:
Qui possiamo decidere di posizionare sulle colonne l’anno di riferimento mentre sulle righe possiamo lasciare l’età, come potete vedere nella schermata a lato. Anche in questo caso dobbiamo esportare i dati all’interno di un foglio elettronico. Questo ci serve per riuscire ad estrarre esclusivamente la popolazione da 25 a 54 anni.
Sommando i valori selezionati possiamo ottenere la popolazione totale residenti in Italia per la classe di età 25-54 per ogni singolo anno, e a questo punto non ci resta che calcolare i rapporti e generare il grafico qui a fianco, che è l’equivalente per l’Italia di quello presentato da Krugman per gli USA. Il motivo per cui si ferma al 2011, anche se i dati sull’occupazione sarebbero disponibili fino al 2012, è che gli effetti del Censimento della popolazione e delle operazioni post-censuarie di aggiornamento degli archivi anagrafici non ci consentono, al momento, di avere un dato sulla popolazione che sia confrontabile con quello degli anni precedenti (maggiori informazioni qui).
Ringraziamento e commenti da Marco
Grazie mille a Vincenzo per questa spiegazione (e per questa sua grandiosa, molto divertente presentazione musicale della statistica, non perdetevela), con qualche considerazione finale. Primo, per verificare i calcoli potete scaricare il foglio elettronico usato da Vincenzo. Secondo, ora possiamo confrontare la situazione fra USA e Italia nel modo spiegato da Krugman. Anche in maniera molto rozza, cioè mettendo i grafici uno sotto l’altro come nella figura qui a lato, si nota che quello italiano ha più o meno lo stesso andamento di quello USA, ma sta regolarmente sotto, all’incirca un 5% più in basso. Il resto, come si dice, è lasciato come esercizio per il lettore. Perché a me piace vedere questo “esercizio” soprattutto come esempio concreto di questa proposta per usare gli Open Data nelle scuole (soprattutto superiori): al di là della disoccupazione in Italia o negli USA, quello che Vincenzo ha mostrato è che (far) studiare e fare esercizi, tesine eccetera… partendo da dati ufficiali e recenti, anzichè da qualche pallosissimo esercizio teorico e già obsoleto quando venne stampato, può essere molto più facile di quanto si creda. Anche senza banda larga, LIM e compagnia bella.
Who writes this, why, and how to help
I am Marco Fioretti, tech writer and aspiring polymath doing human-digital research and popularization.
I do it because YOUR civil rights and the quality of YOUR life depend every year more on how software is used AROUND you.
To this end, I have already shared more than a million words on this blog, without any paywall or user tracking, and am sharing the next million through a newsletter, also without any paywall.
The more direct support I get, the more I can continue to inform for free parents, teachers, decision makers, and everybody else who should know more stuff like this. You can support me with paid subscriptions to my newsletter, donations via PayPal (mfioretti@nexaima.net) or LiberaPay, or in any of the other ways listed here.THANKS for your support!