di Stefano Gallinaro
Negli scorsi giorni ha fatto discutere un tweet del deputato Marattin in cui sovrapponeva il numero di percettori del Reddito di Cittadinanza per regione a quello dei risultati del Movimento 5stelle alludendo alla misura come a una “mancia elettorale”.
Politica a parte, è un classico caso in cui la correlazione non implica la causalità per cui ogni interpretazione è fuorviante. Data la sempre più ampia mole di dati presentati in ogni luogo, per evitare di prendere per buone informazioni che non lo sono, è il caso di ripassare quali sono le principali considerazioni da fare davanti a un grafico e non fare dire ai nostri dati cose di cui non sono rappresentazione:
1) Causalità inversa: a volte una cosa ne causa un’altra, a volte confondiamo la causa con l’effetto, ma molto spesso due cose si causano a vicenda.
2) Variabile omessa: difficilmente i modelli hanno solo due variabili in cui una ne causa un’altra e molto probabilmente ne stiamo scordando una terza (e magari anche una quarta) che spiega il tutto.
3) Rappresentatività del campione: non sempre il campione è rappresentativo dell’intera popolazione e le evidenze valide per un gruppo non lo sono sempre a livello generale.
Questi sono tre spunti per iniziare ad interrogarsi sul grafico che abbiamo davanti, ce ne sono molti altri. In generale la domanda da porsi è “È l’unica spiegazione possibile? Ha senso quello che sto vedendo?”.
Perché in fondo i dati sono come le persone: se torturati possono arrivare a dire qualsiasi cosa.