economia · statistica · Twitter

Hey tu! Cosa credi di dimostrare con quel grafico idiota?

Se ti faccio vedere in un grafico che c’è una correlazione tra due grandezze, ovvero che al crescere dell’una cresce anche l’altra, ti ho forse dimostrato che una causa l’altra? Neanche per sbaglio: come ripetono a mo’ di mantra gli inglesi correlation is not causation, la correlazione (anche quella negativa) non è causazione.

Partendo da una conversazione su Twitter con Alessandro Guerani, avevo scritto una sequenza di #38tweet (forza e coraggio) esattamente su questo tema: come si può dimostrare l’esistenza e la forza di un legame di causa/effetto in economia e nelle altre scienze sociali?

Riprendiamo il discorso precedente: basta vedere una correlazione tra due variabili X e Y per dire che X ha effetti su Y?

Intendiamoci (e ricordiamoci di ciò che si fa nelle scienze naturali e in discipline come la medicina): se fossero possibili esperimenti su X, la verifica di quel che succede a Y permetterebbe di concludere che la correlazione significativa trovata nei dati è un segno del nesso di causa/effetto che va da X a Y, ma…le cose non sono così semplici.

[Eccovi la sequenza di tweet: qui mi prendo la libertà di allungare gli pseudo-tweet oltre i 140 caratteri per essere più chiaro.]

1- Partiamo da un esempio concreto che spesso viene utilizzato: quello di stimare gli effetti degli anni di istruzione sul salario futuro. Ovvero:

2- Di quanto aumenta il tuo salario annuo se vai a scuola un anno in più? Una risposta immediata l’avresti da un esperimento.

3- Ma chi osa assegnare a caso gli anni di istruzione alle persone? “Tu preso a caso studi 10 anni, tu 15, tu 2.” E vediamo l’effetto che fa.

4- Dato che di solito non puoi effettuare un esperimento devi trovare altre strade più impervie. Devi arrivare vicino a un esperimento.

5- Il problema sono le cosiddette variabili omesse, cioè le variabili che sono correlate sia con l’istruzione che con il salario. Esempi?

6- La posizione economica dei genitori è un esempio di variabile omessa, oppure l’abilità della persona. Perché?

7- Se sei un tipo sveglio avrai meno difficoltà ad apprendere a scuola. E probabilmente sei anche sveglio sul lavoro.

8- La variabile omessa “abilità” è correlata positivamente sia con gli anni di istruzione che con il salario futuro.

9- Detto in altri termini: la variabile omessa “abilità” confonde le acque perché si muove insieme alle altre due, ma non la osservi.

10- Se guardi solo la correlazione tra anni di istruzione e salario futuro senza tener conto dell’abilità rischi di sopravvalutare l’effetto…

11- …cioè sopravvaluti l’effetto causale dell’istruzione sul salario. La ragione è che l’istruzione “ti assorbe” l’effetto dell’abilità.

12- Individui più abili studiano per più anni e guadagnano di più. Ma tu pensi che quel guadagno in più sia tutto dovuto all’istruzione!

13- Per non farti fottere dai dati, devi tenere conto delle variabili omesse. Come? La maniera più semplice consiste nel raccogliere dati su queste variabili omesse

14- Puoi misurare il QI delle persone e passare dalla semplice correlazione a un modello di regressione multipla. Che vor dì?

15- La regressione multipla consiste nel guardare il legame esistente tra anni di istruzione e salario A PARI LIVELLO DI ABILITÀ:

16- è come se prendessi tizi a pari livello di abilità (che dunque non ti confonde più) e analizzassi salario e anni di istruzione.

17- Certo sarebbe un mondo molto più facile se potessi fare esperimenti e guardare solo un grafico con due variabili.

18- Tuttavia nei fenomeni macroeconomici è quasi impossibile fare un esperimento. Quindi le variabili omesse sono il principale pericolo.

19- Dunque non basta mostrare un grafico dove si vede che è successo qualcosa, per poi ammiccare a quel che succede dopo:

20- qualcosa del tipo: “Oh guarda! Hai visto che succede al PIL (o la variabile che vuoi) dopo che è successo l’evento X?”

21- Dato che l’evento X non è frutto di un esperimento -cioè non è fatto in maniera casuale- un grafico non ti dice niente. Le variabili omesse!!

22- Secondo tentativo (sempre da furbastri): ti faccio vedere due paesi, uno colpito dall’evento e uno no, e ti mostro la differenza. Ma…

23- …ancora una volta non è esperimento: che un paese sia colpito da un evento e l’altro no, di solito non è frutto di un esperimento.

24- PRIMA CONCLUSIONE: se non c’è un esperimento (o qualcosa che “ci assomiglia”) un grafico non dimostra assolutamente nulla.

25- Buttiamoci ordunque sull’euro: chi ti mostra un grafico con l’andamento di paesi dentro e fuori dall’euro NON TI DIMOSTRA NULLA.

26- Perché non dimostra nulla? Perché non basta ciò per convincermi che stai analizzando qualcosa che assomiglia a un esperimento.

27- Disciamolo: dal punto di vista statistico le variabili omesse sono i SERIAL KILLER di chi ti vuole dimostrare qualcosa con un grafico.

28- Passiamo a un tema connesso: il secondo serial killer degli imbonitori di statistica a buon mercato è il concetto di ENDOGENEITÀ.

29- In breve: se vuoi dimostrare gli effetti di X su Y, attento che Y potrebbe avere effetti su X! Endogeneità o causalità inversa.

30- Torniamo a bomba. Chi se ne fotte dell’endogeneità se hai un esperimento? Distribuisci a caso la variabile X e vedi l’effetto sulla Y.

31- Ecco a voi un esempio: vuoi studiare gli effetti della protezione dei diritti di proprietà (X) sulla crescita economica (Y).

32- L’idea teorica alla base è che -se i diritti di proprietà sono protetti- la gente ha più voglia di investire e la produzione aumenta.

33- Supponi di guardare dati macroeconomici. Eccoti la causalità inversa: un paese più ricco può proteggere meglio i diritti di proprietà.

34- Perché? Beh perché l’ordine pubblico e il sistema giudiziario costano, e non tutti i paesi possono finanziarli per bene.

35- Se trovi nei dati una correlazione positiva tra PIL pro capite e protezione dei diritti di proprietà che cosa concludi? Boh.

36- Forse la protezione dei diritti di proprietà rende un paese più ricco oppure un paese più ricco può permettersi protezione. O entrambe!

37- In termini tecnici: ancora una volta una correlazione non ti dice UNA BEATA MAZZA di conclusivo sui rapporti causali sottostanti.

38- CHI -IN ASSENZA DI ESPERIMENTI- TI VUOLE DIMOSTRARE QUALCOSA CON UN GRAFICO NON SA LA STATISTICA E/O È IN CATTIVA FEDE.

#38tweet

PS: qui trovate parecchie “correlazioni spurie” che meritano

3 thoughts on “Hey tu! Cosa credi di dimostrare con quel grafico idiota?

  1. Com’è che non produci mai grafici con dati che confermino le tue tesi?
    Chiacchieri molto. Spacco tweet banali per osservazioni precise. Cerchi visibilità politica. Non fornisci elementi utili al dibattito. Cerchi anzi di inquinarlo.

    Mi piace

  2. Tutto molto bello, molto istruttivo. Abbiamo imparato un sacco di cose sulle correlazioni. Ma “esperimenti” sull’Euro ce ne sono stati: l’austerità del governo Monti e la gestione del debito greco. Risultato: le regole che tengono in piedi la moneta unica non funzionano. E cosa può indurre la UE a cambiarle? In questo caso l’esperimento è in corso e sembra proprio che l’unica possibilità sia l’aumento del peso politico dei sovranisti e dei populisti. D’altronde i grafici in economia li introdusse Rex Tugwell per fare lobbing a Washington.

    Mi piace

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...