mercoledì 31 maggio 2017

Il paradosso del giorno del compleanno ovvero la fallacia logica del Post hoc ergo propter hoc

È il canto del gallo che fa sorgere il sole?
Entrate in una sala affollata. Che probabilità ci sono che due persone compiano gli anni lo stesso giorno? «Dipende dal numero di persone», direte voi. Avete perfettamente ragione. Allora vi domando: quante persone ci devono essere per avere almeno il 50% delle probabilità che due compiano gli anni lo stesso giorno?

D'impulso si è portati a pensare che ne servano moltissimi. In realtà il numero è incredibilmente basso: 23.

Con 35 persone le probabilità superano l'80%. Con 50 persone siamo addirittura al 97% e con 70 arriviamo al 99,9%. Com'è possibile?

È possibile perché l'intuito ci inganna...
Di primo acchito confrontiamo la data di nascita di una persona con tutte le altre e ci fermiamo lì. In realtà dovremmo pensare a tutte le possibili coppie distinte di persone che si possono formare in quel gruppo.

Il calcolo delle probabilità ci dice che il numero di coppie che si possono formare da un insieme di n persone si calcola con la seguente formula delle “combinazioni senza ripetizione di n elementi a gruppi di k”:

[1] c(n, k) = n! / ((n-k)! × k!)

Non spaventatevi perché non c'è niente di complicato; n è il numero di elementi nel gruppo (nel nostro caso il numero di persone nella stanza), k è il numero di elementi nella combinazione (nel nostro caso k=2 visto che ci interessano le coppie) e il punto esclamativo dopo il numero indica l'operazione di fattoriale. Per chi non lo sapesse 5!=1×2×3×4×5, 8!=1×2×3×4×5×6×7×8, e così via.

Facciamo un esempio semplice con 7 persone: Anna, Barbara, Carla, Daniela, Elena, Franca, Grazia. Secondo la nostra formuletta le coppie possibili che si possono formare con 7 persone sono:

7! / ((7-2)! × 2!) =
7! / (5! × 2!) =
1×2×3×4×5×6×7 / (1×2×3×4×5 × 1×2)

Notiamo che 1×2×3×4×5 appare sia al numeratore che al denominatore per cui lo possiamo cancellare. Inoltre 2! vale sempre 2. Resta quindi:

6×7 / 2 = 21

Questo trucchetto è valido in generale e lo possiamo utilizzare per semplificare la nostra formula in questo modo:

[2] c(n, 2) = n × (n - 1) / 2

Vediamo se è vero che il risultato è 21. Elenco le possibili coppie usando solo le iniziali dei nomi per brevità:

AB, AC, AD, AE, AF, AG (6 coppie)
BC, BD, BE, BF, BG (5)
CD, CE, CF, CG (4)
DE, DF, DG (3)
EF, EG (2)
FG (1)

Le coppie possibili sono quindi 6+5+4+3+2+1 = 21, che è il valore che avevamo calcolato.
Quanti tintinnii di bicchieri dobbiamo sentire a una cena dove ci sono 8 persone per essere sicuri che tutti abbiano condiviso il nostro brindisi? c(8,2) = 28. Cin cin!

Diciamo che ci fidiamo della nostra formula semplificata [2] e proviamo ad applicarla al primo numero che abbiamo visto: 23 persone.

c(23, 2) = 23×22 / 2 = 253

Non è complicato, vero? Bene. 253 coppie sono tanta roba. Già ora, ad intuito, ci rendiamo conto che la probabilità di compleanni coincidenti non possono essere così basse. Cerchiamo però di calcolarle.

Partiamo da tre piccole premesse:
  1. in calcolo delle probabilità e statistica le probabilità non sono espresse in percentuale ma in valori da 0 (evento impossibile) a 1 (evento certo). Per passare alla percentuale basta moltiplicare per 100.
  2. La probabilità che lanciando un dado regolare a 6 facce esca un certo valore è intuitivamente di 1/6. I lanci di un dado sono eventi indipendenti. La probabilità che un evento si riproponga più volte è uguale al prodotto delle singole probabilità. Quindi la probabilità che in due lanci esca lo stesso valore è di (1/6)×(1/6) = (1/6)2. Per 3 lanci la probabilità è (1/6)3 e così via.
  3. A volte (come in questo caso), è più semplice stimare la probabilità che un evento non accada invece che quella che accada. Se la probabilità che un evento accada è p, allora la probabilità dell'evento contrario (la probabilità che l'evento non accada) è 1 - p.
Un buon non-compleanno a te
Ora uniamo gli ingredienti.

Invece che calcolare la probabilità p che una coppia tra 23 condivida il compleanno è molto più semplice affrontare il problema opposto: che probabilità p' c'è che nessuna delle 23 coppie compia gli anni lo stesso giorno? Oppure, per dirla come in Alice attraverso lo specchio, che probabilità ci sono che tutte le persone nella stanza festeggino il loro non-compleanno?


La probabilità che due persone compiano gli anni lo stesso giorno è di 1/365.

La probabilità che non lo facciano è di 364/365.

La probabilità che 253 possibili coppie non compiano gli anni lo stesso giorno è quindi:

p' = (364/365)253

È un valore che possiamo calcolare con una calcolatrice scientifica (anche quella di Windows, in modalità scientifica). Risulta circa:

p' = 0,4995.

Quindi, la probabilità che tra 23 persone ce ne siano due che compiano gli anni lo stesso giorno è (circa) di:

p = 1 - p' = 1 - 0,4995 = 0,5005

che moltiplicato per 100 fa il nostro 50% (50,05 circa se vogliamo essere pignoli).

In generale, se abbiamo n persone, la probabilità che due compiano gli anni lo stesso giorno è:

p = 1 - (364/365) c(n, 2)

dove c(n, 2) è la nostra formuletta semplificata [2] che sappiamo ormai calcolare perfettamente. Ecco alcuni valori:

n c(n,2) p' p = 1 - p' %
20 190 0,59377 0,40623 40,6%
25 300 0,43909 0,56091 56,1%
30 435 0,30318 0,69682 69,7%
35 595 0,19546 0,80454 80,5%
40 780 0,11766 0,88234 88,2%
45 990 0,06614 0,93386 93,4%
50 1225 0,03471 0,96529 96,5%
55 1485 0,01701 0,98299 98,3%
60 1770 0,00778 0,99222 99,2%
65 2080 0,00332 0,99668 99,7%
70 2415 0,00133 0,99867 99,9%

«Bene, molto interessante,» mi direte (perché siete educati e benevoli), «ci hai dimostrato che non è così difficile che a una festa ci siano due persone che compiono gli anni nello stesso giorno... E allora?».

Il punto è che questo discorso non vale solo per i compleanni. Che probabilità ci sono che due eventi accadano nella stessa settimana? Che probabilità ci sono che l'autobus passi proprio mentre vi state fumando una sigaretta? Che probabilità ci sono che un certo problema si manifesti in un bambino nella prima settimana dopo la somministrazione di un vaccino?

Il calcolo è sicuramente più complesso (e io sicuramente non lo so fare) ma il principio è lo stesso. Le probabilità, forse, sono molto più alte di quanto potremmo aspettarci; e siccome spesso si applicano a ciascuno di noi, diventa veramente improbabile che certe coincidenze non capitino a qualcuno.

Una relazione temporale, anche se all'apparenza molto singolare, non ne implica necessariamente una causale. È la fallacia logica del “Post hoc ergo propter hoc”, una tra le più convincenti, insidiose ed abusate, spesso anche in buona fede.



Vedi anche:

7 commenti:

  1. Bè, per dipanare i dubbi aiuterebbe poter fare un doppio cieco come per qualsiasi altro farmaco, ma per i vaccini mi pare che questo non sia possibile, giusto Gabriele?
    Chissà potrebbe essere questo schema di ragionamento paradossale, che spinge farmaco-sorvegliamza, pronto soccorso e pediatri a cercare di minimizzare sempre le reazioni avverse e fare di tutto per limitare il numero di persone che le segnalano.Il che rende naturalmente superfluo qualsiasi analisi delle cause delle possibili reazioni avverse al vaccino. Tanto è una coincidenza.

    PS: mi sento poco poco Zenone anch'io e nel mio piccolo mi è venuto in mente un paradosso anche a me: ma se nel gruppo di persone inietto eroina al posto di un vaccino, che probabilità ho di avere nel gruppo di persone dopo un'ora qualcuno di lucido? :-) buongiorno Gabriele!

    RispondiElimina
  2. E' abbastanza ovvio che studi in doppio cieco sull'efficacia di un vaccino non puoi farli. Non puoi certo inoculare il morbillo per vedere se il vaccino funziona. Eticamente è inaccettabile.

    Ci sono però diversi studi in doppio cieco sugli effetti collaterali per diverse categorie di persone e servono per stabilire quali sono i soggetti a rischio ai quali il vaccino è meglio non darlo. Se cerchi su scholar ne trovi tanti (clicca qui)

    Resta comunque l'osservazione costante sulla popolazione vaccinata. Le segnalazioni vengono raccolte tutte. Non tutte vengono considerate attinenti. In questi casi gli studi sono statistici. Se un certo disturbo ha una certa incidenza percentuale ogni anno. Un conto della serva è calcola in media quante persone sono colpite ogni giorno. Moltiplichiamo questo valore per 7 (una settimana). Controlliamo in quanti casi questo disturbo si verifica nella settimana successiva al vaccino. Se il numero di colpiti nella settimana dopo il vaccino è significativamente più alto che nel resto dell'anno scatta l'allarme.

    Quanto ad eventuali bias del personale medico non escludo che ce ne siano in un verso o nell'altro. Per quella che è la mia esperienza personale - negli anni scorsi purtroppo ho avuto spesso a che fare coi PS e gli ospedali per mia madre - posso solo dire che il personale medico del comparto pubblico della mia regione (E.R.) è preparato, professionale, umano e scrupoloso. Avrei invece molto da ridire per le cliniche convenzionate.


    RispondiElimina
  3. Ciao Gabriele, sul doppio cieco intendevo naturalmente atto a stabilire l'incidenza di reazioni avverse in gruppi di vaccinati o meno, non certo per stabilire l'efficacia del vaccino, come era desumibile dal contesto della mia risposta. Quanto ai link che mi hai gentilmente postato, perdonami, se puoi aiutarmi a scremarli mi faresti una cortesia, perché quelli che ho aperto io mi sembra siano più orientati a definire dei gruppi in cui i vaccini vengono iniettati con modalità diverse, o comunque sempre finalizzati a capire l'efficacia del vaccino contro qualche particolare ceppo. Ma non sono medico, nemmeno inglese, quindi è probabile che possa aver frainteso, se mi potessi cortesemente spiegare anche uno solo di quei studi portandomelo ad esempio, posso capire se attinente a quello che dicevo io (per ora mi pare di no, scusami).
    Sul fatto che le segnalazioni vengano raccolte tutte come dici, avrei onestamente qualche ragionevole dubbio, dopo anni che sento allucinanti testimonianze di genitori, potrei ad esempio raccontarti uno degli ultimi che ho sentito, in cui una madre chiamava il prontosoccorso pediatrico la sera della vaccinazione con il bimbo in crisi respiratoria, ed è stata liquidata dicendo che il bimbo aveva carenze affettive e di non far figli se non si è in grado di starci dietro.
    Ma ammettiamo che sia come dici tu, non voglio farti perdere tempo in discussioni che entrerebbero nel surreale, il passo successivo che tu presupponi è far scattare un allarme. Come ti ho già postato precedentemente, pare neanche questo funzionare, ri-posto un altro link, forse il precedente non funzionava:
    http://www.informasalus.it/it/articoli/documento-riservato-aifa.php
    Quando si inizia a scoprire che le reazioni avverse GRAVI sono diverse centinaia in pochi anni di analisi ed anche 5 bimbi morti, non pensi anche tu che, SENZA NULLA TOGLIERE ALL'IMPORTANZA DEI VACCINI CHE PERSONALMENTE RICONOSCO IN DETERMINATI CONTESTI, forse bisognerebbe avere l'onestà intellettuale di riconoscerne i limiti e far qualcosa di scientifico per andare oltre? Che senso ha, con questi dati rendere obbligatoria una scelta e per di più aumentare il numero dei vaccini di gran lunga oltre quello di un qualsiasi paese europeo occidentale, invece che attivare un tavolo di confronto serio (e non urlato che finisca tutto in caciarra) per arrivare a dei prodotti più sicuri?
    Naturalmente tutto il ragionamento stà in piedi se non si comincia ad accettare il fatto, a prescindere da tutto, che il benessere di tutti non sia superiore a quello di relativamente pochi singoli individui, nel qual caso è naturale che questa discussione non abbia senso, sono il primo ad ammetterlo. Però avrebbe il sapore di una visione piuttosto "nazista" del mondo, ed io non posso credere né condividere che sia così.

    RispondiElimina
  4. Sul link di "Scholar" ci sono centinaia di link. È un motore di ricerca. Puoi provare a raffinarla. Tra i primi, se non ricordo male, c'è una ricerca sul vaccino anti varicella che da reazioni importanti nelle donne che hanno partorito da poco. Altri segnalano che uno specifico per l'influenza non ha effetti gravi in non ricordo quale condizione clinica.

    Veniamo al sodo. Ti faccio notare che "Informasalus" fa propaganda pro-omeopatia. Leggere sulle stesse pagine di scienza, statistiche, reazioni allergiche fa un po' ridere. Tant'è che il documento "segreto" dell'agenzia del farmaco è segretamente scaricabile dal sito dell'agenzia del farmaco.

    Ti porto l'esempio del Veneto, la regione col maggior numero di segnalazioni, senza vaccinazione obbligatoria e con un tasso di vaccinazione tra i più alti e con un'altissima sensibilità per le segnalazioni tant'è che da anni è in funzione un numero verde.

    Nel 2012 sono state somminitrate 1.500.652 dosi di vaccino.
    Ci sono state 453 segnalazioni di reazioni: 0,03% rispetto alle somministrazioni
    Di queste quelle considerate gravi sono state 40: 0,0027% rispetto alle somministrazioni
    Si è trattato di:
    - 28 casi di febbre alta con convulsioni
    - 4 di anafilassi
    - 2 disturbo atassico trasitorio
    - 2 di porpora
    - 1 di cellulite (richiesto terapia antibiotica)
    - 1 di mielite trasversa in una donna anziana

    Ecco il documento. Qui ci sono i dati 2013/2014.

    Da 1 gennaio al 21 maggio ci sono stati 2581 casi di morbillo in Italia (e parliano solo del morbillo). Se fossero segnalazioni di reazioni avverse sarebbero state tutte considerate gravi. Quattro su dieci sono stati ricoverati.
    In questo paese ogni anno muoiono (!) 21 persone per tetano. O vogliamo parlare degli oltre 500 casi di epatite B?

    Paolo, davvero, si può sapere di cosa parli?







    RispondiElimina
    Risposte
    1. P.S. Così, tanto per vedere cosa succede nel mondo: Minnesota

      Elimina
  5. Ho postato quel link, il cui contenuto mi pare più che chiaro e corrispondente alla situazione a prescindere che (sigh! Non avevo fatto caso, ho preso il primo guardando solo il contenuto) sia un sito pro-omeopatia, in quanto avevo il dubbio che quello del codacons non lo fosse. Segreto, perché lo era fino a quando il codacons non lo ha portato in evidenza, da quel che mi risulta. E motivo per cui il codacons ha fatto un esposto.
    I dati relativi al periodo 2014-16 sono ben diversi da quelli della regione Veneto da te riportati, mi pare. Parlo di questo e di come sia possibile non tenerne conto.
    PS: i morti da tetano sono quasi unicamente ascrivibili a una fascia di popolazione over 60 certamente più a rischio di un infante di 3 mesi, fascia per la quale avrebbe certamente più senso fare dei richiami delle vaccinazioni.
    Quanto ai casi di Epatite B (anche questi non credo proprio in bimbi di 3 mesi), conosco anche una persona a cui è venuto il diabete in seguito alla vaccinazione, ma certamente sarà un caso che non ha nulla a che vedere col vaccino stesso, come hai analizzato statisticamente tu nel post.
    Questo spunto mi spinge però anche a chiedermi quali siano gli accertamenti che vengono fatti sulle reazioni avverse per capire se sono correlati o meno. Io giuro che è una cosa che non ho mai capito. Di certo in Italia ci sono 700 casi di danneggiati da vaccino, riconosciuti dai tribunali in seguito ad un lungo iter, ma essendo che giurisprudenza non fà un analisi scientifica sui nessi, io ancora non capisco: chi prende le segnalazioni o i danneggiamenti accertati e li analizza? Boh.

    RispondiElimina
    Risposte
    1. Non mi pare che ci siano differenze sostanziali. L'articolo di "Informasalus" parla di 1.857 reazioni avverse al vaccino esavalente di cui 168 gravi (9%) nel 2014. 992 reazioni di cui 144 gravi nel 2015. 702 reazioni avverse di cui 142 gravi nel 2016.
      Le 40 gravi della regione Veneto mi sembrano del tutto in linea con l'andamento nazionale. Rapporta quei dati alla popolazione nazionale e vedrai che i conti tornano. Anzi, vedrai che tendenzialmente nel resto del paese ci sono - in rapporto - meno segnalazioni. Il che non deve sorprendere proprio perché un terzo delle segnalazioni vengono dalla sola regione Veneto per i motivi che ti ho detto: ti ho citato proprio la regione in cui le segnalazioni sono raccolte in modo più completo e sistematico. E non credo che usino vaccini diversi dal resto d'Italia.

      In sostanza, ci sono mediamente reazioni nello 0,03% dei casi che possono essere gravi nello 0,003% dei casi (nei 3/4 dei quali si tratta di febbre alta).

      Per quel che riguarda l'epatite B, come ti ho già detto, si preferisce somministrare i vaccini nei primi mesi di vita perché è il periodo in cui si forma il sistema immunitario e i bambini sono esposti a decine di migliaia tra antigeni, allergeni, patogeni e quant'altro. Una decina di antigeni in più o in meno non fanno differenza. E, soprattutto, l'esavalente è UN VACCINO, non sei vaccini.

      Quanto alle correlazioni, come ti ho già detto a grandi linee (ma non sono ne' un medico ne' uno statistico):
      - trova quanti casi di un certo disturbo ci sono ogni anno per quella fascia d'età
      - trova che distribuzione stagionale ha quel disturbo
      - trova in quanti casi quel disturbo è stato segnalato entro un certo periodo dal vaccino
      - calcola se - statisticamente - il disturbo si verifica più frequentemente entro tot giorni dal vaccino che nel resto dell'anno.

      Il problema è che la significatività statistica di questi studi rimane comunque molto bassa proprio perchè i casi sono pochissimi.
      Tanto per dire, le reazioni avverse all'aspirina o all'ibuprofene variano a seconda degli studi tra lo 0,3% e l'1%. Quante aspirine prendi nel corso della tua vita? E i tuoi figli?

      Alla luce di queste informazioni puoi senz'altro decidere di non prendere più l'aspirina. Però se non prendi l'aspirina chi ci rimette sei tu. Se non ti vaccini potrebbe rimetterci chi non può vaccinarsi.

      Elimina