2008, anno di sondaggi

21hillary.600.jpg

Magari qualche giornalista passa di qua e gli viene il dubbio del perchè i “sondaggi sbagliano”. Sappia che sbaglia lui a leggerli in quel modo. Magari ha cinque minuti di tempo per leggere ‘sto post …

Quest’anno per via delle elezioni statunitensi avremo il solito esilarante martellamento di sondaggi. Che di per sè sono uno strumento politico molto efficiente, ma che vengono utilizzati e presentati in maniera a dir poco non professionale.
Piùepiù volte su Macchianera e dalle mie parti se ne è parlato spesso. Per cui, prima di iniziare la tornata che ci porterà al nuovo presidente USA (nella foto a lato, insieme al giovane vice-presidente), riassumiamo il decalogo del perfetto statistico:


1. Il sondaggio si basa su delle risposte non vincolanti fatte ad un operatore telefonico (se poi è sul web, ancora peggio); niente assicura che chi vada a votare poi si comporti nello stesso modo.
2. Un sondaggio analizza un campione di persone, tipicamente molto basso. Tipo un migliaio, ma spesso molto meno; su una base di votanti che va dalle decine/centinaia di migliaia (per le primarie) ai milioni (per le elezioni).
3. Il suo risultato ha un certo margine di errore, che va capito molto bene. In realtà, se su 1000 persone 550 mi dicono che votano Hillary, il risultato del sondaggio non sarà che lei è al 55% con margine di errore del 4% (la forchetta). No, il risultato del sondaggio è il seguente: facendo le 1000 telefonate un sacco di volte, i risultati si distribuiscono in un modo tale che valore medio delle preferenze sarebbe del 55%, e che il 95% dei sondaggi sia contenuto fra 51% e 59%.
Ragionando in termini veritieri, c’è una possibilità non nulla che prenda solo quei 550 voti e che il resto voti per il Rudy.
4. Questi risultati poi vengono pesati in modo molto arbitrario. Infatti nei sondaggi, e più o meno è capitato a tutti di farne o subirne uno, vengono chieste un sacco di informazioni supplementari: che hai votato alle ultime elezioni, vai in chiesa la domenica, sei battista etc. Questo perchè gli istituti di ricerca demoscopica hanno dei loro modelli che danno più o meno peso a certi comportamenti. Essere battista e conservatore vuol dire un certo tipo di destra. Allora devo stare attento che se 990 telefonate mi dicono che voteranno Hucka e che sono battista, allora mi sa che sto telefonando solo a dei conservatori.
5. Il fatto che 10 sondaggi dicano tutti che una persona vinca, NON VUOL DIRE NULLA. C’è un modo di dire tra scienziati che pressappoco fa così: l’accordo tra scienziati NON è scienza. Ecco, un singolo sondaggio, interpretato correttamente, ha un suo valore scientifico. Dieci sondaggi raggruppati no. E come voler dire dopo aver lanciato 10 volte una moneta in aria ed aver ottenuto sempre testa, vuol dire che uscirà comunque testa.
6. Una variante all’aggregazione dei sondaggi è la loro disposizione temporale, in forma di tabella o ancor peggio di grafico. Ora, se gli istituti sono seri, e di questo non si dubita, i campioni di persone da intervistare sono scelti in modo casuale e rappresentativo della popolazione. Per cui non c’è correlazione tra le persone intervistate oggi e quelle intervistate ieri. Insomma, la tabella o il grafico NON HA ALCUN VALORE.
Per concludere, l’articolo del Corriere che riprendeva un analisi del Mundo, è completamente toppato. Se non ci credete, guardate quello che è successo in Iowa tra i sondaggi e i risultati. E godetevi la vittoria di Hillary, data ieri perdente di 7 punti “da tutti gli istituti”.
Come nei casi recenti successi in Germania e in Italia, dopo il voto il giornalista medio parla di “sorpresa alle elezioni”; in realtà prima delle elezioni sbagliava a leggere in quel modo i sondaggi, ad aggergarli tra loro e a vederli temporalmente in un grafico. E la sopresa è scoprire che sì, ha sbagliato.

(Visited 4 times, 1 visits today)

33 Comments

  1. Sono tendenzialmente d’ accordo con il post.
    L’unico appunto riguarda il fatto che da esso potrebbe ad alcuni non apparire abbastanza la distinzione tra il valore delle statistiche in genere, costruite , ovviamente, da estrazioni campionarie , e quelle accompagnate a sondaggi o al altri metodi di rilevazione dell’ intenzione di voto prossimo venturo.
    Che le statistiche non siano infallibili è noto , d’altro canto l’entità del margine di errore di esse è minimo e sovente controllabile a piacimento. Si può dire che danno un riscontro decisamente affidabile o almeno più che accettabile.
    I sondaggi invece spesso e volentieri al max c’azzeccano a spanne (o tipo a decimetri su un metro), guardate un po’ voi se è un livello di precisione che può bastare.
    Il problema è che una statistica elaborata da un campione , non so, in cui si è misurata l’ altezza media , sarà verosimilmente affidabile. Quando la rilevazione deve passare ad es. dall’ asserzione di un individuo , che riguardi l’ intenzione di voto , l’ altezza , la lunghezza del pene o altro , ci sono molte complicanze in più.
    Chiedo scusa per la prolissità , adoperata per dire qualcosa di sicuramente banale ai più, ma che non si scindessero chiaramente i due strumenti (sondaggi/statistiche) e l’ ingenza delle loro relative fallacie mi dispiaceva un filo.
    Certo è che quando già vengono utilizzate per sondaggi , in più il campione è estremamente limitato numericamente o nel caso il campionamento sia fatto per suddivisione di clusters (tipologie di persone) che però si rivelano molto opinabili , anch’esse non danno il meglio.
    Ad ogni modo ad oggi alla fine, mi sa che tifo Hillary.
    Che la fox “censuri” Ron Paul mi pare “scandaloso”.
    olà

    p.s. quello “skifoso di Carletto” tanto lo sappiamo che vota Huckabee
    (http://en.wikipedia.org/wiki/Political_positions_of_Mike_Huckabee#Education)

  2. buon pezzo, a mio parere.

    Aggiungo:

    1) quelli che dicono il contrario di quello che votano, perchè sono dispettosi (io faccio sempre così per ogni tipo di sondaggio che mi campiona).

    2) quelli che mentono perchè si vergognano del loro voto: specialmente un voto reazionario a volte è tenuto nascosto.

    3) i sondaggi spesso sono non strumenti di conoscenza dell’orientamento degli elettori, ma strumenti di orientamento degli elettori. faccio un sondaggio semitaroccato, al limite della correttezza tecnica, per ottenere un risultato che faccia pubblicità per un certo candidato o una certa parte.

  3. Cioè, in sostanza la tesi è che siccome si sa che i sondaggi sbagliano, non bisogna dire che sbagliano? Oppure siccome si sa che sono sondaggi, non bisogna dire che rispetto alla realtà danno risultati diversi?
    A me pare un po’ acrobatica la pretesa di sostenere che se un sondaggio ottiene un risultato molto favorevole a Obama, e poi vince Hillary, quel sondaggio non abbia sbagliato la previsione. Altrimenti qual era l’intento del sondaggio? E se diceva che avrebbe vinto Hillary, non si poteva dire che ci aveva azzeccato?
    Ma forse non ho capito io.
    L.

  4. Come statistico, condivido e mi complimento per la minuziosa analisi. Siamo invasi da sondaggi, pseudo sondaggi e rilevazioni, dai risultati più o meno eclatanti. Il punto è che nulla mai o quasi mai viene riferito circa la popolazione di riferimento, la metodologia di estrazione del campione e la modalità di contatto delle unità. Non solo: chi presenta i dati non ha alcuna competenza nell’analisi e interpreta i risultati in modo fuorviante. Il risultato è che siamo invasi da “statistiche” di bassa qualità e la statistica rimane purtroppo la scienza della barzelletta di Trilussa.

  5. Darwin,
    ripeto quanto già detto nel commento al tuo post originale: d’accordo su quasi tutto ma il punto 6 non è sostenibile.
    E come guide per l’interpretazione esatta dei sondaggi segnalo le "20 domande che un giornalista dovrebbe chiedere sui risultati di un sondaggio" del National Council on Public Polls.

    Luca,
    il molto o poco favorevole di un sondaggio andrebbe valutato sulla base dell’errore. Vedi a proposito il punto 12 della sopracitata guida.

  6. e non dimentichiamo quel tale che annegò in un fiume che aveva una profondità media di 80 cm.
    Lui capitò dove c’era una buca fonda tre metri, e tutt’attorno l’acqua gli arrivava alla caviglia.

  7. Come diceva la mia docente di statistica all’Università: “ai numeri potete far dire quello che volete!” (e mostrava degli esempi…).
    I sondaggi sono oramai veri e propri strumenti di propaganda. Obama era dato in vantaggio di 10 punti il giorno prima… e ha tranquillamente perso…
    Paolo

  8. Le risposte le scrivo tutte stasera; rispondo brevemente a Luca, visto che ai giornalisti come lui era diretto.
    Il problema Luca, è che i sondaggi non hanno detto ieri che vinceva Obama, o che vinceva Prodi, o che vinceva il signor xy. I sondaggi sono campionamenti su persone. Teoricamente, e col presupposto che tutti quelli che rispondono al telefono poi votino lo stesso, potresti avere che tutto il resto della popolazione vota in un altro modo.
    Se tu leggessi tutti i dettagli che vengono dati sui sondaggi, e quindi se leggessi tutto quello che scrivono sui siti degli istituti e non quello che pubblica Repubblica, troveresti altre cose.
    Troveresti altri dati. Li troveresti anche all’epoca di Prodi (e lo scrissi all’epoca su Macchianera, l’unico insieme all’americano a scriverlo che non finiva 55 a 45 per noi).
    Per ricapitolare:
    1. Un sondaggio non ti dice mai se vince Hillary, ma ti da delle forchette, da leggere con molta cautela. Anche 44-50 NON vuol dire che il risultato è tra 44 e 50.
    2. Aggregare i sondaggi (tutti i sondaggi dicono che…) o fare delle curve temporali (Hillary sta perdendo negli ultimi due mesi) NON HA ALCUN SENSO.
    Insomma, non è che i sondaggi sbagliano. Si sbaglia a intepretarli in quel modo. Che è quello che provavo a dire.
    I sondaggi hanno moltissime informazioni dentro. Ma non quelle che leggi su Rep.

  9. Scusa, allora ti faccio questa domanda: secondo te cosa dicevano i sondaggi di ieri? A me pare dicessero che era probabile una netta vittoria di Obama. Ma forse dicevano che avrebbe vinto di poco Hillary e io non li ho saputi leggere.
    L.
    p.s. ovviamente, non sto parlando degli articoli di rep. Parlo dei dati dei sondaggi.

  10. Allora, se non ho capito male, non sono mai i sondaggi che sbagliano ma siamo noi che chiediamo loro cose che non dicono.
    1. Le risposte degli intervistati non sono vincolanti; nulla garantisce che l’intervistato farà effettivamente quello che ha risposto di voler fare. Giusto.
    2. Il campione intervistato è sempre molto basso rispetto al numero dei votanti reali (1000 a fronte di milioni). Ok.
    3. Il margine di errore è tale che se 550 persone su mille intervistate dicono di votare x, è del tutto possibile (quanto possibile e quanto probabile?) che x prenda anche solo quei 550 voti. Giusto.
    4. I risultati vengono pesati in maniera del tutto arbitraria, e i singoli intervistati vengono divisi in categorie in base a criteri predefiniti e scelti arbitrariamente dal sondaggista in modo che siano appresentativi della popolazione (l’età, il sesso, la religione, …). Ecco, qui avverto un certo disagio: perchè se da un lato si dà valore scientifico ad un’indagine statistica, onestamente non capisco come si possano mescolare dati oggettivi insieme ad elementi del tutto arbitrari e precostituiti a priori (cioè: far condizionare i dati oggettivi dai criteri arbitrari di un sondaggista) e continuare a parlare di scienza.
    5. Risultati identici in diversi sondaggi identici non significano niente. A questo proposito Carletto Darwin paragona un singolo sondaggio al lancio di una moneta: se esce testa 10 volte di seguito non vuol dire che la prossima voltà scirà testa di nuovo. Ok, ma il paragone con la moneta non mi tranquillizza, quanto all’affidabilità dei sondaggi.
    6. Non ha alcun senso disporre su un grafico temporale sondaggi diversi effettuati in diversi momenti e magari con metodi diversi: è come sommare insieme le mele con le pere. Mi pare sacrosanto.
    Ora, io sono totalmente analfabeta in fatto di statistica e dunque non ho alcun motivo per non credere ad ogni parola di Darwin. Mi pare comunque che il suo orientamento sia quello di considerare un’intervista a 1000 persone come un’intervista a 1000 persone piuttosto che come un sondaggio. Il che mi va benissimo, ma a patto di chiamarla così.
    E allora, se i sondaggi possiamo considerarli quasi solo come interviste a mille persone, e se neanche una forchetta di 55 a 45 consente di fare previsioni, mi spiegate che li facciamo a fare?

  11. Benedetto Carletto, TUTTI vivono di previsioni – quasi sempre sbagliate – di impressioni, di letture parziali. Anche tu, dopotutto, scrivi “il nuovo presidente USA (nella foto a lato, insieme al giovane vice-presidente)”. Alla faccia del rigore statistico.

  12. Luca, due punti:
    1. Innanzitutto non i sondaggi. Il plurale è sbagliato, perchè è sbagliato aggregarli.
    2. Prendiamone uno. American Research Group, ok?
    http://americanresearchgroup.com/pres08/nhdem8-718.html
    Se leggi l’ultimo rilevamento sembra esattamente quello che dici tu, 31 Hillary, 40 Obama.
    Se vai in basso, leggi che hanno intervistato 600 persone (su 130 mila votanti) di cui po’ piu’ della metà dichiarati democratici. Naja, non molti.
    Poi c’è la frasetta che nessuno capisce: Margin of Error: ± 4 percentage points, 95% of the time.
    Il che vuol dire che, ripetendo l’esperimento tante volte, ci si aspetta un margine d’errore di +-4 percento nel 95% dei casi. Ma loro l’hanno fatto una volta sola. Per cui non sai da che parte si centra la curva di probabilità!
    La forchetta vuol dire che abbiamo una buona probabilità (95%) che il risultato sia per Hillary tra il 27 e il 35. E per Obama tra il 36 e 44.
    Il risultato è stato 39 per Hillary e 37 per Obama. Il che vuol dire che per Obama era nella forchetta del 95%, per Hillary no.
    Per come l’ho letto io, e chiedi a Rocca che glielo sto provando a spiegare da un po’, politicamente il sondaggio quindi diceva che stavamo nell’area del pareggio. Che è quello che è successo. Due punti di distacco sono troppo pochi per un sondaggio. Esattamente la stessa cosa che è successa tra Berlusconi e Prodi.
    Guarda, un sondaggio ti può dire che c’è una buona probabilità di successo quando tra gli estremi delle due forchette (estremo inferiore di una e superiore dell’altra) ci sono tra i 5 e i 10 punti. Altrimenti non è il caso di sbilanciarsi. Che poi finisci come Emilio Fede e le sue mitiche bandierine.

  13. Il problema Borgognoni e Luca è che il sondaggio pre elettorale non può rispondere alla domanda “chi vincerà?”. E non per un problema di ampiezza del campione (per strano che possa sembrare un migliaio di persone su una popolazione di milioni sono sufficienti per tirare fuori un risultato con un errore decente) o di come vengono poste le domande, o di come vengono fornite le risposte. Non può perché il sondaggio è una foto della situazione nel momento in cui viene effettuato. E mentre è possibile mettere insieme le foto ed avere un’idea dell’andamento dell’opinione pubblica (e su questo sono in disaccordo con Darwin), non possiamo avere alcuna certezza di come verrà la foto che faremo il giorno delle elezioni.

    Ora se questo discorso vale per un sondaggio ideale (campione scelto adeguatamente,domande poste correttamente, risposte sincere…) figuriamoci cosa succede se la domanda è poco comprensibile o l’interpellato si vergogna di dirci per chi voterà.

    In sintesi da un lato guardiamo allo strumento sbagliato e dall’altro siamo troppo fiduciosi rispetto all’errore campionario (quello derivante dal fatto di intervistare appunto solo 1000 persone invece di milioni) che invece non è decisivo. Sono gli altri errori, quelli non campionari, che abitualmente mandano in vacca il sondaggio.

    Occhio, tutto questo vale negli USA dove le società che fanno sondaggi aderiscono ad una serie di best practices comuni
    ( http://www.aapor.org/bestpractices )
    e dove i campioni sono probabilistici.
    In Italia, dove nei sondaggi politici il campione è quasi sempre non probabilistico, non è neanche pensabile dare una stima dell’errore campionario…

    Insomma finiamo a discutere di fuffa ma non per colpa della statistica.

  14. Concordo ancora nelle risposte. L’obiettivo di un sondaggio è, in soldoni, indicare ciò che pensa una popolazione rispetto a un argomento. Poichè intervistare l’intera popolazione è un processo lento e costoso, si procede all’intervista di un sottoinsieme (il famigerato campione). Se il campione è estratto correttamente, ossia rispecchia le caratteristiche della popolazione di partenza,i risultati che si ottengono sono qualitativamente elevati. In tal caso, il sondaggio non è una mera accozzaglia di interviste, ma un potente strumento conoscitivo.

  15. Cioè, Fabrizio: ci stai dicendo che quando in un sondaggio leggiamo che x sta al 41% e y al 30%, noi dobbiamo interpretarlo come un pareggio? Capisci, però, che allora il tutto non è molto utile? Voglio dire, per parlare di probabile vittoria o di vantaggio di uno sull’altro cosa serve? un 99 a 1?
    Poi: se due punti di differenza sono troppo pochi per un sondaggio, o si trova il modo di realizzare sondaggi affidabili anche con un margine così stretto oppure si smetta di farli, giacchè da molti anni le differenze di voti nelle elezioni sono sempre su quell’ordine di grandezza.
    Kilgore: capito e ti ringrazio per il chiarimento. Però: il sondaggio è una fotografia delle opinioni in un dato momento, non una previsione. Ok. Gli exit polls sono invalidati da decine di fattori (campionamento casuale, scarsa sincerità degli intervistati…). Ok. Allora, i primi mi servono solo per impostare una campagna, i secondi non mi servono a nulla. Dico bene?

  16. per quel che ci capisco(un esame universitario)c’hai preso in pieno carletto
    unica cosa, non riesco proprio a capire il punto 6…se puoi spiegare il perchè l’umanità te ne sarà grata

  17. Il “Margin of Error: ± 4 percentage points, 95% of the time” non corrisponde alla realtà.
    Sarebbe il valore dell’ affibilità statistica data la grandezza del campione , ammesso che l’ intervista o whatever utilizzano, sia uno strumento sufficientemente “preciso”.
    Intanto 600 è un numero molto esiguo ( difatti 95% è il minimo) ma il grosso problema è che i SONDAGGI NON sono PROIEZIONI.

  18. Benissimo sui sondaggi.
    Ma la tua previsione è completamente errata. Non so chi vincerà tra i democratici, ma sono pronto a scommettere che il prossimo presidente sarà repubblicano.

    Giuliani o, molto più probabilmente, McCain

  19. Borgognoni nel link che avevo indicato più su c’è proprio la risposta al tuo quesito su quando dare in testa uno o l’altro. E’ in inglese e lo ripeto qui sotto:
    http://www.ncpp.org/node/4/#12

    Poi sulla questione exit polls: non capisco perché tu li distingua dai sondaggi. L’exit poll è un sondaggio fatto dopo il voto e quindi per esso valgono tutti i discorsi fatti fin qui.
    Poi che essi siano inutili è un discorso soggettivo. Io per esempio sono d’accordo con te perché non vedo cosa ci si possa guadagnare a sapere prima, con una discreta incertezza, quello che sapremo con certezza (o almeno che dovremmo sapere viste le ultime esperienze elettorali, anche in questo paese) da lì a poche ore.
    Vuoi mettere una serata di Vespa di meno?

  20. Kilgore, ti ringrazio ancora. Ho letto e ho le idee più chiare. Però tengo il punto: che me ne faccio di un sondaggio pre-elettorale che, visto il margine di errore e le differenze solitamente minime tra i candidati, mi dice sempre e invariabilmente che i candidati sono in pareggio?
    Sugli exit polls siamo perfettamente d’accordo, credo: sono inutili perché avvengono a urne chiuse, e sono un tipo di sondaggio per sua stessa natura poco affidabili (campioni casuali, reticenza degli intervistati…). Solo le necessità di Bruno Vespa giustificano la loro esistenza. Ok.

  21. Guarda, tu ti diffondi encomiabilmente su numeri e statistica, ma il significato di forchette e percentuali non è in discussione. Quello che chiedo io è: non è tautologico dire che un sondaggio non è la realtà e quindi non può indovinare mai? Oppure che indovina per forza perché qualsiasi cosa dica corrisponde alla realtà del sondaggio?
    Ripeto la domanda già formulata – per te quel sondaggio cosa diceva? – e un’altra formulata non da me: allora a cosa serve un sondaggio, se non va preso come un orientamento rispetto alla realtà?
    E infine: se il sondaggio non dà indicazioni rilevanti o significative, la colpa della sua esaltazione è del giornalista che lo riceve o del sondaggista che ritiene di pubblicarlo?
    L.

  22. Già questo è un altro discorso. Per come la vedo io, il sondaggio può darti delle indicazioni, soprattutto se si leggono i dati disaggregati (tipo quando vai sulle fasce di età o sui mestieri), perchè ti può aiutare a raffinare il messaggio. A quello serve un sondaggio. Non a sapere chi vince.
    E soprattutto deve avere una base più grande. Se ti ricordi il mitico sondaggio americano del berlusca, era stato fatto su 10mila persone (non su mille) e aveva tutta una serie di domande trasversali.
    Rispondentoti alle altre domande: quel sondaggio diceva che era un “too close to call” tra Hillary e Obama.
    Di chi è la colpa. Mah, io mi leggo sempre i dati dei siti (in Italia per legge c’è un sito specifico) e gli istituti presentano i dati sempre correttamente. Poi al giornalista quadratico medio capita la schermata e dice “Obama davanti di 7 punti”.
    La colpa, come ogni volta che si parla di temi tecnici (missioni aereospaziali, scienza, medicina, …), è sostanzialmente del giornalista. Che non ne sa niente e semplifica.
    Lu’, se una cosa è complicata, rimane complicata. Period.

  23. E tra l’altro, Obama non ha perso proprio un bel nulla in New Hampshire, visto che se ne torna a casa con 9 delegati. Tanti quanti la Clinton.

    Ma li bisognerebbe pretendere che i giornalisti sapessero come funzionano le primarie americane (o meglio, democratiche, visto che quelle repubblicane sono ancora diverse), oltre che i sondaggi :)

  24. A proposito di statistiche e di numeri,per la corsa alla casa Bianca sarà una bella lotta dura e avvincente fino all’ultimo minuto.. perchè x divertirci non proviamo a giocare dei numeri al gioco del lotto estrapolati dall’evento? inizio io Hillary Clinton 21 la signora, 1 come il presidente il più potente uomo o “donna”, chissà del mondo e 90 la paura quella che prenderà ai contendenti nelle ultime fasi della campagna elettorale.
    Bene eccovi i miei tre numeri x ricapitolare 1-21-90 giochiamoli x Roma e tutte.
    da http://www.lottorion.com

  25. jack il malmostoso, forse non leggi la stampa, in blog e in carta. Sono settimane che si spiega come funzionano le primarie USA. Come forse mai fatto nella storia. Ce n’è di materiale per farsi un’idea personale, prima di accusare gli editorialisti. Che, peraltro, imperversano solo su Obama e sulle primarie dei Dems (tipo Segolene vs. Sarkò, you know?). Salvo poi svegliarsi per scoprire quanto siano brutti gli USA, che ancora una volta hanno scelto un Presidente repubblicano o Hillary la cessa.
    Quanto alle statistiche dell’Autore, sono d’accordo con Luca Sofri.

  26. Io non sono perfettamente d’accordo con mister Darwin. Chiamare un “to close to call” con quei sondaggi è sbagliato quanto non capire i sondaggi in toto. Quando si fanno delle misure è normale dare un intervallo di confidenza della misura (la famosa forchetta) specificando la probabilità che il valore reale sia all’interno dell’intervallo di confidenza. Questo è il significato reale della dicitura. E’ accettabile dichiarare il “to close to call” quando i due intervalli di probabilità sono sovrapposti, non quando, come in questo caso sono disgiunti, quindi il titolo dei giornali è corretto da un punto di vista “scientifico”. Il problema è che dichiarare che il valore è nell’intervallo di confidenza nel 95% dei casi significa che una volta su venti il risultato è sbagliato. Nel sondaggio che citi viene chiesta la preferenza tra 6 candidati, più il caso degli indecisi, 7 valori diversi. Significa che approssimativamente una volta su 3 sondaggi, mediamente, almeno il risultato di un candidato non cade nella forchetta prevista.

    Bisogna anche considerare che non sapendo il metodo utilizzato per calcolare l’intervallo di confidenza ampliarlo per ottenere una probabilità di errore più basse (equivalente a dire che la distanza tra gli estremi deve essere di 5-10 punti) è abbastanza rischioso. L’aumento è dimostrabile solo passando dalla diseguaglianza di Chebishev che fornisce un limite superiore ma dubito che si possa dimostrare effettivamente qualcosa.

    Poi vi è un noto effetto psicologico che è quello che accade anche con gli oroscopi, quando il sondaggio fornisce un risultato che si rivela corretto non viene ricordato mentre ci si ricorda facilmente di quando il sondaggio sbaglia.

    Questo ovviamente senza mettere in discussione il metodo utilizzato per pesare i dati raccolti e l’eventuale rumore contenuto in essi.

  27. Esatto Alg quel sondaggio citato da Darwin in realtà non fotografava affatto un pareggio. E a logica ci sono due possibilità (le scrivo in maniera più semplice possibile perdendo di rigorosità):

    1. Il risultato del sondaggio era al di fuori del 95% e quindi il sondaggio era sbagliato

    2. Il risultato era all’interno del 95% e quindi il sondaggio era giusto ma gli elettori dal momento del sondaggio (6-7 gennaio) a quello del voto “si sono spostati” verso Clinton.

    Ora rispondendo anche a chi ha detto “ma allora a che serve il sondaggio” se si è verificata la situazione 2 (che poi è la più probabile) non ha, proprio a ragione di questi sondaggi, assunto tutta un’altra luce la storia di Hillary Clinton prima del voto? Il candidato che ha un attimo di umanità e quindi recupera parecchi voti?

    Allo stesso modo, e qui controbatto Darwin che continua a ritenere senza senso organizzare temporalmente i dati dei sondaggi, come avremmo potuto valutare il formidabile effetto traino dell’Iowa senza il confronto nel tempo di tali dati?

    Per finire, spero che questa discussione non sia ormai morta, mi viene in mente solo ora un altro motivo plausibile per la estrema volatilità dei dati. Nel caso delle primarie il fatto di votare comunque all’interno dello stesso partito forse fa sì che il voto sia meno radicalizzato e più soggetto a ripensamenti dell’ultim’ora. Probabilmente se stessimo parlando di elezioni presidenziali le cose starebbero diversamente.

  28. Kilgore, perché affermi che nel caso 1 il sondaggio era sbagliato? Il sondaggio afferma che i suoi risultati sono corretti nel 95% dei casi, il 5% di casi in cui i risultati non si accordano al valore reale è comunque compreso nel sondaggio, quindi il sondaggio è corretto. O meglio, la correttezza di un sondaggio non si può valutare a posteriore dalla rispondenza dei risultati alla realtà ma solo a priori con un’analisi metodologica.

    Detto questo, a cosa servono i sondaggi? A farsi un’idea della realtà nel momento in cui vengono effettuati.

    Su questo sono d’accordo con te, mettere insieme i risultati di sondaggi effettuati in momenti diversi è possibile e corretto a patto che i sondaggi siano metodologicamente compatibili (dimensione del campione, intervallo di confidenza, distribuzione utilizzata etc etc).
    Per inciso, un sondaggio altro non è che una misura a campione su dei dati. L’analisi delle serie temporali mette appunto insieme campioni presi in istanti diversi ed è una tecnica molto usata in vari campi della scienza.

Rispondi