perjantai 8. marraskuuta 2013

Valhe, emävalhe, journalisti tilastotieteilijänä




Journalisti-lehdessä toimittaja ryhtyi tilastotieteilijäksi.

"Katsojat hylkäsivät Sarasvuon! Näin julisti moni lehti, kun Nelosen Sarasvuo-ohjelman toinen jakso keräsi 156000 katsojaa eli 109 000 katsojaa vähemmän kuin ensimmäinen jakso.

Mutta ketkä Sarasvuon oikein hylkäsivät? Finnpanel mittaa tv:n katselua noin 1100 kotitaloudessa. Se  tarkoittaa, että alle 50 suomalaista edustaa 100000 katselijaa. Ja vain tusinan joukko pystyy heilauttamaan dramaattisesti vähän katsottujen kanavien katsojamääriä. Silti me toimittajat suhtaudumme lukuihin hartaan vakavasti.

Samanlaista voimakasta halua uskoa epävarmoihin mittauksiin on tavassa tehdä isoja uutisia pienistä muutoksista puolueiden kannatusluvuissa. Mutta silloin sentään mainitaan sivulauseessa, että  ”muutos mahtuu virhemarginaaliin”.

Virhemarginaalin mainitseminen voisi olla välillä hyväksi myös katsojaluku-uutisissa."

Katsotaanpa. Finnpanelin sivuilta käy ilmi mm. seuraavaa.

Tutkimuksissa on 1100 kotitaloutta, mutta laitteet rekisteröivät 2 300 katsojan katselun. Siis katsojia mittaavia tilastoyksiköitä on 2300 eikä 1100. He ovat otos noin 4.8 miljoonasta katsojasta. Yksi panelisti vastaa noin 2100 katsojaa. Tämä on huomioitu Journalistin laskelmimissa, mutta ilman mainintaa siitä lukija saattaa hämmästellä, millä perusteilla tuloksiin on päädytty.

Edelleen Finnpanelin sivuilta käy selville, että torstaisin Sarasvuon ohjelman aikoihin televisiota katsoo pyörein luvuin 2 miljoonaa suomalaista. Tähän johtopäätökseen tultiin tietysti siitä, että Finnpanelin mittauksessa vajaa tuhat käyttäjää oli katsonut televisiota tätä aikana. Näistä Sarasvuota katsoi yllä mainittuna aikana siis noin 8 % eli noin 80 panelistia. Kun tälle prosentuaaliselle estimaatille tulokselle lasketaan virhemarginaali (luottamusväli) yleisesti käytetyllä 95 %:n luottamustasolla, niin se on noin +/- 1,8 %. Tarkoittaa siis sitä, että Sarasvuon ohjelman todelliset katsoja luvut parhaimmillaankin oli kyseisenä torstaina olivat noin 159000. Jos luottamustaso kasvatetaan huimaan 99,9 %:iin, niin katsojien suurimmaksi määräksi saadaan noin 161000. 

Tekstissä mainittu tusinan joukko vastaa noin yhtä prosenttia televisiota katsovista tyypillisesti tuhannesta panelistista eli noin 25000 katsojaa. Jos haluamme uskoa salaliittoteorioihin, niin periaatteessa tusina "panelikapinallista" voisi halutessaan nostaa jonkin katsojamääriltään marginaalisen ohjelman katsojalukuja merkittävästi. Toiseen suuntaan se ei onnistuisi, elleivät he sitten olisi kyseisen vähemmän suositun ohjelman merkittävin katsojaryhmä paneelissa.

 On selvää, että kovin pieniä katsojalukuja kerääviin ohjelmiin tämä katsojatutkimus ei oikein sovi. Sarasvuon ohjelman katsojien määrä on kuitenkin niin suuri, että sen suhteen voidaan tällä otoskoolla tehdä jo aika pitkälle meneviä johtopäätelmiä.  Sarasvuon katsojalukujen pudotus ei ole mitenkään selitettävissä virhemarginaalilla.

Tähän liittyy se yleinen harhaluulo, että virhemarginaali pienenisi, jos estimoitavana oleva joukko kasvaa. Virhemarginaali  on prosenttiluku ja riippuu vain valitusta luottamustasosta, otoksen koosta ja todennäköisyyksien arvoista. Ainoa oletus perusjoukon ja otoksen välillä on se, että perusjoukko on merkittävästi otosta suurempi. On ilmeistä, että jos perusjoukko on vaikka 1000 ja otos 999, niin ei siinä virhemarginaaleille jää paljoa tilaa.

Ei kommentteja: