Miten Databyron julkaisema eduskuntavaaliennuste toimii? Miksi se antaa tietynlaisia tuloksia? Mihin paikkamäärät perustuvat? Mitä se on oikein syönyt?

Databyron postilaatikkoon on tippunut hiljakseltaan kyselyitä mekaniikasta eduskuntavaaliennusteen takana. Koska läpinäkyvyyteen pyrkiminen on eräs sivustomme perustavanlaatuisimpia periaatteita, tässä tekstissä on tarkoitus valottaa sitä prosessia, joka lähes viikottaiset puoluegallupit kuukaisittaisiksi paikkaennusteiksi muuttaa. Se tullaan soveltuvin osin yhdistämään myös olemassaolevaan metodologiasivuun. Tulevaisuudessa lisää vastauksia usein kysyttyihin kysymyksiin löytääkin erityisesti yllä viitatulta sivulta kysymyksiä ilmaantuessa.

Perusperiaate ennusteen takana

Ennusteen ydinsisältö on siis muuntaa säännölliset koko maan laajuiset kannatusmittaukset paikkaennusteeksi. Seuraavassa käydään läpi vaiheet, jolla tämä muuntaminen tapahtuu Databyron julkaisemassa paikkaennusteessa.

1. Kannatus muunnetaan kansalliselta tasolta piiritasolle

Suomessa, kuten monissa muissakin maissa, paikat kansanedustuslaitoksessa määräytyvät vaalipiireittäin. Ensimmäinen askel onkin siis muuntaa tietyssä gallupissa esiintynyt puolueiden koko maan kannatus arvioimaan puolueiden kannatusta tietyssä vaalipiirissä.

Ennusteessa käytetty mekanismi kannatuksen muuntamisessa vaalipiiritasolle on aiempien vaalien piirikannatuksen kertominen kansallista kannatusmuutosta vastaavalla luvulla.

Oletetaan, että esimerkkipuolue A sai viime vaaleissa 20 % kansallisen kannatuksen, mutta tuoreet kannatusmittaukset näyttävät kannatuksen olevan nyt 22 prosenttia. Ennusteessa käytetty tapa tuoda tämä muutos vaalipiiritasolle on yksinkertaisesti ottaa edellinen piirikohtainen vaalitulos ja kertoa se muutoksen suuruudella. Jos siis edellisissä vaaleissa esimerkkipuolue A sai Keski-Suomen vaalipiirissä 25 % kannatuksen ja kannatus on kansallisella tasolla noussut kaksi prosenttiyksikköä kuten yllä, aiempien vaalien kannatus Keski-Suomessa kerrotaan (22 % / 20 %) = 1.1:llä. Arvio Keski-Suomen kannatuksesta on siten 25 % * 1.1 =27.5 %.

Jos taas esimerkkipuolue A sai Oulun vaalipiirissä 15 % kannatuksen viime vaaleissa, kerrottaisiin se vastaavasti samalla kertoimella uuden piirikannatuksen saamiseksi. Oulussa kannatuksen arvioitaisiin siis olevan 15 % * 1.1 = 16.5 prosenttia. Puolueen maanlaajuisen kannatuksen kokiessa laskua kerroin on vastaavasti negatiivinen, jolloin arviona on viime vaaleja pienempi kannatus piirissä.

Kannatuksen muuntaminen kansalliselta tasolta piiritasolle
Sama tiivistetysti
2. Laskettu piirikannatus simuloidaan lukuisia kertoja uudestaan, jolloin se muodostaa todennäköisyysjakauman. Sen pohjalta kannatus muutetaan paikoiksi.

Yksi mittauksen puoluekannatusluku ei kuitenkaan lopulta kerro järin merkittävästi. Kun toisessa vaiheessa kyseinen mittaus simuloidaan tarpeeksi monta kertaa uudestaan gallupissa ilmoitetulla puolueen kannatuksella sekä sen lasketulla keskihajonnalla, saadaan todennäköisyysjakaumat gallupissa esitetyistä kannatuksista – samoin kuin niiden piirikohtaiset versiot.

Kun on saatu kannatusten todennäköisyysjakaumat piirissä, ne muunnetaan piirikohtaisten paikkamäärien todennäköisyysjakaumaksi. Piirikohtainen kannatus tiedettäessä on jo paljon helpompi ennustaa sekä arvioida puolueen siellä saavaa paikkamäärää.

3. Piirikohtaiset paikat lasketaan yhteen kansallisen paikkamäärän arvioimiseksi

Kolmanneksi piirikohtaisten paikkamäärien todennäköisyysjakaumat summataan yhteen kansalliselle tasolle. On tietysti oletettavaa ja jopa todennäköistä, että jossakin piirissä jokin puolue ylittää puhtaan laskennallisen kannatusennusteensa ja paikkamääränsä. Tämä voi tapahtua vaikkapa erityisen valovoimaisen ehdokkaan kerätessä ääniä enemmän kuin laskettu kannatus odottaa. Piirikannatukset eivät lisäksi muutu täysin lineaarisesti samassa suhteessa kuin kansallinen kannatus muuttuu.

Tietyn puolueen paikkamäärän mahdollinen yliarviointi jossain vaalipiirissä kuitenkin yleensä kompensoituu paikkamäärän aliarvioinnilla toisessa vaalipiirissä siten, että kokonaisennuste on suunnilleen oikein. Virheet siis keskimäärin kumoavat toisensa: yhdessä piirissä saavutetaan laskennallista parempi tulos, toisessa piirissä laskennallista heikompi tulos.

Osin tästä syystä kansallisen kannatuksen muutoksen soveltamista vaalipiiritasolle ei kannata käyttää vaalipiirikohtaisten tulosten ennustamiseen, vaan pelkästään tapana ennustaa kansallista paikkamäärää piiriennusteet yhteen laskemalla. Näin tekee myös Databyron ennuste. Piiritasolle mentäessä absoluuttiset virheet siis kasvavat ja ennuste voi poiketa lopullisesta vaalituloksesta enemmänkin.

4. Viimeiseksi yhdistetään useamman gallupin samalla kaavalla saadut ennusteet

Edellä kuvatun kolmen askeleen jälkeen on saatu luotua yksittäiseen mielkpidemittaukseen perustuva paikkaennuste. Koska yksittäinen kannatusmittaus on kuitenkin jälleen lopulta vain yksittäinen kannatusmittaus, tarkempi arvio saadaan yhdistämällä useamman yksittäisen mittauksen pohjalta vastaavalla tavalla laaditut ennusteet. Databyron julkaisemassa ennusteessa käytetään mittauksia julkaisuhetkestä 90 edellisen päivän ajalta.


Usein kysyttyjä kysymyksiä – FAQ

Ennusteen muodostamista koskevien vaiheiden lisäksi on esitetty muutamia yleisempiä kysymyksiä liittyen muun muassa pienpuolueiden asemaan sekä vaaliliittoihin ennusteessa. Seuraavassa käydään läpi esiin nousseita kysymyksiä.

Q: Arvioin, että pienpuolue A:n ehdokkaiden henkilökohtainen kannatus on isompi kuin kansalliset puoluekannatusmittaukset antavat olettaa. Miten ennuste suhtautuu tähän?

A: Databyron julkaisema ennuste perustuu laskennallisesti yksinomaan kansallisiin puoluekannatusmittauksiin. Se ei siis kykene ottamaan huomioon tai ennakoimaan yksittäisten ehdokkaiden potentiaalisesti puoluekannatusta isompaa henkilökohtaista kannatusta.

Ennusteen “heikon kohdan” voisikin sanoa olevan nimenomaan sellaisten puolueiden kohdalla, joiden ehdokkaiden henkilökohtaisen kannatuksen odotetaan olevan ennakkoon mitattua puoluekannatusta isompaa. Tällaisia tapauksia ei laskennallinen ennuste siis kykene ennakoimaan. Luotettavaa tapaa henkilökohtaisen kannatuksen etukäteismittaukseen ei gallupien puutteessa juuri ole, se perustuu yleensä valistuneisiin arvioihin.


Q: Miten ennuste suhtautuu vaalilittoihin?

A: Sivuston ennusteessa vaaliliittoja ei ole ainakaan tässä vaiheessa ole otettu huomioon. Suomessa käytetty D’Hondtin vaalitapa paikkojen jakajana on suhteellisen lineaarinen, eikä vaaliliitoilla näin ole kansallisella tasolla merkittävää vaikutusta paikkamääriin.

Yksittäisten paikkojen kannalta vaaliliitot voivat olla merkityksellisiä, etenkin pienille puolueille ne voivat olla merkittävä kysymys sekä henkisesti että fyysisesti. Kun ennuste kuitenkin perustuu kansallisiin kannatusmittauksiin, jää myös sinällään mielenkiintoisten pienpuolueiden vaaliliittojen mahdollinen vaikutus pois ennusteesta, vaikka potentiaalia eduskuntapaikkaan mahdollisesti oliskin.


Q: Eikö ennusteesta tulisi muodostua täysi eduskunta?

A: Databyron julkaiseman ennusteen puoluekohtainen paikkaennuste on mediaani paikkojen todennäköisyysjakaumasta. Mediaaniarvo on se arvo, joka erottaa todennäköisyysjakauman puolikkaan toisesta. Sen voi siis ajatella arvona, joka on “keskellä” paikkajakauman todennäköisyyksiä.

Useimmissa tapauksissa mediaanit yhteenlaskettaessa päästään lähelle kokonaispaikkamäärää. Kuitenkin mediaanien summa harvoin on täysin sama kuin paikkojen määrä, ohessa esimerkki helpommin selittämään, miksi näin:

Kuvittele kolme puoluetta kisaamaan yhdestä paikasta. Jos kaikilla kolmella on yhtä suuri kolmanneksen todennäköisyys voittaa paikka, on käänteisesti jokaisella puolueella kahden kolmanneksen todennäköisyys olla saamatta paikkaa. Kaikille puolueille mediaanilukema ennustetuille paikoille on siis pyöreä nolla, 95 % luottamusvälillä 0–1. Mediaanien summa on näin 3 * 0 = 0, mikä on vähemmän kuin jaossa olevat paikat, eli 1. Tämä saattaa painaa kokonaisennusteen muutamaakin paikkaa vajaaksi, jolloin ne jäävät ennusteessa “jakamatta”.