For at målinger skal være til å stole på, kommer vi ikke utenom kvaliteten på utvalgene. I utgangspunktet er det ikke så komplisert, men enkelte mindre nøyaktige målinger i utlandet viser oss at det skal ikke mye til før det går galt.
I utvalg vil det alltid være tilfeldige skjevheter som vi tenker vi kan justere med vekter. Problemet oppstår hvis vi har systematiske skjevheter som vi kan risikere å vekte opp. Her kan det passe å minne om tidligere forsvarsminister i USA Donald Rumsfelds syn på hva vi vet og ikke vet. Foran et pressekorps som måpte og klødde seg i hodet, kom Rumsfeld medfølgende:
“…as we know, there are known knowns; there are things we know we know. We also know there are known unknowns; that is to say we know there are some things we do not know. But there are also unknown unknowns — the ones we don’t know we don’t know.” (Donald Rumsfeld, februar, 2002)
Dette sitatet som ofte blir sett på som et politiker svar der Rumsfeld helst ikke ville svare på manglende bevis for at Saddam Hussein hadde masseødeleggelsesvåpen, er faktisk et godt rammeverk for å tenke på representative utvalg.
Known knowns – kjente demografivariabler og hva man stemte ved forrige valg – her har vi fasit og vet hva eventuelle skjevheter er.
Known unknowns – hvor stor andel av de som ikke stemte forrige gang vil stemme nå og hvor mange av de som sier de vil stemme som faktisk vil gå og stemme. Dette kan også være skjevheter på utdanning, som vi vet om, men ikke helt kjenner effekten av.
Unknown unknowns – dette er forhold ved utvalget vårt vi ikke engang tenker på at vi bør tenke på. Da er det selvsagt vanskelig å sjekke. Selv om utvalget er sjekket for de forholdene vi kjenner til og alt ser fint ut med tanke på kontrollerbare variabler, kan det være underliggende skjevheter som vi ikke kjenner til. For eksempel kan utvalget se helt riktig ut med tanke på andelen unge menn og fordelingen av disse på kjente karakteristika, men det kan være at vi har med unge menn som på annen måte skiller seg fra de som de skal representere. Det kan også være grupper som konsekvent nekter å svare på undersøkelser, uten at vi vet om at vi mangler akkurat de gruppene.
Det er flere eksempler på målinger der dette har skjedd. Den groveste (og kanskje minst kjente) er parlamentsvalget i Storbritannia i 2015. Ingen, absolutt ingen, forutså at David Cameron og de konservative ville vinne et flertall og ikke lenger være avhengig av koalisjon med Nick Clegg og LibDems. I etterkant satte den britiske bransjeorganisasjonen ned et utvalg for å finne ut hva som gikk galt.
Konklusjonen var ikke representative utvalg. Dette til tross for at utvalgene selvsagt så bra ut i utgangspunktet og var vektet på riktig måte. Og her kommer vi til et viktig forhold ved representative utvalg. Det holder ikke at utvalget er ligner på populasjonen når det gjelder andelen kjønn, alder, geografi, utdanning og alle andre forhold man kan tenke seg å sjekke for.
Tenk deg to store dagligvarekjeder med store kundebaser og at vi bruker disse som grunnlag for to «befolkningspanel». Den ene dagligvarekjeden fokuserer på å ha best utvalg og kvalitet, den andre på lavest mulig pris. Det vil være lett å trekke utvalg fra begge «panelene» som på demografiske variabler ligner på hele befolkningspopulasjonen. Men de vil begge være alt annet enn representative for Norges befolkning. Det er for eksempel rimelig å anta at de to utvalgene vil ha skjevfordeling på de som jakter på tilbud og de som er opptatt av best mulig kvalitet. Jeg ville ikke turt å bruke noen av utvalgene til å si noe om partioppslutning i Norge generelt.
I og med at Cameron fikk fortsette som statsminister i 2015, fikk vi som kjent avstemmingen om Brexit (han påstår hardnakket at det var helt nødvendig for å få backbencherne under kontroll). I Brexit-avstemningen kom en ny relevant uknown unknown, nemlig vanskeligheter med å forutse valgdeltagelse i en folkeavstemning som kun skjer en gang.
Det var også andre forhold som var viktige årsaker til at man ikke traff blink, men overraskende deltagelse i undergrupper som vanligvis ikke bruker stemmeretten kan bidra til feilmålinger. Her hjemme kjenner kanskje MDG seg igjen i dette med negativt fortegn da de i 2021 rett før valget lå over sperregrensa, men i valget havnet under. Usikkerhet om hvor mange som sier de vil stemme på et parti som faktisk gjør det kan føre til store utslag for partier rundt sperregrensen.
Norske målinger har truffet godt. Men vi må likevel være bevisste på at det kan være blindsoner i utvalgene . Faren er at det er noe vi ikke vet at vi burde sjekke. Det kan være at ett eller flere småpartier er undermålt fordi disse gruppene har en overvekt av de som nekter å delta i undersøkelser. Eller unge menn som finner seg hjemme i et alternativ til de store og etablerte partiene. Eller noe helt annet. Svaret får vi om ikke lenge, og blir det bom er det mest sannsynlig på grunn av en eller flere unknown unknowns.
Kilder:
The Guardian, BBC