Utviklingen av verktøy basert på kunstig intelligens og maskinlæring går raskt – som et digitalt Klondyke i realtid. Markedsanalyse er blant bransjene som påvirkes sterkt av AI-bølgen, og det er knapt et analysebyrå som ikke utvikler AI-strategi om dagen. Opinion er ikke et unntak.
Det er ingen tvil om at AI og maskinlæring representerer både fantastiske muligheter og krevende utfordringer for bransjen. For å ta det positive først: AI gjør at analysebransjen blir et morsommere sted å jobbe, ved at vi gjennom AI-baserte verktøy kan ta ut en rekke oppgaver som ikke akkurat har vært det mest spennende vi har gjort. Koding av åpne svar er et eksempel. En manuell, tidkrevende og tidvis kjedelig arbeidsoppgave som AI-verktøy gjør kjappere og med høyere kvalitet.
Gjennom vårt datterselskap Citrus Analytics utvikler vi løsninger for automatisert kvalitetskontroll og analyse av data. Programmet bruker oppdaterte bibliotek for maskinlæring og statistikk for å velge de analysemetodene som er best egnet til å belyse en problemstilling, gitt datagrunnlaget man sitter med. AI er også nyttig for å generere hypoteser, hente frem forslag til spørsmål i et skjema eller en guide, strukturere sekundær kilder og mye mer. Vi er midt i en revolusjon, og listen blir lenger og lenger for hver dag som går.
I den senere tid har det også kommet stemmer som mener at man ikke lenger trenger å hente data som grunnlag for analyser, men at man i stedet kan benytte generative språkmodeller som ChatGPT for å besvare spørsmål som normalt krever surveys. Her bør man være forsiktig.
Generative språkmodeller kan ikke erstatte representative markedsundersøkelser når målet er å måle befolkningens holdninger, atferd eller preferanser. Modellens svar er ikke folks meninger, men sannsynlige tekster basert på treningsdata.
Modellen speiler ikke et definert univers, utvalg eller vekting som kan hentes via sannsynlighetsutvelging. Treningsdataene er heller ikke datert, noe som er ganske vesentlig når man ønsker å måle et tidsaktuelt fenomen i en målgruppe. Videre er det fremdeles en risiko for at språkmodellen kan hallusinere og komme med svar som mangler kildegrunnlag. Dette gjør det også helt umulig å kunne validere forskjeller i målgrupper og segmenter.
Modellens svar er ikke folks meninger, men sannsynlige tekster basert på treningsdata.
Situasjonen blir en annen når man tar kontroll over datakildene som legges inn i modellen. Snart kan du i praksis «snakke» med dine egne data, på samme måte som med ChatGPT.
Citrus Analytics utvikler i dag en motor, Citrus Fusion, som løser dette i praksis. I løpet av de neste månedene vil vi kunne mate inn våre egne datafiler, som for eksempel tidsserier fra vår UNG-studie, og hente opp svar via chatting og prompting. Dette åpner opp for helt nye muligheter for kobling og gjenbruk av data, og gjør at vi - og dermed våre kunder - vil kunne få langt mer igjen for sine datainvesteringer.
Dermed: Det er grunn til å være forsiktig med å forsøke å få svar fra dagens språkmodeller. Samtidig er det kort vei til nye og kraftige muligheter når vi kombinerer KI med kvalitetssikrede, egne data. Da får man fart, presisjon og beslutningsstøtte – uten å kompromisse med representativitet eller tvilsomme data og kildegrunnlag.