Illustrasjon: Copilot
Når KI gjør skolearbeidet
Høyere utdanning må fornye undervisnings- og vurderingsformer
Debatt: KI utfordrer vurderingssystemet i høyere utdanning, men gir også nye muligheter. I stedet for å motarbeide teknologien, bør vi tilpasse vurderingsformer som fremmer forståelse, kritisk tenkning og ansvarlig KI-bruk.
Kunstig intelligens (KI) har for alvor gjort sitt inntog i
universitets- og høgskolesektoren. Verktøy som ChatGPT kan på sekunder
produsere tekster og løse oppgaver som før krevde at studentene faktisk jobbet
selvstendig. Det utfordrer hele vurderingssystemet vi har i dag, som jo er
basert på at studentene leverer sitt eget arbeid. Når teknologien kan
automatisere besvarelser, settes denne tilliten på prøve.
Undervisere er bekymret for at karakterene ikke lenger
speiler hva studentene faktisk kan. Samtidig er mange studenter usikre på hvor
grensa går mellom lovlig bruk av hjelpemidler og juks. Kort sagt:
vurderingssystemet henger ikke helt med i en tid der KI-verktøy lurer i
bakgrunnen.
Flere utdanningsinstitusjoner har allerede stramma inn. Noen
har gått tilbake til tradisjonelle skoleeksamener uten hjelpemidler, mens andre
satser på plagiatkontroll for å avsløre KI-generert innhold.
Noen mener det er
mulig å skille KI-generert tekst fra menneskeskapte tekster basert på språklige
trekk. Men er det egentlig fornuftig å bruke tid og penger på å kjempe mot en
teknologi som uansett er kommet for å bli? Kanskje det er lurere å rette
fokuset mot å utdanne studentene i prosessforståelse og kritisk tenkning – slik
at de kan bli "LEGO-byggere" som former fremtidens arbeidsmarked i en
KI-assistert verden?
Eksempel med KI på eksamen
Vi gjorde nylig en test ved en norsk utdanningsinstitusjon
som viser hvor utfordringa ligger. En av oss deltok som student på en
nettbasert flervalgseksamen i et kurs der alle hjelpemidler var tillatt,
inkludert KI.
I forkant ble en egendefinert KI-assistent, med tilgang til
transkripsjoner fra forelesningene og kursopplegget klargjort. KI-assistenten
kunne analysere bilder av oppgaver og gi svar basert på kursmaterialet – alt
via smarttelefonen. Resultatet? Med KI-assistenten som hjelp ble hele eksamen
fullført på seks minutter – med full score.
Prompten som ble brukt var enkel: "Du er en ekspert på
flervalgsspørsmål som kan finne riktig svar basert på en transkripsjonsfil fra
forelesninger." Etter litt justering svarte modellen riktig på alt. Slike
verktøy er lett tilgjengelige for alle studenter – enten på mobil, nettbrett
eller PC – og de er enkle å bruke uten behov for mye teknisk kunnskap.
Så da er spørsmålet: Tester eksamen egentlig studentens
forståelse – eller bare evnen til å gi KI-en de rette instruksene? I en
flervalgsoppgave med alle hjelpemidler tilgjengelig, er svaret opplagt. Det
samme gjelder i stor grad for hjemmeeksamner, så vi må begynne å tenke nytt om
hva vi faktisk måler.
Tilpasning av vurderingsformer
Verktøy som ChatGPT fra OpenAI er ikke alene om å tilby
brukertilpassede KI-løsninger. Google har lignende funksjonalitet med Gemini og
Gems, der brukeren kan laste opp dokumenter og stille spesifikke krav.
Med Google Notebook LM – som er gratis – kan studentene
laste opp pensum i form av artikler eller transkripsjoner fra
undervisningsopptak og få svar basert på dette materialet. Notebook LM er lett
tilgjengelig for alle med en Google-konto, og ChatGPT og Gemini er bare et
tastetrykk unna på mobil eller PC.
Derfor kan det være utfordrende å basere vurderingsformene
på at studentene faktisk skriver sine egne tekster.
Problemet med KI-sjekk
Flere norske utdanningsinstitusjoner har begynt å teste ut
KI-detektorer som et tiltak mot juks med kunstig intelligens i studentarbeider.
Videre har Sikt nylig inngått en ny avtale med Inspera om
plagiatkontrollsystemet Originality, som også inneholder funksjonalitet for
KI-deteksjon. GPT Zero var blant de første deteksjonsverktøyene og forsøker å
skille KI-generert tekst fra menneskeskapte tekster ved å analysere
sannsynligheten for bestemte ordkombinasjoner (perplexity og burstiness).
Problemet er at slike metoder har begrensa treffsikkerhet.
Tekster skrevet for flere hundre år siden har blitt flagga som KI-generert.
Dessuten klarer ikke deteksjonsverktøyene å skille mellom en menneskeskapt
tekst som er språkvaska og en tekst som er KI-generert.
Flere norske universiteter tilbyr nå Microsoft Copilot 365,
der KI er integrert direkte i Word. Hvis utdanningsinstitusjonene selv tilbyr
verktøy med innebygd KI, gir det uklare signaler hvis studentene samtidig blir
sjekka for KI-bruk.
Dessuten finnes det allerede effektive
"humanizere" – programmer som kan omskrive KI-generert tekst slik at
den er mindre forutsigbar og fremstår mer naturlig og ikke blir gjenkjent av
KI-detektorer. KI kan altså ikke bare hjelpe med å svare på spørsmål, men også
etterligne studentens språk og skrivestil.
Dette gjør at KI-sjekkene i praksis blir lite pålitelige.
Vurder prosessen, ikke bare sluttproduktet
Kanskje løsninga er å tilpasse vurderingsformene til den nye
teknologiske virkeligheten, i stedet for å kjempe mot den. Så i stedet for å
begrense KI-bruk, kan vi integrere den på en måte som styrker læring.
Oppgaver kan for eksempel utformes slik at selve prosessen
vurderes i større grad enn sluttproduktet. Undervisere kan kreve
prosessrapporter (prompt-logg) eller muntlige presentasjoner og samtaler i
tillegg til skriftlige besvarelser. Da må studenten vise at de faktisk forstår
stoffet – og ikke bare har fått KI til å gjøre jobben.
Hvis studentene lærer å bruke KI som et verktøy, kan vi måle
hvordan de tenker og løser problemer. Flervalgstester og lukkede eksamener uten
hjelpemidler vil fortsatt være nyttige for å teste grunnleggende kunnskap, men
for mer komplekse vurderinger må vi vurdere prosess og refleksjon i større
grad.
Slike tiltak er lettere å gjennomføre med få studenter – og
det blir fort for krevende med store studentgrupper. Kanskje en
underviserkontrollert KI-assistert vurdering er veien framover? For eksempel
med autotranskribering av studentvideoer og mer målretta oppfølging med støtte
fra KI. Resultatet kan være en mer effektiv bruk av underviserens tid – og mer
rom for engasjerende undervisning.
Integrer KI, ikke bekjemp den
Samtidig er det ikke alle som opplever at kunstig
intelligens faktisk avlaster undervisningen. I et nylig innlegg i
Utdanningsnytt argumenterer Live Håberg (2025) for at «ekte, menneskelege
avtrykk» kan gå tapt dersom KI blir for dominerende (Utdanningsnytt.no,
publisert 25.03.2025). Likevel mener vi at KI ikke trenger å erstatte det
mellommenneskelige; den kan tvert imot frigjøre tid til nettopp den personlige
oppfølgingen – forutsatt at vi tilpasser undervisningen og vurderingsformene på
en god måte. Det handler dessuten om å lære studentene å bruke KI på en
ansvarlig måte. De kommer uansett til å møte slike verktøy i arbeidslivet – så
hvorfor ikke lære dem å bruke dem på en smart, kritisk og sikker måte allerede
nå?
I stedet for å bruke millioner på plagiatkontroll og
overvåking, kan vi heller investere i vurderingsformer som måler forståelse,
refleksjon og evnen til å bruke KI som et verktøy.
Det finnes ingen enkel løsning på dette. Hvordan kan vi
balansere kravet om ærlighet med behovet for å forberede studentene på et
arbeidsliv der KI blir en del av hverdagen? Målet bør ikke være å begrense KI –
men å integrere den på en måte som styrker studentenes læring og forståelse.