Når KI gjør skolearbeidet

Høyere utdanning må fornye undervisnings- og vurderingsformer

Debatt: KI utfordrer vurderingssystemet i høyere utdanning, men gir også nye muligheter. I stedet for å motarbeide teknologien, bør vi tilpasse vurderingsformer som fremmer forståelse, kritisk tenkning og ansvarlig KI-bruk.

Publisert Sist oppdatert

Kunstig intelligens (KI) har for alvor gjort sitt inntog i universitets- og høgskolesektoren. Verktøy som ChatGPT kan på sekunder produsere tekster og løse oppgaver som før krevde at studentene faktisk jobbet selvstendig. Det utfordrer hele vurderingssystemet vi har i dag, som jo er basert på at studentene leverer sitt eget arbeid. Når teknologien kan automatisere besvarelser, settes denne tilliten på prøve.

Undervisere er bekymret for at karakterene ikke lenger speiler hva studentene faktisk kan. Samtidig er mange studenter usikre på hvor grensa går mellom lovlig bruk av hjelpemidler og juks. Kort sagt: vurderingssystemet henger ikke helt med i en tid der KI-verktøy lurer i bakgrunnen.

Flere utdanningsinstitusjoner har allerede stramma inn. Noen har gått tilbake til tradisjonelle skoleeksamener uten hjelpemidler, mens andre satser på plagiatkontroll for å avsløre KI-generert innhold. 

Noen mener det er mulig å skille KI-generert tekst fra menneskeskapte tekster basert på språklige trekk. Men er det egentlig fornuftig å bruke tid og penger på å kjempe mot en teknologi som uansett er kommet for å bli? Kanskje det er lurere å rette fokuset mot å utdanne studentene i prosessforståelse og kritisk tenkning – slik at de kan bli "LEGO-byggere" som former fremtidens arbeidsmarked i en KI-assistert verden?

Eksempel med KI på eksamen

Vi gjorde nylig en test ved en norsk utdanningsinstitusjon som viser hvor utfordringa ligger. En av oss deltok som student på en nettbasert flervalgseksamen i et kurs der alle hjelpemidler var tillatt, inkludert KI.

I forkant ble en egendefinert KI-assistent, med tilgang til transkripsjoner fra forelesningene og kursopplegget klargjort. KI-assistenten kunne analysere bilder av oppgaver og gi svar basert på kursmaterialet – alt via smarttelefonen. Resultatet? Med KI-assistenten som hjelp ble hele eksamen fullført på seks minutter – med full score.

Prompten som ble brukt var enkel: "Du er en ekspert på flervalgsspørsmål som kan finne riktig svar basert på en transkripsjonsfil fra forelesninger." Etter litt justering svarte modellen riktig på alt. Slike verktøy er lett tilgjengelige for alle studenter – enten på mobil, nettbrett eller PC – og de er enkle å bruke uten behov for mye teknisk kunnskap.

Så da er spørsmålet: Tester eksamen egentlig studentens forståelse – eller bare evnen til å gi KI-en de rette instruksene? I en flervalgsoppgave med alle hjelpemidler tilgjengelig, er svaret opplagt. Det samme gjelder i stor grad for hjemmeeksamner, så vi må begynne å tenke nytt om hva vi faktisk måler.

Tilpasning av vurderingsformer

Verktøy som ChatGPT fra OpenAI er ikke alene om å tilby brukertilpassede KI-løsninger. Google har lignende funksjonalitet med Gemini og Gems, der brukeren kan laste opp dokumenter og stille spesifikke krav.

Med Google Notebook LM – som er gratis – kan studentene laste opp pensum i form av artikler eller transkripsjoner fra undervisningsopptak og få svar basert på dette materialet. Notebook LM er lett tilgjengelig for alle med en Google-konto, og ChatGPT og Gemini er bare et tastetrykk unna på mobil eller PC.

Derfor kan det være utfordrende å basere vurderingsformene på at studentene faktisk skriver sine egne tekster.

Problemet med KI-sjekk

Flere norske utdanningsinstitusjoner har begynt å teste ut KI-detektorer som et tiltak mot juks med kunstig intelligens i studentarbeider. Videre har Sikt nylig inngått en ny avtale med Inspera om plagiatkontrollsystemet Originality, som også inneholder funksjonalitet for KI-deteksjon. GPT Zero var blant de første deteksjonsverktøyene og forsøker å skille KI-generert tekst fra menneskeskapte tekster ved å analysere sannsynligheten for bestemte ordkombinasjoner (perplexity og burstiness).

Problemet er at slike metoder har begrensa treffsikkerhet. Tekster skrevet for flere hundre år siden har blitt flagga som KI-generert. Dessuten klarer ikke deteksjonsverktøyene å skille mellom en menneskeskapt tekst som er språkvaska og en tekst som er KI-generert.

Flere norske universiteter tilbyr nå Microsoft Copilot 365, der KI er integrert direkte i Word. Hvis utdanningsinstitusjonene selv tilbyr verktøy med innebygd KI, gir det uklare signaler hvis studentene samtidig blir sjekka for KI-bruk.

Dessuten finnes det allerede effektive "humanizere" – programmer som kan omskrive KI-generert tekst slik at den er mindre forutsigbar og fremstår mer naturlig og ikke blir gjenkjent av KI-detektorer. KI kan altså ikke bare hjelpe med å svare på spørsmål, men også etterligne studentens språk og skrivestil.

Dette gjør at KI-sjekkene i praksis blir lite pålitelige.

Vurder prosessen, ikke bare sluttproduktet

Kanskje løsninga er å tilpasse vurderingsformene til den nye teknologiske virkeligheten, i stedet for å kjempe mot den. Så i stedet for å begrense KI-bruk, kan vi integrere den på en måte som styrker læring.

Oppgaver kan for eksempel utformes slik at selve prosessen vurderes i større grad enn sluttproduktet. Undervisere kan kreve prosessrapporter (prompt-logg) eller muntlige presentasjoner og samtaler i tillegg til skriftlige besvarelser. Da må studenten vise at de faktisk forstår stoffet – og ikke bare har fått KI til å gjøre jobben.

Hvis studentene lærer å bruke KI som et verktøy, kan vi måle hvordan de tenker og løser problemer. Flervalgstester og lukkede eksamener uten hjelpemidler vil fortsatt være nyttige for å teste grunnleggende kunnskap, men for mer komplekse vurderinger må vi vurdere prosess og refleksjon i større grad.

Slike tiltak er lettere å gjennomføre med få studenter – og det blir fort for krevende med store studentgrupper. Kanskje en underviserkontrollert KI-assistert vurdering er veien framover? For eksempel med autotranskribering av studentvideoer og mer målretta oppfølging med støtte fra KI. Resultatet kan være en mer effektiv bruk av underviserens tid – og mer rom for engasjerende undervisning.

Integrer KI, ikke bekjemp den

Samtidig er det ikke alle som opplever at kunstig intelligens faktisk avlaster undervisningen. I et nylig innlegg i Utdanningsnytt argumenterer Live Håberg (2025) for at «ekte, menneskelege avtrykk» kan gå tapt dersom KI blir for dominerende (Utdanningsnytt.no, publisert 25.03.2025). Likevel mener vi at KI ikke trenger å erstatte det mellommenneskelige; den kan tvert imot frigjøre tid til nettopp den personlige oppfølgingen – forutsatt at vi tilpasser undervisningen og vurderingsformene på en god måte. Det handler dessuten om å lære studentene å bruke KI på en ansvarlig måte. De kommer uansett til å møte slike verktøy i arbeidslivet – så hvorfor ikke lære dem å bruke dem på en smart, kritisk og sikker måte allerede nå?

I stedet for å bruke millioner på plagiatkontroll og overvåking, kan vi heller investere i vurderingsformer som måler forståelse, refleksjon og evnen til å bruke KI som et verktøy.

Det finnes ingen enkel løsning på dette. Hvordan kan vi balansere kravet om ærlighet med behovet for å forberede studentene på et arbeidsliv der KI blir en del av hverdagen? Målet bør ikke være å begrense KI – men å integrere den på en måte som styrker studentenes læring og forståelse.

 

Powered by Labrador CMS