Hvorfor slår AlphaZero verdensmester Magnus Carlsen enkelt i sjakk?
Hvorfor er kunstig intelligens (KI) i stand til å oppdage kreftsvulster i billeddiagnostikk som klinikere ikke klarer se med det blotte øye?
Har dybdelæring innen kunstig intelligens og maskinlæring kommet lenger enn man har trodd, eller er dette nok en teknologihype?
KI-kappløpet
De siste to årene har flere store språkmodeller blitt lansert og spesielt teknologifirmaet OpenAI sine ChatGPT og GPT-4 har fått mye oppmerksomhet. Det er fokuset på å forstå språk og tekst det som nå driver kappløpet fremover mellom de store teknologigigantene og mange har blitt forbauset over at chatbotenes evne til å utføre oppgaver som tidligere ble sett på som teknologisk umulig.
Den viktigste endringen dette medfører for utdanningssektoren er at selve maskinlæringen har blitt mer avansert og klarer nå å foreta maskinelle dybdelæringsbeslutninger selv.
Det at dette i stadig større grad er datagenerert (og ikke bare brukergenerert) har ført til meningsbrytninger omkring de kunnskapsmessige og etiske sidene ved kunstig intelligens og chatboter.
Debatten foregår innen flere samfunnsområder og preges av usikkerhet for hva dette innebærer for vår tradisjonelle forståelse av kunnskap, læring og danning. Mange er forståelig nok bekymret for hva dette på sikt kan ha å si for utdanningssektoren.
Lavthengende frukt
Her til lands er et mylder av digitale plattformer og digitale verktøy i daglig bruk i utdanningssektoren. De aller fleste av disse digitale plattformene og digitale verktøyene myntet på utdanning har ikke KI «under panseret», men kan selvsagt fungere fint til det formålet det er utviklet for.
Likevel er det den «laveste hengende frukten» og det man ser av enkel læringsinformasjon man kan hente ut fra slike digitale verktøy. Adaptive læringsverktøy med KI «under panseret» kan ha potensial til å selv hente ut langt mer kompleks og avansert læringsinformasjon som man ikke kan se med det blotte øye, og selv foreta læringsanalyser.
Det blir derfor hevdet at læringsanalyser av titusenvis av elever og studenter daglige bruksmønster med slike adaptive læringsverktøy kan ha et potensial for å forbedre undervisningen, utdanningskvaliteten, samt også forbedre treffsikkerheten i utdanningsforskningen.
Intensjonen er altså at slike adaptive læringsverktøy benytter data og brukergenererte prosesser til å gi elevene faglige utfordringer tilpasset sitt ferdighetsnivå. Men fungerer det i praksis?
Pedagogiske fallgruver
I våre tre studier (1, 2, 3) av slike adaptive læringsverktøy i matematikk fant vi at dette kan fungere bra for innlæring av basisferdigheter, men forutsetter en kyndig klasseledelse fra lærerens side.
Slike adaptive læringsverktøy med KI-funksjonalitet har dermed et potensiale i utdanningssammenheng og spesielt som en støtte for elevene, men også for å kunne foreta læringsanalyser over tid basert på de stordataene slike adaptive læringsverktøy genererer.
Samtidig er det flere pedagogiske fallgruver her. Det kan være et «etisk minefelt» og by på en rekke personvernmessige utfordringer som forutsetter høy etisk årvåkenhet.
Ser ikke verdien
I tillegg til de potensielle etiske utfordringene, er det også andre grunner til hvorfor det er såpass få slike adaptive læringsverktøy med KI-funksjonalitet i bruk i utdanningssektoren her til lands; de fleste er relativt kostnadskrevende, kunnskapsgrunnlaget har vært mangelfullt og sektoren har ennå ikke sett verdien av KI.
En annen utfordring er at den digitale kompetansen blant undervisere varierer, og de har i ulik grad peilet seg inn på denne typen adaptive læringsverktøy.
I tillegg er det svært tids- og kostnadskrevende å utvikle og vedlikeholde slike maskinlæringsverktøy for utdanningssektoren.
Knewton
Et eksempel på dette er KI-selskapet Knewton som startet opp i 2008 med en KI-drevet plattform for adaptive læringsverktøy innen utdanningsområdet. Denne har også vært i bruk i norsk skole siden 2015.
Knewton har siden 2008 trent opp AI-algoritmene sine med over 25 000 betatestere, samlet inn mer enn 180 millioner dollar i investeringskapital og blir brukt av 40 millioner elever og studenter verden over.
Det er fortsatt begrenset med forskningsbasert kunnskap om læringseffekten, men i en intern Knewton-studie av mer enn 10 000 studenter viste gode resultater ved bruk av adaptive læringsverktøy. Likevel har den store suksessen latt vente på seg for selskaper som Knewton. De har møtt en del motbør av flere årsaker.
Brutte løfter, kompleksitet og store egoer
En grunn kan være at de har lovet for mye uten å helt innfri, samt at Knewton har kondisjonert KI-algoritmene sine primært fra åpne utdanningsressurser som gir lavere kostnader for studenter, men som også trolig har gitt lavere inntjening og skralere vilkår for videre utvikling.
En annen grunn kan være at ikke mange nok i utdanningssektoren har vært helt klar for denne type avanserte digitale læringsressurser – det hjelper jo ikke å ha mye KI «under panseret» hvis ikke sektoren selv ønsker det, forstår hva hensikten er eller hvordan man skal dra nytte av det.
Og det hjelper kanskje heller ikke at enkelte av Knewtons ledere litt eplekjekt uttrykker at «Knewton is a Ferrari, but we’re in a Kia market. Ferraris require more maintenance. It’s more complicated to use Knewton».
Og mens Knewton har operert innen et noe foreløpig begrenset marked i utdanningssektoren, har OpenAI nærmest lagt alle sektorer for sine føtter med sine konversasjonsteknologiske språkmodeller, har hentet inn 1,9 milliarder dollar siden 2015 og har allerede over 100 millioner brukere.
Krever langsiktig og tung satsing
Når maskinlæringen har blitt såpass avansert at de klarer å foreta maskinelle dybdelæringsbeslutninger selv på en rekke områder som har konsekvenser for studenters kunnskap og vurderingsformer, er det både muligheter og utfordringer ved dette.
Men når disse generiske språkmodellene som GPT-4 er såpass avanserte og kraftige som de er, og det er vanskelig å forutse hva de er i stand til, kan det være tid for et «hvileskjær» utviklingsmessig.
Og skal de språkmodellene som allerede eksisterer brukes i utdanningssammenheng, vil det kreve et redesign av læreplaner, en vifte av vurderingsformer, samt at de adaptive læringsverktøyene bør brukes mest i underveisvurdering og i mindre grad i sluttvurdering.
Dette medfører at man må adressere – i en tid med svært mye «turbulens» i utdanningssektoren – om sektoren alene i det hele tatt er i stand til å oppskalere, redesigne og innrette seg inn mot de endringene KI vil medføre på flere plan. Trolig vil dette bli såpass krevende for sektoren alene at det vil kreve en langsiktig og tung nasjonal satsing med myndighetene i førersetet.