Eesti kaalub tehisintellekti kasutamist emakeeleeksamil

Eesti kaalub tehisintellekti kasutamist emakeeleeksamil

Kristel Õun Kristel Õun . Kommentaarid

4 Minutit

Tallinna Ülikooli ja Haridus- ja Noorteameti (HARNO) vahelised arutelud tehisintellekti kasutamisest emakeele lõpueksami hindamisel toovad Eesti hariduses esile olulisi teemalehti: hindamise järjepidevus, objektiivsus ja eksamite ulatuslik digitaliseerimine. TLÜ rakenduslingvistika teadlaste uurimus näitab, et suured keelemudelid annavad eksamitöödele sageli sarnaseid hindeid kui inimesehindajad — eriti selgetes ja mõõdetavates kriteeriumites.

Uurimuse taust ja metoodika

Uurimuse eestvedaja, TLÜ emakeeleõpetuse ja rakenduslingvistika lektor Merilin Aruvee koos doktorandi ja nooremteaduri Katarin Leppikuga lõid 9. klassi kirjutamisülesande jaoks uued hindamiskriteeriumid ning kaasasid eksperthinnanguid HARNO kogenud hindajatelt. TLÜ teadlased töötasid ka koos digitehnoloogiate uurijatega, sealhulgas Kais Allkiviga, kelle tööd masinõppel põhineva eesti keele oskuse hindamise vallas andsid täiendavat inspiratsiooni.

Analüüsiks kasutati 2024. ja 2025. aasta katseeksamitöid anonüümses ja kodeeritud kujul, kus oli nähtav ainult õpilase tekst ja inimhindajate määratud tulemused. Selle baasil võrreldi keelemudelite antud hinnanguid inimeste hinnetega.

Tulemused: kus mudel töötab ja kus mitte

Tulemused näitasid, et keelemudelid langevad umbes 60% juhtudest samasse hinnavahemikku, kus inimesed omavahel varieeruvad. Eriliselt hästi sobivad mudelid hindamaks alusteksti kasutamist — masin suudab kiiresti võrrelda õpilase teksti lähteallikaga, tuvastada otsesed koopiad ja hinnata teksti refereerimist.

Selgelt mõõdetavad kriteeriumid

Alusteksti kasutamise kriteerium on struktureeritud ja kvantifitseeritav, mistõttu automatiseeritud hindamine annab siin usaldusväärseid tulemusi. See aitab vähendada inimestest põhjustatud subjektiivsust ning kiirendada kontrolli- ja tagasisideprotsesse e-eksami kontekstis.

Subjektiivsed ja pehmemad oskused

Samal ajal jääb inimestest hindajate roll oluliseks kohtades, kus hinnatakse teksti terviklikkust: sissejuhatuse probleemipüstitus, lõikude veenvus, argumentide loogiline seos ja lõpetuse genereeritud-tunnetus. Need aspektid eeldavad inimkogemust ja suurt kontekstitunnet, mida keelemudelid hetkel ei asenda.

Tehnilised võimalused ja tunnusjooned

Keerukamad keelemudelid ja masinõppe mudelid pakuvad mitmeid funktsioone, mis võivad hariduses kasulikud olla:

  • automaatne plagiaadi ja alusteksti kasutamise tuvastus;
  • konkreetsete hindamiskriteeriumite rakendamine ühtlaselt;
  • skaalautuvus — suurte eksamihulkade kiire töötlemine;
  • andmeanalüütika, mis toob välja õpilaste levinumad nõrkused ja juhendid õppematerjalide täiustamiseks;
  • potentsiaalne integratsioon Eesti e-eksamiplatvormidega ning võimalus kohandada mudelit kohaliku keele ja õpikeskkonna järgi.

Võrdlus globaalse trendiga ja Eesti kontekst

Rahvusvaheliselt kasvab huvi automaatse hindamise vastu, eriti riikides, kus on juba laialdane e-eksamite kasutuselevõtt. Eesti-positsioon on soodne, sest meie digilahenduste infrastruktuur ja varasem e-eksamite kogemus võimaldavad katsetada AI-tööriistu suhteliselt kiiresti. Samas on oluline arvestada keelearenduse spetsiifikat: Eesti keel on vähemesindatud suurtes keelemudelites, mistõttu kohaliku keele andmestiku ja maskide treenimine on vajalik kõrgema täpsuse saavutamiseks.

Plussid, miinused ja riskid

Peamised eelised: järjepidevus hindamises, kiirem tagasiside, kuluefektiivsus pikaajaliselt ja võimalus välja tuua konkreetseid õpitulemusi andmepõhiselt. Miinused ja riskid hõlmavad mudelite kallutatust, piiratud suutlikkust hinnata subjektiivseid stiili- ning mõtteterviku aspekte ning privaatsuse ja GDPR nõuete küsimusi andmete töötlemisel.

Praktilised kasutusjuhtumid Eesti hariduses ja ettevõtetes

Lisaks e-eksamitele võib sarnast tehnoloogiat kasutada koolide sisemistes diagnostilistes testides, keeleõppeplatvormide automaatseks tagasisideks, kirjandite esmast hindamiseks ning hariduslike õppematerjalide ja juhendite kohandamiseks. Erinevad EdTech ettevõtted Eestis võivad arendada kohalikke keelemudeleid, mis võtavad arvesse Eesti õppekava ja keeleeripära.

Järeldus ja järgmised sammud

TLÜ teadlaste tulemuste tutvustamine HARNO-le veebruaris on samm dialoogi suunas, kus teaduslikes tõendites põhinev arutelu aitab kujundada poliitikat. Euroopa Liidu eetikajuhised ja hea tava nõuavad siiski, et lõplik otsus õpilase hinde kohta jääks inimeseks. Parim lähenemine näib olevat hübriidmudel: masin teeb objektiivsed mõõdetavad analüüsid ja ettepanekud, inimene kinnitab lõpliku hindamise ning annab kvalitatiivset tagasisidet. Eesti koolisüsteemil on võimalus jääda digiedu eesrindlikuks, kombineerides kohalike teadlaste ja EdTech ettevõtete koostööd, et luua usaldusväärne, õiglane ja keeleliselt adekvaatne hindamislahendus.

Allikas: err

"Minu huvi tehnoloogia vastu algas lapsepõlvest. Tänapäeval püüan kirjutada nii, et ka keerulised teemad oleksid kõigile arusaadavad."

Jäta kommentaar

Kommentaarid