Hele-Andra Kuulmets kaitseb doktoritööd „Cross-Lingual Transfer Learning and Evaluation in Low-Resource Settings“

Hele-Andra Kuulmets
  • 09.04.2026
  • 11.00–14.00
  • Delta õppehoone (Narva mnt 18-1021)
Doktoritöö kaitsmine

9. aprillil kell 11.00 kaitseb Hele-Andra Kuulmets doktoritööd Cross-Lingual Transfer Learning and Evaluation in Low-Resource Settings“ („Keeltevaheline siirdeõpe ja selle hindamine väheste ressurssidega oludes“).

Juhendaja:
professor Mark Fišel, Tartu Ülikool

Oponendid:
professor Barbara Plank, Müncheni Ludwig Maximiliani Ülikool (Saksamaa)
filosoofiadoktor Jindřich Helcl, Oslo Ülikool (Norra)

Kokkuvõte:

Meie igapäevaellu üha enam sekkuva tehisaru üks põhikomponente on keelemudel, tänu millele tehisaru üldse suudab inimkeele peeneid nüansse mõista. Selleks, et keelemudel inimkeelt väga hästi mõistaks, tuleb seda treenida massiivsete tekstikogumite peal. Koguni nii suurte, et enamik maailmas kõneldavaid keeli pole teksti kujul sellises mahus kättesaadavad. Seetõttu on tehisaru võimalused paljudes keeltes piiratud, mis omakorda võib kaasa tuua nende keelte kasutamise vähenemise.

Õnneks on ka väiksemate tekstikogumitega keeltele lahendus olemas. Nimelt on täheldatud, et keelemudelite treenimisel korraga paljude eri keelte peal paraneb keelemudelite oskus treeningandmestikus vähem esindatud keeltest aru saada. Seda nähtust nimetatakse keeltevaheliseks teadmussiirdeks ja see tähendab, et mudel õpib teadmisi, mis ta on omandanud näiteks ingliskeelsetest tekstidest, kasutama eesti keeles vastamisel. Kui minna veel tehnilisemaks, siis juhtub mitmekeelsel treenimisel see, et eri keelte matemaatilised esitused mudeli sees muutuvad üksteisega sarnasemaks, mis põhjustabki keeltevahelist teadmiste siiret.

Doktoritöös uuritakse, kuidas tugevdada keelemudelites keeltevahelist teadmussiiret, et parandada keelemudelite oskust mõista eesti keelt. Töö jaguneb kaheks osaks, millest esimeses uuritakse meetodeid väikeste keelemudelite kasutamiseks konkreetse ülesande lahendamisel ja teises seda, kuidas õpetada peamiselt ingliskeelsetel tekstidel treenitud suurele keelemudelile selgeks eesti keel.

Töö peamine järeldus on, et mitmekeelne treenimine, isegi kui kasutada ainult sünteetilisi andmeid, võib märgatavalt parandada keelemudeli oskust eesti keeles mitmesuguseid ülesandeid lahendada. See tulemus osutab keeltevahelise teadmussiirde oskusliku ärakasutamise tõhususele väiksematele keeltele tehisaru maailmas parema esindatuse tagamisel.

Kaitsmist saab jälgida ka Zoomis (kohtumise ID: 993 6373 0402 pääsukood: ati).

  • 09.04.2026
  • 11.00–14.00
  • Delta õppehoone (Narva mnt 18-1021)
Doktoritöö kaitsmine