Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Sendu okkur póst. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Nóg komið af lóðabraski og okri fjárfesta – Stofnum Byggingafélag Reykjavíkur Jón Ferdínand Estherarson Skoðun Brennum kerfið til grunna Unnar Þór Sæmundsson Skoðun Lausn við svifryki Auður Elva Kjartansdóttir Skoðun Hátt kólesteról er ekki óvinurinn Anna Lind Fells Skoðun Frá 50 þúsund í 110 þúsund! Stenst mæling á kjaragliðnun? Bogi Ragnarsson Skoðun Að „fara í ræturnar“, val Samfylkingarinnar í Reykjavík við skipan á framboðslista Margrét Sigrún Björnsdóttir Skoðun Ég brenn (út) fyrir menntakerfinu Sigrún Ólöf Ingólfsdóttir Skoðun Bjór og bolti - uppsögn á íslenska forvarnarmódelinu Ellen Calmon,Sabine Leskopf Skoðun Aumingjar Jökull Leuschner Veigarsson Skoðun Það mun enginn bjarga Íslendingum í þriðju heimsstyrjöldinni Jón Frímann Jónsson Skoðun Skoðun Skoðun Lausn við svifryki Auður Elva Kjartansdóttir skrifar Skoðun Ekki úr lausu lofti gripinn, Daði Ísak Einar Rúnarsson skrifar Skoðun Skert þjónusta sem kostar meira. Íslenska leiðin… Þorvaldur Lúðvík Sigurjónsson skrifar Skoðun Hvers vegna gera þau það ekki fyrst sjálf? Tómas Ragnarz skrifar Skoðun Ég brenn (út) fyrir menntakerfinu Sigrún Ólöf Ingólfsdóttir skrifar Skoðun Að „fara í ræturnar“, val Samfylkingarinnar í Reykjavík við skipan á framboðslista Margrét Sigrún Björnsdóttir skrifar Skoðun Hugrekki krefst nafns – nafnleynd krefst einskis Liv Åse Skarstad skrifar Skoðun Jafnara aðgengi að Frístundastyrk í Reykjavík Helga Þórðardóttir skrifar Skoðun Er verið að bregðast brotaþolum kynferðisofbeldis? Brynhildur Yrsa Valkyrja Guðmundsdóttir skrifar Skoðun Vilt þú vita hvað hönnun í raun þýðir og hvað hún gerir? Sigríður Heimisdóttir skrifar Skoðun Þörf fyrir raunverulegar breytingar í sveitarstjórn GOGG Guðrún Njálsdóttir skrifar Skoðun Auður Önnu, Kvenréttindafélagið og barnaníðshringurinn Einar Steingrímsson skrifar Skoðun Hver á að þrífa? Diljá Mist Einarsdóttir skrifar Skoðun Þjóð að þyngjast – Offita er orsök stórs hluta meðferðarkostnaðar Janus Guðlaugsson skrifar Skoðun Viðbrögð við grein ASÍ Christian Kamhaug skrifar Skoðun Aumingjar Jökull Leuschner Veigarsson skrifar Skoðun Brennum kerfið til grunna Unnar Þór Sæmundsson skrifar Skoðun Frá 50 þúsund í 110 þúsund! Stenst mæling á kjaragliðnun? Bogi Ragnarsson skrifar Skoðun Það mun enginn bjarga Íslendingum í þriðju heimsstyrjöldinni Jón Frímann Jónsson skrifar Skoðun Er AMOC kerfisáhættan í Epstein-skjölunum? Sigurpáll Ingibergsson skrifar Skoðun Bjór og bolti - uppsögn á íslenska forvarnarmódelinu Ellen Calmon,Sabine Leskopf skrifar Skoðun Svínar á Austurlandi með óheiðarleika til að koma sínum jarðgöngum að Jónína Brynjólfsdóttir skrifar Skoðun Hvers vegna getum við ekki lifað saman í friði ? Einar Helgason skrifar Skoðun Svartir sauðir eða stjórnunarvandi? Hilja Guðmundsóttir skrifar Skoðun Byggjum fleiri skautasvell Friðjón B. Gunnarsson skrifar Skoðun Áhyggjur vakna þegar bæta á stöðu fátækra — ekki þegar efstu hópar hækka Vilhelm Jónsson skrifar Skoðun Ó Jafnréttisdagar háskólanna - án karlmanna - minnihluta nemenda - en meirihluta landsmanna Ingimundur Stefánsson skrifar Skoðun Reykjavíkurleiðin í leikskólamálum Skúli Helgason skrifar Skoðun Hátt kólesteról er ekki óvinurinn Anna Lind Fells skrifar Skoðun Þegar „góði kallinn“ skyggir á raunveruleikann – um jafnrétti, ofbeldi og ábyrgð Jenný Kristín Valberg skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Nóg komið af lóðabraski og okri fjárfesta – Stofnum Byggingafélag Reykjavíkur Jón Ferdínand Estherarson Skoðun
Að „fara í ræturnar“, val Samfylkingarinnar í Reykjavík við skipan á framboðslista Margrét Sigrún Björnsdóttir Skoðun
Skoðun Að „fara í ræturnar“, val Samfylkingarinnar í Reykjavík við skipan á framboðslista Margrét Sigrún Björnsdóttir skrifar
Skoðun Er verið að bregðast brotaþolum kynferðisofbeldis? Brynhildur Yrsa Valkyrja Guðmundsdóttir skrifar
Skoðun Svínar á Austurlandi með óheiðarleika til að koma sínum jarðgöngum að Jónína Brynjólfsdóttir skrifar
Skoðun Áhyggjur vakna þegar bæta á stöðu fátækra — ekki þegar efstu hópar hækka Vilhelm Jónsson skrifar
Skoðun Ó Jafnréttisdagar háskólanna - án karlmanna - minnihluta nemenda - en meirihluta landsmanna Ingimundur Stefánsson skrifar
Skoðun Þegar „góði kallinn“ skyggir á raunveruleikann – um jafnrétti, ofbeldi og ábyrgð Jenný Kristín Valberg skrifar
Nóg komið af lóðabraski og okri fjárfesta – Stofnum Byggingafélag Reykjavíkur Jón Ferdínand Estherarson Skoðun
Að „fara í ræturnar“, val Samfylkingarinnar í Reykjavík við skipan á framboðslista Margrét Sigrún Björnsdóttir Skoðun