Pamatyti
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
PAMATYTI.LT
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
Pamatyti.lt
Rezultatų nėra
Žiūrėti visus rezultatus

Sukurtas pirmasis lietuvių kalbos DI modelis: žengiame į ateitį

Edita Liškauskė Edita Liškauskė
2025-11-10
Lietuva, Mokslas ir studijos, Technologijos
Laikas: 2 min skaitymo
Pradžia Lietuva
Dalintis FacebookDalintis X

Valstybės skaitmeninių sprendimų agentūra (VSSA), kartu su mokslo ir verslo partneriais, žengia svarbų žingsnį plėtojant lietuvių kalbos dirbtinio intelekto (DI) sprendimus. Viešai paskelbtas pirmasis praktinis rezultatas – „Mažasis lietuvių kalbos vektorizuotas modelis“, atveriantis naujas galimybes inovacijoms.

Vienas didžiausių iššūkių plėtojant dirbtinio intelekto technologijas yra pakankamai gausūs ir kokybiški kalbiniai ištekliai. Šią spragą siekia užpildyti VSSA kartu su Vytauto Didžiojo universitetu (VDU), UAB Neurotechnology, UAB Tilde Lietuva ir MB Krilas įgyvendinamas projektas „Bendrojo lietuvių kalbos tekstyno ir vektorizuotų modelių sukūrimas“.

Didžiausias Autentiškas Lietuvių Kalbos Tekstynas

Kiti straipsniai

Naujas „G&G Sindikato“ albumas „Pikti ir nuožmūs“: pajusite ironijos gniūžtę už apykaklės

Naujas „G&G Sindikato“ albumas „Pikti ir nuožmūs“: pajusite ironijos gniūžtę už apykaklės

2026-05-18
Baltijos šalyse itin populiarūs naujieji „Samsung“ sulenkiami telefonai: „Galaxy Fold7“ pardavimai šoktelėjo 69 proc.

„Samsung Galaxy Z Fold 8“ ir „Flip 8“ bus pristatyti renginyje „Galaxy unpacked 2026“ – štai ko galima tikėtis

2026-05-15

Svarbiausias projekto etapas – Bendrojo lietuvių kalbos tekstyno formavimas. Tai bus didžiausias lig šiol sukauptas lietuviškas tekstynas, apimantis net 3,5 mlrd. žodžių patikrintų, žmogaus kurtų (ne DI generuotų) tekstų. Šis didžiulis autentiškas duomenų kiekis yra kritiškai svarbus efektyviam DI modelių apmokymui.

VDU vyresnysis mokslo darbuotojas dr. Andrius Utka, atstovaujantis tiekėjų grupei, pabrėžia: „Mažasis lietuvių kalbos vektorizuotas modelis yra apmokytas su daugiau nei puse planuojamo sukaupti Tekstyno, t. y. 1,87 mlrd. žodžių. Galima sakyti, kad kol kas tai yra didžiausias tokios kokybės lietuvių kalbos tekstų rinkinys vienoje vietoje.“

Prieinamumas ir Konkurencingumas

Lapkričio 3 d. viešai prieinamas tapo pirmasis apmokytas neuroninis modelis – Mažasis lietuvių kalbos vektorizuotas modelis (LT-MLKM-modernBERT). Šis „iš anksto apmokytas“ (pre-trained) modelis „užkoduoja“ kalbą kompiuteriui suprantamu būdu, taip sudarydamas sąlygas DI inovacijų kūrėjams kurti įvairius sprendimus: nuo pokalbių robotų iki teksto generavimo įrankių.

Modelis patalpintas atvirojoje prieigoje, populiarioje „Hugging Face“ platformoje.

  • Modelio nuoroda: VSSA-SDSA (State Digital Solutions Agency (LT))
  • Validavimo kodas: VSSA-AtvirasKodas-LT/LT_AI-NER
  • Metaduomenys: Lietuvos atvirų duomenų portalas | Mažasis lietuvių kalbos vektorizuotas modelis

Praktinis Pranašumas Rinkoje

Modelio efektyvumas jau patvirtintas pritaikant jį įvardytųjų esybių atpažinimo (named entity recognition, NER) užduočiai. Sėkmingas asmenvardžių, vietovardžių, datų ir kitų esybių atpažinimas yra gyvybiškai svarbus anonimizuojant tekstus ar atliekant specifinės informacijos paiešką. Šis modelis taip pat gali būti pritaikytas sentimentų analizei ir kitoms kalbos apdorojimo užduotims.

UAB Neurotechnology natūralios kalbos apdorojimo vyr. specialistas Vytas Mulevičius pabrėžia lietuviškos inovacijos svarbą: „Šis modelis yra žymiai geresnis negu esami rinkoje. … Anksčiau tokius lietuvių kalbos modelius buvo kūrę slovėnų, slovakų tyrėjai, bet lietuviško vardo ten nerasi. Dabar yra lietuviškas modelis, kurį sukūrė lietuviai.“

Iki 2030 m. siekiama, kad Projekto rezultatai, įskaitant visus Tekstyno duomenis, taptų viešai prieinami ir būtų galima juos pakartotinai naudoti kuriant naujus lietuvių kalbos modelius, taip prisidedant prie šalies skaitmeninimo plėtros programos įgyvendinimo.

Žymos: DIValstybės skaitmeninių sprendimų agentūraVDU
Edita Liškauskė

Edita Liškauskė

Siekiu operatyviai dalytis aktualiomis ir įdomiomis naujienomis su skaitytojais.

Kiti straipsniai

Sezoninė darbo rinka įsibėgėja sparčiau nei pernai
Apžvalgos

Sezoninė darbo rinka įsibėgėja sparčiau nei pernai

2026-05-12
Aktualijos

Elektromobiliai kasdienybėje: ekspertas paneigia populiariausius mitus

2026-05-06
Darbo rinkos paradoksas: trūksta šimtų gerai apmokamų darbuotojų, bet lietuviai perspektyvų čia nemato
Lietuva

Darbo rinkos paradoksas: trūksta šimtų gerai apmokamų darbuotojų, bet lietuviai perspektyvų čia nemato

2026-05-05
Šunys – šaulių draugai ir pagalbininkai
Įdomu

Šunys – šaulių draugai ir pagalbininkai

2026-04-24
19 sekundžių, pakeitusios internetą: pirmasis „YouTube“ video švenčia gimtadienį
Laisvalaikis

19 sekundžių, pakeitusios internetą: pirmasis „YouTube“ video švenčia gimtadienį

2026-04-22
Šiąnakt elektriniai paspirtukai miestuose bus „išjungti“
Lietuva

Iš „Bolt“ bus galima nemokamai pasiimti savo šalmą

2026-04-22
Maži Lietuvos miesteliai slepia įdomias istorijas ir netikėtus atradimus
Įdomu

Maži Lietuvos miesteliai slepia įdomias istorijas ir netikėtus atradimus

2026-04-21
Viliojantys būstai už Vilniaus ribų: didžiulį potencialą turi dar penki miestai
Apžvalgos

Viliojantys būstai už Vilniaus ribų: didžiulį potencialą turi dar penki miestai

2026-04-21
Gydytojo verdiktas: šalmas paspirtukininkams turi būti privalomas
Lietuva

Galvos skausmas „Boltui“ – visoje Lietuvoje jau dingę daugiau nei 2500 šalmų, o žmonės rūpinasi higiena

2026-04-15

Rekomenduojame

Kaip elektroniniu būdu nutraukti narystę partijoje?

Kaip elektroniniu būdu nutraukti narystę partijoje?

2021-09-30 - Atnaujinta 2024-04-06
Mobilusis

Įdomi lietuviška alternatyva reklamų persunktiems socialiniams tinklams

2026-03-17 - Atnaujinta 2026-04-26
Kad per Heloviną netrūktų šiurpuliukų: 6 siaubą keliantys filmai bei laidos

Kad per Heloviną netrūktų šiurpuliukų: 6 siaubą keliantys filmai bei laidos

2024-10-30
Kaip iškepti sultingą ir aromatingą kiaulienos nugarinės kepsnį ant grotelių: pataria profesionalas

Kaip iškepti sultingą ir aromatingą kiaulienos nugarinės kepsnį ant grotelių: pataria profesionalas

2024-04-12
Proneta Proneta Proneta

Naujienos

Free finga

Festivalyje „Myliu Palangą“ – Monika Liu, „Free Finga“, „Katarsis“, „Beissoul & Einius“ ir kiti atlikėjai

2026-05-25
Paradoksas: kodėl bitėms Vilniuje gyventi net geriau nei kaime?

Paradoksas: kodėl bitėms Vilniuje gyventi net geriau nei kaime?

2026-05-21
Pirmą kartą Istoriniame Trakų Vokės dvare – reziduojantys tarptautiniai kino kūrėjai

Pirmą kartą Istoriniame Trakų Vokės dvare – reziduojantys tarptautiniai kino kūrėjai

2026-05-20
„Red Bull Tandemynės“ atskleidžia pilną sąstatą: teisėjaus Dakaro ir interneto žvaigždės, į upę skries garsiausias šalies keliautojas

„Red Bull Tandemynės“ atskleidžia pilną sąstatą: teisėjaus Dakaro ir interneto žvaigždės, į upę skries garsiausias šalies keliautojas

2026-05-19
Verta pamatyti

Naujienos, žinios, įdomybės, patarimai ir apžvalgos iš Lietuvos ir viso pasaulio.

Nauja

Free finga
Aktualijos

Festivalyje „Myliu Palangą“ – Monika Liu, „Free Finga“, „Katarsis“, „Beissoul & Einius“ ir kiti atlikėjai

2026-05-25

Lankoma

Kad per Heloviną netrūktų šiurpuliukų: 6 siaubą keliantys filmai bei laidos
Kinas

Kad per Heloviną netrūktų šiurpuliukų: 6 siaubą keliantys filmai bei laidos

2024-10-30

Reklama

Proneta Proneta Proneta
  • Rašyti redakcijai
  • Naudojimosi taisyklės
  • Akcininkai
  • Privatumo politika
  • Kontaktai

Rezultatų nėra
Žiūrėti visus rezultatus
  • Naujienos
  • Laisvalaikis
  • Kinas
  • Technologijos
  • Receptai
  • Sveikata
  • Auto