Pamatyti
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
PAMATYTI.LT
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
Pamatyti.lt
Rezultatų nėra
Žiūrėti visus rezultatus

Sukurtas pirmasis lietuvių kalbos DI modelis: žengiame į ateitį

Edita Liškauskė Edita Liškauskė
2025-11-10
Lietuva, Mokslas ir studijos, Technologijos
Laikas: 2 min skaitymo
Pradžia Lietuva
Dalintis FacebookDalintis X

Valstybės skaitmeninių sprendimų agentūra (VSSA), kartu su mokslo ir verslo partneriais, žengia svarbų žingsnį plėtojant lietuvių kalbos dirbtinio intelekto (DI) sprendimus. Viešai paskelbtas pirmasis praktinis rezultatas – „Mažasis lietuvių kalbos vektorizuotas modelis“, atveriantis naujas galimybes inovacijoms.

Vienas didžiausių iššūkių plėtojant dirbtinio intelekto technologijas yra pakankamai gausūs ir kokybiški kalbiniai ištekliai. Šią spragą siekia užpildyti VSSA kartu su Vytauto Didžiojo universitetu (VDU), UAB Neurotechnology, UAB Tilde Lietuva ir MB Krilas įgyvendinamas projektas „Bendrojo lietuvių kalbos tekstyno ir vektorizuotų modelių sukūrimas“.

Didžiausias Autentiškas Lietuvių Kalbos Tekstynas

Kiti straipsniai

Startuoliai Lietuvoje: panašu, kad artėja naujas augimo etapas

Startuoliai Lietuvoje: panašu, kad artėja naujas augimo etapas

2026-04-02
Avaringumas didmiesčiuose auga: kurios gatvės pavojingiausios ir kokie automobiliai nukenčia dažniausiai

Avaringumas didmiesčiuose auga: kurios gatvės pavojingiausios ir kokie automobiliai nukenčia dažniausiai

2026-04-02

Svarbiausias projekto etapas – Bendrojo lietuvių kalbos tekstyno formavimas. Tai bus didžiausias lig šiol sukauptas lietuviškas tekstynas, apimantis net 3,5 mlrd. žodžių patikrintų, žmogaus kurtų (ne DI generuotų) tekstų. Šis didžiulis autentiškas duomenų kiekis yra kritiškai svarbus efektyviam DI modelių apmokymui.

VDU vyresnysis mokslo darbuotojas dr. Andrius Utka, atstovaujantis tiekėjų grupei, pabrėžia: „Mažasis lietuvių kalbos vektorizuotas modelis yra apmokytas su daugiau nei puse planuojamo sukaupti Tekstyno, t. y. 1,87 mlrd. žodžių. Galima sakyti, kad kol kas tai yra didžiausias tokios kokybės lietuvių kalbos tekstų rinkinys vienoje vietoje.“

Prieinamumas ir Konkurencingumas

Lapkričio 3 d. viešai prieinamas tapo pirmasis apmokytas neuroninis modelis – Mažasis lietuvių kalbos vektorizuotas modelis (LT-MLKM-modernBERT). Šis „iš anksto apmokytas“ (pre-trained) modelis „užkoduoja“ kalbą kompiuteriui suprantamu būdu, taip sudarydamas sąlygas DI inovacijų kūrėjams kurti įvairius sprendimus: nuo pokalbių robotų iki teksto generavimo įrankių.

Modelis patalpintas atvirojoje prieigoje, populiarioje „Hugging Face“ platformoje.

  • Modelio nuoroda: VSSA-SDSA (State Digital Solutions Agency (LT))
  • Validavimo kodas: VSSA-AtvirasKodas-LT/LT_AI-NER
  • Metaduomenys: Lietuvos atvirų duomenų portalas | Mažasis lietuvių kalbos vektorizuotas modelis

Praktinis Pranašumas Rinkoje

Modelio efektyvumas jau patvirtintas pritaikant jį įvardytųjų esybių atpažinimo (named entity recognition, NER) užduočiai. Sėkmingas asmenvardžių, vietovardžių, datų ir kitų esybių atpažinimas yra gyvybiškai svarbus anonimizuojant tekstus ar atliekant specifinės informacijos paiešką. Šis modelis taip pat gali būti pritaikytas sentimentų analizei ir kitoms kalbos apdorojimo užduotims.

UAB Neurotechnology natūralios kalbos apdorojimo vyr. specialistas Vytas Mulevičius pabrėžia lietuviškos inovacijos svarbą: „Šis modelis yra žymiai geresnis negu esami rinkoje. … Anksčiau tokius lietuvių kalbos modelius buvo kūrę slovėnų, slovakų tyrėjai, bet lietuviško vardo ten nerasi. Dabar yra lietuviškas modelis, kurį sukūrė lietuviai.“

Iki 2030 m. siekiama, kad Projekto rezultatai, įskaitant visus Tekstyno duomenis, taptų viešai prieinami ir būtų galima juos pakartotinai naudoti kuriant naujus lietuvių kalbos modelius, taip prisidedant prie šalies skaitmeninimo plėtros programos įgyvendinimo.

Žymos: DIValstybės skaitmeninių sprendimų agentūraVDU
Edita Liškauskė

Edita Liškauskė

Siekiu operatyviai dalytis aktualiomis ir įdomiomis naujienomis su skaitytojais.

Kiti straipsniai

Pinigai
Finansai

Svarstote, ar kaupti II pakopoje toliau? Nedarykite vienos klaidos

2026-04-01
DI jūsų telefone: kaip patogiai jį išnaudoti?
Technologijos

Ką daryti, kad jūsų telefonas tarnautų ilgiau? Paprasti būdai

2026-03-27
Lietuva vėl suks laikrodžių rodykles: kada nustosime tai daryti?
Aktualijos

Lietuva vėl suks laikrodžių rodykles: kada nustosime tai daryti?

2026-03-26
Kai mūšio laukas – žmonių protai: šauliai imasi veiksmų
Krašto apsauga

Kai mūšio laukas – žmonių protai: šauliai imasi veiksmų

2026-03-20
Mobilusis
Technologijos

Įdomi lietuviška alternatyva reklamų persunktiems socialiniams tinklams

2026-03-17 - Atnaujinta 2026-03-20
Programuotojų ateitis: kaip tapti protingesniam už DI?
Mokslas ir studijos

Programuotojų ateitis: kaip tapti protingesniam už DI?

2026-03-14
Kripto valiutos
Finansai

Teismas patvirtino, kad bitkoinai yra turtas, o ne valiuta, tačiau apribojo VMI praktikas nepripažinti leidžiamų atskaitymų

2026-03-09
Technologijos

Naujos patirtys su „Galaxy“ kamera: sudėtingas kūrybines užduotis bus galima atlikti dar paprasčiau

2026-02-18
Naršymas internete
Technologijos

Vilniaus rajono technologinis šuolis – gyventojams jau prieinamas iki 10 Gb/s internetas

2026-01-27

Rekomenduojame

Kaip elektroniniu būdu nutraukti narystę partijoje?

Kaip elektroniniu būdu nutraukti narystę partijoje?

2021-09-30 - Atnaujinta 2024-04-06
Kopa: Antroji dalis

„Kopa“ režisierius Denis Villeneuve’as sako, kad trečioji dalis oficialiai „rengiama“

2024-09-10
SILO Season 4 Wraps Filming As Fans Await Season 3 Release

„Šachta“ 4 sezono filmavimas baigtas, laukiama 3 sezono pasirodymo

2026-03-10 - Atnaujinta 2026-03-17
Witcher 4

Netflix „Raganiaus“ adaptacija pasibaigs 5-ajame sezone

2024-04-19
Proneta Proneta Proneta

Naujienos

5 nuotaikingų Velykų užkandžių idėjos: bus verti „Instagramo“

2026-04-04
Prie legendinio „Kiaušinio“ – pavasario sutiktuvės su „Baltuoju kiru“ ir kūrybinėmis veiklomis visai šeimai

Prie legendinio „Kiaušinio“ – pavasario sutiktuvės su „Baltuoju kiru“ ir kūrybinėmis veiklomis visai šeimai

2026-04-03
Lupant prie lukšto liko pusė kiaušinio? Kaip to išvengti

Lupant prie lukšto liko pusė kiaušinio? Kaip to išvengti

2026-04-03
Nugalėtojų šefų duetas siūlo tobulą Velykų stalo meniu: telieka pasinaudoti idėjomis

Nugalėtojų šefų duetas siūlo tobulą Velykų stalo meniu: telieka pasinaudoti idėjomis

2026-04-02
Verta pamatyti

Naujienos, žinios, įdomybės, patarimai ir apžvalgos iš Lietuvos ir viso pasaulio.

Nauja

Velykų tradicijos Lietuvoje: nuo senųjų papročių iki šventinio stalo
Įdomu

Velykų tradicijos Lietuvoje: nuo senųjų papročių iki šventinio stalo

2026-04-04

Lankoma

Kaip elektroniniu būdu nutraukti narystę partijoje?
Aktualijos

Kaip elektroniniu būdu nutraukti narystę partijoje?

2021-09-30 - Atnaujinta 2024-04-06

Reklama

Proneta Proneta Proneta
  • Rašyti redakcijai
  • Naudojimosi taisyklės
  • Akcininkai
  • Privatumo politika
  • Kontaktai

Rezultatų nėra
Žiūrėti visus rezultatus
  • Naujienos
  • Laisvalaikis
  • Kinas
  • Technologijos
  • Receptai
  • Sveikata
  • Auto