Pamatyti
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
PAMATYTI.LT
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
Pamatyti.lt
Rezultatų nėra
Žiūrėti visus rezultatus

Sukurtas pirmasis lietuvių kalbos DI modelis: žengiame į ateitį

Edita Liškauskė Edita Liškauskė
2025-11-10
Lietuva, Mokslas ir studijos, Technologijos
Laikas: 2 min skaitymo
Pradžia Lietuva
Dalintis FacebookDalintis X

Valstybės skaitmeninių sprendimų agentūra (VSSA), kartu su mokslo ir verslo partneriais, žengia svarbų žingsnį plėtojant lietuvių kalbos dirbtinio intelekto (DI) sprendimus. Viešai paskelbtas pirmasis praktinis rezultatas – „Mažasis lietuvių kalbos vektorizuotas modelis“, atveriantis naujas galimybes inovacijoms.

Vienas didžiausių iššūkių plėtojant dirbtinio intelekto technologijas yra pakankamai gausūs ir kokybiški kalbiniai ištekliai. Šią spragą siekia užpildyti VSSA kartu su Vytauto Didžiojo universitetu (VDU), UAB Neurotechnology, UAB Tilde Lietuva ir MB Krilas įgyvendinamas projektas „Bendrojo lietuvių kalbos tekstyno ir vektorizuotų modelių sukūrimas“.

Didžiausias Autentiškas Lietuvių Kalbos Tekstynas

Kiti straipsniai

Naršymas internete

Vilniaus rajono technologinis šuolis – gyventojams jau prieinamas iki 10 Gb/s internetas

2026-01-27
Marijampolė veržiasi į ateities inžinerijos elitą

Marijampolė veržiasi į ateities inžinerijos elitą

2026-01-27 - Atnaujinta 2026-01-30

Svarbiausias projekto etapas – Bendrojo lietuvių kalbos tekstyno formavimas. Tai bus didžiausias lig šiol sukauptas lietuviškas tekstynas, apimantis net 3,5 mlrd. žodžių patikrintų, žmogaus kurtų (ne DI generuotų) tekstų. Šis didžiulis autentiškas duomenų kiekis yra kritiškai svarbus efektyviam DI modelių apmokymui.

VDU vyresnysis mokslo darbuotojas dr. Andrius Utka, atstovaujantis tiekėjų grupei, pabrėžia: „Mažasis lietuvių kalbos vektorizuotas modelis yra apmokytas su daugiau nei puse planuojamo sukaupti Tekstyno, t. y. 1,87 mlrd. žodžių. Galima sakyti, kad kol kas tai yra didžiausias tokios kokybės lietuvių kalbos tekstų rinkinys vienoje vietoje.“

Prieinamumas ir Konkurencingumas

Lapkričio 3 d. viešai prieinamas tapo pirmasis apmokytas neuroninis modelis – Mažasis lietuvių kalbos vektorizuotas modelis (LT-MLKM-modernBERT). Šis „iš anksto apmokytas“ (pre-trained) modelis „užkoduoja“ kalbą kompiuteriui suprantamu būdu, taip sudarydamas sąlygas DI inovacijų kūrėjams kurti įvairius sprendimus: nuo pokalbių robotų iki teksto generavimo įrankių.

Modelis patalpintas atvirojoje prieigoje, populiarioje „Hugging Face“ platformoje.

  • Modelio nuoroda: VSSA-SDSA (State Digital Solutions Agency (LT))
  • Validavimo kodas: VSSA-AtvirasKodas-LT/LT_AI-NER
  • Metaduomenys: Lietuvos atvirų duomenų portalas | Mažasis lietuvių kalbos vektorizuotas modelis

Praktinis Pranašumas Rinkoje

Modelio efektyvumas jau patvirtintas pritaikant jį įvardytųjų esybių atpažinimo (named entity recognition, NER) užduočiai. Sėkmingas asmenvardžių, vietovardžių, datų ir kitų esybių atpažinimas yra gyvybiškai svarbus anonimizuojant tekstus ar atliekant specifinės informacijos paiešką. Šis modelis taip pat gali būti pritaikytas sentimentų analizei ir kitoms kalbos apdorojimo užduotims.

UAB Neurotechnology natūralios kalbos apdorojimo vyr. specialistas Vytas Mulevičius pabrėžia lietuviškos inovacijos svarbą: „Šis modelis yra žymiai geresnis negu esami rinkoje. … Anksčiau tokius lietuvių kalbos modelius buvo kūrę slovėnų, slovakų tyrėjai, bet lietuviško vardo ten nerasi. Dabar yra lietuviškas modelis, kurį sukūrė lietuviai.“

Iki 2030 m. siekiama, kad Projekto rezultatai, įskaitant visus Tekstyno duomenis, taptų viešai prieinami ir būtų galima juos pakartotinai naudoti kuriant naujus lietuvių kalbos modelius, taip prisidedant prie šalies skaitmeninimo plėtros programos įgyvendinimo.

Žymos: DIValstybės skaitmeninių sprendimų agentūraVDU
Edita Liškauskė

Edita Liškauskė

Siekiu operatyviai dalytis aktualiomis ir įdomiomis naujienomis su skaitytojais.

Kiti straipsniai

Šauliai
Aktualijos

Pasiektas rekordinis šaulių skaičius: didžioji dauguma – turintys aukštąjį išsilavinimą, absoliuti dauguma – dirbantys

2026-01-21
Jaunieji Lietuvos šokėjai iš tarptautinių varžybose Barselonoje parsiveža sidabrą
Lietuva

Jaunieji Lietuvos šokėjai iš tarptautinių varžybose Barselonoje parsiveža sidabrą

2026-01-21
Mobilusis telefonas
Technologijos

„Asus“ pasitraukia iš išmaniųjų telefonų verslo

2026-01-21
Pasiruoškite, netrukus „Facebook“ užtvindys DI generuotas turinys
Aktualijos

Internetą perima botai: daugiau nei pusę turinio jau generuoja DI

2026-01-16
Intensyvus snygis tęsiasi, draudikai įspėja – tai gali būti rimta. Kaip elgtis?
Aktualijos

Intensyvus snygis tęsiasi, draudikai įspėja – tai gali būti rimta. Kaip elgtis?

2026-01-10
Baterija laikydavo savaitę: kodėl „Nokia 3310“ vis dar kelia nostalgiją?
Įdomu

Baterija laikydavo savaitę: kodėl „Nokia 3310“ vis dar kelia nostalgiją?

2026-01-09
Mobilus
Aktualijos

Žiemos šaltukas ir išmanieji įrenginiai: paaiškino, kada gali tekti kreiptis į meistrą

2026-01-07
Dirbtinis intelektas jau gali daugiau už žmogų, bet be jo vis dar negali
Įdomu

Dirbtinis intelektas jau gali daugiau už žmogų, bet be jo vis dar negali

2026-01-06
JAV griežtina dronų ir jų komponentų kilmės kontrolę: specialistas įspėja – saugumo grėsmių prevencija negali vykti Europos saugumo sąskaita
Technologijos

JAV griežtina dronų ir jų komponentų kilmės kontrolę: specialistas įspėja – saugumo grėsmių prevencija negali vykti Europos saugumo sąskaita

2026-01-01 - Atnaujinta 2026-01-02

Rekomenduojame

Kaip elektroniniu būdu nutraukti narystę partijoje?

Kaip elektroniniu būdu nutraukti narystę partijoje?

2021-09-30 - Atnaujinta 2024-04-06
FK „Sūduva“ pristatė naują identitetą ir sezono planus

FK „Sūduva“ pristatė naują identitetą ir sezono planus

2026-02-11
Stranger things

Serialas „Keisti dalykai“ išstumtas iš Netflix TOP 10 serialų sąrašo

2025-12-09
„Mumija 4“: Brendanas Fraseris ir Rachelė Weisz oficialiai grįžta, paskelbus filmo premjeros datą

„Mumija 4“: Brendanas Fraseris ir Rachelė Weisz oficialiai grįžta, paskelbus filmo premjeros datą

2026-02-14
Proneta Proneta Proneta

Naujienos

SILO Season 4 Wraps Filming As Fans Await Season 3 Release

„Šachta“ 4 sezono filmavimas baigtas, laukiama 3 sezono pasirodymo

2026-03-10
Karas Ukrainoje

4 karo metai – kuo prisidėjo Lietuva prie Ukrainos gynybos?

2026-02-24
Ką apie jus pasako Valentino dienos dovana? Sužinokite, kuriam tipui priklausote

Ką apie jus pasako Valentino dienos dovana? Sužinokite, kuriam tipui priklausote

2026-02-11
Rudens sezonas: ką verta žinoti apie grožio rutiną ir makiažo tendencijas

Kosmetologė atskleidė: renkantis kosmetiką svarbu ne odos tipas, o būklė

2026-02-10
Verta pamatyti

Naujienos, žinios, įdomybės, patarimai ir apžvalgos iš Lietuvos ir viso pasaulio.

Nauja

SILO Season 4 Wraps Filming As Fans Await Season 3 Release
Kinas

„Šachta“ 4 sezono filmavimas baigtas, laukiama 3 sezono pasirodymo

2026-03-10

Lankoma

Kaip elektroniniu būdu nutraukti narystę partijoje?
Aktualijos

Kaip elektroniniu būdu nutraukti narystę partijoje?

2021-09-30 - Atnaujinta 2024-04-06

Reklama

Proneta Proneta Proneta
  • Rašyti redakcijai
  • Naudojimosi taisyklės
  • Akcininkai
  • Privatumo politika
  • Kontaktai

Rezultatų nėra
Žiūrėti visus rezultatus
  • Naujienos
  • Laisvalaikis
  • Kinas
  • Technologijos
  • Receptai
  • Sveikata
  • Auto