Pamatyti
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
PAMATYTI.LT
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
Pamatyti.lt
Rezultatų nėra
Žiūrėti visus rezultatus

Sukurtas pirmasis lietuvių kalbos DI modelis: žengiame į ateitį

Edita Liškauskė Edita Liškauskė
2025-11-10
Lietuva, Mokslas ir studijos, Technologijos
Laikas: 2 min skaitymo
Pradžia Lietuva
Dalintis FacebookDalintis X

Valstybės skaitmeninių sprendimų agentūra (VSSA), kartu su mokslo ir verslo partneriais, žengia svarbų žingsnį plėtojant lietuvių kalbos dirbtinio intelekto (DI) sprendimus. Viešai paskelbtas pirmasis praktinis rezultatas – „Mažasis lietuvių kalbos vektorizuotas modelis“, atveriantis naujas galimybes inovacijoms.

Vienas didžiausių iššūkių plėtojant dirbtinio intelekto technologijas yra pakankamai gausūs ir kokybiški kalbiniai ištekliai. Šią spragą siekia užpildyti VSSA kartu su Vytauto Didžiojo universitetu (VDU), UAB Neurotechnology, UAB Tilde Lietuva ir MB Krilas įgyvendinamas projektas „Bendrojo lietuvių kalbos tekstyno ir vektorizuotų modelių sukūrimas“.

Didžiausias Autentiškas Lietuvių Kalbos Tekstynas

Kiti straipsniai

Šauliai

Pasiektas rekordinis šaulių skaičius: didžioji dauguma – turintys aukštąjį išsilavinimą, absoliuti dauguma – dirbantys

2026-01-21
Jaunieji Lietuvos šokėjai iš tarptautinių varžybose Barselonoje parsiveža sidabrą

Jaunieji Lietuvos šokėjai iš tarptautinių varžybose Barselonoje parsiveža sidabrą

2026-01-21

Svarbiausias projekto etapas – Bendrojo lietuvių kalbos tekstyno formavimas. Tai bus didžiausias lig šiol sukauptas lietuviškas tekstynas, apimantis net 3,5 mlrd. žodžių patikrintų, žmogaus kurtų (ne DI generuotų) tekstų. Šis didžiulis autentiškas duomenų kiekis yra kritiškai svarbus efektyviam DI modelių apmokymui.

VDU vyresnysis mokslo darbuotojas dr. Andrius Utka, atstovaujantis tiekėjų grupei, pabrėžia: „Mažasis lietuvių kalbos vektorizuotas modelis yra apmokytas su daugiau nei puse planuojamo sukaupti Tekstyno, t. y. 1,87 mlrd. žodžių. Galima sakyti, kad kol kas tai yra didžiausias tokios kokybės lietuvių kalbos tekstų rinkinys vienoje vietoje.“

Prieinamumas ir Konkurencingumas

Lapkričio 3 d. viešai prieinamas tapo pirmasis apmokytas neuroninis modelis – Mažasis lietuvių kalbos vektorizuotas modelis (LT-MLKM-modernBERT). Šis „iš anksto apmokytas“ (pre-trained) modelis „užkoduoja“ kalbą kompiuteriui suprantamu būdu, taip sudarydamas sąlygas DI inovacijų kūrėjams kurti įvairius sprendimus: nuo pokalbių robotų iki teksto generavimo įrankių.

Modelis patalpintas atvirojoje prieigoje, populiarioje „Hugging Face“ platformoje.

  • Modelio nuoroda: VSSA-SDSA (State Digital Solutions Agency (LT))
  • Validavimo kodas: VSSA-AtvirasKodas-LT/LT_AI-NER
  • Metaduomenys: Lietuvos atvirų duomenų portalas | Mažasis lietuvių kalbos vektorizuotas modelis

Praktinis Pranašumas Rinkoje

Modelio efektyvumas jau patvirtintas pritaikant jį įvardytųjų esybių atpažinimo (named entity recognition, NER) užduočiai. Sėkmingas asmenvardžių, vietovardžių, datų ir kitų esybių atpažinimas yra gyvybiškai svarbus anonimizuojant tekstus ar atliekant specifinės informacijos paiešką. Šis modelis taip pat gali būti pritaikytas sentimentų analizei ir kitoms kalbos apdorojimo užduotims.

UAB Neurotechnology natūralios kalbos apdorojimo vyr. specialistas Vytas Mulevičius pabrėžia lietuviškos inovacijos svarbą: „Šis modelis yra žymiai geresnis negu esami rinkoje. … Anksčiau tokius lietuvių kalbos modelius buvo kūrę slovėnų, slovakų tyrėjai, bet lietuviško vardo ten nerasi. Dabar yra lietuviškas modelis, kurį sukūrė lietuviai.“

Iki 2030 m. siekiama, kad Projekto rezultatai, įskaitant visus Tekstyno duomenis, taptų viešai prieinami ir būtų galima juos pakartotinai naudoti kuriant naujus lietuvių kalbos modelius, taip prisidedant prie šalies skaitmeninimo plėtros programos įgyvendinimo.

Žymos: DIValstybės skaitmeninių sprendimų agentūraVDU
Edita Liškauskė

Edita Liškauskė

Siekiu operatyviai dalytis aktualiomis ir įdomiomis naujienomis su skaitytojais.

Kiti straipsniai

Mobilusis telefonas
Technologijos

„Asus“ pasitraukia iš išmaniųjų telefonų verslo

2026-01-21
Pasiruoškite, netrukus „Facebook“ užtvindys DI generuotas turinys
Aktualijos

Internetą perima botai: daugiau nei pusę turinio jau generuoja DI

2026-01-16
Intensyvus snygis tęsiasi, draudikai įspėja – tai gali būti rimta. Kaip elgtis?
Aktualijos

Intensyvus snygis tęsiasi, draudikai įspėja – tai gali būti rimta. Kaip elgtis?

2026-01-10
Baterija laikydavo savaitę: kodėl „Nokia 3310“ vis dar kelia nostalgiją?
Įdomu

Baterija laikydavo savaitę: kodėl „Nokia 3310“ vis dar kelia nostalgiją?

2026-01-09
Mobilus
Aktualijos

Žiemos šaltukas ir išmanieji įrenginiai: paaiškino, kada gali tekti kreiptis į meistrą

2026-01-07
Dirbtinis intelektas jau gali daugiau už žmogų, bet be jo vis dar negali
Įdomu

Dirbtinis intelektas jau gali daugiau už žmogų, bet be jo vis dar negali

2026-01-06
JAV griežtina dronų ir jų komponentų kilmės kontrolę: specialistas įspėja – saugumo grėsmių prevencija negali vykti Europos saugumo sąskaita
Technologijos

JAV griežtina dronų ir jų komponentų kilmės kontrolę: specialistas įspėja – saugumo grėsmių prevencija negali vykti Europos saugumo sąskaita

2026-01-01 - Atnaujinta 2026-01-02
Dokumentinis filmas, kurį reikia pamatyti kiekvienam lietuviui
Istorija

Dokumentinis filmas, kurį reikia pamatyti kiekvienam lietuviui

2025-12-31
2026 metais žmonės tikisi daugiau sutaupyti, jaunimas – įsigyti būstą
Apžvalgos

2026 metais žmonės tikisi daugiau sutaupyti, jaunimas – įsigyti būstą

2025-12-31

Rekomenduojame

Namų televizorius

„Sony Bravia“ pereina į TCL rankas

2026-01-21 - Atnaujinta 2026-01-22
Stranger things

Serialas „Keisti dalykai“ išstumtas iš Netflix TOP 10 serialų sąrašo

2025-12-09
AVATAR: FIRE AND ASH Reviews And Rotten Tomatoes Score Land – Is It Worth Taking Another Trip To Pandora?

Džeimso Kamerono filmo „Įsikūnijimas: Ugnis ir pelenai“ pajamos pasiekė simbolinę ribą

2026-01-10 - Atnaujinta 2026-01-11
Kopa: Antroji dalis

„Kopa“ režisierius Denis Villeneuve’as sako, kad trečioji dalis oficialiai „rengiama“

2024-09-10
Proneta Proneta Proneta

Naujienos

Free Finga surengs dienos festivalį netikėtoje, tačiau visiems žinomoje sostinės erdvėje

Free Finga surengs dienos festivalį netikėtoje, tačiau visiems žinomoje sostinės erdvėje

2026-02-09
Festivalis „MURMURS“ skelbia programą: pasirodys Alina Orlova, Rūta MUR, „Mėlyna“, „Akli“ ir kiti aktualiausi alternatyvios muzikos vardai

Festivalis „MURMURS“ skelbia programą: pasirodys Alina Orlova, Rūta MUR, „Mėlyna“, „Akli“ ir kiti aktualiausi alternatyvios muzikos vardai

2026-02-04
Vilniuje atsidarė nuotaikinga meno erdvė – Meškinų muziejus „PLUSHY B 55“

Vilniuje atsidarė nuotaikinga meno erdvė – Meškinų muziejus „PLUSHY B 55“

2026-02-04
Policijos reidai keliuose lapkričio mėnesį

Vasario reidai Lietuvos keliuose

2026-02-03
Verta pamatyti

Naujienos, žinios, įdomybės, patarimai ir apžvalgos iš Lietuvos ir viso pasaulio.

Nauja

Free Finga surengs dienos festivalį netikėtoje, tačiau visiems žinomoje sostinės erdvėje
Laisvalaikis

Free Finga surengs dienos festivalį netikėtoje, tačiau visiems žinomoje sostinės erdvėje

2026-02-09

Lankoma

Free Finga surengs dienos festivalį netikėtoje, tačiau visiems žinomoje sostinės erdvėje
Laisvalaikis

Free Finga surengs dienos festivalį netikėtoje, tačiau visiems žinomoje sostinės erdvėje

2026-02-09

Reklama

Proneta Proneta Proneta
  • Rašyti redakcijai
  • Naudojimosi taisyklės
  • Akcininkai
  • Privatumo politika
  • Kontaktai

Rezultatų nėra
Žiūrėti visus rezultatus
  • Naujienos
  • Laisvalaikis
  • Kinas
  • Technologijos
  • Receptai
  • Sveikata
  • Auto