Pamatyti
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
PAMATYTI.LT
  • Laisvalaikis
  • Kinas
  • Sportas
  • Technologijos
  • Receptai
  • Auto
Rezultatų nėra
Žiūrėti visus rezultatus
Pamatyti.lt
Rezultatų nėra
Žiūrėti visus rezultatus

Sukurtas pirmasis lietuvių kalbos DI modelis: žengiame į ateitį

Edita Liškauskė
2025-11-10
Lietuva, Mokslas ir studijos, Technologijos
Laikas: 2 min skaitymo
Pradžia Lietuva
Dalintis FacebookDalintis X

Valstybės skaitmeninių sprendimų agentūra (VSSA), kartu su mokslo ir verslo partneriais, žengia svarbų žingsnį plėtojant lietuvių kalbos dirbtinio intelekto (DI) sprendimus. Viešai paskelbtas pirmasis praktinis rezultatas – „Mažasis lietuvių kalbos vektorizuotas modelis“, atveriantis naujas galimybes inovacijoms.

Vienas didžiausių iššūkių plėtojant dirbtinio intelekto technologijas yra pakankamai gausūs ir kokybiški kalbiniai ištekliai. Šią spragą siekia užpildyti VSSA kartu su Vytauto Didžiojo universitetu (VDU), UAB Neurotechnology, UAB Tilde Lietuva ir MB Krilas įgyvendinamas projektas „Bendrojo lietuvių kalbos tekstyno ir vektorizuotų modelių sukūrimas“.

Didžiausias Autentiškas Lietuvių Kalbos Tekstynas

Kiti straipsniai

Šaulių priesaika

Apsisprendę tapti šauliais: sukauptą patirtį galime panaudoti Tėvynės labui

2025-11-26
Didžiausias kačių augintojų galvos skausmas: kaip kraiko dėžė tampa konfliktų priežastimi?

Didžiausias kačių augintojų galvos skausmas: kaip kraiko dėžė tampa konfliktų priežastimi?

2025-11-22

Svarbiausias projekto etapas – Bendrojo lietuvių kalbos tekstyno formavimas. Tai bus didžiausias lig šiol sukauptas lietuviškas tekstynas, apimantis net 3,5 mlrd. žodžių patikrintų, žmogaus kurtų (ne DI generuotų) tekstų. Šis didžiulis autentiškas duomenų kiekis yra kritiškai svarbus efektyviam DI modelių apmokymui.

VDU vyresnysis mokslo darbuotojas dr. Andrius Utka, atstovaujantis tiekėjų grupei, pabrėžia: „Mažasis lietuvių kalbos vektorizuotas modelis yra apmokytas su daugiau nei puse planuojamo sukaupti Tekstyno, t. y. 1,87 mlrd. žodžių. Galima sakyti, kad kol kas tai yra didžiausias tokios kokybės lietuvių kalbos tekstų rinkinys vienoje vietoje.“

Prieinamumas ir Konkurencingumas

Lapkričio 3 d. viešai prieinamas tapo pirmasis apmokytas neuroninis modelis – Mažasis lietuvių kalbos vektorizuotas modelis (LT-MLKM-modernBERT). Šis „iš anksto apmokytas“ (pre-trained) modelis „užkoduoja“ kalbą kompiuteriui suprantamu būdu, taip sudarydamas sąlygas DI inovacijų kūrėjams kurti įvairius sprendimus: nuo pokalbių robotų iki teksto generavimo įrankių.

Modelis patalpintas atvirojoje prieigoje, populiarioje „Hugging Face“ platformoje.

  • Modelio nuoroda: VSSA-SDSA (State Digital Solutions Agency (LT))
  • Validavimo kodas: VSSA-AtvirasKodas-LT/LT_AI-NER
  • Metaduomenys: Lietuvos atvirų duomenų portalas | Mažasis lietuvių kalbos vektorizuotas modelis

Praktinis Pranašumas Rinkoje

Modelio efektyvumas jau patvirtintas pritaikant jį įvardytųjų esybių atpažinimo (named entity recognition, NER) užduočiai. Sėkmingas asmenvardžių, vietovardžių, datų ir kitų esybių atpažinimas yra gyvybiškai svarbus anonimizuojant tekstus ar atliekant specifinės informacijos paiešką. Šis modelis taip pat gali būti pritaikytas sentimentų analizei ir kitoms kalbos apdorojimo užduotims.

UAB Neurotechnology natūralios kalbos apdorojimo vyr. specialistas Vytas Mulevičius pabrėžia lietuviškos inovacijos svarbą: „Šis modelis yra žymiai geresnis negu esami rinkoje. … Anksčiau tokius lietuvių kalbos modelius buvo kūrę slovėnų, slovakų tyrėjai, bet lietuviško vardo ten nerasi. Dabar yra lietuviškas modelis, kurį sukūrė lietuviai.“

Iki 2030 m. siekiama, kad Projekto rezultatai, įskaitant visus Tekstyno duomenis, taptų viešai prieinami ir būtų galima juos pakartotinai naudoti kuriant naujus lietuvių kalbos modelius, taip prisidedant prie šalies skaitmeninimo plėtros programos įgyvendinimo.

Žymos: DIValstybės skaitmeninių sprendimų agentūraVDU

Kiti straipsniai

„Juodasis penktadienis“ artėja: pusė šalies gyventojų ketina apsipirkti internetu – kaip neišlaidauti ir išvengti sukčių
Aktualijos

„Juodasis penktadienis“ artėja: pusė šalies gyventojų ketina apsipirkti internetu – kaip neišlaidauti ir išvengti sukčių

2025-11-21
Apžvalgos

Grynųjų laikas baigėsi? 90 proc. lietuvių atsiskaityto kortele

2025-11-20
Statistika neramina: rudenį dėl didelio greičio daugėja avarijų ir sužalojimų
Apžvalgos

Statistika neramina: rudenį dėl didelio greičio daugėja avarijų ir sužalojimų

2025-11-18
Kelionių kainos: ko tikėtis Lietuvos keliautojams 2026 m.?
Apžvalgos

Kelionių kainos: ko tikėtis Lietuvos keliautojams 2026 m.?

2025-11-18
E komercija
Aktualijos

AI SEO mažmeninėje prekyboje: kaip dirbtinis intelektas keičia pirkėjų elgseną ir prekybininkų matomumą

2025-11-17
Iškilmingai užbaigtas „Scanoramos“ festivalis: paaiškėjo pagrindinio konkurso laimėtojas
Kinas

Iškilmingai užbaigtas „Scanoramos“ festivalis: paaiškėjo pagrindinio konkurso laimėtojas

2025-11-17
Iš Dubajaus grįžęs lenktynininkas Rokas Baciuška: „Adrenalinas – mano gyvenimo dalis“
Lietuva

Iš Dubajaus grįžęs lenktynininkas Rokas Baciuška: „Adrenalinas – mano gyvenimo dalis“

2025-11-17
Sveikatos specialistai: daugelio lietuvių mitybos įpročiai verčia sunerimti – kur klystama dažniausiai
Apžvalgos

Sveikatos specialistai: daugelio lietuvių mitybos įpročiai verčia sunerimti – kur klystama dažniausiai

2025-11-11
Holivudo prodiuserius sudomino lietuvių brolio ir sesers kūryba
Lietuva

Holivudo prodiuserius sudomino lietuvių brolio ir sesers kūryba

2025-11-10

Rekomenduojame

Raganiaus sezonas su Liamu Hemsworthu | Netflix

„Raganiaus“ 4 sezonas prarado daugiau nei 50% žiūrovų po to, kai Henris Cavillas buvo pakeistas Liamu Hemsworthu

2025-11-08
5 populiariausi telefonų modeliai Lietuvoje 2025-aisiais

5 populiariausi telefonų modeliai Lietuvoje 2025-aisiais

2025-06-02
Kaip elektroniniu būdu nutraukti narystę partijoje?

Kaip elektroniniu būdu nutraukti narystę partijoje?

2021-09-30
Honor Magic 7 Pro

„Honor Magic 8 Pro“ pasirodys su „Snapdragon 8 Elite 2 SoC“ ir triguba galine kamera

2025-04-30
Proneta Proneta Proneta

Naujienos

Išsiskyrė keliai su K. Hadji

Vilniaus „Žalgiris“ pristatė naujokus, išvyko K. Hadji

2025-12-04
Sotu, skanu ir pigu: pupelių troškiniai, kurie pranoks lūkesčius

Sotu, skanu ir pigu: pupelių troškiniai, kurie pranoks lūkesčius

2025-11-30
Vilniaus eglutė 2025

Vilnius įžiebė natūralią Kalėdų eglę: suspindėjo laikui nepavaldžia elegancija

2025-11-30
Sniegas ant medžių

Intensyvaus snygio dienos – svarbi informacija gyventojams

2025-11-26
Verta pamatyti

Naujienos, žinios, įdomybės, patarimai ir apžvalgos iš Lietuvos ir viso pasaulio.

Nauja

Išsiskyrė keliai su K. Hadji
Sportas

Vilniaus „Žalgiris“ pristatė naujokus, išvyko K. Hadji

2025-12-04

Lankoma

Kaip elektroniniu būdu nutraukti narystę partijoje?
Aktualijos

Kaip elektroniniu būdu nutraukti narystę partijoje?

2021-09-30

Reklama

Proneta Proneta Proneta
  • Rašyti redakcijai
  • Naudojimosi taisyklės
  • Akcininkai
  • Privatumo politika
  • Kontaktai

© 2024 Pamatyti

Rezultatų nėra
Žiūrėti visus rezultatus
  • Naujienos
  • Laisvalaikis
  • Kinas
  • Technologijos
  • Receptai
  • Sveikata
  • Auto

© 2024 Pamatyti