Daugiakalbio DI tyrimai ir kūrimas
Nuodugnių tyrimų sritys
Mašininis vertimas
Kuriame domenui pritaikyto, adaptyvaus ir terminus atpažįstančio mašininio vertimo inovacijas, plėtojame patikimumo, paklaidų koregavimo ir didžiųjų kalbos modelių metodus.
Pokalbių DI
Koncentruojamės į daugiakalbės natūraliosios kalbos supratimą, semantinį indeksavimą, LLM grįstą ir išorine informacija papildytą generavimą bei personalizavimą.
Kalbos technologijos
Tiriame pakopinį ir tiesioginį kalbos atpažinimą ir šnekos vertimą, kelių kalbėtojų ir daugiakalbę kalbos sintezę, šnekos atpažinimą realiuoju laiku, automatinį subtitravimą ir dubliavimą.
Teksto analizė
Kuriame daugiakalbių įvardytų subjektų atpažinimo, anonimizavimo ir pseudonimizavimo, terminų atpažinimo ir rinkimo, morfologinės analizės, lematizacijos, kalbos dalies žymėjimo ir kitus įrankius.
Žinių valdymas
Mes išlaikome didžiausią termbanką Europoje - EuroTermBank, kuriame kuriamos terminų valdymo ir elektroninio žodyno priemonės.
Nuo šiol mūsų mašininis vertimas pagrįstas „TildeOpen LLM“
Šiuo metu vykdomi tyrimai
Naudodamos Kalbos duomenų erdvę (LDS), atitinkamos suinteresuotosios šalys galės dalytis savo kalbos duomenimis ir kitais kalbos ištekliais, taip pat monetizuoti savo kalbos duomenis ir kalbos išteklius vienoje platformoje, atsižvelgdamos į ES vertybes ir ES taisyklių atitiktį.
Naujausi leidiniai
Rinaldsas Vīksna ir Inguna Skadiņa. 2025. Anonimiškumas: daugiakalbio dokumento pseudonimo įrankis. 15-osios tarptautinės konferencijos dėl pastarojo meto pažangos natūralios kalbos apdorojimo srityje - natūralios kalbos apdorojimo generatyviniame AI trynime, 1327-1332.
Jurgita Kapočiūtė-Dzikienė, Daiga Deksne, Inguna Skadiņa, Raivis Skadiņš ir Askaras Salimbajevas. 2025. Vienakalbė ir daugiakalbė teksto klasifikacija. Taikomųjų programų duomenų mokslas. Kompiuterinės žvalgybos tyrimai, tūris 1206, 55-82, Springer.
Jurgita Kapočiūtė-Dzikienė, Tomas Bergmanis ir Mārcis Pinnis. 2025. AI lokalizavimas: Baltijos valstybių kalbų atvirojo svorio kalbų modelių vertinimas. Bendros 25-osios Šiaurės šalių kompiuterinės lingvistikos konferencijos ir 11-osios Baltijos šalių konferencijos dėl žmogaus kalbos technologijų (NoDaLiDa/Baltic-HLT 2025) posėdžiai, 287-295.
Mūsų tyrimų komanda
Mārcis Pinnis
Tomas Bergmanis
Dr. M.Inf., tyrėjas
Martinsas Kronis
Ingus Jānis Pretkalniņš
Jurgita Kapočiūtė-Dzikienė
Dr. SC. COMP., skaičiavimo lingvistikos specialistas.
Raivis Skadiņš
Andrejs Vasiļjevs
Inguna Skadiņa
Matīss Rikters
Daiga Deksne
Inese Vīra
Rinalds Vīksna
Dāvis Nicmanis