ES fondu projekts Zinātne

Lai uzzinātu vairāk par latviešu valodas teksta analīzes un sintēzes tehnoloģijām, kā arī tām nepieciešamajiem resursiem, mazais zinātnieks Kristians devās uz Latvijas Universitātes Matemātikas un informātikas institūta Mākslīgā intelekta laboratoriju. Laboratorijā Kristians tikās ar tās vadītāju, vadošo pētnieku Normundu Grūzīti, vadošo pētnieci Baibu Saulīti un vadošo pētnieku Gunti Bārzdiņu.

Mazais zinātnieks Kristians apmeklē LU Matemātikas un informātikas institūtu

Teksta viedā automātiskā rezumēšana ir aktuāla tēma dabiskās valodas sapratnē un tekstradē. Pretstatā virspusējai rezumēšanai, kurā no teksta tiek atlasīti daži informatīvi teikumi, viedajai rezumēšanai nepieciešama pilna gramatiskā un semantiskā analīze, nozīmīgākās informācijas identificēšana un saistītu parafrāžu sintēze (ģenerēšana). Projektā izveidoti daudzslāņu semantiski anotēti latviešu valodas resursi, izmantojot un attīstot pasaulē atzītas multilingvālas reprezentācijas (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia).

Projekts tika īstenots, lai attīstītu pētniecību un inovācijas informācijas un komunikācijas tehnoloģijas jomā, konkrēti - valodas tehnoloģiju un mākslīgā intelekta virzienos, lai sekmīgi risinātu problēmas, kas saistītas ar valodas automātisku sapratni un tekstradi.

Lai to īstenotu, tika izvirzīti mērķi:

  • izveidot fundamentālu daudzslāņu latviešu valodas resursu kopu, attīstot pasaulē atzītas pieejas;
  • zinātniski novērtēt šo resursu izmantošanas potenciālu valodas sapratnes un tekstrades lietojumu izstrādei, kombinējot progresīvas mašīnmācīšanās metodes un zināšanās balstītas metodes;
  • nodemonstrēt latviešu valodas sapratnes un tekstrades galveno komponentu kopdarbību, izstrādājot un laboratorijas vidē pārbaudot inovatīvas teksta rezumēšanas tehnoloģijas prototipu.

Projektu īstenoja LU MII Mākslīgā intelekta laboratorijas zinātniskie darbinieki – datorzinātnieki un valodnieki, t.sk. jaunie zinātnieki un doktoranti, – sadarbībā ar SIA LETA Pētniecības laboratorijas darbiniekiem.

Projekts “Daudzslāņu valodas resursu kopa teksta semantiskai analīzei un sintēzei latviešu valodā” ir viens no kopumā jau 80 praktiskās pētniecības īstenotajiem projektiem, kas tiek īstenots ar ES fondu atbalstu zinātnei un pētniecībai.