Spletni vmesnik za luščenje in analizo skladenjskih dreves
STARK je vsestransko orodje za analizo skladenjske zgradbe jezikov na podlagi skladenjsko razčlenjenih korpusov (drevesnic).
Trenutna različica orodja STARK je 3.1.0.
Datum zadnje posodobitve vmesnika STARK-demo: 24.5.2025
Programska koda orodja STARK je dostopna v repozitoriju CLARIN.SI pod licenco Apache 2.0.
Spletni vmesnik na orodja.cjvt.si
Zbirka Orodja CJVT
Ljubljana, 2025
Delo je dostopno pod odprto licenco Apache 2.0.
Izdelava spletnega vmesnika STARK-demo
Luka Krsnik
Kaja Dobrovoljc
Izdelava orodja STARK
Luka Krsnik
Kaja Dobrovoljc
Marko Robnik Šikonja
Izdajatelj
Center za jezikovne tehnologije in orodja, Univerza Ljubljana
Citiranje
TBA
STARK je vsestransko orodje za analizo skladenjske zgradbe jezikov na podlagi skladenjsko razčlenjenih korpusov (drevesnic). S prepoznavanjem in luščenjem širokega nabora skladenjskih struktur (dreves) omogoča nova spoznanja o tem, katere strukture se v jeziku dejansko pojavljajo in kako izrazite so glede na različne statistične kazalnike.
STARK je prvenstveno namenjen obdelavi korpusov, označenih po mednarodni shemi Universal Dependencies, podpira pa tudi vse druge odvisnostne drevesnice v formatu CONLL-U. Orodje na podlagi vhodnega korpusa izdela seznam vseh struktur, ki ustrezajo nastavitvam uporabnika, skupaj s podatkom o njihovi pogostosti in drugih uporabnih korpusnih statistikah. Prilagodljivost teh nastavitev omogoča širok nabor leksikalnih ali slovničnih raziskav – od splošnejših analiz po načelu ‘od spodaj navzgor’ (npr. luščenje vseh struktur s samostalniškim jedrom) do bolj ozko usmerjenih poizvedb ‘od zgoraj navzdol’ (npr. iskanje vseh glagolskih struktur s premim in nepremim predmetom).
Orodje STARK so razvili Kaja Dobrovoljc, Luka Krsnik in Marko Robnik Šikonja v okviru raziskovalnega projekta SPOT: Na drevesnici temelječ pristop k raziskavam govorjene slovenščine (ARIS Z6-4617) in indrastrukturnih projektov CLARIN.SI (2019, 2024). Za širšo dostopnost orodja smo s pomočjo CJVT UL razvili tudi pričujoči spletni vmesnik, namenjen demonstraciji osnovnih funkcionalnosti orodja STARK. Celoten nabor funkcionalnosti orodja STARK je na voljo v različici za vmesnike z ukazno vrstico: https://github.com/clarinsi/STARK.
Različica
STARK 3.1.0
Datum izdaje posodobitve orodja: 17.5.2025
Datum zadnje posodobitve vmesnika: 24.5.2025