STARK-demo

Spletni vmesnik za luščenje in analizo skladenjskih dreves

Kolofon >

O orodju

STARK je vsestransko orodje za analizo skladenjske zgradbe jezikov na podlagi skladenjsko razčlenjenih korpusov (drevesnic).

O orodju >

Trenutna različica

Trenutna različica orodja STARK je 3.1.0.

Datum zadnje posodobitve vmesnika STARK-demo: 24.5.2025

Različice >

Dostopnost

Programska koda orodja STARK je dostopna v repozitoriju CLARIN.SI pod licenco Apache 2.0.

Koda >

About

STARK je vsestransko orodje za analizo skladenjske zgradbe jezikov na podlagi skladenjsko razčlenjenih korpusov (drevesnic). S prepoznavanjem in luščenjem širokega nabora skladenjskih struktur (dreves) omogoča nova spoznanja o tem, katere strukture se v jeziku dejansko pojavljajo in kako izrazite so glede na različne statistične kazalnike.


STARK je prvenstveno namenjen obdelavi korpusov, označenih po mednarodni shemi Universal Dependencies, podpira pa tudi vse druge odvisnostne drevesnice v formatu CONLL-U. Orodje na podlagi vhodnega korpusa izdela seznam vseh struktur, ki ustrezajo nastavitvam uporabnika, skupaj s podatkom o njihovi pogostosti in drugih uporabnih korpusnih statistikah. Prilagodljivost teh nastavitev omogoča širok nabor leksikalnih ali slovničnih raziskav – od splošnejših analiz po načelu ‘od spodaj navzgor’ (npr. luščenje vseh struktur s samostalniškim jedrom) do bolj ozko usmerjenih poizvedb ‘od zgoraj navzdol’ (npr. iskanje vseh glagolskih struktur s premim in nepremim predmetom).


Orodje STARK so razvili Kaja Dobrovoljc, Luka Krsnik in Marko Robnik Šikonja v okviru raziskovalnega projekta SPOT: Na drevesnici temelječ pristop k raziskavam govorjene slovenščine (ARIS Z6-4617) in indrastrukturnih projektov CLARIN.SI (2019, 2024). Za širšo dostopnost orodja smo s pomočjo CJVT UL razvili tudi pričujoči spletni vmesnik, namenjen demonstraciji osnovnih funkcionalnosti orodja STARK. Celoten nabor funkcionalnosti orodja STARK je na voljo v različici za vmesnike z ukazno vrstico: https://github.com/clarinsi/STARK.