Opisi uporabljenih mer berljivosti

Na tej strani se nahajajo kratki opisi različnih mer berljivosti, ki so uporabljene v aplikaciji. Višja vrednost označuje večjo težavnost, kar otežuje branje in razumevanje besedila ter posledično učno uspešnost. Z njimi si lahko pomagamo pri oceni težavnosti berljivosti besedila ter njegovem preurejanju.

Avtomatski indeks berljivosti

Avtomatski indeks berljivosti (ang. automated readability index) je preprosta mera berljivosti, ki temelji na dveh komponentah: dolžini besed in dolžini povedi. Izračunamo ga z naslednjo formulo: $$ \text{AIB} = 4,71 \frac{\text{število vseh črk}}{\text{število vseh besed}} + 0,5 \frac{\text{število vseh besed}}{\text{število vseh povedi}} - 21,43 $$

Več kot je v besedilu besed z veliko črkami in povedi z veliko besedami, višji je avtomatski indeks berljivosti. Višje vrednosti nakazujejo nižjo berljivost.

Indeks Coleman-Liau

Indeks Coleman-Liau (ang. Coleman-Liau index) je podoben avtomatskemu indeksu berljivosti in temelji na dolžini besed ter povedi. Izračunan je po naslednji formuli: $$ \text{ICL} = 0,0588 * L - 0,296 * S - 15,8 $$ $L$ predstavlja povprečno število črk na 100 besed, $S$ pa povprečno število povedi na 100 besed.

Več kot je v besedilu besed z veliko črkami in povedi z veliko besedami, višji je indeks Coleman-Liau. Višje vrednosti nakazujejo nižjo berljivost.

LIX

LIX je mera berljivosti, ki za razliko od drugih uporabljenih mer berljivosti ni bila zasnovana primarno za angleščino, temveč za besedila v različnih jezikih. Mera je izračunana z naslednjo formulo: $$ \text{LIX} = \frac{\text{število vseh besed}}{\text{število vseh povedi}} + 100 \frac{\text{število dolgih besed}}{\text{število vseh besed}} $$

V izvirni različici formule se kot dolge štejejo tiste besede, ki vsebujejo več kot šest črk. V slovenskih besedilih kot dolge besede štejemo besede z 8 črkami ali več.

Več kot je v besedilu povedi z veliko besedami in besed z veliko črkami, višji je LIX. Višje vrednosti nakazujejo nižjo berljivost.

Preprosta mera Gobbledygooka (SMOG)

Preprosta mera Gobbledygooka (ang. simple measure of gobbledygook, SMOG) tako kot Gunningov indeks zamegljenosti za oceno števila zahtevnih besed uporablja zloge. V angleščini se kot zahtevne štejejo besede, ki so sestavljene iz treh ali več zlogov. V slovenščini kot zahtevne štejemo besede s 6 zlogi ali več. Mera je izračunana z naslednjo formulo: $$ \text{SMOG} = 1,043 * \sqrt{\text{število zahtevnih besed} \frac{30}{\text{število vseh povedi}}} + 3,1291 $$

Več kot je v besedilu zahtevnih besed in gosteje kot so razporejene znotraj povedi, višja je vrednost SMOG. Višje vrednosti nakazujejo nižjo berljivost.

Formula berljivosti Dale-Chall

Formula berljivosti Dale-Chall (ang. Dale-Chall readability formula) temelji na številu zahtevnih besed in številu dolgih povedi. Za razliko od nekaterih drugih mer formula berljivosti Dale-Chall zahtevnosti besed ne ocenjuje glede na njihovo dolžino, temveč glede na to, ali so vključene v seznam lahkih besed. V izvirni formuli, ki je bila razvita za angleščino, tovrstni seznam vključuje besede, ki naj bi bile poznane večini učencev četrtega razreda. V slovenščini takšnega seznama nimamo. V aplikaciji namesto tega uporabimo seznam učbeniškega besedišča. Za učbeniško besedišče smo uporabili besedila 127 različnih učbenikov iz 16 predmetov. Za pogoste besede smo vzeli besede, ki se pojavijo vsak 5-krat v vsaj osmih različnih predmetih. Podrobne informacije o učbeniškem besedišču so na voljo na https://www.clarin.si/repository/xmlui/handle/11356/1215.
Formula berljivosti Dale-Chall je izračunana na naslednji način: $$ \text{FBDC} = 0,1579 \frac{\text{število zahtevnih besed}}{\text{število vseh besed}} + 0,0496 \frac{\text{število vseh besed}}{\text{število vseh povedi}} $$

Več kot je v besedilu zahtevnih besed in dolgih povedi, višja je vrednost formule berljivosti Dale-Chall. Višje vrednosti nakazujejo nižjo berljivost.

Orodje ponuja tudi alternativen izračun formule berljivosti Dale-Chall, pri katerem ni upoštevan seznam pogostih splošnih besed, temveč so kot težavne besede privzete vse dolge besede (s 13 črkami ali več).

Fleschova enostavnost branja

Fleschova enostavnost branja (ang. Flesch reading ease) za oceno težavnosti povedi ne uporablja števila črk ali seznama lahkih besed, temveč število zlogov in razmerje med številom besed in številom povedi. Mera je izračunana z naslednjo formulo: $$ \text{FEB} = 206,835 - 1,015 \frac{\text{število vseh besed}}{\text{število vseh povedi}} - 84,6 \frac{\text{število vseh zlogov}}{\text{število vseh besed}} $$

Za razliko od ostalih mer pri v formuli nižje vrednosti nakazujejo nižjo berljivost besedila. Pri prikazu rezultatov mero obrnemo tako da večja vrdenost pomeni nižjo berljivost, kot pri ostalih merah.

Flesch-Kincaidov razred težavnosti

lesch-Kincaidov razred težavnosti (ang. Flesch Kincaid grade level) je podobna mera kot Fleschova enostavnost branja. Razlika je v tem, da so uteži spremenjene tako, da je mera prilagojena težavnosti glede na razrede šolskega sistema v Združenih državah Amerike. Mera je izračunana na naslednji način: $$ \text{FKRT} = 0,39 \frac{\text{število vseh besed}}{\text{število vseh povedi}} + 11,8 \frac{\text{število vseh zlogov}}{\text{število vseh besed}} - 15,59 $$

Več kot je v besedilu dolgih povedi (z veliko besedami) in besed z velikim številom zlogov, višja je stopnja težavnosti. Višje vrednosti nakazujejo nižjo berljivost.

Gunningov indeks zamegljenosti

Gunningov indeks zamegljenosti (ang. Gunning fog index za oceno berljivosti besedila uporablja število zlogov. Za angleška besedila formula predpostavlja, da so zahtevne tiste besede, ki vsebujejo več kot tri zloge. V slovenskih besedilih kot zahtevne besede štejemo tiste s 6 ali več zlogi. Formula za Gunningov indeks zamegljenosti je naslednja: $$ \text{GIZ} = 0,4 (\frac{\text{število vseh besed}}{\text{število vseh povedi}} + 100 \frac{\text{število zahtevnih besed}}{\text{število vseh besed}}) $$

Več kot je v besedilu povedi z veliko besedami in besed z velikim številom zlogov, večji je Gunningov indeks zamegljenosti. Višje vrednosti nakazujejo nižjo berljivost.

RIX

RIX je poenostavitev LIX-a in je najenostavnejša mera, ki smo jo uporabili - predstavlja razmerje med številom dolgih besed in številom povedi. Izračunana je na naslednji način: $$ \text{RIX} = \frac{\text{število dolgih besed}}{\text{število vseh povedi}} $$ V izvirni različici formule se kot dolge štejejo tiste besede, ki vsebujejo več kot šest črk. V slovenskih besedilih kot dolge besede štejemo besede z 8 črkami ali več.

Več kot je v besedilu dolgih besed in gosteje kot so razporejene znotraj povedi, višji je RIX. Višje vrednosti nakazujejo nižjo berljivost.

Spacheova formula berljivosti

Spacheova formula berljivosti (ang. Spache readability formula) tako kot formula berljivosti Dale-Chall uporablja seznam lahkih besed, pri oceni težavnosti besedila pa upošteva le edinstvene besede. Zasnovana je bila le za učence do četrtega razreda v šolskem sistemu Združenih držav Amerike in je za starejše učence manj primerna kot formula berljivosti Dale-Chall. Izračunana je na naslednji način: $$ \text{SFB} = 0,141 \frac{\text{število vseh besed}}{\text{število vseh povedi}} + 8,6 \frac{\text{število vseh različnih zahtevnih besed}}{\text{število vseh različnih besed}} + 0,839 $$

Daljše kot so povedi v besedilu in več kot je v besedilu različnih zahtevnih besed, višja je vrednost Spacheove formule berljivosti. Višje vrednosti nakazujejo nižjo berljivost. Za seznam pogostih besed smo uporabili učbeniško besedišče učbeniško, ki vsebuje besedila 127 različnih učbenikov iz 16 predmetov. Za pogoste besede smo vzeli besede, ki se pojavijo vsak 5-krat v vsaj osmih različnih predmetih. Podrobne informacije o učbeniškem besedišču so na voljo na https://www.clarin.si/repository/xmlui/handle/11356/1215.