dizajn bez naslova (11) Foto: Pixabay, Canva

U ispravnom korištenju hrvatskoga jezika već od 1994. „uskočio“ Hašek, danas „Ispravi.me“

Obrazovanje i znanost Vijesti

U eri brze konzumacije, ne samo vijesti u medijima i na društvenim mrežama, već i one u svakodnevnoj korespondenciji između političkih i poslovnih subjekata hrvatski jezik zbog neznanja govornika ili izostanka lektorskih usluga gubi svoju vrijednost službenoga jezika u Republici Hrvatskoj i jednog od službenih jezika Europske unije koji je u svojoj ukupnosti i cjelovitosti temeljna sastavnica hrvatskoga identiteta i hrvatske kulture.

Piše: Gloria Lujanović


Svjedoci smo niza jezičnih pogrešaka i u govornoj i u pisanoj riječi, manjka svijesti o ulozi hrvatskoga jezika u nacionalnom razvoju, a što je bilo i razlogom da je hrvatska Vlada 2023. predložila, a Hrvatski sabor na inicijativu Matice hrvatske usvojio Zakon o hrvatskom jeziku u kojem se uz ostalo navodi da su državna i tijela lokalne uprave i samouprave dužna na hrvatskome standardnom jeziku osigurati jezično uređenje normativnih akata, akata strateškoga planiranja, službenih publikacija i njihovih priloga te izvješća i drugih dokumenata iz svoje nadležnosti.

Ispravi.me (poznatija kao hrvatski Hašek), besplatna usluga pravopisne provjere teksta

Kako će do angažiranja lektora na tim poslovima trebati proći vremena, te s obzirom da situacija u medijima, što se tiče uporabe službenoga hrvatskog jezika i nije baš bajna, u pomoć može „uskočiti“ platforma Ispravi.me (poznatija kao hrvatski Hašek), besplatna usluga pravopisne provjere teksta pisanog hrvatskim jezikom. Hašek je prvi javni hrvatski spellchecker. Njegovu vrijednost potvrđuje i činjenica da mu je bila povjerena strojna provjera teksta Hrvatskog leksikona, kapitalnog djela hrvatske kulture. Hašekovo bavljenje Hrvatskim leksikonom prvi je slučaj sustavne strojne provjere teksta u slavenskim leksikografijama.

Online ispravljanje na Ispravi.me

Naša najstarija usluga dostupna je od 1994. godine kao usluga elektroničke pošte, a od 2003. kao web-aplikacija. Usluga omogućuje korisnicima ispravljanje teksta unesenoga putem web-obrasca. Učinkovito otkriva standardne pogreške u hrvatskom jeziku: ije/je, č/ć, s/sa, zamijenjena slova, ubačena slova i izbrisana slova, a na temelju razvijenog statističkog modela hrvatskog jezika, za sumnjive riječi nudi se
popis mogućih ispravaka. Hašek nudi ispravljanje pogrešaka koje konvencionalni spellcheckeri ne prepoznaju –česte stilske pogreške (na taj način vs.tako, obzirom na vs. s obzirom na to da) i pleonazme (čak štoviše, iz razloga što, besplatni poklon….). Valja napomenuti da je sva komunikacija između korisnika i Hašeka šifrirana kriptografskim ključevima.

U 2024. na Ispravi.me 9,4 milijuna provjera

Tijekom 2024. godine u sustavu je zabilježeno 9,4 milijuna provjera te otkriveno čak 29 milijuna pravopisnih i stilskih pogrešaka, što u prosjeku iznosi 3,14 pogrešaka po tekstu. U prvih šest mjeseci 2025. zabilježeno je gotovo 5 milijuna provjera, ali s većim prosjekom pogrešaka po tekstu – ukupno 20 milijuna pogrešaka, odnosno 4 pogreške po tekstu. Sustav mjesečno koristi u prosjeku 40 tisuća korisnika.

Autor hrvatskoga Hašeka je Šandor Dembitz

Autor tog izuzetnog jezičnog provjeravateljskog sustava je prof. dr. sc. Šandor Dembitz sa zagrebačkog Fakulteta elektronike i računarstva koji je preminuo u veljači 2024. godine, nakon čega vođenje projekta preuzima prof. dr. sc. Gordan Gledec s istog fakulteta.

Najčešće pogreške

U analizama stoji da korisnici najčešće griješe u sljedećim pravopisnim i stilskim
situacijama:
 pisanje “sa” umjesto “s” – zabilježeno je skoro 700 tisuća puta, a suprotna
greška (“s” umjesto “sa”) 125 tisuća puta.
 pogrešna upotreba riječi poput “ukoliko” umjesto “ako”, “da li
je” umjesto “je li”, “biti će” umjesto “bit će”, “nebi” umjesto “ne bi”, kao
i “riješenja” umjesto “rješenja”, “slijedeći” umjesto “sljedeći”, “projekat”,
“vjerovatno”, “niko”.
 česte su i stilske greške: pisanje bez kvačica (npr. moze, vec, jos), lijepljenje
znaka % ili °C uz broj bez razmaka, neispravno pisanje
datuma (npr. 09.07. umjesto 9. 7.), kao i upotreba izraza poput “biti u
mogućnosti” umjesto jednostavnijeg “moći”.
 pogrešna upotreba izraza “obzirom da” umjesto pravilnog “s obzirom na to
da” također je zabilježena u velikom broju tekstova.
 sustav često detektira srbizme, jer veliki broj korisnika dolazi iz Srbije i
Bosne i Hercegovine.

Razvojni tim Ispravi.me najavio je daljnja unaprjeđenja sustava, posebno u području prepoznavanja gramatičkih i kontekstualnih pogrešaka. To uključuje slučajeve kada se pridjev i imenica ne slažu u rodu ili padežu, ili kad riječi poput “zamjene” i “zamijene” imaju različito značenje ovisno o kontekstu. U tu svrhu, tim intenzivno radi na n-gramskoj obradi hrvatskoga jezika, koja omogućuje bolje razumijevanje konteksta unutar rečenice. U planu je i integracija alata umjetne inteligencije, što bi korisnicima omogućilo parafraziranje i prepričavanje tekstova, kao i unaprjeđenje korisničkog sučelja.

Od Hašeka do Ispravi.me

Ispravi.me je izravni nasljednik Haschecka – Hrvatskog akademskog spelling checkera, koji je pokrenut u proljeće 1994. godine. Do kraja 2016. usluga je bila poznata pod tim nazivom, a tada korisničko sučelje mijenja ime i adresu u Ispravi.me, dok Hašek ostaje pogonski mehanizam koji u pozadini i dalje
analizira tekstove.

Prema podacima koje daje Google Analytics, nešto više od 85 posto korisnika dolazi iz Hrvatske, njih 7 posto iz Bosne i Hercegovine, dok uslugu koristi i po jedan posto 1 korisnika iz Njemačke, Srbije, Austrije i Slovenije. Najviše je korisnika u dobnoj skupini od 25 do 35 godine (njih četvrtina). Ukupno je sustav pronašao 4,86 milijuna različitih pogrešaka koje su se u tekstovima pojavile 30,32 milijuna puta, što znači da i dalje na svakih 60-ak ispravnih riječi dolazi jedna pogrešna.

Top-lista grešaka: Riješenje, več, čemo, projekat

Top-lista grešaka nije se značajno mijenjala u odnosu na posljednje godine: najčešće se griješi pišući “slijedeći” umjesto “sljedeći”, “riješenje” umjesto “rješenje”, “promjeniti” umjesto “promijeniti”, “mogučnost” umjesto “mogućnost”, “če” i “čemo” umjesto “će” i “ćemo”, “več” umjesto “već”. Vrlo često korisnici uopće ne koriste dijakritike, što se pripisuje želji za brzim pisanjem, posebno na pametnim
telefonima. Zamjetno je i često pisanje riječi “svo” umjesto “sve”, “niko” umjesto “nitko”, “šta” umjesto “što”, “vjerovatno” umjesto “vjerojatno” ili “projekat” umjesto “projekt”. Pri vrhu je i pogrešno pisanje negacije pa tako “ne bi” postaje “nebi”, a “ne znam” postaje “neznam”. “Sa mnom” često postaje “samnom”.

Usluga Ispravi.me osim klasičnih zatipaka ispravlja i česte gramatičke te stilske pogreške – takvih je pronađeno 300 tisuća, a pojavile su se 3,2 milijuna puta. U takve pogreške ubrajaju se sintagme “s obzirom da” (treba “s obzirom na to da”), “na taj način” (bolje je “tako”) ili “na način da” (bolje je “tako da”), “zajedno s” (najčešće je dovoljno “s“. Korisnici griješe i kod pisanja futura (npr. “biti će” umjesto
“bit će”). Pri vrhu ljestvice nalazi se i pogrešno korištenje prijedloga “s”, tj. “sa” te
sintagma “da li”.

Analiza višegodišnjih zapisa o ispravcima koje korisnici izabiru od ponuđenih opcija
(preko 33 milijuna pogrešaka i ispravaka) pokazala je sljedeće:


 18,3 % svih pogrešaka posljedica je nekorištenja dijakritika,
 7 % svih pogrešaka posljedica je pogrešnog pisanja “je” umjesto “ije”,

 6,3 % svih pogrešaka posljedica je pogrešnog pisanja “č” umjesto “ć”,
 5,4 % svih pogrešaka predstavlja pogrešno pisanje prijedloga “sa” umjesto “s”
(za razliku od 0,4 % pogrešaka pisanja “s” umjesto “sa”),
 5 % svih pogrešaka predstavlja pogrešno pisanje “ije” umjesto “je”,
 3,4 % svih pogrešaka predstavlja pogrešno pisanje “ć” umjesto “č”.

Hašek je do sada obradio 63 milijuna tekstova

Od javne objave usluge 21. ožujka 1994. godine kad se ona koristila putem elektroničke pošte, preko uvođenja web-sučelja 2003. godine, Hašek je do danas obradio gotovo 63 milijuna tekstova s nešto više od 16 milijarda riječi, čime je, prema navedenim parametrima, korisnicima uštedio više od 15,5 tisuća radnih godina sričućeg čitanja teksta.

Na web stranicama Ispravi.me stoji da sve više korisnika dolazi iz Srbije i Crne Gore, s tekstovima na njihovim jezicima, što je vjerojatno odraz činjenice da tamo nema ovakve usluge, a jezici su slični. Njima ne smeta što im Hašek ekavicu uredno ijekavizira. Uočeno je i da su tekstovi koji dolaze iz SAD-a i Njemačke pismeniji od onih koji dolaze s domaćih adresa. Izvorno je ova usluga bila namijenjena akademskoj zajednici, a danas ima stotine tisuća malih korisnika. Među njima su i oni profesionalni, koji su izvor prihoda za održavanje usluge od najvećih medijskih i televizijskih kuća, PR i internetskih oglašivačkih agencija, ali i kompanija i poduzeća.

Gledec: Ako si veliki Hrvat, daj barem nauči jezik

„Smatram da brigom o jeziku doista i stvarno čuvamo i razvijamo svoju kulturu i nacionalnu pripadnost. Oni koji se busaju o nacionalna velikohrvatska prsa po društvenim mrežama najčešće su potpuno nepismeni, do razine osnovne škole, čime i njihovo hrvatstvo (p)ostaje samo deklarativno. Ako si veliki Hrvat, daj barem nauči jezik“, poručio je prof. Gledec u razgovoru povodom 30 godina ‘dobrog
alata Hašeka’
koji dnevno obradi više od 30 tisuća vaših tekstova.

Tekst je nastao u okviru projekta “Gdje su nestali lektori?” koji je financijski podržala Agencija za elektroničke medije sredstvima iz programa poticanje novinarske izvrsnosti.

Tagged