FER-ov Hašek skoro 30 godina ispravlja greške. Evo najčešćih

FER-ov Hašek skoro 30 godina ispravlja greške. Evo najčešćih

Hrvatski akademski spelling checker Hascheck [Hašek] jedna je od najstarijih domaćih internetskih usluga koja od 1993. godine svakodnevno pomaže akademskoj zajednici, brojnim novinskim redakcijama, ali i privatnim korisnicima u uređivanju njihovih tekstova.

Ime Hascheck ili u hrvatskoj verziji Hašek dolazi iz punog naziva - Hrvatski akademski spelling checker. Nalazi se na adresi ispravi.me, a protekle godine koristilo ga je 450 tisuća korisnika iz preko 130 zemalja svijeta. Oni su obradili osam milijuna tekstova koji su tvorili korpus od blizu dvije milijarde pojavnica. Ovo nedvojbeno govori o globalnoj popularnosti vrlo specifične usluge posvećene hrvatskom jeziku. Valja naglasiti da je hrvatski u svjetskim razmjerima "mali" jezik jer ga koristi manje od jednog promila svjetske populacije. 

Najviše korisnika usluzi je pristupilo iz Hrvatske (83%), zatim iz Bosne i Hercegovine (7%) i Njemačke (1%). Više od 40 posto korisnika bilo je mlađe od 34 godine, a usluzi su u 75 posto slučajeva pristupali sa stolnog računala, najčešće radnim danima između 9 i 15 sati. Sve ovo upućuje da u Hrvatskoj treba posvećivati veću pozornost domaćem razvoju jezičnotehnoloških proizvoda i usluga.

U 2021. godini korisnici su najčešće griješili pri pisanju sljedećih riječi: če --> će, tiće --> tiče, riješenje --> rješenje, slijedeće --> sljedeće, mogučnosti --> mogućnosti, promjeniti --> promijeniti, čemo --> ćemo, več --> već, primjetiti --> primijetiti, djete --> dijete, samnom --> sa mnom, riješenja --> rješenja, reči --> reći, primjeniti --> primijeniti te razumijeti --> razumjeti.

Skrb o usluzi od samih početaka primarno počiva na idejnom začetniku, umirovljenom profesoru FER-a Šandoru Dembitzu, a u sklopu diplomskih i završnih radova na projektu povremeno sudjeluju i studenti FER-a.

Od početnih 100 tisuća različnica hrvatskog općejezičnog fonda, u gotovo 30 godina strogo nadziranog učenja sustav je narastao na 1,1 milijun različnica hrvatskog općejezičnog fonda te nešto više od milijun različnica hrvatskog posebnojezičnog, dominantno imenskog fonda. Posebnu vrijednost izvedenu iz obrada predstavlja hrvatski n-gramski sustav (n = 1, ..., 7) u kojemu su pohranjeni sljedovi od n sukcesivnih riječi iz obrađivanih tekstova s potvrdom svake riječi u Hašekovu rječniku, upotpunjeno učestalošću pojedinog n-grama u ukupno obrađenome korpusu. Hašekov n-gramski sustav, mjereno pojavnicama, višestruko nadmašuje opseg svih knjiga tiskanih na hrvatskom jeziku od Gutenberga do danas. Već ovaj podatak upućuje na vrijednost n-gramskog sustava u kontekstu suvremenih na big-data pristupima zasnovanih jezičnih obrada.

- - - IZDVOJITE MINUTU I PODRŽITE REP.HR - - -

Ako redovito posjećujete rep.hr, vjerojatno ste svjesni da objavljujemo niz članaka koji sadrže zanimljive i društveno korisne informacije. Nastojimo ukazati na nepravilnosti i prevare, promovirati uspjehe informatičara na natjecanjima, predstaviti nove projekte i inicijative i pružiti niz drugih informacija. Iako portal ima određene marketinško-prodajne aktivnosti, proizvodnja takvog sadržaja košta i - kao i drugim medijima - dodatni izvor prihoda pomogao bi u daljnjem rastu i razvoju. Brojni portali uveli su proteklih mjeseci zaključavanje članaka i pretplatu, a mi smo se odlučili za opciju dobrovoljnih priloga za koje se izdaju računi.

Podržati nas možete već s pet kuna, na što trebate potrošiti manje od minute. Dovoljno je izabrati sličicu s jednim od ponuđenih iznosa, a nakon toga u novom prozoru izabrati način plaćanja. Radi jednostavnosti i brzine plaćanja, podržane su mobilne aplikacije KEKS Pay, Aircash i Settle te kriptovalute. Uplata se realizira putem partnerske tvrtke Neoinfo i sustava mobilepaymentsgateway.com Sustav za plaćanja je trenutnu u testnoj fazi te se ispričavamo ako u početku bude nekih nesavršenosti. Ako uočite nekakav nedostatak ili vas zanima više informacija o sustavu možete nas kontaktirati na info@rep.hr

Izaberite iznos podrške: