FER je objavio popis najčešćoh tipfelera i jezičnih pogrešaka zabilježenih na njihovom spelling checkeru u 2022. godini.
Riječ je o greškama koje su uočene tijekom korištenja web servisa Ispravi.me, odnosno Hrvatskog akademskog spelling checkera Hascheck (Hašek). Uslugu je 2022. godine prema podacima s Google Analyticsa koristilo 423 tisuće korisnika s preko 2,5 milijuna obrađenih tekstova, čime se ukupni broj korisnika od 2008. godine povećao na 2,7 milijuna korisnika sa 17 milijuna obrada. Prosječno je pogrešno napisana jedna od 60 riječi zaprimljenih na obradu. Nešto više od 80 posto korisnika dolazi iz Hrvatske, njih 7 posto dolazi iz Bosne i Hercegovine, dok uslugu koristi i oko 1 posto korisnika iz Njemačke, Srbije, Austrije i Slovenije. Najviše je korisnika u dobnoj skupini od 25 do 35 godine (njih četvrtina), slijede mlađi od 24, a zatim dob korisnika progresivno pada od 35 godina prema starijima.
Većina riječi i pogrešaka ponavlja se iz godine u godinu, a u nastavku članka slijedi popis najčešće ispravljanih riječi-
šta -> što
če -> će
tiće -> tiče
riješenje -> rješenje
slijedeće -> sljedeće
ko -> tko
mogučnosti -> mogućnosti
promjeniti -> promijeniti
slijedeći -> sljedeći
čemo -> ćemo
mogučnost -> mogućnost
primjetiti -> primijetiti
več -> već
djete -> dijete
primjetio -> primijetio
riješenja -> rješenja
reči -> reći
primjetili -> primijetili
vjerovatno -> vjerojatno
razumijeti -> razumjeti
primjeniti -> primijeniti
Često se umjesto "kvakastih" slova koriste njihove "beskvake" varijante, a značajan broj korisnika ne zna da se "sa mnom", "ne bi" ili "ne mogu" pišu razdvojeno, a da je "bismo" jedna riječ. Vrlo često se griješi i s izrazima:
s obzirom da -> s obzirom na to da
biti će -> bit će
obzirom da -> s obzirom na to da
ukoliko -> ako
iz razloga što -> zato što
zato jer -> zato što
Za 2023. godinu planirana su dodatna poboljšanja usluge, uvođenjem novih funkcionalnosti (npr. prepoznavanje pogrešaka u pisanju datuma, prepoznavanje pogrešaka u punktuaciji, sklanjanje kratica i stranih imena i slično), ali i promjene u korisničkom sučelju. Dakako, nastavlja se i rad na održavanju n-gramskog sustava (n = 1, ..., 7) u kojemu su pohranjeni sljedovi od n sukcesivnih riječi iz obrađivanih tekstova s potvrdom svake riječi u Hašekovu rječniku, upotpunjeno učestalošću pojedinog n-grama u ukupno obrađenome korpusu.
Mjereno pojavnicama, taj sustav višestruko nadmašuje opseg svih knjiga tiskanih na hrvatskom jeziku od Gutenberga do danas, dajući izvrsnu podlogu za big data obrade. Briga o usluzi i dalje počiva na umirovljenom profesoru FER-a Šandoru Dembitzu i donedavnom dekanu Gordanu Gledecu, koji uz pomoć studenata razvijaju i unapređuju uslugu.