FER-ov Hašek skoro 30 godina ispravlja greške. Evo najčešćih

Internet • 14.01.2022 16:42

FER-ov Hašek skoro 30 godina ispravlja greške. Evo najčešćih

Piše: rep.hr

Politika objava

www twitter kontakt

Hrvatski akademski spelling checker Hascheck [Hašek] jedna je od najstarijih domaćih internetskih usluga koja od 1993. godine svakodnevno pomaže akademskoj zajednici, brojnim novinskim redakcijama, ali i privatnim korisnicima u uređivanju njihovih tekstova.

Ime Hascheck ili u hrvatskoj verziji Hašek dolazi iz punog naziva - Hrvatski akademski spelling checker. Nalazi se na adresi ispravi.me, a protekle godine koristilo ga je 450 tisuća korisnika iz preko 130 zemalja svijeta. Oni su obradili osam milijuna tekstova koji su tvorili korpus od blizu dvije milijarde pojavnica. Ovo nedvojbeno govori o globalnoj popularnosti vrlo specifične usluge posvećene hrvatskom jeziku. Valja naglasiti da je hrvatski u svjetskim razmjerima "mali" jezik jer ga koristi manje od jednog promila svjetske populacije.

Najviše korisnika usluzi je pristupilo iz Hrvatske (83%), zatim iz Bosne i Hercegovine (7%) i Njemačke (1%). Više od 40 posto korisnika bilo je mlađe od 34 godine, a usluzi su u 75 posto slučajeva pristupali sa stolnog računala, najčešće radnim danima između 9 i 15 sati. Sve ovo upućuje da u Hrvatskoj treba posvećivati veću pozornost domaćem razvoju jezičnotehnoloških proizvoda i usluga.

U 2021. godini korisnici su najčešće griješili pri pisanju sljedećih riječi: če --> će, tiće --> tiče, riješenje --> rješenje, slijedeće --> sljedeće, mogučnosti --> mogućnosti, promjeniti --> promijeniti, čemo --> ćemo, več --> već, primjetiti --> primijetiti, djete --> dijete, samnom --> sa mnom, riješenja --> rješenja, reči --> reći, primjeniti --> primijeniti te razumijeti --> razumjeti.

Skrb o usluzi od samih početaka primarno počiva na idejnom začetniku, umirovljenom profesoru FER-a Šandoru Dembitzu, a u sklopu diplomskih i završnih radova na projektu povremeno sudjeluju i studenti FER-a.

Od početnih 100 tisuća različnica hrvatskog općejezičnog fonda, u gotovo 30 godina strogo nadziranog učenja sustav je narastao na 1,1 milijun različnica hrvatskog općejezičnog fonda te nešto više od milijun različnica hrvatskog posebnojezičnog, dominantno imenskog fonda. Posebnu vrijednost izvedenu iz obrada predstavlja hrvatski n-gramski sustav (n = 1, ..., 7) u kojemu su pohranjeni sljedovi od n sukcesivnih riječi iz obrađivanih tekstova s potvrdom svake riječi u Hašekovu rječniku, upotpunjeno učestalošću pojedinog n-grama u ukupno obrađenome korpusu. Hašekov n-gramski sustav, mjereno pojavnicama, višestruko nadmašuje opseg svih knjiga tiskanih na hrvatskom jeziku od Gutenberga do danas. Već ovaj podatak upućuje na vrijednost n-gramskog sustava u kontekstu suvremenih na big-data pristupima zasnovanih jezičnih obrada.

Tag: FER • Spell checker • Hascheck - Hašek • Sandor Dembitz

Istaknuto

Otvorene prijave za 23. IT pub kviz | rep.hr

Otvorene prijave za 23. IT pub kviz

Špek Overflow zbacio Routne profitere s vrha | rep.hr

Špek Overflow zbacio Routne profitere s vrha

Routni profiteri pobijedili Simple Jack | rep.hr

Routni profiteri pobijedili Simple Jack

Routni profiteri ponovno pobijedili na IT pub kvizu | rep.hr

Routni profiteri ponovno pobijedili na IT pub kvizu

Hrvatski studio osmišljava softversko rješenje za gaming industriju | rep.hr

Hrvatski studio osmišljava softversko rješenje za gaming industriju

Gase li se Titlovi.com? | rep.hr

Gase li se Titlovi.com?

e-Građani će dobiti mobilnu aplikaciju vrijednu 2,15 milijuna eura | rep.hr

e-Građani će dobiti mobilnu aplikaciju vrijednu 2,15 milijuna eura

Htio preprodati domenu Heinekenu za 5000 eura, CARNET mu je oduzeo | rep.hr

Htio preprodati domenu Heinekenu za 5000 eura, CARNET mu je oduzeo

Danski mediji sumnjaju u vrijednost hrvatskog Bellabeata | rep.hr

Danski mediji sumnjaju u vrijednost hrvatskog Bellabeata

Wozniak posjetio Srbiju, Vučić mu dao državljanstvo | rep.hr

Wozniak posjetio Srbiju, Vučić mu dao državljanstvo

Burazer i ekipa potrošili 410.000 eura na sportsko klađenje | rep.hr

Burazer i ekipa potrošili 410.000 eura na sportsko klađenje

Danci objavili izvještaj o napadu na njihovu infrastrukturu | rep.hr

Danci objavili izvještaj o napadu na njihovu infrastrukturu

Zaggy Space pobijedio na Hacklu | rep.hr

Zaggy Space pobijedio na Hacklu

Devōt predvodi hrvatske firme na Deloitteovoj ljestvici | rep.hr

Devōt predvodi hrvatske firme na Deloitteovoj ljestvici

Porsche ugasio Greyp - Rimčev brend električnih bicikala | rep.hr

Porsche ugasio Greyp - Rimčev brend električnih bicikala

Spis o slučaju Bitlucky ima 3500 stranica | rep.hr

Spis o slučaju Bitlucky ima 3500 stranica

Croatia osiguranje predstavilo automatsku procjenu štete | rep.hr

Croatia osiguranje predstavilo automatsku procjenu štete

Luc Julia na FER-u: Peti level autonomne vožnje nikad neće postojati | rep.hr

Luc Julia na FER-u: Peti level autonomne vožnje nikad neće postojati

Hrvatski Python developeri u velikom broju preuzimali malware | rep.hr

Hrvatski Python developeri u velikom broju preuzimali malware

RIS-ova ponuda odbijena, Kingu informacijski sustav Holdinga | rep.hr

RIS-ova ponuda odbijena, Kingu informacijski sustav Holdinga

Najnovije

Web hosting | rep.hr

Hakeri otkrili kako pristupiti Google računima bez lozinke | rep.hr

Hakeri otkrili kako pristupiti Google računima bez lozinke

e-Dnevnik dobio nove funkcionalnosti | rep.hr

e-Dnevnik dobio nove funkcionalnosti

Postanite fan na Facebooku

Profili tvrtki (34)

Endava

Zagreb

FIVE (Pet minuta d.o.o.) je agencija fokusirana na dizajn i razvoj digitalnih proizvoda, s uredima u Hrvatskoj i New Yorku.

Amodo

Amodo je InsureTech tvrtka koja osiguravateljima pomaže stvoriti proizvode bazirane na podacima o ponašanju korisnika, koji se prikupljaju putem njihovih pametnih telefona.

Triple Innovations

Zagreb

Triple Innovations je softverska agencija usmjerena na razvoj poslovnog softvera na renomiranim svjetskim platformama: Salesforce i Microsoft Azure.

Amplexor Adriatic

Zagreb

AMPLEXOR LSPS globalni je dobavljač regulatornih, kvalitetnih i sigurnosnih rješenja za vođenje regulatornih procesa u Life science industriji s posebnim naglaskom na farmaceutsku industriju.

Undabot

Zagreb

Undabot je tvrtka specijalizirana za custom dizajn i razvoj visokokvalitetnih mobilnih i web aplikacija za klijente, orijentirana prvenstveno na europsko tržište.

Digihey

Zagreb

Digifhey je Digital Product Development studio s uredom u Zagrebu.

Infinum

Zagreb

Infinum je tvrtka specijalizirana za razvoj mobilnih aplikacija, mobilnih igara i web aplikacija.

Serengeti

Zagreb

Serengeti je konzultantska tvrtka za pružanje usluga razvoja softvera.

Locastic

Split

Locastic je nagrađivana splitska digitalna agencija koja se bavi razvojem softverskih rješenja - web i mobilnih aplikacija za renomirane klijente.

Notch

Zagreb

Notch je full-service software development tvrtka, u čijem fokusu je razvoj custom i enterprise rješenja za globalne klijente.

Morgan Code

Krapina

Morgan Code je tvrtka koja razvija visoko-kvalitetni softver po narudžbi, proizvode, mobilne aplikacije i web stranice.

About You

Zagreb

ABOUT YOU is one of the fastest growing e-Commerce companies in Europe and Hamburg’s first unicorn since 2018.

Superology

Zagreb

Tehnološka tvrtka koja razvija rješenja u industriji sportskog klađenja.

Comping

Zagreb

Comping je jedna od vodećih domaćih IT firmi koja posluje više od 30 godina i nudi vrhunska tehnološka rješenja.

SysKit

Zagreb

SysKit je hrvatska softverska tvrtka posvećena razvoju platformi za upravljanje Microsoftovim okolinama.

Pontis Technology

Zagreb

Pontis Technology je servisna IT kompanija iz Zagreba. Glavna djelatnost Pontisa je razvoj custom softverskih rješenja za internacionalne klijente.

Dream Agency

Zagreb

Dream agency bavi se razvojem web i mobilnih aplikacija.

ASEE

Zagreb

ASEE je vodeći partner digitalizacije financijskog sektora. Ako ste danas koristili mobilno bankarstvo ili platili nešto karticom sigurno ste koristili neka od IT rješenja ove kompanije.

Trikoder

Zagreb

Trikoder je tvrtka koja se bavi razvojem visokokvalitetnih web i mobilnih rješenja.

VuMedi

Zagreb

Vumedi je najveća svjetska videoedukacijska platforma namijenjena liječnicima.

Flow and Form

Zagreb

Flow and Form je tvrtka koja osmišlja kako koristiti tehnološke inovacije za trgovanje, gradnju i upravljanje nekretninama.

Poslovna inteligencija

Poslovna inteligencija vodeća je tvrtka za implementaciju analitičkih sustava u regiji.

Tria

Čakovec

Tria je tvrtka specijalizirana za razvoj custom softverskih rješenja za internacionalno tržište.

Gauss

Gauss je tvrtka koja pruža visokokvalitetna razvojna i konzultantska rješenja te omogućava implementaciju najsuvremenijih tehnologija u poslovanje svojih klijenata.

Valcon

Split

Valcon je kreativna tehnološka tvrtka posvećena razvoju relevantnih digitalnih proizvoda.

Mašinerija

Zagreb

Mašinerija je tvrtka specijalizirana za dizajn digitalnih proizvoda i softverska rješenja za web i mobilne aplikacije.

Aircash

Prva hrvatska fintech kompanija, koja je napravila mobilnu aplikaciju te je na hrvatsko tržište uvela prvi digitalni novčanik.

LeverUP Consulting

Zagreb

LeverUP Consulting, registrirani Salesforce Partner, je tim stručnjaka u svojim područjima s operativnim i upravljačkim iskustvom u različitim granama industrije.

Omega Software

Zagreb

Više od 20 godina Omega Software d.o.o. je predvodnik hrvatskog IT-ja, s naglaskom na kvalitetu i tehnologiju, a s ciljem stvaranja najučinkovitijih poslovnih rješenja.

Adnet

Zagreb

Adnet je R&D tvrtka orijentirana prvenstveno na razvoj softvera u domeni energetike. Glavne grupe proizvoda su NetVision - sustav za nadzor i upravljanje (eng. SCADA), Sustav za podršku tržištu energije (eng. MMS) i Sustav za podršku opskrbljivačima energijom.

iOLAP

Rijeka

iOLAP je globalna tvrtka sa sjedištem u Rijeci i Dallasu. Fokusirna je na rješenja iz područja velikih podataka, napredne analitike i stvaranja aplikacija.

Dwizards

Dwizards agencija pouzdan je partner za razvoj visokokvalitetnih web i softver rješenja s posebnom pažnjom na vrhunsku uslugu tijekom razvoja projekta.

Alfatec

Alfatec Group već više od tri desetljeća svoje klijente vodi na put promjene i rasta, a podaci su jezgra njihove ekspertize. Kao visokospecijalizirana tvrtka za upravljanje podacima, među predvodnicima su podatkovne industrije u SEE regiji.

Martian and Machine

Martian and Machine je hrvatsko-njemački venture studio koji se bavi izgradnjom startupova od nule.

Želite vidjeti svoj profil?
Javite nam se na info@rep.hr

Sva prava pridržana © REP 2009-2018

Dizajn & razvoj: 100% locastic