Završna konferencija projekta Uspostava integralnog sustava za upravljanje službenom dokumentacijom Republike Hrvatske održana je jučer u Mozaik centru.
Navedeni projekt započeo je još 2018. godine te bi uskoro trebao biti završen. Riječ je o sustavu koji svim zainteresiranima nudi trajan i besplatan pristup dokumentima, a dostupan je na adresi sredisnjikatalogrh.gov.hr/
Osim Središnjeg državnog ureda za razvoj digitalnog društva kao nositelja projekta, na njemu je kao partner radio FER-ov laboratorij za analizu teksta i inženjerstvo znanja. FER se u sklopu projekta bavio razvojem semantičke tražilice, a o čemu se točno radi na prezentaciji je pojasnio je prof.dr. Jan Šnajder. Semantička tražilica primjerice mora znati da onaj tko pretražuje dokumente u kojima se spominje prasad istovremeno u rezultatima želi i dokumente u kojima se spominju svinje, s obzirom da obje riječi imaju isto značenje i u protivnom rezultati nisu potpuni. Dao je i specifične primjere za hrvatski jezik, u kojem je primjerice krivi padež ne smije utjecati na smanjenje rezultata pretrage.
Sustav je postojao i ranije, a voditelj projekta Tomislav Malarić pojasnio je kako se krenulo u izradu novoga zato jer je prethodni imao dva CMS-a, tri različite tražilice, manjak automatizacije i povezanosti aplikacija i baza, neautomatizirano prikupljanje podataka, manjak kontrolnih mehanizama, uporabu većeg broja posebno kreiranih IT aplikacija i baza te rad u mrežnim bazama podataka. Detalje sustava prezentirali su i Kristijan Crnković iz tvrtke ArhivPRO i Željka Motika iz Središnjeg državnog ureda za razvoj digitalnog društva.
Šnajder je naveo i tehnologije koje su koristiti u projektu. PostGRE SQL su koristili za zapise o korisničkim akcijama, Apache Solr za indekse ze izvorne i izvedene oblike dokumenata te dodatne podatke za facetiranje, Python i Django za module za semantičku obradu temeljene na strojnom učenju, odgovaranje na upite preko API-ja te pripremu za indeksaciju, a OpenAPI initiative i Docker spominjali su se u kontekstu API-ja koji se mogu koristiti za pretraživanje i indeksiranje dokumenata.
Po završetku prezentacije uslijedio je okrugli stol na kojoj su sudjelovali moderator prof.dr. Jan Šnajder s FER-a, državni tajnik Bernard Gršić, prof.dr. Marko Tadić s Filozofskog fakulteta, prof.dr. Iris Golder Lang s Pravnog fakulteta, prof.dr. Marijana Grbeša s Fakulteta političkih znanosti i Zana Čizmin iz tvrtke Ciklopea. Tema stola bio je utjecaj tehnologije na pristup pouzdanim uslugama i informacijama.