Nacionalna i sveučilišna knjižnica u Zagrebu i Sveučilišni računski centar danas su u prostorima knjižnice predstavili rezultate prvog harvestiranja, odnosno pobiranja hrvatskog web prostora (.hr domene).
NSK je u suradnji sa Srcem od 18. srpnja do 18. kolovoza 2011. godine izvršila pobiranje preko 56 milijuna datoteka ukupne veličine preko 3.1 TB. Prikupljani su i arhivirani javno dostupni sadržaji s aktivnih web-sjedišta u domenama .hr, .com.hr i .biz.hr prema popisu aktivnih domena koji je Knjižnici dostavila CARNet-ova DNS služba.
Rezultati su pokazali da je web-prostor još uvijek jednostavan to jest da je 90 posto resursa u desetak osnovnih formata te da tekstualni zapisi i dalje zauzimaju vodeće mjesto. Slijede ih slike i .pdf datoteke, a tek onda video i audio sadržaj.
Arhiviranoj građi će zbog problematike tehničke i pravne prirode za prvo vrijeme biti moguće pristupiti samo unutar Knjižnice. Također, najavljeno je da će se proces harvestiranja, ukoliko to sredstva budu dopuštala, ponavljavljati jednom godišnje.
NSK i Srce inače redovito prikupljaju publikacije s weba još od 2004. godine, ali se to prikupljanje obavlja selektivno. Arhivirani materijal dostupan je na stranicama Hrvatskog arhiva weba (HAW-a).
Djelatnici NSK naglasili su važnost prikupljanja, obrade i objave intelektualne i kulturne baštine te upozorili na izazove harvestiranja podataka kao što su prikupljanje i klasifikacija specifičnog ili eliminacija neželjenog sadržaja.
PROMO AKCIJA: Uz svaku kupljenu .hr domenu Inside.hr poklanja 12 mjeseci hostinga. Vrijeme trajanja akcije 21.11.2011. do 21.12.2011. |
Plaćeni mini oglas. |