Googleov Caffeine drži gotovo 100 milijuna GB podataka

Googleov Caffeine drži gotovo 100 milijuna GB podataka

Google je jučer završio novi sustav web indeksiranja nazvan Caffeine, zahvaljujući kojem tražilica daje 50 posto novije rezultate nego prije.

Kako je objavljeno na Googleovom blogu, podaci s weba indeksiraju se mnogo brže neovisno o tome nalaze li se na portalu s vijestima, blogu ili forumu.

Kao što je upućenijim korisnicima poznato od ranije, prilikom pretraživanja na Google ne pretržauje se web uživo, več ono što Google prethodno pretraži i indeksira, što radi cijelo vrijeme kako bi imao zabilježene sve sadržaje na Internetu.

Google se odlučio za unaprijeđenje svog sustava jer je sadržaja na webu sve više, web stranice su sve bogatije i složenije, a očekivanja ljudi sve veća.

Gore objavljeni prikaz pojašnjava kako radi sustav Caffeine, čiji dolazak smo najavili već ranije. Za razliku od starijeg sustava koji je imao više slojeva koji su se osvježavali različitom brzinom, pri čemu se glavni sloj osvježavao svakih nekoliko tjedana, Caffeine analizira web u malim komadima i nadopunjuje Googleovu bazu na kontinuiranoj bazi, globalno, što rezultira svježijim informacijama nego prije.

Svake sekunde, Caffeine tako paralelno procesira stotine tisuća stranica. Trenutno zauzima gotovo 100 milijuna GB prostora u jednoj bazi podataka i dnevno dodaje novih informacija reda veličine nekoliko stotina tisuća GB. 

Google Caffeine - velike promjene u pretraživanju weba

Google proteklih mjeseci radi na optimizaciji svog pretraživanja kroz novi projekt kodno nazvan Caffeine, koji će vlasnici nekih web stranica dočekati s oduševljenjem, a nekih drugih s ogorčenjem.

Google Caffeine uskoro spreman za širu javnost

Optimizirana Googleova tražilica Caffeine uskoro će biti spremna za masovnu upotrebu, objavljeno je na stranicama testne verzije.