Grubišić: Tko se počne baviti Hadoopom, za 2-3 godine može imati firmu od 100 ljudi

Grubišić: Tko se počne baviti Hadoopom, za 2-3 godine može imati firmu od 100 ljudi

Predavanje Digitalni marketing koji je jučer na FER-u održao Tomislav Grubišić okupljenima je prvenstveno otkrilo Big Data svijet i njegov informatički potencijal.

Predavanje su organizirali Odjel za komunikacije Hrvatske sekcije IEEE i Odjela za računarstvo Studentskog ogranka Zagreb, a Grubišić se pokazao idealnim predavačem s obzirom na iskustvo koje je stekao kao suvlasnik tvrtke iStudio koje je u samo tri godine izrasla u tvrtku s više od 40 zaposlenih, a mogla bi se opisati kao full service social media tvrtka s jakim developerskim odjelom. 

Svoje predavanje one je započeo zaključkom kako ljudi sve više koriste razne uređaje (računala, IPTV, tablete, smartphoneove), a tehnologija omogućuje marketing prema svim tim platformama. Razne web i smartphone aplikacije na tim uređajima barataju ogromnom količinom podataka koje koriste milijuni korisnika, a problem se javlja jer tradicionalni sustavi koji koriste MySQL baze, tehnologiju koja ne može podnijeti svu tu količinu podataka. Skripte su ranije obrađivale razne podatke tijekom noći kako bi se sljedećeg dana napravio izvještaj, a digitalni marketing danas postavlja potrebu da se sve radi u stvarnom vremenu, jer je jedino tako moguće pratiti što korisnik radi i odmah se tome prilagođavati i  npr. prikazivati mu targetirane oglase. Ukoliko je primjerice netko na web stranicama za grupnu kupovinu dodao nešto u košaricu i iz nekog razloga odustao od kupnje, njega se i kasnije može targetirati s tim proizvodom ili mu pristupiti na drugi adekvatniji način. Ako se to kvalitetno napravi, financijski rezultati teško mogu izostati.

Kartice jednog hrvatskog trgovačkog lanca danas prate što su korisnici kupili, gdje su to kupili, koliko su potrošili i druge slične podatke na osnovu kojih se šalju razni kuponi ili materijali prilagođeni korisniku. Može se očekivati kako će slično targetiranje uskoro provoditi i na Internetu na kojem se generira sve više podataka. 2011. godine je „kroz Internet prošlo“ 1,8 zettabytea podataka (bilijuna GB), a 2015. godine se očekuje kako će ih „proći“ 7,9 zettabytea.
 
Big data podatke karakterizira to što dolaze brzo u velikim količinama te su nedefiniranog tipa i strukture. Grubišić je istaknuo opensource framework za obradu velike količine podataka Hadoop i dodao kako onaj tko se počne baviti tom tehnologijom za 2-3 godine može imati firmu od 100 ljudi, jer već sad postoji enormna potreba za ljudima koji znaju raditi na Hadoopu. 
 
Sama tvrtka iStudio u svom radu koristi Redis bazu podataka i MongoDB - tzv. „novi SQL“, odnosno alternativu SQL-u, u kojem ne treba unaprijed definirati tablice. (Tko npr radi u PHP-u u njemu može snimati gotove objekte, ne treba ih raščlanjivati po kolonama).
 
iStudio je Big Data iskoristio na način da je napravio alat Mediatoolkit koji nadzire sve portale na svijetu kako bi u pet minuta prepoznao promjene na njima i u njihovim kategorijama te nadzirao kako njihovi sadržaji (članci) kotiraju na društvenim mrežama. Na taj način putem prediktivnih modela Mediatoolkit procjenjuje koliko će popularni sadržaji imati shareova (tj. dijeljenja na društvenim mrežama) na kraju dana. Cilj ovog alata je omogućiti medijskim kućama praćenje konkurencije odnosno najatraktivnijih lokalnih i globalnih sadržaja brzo nakon njihovog nastanka, kako bi ih i one na vrijeme obradile. Na navedeni projekt za sada je potrošeno 2,5 milijuna kuna i skoro dvije i pol godine rada, a rezultati se tek očekuju. Po Grubišićevom mišljenju, to je najkvalitetnija real time baza vijesti na svijetu. Gotovo svi takvi alati osim njihovog u tu svrhu koristili su RSS feedove, a radi se o jako zanimljivom i zahtjevnom projektu.
 
Govoreći o mogućnostima oglašavanja na Facebooku, Grubišić je kao zanimljivost spomenuo mogućnost oglašavanja targetiranjem osobnih podataka nekog korisnika, no ta opcija nije dostupna bilo kome, već je se može developerski omogućiti, pri čemu treba paziti da se to ne radi bez dozvole korisnika (vjerojatno dobivene kroz neke uvjete korištenja). Nije nebitno napomenuti i kako je iStudio jedan od 200 tvrtki Facebook preffered marketing developera, odnosno jedina s takvim certifikatom na potezu od Beča do Istanbula, zbog čega za neke opcije ne moraju tražiti posebnu dozvolu od Facebooka.
 
Za kraj predavanja, prikazao je i mogućnosti Google Analyticsa, besplatnog alata koji osim uobičajene statistike za mjerenje posjećenosti neke web stranice nudi i podatke o prodaji na siteu koji je uključen u taj alat, pa se može – čak i u real timeu – vidjeti koliko stranica ima korisnika, gdje se nalaze, kako su došli na stranicu, usporediti te podatke s njihovom potrošnjom, sortirati robu po tome koliko je prodavana i slično.