ChatGPT sad vidi, čuje i govori

ChatGPT sad vidi, čuje i govori

OpenAI je objavio kako će tijekom sljedeća dva tjedna ChatGPT dobiti nove glasovne i slikovne mogućnosti te novo intuitivnije sučelje.

Drugim riječima, korisnik će s ChatGPT-om moći razgovarati, dok će ovaj moći "vidjeti" na način da primjerice koristi fotografiju kao input. Ove opcije će kroz sljedeća dva tjedna dobiti Plus i Enterprise korisnici koji plaćaju ChatGPT uslugu, dok će ih ostali dobiti nekad kasnije. Glasovne mogućnosti bit će dostupne na Android i iOS uređajima nakon što ih korisnici uključe u postavkama, a slikovne mogućnosti dobit će sve platforme.

Korištenje fotografija omogućit če neke nove prilike za korištenje ChatGPT-a. U OpenAI-jevoj objavi kao jedan od primjera navodi se fotografiranje frižidera i smočnice, kako bi ChatGPT predložio što napraviti za večeru, a po potrebi dao i recepte. Nove mogućnosti idu i u smjeru mogućnosti poznate (sada Googleove) aplikacije Photomath razvijene u Hrvatskoj, jer ChatGPT može i riješiti i raspraviti matematički problem koji korisnik prethodno fotografira.

Činjenica da će ChatGPT razumjeti glasovni input i moći dati glasovne odgovore također otvaraju niz novih mogućnosti korištenja. ChatGPT ćće djeci moći čitati priče za laku noć, pročitati neki tekst ljudima koji primjerice voze ili ne vide... ChatGPT tekst može čitati raznim glasovima koji zvuče prilično nerobotski - barem na engleskom jeziku. Nije poznato kako će to zvučati na hrvatskom, no u objavi je istaknuto da pretvaranje teksta u govor kod drugih jezika može biti lošije kvalitete - ali prvenstveno kod onih koji koriste nelatinična pisma. 

Više ranijih članaka o ChatGPT-u na rep.hr-u mogu se pronaći ovdje, a raniji članak o ElevenLabsovom generatoru teksta koji izvrsno čita tekstove na hrvatskom jeziku ovdje.