Antena 3 CNN High Tech ChatGPT duce imaginile AI la un nou nivel, lansând noua versiune care „gândește” înainte să creeze

ChatGPT duce imaginile AI la un nou nivel, lansând noua versiune care „gândește” înainte să creeze

Laura Dinu
1 minut de citit Publicat la 12:00 25 Apr 2026 Modificat la 12:00 25 Apr 2026
Noul model aduce îmbunătățiri semnificative în respectarea instrucțiunilor, redarea textului în imagini și compoziție. Foto: Getty Images

OpenAI a lansat o actualizare majoră pentru generarea de imagini în ChatGPT, ducând tehnologia la un nou nivel. Noua versiune, numită ChatGPT Images 2.0, combină raționamentul, cercetarea și designul vizual, oferind imagini cu o rezoluție de până la 2K, potrivit Interesting Engineering.

La puțin peste un an de la introducerea generării native de imagini, compania încearcă să transforme acest instrument dintr-o simplă funcție într-un sistem creativ interactiv. Potrivit OpenAI, noul model aduce îmbunătățiri semnificative în respectarea instrucțiunilor, redarea textului în imagini și compoziția scenelor.

Un element important este faptul că sistemul poate „gândi” înainte de a genera imagini, verificând rezultatele și folosind informații externe atunci când este necesar. Scopul este de a face imaginile generate de inteligența artificială mai utile în activități reale, nu doar experimentale.

Două moduri de lucru

Noua versiune vine cu două moduri distincte: Instant și Thinking.

Modul Instant este orientat spre viteză și produce rapid imagini de calitate bună. În schimb, modul Thinking analizează cerința înainte de a genera vizualul, ceea ce permite rezultate mai coerente.

Acest al doilea mod rezolvă o problemă mai veche a modelelor AI: lipsa de continuitate între imagini. Astfel, utilizatorii pot crea povești vizuale consistente, utile în proiecte precum benzi desenate, storyboard-uri sau design pe mai multe cadre.

Interacțiune mai naturală

O schimbare majoră este modul în care utilizatorii interacționează cu sistemul. Generarea de imagini nu mai este un proces simplu, bazat pe o singură comandă.

Utilizatorii pot modifica imaginile prin conversație: pot face zoom, pot schimba detalii sau compoziția fără să o ia de la zero. Sistemul ține cont de context și permite ajustări treptate, ca într-un proces real de creație.

În demonstrațiile prezentate, modelul a generat mai multe variante de design pornind de la o singură imagine și a combinat informații din mediul online pentru a crea elemente vizuale explicative, inclusiv coduri QR.

Îmbunătățiri tehnice și lingvistice

Noua versiune gestionează mai bine și limbile care nu folosesc alfabetul latin, precum japoneza, chineza sau hindi, o limitare frecventă în trecut.

De asemenea, modelul este mai precis în redarea stilurilor artistice și oferă mai multă flexibilitate tehnică: suportă diferite formate de imagine și poate genera până la opt variante simultan.

Etichete: OpenAI chatGPT imagine
Citește mai multe din High Tech
» Citește mai multe din High Tech
TOP articole