Antena 3 CNN High Tech Google lansează Gemini 2.5 Deep Think: Ce aduce nou față de versiunile anterioare

Google lansează Gemini 2.5 Deep Think: Ce aduce nou față de versiunile anterioare

Laura Dinu
2 minute de citit Publicat la 08:00 09 Aug 2025 Modificat la 08:00 09 Aug 2025
Utilizatorii care plătesc abonamentul Ultra de 250 de dolari pe lună vor avea acces la Gemini 2.5 Deep Think în aplicația Gemini, începând de vineri. Foto: Getty Images

Google DeepMind a lansat Gemini 2.5 Deep Think, un nou model de inteligență artificială despre care compania susține că este cel mai avansat din portofoliul său în ceea ce privește raționamentul complex. Acesta poate răspunde la întrebări explorând mai multe idei în paralel și selectând ulterior cea mai bună variantă de răspuns, scrie techcrunch.com.

Utilizatorii care plătesc abonamentul Ultra de 250 de dolari pe lună vor avea acces la Gemini 2.5 Deep Think în aplicația Gemini, începând de vineri.

Ce este diferit la Gemini 2.5 Deep Think

Prezentat pentru prima dată în mai, la Google I/O 2025, Gemini 2.5 Deep Think este primul model multi-agent disponibil publicului larg. Practic, acesta generează mai mulți agenți AI care lucrează în paralel pentru a rezolva o problemă – un proces care consumă mai multe resurse computaționale, dar produce rezultate mai bune.

Google a folosit o variantă a acestui model pentru a câștiga medalia de aur la Olimpiada Internațională de Matematică (IMO) din acest an.

Totodată, compania a anunțat că va oferi acces la versiunea folosită la IMO unui grup restrâns de matematicieni și cercetători. Această versiune este capabilă să „raționeze ore întregi”, spre deosebire de modelele AI obișnuite, care generează răspunsuri în câteva secunde sau minute.

Performanțe de top pe teste dificile

Google susține că Gemini 2.5 Deep Think a înregistrat rezultate remarcabile în Humanity’s Last Exam (HLE) – un test complex ce evaluează capacitatea AI-ului de a răspunde la mii de întrebări din matematică, științe și umanioare. Modelul Google a obținut un scor de 34,8%, față de 25,4% pentru Grok 4 (xAI) și 20,3% pentru OpenAI o3.

Pe testul LiveCodeBench 6, destinat evaluării performanței în sarcini de programare competitivă, Gemini 2.5 Deep Think a obținut 87,6%, în timp ce Grok 4 a avut 79%, iar OpenAI o3 – 72%.

Funcționalități extinse și răspunsuri detaliate

Modelul se integrează automat cu instrumente precum executarea de cod și Google Search, și poate genera răspunsuri mult mai lungi și mai elaborate decât modelele AI tradiționale. Google afirmă că în testele interne, Gemini 2.5 a produs rezultate mai atractive și mai bine structurate în sarcini de dezvoltare web.

Viitorul AI: sistemele multi-agent

Google nu este singura companie care pariază pe sistemele multi-agent. xAI, compania lui Elon Musk, a lansat recent Grok 4 Heavy, un model AI multi-agent cu performanțe de top. Și OpenAI a folosit un astfel de sistem – încă nelansat public – pentru a câștiga aurul la IMO. De asemenea, Anthropic folosește această abordare pentru Research Agent, un model AI care generează rapoarte detaliate.

Cu toate acestea, costurile de rulare a sistemelor multi-agent sunt mult mai mari, ceea ce explică de ce ele sunt disponibile doar prin abonamentele premium.

Citește mai multe din High Tech
» Citește mai multe din High Tech
TOP articole