Înapoi
Gemini 3 Flash introduce o nouă viziune „Agentic” pentru îmbunătățirea răspunsurilor vizuale
Tech

Gemini 3 Flash introduce o nouă viziune „Agentic” pentru îmbunătățirea răspunsurilor vizuale

Postat 1 oră în urmă

Update 1 oră în urmă

Timp de citire: 1 minut

Articol scris de: Cristina Preda

Agentic Vision este o nouă capacitate a modelului Gemini 3 Flash, care îmbunătățește acuratețea sarcinilor legate de imagini prin „fundamentarea răspunsurilor în dovezi vizuale”. Aceasta înseamnă că modelul poate oferi răspunsuri mai precise, conform 9to5google.com.

👉 Limitele modelelor AI tradiționale în procesarea imaginilor

Modelele de AI de frontieră, cum ar fi Gemini, procesează de obicei lumea într-o singură privire statică. Dacă acestea omit un detaliu fin, cum ar fi un număr de serie pe un cip sau un semn de stradă îndepărtat, sunt nevoite să ghicească. Această nouă abordare „consideră viziunea ca o investigație activă”, combinând raționamentul vizual cu execuția de cod și alte instrumente în viitor.

Pentru a răspunde solicitărilor cu imagini, Gemini 3 Flash va formula „planuri de a mări, inspecta și manipula imaginile pas cu pas.” În mod specific, Agentic Vision se bazează pe un ciclu „Gândește, Acționează, Observă”.

Distribuie aceasta stire pe social media sau mail
Alte postari din Tech
Acasa Recente Radio Județe