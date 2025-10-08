Mentre con i loro modelli agentici Anthropic e OpenAI cercano di controllare un intero computer, inclusi file e sistema operativo, per il suo Computer Use ora in anteprima per sviluppatori Google preferisce iniziare limitandosi al browser web, alla navigazione su Internet e al massimo all’interazione con dispositivi mobile.

Ciò nonostante si tratta di un passo importante perché mira ad ampliare le funzioni dei modelli AI, superando i confini d’azione resi possibili dalle API di programmazione. Grazie alla possibilità di effettuare operazioni finora riservate agli utenti in carne e ossa, il modello Computer Use permette di realizzare agenti AI in grado di accedere e interagire con siti web e servizi, compilare documenti e form, in generale effettuare operazioni per cui non esistono API.

Computer Use è basato su Google Gemini 2.5 Pro che permette all’AI sia la comprensione visiva che le capacità di ragionamento, indispensabili per interagire con le interfacce utente UI.

Tutte le operazioni che è in grado di effettuare Gemini 2.5

Per il momento è in grado di effettuare 13 operazioni: aprire il browser, aspettare 5 secondi, andare avanti e indietro nella cronologia delle pagine web, effettuare una ricerca con il motore predefinito, inserire un indirizzo web per accedere a una pagina specifica, cliccare, scorrere il puntatore su coordinate specifiche, inserire testo, effettuare una combinazione di testa, scorrere un documento oppure in un’area della pagina, infine effettuare anche il drag & drop.

Computer Use è già impiegato da Google per le funzioni agentiche di AI Mode, oltre che in Project Mariner, un prototipo di ricerca in grado di eseguire operazioni in autonomia all’interno di un browser. Ma la sua utilità si estende anche agli sviluppatori e società terze parti che devono testare interfacce utente.

Big G dichiara che il suo Computer Use supera le alternative dei concorrenti in termini di bassa latenza e precisione. Gli sviluppatori possono già utilizzare Computer Use tramite Google AI Studio e Vertex AI. È possibile osservarlo in azione da questa pagina di Browserbase, scegliendo tra quattro azioni già pronte oppure digitando un campito da eseguire.

