OpenAI ha presentato l’anteprima di un’agente AI denominato Operator, pensato per aiutare gli utenti nelle attività quotidiane svolte normalmente con il browser.

Il modello sfruttato combina le capacità di visione di GPT-4o con un ragionamento avanzato attraverso l’apprendimento potenziato ed è in grado di navigare in ambienti digitali (pulsanti, menu, campi di testo, ecc.). È al momento disponibile solo per gli utenti USA abbonati al piano ChatGPT Pro da 200$ al mese, e sembra promettente: è in grado di interagire con vari siti, come se fosse l’utente a prendere in mano il mouse, eseguendo operazioni come prenotare un ristorante, un volo, un Uber, rispondere alle mail, fare la spesa on line al posto nostro (basta partire da frasi come “Comprami” seguita dall’elenco di cose da comprare), ecc.

Operator può interagire con vari siti, digitare testi, cliccare, scorrere le pagine, ecc. Se non riesce a proseguire può chiedere all’utente di intervenire, è in grado di imparare dai suoi errori, può chiedere l’autorizzazione prima di inserire in automatico dati sensibili come login e password, dati bancari e attendere l’ok dell’utente prima di spedire un messaggio di posta elettronica.

OpenAI afferma che Operator è stato progettato per “rifiutare richieste dannose” e “bloccare contenuti non consentiti”.

OpenAI ha fatto sapere di aver collaborato con aziende quali DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack e Uber, rispondendo a esigenze reali, nel rispetto di norme consolidate. Gli sviluppatori hanno spiegato che potrebbero ancora esserci problemi, e che vi sono inconvenienti nelle interazioni con interfacce complesse, come ad esempio quelle che permettono di creare slideshow o gestire calendari.

In futuro Operator dovrebbe arrivare per gli utenti dei piani Plus, Team, ed Enterprise, integrando le funzionalità in questione in ChatGPT. IA come queste aprono nuovi scenari ma non mancano interrogativi sulla privacy e la sicurezza dei dati.

