Voi avete paura dell’intelligenza artificiale? Forse è lei che dovrebbe aver paura di noi. Comunque sia, sappiate che è ufficialmente finita l’era in cui l’intelligenza artificiale era confinata in una chat. Con il lancio delle API per il desktop di Claude 3.5 Sonnet, Anthropic ha aperto una nuova frontiera: l’AI può usare il computer esattamente come facciamo noi. Come abbiamo già scritto può guardare lo schermo, muovere il cursore, cliccare i pulsanti e digitare testo. È una svolta epocale che potrebbe cambiare radicalmente il modo in cui interagiamo con la tecnologia.

La corsa agli agenti

Ovviamente Claude non è l’unico che vuole fare queste cose. Anche i ChatBot di Microsoft, Salesforce e Asana sono in corsa per arrivare a fare le stesse cose: molte aziende del settore stanno correndo per costruire i propri agenti AI “speciali”. Ma quello che rende unico l’annuncio di Anthropic è che per la prima volta un’intelligenza artificiale può uscire dalla gabbia del chatbot. Non si limita più a rispondere alle nostre domande, ma può completare progetti al posto nostro. È come avere un assistente digitale che non si limita a suggerire cosa fare, ma lo fa direttamente. Cosa significa esattamente? Una volta che lo avete capito farete un salto sulla sedia (o sul posto, se siete in piedi).

Premessa. Ci sono ancora dei limiti. La stessa Anthropic ammette che questa prima versione è lenta e fa molti errori. Nei test standardizzati ottiene un punteggio del 14,9%, mentre gli umani arrivano al 70-75%. Tuttavia, è già il doppio rispetto al secondo miglior modello AI in questa categoria. È un risultato molto umano: anche noi facciamo fatica con certe operazioni al computer. Tuttavia, come è noto, il punto non è la velocità ma se l’AI è in grado di fare qualcosa o no. Se è in grado di farlo, occorre solo tempo e iterazioni prima che lo faccia più velocemente di noi.

L’esperienza sul campo

I primi testi sono stati fatti anche da persone esterne ad Anthropic che hanno avuto accesso in anteprima alle API. È hanno fatto cose interessanti. Ethan Mollick, docente della Wharton School, ha testato l’agente chiedendogli di preparare un piano di lezioni su Il Grande Gatsby. «Ho chiesto all’AI di mettere insieme un piano didattico per studenti delle superiori, suddividendolo in parti leggibili e creando compiti e collegamenti legati agli standard di apprendimento Common Core. Le ho anche chiesto di mettere tutto in un unico foglio di calcolo. Con un chatbot avrei dovuto guidare l’AI attraverso ogni passaggio. Qui è stato diverso: una volta date le istruzioni, l’AI ha eseguito i passaggi da sola».

Solo da questo esempio si dovrebbe capire tutto: Claude prende il controllo è fa tutto lui. L’agente ha scaricato il libro, cercato piani di lezione sul web, aperto un foglio di calcolo e compilato una prima bozza. Ha poi cercato gli standard Common Core e fatto revisioni multiple. I risultati non sono perfetti ma sono utilizzabili. La differenza fondamentale è che l’utente può delegare un compito complesso e tornare più tardi per vedere il risultato.

Le possibili applicazioni

Le potenzialità sono enormi. Si può immaginare un agente che gestisce appuntamenti e pianificazione, compila moduli online, risponde alle email e fa shopping per noi. Potrebbe navigare sul web al nostro posto, preparando un digest personalizzato che ci evita di lottare contro i paywall. Ma c’è anche il rischio che queste capacità vengano usate per operazioni spam o per sovraccaricare istituzioni e aziende con richieste generate dall’AI.

Infatti, qui la questione della privacy è cruciale. Microsoft ha dovuto ritardare il lancio di Recall, una funzionalità che permette di cercare tutte le attività passate sul computer attraverso screenshot silenziosi, proprio per problemi di sicurezza. Anthropic dovrà affrontare sfide simili: per operare per nostro conto, l’agente deve avere accesso al nostro computer. Le aziende vorranno garanzie su come vengono gestiti i dati dei dipendenti e dei clienti.

I limiti attuali

C’è scetticismo sulla possibilità che il linguaggio naturale diventi presto il nuovo linguaggio di programmazione. Una vecchia vignetta nerd vede due programmatori che dialogano: uno dice: “Presto chiunque potrà programmare semplicemente spiegando in linguaggio semplice e logico cosa vuole esattamente”. L’altro programmatore risponde: “Siamo salvi”.

Il computer non può interpretare cosa uno vuole se neanche quella persona lo sa. Un CEO del settore ha fatto notare che anche quando i manager “programmano in inglese” dando cioè istruzioni ai loro ingegneri, il processo è pieno di errori e inefficienze. La comunicazione umana resta complessa da interpretare anche per l’AI più sofisticata.

Tuttavia, questa versione di Claude è una forma di futuro che è solo all’inizio. È il peggio che vedremo di questa tecnologia: da qui in poi potrà solo migliorare. L’intelligenza artificiale non sarà più limitata a quello che può essere digitato in una chat. È il momento di iniziare a pensare in modo diverso a come interagiremo con i computer nel prossimo futuro. È una svolta notevolissima, segnatevela sul vostro diario.

