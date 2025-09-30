Anthropic ha presentato Claude Sonnet 4.5, modello che si posiziona come una soluzione avanzata nel campo della programmazione, presentata come “il miglior coding model al mondo”, vantando prestazioni superiori a GPT-5 di OpenAI e Gemini 2.5 Pro di Google.

Le superiori capacità in ambito programmazione emergono dal benchmark OSWorld, suite che valuta le capacità dei modelli AI in attività informatiche pratiche. In tale contesto, Claude Sonnet 4.5 ottiene un punteggio del 61,4%, superando di 17 punti percentuali le performance di Opus 4.1 (solo quattro mesi addietro il punteggio di Sonnet 4 era di 42,2%).

Gli sviluppatori riportano migliori capacità con un’ampia varietà di analisi, incluse attività di ragionamento e matematica; competenze in settori quali finanza, legge, medicina e materie STEM evidenziano superiori conoscenze specifiche e di ragionamento rispetto ai precedenti modelli, incluso Opus 4.1.

Gli sviluppatori spiegano che le app di Claude ora supportano l’esecuzione di codice, la creazione di file per realizzare fogli elettronici, slide e documenti. È disponibile l’estensione Claude for Chrome per permette agli utenti dei piani Max di testare queste funzionalità ed è disponibile anche il Claude Agent SDK per la creazione di agenti.

Maggiore autonomia operativa e più sicurezza

Il nuovo modello integra migliorie anche per quanto riguarda l’autonomia operativa: è in grado di lavorare in modo indipendente su progetti che richiedono più fasi per una durata che supera le 30 ore consecutive, una differenza notevole rispetto alle circa sette ore di lavoro continuativo che Opus 4 garantiva alla presentazione. Questo traguardo è indicato come fondamentale per lo sviluppo di sistemi agentici e apre la strada ad automazioni complesse.

Anthropic riferisce ancora che Claude Sonnet 4.5 integra migliorie che riguardano l’addestramento per sicurezza, elementi che consentono di migliorare il comportamento, con una riduzione di “piaggeria, menzogne, ricerca di potere” e della tendenza a incoraggiare “pensieri deliranti”. Il framework di sicurezza AI di Livello 3 integra filtri specifici che bloccano la generazione di output potenzialmente pericolosi relativi ad argomenti quali armi chimiche, biologiche e nucleari.

