E’ arrivato il giorno in cui i modelli di intelligenza artificiale AI più avanzati del mondo si sfidano a scacchi. L’intelligenza artificiale si darà battaglia sulla scacchiera nel primo di una serie di tornei ospitati da Kaggle, la comunità di data science di Google, all’interno della sua nuova piattaforma, la Game Arena.

L’evento, che si svolge dal 5 al 7 agosto, vede sfidarsi in un torneo a eliminazione diretta otto dei più noti modelli di AI, tra cui o3 e o4-mini di OpenAI, Gemini 2.5 Pro e Gemini 2.5 Flash di Google, Claude Opus 4 di Anthropic, e Grok 4 di xAI. L’obiettivo non è solo determinare quale modello sia il migliore a scacchi, ma soprattutto valutare le loro capacità di ragionamento e di pianificazione strategica in un ambiente dinamico e competitivo.

A differenza dei tradizionali motori scacchistici, questi modelli non sono specializzati nel gioco, ma sono Large Language Models (LLM) pensati per attività di scrittura e codifica. Inoltre, i modelli non hanno accesso a strumenti esterni per suggerire le mosse, e se proveranno a farne una non valida avranno solo tre tentativi prima di perdere la partita a tavolino.

Il torneo, insomma, si propone di essere una vetrina sul “modo di pensare” di queste AI, con le partite che saranno addirittura trasmesse e visibili in streaming su Kaggle, con il commento del grande maestro e celebre streamer di scacchi Hikaru Nakamura.

Inoltre, sono previsti riassunti e analisi quotidiane da parte di Levy Rozman sul suo canale YouTube GothamChess, mentre la finale sarà commentata dal campione di scacchi Magnus Carlsen. La prima giornata di competizione nella Kaggle Game Arena ha visto quattro modelli avanzare alle semifinali, grazie a una serie di schiaccianti vittorie per 4 a 0.

Il primo match ha visto o3 sconfiggere Kimi k2, che ha ha mostrato evidenti difficoltà a mantenere la coerenza strategica, perdendo tutte le partite per aver effettuato mosse illegali. In un’altra partita, o4-mini ha battuto DeepSeek R1.

Invece Gemini 2.5 Pro ha avuto la meglio su Claude Opus 4 in quello che è stato l’unico match con il maggior numero di scacchi matti effettivi, a differenza delle altre partite vinte per mosse non consentite.

Infine, Grok 4 ha trionfato su Gemini 2.5 Flash. Proprio Grok 4 è stata particolarmente impressionante, dimostrando una notevole capacità di identificare e sfruttare gli errori dell’avversario. Le semifinali, previste per oggi, vedranno contrapporsi i modelli di OpenAI (o3 vs o4-mini) e la sfida tra Grok 4 e Gemini 2.5 Pro.

