Questo sito contiene link di affiliazione per cui può essere compensato

Home » Hi-Tech » AI - Intelligenza Artificiale » Grok 4 supera tutti nell’Ultimo Esame dell’Umanità e nel prezzo

Grok 4 supera tutti nell’Ultimo Esame dell’Umanità e nel prezzo

Dimenticate Hitler e i post antisemiti di Grok 3, così come abbiamo quasi dimenticato la pizza con la colla di Google AI, il predecessore di Gemini: ora secondo Elon Musk e il team di xAI Grok 4 è il modello di intelligenza artificiale più potente al mondo.

L’annuncio è arrivato nel  corso della notte e nel momento in cui scriviamo il sito web di xAI non è ancora stato aggiornato. Ma le prestazioni e le imprese di cui è già capace Grok 4 al debutto (genericamente in estate) sono state illustrate da Elon Musk e da alcuni membri del team xAI durante una diretta video trasmessa nelle scorse ore.

Grok 4 e l’Ultimo Esame dell’Umanità

Nel test dall’inquietante nome Humanity Last Exam HLE, letteralmente l’ultimo esame dell’umanità Grok 4 è il modello AI che ottiene il punteggio migliore, superando tutti i modelli di frontiera più celebri.

Grok 4 supera tutti nell’Ultimo Esame dell’Umanità e nel prezzo - macitynet.it
immagine di xAI

Si tratta di un test in cui anche l’umano più dotato e istruito può arrivare a un risultato massimo di una singola cifra percentuale, perché consiste in oltre 2.500 domande elaborate in crowdsourcing (non disponibili su internet) super complesse, ognuna della quali per essere risolta richiede conoscenza e competenze pari o superiori a quelle di un ricercatore specializzato. Ma il test Humanity Last Exam HLE copre matematica, chimica, biologia, linguistica e praticamente ogni altro campo del sapere e materia di studio.

Più precisamente Grok 4 base senza “strumenti” arriva a un punteggio del 25,4%, superando così sia Google Gemini 2.5 Pro (21,6%) che il modello o3 di OpenAI (21%). Con strumenti si intende un set di regole e funzioni che date in pasto al modello AI garantiscono prestazioni sensibilmente superiori.

Grok 4 supera tutti nell’Ultimo Esame dell’Umanità e nel prezzo - macitynet.it

Sempre secondo Musk e xAI nella modalità con strumenti Grok 4 raggiunge il 44,4% nello stesso test, il punteggio più alto mai registrato finora, quasi doppiando la distanza da Google Gemini 2.5 Pro che si ferma al 26,9%. Anche nel test ARC-AGI-2 con puzzle impegnativi in cui i modelli AI devono identificare pattern visivi, Grok 4 segna il punteggio record di 16,2%, quasi il doppio del secondo piazzato Claude Opus 4 di Anthropic.

Grok 4 supera tutti nell’Ultimo Esame dell’Umanità e nel prezzo - macitynet.it

Supera qualsiasi ricercatore umano in qualsiasi materia

Durante la presentazione in live streaming Elon Musk dichiara:

“Per quanto riguarda le domande accademiche, Grok 4 è migliore del livello di dottorato in ogni materia, senza eccezioni”

Subito però aggiungendo “A volte, potrebbe mancare di buon senso e non ha ancora inventato nuove tecnologie o scoperto nuova fisica, ma è solo questione di tempo”.

Musk prevede che Grok 4 sarà in grado di inventare una nuova tecnologia entro la fine di quest’anno, al più tardi entro il 2026, anno in cui dovrebbe elaborare anche una nuova fisica. Sempre nel 2026 dovrebbe arrivare il primo videogioco creato da Grok e un lungometraggio interamente generato da AI.

Grok 4 supera tutti nell’Ultimo Esame dell’Umanità e nel prezzo - macitynet.it

Versioni, funzioni e prezzo

L’ultimo modello AI di Elon Musk e xAI è proposto in due versioni: Grok 4 e la versione multi agentica Grok 4 Heavy che funziona come un gruppo di studio composto da esperti che confrontano il lavoro di ciascuno per arrivare alla risposta definitiva.

Le prestazioni super di Grok 4 si traducono nel prezzo più elevato richiesto finora per un abbonamento AI: servono 300 dollari al mese per il piano SuperGrok Heavy che offre accesso anticipato al modello più sofisticato e alle nuove funzioni in arrivo.

La tabella di marcia prevede: in agosto un modello evoluto dedicato alla programmazione, a settembre significativi miglioramenti alle funzioni che richiedono la visione, quindi un agente multimodale, infine a ottobre la generazione di video.

Grok 4 è chiamato a mantenere le mirabolanti promesse nella realtà non appena sarà disponibile questa estate, mentre si prepara la sfida con il prossimo agguerrito concorrente ChatGPT-5 o quale sarà il nome ufficiale anche questo previsto entro l’estate.

Tutti gli articoli sull’Intelligenza Artificiale sono disponibili da questa pagina di macitynet.

Offerte Apple e Tecnologia

Le offerte dell'ultimo minuto le trovi nel nostro canale Telegram

Le migliori offerte BLACK FRIDAY con macitynet.it

Pubblicità
Pubblicità

Ultimi articoli