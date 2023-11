Nell’ambito della conferenza re:Invent di Las Vegas, Amazon Web Services (AWS) ha annunciato novità legate all’AI, lasciando intuire quelli che saranno alcuni obiettivi a lungo termine dell’azienda per quanto riguarda le piattaforme di intelligenza artificiale.

Sono stati presentati chip di nuova generazione per l’AI pensati per il training (l’addestramento) e l’esecuzione di compiti che è possibil eseguire con intelligenze artificiali. Trainium2, per il training di modelli, promette migliorie fino a 4x in termini di performance, e fino a 2x in termini di efficienza energetica rispetto al predecessore.

Amazon riferisce che questi chip permetteranno agli sviluppatori di addestrare velocemente modelli e con costi inferiori, grazie alla riduzione del consumo energetico. Anthropic, un competitor di OpenAI, finanziato da Amazon, ha già annunciato l’intenzione di creare modelli sfruttando i chip Trainium2.

Graviton4 è invece un chip più generico. Si tratta di processori basati su architettura ARM, che consumano meno rispetto a chip Intel o AMD. Amazon riferisce di un incremento di prestazioni del 30% in termini di performance generali sfruttando modelli di addestramento AI integrati nel processore, elemento che dovrebbe ridurre i costi legati al cloud computing di organizzazioni che sfruttando con regolarità modelli IA, e anche per gli utenti che usano le IA per compiti come ad esempio la modifica delle foto e cose simili.

Nel complesso, Graviton4 permetterà agli utenti AWS di “elaborare grandi quantità di dati, scalare carichi di lavoro, ridurre i tempi per ottenere risultati, e ridurre i costo di gestione”.

Attualmente AWS offre oltre 150 istanze Graviton che è possibile utilizzare per una vasta gamma di carichi di lavoro diversi, dispone di oltre 2 milioni di processor Graviton e vanta oltre 50.000 clienti che usano istanze di questo tipo (nomi quali: SAP, Nielsen, Pinterest, Stripe e altri ancora). Ciascuna vCPU sulle istanze Amazon EC2 basate su Graviton è un core di un processore AWS Graviton.

