Nel giorno in cui Apple ha ufficialmente annunciato il ritardo di Siri on Ai, quindi fatto sapere di essere in grave ritardo nei suoi piani, si apprende che Microsoft di piano ne ha uno capace di liberarla dalla dipendenza da OpenAI di superare l’attuale partner e anche Anthropic.

La strategia parte dall’adozione di Large Language Model (LLM), la base per l’Intelligenza artificiale, tutto costruiti in casa. Stiamo parlando di un set di piattaforme, più che di un semplice LLM che internamente viene chiamato MAI, che potrebbe essere l’acronimo di “Microsoft Artificial Intelligence” o fare riferimento Maia 100.

Questa componente è di fatto un chip basato su tecnologia TSMC a 5 nm, specializzato nell’AI, sviluppato internamente presentato lo scorso anno alla conferenza Hot Chips 2024. MAIA 100 si distingue per l’architettura integrata, una unità tensor per l’elaborazione di compiti di training e inferenza con supporto di vari di dati incluso il formato MX introdotto da Microsoft nel 2023.

Come dice Bloomberg Microsoft sta testando una serie di modelli LLM per valutare le prestazioni. Nell’ambito delle valutazioni, gli ingegneri di Microsoft hanno verificato se MAI è utilizzabile per la gestione della famiglia di assistenti AI “Copilot”. Dai dati ricavati dai test, la serie LLM sembrerebbe poter competere con modelli di OpenAI e Anthropic.

Microsoft ha valutato la possibile integrazione con Copilot e la serie di LLM in questione sembrerebbe destinata all’esecuzione di compiti generici più che al “ragionamento” (molti dei task supportati da Copilot, possono essere portati a termini sfruttando LLM per usi generici).

Secondo quanto riferisce Bloomberg, Microsoft sta intanto sviluppando una seconda serie di LLM, ottimizzata per task che richiedono “ragionamenti”. Non è chiaro quanti siano i modelli in questione e il numero di parametri rappresentati (nella fase di training degli LLM è possibile alimentare questi ultimi con decine di milioni o miliardi di parametri che costituiscono la loro logica interna, una misura della complessità del modello. Non è chiaro nemmeno se si tratta di modelli “multimodali” (che combinano linguaggio, visione e audio per offrire un’IA generativa avanzata) ma ne dovremmo sapere di più nei prossimi mesi.

