AI – modelli piccoli, in locale, per il business

Siamo tutti (giustamente) affascinati dalle magie dei nuovi modelli AI “giganti” che vengono annunciati continuamente. Fanno cose incredibili, ragionano su problemi complessi e sembrano non avere limiti.

Ma la vera domanda per le aziende è: ci serve davvero una fuoriserie per andare a fare la spesa?

Nell’immagine vedete è un Llama 3.1 (8B), un “piccolo” modello open-source che sta girando completamente in locale sul mio portatile.
Gli ho dato in pasto un PDF (un programma per un corso di calzature) e gli ho chiesto di estrarne il testo formattandolo in Markdown. Ha eseguito il compito in modo perfetto, veloce e in un ottimo italiano.( e può fare molto altro!)

Perché questo è un punto di svolta enorme per il business?
🔒 Privacy e Sicurezza Totali: I dati non escono MAI dal computer. Puoi fargli analizzare contratti, bilanci, dati dei dipendenti o segreti industriali senza il minimo rischio che finiscano su server di terze parti.
Zero Costi Ricorrenti: Niente abbonamenti mensili, niente costi API basati sui token.
Efficienza reale: Per il 90% delle attività quotidiane di un’azienda (riassumere, estrarre dati, tradurre, formattare testi), un modello locale da pochi gigabyte è tutto ciò che serve.

Cosa ci riserva il prossimo futuro?
La cosa più incredibile è che la crescita di questi piccoli modelli è esponenziale. Fino a poco tempo fa, un modello da 8 miliardi di parametri faticava a seguire istruzioni complesse; oggi non solo ragiona meglio, ma batte i vecchi modelli giganti di passata generazione in quasi tutti i benchmark, consumando una frazione delle risorse.

Cosa ci aspetta domani?
Presto vedremo modelli minuscoli, ultra-specializzati e ottimizzati per chip specifici (NPU) integrati direttamente nei dispositivi aziendali. L’AI non sarà più un servizio cloud a cui abbonarsi, ma una feature nativa del nostro hardware, sicura per definizione e integrata nel flusso di lavoro.
I grandi modelli cloud rimarranno insostituibili per compiti di altissima complessità scientifica o di ricerca, ma per la produttività quotidiana e sicura, gli Small Language Models (SLM) sono già il presente.