Agenti, superapp e consulenti: il piano in tre mosse verso l'AGI
Il futuro è determinato, e si chiama intelligenza artificiale generale (AGI). La strada per arrivarci la si sta tracciando ora
IN POCHE RIGHE
Sono settimane che battiamo un chiodo caldo ormai da anni. Quello del segreto di pulcinella: i grandi lab AI hanno tutti il medesimo, esplicito obiettivo di sviluppare un sistema di intelligenza artificiale generale (AGI). La cui definizione è quasi per natura sfuggevole, prona a storture e mistificazioni di ogni tipo; ma anche, volendo, incatenabile a descrizioni più o meno verificabili. OpenAI, ad esempio, parla di un’AI autonoma e in grado di “svolgere ogni compito economicamente valido meglio di qualunque essere umano”.
Non è precisissima e l’immensa complessità del mondo odierno renderà arduo il compito di coprire ogni specificità al 100%. Ma questo ci interessa il giusto, perché stiamo parlando di modelli qualitativamente ancora molto distanti da ciò che abbiamo oggi tra le mani.1 È più che verosimile che, per quel tipo di sistema, sia necessario un meccanismo di recursive self-improvement (RSI), da tempo ventilato e prontamente ripreso tra queste pagine.
Provate del resto a figurarvi un sistema inadatto ad assolvere un compito specifico, ma comunque capace di riprogrammarsi arbitrariamente con l’obiettivo di migliorarsi espressamente sul task fino a portarlo a compimento. Il primo “compito specifico” a cui ricercatori e ingegneri stanno alacremente lavorando è l’R&D necessario per far creare in maniera del tutto autonoma a una AI un proprio successore — un’altra AI — migliore di sé; e così a cascata, fino a occupare tutti i domini (da cui “generale”). Un loop non solo chiuso, ma potenzialmente molto rapido.2
Fare i conti con quello scenario, ce lo siamo detti, è pressoché impossibile — e anche legittimamente allarmante. Ora però lasciate quell’immagine al futuro (seppure imminente), e tuffatevi nel presente. Il 2026, giunto ormai a metà (!), sta delineando tre perni principali in quella direzione: gli agenti, i forward-deployed engineer (FDE) e le cosiddette “superapp”.
UNA STORIA
Il termine “superapp” è tradizionalmente associato alle app cinesi come WeChat (Weixin), che hanno per prime (e per adesso ancora uniche) costruito una singola piattaforma centralizzante dove far convergere utenti e servizi di ogni tipo (messaggistica, giochi, social media, pagamenti, chatbot, etc.), di fatto sostituendosi al sistema operativo sottostante e rendendosi contemporaneamente imprescindibili ed esaustive. Ma se WeChat nasce ed esplode solo nel corso del 2011, la storia della idea della superapp trova la propria origine giusto un attimo prima.
È infatti il febbraio 2010 quando BlackBerry (RIM), al Mobile World Congress di Barcellona, introduce per la prima volta espressamente il concetto di “superapp”. Mike Lazaridis — ingegnere visionario, co-fondatore e co-CEO dell’azienda — osserva il panorama attorno a sé e nota come le applicazioni mobile, benché in piena fioritura, siano un po’ troppo “sparpagliate”; non progettate per comunicare bene con l’OS sottostante né, soprattutto, tra di loro. Serve una commistione più radicale e profonda.
Non è solo questo zoom-in eccessivo che gli impedirà di vedere l’onda travolgente dell’iPhone, già più che montante (l’iPhone 4 verrà annunciato pochi mesi dopo), ma come a fare la differenza sia l’idea stessa di lasciare in mano a sviluppatori terzi la possibilità di creare un ecosistema. La storia di RIM da lì a poco è tristemente nota. Eppure, con gli occhi di oggi — col filtro delle applicazioni di AI — è come se Lazaridis avesse inavvertitamente anticipato il discorso sull’importanza dell’harness, ossia l’insieme degli strumenti3 che un agente utilizza per, appunto, agire; fare cose utilizzando un computer.
Lazaridis sperava di costruire su BlackBerry superapp che integrassero verticalmente le capacità hardware native dei dispositivi con un software cucito su misura, col fine ultimo di creare un moat competitivo. Oggi, con gli LLM di frontiera4 che rimangono piuttosto vicini nelle capability e senza un chiaro vantaggio competitivo strutturale l’uno sull’altro, a fare la differenza sembrano sempre più essere proprio gli harness delle proto-superapp, cioè Codex, Claude Code/Cowork e Antigravity (o più presto Spark).5
L’ACQUA IN CUI NUOTIAMO
Sebbene nate esplicitamente nell’ambito del coding, le tre applicazioni (Codex e Claude Code/Cowork in particolare) si sono rivelate quasi immediatamente utili in diversi altri campi del knowledge work — tanto che Anthropic ha deciso espressamente di rimpacchettare Claude Code con una patina UI/UX diversa con Cowork. Produttività generale, documenti legali, analisi dati finanziari, organizzazione dei workspace, web browsing ed esecuzione autonoma; chi più ne ha più ne metta.6 La versatilità degli agenti è già impressionante.
Nonostante la chat rimanga l’interfaccia principale e gli LLM la tecnologia di fondo7, queste app superano in toto il paradigma rudimentale del “domanda e risposta” dei chatbot, che ha rappresentato un po’ il primo ciclo dell’era generative AI. Ora siamo nel secondo, in cui noi fungiamo sempre più da manager di agenti progressivamente più capaci e sofisticati, anche se non ancora all’altezza di gestire flussi complessi, soprattutto negli orizzonti temporali8. Avvicinandoci all’AGI, il principio cambierà ulteriormente: non faremo domande né daremo istruzioni, ma esprimeremo un’intenzione, di alto livello, e lasceremo che il modello gestisca il flusso da sé.9
Tracciare una linea retta da qui all’AGI, purché impossibile nella distanza, diventa dunque intuitivo almeno nelle intenzioni: un’unica superficie, con interfaccia in linguaggio naturale (scritto o parlato), abilitata a fare via via sempre più cose — fino, sperabilmente, ad automatizzare tutto.
Una “superapp” agentica, insomma.
PERCHÉ CONTA
Rimane da ispezionare un ultimo pezzo del puzzle10, ovvero i forward-deployed engineer.
Prendendo una pagina dal libro di Palantir, i grandi lab hanno capito non solo che per alimentare la macchina estremamente capital-intensive dell’AI servono i soldi di cui solo le aziende dispongono, ma anche che da queste non ci si può (ancora?) aspettare un’adozione plug-and-play.
Gli FDE, infatti, sono in tutto e per tutto dei consulenti, che lavorano direttamente dentro le aziende per adattare i modelli agli specifici bisogni delle stesse, e portare a fruizione le promesse dell’AI. Che ci sono, indiscutibilmente, ma che necessitano comunque di affrontare una curva di adozione piuttosto ripida, fatta di rifiuti ontologici e difficoltà più tecniche.
Un beneficio triplice per i grandi lab, e un eccellente alimentatore del volano indirizzato verso il RSI e l’AGI:
Il primo, lo abbiamo menzionato, è il più banale — e dunque il più fondamentale: i soldi. Per alimentare la macchina serve capitale che non può essere racimolato dalla sola userbase consumer e dai VC; né dal mercato aperto, una volta che verranno quotate in borsa11. Tutto deve concorrere all’accrescimento della torta, e gli introiti derivati dall’enterprise sono un mattoncino fondamentale — oltre al fatto che le imprese sono clienti tendenzialmente più credibili, buoni anche per raccontare al mercato la crescita esponenziale del capex, spingendola ulteriormente.
Sempre nell’ottica di ingrandire il proprio fossato, entrare nelle aziende — con sistemi interni articolati e decine, centinaia, se non svariate migliaia di persone o più — è anche un modo per aumentare a dismisura la frizione dello switching cost. Una volta avviati i processi, molto difficilmente gli organismi aziendali cambiano provider. Da cui le partnership in joint venture con vari fondi di private equity12, utili per garantire un pacchetto ben nutrito e più rapidamente raggiungibile di clienti finanziariamente sani.
L’aspetto forse più importante ma meno discusso, perché subdolo: entrare nella carne viva dei processi aziendali vuol dire inevitabilmente esporre i modelli al loro know-how operativo. Passare, in poche parole, dalla pur straordinaria forza delle capacità emergenti che i modelli apprendono nativamente nelle fasi di pre- e post-training ad un più diretto coinvolgimento nelle specifiche del “lavoro vero” — un workflow capture — facendo loro apprendere tutte le sfaccettature dell’intricato mosaico su cui un’organizzazione si poggia13: mappe di processi, failure mode, eval e connettori, pattern ripetibili, permessi, playbook…
SCENARI
Ci sarebbe in effetti un quarto punto da aggiungere, ovvero il modo in cui il feedback loop di apprendimento tramite il coinvolgimento di aziende terze andrà inevitabilmente a modificare la roadmap di sviluppo dei modelli stessi, più prontamente tarati a scomporre, astrarre, codificare e riprodurre proprio le insidiose specifiche di cui sopra.
Se un’AGI in grado di “svolgere autonomamente tutti i compiti economicamente validi” dovesse essere sviluppata, non potrà prescindere dall’essere capace di portare a termine task arbitrariamente complessi e con orizzonti temporali indefinitamente lunghi. Il passaggio dalle aggrovigliate tubature aziendali è pertanto indispensabile.
Un occhio cinico potrebbe intravedere l’intenzione neanche troppo celata di automatizzare pezzi più e più estesi del lavoro. Un occhio meno cinico potrebbe gridare che il re è nudo. Le lamentele, più o meno consce, ci sono già. Gli allarmi pure.
Sarà obiettivo di regolatori e policymaker capire come gestire la transizione da fattibilità tecnica a integrazione reale; senza nascondersi dietro a un dito per negare in principio la possibilità della prima.
La strada è tracciata.
…e rimane, come sempre sottolineiamo, l’enorme caveat che i compiti di natura fisica vengono ancora trattati come distinti.
Si parla infatti di “intelligence explosion”. Ricordate le esponenziali?
Permessi, memoria, terminale, file system, workspace, esecuzione, coordinamento, etc.
Parliamo dei soliti Big 3: OpenAI, Anthropic, Google DeepMind
Andrebbe anche incluso OpenClaw, che tuttavia rimane più complesso e slegato da un LLM specifico alla base; e anche Microsoft, che proprio nelle ore di pubblicazione di questo issue presenterà la propria superapp, sebbene anch’essa priva di un LLM di frontiera proprietario alla base.
È stata Anthropic ad avere per prima questa intuizione, con i risultati roboanti di inizio anno che l’hanno catapultata nella posizione in vetta dove oggi si trova; costringendo anche OpenAI a ricalibrare il baricentro, come abbiamo raccontato nel primo episodio, proprio andando a convergere su un’unica “superapp”.
Discorso che viaggia in parallelo a (e non in contrasto con) i world model, come nel caso di Google.
Limitati ma in crescita, come sovente raccontiamo.
Con vari gradi di permessi da concedere e chiarimenti su parti del flusso, ovviamente.
Senza volutamente includere il pur fondamentale mattone soggiacente, ossia il modello; Claude Mythos, per il momento, rimane sia imbattuto sia indisponibile, ma questo cambierà nelle prossime settimane.
Operazione sempre più imminente, vista la pressione messa da SpaceX prima e da Anthropic poi, proprio in queste ore.
Si parla della OpenAI Deployment Company; dell’accordo tra Anthropic e Blackstone, Hellman & Friedman e Goldman Sachs (o quello con Accenture); e l’espansione analoga di Google.
Apprendendolo, astraendolo, riproducendolo, efficientandolo; cosa ben diversa da un semplicistico “fanno training diretto sui dati del cliente”!



