Simon Willison rilancia un calcolo di James Shore che pochi vendor mettono nelle slide di vendita: se raddoppi la produttività con un LLM ma non dimezzi i costi di manutenzione, hai quadruplicato il debito tecnico. Tre righe, e cambia il modo in cui un CFO dovrebbe leggere il TCO di un agente in produzione.
Il punto operativo è questo. L'API è la voce più visibile e quasi mai la più cara su dodici mesi. Pesa di più il refactor quando il provider cambia versione di modello, la persona che mantiene i prompt, il monitoraggio degli output, la rete di valutazioni che impedisce regressioni silenziose. Voci che non entrano nel preventivo iniziale e che spostano il break-even di mesi.
Chi sta valutando un workflow AI in azienda dovrebbe pretendere tre numeri da chi propone: costo API a regime, ore/mese di manutenzione previste, costo di un cambio di modello forzato. Senza questi tre, non c'è un business case, c'è una slide.
Perché conta per chi fa AI in azienda: il vero costo di un agente in produzione non è l'API, è la manutenzione quando il modello cambia versione.