Il prezzo per-token dei modelli AI non scende più

Simon Willison nota una cosa che chi gestisce un workflow AI in produzione ha già visto in fattura: i tre lab principali, Google, OpenAI e Anthropic, alzano il prezzo delle API a ogni release. GPT-5.5 costa il doppio di GPT-5.4. Opus 4.7 circa 1,46 volte la 4.6. L'assunto su cui molti hanno costruito il business case, il costo per-token che scende sempre, non regge più. Il provider muove il prezzo sotto di te, tra una versione e l'altra, e chi ha l'agent in produzione ha due scelte: assorbire l'aumento o rifare i conti.

Il punto per il TCO è questo. Il costo API non è una riga che fissi a budget per dodici mesi. È variabile, decisa da qualcun altro. Va sommata alla manutenzione, alla persona dedicata, al refactor quando il modello cambia comportamento. Chi calcola il costo annuo di un workflow solo sui token di oggi sta sottostimando.

Perché conta per chi fa AI in azienda: il costo per-token è una variabile che decide il provider, non una riga fissa a budget.

◆ ◆ ◆

Fonte

https://simonwillison.net/2026/May/19/gemini-35-flash/