Cost Engineering per la Generative AI
Lingua:
Italiano
Track "AI Technologies"
Orario: 14:45
- 15:30
Abstract
Cost Engineering per la Generative AI affronta una sfida centrale: rendere i sistemi basati su LLM scalabili e sostenibili nel tempo. Ogni richiesta ha un costo e, su larga scala, anche piccole inefficienze possono compromettere il ROI. Il talk esplora strategie concrete per ottimizzare modelli, prompt, retrieval e architetture, introducendo un approccio ispirato al FinOps e metriche per monitorare i costi e massimizzare il valore generato.