RAG è ideale quando i contenuti cambiano spesso: policy, cataloghi, FAQ, listini.
RAG combina retrieval documentale e generazione LLM per risposte aggiornate.
RAG non richiede ri-addestramento del modello quando i dati cambiano.
RAG è preferibile quando il budget è limitato e i contenuti si aggiornano frequentemente.
Il fine-tuning modifica i pesi del modello: richiede dataset curato, tempo e budget.
Il fine-tuning è utile quando serve comportamento molto specifico e consistente.
Il fine-tuning va fatto solo dopo aver verificato che RAG e prompt non bastano.
Il fine-tuning richiede dati di qualità: esempi rumorosi degradano il modello.
Zero-shot è rapido ma meno controllabile su casi specifici e ad alto rischio.
Zero-shot funziona bene per task generici senza requisiti di precisione elevata.
Per casi business reali si confrontano KPI: qualità, latenza, costo e aggiornabilità.
La scelta tra RAG e fine-tuning dipende da frequenza aggiornamenti, budget e precisione richiesta.
