Contesto
Perché questa guida conta
Una delle decisioni piu sottovalutate nel prompt engineering e quanta guida esplicita fornire al modello. In alcuni casi basta un istruzione chiara; in altri, senza esempi il modello non capisce tono, edge case o schema di classificazione e produce output troppo variabili.
Zero-shot e few-shot non sono scuole di pensiero opposte. Sono leve operative. La scelta giusta dipende dal livello di precisione richiesto, dal costo che puoi tollerare, dalla complessita del task e dalla frequenza con cui quel task fallisce in modi ripetuti.
Questa guida ti aiuta a scegliere in modo pratico, senza appesantire il prompt inutilmente.
Sintesi
Punti chiave
- Zero-shot e sufficiente per task chiari e output standardizzati.
- Few-shot serve quando stile, classificazione o edge case contano molto.
- Troppi esempi possono peggiorare costo e nitidezza del prompt.
- Usa esempi ad alto segnale, non esempi mediocri o ridondanti.
- Decidi in base al tipo di errore che vuoi eliminare.
Blocco operativo
1) Zero-shot funziona quando il task e ben definito
Se il compito e chiaro, il formato e semplice e il modello non deve imitare uno stile molto specifico, zero-shot spesso basta. Un prompt breve ma preciso e meno costoso, piu facile da mantenere e meno fragile quando cambiano i requisiti.
Esempi tipici: sintesi strutturate, tabelle comparativa standard, estrazione di punti chiave, outline iniziali e classificazioni molto semplici.
Blocco operativo
2) Few-shot ha valore quando vuoi ridurre ambiguità specifiche
Few-shot non serve a “insegnare tutto” al modello. Serve a mostrargli il comportamento esatto che vuoi in situazioni dove le sole istruzioni non bastano. Questo vale per rubriche di scoring, tono di voce, categorie proprietarie, output borderline o formati editoriali molto specifici.
Se noti che il modello sbaglia sempre nello stesso modo, un esempio ben scelto spesso corregge piu di altre venti righe di spiegazione.
Blocco operativo
3) Il rischio dei few-shot e il rumore, non solo il costo
Molti team aggiungono troppi esempi pensando di aumentare il controllo. In realta rischiano di fare il contrario. Esempi mediocri, ridondanti o incoerenti possono spostare l attenzione del modello e ridurre la chiarezza del task.
Per questo conviene preferire pochi esempi ad alto segnale: uno ottimo, uno borderline e, se necessario, un anti-esempio che mostri cosa evitare.
Blocco operativo
4) Scegli in base al costo dell errore, non per abitudine
La domanda giusta non e “few-shot e meglio?” ma “quanto costa un errore in questo task?”. Se stai generando idee preliminari, uno zero-shot ben scritto puo bastare. Se stai classificando lead, costruendo report per leadership o generando messaggi per prospect enterprise, controllare di piu puo avere senso.
Quando il costo dell errore sale, cresce il valore di esempi, rubriche e validazione aggiuntiva.
Blocco operativo
5) Testa in coppia: versione zero-shot e versione few-shot
Un modo pragmatico per decidere e testare entrambi gli approcci sullo stesso task con lo stesso criterio di valutazione. Se few-shot non migliora sostanzialmente precisione, consistenza o velocita di revisione, allora stai solo pagando piu contesto senza ritorno reale.
Questo test comparativo e particolarmente utile nei workflow ricorrenti, dove piccole differenze si amplificano nel tempo.
Libreria di template
Template riutilizzabili
Template zero-shot
Per task chiari con formato semplice e criteri ben definiti.
Agisci come [RUOLO]. Task: [OBIETTIVO]. Audience: [DESTINATARIO]. Vincoli: [VINCOLI]. Formato di output: [FORMATO]. Se manca un dato, dichiaralo esplicitamente. Non inventare nulla.
Template few-shot minimale
Per task in cui tono, classificazione o edge case devono essere controllati meglio.
Agisci come [RUOLO]. Task: [OBIETTIVO]. Segui il pattern mostrato negli esempi. Esempio 1: Input: [INPUT] Output: [OUTPUT IDEALE] Esempio 2: Input: [INPUT BORDERLINE] Output: [OUTPUT DESIDERATO] Ora applica la stessa logica a questo input: [NUOVO INPUT] Mantieni la stessa struttura, livello di specificità e stile decisionale degli esempi.
Quality control
Errori comuni e fix
Few-shot usato per inerzia
Problema: Il prompt cresce ma la qualità non migliora davvero.
Fix: Usa few-shot solo se elimina errori reali e ripetuti.
Esempi mediocri
Problema: Il modello imita anche la mediocrità o le ambiguità degli esempi.
Fix: Scegli pochi esempi forti e altamente rappresentativi.
Nessun test comparativo
Problema: Non sai se il costo aggiuntivo degli esempi e giustificato.
Fix: Confronta zero-shot e few-shot sullo stesso task e sulla stessa rubrica.
FAQ
Domande frequenti
Quanti esempi servono in un prompt few-shot?
Di solito 1 o 2 esempi forti bastano. Aggiungerne molti spesso aumenta rumore e costo senza un guadagno proporzionale.
Zero-shot e sempre meno accurato?
No. Per task chiari e ben strutturati puo essere piu efficiente e altrettanto affidabile.
Posso usare esempi negativi?
Si, ma con attenzione. Un anti-esempio puo essere utile per chiarire cosa evitare, purché non confonda il comportamento principale richiesto.
Riferimenti
