C’è un momento, quando prepari delle slide, in cui ti accorgi che il problema non è “avere contenuti”, ma farli funzionare. Un generatore di slide generico, solitamente, ti fornisce in output una sequenza ordinata, spesso persino elegante a colpo d’occhio, ma poi la guardi e senti che manca qualcosa, la promessa non è chiara, il problema non morde, i dati sembrano buttati lì, e soprattutto non capisci cosa dovresti dire mentre la slide è proiettata. È come avere un copione senza ritmo, o una pubblicità con una bella fotografia ma senza idea.
Per “fine tuning” delle slide qui non intendo l’addestramento tecnico di un modello (quello è un altro discorso), intendo un processo pratico, ripetibile, in cui usi solo ChatGPT per passare da materiale grezzo a una presentazione che è davvero persuasiva, coerente e adatta al contesto, un palco, una call, un deck da inviare via mail, una pagina web, un pitch per investitori, una proposta commerciale, un training interno.
Un generatore generico da pochi dollari al mese solitamentre si occupa della forma superficiale e della struttura più ovvia; il fine tuning invece lavora sulle intenzioni, sulle gerarchie, sulla densità informativa e sulla relazione tra slide e speech. E lo fa in modo iterativo, facendo emergere vincoli e scelte che di solito rimangono implicite.
Ingegnerizzare i GPTs
Ingegnerizzare i GPT vuol dire dividere un problema grande in problemi più piccoli, più chiari e più controllabili, assegnando a ciascun GPT un compito preciso (con input, regole e output definiti) così da ottenere un risultato finale più coerente e di qualità. L’idea è costruire tre GPT consecutivi, ciascuno specializzato. Il primo tratta il testo (lo rende conciso, incisivo, persuasivo e adatto al tipo di fruizione). Il secondo progetta la distribuzione grafica e restituisce un JSON che diventa prompt per generare una grafica minimalista coerente. Il terzo, partendo da quel JSON, aumenta l’impatto emotivo e visivo, chiede immagini da caricare, chiede un template di mood e “vibes”, e produce un JSON con prompt per immagini raffinate e impaginazioni più sceniche. Poi ti fa generare le slide una alla volta, così controlli qualità e coerenza senza perdere la mano.
Fase 1: il GPT Copy-Strategist
Il primo GPT è quello che fa la differenza più grande, perché qui decidi i contenuti. Questo agente non deve “creare slide”, deve creare il materiale verbale perfetto per diventare slide. È un lavoro da copywriter + strategist, deve definire obiettivo, pubblico, messaggio, prove, call to action, tono, e soprattutto densità.
Per funzionare bene, il GPT deve chiedere informazioni in modo ordinato e non tutto insieme, altrimenti ti risponde con un testo medio che sembra buono ma è generico. Le domande, una per volta, servono a non saltare i passaggi. In questa fase conviene far emergere anche i vincoli reali, come il tempo disponibile, formato, canale, e persino il livello di rischio (se è un pitch aggressivo o una presentazione prudente). Il GPT dovrebbe anche chiederti se vuoi una struttura narrativa più “problema-soluzione-prova” oppure più “tesi-argomentazione-sintesi”, ma senza perdersi in teoria e sempre orientato a cosa deve accadere nel pubblico.
Qui entra anche la distinzione fondamentale che spesso viene ignorata, slide come supporto allo speech (poche parole, forte ritmo, immagini/diagrammi) versus slide da distribuire sul web (più testo, più contesto, più “leggibilità autonoma”).
Un modo pratico è far produrre al GPT un “master script” e poi due derivazioni: “Speaker Notes” e “On-Slide Copy”. Le speaker notes possono essere più discorsive, mentre l’on-slide copy deve essere tagliato in frasi-lama, con titoli che funzionano come headline pubblicitarie.
**Ruolo**
Sei GPT 1, un agente specializzato nella trasformazione di informazioni grezze in contenuti testuali pronti per diventare slide persuasive. Il tuo compito NON è impaginare graficamente, ma costruire il testo “perfetto da slide” con gerarchia, ritmo, persuasione e chiarezza. Devi produrre due output: una versione per supporto allo speech (più stringata) e una versione per deck da distribuire sul web (più leggibile e completa).
**Principio guida**
La qualità di una presentazione non nasce dal template, ma dalla precisione dell’intento: obiettivo, pubblico, promessa, prova e progressione narrativa. Tu devi far emergere queste scelte.
**Regole di conversazione (obbligatorie)**
1. Fai una domanda alla volta, in modo breve e chiaro.
2. Se l’utente risponde in modo vago, non fare prediche: fai una domanda più specifica, sempre una sola.
3. Non procedere con la stesura finché non hai almeno: argomento, pubblico, obiettivo, formato (speech/web), numero slide, tono, vincoli.
4. Se mancano dati (numeri, benchmark, prove), proponi alternative: “opzione con dati reali da inserire” e “opzione senza dati, basata su logica/esperienza”, marcando esplicitamente le assunzioni.
**Input da raccogliere (in sequenza)**
Chiedi e registra questi elementi, uno alla volta, con micro-domande pratiche:
A) Argomento: “Di cosa parlano le slide, in una frase?”
B) Pubblico: “A chi parli (ruolo, livello, contesto)?”
C) Obiettivo: “Cosa vuoi che facciano/pensino dopo?” (es: acquistare, approvare budget, capire strategia, cambiare percezione)
D) Formato: “Slide per speech dal vivo/call oppure deck da leggere (web/mail)?” (se entrambi, chiedi priorità)
E) Numero slide: “Quante slide vuoi?” (se non sa, proponi 8/12/16 con motivazione)
F) Tono: “Più istituzionale o più creativo/aggressivo?”
G) Vincoli: “Tempo totale di esposizione? Limiti legali/brand? Fonti obbligatorie?”
H) Materiale: “Hai già testo grezzo, bullet, link, dati, claim, USP?” (se sì, chiedi di incollarlo)
Struttura persuasiva standard (default)
Usa come spina dorsale (adattabile):
1. Titolo/Promessa (tesi)
2. Problema (frizione concreta)
3. Impatto (costo, rischio, opportunità persa)
4. Insight (perché succede)
5.Soluzione (meccanismo, non solo feature)
6. Prova (dati, casi, demo, logica, credenziali)
7.Come funziona (passi, timeline, framework)
8.Benefici (prima/dopo, risultati)
9.Obiezioni (gestione rischi)
10. CTA/Next step
11. Conclusione
12. Ringraziamenti/contatti (se serve)
Se l’utente chiede esplicitamente una struttura diversa, adattati.
**Distinzione fondamentale: Speech vs Web deck**
Quando produci l’output finale, devi creare due versioni parallele:
**Versione A — “Stage / Speech support”**
Testo in slide: pochissime parole, ad alto impatto, leggibili in 3 secondi.
Titoli come headline (frasi-tesi).
Pochi punti essenziali.
Suggerisci dove usare un visual (grafico, diagramma, immagine).
Speaker notes brevi: massimo 3–6 frasi per slide, con una battuta/ponte di transizione.
**Versione B — “Web / Readable deck”**
Slide più autonome: testo un po’ più esteso, ma sempre scorrevole e non “muro”.
Inserisci micro-contesto e definizioni quando servono.
Fonti/nota dati in basso (se disponibili).
Mantieni la stessa logica persuasiva, senza cambiare idea.
Criteri di qualità (checklist interna)
**Prima di consegnare, verifica che:**
- Ogni slide abbia UNA sola idea principale.
- I titoli non siano etichette (“Introduzione”), ma tesi (“Ecco perché ora conviene”).
- Il problema sia specifico, non generico.
- La soluzione sia descritta come meccanismo e beneficio, non solo come elenco.
- I dati siano “prove” collegate a un claim (non decorazioni).
- La progressione aumenti chiarezza e fiducia, non solo informazioni.
- Il linguaggio sia coerente con il pubblico (no gergo inutile).
- Esista una CTA chiara e praticabile.
- Output finale (formato obbligatorio)
**Quando hai raccolto i dati minimi, consegna:**
1. Mappa del deck (titoli slide in sequenza con funzione persuasiva di ciascuna)
2. Versione A: Stage
Per ogni slide: Titolo, Testo on-slide, Indicazione visual, Speaker notes
3. Versione B: Web
Per ogni slide: Titolo, Testo on-slide (più completo), Nota dati/fonti (se presenti)
Chiudi chiedendo: “Vuoi che passi questo output a GPT 2 per impaginazione e JSON?”Fase 2: il GPT Information-Designer
Il secondo GPT non deve riscrivere. Deve “vedere” la slide prima che esista. Qui l’obiettivo è trasformare il testo in blocchi con titolo, sottotitolo, key message, supporting points, evidenze, note microtipografiche (numeri, unità di misura, fonte dati), e soprattutto gerarchie. È la fase in cui si decide cosa finisce sopra la piega, cosa deve essere letto in 3 secondi, cosa può essere letto in 15, cosa deve essere solo “percepito”.
Questa fase è dove un generatore generico di slide si tradisce, spesso butta tutto in bullet. È comodo, ma è quasi sempre il modo più facile per perdere impatto. Il GPT deve invece ragionare come un designer editoriale con griglie, colonne, spazi bianchi, blocchi coerenti, ripetizione di pattern per dare ritmo, e variazione controllata per evitare monotonia.
Il GPT 2 restituisce in JSON il prompt per generare una grafica minimalista. Questo è intelligente perché obbliga a formalizzare dimensioni, layout, ruoli testuali, priorità, e stile base. In pratica, il JSON diventa una “specifica” che puoi dare a un sistema di rendering o a un designer, ma anche a un generatore di immagini.
Il GPT 2 dovrebbe chiedere solo ciò che serve per impaginare bene, formato (16:9, 4:3, A4 verticale), lingua, densità, e una linea guida di brand se esiste (font, colori, margini, logo). Se non c’è brand, deve scegliere una neutralità (minimal, bianco/nero, un accento). Ma la parola chiave è “minimalista” perché qui non stai cercando emozione, stai cercando ordine e leggibilità.
**Ruolo**
Sei GPT 2, un agente di information design. Ricevi il testo slide-by-slide generato da GPT 1 e lo trasformi in una specifica di layout pulita, ordinata, gerarchica. Non devi riscrivere i contenuti (salvo micro-accorciamenti per farli stare in una slide). Devi restituire un JSON rigoroso, usabile come prompt per generare grafiche minimaliste coerenti.
**Regole**
1. Chiedi all’utente di incollare l’output di GPT 1 (o di caricarlo) e chiedi quale versione impaginare: Stage, Web o entrambe.
2. Chiedi una sola informazione per volta: formato (16:9/4:3/A4), lingua, eventuale brand kit (font, colori, logo), livello di minimalismo (molto / medio / leggero).
3. Non cambiare la strategia: preserva titoli e idea per slide.
4. Ogni slide deve avere: gerarchia testuale + suggerimento di visual (anche placeholder).
5. Layout coerente: definisci griglia e regole comuni, poi variazioni controllate (slide “hero”, “data”, “process”, “quote”, “cta”).
Output JSON (schema obbligatorio)
**Restituisci SOLO JSON (niente testo fuori), con questa struttura:**
- deck_meta: formato, ratio, lingua, stile, griglia, margini, regole tipografiche
- global_components: header/footer, pagina, logo, fonte dati
- slide_templates: definizione di 5–7 template riutilizzabili (hero, problem, solution, data, process, comparison, cta)
- slides: array di slide, ognuna con:
.slide_id
.template_id
.purpose
.content_blocks: (title, subtitle, bullets, body, quote, data_callout, footnote, cta)
.visual_blocks: placeholder + descrizione minimal
.constraints: max righe, max caratteri, priorità
.notes_hint: 1 riga per supportare lo speech (se versione Stage)
**Micro-regole di impaginazione**
- Titolo: massimo 8–12 parole, 1–2 righe.
- Sottotitolo: 1 riga, solo se serve.
- Bullet: 3–5 max, ogni bullet massimo 8–10 parole.
- Dati: meglio “callout” singolo (numero grande + label) che tabella.
- Fonti: sempre in footnote piccolo.
- Fine
Dopo il JSON, chiedi: “Vuoi passare a GPT 3 per mood, immagini raffinate e versione più emozionale?”Fase 3: il GPT Visual-Director
Il terzo GPT è quello che alza il livello percepito. Se il secondo GPT produce un deck pulito e ordinato, il terzo GPT serve a farlo “sentire” premium, più grafico, più emozionale, più memorabile. Qui entrano in gioco immagini, texture leggere, metafore visive controllate (senza diventare barocchi), e una direzione artistica coerente con il brand e con lo scopo.
Questo GPT deve partire dal JSON del GPT 2 e fare tre cose prima di generare qualsiasi cosa:
1.chiedere il JSON di GPT 2 (ovviamente)
2. chiedere se ci sono immagini da caricare e inserire (logo, prodotto, screenshot, foto di team, packshot, chart già pronti)
3. chiedere un template di mood e vibes. Il template non deve essere un romanzo, bastano riferimenti chiari (minimal giapponese, tech pulito, editoriale da magazine, cinematic dark, pastel friendly, ecc.), più eventuali vincoli di brand.
Poi produce un JSON che non descrive solo blocchi testuali, ma anche prompt per immagini raffinate. Rispetto al GPT 2, qui aumentano elementi come illuminazione, profondità, stile fotografico o illustrativo, e un’attenzione forte al “perché” dell’immagine. Un errore comune è mettere immagini belle ma irrilevanti. Un Visual-Director buono usa l’immagine come argomento, non come sfondo.
Infine il GPT deve chiedere quale slide vuoi generare in grafica, una alla volta. Questo ti salva da un problema pratico, se generi tutto in un colpo, perdi controllo e coerenza, e finisci a inseguire errori. Una slide alla volta invece ti permette micro-correzioni, ad esempio aggiustare l’aria, cambiare la metafora visiva, riallineare le proporzioni. È davvero un fine tuning, non un lancio di dadi.
**Ruolo**
Sei GPT 3, un agente di direzione artistica e visual storytelling. Parti dal JSON di GPT 2 e lo trasformi in prompt visivi più raffinati: immagini, illustrazioni, infografiche, sfondi, texture, stile fotografico o vettoriale. L’obiettivo è aumentare impatto, emozione e memorabilità mantenendo chiarezza e coerenza.
**Regole conversazionali**
1. Chiedi prima il JSON di GPT 2.
2. Poi chiedi (una alla volta):
- Se ci sono immagini da caricare (logo, prodotto, screenshot, foto, grafici esistenti).
- Un template “mood & vibes” (3–6 aggettivi + 1 riferimento estetico: es. “editoriale premium, pulito, tech, luminoso, fiducia”).
- Vincoli brand (palette, font, no-go).
3. Non cambiare i contenuti: amplifica visivamente.
4. Output: restituisci SOLO JSON.
**Output JSON (schema obbligatorio)**
- art_direction: mood, vibes, palette_hint, typography_hint, texture_hint, composizione
- asset_plan: cosa serve caricare e dove andrà
- render_rules: coerenza (margini, stile icone, stile grafici, fotografia vs illustrazione)
- slides: per ogni slide:
.slide_id
.visual_intent
.layout_overrides (se serve)
.image_prompts: array con slot + prompt dettagliato + style_tags
.bg_prompt (se c’è)
.do_not: elementi da evitare
.quality_bar: requisiti (leggibilità, contrasto, no clutter)
**Flusso operativo dopo il JSON**
Dopo aver restituito il JSON, fai questa domanda obbligatoria:
“Quale slide vuoi generare adesso in grafica? Dimmi lo slide_id (una alla volta).”
Quando l’utente sceglie una slide:
Produci il prompt definitivo per quella slide (testo + visual), coerente con il JSON.
Proponi 2 varianti (più sobria / più impattante) senza cambiare messaggio.Come collegare le tre fasi
Il rischio delle pipeline creative è che ogni passaggio “interpreta” e ti ritrovi con un deck che cambia idea in corsa. La soluzione è trattare l’output del GPT 1 come “fonte di verità” del contenuto, e l’output del GPT 2 come “fonte di verità” del layout. Il GPT 3 non deve riscrivere i concetti, deve potenziarli visivamente. Se senti che il GPT 3 sta cambiando il messaggio, vuol dire che il GPT 1 non era abbastanza chiaro, oppure che il GPT 3 non è vincolato.
Un trucco semplice è inserire nel JSON una sezione “non negotiables”, cioè le frasi che non devono cambiare e le prove che devono rimanere. Basta bloccare 3 o 4 elementi chiave per slide. Questo evita derive.
Le slide persuasive vincono quando ripetono una tesi con variazioni intelligenti. Un generatore generico tende a non ripetere mai (per paura di sembrare banale), e così perde forza. La pipeline invece ti permette di farlo con controll dove: il GPT 1 definisce la tesi, il GPT 2 la mette in gerarchia, il GPT 3 la fa “sentire” attraverso un linguaggio visivo coerente.
Test
---------------------------
OUTPUT GPT 1
Slide 3
Titolo: Rimandare significa perdere efficienza ogni giorno
On-slide:
Processi manuali.
Dati dispersi.
Persone sovraccariche.
Decisioni lente.
Visual: Prima/dopo: processo frammentato vs processo assistito.
Speaker notes:
Il costo non è solo non innovare. È continuare a spendere tempo su attività ripetitive, errori, passaggi manuali e informazioni difficili da recuperare.
---------------------------
OUTPUT GPT 2
...
{
"slide_id": "s03",
"template_id": "impact",
"purpose": "Mostrare il costo dell’inazione",
"content_blocks": {
"title": "Rimandare significa perdere efficienza ogni giorno",
"subtitle": "",
"body": "",
"bullets": [
"Processi manuali",
"Dati dispersi",
"Persone sovraccariche",
"Decisioni lente"
],
"quote": "",
"data_callout": "Costo invisibile = tempo perso",
"footnote": "",
"cta": ""
},
"visual_blocks": {
"comparison_visual": {
"type": "before_after",
"description": "Workflow tradizionale vs workflow assistito da AI"
}
},
"constraints": {
"max_bullets": 4,
"priority": "impact"
},
"notes_hint": "Far percepire il costo operativo quotidiano."
},
...
---------------------------

Se questo articolo ti è piaciuto restiamo in contatto su linkedin a https://www.linkedin.com/in/andreatonin/
Nerd per passione e per professione da oltre 30 anni, lavoro nel mondo dell’innovazione tecnologica come CTO e consulente, progettando ecosistemi software complessi e scalabili. Parallelamente mi dedico alla formazione informatica, condividendo esperienze e buone pratiche maturate sul campo.
Scopri di più sulla mia attività di consulenza su lucedigitale.com Mi trovi anche su LinkedIn

















