ChatBCG: generare delle slides tramite AI

  • Di
  • 2022-12-29 - 3 minuti
banner

Hai mai sognato di avere delle slides impostate e pronte all’uso, a partire da un argomento qualsiasi?

Dopo ChatGPT, arriva ChatBCG: un sistema in grado di generare delle slides a partire da un input testuale. Scopriamo insieme di che si parla!

ChatBCG

Dopo DALL-E 2 per le immagini e ChatGPT per il testo, il passaggio finale per renderci tutti ridondanti: la prima implementazione al mondo di Text-to-PowerPoint.

Il lancio dell’IA conversazionale e generativa ha preso d’assalto Internet nelle ultime settimana: mentre ChatGPT può parlare agli umani attraverso il linguaggio naturale, i modelli di text-to-image come DALL-E 2, Stable Diffusion e Midjourney hanno dato impulso all’arte digitale.

Creato da Joseph Semrai e Silas Alberti, due studenti alla Stanford AI PhD, questa rete generativa permette di creare delle slides con una grafica già pronta a partire da un testo inserito nella barra di ricerca.

Features

Il modello BCG-3 (acronimo di Bi-modal Conditional Generation) ha finora le seguenti caratteristiche:

  • Schema delle slides con tabella dei contenuti
  • Intestazioni per i titoli
  • Elenco puntato per i diversi argomenti
  • Parole chiave in grassetto
  • Immagini e grafica a tema
  • Layout e temi multipli

Il punto forte di questo strumento è che puoi anche esportare le diapositive nei formati PPTX e PTF. Presto verranno aggiunte altre funzionalità come grafici basati sui dati e l’utilizzo di contenuti presi da testi.

…e questo è solo l’inizio! 🎬

Prossimamente, i due sviluppatori hanno annunciato di voler inserire altre funzionalità, tra cui:

  • Altri layout e temi
  • Editing conversazionale, ossia la possibilità di modificare le slides sfruttando del testo o audio💭
  • Usa diverse sorgenti per generare i tuoi contenuti (blog/paper/pubblicazioni)
  • Grafici basati sui dati inseriti.

Per provarla, abbiamo inserito come testo “How to Write a Best Selling Book”, e in effetti il risultato non è male: nella tabella dei contenuti abbiamo come punti focus la ricerca dell’argomento, la preparazione di un piano di scrittura e poi la fase di promozione e lancio del libro.

Come funziona

Non esiste ancora una pubblicazione ufficiale su questo prodotto, ma si può supporre che il sistema sia basato su una rete neurale generativa molto simile a quella utilizzata nei sistemi generativi avversari. Il nome assegnato alla rete indica che si tratta di una rete bi-modal, ossia una rete neurale che combina come input sia testo che immagini annotate. Questo approccio è ancora poco documentato, ma è una versione semplificata dell’apprendimento multimodale, e quindi un sistema che tenta di modellare tramite l’AI la combinazione di diverse forme di dati, spesso derivanti da applicazioni del mondo reale.

La parte condizionale della rete fa verso ad una Conditional Generative Adversarial Network (CGAN), un tipo di GAN che sfrutta anche le etichette durante il processo di formazione. Il generatore, data un’etichetta e un array casuale come input, produce dei dati con la stessa struttura dei dati di training corrispondenti ad una data label.

Un esempio di GAN l’avevamo vista in questo articolo, dove avevamo parlato delle reti generative avversarie (abbreviate in GAN) come insieme di modelli di reti neurali profonde, sviluppate da Ian Goodfellow nel 2014, e utilizzate per produrre dati sintetici.

Vi immaginate? Produrre dei dati che sono verosimili, ma non simili, rilevanti per una situazione specifica, ma che non provengono dal mondo reale. Suona familiare?

Demo

Per vedere una breve demo, qui di seguito il video di presentazione:

Preview di ChatBCG

Post correlati

#TheRedComics

Giugno

A cura di Sophie Aiello, copy di Chiara Romano

La dura vita di una madre tech - Meme

TheRedCode Digest

La tecnologia corre, e tu devi correre più veloce per rimanere sempre sul pezzo! 🚀

Riceverai una volta al mese (o anche meno) con codici sconto per partecipare agli eventi del settore, quiz per vincere dei gadget e i recap degli articoli più interessanti pubblicati sul blog

Ci sto!

Partners

Community, aziende e persone che supportano attivamente il blog

Logo di Codemotion
Logo di GrUSP
Logo di Python Milano
Logo di Schrodinger Hat
Logo di Python Biella Group
Logo di Fuzzy Brains
Logo di Django Girls
Logo di Improove
Logo del libro open source
Logo di NgRome
Logo de La Locanda del Tech

Vuoi diventare #tech content writer? 🖊️

Se vuoi raccontare la tua sul mondo #tech con dei post a tema o vuoi condividere la tua esperienza con la community, sei nel posto giusto! 😉

Manda una mail a collaborazioni[at]theredcode.it con la tua proposta e diventa la prossima penna del blog!

Ma sì, facciamolo!