L’AI “ringiovanisce” Eminem: così la tecnologia rivoluziona la produzione musicale

25 luglio 2024

La produzione musicale e più in generale quella creativa fa sempre più uso di tecnologie di AI generativa. Di recente se ne è parlato al Giffoni Film Festival in occasione di un focus su musica e intelligenza artificiale con alcune testimonianze delle principali case discografiche.

AI nella produzione musicale: sfide di copyright e trasparenza

L’ausilio degli strumenti di AI generativa è decisamente oggetto di grande cautela data lascarsa trasparenza dei sistemi di addestramento in relazione ai contenuti utilizzati che potrebbero generare contenziosi. Le recenti cause promosse dalle major contro le piattaforme Udio e Suno hanno, ad esempio, evidenziato violazioni massive del copyright nel training dei sistemi.

In questo contesto si stanno tuttavia sviluppando anche innovazioni che sfruttano piattaforme che hanno adottato codici etici o una particolare attenzione nella fase di addestramento in modo da garantire un utilizzo assolutamente rispettoso dei diritti di proprietà intellettuale.

Universal Music ha sviluppato una partnership con SoundLabs per MicDrop, il cui lancio è previsto per quest’estate, un plug-in vocale in tempo reale che consente agli artisti di creare modelli vocali ad alta fedeltà utilizzando i propri dati vocali.

Il caso emblematico di Eminem

Tra le ultime interessanti esperienze che hanno caratterizzato la produzione creativa nell’industria musicale va sicuramente segnalata quella di Eminem, con l’ultimo album “The Death of Slim Shady (Coup de Grâce)”. Il video del singolo “Houdini” ha visto un deciso impiego di AI generativa, grazie alla collaborazione dell’artista con la società Metaphysic che opera nella ricreazione di immagini e video grazie a dataset che sono alimentati con contenuti creati direttamente dall’artista.

Le immagini quali i volti possono essere sintetizzati in video o fotografie realistiche che sono integrati in contenuti creativi nuovi.

Tecnologia avanzata e spazio latente

Il sistema adottato in questo caso è tra i più avanzati esempi di AI generativa e utilizza un modello di generatore che denominato spazio latente.

Lo spazio latente è un costrutto matematico che memorizza tutte le caratteristiche (ed eventuali etichette/classi associate) nel modo più ordinato e logico che il GAN (Generative Adversarial Network) ​​è riuscito a ideare durante l’addestramento.

In poche parole, il sistema riesce a identificare il codice latente di un oggetto assimilato (come un volto) in questa labirintica rete di interrelazioni e inizia a manipolarlo ‘inviandolo’ a diverse regioni dello spazio latente che contengono altri concetti correlati, come vecchio, giovane, maschio e femmina o anche direttamente ad identità e pose alternative immagazzinate altrove nello spazio latente.

La ri-creazione del giovane Eminem

Nel modello realizzato con il videoclip di Eminem, il team di Metaphysic ha operato di fatto ricreando un volto dell’artista di venti anni più giovane raccogliendo tutte le risorse (vecchie foto, video e campioni audio, ecc.) con i quali sono stati costruiti i modelli. In poco meno di due mesi Metaphysic ha addestrato il modello di intelligenza artificiale su tutti gli asset raccolti.

The Slim Shady LP fu pubblicato da Interscope Records nel 1999 e nel 2024 Eminem ha di fatto ricreato il suo volto e movenze come se il videoclip di Houdini vedesse come protagonista l’Eminem del 1999.

Per aiutare Eminem a ricreare questo io più giovane, Metaphysic, come ha raccontato Billboard in un articolo, “ha fornito un altro dei suoi prodotti, l’AI Mirror. Costruito attorno a un enorme monitor LED da 85 pollici, l’AI Mirror ha una fotocamera e una luce soffusa che lavorano insieme per consentire alle persone di avvicinarsi e vedere l’IA dal vivo proiettata sul loro viso. Quindi, prima che le telecamere iniziassero a girare, Eminem poteva vedere esattamente come sarebbe stato un giovane Slim Shady e come si sarebbe mosso per aiutarlo a entrare meglio nel personaggio”.

Le potenzialità e i rischi dell’AI Generativa

Questo esperimento conferma le potenzialità delle tecnologie che possono integrare voci, immagini e video lasciandone tuttavia il totale controllo all’artista o al titolare dei diritti.

Un tema molto sentito tanto che da più parti vi sono iniziative legislative o azioni giudiziarie per proteggere gli artisti dai “voice” e “likeness cloning”.

La protezione dei dati e i rischi del web scraping

In una fase ancora poco regolamentata il rischio che aziende ed operatori disonesti rastrellino contenuti personali di cantanti e artisti per utilizzi non autorizzati è concreto.

Non a caso, anche in Italia, il Garante privacy ha pubblicato le indicazioni per difendere i dati personali pubblicati online da soggetti pubblici e privati in qualità di titolari del trattamento dal web scraping, la raccolta indiscriminata di dati personali su internet, effettuata, da terzi, con lo scopo di addestrare i modelli di Intelligenza artificiale generativa.

Si apre così una nuova frontiera che vede da un lato le opportunità per gli artisti di utilizzare la propria immagine fisica nello sviluppo di contenuti creativi e dall’altro il rischio che il volto, la voce ed altre caratteristiche vengano utilizzate illegalmente.