Stability AI ha presentato Stable Audio 2.5, un nuovo modello in grado di generare tracce musicali personalizzate lunghe fino a tre minuti. La novità punta a rivoluzionare la produzione di contenuti digitali, permettendo a brand e creator di abbandonare i classici cataloghi di musica stock.

Tracce da 3 minuti create in un attimo
Il nuovo modello rappresenta un netto salto in avanti rispetto alle versioni precedenti di Stability AI. La vecchia release open-source si limitava infatti a brevi campionamenti audio inferiori ai 50 secondi.
Stable Audio 2.5 riesce a generare un brano intero di 3 minuti in meno di due secondi di calcolo. Il sistema risponde a comandi testuali basati su generi musicali o stati d’animo, come “sintetizzatori avvolgenti” o “musica stimolante”.
- Google rivoluziona i piani AI: arrivano YouTube Premium e i crediti a consumo
- NVIDIA Dynamo: lo streaming AI diventa più fluido per creator e sviluppatori
- Spotify lancia i “Personal Podcast”: l’AI crea contenuti solo per te
L’addestramento del modello sfrutta una nuova tecnica di ottimizzazione post-training. Questo processo, chiamato Adversarial Relativistic-Contrastive, garantisce una maggiore velocità di calcolo e una fedeltà sonora superiore.
La funzione Inpainting per modificare l’audio
La vera svolta pratica per chi monta video e crea contenuti è la funzione di audio inpainting. Questa opzione permette di caricare una traccia esistente e selezionare una finestra temporale specifica da modificare.
Il modello analizza il contesto musicale circostante e completa la composizione in modo coerente. Diventa così immediato correggere un passaggio o adattare la durata del brano ai tagli del video.
La tecnologia è già disponibile tramite API e su piattaforme partner come fal, Replicate e ComfyUI. Inoltre, la partnership globale con il gruppo pubblicitario WPP integrerà lo strumento nei flussi di lavoro delle grandi agenzie.
Sicurezza sul copyright e tutele legali
Stability AI dichiara che il modello è sicuro per l’uso commerciale e aziendale. Il set di dati utilizzato per l’addestramento è composto esclusivamente da musica interamente concessa in licenza.
La piattaforma integra anche sistemi di riconoscimento dei contenuti per bloccare il caricamento di file protetti da copyright. Chi utilizza lo strumento deve infatti garantire che i file sorgente siano privi di diritti di terzi.
La trasparenza sui dati di addestramento resta un tema caldo nel Regno Unito e in Europa. I legislatori continuano a chiedere tutele più stringenti per i diritti degli artisti e dei creatori originali.
Come cambia il lavoro per i creator digitali
Lo strumento non elimina la necessità di figure professionali come sound designer e compositori. Offre però una risorsa per diversificare rapidamente le colonne sonore di campagne social, inserzioni e video brevi.
Un creator può generare diverse varianti dello stesso tema musicale per adattarle ai vari formati. Il controllo umano rimane fondamentale per la verifica finale della qualità e la supervisione delle licenze.
Resta ora da capire come la community dei creator accoglierà il modello sul lungo periodo. Bisognerà verificare se la qualità reale della struttura melodica e delle voci saprà davvero competere con la musica tradizionale.
Nota fonte/verifica
- Elementi confermati (Fonte ufficiale Stability AI): Il lancio di Stable Audio 2.5, la durata massima delle tracce di 3 minuti, il tempo di calcolo inferiore a 2 secondi, l’introduzione dell’audio inpainting, l’addestramento su dati con licenza e la partnership con WPP.
- Elementi da verificare/osservare: L’effettiva qualità artistica delle melodie e delle voci su produzioni complesse, l’impatto reale sul mercato dei compositori e l’evoluzione delle normative sul copyright nel Regno Unito.

