Nell’ambito delle innovazioni nel campo dell’intelligenza artificiale, OpenAI ha annunciato il lancio di un modello di generazione video chiamato SORA, che promette di rivoluzionare il modo in cui i contenuti video vengono creati e condivisi. SORA è capace di generare scene complesse, includendo molteplici personaggi, tipi specifici di movimento e dettagli accurati relativi ai soggetti e agli sfondi, basandosi semplicemente su una descrizione testuale fornita dall’utente.

Al momento della sua presentazione, SORA ha suscitato grande interesse e ammirazione per le sue capacità di generazione video fotorealistici, come riconosciuto da pubblicazioni di prestigio come Wired e il New York Times. Queste capacità hanno acceso l’entusiasmo sia nel pubblico generale che tra professionisti creativi, evidenziando il potenziale del modello nell’ambito della narrazione digitale e della creazione di contenuti visivi.
Il modello SORA è stato sviluppato adattando le tecnologie alla base di DALL-E 3, la nota versione del modello di generazione di immagini di OpenAI, combinando un modello di diffusione con una rete neurale di tipo transformer. Questo approccio innovativo permette a SORA di elaborare i video tagliandoli sia nello spazio che nel tempo, potenziando significativamente la sua capacità di generare video vari in termini di risoluzione, durata, rapporto di aspetto e orientamento.
Tuttavia, nonostante l’entusiasmo suscitato dalle sue prime dimostrazioni, OpenAI non ha ancora annunciato una data ufficiale di rilascio per SORA al pubblico generale. È stato menzionato che SORA sarà rilasciato “più avanti quest’anno”, e ci sono piani per integrare audio nelle scene generate, oltre alla possibilità per gli utenti di modificare i contenuti video all’interno dello strumento stesso. Queste caratteristiche verranno integrate “eventualmente”, il che implica che potrebbero essere disponibili solo dopo il lancio iniziale.
OpenAI ha rivelato anche che SORA è stato addestrato utilizzando video disponibili pubblicamente o video per i quali sono state acquistate le licenze, senza specificare il numero o la fonte esatta dei video utilizzati. OpenAI ha riconosciuto alcune delle limitazioni di SORA, tra cui la difficoltà nel simulare fisiche complesse, nel comprendere la causalità e nel distinguere la sinistra dalla destra. Nonostante queste sfide, i video generati da SORA sono contrassegnati con metadati C2PA per indicare che sono stati generati tramite intelligenza artificiale.
Considerazioni etiche e di sicurezza hanno guidato la decisione di OpenAI di non accelerare il lancio di SORA. L’organizzazione ha enfatizzato l’importanza di adottare misure di sicurezza significative prima di rendere SORA disponibile nei suoi prodotti, lavorando con esperti in disinformazione, contenuti d’odio e pregiudizi per testare il modello in modo avversario. La potenziale abusabilità della tecnologia, soprattutto nel creare video che possano impersonare persone reali o generare disinformazione, è una delle principali preoccupazioni.
In conclusione, sebbene l’entusiasmo per SORA sia indubbiamente elevato, sia per le sue potenzialità rivoluzionarie sia per le sfide etiche che presenta, l’attesa per il suo lancio continua. OpenAI sembra intenzionata a procedere con cautela, assicurandosi che le innovazioni portate da SORA siano accompagnate da adeguate misure di sicurezza e responsabilità etica.