Arriva Adobe VoCo, il Photoshop per l’audio

Algoritmi sperimentali permettono di modificare il parlato senza lasciare traccia.

Qualche settimana fa, Adobe, azienda nota per i suoi prodotti di video e grafica digitale, ha stupito gli spettatori della Adobe MAX, una conferenza tenutasi a San Diego in California, presentando quello che può essere considerato il Photoshop dell’audio.

La nuova applicazione dal nome in codice VoCo, sviluppata in collaborazione con l’università di Princeton, è stata presentata da Zeyu Jin, uno degli sviluppatori del team, che ne ha mostrato la feature principale ovvero quella di aggiungere, cambiare o eliminare parole dall’audio come se fosse testo.

Con Adobe Voco si potrà quindi convertire il testo in audio, facendo uso di campioni vocali, dopo un processo di sintetizzazione reso possibile dall’algoritmo CUTE ed inserire nuove porzioni di parlato all’interno del file sorgente per poi adattarle al tono di voce di chi parla.

L’inserimento richiederà per ogni parola circa 20 minuti, lasso di tempo giustificato e decisamente accettabile per un risultato così preciso e accurato.

Ogni aspetto di questo processo è descritto in un paper rilasciato all’inizio di quest’anno.

La demo mostrata, come sottolineato da alcuni rappresentanti di The Verge, è solamente un prototipo e la dimostrazione può essere considerata come una “sbirciata” a quello che  Adobe ha in serbo per il futuro.

Non è chiaro quando il programma verrà rilasciato e se per scopi commerciali o meno.

Nonostante questo innovativo software faccia sorgere alcuni dubbi sull’etica di determinate azioni che si possono svolgere col programma, risulta però utile in compiti di editing come ad esempio correggere errori di pronuncia o ripulire registrazioni e podcast.

L’idea di creare qualcosa di simile era già venuta anche a Google e Microsoft che pur ipotizzando metodologie diverse, avevano precedentemente manifestato l’interesse nel Voice Conversion.