La generazione vocale da parte delle Intelligenze Artificiali è molto utile ma è anche piuttosto controversa. L’intelligenza artificiale generativa rivoluziona infatti il modo in cui vengono creati contenuti di vario genere, come testi, opere d’arte, immagini e discorsi. La startup AI chiamata ElevenLabs si è distinta nel campo della sintesi vocale e della clonazione vocale sin dal suo lancio beta nel mese di gennaio, riuscendo a conquistare oltre un milione di utenti registrati.

ElevenLabs affronta la controversia sulla generazione vocale
Recentemente, ElevenLabs ha annunciato una notizia di grande rilievo: la conclusione di un round di finanziamento di serie A da 19 milioni di dollari, insieme a importanti aggiornamenti alla propria piattaforma, mirati ad affrontare la principale controversia che l’azienda ha dovuto affrontare finora.
Fin dal momento del suo lancio, la tecnologia di generazione vocale di ElevenLabs ha portato con sé implicazioni sia positive che negative. L’azienda ha illustrato alcuni dei casi d’uso positivi, tra cui la creazione di audiolibri da parte di autori indipendenti, la voce attribuita a personaggi nei videogiochi, il supporto all’accesso a contenuti scritti online per le persone non vedenti e la creazione del primo canale radio al mondo basato sull’intelligenza artificiale.
Problematiche associate alla generazione vocale
Nonostante questi utilizzi positivi, si sono riscontrate anche applicazioni dannose. La funzionalità di clonazione vocale permette di generare nuovi audio utilizzando frammenti della voce di una persona. Essa però è stata utilizzata in modi nefasti, creando discorsi offensivi e discriminatori attribuiti a personaggi pubblici.
Poco dopo il lancio della versione beta, ElevenLabs si è affrettata a rispondere alle “molestie legate all’uso improprio della clonazione vocale” tramite Twitter. L’azienda ha proposto possibili soluzioni per contrastare il problema, come la verifica aggiuntiva dell’account, la verifica del copyright della voce, la transizione della clonazione vocale a un modello a pagamento e persino la verifica manuale di ogni richiesta. Come risposta a questa controversia, ElevenLabs ha finalmente presentato al pubblico la propria soluzione: un classificatore vocale basato sull’intelligenza artificiale.
Questo strumento, chiamato “AI Speech Classifier”, sarà in grado di identificare se l’audio caricato contiene contenuti generati da ElevenLabs. Secondo quanto affermato dall’azienda in un comunicato, questo classificatore rappresenta l’ultimo passo dell’impegno di ElevenLabs verso la trasparenza e costituisce un pilastro fondamentale per creare un ambiente mediatico generativo sicuro. Speriamo che ciò si traduca in una soluzione efficace per affrontare la problematica della generazione vocale controversa.