Home » Intelligenza Artificiale » AudioCraft: Meta lancia il suo modello di IA generativa legato alla musica
Il mondo della musica è scosso da una notizia riguardante l’Intelligenza Artificiale. Meta, il gigante dei social media di proprietà di Mark Zuckerberg, lancia infatti un modello di linguaggi di grandi dimensioni open source. Il modello di IA generativa basato su text-to-voice è stato soprannominato AudioCraft.
AudioCraft promette di aprire nuovi orizzonti nella generazione di musica e audio di alta qualità mediante semplici istruzioni basate su testo. Ciò che rende AudioCraft un’esperienza autentica e realistica è il suo addestramento sui segnali audio. Un concetto simile a quello adottato da Google con i suoi strumenti di intelligenza artificiale audio, MusicLM.
La forza trainante di AudioCraft si basa su tre distinti modelli di intelligenza artificiale: MusicGen, AudioGen e EnCodec. MusicGen si dedica a generare “musica da input basati su testo”, sfruttando i campioni musicali di proprietà di Meta e rilasciati sotto licenza. Allo stesso modo, AudioGen si concentra sulla creazione di “audio da input basati su testo”, utilizzando effetti sonori disponibili pubblicamente. L’elemento chiave che dà vita alle uscite audio realistiche è rappresentato dal decoder EnCodec, che opera con precisione riducendo al minimo gli artefatti sonori.
L’applicazione pratica di questa potente combinazione di modelli è stupefacente: con AudioCraft, è possibile generare scene diverse, ognuna con elementi focalizzati che si amalgamano perfettamente nell’output finale. Un esempio lampante è il prompt “Musica pop degli anni ’90 con un gatto che miagola in sottofondo”. In questo caso MusicGen offrirà un’ottima parte pop e AudioGen aggiungerà senza soluzione di continuità il miagolio del gatto in sottofondo. Il tutto viene presentato grazie alle avanzate capacità di decodifica di EnCodec.
La vera potenza di AudioCraft si rivela nel suo carattere open-source. Questo significa che i ricercatori hanno accesso al codice sorgente del modello AudioCraft, consentendo loro di approfondire la comprensione di questa tecnologia e persino di creare set di dati personalizzati per migliorarla ulteriormente.
Questo potente strumento apre nuovi orizzonti nella generazione di musica e suoni, offrendo anche l’opportunità di creare algoritmi di compressione e generatori di suoni ottimizzati. Con la possibilità di basarsi su un solido codice esistente, gli utenti hanno la libertà di sperimentare e dare vita a nuove idee e scoperte nell’universo dell’Intelligenza Artificiale Musicale.
© 2023 Near Future - Testata Giornalistica registrata al Tribunale di Napoli (Registrazione n. 31 del 21/07/2022)
Gruppo Editoriale: USB - Animalsland - Findyourtravel - Foodando - Worldculture
© 2023 Near Future - Testata Giornalistica registrata al Tribunale di Napoli (Registrazione n. 31 del 21/07/2022)
Gruppo Editoriale: USB - Animalsland - Findyourtravel - Foodando - Worldculture