Itt az Nvidia új AI-modellje, mely szöveges promptokból hangot tud létrehozni

2024. november 25.
7.6121
csirkee profilja, adatai
csirkee
Az Nvidia nemrégiben bemutatott egy új kísérleti, generatív mesterséges intelligencia modellt, melyet Fugatto-ként emleget, mely képes csupán szöveges promptokból parancsokat fogadni, és felhasználni hangok létrehozására vagy meglévő zenei, hang- és hangfájlok módosítására.

A modellt a világ minden tájáról érkezett mesterséges intelligenciakutatókból álló csapat tervezte, ennek köszönhetően az AI képes több nyelven beszélni és akcentust is többet ismer. Rafael Valle, a projekt egyik kutatója úgy fogalmazott, hogy olyan modellt akartak létrehozni, ami úgy érti és generálja a hangot, mint az emberek.

A szoftvert első körben zenei producerek tesztelték, akik a technológia segítségével gyorsan és egyszerűen tudtak dalötleteket előállítani, és azokat módosítani különféle stílusokra. Az NVIDIA nem közölte, hogy a nyilvánosság számára is elérhetővé válik valamikor a Fugatto, de a modell nem az első olyan generatív mesterséges intelligencia technológia, amely szöveges üzenetekből hangokat tud létrehozni.
4 hozzászólás

Kisfaludy82

2 hónapja, 2 napja

Frankón ijesztő baszki.

válasz erre

Porthos

2 hónapja, 2 napja

Nagyon durva baszki! meglepett smiley

válasz erre

CharlieFirpo

2 hónapja, 3 napja

Már nem lehet tudni, mi igaz és mi hamis...

válasz erre

Fikarc

2 hónapja, 3 napja

Szépen fejlődik a dolog, meg kell hagyni!

válasz erre