A modellt a világ minden tájáról érkezett mesterséges intelligenciakutatókból álló csapat tervezte, ennek köszönhetően az AI képes több nyelven beszélni és akcentust is többet ismer. Rafael Valle, a projekt egyik kutatója úgy fogalmazott, hogy olyan modellt akartak létrehozni, ami úgy érti és generálja a hangot, mint az emberek.
A szoftvert első körben zenei producerek tesztelték, akik a technológia segítségével gyorsan és egyszerűen tudtak dalötleteket előállítani, és azokat módosítani különféle stílusokra. Az NVIDIA nem közölte, hogy a nyilvánosság számára is elérhetővé válik valamikor a Fugatto, de a modell nem az első olyan generatív mesterséges intelligencia technológia, amely szöveges üzenetekből hangokat tud létrehozni.