A Voice Engine mesterséges intelligencia szoftver 15 másodperces hangminta alapján képes szintetikus másolatot létrehozni. A program egyelőre korlátozottan érhető el, mivel a technológia jelentős kockázatokat hordoz magában, különösen a deepfake manipuláció terén. A Voice Engine az OpenAI meglévő szövegfelolvasó technológiájának bővítése.
A szoftver kifinomult mesterséges intelligencia-modellt használ, amely elemzi mind a rendelkezésre álló hangrészletet, mind az olvasandó szöveget, és valós időben állít elő egy megfelelő hangot anélkül, hogy állandó felvételt készítene az egyén hangjáról. Az első teszthangokat ezen az oldalon lehet meghallgatni. Az OpenAI úgy véli, hogy az új fejlesztésük segít az olvasási nehézségek kezelésében, a nyelvek fordításában, és még a beszédkommunikációjukat vesztett embereken is.
A technológia első hangzásra tényleg nagyon hasznos tud lenni, de sok veszélyforrást is rejt magában, nem csak a mélyhamisítások terén, de a hangmunka például szinkronizálás terén is. Egy ilyen fejlett technológia akár halott emberek hangját is visszahozhatja, sőt olcsóbbá válhat a hangmunka a szintetikus hangok felhasználásával.