Már nem először okoz gondot az, hogy a mesterséges intelligenciát fejlesztő vállalatok engedély nélkül használnak fel adatokat a modellek képzéséhez, ebből az OpenAI-nak is voltak már problémái, most az Appleről és az Nvidiáról is hasonló derült ki. A két cég az EleutherAI nevű nonprofit cég által létrehozott adatkészletéből kezdtek el dolgozni.
Ez az adatkészlet 48 ezer csatorna YouTube-videóinak szöveges átiratát tartalmazza, tehát képet és hanganyagot nem tartalmaz. A Google szóvivője ismételten megjegyezte, hogy az adatok felhasználása megsérti a YouTube felhasználási feltételeit, ám kérdéses, hogy mit lehet ez ellen tenni. Ráadásul a legnagyobb gondot az okozza, hogy családi videókat is felhasználnak a cégek.