Már néhány napja tudni lehetett, hogy az OpenAI egy nagy bejelentésre készült, ám a pletykák egy új keresőmotorról szóltak, ezzel szemben a vállalat egy új AI modellt mutatott be, méghozzá a GPT-4o-t (omni), mely elrepíthet bennünket a jövőbe, annyira valósághű a mesterséges intelligencia.
Sam Altman által vezetett mesterséges intelligenciával foglalkozó vállalat új szintre emeli a jövőben a virtuális asszisztensek területét az új GPT-4o AI modellel. A chatbot képes valós idejű beszélgetést folytatni, ráadásul nemcsak írott szöveg, hanem videók, képek és hangok alapján is. Az új modell a következő hetekben válik elérhetővé mindenki számára, ráadásul ingyen.
Az új nagy nyelvi modell nem csak gyorsabb az elődjéhez képest (GPT-4), de megérti a valós idejű beszédet, felismeri a különféle érzelmekre utaló jeleket, és mindezek mellett még vizuális bemenettel is képes dolgozni. Késleltetés nélkül tud kommunikálni, a fejlesztők elmondása szerint átlagosan körülbelül 320 ezredmásodperc alatt reagál. Az AI képes énekelni, sőt a hangszínét is képes a felhasználóhoz igazítani. Az alábbi videókban láthatunk egy kis demót arról, hogyan működik majd a GPT-4o.