Az OpenAI által bejelntett GPT-4o néven futó frissítés lehetővé teszi a szöveg, a hang és a kép egyidejű feldolgozását és generálását, bármilyen kombinációban. A fejlesztések célja természetesebb interakciók létrehozása a felhasználók és a generatív mesterséges intelligencia között. Az egyik legjelentősebb újítás az, hogy ugyanaz a neurális hálózat dolgozza fel a szöveges, a képi és a hang információkat. Például a hangbemenetekre gyorsan reagál, ami hasonló az emberi válaszidőhöz.
Az „o” az „omni” rövidítése, ami arra utal, hogy az új funkciók széleskörű alkalmazást tesznek lehetővé. A GPT-4o mellett egy asztali alkalmazást is kiadnak a felhasználói élmény fokozása érdekében. Az új verzió jelentős javulást mutat a nem angol nyelvű szövegek esetén is. Habár a magyar nyelvet az OpenAI nem nevezte meg honlapján, más európai nyelveket igen.
A GPT-4o funkciók fokozatosan lesznek elérhetőek a bejelentést követően, jelenleg azonban még nem érhetőek el, de várhatóan az ingyenes felhasználók számára is rendelkezésre áll majd. Az OpenAI további fejlesztéseket is tervez a hangfelismerés terén a ChatGPT Plus felhasználók számára. Ezenfelül a fejlesztők számára is elérhető lesz a GPT-4o az API-ban, mint szöveg- és gépi tanulásmodell. Az új verzió kétszer olyan gyors és fele annyiba kerül majd, mint a GPT-4 Turbo.
Az új funkciók számos új felhasználási területet nyitnak meg a természetesebb interakciók révén, beleértve például az élő fordítást, matematikai problémák megoldását, nyelvtanulást, állásinterjúra való felkészülést, környezetleírást és videók összefoglalását.
(Forrás: Fintech.hu)
Szólj hozzá