Az OpenAI generatív AI-hoz további funkciók érkeztek.

Az OpenAI által bejelntett GPT-4o néven futó frissítés lehetővé teszi a szöveg, a hang és a kép egyidejű feldolgozását és generálását, bármilyen kombinációban. A fejlesztések célja természetesebb interakciók létrehozása a felhasználók és a generatív mesterséges intelligencia között. Az egyik legjelentősebb újítás az, hogy ugyanaz a neurális hálózat dolgozza fel a szöveges, a képi és a hang információkat. Például a hangbemenetekre gyorsan reagál, ami hasonló az emberi válaszidőhöz.

Az „o” az „omni” rövidítése, ami arra utal, hogy az új funkciók széleskörű alkalmazást tesznek lehetővé. A GPT-4o mellett egy asztali alkalmazást is kiadnak a felhasználói élmény fokozása érdekében.  Az új verzió jelentős javulást mutat a nem angol nyelvű szövegek esetén is. Habár a magyar nyelvet az OpenAI nem nevezte meg honlapján, más európai nyelveket igen.

A GPT-4o funkciók fokozatosan lesznek elérhetőek a bejelentést követően, jelenleg azonban még nem érhetőek el, de várhatóan az ingyenes felhasználók számára is rendelkezésre áll majd. Az OpenAI további fejlesztéseket is tervez a hangfelismerés terén a ChatGPT Plus felhasználók számára. Ezenfelül a fejlesztők számára is elérhető lesz a GPT-4o az API-ban, mint szöveg- és gépi tanulásmodell. Az új verzió kétszer olyan gyors és fele annyiba kerül majd, mint a GPT-4 Turbo.

Az új funkciók számos új felhasználási területet nyitnak meg a természetesebb interakciók révén, beleértve például az élő fordítást, matematikai problémák megoldását, nyelvtanulást, állásinterjúra való felkészülést, környezetleírást és videók összefoglalását.

(Forrás: Fintech.hu)


Ha tetszett a cikk:

és kövess minket a Facebookon!



Szólj hozzá

Vélemény, hozzászólás?