OpenAI lansează noi funcții de inteligență vocală în API-ul său
OpenAI a adăugat noi capabilități de inteligență vocală în API-ul său, inclusiv modele pentru conversație în timp real, traducere și transcriere. Compania afirmă că aceste instrumente pot sprijini serviciile pentru clienți, educația, media și platformele pentru creatori.

OpenAI a declarat joi că API-ul său include acum o serie de noi funcționalități de inteligență vocală, concepute pentru a ajuta dezvoltatorii să creeze aplicații care pot conversa, transcrie și traduce discuțiile cu utilizatorii.
GPT‑Realtime‑2
GPT‑Realtime‑2 al companiei este un nou model vocal construit pentru a crea o simulare vocală realistă care poate conversa cu utilizatorii. Spre deosebire de predecesorul său, GPT‑Realtime‑1.5, noul model este dezvoltat cu un raționament de clasă GPT‑5, despre care OpenAI spune că a fost conceput pentru a gestiona solicitări mai complicate din partea utilizatorilor.
GPT‑Realtime‑Translate
OpenAI lansează, de asemenea, GPT‑Realtime‑Translate, un model conceput pentru a oferi servicii de traducere în timp real care „țin pasul” cu utilizatorul în conversație. Funcționalitatea suportă peste 70 de limbi de intrare—limbile pe care le poate înțelege—și 13 limbi de ieșire, care sunt redate vorbitorului.
GPT‑Realtime‑Whisper
Compania a introdus o nouă capabilitate de transcriere numită GPT‑Realtime‑Whisper. Modelul oferă funcționalitate live de conversie a vorbirii în text, capturând transcrierile pe măsură ce interacțiunile au loc.
„Împreună, modelele pe care le lansăm mută audio în timp real de la simple schimburi de tip întrebare-răspuns către interfețe vocale care pot efectiv să facă lucruri: să asculte, să raționeze, să traducă, să transcrie și să acționeze pe măsură ce o conversație se desfășoară”, a declarat compania.
Utilizări și aplicații
Companiile care doresc să își extindă capacitățile de servicii pentru clienți sunt un public țintă evident pentru noile instrumente. Totuși, OpenAI afirmă că funcționalitățile pot susține, de asemenea, o gamă largă de aplicații, inclusiv în educație, media, evenimente și platforme pentru creatori.
Siguranță și măsuri de protecție
OpenAI a recunoscut că, deși instrumentele pot fi utile pentru companii, ele ar putea fi și utilizate abuziv. Compania a declarat că a implementat măsuri de protecție pentru a preveni abuzuri precum spamul, frauda sau alte forme de prejudicii online. Potrivit OpenAI, anumite declanșatoare sunt integrate în sistem astfel încât „conversațiile pot fi oprite dacă sunt detectate ca încălcând politicile noastre privind conținutul dăunător.”
Disponibilitate și prețuri
Toate noile modele vocale sunt incluse în API-ul Realtime al OpenAI. GPT‑Realtime‑Translate și GPT‑Realtime‑Whisper sunt facturate la minut, în timp ce GPT‑Realtime‑2 este facturat pe baza consumului de tokeni.