OpenAI startet neue Sprachintelligenz-Funktionen in seiner API

Technology07.May.2026 22:242 min read

OpenAI hat seiner API neue Sprachintelligenz-Funktionen hinzugefügt, darunter Echtzeit-Konversation, Übersetzungs- und Transkriptionsmodelle. Das Unternehmen gibt an, dass die Tools Kundenservice, Bildung, Medien- und Creator-Plattformen unterstützen können.

OpenAI startet neue Sprachintelligenz-Funktionen in seiner API

OpenAI teilte am Donnerstag mit, dass seine API nun eine Reihe neuer Sprachintelligenz‑Funktionen enthält, die Entwicklern dabei helfen sollen, Apps zu erstellen, die mit Nutzern sprechen, Gespräche transkribieren und übersetzen können.

GPT‑Realtime‑2

Das GPT‑Realtime‑2 des Unternehmens ist ein neues Sprachmodell, das eine realistische Sprachsimulation erzeugen kann, die mit Nutzern interagiert. Im Gegensatz zu seinem Vorgänger GPT‑Realtime‑1.5 basiert das neue Modell auf einer Argumentationsfähigkeit der GPT‑5‑Klasse, die laut OpenAI dafür entwickelt wurde, komplexere Nutzeranfragen zu bewältigen.

GPT‑Realtime‑Translate

OpenAI bringt außerdem GPT‑Realtime‑Translate auf den Markt, ein Modell, das Echtzeit‑Übersetzungsdienste bereitstellt, die im Gespräch mit dem Nutzer „Schritt halten“. Die Funktion unterstützt mehr als 70 Eingabesprachen – also die Sprachen, die sie verstehen kann – sowie 13 Ausgabesprachen, die an den Sprecher übermittelt werden.

GPT‑Realtime‑Whisper

Das Unternehmen hat eine neue Transkriptionsfunktion namens GPT‑Realtime‑Whisper eingeführt. Das Modell bietet eine Live‑Speech‑to‑Text‑Funktion und erfasst Transkriptionen, während Interaktionen stattfinden.

„Gemeinsam verschieben die Modelle, die wir auf den Markt bringen, Echtzeit‑Audio von einfachen Frage‑und‑Antwort‑Interaktionen hin zu Sprachschnittstellen, die tatsächlich Arbeit leisten können: zuhören, schlussfolgern, übersetzen, transkribieren und Maßnahmen ergreifen, während sich ein Gespräch entwickelt“, erklärte das Unternehmen.

Anwendungsfälle und Einsatzbereiche

Unternehmen, die ihre Kundenservice‑Funktionen ausbauen möchten, sind ein naheliegendes Ziel für die neuen Tools. OpenAI zufolge können die Funktionen jedoch auch eine breite Palette von Anwendungen unterstützen, darunter Bildung, Medien, Veranstaltungen und Creator‑Plattformen.

Sicherheit und Schutzmechanismen

OpenAI räumte ein, dass die Tools zwar für Unternehmen nützlich sein können, jedoch auch missbraucht werden könnten. Das Unternehmen erklärte, es habe Schutzmechanismen integriert, um Missbrauch wie Spam, Betrug oder andere Formen von Online‑Schäden zu verhindern. Laut OpenAI sind bestimmte Auslöser im System eingebettet, sodass „Gespräche gestoppt werden können, wenn festgestellt wird, dass sie gegen unsere Richtlinien zu schädlichen Inhalten verstoßen.“

Verfügbarkeit und Preisgestaltung

Alle neuen Sprachmodelle sind in der Realtime‑API von OpenAI enthalten. GPT‑Realtime‑Translate und GPT‑Realtime‑Whisper werden pro Minute abgerechnet, während GPT‑Realtime‑2 auf Basis des Token‑Verbrauchs berechnet wird.