Back

Thinking Machines presenta un modelo de IA ‘Full Duplex’ que escucha mientras habla

AI Startups12.May.2026 10:084 min read

La startup de Mira Murati, Thinking Machines Lab, ha presentado una vista previa de investigación de un modelo de IA “full duplex” diseñado para procesar entradas y generar respuestas simultáneamente, con el objetivo de que las conversaciones con IA se sientan más como llamadas telefónicas en tiempo real que como intercambios de texto por turnos.

Thinking Machines presenta un modelo de IA ‘Full Duplex’ que escucha mientras habla

Thinking Machines Lab, la startup de IA fundada por la ex CTO de OpenAI Mira Murati, ha anunciado un nuevo enfoque para la IA conversacional que podría cambiar fundamentalmente la forma en que los humanos interactúan con los modelos de lenguaje a gran escala. En lugar del formato habitual basado en turnos —donde los usuarios hablan o escriben, esperan una respuesta y luego continúan— la empresa está desarrollando lo que denomina un “modelo de interacción” capaz de escuchar y responder al mismo tiempo.

De un modelo por turnos a una IA en tiempo real

Los sistemas de IA convencionales actuales operan con un patrón secuencial. Un usuario proporciona una entrada, el modelo la procesa y luego genera una respuesta. Esta estructura se asemeja más a la mensajería de texto que a una conversación natural. Thinking Machines pretende sustituir ese paradigma con una arquitectura de “full duplex”, que permite el procesamiento simultáneo de la entrada y la generación de la salida.

El modelo preliminar de investigación de la empresa, denominado TML-Interaction-Small, responde supuestamente en aproximadamente 0,40 segundos, una latencia cercana a la típica del habla humana. Según Thinking Machines, esto lo hace significativamente más rápido que ofertas comparables de los principales proveedores de IA, aunque las evaluaciones independientes aún no han validado esas afirmaciones.

Por qué el full duplex es importante

En el diálogo humano, los participantes interrumpen, intercalan comentarios o ajustan su discurso a mitad de frase en respuesta a señales sutiles. Los asistentes de voz actuales basados en IA tienen dificultades con este flujo dinámico porque deben esperar a que la entrada concluya antes de generar una salida. Un modelo full duplex nativo podría permitir intercambios más fluidos, interrupciones más naturales y respuestas adaptativas que evolucionen mientras el usuario continúa hablando.

Si tiene éxito, este cambio podría tener implicaciones más allá de los chatbots para consumidores. La IA conversacional en tiempo real es fundamental para aplicaciones como asistentes virtuales, automatización del servicio al cliente, herramientas de accesibilidad, sistemas de tutoría y entornos de trabajo colaborativo. Una menor latencia y el procesamiento simultáneo podrían reducir la fricción y hacer que la IA se sienta menos mecánica.

Aún en fase preliminar de investigación

A pesar de las afirmaciones técnicas, el anuncio de Thinking Machines se mantiene firmemente en la fase de investigación. La empresa no ha lanzado el modelo al público. Se espera una vista previa limitada para investigación en los próximos meses, con un lanzamiento más amplio previsto para finales de este año.

Eso significa que aún quedan preguntas clave sin respuesta: ¿Qué tan bien maneja el modelo el habla ruidosa o superpuesta? ¿Puede mantener la precisión mientras genera respuestas en tiempo real? ¿Y la experiencia real del usuario coincidirá con los indicadores de rendimiento presentados por la empresa?

Una señal estratégica de una startup de alto perfil

El anuncio es notable no solo por su ambición técnica, sino también por su origen. Murati, quien anteriormente ayudó a liderar el desarrollo de ChatGPT y otros productos de OpenAI, fundó Thinking Machines Lab en 2025. El enfoque inicial de la startup en una IA nativa de interacción sugiere que podría estar apuntando a un cambio fundamental en la forma en que se diseñan los modelos, en lugar de competir únicamente en tamaño de modelo o puntuaciones en pruebas comparativas.

Que la interacción full duplex se convierta en el próximo estándar para la IA conversacional dependerá de la ejecución, la escalabilidad y la adopción por parte de los desarrolladores. Pero el movimiento señala un reconocimiento creciente en toda la industria: hacer que la IA sea más inteligente puede no ser suficiente; hacer que se sienta más humana podría ser igual de importante.