OpenAI ha anunciado el lanzamiento de GPT-5.4, una nueva generación de su modelo de inteligencia artificial que llega a ChatGPT, la API y Codex con mejoras importantes en razonamiento, programación, uso de herramientas y ejecución de tareas complejas. La compañía también ha presentado GPT-5.4 Pro, una variante diseñada para ofrecer el máximo rendimiento en trabajos especialmente exigentes.

El nuevo modelo pretende consolidar en un único sistema los avances recientes en IA aplicada al trabajo profesional, permitiendo completar tareas complejas con mayor precisión, menor consumo de recursos y menos interacciones entre usuario y modelo.

GPT-5.4: un modelo diseñado para el trabajo profesional

GPT-5.4 se presenta como el modelo más avanzado y eficiente desarrollado por OpenAI hasta la fecha para tareas profesionales. Integra las capacidades de razonamiento introducidas en versiones anteriores con las potentes habilidades de programación heredadas de GPT-5.3-Codex, además de mejorar su interacción con herramientas externas, aplicaciones de oficina y entornos de software.

Según OpenAI, este modelo ha sido optimizado para ejecutar tareas reales de trabajo del conocimiento como crear hojas de cálculo, preparar presentaciones, redactar documentos o desarrollar software. Gracias a estas mejoras, GPT-5.4 puede generar resultados más precisos y completos sin necesidad de múltiples iteraciones con el usuario.

El objetivo es claro: que la IA no solo responda preguntas, sino que complete tareas complejas de principio a fin, actuando cada vez más como un agente autónomo capaz de operar herramientas y software.

GPT-5.4 Thinking en ChatGPT: más transparencia y control

En ChatGPT, el nuevo modelo aparece como GPT-5.4 Thinking, sustituyendo a GPT-5.2 Thinking. Una de las novedades más interesantes es que el sistema puede mostrar un plan previo de cómo va a abordar la tarea, permitiendo al usuario ajustar el rumbo de la respuesta mientras se está generando.

Este enfoque facilita corregir o modificar instrucciones sin tener que reiniciar la conversación o realizar múltiples solicitudes adicionales. En la práctica, permite guiar mejor a la IA hacia el resultado deseado.

Además, GPT-5.4 mejora notablemente el análisis de información en la web, especialmente en consultas muy específicas o difíciles de encontrar. El modelo puede mantener el contexto durante procesos de razonamiento más largos y combinar información procedente de múltiples fuentes.

Estas mejoras se traducen en respuestas más completas, relevantes y rápidas.

Un salto importante en agentes de IA y uso del ordenador

Una de las novedades más destacadas de GPT-5.4 es que se convierte en el primer modelo generalista de OpenAI con capacidades nativas de uso del ordenador.

Esto significa que los agentes basados en GPT-5.4 pueden interactuar con software y sistemas informáticos para completar tareas complejas, incluyendo:

Navegar por aplicaciones

Ejecutar comandos de teclado y ratón

Interactuar con páginas web

Utilizar herramientas y APIs externas

El modelo puede escribir código para controlar ordenadores mediante bibliotecas como Playwright, o interpretar capturas de pantalla para decidir qué acciones realizar.

En pruebas realizadas en el benchmark OSWorld-Verified, que mide la capacidad de un modelo para operar un entorno de escritorio mediante capturas de pantalla y acciones de ratón o teclado, GPT-5.4 alcanzó una tasa de éxito del 75,0%, superando tanto a GPT-5.2 (47,3%) como al rendimiento humano medio (72,4%).

Mejor integración con herramientas y ecosistemas de software

Otra mejora clave se centra en cómo el modelo trabaja con herramientas externas. En sistemas complejos con decenas o cientos de herramientas, incluir todas sus definiciones en cada solicitud puede aumentar significativamente el número de tokens utilizados.

Para solucionar este problema, OpenAI ha introducido una función denominada tool search. En lugar de cargar todas las herramientas en el contexto desde el inicio, el modelo recibe solo una lista ligera y puede buscar la definición completa de una herramienta cuando realmente necesita utilizarla.

Esta estrategia reduce el consumo de tokens, acelera las respuestas y permite trabajar con ecosistemas de herramientas mucho más grandes.

En pruebas realizadas con el benchmark MCP Atlas, esta técnica redujo el uso total de tokens en un 47% manteniendo la misma precisión en los resultados.

Mayor precisión y menos errores

OpenAI afirma que GPT-5.4 es su modelo más fiable desde el punto de vista factual. En pruebas internas basadas en consultas donde usuarios habían detectado errores en versiones anteriores, el nuevo modelo redujo significativamente las alucinaciones.

En concreto:

Las afirmaciones individuales del modelo tienen un 33% menos de probabilidades de ser falsas

Las respuestas completas presentan un 18% menos de errores respecto a GPT-5.2

Esta mejora es especialmente relevante para aplicaciones profesionales donde la precisión es crítica, como análisis financiero, investigación o generación de documentación técnica.

Avances en programación y desarrollo de software

En el ámbito del desarrollo, GPT-5.4 combina las capacidades de programación de GPT-5.3-Codex con las mejoras en razonamiento y uso de herramientas.

En el benchmark SWE-Bench Pro, que evalúa la capacidad de resolver problemas reales de ingeniería de software, GPT-5.4 alcanzó un 57,7% de precisión, superando ligeramente a GPT-5.3-Codex (56,8%) y GPT-5.2 (55,6%).

También introduce nuevas herramientas experimentales en Codex, como Playwright Interactive, que permite depurar visualmente aplicaciones web o Electron mientras el modelo las está desarrollando.

Además, el modo /fast en Codex permite incrementar la velocidad de generación de tokens hasta 1,5 veces, facilitando ciclos de desarrollo y depuración más rápidos.

Contexto ampliado y tareas más largas

GPT-5.4 admite contextos de hasta 1 millón de tokens, lo que permite analizar grandes volúmenes de información o trabajar con proyectos complejos durante más tiempo sin perder contexto.

Este tipo de capacidades resulta especialmente útil para tareas como:

análisis de grandes documentos

desarrollo de software de gran tamaño

investigación con múltiples fuentes

automatización de procesos empresariales

Resultados destacados en benchmarks

El nuevo modelo logra mejoras significativas en múltiples evaluaciones.

En GDPval, que mide el rendimiento en tareas reales de trabajo del conocimiento en 44 profesiones, GPT-5.4 iguala o supera a profesionales humanos en el 83,0% de los casos, frente al 70,9% de GPT-5.2.

En el benchmark BrowseComp, que evalúa la capacidad de encontrar información difícil en Internet, GPT-5.4 alcanza un 82,7%, mientras que la versión GPT-5.4 Pro llega al 89,3%, estableciendo un nuevo récord.

En pruebas de visión e interpretación de imágenes complejas, el modelo logra:

81,2% de precisión en MMMU-Pro

en MMMU-Pro reducción del error en OmniDocBench de 0,140 a 0,109

Estas mejoras también se reflejan en tareas relacionadas con hojas de cálculo y presentaciones. En evaluaciones internas, GPT-5.4 obtuvo un 87,3% de puntuación media en tareas de modelado financiero que normalmente realizaría un analista junior de banca de inversión.

Capacidades visuales mejoradas

GPT-5.4 también introduce mejoras en el procesamiento de imágenes de alta resolución.

El nuevo modo de entrada de imágenes permite trabajar con archivos de hasta 10,24 millones de píxeles o dimensiones máximas de 6.000 píxeles, lo que facilita interpretar documentos escaneados, diagramas complejos o capturas de pantalla detalladas.

Según OpenAI, las pruebas iniciales muestran mejoras en:

localización de elementos en imágenes

comprensión visual

precisión en clics en interfaces gráficas

Disponibilidad y precios

GPT-5.4 comienza a desplegarse gradualmente en ChatGPT y Codex.

En ChatGPT:

GPT-5.4 Thinking está disponible para usuarios Plus, Team y Pro

está disponible para usuarios sustituye a GPT-5.2 Thinking

GPT-5.2 seguirá disponible durante tres meses en la sección de modelos legacy

La versión GPT-5.4 Pro estará disponible para planes Pro y Enterprise.

En la API, el modelo se ofrece bajo los identificadores gpt-5.4 y gpt-5.4-pro.

El precio por millón de tokens es el siguiente:

gpt-5.4:

entrada: $2,50 (≈2,30 €)

entrada cacheada: $0,25 (≈0,23 €)

salida: $15 (≈13,80 €)

gpt-5.4-pro:

entrada: $30 (≈27,60 €)

salida: $180 (≈165,60 €)

Aunque el coste por token es superior al de GPT-5.2, OpenAI afirma que la mayor eficiencia del modelo reduce el número total de tokens necesarios para muchas tareas.

Un paso más hacia agentes de IA plenamente autónomos

Con GPT-5.4, OpenAI da un paso importante hacia sistemas capaces de planificar, ejecutar y verificar tareas complejas de forma autónoma.

La combinación de razonamiento avanzado, uso de herramientas, interacción con ordenadores y contexto ampliado apunta hacia una nueva generación de agentes de IA capaces de automatizar flujos de trabajo completos.

Para desarrolladores y empresas, esto abre la puerta a aplicaciones cada vez más potentes en automatización, desarrollo de software, análisis de datos y productividad empresarial.

Si las capacidades demostradas en benchmarks se trasladan al uso real, GPT-5.4 podría marcar un nuevo punto de inflexión en la evolución de la inteligencia artificial aplicada al trabajo profesional.