
[14/03/2025] OpenAI ha lanzado un conjunto de herramientas diseñadas para facilitar el desarrollo de agentes autónomos que pueden completar tareas de manera independiente. Según lo señalado en una entrada de blog, estas nuevas capacidades buscan abordar los desafíos que enfrentan los desarrolladores al convertir modelos avanzados en agentes listos para producción, eliminando la necesidad de iteraciones extensas y lógica de orquestación personalizada.
Para ello, se han introducido:
- API de Respuestas: Combina la facilidad de uso de Chat Completions con las herramientas de Assistants API.
- Herramientas integradas: Búsqueda web, búsqueda de archivos y uso de computadora.
- SDK de Agentes: Permite la orquestación de flujos de trabajo con agentes individuales o múltiples.
- Herramientas de observabilidad: Proporcionan trazabilidad e inspección de la ejecución de agentes.
Con estas herramientas, OpenAI esperamos simplificar la creación y optimización de aplicaciones basadas en agentes.
Introducción a la API de Respuestas
La API de Respuestas es una nueva base para desarrollar aplicaciones con agentes. Según OpenAI, su objetivo es proporcionar un método flexible para la integración de modelos de OpenAI con herramientas predefinidas. Con una sola llamada a la API, los desarrolladores pueden ejecutar tareas complejas combinando varias herramientas y llamadas al modelo.
Inicialmente, esta API incluirá herramientas como búsqueda web, búsqueda de archivos y uso de computadora, lo que permite conectar los modelos con información en tiempo real. La API de Respuestas está diseñada para simplificar la integración y eliminar la necesidad de múltiples API o proveedores externos.
Herramientas integradas en la API de Respuestas
- Búsqueda Web: La herramienta de búsqueda web ofrece respuestas actualizadas y con referencias. Durante las pruebas iniciales, ha sido utilizada en asistentes de compra, agentes de investigación y plataformas de reservas de viajes.
- Búsqueda de Archivos: La herramienta de búsqueda de archivos permite encontrar información en documentos de gran tamaño mediante optimización de consultas, filtrado de metadatos y reordenamiento personalizado.
- Uso de Computadora: Para automatizar tareas en computadoras, la API de Respuestas incluye una herramienta basada en el modelo Computer-Using Agent (CUA). Este modelo captura acciones del ratón y teclado generadas por IA, lo que permite la ejecución de comandos automatizados.
SDK de Agentes
El nuevo SDK de Agentes facilita la orquestación de múltiples agentes dentro de un flujo de trabajo. Sus principales características incluyen:
- Agentes: LLMs fácilmente configurables con instrucciones claras y herramientas integradas.
- Handsoff: Transferencia inteligente del control entre agentes.
- Medidas de seguridad: Revisiones de seguridad configurables para la validación de los inputs y outputs.
- Trazabilidad y Observabilidad: Visualización de las trazas de ejecución de los agentes para depuración y optimización del desempeño.
El futuro de los agentes de IA
OpenAI prevé que los agentes de IA serán fundamentales para el trabajo del futuro, mejorando la productividad en múltiples industrias. Con el lanzamiento de estas herramientas, la empresa busca proporcionar los componentes esenciales para que los desarrolladores puedan crear agentes autónomos con impacto real en el mundo empresarial. Se espera que en el futuro haya integraciones más profundas y nuevas funcionalidades para mejorar el despliegue y evaluación de agentes en producción.
Franca Cavassa, CTOPerú