
Editor en La Ecuación Digital. Consultor de Innovación y Estrategia…
OpenAI ha anunciado la disponibilidad de Deep Research para los suscriptores de ChatGPT Plus, Team, Edu y Enterprise, ampliando así el acceso a esta funcionalidad diseñada para realizar investigaciones complejas de forma autónoma. Hasta ahora, esta capacidad solo estaba disponible para usuarios Pro.
¿Qué es Deep Research?
Deep Research es una herramienta avanzada de búsqueda, interpretación y síntesis de información basada en inteligencia artificial. Su objetivo es automatizar tareas de investigación extensas, proporcionando análisis detallados a partir de grandes volúmenes de texto, imágenes y archivos PDF disponibles en Internet.
Según OpenAI, esta capacidad permite a los usuarios obtener en minutos resultados que de otro modo requerirían varias horas de trabajo humano. Deep Research busca información en la web, analiza múltiples fuentes y ajusta su enfoque en función de los datos recopilados.
Entre sus mejoras recientes, OpenAI destaca:
- Incorporación de imágenes con citas en los resultados.
- Mejor comprensión y referencia de archivos cargados por los usuarios.
- Mayor capacidad para estructurar informes documentados.
Acceso y disponibilidad
A partir de ahora, los usuarios de ChatGPT Plus, Team, Edu y Enterprise dispondrán de 10 consultas mensuales con Deep Research. Los usuarios de la versión Pro, en cambio, contarán con un límite más alto, de 120 consultas mensuales.
Para utilizar Deep Research en ChatGPT, los usuarios deben seleccionar esta opción en el compositor de mensajes e introducir su consulta. Es posible adjuntar archivos o documentos para proporcionar contexto adicional. Una vez en ejecución, el sistema genera un informe detallado con referencias a las fuentes utilizadas.
Un modelo optimizado para análisis web y razonamiento
Deep Research está basado en una versión optimizada del modelo OpenAI o3, especializada en navegación web y análisis de datos. A diferencia de modelos anteriores, esta versión ha sido entrenada para:
- Planificar y ejecutar múltiples pasos de búsqueda.
- Interpretar y sintetizar información de diversas fuentes.
- Corregir y ajustar su enfoque en función de los datos recopilados.
Según OpenAI, la herramienta está diseñada para profesionales que requieren investigación detallada y fiable, como analistas de finanzas, ingenieros, científicos y expertos en políticas públicas. Además, también podría aplicarse a consumidores que buscan recomendaciones detalladas sobre productos que requieren comparaciones minuciosas, como automóviles o electrodomésticos.
Rendimiento en evaluaciones públicas
Deep Research ha sido sometido a pruebas en diferentes evaluaciones de inteligencia artificial para medir su capacidad de razonamiento y búsqueda en entornos reales.
Humanity’s Last Exam
En la evaluación Humanity’s Last Exam, que mide el desempeño de la IA en preguntas avanzadas de más de 100 disciplinas (desde matemáticas hasta ciencias sociales), Deep Research alcanzó una precisión del 26,6%, superando a otros modelos recientes:
Resultados de Deep Research en Humanity’s Last Exam
Modelo | Precisión (%) |
---|---|
GPT-4o | 3.3 |
Grok-2 | 3.8 |
Claude 3.5 Sonnet | 4.3 |
Gemini Thinking | 6.2 |
OpenAI o1 | 9.1 |
DeepSeek-R1 | 9.4 |
OpenAI o3-mini (medium) | 10.5 |
OpenAI o3-mini (high) | 13.0 |
OpenAI Deep Research | 26.6 |
Los mayores avances se registraron en química, humanidades, ciencias sociales y matemáticas, áreas en las que la herramienta mostró una capacidad notable para buscar información especializada.
GAIA Benchmark
En el GAIA Benchmark, una evaluación de IA enfocada en problemas del mundo real, Deep Research logró una nueva marca de referencia, liderando la clasificación en diferentes niveles de dificultad:
Resultados de Deep Research en GAIA Benchmark
Nivel | Anterior SOTA (%) | Deep Research (pass@1) (%) | Deep Research (cons@64) (%) |
---|---|---|---|
1 | 67.92 | 74.29 | 78.66 |
2 | 67.44 | 69.06 | 73.21 |
3 | 42.31 | 47.6 | 58.03 |
Promedio | 63.64 | 67.36 | 72.57 |
Estos resultados refuerzan la capacidad de Deep Research para abordar tareas que requieren razonamiento avanzado y recopilación de datos de múltiples fuentes.
Limitaciones y posibles mejoras
Aunque Deep Research representa un avance significativo en la automatización de investigaciones complejas, OpenAI reconoce que la herramienta todavía presenta ciertas limitaciones:
- Puede generar información incorrecta o hacer inferencias erróneas, aunque en menor medida que otros modelos anteriores.
- Dificultad para distinguir fuentes confiables de rumores o información poco verificada.
- Falta de calibración en la confianza de sus respuestas, lo que puede llevar a errores en la expresión de la certeza de sus hallazgos.
- Errores menores en el formato de informes y citas.
- Tiempo de ejecución variable, ya que algunas tareas pueden tardar entre 5 y 30 minutos en completarse.
OpenAI asegura que estos problemas mejorarán con el tiempo a medida que el modelo reciba más retroalimentación y refinamientos.
¿Cómo se compara con GPT-4o?
Si bien GPT-4o está diseñado para conversaciones en tiempo real y generación de contenido multimodal, Deep Research se enfoca en consultas que requieren un análisis exhaustivo y documentación detallada. La principal diferencia radica en que Deep Research:
- Realiza búsquedas extensivas en la web y referencia fuentes específicas.
- Sistematiza información en informes documentados.
- Tarda más tiempo en procesar consultas, ya que ejecuta múltiples pasos de búsqueda y validación.
Por lo tanto, mientras GPT-4o es útil para respuestas inmediatas y generales, Deep Research es la opción más adecuada para análisis en profundidad y tareas de investigación técnica.