Google lanzó Gemini 3 Deep Think, un avanzado servicio de IA para tareas científicas que continúa “ajustando” las respuestas según las consultas.

Google lanzó Gemini 3 Deep Think, un avanzado servicio de IA para tareas científicas que continúa “ajustando” las respuestas según las consultas.

9 software

Google presentó una versión actualizada de Gemini 3 Deep Think

La compañía Google anunció una gran actualización de su plataforma Gemini 3 Deep Think, una inteligencia artificial capaz de razonar y resolver tareas complejas de ingeniería científica.

¿Qué cambió
Parámetro | Nuevo | Cómo se ve | Objetivo
---|---|---|---
Pasar de la teoría pura a la aplicación práctica | Resolver problemas sin restricciones claras, con datos incompletos | Acceso | Integrado en la aplicación Gemini; suscriptores de Google AI Ultra pueden usarlo, y mediante API – ingenieros y empresas (se requiere solicitud) | Socios de desarrollo | Investigadores científicos | Trabajo colaborativo en tareas complejas

Indicadores de rendimiento
Prueba | Resultado | Comentario
---|---|---
Humanity’s Last Exam | 48,4 % | Sin herramientas externas
ARC‑AGI‑284 | 6,5 % | Benchmark para asistentes AI
Codeforces (Elo) | 3455 | Alta puntuación entre soluciones de software
IMO 2025 | Medalla de oro | Equivalente al nivel de participantes de la olimpiada internacional
Química/Física | Mismo resultado | Demostró versatilidad en distintas disciplinas
CMT‑Benchmark (física teórica) | 50,5 % | Buen dominio de conceptos complejos

Agente AI “Aletheia”
En el laboratorio DeepMind de Google crearon el agente Aletheia basado en Gemini 3 Deep Think. Características clave:

1. Verificación de hipótesis – el agente identifica debilidades en las soluciones propuestas y las corrige iterativamente.
2. Reconocimiento de incertidumbre – puede indicar que no conoce la respuesta.
3. Interacción con fuentes externas – utiliza el servicio de búsqueda Google y navegación web, pero evita inventar enlaces.

Niveles de logro
Google dividió los éxitos de Aletheia en cinco etapas:

EtapaDescripciónEjemplos
0 – “pequeña novedad”Modo totalmente autónomo, tres problemas de P. Erdős resueltos (primer nivel)Tres problemas Erdős
1 – “mínima novedad”Un resultado adicional en modo autónomoCuarto problema
2 – “publicable”Resultados tanto autónomos como colaborativos con humanos, además de herramientas auxiliaresDatos de los problemas 3–4 – “avances significativos/legendarios”

Cómo Aletheia aborda los problemas de Erdős
* De las 700 problemáticas sin resolver hasta ahora, el agente resolvió 13.
* Sin embargo, solo 4 son realmente nuevas; el resto ya es conocido en la comunidad científica.
* Entre las 212 soluciones presentadas, solo el 6,5 % fueron sustancialmente correctas; el 68,5 % contenían errores fundamentales y el 31,5 % interpretaron incorrectamente la tarea.

Los desarrolladores señalan que la IA tiende a “reinterpretar la pregunta para dar una respuesta más simple” y sigue siendo “altamente propensa a errores en comparación con los humanos”. En consecuencia, todavía no se puede reemplazar a los matemáticos por inteligencia artificial.

En resumen: Gemini 3 Deep Think y su agente Aletheia demuestran resultados impresionantes en diversas áreas de la ciencia, pero mantienen limitaciones significativas en precisión y fiabilidad de las soluciones. Google continúa trabajando para mejorar la capacidad de razonamiento profundo y verificación de sus propias conclusiones.

Comentarios (0)

Comparte tu opinión — por favor, sé amable y mantente en el tema.

Aún no hay comentarios. Deja un comentario y comparte tu opinión!

Para dejar un comentario, inicia sesión.

Inicia sesión para comentar