Google lanzó Gemini 3 Deep Think, un avanzado servicio de IA para tareas científicas que continúa “ajustando” las respuestas según las consultas.
Google presentó una versión actualizada de Gemini 3 Deep Think
La compañía Google anunció una gran actualización de su plataforma Gemini 3 Deep Think, una inteligencia artificial capaz de razonar y resolver tareas complejas de ingeniería científica.
¿Qué cambió
Parámetro | Nuevo | Cómo se ve | Objetivo
---|---|---|---
Pasar de la teoría pura a la aplicación práctica | Resolver problemas sin restricciones claras, con datos incompletos | Acceso | Integrado en la aplicación Gemini; suscriptores de Google AI Ultra pueden usarlo, y mediante API – ingenieros y empresas (se requiere solicitud) | Socios de desarrollo | Investigadores científicos | Trabajo colaborativo en tareas complejas
Indicadores de rendimiento
Prueba | Resultado | Comentario
---|---|---
Humanity’s Last Exam | 48,4 % | Sin herramientas externas
ARC‑AGI‑284 | 6,5 % | Benchmark para asistentes AI
Codeforces (Elo) | 3455 | Alta puntuación entre soluciones de software
IMO 2025 | Medalla de oro | Equivalente al nivel de participantes de la olimpiada internacional
Química/Física | Mismo resultado | Demostró versatilidad en distintas disciplinas
CMT‑Benchmark (física teórica) | 50,5 % | Buen dominio de conceptos complejos
Agente AI “Aletheia”
En el laboratorio DeepMind de Google crearon el agente Aletheia basado en Gemini 3 Deep Think. Características clave:
1. Verificación de hipótesis – el agente identifica debilidades en las soluciones propuestas y las corrige iterativamente.
2. Reconocimiento de incertidumbre – puede indicar que no conoce la respuesta.
3. Interacción con fuentes externas – utiliza el servicio de búsqueda Google y navegación web, pero evita inventar enlaces.
Niveles de logro
Google dividió los éxitos de Aletheia en cinco etapas:
| Etapa | Descripción | Ejemplos |
|---|---|---|
| 0 – “pequeña novedad” | Modo totalmente autónomo, tres problemas de P. Erdős resueltos (primer nivel) | Tres problemas Erdős |
| 1 – “mínima novedad” | Un resultado adicional en modo autónomo | Cuarto problema |
| 2 – “publicable” | Resultados tanto autónomos como colaborativos con humanos, además de herramientas auxiliares | Datos de los problemas 3–4 – “avances significativos/legendarios” |
Cómo Aletheia aborda los problemas de Erdős
* De las 700 problemáticas sin resolver hasta ahora, el agente resolvió 13.
* Sin embargo, solo 4 son realmente nuevas; el resto ya es conocido en la comunidad científica.
* Entre las 212 soluciones presentadas, solo el 6,5 % fueron sustancialmente correctas; el 68,5 % contenían errores fundamentales y el 31,5 % interpretaron incorrectamente la tarea.
Los desarrolladores señalan que la IA tiende a “reinterpretar la pregunta para dar una respuesta más simple” y sigue siendo “altamente propensa a errores en comparación con los humanos”. En consecuencia, todavía no se puede reemplazar a los matemáticos por inteligencia artificial.
En resumen: Gemini 3 Deep Think y su agente Aletheia demuestran resultados impresionantes en diversas áreas de la ciencia, pero mantienen limitaciones significativas en precisión y fiabilidad de las soluciones. Google continúa trabajando para mejorar la capacidad de razonamiento profundo y verificación de sus propias conclusiones.
Comentarios (0)
Comparte tu opinión — por favor, sé amable y mantente en el tema.
Inicia sesión para comentar