Google anunció Gemini 3.1 Flash-Lite como el “representante más rápido y eficiente energéticamente de su línea”.
Google presenta Gemini 3.1 Flash‑Lite: un modelo de IA económico y rápido
La compañía Google anunció el lanzamiento de la nueva versión del modelo Gemini 3.1 Flash‑Lite, que se posiciona como el más accesible en la línea Gemini en términos de costo y rendimiento.
* Optimización para grandes datos – el algoritmo está especialmente configurado para procesar eficientemente volúmenes extensos de información.
* Costo de uso – 0,25 $ por millón de tokens de entrada y 1,50 $ por millón de tokens de salida.
La versión preliminar ya está disponible:
- para desarrolladores a través del Gemini API en Google AI Studio;
- para clientes corporativos – en Vertex AI.
Velocidad y calidad
IndicadorGemini 3.1 Flash‑LiteGemini 2.5 FlashTiempo hasta el primer token2,5‑veces más rápido—Velocidad de respuesta 45 % mayor—Calidad de respuesta similar/mayor—
La baja latencia hace que el modelo sea especialmente atractivo para aplicaciones en tiempo real: desde chatbots hasta interfaces interactivas donde la reacción debe ser instantánea.
Resultados de las pruebas
* Clasificación ELO en Arena.ai – 1432 puntos.
* GPQA Diamond – 86,9 %.
* MMMU Pro – 76,8 %.
En estas evaluaciones, Gemini 3.1 Flash‑Lite superó a modelos del mismo nivel e incluso a algunos predecesores más grandes (por ejemplo, Gemini 2.5 Flash) en razonamiento y procesamiento multimodal.
Flexibilidad y escalabilidad
Los desarrolladores pueden ajustar la profundidad de pensamiento del modelo según sus necesidades – un factor importante para cargas de trabajo de alta frecuencia.
El algoritmo está optimizado para:
- traducción de grandes volúmenes de texto;
- moderación de contenido, donde el precio es primordial.
También es adecuado para generar interfaces de usuario (UI), paneles de control, modelado y para realizar investigaciones basadas en consultas complejas.
En resumen: Gemini 3.1 Flash‑Lite combina economía, velocidad y calidad fiable, lo que lo convierte en una herramienta valiosa tanto para desarrolladores individuales como para clientes corporativos que buscan soluciones de IA con baja latencia y alto rendimiento.
Comentarios (0)
Comparte tu opinión — por favor, sé amable y mantente en el tema.
Inicia sesión para comentar