La IA mostró una baja eficacia en las apuestas deportivas, perdiendo todo el dinero en partidos de la Premier League inglesa.
Breve sobre el resultado del experimento
La startup *General Reasoning* realizó una prueba llamada KellyBench, en la que evaluaron ocho sistemas de IA líderes (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 y otros) sobre su capacidad para hacer apuestas durante la temporada de la Premier League inglesa 2023–2024.
A cada agente se le proporcionó una descripción estadística completa de todos los equipos y partidos anteriores, pero el acceso a Internet estaba prohibido: las modelos solo podían usar los datos que recibieron previamente.
Cómo se llevó a cabo la prueba
1. Tres intentos: cada sistema podía hacer tres series de apuestas durante la temporada.
2. Apuestas: sobre resultados de juegos (victoria/empate/perdida) y número de goles.
3. Objetivo: maximizar las ganancias gestionando los riesgos.
Quién ganó y quién perdió
| Sistema de IA | Resultado medio | Nota |
|---|---|---|
| Anthropic Claude Opus 4.6 | 11 % (aproximadamente sin pérdidas en un intento) | El participante más “justo”, pero aun así perdió dinero |
| Google Gemini 3.1 Pro | +34 % en el primer intento, luego quebró | Primero ganaba, después perdía |
| xAI Grok 4.20 | Quiebra inmediata, no completó los dos intentos siguientes | El más débil de todos |
Al final cada modelo perdió dinero durante la temporada, y varios incluso “fracasaron” por completo. Esto confirma las conclusiones de los investigadores: incluso las IA más avanzadas tienen dificultades con la previsión a largo plazo en el mundo real.
Qué significa esto para el futuro de la IA
- Las preocupaciones sobre reemplazar al ser humano todavía parecen exageradas.
- Los benchmarks actuales suelen usar condiciones “estáticas” que no reflejan el caos y la complejidad de la vida real.
- Aunque la IA ya resuelve con éxito tareas como escribir código, en la mayoría de otras áreas de actividad humana sigue siendo limitada.
Así, el experimento KellyBench demuestra que la IA aún no está preparada para competir con los humanos en tareas dinámicas e impredecibles, como las predicciones deportivas.
Comentarios (0)
Comparte tu opinión — por favor, sé amable y mantente en el tema.
Inicia sesión para comentar