Andrey Carpaty entrenó a los agentes de IA para realizar cientos de experimentos durante la noche, cuando las personas descansan
Andrej Karpathy abre un nuevo enfoque para la investigación autónoma
El ex director de proyectos de IA de Tesla y cofundador de OpenAI, Andrej Karpathy, anunció el lanzamiento de un proyecto simple pero potente de código abierto. El script consta de solo 630 líneas y está alojado en GitHub. No pretende ser una modelo lista o un gran producto corporativo; su objetivo es demostrar cómo los agentes de IA pueden automatizar completamente el método científico sin intervención humana.
> «Nuestro objetivo es construir agentes que avancen infinitamente rápido en la investigación, incluso por la noche», escribió Karpathy en X. El mensaje se volvió viral de inmediato y obtuvo más de 8,6 millones de vistas en dos días.
Cómo funciona el sistema
1. Inicialización
El agente recibe un script de entrenamiento y un presupuesto computacional fijo (usualmente 5 minutos en GPU).
2. Autoanálisis del código
Lee su propio código fuente, formula una hipótesis de mejora (por ejemplo, cambiar la tasa de aprendizaje o la profundidad del modelo).
3. Modificación y ejecución del experimento
Realiza cambios, ejecuta el experimento y evalúa los resultados.
4. Verificación de eficacia
Si la métrica *val_bpb* (pérdida por byte en validación) mejora, se guarda el cambio; de lo contrario, se revierte y se genera una nueva hipótesis.
En una sola noche, el agente realizó 126 experimentos, reduciendo las pérdidas de 0,9979 a 0,9697. Tras dos días de ajustes, procesó alrededor de 700 cambios autónomos, descubriendo ~20 mejoras adicionales que trasladó con éxito a modelos más grandes.
Karpathy señaló: «Ver cómo el agente gestiona completamente el proceso desde el principio hasta el final es increíble. Encontró errores en la escalabilidad de atención y regularización que había pasado por alto durante 20 años de trabajo».
Qué dicen los expertos
La automatización del método científico se considera un giro fundamental en el desarrollo de la IA. Al convertir el aprendizaje automático en un «proceso evolutivo» a velocidad de silicio, Karpathy abrió nuevos horizontes para investigaciones no solo en TI, sino también en marketing, salud y otras áreas.
Ejemplos de aplicación práctica
| Socio | Descripción del experimento | Resultados |
|-------|-----------------------------|------------|
| Hyperspace AI (Varun Mathur) | 35 agentes autónomos trabajaron en una red peer‑to‑peer, usando CPUs portátiles. | Durante la noche realizaron 333 experimentos sin operador, descubriendo estrategias de inicialización (Kaiming, Xavier) y normalización (RMSNorm). |
| Single Grain (Eric Siu) | Automatización del ciclo de marketing: el agente cambia variables en páginas objetivo, creatividades publicitarias o correos electrónicos. | Mide el «porcentaje de respuestas positivas», guarda cambios exitosos y elimina los ineficaces. |
Conclusión
Karpathy demostró cómo scripts simples pueden convertirse en poderosas herramientas para la auto‑aprendizaje de agentes de IA. El ciclo automatizado de optimización permite realizar cientos de experimentos por noche, identificando mejoras que antes requerían años de investigación. Esto abre el camino a un desarrollo más rápido y escalable de modelos en una amplia variedad de campos.
Comentarios (0)
Comparte tu opinión — por favor, sé amable y mantente en el tema.
Inicia sesión para comentar