Anthrope ha lanzado Claude Sonnet 4.5 para garantizar que estuviera trabajando durante 30 horas seguidas para crear una réplica relajada. Durante este tiempo, se generaron 11,000 líneas de código sin supervisión y solo se detuvieron cuando se completó la tarea. En mayo, su modelo Opus 4 logró trabajar durante siete horas. La compañía lo presenta como «el mejor modelo del mundo para los agentes, la programación y el uso de computadoras».
¿Por qué es importante?. Anthrope, Openai y Google están luchando por una lucha por los agentes autónomos y las herramientas de programación. Aquellos que convencen traerán mucho dinero en licencias comerciales.
Scott White, gerente de producto, dice que «a nivel de un jefe de gabinete»: coordina, analiza datos, informa … Dianne Penn dice que lo usa para buscar candidatos en LinkedIn y generar hojas de cálculo.
Si pero. Los desarrolladores cuentan otra historia más matizada. Miguel Ángel Durán, conocido como @MidudeVlo resume: «Claude Sonnet 4.5 Refactor todo mi proyecto en un Inmediato. Piensa en 20 minutos. 14 archivos nuevos. 1.500 líneas modificadas. Arquitectura limpia aplicada. Nada funcionó. Pero qué bien fue. «
Otros desarrolladores Usted informa de inmediato: Miles de líneas con una estructura impecable, pero no ejecutar. Código que aparece profesionalmente, pero colapsa al compilarse.
Entre líneas. Anthrope no ha demostrado el uso de trabajo flojo. Él solo dijo que lo construyó. Tampoco mostró que el código esté en funcionamiento. La diferencia entre la comunicación y la demostración, Subrayado por Ed Zitron.
La compañía reconoce indirectamente el problema: Claude Sonnet 4.5 viene con una infraestructura adicional para los agentes de construcción: gestión virtual, gestión de memoria, gestión del contexto, múltiple -soporte … – Traducción: incluso con el modelo más avanzado, los desarrolladores necesitan herramientas adicionales para que los agentes puedan programar de manera confiable.
Detallado. Penn El explicó a El borde que las mejoras sorprendieron al equipo interno. El modelo está tres veces más calificado que la versión de octubre con computadoras. El equipo pasó el último mes para trabajar Mensaje de retorno por Github y cursor. Lienzo, Campo betaÉl dice que ayuda con «tareas complejas de contexto largo».
El contraste. Existe una gran brecha entre el marketing y la realidad técnica. Anthrope promete una IA que construye 30 horas, software complejo. Los desarrolladores confirman que crea un código muy bien estructurado pero financiero.
Este patrón se repite en toda la industria. Los modelos mejoran la generación de código que aparecer Profesional. No puede generar sistemáticamente un código que realmente funcione sin una intervención humana importante.
Y ahora algo. La pregunta sigue sin respuesta: ¿cuándo se nos entregará desde el cual crea un código funcional hermoso pero diferente que solo genera código funcional?
Anthrope apuesta que su combinación de un modelo poderoso e infraestructura adicional cierra esta brecha. En este momento tenemos que esperar evidencia concreta y no dar sin código verificable.
En | Con Samsung y SK Hynix, Operai firma para una posible demanda de 900,000 obleas por mes. Es una figura absurda
Excelente imagen | Antrópico