GLM-5.2 es el último modelo de lenguaje grande de Z.ai, convirtiéndose en el tercer lanzamiento importante de la línea GLM-5. Le siguen el GLM-5 (11 de febrero), el GLM-5-Turbo (15 de marzo) y el GLM-5.1 (7 de abril). Eso hace cuatro lanzamientos de codificación de nivel emblemático en aproximadamente cuatro meses.
Ventana de contexto de 1 millón de tokens utilizable
La especificación destacada de GLM-5.2 es una ventana contextual de 1.000.000 de tokens. Z.ai etiqueta la variante glm-5.2[1m] en su propia configuración. Cada respuesta puede devolver hasta 131.072 tokens de salida. Eso es aproximadamente un salto de 5 veces desde la ventana de 200.000 tokens de GLM-5.1.
Una ventana de 1 millón de tokens cambia la forma en que funciona un agente de codificación en la práctica. El agente puede contener un repositorio completo de tamaño mediano en la memoria de trabajo. Eso incluye archivos fuente, pruebas, configuración e historial de conversaciones. Evita el resumen constante que obligan las ventanas más pequeñas.
El lanzamiento también agrega dos niveles de esfuerzo de pensamiento: Alto y Máximo. Z.ai recomienda Max esfuerzo para trabajos de codificación complejos de varios pasos. En el Código Claude, el /effort El comando controla esta configuración. Las opciones xhigh, max y ultracode se asignan al esfuerzo Max de GLM-5.2.
Arquitectura y lo que cambió
Z.ai no especificó la arquitectura del GLM-5.2 en sus materiales de lanzamiento. Pero según las notas de la comunidad, la base GLM-5 es un modelo de mezcla de expertos de 744 mil millones de parámetros. Activa 40 mil millones de parámetros por token. GLM-5.1 mantuvo la misma columna vertebral con un entrenamiento posterior reorientado.
Zona de juegos explicativa de MTP
Demostración interactiva
Generador de configuración y visualizador de contexto GLM-5.2
Elija su agente y modo de esfuerzo. Copie la configuración exacta. Vea qué le compran 1 millón de tokens.
1. Agente codificador
2. Ventana contextual
3. Esfuerzo de pensamiento
Ventana de contexto: GLM-5.1 vs GLM-5.2
GLM-5.2 de un vistazo
1.000.000tokens de entrada en una ventana contextual
131.072tokens de salida máximos por respuesta
5xmás grande que la ventana del GLM-5.1
8Herramientas agentes compatibles desde el primer día.
La cuestión del punto de referencia
Aquí está la advertencia importante. Z.ai no publicó puntuaciones de referencia para GLM-5.2 en el momento del lanzamiento. Aún no existe un número de SWE-bench, Terminal-Bench o Code Arena. El anuncio se centró en la disponibilidad, el contexto y la hoja de ruta del código abierto.
Comparación de especificaciones: GLM-5.2 vs GLM-5.1
| Atributo | GLM-5.2 | GLM-5.1 |
|---|---|---|
| Liberado | 13 de junio de 2026 | 7 de abril de 2026 |
| ventana contextual | 1.000.000 de fichas (glm-5.2[1m]) |
~200.000 fichas |
| Fichas de salida máxima | 131.072 | No revelado |
| Modos de razonamiento | alto, máximo | Modo único |
| Arquitectura | No especificado en el lanzamiento (linaje GLM-5) | 744B MoE, 40B activos |
| Licencia | MIT (pesos pendientes la próxima semana) | MIT (pesos abiertos liberados) |
| Lanzar puntos de referencia | Ninguno publicado | 58.4 SWE-banco Pro |
| Acceso en el lanzamiento | Plan de codificación GLM (todos los niveles) | Plan de codificación, API y pesos |
Casos de uso con ejemplos
- Refactorizadores de repositorio completo: cargue un repositorio de tamaño mediano en una ventana contextual. El agente rastrea las dependencias entre archivos sin volver a buscarlas. Ejemplo: refactorizar una canalización de datos de Python de 40 archivos en una sola sesión.
- Correciones de agentes a largo plazo: GLM-5.2 apunta a planificar, ejecutar, probar y arreglar bucles sostenidos. GLM-5.1 sostuvo aproximadamente 1.700 pasos de agente en una sesión. Ejecutó bucles autónomos durante hasta ocho horas. GLM-5.2 hereda esa trayectoria, aunque sus propios números están pendientes.
- Reemplazo directo del código Claude: intercambie únicamente la URL base y el identificador de modelo. Mantenga el flujo de trabajo y el aprovechamiento de sus agentes existentes. Esto es importante cuando se interrumpe el acceso a la API fronteriza.
- Análisis de documentos grandes: proporcione especificaciones, registros o transcripciones extensas que superen los 200 000 tokens. La ventana 1M contiene material que los modelos más pequeños truncan.
Cómo configurar GLM-5.2
Para Claude Code, editar ~/.claude/settings.json. Apunte las ranuras Sonnet y Opus hacia la variante 1M. Levante la ventana de autocompactación para que el agente utilice el contexto completo.
{
"env": {
"CLAUDE_CODE_AUTO_COMPACT_WINDOW": "1000000",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"
}
}
Alternativamente, establezca el punto final a través de variables de entorno. El punto final compatible con Anthropic acepta un intercambio de URL base.
export ANTHROPIC_AUTH_TOKEN="your-zai-api-key"
export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="glm-4.5-air"
claude
Entonces corre /effort en una sesión y seleccione max. Correr /status para confirmar que GLM-5.2 está activo. Para Cline, elija el proveedor compatible con OpenAI. Establezca la URL base en https://api.z.ai/api/coding/paas/v4. Ingrese el modelo personalizado glm-5.2 y establezca el contexto en 1.000.000.
GLM-5.2 es compatible con ocho herramientas de codificación agente desde el primer día. La lista incluye Claude Code, Cline, OpenCode y OpenClaw.
Conclusiones clave
- Z.ai envió GLM-5.2 el 13 de junio de 2026, disponible de inmediato en todos los niveles del plan de codificación GLM (Lite, Pro, Max, Team).
- Ventana contextual de 1 millón de tokens (
glm-5.2[1m]) con hasta 131.072 tokens de salida. - No se publicaron puntos de referencia en el lanzamiento
- Llega a Claude Code, Cline y OpenClaw a través de un punto final compatible con Anthropic con solo una URL base y un intercambio de modelo.
Mira el Detalles técnicos. Además, no dudes en seguirnos en Gorjeo y no olvides unirte a nuestro SubReddit de 150k+ML y suscríbete a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.
¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros
Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.









