GLM-5.2 от Z.ai: open-weights модель обходит GPT-5.5 по кодингу за 1/6 стоимости

Китайский AI-стартап Z.ai (бывший Zhipu AI) сегодня объявил о выпуске GLM-5.2 - модели с 753 миллиардами параметров, которая инженерно заточена на «длинные горизонты» автономного кодинга. Модель доступна под MIT-лицензией, с контекстным окном в 1 миллион токенов и enterprise-подпиской от 12,60 долларов в месяц. Open source ии, open weights модели, новости нейросетей - это снова главная тема дня.

Веса GLM-5.2 уже доступны на Hugging Face, через API Z.ai и более чем в 20 сторонних средах разработки. Для бизнеса, чувствительного к затратам и безопасности, это, пожалуй, главный релиз месяца.

Z.ai выпустила GLM-5.2 под unrestricted MIT-лицензией. Это значит: скачивай, кастомизируй, дообучай, запускай локально или на своих серверах. Платишь только за железо и электричество.

Почему это важно прямо сейчас

Американские проприетарные модели столкнулись с неопределённым регуляторным будущим. На прошлой неделе администрация Трампа запретила иностранным гражданам использовать Anthropic Claude Fable 5, и Anthropic отключила модель для всех. GLM-5.2 даёт enterprise-клиентам возможность разместить frontier-level AI на своей инфраструктуре, обойдя географические ограничения.

IndexShare: архитектура, экономящая 2,9× FLOPs

Под капотом GLM-5.2 - архитектурная инновация под названием IndexShare. В стандартных больших языковых моделях пересчёт механизмов внимания на длинных документах вычислительно дорог. IndexShare решает это переиспользованием одного и того же индексатора на каждые четыре слоя разреженного внимания.

На максимальной длине контекста в 1 млн токенов это снижает вычислительные FLOPs на токен в 2,9 раза. Модель также оснащена улучшенным Multi-Token Prediction (MTP) для спекулятивного декодирования, увеличивающим длину принятых токенов на 20%.

Отдельно: Z.ai реализовала выбираемые «режимы мышления» - пользователь может переключать усилия рассуждения между «Max» (максимальная точность, ~85k выходных токенов на задачу) и «High» (баланс производительности и задержки, вдвое меньше токенов).

Бенчмарки: где GLM-5.2 побеждает

На стандартных тестах GLM-5.2 работает выше большинства open-source флагманов, включая DeepSeek V4, и вплотную приближается к закрытым конкурентам:

SWE-bench Pro: 62,1 - выше GPT-5.5 (58,6) и GLM-5.1 (58,4)
FrontierSWE (Dominance): 74,4% - выше GPT-5.5 (72,6%), почти вровень с Claude Opus 4.8 (75,1%)
MCP-Atlas (инструменты): 77,0 - выше GPT-5.5 (75,3), чуть ниже Claude Opus 4.8 (77,8)
Humanity's Last Exam (с инструментами): 54,7 - выше GPT-5.5 (52,2)
PostTrainBench: 34,3% против 25,0% у GPT-5.5
Design Arena: первое место с ELO 1360, обойдя даже Claude Fable 5

GLM-5.2 немного отстаёт от Claude Opus 4.8 и GPT-5.5 на Terminal-Bench 2.1 (81,0 против 85,0 и 84,0), но значительно обходит Gemini 3.1 Pro (74,0).

Enterprise-подписки: от 12,60 до 112 долларов в месяц

Z.ai запустила GLM Coding Plan, нацеленный на разработчиков, а не чат-интерфейсы. Три тарифа при ежегодной оплате:

Lite: 12,60 долларов/мес - лёгкие задачи на небольших репозиториях
Pro: 50,40 долларов/мес - повседневная разработка, в 5× больше лимита
Max: 112 долларов/мес - тяжёлые нагрузки, 20× лимит, выделенные ресурсы

API-доступ: 1,40 долларов за миллион входных токенов, 4,40 долларов за миллион выходных. Для сравнения: Claude Opus 4.8 стоит 5,00 / 25,00 долларов, GPT-5.5 - 5,00 / 30,00 долларов. GLM-5.2 примерно в 6 раз дешевле GPT-5.5.

«Frontier labs absolutely are scamming you on API pricing, - написал AI-обозреватель Lisan al Gaib (@scaling01). - Открытые модели работают прибыльно без новейших чипов Blackwell. Проприетарные лаборатории работают с маржой под 90%»

MIT-лицензия как козырь для enterprise

Z.ai выпустила GLM-5.2 под MIT - это «Pure Open» система. Никаких региональных ограничений, никаких политик «приемлемого использования». Документация прямо говорит: «технический доступ без границ».

Для enterprise это означает: можно установить модель на своей инфраструктуре, дообучить под свои данные, встроить в продукты и коммерциализировать без отчислений. Полное устранение vendor lock-in.

Сообщество отреагировало мгновенно. Kilo Code подтвердил интеграцию в день релиза. Cline IDE назвал GLM-5.2 «первой open-weights моделью, пересекшей 80% на Terminal-Bench». Eigent AI протестировал на сложных задачах - исследование 30 компаний в 6 секторах с построением JSON и HTML-отчёта - и подтвердил, что модель справляется.

Что это значит для бизнеса

GLM-5.2 - не просто очередная модель. Это симптом системных изменений на рынке AI. Пока американские лаборатории поднимают цены до 30 долларов за миллион выходных токенов и сталкиваются с регуляторными ограничениями, китайские open-source разработчики предлагают сопоставимое качество за 4-6 долларов.

Для компаний во Владивостоке и на Дальнем Востоке, которые рассматривают внедрение искусственного интеллекта в бизнес, это означает: появляется реалистичная альтернатива проприетарным моделям. Вы можете развернуть frontier-level модель локально, без ежемесячных счетов за API, без риска, что модель отключат по политическим причинам. Если вы собираетесь строить серьёзную AI-инфраструктуру, GLM-5.2 - причина пересмотреть смету.