Alibaba выпустила Qwen3.7-Plus - новую мультимодальную модель, которая на 60% дешевле предыдущей Qwen3.7-Max и умеет работать с текстом, видео и изображениями. Но есть нюанс: в отличие от всей линейки Qwen, эта модель полностью закрытая - только через API, без открытых весов. Такая себе новость для тех, кто привык скачивать Qwen на свой сервер.

Что умеет и сколько стоит

Qwen3.7-Plus работает с контекстом до 1 миллиона токенов. Из них до 256 тысяч токенов отдаётся под внутреннюю цепочку рассуждений - модель может «думать» над сложной задачей и не забывать, что решила четыре шага назад.

Цена выглядит привлекательно: 0,4 доллара за миллион входных токенов и 1,6 доллара за выходные. Для сравнения, GPT-5.5 стоит 5/30 долларов, а Qwen3.7-Max - 2,5/7,5. При этом Plus понимает видео, картинки и скриншоты - чего Max не умеет вообще.

🔑 Ключевой момент

Preserve_thinking - параметр, который сохраняет внутреннюю цепочку рассуждений модели между шагами. Это решает проблему «state decay», когда AI-агент теряет нить мысли через несколько шагов. Anthropic называет это «Extended Thinking», OpenAI - «reasoning pass-back mechanism». Alibaba просто дала своё название, но суть одна: длинные многошаговые задачи становятся возможными.

Почему это важно для бизнеса

Если вы строите AI-агентов, которые работают с кодом, базами данных и интерфейсами - Qwen3.7-Plus выглядит как бюджетная альтернатива дорогим флагманам. На Terminal Bench 2.0 модель набрала 70,3 балла, обойдя DeepSeek-V4 Pro (67,9) и Gemini 3.1 Pro (63,5). На ScreenSpot Pro (компьютерное зрение для интерфейсов) - 79,0 баллов, что значительно выше GPT-5.4 (67,4) и Claude Opus 4.6 (49,5).

При этом кеширование работает агрессивно: если агент постоянно читает одну базу кода, стоимость повторных чтений падает до 0,04 доллара за миллион токенов - в 10 раз дешевле обычного входа. Для автоматизации бизнес-процессов, где один и тот же скрипт крутится сотни раз в день, это меняет экономику.

«Qwen 3.7 Plus на 40% дешевле Max. Если результат достаточно близок для кодинга и заметно сильнее для визуальных задач - нужен ли вам Max каждый день или только для тяжёлой терминальной работы?»

- @Boxmining, венчурный инвестор

Закрытость - главный недостаток

Раньше стратегия Qwen строилась на open-source. Компании вроде Airbnb спокойно ставили модели себе на серверы. С Qwen3.7-Plus этот номер не пройдёт. Модель доступна только через Alibaba Cloud Model Studio - облачный API с дата-центрами в Сингапуре и других регионах.

Для российского бизнеса это дополнительная головная боль: данные уходят на зарубежные сервера, вопросы с комплаенсом и локализацией данных остаются открытыми. Если ваша компания работает с чувствительной информацией - модель придётся разворачивать через международные эндпоинты, что не всегда разрешено политиками безопасности.

С другой стороны, Alibaba API полностью совместим с OpenAI - достаточно сменить эндпоинт в коде, и модель начинает работать. Это снижает порог входа для тех, кто уже использует GPT.

Что в итоге

Qwen3.7-Plus - это прагматичный выбор для AI-агентов, работающих с визуальными интерфейсами и кодом. Особенно в сценариях, где важна стоимость за токен (0,04 доллара с кешем - это очень дёшево). Но проприетарная модель, завязанная на облако Alibaba, подходит не всем. Если вы ищете нейросети для бизнеса, которые можно развернуть на своём «железе» - лучше смотреть в сторону MiniMax-M3 или DeepSeek. А если хотите разобраться, какая архитектура подходит именно вашему бизнесу - начните с бесплатного AI-аудита.