Cohere выпустила North Mini Code — открытую модель для agentic coding под лицензией Apache 2.0. Она работает на одном H100 и стоит в десятки раз дешевле Claude Fable 5. В тот же день, когда Anthropic представила свои самые мощные модели, Cohere сделала заявление противоположного толка: «маленький, открытый, прозрачный и суверенный — вот куда должны идти LLM». Open source ии новости этой недели показывают: рынок AI-моделей раскалывается на два лагеря.

North Mini Code — это модель смешанных экспертов (MoE) на 30 млрд параметров, из которых активны только 3 млрд на каждый токен. Контекстное окно — 256 тысяч токенов, максимальная генерация — 64 тысячи токенов. Создана специально для agentic software engineering: оркестрация суб-агентов, архитектурное картирование, код-ревью и работа в терминале.

Ключевой факт

Apache 2.0, один H100, 20 ГБ RAM на Mac Studio. North Mini Code можно запустить где угодно - от сервера до локального ноутбука. Сравните с 50 долларов за миллион токенов на Claude Fable 5. Для небольших команд и компаний во Владивостоке разница в стоимости измеряется порядками.

Что умеет North Mini Code

Модель специально обучали для трёх сценариев: агентная разработка с оркестрацией суб-агентов, архитектурный анализ и ревью больших кодовых баз (256K контекста), и терминальные задачи — shell-взаимодействия, пакетные скрипты, командная строка. Для терминальных сценариев Cohere использует бенчмарк Terminal-Bench v2, а не синтетические задачи генерации кода.

Архитектура: 128 экспертов, 8 активных на токен. При инференсе вычислительные затраты соответствуют модели на 3 млрд параметров, несмотря на 30 млрд общего размера. Сооснователь Cohere Nick Frosst демонстрировал работу модели на Mac Studio через MLX при ~20 ГБ RAM — том же компьютере, на котором пишет свой код.

Обучение: отличительная особенность

Cohere использовала нетривиальный подход: два этапа supervised fine-tuning + reinforcement learning с верифицируемыми наградами на более чем 70 000 задач из примерно 5 000 репозиториев. И главное — они тренировали модель не на одном агентом каркасе (scaffold), а на трёх одновременно: SWE-Agent (богатый CLI), Mini-SWE-Agent (один bash-тул), OpenCode (индивидуальные тулы с JSON). Мульти-каркасный подход дал прирост 10 процентных пунктов на OpenCode при сохранении производительности на SWE-Agent.

Где её место на рынке

North Mini Code конкурирует с Mistral Devstral Small 2 (24B), GitHub Copilot, Cursor и Claude Fable 5. Cohere утверждает, что их модель в 2.8 раза быстрее по выходному throughput и имеет на 30% меньше задержку между токенами по сравнению с Devstral Small 2 в одинаковых аппаратных конфигурациях. Artificial Analysis ставит её на 8-е место из 127 по скорости (210 токенов/сек) и на 18-е по качеству.

Есть и подвох: North Mini Code генерирует в 3 раза больше выходных токенов, чем сопоставимые модели. В высоконагруженных agentic-пайплайнах многословие превращается в скрытую стоимость инференса и задержек. Это важно: не все бенчмарки показывают реальные операционные расходы.

«Эта модель — противоположность Mythos. Маленькая, экономичная, Apache 2.0, локально развёртываемая. Вот куда должны идти LLM: маленькие, открытые, прозрачные и суверенные. Против больших, дорогих, проприетарных и гегемонных» — Nick Frosst, сооснователь Cohere

Что это значит для бизнеса

Понедельник 9 июня 2026 года войдёт в историю AI как день, когда два противоположных видения столкнулись впрямую. Anthropic продаёт Fable 5 за 60 долларов за миллион токенов. Cohere выкладывает North Mini Code бесплатно под Apache 2.0. И обе модели — лучшие в своём классе.

Для бизнеса это значит только одно: пора перестать гадать и начать считать. Если ваши задачи укладываются в возможности open source модели (а North Mini Code показывает, что они укладываются для большинства сценариев кодинга), то автоматизация с помощью ии не требует контрактов с Anthropic или OpenAI на десятки тысяч долларов. Apache 2.0 — никаких ограничений на коммерческое использование. Никаких проблем с экспортным контролем. Никакой отправки кода на сторонние серверы.

Для компаний из Владивостока и Дальнего Востока это особенно важно. Локальное развёртывание на собственном сервере или даже на мощном рабочем ноутбуке — это не только экономия, но и контроль над данными. Нейросети для бизнеса больше не требуют облачных подписок. Они становятся инфраструктурой, как база данных или веб-сервер.

Мы в AG Branding давно следим за трендом open source моделей и видим, как быстро сокращается разрыв между открытыми и проприетарными решениями. Внедрение искусственного интеллекта в процессы разработки теперь доступно на любом бюджете — от бесплатного локального инференса до enterprise-контрактов. Главное — правильно выбрать инструмент под задачу.