На Build 2026 Microsoft показала Surface RTX Spark Dev Box - маленький настольный ПК, который может запускать AI-модели до 120 миллиардов параметров прямо на столе разработчика. Без отправки данных в облако, без поминутной оплаты GPU, без токенов-счётчиков. Просто купил железо - и считай.

Это прямой вызов модели per-token pricing, на которой держится вся индустрия AI с момента запуска ChatGPT. Microsoft, которая сама зарабатывает десятки миллиардов на Azure, вдруг продаёт железо, которое сокращает зависимость от облака.

Что внутри

Сердце Dev Box - Nvidia RTX Spark: система-на-чипе, объединяющая ARM-процессор с Blackwell-графикой в одном кристалле. В обычном ПК потребовалось бы четыре компонента: CPU, дискретная GPU, видеопамять и оперативная память. RTX Spark делает всё это одним чипом с единым пулом памяти в 128 гигабайт.

Это принципиально. Игровые ноутбуки с топовыми GPU Nvidia дают максимум 24 гигабайта доступной видеопамяти. Здесь - 128, причём разделяемых между CPU и GPU через архитектуру Unified Memory Access. Этого хватает, чтобы загрузить модель вроде Llama 3 120B или Qwen3.7-Plus целиком.

🔑 Почему это важно

При контексте в 100 тысяч токенов один лишь кэш key-value может съесть 40-50 гигабайт памяти. Обычные десктопы с этим не справляются - нужны облачные GPU-инстансы с дорогой HBM-памятью. Surface RTX Spark решает эту задачу физически: вся память в одном пуле, доступном и CPU и GPU.

Кому это нужно

Разработчикам, которые гоняют одну и ту же модель десятки раз в день на прототипировании или тонкой настройке. Сейчас каждый такой прогон - деньги в Azure/AWS. С Dev Box - фиксированная стоимость железа и нулевая стоимость каждого следующего эксперимента.

Microsoft формулирует это как «неограниченный интеллект»: маленькие модели (Aion 1.0) на самом устройстве для бытовых задач; RTX Spark - для основной работы; облако - только для по-настоящему фронтирных задач. GitHub Copilot CLI уже получит /fleet - функцию, которая определяет сложность задачи и отправляет простые подзадачи на локальную модель, а сложные - в облако.

Термодизайн и готовность к работе

Корпус напечатан на 3D-принтере из алюминия - со сложной внутренней геометрией для отвода тепла. Устройство работает в режиме около 100 ватт - тихо, достаточно для открытого офиса. Но главное - «распакуй и работай»: Windows 11 Pro уже настроена для разработчика (тёмная тема, WSL2 с GPU-passthrough, CUDA, VS Code, Copilot, Python, Node.js).

По сути Microsoft убрала часы настройки, которые стоят между распаковкой коробки и первой строкой кода.

Что это значит для бизнеса

Если Microsoft права и Dev Box действительно позволяет запускать модели в 70-120 млрд параметров локально - это меняет экономику AI-разработки. Каждый доллар, который разработчик не тратит на облачный инференс, - это доллар, который можно потратить на ещё один эксперимент. Для компаний, которые всерьёз занимаются внедрением искусственного интеллекта и автоматизацией бизнес-процессов, возможность запускать AI на собственном оборудовании - не просто экономия, а вопрос суверенности данных.

«Резервируйте фронтирные модели для действительно фронтирных задач. Остальное делайте на своём железе с предсказуемой стоимостью.»

- Andrew Hill, вице-президент Surface, Microsoft

Цена пока не объявлена. Продажи - в США с конца года. Но сам сигнал сильнее цифр: трёхлетняя эра «AI = облачная подписка» заканчивается. AI переезжает на рабочий стол.