Три события одной недели - и все в одну сторону. NVIDIA представила чип для запуска frontier AI на собственном ПК. Anthropic выпустила официальный CLI-клиент для всей платформы Claude. Perplexity запустила десктопного агента, который живёт на вашем компьютере и управляет им. Два года AI по умолчанию работал в чьём-то дата-центре, и ты арендовал его за токены. На этой неделе чипмейкер, frontier-лаборатория и поисковая компания одновременно перенесли действие обратно на устройства, которыми вы владеете.
Капля 1: NVIDIA сделала чип для AI на вашем ПК
На Computex в Тайбэе 1 июня Дженсен Хуанг представил RTX Spark Superchip - первый серьёзный шаг NVIDIA в потребительский PC-рынок. Один петафлоп, 20 Arm-ядер, GPU на архитектуре Blackwell и 128 ГБ унифицированной памяти. Этот чип запускает AI-модели до 120 миллиардов параметров целиком на вашей машине, с контекстом до миллиона токенов.
NVIDIA целится в рынок CPU на 200 миллиардов долларов, который десятилетиями контролировали Intel, AMD, Apple и Qualcomm. Анонс одного этого чипа обрушил акции конкурентов. Хуанг сказал, что они с Microsoft собираются «переизобрести ПК» - будущее, где миллиарды AI-агентов используют компьютеры как инструменты, а это значит, что миру нужно гораздо больше CPU, чем построено в эпоху GPU-датацентров.
Ключевые цифры
1 петафлоп - производительность RTX Spark Superchip. 128 ГБ - унифицированной памяти. 120 млрд параметров - модели, которые работают локально. 200 млрд долларов - объём CPU-рынка, куда заходит NVIDIA. Чипы выйдут осенью у ASUS, Dell, HP, Lenovo, Microsoft Surface и MSI.
Главное здесь - направление. Запустить модель на 120 миллиардов параметров на ноутбуке, без облачного счёта и без ограничения по токенам - раньше это было невозможно. NVIDIA просто сделала из этого продукт, который можно купить этой осенью. Это меняет экономику для всех, кто устал от токен-метровых тарифов.
Капля 2: Anthropic поместила всю платформу в ваш терминал
2 июня Anthropic выпустила ant - официальный CLI-клиент Claude Developer Platform. Любой API-эндпоинт: Messages API, Claude Managed Agents, сессии, файлы, навыки - теперь вызывается одной строкой в терминале. Написан на Go, опубликован под MIT-лицензией, и за первый же день набрал сотни звёзд на GitHub.
Принцип простой: каждый ресурс API стал подкомандой. Вызвать Messages API, запустить агента в облаке, передать результат в shell-пайп - без редактора, без Python-скрипта, без ручного копирования JSON в curl. И самое важное: Claude Code уже умеет пользоваться ant самостоятельно, через встроенный навык claude-api. Кодинг-агент теперь может управлять всей платформой за вас.
Для разработчиков это коллапс целой категории клеевого кода. Если вы строили агентов, вызывая API в цикле и управляя инструментами вручную - большая часть этой работы исчезает.
Капля 3: Perplexity выпустила десктопный компьютер
На той же неделе Perplexity запустила Perplexity Personal Computer для Windows. Доступно пользователям Max и Enterprise Max, для остальных - лист ожидания. Это превращает Perplexity из облачного поисково-ответного сервиса в агента, который живёт на вашей машине и управляет ей.
Смысл не в списке функций, а в инстинкте. Perplexity построила имя как облачный ответный движок. Запуск десктопного агента - это тот же ход, что и чип NVIDIA, и та же энергия, что толкает разработчиков к локальным инструментам: убрать AI с удалённого сервера и поставить на устройство. Там он быстрее, приватнее и работает напрямую с вашими файлами и приложениями.
Каждая серьёзная AI-компания сейчас гоняется за флагом на вашем реальном компьютере. Следующая фаза битвы идёт на устройстве, а не в браузере.
Кто выигрывает, кто проигрывает
Переход на локальный AI не нейтрален. Он создаёт явных победителей и проигравших, и назвать их - самое полезное, что можно сделать.
Выигрывают. Разработчики и продвинутые пользователи - получают скорость, приватность и побег от токен-метровой аренды. NVIDIA - только что нашла второй рынок на 200 миллиардов долларов сверху своей дата-центровой империи. И open-source агенты вроде Hermes и OpenClaw, которые с первого дня строились как локальные и теперь имеют железо для работы.
Проигрывают. Intel, AMD и Qualcomm - их акции упали в момент анонса NVIDIA. Чистая облачная аренда - выглядит всё хуже с каждым неожиданным токен-счётом. И, пожалуй, ментальная модель «AI - это сайт, куда ты логинишься», которая определяла последние два года. Её заменяет «AI - это штука, которая работает на моей машине».
За кем следить. Облачные гиганты - Amazon, Google, Microsoft - тут и выигрывают, и проигрывают одновременно. Они продают облачный AI, которому локальные вычисления угрожают, но они же строят чипы и облака, от которых локальные решения всё равно зависят. Как они разыграют следующий год - решит, останется ли локальный AI нишей для энтузиастов или станет новым стандартом.
Что это значит для бизнеса
Вот ставка, которую стоило бы сделать. Локальный AI - не мода, но он не заменяет облако. На самом деле происходит то же разделение, что и в каждую предыдущую вычислительную эпоху: тяжёлая, редкая, frontier-работа остаётся в облаке, а постоянная, ежедневная, чувствительная к приватности - уходит на устройство в ваших руках.
К концу 2026 вопрос перестанет быть «облако или локально» и станет «какая нагрузка куда идёт». Разработчики, которые разберутся с маршрутизацией первыми - frontier-модель в облаке для сложных 20%, локальная модель на RTX Spark для постоянных 80% - будут обгонять по стоимости и скорости тех, кто всё ещё арендует каждый токен.
NVIDIA, Anthropic и Perplexity сделали одну и ту же ставку на этой неделе. Они считают, что устройство снова имеет значение. Думаю, они правы - и те, кто перестроит стек первыми, выиграют следующие два года.