Google сделала неожиданный ход: выпустила Gemini 3.5 Flash - и эта модель оказалась не просто дешевле флагманской, а в ряде сценариев обошла её по качеству. Особенно там, где нужны код, агентные сценарии и быстрые ответы. Модель уже стала стандартом в Gemini App и Google Поиске по всему миру. Мы разобрались, что изменилось - и при чём тут SpaceX.
Новость пришла с Google I/O 2026, и реакция сообщества была единодушной: «Flash съел флагман». Если коротко: Gemini 3.5 Flash - это новая модель среднего класса, но с характеристиками, которые ставят её вровень (а местами выше) с топовой Gemini 2.0 Ultra.
«Мы сделали ставку на скорость и доступность. Flash показывает, что можно не жертвовать качеством, если правильно настроить архитектуру. Это новый стандарт для нашей экосистемы.»
- представитель Google на Google I/O 2026
Что такое Gemini 3.5 Flash и чем он крут
Gemini 3.5 Flash - это модель, которая работает в 2,5 раза быстрее предыдущей версии и стоит примерно на 60–70% дешевле в API. При этом по бенчмаркам кода (HumanEval, MBPP) она превзошла Gemini 2.0 Ultra на 3–5 процентных пунктов. В агентных задачах - планировании, multi-step reasoning, инструментальных цепочках - разрыв ещё заметнее.
Главный сюрприз: Google сделала Gemini 3.5 Flash бесплатной в базовом доступе через Gemini App. Раньше такие возможности были только у подписчиков Gemini Advanced. Теперь любой пользователь может запустить сложный анализ, генерацию кода или работу с агентами без Premium-подписки.
🔥 Ключевой факт
Gemini 3.5 Flash уже работает в Google Поиске: расшифровка сложных запросов, суммаризация длинных документов и код-генерация прямо в выдаче - всё это теперь на Flash, а не на флагмане. Экономия для Google - миллионы долларов в день на инференсе.
Как это выглядит на практике
Представьте: вы пишете промпт на русском с просьбой написать парсер данных на Python с обработкой ошибок и многопоточностью. Gemini 3.5 Flash выдаёт рабочий код за 3–4 секунды. Флагманская Gemini 2.0 Ultra справляется за 7–8 секунд - и качество кода примерно то же. Разница в скорости почти двукратная.
Для агентских сценариев разрыв ещё больше. Flash быстрее переключается между инструментами, меньше тупит при multi-turn диалогах и точнее держит контекст. Google явно переработала архитектуру внимания - модель меньше «забывает» инструкции на длинных цепочках.
SpaceX подаёт на рекордное IPO - какая связь?
Прямой связи нет, но обе новости вышли в один день и вместе рисуют картину недели. SpaceX Илона Маска подала заявку на IPO, которое, по оценкам аналитиков, может стать крупнейшим в истории - до $60–75 млрд привлечённого капитала. Оценка компании в ходе размещения может превысить $250 млрд.
Для SpaceX это способ привлечь деньги на Starship, Starlink 2.0 и колонизацию Марса без долговых обязательств. Для рынка - проверка: готов ли инвестор платить за космические риски.
«Если SpaceX выйдет на IPO с оценкой $250 млрд, это будет крупнейший tech-выход на биржу со времён Alibaba в 2014-м. Но в отличие от Alibaba, SpaceX - это не платформа, а хардкорный hardware с космическими рисками.»
- аналитик Bloomberg, май 2026
Что это значит для разработчиков и бизнеса
Если вы используете ИИ в продукте - Gemini 3.5 Flash меняет экономику. В 2–3 раза более дешёвый инференс при сопоставимом (или лучшем) качестве кода означает, что ИИ-фичи становятся доступны для стартапов и среднего бизнеса без огромных бюджетов на API.
Google чётко сигналит: флагманские модели больше не обязательно самые лучшие для каждой задачи. Flash - это модель «золотой середины», которая берёт практичностью, а не рекордами на бенчмарках. И это может быть умнее, чем гонка за параметрами.
Вам может быть интересно: обзор Gemini Advanced и тренды ИИ в 2026 году - скоро в наших статьях. Подпишитесь на наш Telegram-канал AG Branding, чтобы не пропускать дайджесты.