Enterprise-команды по AI стоят перед дилеммой: лучшие модели сегодня могут оказаться не лучшими через год. MassMutual решила эту проблему радикально - перестала делать долгосрочные ставки на одного вендора и построила инфраструктуру, которая позволяет менять модели по мере изменения рынка. Итог: +30% продуктивности разработчиков и контакт-центр, который обрабатывает запросы в 10 раз быстрее. Это и есть ии для бизнеса в действии.

12-месячные контракты и никакого lock-in

CIO MassMutual Sears Merritt объясняет логику просто: «Мир AI сегодня чрезвычайно динамичен. Мы хотели быть готовыми оседлать эту волну». Компания работает с ведущими вендорами, но ограничивает отношения по времени. «Наши контракты capped, чтобы мы сохраняли возможность выбора лучших инструментов по мере того, как рынок созревает и стабилизируется».

Этот подход распространяется и на open-source. Merritt говорит, что его команда на 100% смотрит в сторону open-source инструментов и видит в них большую роль для будущего AI в MassMutual.

Цифры MassMutual

+30% продуктивности разработчиков. 10 минут → 1 минута - время обработки запроса в контакт-центре. Секрет: 12-месячные контракты с AI-вендорами + мультимодельная архитектура + фокус на качестве, а не на скорости.

Измерять результат, а не внедрение

MassMutual разделяет AI-усилия на две категории. Первая - enablement: дать сотрудникам инструменты вроде Copilot и виртуальных ассистентов. Вторая - «углубление и фокус»: команды выбирают конкретный бизнес-процесс, который сильно повлияет на консультантов, страховщиков или сотрудников.

Вместо метрик принятия технологии проекты начинаются с заранее определённых критериев успеха. «Всё, что мы делаем, измеряется. У каждого проекта есть метрика успеха, которую мы определяем заранее, чтобы понять, масштабировать ли его» - говорит Merritt.

Компания собирает детальную аналитику по паттернам использования, рабочим процессам разработчиков, производительности моделей и затратам. Цель - снижать расходы и одновременно строить операционный интеллект, чтобы в будущем автоматически направлять задачи к нужной модели на основе стоимости, качества ответа и пользовательского опыта.

Когда дорогая модель побеждает дешёвую

Самый интересный момент в стратегии MassMutual - как они оценивают качество AI. Вместо бенчмарков и стоимости токенов компания использует фреймворк «trust score»: комбинация пользовательской обратной связи и операционных метрик.

Во время перестройки контакт-центра сотрудникам дали доступ к двум разным LLM. Одна генерировала ответы почти мгновенно, но качество было ниже. Другая - дороже и на несколько секунд дольше, но стабильно выдавала лучшие ответы. Результат: пользователи overwhelmingly выбрали качество.

«Мы спросили пользователей: качество ответа, предпочитаемую модель, общее впечатление. В большинстве случаев они сказали: "Мы хотим ту, что подороже. Мы готовы подождать, разница в качестве настолько велика, что эти две дополнительные секунды того стоят"» - Sears Merritt, CIO MassMutual

Этот опыт определил, какую модель MassMutual в итоге запустила в продакшн. Merritt: «Мы учли опыт пользователей в принятии решения, и это привело нас к тому, что затраты оказались несущественными на относительной основе, поэтому мы используем более сложную модель».

Что это значит для бизнеса

История MassMutual показывает: правильная AI-стратегия - это не выбор «лучшей модели», а построение архитектуры, которая позволяет менять модели без остановки бизнеса. Для Владивостока и Дальнего Востока этот подход особенно актуален: компании не обязаны выбирать одного вендора и привязываться к нему на годы.

Вот три урока для бизнеса:

  • Короткие контракты с AI-вендорами - сохраняете возможность переключиться, когда появится что-то лучшее. В AI рынок меняется каждые 3-6 месяцев.
  • Мультимодельная архитектура - разные задачи могут решаться разными моделями. Не нужно заставлять одну модель делать всё.
  • Пользовательский опыт важнее бенчмарков - ваши сотрудники скажут вам, какая модель лучше для их задач. Спросите их.

Внедрение искусственного интеллекта в бизнес - это не про то, у кого самая мощная модель. Это про то, как построить систему, которая приносит измеримый результат: +30% продуктивности, контакт-центр в 10 раз быстрее, затраты на обработку - копейки вместо долларов. В наших кейсах во Владивостоке мы видим те же закономерности: компании, которые строят AI-инфраструктуру гибко и с фокусом на пользователя, получают больше, чем те, кто ставит на одну «самую лучшую» модель.