Безопасность ИИ-агентов: невидимые риски и зрелый контроль агентного ИИ

Современные AI-агенты в бизнесе перестали быть экспериментом для R&D-команд. Сегодня компании активно внедряют агентный ИИ в разработку, аналитику, поддержку и внутреннюю автоматизацию. Вместе с этим растет и потребность в безопасности искусственного интеллекта, потому что автономные системы получают доступ к корпоративным данным, API и внутренним инструментам.
Главная проблема в том, что классические подходы к ИБ создавались для традиционного софта и предсказуемых сценариев работы пользователей. Но агентный ИИ действует иначе: принимает промежуточные решения, взаимодействует с внешними сервисами, вызывает инструменты и может самостоятельно выполнять действия внутри инфраструктуры компании.

Из-за этого бизнесу приходится переосмысливать сам подход к защите ИИ-агентов и контролю AI-систем.
Рост интереса к внедрению ИИ-агентов и первые сигналы рынка
Российские компании всё активнее внедряют генеративный ИИ и агентные системы. Речь уже не только про чат-ботов: в корпоративной среде появляются AI-ассистенты разработчиков, внутренние сервисы автоматизации, HR- и support-агенты, инструменты аналитики и обработки документов.

На этом фоне растет и внимание к вопросам безопасности ИИ и контроля автономных систем. Причины вполне практические:
  • Пилотные внедрения показывают, что агент способен совершать действия, которые никто не ожидал: получить лишний доступ, обратиться не к тем данным или выполнить ошибочный инструментальный вызов.
  • Появляются первые инциденты, где рекомендации или действия ИИ косвенно приводят к утечкам данных и нарушениям внутренних политик безопасности.
  • Усиливается регулирование ИИ и обработки данных, а значит — растут требования к наблюдаемости и контролю таких систем.
При этом рынок всё ещё находится в переходной стадии. Многие компании уже тестируют внедрение ИИ-агентов, но далеко не все выстроили полноценную стратегию AI Security. На практике внедрение часто опережает процессы контроля.
Почему агентный ИИ меняет модель угроз и подходы к кибербезопасности ИИ
Главное отличие ИИ-агента от обычного чат-бота — способность действовать.
Агент не просто отвечает на вопросы. Он взаимодействует с инструментами, запускает сценарии, вызывает API, работает с кодом и корпоративными системами. Причём делает это динамически: на основе контекста, промежуточных решений и собственных подцелей.

Из-за этого появляются новые классы угроз:
  • Agent Goal Hijack
    скрытые инструкции меняют цель или поведение агента
  • Эксплуатация инструментов и привилегий
    агент использует легальные инструменты для нежелательных действий
  • Атаки через цепочку поставок
    вредоносные плагины, MCP-серверы или зависимости становятся точкой входа
  • Контекстное отравление и межагентные атаки
    вредоносный контент влияет на память, контекст или взаимодействие между агентами
Эти риски уже систематизированы в OWASP Top 10 for Agentic Applications — международном фреймворке по безопасности агентных приложений. И ключевой вывод там простой: традиционных средств защиты недостаточно, если система принимает решения автономно.
Где компании чаще всего недооценивают риск
На практике проблема редко выглядит как «хакер взломал ИИ». Гораздо чаще агент сам становится посредником между инфраструктурой компании и внешним воздействием.

Типовые сценарии выглядят так:
  • агент получает скрытую инструкцию через тикет, документ или репозиторий
  • автоматически отправляет данные во внешний сервис
  • использует лишние привилегии
  • запускает инструмент, который не должен был запускать без подтверждения
  • обращается к чувствительным данным вне своей зоны ответственности
Именно поэтому сегодня основной риск — не сама модель, а отсутствие наблюдаемости за действиями агента.

Для бизнеса это уже вопрос не только технологий, но и защиты данных при использовании ИИ, соответствия требованиям регуляторов и контроля Shadow AI внутри компании.
Мониторинг ИИ-агентов и контроль AI Security: что уже появляется на рынке
Рынок инструментов для мониторинга и контроля агентных ИИ пока только формируется. Если ещё недавно компании ограничивались логированием запросов к LLM, то теперь появляются отдельные решения для наблюдаемости и защиты агентных систем.

Условно можно выделить три направления:
  • Внутренние инструменты компаний
    Многие команды сначала создают собственные механизмы контроля: логирование действий агента, ограничения вызовов инструментов, базовые проверки промптов.

    Проблема в том, что такие решения сложно масштабировать и поддерживать, особенно если агентов становится много.
  • Open source и исследовательские фреймворки
    Появляется всё больше open source-инструментов для AI Security: от red teaming и тестирования агентов до систем оценки рисков и анализа поведения.

    Этот сегмент активно растёт, но требует сильной внутренней экспертизы.
  • Специализированные AI Security-платформы
    Отдельное направление — системы наблюдаемости и мониторинга ИИ-агентов. Их задача — контролировать действия агента в реальном времени:
    • какие данные он получает;
    • какие инструменты вызывает;
    • какие внешние сервисы использует;
    • не выходит ли за пределы допустимого поведения.
    Именно здесь сейчас появляется спрос со стороны корпоративного сегмента, особенно в контексте Shadow AI — когда сотрудники или команды запускают AI-агентов без полноценного контроля со стороны ИБ.
Компании внедряют специализированные системы защиты ИИ-агентов и контроля действий LLM в корпоративной среде. Такие решения помогают увидеть, какие данные агент передает во внешние модели, какие инструменты вызывает и где возникают риски утечки или выхода за пределы разрешенных сценариев.
Почему SIEM, PAM и XDR больше не закрывают проблему полностью
Традиционные системы кибербезопасности ИИ остаются важной частью инфраструктуры, но сами по себе они не проектировались для контроля автономных AI-агентов и защиты агентных систем.

SIEM, PAM, IAM или XDR хорошо работают с понятными сущностями: пользователями, серверами, приложениями, событиями доступа.

Но агентный ИИ действует иначе:
  • самостоятельно принимает промежуточные решения;
  • строит цепочки действий;
  • работает через инструменты и API;
  • меняет свое поведение в зависимости от контекста.
В результате ИБ-команда может видеть отдельные события, но не понимать логику происходящего.

Например: агент легитимно обращается к Git, затем к CRM, затем к внешнему API. Формально всё разрешено. Но в совокупности это может оказаться цепочкой подготовки к утечке данных.

Поэтому всё чаще компании приходят к многослойной модели защиты:
базовая телеметрия наблюдаемость действий агента контроль поведения аналитика аномалий интеграция с корпоративной ИБ-экосистемой
Что реально работает для защиты ИИ-агентов в корпоративной среде
В корпоративной среде постепенно формируется отдельный класс решений для контроля агентных систем. Их задача — не просто собирать логи, а понимать контекст действий ИИ-агента.

Система мониторинга и защиты ИИ-агентов может работать как единый прокси-слой между агентом и внешними LLM-сервисами. В этом случае ИБ-команда получает возможность видеть:
  • какие данные агент отправляет во внешнюю модель
  • какие инструменты вызывает
  • какие действия инициирует
  • какие цепочки операций выглядят аномально
Такой подход позволяет выявлять проблемы ещё до инцидента.

Например, в одном из сценариев мониторинг показал, что агент для исправления багов регулярно запрашивал финансовую документацию, хотя это не требовалось для его задачи. Причиной оказалась слишком широкая формулировка системного промпта.

В другом случае система обнаружила попытку установки npm-пакета с функциями удалённого выполнения команд и остановила действие до подтверждения пользователя.
Именно на такие сценарии сегодня ориентированы решения вроде КиберАгентРевью — систем мониторинга и контроля действий ИИ-агентов в корпоративной среде
Сочетание традиционной ИБ и AI-специфической защиты
На практике эффективная стратегия AI Security не заменяет существующий кибербез, а дополняет его.

Традиционные инструменты по-прежнему критически важны:
  • SIEM и XDR — для корреляции событий и общей картины безопасности
  • IAM — для управления доступами агентов
  • DevSecOps — для контроля зависимостей, MCP-серверов и цепочек поставок
  • DLP — для защиты чувствительных данных
Но поверх этого появляется новый слой: контроль поведения автономных систем и наблюдаемость их действий в реальном времени.

Именно этот слой сегодня становится ключевым отличием между «у нас есть AI-агенты» и «у нас AI-агенты действительно под контролем».
Специалисты и новые компетенции
Безопасность агентного ИИ уже выходит за рамки классического AppSec или Data Science.

Компании всё чаще ищут специалистов, которые одновременно понимают:
  • архитектуру LLM и агентных систем
  • практики информационной безопасности
  • DevSecOps и инфраструктуру
  • принципы работы AI-инструментов и цепочек взаимодействия
Таких специалистов пока мало — и это становится отдельным вызовом рынка.

Российские вузы уже начинают реагировать: профильные программы и курсы по AI Security появляются в ИТМО, МФТИ и ВШЭ. Но бизнесу уже сейчас приходится формировать экспертизу внутри команд.
Что важно понять бизнесу уже сейчас
Переход к агентным ИИ — это не просто внедрение еще одного цифрового инструмента. Это изменение самой модели взаимодействия с корпоративной инфраструктурой.

ИИ-агенты становятся новыми активными участниками процессов:
  • получают доступ к данным
  • принимают решения
  • взаимодействуют с внешними сервисами
  • выполняют действия от имени компании.
А значит — требуют отдельного уровня контроля.

Сейчас рынок находится в точке, где внедрение агентных систем идёт быстрее, чем зрелость механизмов их защиты. Именно поэтому уже сегодня компаниям важно выстраивать наблюдаемость, контроль поведения и прозрачность работы AI-агентов — до того, как первый инцидент превратится в проблему для ИБ, бизнеса и регуляторов.

В ближайшие годы безопасность ИИ станет таким же обязательным элементом корпоративной инфраструктуры, как когда-то стали DevSecOps, DLP и контроль привилегированного доступа. Компании, которые начнут выстраивать контроль ИИ-агентов уже сейчас, получат преимущество не только в безопасности, но и в скорости масштабирования AI-систем.

Если ваша команда уже тестирует или внедряет AI-агентов, хороший первый шаг — проверить, какие действия они реально выполняют внутри инфраструктуры и насколько эти действия сегодня вообще видны службе безопасности.
Связаться с нами
Россия, г. Екатеринбург,
улица Мамина-Сибиряка 101, офис 8.19

ООО "Софтмедиалаб"
ОГРН 1156658028009
ИНН 6658472405