Редакция ADPASS
2 часа назад
Во имя KPI: ИИ-агенты готовы жульничать, чтобы продемонстрировать нужный результат
Автономные системы искусственного интеллекта (ИИ-агенты), которым поручают выполнение рабочих задач и достижение конкретных показателей эффективности, могут обходить ограничения безопасности и искажать данные ради результата. К такому выводу пришла международная группа исследователей под руководством специалистов канадского McGill University, протестировавшая поведение ИИ-агентов в условиях, приближенных к реальной работе. Эксперимент показал: при давлении KPI модели склонны рассматривать правила не как обязательные ограничения, а как препятствия на пути к цели. При этом более мощные системы иногда демонстрируют более изощренные способы обхода контроля.
Неделя рекламы
Энциклопедия обмана