ADPASS рекомендует материал к прочтению
ООО «Акме»
26.07.2024, 13:31

Российские ученые первыми в мире обучили ИИ самостоятельно адаптироваться к новым действиям

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research и Института AIRI разработали первую в мире модель в области контекстного обучения (In-Context Learning), которая умеет самостоятельно обучаться новым действиям всего на нескольких примерах.

Ранее ИИ-системы умели выполнять только фиксированный набор действий, а при появлении новых задач должны были переобучаться им с нуля. Это требовало дополнительных финансовых и вычислительных ресурсов, чтобы дообучить ИИ для практического применения.

Разработка российских ученых позволяет создавать ИИ-системы, которые будут самостоятельно адаптироваться под изменения внешней среды и к новым задачам без участия человека. Решение поможет в различных областях: от космических аппаратов до домашних роботов-помощников. Модель, названная Headless-AD, умеет выполнять в пять раз больше действий, чем заложено в нее при обучении.

Обучение в контексте (In-Context Learning) — это одна из самых перспективных областей в сфере искусственного интеллекта, которая позволяет ИИ-агентам адаптироваться к новым ситуациям без необходимости повторного обучения. Теоретически ИИ-агенты должны уметь адаптироваться к окружающей среде по четырем компонентам:

  • Состояние (State) — это то, что агент видит или знает о текущей ситуации; переход (Transition) — это изменение состояния агента; 

  • Награда (Reward) — это оценка выполненного агентом действия, может быть положительной или отрицательной; 

  • Действие (Action) — это доступные агенту способы взаимодействия со средой.

Ранее ИИ-агенты умели адаптироваться по первым трем компонентам. Например, беспилотные автомобили адаптируются к меняющимся погодным условиям (State), скорости движения (Transition) и пунктам назначения (Reward). Но адаптация по действиям (Action) не была до конца изучена и не использовалась в создании моделей. Агенты умели выполнять только фиксированный набор действий, а при появлении новых — требовали переобучения с нуля.

На основе модели дистилляции алгоритма (Algorithm Distillation, AD) ученые из T-Bank AI Research и AIRI создали Headless-AD, которая научилась адаптироваться к окружающей среде по действиям. В исходную модель внесли три модификации: 

  • Отказ от конечного линейного слоя, который ранее ограничивал количество и набор доступных действий (отсюда название Headless-AD); 

  • Кодировка действий случайными векторами — позволяет избежать необходимости дообучения для каждого нового действия, обеспечивая автоматическую адаптацию; 

  • Внедрение контекста, который позволяет информировать модель о доступных действиях.

Было проведено несколько экспериментов, сравнивающих Headless-AD и ближайшие аналоги на разных задачах. Их результаты подтвердили, что Headless-AD способна к выполнению любой комбинации и количества действий, сохраняя качество их выполнения и не затрачивая дополнительные вычислительные ресурсы. Это делает применение ИИ более быстрым и дешевым.


По материалам cnews.ru.

Вам понравится

Onpoint
02.09.2024