Дрессировщик алгоритмов: кого и зачем берут в тренеры по искусственному интеллекту

Феноменальный успех бота ChatGPT от компании OpenAI вызвал к жизни профессию тренера по искусственному интеллекту (ИИ). В 2023 году крупнейшие интернет-компании спешно набирали тех, кто научит чат-ботов правильно отвечать на любые вопросы пользователей. ADPASS разбирался, чего больше в новой специальности — программирования, журналистики или писательства, кого берут на такую должность, в чем заключается работа ИИ-тренера, какая у него зарплата и в каких российских компаниях кроме «Яндекса» такие специалисты востребованы.

Изображение сгенерировано нейросетью Kandinsky («Сбер»).

Весной 2023 года «Яндекс» запустил собственную генеративную нейросеть YandexGPT. В апреле компания первой в России начала набор на вакансии тренеров по искусственному интеллекту (ИИ), чтобы обучать модель. Сейчас в «Яндекс» работают 500 ИИ-тренеров, в том числе 50 шеф-редакторов. В среднем редактор руководит командой из десяти человек. Одним из первых ИИ-тренеров стал Рагим Джафаров — российский писатель и сценарист.

Кто такой Рагим Джафаров

Рагим Джафаров Родился в 1992 году в Баку, в 1996-м его семья переехала в Россию. Автор романов «Атака мертвецов», «Марк и Эзра», «Сато», «Картина Сархана» и «Его последние дни», лауреат литературных премий «НОС» и «Новые горизонты». Работал в «Яндексе» в апреле-ноябре 2023 года.

Несколько месяцев назад «Яндекс» запустил школу ИИ-тренеров. В компании считают, что ее выпускники справляются с задачами существенно лучше тех, кто приходил по объявлению о вакансии. Но в итоге из приглашенных в Москву на очное обучение в школу «Яндекс» предложил работать над нейросетью YandexGPT только каждому третьему.

«Нейросеть решила», «нейросеть придумала», «нейросеть сказала» — когда кто-то произносит такие слова, создается впечатление, что нейросеть обладает сознанием. Но в действительности любой ее ответ — результат работы алгоритма, обученного выдавать наиболее вероятный ответ. Система анализирует огромный объем текстов, фиксирует в них закономерности и на их основе угадывает продолжение.

Большинство ИИ-тренеров и шеф-редакторов «Яндекса» работает над так называемой базовой технологией — основной большой языковой моделью, на которую уже могут надстраиваться продуктовые задачи. Задача редакторов — адаптировать технологию для применения в различных продуктах компании. Например, в виртуальном помощнике «Алисе» или в поиске.

В начале обучения нейросети в большую модель загружают терабайты данных из интернета. На этом этапе система накапливает знания о мире, изучает грамматику языка. При этом система еще не способна выдавать точные ответы на запросы: нейросеть не определит, что пользователь ожидает увидеть в ответе и на какие вопросы отвечать нельзя.

Что делает ИИ-тренер: два типа задач

Первая задача ИИ-редактора – написание примеров текстов для нейросети. Редактор пишет ответы на разные типы запросов: это может быть просьба объяснить простым языком, что такое круговорот воды в природе, план сочинения по литературе, деловое письмо или сценарий для детского утренника. Пары из запросов и ответов загружают в нейросеть, которая в дальнейшем считает эти примеры эталонными.

Темы для подготовки текстов аналитики выбирают, исходя из статистики запросов. Так, если пользователи регулярно просят придумать пять идей для запуска своего бизнеса, ИИ-тренер получает задание написать текст на эту тему. По словам Рагима Джафарова, за три-четыре первых месяца ИИ-редакция YandexGPT подготовила около 80 тысяч текстов. Узкая специализация по сферам знаний среди ИИ-тренеров не предусмотрена.

Вторая задача ИИ-тренера — оценка ответов самой нейросети. Нейросеть дает разные варианты ответа на один и тот же запрос, которые ИИ-тренер ранжирует от лучшего к худшему: выбирает наиболее удачные и помечает неправильные, неэтичные или бессмысленные.

По словам Рагима Джафарова, для ранжирования ответов YandexGPT использует 16 параметров. Правда, из них он согласился назвать только три: безопасность, этичность и полезность. 13 оставшихся он не раскрыл, ссылаясь на коммерческую тайну.

Какие знания и навыки нужны ИИ-тренеру

Претендовать на вакансию ИИ-тренера может любой человек, умеющей излагать свои мысли. Первый и основной навык — уметь грамотно писать по-русски, избегая канцеляризмов и сложных языковых конструкций, рассказал Рагим Джафаров. По его словам, текст эталонных ответов нейросети должен быть ясным и доходчивым. Помимо этого ИИ-тренер должен соблюдать общий подход к написанию материалов, а также выдерживать сроки их сдачи. Образование в какой-то конкретной области или профессиональный опыт не являются показателем пригодности к работе ИИ-тренером.

Второй важный критерий — способность ориентироваться в информации. ИИ-тренер должен уметь критически мыслить, выбирать подходящие источники для эталонных текстов и дотошно проверять факты. «Если человек немного зануда и готов каждое слово поставить под сомнение — это большое преимущество, такие люди нам нужны», — объяснил Рагим Джафаров ADPASS. По его словам, наряду с владением русским языком ключевым при отборе соискателей также был навык проверки фактуры (фактчекинг). Дело в том, что нейросеть может галлюцинировать, выдавая неверные и абсурдные ответы, поэтому проверять приходится буквально каждое слово.

Третий существенный навык — знание иностранных языков. Подавляющее большинство запросов к YandexGPT поступают на русском, но иностранный язык нужен для того, чтобы не ограничиваться только русскоязычными источниками. Рагим Джафаров уверяет, что среди руководящего состава ИИ-редакции «Яндекса» — 50 шеф-редакторов, нет ни одного, кто знал бы меньше двух языков помимо русского. «Это не было требованием при найме, просто на позицию подходят люди, тесно работающие с языками», — утверждает он.

Четвертая группа навыков характерна для тех, кто работает удаленно: самостоятельность, ответственность и умение строить коммуникацию. ИИ-тренеры трудятся удаленно, и должны уметь эффективно распоряжаться своим временем.

Как работают и сколько зарабатывают ИИ-тренеры

Рабочий день ИИ-тренера начинается с планерки, на которой шеф-редактор расставляет приоритеты и распределяет между членами команды задачи на день. Так, один сотрудник сегодня может потратить тратит шесть часов на написание и еще два на ранжирование текстов, а другой в основном ранжирует и пишут только час. Работа ИИ-тренеров оценивается автоматически по ряду параметров. Ключевые — скорость и качество выполнения заданий (точность и полнота ответа, грамотность, безопасность, этичность, отсутствие фактических и других ошибок и др.).

В «Яндексе» ИИ-тренеры могут работать по договору совместительства и выбирать объем ежедневной нагрузки. Одни берут часы вразбивку, другие работают полный день, например, с 10 до 19.

Заработок ИИ-тренеров в YandexGPТ при полном рабочем дне составляет 75-108 тыс. рублей в зависимости от скорости и качества работы, сообщил ADPASS Рагим Джафаров. Зарплаты шеф-редакторов, выполняющих больше менеджерских функций, начинаются от 120 тыс. рублей. При этом шеф-редактор может взять дополнительную нагрузку в рамках проекта.

В США среднегодовой доход тренера искусственного интеллекта составляет около $50 тыс. или $4,15 тыс. в месяц. В пересчете на рубли — 385 тыс. (курс ЦБ на 22 декабря).

Как будет строиться картера таких ИИ-тренеров покажет время. В «Яндексе» наиболее очевидный путь — из рядового ИИ-тренера дорасти до шеф-редактора. Кроме того, в крупнейшей российской интернет-компании существует система ротации, позволяющая сотрудникам пройти дополнительное обучение и поменять специализацию. При этом опытные ИИ-тренеры явно могут рассчитывать на приглашение в другие проекты в сфере искусственного интеллекта, которые развивают другие крупные российские компании.

Где еще нужны ИИ-тренеры

Поиск в базе портала HeadHunter.ru выдает вакансии ИИ-тренеров и руководителей от экосистемы «Сбера», сотового оператора МТС, банка «Тинькофф» и медиагруппы Shkulev Media Holding.

Основным российским конкурентом «Яндекса» в разработке искусственного интеллекта можно назвать «Сбер». «Яндекс» и «Сбер» анонсировали свои ИИ-проекты YandexGPT и GigaChat с месячным интервалом в мае-апреле 2023 года. Как и YandexGPT, нейросеть GigaChat уже умеет отвечать на вопросы пользователей, поддерживать диалог, создавать и перерабатывать тексты, генерировать идеи, писать несложный код (например, HTML для веб-страниц). ИИ встроен в голосовые помощники «Яндекса» и «Сбера» — «Алису» и «Салют».

У обеих компаний есть две технологии для генерации изображений по тексту – диффузионные модели YandexART и Kandinsky. Но в этом случае учебный процесс не требует привлечения ИИ-тренеров. Тут нужны специалисты по разметке данных для описания в текстовом виде изображений, на которых учится модель. «Сбер» не спешит делиться подробностями работы своего ИИ-проекта: в пресс-службе компании проигнорировали просьбу ADPASS рассказать о GigaChat.

Нейросети других российских разработчиков более узко специализированы и пока не так широко известны. Банк «Тинькофф» 1 ноября представил нейросеть для предпринимателей, умеющую создавать персонализированные ответы на отзывы покупателей. Она доступна продавцам на маркетплейсе Wildberries и на платформе «Тинькофф отзывы». Судя по вакансии «шеф-редактор ИИ-тренеров» на HeadHunter, амбиции компании этим не исчерпываются: соискателям предлагают работать над «технологиями, аналогичными ChatGPT».

В тексте вакансии от МТС сказано, что редакторам-тренерам ИИ-модели предстоит обучать виртуального ассистента, который «защитит клиента от рутины». Что скрывается за этой формулировкой в компании не уточнили. Оператор пока не публиковал информацию о том, что представляет собой его проект в сфере искусственного интеллекта. Несколько лет назад МТС пытался создать голосового помощника «Марвина»: о запуске было объявлено в июне 2020-го. Правда, с новой системой тогда общались обладатели тестовой партии смарт-колонок от МТС, которая была доступна только для сотрудников компании, а также пользователи соответствующих мобильных приложений. В 2021-м проект заглох: колонки перестали работать, а «Марвин» пропал из магазинов приложений. Но весной 2023-го в МТС заявили, что собираются перезапустить своего ИИ-ассистента.

Информация о том, для чего ИИ-тренеры понадобились группе Shkulev Media Holding, отсутствует. До сих пор медиахолдинг не делал никаких заявлений о запуске собственных проектов в сфере искусственного интеллекта. В тексте вакансии на HeadHunter.ru сказано, что «редактору для обучения языковой нейросети» предстоит работать со сгенерированными ИИ-текстами, обучать нейросеть «грамотному написанию оригинальных текстов и уникальных рерайтов», а также писать «в соавторстве» с ней контент для интернет-изданий холдинга (MarieClaire.ru, TheGirl.ru, MyDecor.ru, Woman.ru и других).

Авторы:

Николай Белый