Финансовые показатели двух IT-гигантов, Alphabet (владеет Google) и Microsoft, за первый квартал 2024 года превзошли ожидания аналитиков. Днем ранее гендиректор Meta* Марк Цукерберг словами о нескорой финансовой отдаче от многомиллиардных вложений в ИИ отправил в минус акции не только своей компании, но и весь индекс NASDAQ. Однако отчетность двух других IT-гигантов успокоила рынок. Alphabet заработала чистыми за квартал $23,7 млрд (+57% год к году), а Microsoft — $21,9 млрд (+20%). При этом обе корпорации приписывают часть прироста затратным, но крайне востребованным технологиям ИИ.
Дрессировщик алгоритмов: кого и зачем берут в тренеры по искусственному интеллекту
Феноменальный успех бота ChatGPT от компании OpenAI вызвал к жизни профессию тренера по искусственному интеллекту (ИИ). В 2023 году крупнейшие интернет-компании спешно набирали тех, кто научит чат-ботов правильно отвечать на любые вопросы пользователей. ADPASS разбирался, чего больше в новой специальности — программирования, журналистики или писательства, кого берут на такую должность, в чем заключается работа ИИ-тренера, какая у него зарплата и в каких российских компаниях кроме «Яндекса» такие специалисты востребованы.
Весной 2023 года «Яндекс» запустил собственную генеративную нейросеть YandexGPT. В апреле компания первой в России начала набор на вакансии тренеров по искусственному интеллекту (ИИ), чтобы обучать модель. Сейчас в «Яндекс» работают 500 ИИ-тренеров, в том числе 50 шеф-редакторов. В среднем редактор руководит командой из десяти человек. Одним из первых ИИ-тренеров стал Рагим Джафаров — российский писатель и сценарист.
Кто такой Рагим Джафаров
Рагим Джафаров Родился в 1992 году в Баку, в 1996-м его семья переехала в Россию. Автор романов «Атака мертвецов», «Марк и Эзра», «Сато», «Картина Сархана» и «Его последние дни», лауреат литературных премий «НОС» и «Новые горизонты». Работал в «Яндексе» в апреле-ноябре 2023 года.
Несколько месяцев назад «Яндекс» запустил школу ИИ-тренеров. В компании считают, что ее выпускники справляются с задачами существенно лучше тех, кто приходил по объявлению о вакансии. Но в итоге из приглашенных в Москву на очное обучение в школу «Яндекс» предложил работать над нейросетью YandexGPT только каждому третьему.
«Нейросеть решила», «нейросеть придумала», «нейросеть сказала» — когда кто-то произносит такие слова, создается впечатление, что нейросеть обладает сознанием. Но в действительности любой ее ответ — результат работы алгоритма, обученного выдавать наиболее вероятный ответ. Система анализирует огромный объем текстов, фиксирует в них закономерности и на их основе угадывает продолжение.
Большинство ИИ-тренеров и шеф-редакторов «Яндекса» работает над так называемой базовой технологией — основной большой языковой моделью, на которую уже могут надстраиваться продуктовые задачи. Задача редакторов — адаптировать технологию для применения в различных продуктах компании. Например, в виртуальном помощнике «Алисе» или в поиске.
В начале обучения нейросети в большую модель загружают терабайты данных из интернета. На этом этапе система накапливает знания о мире, изучает грамматику языка. При этом система еще не способна выдавать точные ответы на запросы: нейросеть не определит, что пользователь ожидает увидеть в ответе и на какие вопросы отвечать нельзя.
Что делает ИИ-тренер: два типа задач
Первая задача ИИ-редактора – написание примеров текстов для нейросети. Редактор пишет ответы на разные типы запросов: это может быть просьба объяснить простым языком, что такое круговорот воды в природе, план сочинения по литературе, деловое письмо или сценарий для детского утренника. Пары из запросов и ответов загружают в нейросеть, которая в дальнейшем считает эти примеры эталонными.
Темы для подготовки текстов аналитики выбирают, исходя из статистики запросов. Так, если пользователи регулярно просят придумать пять идей для запуска своего бизнеса, ИИ-тренер получает задание написать текст на эту тему. По словам Рагима Джафарова, за три-четыре первых месяца ИИ-редакция YandexGPT подготовила около 80 тысяч текстов. Узкая специализация по сферам знаний среди ИИ-тренеров не предусмотрена.
Вторая задача ИИ-тренера — оценка ответов самой нейросети. Нейросеть дает разные варианты ответа на один и тот же запрос, которые ИИ-тренер ранжирует от лучшего к худшему: выбирает наиболее удачные и помечает неправильные, неэтичные или бессмысленные.
По словам Рагима Джафарова, для ранжирования ответов YandexGPT использует 16 параметров. Правда, из них он согласился назвать только три: безопасность, этичность и полезность. 13 оставшихся он не раскрыл, ссылаясь на коммерческую тайну.
Какие знания и навыки нужны ИИ-тренеру
Претендовать на вакансию ИИ-тренера может любой человек, умеющей излагать свои мысли. Первый и основной навык — уметь грамотно писать по-русски, избегая канцеляризмов и сложных языковых конструкций, рассказал Рагим Джафаров. По его словам, текст эталонных ответов нейросети должен быть ясным и доходчивым. Помимо этого ИИ-тренер должен соблюдать общий подход к написанию материалов, а также выдерживать сроки их сдачи. Образование в какой-то конкретной области или профессиональный опыт не являются показателем пригодности к работе ИИ-тренером.
Второй важный критерий — способность ориентироваться в информации. ИИ-тренер должен уметь критически мыслить, выбирать подходящие источники для эталонных текстов и дотошно проверять факты. «Если человек немного зануда и готов каждое слово поставить под сомнение — это большое преимущество, такие люди нам нужны», — объяснил Рагим Джафаров ADPASS. По его словам, наряду с владением русским языком ключевым при отборе соискателей также был навык проверки фактуры (фактчекинг). Дело в том, что нейросеть может галлюцинировать, выдавая неверные и абсурдные ответы, поэтому проверять приходится буквально каждое слово.
Третий существенный навык — знание иностранных языков. Подавляющее большинство запросов к YandexGPT поступают на русском, но иностранный язык нужен для того, чтобы не ограничиваться только русскоязычными источниками. Рагим Джафаров уверяет, что среди руководящего состава ИИ-редакции «Яндекса» — 50 шеф-редакторов, нет ни одного, кто знал бы меньше двух языков помимо русского. «Это не было требованием при найме, просто на позицию подходят люди, тесно работающие с языками», — утверждает он.
Четвертая группа навыков характерна для тех, кто работает удаленно: самостоятельность, ответственность и умение строить коммуникацию. ИИ-тренеры трудятся удаленно, и должны уметь эффективно распоряжаться своим временем.
Как работают и сколько зарабатывают ИИ-тренеры
Рабочий день ИИ-тренера начинается с планерки, на которой шеф-редактор расставляет приоритеты и распределяет между членами команды задачи на день. Так, один сотрудник сегодня может потратить тратит шесть часов на написание и еще два на ранжирование текстов, а другой в основном ранжирует и пишут только час. Работа ИИ-тренеров оценивается автоматически по ряду параметров. Ключевые — скорость и качество выполнения заданий (точность и полнота ответа, грамотность, безопасность, этичность, отсутствие фактических и других ошибок и др.).
В «Яндексе» ИИ-тренеры могут работать по договору совместительства и выбирать объем ежедневной нагрузки. Одни берут часы вразбивку, другие работают полный день, например, с 10 до 19.
Заработок ИИ-тренеров в YandexGPТ при полном рабочем дне составляет 75-108 тыс. рублей в зависимости от скорости и качества работы, сообщил ADPASS Рагим Джафаров. Зарплаты шеф-редакторов, выполняющих больше менеджерских функций, начинаются от 120 тыс. рублей. При этом шеф-редактор может взять дополнительную нагрузку в рамках проекта.
В США среднегодовой доход тренера искусственного интеллекта составляет около $50 тыс. или $4,15 тыс. в месяц. В пересчете на рубли — 385 тыс. (курс ЦБ на 22 декабря).
Как будет строиться картера таких ИИ-тренеров покажет время. В «Яндексе» наиболее очевидный путь — из рядового ИИ-тренера дорасти до шеф-редактора. Кроме того, в крупнейшей российской интернет-компании существует система ротации, позволяющая сотрудникам пройти дополнительное обучение и поменять специализацию. При этом опытные ИИ-тренеры явно могут рассчитывать на приглашение в другие проекты в сфере искусственного интеллекта, которые развивают другие крупные российские компании.
Где еще нужны ИИ-тренеры
Поиск в базе портала HeadHunter.ru выдает вакансии ИИ-тренеров и руководителей от экосистемы «Сбера», сотового оператора МТС, банка «Тинькофф» и медиагруппы Shkulev Media Holding.
Основным российским конкурентом «Яндекса» в разработке искусственного интеллекта можно назвать «Сбер». «Яндекс» и «Сбер» анонсировали свои ИИ-проекты YandexGPT и GigaChat с месячным интервалом в мае-апреле 2023 года. Как и YandexGPT, нейросеть GigaChat уже умеет отвечать на вопросы пользователей, поддерживать диалог, создавать и перерабатывать тексты, генерировать идеи, писать несложный код (например, HTML для веб-страниц). ИИ встроен в голосовые помощники «Яндекса» и «Сбера» — «Алису» и «Салют».
У обеих компаний есть две технологии для генерации изображений по тексту – диффузионные модели YandexART и Kandinsky. Но в этом случае учебный процесс не требует привлечения ИИ-тренеров. Тут нужны специалисты по разметке данных для описания в текстовом виде изображений, на которых учится модель. «Сбер» не спешит делиться подробностями работы своего ИИ-проекта: в пресс-службе компании проигнорировали просьбу ADPASS рассказать о GigaChat.
Нейросети других российских разработчиков более узко специализированы и пока не так широко известны. Банк «Тинькофф» 1 ноября представил нейросеть для предпринимателей, умеющую создавать персонализированные ответы на отзывы покупателей. Она доступна продавцам на маркетплейсе Wildberries и на платформе «Тинькофф отзывы». Судя по вакансии «шеф-редактор ИИ-тренеров» на HeadHunter, амбиции компании этим не исчерпываются: соискателям предлагают работать над «технологиями, аналогичными ChatGPT».
В тексте вакансии от МТС сказано, что редакторам-тренерам ИИ-модели предстоит обучать виртуального ассистента, который «защитит клиента от рутины». Что скрывается за этой формулировкой в компании не уточнили. Оператор пока не публиковал информацию о том, что представляет собой его проект в сфере искусственного интеллекта. Несколько лет назад МТС пытался создать голосового помощника «Марвина»: о запуске было объявлено в июне 2020-го. Правда, с новой системой тогда общались обладатели тестовой партии смарт-колонок от МТС, которая была доступна только для сотрудников компании, а также пользователи соответствующих мобильных приложений. В 2021-м проект заглох: колонки перестали работать, а «Марвин» пропал из магазинов приложений. Но весной 2023-го в МТС заявили, что собираются перезапустить своего ИИ-ассистента.
Информация о том, для чего ИИ-тренеры понадобились группе Shkulev Media Holding, отсутствует. До сих пор медиахолдинг не делал никаких заявлений о запуске собственных проектов в сфере искусственного интеллекта. В тексте вакансии на HeadHunter.ru сказано, что «редактору для обучения языковой нейросети» предстоит работать со сгенерированными ИИ-текстами, обучать нейросеть «грамотному написанию оригинальных текстов и уникальных рерайтов», а также писать «в соавторстве» с ней контент для интернет-изданий холдинга (MarieClaire.ru, TheGirl.ru, MyDecor.ru, Woman.ru и других).
Лучшее в блогах
Вам понравится
Специалисты из Стэнфорда выяснили, сколько денег OpenAI и Google потратили на тренировку своих флагманских моделей искусственного интеллекта, инвестиции в какое направление ИИ-технологий выросли за год в восемь раз, и кто лидирует в геополитической «гонке нейросетевых вооружений». В Институте человекоориентированного ИИ при Стэнфордском университете (Stanford Institute for Human-Centered Artificial Intelligence, HAI) при участии ведущих экспертов индустрии и ученых подготовили объемный отчет о тенденциях в сфере искусственного интеллекта. На 500 страницах охватили все — от исследований и разработки до финансовых затрат, проблем регулирования, экономических и геополитических аспектов. ADPASS ознакомился с одним из самых масштабных исследований прогресса в самой горячем (или перегретом?) секторе IT-индустрии.
ПОДПИСКА
ВАШ ЗАПРОС ДОСТАВЛЕН
О блогах ADPASS: правила, рекомендации, ответы на вопросы