24.07.2024, 15:40

Бесплатный ИИ догнал коммерческий. Новая нейросеть Meta Llama 3.1 работает на уровне GPT-4o

Пользователям и разработчикам по всему миру впервые стала доступна бесплатная ИИ-модель, по результатам тестирования не уступающая лидерам вроде GPT-4o от OpenAI или Claude 3.5 Sonnet от Anthropic. Llama 3.1 405B, представленная накануне корпорацией Meta*, также является первой и пока единственной моделью с такими возможностями, распространяемой на принципах открытого исходного кода (open source). Марк Цукерберг уверен, что за таким подходом будущее — в котором ИИ-моделям Meta суждено занять то же место, которое в мире операционных систем занимает Linux (лежащий, в том числе, в основе Android и iOS). Но далеко не все согласны, что условия лицензирования Llama соответствуют принципам open source.

Иллюстрация сгенерирована нейросетью Midjourney

Самый мощный открытый ИИ

Владеющая крупнейшими мировыми соцсетями Facebook** и Instagram**, а также крупнейшим мессенджером WhatsApp корпорация Meta представила накануне новое поколение своих больших языковых моделей Llama — Llama 3.1. В семейство входят, как и раньше, модели на 8 млрд и 70 млрд параметров (взаимосвязанных значений, формируемых при обучении модели), но к ним добавилась третья, самая продвинутая по возможностям — на 405 млрд параметров.

Чем больше параметров у нейросети, тем она, при прочих равных условиях, лучше решает задачи —, но и требует при этом больше вычислительных ресурсов. В Meta подчеркивают, что запустить и использовать Llama 3.1 405B может любой желающий специалист, имеющий в своем распоряжении достаточно производительный сервер. Но мощности обычного компьютера тут не хватит. Новая модель, говорят разработчики, может обобщать длинные тексты, служить основой многоязычных чат-ботов, писать программный код и даже (такой сценарий использования прописан в лицензии), генерировать синтетические данные для обучения других ИИ-моделей.

Результаты выполнения Llama 3.1 405B стандартных тестов, опубликованные Meta, показывают, что она первой из бесплатных и открытых моделей максимально приблизилась к коммерческим продуктам, таким как GPT-4o (OpenAI), Claude 3.5 Sonnet (Anthropic) или Gemini 1.5 Pro (Google). Многие в отрасли считают более правильным подходом к тестированию субъективную оценку тысячами пользователей ответов двух моделей на одни и те же вопросы. Такое тестирование ведет, например, ресурс Chatbot Arena, однако в списке доступных моделей Llama 3.1 405B там пока нет. Тем не менее, многие, уже попробовавшие с ней работать, говорят, что результаты действительно сопоставимы с «закрытыми» лидерами рынка.

Топовую нейросеть Meta несколько месяцев обучали на 16 тысячах ИИ-процессоров Nvidia H100. Использовались более 15 трлн токенов данных из Интернета (в том числе на открытых постах в Facebook и Instagram), предварительно обработанных, отфильтрованных и аннотированных моделью Llama 2. По оценкам экспертов, на обучение распространяемой бесплатно модели корпорация Марка Цукерберга могла потратить сотни миллионов долларов — не считая миллиардов, вложенных в ИИ-процессоры и другое оборудование дата-центров.

Испытать Llama 3.1 405B в деле могут все желающие даже без регистрации на платформе Hugging Face по этой ссылке.

Открытый, но не до конца

Подчеркивая важность момента для его корпорации, Марк Цукерберг сопроводил анонс Llama 3.1 постом, в котором в очередной раз превозносит преимущества open source в сфере искусственного интеллекта. Он сравнивает ИИ-разработки Meta с Linux — операционной системой с открытым исходным кодом, в последние десятилетия составившей серьезную конкуренцию закрытым решениям от IT-гигантов. На Linux работают не только большинство серверов в дата-центрах — крупнейшие мобильные операционки Android и iOS тоже были разработаны на его основе. «Я верю, что ИИ будет развиваться похожим образом, — пишет Марк Цукерберг. — Сегодня несколько технологических компаний разрабатывают ведущие закрытые модели. Но open source быстро сокращает отрыв».

Один из аргументов главы Meta в пользу ИИ с открытым кодом: так безопаснее. По его мнению, ошибки и уязвимости закрытых моделей могут легко стать добычей активно шпионящих за американским бигтехом недругов США, в то время как искать «дыры» в открытых моделях легко может любой специалист по компьютерной безопасности. «Я думаю, правительства придут к выводу, что в их интересах поддерживать открытый исходный код, так как это сделает мир более процветающим и безопасным», — сказал Марк Цукерберг в письме. У OpenAI, Microsoft и Google позиция противоположная: там считают, что ИИ — опасная технология, которую должны контролировать только ее непосредственные разработчики. А общедоступные модели с открытым исходным кодом могут быть использованы против США их геополитическими противниками.

«Открытый исходный код обеспечит доступ к преимуществам и возможностям ИИ большему числу людей по всему миру, не допустит концентрации власти в руках небольшого числа компаний и позволит более равномерно и безопасно внедрять технологию в обществе», — утверждает гендиректор Meta. В то же время, подход корпорации к разработке ИИ нельзя назвать чисто альтруистичным. Если Llama станет отраслевым стандартом, она будет не менее важна для Meta и ее доходов, чем Android важен для Google или Windows — для Microsoft.

Большинство специалистов считают, что Марк Цукерберг лукавит, и лицензия на использование моделей Llama не соответствует принципам open source. Далеко не вся информация о них открыта: например, Meta не предоставляет для изучения наборы данных, на которых тренировали ИИ, и не раскрывает конкретные методы обучения. Это не позволяет сторонним разработчикам до конца понять, как именно модель работает. Кроме того, компании с более чем 700 млн пользователей в месяц должны получать специальное разрешение на использование Llama — это делает маловероятным ее применение многими популярными платформами, тем же Telegram. Наконец, модели Meta завязаны на инфраструктуру и API корпорации, что может ограничивать свободу действий сторонних разработчиков.

*Корпорация Meta признана экстремистской и запрещена в РФ

** Продукт корпорации Meta, запрещен в РФ

Авторы:
Николай Белый
Редакция ADPASS
Главное про маркетинг и рекламу
в Telegram