28.10.2024, 16:25

ИИ затормозился в развитии

Пользователи заждались обновлений ведущих разработчиков искусственного интеллекта — OpenAI (ChatGPT) и конкурирующей с ней Google. Последнюю номерную версию большой языковой модели GPT-4 OpenAI выпустила в марте 2023 года — полтора года назад. Google представила нейросеть Gemini 1.0 в декабре 2023-го и также пока не выпустила версию 2.0. Когда станут доступны новинки, и оправдают ли они ожидания разработчиков и пользователей, выяснял ADPASS.

OpenAI никак не достанет до звезд

На прошлой неделе стало известно, что лидер отрасли генеративного искусственного интеллекта, OpenAI, почти доделал масштабный релиз — новую большую языковую модель под кодовым названием Orion. Издание The Verge сообщило со ссылкой на источники, что при этом, в отличие от предыдущих моделей GPT-4o и o1, Orion не будет сразу доступен широкой аудитории через ChatGPT. Вместо этого OpenAI намеревается предоставить доступ сначала компаниям, с которыми она тесно сотрудничает, чтобы они могли интегрировать Orion в свои продукты и сервисы.

В публикации подчеркивается, что модель не будет преемником выпущенной в сентябре o1 — медленной, но выдающей более качественные ответы на сложные запросы благодаря встроенной способности рассуждать. o1 минимизирует количество ошибок, разбивая решение на этапы и проверяя сделанные на каждом из них выводы. Компания планирует в будущем интегрировать свои языковые модели, чтобы создать ещё более продвинутую систему, которая потенциально может стать моделью искусственного общего интеллекта (Artificial General Intelligence, AGI). В конце августа издание The Information писало, что OpenAI уже использует сгенерированные o1 синтетические данные для тренировки Orion. Это стало необходимо, поскольку большая часть качественных данных, созданных человеком и находящихся в свободном доступе в интернете, уже использована для обучения моделей предыдущих поколений.

Другой источник рассказал The Verge, что инженеры Microsoft, главного партнера OpenAI по развертыванию моделей ИИ, уже в ноябре начнут подготовку Orion к размещению на облачной платформе Azure. Внутри OpenAI Orion рассматривается как преемник GPT-4, но пока неизвестно, будет ли модель официально называться GPT-5.

О том, что следующая передовая языковая модель OpenAI может быть «на порядки» (то есть как минимум в 100 раз) мощнее GPT-4, сообщил в сентябре на конференции KDDI в Японии руководитель местного подразделения OpenAI Тадоа Нагасаки. Разработка, упомянутая как ‘GPT Next’, обеспечит такой масштаб вычислений благодаря улучшенной архитектуре и повышенной эффективности. При этом она якобы будет потреблять примерно столько же ресурсов, сколько и GPT-4.

В OpenAI оказались явно не готовы к такой утечке, по сути накладывающей на нее обязательства — ведь теперь, если новое поколение GPT не появится до конца года, пользователи будут негодовать. Компания, обычно предпочитающая, как Apple, не комментировать слухи, в этот раз решила сразу убить созданные журналистами завышенные ожидания. «Фейковые новости вышли из-под контроля», — написал генеральный директор OpenAI Сэм Альтман в соцсети X, комментируя пост The Verge со ссылкой на публикацию. После этого пресс-секретарь компании Нико Феликс сообщил изданию, что OpenAI «не планирует выпуск модели под кодовым названием Orion в этом году», хотя и заверил, что «компания готовит к выпуску множество других значимых технологий».

Решительное опровержение не согласуется со сделанным ранее Сэмом Альтманом в X очередным туманным намеком. В июне он уже «анонсировал» загадочным постом о созревающей в саду клубнике ИИ-модель Strawberry, выпущенную в сентябре как o1. «Я люблю бывать дома на Среднем Западе. Ночное небо прекрасно. Жду не дождусь, когда поднимутся зимние созвездия; они так красивы», — написал он 14 сентября. Если задать вопрос ChatGPT о возможном значении этого текста, он предположит, что речь идет о созвездии Ориона (Orion), которое лучше всего видно в зимние месяцы, с ноября по февраль.

То, что спустя полтора месяца OpenAI по сути аннулировала намек своего руководителя, может говорить об изменении планов. Возможно, в сентябре всем в OpenAI действительно казалось, что Orion уже почти готова к запуску, но сейчас возникли непредвиденные сложности. Они возникают с разработкой больших языковых моделей следующего поколения не только у OpenAI.

Google тоже нацелился на декабрь

Google, третий год соревнующийся с OpenAI в сфере универсальных флагманских нейросетей и пока не впечатливший ни пользователей, ни экспертов, подготовил ответ на Orion. Нейросеть Gemini 2.0 якобы должны анонсировать и «широко распространить» в декабре. Слово Gemini, кстати, в английском языке тоже обозначает созвездие — Близнецы.

О скором выпуске новинки сообщил в еженедельной рассылке Command Line заместитель главного редактора The Verge Алекс Хит. При этом рассказавшие ему об этом источники отметили, что «модель не демонстрирует прироста производительности, на который рассчитывала команда». Собеседники подчеркнули, намекая на проблемы у OpenAI, что такая тенденция «наблюдается среди всех компаний, разрабатывающих флагманские модели». Других подробностей о возможностях новой версии пока нет.

Если релиз состоится в декабре, Google установит ежегодный цикл выпуска крупных моделей, примерно между проходящими каждый май конференциями разработчиков I/O. В декабре прошлого года компания представила Gemini 1.0, сделала 1.0 Pro доступной через чат-бот Bard (после чего его переназвали Gemini), а компактная и быстрая версия Nano появилась на Pixel 8 Pro. В феврале этого года была выпущена Gemini 1.0 Ultra для расширенной версии Gemini Advanced. Gemini 1.5 с увеличенным контекстным окном анонсировали в феврале, а подписчики gemini.google.com получили доступ к ней в мае.

Под «широким распространением» Google, возможно, подразумевает доступ как для разработчиков (как, вероятно, случится со следующей моделью OpenAI), так и для обычных пользователей. В то же время запуск Project Astra, который добавит к Gemini Live возможности работы с камерой и визуальным контентом, задерживается.

В Chrome поселят «Джарвиса»

Ожидания IT-гигантов по поводу сроков разработки и возможностей ИИ-моделей нового поколения не оправдываются. Чтобы доказать рынку, что они не сидят, сложа руки, компании стараются регулярно делать менее масштабные анонсы. В случае с OpenAI это в последние месяцы были функция голосового общения с ChatGPT в реальном времени и уже упоминавшаяся рассуждающая модель Strawberry. После этого, как писал ADPASS, компании удалось соблазнить инвесторов на самый крупный раунд венчурного финансирования в истории мирового бизнеса. Он позволил привлечь $6,6 млрд, а оценка стоимости OpenAI достигла $157 млрд.

В свою очередь, Google начал настойчиво демонстрировать возможности Gemini всем пользователям своего поисковика, запустив «ИИ-обзоры» — блоки с созданными ИИ ответами на запрос. В них также стали встраивать рекламу. Теперь же, если верить публикации ссылающегося на источники издания The Information, искусственный интеллект встроят в браузер Chrome.

В публикации от 26 октября сказано, что функция разрабатывается под кодовым названием «Project Jarvis» — в честь созданного героем кинокомикса «Железный человек» Тони Старком ИИ J.A. R.V.I. S. Она будет работать браузере Google, автоматизируя для пользователей рутинные задачи в интернете — собирать информацию, совершать покупки в онлайн-магазинах или бронировать авиабилеты. The Information не уточняет, будет ли Jarvis доступен на мобильных устройствах или только на десктопах.

Судя по описанию, новинка представляет собой ИИ-агента — программного посредника. В отличие от чат-ботов он не генерирует контент, а управляет приложениями и функциями пользовательского устройства, выполняя конкретные задачи.

«Я думаю об [агентах] как об интеллектуальных системах, которые демонстрируют умение рассуждать, планировать и запоминать. Они могут думать на несколько шагов вперед, работать в разных программах и системах для выполнения задач за вас, и, что самое важное, под вашим контролем», — отмечал Сундар Пичаи, говоря об ИИ-агентах в мае на конференции Google I/O.

На прошлой неделе ADPASS сообщал, что бета-тестирование такой возможности своего ИИ Claude запустил конкурент OpenAi, стартап Anthropic. Jarvis работает похожим образом, который вряд ли понравится беспокоящимся о сохранности своих данных: программа делает скриншоты экрана и интерпретирует их, чтобы передвигать в нужное место курсор, нажимать кнопки или вводить текст. The Information пишет, что Jarvis работает медленно — модели требуется несколько секунд, чтобы подумать перед каждым действием. Скорее всего, это значит, что агент пока не работает непосредственно на устройстве, нуждаясь в подключении к серверам Google.

Авторы:
Николай Белый
Редакция ADPASS
Главное про маркетинг и рекламу
в Telegram

Вам понравится

Редакция ADPASS
25.10.2024
Редакция ADPASS
10.10.2024
Редакция ADPASS
04.10.2024
Редакция ADPASS
03.10.2024