Новости

Редакция ADPASS

22.02.2024, 10:22

Чат-ботам придали ускорения: создан чип, позволяющий ИИ общаться без задержек

Стартап Groq (не путать с чатботом-юмористом Grok Илона Маска) выпустил чип, кратно ускоряющий работу больших языковых моделей — например, он в 18 раз производительнее GPT-4. Это впервые позволит общаться с искусственным интеллектом как с живым человеком действительно в реальном времени, без малейших задержек, а разработчик ИИ получит огромную экономию на закупках оборудования и счетах за электричество. Таким образом Groq бросает вызов Nvidia, сейчас — крупнейшему поставщику специализированных комплектующих для тренировки и работы систем искусственного интеллекта.

*Изображение сгенерировано нейросетью Kandinsky*

«Железо» для нейросетевых вычислений сегодня — одна из самых горячих областей IT-бизнеса. Глава OpenAI Сэм Альтман хочет договориться с инвесторами от суверенного фонда Саудовской Аравии до правительства США и собрать до $7 трлн на мегапроект по производству ИИ-чипов. Акции Nvidia за неполных два месяца с начала года выросли на 40%, а с начала 2023-го — в пять раз, так что сейчас компания соревнуется по рыночной капитализации с Amazon и Alphabet, пропуская вперед только Apple и Microsoft. Причиной ее успеха стали лучшие на рынке специализированные ускорители вычислений, унаследовавшие архитектуру высокопроизводительных видеокарт (graphic processing unit, GPU) — такие сейчас требуются в огромных количествах любой компании, тренирующей большие языковые модели. Но как выяснилось, для работы этих моделей существующие чипы с такой архитектурой подходят не так хорошо, как для тренировки.

«Гамлет» за 7 минут

Все пользователи чат-ботов сталкивались с тем, что текст любого ответа (если это не пара-тройка слов) появляется не моментально, а постепенно — и воспринимают это как само собой разумеющееся. Но в компании Groq видят в этом проблему, которую нужно решить, так как она мешает естественному взаимодействию. Решением стала разработка специализированного чипа Groq LPU (language processing unit, модуль языковых вычислений), на котором могут работать любые существующие большие языковые модели.

Ускоритель ИИ Groq LPU выглядит как обычная видеокарта и стоит около $20 000.

Благодаря тому, что прямо в чип интегрирована память объемом 230 мегабайт, обеспечивается крайне высокая скорость обмена данными между ею и вычислительными ядрами, что позволяет нейросети выдавать даже объемные ответы за доли секунды. Модуль с чипом представляет собой карту расширения для компьютера или сервера со стандартным интерфейсом PCIe и стоит около $20 тыс. Но все желающие с 19 февраля могут протестировать работу системы через сайт Groq.

Стартап Groq был основан в 2016 году бывшим гугловцем Джонатаном Россом, стоявшим у истоков разработки собственных ИИ-чипов поисковика — tensor processing units. Так что анонс Илоном Маском почти одноименного чат-бота Grok в ноябре прошлого года вызвал у Росса ироничную реакцию. «Добро пожаловать в галактику Groq, Илон», — написал он тогда в своем блоге. Выбор похожих названий, скорее всего, объясняется любовью обоих предпринимателей к научной фантастике. В удостоенном премии Хьюго романе Роберта Хайнлайна 1961 года «Чужак в чужой стране» «грок» — не имеющий в земных языках точного соответствия марсианский глагол. Его примерное значение — понимать полностью, интуитивно и эмпатично.

Результаты, полученные первыми пользователями, ставят Groq на первое место среди существующих решений для «инференции» (inference, «вывод» или «умозаключение») — так специалисты по ИИ называют процесс «мышления» языковой модели, то есть анализа пользовательского запроса и формирования ответа на него. Скорость инференции у платной версии ChatGPT, работающей на модели GPT-4 — 40 токенов в секунду (около 160 текстовых символов, 30 слов или пара строк текста), в то время как Groq при использовании модели с открытым исходным кодом Mixtral выдает за ту же секунду 500 токенов. Энтузиасты подсчитали, что за семь минут система способна написать текст длиной с шекспировского «Гамлета». Задачу поиска багов в большом объеме программного кода Groq выполняет в 10 раз быстрее Google Gemini и в 18 раз быстрее GPT-4.

Поговорить по-человечески

Вот как глава Groq Джонатан Росс объясняет, почему для языковых моделей важна скорость. «Все дело в вовлеченности, — сказал он в эфире CNN в середине февраля. — Представьте, что я бы говорил неестественно медленно. Тогда вы бы начали отвлекаться, теряя нить разговора». Он привел пример, когда при ускорении отклика мобильного сайта на 100 миллисекунд вовлеченность пользователей растет на треть. То же самое и с нейросетевыми чат-ботами: чем быстрее пользователь получает ответ, тем легче ему взаимодействовать с сервисом, и тем активнее он будет этот сервис использовать.

В прошлом году Google, представляя новое поколение своей большой языковой модели Gemini, попалась на попытке схитрить: в промо-видео чат-бот разговаривал с пользователем голосом, отвечая в реальном времени. Как убедились пользователи, на самом деле прежде чем выдать ответ, системе нужно было подумать несколько секунд. Однако Groq эту проблему устраняет, его скорость инференции позволяет реализовать полноценную беседу с ИИ без пауз — что Росс и продемонстрировал в эфире CNN, устроив беседу между Groq и ведущей.

Росс рассказал, что несколько крупных компаний, разрабатывающих ИИ-железо, уже проявили интерес к технологиям его компании. Конкретных игроков он не назвал, но нетрудно представить ситуацию, когда кто-то из обладающих значительными ресурсами конкурентов Nvidia (например, AMD) покупает стартап и создает на основе его наработок свои продукты.

Такие ИИ-ускорители будут востребованы на рынке не только из-за скорости. По оценке разработчиков Groq LPU, он потребляет в 10 раз меньше энергии, чем ускорители Nvidia, для выполнения тех же задач. То есть, внедрив его, можно сэкономить огромные суммы — да еще и попиариться на теме защиты окружающей среды. Оптимизация операционных затрат в этом году станет особенно важной для ведущих игроков ИИ-отрасли, так как число пользователей нейросетевых чат-ботов с момента появления ChatGPT неуклонно и быстро растет — а с ними и нагрузка на дата-центры.

Авторы:

Николай Белый

#Нейросети #ИИ #Чат-боты #Технологии

Редакция ADPASS

Главное про маркетинг и рекламу

в Telegram

Лучшее в блогах

16.02.2026

ADPASS меняется: блог-платформа переходит на платную модель с 1 апреля

27.02.2026

Агентство Be Ready вступило в РАМУ

27.02.2026

Сила внутренних коммуникаций: как держать команду на одной волне

26.02.2026

Когда репутация становится активом: новые правила взросления компании

Вам понравится

Редакция ADPASS

9 часов назад

Сэм Альтман отсканировал 36 млн глаз: Gap, Tinder и Visa тестируют «цифровое доказательство человечности»

Технологии ChatGPT Биометрия Маркетинг

Проект биометрической верификации от главы OpenAI Сэма Альтмана World ID набрал 18 млн пользователей и заручился партнерствами с Gap, Tinder и Visa. Бренды видят в этом способ привлечь внимание и решить проблему ботов. А заодно помогают строить глобальную инфраструктуру биометрической идентификации, которую несколько стран уже запретили.

Редакция ADPASS

17.02.2026

Как заработать на ИИ: количество молодых миллионеров и миллиардеров обновило рекорд

ChatGPT Миллиардеры Миллионеры ИИ

2025 год был богат на молодых миллиардеров и миллионеров. В списке мировых миллиардеров Forbes количество тех, кто сам заработал состояние до 30 лет, достигло рекордных 13 человек. В Великобритании в прошлом году число миллионеров-зумеров перевалило за 1 тыс. человек. Большинство из миллиардеров занимаются технологиями искусственного интеллекта, а миллионеры — работники этих компаний, блогеры и спортсмены.

Редакция ADPASS

10.02.2026

Реклама в ChatGPT: новый инвентарь на 800-миллионную аудиторию

Монетизация ИИ Чат-боты ChatGPT OpenAI Реклама

OpenAI начал показывать рекламу в ChatGPT — пока в тестовом режиме, пока только в США и только на двух тарифах: бесплатном и 8-долларовом Go. Но масштаб аудитории — 800 млн еженедельных пользователей, из которых оплачивают подписку только 5% — делает это событием для всего рекламного рынка. Еще в 2024 году глава компании Сэм Альтман называл перспективу появления рекламы в ИИ пугающей. Что заставило его передумать, и что получат рекламодатели?

Редакция ADPASS

03.02.2026

Расследование The Washington Post: зачем Илон Маск превратил Grok в генератор порно

Илон Маск ИИ ChatGPT xAI Порно Grok Скандалы Регулирование

The Washington Post опубликовала расследование о стратегии роста xAI Илона Маска. Издание выяснило: ИИ-компания сознательно сняла ограничения на сексуальный контент, чтобы нарастить аудиторию чат-бота Grok. Результат: попадание в топ-10 App Store, три регуляторных расследования и 23 000 сгенерированных изображений с признаками детской порнографии.

Неделя рекламы Новости Кейсы How to Интервью и дискуссии Маркетинговые исследования Просто о сложном Энциклопедия обмана Проверено ADPASS Рекламные кампании

ChatGPT Маркировка рекламы Маркетинг Digital Коммуникации Кризис Соцсети Медиа Контент Наружная реклама IT и инновации Госрегулирование Брендинг