26.09.2023, 18:43

ChatGPT подал голос: премиум-подписчикам дадут поговорить с ботом

ChatGPT превращается в нечто большее, чем просто текстовый ИИ-поисковик и генератор контента. 25 сентября 2023 года разработчик решения, компания OpenAI, объявила, что начинает внедрение на платформе нового функционала, основанного на работе с голосом и изображениями. OpenAI объединила уже привычный мир голосовых помощников с самой мощной на сегодняшний день большой языковой моделью (LLM). Теперь ChatGPT станет намного интерактивнее: пользователи смогут общаться с чат-ботом голосом. Первым новинкой воспользовался Spotify.

ChatGPT озвучат на пять голосов

Используемая OpenAI голосовая функция для нейросети основана на новой модели преобразования текста в речь, созданной на базе предыдущей голосовой разработки компании – системе распознавания речи с открытым исходным кодом Whisper. ChatGPT будет разговаривать с людьми пятью разными голосами, в создании которых участвовали известные актеры озвучания.

Как можно использовать голосовые возможности ChatGPT

Например, пользователь сможет устно попросить ChatGPT сочинить сказку на ночь, сопроводив просьбу несколькими голосовыми подсказками для направления повествования. Или можно просто произнести вопрос, а ChatGPT даст ответ в устной форме.

Другой метод использования нового функционала системы предлагает пользователю загрузить в нейросеть изображение, а потом устно задать вопрос о нем. Например, можно загрузить картинку с велосипедом и спросить ChatGPT, что это за модель или как опустить на нем сиденье.

Как включить функцию голосового общения в приложении ChatGPT

Голосовой апгрейд нейросети начнет распространяться среди платных подписчиков Plus и Enterprise в ближайшие две недели. Чтобы начать работу с голосом, перейдите в раздел «Настройки» → «Новые функции» в мобильном приложении и включите опцию «Голосовые разговоры». Затем нужно нажать на кнопку с изображением наушников, расположенную в правом верхнем углу главного экрана, и выберите предпочитаемый голос из пяти вариантов.

Spotify заговорит первым

Одной из первых компаний, интегрировавших новый функционал ChatGPT, стал стриминговый сервис Spotify. Платформа начала использование голосовых возможностей нейросети OpenAI в подкастах. Пилотный проект называется Voice Translation. Авторы контента смогут сэмплировать свой голос, а система переведет подкаст с английского на испанский, французский или немецкий язык, сохраняя при этом оригинальное звучание голоса подкастера и его интонации. Запуск Voice Translation состоялся одновременно с анонсом новых возможностей нейросети.

«Сопоставляя собственный голос автора, Voice Translation дает слушателям по всему миру возможность открывать для себя новых подкастеров и вдохновляться ими более аутентично, чем когда-либо прежде», — заявил Зиад Султан, вице-президент Spotify по персонализации.

Авторы:
Артемий Шохор
Редакция ADPASS
Главное про маркетинг и рекламу
в Telegram

Вам понравится

Media Direction Group
03.11.2023
Редакция ADPASS
02.11.2023
Media Direction Group
30.10.2023