Маркетинговые исследования

Редакция ADPASS

01.12.2023, 18:12

Кошки умнее искусственного интеллекта: что показало IQ-тестирование человека и нейросети

Искусственный интеллект (ИИ) провалил IQ-тест, разработанный франко-американскими исследователями. Тест из 466 вопросов создала группа в составе сотрудников компании Meta* и франко-американского стартапа Hugging Face, работающего с тематикой ИИ. Людям и нейросети GPT-4 — новейшей разработке компании OpenAI, предложили решить одинаковые задачи. Но нейрость давала в лучшем случае 30% верных ответов, а люди отвечали правильно в среднем в 92% случаев. Сегодня кошки существенно обгоняют системы ИИ по интеллекту, констатировали исследователи.

Изображение сгенерировано сервисом Bing Image Creator

Нейросеть, к вам есть вопросы

Группа исследователей решила критически оценить возможности существующих нейросетей и создала IQ-тест для искусственного интеллекта (ИИ). В группу входят руководитель ИИ-исследований в компании Meta* Янн Лекун, а также сотрудники франко-американского стартапа Hugging Face, разрабатывающего инструменты для приложений на базе ИИ, Клементин Фурье и Томас Вулф.

В ходе теста одни и те же задачи предложили решить группе людей и нейросети GPT-4 — новейшей разработке компании OpenAI. Тест под названием General AI Assistants (GAIA) состоит из 466 вопросов, для ответов на которые нужны фундаментальные когнитивные навыки: способность рассуждать, сочетать восприятие текста и изображений, искать сведения в интернете и пользоваться другими привычными для человека методами работы с данными.

В ходе теста нейросети предложили зайти на сайт и затем ответить на вопросы по содержащейся на нем информации. Другая задача предполагала анализ файла Excel с данными о продажах сети фастфудов и вычисление суммы выручки от тех позиций в меню, которые являются едой, но не напитками.

Более сложное для ИИ, но вполне посильное для человека, задание заключалась в том, чтобы найти в интернете информацию о суммарной длительности пребывания в открытом космосе одного из астронавтов NASA. Вместо имени астронавта нейросети предложили фото, где этот человек был изображен вместе с коллегой, и затем поручили идентифицировать его самостоятельно.

Искусственный интеллект не больше котенка

Результаты проверки оказались неутешительными для ИИ — в большинстве случаев людям удавалось справиться гораздо лучше. Нейросети даже на самые простые вопросы отвечали правильно лишь в 30% случаев, а на наиболее сложные вообще не могли ответить. У людей, состязавшихся с ИИ, правильных ответов было в среднем 92%.

Говорить о создании общего искусственного интеллекта (равного человеческому) пока преждевременно, заключают авторы исследования. Для этого ИИ-системы должны уверенно справляться хотя бы с теми когнитивными задачами, которые не представляют проблемы для среднестатистического homo sapiens.

Чтобы ИИ по когнитивным возможностям сравнился с человеком, в нейросети нужно заложить модель устройства мира, считает Янн Лекун. Пока же ИИ представляет собой просто системы, умеющие на базе заложенной в них информации с обманчивой точностью предсказывать, какое слово поставить следующим в предложении. «Фактически полное отсутствие у ИИ понимания физического мира и способности к планированию ставит эти системы по интеллекту существенно ниже кошки, не говоря уже о человеке», — написал Янн Лекун в соцсети X (экс-Twitter).

Писать умеет, считать — не очень

Математика — одна из областей, в которых нельзя доверять ChatGPT и другим чат-ботам. Складывать и вычитать нейросеть умеет, но в умножении уже на трехзначных числах появляются ошибки. В ходе исследования тайваньской Ассоциации компьютерной лингвистики и обработки китайского языка (Association for Computational Linguistics and Chinese Language Processing, опубликовано в октябре 2023 года), боту давали уравнения разной степени сложности. В итоге доля правильных ответов составила всего 64%. Когда нейросеть попросили сосчитать буквы, предложив 100 текстов из 50-69 букв каждый, ИИ в 66% случаях округлил ответ до 50.

Способности большой языковой модели GPT-4 в вычислениях ограничиваются математикой средней школы. Когда же дело доходит до интегралов, ИИ начинает часто ошибаться, говорится в исследовании группы ученых из ведущих европейских и американских университетов, опубликованном в июле 2023 года.

ADPASS обнаружил, что ChatGPT буксует даже на математических задачах для начальной школы. Нейросеть не поняла, что нужно сложить яблоки у детей и разделить получившуюся сумму (15) на три. Вместо этого она начала оперировать дробями:

ИИ-находка для шпиона

Еще один вариант «глупого» поведения ChatGPT выявили на этой неделе специалисты в области кибербезопасности из компании DeepMind, принадлежащей Google. Они обнаружили, что в ответ на простой, но необычный запрос чат-бот случайным образом выдает данные, на которых нейросеть была натренирована.

Когда исследователи попросили бота повторять слово «стихотворение» бесконечное число раз, то система сначала действительно повторяла. Но со временем бот стал выдавать, по всей видимости, случайные данные, а затем показал почтовый адрес и телефонный номер реально существующего предпринимателя, основателя одного из стартапов.

Когда «стихотворение» в запросе заменили на слово «компания», ChatGPT сначала повторял, а затем продемонстрировал адрес и телефон юридической фирмы из США. Персональная информация, очевидно, попавшая в нейросеть во время тренировки, выдавалась в 16,9% протестированных исследователями запросов на повторение различных слов.

Даже не смешно

Нейросети сегодня не способны заставить человека не то, чтобы рассмеяться, но просто улыбнуться. Двое немецких ученых выяснили, что в ответ на повторяемые просьбы пошутить ИИ выдал 1008 анекдотов. 90% из них оказались вариациями на тему 25 шуток, которые можно назвать смешными лишь с большой натяжкой.

Юмор — одна из тех областей, где невозможно добиться хорошего результата повторением почерпнутой из интернета информации. Чтобы удачно пошутить, необходимо понимать, что именно и почему является смешным, но устройство большой языковой модели никакого «понимания» не предполагает.

Пытающийся улыбаться робота сгенерировано нейросетью Midjourney.

Из-за того, что нейросети не в состоянии распознавать эмоции живого собеседника и адекватно реагировать на них, ответы ИИ часто воспринимаются как механистичные и отстраненные. Не даются ИИ и творческие задачи: чат-бот может написать стихи или рэп, руководствуясь загруженными образцами, но результат вряд ли будет хорошим.

* признана экстремистской организацией и запрещена в РФ

Авторы:

Николай Белый

#Искусственный интеллект #Исследования #ChatGPT

Редакция ADPASS

Главное про маркетинг и рекламу

в Telegram

Лучшее в блогах

15.07.2024

Блог-платформа ADPASS провела ребрендинг

Вчера

Брендинг-инсайты: Design Department, Endy, JAMI

Позавчера

Тренды дизайна в 2024: стили и технологии на пике популярности

Позавчера

СберСпасибо запустила рекламную кампанию обновлённой программы лояльности

Вам понравится

Редакция ADPASS

23 часа назад

Бокал вина в день пользы не принесет, доказали канадские наркологи

Исследования Здоровье

«Алкоголь в малых дозах безвреден в любом количестве», — заметил однажды Михаил Жванецкий. Широко известен так называемый «французский парадокс» — во Франции, жители которой славятся любовью к вину, уровень сердечно-сосудистых заболеваний ниже, чем в других странах. Множество научных исследований доказывают, что умеренное потребление алкоголя может быть полезно для здоровья. Одновременно множество научных исследований доказывает, что безопасной дозы алкоголя не существует. Точку в старом научном споре решили поставить канадские ученые. Они проанализировали 107 исследований о взаимосвязи умеренного потребления вина и риска смертности. Результаты их работы опубликованы в Journal of Studies on Alcohol and Drugs.

Редакция ADPASS

Вчера

Прогноз GroupM: глобальная реклама отстанет от российской

GroupM Исследования Объем рынка

Вслед за российской Group4Media, ранее входившей в мировую сеть GroupM, и глобальная рекламная группа улучшила свой прогноз развития рынка. В 2024 году мировая реклама уступит российской по росту в пять раз — 7,8% против 40%, да и первый триллион, правда рублей, российский рынок разменяет уже в этом году, а глобальный (в долларах) — в 2025-м.

Редакция ADPASS

12.07.2024

Спортивная трансляция как повод выпить

Исследования Потребительское поведение

Видеоролики с алкогольной рекламой, демонстрируемые во время спортивных трансляций, усиливают желание выпить любимый напиток у зрителей, склонных к рискованному употреблению алкоголя. Такой вывод содержится в статье группы исследователей из австралийского университета имени Эдит Коуэн, опубликованной в Health Promotion Journal of Australia. Статья вышла в свет незадолго до начала Олимпийских игр в Париже – первой в истории Олимпиады, официальным спонсором которой станет пивоваренная компания.

Редакция ADPASS

08.07.2024

Мужчина у плиты против мужчины на диване: какие образы в рекламе ближе российскому потребителю

Исследования Телеграм ТВ-реклама

Через полгода после отказа от телерекламы бренд начинает терять ключевые характеристики, при этом возврат рекламы в эфир не способен обеспечить быстрое восстановление показателей. Такие выводы содержит исследование, которое агентство «АРМИ-Маркетинг» представило на конгрессе Объединения исследователей рынка и общественного мнения в России (ОИРОМ). Другие докладчики рассказали, что россиян отталкивает реклама с уехавшими знаменитостями, феминистками и мужчинами с пивом на диване. При этом каждого девятого привлекает мужчина на кухне, а каждого восьмого — женщина-карьеристка без детей.

Новости Кейсы How to Интервью и дискуссии Маркетинговые исследования Просто о сложном Проверено ADPASS Рекламные кампании

ChatGPT Маркировка рекламы Маркетинг Digital Коммуникации Кризис Соцсети Медиа Контент Наружная реклама IT и инновации Госрегулирование Брендинг