17.03.2026, 13:59

Как предварительное тестирование креативов стало «бедой» российского рекламного рынка

Комитет креативных агентств АКАР запускает проект по разработке индустриального стандарта тестирования креативов. Эта статья — экскурс в историю. Мы хотим разобраться, как предварительное тестирование креативов в России превратилось в инструмент, который вредит, а не помогает рынку. Приглашаем к диалогу все заинтересованные стороны — рекламодателей, рекламные и исследовательские агентства.

Как все начиналось

Конец 50-х — начало 60-х годов, США — отправная точка в истории тестирования креативов для рекламы на ТВ. Именно американские коллеги придумали исследования под названием copytesting. Рекламный эфир на американском телевидении в этот период был «захвачен» узким кругом брендов. Каждый из них мог быть единственным спонсором телешоу и пачками выпускать минутные ролики для одного и того же продукта (так делал, например, P&G — благодаря которому еще в 30-х появились знаменитые «мыльные оперы»). Этому способствовала относительно небольшая стоимость производства — порядка $10 тыс. за ролик

Фото: мыльная опера «Путеводный свет» от P&G / Кинопоиск

Но ситуация стала меняться. Конкуренция и бюджеты росли, рекламодатели склонялись к тому, чтобы выпускать роликов «меньше, но лучше». Исследовательская компания Gallup & Robinson первой увидела перспективную нишу: почему бы не предложить рекламодателям тестировать ролики для ТВ, чтобы выявлять наиболее эффективные?

Просмотр «подопытных» роликов был организован в исследовательском центре G&R. Респондентам показывали реальную ТВ-программу с рекламными блоками, куда были включены тестируемые ролики. Затем участников опрашивали (запомнили ли рекламу, бренд, и т.д.) и фиксировали результаты.

Оценку проводили и в прямом в эфире. On-air тесты были ограничены по времени и количеству регионов для трансляции. Разные версии роликов могли одновременно показывать в разных штатах, чтобы затем сравнить их показатели. Ролики — чемпионы тестов — попадали в эфир национального вещания. Какие метрики брали в расчет? Сначала исследователи возвели в абсолют запоминаемость (recall), затем на первый план вышла убедительность рекламы (persuasiveness). Также стали измерять связь с брендом (brand linkage), понимание сообщения (message take-out), «нравится» ли реклама респондентам (likeability) и т.д.

К началу 80-х крупные рекламодатели начали тестировать «сырой» материал (раскадровки, аниматики), надеясь оценить потенциал креатива до продакшена. Рынок копитестинга рос — услугу предлагали порядка 50 компаний. В 1981 году американские рекламодатели потратили на пре-тесты $53 млн, протестировав 9 тыс. роликов. Но уже тогда случился первый «кризис доверия» к пре-тестам. Рекламодатели и агентства сомневались в надежности измерений, прозрачности результатов и обоснованности выводов.

Поэтому в 1982 году индустрия сформулировала PACT (Positioning Advertising Copy Testing) — принципы копитестинга. В их создании участвовало 21 ведущее рекламное агентство США при поддержке ARF (Advertising Research Foundation). В PACT говорится о том, что измерения не могут быть универсальными, и тест должен соотноситься с целями тестируемой рекламы — тем, что заложено в брифе. В список принципов вошли репрезентативность выборки, надежность и валидность измерений, одинаковая степень готовности «тестовых» материалов, максимально реалистичные условия тестирования. Также документ подчеркивал, что пре-тесты можно использовать скорее как инструмент диагностики, а не однозначной и окончательной оценки, и их прогностическую ценность завышать не стоит.

«Принципы PACT»  / интернет-архив

Как появление PACT повлияло на рынок? Развивались диагностические методы с измерением внимания (attention), понимания сообщения (comprehension), актуальности (relevance), правдоподобия (credibility), связи с брендом (brand linkage). Исследователи стали искать способы измерить эмоциональный отклик аудитории на рекламу. В 1990-е был популярен dial testing, когда респондент оценивает материал прямо во время просмотра, поворачивая специальный регулятор, тем самым отмечая положительную или негативную реакцию на увиденное. Позднее попытались фиксировать отклик с помощью замеров активности мозга, анализа мимики (face coding) и направления взгляда (eye-tracking).

Предварительные тесты теряли статус «оракула». Они использовались как вспомогательный инструмент для диагностики и «донастройки» креатива: считывается ли идея, нет ли «опасных» ассоциаций. Нередко работы, которые показывали «плохой» результат на пре-тестах, все равно выходили в эфир. И становились культовыми. Например, ролики Guinness «Серфер», «Dreamer» и «Гонка улиток». Они были предварительно протестированы с помощью системы Link Test от Millward Brown, но показали невысокие результаты. В частности, в ролике «Серфер» сообщение, по данным теста, «не передавалось достаточно четко». Для большей ясности в начало ролика был добавлен закадровый голос. В 2000 году зрители Channel 4 признали его лучшим рекламным роликом всех времен.

Видеоролик «Серфер» / Guinness

В 2005 году основатель исследовательской компании Ameritest Чарльз Янг задавался вопросом: почему несмотря на эволюцию и все большее «научное обоснование» копитестинга, он остается источником разочарований? «Дело в преувеличенных обещаниях и чрезмерном упрощении сложного предмета — вопроса о том, как бесконечное множество и разнообразие ТВ-роликов «проникают» в мозг человека, чтобы влиять на его поведение. Когда задумываешься об этом, ракетостроение кажется чем-то более простым», — отмечал он.

Сегодня в США тоже нет полного доверия к пре-тестам. В прошлом году в сети разразился спор по поводу эффективности исследований компании System1, которая заявила о «самом предсказательном тесте рекламы в мире». Суть метода — измерение «реальных человеческих эмоций для прогнозирования продаж и роста».

System1 упрекнули в том, что в своих тестах она измеряет 8 чувств, 5 из которых — негативные, одно — нейтральное и только два — относятся к позитивным. «Это ограниченный инструмент, который покупает уверенность. Он не доказывает эффективность, а говорит лишь о ряде эмоциональных реакций в странно ограниченном масштабе — с тенденцией к крайне негативным оттенкам», «Если какой-нибудь уважающий себя маркетолог всерьез верит, что телевизионный пре-тест на выборке из 150 человек (из которых около 50, скорее всего, боты или не вовлеченные респонденты) способен предсказать долю рынка, ему стоит немедленно уйти в отставку», — отреагировали американские рекламисты.

Как пре-тестинг завоевал Россию

В России исследовательский рынок возник вместе с рекламным — в начале 1990-х. Поначалу ни у кого не было и мысли тестировать ТВ-рекламу. Ситуацию изменили западные бренды, которые стали активно заполнять рекламное пространство своими продуктами. Появилась задача адаптировать западные коммуникации к российскому рынку. Любимым инструментом исследователей стали фокус-группы, на которые приглашались представители клиента. Для них это было отчасти развлечение, «шоу» — посмотреть через стекло, как респонденты реагируют на их рекламу. Формирование доверия к пре-тестам было важной частью внедрения их в маркетинговые процессы. В первое время качественные измерения не имели конкретных метрик и нацелены были, главным образом, на избежание грубых ошибок в коммуникациях.

В середине 2000-х в РФ стали появляться стандартизированные тесты. Одним из пионеров в этом деле была компания ARMI (часть сети Millward Brown). Методика Millward Brown предлагала конкретные метрики и возможность сравнить результаты тестов с бенчмарками из мирового опыта исследований.

Во второй половине 2010-х подход к тестам изменился: развивались онлайн-методики, увеличилась доля исследований in-house, появились  DIY-инструменты (Do-It-Yourself) — автоматизированные программные решения и платформы — с готовыми решениями для исследований «на скорую руку». Идеология quick-and-dirty («дешево и сердито») стала доминировать на рынке. Быстро получить некие оценки, не задумываясь, насколько они отражают реальную картину, стало почти нормой. 

Сегодня на тест выносятся «черновики» будущих рекламных роликов — от синопсисов до аниматиков. При всем желании они не складываются в готовое произведение «в голове» у респондента. Злую шутку с рекламодателем может сыграть и склонность людей выбирать нечто стандартное, усредненное, уже знакомое по телевизионному эфиру. В итоге побеждает «креатив», который могут спасти, разве что, огромные медиавеса. 

Почему здравые принципы, которые были озвучены больше 40 лет назад, оказались забытыми в нашей стране? Мы сами загнали себя в ловушку бесцельных тестов, где респонденты, не имеющие нужных компетенций и воображения, рассуждают о «симпатичности» рисованных персонажей, об уникальности сюжета, об эффективности коммуникаций и т.д. Возможно, пора обратиться к первоисточнику — тому самому PACT? Вспомнить принцип — соответствие теста целям рекламы. Или с опорой на тот же PACT сформировать свои принципы, которые помогут рынку выйти из замкнутого круга методологически ошибочных тестов и как следствие — однотипной безвкусицы в рекламном эфире.

АКАР
Ассоциация коммуникационных агентств России — некоммерческая организация, которая включает в себя более 200 профессиональных игроков рынка коммуникационных услуг России.