Очень часто в форме оплаты в интернете или в анкете банка можно найти графы, которые нужно заполнить, но которые абсолютно не относятся к предмету сделки или соглашения. Организации собирают персональные данные граждан «на всякий случай» и часто не могут обеспечить их сохранность. Роскомнадзор решил изменить практику излишнего сбора персональных данных и предложил создать стандарты их обработки, согласно которым организации смогут собирать только те данные, которые необходимы для решения конкретных задач. Мнения экспертов по поводу инициативы Роскомнадзора разделились. Юристам идея службы понравилась, так как концептуально совпадает с европейскими нормами. Бизнесмены же считают, что в случае принятия стандартов они затормозят рост компаний и развитие новых сервисов.
Роскомнадзор против OpenAI: служба рекомендует заблокировать поискового бота компании
Несколько хостинг-провайдеров получили письмо от Роскомнадзора о выявлении поискового робота от компании OpenAI. Ведомство рекомендует заблокировать боту возможность просматривать сайты для «исключения сбора информации о критических уязвимостях ресурсов». В случае запрета деятельности подобных алгоритмов бизнес может прибегнуть к альтернативным методам сбора данных, например, замаскировав бота под обычного посетителя сайта, отмечают эксперты.
Что такое поисковый робот
Поисковый робот (или бот, сканер, паук, обходчик) – программа, которая автоматически обходит сайты и анализирует контент на них (например, изображения или текст). Порядок обхода сайтов и данные, которые бот собирает и анализирует, задаются его владельцами. Бот может обходить все сайты подряд или переходить по ссылкам с одного на другой. Информация, собранная ботом, далее анализируется. В случае с поисковыми ботами этот процесс называется «индексацией». Для поддержания актуальности собранной информации, боты работают постоянно – один и тот же сайт может обследоваться ботом несколько раз в день.
Самые известные боты – поисковые. Это: Googlebot, Bingbot и Yandexbot.
11 декабря Главный радиочастотный центр (ГРЧЦ, подчиняется Роскомнадзору) направил ряду хостинг-провайдеров письмо с рекомендациями по выявлению и блокировке бота GPTBot компании OpenAI. В документе, с которым ознакомился «Коммерсант», рекомендуется оценить риски сбора ботом информации об уязвимости ресурсов или «иной чувствительной информации, в том числе содержащей персональные данные». В случае выявления таких рисков ГРЧЦ рекомендует заблокировать бота и приложил инструкцию, как это сделать.
Вредоносные боты атакуют рунет
В ноябре 2023 года специализирующаяся на интернет-безопасности компания Qrator Labs отметили всплеск активности вредоносных ботов. Их атакам в первую очередь подвергались интернет-магазины в период распродаж. 40,7% атак обезличенных ботов пришлось на период с 24 по 30 ноября. Самая масштабная атака была проведена 26 ноября – тогда Qrator Labs зафиксировала 5,2 млн запросов. По данным компании, большинство запросов к российским ресурсам поступало именно от GPTBot.
GPTBot был запущен OpenAI в августе. Бот сканирует интернет-ресурсы с целью сбора информации, которая впоследствии используется для обучения нейросети. Вскоре после запуска компания подверглась критике за несанкционированный сбор данных. После этого OpenAI опубликовала руководство, как запретить или частично ограничить сбор данных ботом.
«Сам по себе GPTBot оформлен максимально корректно, он всегда «представляется», когда появляется на сети, и заявляет о соблюдении правил доступа для ботов, заданных владельцами ресурсов», отметил менеджер продукта Qrator.AntiBot в Qrator Labs Георгий Тарасов. По его словам, кроме опубликованного руководства OpenAI опубликовала список IP-адресов серверов, с которых происходят обращения GPTBot.
По мнению Георгия Тарасова, если компании будут блокировать доступ для GPTBot и других AI-поисковых ботов, то AI-компании могут прибегнуть к другим методам сбора и актуализации данных. Например, рассказал эксперт, это может быть маскировка ботов под обычных пользователей или покупка агрегированных данных у владельцев бот-ферм.
Лучшее в блогах
Вам понравится
8 октября 2024 Роскомнадзор заблокировал в России Discord — самый популярный игровой мессенджер в мире. Как сообщила служба, блокировка связана с размещением противоправной информации, которая могла использоваться в террористических и экстремистских целях для вербовки граждан, продаже наркотиков и других незаконных действиях. Бан Discord не понравился не только геймерам. Против блокировки платформы выступил вице-спикер Госдумы Владислав Даванков и военкоры, которые рассказали, что мессенджер используется военными. На фоне блокировки Discord почти незаметной осталась новость о том, что РКН заблокировал несколько страниц на игровой платформе Steam.
Министерство юстиции США опубликовало ряд рекомендаций федеральному судье, который должен вынести вердикт о санкциях против компании по проигранному делу о монополизме на рынке поиска. Среди них: продажа части продуктов и направлений бизнеса Google, требование делиться данными о пользователях с конкурентами и ограничения по обучению моделей искусственного интеллекта и включению контента сайтов в ИИ-поиск.
Работники судебных и регуляторных органов всех стран как сговорились и единым фронтом пошли на технологических гигантов. Meta* должна ограничить использование персональных данных в рекламе. Google — допустить сторонние магазины в Google Play. TikTok — не навязывать рекламу, Amazon — ответить за злоупотребление монопольным положением.
ПОДПИСКА
ВАШ ЗАПРОС ДОСТАВЛЕН
О блогах ADPASS: правила, рекомендации, ответы на вопросы