10.04.2024, 14:20

Нейроментарно, Ватсон: Роскомнадзор привлечет ИИ к поиску незаконного контента в рунете

Роскомнадзор уже в этом году начнет анализировать тексты российских сайтов и вести Единый реестр запрещенной информации с помощью искусственного интеллекта (ИИ). Нейросети помогут ведомству сократить сроки поиска незаконного контента, количество ошибок и персонал на обслуживание системы. В США и Европе модели с искусственным интеллектом рекомендованы к использованию для блокировки незаконного контента. Но участники рынка предупреждают, что для функционирования подобных систем необходимы большие вычислительные мощности, которыми в России пока располагают лишь «Яндекс» и, возможно, VK Group.

МИР с ИИ

Инструменты ИИ будут внедрены в информационную систему мониторинга интернет-ресурсов (ИС МИР), сообщает «Коммерсант» со ссылкой на новую версию паспорта программы цифровой трансформации ведомства.

ИС МИР предназначена для выявления запрещенной информации в интернете и маркировки материалов в зависимости от их содержания (нейтральное, негативное или позитивное мнение автора), а также поиска перепечаток таких текстов.

В 2023 году, когда Роскомнадзор не использовал ИИ, система выявляла запрещенный интернет-контент через три часа после его публикации. С искусственным интеллектом в 2024 году ведомство планирует делать это за час, а в 2026-м сократить время поиска до одного часа.

В рекламно-технологических компаниях считают, что для обработки информации всего рунета потребуются огромные мощности. Они есть «разве что у Yandex и, возможно, VK Group», сказал ADPASS директор по продукту рекламно-технологической компании UMG Владилен Ситников. По его мнению, если еще применять алгоритмы для обработки данных, требуемые вычислительные мощности возрастут кратно. «Практическое применение упомянутого в статье пока что выглядит неправдоподобным, во всяком случае, в существенном масштабе», — считает эксперт.

Даже если предположить, что реализацию проекта возьмет на себя компания с достаточными ресурсами и опытом, возникают очевидные вызовы, связанные с приватностью данных и свободой слова, полагает Владилен Ситников. «Важно, чтобы использование ИИ для регулирования контента сопровождалось прозрачными процедурами и четкими критериями оценки, чтобы минимизировать риск ошибочной классификации и обеспечить справедливый баланс между защитой пользователей и свободой информации», — отметил эксперт.

ИИ экономит время и деньги

Нейросети помогут снизить процент контента, ошибочно признанного незаконным системой МИР, с 20% в 2023 году до 10% в 2026-м, утверждают авторы паспорта программы. За счет внедрения ИИ ведомство сократит издержки на персонал, обслуживающий систему, а также сможет «выявлять сложные контекстуальные связи между текстовыми фрагментами, находить скрытые закономерности и ассоциации», уверены собеседники «Коммерсанта». Впрочем, «даже через два года доля выявляемого запрещенного контента, который потребует дополнительной модерации человеком, вряд ли будет ниже 60%», считает глава департамента расследований компании T.Hunter Игорь Бедеров.

Ведомство планирует в течение двух лет начать использовать искусственный интеллект для ведения реестра операторов, осуществляющих обработку персональных данных. Однако их будет сложнее автоматизировать. Например, некоторые интернет-магазины могут отображать документы по обработке персональных данных «только в процессе регистрации пользователя или оформления заказа», рассказала изданию гендиректор разработчика интеллектуальных систем сбора и анализа данных «Социальная лаборатория» Наталия Тылевич.

В паспорте программы речь идет только об использовании искусственного интеллекта в поиске незаконных текстовых файлов в рунете, об интеграции ИИ в систему обнаружения нарушений в изображениях и видео — ИС «Окулус» — информации нет. Система «Окулус» была запущена подведомственным Роскомнадзору ФГУП «Главный радиочастотный центр» в феврале 2023 года. Она распознает незаконные изображения, символы, противоправные сцены и действия. Также «Окулус» анализирует текст в фото- и видеоконтенте.

ИИ-блокировщики контента в других странах

В США принципы «сетевой нейтральности» и «открытости интернета», по которым было запрещено блокировать или замедлять сайты, были отменены в 2017 году. Федеральная комиссия по коммуникациям США (FCC) предписала интернет-провайдерам, таким, как Comcast, Verizon и AT&T определять незаконный контент и ограничивать доступ пользователей к таким сайтам и онлайн-сервисам. Comcast с 2020 года использует модели с искусственным интеллектом для блокировки незаконного контента, но система не идеальна. В сентябре 2022 года кинокомпания Voltage Pictures, владеющая правами на такие фильмы, как «Далласский клуб покупателей» и «Красотка на всю голову», подала в суд на Comcast за то, что он не блокировал пиратские сайты и «способствовал тому, чтобы клиенты смотрели пиратский контент».

В Европе также с 2017 года действует Регламент государственной кооперации в области защиты прав потребителей. Он позволяет национальным организациям по защите прав потребителей приказать любой третьей стороне (в основном интернет-провайдерам) блокировать доступ к веб-сайтам без судебного решения. В апреле 2021 года Европейский парламент принял закон, требующий от интернет-компаний «удалять или отключать доступ к контенту, помеченному как террористический» в течение одного часа после уведомления национальных властей. Для того, чтобы найти такой контент в сжатые сроки, Европарлимент рекомендовал использовать инструменты искусственного интеллекта. ИИ в Европе используется не только для поиска нежелательного контента, но и для определения возраста пользователей для авторизации в соцсетях. В июне 2022 года Комиссия по защите молодёжи в медиасфере Германии (KJM) одобрила использование ИИ-систем, которые определяют возраст пользователя по биометрическим данным, чтобы оградить детей и молодежь от «вредоносного контента».

Авторы:
Алина Губина
Редакция ADPASS
Главное про маркетинг и рекламу
в Telegram

Вам понравится

Редакция ADPASS
25.04.2024
Редакция ADPASS
15.04.2024
Журналистам покинуть поиск: в США Google снова не хочет платить медиакомпаниям за контент

В минувшую пятницу 12 апреля гиперссылки на новостные сайты исчезли из поисковой выдачи Google у некоторых жителей штата Калифорния. Таким способом технологический гигант пригрозил законодателям штата, которые рассматривают закон, обязывающий Google платить медиакомпаниям за ссылки на контент. Местные депутаты хотят обложить интернет-платформы ежеквартальной «платой за использование» материалов, созданных журналистами. Аналогичную инициативу рассматривают в США и на федеральном уровне. Похожие законы уже приняты в Австралии и Канаде, а в Бразилии, Индонезии и Швейцарии находятся в стадии обсуждения. В случае их принятия размер возможных компенсаций для Meta* оценивается в $1,9 млрд в год, а для Google – $10-12 млрд.

Редакция ADPASS
09.04.2024
Редакция ADPASS
04.04.2024
Как создать полезный гид
для предпринимателей?