АНАЛИЗ ВОЗМОЖНОСТЕЙ СИСТЕМЫ МОНИТОРИНГА ЛОЖНОЙ ИНФОРМАЦИИ В СОЦИАЛЬНЫХ СЕТЯХ

С.Г.КЛЮЕВ
А.Г.АЛЕКСАНДРОВ

Исследованы вопросы обнаружения ложной информации (фальшивых новостей) в социальных сетях с использованием базы данных «FakeNewsNet». Обнаружение ложных новостей – это необычная задача, которая требует использования нескольких источников информации. Новостной контент и социальный контекст очень важны для противодействия распространению ложной информации и снижения влияния фальшивых новостей на общество. Делается вывод о том, что создание в России базы данных, помогающей выявлению ложной информации в социальных сетях, может послужить отправной точкой для исследований, касающихся проблемы фальшивых новостей, и обеспечить лучшее понимание тактики дезинформации.

Ключевые слова: социальные сети, ложная информация, мониторинг, база данных выявления фейковых новостей, фальшивые новости, профиль пользователя.

 

Социальные сети стали популярным средством получения информации. Это дает возможность широкого распространения через них так называемых фальшивых новостей, то есть сообщений, содержащих заведомо ложную информацию, оказывающую существенное негативное влияние на общество. Обнаружение таких новостей – нетривиальная задача, которая требует использования нескольких источников информации. В том числе новостного контента и социального контекста. Фальшивые новости создаются с целью обмана людей таким образом, что их тяжело обнаружить просто на основании изучения содержания самой новости. В дополнение к содержимому новостного контента необходимо исследование социальных контекстов, таких как вовлеченность пользователей и социальное поведение. Например, заслуживающий доверия комментарий пользователя о том, что новость является фальшивой, является сильным сигналом для обнаружения ложной информации. Кроме того, немаловажным источником, способствующим обнаружению и изучению фальшивых новостей, является динамическая информация, связанная с процессами распространения новостей (как фальшивых, так и правдивых).

Таким образом, комплексные наборы данных, содержащие новостной контент, социальный контекст и динамическую информацию очень важны для формирования полезных шаблонов с целью раннего обнаружения фальшивых новостей и вмешательства в процесс их распространения, что, в свою очередь, приведет к снижению их влияния на общество.

Основным источником новостей в настоящее время являются социальные сети. Они позволяют бесплатно и легко выражать свое мнение публично и, следовательно, являются хорошим источником потребления информации. Время, которое люди тратят на социальные сети, постоянно увеличивается. Анализ, проведенный исследовательским центром «Pew Research Center», показывает, что около 67% жителей развитых стран читают новости в социальных сетях, и рост этого показателя продолжается с 2016 года. Поскольку в социальных сетях нет регулирующего органа, качество распространяемых в них новостей зачастую ниже, чем у тех, которые публикуются в традиционных источниках информации. Другими словами, социальные сети обеспечивают широкое распространение фальшивых новостей. Такие новости как особый тип дезинформации представляют собой ложную информацию, преднамеренно распространяемую в целях обмана большого количества людей.

Фальшивые новости затрагивают как отдельных людей, так и общество в целом. Во- первых, они могут нарушить баланс подлинности новостной системы. Во-вторых, убеждают потребителей принимать ложные или предвзятые решения. Например, некоторые люди и организации распространяют фальшивые новости в социальных сетях для финансовой и политической выгоды. Кроме того, их используют для оказания влияния на результаты выборов в различные органы государственной власти, с целью дискредитации неугодного и продвижения «нужного» кандидата. Наконец, фальшивые новости изменяют способ интерпретации людьми правдивых новостей и то, как они реагируют на новости в целом. Таким образом, обнаружение фальшивых новостей является критически важной проблемой, требующей эффективного решения.

Обнаружение фальшивых новостей в социальных сетях представляет собой трудноразрешимую проблему по нескольким причинам. Во-первых, тексты таких новостей специально написаны для того, чтобы ввести потребителей информации в заблуждение, что делает затруднительным обнаружение фальшивых новостей в общем новостном контенте. Необходимо проводить исследование информации в дополнение к имеющемуся новостному контенту, например социальных обязательств и социального поведения пользователей в социальных сетях. Так, заслуживающий доверия комментарий пользователя о том, что какая-то новость – «это чушь собачья», является сильным сигналом о том, что данный пользователь не верит новостям и, следовательно, новость может быть фальшивой. Во-вторых, исследовательскому сообществу не хватает наборов данных, содержащих динамическую информацию, чтобы понять, как фальшивые новости распространяются, как пользователи реагируют на них и каким образом можно извлечь полезные шаблоны для обнаружения таких новостей и вмешательства в информационный поток в целях дезинформации. То есть необходимо владеть очень большим набором данных, которые содержат новостной контент, социальный контекст и динамическую информацию, чтобы облегчить исследования фальшивых новостей.

В США для выявления фальшивых (фей- ковых, как модно сейчас там их называть) новостей и их нейтрализации активно используется система мониторинга ложных новостей, основанная на базе данных «FakeNewsNet» . В базе содержится набор данных с новостным контентом, социальным контекстом и динамической информацией. База данных «FakeNewsNet» обладает потенциалом для стимулирования анализа различных открытых исследований, связанных с изучением фальшивых новостей. Во-первых, богатый набор функций предоставляет возможность экспериментировать с различными подходами к обнаружению вновь публикуемых фальшивых новостей, выявлять возможности распространения таких новостей в социальных сетях и вмешиваться в эти процессы. Во-вторых, динамическая информация позволяет изучать процесс раннего обнаружения фальшивых новостей, генерируя взаимодействие с пользователями из исторических временных шаблонов взаимодействия с пользователем, имеющихся в наборе данных. В-третьих, возможно исследование процесса распространения фальшивых новостей, выявление этапа их происхождения, разработка стратегии вмешательства в такие новости.

Одной из проблем, связанных с обнаружением фальшивых новостей, является отсутствие маркированного набора эталонных данных с надежными метками достоверности и всеобъемлющим информационным пространством, на основе которого возможна фиксация эффективных функций и создание модели. «FakeNewsNet» помает в решении задачи обнаружения фальшивых новостей, так как располагает надежными ярлыками, а также многоплановой информацией из новостного контента, социального контекста и динамической информацией.

Считаем, что создание в Российской Федерации аналогичной базы данных может стать отправной точкой для многих исследований фальшивых новостей в социальных сетях и обеспечить лучшее общее понимание тактики дезинформации. Проиллюстрируем особенности «FakeNewsNet», чтобы понять, каким же образом составляется такая база данных и как использовать ее при изучении новостей на территории России.

«FakeNewsNet» как индикатор осуществляет анализ данных на основе информации, связанной с новостным контентом, социальным контекстом и динамической информацией. Рассмотрим по порядку:

1. Оценка новостного контента. Поскольку фальшивые новости пытаются распространять ложные утверждения в новостном контенте, наиболее простым способом их обнаружения является поиск улик в самой новостной статье. Список репрезентативных атрибутов новостного контента включает издателей, заголовки, основные тексты, изображения и видео. Первоначально подлежит анализу тема распространения фальшивых и реальных новостных статей. Так как «FakeNewsNet» является базой данных, разработанной в США, возьмем за основу новостной контент этой страны. Можно заметить, что фальшивые и реальные новости из набора данных «PolitiFact» в основном связаны с политическими кампаниями. В случае с набором данных «GossipCop» фальшивые и реальные новости в основном связаны со сплетнями о взаимоотношениях между знаменитостями. Однако для конкретных новостей для обнаружения ложной информации трудно использовать только темы в контенте. Требуется использование другой вспомогательной информации, такой как социальный контекст. Хорошим индикатором для распознавания фальшивых новостей являются заголовки публикуемых новостных материалов. Они могут использоваться для извлечения различных лингвистических маркеров с целью дальнейшего построения моделей обнаружения «приманок» в заголовках фальшивых новостей.

Специалистами «FakeNewsNet» изучено определенное количество пользователей, которые опубликовали фальшивые новости в обоих вышеуказанных наборах данных. Проведенное исследование показало, что 301 пользователь в общей сложности опубликовал 432 фальшивых новости, в том числе 191 опубликовал только по 1 недостоверной новости, а 40 – как минимум 2. Результаты исследования позволяют разработчикам «FakeNewsNet» выявлять пользователей, которые наиболее склонны к публикации или распространению фальшивых новостей.

2. Измерение социального контекста. Социальный контекст представляет собой процесс распространения новостей с течением времени, который дает полезную вспомогательную информацию для определения достоверности новостных статей. Как правило, можно говорят о трех основных аспекта контекста социальных сетей: профили пользователей, публикации пользователей и сетевые структуры. Профили пользователей в социальных сетях коррелируют с обнаружением фальшивых новостей. Также следует обратить внимание на то, что такие новости могут создаваться так называемыми социальными ботами, то есть компьютерными программами, специально разработанными для распространения с аккаунтов в социальных сетях фальшивых новостей без участия человека.

База данных «FakeNewsNet» анализирует информацию, устанавливая, отличается ли время создания учетных записей пользователей для фальшивых новостей и реальных новостей. Она вычисляет временной интервал между регистрацией аккаунта и текущей датой публикации новости. Пользователи, которые публикуют реальные новости, как правило, зарегистрировались в социальной сети много лет назад. Пользователи, публикующие фальшивые новости, обычно имеют аккаунт, созданный не более года назад.

Люди выражают свои эмоции или мнения по поводу фальшивых новостей через комментарии в социальных сетях. Эти данные являются важными сигналами для изучения таких новостей и дезинформации в целом. «FakeNewsNet» проводит анализ настроений в ответах на сообщения пользователей, которые распространяют фальшивые и реальные новости. Следует отметить, что последние имеют большее количество нейтральных отзывов на положительные новости, в то время как фальшивые – большее количество отрицательных комментариев. Также следует отметить, что фальшивые новости имеют меньше комментариев и много «ретвитов» по сравнению с реальными новостями в социальных сетях; реальные новости имеют большее количество «лайков» по сравнению с фальшивыми.

3. Изучение динамической информации (то есть информации, которая может изменяться в течение определенного промежутка времени). Динамическая информация в «FakeNewsNet» отражает временные отрезки участия пользователей в новостных статьях. Данные периоды времени для публикаций, связанных с фальшивыми и реальными новостями, отличаются. Например, фальшивые новости чаще всего публикуются ночью, когда люди обычно неактивны. Чаще всего это связано с программированием учетных записей ботов в течение дня. В отношении фальшивых новостей происходит резкое увеличение количества «ретвитов» за короткие промежутки времени, тогда как в случае с реальными новостями наблюдается постепенное увеличение числа «ретвитов» в течение длительного промежутка времени.

В российском законодательстве есть два федеральных закона, обеспечивающих правовою борьбу с распространением ложной информации в средствах массовой информации и информационно-телекоммуникационных сетях: от 18 марта 2019 г. № 31-ФЗ «О внесении изменений в статью 15 Федерального закона «Об информации, информационных технологиях и о защите информации»»; от 18 марта 2019 г. № 27-ФЗ «О внесении изменений в Кодекс Российской Федерации об административных правонарушениях». Этими законами устанавливается административная ответственность за распространение в средствах массовой информации и информационно-телекоммуникационных сетях заведомо недостоверной общественно значимой информации под видом достоверных сообщений.

Административная ответственность позволит обеспечить защиту от так называемых «сетевых террористов». А механизм оперативной блокировки позволит предотвратить панические настроения, возникновение которых возможно вследствие распространения опасной лжи. Генеральный прокурор Российской Федерации или его заместители, согласно принятым изменениям в действующее законодательство, должны обращаться в Роскомнадзор с требованием о принятии мер по ограничению доступа к информационным ресурсам, распространяющим такую информацию.

Наименьшее наказание полагается за распространение информации, создавшей угрозу причинения вреда жизни и здоровью граждан, имуществу, угрозу массовых беспорядков, угрозу нарушения функционирования объектов жизнеобеспечения. Штрафы варьируются от 30 до 300 тысяч рублей. Более серьезное наказание установлено за рецидив, оно применяется и в случае возникновения последствий в виде помех функционированию объектов жизнеобеспечения – штраф от 100 тысяч до 1 млн рублей. Самое строгое наказание предусмотрено за распространение информации, повлекшее причинение вреда гражданам или имуществу, массовые беспорядки, – штраф до 1,5 млн рублей. Для традиционных медиа (то есть зарегистрированных средств массовой информации, которые имеют лицензию или свидетельство) наказание за распространение фальшивых новостей существовало и ранее, так что рассмотренные новации в законодательстве в первую очередь касаются сайтов таких СМИ (газет, журналов, ТВ-каналов и т.п.).

Подводя итог, следует отметить, что в Российской Федерации на данный момент нет базы данных для анализа новостей, публикуемых в социальных сетях. По нашему мнению, существует необходимость создания в России системы мониторинга новостей, основанной на базе данных, созданной по подобию «FakeNewsNet», и разработки индикатора, с помощью которых мог бы осуществляться контроль за достоверностью публикуемой информации, а также возможно было бы выявлять фальшивые новости на раннем этапе их появления.

Источник: Научно-теоретический журнал “Вестник Калининградского филиала Санкт-Петербургского университета МВД России”. № 4 (58) 2019.

Просмотров: 18

Добавить комментарий

Ваш адрес email не будет опубликован.

*

code