​Источник распространения экстремистской и другой запрещенной информации в социальных сетях теперь можно будет вычислить за считаные минуты. Алгоритм, созданный российскими учеными, позволяет получить графическую картинку, на которой отображены основные каналы распространения нежелательного контента. На ней также наглядно видно, кто простой потребитель, а кто — активный распространитель. Результативность работы алгоритма доказали экспериментально, использовав сеть «ВКонтакте».

Схема распространения

С появлением соцсетей пользователи интернета стали не только получателями информации, но и ее источниками. Люди часто делятся картинками и текстами с помощью репоста или сообщения. Однако зачастую эти данные представляют собой нежелательный контент, связанный с деятельностью запрещенных организаций, призывом к опасным для жизни или уголовно наказуемым действиям. Поэтому перед учеными была поставлена задача — найти методы выявления каналов и источников распространения подобной информации.

Конечно, можно просто собрать все репосты и найти самый первый по времени выкладывания его в Сеть. Однако на практике реализовать такой подход крайне сложно, он требует огромных ресурсов. Ученые из Санкт-Петербургского института информатики и автоматизации РАН предложили иной вариант — сбор сведений о пользователях или группах, между которыми осуществлялся репост.

Социальную сеть можно представить как совокупность взаимосвязанных объектов — пользователей, сообществ, постов. Они так или иначе связаны между собой: люди могут находиться в друзьях или в одной группе, профиль пользователя содержит ссылки на родственников и т.д. Эти данные собираются и помещаются во временное хранилище, а затем удаляются из него согласно законам РФ.

— Допустим, пользователь (приемник) скопировал пост из сообщества (источник) на свою страницу, — рассказала научный сотрудник лаборатории проблем компьютерной безопасности СПИИРАН Лидия Виткова. — Мы разработали алгоритм, находящий все записи пользователей или групп, у которых появлялся данный репост. Далее наш алгоритм строит схему объектов, между которыми происходил обмен постами.

Ключевая точка

Описать созданный учеными алгоритм можно следующим образом. При передаче информации от источника распространения далее можно наблюдать факт «затухания» или искажения первоначальной версии. Это можно использовать, чтобы двигаться по цепочке обратно — от скопированного поста к оригинальному.

Кроме того, разработчики взяли ключевые слова для оценки целевой направленности создания страницы или профиля. Например, в группе, посвященной деятельности экстремистской организации, будут посты исключительно на данную тему. В таком сообществе рассчитываемый по особому методу процент ключевых слов составит 100%. На странице же пользователя или другой тематической группы будут также картинки или сообщения на иные темы, следовательно, процент ключевых слов уменьшится. По его изменению можно двигаться по цепочке репостов вверх или вниз.

Однако собранный массив данных человек самостоятельно проанализировать не способен. По сути, это огромный неупорядоченный набор описаний объектов и связей между каждым из них.

— Для облегчения визуального анализа была разработана графическая схема представления собранных данных, — сказал ведущий научный сотрудник лаборатории проблем компьютерной безопасности СПИИРАН Андрей Чечулин. — Она представляет собой множество соединенных между собой точек-объектов, обозначенных разным цветом в зависимости от уникальности распространяемого контента. Например, красным обозначаются скопированные много раз посты, а ярко-зеленым — оригинальные.

Чтобы проверить результативность созданного алгоритма, был проведен эксперимент на базе соцсети «ВКонтакте». В качестве исходных данных выбрали ряд сообществ и пользователей, тем или иным образом связанных с поклонением Кришне (одна из форм бога в индуизме). В итоге за семь дней была получена целостная картина информационных потоков между объектами соцсети. Из него легко можно было вынести данные о том, какие группы и пользователи поставляют уникальный контент, а какие просто копируют его. Также на графике было наглядно видно, кто простой потребитель, а кто — активный распространитель.

— В принципе репост сообщений является явным каналом распространения информации, который легко выявить и проанализировать. При этом он позволяет устанавливать источники и пользователей, осуществляющих передачу, — отметил декан факультета компьютерных технологий и информатики СПбГЭТУ ЛЭТИ Иван Холод. — Анализ осложняется большим количеством источников и разветвленностью путей распространения. Кроме того, часть информации передается через личные сообщения пользователей, которые являются закрытыми согласно законам РФ. «Взломать» переписку можно только в особых случаях. По этой причине интересен также анализ не только репостов, но и, например, комментариев, в которых пользователь выразил свое мнение и, возможно, изменил смысл информации.

Ученые рассчитывают, что полученные результаты позволят бороться с информационными воздействиями как со стороны террористических и экстремистских организаций, так и криминальных структур, которые используют соцсети как площадку для вовлечения новых адептов. Работа проводится в рамках президентской программы исследовательских проектов Российского научного фонда.

В дальнейшем исследователи планируют расширить разработанные алгоритмы методами искусственного интеллекта для автоматического распознавания распространяемой информации.

Ольга Коленцова

Похожие новости

  • 01/08/2016

    Российские ученые разработали программу для перевода с любого языка

    ​Математики Санкт-Петербургского госуниверситета разработали программу, позволяющую анализировать текст, написанный на любом языке. Помимо собственно перевода программа способна определить подлинность материала и количество создававших его авторов.
    848
  • 13/09/2018

    Нейронную сеть научили распознавать жалобы на лекарства

    ​Российские программисты обучили нейронную сеть анализировать мнения пользователей соцсетей о действии лекарств. Искусственный интеллект теперь может излагать пользовательский текст в медицинских терминах.
    654
  • 10/06/2019

    Естественный интеллект хотят научить создавать искусственный интеллект

    На Санкт-Петербургском экономическом форуме объявлено о создании в крупнейших вузах страны магистерских программ, где будут учить по перспективным направлениям: искусственный интеллект, машинное обучение, большие данные, бизнес-аналитика и Интернет вещей.
    249
  • 20/08/2018

    Красноярские ученые предложили использовать технологию блокчейн для создания честной очереди в детский сад

    ​Существующие технологии, применяемые при формировании очереди в детсады и мониторинге, не обеспечивают полной защищенности от изменения и искажения информации об очередности, времени записи в очередь и прочее.
    520
  • 25/05/2019

    Смартфон поможет беременным с сахарным диабетом

    ​Примерно четыре процента беременных женщин в России сталкиваются с сахарным диабетом, который проявляется только во время вынашивания малыша. В зоне риска - женщины с ожирением и генетической предрасположенностью к болезни.
    456
  • 05/03/2018

    Томские ученые получили президентский грант на исследование мифологии видеоигр

    ​Проект доцента Школы инженерного предпринимательства Томского политехнического университета (ТПУ) Екатерины Галаниной получил грант президента России на 2018-2019 годы на исследование мифологии в контексте видеоигр; ученые исследуют онтологию игрового мифа для последующего использования полученных данных при создании образовательных игр, сообщает в пятницу пресс-служба ТПУ.
    1014
  • 24/01/2018

    Российские и американские ученые разработали алгоритм для быстрого поиска новых антибиотиков

    ​Молодые сотрудники Центра алгоритмической биотехнологии СПбГУ под руководством Павла Певзнера вместе с ассистент-профессором Университета Карнеги — Меллон (США) Хосейном Мохимани разработали компьютерную программу, которая ускорит поиск новых антибиотиков.
    846
  • 23/05/2017

    Студент СВФУ предложил систему для разгрузки call-центра авиакомпании

    ​Студент Северо-Восточного федерального университета Петр Васильев принял участие в разработке бота для авиакомпании S7 Airlines. Он выиграл первый хакатон авиакомпании. Финал конкурса, направленного на поиск современных технологических решений в области пассажирского опыта, прошел с 20 по 21 мая в Москве.
    1036
  • 05/09/2019

    ВЭФ-2019: СВФУ представил проекты в сфере медицины, IT и наноматериалов

    ​Во Владивостоке 3 сентября стартовал Восточный экономический форум — 2019, который продлится по 6 сентября. Форум собрал на одной площадке перспективные инвестиционные проекты со всего мира.
    130
  • 06/05/2019

    В Санкт-Петербурге прошло заседание Консультативного научного совета Фонда «Сколково»

    ​В Санкт-Петербургском научном центре РАН состоялось выездное заседание Консультативного научного совета Фонда «Сколково». Члены совета подвели предварительные итоги 2018 года, обсудили памятные и праздничные мероприятия, побывали в Академическом университете.
    512