​Источник распространения экстремистской и другой запрещенной информации в социальных сетях теперь можно будет вычислить за считаные минуты. Алгоритм, созданный российскими учеными, позволяет получить графическую картинку, на которой отображены основные каналы распространения нежелательного контента. На ней также наглядно видно, кто простой потребитель, а кто — активный распространитель. Результативность работы алгоритма доказали экспериментально, использовав сеть «ВКонтакте».

Схема распространения

С появлением соцсетей пользователи интернета стали не только получателями информации, но и ее источниками. Люди часто делятся картинками и текстами с помощью репоста или сообщения. Однако зачастую эти данные представляют собой нежелательный контент, связанный с деятельностью запрещенных организаций, призывом к опасным для жизни или уголовно наказуемым действиям. Поэтому перед учеными была поставлена задача — найти методы выявления каналов и источников распространения подобной информации.

Конечно, можно просто собрать все репосты и найти самый первый по времени выкладывания его в Сеть. Однако на практике реализовать такой подход крайне сложно, он требует огромных ресурсов. Ученые из Санкт-Петербургского института информатики и автоматизации РАН предложили иной вариант — сбор сведений о пользователях или группах, между которыми осуществлялся репост.

Социальную сеть можно представить как совокупность взаимосвязанных объектов — пользователей, сообществ, постов. Они так или иначе связаны между собой: люди могут находиться в друзьях или в одной группе, профиль пользователя содержит ссылки на родственников и т.д. Эти данные собираются и помещаются во временное хранилище, а затем удаляются из него согласно законам РФ.

— Допустим, пользователь (приемник) скопировал пост из сообщества (источник) на свою страницу, — рассказала научный сотрудник лаборатории проблем компьютерной безопасности СПИИРАН Лидия Виткова. — Мы разработали алгоритм, находящий все записи пользователей или групп, у которых появлялся данный репост. Далее наш алгоритм строит схему объектов, между которыми происходил обмен постами.

Ключевая точка

Описать созданный учеными алгоритм можно следующим образом. При передаче информации от источника распространения далее можно наблюдать факт «затухания» или искажения первоначальной версии. Это можно использовать, чтобы двигаться по цепочке обратно — от скопированного поста к оригинальному.

Кроме того, разработчики взяли ключевые слова для оценки целевой направленности создания страницы или профиля. Например, в группе, посвященной деятельности экстремистской организации, будут посты исключительно на данную тему. В таком сообществе рассчитываемый по особому методу процент ключевых слов составит 100%. На странице же пользователя или другой тематической группы будут также картинки или сообщения на иные темы, следовательно, процент ключевых слов уменьшится. По его изменению можно двигаться по цепочке репостов вверх или вниз.

Однако собранный массив данных человек самостоятельно проанализировать не способен. По сути, это огромный неупорядоченный набор описаний объектов и связей между каждым из них.

— Для облегчения визуального анализа была разработана графическая схема представления собранных данных, — сказал ведущий научный сотрудник лаборатории проблем компьютерной безопасности СПИИРАН Андрей Чечулин. — Она представляет собой множество соединенных между собой точек-объектов, обозначенных разным цветом в зависимости от уникальности распространяемого контента. Например, красным обозначаются скопированные много раз посты, а ярко-зеленым — оригинальные.

Чтобы проверить результативность созданного алгоритма, был проведен эксперимент на базе соцсети «ВКонтакте». В качестве исходных данных выбрали ряд сообществ и пользователей, тем или иным образом связанных с поклонением Кришне (одна из форм бога в индуизме). В итоге за семь дней была получена целостная картина информационных потоков между объектами соцсети. Из него легко можно было вынести данные о том, какие группы и пользователи поставляют уникальный контент, а какие просто копируют его. Также на графике было наглядно видно, кто простой потребитель, а кто — активный распространитель.

— В принципе репост сообщений является явным каналом распространения информации, который легко выявить и проанализировать. При этом он позволяет устанавливать источники и пользователей, осуществляющих передачу, — отметил декан факультета компьютерных технологий и информатики СПбГЭТУ ЛЭТИ Иван Холод. — Анализ осложняется большим количеством источников и разветвленностью путей распространения. Кроме того, часть информации передается через личные сообщения пользователей, которые являются закрытыми согласно законам РФ. «Взломать» переписку можно только в особых случаях. По этой причине интересен также анализ не только репостов, но и, например, комментариев, в которых пользователь выразил свое мнение и, возможно, изменил смысл информации.

Ученые рассчитывают, что полученные результаты позволят бороться с информационными воздействиями как со стороны террористических и экстремистских организаций, так и криминальных структур, которые используют соцсети как площадку для вовлечения новых адептов. Работа проводится в рамках президентской программы исследовательских проектов Российского научного фонда.

В дальнейшем исследователи планируют расширить разработанные алгоритмы методами искусственного интеллекта для автоматического распознавания распространяемой информации.

Ольга Коленцова

Похожие новости

  • 25/06/2019

    Андрей Фурсенко предложил брать «решения природы» для развития технологий

    ​Эволюция природы происходит на основе механизмов, схожих с функционированием "больших данных" (big data), развитие технологий следует основывать на этих же принципах, считает доктор физико-математических наук, помощник президента РФ Андрей Фурсенко.
    127
  • 13/09/2018

    Нейронную сеть научили распознавать жалобы на лекарства

    ​Российские программисты обучили нейронную сеть анализировать мнения пользователей соцсетей о действии лекарств. Искусственный интеллект теперь может излагать пользовательский текст в медицинских терминах.
    612
  • 07/06/2019

    О соперничестве с Китаем и экспорте технологического суверенитета

    ​Человеческий страх — лучший контролер внедрения искусственного интеллекта, уверен специальный представитель президента по цифровому и технологическому развитию Дмитрий Песков. Однако пока ИИ слишком глуп, чтобы угрожать человечеству, насущный вопрос — кто будет в этой сфере, обгонит весь мир.
    220
  • 19/09/2018

    Инженерно-технологические знания закладываются с детства

    ​В 2017 году утверждена программа "Цифровая экономика Российской Федерации", где государством и обществом сформирован запрос на новые, более гибкие форматы образования, нацеленные в будущее. Ответом Санкт-Петербурга на существующие запросы и вызовы стало открытие образовательных учреждений основного и дополнительного образования, которые будут обеспечивать новые подходы к развитию детского и молодежного технического творчества.
    517
  • 06/03/2019

    Искусственному интеллекту доверят контроль соцсетей

    Если вы не живете в социальных сетях, то скорей всего вообще не живете. Такой неутешительный диагноз вам может поставить половина населения Земли. Во всяком случае столько, по данным статистики, сегодня прописаны в социальных сетях.
    319
  • 01/08/2016

    Российские ученые разработали программу для перевода с любого языка

    ​Математики Санкт-Петербургского госуниверситета разработали программу, позволяющую анализировать текст, написанный на любом языке. Помимо собственно перевода программа способна определить подлинность материала и количество создававших его авторов.
    836
  • 15/07/2019

    Петербургские ученые учат компьютер определять болезни и ложь по речи

    ​Группа сотрудников Санкт-Петербургского института информатики и автоматизации Российской академии наук (СПИИРАН) создают компьютерную паралингвистическую систему, которая позволит определять целый комплекс характеристик человека, такие как возраст, пол, акцент, наличие болезни и даже состояние опьянения по речи.
    167
  • 10/06/2019

    Естественный интеллект хотят научить создавать искусственный интеллект

    На Санкт-Петербургском экономическом форуме объявлено о создании в крупнейших вузах страны магистерских программ, где будут учить по перспективным направлениям: искусственный интеллект, машинное обучение, большие данные, бизнес-аналитика и Интернет вещей.
    229
  • 05/12/2018

    Астрономы не подтвердили вывод аналитиков Saxo Bank об ущербе экономике от солнечной бури

    ​Российские астрономы скептически отнеслись к прогнозу аналитиков датского банка, заявивших об угрозах мировой экономике из-за сильной солнечной вспышки в 2019 году. Солнечная активность будет даже слабее, чем обычно, сообщил ТАСС эксперт в области физики Солнца, директор Астрономической обсерватории Иркутского госуниверситета Сергей Язев.
    494
  • 03/07/2018

    Алтайские ученые разрабатывают компьютерную программу для прогнозов развития тромбоэмболии

    ​Ученые Алтайского государственного университета (АлтГУ) разрабатывают уникальную компьютерную программу для раннего прогнозирования развития тромбоэмболии легочной артерии. Программу планируется распространять через социальные сети, сообщили в пресс-службе вуза.
    574