Создан алгоритм для автоматизированной борьбы с интернет-троллями

Исследователи создали алгоритм, позволяющий выявлять троллей на интернет-сайтах по первым пяти комментариям с вероятностью 79%. Чтобы понять их поведение, исследователи проанализировали 40 млн комментариев с трех различных ресурсов.

Исследователи из Стэнфордского университета и Корнелльского университета (оба находятся в США), воспользовавшись грантом Google, разработали алгоритм, позволяющий с 79-процентной точностью определять «троллей» на интернет-ресурсах по пяти первым сообщениям.

Тролль в интернете — человек, который ведет себя вызывающе, оскорбительно, провоцирует других участников на острую реакцию.

Работа ученых опубликована на сайте библиотеки Корнелльского университета. Авторы работы утверждают, что разработанный ими алгоритм может использоваться в качестве вспомогательного инструмента в работе модераторов.

Исследователи проанализировали 40 млн комментариев, оставленных 1,7 млн пользователями, а также 100 млн оценок этих комментариев другими участниками обсуждений на новостном сайте CNN.com, новостном ресурсе о политике Breitbart.com и игровом сайте IGN.com, использующими веб-сервис для обсуждений Disqus. На сбор данных ушло 18 месяцев.

Затем авторы работы сравнили поведение пользователей, которые впоследствии были забанены, с пользователями, которые не были забанены ни разу, и пришли к выводу, что поведение этих двух групп существенно отличается.

Во-первых, тролли предпочитают концентрироваться на беседах с конкретными участниками в групповом обсуждении. Во-вторых, они склонны оставлять неуместные комментарии. В-третьих, в их фразах чаще присутствует ненормативная лексика, чем во фразах представителей другой группы. В-четвертых, они чаще всего получают отклики от других участников беседы, таким образом расходуя их время на бесцельную болтовню.

Чтобы научиться находить троллей, исследователи проанализировали 40 млн комментариев

Исследователи также выяснили, что постепенно в беседах агрессия троллей возрастает и они вызывают все большее неприятие других участников. Если же другие участники отвечают троллю грубо, то беседа принимает еще более негативный характер. При этом, по словам исследователей, чем дольше тролль принимает участие в беседе, тем сложнее его определить. Скорее всего, это связно с изменением поведения других участников в беседе, предположили они.

Что касается вопроса, создают ли тролли обсуждения сами или присоединяются к уже существующим, однозначного ответа исследователи не дали. По их словам, это зависит от конкретного сайта. Например, на Breitbart.com и IGN.com тролли преимущественно начинали общение с ответов на комментарии других пользователей, тогда как на сайте CNN.com они преимущественно сами инициировали обсуждения.

Исследователи не говорят, когда разработанный ими алгоритм может появиться в Сети.

Подобрать оптимальный тариф на IaaS на ИТ-маркетплейсе CNewsMarket среди десятков поставщиков

Сергей Попсулин

Короткая ссылка

Создан алгоритм для автоматизированной борьбы с интернет-троллями

Другие материалы рубрики

CNewsMarket

СЭД

VPS

Kubernetes

IaaS

Техника

Обзор умной зубной щетки Oclean X Ultra 20 Set: искусственный интеллект на страже здоровья зубов

Лучшие подарки к Новому году от UGREEN: выбор ZOOM

Лучшие умные лампы и световые будильники с имитацией рассвета: выбор ZOOM

Наука

Ледяная поверхность Титана нарушает фундаментальное правило химии, зато проливает свет на зарождение жизни на Земле

Ученые используют ген долголетия, который есть у людей старше 100 лет, чтобы замедлить быстрое старение

Произошло рекордное извержение черной дыры — она сияет ярче 10 триллионов Солнц

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Закупки уходят в цифру: как устроен современный B2B-маркетплейс

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Способна ли российская CAE-платформа заменить решения Siemens и Ansys?