Несмотря на то, что в России уже неоднократно принимали попытки заблокировать Википедию по различным причинам, сама же российская пропаганда не отказывается от использования онлайн-энциклопедии в собственных интересах.

Screenshot_2015-12-23-15-16-29-1 (1)
Скриншот Википедии

Например, твиттер-блог «Госправки» систематически отслеживает изменения в статьях Википедии, сделанные с IP-адресов, принадлежащих российским государственным структурам.

Screenshot_2015-12-23-15-12-20-1

Именно эта инициатива в июле 2014 года нашла правку об ответственности за сбитый на Донбассе пассажирский самолет MH-17, которая была сделана с IP-адреса медиахолдинга ВГТРК. Фрагмент о том, что самолет сбили «террористы самопровозглашенной Донецкой народной республики из ракетных установок «Бак», которые были получены террористами из Российской Федерации» был изменен на формулировку «самолет сбили украинские военные».

Случаи редактирования текстов в Википедии с компьютеров государственных учреждений известны во многих странах. Американские СМИ также неоднократно фиксировали случаи, когда представители Конгресса США изменяли акценты в различных материалах онлайн-энциклопедии, что зачастую вызывало громкие медиаскандалы. Существует также мониторинг правок из украинских госучреждений, которые отслеживает блог «Держредагування».

Но кроме пропагандистов статьи в Википедии редактируют еще и обычные вандалы, удаляя фрагменты информации, добавляя спам или неправдивую информацию. За день Википедию редактируют около полумиллиона раз. Поэтому сохранять качество информации и удалять ненужный мусор невозможно без инструментов, которые сканируют активность в онлайн-энциклопедии автоматически.

30 ноября Википедия анонсировала запуск ORES — технологии искусственного интеллекта, целью которого является идентифицировать именно вредные правки – акты вандализма в онлайн-энциклопедии. Эта технология не занимается факт-чекингом, а только обнаружением сомнительных изменений, которые ухудшают качество Википедии.

Одним из главных заданий ORES является автоматическое разделение целенаправленного вандализма и просто некачественных изменений, которые были сделаны неопытными редакторами без злого умысла.

По мере использования алгоритм системы самостоятельно совершенствуется и сканирует изменения в Википедии более точно. На данный момент технология поддерживает 14 языков: немецкий, английский, испанский, эстонский, голландский, фарси, французский, иврит, индонезийский, итальянский, португальский, турецкий, украинский, вьетнамский.

ORES является открытым кодом, который каждый может использовать в своих инструментах. Еще до официального релиза его на протяжении нескольких месяцев тестировали в 12 различных инструментах.

Мы расскажем о некоторых инструментах, которые используют ORES для отслеживания вандализма в режиме реального времени, и могут, на наш вигляд, быть также полезными для факт-чекеров.

Ra·un – лаконичный и удобный инструмент мониторинга правок. Практически в режиме реального времени Ra•un показывает названия статей, в которых были внесены свежие правки. Справа от названия статьи показано количество добавленного (зеленый) или удаленного (красный) контента.

С помощью фильтра можно выбирать мониторинг определенного типа правок, например, анонимных или на новых страницах. В настройках также есть возможность смены языковой версии Википедии.

raun

Snuggle  ‒ инструмент, который помогает опытным «википедистам» отслеживать новых пользователей, делающих качественную работу в онлайн-энциклопедии. Первоочередным заданием является развитие вики-сообщества. Но инструмент также отслеживает пользователей, делающих вредные правки.

snuggle

В факт-чекинге Snuggle дает полезную информацию о тенденциях. При помощи данного инструмента можно узнать,  какую тематику наиболее активно редактируют, где и кто наиболее часто добавляет вредные правки. Этот инструмент также можно использовать для отслеживания активности определенного пользователя – какого рода правки и в каких статьях он делает.

Еще одна программа, которая предоставляет множество функций отслеживания вандализма – Huggle. В этом инструменте можно создавать различные фильтры для отслеживания определенного типа редактирований: статьи, на которые стоит обращать дополнительное внимание; новые статьи, созданные пользователями не из белого списка и т.д.

Но в то же время, программа требует установки на компьютер и ее использование возможно только для вики-пользователей, имеющих права «быстрого отката» (возможность отмены правок другого  пользователя без редактирования самой страницы). Для получения таких прав нужен определенный опыт редактирования статей Википедии (условия разные в зависимости от языковой версии).

Если же нас интересуют правки не в режиме реального времени, а например история правок конкретного пользователя или статьи, то это можно проверить непосредственно на страницах Википедии. Для этого достаточно вписать имя пользователя или IP-адрес. Например, можно проверить активность IP-адреса ВГТРК, с которого была сделана уже упомянутая правка об ответственности за сбитый Боинг «Малазийских авиалиний».

Оказывается, что в сентябре 2013 года этот же пользователь делал мелкие правки в статье «Украина и Таможенный Союз с ЕврАзЭС», а примерно через год – 7 сентября 2014 – удалил фрагмент статьи о противопехотной фугасной мине ПФМ-1 «Лепесток». За день до этого один из руководителей батальона «Азов» Захар Лавреньтев заявил, что российские войска использовали эти мины возле поселка Широкино под Мариуполем. Именно это сообщение и было удалено из статьи в Википедии. Существуют также правки этого пользователя в резонансных статьях других языковых версий.

wiki_contribution

В случае конкретной статьи полная история правок доступна по ссылке над названием статьи.

wiki_history

Поскольку ресурс Википедии доступен для каждого, этим активно пользуются также злоумышленники. Но именно из-за своей открытости любую попытку скрытия фактов, дезинформации или вандализма можно отследить. И многие участники этого проекта по всему миру работают над уменьшением влияния вандалов и пропагандистов на качество онлайн-энциклопедии. Технология ORES также продолжает усовершенствование в нескольких направлениях – добавление новых языков или уменьшения влияния субъективных оценок – и приглашает всех заинтересованных к участию.

Автор: Тарас Назарук, для Stopfake.org.