Хотели бы вы иметь «апарат для обнаружения фейк новостей»? Благодаря польским ученым это может быть вполне возможно в ближайшее время. Кандидат технических наук Петр Пшибыла из Польской академии наук работает над алгоритмом, который на основе стилистических особенностей информационного текста определит, является ли он ложным или подделанным. Его команда хочет таким образом обнаруживать фейки и ботов в социальных сетях.
Алгоритм анализирует стиль новостных статей и сообщений в социальных сетях. Для его создания потребовалась база данных текстов (изначально на английском языке), на основе которой был определен набор признаков, типичных для достоверных и недостоверных текстов. Как утверждают исследователи, «фейковые новости» характеризуются высокой эмоциональностью, апеллируют к ценностям и морали. Более того, они употребляют такие термины, как «власть» и «уважение». Выявлены три основных стилистических категории недостоверной информации. Это слова, которые описывают суждения, ценности и моральные цели. – Всего мы выделили более 900 характеристик, которыми руководствуется наш алгоритм, — отметил Пшибыла. Ученый указывает, что достоверные тексты, в свою очередь, можно определить по тому, что они ссылаются на другие источники, а также на научные данные.
Чтобы избежать риска ошибки, ученые в анализируемых ими текстах (на английском языке) не обращали внимания на те, которые касались текущих политических событий (включая выборы в США). Когда отмечается в новостях PAP о таком алгоритме: «Таким образом, данные, представленные для дальнейшего анализа, будут более объективными — алгоритм получит информацию о том, что, например, предложение состоит из прилагательного, существительного, наречия, глагола, и, таким образом, он будет слеп к информации, которую хотят отсеять исследователи, потому что они нарушают работу алгоритма ».
Ученые из Польской академии наук оценивают эффективность созданного ими инструмента около — 80-90%. Они заявляют, что подобная эффективность их не удовлетворяет, поэтому ведутся работы по усовершенствованию инструмента, который будет опробован на пользователях Интернета. Тогда можно будет создать алгоритм и для других языков, в том числе для польского. Исследователи отмечают, что инструмент не будет работать автоматически, то есть о том, чтобы «отрезать» пользователей от любого контента речь не идет. То, хотят ли они использовать такой контент всегда будет самостоятельным решением пользователей Интернета.
Подобные алгоритмы не новы. Однако крупные корпорации, такие как Facebook и Twitter, неохотно делятся информацией о том, как они работают. Проект польских ученых финансируется Национальным агентством академических обменов в рамках программы «Польских возвратов» и предназначен для обслуживания всех заинтересованных сторон.
ВМ / PAP