Чи хотіли б ви мати «апарат для виявлення фейкових новин»? Завдяки польським вченим це невдовзі буде можливим. Кандидат технічних наук Пьотр Пшибила з Польської академії наук працює над алгоритмом, який на підставі стилістичних особливостей інформаційного тексту виявить, чи є він неправдивим чи підробленим. Його команда хоче таким чином виявляти фейки і ботів в соціальних мережах.
Алгоритм аналізує стиль новинних статей і повідомлень в соціальних мережах. Для його створення вимагалася база даних текстів (спочатку англійською мовою), на підставі якої був визначений набір ознак, якими відзначаються достовірні і недостовірні тексти. Як стверджують дослідники, «фейк-новини» характеризуються високою емоційністю, апелюють до вартостей і моральності. Окрім того, вони використовують такі терміни, як «влада» і «повага». Виявлено три основних стилістичних категорії недостовірної інформації. Це слова, що описують думки, вартості та моральні цілі. – Загалом ми визначили більш як 900 характеристик, якими керується наш алгоритм, – зазначає Пшибила. Вчений вказує, що надійні тексти, в свою чергу, можна визначити за тим, що вони посилаються на інші джерела, а також на наукові дані.
Щоб уникнути ризику помилки, вчені в аналізованих ними текстах (англомовних) не звертали уваги на ті, які були присвячені поточним політичним подіям (включно з виборами в США). Як мовиться в новинах PAP на тему цього алгоритму: «Таким чином, дані, представлені для подальшого аналізу, будуть більш об’єктивізованими – алгоритм отримає інформацію про те, що, наприклад, речення складається з прикметника, іменника, прислівника, дієслова, і, отже, він буде сліпим щодо інформації, яку дослідники хочуть відсіяти, оскільки вони порушують працю алгоритму».
Вчені з Польської академії наук оцінюють ефективність створеного ними знаряддя близько – 80-90%. Вони заявляють, що подібна ефективність їх не задовольняє, тому триває праця над удосконаленням інструмента, який випробовуватиметься на користувачах Інтернету. Тоді можна буде створити алгоритм і для інших мов, у тому числі для польської. Дослідники підкреслюють, що інструмент не буде працювати автоматично, тобто немає мови про те, щоб «відрізати» користувачів від будь-якого контенту. Чи захоче користувач Інтернету використовувати той чи інший контент, завжди буде його самостійним рішенням.
Подібні алгоритми не є новими. Однак великі корпорації, такі, як Facebook та Twitter, неохоче діляться інформацією про те, як вони працюють. Проект польських вчених фінансується Національною агенцією академічних обмінів у рамках програми «Польських повернень» і призначений для обслуговування всіх зацікавлених сторін.
Опрацьовано ВМ / PAP