Czy chcieliby Państwo mieć „maszynę do wykrywania fake newsów”? To za chwile może być możliwe i to dzięki polskim naukowcom. Dr inż. Piotr Przybyła z Polskiej Akademii Nauk, pracuje nad algorytmem, który na podstawie cech stylistycznych tekstu informacyjnego wykryje, czy jest on fałszywy lub zmanipulowany. Jego zespół chce w ten sposób wykrywać fake newsy i boty w mediach społecznościowych.
Algorytm analizuje styl artykułów newsowych i postów w mediach społecznościowych. Do jego stworzenia potrzebna była baza tekstów (początkowo w języku angielskim), na podstawie których określono zestaw cech, jakimi odznaczają się tekst wiarygodne i niewiarygodne. Jak przekonują badacze, „fake newsy” odznaczają się dużym nacechowaniem emocjonalnym, nawiązują do wartości i moralności. Ponadto odnoszą się do takich pojęć jak „władza” czy „szacunek”. Zaobserwowano trzy główne stylistyczne kategorie informacji niewiarygodnych. To słowa opisujące osąd, dotyczące wartości i celów moralnych – w sumie wyróżniliśmy ponad 900 cech, którymi kieruje się nasz algorytm – mówi dr inż. Przybyła. Naukowiec zwraca uwagę, że wiarygodne teksty można z kolei określić choćby po tym, że powołują się na inne źródła, ale także odnoszą się do danych naukowych.
By pozbawić się ryzyka błędu, naukowcy w analizowanych przez siebie (anglojęzycznych) tekstach pominęli takie, które odnosiły się do bieżących wydarzeń politycznych (w tym wyborów w USA). Jak czytamy depeszy PAP na temat algorytmu: „W ten sposób dane przekazane do dalszej analizy będą bardziej zobiektywizowane – algorytm otrzyma informacje, że np. zdanie składa się z przymiotnika, rzeczownika, przysłówka, czasownika i w ten sposób będzie ślepy na informacje, które badacze chcą odfiltrować, bo zaburzają pracę algorytmu.”
Naukowcy z PAN-u oceniają, że skuteczność stworzonego przez nich narzędzia to ok – 80 – 90%. Tłumaczą, że podobna efektywność jest dla nich niezadowalająca, trwają więc prace nad udoskonaleniem narzędzia, które zostanie przetestowane na użytkownikach internetu. Wówczas będzie można stworzyć algorytm dla innych języków, w tym polskiego. Badacze zwracają uwagę, że narzędzie nie będzie działać automatycznie, tzn. że nie ma mowy o „odcinaniu” użytkowników od jakichkolwiek treści. To, czy chcą z takich treści korzystać, będzie zawsze autonomiczną decyzją internauty.
Podobne algorytmy nie są nowością. Jednak wielkie korporacje takie jak Facebook czy Twitter niechętnie dzielą się informacjami, na jakiej zasadzie one pracują. Projekt polskich naukowców jest sfinansowany przez Narodową Agencję Wymiany Akademickiej w ramach „Polskich Powrotów” i ma służyć wszystkim zainteresowanym.
Opr. WM / PAP