Сегодня поиск любой информации практически всегда начинается с поисковой системы. Несмотря на то, что мы привыкли «проверять себя по Google», сегодня вряд ли можно быть уверенными в том, что поисковые системы в целом и Google в частности предоставляют нам абсолютно беспристрастный и точный результат. Далеко не всегда то, что предлагают нам поисковые системы, является наиболее точным и правдивым срезом информации. В сегодняшнем материале рубрики «Инструменты» мы поговорим о том, как получить действительно независимую информацию при онлайн-поиске.
Искать = гуглить
Итак, если мы хотим составить представление об определенной теме, человеке или событии, чаще всего мы пользуемся для этого поисковыми системами. Точнее, одной поисковой системой – Google. Недаром в английском языке слово «гуглить» (глагол to google), появившееся несколько лет назад в словарях, означает «найти что-то в интернете с помощью поисковой системы». Google является бесспорным мировым лидером рынка поиска. Согласно последнему отчету исследовательского центра comScore по состоянию на февраль 2016 года в США Google обрабатывает около 64% всех поисковых запросов. В целом по миру ситуация практически не отличается, за исключением ряда стран мира, например, Китая, где в силу лингвистической специфики лидирует собственная поисковая система Baidu. В России на рынке поиска лидирует «Яндекс», ситуация в Украине практически не отличается от американской. Иными словами, понятия «искать» и «гуглить» во многих странах мира, в том числе в Украине, действительно являются синонимами. Эти цифры означают, что хотим мы этого или нет, но мы доверяем Google искать нужную нам информацию в большинстве случаев. Это доверие зиждется на качественном алгоритме, который не раз доказал свою эффективность. Однако этот алгоритм все чаще подвергается влиянию внешних факторов, понижающих доверие к нему.
Как работает поисковая система и что такое пузырь фильтров
Поисковая система предоставляет нам ссылки в соответствии с ее алгоритмом. Суть поискового алгоритма и то, на что он обращает внимание – это строго засекреченная информация, ведь эта коммерческая тайна и является основой основ бизнеса поисковых сервисов. Иногда поисковые системы раскрывают отдельные подробности своих поисковых алгоритмов, например, Google периодически уведомляет пользователей, что в поисковой выдаче выше будут подниматься сайты с удобной мобильной версией или защищенным протоколом HTTPS. Однако это не более чем отрывки информации, только частично позволяющие воссоздать общую картину.
В целом принцип работы поисковой системы Google следующий: на первых местах выдачи будут размещаться сайты с большим уровнем доверия или с более высоким Page Rank – численным показателем того самого доверия к сайту. А уровень доверия сайта Google определяет как число ссылок на него с других надежных сайтов. Например, ссылка со страниц «Википедии» или с официальной страницы Гарварда будет более надежной в представлении алгоритма поисковой системы, чем со страницы малораскрученного блога. Тем не менее, специалисты по оптимизации поиска делают все для того, чтобы их сайты оказывались как можно выше в поисковой выдаче. Иногда их действия имеют успех.
Но гораздо более серьезной является ситуация, когда слишком услужливый Google, желая быть идеальной поисковой системой, сам ограничивает выдачу. Это ограничение может быть не особенно сильно влияющим на выборку. Например, поисковик может показывать сайты только из определенного региона или на определенном языке. Но чаще Google старается всячески угодить нам и сам корректирует поисковую выдачу так, чтобы как можно быстрее дать нам точный ответ на наш запрос. А такая коррекция выдачи уже не позволяет назвать ее независимой и точной.
По большому счету, сегодня практически невозможно получить «чистую» поисковую выдачу. Дело в том, что Google владеет огромными наборами данных о своих пользователях. Он знает не только то, где мы живем, а еще и что любим читать и смотреть, какие страны посещать, он знает, в какие магазины мы ходим и что мы в них покупаем. Например, чтобы найти сервис заказа пиццы, часто уже не нужно добавлять город. Запрос «заказ пиццы» приведет к разным результатам для людей, которые задали такие запросы, например, из Киева или из Одессы.
С одной стороны, такие действия алгоритма Google понятны и оправданы, с другой – все они, помноженные на недюжинные усилия оптимизаторов, портят нам «чистую» выдачу. Поэтому в ситуациях, когда при поиске нужно получить не точный ответ (например, когда была принята Конституция США), а подборку ссылок по той или иной теме, Google перестает быть нашим помощником.
Таким образом, Google иногда пытается предлагать нам контент, соответствующий определенным критериям, которые, по мнению Google, связаны с нами. Такое влияние на поисковую выдачу и предлагаемый в результате его контент, получили название пузыря фильтров.
Пузырь фильтров хорош при поиске пиццерии или парикмахерской. Но он играет весьма отрицательную роль, например, когда пользователь хочет получить представление об определенной личности, обсуждаемой теме или подборке событий. Google предоставит эту информацию, но назвать эту выдачу достоверной, полной и релевантной можно будет с большой натяжкой.
Эксперимент: как работает пузырь фильтров
Для эксперимента проанализируем, как поисковая система Google отображает информацию о Надежде Савченко. Результатом обычного запроса к украинской версии Google (доступной на домене http://google.com.ua) на русском языке будет страница из русской «Википедии», а также ссылки на статьи о Савченко, в основном, в украинских онлайн-медиа.
Правда, на первой странице окажутся издания «Вести» и Strana.ua. Практически не отличается выдача в Google с украинским языком интерфейса.
В то же время, аналогичный запрос к Google.com (международной версии поисковой системы) приведет к тому, что ссылка на «Вести.ру» будет на втором месте, после «Википедии», а на первой странице выдачи окажется еще выдача из «РИА Новости» и РБК.
Попытка задать запрос на английском языке не особенно изменила поисковую выдачу. Запрос «nadezhda savchenko» к русскоязычной версии Google.com.ua приведет практически к тем же сайтам. Но зато в блоке новостей будет ссылка на «Ленту.ру» и заголовок «Савченко предрекла превращение Украины в поле боя третьей мировой войны». В результате такого же англоязычного запроса к украинской версии Google мы увидим ссылку на англоязычную «Википедию», Facebook-страницу, посвященную летчице, ссылку на «Russia Today» и сайт телеканала «Аль Джазира».
На этом примере видно, что Google пытается угадать место нахождение человека, задавшего запрос. Знать это Google может по IP-адресу пользователя, его поисковым настройкам, запросам и другим данным.
Манипуляция: легальная и не очень
Пузырь фильтров можно назвать легальной манипуляцией с поисковой выдачей, по крайней мере, Google не скрывает, что подгонка результатов под интересы пользователя все же оправдывается желанием поисковой системы угодить нам, сделать результаты поиска более релевантными.
Однако поисковая система уже несколько раз предпринимала явные, а иногда и тайные попытки манипуляции поисковой выдачей. Например, в феврале этого года Google заявила, что будет бороться с вербовкой террористической организации ИГИЛ в интернете. В Google не нашли ничего лучшего, чем при запросах, связанных с этой террористической организацией, перенаправлять пользователей на сайты антирадикальной направленности. Такими контрпримерами Google хочет остановить пропаганду ИГИЛ в интернете. Желание Google похвально и объяснимо. Однако такими способами поисковая система, по сути, превращается в интернет-цензора.
Были и другие попытки манипуляции поисковыми результатами, они даже породили специальный термин – SEME (search engine manipulation effect).
Строим «чистую» выдача: несколько простых советов
Итак, доверять Google при сборе информации сегодня нельзя. Что же делать в таких случаях, когда нужно получить максимально независимую поисковую выдачу, не связанную с нашим местом нахождения, предыдущими запросами и другой информацией? Можно пойти несколькими путями.
- Разлогиниться в Google и очистить поисковую историю и, возможно, cookies
Чтобы разлогиниться в Google, нужно зайти на главную страницу поисковой системы (не пользоваться поисковой строкой браузера), после чего нажать на ваш аватар в правом верхнем углу и выбрать кнопку «Выйти».
Чтобы очистить поисковую историю, нужно с помощью кнопки «Настройки» в правом нижнем углу главной страницы Google (вы должны быть авторизированны при этом) перейти в раздел настроек поиска.
Последним пунктом здесь будет раздел, посвященный поисковой истории.
В этом разделе снова перейдите в раздел настроек, далее «Другие настройки» – «Управление историей» и отключите сбор данных о вашем серфинге.
Чтобы удалить предыдущую историю, нужно воспользоваться пунктом «Удаление» и удалить сохраненные данные – за определенный день, за последний месяц или все данные.
Чтобы удалить cookies, вам нужно перейти в раздел настроек вашего браузера, перейти к дополнительным настройкам и найти раздел с cookies.
Для Chrome он находится в разделе «Личные данные» – «Настройки контента», далее нужно воспользоваться «Все cookies и данные сайтов» – кнопка «Удалить».
- Воспользоваться анонимным режимом серфинга вашего браузера
Режим анонимного серфинга сегодня поддерживает любой браузер. Перейти в него можно с помощью меню браузера, выбрав пункт «Новое конфиденциальное окно» (для Mozilla Firefox) либо «Новое окно в режиме инкогнито» (для Google Chrome). В этом режиме на вашем компьютере не будут сохраняться данные вашого серфинга, а это позволит хотя бы частично избавиться влияния пузыря фильтров.
- Воспользоваться анонимным браузером, например, Tor
Tor – это анонимная сеть, предназначенная для блокирования слежки за пользователями. Термином Tor называют систему серверов и связей между ними, обеспечивающих анонимность в интернете. А еще иногда так называют анонимный браузер, работающий в этой среде. После установки Tor на ваш компьютер, вы можете использовать его для поиска в Google. В этом случае вы для Google будете абсолютной интернет-невидимкой, поисковая система о вас ничего не будет знать, поэтому выдача в этом случае будет практически не подвержена действиям пузыря фильтров.
- Воспользоваться анонимными поисковыми системами
Еще один способ получить релевантный и, самое главное, независимый результат – анонимные поисковые системы. Правда, такие системы могут использовать недостаточно качественные поисковые алгоритмы или не столь оперативные.
Авторы этого поисковика заявляют, что он сохраняет нейтралитет относительно пользователя, что позволяет избежать влияния пузыря фильтров и других данных на поисковую выдачу. Сервис позволяет провести поиск сайтов, картинок, видео и новостей, а также ограничить результаты по дате. Выдачу можно отображать с включенным фильтром по регионам, то есть, например, можно показать только сайты, актуальные для Украины.
Сервис в своей работе использует алгоритмы нескольких поисковых систем. В описании Ixquick упоминается десять разных поисковиков, а для определения релевантности результата используется система «Star System». Ее суть состоит в том, что один условный бал (звезда) присваивается результату из одной поисковой системы. Список ранжируется в зависимости от количества звезд. Иными словами, в верхней части списка окажутся сайты, которые были найдены с помощью сразу нескольких поисковых систем.
Это проект, созданный разработчиками из Ixquick, который использует для поиска результатов только алгоритмы поисковой системы Google, что для некоторых поисковых запросов может быть гораздо результативнее.
Авторы этой поисковой системы обещают поддержку семантического поиска — сервис может уточнять и предугадывать запросы пользователя. Кроме поиска, Hulbee умеет строить семантическое ядро – дополнительные ключевые слова, связанные с заданным запросом. С помощью этого ядра можно уточнять поисковый запрос.
Рецепты поиска: как искать и находить
Чтобы получить действительно качественный поисковый результат, релевантный срез информации, доступной в Сети, независящий от каких бы то ни было фильтров, лучше применять все перечисленные советы сразу или, хотя бы, комбинировать их.
Если вы хотите составить представление о предмете поиска, проведите поисковую работу с Google в разных режимах, в том числе в анонимном и через Tor. При этом не следует ограничиваться 1-2 страницами выдачи. Дополнительной помощью станут анонимные поисковые системы. Если запрос может быть сформулирован на английском языке и результат такого поиска для вас важен, то не забывайте о том, что искать можно и с помощью поисковой системы Bing. Правда, сразу отметим, что для русскоязычных запросов либо запросов на украинском языке Bing практически бесполезен. Зато в случае кириллических запросов не стоит забывать о «Яндексе», который в некоторых случаях может быть весьма полезным инструментом поиска.
Автор: Надежда Баловсяк, для Stopfake.org.