Tento článek je součástí rozšířenějšího návodu od RuNet Echo, který má pomoci lidem získávat informace z otevřených zdrojů na ruském internetu. Nahlédněte také do kompletního průvodce, který je dostupný na speciálních projektových stránkách.
Vyhledávat informace v otevřených zdrojích může být obtížné, obzvlášť pokud neznáte jazyk, ve kterém informace hledáte. Nicméně díky internetu není ani vyhledávání v neznámém jazyce nemožné. Vyžaduje však trpělivost a také obeznámenost s využíváním vyhledávacích algoritmů a překladatelských nástrojů. Tento průvodce vysvětluje, prostřednictvím jakých bezplatných prostředků lze vyhledávat v ruskojazyčných otevřených zdrojích. Zde se také dozvíte, jak využívat vyhledávací algoritmy na Googlu a Twitteru, a získat tak užitečné informace.
Překladač Google
Pokud máte jen malou nebo žádnou znalost ruského jazyka, pak je tento překladový software pro vaše vyhledávání naprostou nutností. Překladač Google je nejuniverzálnějším z překladatelských nástrojů, nabízí spoustu funkcí, které již pravděpodobně znáte, ale také některé, které mohou být méně známé.
Obvyklá překladová funkce překladače je vám jistě zřejmá – zkopírujete a vložíte ruský text (nebo napíšete český text) – a získáte překlad. Rovněž můžete vložit do překladového okna URL internetové stránky a podívat se na překlad celé stránky v libovolném jazyce.
Jestliže neovládáte azbuku, Překladač Google nabízí funkci „rukopis“, která umožňuje přímo kreslit kontury písmen pomocí myši či touchpadu a převádí tyto kresby na upravitelný a přeložitelný text. Viz níže uvedený příklad s názvem supermarketu Магнит (magnet):
Zatímco kreslíte text, Google automaticky navrhuje upravitelný text, který přiřazuje k vašemu obrázku. První návrh bývá někdy nesprávný, proto si pečlivě prohlédněte všechny nabízené možnosti.
Díky jedné speciální funkci dokáže nástroj Google dokonce rozeznat ruské psací písmo (kurzivu), které se může od tiskacího písma zásadně lišit. Níže je fráze „до свидания“ (na shledanou), která je úspěšně převedena do elektronické podoby nástrojem Google rukopis.
Zkratky a akronymy
Stejně jako v jiných jazycích, i v ruštině existuje obrovské množství oficiálních zkratek. Stránka Sokr.ru může napomoci zorientovat se v těchto hádankách. K rozluštění specifických místních názvů velmi dobře slouží například tato stránka na ruské Wikipedii, kde najdeme seznam běžných zkratek nejrůznějších lokalit v Rusku (měst, obcí atd.).
Například tento text se objevuje v popisu k jednomu videu na sociální síti VK, které bylo zveřejněno na jistém proseparatistickém videokanálu. Použijeme-li ony dva nástroje, které jsme zmínili v předchozím odstavci, je možné dešifrovat informaci, i když neumíme rusky.
г.Донецк Ленинский р-н обстрел РСЗО “Ураган”
Jsou tu tři zkratky, které se běžně objevují u videí s tematikou ukrajinského konfliktu:
- г. Донецк: První údaj pro “г.” na Sokr.ru nám dá výsledek „город“ (město), což je také druhý údaj, který se objevuje v seznamu zkratek na zmíněné stránce na Wikipedii. Uvádí město Doněck (Донецк).
- Ленинский р-н: Jak Sokr.ru website, tak Wikipedie uvádějí, že tato zkratka znamená район (okrsek, oblast) a charakterizují Leninský okrsek (Ленинский).
- РСЗО: Tato zkratka nijak nesouvisí s městy, takže je třeba se spolehnout na Sokr.ru, podle něhož výraz znamená „реактивная система залпового огня / ракетная система залпового огня“, tedy „reaktivní systém salvové palby“ / „raketový systém salvové palby“. Anglickým ekvivalentem tohoto termínu je „multiple rocket launcher system“ (MLRS). V tomto případě jde konkrétně o MLRS Uragan.
Název videa tedy je „Město Doněck Leninská oblast palba raketový systém salvové palby Uragan“.
Vyhledávání v ruštině
Na rozdíl od angličtiny je ruština, stejně jako čeština, flektivní jazyk, to znamená, že pro každé slovo může existovat na tucet různých forem (které udávají číslo jednotné či množné a pád), taktéž existují různé typy časování sloves. V závislosti na konkrétní funkci ve větě (podmět, přímý či nepřímý předmět, množné číslo, přímý předmět v množném čísle atd.) může mít třeba slovo kočka, celkem devět různých skloňovaných forem: кошка, кошки, кошке, кошку, кошкой, кошек, кошкам, кошками, кошках. Proto je třeba dávat pozor např. při vyhledávání na Twitteru, forma „кошка“ či „кошки“ dají mnohem více výsledků než rozvitější dotaz „s kočkou“ či „s kočkami“.
Wikislovník uvádí tvary skloňování u většiny slov vedle tvarů slovesného časování v sekci Skloňování. Například pro heslo кошка (kočka) ukazuje Wikislovník tvary jednotného i množného čísla pro všech 6 ruských pádů. Budete-li dané heslo vyhledávat, nezapomeňte smazat znaménko přízvuku (čárku nad о́, jako v hesle ко́шка). Odstraníte jej stisknutím klávesy Backspace před daným písmenem.
Vyhledáváte-li na Googlu, pak skloňování ani časování nepředstavuje problém, protože jeho vyhledávací algoritmus s různými formami slov počítá. Proto si s různými tvary slov nemusíte dělat starosti, pokud nevyhledáváte přesné znění určitých slov s použítím uvozovek.
Nicméně Twitter funguje jinak. Twitter ukazuje výsledky pouze pro konkrétní zadaná slova a není schopen rozlišit jednotlivé tvary sloves (běžet, běžel, běží atd.) nebo podstatných jmen.
Pokud se snažíte vyhledat informaci o evakuaci budovy ve městě Kazaň, můžete získat diametrálně odlišné výsledky v závislosti na tvaru slov, která zadáte do vyhledávače. Můžete například vyzkoušet zadat výraz „эвакуировать“ (evakuovat) spolu se slovy „Казань“ (nominativ názvu města „Kazaň“) and в Казани („v Kazani“).
- Эвакуировать Казань – Evakuovat Kazaň (beze změn tvarů):
Při vyhledávání ve Zprávách Google obsahují výsledky nejen všechny možné formy jména Kazaň i slovesa evakuovat, ale také například slovo „evakuace“ (эвакуация) a odvozené přídavné jméno kazaňský v různých deklinacích:
Na Twitteru pak dostaneme mnohem méně výsledků, protože tvar „evakuovat“ se ve tweetech a zpravodajských článcích používá zřídka. Jak lze vidět na níže zobrazených výsledcích, mezi jednotlivými tweety jsou čtyřměsíční časové rozestupy, což znamená, že na dané téma neexistují skoro žádné informace, či že je potřeba změnit vyhledávací dotaz.
- Эвакуировали в Казани (“evakuovali v Kazani”)
Použijeme-li formu plurálu minulého času slovesa „evakuovat“ (v ruštině je běžná forma vyjádření v trpném rodě), dostaneme mnohem více užitečných výsledků. Všimněte si druhého výsledku na předchozím snímku, který používá právě tuto formu slov Kazaň a evakuovat. Níže zobrazené tweety jsou velmi různé, ale všechny jsou relevantní pro naše vyhledávání, jako např. evakuace kostela po požáru, evakuace autobusu, školy ap.:
Neovládáte-li ruštinu, je těžké odhadnout, které parametry mohou zvýšit počet relevantních výsledků. Je tedy dobré zadávat obecné termíny či fráze v ruštině, jako „evakuovat“ či „Kazaň“, a posléze zkopírovat termíny, které mají nejvíce výskytů a často se používají. Postupujeme-li takto s výsledky nabídnutými Googlem, najdeme mnohem relevantnější výsledky také na Twitteru, který – na to je třeba pamatovat – si příliš nerozumí s tvárnou povahou ruských sloves.
***
Jak je tedy podle tohoto návodu vidět, vyhledávání v ruštině bez její znalosti může být velmi frustrující a časově náročné, ale je nakonec velmi dobře možné. Nemusíte ani ovládat ruskou abecedu, abyste byli schopni hledat v ruských otevřených zdrojích, ačkoli samozřejmě jistá základní obeznámenost s jazykem může výrazně pomoci. Postupem času se naučíte rozeznávat jednotlivá písmena a naučíte se ruskou cyrilici číst, zvlášť protože jistá jména a názvy se ve vašem vyhledávání budou často opakovat. Zároveň vám tento návod umožní rozluštit nesrozumitelné zkratky a pomůže dosáhnout lepších výsledků při vyhledávání na Googlu či Twitteru.
Autor: Aric Toler, pro Global Voices