Questo articolo fa parte di una guida di RuNet Echo e si propone di aiutare le persone a imparare a condurre una ricerca open-source su Internet in lingua russa. Visualizza la guida completa alla pagina speciale del progetto.
Condurre ricerche open-source può essere difficile, ed è ancora più difficile quando non si conosce la lingua del tema della ricerca. Grazie ad Internet tuttavia, anche per chi non conosce la lingua russa è possibile svolgere delle ricerche in tale lingua. Per fare ciò è necessario coniugare conoscenze nella navigazione con algoritmi di ricerca e strumenti di traduzione. Questa guida illustra e spiega le risorse gratuite che consentono di condurre una ricerca open-source in lingua russa di senza conoscerne la lingua. Qui potrete anche imparare come navigare con algoritmi di ricerca su Google e Twitter per recuperare le informazioni utilizzabili.
Google Translate
Se avete poca o nessuna conoscenza della lingua russa, il software di traduzione è una necessità assoluta per condurre ricerche sulle informazioni open-source. Google Translate è lo strumento più versatile per la traduzione, offre molte caratteristiche che probabilmente già conoscete.
La funzione di traduzione di Google Translate è sicuramente già conosciuta da voi, copia e incolla in russo (o digitare in inglese) del testo, e ottenere la traduzione. È anche possibile inserire l’URL di un sito web nella casella di traduzione e vedere l’intera pagina tradotta in qualsiasi lingua.
Se avete difficoltà a leggere l’alfabeto russo, Google Translate ha la funzione “disegno”, che consente di delineare le lettere utilizzando il mouse o il trackpad e poi converte gli schizzi in in testo traducibile. Vedi sotto per un esempio con un Магнит ( “Magnit,” che significa “magnete”) insegna della vetrina del supermercato:
Quando si disegna il testo, Google suggerisce automaticamente il testo editabile da abbinare al vostro disegno. A volte il primo suggerimento non è sempre corretto e per essere sicuri è meglio consultare le varie opzioni proposte.
Abbreviazioni e Acronimi
Come con l’inglese, ci sono una serie apparentemente infinita di sigle ed acronimi in russo e il sito web Sokr.ru aiuta navigare molti di questi puzzle. Per la decodifica specifica di una località nella lingua, particolarmente utile è la voce di Wikipedia in russo, che elenca le abbreviazioni comuni per varie località in Russia (città, paesi, villaggi, e così via).
Ad esempio, il seguente testo si trova nel titolo di un video su VK, pubblicato da un canale video pro-separatista. Utilizzando i due strumenti di cui sopra, è possibile decifrare i dati anche senza parlare russo.
г.Донецк Ленинский р-н обстрел РСЗО “Ураган”
Ci sono tre sigle qui, che sono tutte e tre molto comuni nei video relativi al conflitto ucraino
- г. Донецк: The first listing for “г.” On Sokr.ru brings up “город” (city), which is also the second entry on the Wikipedia page listing abbreviations. This describes the city of Donetsk (Донецк).
- Ленинский р-н: Both the Sokr.ru website and Wikipedia say this means “район” (region/district) for this abbreviation. This describes the Lenin (Ленинский) district.
- РСЗО: This has nothing to do with towns, so we must rely on Sokr, which tells us that this acronym is short for “реактивная система залпового огня / ракетная система залпового огня” (reactive system of volley fire / rocket system of volley fire). The English equivalent to this is “multiple rocket launcher system” (MLRS), which in this case refers to the Uragan (“Hurricane”) MLRS.
Pertanto, il titolo del video è ” ‘Uragan’ città di Donetsk quartiere Leninskiy bombardamenti MLRS”
Ricercare in russo
In inglese le parole raramente cambiano in base al loro ruolo in una frase, ma di tanto in tanto si aggiunge una lettera per indicare il numero o il possesso (soldato, soldati, soldato di, soldati ‘), o nel caso di alcuni pronomi per indicare soggetto o oggetto ( chi o chi, lui o lui, o lei, e così via).
Le cose non sono così semplici in russo, in quanto vi sono circa una dozzina di moduli per ogni parola (che indicano il singolare o il plurale e il caso), e diverse coniugazioni dei verbi. A seconda del suo ruolo nella frase (soggetto, oggetto diretto, oggetto indiretto, plurale, plurale oggetto diretto, e così via), la parola “gatto” può avere le seguenti nove forme: кошка, кошки, кошке, кошку , кошкой, кошек, кошкам, кошками, кошках. A rendere le cose più complicate, ognuna di queste grafie restituisce risultati diversi in una ricerca, ad esempio in Twitter il semplice “gatto” o “gatti” forme di sostantivo, restituirà molti più risultati di quanto una ricerca avanzata eseguita “con un gatto” o ” con i gatti. “
Wiktionary provvede alle forme declinate per la maggior parte delle parole nella sua sezione Declinazione, insieme con le coniugazioni verbali. Ad esempio, la voce Wiktionary per кошка (cat) mostra le forme singolari e plurali per ciascuno dei sei casi russi. Nello svolgimento delle ricerche, assicurarsi di rimuovere il segno di accento (il piccolo segno sulla о́, come si vede nella ко́шка) dalle lettere premendo backspace davanti le lettere accentate.
Quando effettuiamo ricerche su Google, questo non è il maggior problema in quanto gli algoritmi di ricerca sono in grado di comprendere molte delle forme di una parola nelle sue ricerche. (Quando si immette la parola russa per il gatto (кошка) in una ricerca, i risultati rilevanti che comprendono le altre forme sono comunque spesso riportare e suggerite) Pertanto, a meno che si metta la parola tra virgolette per specificare i risultati, non c’è bisogno di preoccuparsi del sostantivo e delle forme verbali durante la ricerca su Google in russo.
Su Twitter, però la situazione è differente. Twitter può restituire solo i risultati per l’esatta lettera data e non è in grado di rilevare i cambiamenti nella forma dei verbi (come “run”, “corse”, “corre”) o dei sostantivi.
Se si stava tentando di trovare informazioni sull’evacuazione di un edificio nella città di Kazan, è possibile ottenere risultati di ricerca drasticamente diversi, a seconda delle forme di parole che vengono inserite nella vostra ricerca. Ad esempio, provare ad effettuare due differenti ricerche con forme del verbo “эвакуировать” (per evacuare) con le stringhe di ricerca di Казань (forma normale di “Kazan”) e в Казани ( “a Kazan”).
- Эвакуировать Казань – Evacuate Kazan (no changes to verb/noun forms):
Effettuando la ricerca su Google News, i risultati includono varie forme di entrambi Kazan ed evacuare, ma sarà anche riportato il sostantivo “evacuazione” (эвакуация) e la forma aggettivale di Kazan in varie declinazioni:
Su Twitter si ottengono molti meno risultati, in quanto questa forma del verbo “evacuare” viene usata raramente in tweet di articoli e notizie. Come si vede nei risultati qui sotto, c’è un divario di 4 mesi tra tre tweets che indica che non vi è quasi nessuna informazione relativa a questo argomento, o che la frase di ricerca debba essere modificata.
- Эвакуировали в Казани (“evacuated in Kazan”)
Utilizzando il passato sotto forma plurale di “Evacuare”otteniamo risultati di gran lunga più utili rispetto i primi termini di ricerca. (Se si guarda indietro ai risultati di Google News, il secondo risultato utilizza queste forme di parole, evacuare e Kazan.) I tweets di seguito sono abbastanza vari, ma sono tutti rilevanti per i risultati della ricerca, come ad esempio l’evacuazione di una chiesa dopo incendi, evacuazione autobus, e l’evacuazione della scuola
Se non si ha familiarità con la Russia, è difficile sapere quali frasi e parametri di ricerca è meglio utilizzare per massimizzare i risultati. Quindi, è una buona idea inserire termini e frasi generiche in russo nella ricerca Google, ad esempio “evacuazione” e “Kazan», e quindi copiare i termini utilizzati più di frequente. Dopo aver effettuato queste operazioni e trovato i risultati nelle news di Google, troviamo molti più risultati rilevanti anche nella nostra ricerca su Twitter.
***
Come si può vedere da queste guide, la ricerca in lingua russa senza conoscerla può essere frustrante e richiedere molto tempo, ma alla fine è possibile. Non c’è bisogno di saper leggere il russo o conoscere l’alfabeto cirillico per effettuare una ricerca anche se certamente aiuta avere una conoscenza di base della lingua. Dopo un po ‘, si inizierà a riconoscere le lettere e a capire come leggere l’alfabeto, tanto più che certi nomi di città diventano ricorsivi nelle ricerche.
By Aric Toler, Global Voices