Frequenzen der Propaganda
Sie gilt als eine der meistgelesenen Online-Ressourcen in Russland: die Nachrichtenagentur RIA Nowosti. Wir haben mehr als drei Millionen ihrer Artikel analysiert. Worüber das Medium in den vergangenen 21 Jahren wie oft berichtet, zeigt unser Tool.
Wie wir die Daten aufbereitet haben
Die Grafik zeigt, wie oft einzelne Begriffe und Begriffskombinationen auftauchen in den Artikeln von RIA Nowosti zwischen 2002 und 2022.
Bei der Aufbereitung und Darstellung der Daten haben wir uns weitgehend orientiert am Vorgehen der Kollegen von Zeit Online in ihrem Projekt 70 Jahre Bundestag – Darüber spricht der Bundestag.
Um welche Daten geht es?
Ausgangsbasis der Analyse sind mehr als drei Millionen Artikel, die zwischen 2002 und 2022 auf der Seite von RIA Nowosti veröffentlicht wurden.
Wie sind wir vorgegangen?
Für die Analyse haben wir die Stenogramme zunächst in Einzelwörter – sogenannte Tokens – zerlegt. Die Liste der Einzelwörter haben wir dann um sogenannte Stopwords bereinigt – das sind Wörter wie „und“ (и), „so“ (так) oder „nur“ (только), die für die Analyse keine besondere Relevanz haben.
Da die Begriffe (insbesondere im Russischen) in verschiedenen Formen auftreten können (газета, газеты, газете, газету, …), ging es als nächstes darum, alle Varianten zu vereinheitlichen, sie in ihre Grund- bzw. Lexikonform zu bringen. Dieser Schritt wird in der Computerlinguistik Lemmatisierung genannt. Hierfür verwenden wir einen Algorithmus, den der russische Suchmaschinenanbieter Yandex entwickelt hat.
Da uns nicht nur Einzelbegriffe interessieren, sondern auch Wortverbindungen wie „ausländische Agenten“ (иностранные агенты) oder „Großer Vaterländischer Krieg“ (Великая Отечественная Война), haben wir die Daten außerdem nach Wörtern durchsucht, die besonders häufig in Zweier- und Dreier-Kombinationen auftreten (sogenannte N-Gramme).
Schließlich haben wir gezählt, wie oft die Wörter und Wortverbindungen jeweils in den Dokumenten der einzelnen Jahre auftauchen. Um Verzerrungen durch unterschiedliche Publikationsvolumina in den Jahren auszuschließen, zeigen wir in der Grafik nicht die absolute, sondern die relative Häufigkeit: wie oft ein Wort bzw. eine Wortverbindung pro 100.000 Wörter in einem Jahr auftaucht.
Was sollte noch beachtet werden?
Rechtschreibfehler oder unterschiedliche Schreibweisen können wie in den Originaldokumenten enthalten sein. Um den Datensatz überschaubar zu halten, zeigen wir nur Begriffe, die mindestens 200 mal im gesamten Zeitraum vorkommen.
RIA Nowosti ist eine der ältesten Nachrichtenagenturen Russlands. Vier Tage nach dem deutsche Überfall auf die Sowjetunion am 26. Juni 1941 gegründet, hat sie seither mehrmals den Namen gewechselt. Über viele Jahrzehnte blieb jedoch eines konstant: Sie war stets sehr eng mit dem Staat gekoppelt. Trotzdem galt RIA Nowosti in den 2000er Jahren als eines der liberalsten Staatsmedien in Russland, das mit journalistischen Preisen unter anderem für Live-Übertragungen von Schauprozessen gegen Pussy Riot oder Alexej Nawalny ausgezeichnet wurde. Nach den Bolotnaja-Protesten 2011/2012 und dem Beginn des Maidan in der Ukraine 2013 wurde jedoch auf der höchsten politischen Ebene die Entscheidung getroffen, die Nachrichtenagentur der Medien-Holding Rossija Segodnja (dt. Russland heute) unterzuordnen, unter der Leitung der Propagandisten Dimitri Kisseljow und Margarita Simonjan.
Gemeinsam mit dem Daten-Team der Novaya Gazeta Europe haben wir ein Tool entwickelt, das mehr als drei Millionen Artikel von RIA Nowosti zwischen 2002 und 2022 analysiert und zeigt, welche Wörter und Wortkombinationen wie oft verwendet wurden.
Was kann ich hier machen?
Dieses Tool zeigt, wann und wie oft einzelne Wörter oder Wortkombinationen in Artikeln der russischen staatlichen Nachrichtenagentur RIA Nowosti zwischen 2002 und 2022 verwendet wurden.
Und wie funktioniert es?
Ganz einfach: In der Suchmaske könnt ihr jedes beliebige Wort oder irgendeine Wortkombination eingeben, etwa , , oder, sagen wir mal, . Wenn diese Wörter in den Texten von RIA mehr als 200 Mal vorkommen, werden sie in der Grafik angezeigt: Man kann ablesen, wie oft sie in welchem Monat pro 100.000 Wörter verwendet wurden. Wenn ihr mit der Maus auf die Grafik geht, seht ihr auch die absoluten Zahlen.
Wenn ihr mehrere Wörter oder Wortverbindungen gleichzeitig eingebt, werdet ihr einige Linien auf der Grafik sehen. Das ist manchmal hilfreich, wenn man die Häufigkeit einzelner Wörter vergleichen möchte, etwa: wie oft von der und wie oft vom die Rede ist.
Manche Wörter gibt es nur in einem bestimmten Zeitraum oder sind nur für einen Zeitraum relevant, z. B. die , über die erst ab 2012 im Zuge der Verabschiedung eines Gesetzes diskutiert wurde. Deswegen haben wir für dieses Tool eine Funktion entwickelt, um den Zeitraum zu konkretisieren: ihr könnt dafür einfach die Zeitleiste unter dem Tool verwenden.
Das Wort fällt besonders häufig ab 2014, also ab dem Jahr, in dem Russland die Krim annektiert und der Krieg im Osten der Ukraine begonnen hat.
Apropos Beschuss: Laut RIA Nowosti kann nur die Ukraine „beschießen“. Russische Streitkräfte „verpassen einen Schlag“.
Das Tool kann auch Worthäufigkeiten zusammenzählen. Das ist insbesondere dann wichtig, wenn ein Phänomen verschiedene Namen hat, wie zum Beispiel und – zusammen:
Was tun, wenn ich etwas nicht finden kann?
In diesem Fall wurde das Wort oder die Wortverbindung höchstwahrscheinlich weniger als 200 Mal innerhalb des gesamten Zeitraums (2002–2022) erwähnt.
Aber manchmal unterscheiden sich die Begrifflichkeiten, die RIA Nowosti nutzt, von denen, die in unabhängigen Medien verwendet werden. Dann muss man die Suche kreativ gestalten. Wenn es bei RIA Nowosti um die geht, wird oft das Wort verwendet.
Was kann das Tool sonst noch?
Ihr könnt eure Suchergebnisse mit Hilfe eines speziellen Buttons oben rechts speichern. Die Ergebnisse werden nur in eurem Browser gespeichert und werden unter der Grafik angezeigt.
Die Grafiken kann man auch in teilen. Einfach auf die Icons oben links klicken.
Okay, mit RIA Nowosti ist alles klar. Und habt ihr noch andere ähnliche Tools?
Ja, wir haben auch die Reden von Putin und Medwedew analysiert und auch die Stenogramme der russischen Staatsduma.
Die Stenogramme sind ja auf Russisch! Wie kann ich nach etwas suchen, wenn ich kein Russisch kann?
Ja, das Tool funktioniert erstmal nur auf Russisch. Wir arbeiten aber daran, dass man auch nach deutschen Übersetzungen suchen kann.