HMS - BLOG

DIGITAL- UND MEDIENMANAGEMENT / FORSCHUNG

Big Data: Über 2 Mio. Facebook-Posts in der Analyse

Big Data ist eines der Buzzwords unserer Zeit, das Problem: Alle reden darüber, niemand weiß wirklich, wie es geht, alle denken, dass es alle anderen wüssten und erwecken daher den Anschein, es auch zu können. Wir haben uns somit dazu entschlossen: Weniger reden, mehr machen!

Die Folge sind über 2 Millionen analysierte Facebook-Posts von 84 Nachrichtenseiten über einen Zeitraum von fünfeinhalb Jahren, das entspricht 9000 Megabyte Daten. Wir haben die Analyse aber natürlich nicht gemacht, um endlich beim Thema Big Data mitreden zu können. Vielmehr hat uns im Zuge einer aktuellen Studie interessiert, wie die Online-Nachrichtenseiten auf einem politischen Links-Rechts-Spektrum eingestuft werden können. Die meisten Menschen haben ja bereits eine Idee davon, ob News-Anbieter eher liberal oder konservativ ausgerichtet sind, so assoziiert man meist eine Nähe zwischen taz und Linke oder sagt der Bild-Zeitung eine Nähe zur CDU nach. Da eine Vermutung in der Wissenschaft aber nicht ausreicht, haben wir uns das noch mal genauer angeschaut, um die Ähnlichkeit bzw. Distanz zwischen Nachrichtenseiten und politischen Parteien zu messen.

Was haben wir also gemacht?

Im Kern haben wir die Inhalte der Parteiprogramme mit den Inhalten der Nachrichtenseiten anhand von Sprach-Vektoren miteinander verglichen. Zunächst haben wir die besagten 2 Millionen Facebook-Posts über die API heruntergeladen. So erhalten wir Informationen zu jedem Post, u.a. wird das Veröffentlichungsdatum und die -uhrzeit sowie der Text des Posts erfasst.
Daten der Facebook-API

Daten der Facebook-API

Text-Mining

Im nächsten Schritt haben wir die Parteiprogramme mithilfe eines Text-Mining-Algorithmus auf typische Begriffe analysiert. Während die SPD bspw. besonders häufig die Begriffe „Solidarrente“ oder „Arbeitnehmer“ in ihren Parteiprogrammen aufgreift, sprechen die Grünen über „Massentierhaltung“ und die „Bäuerinnen“, die FDP hingegen befasst sich mit „Bürgergeld“ und die AfD verwendet besonders häufig Wörter wie „Genderideologie“ und „Staatsvolk“.
Typische Begriffe aus den Parteiprogrammen

Typische Begriffe aus den Parteiprogrammen

Vergleich von Sprach-Vektoren

Nachdem wir diese charakteristischen Begriffe identifiziert haben, erfolgt nun der Abgleich mit den Posts der Nachrichtenseiten. Hier werden 756 mögliche Partei-Nachrichtenseiten-Kombinationen durchgespielt.
Vergleich der Sprach-Vektoren

Vergleich der Sprach-Vektoren

Links-Rechts-Spektrum

Schließlich fehlt noch die Einordnung der Nachrichtenseiten im politischen Spektrum. Diese lässt sich anhand von „Scores“ abbilden, die mit Hilfe von Politbarometer-Umfragedaten und den errechneten Ähnlichkeiten zwischen Nachrichtenseiten/Parteien ermittelt werden.
Scores im Links-Rechts-Spektrum

Scores im Links-Rechts-Spektrum

Ergebnisse

Für die weitere Betrachtung haben wir die eingeordneten Nachrichtenseiten in Relation zu den Page-Likes, separat für überregionale und regionale Medien, in einer Grafik abgebildet. Wir halten mehrere Ergebnisse fest: Zum einen sehen wir bei den überregionalen Medien eine Glockenkurve, d.h. beliebtere Seiten auf Facebook (mehr Likes), sind auf dem politischen Spektrum eher in der Mitte angesiedelt. Die weiter links bzw. rechts verorteten Medien, weisen hingegen weniger Likes auf. Bei den regionalen Nachrichtenseiten ist die Verteilung hingegen zerstreuter. Darüber hinaus stellen wir fest, dass die aus dem Alltag stammende Einschätzung der meisten Nachrichtenmedien sich bestätigen, d.h. die taz ist tatsächlich links der Mitte zu finden, die Bild-Zeitung hingegen leicht nach rechts verschoben.
National Media

Überregionale Medien

Regional Media

Regionale Medien

Die hier publizierten Ergebnisse sind Teil der 2018 erscheinenden Studie „Congeniality and News Demand: Evidence from Facebook“ (Working Title) von Marcel Garz, Jil Sörensen und Daniel F. Stone (Bowdoin College).