Eine Studie bietet tiefe Einblicke in das Twitterversum

Anders als die meisten sozialen Netzwerke macht Twitter fast alle seine Daten über APIs zugänglich. Das ermöglicht neben einer Realtime-Analyse auch den programm­gesteuerten Zugriff auf das Sieben-Jahres-Archiv des Unternehmens.

Forscher der Universität von Illinois haben eine Studie zum Thema Twitter veröffentlicht, die sich dieser Möglichkeiten bedient. Über den Zeitraum eines Monats wurden 10 Prozent des weltweiten Twitter-Stream, bestehend aus über 1,5 Milliarden Tweets von mehr als 70 Millionen Nutzern analysiert. Diese in Twitter Decahose gefassten Tweets werden zufällig ausgewählt und enthalten auch Metadaten, die geolokale und sprachliche Zuordnungen der Nutzer zulassen. Und diese Studie bietet tiefe Einblicke in das Twitterversum.

15 Prozent der Twitter-Nutzer posten 85 Prozent aller Tweets

Laut der auf der Basis von Decahose durchgeführten Untersuchung werden 85 Prozent aller Tweets von nur 15 Prozent der Twitter-Nutzer gepostet. Dabei sind die oberen fünf Prozent der Twitterer für 48 Prozent der Tweets verantwortlich und das aktivste Prozent der Twittergemeinde verfasst 20 Prozent der Tweets. Daraus könnte man folgern, dass die Mehrheit der Twitter-Nutzer den Microblogging-Dienst vor allem als News-Feed nutzt.

verteilung-von-tweets-auf-twitter-nutzer

»The Tweets Heard Around the World« Wirklich?

Seit August 2009 können Tweets geografischen Metadaten enthalten, die den Ort referenziert, wo der Tweet verfasst wurde. Solche Geodaten werden zum Beispiel in Twitter Heartbeat, einem Demonstrationsprojekt des Computer-Herstellers Silicon Graphics ( SGI ) genutzt.

Es gibt zwei Arten von geolokalen Informationen bei Twitter. Das sind zum einen statische Daten, die Nutzer in ihrem Profil hinterlegen. Diese Daten sind dann genau, wenn Twitter — oder Tools von Drittanbietern — auf stationären Rechnern genutzt wird. Ansonsten müssen sie vom Benutzer manuell aktualisiert werden.

Daneben erfassen mobile Geräte über eigene Geolocation-Funktionen den Aufenthaltsort des Nutzers auf vier Nachkommastellen genau, so kann zu jedem Zeitpunkt exakt lokalisiert werden, von wo ein Tweet gesendet wird. Allerdings muss diese Möglichkeit in den Privacy-Einstellungen explizit aktiviert werden.

Obwohl Twitter CEO Dick Costolo gerne über den Twitter als »Puls des Planeten« redet, sieht die Wirklichkeit doch anders aus: Die Mehrheit der Weltbevölkerung nutzt Twitter nicht und sogar die meisten von denen, die Twitter nutzen, twittern nicht.

Faszinierende Einblicke in das Twitterversum

Obwohl Standortdaten von nur 8 Prozent aller Nutzer zur Verfügung standen, bietet die Studie faszinierende Einblicke in das Twitterversum mit eindrucksvollen Darstellungen und Statistiken. Die folgende Darstellung visualisiert die weltweite Verteilung und Häufigkeit der Sprachen, in denen getwittert wird anhand einer Farbskala. Der Informationsgehalt erschließt sich erst vollständig in einer hochauflösenden Version.

Die Studie enthällt ein Fülle von Informationen, die den Rahmen dieses Blogs sprengen. Unbedingt ansehen! Im folgenden nur noch einige Informationen zur Datenbasis.

Twitter Decahose

Die Untersuchung basiert auf 1.535.929521 Tweets von 71.273.997 eindeutigen Twitter-Nutzern im Zeitraum vom 23. Oktober bis zum 30. November 2012. Dabei handelt es sich um zehn Prozent sämtlicher Tweets in Echtzeit, zusammengfasst in dem Datenpaket Twitter Decahose. Neben diesen Daten bietet Twitter auch andere Zugriffsmöglichkeiten. Golem:

Wer die Twitter-Daten für Analysezwecke benötigt, kann bei Gnip zwischen drei Paketen wählen: Twitter Halfhose umfasst 50 Prozent der über Twitters Firehose laufenden Tweets. Das sind im Schnitt 1.100 Tweets pro Sekunde, wobei Twitter Spitzenwerte von über 3.000 Tweets pro Sekunde erreicht. Das dritte Paket heißt Twitter Decahose und umfasst zehn Prozent der über Firehose laufenden Tweets.

Link zur Studie

Bilder: Brian Solis cc BY 2.0, Statista, First Monday