Ensembles de données / API de réseaux sociaux accessibles au public


26

En tant qu'extension de notre grande liste d' ensembles de données disponibles publiquement , j'aimerais savoir s'il existe une liste d'ensembles de données de réseaux sociaux / API d'exploration accessibles au public. Ce serait très bien si à côté d'un lien vers l'ensemble de données / API, les caractéristiques des données disponibles étaient ajoutées. Ces informations devraient être et ne sont pas limitées à:

  • le nom du réseau social;
  • quel type d'informations utilisateur il fournit (messages, profil, réseau d'amitié, ...);
  • si elle permet d'explorer son contenu via une API (et taux: 10 / min, 1k / mois, ...);
  • s'il fournit simplement un instantané de l'ensemble des données.

Toutes les suggestions et autres caractéristiques à ajouter sont les bienvenues.

Réponses:


20

Quelques mots sur les API des réseaux sociaux. Il y a environ un an, j'ai écrit une revue des API des réseaux sociaux populaires pour les chercheurs. Malheureusement, c'est en russe. En voici un résumé:

Twitter ( https://dev.twitter.com/docs/api/1.1 )

  • presque toutes les données sur les tweets / textes et les utilisateurs sont disponibles;
  • manque de données sociodémographiques;
  • grande API de streaming: utile pour le traitement de texte en temps réel;
  • beaucoup de wrappers pour programmer des langages;
  • obtenir la structure du réseau (connexions) est possible, mais coûteux en temps (1 demande par minute).

Facebook ( https://developers.facebook.com/docs/reference/api/ )

  • limites de débit: environ 1 demande par seconde;
  • bien documenté, bac à sable présent;
  • API graphique FQL (de type SQL) et «Regular Rest»;
  • données d'amitié et caractéristiques sociodémographiques présentes;
  • beaucoup de données dépassent l' horizon des événements : seules les données des amis et amis d'amis sont plus ou moins complètes, presque rien ne peut être étudié sur un utilisateur aléatoire;
  • certains bogues étranges de l'API, et il semble que personne ne s'en soucie (par exemple, certaines fonctionnalités disponibles via FQL, mais pas via le synonyme de l'API Graph).

Instagram ( http://instagram.com/developer/ )

  • limites de taux: 5000 demandes par heure;
  • API en temps réel (comme Streaming API pour Twitter, mais avec des photos) - la connexion à celle-ci est un peu délicate: les rappels sont utilisés;
  • manque de données sociodémographiques;
  • photos, filtre les données disponibles;
  • imperfections inattendues (par exemple, il est possible de collecter seulement 150 commentaires pour poster / photo).

Foursquare ( https://developer.foursquare.com/overview/ )

  • limites de taux: 5000 demandes par heure;
  • royaume des données géosociales :)
  • assez fermé des recherches en raison de problèmes de confidentialité. Pour collecter les données d'enregistrement, il faut construire un analyseur composite fonctionnant avec les API 4sq, bit.ly et twitter à la fois;
  • encore: manque de données sociodémographiques.

Google+ ( https://developers.google.com/+/api/latest/ )

  • environ 5 demandes par seconde (essayez de vérifier);
  • principales méthodes: activités et personnes;
  • comme sur Facebook, beaucoup de données personnelles pour un utilisateur aléatoire sont cachées;
  • manque de données de connexions utilisateur.

Et hors compétition: j'ai passé en revue les réseaux sociaux pour les lecteurs russes, et le réseau n ° 1 ici est vk.com . Il est traduit dans de nombreuses langues, mais n'est populaire qu'en Russie et dans d'autres pays de la CEI. Lien vers les documents de l'API: http://vk.com/dev/ . Et de mon point de vue, c'est le meilleur choix pour la recherche de médias sociaux homebrew. Du moins, en Russie. Voilà pourquoi:

  • limites de taux: 3 demandes par seconde;
  • texte public et données sur les médias disponibles;
  • données sociodémographiques disponibles: pour un niveau de disponibilité aléatoire des utilisateurs est d'environ 60 à 70%;
  • des connexions entre les utilisateurs sont également disponibles: presque toutes les données sur les amitiés pour un utilisateur aléatoire sont disponibles;
  • certaines méthodes spéciales: par exemple, il existe une méthode pour obtenir le statut en ligne / hors ligne de l'utilisateur exact en temps réel, et on peut créer un calendrier pour son public.

1
Impressionnant pure! En fait, je m'attendais à ce que quelque chose comme ça se dissolve dans de nombreuses réponses, et vous êtes venu avec le tout: D Merci pour la réponse. Bon travail! :)
Rubens

1
J'ai laissé derrière moi la portée de LinkedIn, YouTube, Secret. Peut-être d'autres réseaux régionaux (QQ?). Et serait heureux d'obtenir des informations à leur sujet.
sobach

8

Ce n'est pas un réseau social en soi, mais Stackexchange publie périodiquement l'intégralité de son vidage de base de données:

Vous pouvez extraire des informations sociales en analysant les utilisateurs qui se demandent et répondent les uns aux autres. Une bonne chose est que, puisque les messages sont balisés, vous pouvez facilement analyser les sous-communautés.


6

Une bonne liste d'ensembles de données de réseaux sociaux accessibles au public se trouve sur le site Web du Stanford Network Analysis Project:

Ensembles de données SNAP

Le site contient des données de réseaux sociaux Internet (Facebook, Twitter, Google Plus), des réseaux de citation pour des revues académiques, des réseaux de co-achat d'Amazon et plusieurs autres types de réseaux. Ils ont des graphiques dirigés, non dirigés et bipartites et tous les jeux de données sont des instantanés qui peuvent être téléchargés sous forme compressée.


5

Un exemple en Allemagne: Xing un site similaire à linkedin mais limité aux pays germanophones.

Lien vers son développeur central: https://dev.xing.com/overview

Donne accès à: profils d'utilisateurs, conversations entre utilisateurs (limité à l'utilisateur lui-même), annonces d'emploi, contacts et contacts de contacts, actualités du réseau et certaines API de géolocalisation.

Oui, il a un api, mais je n'ai pas trouvé d'informations sur le tarif. Mais il me semble que certaines informations sont limitées au consentement de l'utilisateur.


4

Network Repository ( http://networkrepository.com ) a des tonnes de réseaux sociaux, des graphiques Web, des réseaux bio et cérébraux, etc. Mieux encore, ils ont également des outils analytiques visuels interactifs pour comparer / explorer les différents réseaux sociaux.


2

Une petite collection de ces liens peut être trouvée ici . Beaucoup d'entre eux sont des graphiques sociaux.


Je vous remercie beaucoup d'avoir posté cette référence, mais je me attendais les réponses ici au point un ensemble de données public / API pour réseau social, AndAlso décrire ce qui est prévu par cette source (soit le taux de téléchargement des messages, ou quel type d'information sur les utilisateurs). Comme votre réponse est, je suppose que ce serait la bienvenue dans la liste des ensembles de données accessibles au public que nous avons.
Rubens

0

Texte thaï de différentes plateformes de médias sociaux + étiquettes de sentiment (positif, neutre, négatif).

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.