Réponses:
Un large index de pages facebook a été créé et est disponible sous forme de torrent (il est ~ 2,8 Go) http://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users/3979e54c73099d291605e7579b90838c2cd86a8e9575
Les jeux de données Twitter sont balisés sur Infochimps: http://infochimps.com/tags/twitter
Un jeu de données lastfm est disponible sur http://mtg.upf.edu/node/1671
Je viens de trouver ceci: 476 millions de tweets Twitter (via @yarapavan ).
Nous avons organisé un ensemble de données Twitter pour les amis des utilisateurs en 2009 puis en 2009. Vous pouvez trouver plus d'informations ici: http://strict.dista.uninsubria.it/?p=364
Graphique social Facebook, installations d'applications et utilisateurs, événements, groupes Last.fm sur http://odysseas.calit2.uci.edu/research/
Deux ensembles de données (collectés d'avril à mai 2009) qui contiennent des échantillons représentatifs d'environ 1 million d'utilisateurs sur l'ensemble de Facebook, avec quelques propriétés annotées: pour chaque utilisateur échantillonné, la liste d'amis, les paramètres de confidentialité et l'appartenance au réseau sont inclus. Un troisième ensemble de données (collecté en février 2008) comprend un graphique bipartite qui représente les installations d'applications par les utilisateurs de Facebook. Un quatrième ensemble de données avec des utilisateurs actifs quotidiens et des installations d'applications sur 6 mois (collecté de septembre 2007 à février 2008). Un cinquième ensemble de données qui comprend un échantillon représentatif d'utilisateurs Last.fm obtenu à l'aide d'un échantillonnage multigraphe (collecté en juillet 2010).
Une bonne ressource pour trouver des jeux de données est:
/ r / jeux de données sur Reddit.
Un rapide coup d'œil sur cette page révèle cette source , qui pourrait contenir quelque chose d'utile pour vous.
Ce document utilise un ensemble de données facebook qui est disponible ici. Voici la description des auteurs:
Les données comprennent l'ensemble complet des nœuds et des liens (et certaines informations démographiques) de 100 collèges et universités des États-Unis à partir d'un instantané unique en septembre 2005.