J'ai un fichier CSV avec 4 millions de bords d'un réseau dirigé représentant des personnes communiquant entre elles (par exemple, John envoie un message à Mary, Mary envoie un message à Ann, John envoie un autre message à Mary, etc.). Je voudrais faire deux choses:
Trouvez le degré, l'intervalle et (peut-être) les mesures de centralité des vecteurs propres pour chaque personne.
Obtenez une visualisation du réseau.
Je voudrais le faire en ligne de commande sur un serveur Linux car mon ordinateur portable n'a pas beaucoup de puissance. J'ai R installé sur ce serveur et la bibliothèque statnet. J'ai trouvé ce poste de 2009 d'une personne plus compétente que moi essayant de faire la même chose et ayant des problèmes avec ça. Je me demandais donc si quelqu'un d'autre avait des conseils sur la façon de procéder, de préférence en me prenant étape par étape car je ne sais que charger le fichier CSV et rien d'autre.
Juste pour vous donner une idée, voici à quoi ressemble mon fichier CSV:
$ head comments.csv
"src","dest"
"6493","139"
"406705","369798"
$ wc -l comments.csv
4210369 comments.csv