Je suis tombé sur un article qui utilise la détection d'anomalie de lien pour prédire les sujets à la mode et je l'ai trouvé extrêmement intriguant: Cet article s'intitule "Découvrir les sujets émergents dans les flux sociaux via la détection d'anomalie de lien" .
J'adorerais le reproduire sur un jeu de données différent, mais je ne connais pas suffisamment les méthodes pour savoir comment les utiliser. Disons que j'ai une série d'instantanés du réseau de nœuds sur une période de six mois. Les nœuds ont une distribution en degrés longue distance, la plupart n'ayant que peu de connexions, mais certains en ont beaucoup. De nouveaux nœuds apparaissent au cours de cette période.
Comment pourrais-je mettre en œuvre des calculs de vraisemblance maximale normalisée séquentiellement actualisés utilisés dans le document pour détecter des liens anormaux qui, selon moi, pourraient être des précurseurs d'une rafale? Y a-t-il d'autres méthodes qui seraient plus appropriées?
Je demande à la fois théoriquement et pratiquement. Si quelqu'un pouvait m'indiquer un moyen d'implémenter cela en python ou en R, ce serait très utile.
N'importe qui? Je sais que vous, les gens intelligents, avez des idées de départ pour une réponse,