Quels algorithmes utiles existent-ils qui fonctionnent sur d'énormes flux de données et aussi leurs résultats sont assez petits et on peut calculer le résultat pour un mélange de deux flux en fusionnant en quelque sorte leurs résultats?
Je peux en nommer quelques-uns:
- Les choses évidentes comme sum, min, max, count, top-K etc.
- Algorithmes de flux dits "basés sur des croquis" approximatifs pour les histogrammes, comptant des éléments distincts ou calculant des quantiles
Quels autres sont là?
(Je suis intéressé parce que j'écris un projet de loisir pour la surveillance de systèmes distribués dont l'utilité est directement déterminée par l'utilité de tels algorithmes)