Comment les entreprises suivent-elles les erreurs sur les appareils, passerelles et plateformes IoT à l'heure actuelle? Mon entreprise utilise papertrail pour agréger les journaux de tous les appareils, mais cela nous laisse souvent traîner entre plusieurs systèmes lorsqu'une erreur se produit en production.
Je suis à la recherche d'un moyen de réduire notre "délai de cause-racine" lors de la résolution des exceptions qui peuvent avoir été générées en un seul endroit (par exemple sur une plate-forme IoT), mais qui sont dues à un problème ailleurs dans le pile - par exemple, erreur de données du périphérique périphérique.
En termes de ce que j'ai trouvé dans cet espace, Sentry et Rollbar sont bons pour le suivi des exceptions sur les serveurs ou les applications, mais ne fournissent pas de moyen de suivre les erreurs en cascade comme discuté dans le paragraphe précédent.
Existe-t-il des systèmes pour faire cela mieux que la journalisation de texte? Je cherche spécifiquement à utiliser les événements de style fil d'Ariane que vous obtenez de Sentry, mais avec un suivi sur un système distribué.