J'essaie de créer un ensemble de données sur plusieurs fichiers journaux de l'un de nos produits.
Les différents fichiers journaux ont leur propre mise en page et leur propre contenu; Je les ai regroupés avec succès, il ne reste qu'une étape ...
En effet, les "messages" du journal sont les meilleures informations. Je n'ai pas la liste complète de tous ces messages, et c'est une mauvaise idée de coder en dur sur la base de ceux-ci car cette liste peut changer tous les jours.
Ce que je voudrais faire, c'est séparer le texte d'identification du texte de la valeur (par exemple: "Fichier chargé XXX" devient (identification: "Fichier chargé", valeur: "XXX")). Malheureusement, cet exemple est simple et dans le monde réel, il existe différentes dispositions et parfois plusieurs valeurs.
Je pensais à utiliser des noyaux de chaîne, mais il est destiné au clustering ... et le cluseting n'est pas applicable ici (je ne connais pas le nombre de types de messages différents et même si ce serait trop).
Avez-vous une idée?
Merci de votre aide.
PS: Pour ceux qui programment, cela peut être plus facile à comprendre. Disons que le code contient en tant que logs printf ("blabla% s", "xxx") -> je voudrais que "blabla" et "xxx" soient séparés