Je suis récemment entré dans le domaine de l'apprentissage automatique et un projet sur lequel je travaille m'oblige à regrouper les utilisateurs en fonction de l'ordre dans lequel ils ont visité les pages Web sur un site Web. J'ai des données sous forme de:
['user_id', 1, 2, 4, 6, 3, 7, 3, 2, 4...]
Où chaque numéro est une catégorie / page visitée par l'utilisateur. De plus, la longueur des données pour chaque utilisateur n'est pas la même, c'est-à-dire que certains utilisateurs visitent plus de pages que d'autres.
Je me rends compte que c'est vraiment vague et qu'il est difficile de définir la similitude. J'ai essayé de suivre l'exemple de ce document de recherche et, pour être honnête, beaucoup de choses m'ont dépassé la tête.
J'ai besoin d'aide pour aborder ce problème et je suis ouvert à de nouvelles idées et suggestions.