Comment créer un système de recommandation qui intègre à la fois le filtrage collaboratif et les fonctionnalités de contenu?


10

Je suis en train de créer un système de recommandation et je veux intégrer à la fois les évaluations d'utilisateurs "similaires" et les caractéristiques des articles. La sortie est une note prédite [0-1]. J'envisage un réseau neuronal (pour commencer).

Ainsi, les entrées sont une combinaison des caractéristiques des articles et des notes de chaque utilisateur. Pour l'article A et l'utilisateur 1, le système pourrait être formé sur les données combinées, A1. Ce serait un exemple de formation.

Et si l'utilisateur 1 notait également le film B? Les données B1 seraient-elles également un exemple de formation? Y a-t-il un problème à répéter la formation avec les fonctionnalités de l'utilisateur 1 de cette manière?

Avez-vous des suggestions sur une meilleure façon d'aborder le problème?

Réponses:


11

Pourquoi envisagez-vous un réseau de neurones avant de bien comprendre le problème?

Les méthodes de factorisation matricielle standard pour le filtrage collaboratif sont capables d'exploiter facilement les fonctionnalités de contenu. Pour un exemple de la façon dont cela peut être fait dans un cadre bayésien, voir le papier Matchbox .


6

Trois articles sur l'intégration de la factorisation matricielle aux fonctionnalités de contenu (ici, le modèle de sujet en particulier):

  • Deepak Agarwal et Bee-Chung Chen. 2010. fLDA: factorisation matricielle par allocation de dirichlets latents. Dans Actes de la troisième conférence internationale ACM sur la recherche sur le Web et l'exploration de données (WSDM '10). ACM, New York, NY, USA, 91-100.
  • Hanhuai Shan et Arindam Banerjee. 2010. Factorisations généralisées à matrice probabiliste pour le filtrage collaboratif. Dans les actes de la Conférence internationale 2010 de l'IEEE sur l'exploration de données (ICDM '10). IEEE Computer Society, Washington, DC, États-Unis, 1025-1030.
  • Chong Wang et David M. Blei. 2011. Modélisation collaborative de sujets pour recommander des articles scientifiques. Dans les actes de la 17e conférence internationale ACM SIGKDD sur la découverte des connaissances et l'exploration de données (KDD '11). ACM, New York, NY, USA, 448-456.

Je voudrais également promouvoir ma propre entrée de blog qui traite un peu de cette question: les modèles de sujet rencontrent les modèles de facteur Lantent


3

Il n'y a pas besoin d'une approche de réseau neuronal, le filtrage collaboratif est un algorithme sur lui-même. Pour votre problème en particulier, il y a une bonne description du système cf et recomender sur:

ml-class.org

(recherchez XVI: Systèmes de recommandation). Il est élégant, simple et si vous le faites correctement (c'est-à-dire en utilisant une forme vectorisée, des minimiseurs rapides et des dégradés préparés), cela peut être assez rapide.


J'ai utilisé cette approche, mais elle n'utilise pas les fonctionnalités des éléments. Je voudrais également inclure des fonctionnalités.
B Seven
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.