Envisagez un problème de filtrage collaboratif. Nous avons une matrice de taille #users * #items. si l'utilisateur i aime l'article j, si l'utilisateur i n'aime pas l'article j ets'il n'y a pas de données sur la paire (i, j). Nous voulons prédire pour les futurs utilisateurs, paires d'articles.
L'approche de filtrage collaboratif standard consiste à représenter M comme le produit de 2 matrices telles que est minimale (par exemple en minimisant l'erreur quadratique moyenne pour les éléments connus de ).
La fonction de perte logistique me semble plus appropriée, pourquoi tous les algorithmes utilisent-ils MSE?