J'ai un ensemble de données et je veux trouver le paramètre tel qu'il minimise la somme
J'ai un ensemble de données et je veux trouver le paramètre tel qu'il minimise la somme
Réponses:
Vous demandez probablement une preuve que la médiane résout le problème? Eh bien, cela peut être fait comme ceci:
L'objectif est linéaire par morceaux et donc différenciable sauf pour les points . Quelle est la pente de l'objectif est un certain point m ≠ x i ? Eh bien, la pente est la somme des pentes des mappages m ↦ | m - x j | et c'est soit + 1 (pour m > x j ) ou - 1 (pour m < x j ). Par conséquent, la pente indique combien de x i sont plus petits que m . Vous voyez que la pente est nulle s'il y a autant de plus petits et plus grands que m (pour et nombre pair de x i ). S'il y a un nombre impair de x i , alors la pente est de - 1 à gauche de la "plus moyenne" et + 1 à droite de celle-ci, donc la plus moyenne est la minimale.
Une généralisation de ce problème à plusieurs dimensions est appelée le problème de la médiane géométrique . Comme le souligne David, la médiane est la solution pour le cas 1-D; là, vous pourriez utiliser des algorithmes de sélection de recherche médiane , qui sont plus efficaces que le tri. Les tris sont tandis que les algorithmes de sélection sont O ( n ) ; les tris ne sont plus efficaces que si plusieurs sélections sont nécessaires, auquel cas vous pouvez trier (de manière coûteuse) une fois, puis effectuer des sélections répétées dans la liste triée.
Le lien avec le problème géométrique médian mentionne des solutions pour des cas multidimensionnels.
La solution explicite en termes de médiane est correcte, mais en réponse à un commentaire de mayenew, voici une autre approche.
Il est bien connu que les problèmes de minimisation de général, et le problème affiché en particulier, peuvent être résolus par programmation linéaire.
La formulation LP suivante fera l'affaire pour l'exercice donné avec des inconnues :
tel que: z i ≥ m - x i z i ≥ x i - m
Nous sommes essentiellement après:
Il faut remarquer que (Being more rigorous would say it is a Sub Gradient of the non smooth Norm function).
Hence, deriving the sum above yields .
This equals to zero only when the number of positive items equals the number of negative which happens when .
One should notice that the median
of a discrete group is not uniquely defined.
Moreover, it is not necessarily an item within the group.