Ignorez les autres réponses ici. Ce n'est pas du tout un paradoxe. La question réelle à portée de main ici que tout le monde semble ignorer que vous confondez qui probabilité que vous cherchez réellement à. Il y a en fait deux moyennes et statistiques complètement différentes en jeu ici qui ont toutes deux leurs propres utilisations et interprétations dans votre exemple proposé (marketing)!
Tout d'abord, il y a le nombre moyen de produits achetés par client. Ainsi, en moyenne, un client achète 1,6 articles. Bien sûr, un client ne peut que 0,6 du produit (en supposant que ce n'est pas quelque chose comme du riz ou du grain auquel une mesure continue lui est associée).
Deuxièmement, il y a le nombre moyen de clients qui achètent un produit particulier. Ça a l'air bizarre non? Donc, en moyenne, un produit a 5.33333333 ... clients l'achetant. C'est différent cependant. Ce que nous décrivons ici n'est pas le nombre de produits achetés (il n'y en a que trois!), Mais plutôt le nombre de personnes qui achètent réellement ledit produit.
Pensez aux deux valeurs de cette façon: que représenteraient ces deux valeurs s'il n'y avait qu'un seul client ou un seul produit? Après tout, la moyenne d'un point de données unique est juste ce point de données donné.
Ou mieux encore, pensez au tableau comme s'il vous donnait les sommes dépensées pour acheter le produit. De toute évidence, le montant moyen dépensé par un client individuel sera bien inférieur au montant d'argent gagné en moyenne par un produit fourni par une grande entreprise (ou même juste une petite entreprise). Je suis sûr que vous pouvez penser à de bonnes façons d'utiliser les deux valeurs lorsque vous discutez du bien-être de l'entreprise.
Lorsque vous allez expliquer cela au personnel marketing, expliquez-le-lui comme je l'ai dit. Ce n'est pas un paradoxe. C'est juste une statistique complètement différente. Le seul problème ici était de remarquer qu'il y avait en fait deux façons différentes de lire le tableau (c'est-à-dire le nombre de personnes achetant par produit par rapport au nombre de produits achetés par personne).
tl; dr la première chose que vous avez décrite est le montant moyen qu'un client individuel est prêt à dépenser pour acheter vos produits. Le second est la demande moyenne d'un produit donné par le public. Je suis sûr que vous pouvez voir maintenant pourquoi les deux ne sont certainement pas la même chose. Les comparer en tant que tels ne vous donnera que des informations sur les ordures.
MODIFIER
Il semblerait que la question porte sur le montant moyen dépensé par les clients qui achètent un produit a, b ou c. Bien. Ce n'est en fait qu'une erreur de calcul. Je n'appellerais pas cela un paradoxe. C'est vraiment juste un flou subtil.
Regardez vos colonnes. Il y a des gens qui sont partagés entre les colonnes. Supposons que vous ayez fait une moyenne pondérée appropriée . Vous ajoutez toujours des personnes deux fois. Cela signifie que la moyenne contiendra des personnes supplémentaires avec une valeur supérieure ou égale à 2. Quelle était votre moyenne? C'était 1,6! En substance, votre moyenne ressemble à ceci:
∑ni=0valueOfPersoni∗valueOfPersonin
Ce n'est certainement pas la bonne formule. C'est une moyenne pondérée, mais en supposant une exclusivité mutuelle, c'est ainsi que vous vous ajusteriez pour obtenir une vraie moyenne dans votre situation.
∑ni=0numberOfPeopleBuyingi∗averageSpentByPersonBuyingin
De toute façon, vous obtiendrez une moyenne foirée. Une erreur a été de ne pas tenir compte de la nécessité d'une moyenne pondérée car une catégorie a un «poids» plus élevé en termes de moyenne. C'est comme la densité. Une valeur est plus dense chez les personnes représente. L'autre problème est l'ajout de doublons qui faussera la moyenne. Je n'appelle cependant ni l'un ni l'autre de ces "paradoxes". Une fois que j'ai vu ce que vous faisiez, il m'a semblé évident pourquoi cela ne fonctionnerait pas. La moyenne pondérée est quelque peu explicite pour son besoin et je pense maintenant que vous voyez que vous avez ajouté des valeurs plusieurs fois ... cela ne peut pas fonctionner. Vous avez essentiellement pris la moyenne des carrés de leurs valeurs.