J'étudie l'utilisation des tests de signification statistique (SST) pour valider les résultats de l'analyse en grappes. J'ai trouvé plusieurs articles sur ce sujet, tels que
- « Signification statistique du regroupement pour les données de grande taille et de faible taille d'échantillon » par Liu, Yufeng et al. (2008)
- " Sur certains tests de signification dans l'analyse en grappes ", par Bock (1985)
Mais je suis intéressé à trouver de la littérature faisant valoir que le SST n'est PAS approprié pour valider les résultats de l'analyse de cluster. La seule source que j'ai trouvée affirmant qu'il s'agit d'une page Web d'un fournisseur de logiciels
Clarifier:
Je suis intéressé à tester si une structure de cluster significative a été trouvée à la suite de l'analyse de cluster, donc, j'aimerais avoir des articles qui soutiennent ou réfutent la préoccupation "sur la possibilité de tests post-hoc des résultats des données exploratoires analyse utilisée pour trouver des clusters ".
Je viens de trouver un article de 2003, " Clustering and classification methods " de Milligan et Hirtle, disant, par exemple, que l'utilisation de l'ANOVA serait une analyse invalide car les données n'ont pas d'assignations aléatoires aux groupes.