Analyse de classe latente vs analyse de cluster - différences dans les inférences?


30

Quelles sont les différences dans les inférences qui peuvent être faites à partir d'une analyse de classe latente (ACV) par rapport à une analyse en grappes? Est-il exact qu'une ACV suppose une variable latente sous-jacente qui donne naissance aux classes, alors que l'analyse de cluster est une description empirique des attributs corrélés d'un algorithme de clustering? Il semble que dans les sciences sociales, l'ACV a gagné en popularité et est considérée comme supérieure sur le plan méthodologique étant donné qu'elle dispose d'un test de signification formel du chi carré, ce que l'analyse en grappes n'a pas.

Ce serait formidable si des exemples pouvaient être proposés sous la forme de: "L'ACV serait appropriée pour cela (mais pas une analyse en grappes), et une analyse en grappes serait appropriée pour cela (mais pas une analyse de classe latente).

Merci! Brian


1
Comment appelez-vous inferencesdans ce contexte et pourquoi seules les différences d'inférence vous intéressent?
ttnphns

1
@ttnphns Par inférences, je veux dire l'interprétation substantielle des résultats. Je ne suis pas sûr de la dernière partie de votre question sur mon intérêt pour "seulement les différences dans les déductions?" Je ne m'intéresse pas à l'exécution de leurs algorithmes respectifs ni aux mathématiques sous-jacentes. Je suis intéressé par la façon dont les résultats seraient interprétés.
Brian P

Réponses:


27

L'analyse de classe latente est en fait un modèle de mélange fini (voir ici ). La principale différence entre FMM et d'autres algorithmes de clustering est que FMM vous propose une approche de «clustering basé sur un modèle» qui dérive les clusters à l'aide d'un modèle probabiliste qui décrit la distribution de vos données. Ainsi, au lieu de trouver des grappes avec une mesure de distance choisie arbitrairement, vous utilisez un modèle qui décrit la distribution de vos données et sur la base de ce modèle, vous évaluez les probabilités que certains cas soient membres de certaines classes latentes. Vous pouvez donc dire qu'il s'agit d'une approche descendante (vous commencez par décrire la distribution de vos données) tandis que d'autres algorithmes de clustering sont plutôt des approches ascendantes (vous trouvez des similitudes entre les cas).

Parce que vous utilisez un modèle statistique pour la sélection de votre modèle de données et l'évaluation de la qualité de l'ajustement sont possibles - contrairement au clustering. De plus, si vous supposez qu'il existe un processus ou une "structure latente" qui sous-tend la structure de vos données, les FMM semblent être un choix approprié car ils vous permettent de modéliser la structure latente derrière vos données (plutôt que de simplement rechercher des similitudes).

Une autre différence est que les FMM sont plus flexibles que le clustering. Les algorithmes de clustering ne font que du clustering, alors qu'il existe des modèles basés sur FMM et LCA qui

  • vous permettent de faire une analyse confirmatoire entre groupes,
  • combiner la théorie de la réponse aux objets (et d'autres) modèles avec l'ACV,
  • inclure des covariables pour prédire l'appartenance à une classe latente des individus,
  • et / ou même des modèles de régression intra-cluster en régression de classe latente ,
  • vous permettre de modéliser les changements dans le temps dans la structure de vos données, etc.

Pour plus d'exemples, voir:

Hagenaars JA & McCutcheon, AL (2009). Analyse de classe latente appliquée. La presse de l'Universite de Cambridge.

et la documentation des packages flexmix et poLCA dans R, y compris les articles suivants:

Linzer, DA et Lewis, JB (2011). poLCA: Un package R pour l'analyse de classe latente variable polytomique. Journal of Statistical Software, 42 (10), 1-29.

Leisch, F. (2004). Flexmix: A general framework for finite mixture models and latent glass regression in R. Journal of Statistical Software, 11 (8), 1-18.

Grün, B. et Leisch, F. (2008). FlexMix version 2: mélanges finis avec variables concomitantes et paramètres variables et constants . Journal of Statistical Software, 28 (4), 1-35.


3

Un modèle de classe latente (ou profil latent, ou plus généralement, un modèle à mélange fini) peut être considéré comme un modèle probabiliste de regroupement (ou classification non supervisée). L'objectif est généralement le même: identifier des groupes homogènes au sein d'une population plus large. Je pense que les principales différences entre les modèles de classes latentes et les approches algorithmiques du clustering sont que les premiers se prêtent évidemment à des spéculations plus théoriques sur la nature du clustering; et parce que le modèle de classe latente est probabiliste, il offre des alternatives supplémentaires pour évaluer l'ajustement du modèle via des statistiques de vraisemblance, et capture / conserve mieux l'incertitude dans la classification.

Vous pourriez trouver des informations utiles dans ce fil , ainsi que cette réponse dans un article connexe de chl.

Il y a aussi des parallèles (au niveau conceptuel) avec cette question sur l'analyse PCA vs analyse factorielle, et celle-ci aussi.


2

La différence est que l'analyse de classe latente utiliserait des données cachées (qui sont généralement des modèles d'association dans les entités) pour déterminer les probabilités des entités de la classe. Ensuite, des inférences peuvent être faites en utilisant le maximum de probabilité pour séparer les éléments en classes en fonction de leurs caractéristiques.

L'analyse de cluster trace les fonctionnalités et utilise des algorithmes tels que les voisins les plus proches, la densité ou la hiérarchie pour déterminer à quelles classes un élément appartient.

Fondamentalement, l'inférence ACV peut être considérée comme "quels sont les modèles les plus similaires en utilisant la probabilité" et l'analyse par grappe serait "quelle est la chose la plus proche en utilisant la distance".


Pouvez-vous clarifier à quoi «chose» fait référence dans la déclaration sur l'analyse des clusters? Est-ce la «caractéristique» la plus proche basée sur une mesure de la distance?
Brian P

chose serait un objet ou toutes les données que vous entrez avec les paramètres de fonctionnalité.
ccsv
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.