Le centrage consiste à soustraire le score moyen global de l'échantillon du score d'origine; la normalisation fait de même, suivie de la division par l'écart-type global de l'échantillon.
Dans certaines publications, j'ai lu qu'une régression avec plusieurs variables explicatives, si différentes unités, devait être normalisée. (La normalisation consiste à soustraire la moyenne et à la diviser par l'écart type.) Dans quels autres cas dois-je normaliser mes données? Existe-t-il des cas dans lesquels je devrais seulement centrer mes données …
Je continue à lire sur les cas où nous centrons les données (par exemple, avec régularisation ou PCA) afin de supprimer l'interception (comme mentionné dans cette question ). Je sais que c'est simple, mais j'ai du mal à comprendre cela intuitivement. Quelqu'un pourrait-il fournir l'intuition ou une référence que je …
Quelle différence le centrage (ou la dé-signification) de vos données fait-il pour l'ACP? J'ai entendu dire que cela rend les calculs plus faciles ou qu'elle empêche le premier PC d'être dominé par les moyens des variables, mais j'ai l'impression que je n'ai pas encore pu saisir fermement le concept. Par …
J'ai une question liée à la régression multiple et à l'interaction, inspirée de ce fil de CV: terme d'interaction utilisant une analyse de régression hiérarchique à variables centrées? Quelles variables devons-nous centrer? Lorsque je vérifie un effet de modération, je centre mes variables indépendantes et je multiplie les variables centrées …
Mes variables d'entrée ont des dimensions différentes. Certaines variables sont décimales tandis que d'autres sont des centaines. Est-il essentiel de centrer (soustraire la moyenne) ou de mettre à l'échelle (diviser par l'écart-type) ces variables d'entrée afin de rendre les données sans dimension lors de l'utilisation d'une forêt aléatoire?
J'ai un ensemble de données qui contient à la fois des variables catégorielles et des variables continues. On m'a conseillé de transformer les variables catégorielles en variables binaires pour chaque niveau (c'est-à-dire A_level1: {0,1}, A_level2: {0,1}) - je pense que certains ont appelé cela des "variables factices". Cela dit, serait-il …
En lisant comment approximer la distribution de la moyenne de l'échantillon, je suis tombé sur la méthode de bootstrap non paramétrique. Apparemment, on peut approximer la distribution de X¯n−μX¯n−μ\bar{X}_n-\mu par la distribution de , où désigne la moyenne de l'échantillon de l'échantillon bootstrap.X¯∗n−X¯nX¯n∗−X¯n\bar{X}_n^*-\bar{X}_nX¯∗nX¯n∗\bar{X}_n^* Ma question est alors: ai-je besoin du …
Je me rends compte que c'est probablement une question très simple, mais après avoir cherché, je ne trouve pas la réponse que je cherche. J'ai un problème où j'ai besoin de normaliser les variables exécutez la (régression de crête) pour calculer les estimations de crête des bêtas. J'ai ensuite besoin …
J'ai trouvé de nombreux articles utiles sur les variables indépendantes standardisées et les variables indépendantes centrées sur stats.stackexchange.com, mais je suis toujours un peu confus. Je vous demande une évaluation de ce que j'ai compris. De plus, si ce qui suit n'est pas correct, pourriez-vous me corriger? Comment normaliser. Les …
Je veux inclure le terme et son carré (variables prédictives) dans une régression parce que je suppose que les faibles valeurs de ont un effet positif sur la variable dépendante et les valeurs élevées ont un effet négatif. Le devrait capturer l'effet des valeurs plus élevées. J'espère donc que le …
Je lance une analyse de régression hiérarchique et j'ai quelques petits doutes: Calculons-nous le terme d'interaction en utilisant les variables centrées? Faut-il centrer TOUTES les variables continues que nous avons dans l'ensemble de données, à l'exception de la variable dépendante? Lorsque nous devons enregistrer certaines variables (parce que leur sd …
Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. Les fonctions que je connais incluent l' échelle à partir de la base R, la mise à l' échelle à partir …
Lors de l'ajout d'un prédicteur numérique avec des prédicteurs catégoriels et leurs interactions, il est généralement considéré nécessaire de centrer les variables à 0 au préalable. Le raisonnement est que les principaux effets sont autrement difficiles à interpréter car ils sont évalués avec le prédicteur numérique à 0. Ma question …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.