Ré-expression mathématique, souvent non linéaire, des valeurs de données. Les données sont souvent transformées soit pour répondre aux hypothèses d'un modèle statistique, soit pour rendre les résultats d'une analyse plus interprétables.
Si j'ai des données positives très asymétriques, je prends souvent des journaux. Mais que dois-je faire avec des données non négatives hautement asymétriques qui incluent des zéros? J'ai vu deux transformations utilisées: log(x+1)log(x+1)\log(x+1) qui a la particularité que 0 mappe sur 0. log(x+c)log(x+c)\log(x+c) où c est estimé ou défini comme …
J'ai un cadre de données R comme ceci: age group 1 23.0883 1 2 25.8344 1 3 29.4648 1 4 32.7858 2 5 33.6372 1 6 34.9350 1 7 35.2115 2 8 35.2115 2 9 35.2115 2 10 36.7803 1 ... Je dois obtenir un bloc de données sous la …
Supposons que je dispose de certaines données historiques, telles que les cours antérieurs, les fluctuations des prix des billets d'avion, les données financières passées de la société ... Maintenant, quelqu'un (ou une formule) arrive et dit "prenons / utilisons le journal de la distribution" et voici où je vais POURQUOI …
Est-ce que je cherche une distribution plus sage pour la variable indépendante en question, ou pour réduire l'effet des valeurs aberrantes, ou autre chose?
Il est souvent recommandé de prendre la racine carrée lorsque vous avez des données de comptage. (Pour des exemples sur CV, voir la réponse de @ HarveyMotulsky ici ou celle de @ whuber ici .) Par contre, lors de l'ajustement d'un modèle linéaire généralisé avec une variable de réponse distribuée …
J'ai analysé mes données telles quelles. Maintenant, je veux regarder mes analyses après avoir pris le journal de toutes les variables. Beaucoup de variables contiennent beaucoup de zéros. J'ajoute donc une petite quantité pour éviter de prendre le log de zéro. Jusqu'ici, j'ai ajouté 10 ^ -10, sans aucune justification, …
En répondant à cette question sur des données discrètes et continues, j'ai clairement affirmé qu'il était rarement logique de traiter des données catégoriques comme continues. À première vue, cela semble aller de soi, mais l’intuition est souvent un mauvais guide pour les statistiques, ou du moins la mienne. Alors maintenant …
J'ai lu que l'utilisation d'échelles de notation lors de la création de graphiques est appropriée dans certaines circonstances, comme l'axe des ordonnées dans un graphique de séries chronologiques. Cependant, je n'ai pas été en mesure de trouver une explication définitive quant à la raison pour laquelle c'est le cas ou …
Existe-t-il une transformation de type Box-Cox pour les variables indépendantes? C’est-à-dire une transformation qui optimise la variable manière à ce qu’elle corresponde mieux à un modèle linéaire?XXxy~f(x) Si oui, existe-t-il une fonction pour effectuer cela R?
Il existe deux manières différentes d’encoder des variables catégorielles. Disons qu'une variable catégorique a n valeurs. Un codage à chaud le convertit en n variables, alors qu'un codage factice le convertit en n-1 variables. Si nous avons k variables catégorielles, chacune d’elles ayant n valeurs. Un codage à chaud aboutit …
Est-ce que je transforme toutes mes données ou mes plis (si CV est appliqué) en même temps? par exemple (allData - mean(allData)) / sd(allData) Est-ce que je transforme les trains et les tests séparément? par exemple (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Ou dois-je transformer la …
Quelle est la différence entre les données "Normalisation" et les données "Mise à l'échelle"? Jusqu'à présent, je pensais que les deux termes faisaient référence au même processus, mais je réalise maintenant qu'il y a quelque chose de plus que je ne sais pas / ne comprends pas. De même, s'il …
Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme l'augmentation en pourcentage, mais comment cela change-t-il …
Lorsque vous transformez des variables, devez-vous utiliser la même transformation? Par exemple, puis-je choisir et choisir des variables transformées différemment, comme dans: Soit, l'âge, la durée de l'emploi, la durée de résidence et le revenu.X1, x2, x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Ou devez-vous être cohérent avec vos …
J'ai des données de 3 groupes de biomasse d'algues ( , , ) qui contiennent des tailles d'échantillon inégales ( , , ) et j'aimerais comparer si ces groupes appartiennent à la même population.B C n A = 15 n B = 13 n C = 12UNEAABBBCCCnUNE= 15nA=15n_A=15nB= 13nB=13n_B=13nC= 12nC=12n_C=12 …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.