Statistiques et Big Data interpretation

1

Interprétation de la sortie de régression logistique dans R

Je travaille sur une régression logistique multiple dans R en utilisant glm. Les variables prédictives sont continues et catégoriques. Un extrait du résumé du modèle montre ce qui suit: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 …

13 r logistic interpretation p-value

1

Interprétation des proportions qui totalisent un en tant que variables indépendantes dans la régression linéaire

Je connais le concept de variables catégorielles et le codage des variables fictives respectif qui nous permet d'ajuster un niveau comme ligne de base afin d'éviter la colinéarité. Je suis également familier avec la façon d'interpréter les estimations de paramètres à partir de ces modèles: le changement prévu dans le …

13 regression interpretation proportion multicollinearity

1

Signification de l'axe des y dans le graphique de dépendance partielle de la forêt aléatoire

J'utilise le RandomForestpackage R et je ne sais pas comment interpréter les valeurs de l'axe Y dans leurs graphiques de dépendance partielle. Les documents d'aide indiquent que l'intrigue est une "représentation graphique de l'effet marginal d'une variable sur la probabilité de classe". Cependant, je suis toujours confus quant à ce …

13 r interpretation random-forest partial-plot

1

Comment interpréter le tracé d'autocorrélation dans MCMC

Je me familiarise avec les statistiques bayésiennes en lisant le livre Doing Bayesian Data Analysis , de John K. Kruschke, également connu sous le nom de "chiot livre". Dans le chapitre 9, des modèles hiérarchiques sont présentés avec cet exemple simple: et les observations de Bernoulli sont de 3 pièces, …

12 bayesian interpretation python mcmc autocorrelation

3

Comment puis-je interpréter un graphique du pourcentage de rognage par rapport à la moyenne rognée?

Pour une partie d'une question de devoirs, on m'a demandé de calculer la moyenne ajustée pour un ensemble de données en supprimant l'observation la plus petite et la plus grande, et d'interpréter le résultat. La moyenne ajustée était inférieure à la moyenne non ajustée. Mon interprétation était que c'était parce …

12 data-visualization interpretation mean trimmed-mean

2

Interprétation de la matrice de variance-covariance

Supposons que nous avons un modèle linéaire Model1et vcov(Model1)donne la matrice suivante: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 Pour cet exemple, qu'est-ce que cette matrice affiche réellement? Quelles hypothèses pouvons-nous faire en …

12 r interpretation multicollinearity assumptions covariance-matrix

2

Statistiques de pizza pour les masses

Une brève entrée sur le site Web du NY Times fournit les faits et chiffres de la consommation de pizza aux États-Unis. J'ai un intérêt occasionnel dans la façon dont les statistiques sont utilisées (ou utilisées abusivement) pour fournir des informations au grand public, et quelques questions se sont posées …

12 interpretation descriptive-statistics

3

Raison intuitive pour laquelle l'information de Fisher sur le binôme est inversement proportionnelle à

Cela me rend confus / époustouflant que le binôme a une variance proportionnelle à . De manière équivalente, les informations de Fisher sont proportionnelles à 1p ( 1 - p )p(1−p)p(1-p) . Quelle est la raison pour ça? Pourquoi l'information Fisher est-elle minimisée àp=0,5? Autrement dit, pourquoi l'inférence est-elle la …

12 variance binomial interpretation

1

Puis-je interpréter l'inclusion d'un terme quadratique dans la régression logistique comme indiquant un tournant?

Dans une régression logistique avec des termes linéaires et quadratiques uniquement, si j'ai un coefficient linéaire et un coefficient quadratique , puis-je dire qu'il y a un point tournant de la probabilité à ?β 2 - β 1 / ( 2 β 2 )β1β1\beta_1β2β2\beta_2- β1/ (2 β2)−β1/(2β2)-\beta_1 / (2\beta_2)

12 interpretation logit polynomial

1

Interprétation des coefficients de régression LASSO

Je travaille actuellement sur la construction d'un modèle prédictif pour un résultat binaire sur un ensemble de données avec environ 300 variables et 800 observations. J'ai beaucoup lu sur ce site sur les problèmes liés à la régression pas à pas et pourquoi ne pas l'utiliser. J'ai lu la régression …

12 multiple-regression predictive-models interpretation regression-coefficients lasso

2

Interprétation du résultat du clustering k-means dans R

J'utilisais l' kmeansinstruction de R pour effectuer l'algorithme k-means sur l'ensemble de données iris d'Anderson. J'ai une question sur certains paramètres que j'ai obtenus. Les résultats sont: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 Dans ce cas, que signifie "Cluster"? Est-ce la moyenne des distances de …

12 r machine-learning clustering interpretation k-means

3

Effet marginal du modèle Probit et Logit

Quelqu'un peut-il expliquer comment calculer l'effet marginal du modèle Probit et Logit en termes simples? Je suis nouveau dans les statistiques et je suis confus au sujet de ces deux modèles.

12 logistic interpretation logit probit

1

Comment interpréter un coefficient de régression linéaire négatif pour une variable de résultat enregistrée?

J'ai un modèle de régression linéaire où la variable dépendante est enregistrée et une variable indépendante est linéaire. Le coefficient de pente pour une variable indépendante clé est négatif: . Je ne sais pas comment interpréter.−.0564−.0564-.0564 Dois-je utiliser la valeur absolue puis la transformer en un négatif comme ceci: (exp(0.0564)−1)⋅100=5.80(exp⁡(0.0564)−1)⋅100=5.80(\exp(0.0564)-1) …

11 linear-model interpretation regression-coefficients

2

Interprétation du tracé QQ

Considérez le code et la sortie suivants: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") Il semble que ce tracé QQ pour log-normal soit …

11 r data-visualization interpretation qq-plot

1

Puis-je supposer la normalité (log) pour cet échantillon?

Voici un tracé QQ pour mon échantillon (notez l'axe Y logarithmique); :n = 1000n=1000n = 1000 Comme l'a souligné whuber, cela indique que la distribution sous-jacente est asymétrique à gauche (la queue droite est plus courte). En utilisant shapiro.test(sur les données transformées par log) dans R, j'obtiens une statistique de …

11 interpretation lognormal qq-plot

Questions marquées «interpretation»