Je travaille sur une régression logistique multiple dans R en utilisant glm. Les variables prédictives sont continues et catégoriques. Un extrait du résumé du modèle montre ce qui suit: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 …
Je connais le concept de variables catégorielles et le codage des variables fictives respectif qui nous permet d'ajuster un niveau comme ligne de base afin d'éviter la colinéarité. Je suis également familier avec la façon d'interpréter les estimations de paramètres à partir de ces modèles: le changement prévu dans le …
J'utilise le RandomForestpackage R et je ne sais pas comment interpréter les valeurs de l'axe Y dans leurs graphiques de dépendance partielle. Les documents d'aide indiquent que l'intrigue est une "représentation graphique de l'effet marginal d'une variable sur la probabilité de classe". Cependant, je suis toujours confus quant à ce …
Je me familiarise avec les statistiques bayésiennes en lisant le livre Doing Bayesian Data Analysis , de John K. Kruschke, également connu sous le nom de "chiot livre". Dans le chapitre 9, des modèles hiérarchiques sont présentés avec cet exemple simple: et les observations de Bernoulli sont de 3 pièces, …
Pour une partie d'une question de devoirs, on m'a demandé de calculer la moyenne ajustée pour un ensemble de données en supprimant l'observation la plus petite et la plus grande, et d'interpréter le résultat. La moyenne ajustée était inférieure à la moyenne non ajustée. Mon interprétation était que c'était parce …
Supposons que nous avons un modèle linéaire Model1et vcov(Model1)donne la matrice suivante: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 Pour cet exemple, qu'est-ce que cette matrice affiche réellement? Quelles hypothèses pouvons-nous faire en …
Une brève entrée sur le site Web du NY Times fournit les faits et chiffres de la consommation de pizza aux États-Unis. J'ai un intérêt occasionnel dans la façon dont les statistiques sont utilisées (ou utilisées abusivement) pour fournir des informations au grand public, et quelques questions se sont posées …
Cela me rend confus / époustouflant que le binôme a une variance proportionnelle à . De manière équivalente, les informations de Fisher sont proportionnelles à 1p ( 1 - p )p(1−p)p(1-p) . Quelle est la raison pour ça? Pourquoi l'information Fisher est-elle minimisée àp=0,5? Autrement dit, pourquoi l'inférence est-elle la …
Dans une régression logistique avec des termes linéaires et quadratiques uniquement, si j'ai un coefficient linéaire et un coefficient quadratique , puis-je dire qu'il y a un point tournant de la probabilité à ?β 2 - β 1 / ( 2 β 2 )β1β1\beta_1β2β2\beta_2- β1/ (2 β2)−β1/(2β2)-\beta_1 / (2\beta_2)
Je travaille actuellement sur la construction d'un modèle prédictif pour un résultat binaire sur un ensemble de données avec environ 300 variables et 800 observations. J'ai beaucoup lu sur ce site sur les problèmes liés à la régression pas à pas et pourquoi ne pas l'utiliser. J'ai lu la régression …
J'utilisais l' kmeansinstruction de R pour effectuer l'algorithme k-means sur l'ensemble de données iris d'Anderson. J'ai une question sur certains paramètres que j'ai obtenus. Les résultats sont: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 Dans ce cas, que signifie "Cluster"? Est-ce la moyenne des distances de …
Quelqu'un peut-il expliquer comment calculer l'effet marginal du modèle Probit et Logit en termes simples? Je suis nouveau dans les statistiques et je suis confus au sujet de ces deux modèles.
J'ai un modèle de régression linéaire où la variable dépendante est enregistrée et une variable indépendante est linéaire. Le coefficient de pente pour une variable indépendante clé est négatif: . Je ne sais pas comment interpréter.−.0564−.0564-.0564 Dois-je utiliser la valeur absolue puis la transformer en un négatif comme ceci: (exp(0.0564)−1)⋅100=5.80(exp(0.0564)−1)⋅100=5.80(\exp(0.0564)-1) …
Considérez le code et la sortie suivants: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") Il semble que ce tracé QQ pour log-normal soit …
Voici un tracé QQ pour mon échantillon (notez l'axe Y logarithmique); :n = 1000n=1000n = 1000 Comme l'a souligné whuber, cela indique que la distribution sous-jacente est asymétrique à gauche (la queue droite est plus courte). En utilisant shapiro.test(sur les données transformées par log) dans R, j'obtiens une statistique de …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.