J'ai des données qui décrivent la fréquence à laquelle un événement se produit pendant une heure ("nombre par heure", nph) et la durée des événements ("durée en secondes par heure", dph). Ce sont les données d'origine: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, …
J'ai utilisé la fonction glm.fit dans R pour ajuster les paramètres à un modèle de régression logistique. Par défaut, glm.fit utilise des moindres carrés itérativement repondérés pour ajuster les paramètres. Quelles sont les raisons pour lesquelles cet algorithme ne parviendrait pas à converger, lorsqu'il est utilisé pour la régression logistique?
J'ai développé un modèle de régression logistique basé sur les données rétrospectives d'une base de données nationale sur les traumatismes des traumatismes crâniens au Royaume-Uni. Le résultat clé est la mortalité à 30 jours (désignée comme Outcome30mesure). D'autres mesures dans l'ensemble de la base de données avec des preuves publiées …
Je voudrais spécifier un modèle de régression logistique où j'ai la relation suivante: E[Yi|Xi]=f(βxi1+β2xi2)E[Yi|Xi]=f(βxi1+β2xi2)E[Y_i|X_i] = f(\beta x_{i1} + \beta^2x_{i2}) où est la fonction logit inverse.fff Existe-t-il un moyen "rapide" de le faire avec des fonctions R préexistantes ou existe-t-il un nom pour un modèle comme celui-ci? Je me rends compte …
Je modélise actuellement certaines données à l'aide d'une régression logistique binaire. La variable dépendante a un bon nombre de cas positifs et négatifs - elle n'est pas rare. J'ai également un grand ensemble d'entraînement (> 100 000) et le nombre d'effets principaux qui m'intéresse est d'environ 15, donc je ne …
J'utilise la régression logistique pour prédire la probabilité qu'un événement se produise. En fin de compte, ces probabilités sont placées dans un environnement de production, où nous nous concentrons autant que possible sur nos prévisions de «oui». Il est donc utile pour nous d'avoir une idée de ce que les …
Je réalise une régression logistique avec variables indépendantes et observations. J'évalue l'ajustement du modèle afin de déterminer si les données répondent aux hypothèses du modèle et ont produit le tracé résiduel groupé suivant à l'aide du package:242424123,996123,996123,996arm R Évidemment, il y a de mauvais signes dans ce graphique: de nombreux …
J'ai un ensemble de données avec une variable de réponse binaire (survie) et 3 variables explicatives ( A= 3 niveaux, B= 3 niveaux, C= 6 niveaux). Dans cet ensemble de données, les données sont bien équilibrées, avec 100 individus par ABCcatégorie. J'ai déjà étudié l'effet de ceux A- ci Bet …
Je comprends que les coefficients d'une équation logistique peuvent être interprétés comme un rapport impair. Si un terme de régularisation est ajouté pour contrôler le sur-ajustement, comment cela change-t-il l'interprétation des coefficients?
J'ai joué avec la régression logistique avec divers algorithmes d'optimisation par lots (gradient conjugué, newton-raphson et diverses méthodes de quasinewton). Une chose que j'ai remarquée est que, parfois, l'ajout de données à un modèle peut en fait rendre la formation du modèle beaucoup moins longue. Chaque itération nécessite de regarder …
J'ai fait un modèle de régression logistique qui inclut un terme polynomial au degré 2. Je sais que la régression logistique modélise la variable de réponse comme une fonction non linéaire des prédicteurs. Est-il judicieux d'inclure un terme polynomial dans la régression logistique?
Les gens qui travaillent avec la régression logistique connaissent le problème de la séparation parfaite: si vous avez une variable dont les valeurs spécifiques sont associées à un seul des deux résultats (disons un binaire tel que toutes les observations avec ont le résultat = 1 ), la vraisemblance explose …
Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …
J'ai construit un modèle de régression logistique en R et bien que le résultat semble satisfaisant dans une certaine mesure, il y a une question que je ne suis pas en mesure de répondre. Je ne sais pas si mon approche est correcte. Je sais que l'objectif global du modèle …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.