Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test non paramétrique comme Mann-Whitney-U-testcela entraînerait la perte …
Je dois faire face à un problème de classification de texte. Un robot d'indexation analyse des pages Web d'un certain domaine et pour chaque page Web, je veux savoir si elle appartient à une seule classe spécifique ou non. Autrement dit, si j'appelle cette classe positive , chaque page Web …
J'ai quelques données dichotomiques, seulement des variables binaires, et mon patron m'a demandé d'effectuer une analyse factorielle en utilisant la matrice de corrélations tétrachoriques. J'ai déjà pu m'apprendre à exécuter différentes analyses sur la base des exemples ici et sur le site de statistiques de l' UCLA et d'autres sites …
J'analyse des données sur 300 000 élèves dans 175 écoles avec un modèle logistique linéaire à effets mixtes (interceptions aléatoires). Chaque élève se produit exactement une fois et les données s'étalent sur 6 ans. Comment répartir la variance entre les niveaux de l'école et des élèves, d'une manière similaire au …
Lors de la dichotomisation des variables, quelles informations sont perdues dans le processus? Comment une dichotomisation aide-t-elle dans les analyses?
Le bildpackage semble être un excellent package pour les réponses binaires en série. Mais c'est pour un temps discret. Je voudrais spécifier une fonction lisse du temps pour la connexion du rapport de cotes de la réponse actuelle Y avec des réponses binaires mesurées à des moments antérieurs, ou au …
Quels sont les avantages et les inconvénients de l'utilisation de LARS [1] par rapport à l'utilisation de la descente de coordonnées pour ajuster la régression linéaire régularisée L1? Je m'intéresse principalement aux aspects de performance (mes problèmes ont tendance à avoir Ndes centaines de milliers et p<20). Cependant, toute autre …
Contexte: Il y a ici d'excellentes questions / réponses sur la façon d'étalonner les modèles qui prédisent les probabilités qu'un résultat se produise. Par exemple Le score de Brier et sa décomposition en résolution, incertitude et fiabilité . Tracés d'étalonnage et régression isotonique . Ces méthodes nécessitent souvent l'utilisation d'une …
J'ai une série temporelle binaire avec 1 lorsque la voiture ne bouge pas et 0 lorsque la voiture se déplace. Je veux faire une prévision pour un horizon temporel jusqu'à 36 heures à l'avance et pour chaque heure. Ma première approche a été d'utiliser un Naive Bayes en utilisant les …
J'effectue une tâche de classification binaire où la probabilité de résultat est assez faible (environ 3%). J'essaie de décider s'il faut optimiser par AUC ou perte de journal. Autant que j'ai compris, l'AUC maximise la capacité du modèle à discriminer entre les classes tandis que la perte de log pénalise …
On m'a dit qu'il était possible d'effectuer une régression IV en deux étapes où la première étape est un probit et la deuxième étape est une OLS. Est-il possible d'utiliser 2SLS si la première étape est un probit mais la deuxième étape est un modèle probit / poisson?
Nous avons des données avec un résultat binaire et quelques covariables. J'ai utilisé la régression logistique pour modéliser les données. Juste une simple analyse, rien d'extraordinaire. La sortie finale est supposée être une courbe dose-réponse où nous montrons comment la probabilité change pour une covariable spécifique. Quelque chose comme ça: …
Je fais des analyses de panier mon ensemble de données est un ensemble de vecteurs de transaction, avec les articles que les produits sont achetés. Lors de l'application de k-means sur les transactions, j'obtiendrai toujours un résultat. Une matrice aléatoire montrerait probablement aussi quelques grappes. Existe-t-il un moyen de tester …
Le mgcvpackage pour Ra deux fonctions pour ajuster les interactions des produits tensoriels: te()et ti(). Je comprends la division de base du travail entre les deux (ajustement d'une interaction non linéaire vs décomposition de cette interaction en effets principaux et interaction). Ce que je ne comprends pas, c'est pourquoi te(x1, …
J'ai une grande matrice (650K lignes * 62 colonnes) de données binaires (0-1 entrées uniquement). La matrice est généralement clairsemée: environ 8% est remplie. Je voudrais le regrouper en 5 groupes - disons nommés de 1 à 5. J'ai essayé le regroupement hiérarchique et il n'a pas pu gérer la …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.