Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Disons que nous avons une variable dépendante avec peu de catégories et un ensemble de variables indépendantes. YYY Quels sont les avantages de la régression logistique multinomiale par rapport à un ensemble de régressions logistiques binaires (c. -à-d. Un schéma un-vs-reste )? Par ensemble de régression logistique binaire, je veux …
C'est la saison d'admission pour les écoles supérieures. Je (et de nombreux étudiants comme moi) essaie maintenant de choisir le programme de statistiques à choisir. Quelles sont les choses que ceux d’entre vous qui travaillent avec les statistiques suggèrent que nous considérions les programmes de maîtrise en statistiques? Existe-t-il des …
plot(density(rexp(100)) De toute évidence, toute densité à gauche de zéro représente un biais. Je cherche à résumer certaines données relatives aux non-statisticiens et à éviter de se demander pourquoi les données non négatives ont une densité inférieure à zéro. Les parcelles sont destinées à la vérification de la randomisation; Je …
Je suis récemment tombé sur le document "L'essai de signification de l'hypothèse nulle", Jeff Gill (1999) . L'auteur a soulevé quelques idées fausses sur les tests d'hypothèses et les valeurs p, au sujet desquelles j'ai deux questions spécifiques: La valeur p est techniquement , ce qui, comme le souligne le …
J'ai récemment appris l'existence d'un principe de raisonnement probabiliste appelé " expliquer ", et j'essaie d'en saisir l'intuition. Permettez-moi de mettre en place un scénario. Soit AAA l’événement d’un séisme. Que l’événement BBB soit l’événement où le joyeux géant vert se promène en ville. Soit CCC l’événement où le sol …
Je souhaite utiliser la régression de Lasso ou de crête pour un modèle comportant plus de 50 000 variables. Je souhaite utiliser un logiciel en mode R. Comment puis-je estimer le paramètre de retrait ( λλ\lambda )? Modifications: Voici le point je me suis levé à: set.seed (123) Y <- …
Une version très simple du théorème central limité comme ci-dessous qui est Lindeberg – Lévy CLT. Je ne comprends pas pourquoi il y a un sur le côté gauche. Et Lyapunov CLT dit mais pourquoi pas ? Quelqu'un pourrait-il me dire quels sont ces facteurs, tels que \ sqrt {n} …
J'ai cherché de nombreux sites Web pour savoir ce que ferait exactement l'ascenseur? Les résultats que j'ai trouvés concernaient tous son utilisation dans des applications autres que celles-ci. Je connais la fonction de support et de confiance. D'après Wikipédia, dans l'exploration de données, l'ascenseur est une mesure de la performance …
Je vois une régression similaire similaire ici: Régression linéaire contrainte à travers un point spécifié mais mon exigence est légèrement différente. Il me faut les coefficients pour faire un total de 1. Plus précisément, je régresse les rendements d'une série de devises contre trois autres séries de devises, de sorte …
Je cherche à former un classificateur qui établira une distinction entre les objets Type Aet ceux Type Bdont le nombre d’apprentissage est relativement important, soit environ 10 000 objets, dont la moitié environ Type Aet la moitié Type B. Le jeu de données comprend 100 entités continues détaillant les propriétés …
J'ai une petite liste de sociétés qui fournissent une plate-forme pour l'exécution de scripts R, python ou octave sur des clusters construits au-dessus d'Amazon EC2. Y a-t-il d'autres noms que je devrais ajouter? Nuages de nuages Opani crata
Je voudrais mesurer le temps qu'il faut pour répéter l'exécution d'une fonction. Est-ce replicate()que l'utilisation de boucles for est équivalente? Par exemple: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); Quelle est la méthode préférée? En sortie de system.time(), sys+userle temps CPU réel pour exécuter le programme est-il? Une elapsedbonne mesure de la …
Si est distribué , est distribué et , je sais que est distribué si X et Y sont indépendants.N ( μ X , σ 2 X ) Y N ( μ Y , σ 2 Y ) Z = X + Y Z N ( μ X + μ Y …
J'aime beaucoup entendre des explications simples sur des problèmes complexes. Quelle est votre analogie ou anecdote préférée qui explique un concept statistique difficile? Mon préféré est l' explication de Murray sur la cointégration utilisant un ivrogne et son chien. Murray explique comment deux processus aléatoires (une personne ivre errante et …
Dans quelles conditions une personne devrait-elle envisager d'utiliser une analyse multiniveau / hiérarchique, par opposition à une analyse plus fondamentale / traditionnelle (par exemple, ANOVA, régression MCO, etc.)? Existe-t-il des situations dans lesquelles cela pourrait être considéré comme obligatoire? Existe-t-il des situations dans lesquelles l’analyse multiniveau / hiérarchique est inappropriée? …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.