Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Dans cet article actuel de SCIENCE, on propose ce qui suit: Supposons que vous divisez au hasard 500 millions de revenus sur 10 000 personnes. Il n'y a qu'un moyen de donner à chacun une part égale, 50 000 actions. Donc, si vous distribuez vos gains au hasard, l’égalité est …
Dans l'algorithme de modèle de sujet LDA, j'ai vu cette hypothèse. Mais je ne sais pas pourquoi choisir la distribution de Dirichlet? Je ne sais pas si nous pouvons utiliser la distribution uniforme sur Multinomial par paire?
J'essaie d'adapter un modèle de régression linéaire multivarié avec environ 60 variables de prédicteur et 30 observations. J'utilise donc le package glmnet pour la régression régularisée, car p> n. J'ai parcouru la documentation et d'autres questions, mais je ne peux toujours pas interpréter les résultats. Voici un exemple de code …
Q: Existe-t-il des preuves expérimentales soutenant des visualisations à la manière de Tufte, minimalistes et basées sur des données, par rapport aux visualisations avec graphiques désordonnés de, par exemple, Nigel Holmes ? J'ai demandé comment ajouter des graphiques compliqués aux courbes R ici et les répondants ont jeté une grosse …
Je n'ai jamais suivi de cours de statistiques et j'espère donc poser mes questions au bon endroit ici. Supposons que je ne dispose que de deux données décrivant une distribution normale: la moyenne et la variance . Je souhaite utiliser un ordinateur pour échantillonner de manière aléatoire cette distribution, de …
Si je voulais obtenir la probabilité de 9 succès sur 16 essais, chaque essai ayant une probabilité de 0,6, je pourrais utiliser une distribution binomiale. Que pourrais-je utiliser si chacun des 16 essais a une probabilité de succès différente?
Quelles sont les idées principales, c'est-à-dire les concepts liés au théorème de Bayes ? Je ne demande aucune déduction de la notation mathématique complexe.
Je ne suis pas sûr de la façon dont cela devrait être appelé, alors corrigez-moi si vous connaissez un meilleur terme. J'ai deux listes. L'un des 55 éléments (par exemple: un vecteur de chaînes), l'autre de 92. Les noms des éléments sont similaires mais non identiques. Je souhaite trouver les …
Les variables instrumentales sont de plus en plus courantes en économie appliquée et en statistique. Pour les non-initiés, pouvons-nous avoir des réponses non techniques aux questions suivantes: Qu'est-ce qu'une variable instrumentale? Quand voudrait-on employer une variable instrumentale? Comment trouver ou choisir une variable instrumentale?
Tout d'abord, j'ai réalisé que si je devais effectuer des prédictions binaires, je devais créer au moins deux classes en effectuant un encodage à chaud. Est-ce correct? Cependant, l'entropie croisée binaire est-elle réservée aux prédictions avec une seule classe? Si je devais utiliser une perte catégorique d'entropie croisée que l'on …
La fonction de coût du réseau neuronal est J(W,b)J(W,b)J(W,b) , et il est prétendu être non convexe . Je ne comprends pas très bien pourquoi c'est ainsi, car je vois que cela ressemble beaucoup à la fonction de coût de la régression logistique, n'est-ce pas? Si elle est non convexe, …
Je me demandais simplement pourquoi les problèmes de régression sont appelés problèmes de "régression". Quelle est l'histoire derrière le nom? Une définition de la régression: "Rechute dans un état moins parfait ou moins développé".
Lorsque vous utilisez la validation croisée pour sélectionner des modèles (par exemple, un réglage hyperparamètre) et pour évaluer les performances du meilleur modèle, vous devez utiliser une validation croisée imbriquée . La boucle externe sert à évaluer les performances du modèle et la boucle interne à sélectionner le meilleur modèle. …
J'ai vu la formule de normalisation min-max mais cela normalise les valeurs comprises entre 0 et 1. Comment normaliser mes données entre -1 et 1? J'ai des valeurs négatives et positives dans ma matrice de données.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.