Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Premièrement, il donne la probabilité des résultats. Ainsi, par exemple, ses prédictions pour les élections américaines sont actuellement de 82% pour Clinton contre 18% pour Trump. Maintenant, même si Trump gagne, comment puis-je savoir que ce n'était pas seulement les 18% du temps qu'il aurait dû gagner? L'autre problème est …
Il s'agit essentiellement d'une réplication d' une question que j'ai trouvée sur math.se , qui n'a pas obtenu les réponses que j'espérais. Soit une séquence de variables aléatoires indépendantes et distribuées de manière identique, avec et .{Xi}i∈N{Xi}i∈N\{ X_i \}_{i \in \mathbb{N}}V [ X i ] = 1E[Xi]=1E[Xi]=1\mathbb{E}[X_i] = 1V[Xi]=1V[Xi]=1\mathbb{V}[X_i] = …
Que les coordonnées cartésiennes d'un point aléatoire soient sélectionnées st .x , yX,yx,y( x , y) ∼ U(−10,10)×U(−10,10)(x,y)∼U(−10,10)×U(−10,10)(x,y) \sim U(-10,10) \times U(-10,10) Ainsi, le rayon, , n'est pas uniformément distribué comme le le pdf de .ρ = x2+y2−−−−−−√ρ=x2+y2\rho = \sqrt{x^2 + y^2}ρρ\rho Néanmoins, je m'attendrais à ce que soit presque …
Je viens de rejoindre en tant que membre du corps professoral dans un département de mathématiques. d'une institution réputée. J'enseignerai le cours Probabilités et Statistiques au premier cycle. L'établissement a déjà un programme pour ce cours dont je ne suis pas très satisfait. Dans ce programme, les statistiques sont couvertes …
Le moignon de décision est un arbre de décision avec une seule division. Il peut également être écrit comme une fonction par morceaux. Par exemple, supposons que xxx est un vecteur, et x1x1x_1 est le premier composant de , dans le cadre de la régression, un moignon de décision peut …
Donc dans une distribution normale, nous avons deux paramètres: la moyenne et la variance σ 2 . Dans le livre Pattern Recognition and Machine Learning , il apparaît tout à coup un hyperparamètre λ dans les termes de régularisation de la fonction d'erreur.μμ\muσ2σ2\sigma^2λλ\lambda Que sont les hyperparamètres? Pourquoi sont-ils nommés …
Y a-t-il un mot qui signifie «l'inverse de la variance»? Autrement dit, si a une variance élevée, alors a de faibles ? Pas intéressé par un antonyme proche (comme «accord» ou «similitude») mais signifiant spécifiquement ?XXXXXX……\dots1 / σ21/σ21/\sigma^2
Je me demande pourquoi skip-gram est meilleur pour les mots peu fréquents que CBOW dans word2vec. J'ai lu la réclamation sur https://code.google.com/p/word2vec/ .
La régularisation peut-elle être utile si nous nous intéressons uniquement à l'estimation (et à l'interprétation) des paramètres du modèle, pas à la prévision ou à la prédiction? Je vois à quel point la régularisation / validation croisée est extrêmement utile si votre objectif est de faire de bonnes prévisions sur …
Je suis nouveau dans l'apprentissage automatique et je recherche des ensembles de données à travers lesquels je peux comparer et contraster les différences entre les différents algorithmes d'apprentissage automatique (Arbres de décision, Boosting, SVM et Réseaux de neurones) Où puis-je trouver de tels ensembles de données? Que dois-je rechercher tout …
Pour moi, les statistiques Frequentist sont synonymes d'essayer de prendre des décisions qui sont bonnes pour tous les échantillons possibles. C'est-à-dire qu'une règle de décision fréquentiste devrait toujours essayer de minimiser le risque fréquentiste, qui dépend d'une fonction de perte et du véritable état de la nature :L θ 0δδ\deltaLLLθ0θ0\theta_0 …
Cela peut être une question simple pour beaucoup, mais la voici: Pourquoi la variance n'est-elle pas définie comme la différence entre chaque valeur se succédant au lieu de la différence par rapport à la moyenne des valeurs? Ce serait le choix le plus logique pour moi, je suppose que je …
Le paramètre de taux d'apprentissage ( ) dans Gradient Boosting réduit la contribution de chaque nouveau modèle de base - généralement un arbre peu profond - qui est ajouté dans la série. Il s'est avéré augmenter considérablement la précision de l'ensemble de test, ce qui est compréhensible car avec des …
J'essaie d'obtenir une compréhension intuitive du fonctionnement de l'analyse en composantes principales (ACP) dans l'espace (double) sujet . Considérons un ensemble de données 2D avec deux variables, et , et points de données (la matrice de données est et est supposée être centrée). La présentation habituelle de l'ACP est que …
J'essaie d'adapter un modèle à l'aide des données de vent (0, 359) et de l'heure (0, 23), mais je crains qu'ils ne s'intègrent mal dans une régression linéaire car ce ne sont pas eux-mêmes des paramètres linéaires. Je voudrais les transformer en Python. J'ai vu une certaine mention du calcul …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.