Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


5
Quand le théorème de la limite centrale et la loi des grands nombres ne sont pas d'accord
Il s'agit essentiellement d'une réplication d' une question que j'ai trouvée sur math.se , qui n'a pas obtenu les réponses que j'espérais. Soit une séquence de variables aléatoires indépendantes et distribuées de manière identique, avec et .{Xi}i∈N{Xi}i∈N\{ X_i \}_{i \in \mathbb{N}}V [ X i ] = 1E[Xi]=1E[Xi]=1\mathbb{E}[X_i] = 1V[Xi]=1V[Xi]=1\mathbb{V}[X_i] = …

3
Comment est
Que les coordonnées cartésiennes d'un point aléatoire soient sélectionnées st .x , yX,yx,y( x , y) ∼ U(−10,10)×U(−10,10)(x,y)∼U(−10,10)×U(−10,10)(x,y) \sim U(-10,10) \times U(-10,10) Ainsi, le rayon, , n'est pas uniformément distribué comme le le pdf de .ρ = x2+y2−−−−−−√ρ=x2+y2\rho = \sqrt{x^2 + y^2}ρρ\rho Néanmoins, je m'attendrais à ce que soit presque …

3
Que faut-il enseigner en premier: la probabilité ou les statistiques?
Je viens de rejoindre en tant que membre du corps professoral dans un département de mathématiques. d'une institution réputée. J'enseignerai le cours Probabilités et Statistiques au premier cycle. L'établissement a déjà un programme pour ce cours dont je ne suis pas très satisfait. Dans ce programme, les statistiques sont couvertes …
19 teaching 


5
Contenu d'un nom: hyperparamètres
Donc dans une distribution normale, nous avons deux paramètres: la moyenne et la variance σ 2 . Dans le livre Pattern Recognition and Machine Learning , il apparaît tout à coup un hyperparamètre λ dans les termes de régularisation de la fonction d'erreur.μμ\muσ2σ2\sigma^2λλ\lambda Que sont les hyperparamètres? Pourquoi sont-ils nommés …

1
Antonyme de variance
Y a-t-il un mot qui signifie «l'inverse de la variance»? Autrement dit, si a une variance élevée, alors a de faibles ? Pas intéressé par un antonyme proche (comme «accord» ou «similitude») mais signifiant spécifiquement ?XXXXXX……\dots1 / σ21/σ21/\sigma^2


2
La régularisation peut-elle être utile si nous ne nous intéressons qu'à la modélisation, pas aux prévisions?
La régularisation peut-elle être utile si nous nous intéressons uniquement à l'estimation (et à l'interprétation) des paramètres du modèle, pas à la prévision ou à la prédiction? Je vois à quel point la régularisation / validation croisée est extrêmement utile si votre objectif est de faire de bonnes prévisions sur …

5
Quels sont les bons ensembles de données pour apprendre les algorithmes de base de l'apprentissage automatique et pourquoi?
Je suis nouveau dans l'apprentissage automatique et je recherche des ensembles de données à travers lesquels je peux comparer et contraster les différences entre les différents algorithmes d'apprentissage automatique (Arbres de décision, Boosting, SVM et Réseaux de neurones) Où puis-je trouver de tels ensembles de données? Que dois-je rechercher tout …

2
Pourquoi l'estimation du maximum de vraisemblance est-elle considérée comme une technique fréquentiste
Pour moi, les statistiques Frequentist sont synonymes d'essayer de prendre des décisions qui sont bonnes pour tous les échantillons possibles. C'est-à-dire qu'une règle de décision fréquentiste devrait toujours essayer de minimiser le risque fréquentiste, qui dépend d'une fonction de perte et du véritable état de la nature :L θ 0δδ\deltaLLLθ0θ0\theta_0 …





En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.