Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

3
Cette distribution a-t-elle un nom?
Il m'est venu à l'esprit aujourd'hui que la distribution pourrait être considéré comme un compromis entre les distributions gaussienne et de Laplace, pourx∈R,p∈[1,2]etβ>0. Unetelle distribution a-t-elle un nom? Et a-t-il une expression pour sa constante de normalisation? Le calcul m'arrête, car je ne sais même pas comment commencer à résoudre …


6
Texas sophisme tireur d'élite dans l'analyse exploratoire des données
Je lisais cet article dans Nature dans lequel certaines erreurs sont expliquées dans le contexte de l'analyse des données. J'ai remarqué que l'erreur du tireur d'élite au Texas était particulièrement difficile à éviter: Un piège cognitif qui attend pendant l'analyse des données est illustré par la fable du tireur d'élite …
23 eda  fallacy 




2
Différence de deux variables aléatoires log-normales iid
Soit X1X1X_1 et deux iidrv où . Je voudrais connaître la distribution pour .X2X2X_2log(X1),log(X2)∼N(μ,σ)log⁡(X1),log⁡(X2)∼N(μ,σ)\log(X_1),\log(X_2) \sim N(\mu,\sigma)X1−X2X1−X2X_1 - X_2 Le mieux que je puisse faire est de prendre la série Taylor des deux et de faire en sorte que la différence soit la somme de la différence entre deux VR normaux …




1
Modèle linéaire non linéaire ou généralisé: comment référez-vous à la régression logistique, Poisson, etc.?
J'ai une question sur la sémantique sur laquelle j'aimerais avoir l'avis de mes collègues statisticiens. Nous savons que des modèles tels que la logistique, Poisson, etc. tombent sous l'égide de modèles linéaires généralisés. Le modèle comprend des fonctions non linéaires des paramètres, qui peuvent à leur tour être modélisées en …


6
Pourquoi choisissons-nous généralement de minimiser la somme des erreurs carrées (SSE) lors de l'ajustement d'un modèle?
La question est très simple: pourquoi, lorsque nous essayons d'adapter un modèle à nos données, linéaires ou non linéaires, essayons-nous généralement de minimiser la somme des carrés d'erreurs pour obtenir notre estimateur pour le paramètre du modèle? Pourquoi ne pas choisir une autre fonction objective à minimiser? Je comprends que, …


1
Existe-t-il un moyen d'utiliser la matrice de covariance pour trouver des coefficients de régression multiple?
Pour une régression linéaire simple, le coefficient de régression peut être calculé directement à partir de la matrice de variance-covariance CCC , par Cd,eCe,eCd,eCe,e C_{d, e}\over C_{e,e} oùdddest l'indice de la variable dépendante eteeeest l'indice de la variable explicative. Si l'on n'a que la matrice de covariance, est-il possible de …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.