Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

10
Quelles sont les sources de données économiques les plus utiles?
Lors de recherches en économie, il est souvent nécessaire de vérifier les conclusions théoriques sur des données réelles. Quelles sont les sources de données fiables à utiliser et à citer? Je suis principalement intéressé par les sources qui fournissent diverses données statistiques telles que le PIB, la population, l'IPC, l'IPP, …
37 references 



2
Inégalités de probabilité
Je cherche des inégalités de probabilité pour les sommes de variables aléatoires non bornées. J'apprécierais vraiment si quelqu'un pouvait me donner des idées. Mon problème est de trouver une limite supérieure exponentielle sur la probabilité que la somme des variables aléatoires iid non bornées, qui sont en fait la multiplication …


2
Quand et comment utiliser des variables explicatives normalisées dans la régression linéaire
J'ai 2 questions simples sur la régression linéaire: Quand est-il conseillé de normaliser les variables explicatives? Une fois que l'estimation est réalisée avec des valeurs normalisées, comment peut-on prévoir avec de nouvelles valeurs (comment normaliser les nouvelles valeurs)? Quelques références seraient utiles.

6
Interprétation bayésienne vs fréquentiste de la probabilité
Quelqu'un peut-il donner un bon aperçu des différences entre l'approche bayésienne et l'approche fréquentiste de la probabilité? D'après ce que j'ai compris: Le point de vue fréquentiste est que les données sont un échantillon aléatoire répétable (variable aléatoire) avec une fréquence / probabilité spécifique (définie comme la fréquence relative d'un …



3
Explication intuitive de la densité de la variable transformée?
Supposons que soit une variable aléatoire avec pdf f X ( x ) . Alors la variable aléatoire Y = X 2 a le pdfXXXfX(x)fX(x)f_X(x)Y=X2Y=X2Y=X^2 fY(y)={12y√(fX(y√)+fX(−y√))0y≥0y<0fY(y)={12y(fX(y)+fX(−y))y≥00y<0f_Y(y)=\begin{cases}\frac{1}{2\sqrt{y}}\left(f_X(\sqrt{y})+f_X(-\sqrt{y})\right) & y \ge 0 \\ 0 & y \lt 0\end{cases} Je comprends le calcul derrière cela. Mais j'essaie de trouver un moyen de l'expliquer …

11
Manuels statistiques Open Source?
Il y a eu quelques questions sur les manuels de statistiques , telles que la question Manuels de statistiques gratuits . Cependant, je suis à la recherche de manuels Open Source, par exemple, sous licence Creative Commons . La raison en est que, dans les supports de cours d'autres domaines, …

5
Les statisticiens en activité se soucient-ils de la différence entre inférence fréquentiste et bayésienne?
En tant qu'étranger, il semble y avoir deux points de vue divergents sur la manière de procéder à l'inférence statistique. Les deux méthodes différentes sont-elles considérées comme valables par des statisticiens en activité? Est-ce que choisir est considéré davantage comme une question philosophique? Ou bien la situation actuelle est-elle considérée …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.