Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

2
La corrélation suppose-t-elle la stationnarité des données?
L'analyse inter-marchés est une méthode de modélisation du comportement des marchés par la recherche de relations entre différents marchés. Souvent, une corrélation est calculée entre deux marchés, par exemple le S&P 500 et les bons du Trésor américain à 30 ans. Ces calculs sont le plus souvent basés sur des …


9
Outils logiciels de statistiques et d'exploration de données pour gérer de grands ensembles de données
Actuellement, je dois analyser environ 20 millions d'enregistrements et créer des modèles de prédiction. Jusqu'à présent, j'ai essayé Statistica, SPSS, RapidMiner et R. Parmi ces Statistica semble être le plus approprié pour faire face à l'exploration de données et l'interface utilisateur de RapidMiner est également très pratique, mais il semble …


3
Les probabilités / amplitudes de probabilité négatives ont-elles des applications en dehors de la mécanique quantique?
La mécanique quantique a généralisé la théorie des probabilités aux nombres négatifs / imaginaires, principalement pour expliquer les modèles d'interférence, la dualité onde / particule et des choses généralement étranges comme ça. Elle peut cependant être considérée de manière plus abstraite comme une généralisation non commutative de la probabilité bayésienne …






2
Pourquoi la pénalité de Lasso est-elle équivalente à la double exponentielle (Laplace) antérieure?
J'ai lu dans un certain nombre de références que l'estimation de Lasso pour le vecteur de paramètre de régression est équivalente au mode postérieur de dans lequel la distribution antérieure pour chaque est une distribution exponentielle double (également connue sous le nom de distribution de Laplace).BBBBBBBiBiB_i J'ai essayé de le …

6
Pourquoi des poids plus petits donnent-ils des modèles de régularisation plus simples?
J'ai terminé le cours d'apprentissage automatique d'Andrew Ng il y a environ un an et j'écris maintenant mon exploration des mathématiques au lycée sur le fonctionnement de la régression logistique et des techniques pour optimiser les performances. Une de ces techniques est bien sûr la régularisation. L'objectif de la régularisation …



1
Fonction Predict () pour les modèles d'effets mixtes lmer
Le problème: J'ai lu dans d'autres articles qui predictne sont pas disponibles pour les lmermodèles d' effets mixtes {lme4} dans [R]. J'ai essayé d'explorer ce sujet avec un jeu de données jouet ... Contexte: L'ensemble de données est adapté de cette source et disponible en ... require(gsheet) data <- read.csv(text …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.