Statistiques et Big Data

3

Que dit l'écart type en distribution non normale

Dans une distribution normale, la règle 68-95-99.7 attribue beaucoup de signification à l'écart-type, mais que signifierait-il par déviation dans une distribution non normale (multimodale ou asymétrique)? Toutes les valeurs de données resteraient-elles toujours dans les 3 écarts types? Avons-nous des règles comme celle 68-95-99.7 pour les distributions non normales?

40 normal-distribution standard-deviation skewness

4

Comment la fonction d'activation rectiligne résout-elle le problème du gradient en voie de disparition dans les réseaux de neurones?

J'ai trouvé des unités linéaires rectifiées (ReLU) louées à plusieurs endroits comme solution au problème du gradient de fuite pour les réseaux de neurones. En d’autres termes, on utilise max (0, x) comme fonction d’activation. Lorsque l'activation est positive, il est évident qu'elle est meilleure que, par exemple, la fonction …

40 machine-learning neural-networks deep-learning gradient-descent

5

Regroupement temporel dynamique

Quelle serait l'approche d'utiliser Dynamic Time Warping (DTW) pour regrouper des séries chronologiques? J'ai lu que DTW était un moyen de trouver des similitudes entre deux séries chronologiques, alors qu'elles pouvaient être décalées dans le temps. Puis-je utiliser cette méthode comme mesure de similarité pour un algorithme de classification tel …

40 time-series clustering

7

Un bayésien admettrait-il qu'il existe une valeur de paramètre fixe?

Dans l'analyse de données bayésienne, les paramètres sont traités comme des variables aléatoires. Cela découle de la conceptualisation subjective bayésienne de la probabilité. Mais les Bayésiens reconnaissent-ils théoriquement qu’il existe une véritable valeur de paramètre fixe dans le «monde réel»? Il semble que la réponse évidente soit «oui», car tenter …

40 probability bayesian parameterization

6

Règle de base pour le nombre d'échantillons bootstrap

Je me demande si quelqu'un connaît des règles générales concernant le nombre d'échantillons bootstrap à utiliser, en fonction des caractéristiques des données (nombre d'observations, etc.) et / ou des variables incluses?

40 bootstrap inference monte-carlo

2

Comment tirer des conclusions valables du «big data»?

Le "big data" est omniprésent dans les médias. Tout le monde dit que le "big data" est le gros problème pour 2012, par exemple, un sondage KDNuggets sur des sujets d'actualité pour 2012 . Cependant, j'ai de profondes préoccupations ici. Avec le Big Data, tout le monde semble content d’obtenir …

40 data-mining dataset large-data validation

6

Propagation du dos avec Softmax / Entropie croisée

J'essaie de comprendre comment fonctionne la rétropropagation pour une couche de sortie softmax / entropie croisée. La fonction d'erreur d'entropie croisée est E(t,o)=−∑jtjlogojE(t,o)=−∑jtjlog⁡ojE(t,o)=-\sum_j t_j \log o_j avec et comme cible et sortie au neurone , respectivement. La somme est sur chaque neurone dans la couche de sortie. lui-même est le …

40 backpropagation derivative softmax cross-entropy

2

Mesures d'importance variable dans les forêts aléatoires

J'ai joué avec des forêts aléatoires pour la régression et j'ai du mal à comprendre exactement ce que signifient les deux mesures d'importance et comment elles doivent être interprétées. La importance()fonction donne deux valeurs pour chaque variable: %IncMSEet IncNodePurity. Existe-t-il des interprétations simples pour ces 2 valeurs? En IncNodePurityparticulier, s’agit-il …

40 r machine-learning random-forest importance

5

Intervalle de confiance pour la médiane

Je dois trouver un IC à 95% sur la médiane et les autres centiles. Je ne sais pas comment aborder cela. J'utilise principalement R comme outil de programmation.

40 r confidence-interval median

5

Relation entre

Disons que j'ai deux tableaux à dimension, un 1a1a1a_1 et . Chacun contient 100 points de données. correspond aux données réelles et la prédiction du modèle. Dans ce cas, la valeur de serait: Entre-temps, cela serait égal à la valeur carrée du coefficient de corrélation, Maintenant, si j'échange les deux: …

40 correlation r-squared

2

Le modèle de régression logistique ne converge pas

J'ai quelques données sur les vols des compagnies aériennes (dans une trame de données appelée flights) et j'aimerais voir si le temps de vol a un effet sur la probabilité d'une arrivée considérablement retardée (c'est-à-dire 10 minutes ou plus). Je pensais utiliser une régression logistique, avec le temps de vol …

40 r logistic separation

3

Comment interpréter les valeurs F et p dans l'ANOVA?

Je suis nouveau dans les statistiques et je traite actuellement avec ANOVA. J'effectue un test ANOVA en R avec aov(dependendVar ~ IndependendVar) Je reçois, entre autres, une valeur F et une valeur p. Mon hypothèse nulle ( ) est que toutes les moyennes de groupe sont égales.H0H0H_0 Il y a …

40 r anova interpretation

3

Effet de suppression en régression: définition et explication / représentation visuelle

Qu'est-ce qu'une variable de suppression dans la régression multiple et quelles pourraient être les manières d'afficher un effet de suppression visuellement (ses mécanismes ou sa mise en évidence dans les résultats)? J'aimerais inviter tous ceux qui ont une pensée à partager.

40 multiple-regression data-visualization geometry suppressor

3

Relation empirique entre moyenne, médiane et mode

Pour une distribution unimodale qui est modérément biaisée, nous avons la relation empirique suivante entre la moyenne, la médiane et le mode: (Mean - Mode)∼3(Mean - Median)(Mean - Mode)∼3(Mean - Median) \text{(Mean - Mode)}\sim 3\,\text{(Mean - Median)} Comment cette relation a-t-elle été dérivée? Karl Pearson a-t-il tracé des milliers de …

40 distributions mathematical-statistics descriptive-statistics history

7

Normalisation des données et normalisation dans les réseaux de neurones

J'essaie de prédire le résultat d'un système complexe en utilisant des réseaux de neurones (ANN). Les résultats (dépendants) vont de 0 à 10 000. Les différentes variables d'entrée ont des plages différentes. Toutes les variables ont des distributions à peu près normales. Je considère différentes options pour mettre à l'échelle …

40 machine-learning neural-networks multidimensional-scaling