Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

3
Que dit l'écart type en distribution non normale
Dans une distribution normale, la règle 68-95-99.7 attribue beaucoup de signification à l'écart-type, mais que signifierait-il par déviation dans une distribution non normale (multimodale ou asymétrique)? Toutes les valeurs de données resteraient-elles toujours dans les 3 écarts types? Avons-nous des règles comme celle 68-95-99.7 pour les distributions non normales?

4
Comment la fonction d'activation rectiligne résout-elle le problème du gradient en voie de disparition dans les réseaux de neurones?
J'ai trouvé des unités linéaires rectifiées (ReLU) louées à plusieurs endroits comme solution au problème du gradient de fuite pour les réseaux de neurones. En d’autres termes, on utilise max (0, x) comme fonction d’activation. Lorsque l'activation est positive, il est évident qu'elle est meilleure que, par exemple, la fonction …

5
Regroupement temporel dynamique
Quelle serait l'approche d'utiliser Dynamic Time Warping (DTW) pour regrouper des séries chronologiques? J'ai lu que DTW était un moyen de trouver des similitudes entre deux séries chronologiques, alors qu'elles pouvaient être décalées dans le temps. Puis-je utiliser cette méthode comme mesure de similarité pour un algorithme de classification tel …

7
Un bayésien admettrait-il qu'il existe une valeur de paramètre fixe?
Dans l'analyse de données bayésienne, les paramètres sont traités comme des variables aléatoires. Cela découle de la conceptualisation subjective bayésienne de la probabilité. Mais les Bayésiens reconnaissent-ils théoriquement qu’il existe une véritable valeur de paramètre fixe dans le «monde réel»? Il semble que la réponse évidente soit «oui», car tenter …



6
Propagation du dos avec Softmax / Entropie croisée
J'essaie de comprendre comment fonctionne la rétropropagation pour une couche de sortie softmax / entropie croisée. La fonction d'erreur d'entropie croisée est E(t,o)=−∑jtjlogojE(t,o)=−∑jtjlog⁡ojE(t,o)=-\sum_j t_j \log o_j avec et comme cible et sortie au neurone , respectivement. La somme est sur chaque neurone dans la couche de sortie. lui-même est le …

2
Mesures d'importance variable dans les forêts aléatoires
J'ai joué avec des forêts aléatoires pour la régression et j'ai du mal à comprendre exactement ce que signifient les deux mesures d'importance et comment elles doivent être interprétées. La importance()fonction donne deux valeurs pour chaque variable: %IncMSEet IncNodePurity. Existe-t-il des interprétations simples pour ces 2 valeurs? En IncNodePurityparticulier, s’agit-il …


5
Relation entre
Disons que j'ai deux tableaux à dimension, un 1a1a1a_1 et . Chacun contient 100 points de données. correspond aux données réelles et la prédiction du modèle. Dans ce cas, la valeur de serait: Entre-temps, cela serait égal à la valeur carrée du coefficient de corrélation, Maintenant, si j'échange les deux: …

2
Le modèle de régression logistique ne converge pas
J'ai quelques données sur les vols des compagnies aériennes (dans une trame de données appelée flights) et j'aimerais voir si le temps de vol a un effet sur la probabilité d'une arrivée considérablement retardée (c'est-à-dire 10 minutes ou plus). Je pensais utiliser une régression logistique, avec le temps de vol …
40 r  logistic  separation 

3
Comment interpréter les valeurs F et p dans l'ANOVA?
Je suis nouveau dans les statistiques et je traite actuellement avec ANOVA. J'effectue un test ANOVA en R avec aov(dependendVar ~ IndependendVar) Je reçois, entre autres, une valeur F et une valeur p. Mon hypothèse nulle ( ) est que toutes les moyennes de groupe sont égales.H0H0H_0 Il y a …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.