Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


3
Test de la signification des pics de densité spectrale
Nous utilisons parfois le tracé de densité spectrale pour analyser la périodicité des séries chronologiques. Normalement, nous analysons l'intrigue par inspection visuelle, puis essayons de tirer une conclusion sur la périodicité. Mais les statisticiens ont-ils développé un test pour vérifier si des pointes dans l'intrigue sont statistiquement différentes du bruit …




6
Interprétation de sortie de régression linéaire simple
J'ai effectué une régression linéaire simple du logarithme naturel de 2 variables pour déterminer si elles sont corrélées. Ma sortie est la suivante: R^2 = 0.0893 slope = 0.851 p < 0.001 Je suis confus. En regardant la valeur R2R2R^2 , je dirais que les deux variables ne sont pas …



2
Transformation des données de proportion: lorsque la racine carrée de l'arcsin ne suffit pas
Existe-t-il une alternative (plus forte?) À la transformation de racine carrée en arcsin pour les données de pourcentage / proportion? Dans l'ensemble de données sur lequel je travaille en ce moment, une hétéroscédasticité marquée subsiste après l'application de cette transformation, c'est-à-dire que le tracé des valeurs résiduelles en fonction des …


4
Valeurs moyennes de corrélation
Disons que je teste la façon dont une variable Ydépend d'une variable Xdans différentes conditions expérimentales et j'obtiens le graphique suivant: Les lignes en pointillés dans le graphique ci-dessus représentent une régression linéaire pour chaque série de données (configuration expérimentale) et les nombres dans la légende indiquent la corrélation de …

1
Article sur l'utilisation abusive de la méthode statistique dans NYTimes
Je fais référence à cet article: http://www.nytimes.com/2011/01/11/science/11esp.html Considérez l'expérience suivante. Supposons qu'il y ait des raisons de croire qu'une pièce est légèrement lestée vers les têtes. Dans un test, la pièce remonte 527 fois sur 1000. Est-ce une preuve significative que la pièce est pesée? L'analyse classique dit oui. Avec …

2
Quels sont les avantages / inconvénients de l'utilisation de splines, de splines lissées et d'émulateurs de processus gaussiens?
Je souhaite apprendre (et implémenter) une alternative à l'interpolation polynomiale. Cependant, j'ai du mal à trouver une bonne description de la façon dont ces méthodes fonctionnent, comment elles sont liées et comment elles se comparent. J'apprécierais votre contribution sur les avantages / inconvénients / conditions dans lesquelles ces méthodes ou …

2
Comment nommer les ticks dans un boxplot matplotlib en python
Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. Python matplotlib a une commande boxplot . Normalement, toutes les parties du graphique sont cochées numériquement. Comment puis-je changer les graduations …

2
Estimation de la valeur R au carré et de la signification statistique à partir d'un modèle de régression pénalisé
J'utilise le package R pénalisé pour obtenir des estimations réduites des coefficients pour un ensemble de données où j'ai beaucoup de prédicteurs et peu de connaissances sur ceux qui sont importants. Après avoir choisi les paramètres de réglage L1 et L2 et que je suis satisfait de mes coefficients, existe-t-il …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.