Un histogramme est une représentation graphique des fréquences d'une variable continue. La variable est divisée en cases et une barre est dessinée pour chaque case, proportionnelle à sa fréquence dans les données.
Supposons que je veuille voir si mes données sont exponentielles en fonction d'un histogramme (c'est-à-dire asymétriques à droite). Selon la façon dont je regroupe ou classe les données, je peux obtenir des histogrammes très différents. Un ensemble d'histogrammes semblera indiquer que les données sont exponentielles. Un autre ensemble fera croire …
Je suis intéressé à trouver une méthode optimale pour déterminer le nombre de casiers à utiliser dans un histogramme. Mes données devraient aller de 30 à 350 objets au maximum, et en particulier j'essaie d'appliquer un seuillage (comme la méthode d'Otsu) où les "bons" objets, pour lesquels je devrais avoir …
Je l'ai tracé après avoir fait un test de normalité Shapiro-Wilk. Le test a montré qu'il est probable que la population est normalement répartie. Cependant, comment voir ce "comportement" sur cette intrigue? MISE À JOUR Un histogramme simple des données: MISE À JOUR Le test Shapiro-Wilk dit:
À partir de deux histogrammes, comment pouvons-nous évaluer s'ils sont similaires ou non? Est-il suffisant de simplement regarder les deux histogrammes? La simple correspondance un à un pose le problème suivant: si un histogramme est légèrement différent et légèrement décalé, nous n'obtiendrons pas le résultat souhaité. Aucune suggestion?
Cette question a été migrée à partir de Stack Overflow car il est possible d'y répondre sur la validation croisée. Migré il y a 7 ans . J'ai généré un vecteur qui a une distribution de Poisson, comme suit: x = rpois(1000,10) Si je fais un histogramme en utilisant hist(x), …
Dans ce commentaire , Nick Cox a écrit: Le regroupement en classes est une méthode ancienne. Bien que les histogrammes puissent être utiles, les logiciels statistiques modernes facilitent et recommandent d'adapter les distributions aux données brutes. Le regroupement jette simplement les détails cruciaux pour déterminer les distributions plausibles. Le contexte …
Lorsque je trace un histogramme de mes données, il a deux pics: Cela signifie-t-il une distribution multimodale potentielle? J'ai exécuté le dip.testdans R ( library(diptest)), et la sortie est: D = 0.0275, p-value = 0.7913 Je peux conclure que mes données ont une distribution multimodale? LES DONNÉES 10346 13698 13894 …
Après avoir effectué l'analyse des composants principaux (PCA), je souhaite projeter un nouveau vecteur sur l'espace PCA (c'est-à-dire trouver ses coordonnées dans le système de coordonnées PCA). J'ai calculé PCA en langage R en utilisant prcomp. Maintenant, je devrais pouvoir multiplier mon vecteur par la matrice de rotation PCA. Les …
J'ai deux ensembles de données représentant les paramètres des étoiles: un observé et un modélisé. Avec ces ensembles, je crée ce qu'on appelle un diagramme à deux couleurs (TCD). Un échantillon peut être vu ici: A étant les données observées et B les données extraites du modèle (sans parler des …
Je veux comparer deux images de visages. J'ai calculé leurs histogrammes LBP. Alors maintenant, je dois comparer ces deux histogrammes et obtenir quelque chose qui dira combien ces histogrammes sont égaux (0 - 100%). Il existe de nombreuses façons de résoudre cette tâche, mais les auteurs de la méthode LBP …
Si nous voulons voir visiblement la distribution d'une donnée continue, laquelle parmi l'histogramme et le pdf devrait être utilisée? Quelles sont les différences, pas en termes de formule, entre l'histogramme et le pdf?
À la suite d'un récent vote à la baisse, j'ai essayé de vérifier ma compréhension du test Pearson Chi Squared. J'utilise généralement la statistique du chi carré (ou la statistique du chi carré réduit) pour ajuster ou vérifier l'ajustement résultant. Dans ce cas, la variance n'est généralement pas le nombre …
J'ai un problème avec la normalité de certaines données: j'ai fait un test de Kolmogorov qui dit que ce n'est pas normal avec p = .0000, je ne comprends pas: l'asymétrie de ma distribution = -. 497, et le kurtosis = -0,024 Voici l'intrigue de ma distribution qui semble tout …
Disons que j'ai deux distributions que je veux comparer en détail, c'est-à-dire d'une manière qui rend la forme, l'échelle et le décalage facilement visibles. Une bonne façon de procéder consiste à tracer un histogramme pour chaque distribution, à les placer sur la même échelle X et à les empiler les …
Il semble y avoir beaucoup de confusion dans la comparaison de l'utilisation à l' glmnetintérieur caretpour rechercher un lambda optimal et à utiliser cv.glmnetpour faire la même tâche. De nombreuses questions ont été posées, par exemple: Modèle de classification train.glmnet vs cv.glmnet? Quelle est la bonne façon d'utiliser glmnet avec …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.