Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. J'ai besoin de calculer la fonction de distribution cumulative d'un échantillon de données. Y a-t-il quelque chose de similaire à hist …
Ce matin, je me suis réveillé en me demandant (cela pourrait être dû au fait que la nuit dernière je n'ai pas beaucoup dormi): étant donné que la validation croisée semble être la pierre angulaire de la prévision des séries chronologiques, quels sont les modèles que je devrais "normalement "contre-valider? …
Je lis "The Drunkard's Walk" maintenant et je ne peux pas en comprendre une histoire. Ça y est: Imaginez que George Lucas réalise un nouveau film Star Wars et décide dans un marché de test de réaliser une expérience folle. Il sort le film identique sous deux titres: "Star Wars: …
Supposons que j'ai un modèle prédictif qui produit, pour chaque instance, une probabilité pour chaque classe. Je reconnais maintenant qu'il existe de nombreuses façons d'évaluer un tel modèle si je veux utiliser ces probabilités pour la classification (précision, rappel, etc.). Je reconnais également qu'une courbe ROC et l'aire sous-jacente peuvent …
Récemment, il y a eu une question de type ML sur cstheory stackexchange, et j'ai posté une réponse recommandant la méthode de Powell, la descente de gradient, les algorithmes génétiques ou autres "algorithmes d'approximation". Dans un commentaire, quelqu'un m'a dit que ces méthodes étaient des "heuristiques" et non des "algorithmes …
J'utilise JMP pour examiner les différences de couverture végétale dans les groupes de formes de croissance (arbres, arbustes, forbes, etc.) avant et après trois traitements avec un témoin. Ma taille d'échantillon est petite (n = 5) et la plupart de mes distributions ne sont pas normalement distribuées. Pour les distributions …
Si j'ai un échantillon iid normal multivarié , et définissez (qui est une sorte de distance de Mahalanobis [au carré] d'un point d'échantillon au vecteur utilisant la matrice pour la pondération), quelle est la distribution de d_i ^ 2 (\ bar X, S) (distance de Mahalanobis au moyenne de l'échantillon …
Je me demande s'il y a toujours un maximiseur pour tout problème d'estimation de vraisemblance maximale (log)? En d'autres termes, existe-t-il une distribution et certains de ses paramètres pour lesquels le problème MLE n'a pas de maximiseur? Ma question vient d'une affirmation d'un ingénieur selon laquelle la fonction de coût …
J'ai une matrice avec deux colonnes qui ont beaucoup de prix (750). Dans l'image ci-dessous, j'ai tracé les résidus de la régression linéaire suivante: lm(prices[,1] ~ prices[,2]) En regardant l'image, cela semble être une très forte autocorrélation des résidus. Cependant, comment puis-je tester si l'autocorrélation de ces résidus est forte? …
Je participe à des compétitions de modélisation prédictive sur Kaggle , TunedIt et CrowdAnalytix . Je trouve que ces sites sont un bon moyen de "travailler" pour les statistiques / l'apprentissage automatique. Y a-t-il d'autres sites que je devrais connaître? Que pensez-vous tous des compétitions où l'hôte a l'intention de …
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Vous souhaitez améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé l'année dernière . Je recherche des informations sur la façon dont les autres organisent leur code …
Je veux générer deux variables. L'un est une variable de résultat binaire (disons succès / échec) et l'autre est l'âge en années. Je veux que l'âge soit en corrélation positive avec le succès. Par exemple, il devrait y avoir plus de succès dans les tranches d'âge supérieures que dans les …
Comme la science doit être reproductible, par définition, il est de plus en plus reconnu que les données et le code sont un élément essentiel de la reproductibilité, comme discuté par la table ronde de Yale pour le partage des données et du code . En examinant un manuscrit pour …
J'effectue plusieurs analyses de régression et je ne sais pas si les valeurs aberrantes de mes données doivent être supprimées. Les données qui m'inquiètent apparaissent sous forme de «cercles» sur les boîtes à moustaches SPSS, mais il n'y a pas d'astérisques (ce qui me fait penser qu'elles ne sont pas …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.