Les demandes d'ensembles de données sont hors sujet sur ce site. Utilisez cette balise pour les questions concernant la création, le traitement ou la maintenance des jeux de données.
J'ai étiqueté des données composées de 10000 exemples positifs et 50000 exemples négatifs, ce qui donne un total de 60000 exemples. Évidemment, ces données sont déséquilibrées. Disons maintenant que je veux créer mon ensemble de validation et que je souhaite utiliser 10% de mes données pour le faire. Ma question …
Je m'emballe autour des types de données et j'ai besoin d'aide: Si vous regardez l'image ci-dessus (prise d' ici ), elle a les types de données comme ceci: Quantitatif (discret, continu) Qualitatif (nominal (N), ordinal (O), binaire (B)). Mais si vous regardez cette photo suivante (d' ici ), les catégories …
Je développe des systèmes de trading automatisés pour le marché boursier. Le grand défi a été le sur-ajustement. Pouvez-vous recommander des ressources décrivant des méthodes pour mesurer et éviter le sur-ajustement? J'ai commencé avec des ensembles de formation / validation, mais l'ensemble de validation est toujours vicié. De plus, les …
Supposons que vous ayez reçu des données d'un modèle de bloc aléatoire avec 4 répétitions et 23 traitements. Après une première inspection des données, vous constatez que pour 8 traitements toutes les répétitions sont identiques, ce qui est évidemment faux. Après avoir signalé le problème, vous êtes informé qu'il est …
Dans un article de blog, Andrew Gelman écrit : La régression pas à pas est l'une de ces choses, comme la détection des valeurs aberrantes et les graphiques circulaires, qui semblent être populaires parmi les non-statisticiens mais qui sont considérés par les statisticiens comme une plaisanterie. Je comprends la référence …
Avant de poster cette question, j'avais parcouru d'autres questions sur cette pile, et cela va probablement être une promenade dans le parc pour tous ceux qui la liront! Mais la description de cette pile comprend l'analyse et la visualisation des données, donc j'espère que c'est au bon endroit! </preapology> J'utilise …
Pourquoi les mesures de dispersion sont-elles calculées par rapport à un point central? Pourquoi, par exemple, toutes les différences non répétées et par paire possibles dans l'ensemble de données ne seraient-elles pas une mesure valable de la propagation?
J'ai un peu de mal à comprendre le concept et la dérivation de la probabilité de données tronquées. Par exemple, si je veux trouver la fonction de vraisemblance basée sur un échantillon d'une distribution, mais en prenant un échantillon de la distribution, j'observe les valeurs tronquées (où il y a …
Je calcule des probabilités conditionnelles et des intervalles de confiance à 95% associés. Pour bon nombre de mes cas, j'ai un décompte simple des xsuccès des nessais (à partir d'un tableau de contingence), donc je peux utiliser un intervalle de confiance binomial, tel que celui fourni par binom.confint(x, n, method='exact')dans …
Je veux que R affiche les données qu'il me donne de la summary()fonction dans un tableau afin que je puisse facilement les partager. Je suis actuellement en train de faire summary()dans la console, puis de prendre une capture d'écran, mais je préfère que cela soit généré comme un joli tableau, …
Je jouais avec ggplot2 en utilisant les commandes suivantes pour ajuster une ligne à mes données: ggplot(data=datNorm, aes(x=Num, y=Val)) + geom_point() + stat_summary(fun.data = "mean_cl_boot", geom="errorbar", colour="red", width=0.8) + stat_sum_single(median) + stat_sum_single(mean, colour="blue") + geom_smooth(level = 0.95, aes(group=1), method="lm") Les points rouges sont des valeurs médianes, le bleu est la …
Je cherchais des jeux de données de jeux informatiques, mais jusqu'à présent, je n'ai pu trouver que le jeu de données «Historique des avatars» pour WoW. Existe-t-il d'autres ensembles de données intéressants, peut-être pour d'autres genres?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.