Questions marquées «reproducible-research»

Pratique de recherche consistant à rendre la description expérimentale complète, l'ensemble des données collectées et tous les scripts d'analyse des données accessibles au public, de sorte que les résultats publiés puissent être reproduits ailleurs.

2
Que savons-nous du piratage informatique «à l'état sauvage»?
La phrase p- achalandage (aussi: "dragage de données" , "espionnage" ou "pêche") fait référence à divers types de fautes statistiques dans lesquelles les résultats deviennent artificiellement statistiquement significatifs. Il existe de nombreuses façons d'obtenir un résultat "plus significatif", notamment, sans s'y limiter: analyser uniquement un sous-ensemble "intéressant" de données dans …


8
Générer une variable aléatoire avec une corrélation définie avec une ou plusieurs variables existantes
Pour une étude de simulation , je dois générer des variables aléatoires qui montrent une corrélation prefined (population) à une variable existante .YYY J'ai examiné les Rpackages copulaet ceux CDVinequi peuvent produire des distributions multivariées aléatoires avec une structure de dépendance donnée. Cependant, il n'est pas possible de fixer l'une …



5
La valeur p est-elle essentiellement inutile et dangereuse à utiliser?
Cet article du New York Times " Les chances, continuellement mises à jour" a attiré mon attention. Pour être bref, il est écrit que [Les statistiques bayésiennes] se révèlent particulièrement utiles pour aborder des problèmes complexes, y compris des recherches telles que celle utilisée par la Garde côtière en 2013 …





1
Les performances de pointe rapportées de l'utilisation de vecteurs de paragraphe pour l'analyse des sentiments ont-elles été reproduites?
J'ai été impressionné par les résultats du document ICML 2014 " Représentations distribuées des peines et des documents " de Le et Mikolov. La technique qu'ils décrivent, appelée «vecteurs de paragraphe», apprend des représentations non supervisées de paragraphes / documents arbitrairement longs, basées sur une extension du modèle word2vec. L'article …


1
Et si la précision de validation était élevée mais la précision de test faible dans la recherche?
J'ai une question spécifique sur la validation dans la recherche d'apprentissage automatique. Comme nous le savons, le régime d'apprentissage automatique demande aux chercheurs de former leurs modèles sur les données de formation, de choisir parmi les modèles candidats par ensemble de validation et de rendre compte de la précision sur …

3
Options d'hébergement pour les données accessibles au public
Vous avez donc décidé de soutenir l'idée d'une recherche reproductible et souhaitez rendre vos données disponibles en ligne pour que les gens puissent les voir et les utiliser. La question est, où l'hébergez-vous? Ma première inclination est bien sûr l'espace Web privé que j'ai sur un serveur universitaire, mais ces …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.