Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Une analyse intermédiaire est une analyse des données à un ou plusieurs moments avant la clôture officielle de l'étude dans le but, par exemple, de mettre éventuellement fin à l'étude plus tôt. Selon Piantadosi, S. ( Essais cliniques - une perspective méthodologique ): " L'estimation d'un effet du traitement sera …
Le New York Times a un long commentaire sur le système d'évaluation des enseignants à «valeur ajoutée» utilisé pour donner un feedback aux éducateurs de la ville de New York. La lede est l'équation utilisée pour calculer les scores - présentée sans contexte. La stratégie rhétorique semble être l'intimidation via …
Au début, je pensais que l'ordre n'avait pas d'importance, mais j'ai ensuite lu au sujet du processus d'orthogonalisation gram-schmidt pour calculer les coefficients de régression multiple, et maintenant j'ai des doutes. Selon le processus gram-schmidt, plus une variable explicative est indexée tardivement parmi les autres variables, plus son vecteur résiduel …
Je veux estimer le quantile de certaines données. Les données sont si énormes qu'elles ne peuvent pas être stockées dans la mémoire. Et les données ne sont pas statiques, de nouvelles données continuent d'arriver. Quelqu'un connaît-il un algorithme pour surveiller les quantiles des données observées jusqu'à présent avec une mémoire …
Quels bons manuels d'économétrie recommanderiez-vous? Edit: il y a pas mal de livres, avec différents niveaux de sophistication mathématique. Il serait bon d'avoir une idée de la technicité du livre que vous recommandez.
J'ai des valeurs de p provenant de nombreux tests et j'aimerais savoir s'il y a réellement quelque chose d'important après correction pour plusieurs tests. La complication: mes tests ne sont pas indépendants. La méthode à laquelle je pense (une variante de la méthode des produits de Fisher, Zaykin et al., …
"Heure du jour" où la valeur peut être 0, 1, 2, ..., 23 est-elle une variable catégorielle? Je serais tenté de dire non, car 5, par exemple, est «plus proche» de 4 ou 6 que de 3 ou 7. Par contre, il y a la discontinuité entre 23 et 0. …
Je souhaite mieux comprendre comment la correction de continuité de la distribution binomiale pour l'approximation normale a été dérivée. Quelle méthode a été utilisée pour décider d'ajouter 1/2 (pourquoi pas un autre nombre?). Toute explication (ou un lien vers une lecture suggérée, autre que celle-ci , serait appréciée).
Quelle est la notation algébrique pour calculer l'intervalle de prédiction pour la régression multiple? Cela peut paraître idiot, mais j'ai du mal à trouver une notation algébrique claire de cela.
J'essaie de comprendre les différences entre les méthodes de réduction de dimensionnalité linéaire (par exemple, PCA) et les méthodes non linéaires (par exemple, Isomap). Je ne comprends pas très bien ce que la (non) linéarité implique dans ce contexte. J'ai lu sur Wikipedia que Par comparaison, si PCA (un algorithme …
Dans Alex Krizhevsky, et al. Classification Imagenet avec des réseaux de neurones convolutionnels profonds, ils énumèrent le nombre de neurones dans chaque couche (voir schéma ci-dessous). L'entrée du réseau est de 150528 dimensions et le nombre de neurones dans les couches restantes du réseau est donné par 253,440–186,624–64,896–64,896–43,264– 4096–4096–1000. Une …
J'essayais de simuler l'injection de points aléatoires dans un cercle, de sorte que n'importe quelle partie du cercle ait la même probabilité d'avoir un défaut. Je m'attendais à ce que le compte par zone de la distribution résultante suive une distribution de Poisson si je divise le cercle en rectangles …
Je construis un modèle et je pense que la situation géographique est susceptible d'être très bonne pour prédire ma variable cible. J'ai le code postal de chacun de mes utilisateurs. Je ne suis pas tout à fait sûr de la meilleure façon d'inclure le code postal comme fonctionnalité de prédiction …
J'utilise une matrice de confusion pour vérifier les performances de mon classificateur. J'utilise Scikit-Learn, je suis un peu confus. Comment interpréter le résultat de from sklearn.metrics import confusion_matrix >>> y_true = [2, 0, 2, 2, 0, 1] >>> y_pred = [0, 0, 2, 2, 0, 2] >>> confusion_matrix(y_true, y_pred) array([[2, …
J'ai appris le PCA il y a quelques conférences en classe et en approfondissant ce concept fascinant, j'ai appris à connaître le PCA clairsemé. Je voulais demander, si je ne me trompe pas, c'est ce que l'APC est clairsemée: Dans l'APC, si vous avez points de données avec variables, vous …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.