Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
En tant que biologiste, bon nombre des projets de recherche sur lesquels je travaille à un moment donné impliquent une collaboration avec un statisticien, que ce soit pour de simples conseils ou pour mettre en œuvre et tester un modèle pour mes données. Mes collègues des statistiques admettent qu'ils collaborent …
L'analyse exploratoire des données (EDA) conduit souvent à explorer d'autres «pistes» qui n'appartiennent pas nécessairement à l'ensemble initial d'hypothèses. Je suis confronté à une telle situation dans le cas d'études avec une taille d'échantillon limitée et beaucoup de données collectées à travers différents questionnaires (données socio-démographiques, échelles neuropsychologiques ou médicales …
QUESTION: J'ai des données binaires sur les questions d'examen (correctes / incorrectes). Certaines personnes peuvent avoir eu accès auparavant à un sous-ensemble de questions et à leurs réponses correctes. Je ne sais pas qui, combien ou quoi. S'il n'y avait pas de triche, supposons que je modélise la probabilité d'une …
Un étudiant m'a demandé aujourd'hui: "Comment savent-ils combien de personnes ont assisté à un événement de grand groupe, par exemple, le Rallye Stewart / Colbert pour restaurer la santé mentale à Washington DC?" Les agences de presse font état d'estimations par dizaines de milliers, mais quelles méthodes sont utilisées pour …
On m'a posé cette question lors d'une interview pour un poste de trading avec une société de trading propriétaire. J'aimerais beaucoup connaître la réponse à cette question et l'intuition qui la sous-tend. Question sur les amibes: Une population d'amibes commence par 1. Après 1 période pendant laquelle l'amibe peut se …
J'essaie d'implémenter une descente de gradient de base et je la teste avec une fonction de perte de charnière, c'est-à-dire . Cependant, je suis confus quant au gradient de la perte de charnière. J'ai l'impression que c'estlhinge=max(0,1−y x⋅w)lhinge=max(0,1−y x⋅w)l_{\text{hinge}} = \max(0,1-y\ \boldsymbol{x}\cdot\boldsymbol{w}) ∂∂wlhinge={−y x0if y x⋅w<1if y x⋅w≥1∂∂wlhinge={−y xif y …
Quelles méthodes de fiabilité inter-évaluateurs sont les plus appropriées pour les données ordinales ou d'intervalle? Je pense que la "probabilité d'accord commune" ou la "Kappa" sont conçues pour des données nominales. Alors que "Pearson" et "Spearman" peuvent être utilisés, ils sont principalement utilisés pour deux évaluateurs (bien qu'ils puissent être …
J'ai commencé à me frayer un chemin à travers les didacticiels d'exploration de données statistiques d'Andrew Moore (fortement recommandé pour toute autre personne qui s'aventure dans ce domaine). J'ai commencé par lire ce PDF extrêmement intéressant intitulé "Présentation introductive des algorithmes de détection d'anomalies basées sur des séries chronologiques" dans …
Quels sont les bons moyens de visualiser un ensemble de réponses Likert? Par exemple, un ensemble d'éléments demandant l'importance de X dans ses décisions concernant A, B, C, D, E, F & G? Y a-t-il quelque chose de mieux que des graphiques à barres empilées? Que faut-il faire avec les …
Disons que je mange des hamburgers tous les mardis depuis des années. On pourrait dire que je mange des hamburgers 14% du temps, ou que la probabilité que je mange un hamburger au cours d'une semaine donnée est de 14%. Quelles sont les principales différences entre les probabilités et les …
Cela peut être difficile à trouver, mais j'aimerais lire un exemple ARIMA bien expliqué qui utilise un minimum de mathématiques étend la discussion au-delà de la construction d'un modèle en utilisant ce modèle pour prévoir des cas spécifiques utilise des graphiques ainsi que des résultats numériques pour caractériser l'adéquation entre …
En lisant le test KS à 2 échantillons, je comprends exactement ce qu'il fait, mais je ne comprends pas pourquoi cela fonctionne . En d'autres termes, je peux suivre toutes les étapes pour calculer les fonctions de distribution empiriques, trouver la différence maximale entre les deux pour trouver la statistique …
Le titre est la question. On me dit que les ratios et les inverses de variables aléatoires sont souvent problématiques. Cela signifie que les attentes n'existent souvent pas. Y a-t-il une explication simple et générale à cela?
La régression LASSO réduit les coefficients vers zéro, permettant ainsi une sélection efficace du modèle. Je crois que dans mes données, il existe des interactions significatives entre les covariables nominales et continues. Cependant, les «principaux effets» du vrai modèle ne sont pas nécessairement significatifs (non nuls). Bien sûr, je ne …
Étant donné une fonction de coût convexe, en utilisant SGD pour l'optimisation, nous aurons un gradient (vecteur) à un certain point au cours du processus d'optimisation. Ma question est, étant donné le point sur le convexe, le gradient ne pointe-t-il que vers la direction dans laquelle la fonction augmente / …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.