Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Quelqu'un peut-il me dire comment interpréter les graphiques «résidus vs ajustés», «q-q normal», «emplacement-échelle» et «résidus vs effet de levier»? Je pose un GLM binomial, l'enregistre puis le trace.
J'ai deux échantillons que je veux tester (en utilisant python) s'ils sont tirés de la même distribution. Pour ce faire, j'utilise la fonction statistique ks_2samp de scipy.stats. Il renvoie 2 valeurs et j'ai du mal à les interpréter. Aidez-moi, s'il vous plaît!
En mathématiques, il existe des branches telles que l'algèbre, l'analyse, la topologie, etc. Dans l'apprentissage automatique, il y a l'apprentissage supervisé, non supervisé et par renforcement. Dans chacune de ces branches, il existe des branches plus fines qui divisent davantage les méthodes. J'ai du mal à établir un parallèle avec …
Dans le paradoxe d'anniversaire traditionnel, la question est "quelles sont les chances que deux personnes ou plus dans un groupe de personnes partagent un anniversaire". Je suis coincé sur un problème qui en est une extension.nnn Au lieu de connaître la probabilité que deux personnes partagent un anniversaire, je dois …
Si deux variables aléatoires et sont pas corrélées, peut-on également savoir que et non corrélées? Mon hypothèse est oui.YXXXX 2OuiYYX2X2X^2OuiYY E [ X Y ] = E [ X ] E [ Y ]X, YX,YX, Y non corrélé signifie , ouE[ XOui] = E[ X] E[ Oui]E[XY]=E[X]E[Y]E[XY]=E[X]E[Y] E[ XOui] = …
Quel est l'analyse des séries temporelles? Il existe de nombreuses autres méthodes statistiques, telles que la régression et l'apprentissage automatique, qui ont des cas d'utilisation évidents: la régression peut fournir des informations sur la relation entre deux variables, tandis que l'apprentissage automatique est idéal pour la prédiction. Mais en attendant, …
J'ai suivi un cours en ligne, où j'ai appris, que des classes déséquilibrées dans les données de formation pouvaient entraîner des problèmes, car les algorithmes de classification optent pour la règle de la majorité, car cela donne de bons résultats si le déséquilibre est trop important. Dans une affectation, il …
Si les Hessois sont si bons pour l'optimisation (voir par exemple la méthode de Newton ), pourquoi s'arrêter là? Utilisons les troisième, quatrième, cinquième et sixième dérivés? Pourquoi pas?
Supposons que j'ai deux groupes de données, étiquetés A et B (contenant chacun par exemple 200 échantillons et 1 fonction), et je veux savoir s'ils sont différents. Je pourrais: a) effectuer un test statistique (par exemple un test t) pour voir s'ils sont statistiquement différents. b) utiliser l'apprentissage automatique supervisé …
L'idée de l'analyse adaptative des données est que vous modifiez votre plan d'analyse des données à mesure que vous en apprenez davantage. Dans le cas de l'analyse exploratoire des données (EDA), c'est généralement une bonne idée (vous recherchez souvent des tendances imprévues dans les données), mais pour une étude de …
Je vais expliquer mon problème avec un exemple. Supposons que vous souhaitiez prédire le revenu d'un individu en fonction de certains attributs: {âge, sexe, pays, région, ville}. Vous avez un ensemble de données de formation comme ça train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, …
Une méta-analyse comprend un tas d'études, qui ont toutes rapporté une valeur P supérieure à 0,05. Est-il possible que la méta-analyse globale rapporte une valeur P inférieure à 0,05? Dans quelles circonstances? (Je suis presque sûr que la réponse est oui, mais j'aimerais une référence ou une explication.)
Je pense que c'est un sujet fascinant et je ne le comprends pas pleinement. Quelle loi de la physique fait que tant de phénomènes naturels ont une distribution normale? Il semblerait plus intuitif qu'ils auraient une distribution uniforme. Il est si difficile pour moi de comprendre cela et je sens …
Existe-t-il une branche des statistiques qui traite des données dont les valeurs exactes ne sont pas connues , mais pour chaque individu, nous connaissons un maximum ou un minimum lié à la valeur ? Je soupçonne que mon problème provient en grande partie du fait que j'ai du mal à …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.