Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'ai deux séries chronologiques (lisses) que j'aimerais corréler entre elles pour voir leur corrélation. J'ai l'intention d'utiliser le coefficient de corrélation de Pearson. Est-ce approprié? Ma deuxième question est que je peux choisir d’échantillonner les 2 séries chronologiques aussi bien que je le souhaite. c'est-à-dire que je peux choisir combien …
Comment interpréter la déviance nulle et résiduelle dans GLM in R? Comme, nous disons qu'un plus petit AIC est meilleur. Existe-t-il une interprétation similaire et rapide pour les déviances également? Déviance nulle: 1146.1 sur 1077 degrés de liberté Déviance résiduelle: 4589.4 sur 1099 degrés de liberté AIC: 11089
Extrait de StatSoft, Inc. (2013), Manuel de statistiques électroniques , "Naive Bayes Classifier" : Pour illustrer le concept de classification naïve de Bayes, considérons l'exemple présenté dans l'illustration ci-dessus. Comme indiqué, les objets peuvent être classés en VERT ou en ROUGE. Ma tâche consiste à classer les nouveaux cas au …
Imaginez que vous deviez faire un rapport sur le nombre de candidats qui passent chaque année un test donné. Il semble assez difficile de déduire le pourcentage de succès observé, par exemple, sur une population plus large en raison de la spécificité de la population cible. Vous pouvez donc considérer …
Je suis sûr que je suis complètement enroulé autour de ma tête, mais je n'arrive pas à comprendre. Le test t compare deux distributions normales utilisant la distribution Z. C'est pourquoi il y a une hypothèse de normalité dans les DONNÉES. L'ANOVA équivaut à une régression linéaire avec des variables …
Cette question me laisse perplexe depuis longtemps. Je comprends l'utilisation de 'log' pour maximiser la probabilité, je ne pose donc pas la question de 'log'. Ma question est la suivante: puisque maximiser la probabilité de log équivaut à minimiser la "probabilité de log négative" (NLL), pourquoi avons-nous inventé cette NLL? …
Gradient Descent a le problème de rester bloqué dans les minima locaux. Nous devons exécuter des temps exponentiels de descente sur gradient afin de trouver les minima globaux. Quelqu'un peut-il me parler de toute alternative de descente de gradient telle qu'appliquée dans l'apprentissage par réseau de neurones, ainsi que de …
Au cours des dernières années, les réseaux de neurones convolutifs (CNN) sont devenus le nec plus ultra en matière de reconnaissance d’objets en vision par ordinateur. En règle générale, un CNN se compose de plusieurs couches convolutives, suivies de deux couches entièrement connectées. L'intuition derrière cela est que les couches …
Dans l'article "Discussion: les écologistes doivent-ils devenir bayésiens?" Brian Dennis donne une vision étonnamment équilibrée et positive des statistiques bayésiennes alors que son objectif semble être de mettre les gens en garde. Cependant, dans un paragraphe, sans aucune citation ni justification, il dit: Les Bayésiens, voyez-vous, ne sont pas autorisés …
Je venais de lire cet article sur le facteur Bayes pour un problème totalement sans rapport lorsque je suis tombé sur ce passage Les tests d’hypothèses avec des facteurs Bayes sont plus robustes que les tests d’hypothèses fréquentistes, dans la mesure où la forme bayésienne évite les biais de sélection …
J'ai vu des "résidus" définis différemment comme étant "des valeurs prédites moins les valeurs réelles" ou des "valeurs prédites moins les valeurs réelles". À titre d'illustration, pour montrer que les deux formules sont largement utilisées, comparez les recherches sur le Web suivantes: résiduelle "prévue moins réelle" résiduelle "moins réelle prévue" …
Je suis curieux de connaître la nature de . Quelqu'un peut-il dire quelque chose d'intuitif sur "Que dit propos des données?" Σ - 1Σ−1Σ−1\Sigma^{-1}Σ−1Σ−1\Sigma^{-1} Modifier: Merci pour les réponses Après avoir suivi d'excellents cours, j'aimerais ajouter quelques points: C'est une mesure d'information, c'est-à-dire que est la quantité d'informations le long …
J'ai terminé l'analyse des données et obtenu des "résultats statistiquement significatifs", ce qui correspond à mon hypothèse. Cependant, un étudiant en statistiques m'a dit que c'était une conclusion prématurée. Pourquoi? Y a-t-il autre chose à inclure dans mon rapport?
Quelqu'un peut-il expliquer pourquoi nous avons besoin d'un grand nombre d'arbres dans une forêt aléatoire lorsque le nombre de prédicteurs est grand? Comment pouvons-nous déterminer le nombre optimal d'arbres?
Dans cet article intitulé "CHOISIR ENTRE DES MODÈLES LINÉAIRES GÉNÉRALISÉS APPLIQUÉS AUX DONNÉES MÉDICALES", les auteurs écrivent: Dans un modèle linéaire généralisé, la moyenne est transformée, par la fonction de lien, au lieu de transformer la réponse elle-même. Les deux méthodes de transformation peuvent conduire à des résultats très différents. …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.