Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
En février 2016, l'American Statistical Association a publié une déclaration officielle sur la signification statistique et les valeurs p. Notre fil à ce sujet traite de ces questions en détail. Cependant, aucune autorité n’a été proposée pour offrir une alternative efficace universellement reconnue - jusqu’à présent. L'American Statistical Society (ASS) …
Je suis novice en Analyse de Composants Indépendants (ICA) et n’ai qu’une compréhension rudimentaire de la méthode. Il me semble que l’ACI est semblable à l’analyse factorielle (AF) à une exception près: l’ACI suppose que les variables aléatoires observées sont une combinaison linéaire de composants / facteurs indépendants non gaussiens, …
Il est dit sur Wikipedia que: les mathématiques [de probabilité] sont largement indépendantes de toute interprétation de probabilité. Question: Alors, si nous voulons être mathématiquement corrects, ne devrions-nous pas rejeter toute interprétation de la probabilité? C'est-à-dire que le bayésien et le fréquentisme sont mathématiquement incorrects? Je n'aime pas la philosophie, …
Les réseaux de neurones récurrents diffèrent des réseaux "normaux" par le fait qu'ils ont une couche "mémoire". En raison de cette couche, les NN récurrents sont supposés être utiles dans la modélisation de séries chronologiques. Cependant, je ne suis pas sûr de bien comprendre comment les utiliser. Supposons que j'ai …
Je n'ai jamais vraiment fait la différence entre ces deux mesures de convergence. (Ou, en fait, n'importe lequel des différents types de convergence, mais je les mentionne en particulier en raison des lois faibles et fortes des grands nombres.) Bien sûr, je peux citer la définition de chacun et donner …
J'ai quelques données ordinales obtenues à partir de questions d'enquête. Dans mon cas, ce sont des réponses de type Likert (fortement en désaccord - en désaccord - neutre - en accord - en parfait accord). Dans mes données, ils sont codés 1-5. Je ne pense pas que les moyens signifient …
La formule de calcul de la variance a au dénominateur:( n - 1 )(n−1)(n-1) s2= ΣNi = 1( xje- x¯)2n - 1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Je me suis toujours demandé pourquoi. Cependant, lire et regarder quelques bonnes vidéos sur le "pourquoi", il semble que soit un bon estimateur …
En analyse en composantes principales (ACP), nous obtenons des vecteurs propres (vecteurs unitaires) et des valeurs propres. Maintenant, définissons les charges comme Loadings=Eigenvectors⋅Eigenvalues−−−−−−−−−−√.Loadings=Eigenvectors⋅Eigenvalues.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. Je sais que les vecteurs propres ne sont que des directions et que les chargements (tels que définis ci-dessus) incluent également la variance …
Je lisais des informations sur la PCA dans le noyau ( 1 , 2 , 3 ) avec les noyaux gaussiens et polynomiaux. Comment le noyau gaussien sépare-t-il apparemment toute sorte de données non linéaires exceptionnellement bien? S'il vous plaît donner une analyse intuitive, ainsi que mathématiquement impliqué si possible. …
Je fais des calculs sur différentes matrices (principalement dans la régression logistique) et je reçois généralement l'erreur "Matrix is singular", où je dois revenir en arrière et supprimer les variables corrélées. Ma question est la suivante: que considéreriez-vous comme une matrice "fortement" corrélée? Existe-t-il une valeur seuil de corrélation pour …
J'ai plusieurs centaines de mesures. Maintenant, je pense utiliser un logiciel pour corréler chaque mesure avec chaque mesure. Cela signifie qu'il existe des milliers de corrélations. Parmi ceux-ci, il devrait exister (statistiquement) une corrélation élevée, même si les données sont complètement aléatoires (chaque mesure n’a qu’une centaine de points de …
Ce n'est pas une question de travail à domicile mais un problème réel auquel notre entreprise est confrontée. Très récemment (il y a 2 jours), nous avons commandé la fabrication de 10 000 étiquettes de produits à un revendeur. Le concessionnaire est une personne indépendante. Il fait fabriquer les étiquettes …
Je vois beaucoup cette image. J'ai le pressentiment que les informations fournies de cette manière sont en quelque sorte incomplètes ou même erronées, mais je ne connais pas suffisamment les statistiques pour y répondre. Cela me fait penser à cette bande dessinée xkcd , que même avec des données historiques …
Dans la plupart des tâches d’apprentissage automatique où vous pouvez formuler une probabilité qui doit être maximisée, nous optimisons en fait la probabilité de au lieu de la probabilité de certains paramètres . Par exemple, dans l'entraînement à probabilité maximum, il s'agit généralement du log-vraisemblance. Lorsque vous faites cela avec …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.