Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
En bout de ligne , plus j'en apprends sur les statistiques, moins je me fie aux articles publiés dans mon domaine; Je crois simplement que les chercheurs ne font pas assez bien leurs statistiques. Je suis un profane, pour ainsi dire. J'ai une formation en biologie mais je n'ai aucune …
Je suis nouveau dans la sélection de fonctionnalités et je me demandais comment vous utiliseriez PCA pour sélectionner des fonctionnalités. La PCA calcule-t-elle un score relatif pour chaque variable d'entrée que vous pouvez utiliser pour filtrer les variables d'entrée non informatives? En gros, je veux pouvoir classer les caractéristiques d'origine …
Ou plus encore "ça va être"? Le Big Data rend les statistiques et les connaissances pertinentes d'autant plus importantes mais semble sous-estimer la théorie de l'échantillonnage. J'ai déjà vu ce battage publicitaire autour du «Big Data» et je ne peux m'empêcher de me demander «pourquoi» voudrais-je tout analyser ? N'y …
Je travaille depuis un moment dans R et je suis confronté à des problèmes tels que PCA, SVD, décompositions QR et de nombreux autres résultats d'algèbre linéaire (lors de l'inspection d'estimations de régressions pondérées, etc.). Je voulais donc savoir si quelqu'un a une recommandation livre complet d'algèbre linéaire qui n'est …
Nous trouvons les centres de cluster et attribuons des points à k différents groupes de cluster dans le clustering k-means, qui est un algorithme très bien connu et qui se retrouve presque dans tous les packages d'apprentissage automatique du réseau. Mais la partie manquante et la plus importante à mon …
J'entends souvent dire que les tests post-hoc après une ANOVA ne peuvent être utilisés que si celle-ci était significative. Cependant, les tests post-hoc ajustent les valeurs pour maintenir le taux d'erreur global de type I à 5%, n'est-ce pas?ppp Alors pourquoi avons-nous besoin du test global en premier? Si nous …
Qu'est-ce qu'une bonne introduction aux statistiques pour un mathématicien qui connaît déjà bien les probabilités? J'ai deux motivations distinctes à poser, ce qui peut conduire à différentes suggestions: J'aimerais mieux comprendre la motivation statistique derrière de nombreux problèmes considérés par les probabilistes. J'aimerais savoir comment mieux interpréter les résultats des …
Supposons que vous êtes un chercheur en sciences sociales / économétrique qui essaie de trouver des prédicteurs pertinents de la demande d'un service. Vous avez 2 variables de résultat / variables dépendantes décrivant la demande (en utilisant le service oui / non et le nombre d'occasions). Vous avez 10 variables …
J'ai déjà posé cette question à StackOverflow, mais il semble que cela conviendrait mieux ici, étant donné que cela n'a pas donné de réponse à SO. C'est un peu à la croisée des statistiques et de la programmation. J'ai besoin d'écrire du code pour faire PCA (analyse en composantes principales). …
Une question a précédemment demandé des recommandations pour les manuels de statistiques mathématiques Est-ce que quelqu'un connaît de bonnes conférences vidéo en ligne sur les statistiques mathématiques ? Les plus proches que j'ai trouvés sont: Apprentissage machine Économétrie MISE À JOUR: Un certain nombre des suggestions mentionnées ci-dessous sont de …
Il semble qu'il soit possible d'obtenir des résultats similaires à ceux d'un réseau de neurones avec une régression linéaire multivariée dans certains cas, et la régression linéaire multivariée est extrêmement rapide et facile. Dans quelles circonstances les réseaux de neurones peuvent-ils donner de meilleurs résultats que la régression linéaire multivariée?
J'ai beaucoup lu sur la PCA, y compris divers tutoriels et questions (comme celle-ci , celle-ci , celle-ci et celle-ci ). Le problème géométrique que PCA essaie d’optimiser m’est clair: PCA essaie de trouver le premier composant principal en minimisant l’erreur de reconstruction (projection), ce qui maximise simultanément la variance …
À mes yeux, il semble que la validation en attente est inutile. En d’autres termes, scinder le jeu de données original en deux parties (formation et test) et utiliser le score de test comme mesure de généralisation est quelque peu inutile. La validation croisée des plis en K semble donner …
J'ai lu dans mon manuel que ne garantit pas que X et Y sont indépendants. Mais si elles sont indépendantes, leur covariance doit être égale à 0. Je ne peux encore penser à aucun exemple approprié; quelqu'un pourrait-il en fournir un?cov(X,Y)=0cov(X,Y)=0\text{cov}(X,Y)=0
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.