Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'entraîne un réseau de neurones mais la perte d'entraînement ne diminue pas. Comment puis-je réparer cela? Je ne parle pas de surajustement ou de régularisation. Je demande comment résoudre le problème où les performances de mon réseau n'améliorent pas l' ensemble de formation . Cette question est délibérément générale, de …
J'ai un jeu de données qui contient à la fois des données continues et catégoriques. J'analyse en utilisant PCA et je me demande s'il est acceptable d'inclure les variables catégoriques dans le cadre de l'analyse. D'après ce que j'ai compris, l'ACP ne peut être appliquée qu'à des variables continues. Est-ce …
Dans plusieurs contextes différents, nous invoquons le théorème de la limite centrale pour justifier toute méthode statistique que nous souhaitons adopter (par exemple, approximer la distribution binomiale par une distribution normale). Je comprends les détails techniques expliquant pourquoi le théorème est vrai, mais je viens tout juste de penser que …
L’état actuel de la non-linéarité consiste à utiliser des unités linéaires rectifiées (ReLU) au lieu de la fonction sigmoïde dans un réseau neuronal profond. Quels sont les avantages? Je sais que la formation d'un réseau lorsque ReLU est utilisé serait plus rapide et inspirée davantage par la biologie. Quels sont …
Voici l'article qui a motivé cette question: L'impatience fait-elle grossir? J'ai aimé cet article et il illustre bien le concept de «contrôle des autres variables» (QI, carrière, revenu, âge, etc.) afin de mieux isoler la relation réelle entre les deux variables en question. Pouvez-vous m'expliquer comment vous contrôlez réellement les …
Est-ce toujours une bonne idée de s'entraîner avec l'ensemble de données complet après validation croisée ? En d'autres termes, est-il possible de s'entraîner avec tous les échantillons de mon jeu de données sans pouvoir vérifier si cet ajustement est trop important ? Quelques informations sur le problème: Disons que j'ai …
J'ai eu cette question lors d'une interview avec Amazon: 50% de toutes les personnes qui reçoivent une première interview reçoivent une deuxième interview 95% de vos amis qui ont eu une deuxième entrevue ont eu une bonne première entrevue 75% de vos amis qui N'ONT PAS eu une deuxième interview …
Récemment, ce document a attiré beaucoup d'attention (par exemple de WSJ ). En gros, les auteurs concluent que Facebook perdra 80% de ses membres d’ici 2017. Ils fondent leurs revendications sur une extrapolation du modèle SIR , un modèle compartimental fréquemment utilisé en épidémiologie. Leurs données sont tirées des recherches …
Je me sers de la quelques fois la validation croisée de d'évaluer la performance de certains algorithmes d'apprentissage, mais je l' ai toujours été perplexe quant à la façon dont je choisir la valeur de .KKKKKK J'ai souvent vu et utilisé une valeur de , mais cela me semble totalement …
On m'a demandé aujourd'hui en classe pourquoi on divisait la somme de l'erreur carrée par au lieu de , lors du calcul de l'écart type.nn - 1n−1n-1nnn J'ai dit que je ne vais pas y répondre en classe (étant donné que je ne voulais pas utiliser d'estimateurs non biaisés), mais …
J'utilise actuellement un SVM avec un noyau linéaire pour classer mes données. Il n'y a pas d'erreur sur le set d'entraînement. J'ai essayé plusieurs valeurs pour le paramètre ( ). Cela n'a pas modifié l'erreur sur l'ensemble de test.10 - 5 , … , 10 2CCCdix- 5, … , 10210−5,…,10210^{-5}, …
Quelles sont les fonctions de coût courantes utilisées pour évaluer les performances des réseaux de neurones? Détails (n'hésitez pas à sauter le reste de cette question, mon intention est simplement de fournir des éclaircissements sur la notation que les réponses peuvent utiliser pour les aider à être plus compréhensibles par …
Quelle est la différence entre PCA et MDS classique? Qu'en est-il des MDS par rapport aux MDS non métriques? Y a-t-il un moment où vous préféreriez l'un plutôt que l'autre? Comment les interprétations diffèrent-elles?
J'ai un jeu de données et j'aimerais savoir quelle distribution correspond le mieux à mes données. J'ai utilisé le fitdistr() fonction pour estimer les paramètres nécessaires pour décrire la distribution supposée (c.-à-d. Weibull, Cauchy, Normal). En utilisant ces paramètres, je peux effectuer un test de Kolmogorov-Smirnov pour estimer si les …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.