Statistiques et Big Data

5

Que dois-je faire lorsque mon réseau de neurones n'apprend pas?

J'entraîne un réseau de neurones mais la perte d'entraînement ne diminue pas. Comment puis-je réparer cela? Je ne parle pas de surajustement ou de régularisation. Je demande comment résoudre le problème où les performances de mon réseau n'améliorent pas l' ensemble de formation . Cette question est délibérément générale, de …

148 neural-networks deep-learning

6

L’analyse en composantes principales peut-elle être appliquée à des ensembles de données contenant un mélange de variables continues et catégorielles?

J'ai un jeu de données qui contient à la fois des données continues et catégoriques. J'analyse en utilisant PCA et je me demande s'il est acceptable d'inclure les variables catégoriques dans le cadre de l'analyse. D'après ce que j'ai compris, l'ACP ne peut être appliquée qu'à des variables continues. Est-ce …

147 categorical-data pca correspondence-analysis mixed-type-data

7

Quelle explication intuitive existe-t-il pour le théorème de la limite centrale?

Dans plusieurs contextes différents, nous invoquons le théorème de la limite centrale pour justifier toute méthode statistique que nous souhaitons adopter (par exemple, approximer la distribution binomiale par une distribution normale). Je comprends les détails techniques expliquant pourquoi le théorème est vrai, mais je viens tout juste de penser que …

144 intuition central-limit-theorem

25

R vs SAS, pourquoi les entreprises privées préfèrent-elles SAS?

J'ai appris R, mais il semble que les entreprises s'intéressent beaucoup plus à l'expérience SAS. Quels sont les avantages de SAS sur R?

143 r sas

6

Quels sont les avantages de ReLU par rapport à la fonction sigmoïde dans les réseaux de neurones profonds?

L’état actuel de la non-linéarité consiste à utiliser des unités linéaires rectifiées (ReLU) au lieu de la fonction sigmoïde dans un réseau neuronal profond. Quels sont les avantages? Je sais que la formation d'un réseau lorsque ReLU est utilisé serait plus rapide et inspirée davantage par la biologie. Quels sont …

141 machine-learning neural-networks deep-learning

5

Comment exactement "contrôler pour d'autres variables"?

Voici l'article qui a motivé cette question: L'impatience fait-elle grossir? J'ai aimé cet article et il illustre bien le concept de «contrôle des autres variables» (QI, carrière, revenu, âge, etc.) afin de mieux isoler la relation réelle entre les deux variables en question. Pouvez-vous m'expliquer comment vous contrôlez réellement les …

141 regression causality confounding controlling-for-a-variable statistics-in-media

5

Formation avec l'ensemble de données complet après validation croisée?

Est-ce toujours une bonne idée de s'entraîner avec l'ensemble de données complet après validation croisée ? En d'autres termes, est-il possible de s'entraîner avec tous les échantillons de mon jeu de données sans pouvoir vérifier si cet ajustement est trop important ? Quelques informations sur le problème: Disons que j'ai …

140 machine-learning cross-validation model-selection

14

Question d'entrevue Amazon - probabilité de 2e interview

J'ai eu cette question lors d'une interview avec Amazon: 50% de toutes les personnes qui reçoivent une première interview reçoivent une deuxième interview 95% de vos amis qui ont eu une deuxième entrevue ont eu une bonne première entrevue 75% de vos amis qui N'ONT PAS eu une deuxième interview …

139 probability conditional-probability

8

Facebook est-il en train de se terminer?

Récemment, ce document a attiré beaucoup d'attention (par exemple de WSJ ). En gros, les auteurs concluent que Facebook perdra 80% de ses membres d’ici 2017. Ils fondent leurs revendications sur une extrapolation du modèle SIR , un modèle compartimental fréquemment utilisé en épidémiologie. Leurs données sont tirées des recherches …

138 hypothesis-testing correlation epidemiology social-network

4

Choix de K dans la validation croisée du pli K

Je me sers de la quelques fois la validation croisée de d'évaluer la performance de certains algorithmes d'apprentissage, mais je l' ai toujours été perplexe quant à la façon dont je choisir la valeur de .KKKKKK J'ai souvent vu et utilisé une valeur de , mais cela me semble totalement …

136 machine-learning classification cross-validation

15

Explication intuitive de la division par

On m'a demandé aujourd'hui en classe pourquoi on divisait la somme de l'erreur carrée par au lieu de , lors du calcul de l'écart type.nn - 1n−1n-1nnn J'ai dit que je ne vais pas y répondre en classe (étant donné que je ne voulais pas utiliser d'estimateurs non biaisés), mais …

136 standard-error intuition teaching bessels-correction

7

Quelle est l'influence du C dans les SVM avec un noyau linéaire?

J'utilise actuellement un SVM avec un noyau linéaire pour classer mes données. Il n'y a pas d'erreur sur le set d'entraînement. J'ai essayé plusieurs valeurs pour le paramètre ( ). Cela n'a pas modifié l'erreur sur l'ensemble de test.10 - 5 , … , 10 2CCCdix- 5, … , 10210−5,…,10210^{-5}, …

134 machine-learning svm libsvm

2

Liste des fonctions de coût utilisées dans les réseaux de neurones, parallèlement aux applications

Quelles sont les fonctions de coût courantes utilisées pour évaluer les performances des réseaux de neurones? Détails (n'hésitez pas à sauter le reste de cette question, mon intention est simplement de fournir des éclaircissements sur la notation que les réponses peuvent utiliser pour les aider à être plus compréhensibles par …

133 machine-learning neural-networks

5

Quelle est la différence entre l'analyse en composantes principales et la mise à l'échelle multidimensionnelle?

Quelle est la différence entre PCA et MDS classique? Qu'en est-il des MDS par rapport aux MDS non métriques? Y a-t-il un moment où vous préféreriez l'un plutôt que l'autre? Comment les interprétations diffèrent-elles?

133 pca multidimensional-scaling pcoa

2

Comment déterminer quelle distribution correspond le mieux à mes données?

J'ai un jeu de données et j'aimerais savoir quelle distribution correspond le mieux à mes données. J'ai utilisé le fitdistr() fonction pour estimer les paramètres nécessaires pour décrire la distribution supposée (c.-à-d. Weibull, Cauchy, Normal). En utilisant ces paramètres, je peux effectuer un test de Kolmogorov-Smirnov pour estimer si les …

133 r distributions goodness-of-fit kolmogorov-smirnov distribution-identification