Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Supposons que je veuille voir si mes données sont exponentielles en fonction d'un histogramme (c'est-à-dire asymétriques à droite). Selon la façon dont je regroupe ou classe les données, je peux obtenir des histogrammes très différents. Un ensemble d'histogrammes semblera indiquer que les données sont exponentielles. Un autre ensemble fera croire …
Je lis un article dans lequel l'auteur élimine plusieurs variables en raison d'une corrélation élevée avec d'autres variables avant de procéder à la PCA. Le nombre total de variables est d'environ 20. Est-ce que cela donne des avantages? Cela me semble être une surcharge, car la PCA devrait gérer cela …
Comme l’a proposé Friedman, l’amélioration des arbres en dégradé utilise des arbres de décision comme apprenants de base. Je me demande si nous devrions rendre l'arbre de décision de base aussi complexe que possible (complètement développé) ou plus simple? Y a-t-il une explication au choix? Random Forest est une autre …
Je travaille sur un petit projet impliquant les visages des utilisateurs de Twitter via leurs photos de profil. Un problème que j'ai rencontré est qu'après avoir filtré toutes les images sauf les images qui sont claires, un pourcentage faible mais significatif d'utilisateurs de Twitter utilise une photo de Justin Bieber …
J'ai une question étrange. Supposons que vous avez un petit échantillon dans lequel la variable dépendante que vous allez analyser avec un modèle linéaire simple est fortement asymétrique. Ainsi , on suppose que est normalement distribué, car cela entraînerait une distribution normale y . Mais lorsque vous calculez le graphe …
Pour poursuivre sur cette question, comment expliqueriez-vous la covariance à quelqu'un qui ne comprend que la moyenne? , qui aborde la question de l’explication de la covariance à un laïc, a soulevé une question similaire dans mon esprit. Comment expliquer à un néophyte de statistiques la différence entre covariance et …
À partir de la fonction de densité de distribution, nous pourrions identifier une moyenne (= 0) pour la distribution de Cauchy, comme le montre le graphique ci-dessous. Mais pourquoi dit-on que la distribution de Cauchy n'a pas de moyen?
Comment une machine à vecteurs de support (SVM) travail, et ce qui le différencie des autres classificateurs linéaires, tels que le linéaire Perceptron , analyse discriminante linéaire ou régression logistique ? * (* Je pense en termes de motivations sous-jacentes à l'algorithme, de stratégies d'optimisation, de capacités de généralisation et …
D'abord c'était le Brexit , maintenant les élections américaines. De nombreuses prédictions de modèles ont été largement décalées et reste-t-il des leçons à tirer ici? Pas plus tard qu'hier, à 16 heures, heure de Paris, les marchés des paris étaient toujours favorables à Hillary 4 à 1. Je suppose que …
Ici @gung fait référence à la règle .632+. Une recherche rapide dans Google ne permet pas de comprendre aisément ce que cette règle signifie et dans quel but elle est utilisée. Quelqu'un voudrait-il élucider la règle .632+?
Pour une matrice de données donnée (avec des variables dans des colonnes et des points de données dans des lignes), il semble que joue un rôle important dans les statistiques. Par exemple, il s’agit d’une partie importante de la solution analytique des moindres carrés ordinaires. Ou, pour la PCA, ses …
De nombreux emplois statistiques demandent une expérience avec des données à grande échelle. Quelles sont les compétences statistiques et informatiques nécessaires pour travailler avec de grands ensembles de données? Par exemple, qu’en est-il de la construction de modèles de régression à partir d’un ensemble de données contenant 10 millions d’échantillons?
C'est une question générale qui a été posée indirectement à plusieurs reprises ici, mais il manque une seule réponse faisant autorité. Il serait bon d'avoir une réponse détaillée à cette question pour la référence. L’exactitude , la proportion de classifications correctes parmi toutes les classifications, est une mesure très simple …
Je suis en train de faire le tutoriel Udacity Deep Learning. Dans la leçon 3, ils parlent d'une convolution 1x1. Cette convolution 1x1 est utilisée dans Google Inception Module. J'ai du mal à comprendre ce qu'est une convolution 1x1. J'ai aussi vu ce post de Yann Lecun. Quelqu'un pourrait-il bien …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.