Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Je connais la définition de la matrice définie positive symétrique (SPD), mais je veux en savoir plus. Pourquoi sont-ils si importants, intuitivement? Voici ce que je sais. Quoi d'autre? Pour une donnée donnée, la matrice de co-variance est SPD. La matrice de co-variance est une métrique importante, voir cet excellent …
Les documents de recherche sur l'apprentissage automatique traitent souvent l'apprentissage et l'inférence comme deux tâches distinctes, mais je ne comprends pas très bien quelle est la distinction. Dans ce livre, par exemple, ils utilisent les statistiques bayésiennes pour les deux types de tâches, mais ne motivent pas cette distinction. J'ai …
J'entraîne un réseau neuronal (détails non importants) où les données cibles sont un vecteur d'angles (entre 0 et 2 * pi). Je recherche des conseils sur la façon de coder ces données. Voici ce que j'essaie actuellement (avec un succès limité): 1) Encodage 1-of-C: je regroupe les angles possibles configurés …
Je ne peux pas être précis sur la nature des données car elles sont propriétaires, mais supposons que nous ayons des données comme celle-ci: chaque mois, certaines personnes s'inscrivent à un service. Ensuite, au cours de chaque mois suivant, ces personnes peuvent mettre à niveau le service, interrompre le service …
loss=∥y−Xβ∥22+λ∥β∥1loss=‖y−Xβ‖22+λ‖β‖1 {\rm loss} = \| y - X \beta \|_2^2 + \lambda \| \beta \|_1 exp(−λ∥β∥1)exp(−λ‖β‖1) \exp(-\lambda \| \beta \|_1 ) λλ\lambda Considérons que du point de vue bayésien, nous pouvons calculer la probabilité postérieure que, disons, les estimations de paramètres non nuls se trouvent dans une collection d'intervalles donnée …
Je prends le cours d' Andrew Ng sur l'apprentissage automatique à travers Coursera . Pour les équations, les exposants sont utilisés à la place des indices. Par exemple, dans l'équation suivante, est utilisé à la place de :X( i )X(je)x^{(i)}XjeXjex_i J( θ0, θ1) = 12 m∑i = 1m( hθ( x( …
Cela a été un peu un choc pour moi la première fois que j'ai fait une simulation Monte Carlo à distribution normale et découvert que la moyenne de 100100100 écarts-types de 100100100 échantillons, tous ayant une taille d'échantillon de seulement n=2n=2n=2 , s'est avérée être beaucoup moins que, c.-à-d., faire …
Voir cette question sur Math SE . Petite histoire: j'ai lu Les éléments de l'apprentissage statistique et j'ai été frustré lorsque j'essayais de vérifier certains résultats, par exemple, étant donné puis I je cherche un livre de calcul matriciel qui est écrit comme votre livre de calcul traditionnel (ie, preuves …
J'ai lu à partir de là que l'erreur standard de la variance de l'échantillon est SEs2=2σ4N−1−−−−−−√SEs2=2σ4N−1SE_{s^2} = \sqrt{\frac{2 \sigma^4}{N-1}} Quelle est l'erreur type de l'écart type de l'échantillon? Je serais tenté de deviner et de dire que mais je ne suis pas sûr.SEs=SEs2−−−−√SEs=SEs2SE_{s} = \sqrt{SE_{s^2}}
Il existe de nombreuses techniques en statistiques écologiques pour l'analyse exploratoire des données multidimensionnelles. Ces techniques sont appelées techniques d '«ordination». Beaucoup sont identiques ou étroitement liés aux techniques courantes ailleurs dans les statistiques. L'exemple prototypique serait peut-être l'analyse des composants principaux (ACP). Les écologistes pourraient utiliser l'ACP et des …
Le paradoxe de Stein montre que lorsque trois paramètres ou plus sont estimés simultanément, il existe des estimateurs combinés plus précis en moyenne (c'est-à-dire ayant une erreur quadratique moyenne attendue inférieure) que toute méthode qui gère les paramètres séparément. C'est un résultat très contre-intuitif. Le même résultat est-il valable si …
J'ai une question concernant la nécessité d'utiliser des méthodes de sélection d'entités (forêts aléatoires, valeur d'importance des caractéristiques ou méthodes de sélection d'entités univariées, etc.) avant d'exécuter un algorithme d'apprentissage statistique. Nous savons que pour éviter le sur-ajustement, nous pouvons introduire une pénalité de régularisation sur les vecteurs de poids. …
J'ai un réseau de neurones mis en place pour prédire quelque chose où la variable de sortie est ordinale. Je décrirai ci-dessous en utilisant trois sorties possibles A <B <C. Il est assez évident de savoir comment utiliser un réseau de neurones pour produire des données catégorielles: la sortie est …
J'ai regardé beaucoup de vidéos tutorielles et elles se ressemblent. Celui-ci par exemple: https://www.youtube.com/watch?v=ip4iSMRW5X4 Ils expliquent les états, les actions et les probabilités qui conviennent. La personne l'explique, mais je n'arrive pas à comprendre à quoi cela pourrait servir dans la vie réelle. Je n'ai pas trouvé de liste pour …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.