Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'essaie d'écrire une série de billets de blog sur les valeurs p et j'ai pensé qu'il serait intéressant de revenir là où tout a commencé - qui semble être le document de Pearson de 1900. Si vous êtes familier avec ce papier, vous vous souviendrez qu'il couvre les tests d'adéquation. …
Des distributions très asymétriques telles que le log-normal n'entraînent pas des intervalles de confiance bootstrap précis. Voici un exemple montrant que les zones arrière gauche et droite sont loin de la valeur idéale de 0,025, quelle que soit la méthode d'amorçage que vous essayez dans R: require(boot) n <- 25 …
J'ai beaucoup réfléchi au «problème de déséquilibre de classe» dans l'apprentissage machine / statistique ces derniers temps, et j'approfondis de plus en plus le sentiment que je ne comprends tout simplement pas ce qui se passe. Permettez-moi d'abord de définir (ou d'essayer de) définir mes termes: Le problème de déséquilibre …
Remarque: Je sais que L1 a une propriété de sélection de fonction. J'essaie de comprendre lequel choisir lorsque la sélection des fonctionnalités est complètement hors de propos. Comment décider quelle régularisation (L1 ou L2) utiliser? Quels sont les avantages et les inconvénients de chacune des régularisations L1 / L2? Est-il …
Enseignement supervisé 1) Un humain construit un classificateur basé sur des données d' entrée et de sortie 2) Ce classificateur est formé avec un ensemble de données de formation 3) Ce classificateur est testé avec un ensemble de données de test 4) Déploiement si le résultat est satisfaisant A utiliser …
Dans le livre Modèles et méthodes statistiques pour les données à vie , il est écrit: Censure: lorsqu'une observation est incomplète en raison d'une cause aléatoire. Troncature: lorsque la nature incomplète de l'observation est due à un processus de sélection systématique inhérent au plan d'étude. Qu'entend-on par «processus de sélection …
Quelles sont les différences dans les inférences qui peuvent être faites à partir d'une analyse de classe latente (ACV) par rapport à une analyse en grappes? Est-il exact qu'une ACV suppose une variable latente sous-jacente qui donne naissance aux classes, alors que l'analyse de cluster est une description empirique des …
La formule de la probabilité conditionnelle d' AA\text{A} happening étant donné que BB\text{B} est arrivé est la suivante : P(A | B)=P(A∩B)P(B).P(A | B)=P(A∩B)P(B). P\left(\text{A}~\middle|~\text{B}\right)=\frac{P\left(\text{A} \cap \text{B}\right)}{P\left(\text{B}\right)}. Mon manuel explique l'intuition derrière cela en termes de diagramme de Venn. Étant donné que BB\text{B} s'est produit, la seule façon pour AA\text{A} …
[Cette question a également été posée au débordement de la pile] La question en bref J'étudie les réseaux de neurones convolutifs, et je crois que ces réseaux ne traitent pas chaque neurone d'entrée (pixel / paramètre) de manière équivalente. Imaginez que nous ayons un réseau profond (plusieurs couches) qui applique …
Je recherche une distribution où la densité de probabilité diminue rapidement après un certain point loin de la moyenne, ou selon mes propres mots une "distribution en forme de plateau". Quelque chose entre le gaussien et l'uniforme.
Je joue à l' Album d'autocollants en ligne FIFA Panini , qui est une adaptation Internet des albums Panini classiques qui sont généralement publiés pour la coupe du monde de football, le championnat d'Europe et peut-être d'autres tournois. L'album contient des espaces réservés pour 424 autocollants différents. Le but du …
Dans ce billet de blog d'Andrew Gelman, il y a le passage suivant: Les modèles bayésiens d'il y a 50 ans semblent désespérément simples (sauf, bien sûr, pour des problèmes simples), et je m'attends à ce que les modèles bayésiens d'aujourd'hui semblent désespérément simples, dans 50 ans. (Juste pour un …
Je comprends que la corrélation n'est pas une causalité . Supposons que nous obtenions une forte corrélation entre deux variables. Comment vérifiez-vous si cette corrélation est réellement causale? Ou, dans quelles conditions, exactement, pouvons-nous utiliser des données expérimentales pour déduire une relation causale entre deux ou plusieurs variables?
Quelles sont les différences entre "inférence" et "estimation" dans le contexte de l'apprentissage automatique ? En tant que débutant, je pense que nous déduisons des variables aléatoires et estimons les paramètres du modèle. Ma compréhension est-elle juste? Sinon, quelles sont exactement les différences et quand dois-je les utiliser? De plus, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.