Cette balise indique des questions sur les définitions des termes statistiques. Utilisez une balise plus générale [terminologie] pour les questions sur le langage statistique qui ne concernent pas spécifiquement les définitions.
Je connais très peu de probabilités et de statistiques, et je souhaite apprendre. Je vois le mot «distribution» utilisé partout dans différents contextes. Par exemple, une variable aléatoire discrète a une «distribution de probabilité». Je sais ce que c'est. Une variable aléatoire continue a une fonction de densité de probabilité, …
J'expérimente l'algorithme de la machine de renforcement de gradient via le caretpackage en R. À l'aide d'un petit ensemble de données d'admission à l'université, j'ai exécuté le code suivant: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …
J'écris sur l'utilisation d'une «distribution de probabilité conjointe» pour un public qui serait plus susceptible de comprendre la «distribution multivariée», donc j'envisage d'utiliser la dernière. Cependant, je ne veux pas perdre de sens en faisant cela. Wikipédia semble indiquer qu'il s'agit de synonymes. Sont-ils? Sinon, pourquoi pas?
J'avais utilisé le terme «Affaire Heywood» de manière quelque peu informelle pour faire référence à des situations où une estimation en ligne, «réponse finie» itérativement mise à jour de la variance devenait négative en raison de problèmes de précision numérique. (J'utilise une variante de la méthode de Welford pour ajouter …
Ceci est la définition de la statistique sur wikipedia Plus formellement, la théorie statistique définit une statistique comme une fonction d'un échantillon où la fonction elle-même est indépendante de la distribution de l'échantillon; c'est-à-dire que la fonction peut être indiquée avant la réalisation des données. Le terme statistique est utilisé …
Je passe actuellement par un jeu de diapositives que j'ai pour "l'analyse factorielle" (PCA pour autant que je sache). On y dérive le "théorème fondamental de l'analyse factorielle" qui prétend que la matrice de corrélation des données entrant dans l'analyse ( ) peut être récupérée en utilisant la matrice des …
Selon M. Katz dans son livre Multivariable analysis (Section 1.2, page 6), " Un facteur de confusion est associé au facteur de risque et lié de manière causale au résultat. " Pourquoi le facteur de confusion doit-il être lié de manière causale au résultat? Serait-il suffisant que le confondant soit …
Il s'agit clairement d'une question de définition ou de convention, et presque sans importance pratique. Si est réglé sur sa valeur traditionnelle de 0,05, une valeur de p de 0,0500000000000 ... est-elle considérée comme statistiquement significative ou non? La règle pour définir la signification statistique est-elle généralement considérée comme p …
Le contexte de cette question s'inscrit dans un cadre de santé c'est-à-dire en examinant une ou plusieurs thérapies dans le traitement d'une condition. Il semble que même des chercheurs très respectés confondent les termes efficacité et efficacité , en utilisant les termes de manière interchangeable. Comment penser l'efficacité par rapport …
J'ai vu l' opérateur do(x)do(x)do(x) partout dans une revue de littérature que je fais sur la causalité (voir, par exemple, cette entrée wikipedia ). Cependant, je ne trouve pas de définition formelle et générale de cet opérateur. Quelqu'un peut-il me désigner une bonne référence à ce sujet? Je m'intéresse à …
Je n'arrive pas à comprendre Thompson Sampling et comment cela fonctionne. Je lisais sur Multi Arm Bandit et après avoir lu l'algorithme de limite de confiance supérieure, de nombreux textes suggéraient que l'échantillonnage de Thompson était plus performant que l'UCB. Qu'est-ce que Thompson Sampling, en termes simples ou simples? N'hésitez …
Une question embarrassante simple - mais il semble qu'elle n'a pas été posée sur Cross Validated avant: Quelle est la définition d'un modèle de régression? Aussi une question de support, Qu'est-ce qui n'est pas un modèle de régression? En ce qui concerne ce dernier, je suis intéressé par des exemples …
J'entends ces mots de plus en plus alors que j'étudie l'apprentissage automatique. En fait, certaines personnes ont remporté la médaille Fields en travaillant sur les régularités des équations. Donc, je suppose que c'est un terme qui va de la physique statistique / mathématique à l'apprentissage automatique. Naturellement, un certain nombre …
J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.