Sur la p. 34 de Introduction à l'apprentissage statistique : \newcommand{\Var}{{\rm Var}} Bien que la preuve mathématique dépasse le cadre de ce livre, il est possible de montrer que le test attendu MSE, pour une valeur donnée x0x0x_0 , peut toujours être décomposé en la somme de trois quantités fondamentales: …
J'ai une série chronologique de données avec N = 14 comptes à chaque point dans le temps, et je veux calculer le coefficient de Gini et une erreur standard pour cette estimation à chaque point dans le temps. Comme je n'ai que N = 14 comptes à chaque instant, j'ai …
Je viens d'apprendre le concept de bootstrap, et une question naïve m'est venue à l'esprit: si nous pouvons toujours générer de nombreux échantillons bootstrap de nos données, pourquoi se donner la peine d'obtenir davantage de données "réelles"? Je pense avoir une explication, dites-moi si j'ai raison: je pense que le …
Étant donné les variables aléatoires échantillonné iid à partir de , définissez X1,X2,⋯,XnX1,X2,⋯,XnX_1,X_2, \cdots, X_n∼N(0,σ2)∼N(0,σ2)\sim \mathcal{N}(0, \sigma^2)Z=maxi∈{1,2,⋯,n}XiZ=maxi∈{1,2,⋯,n}XiZ = \max_{i \in \{1,2,\cdots, n \}} X_i Nous avons cela E[Z]≤σ2logn−−−−−√E[Z]≤σ2logn\mathbb{E}[Z] \le \sigma \sqrt{2 \log n} . Je me demandais s'il y avait des limites supérieures / inférieures sur Var(Z)Var(Z)\text{Var}(Z) ?
Je sais par des études antérieures que Var(A+B)=Var(A)+Var(B)+2Cov(A,B)Var(A+B)=Var(A)+Var(B)+2Cov(A,B)Var(A+B) = Var(A) + Var(B) + 2 Cov (A,B) Cependant, je ne comprends pas pourquoi. Je peux voir que l'effet sera de «faire monter» la variance lorsque A et B covarient fortement. Il est logique que lorsque vous créez un composite à partir …
Comment puis-je quantifier la quantité de dispersion dans un vecteur de décompte de mots? Je recherche une statistique qui sera élevée pour le document A, car elle contient de nombreux mots différents qui se produisent rarement, et faible pour le document B, car elle contient un mot (ou quelques mots) …
Je voudrais comprendre comment je peux obtenir le pourcentage de variance d'un ensemble de données, non pas dans l'espace de coordonnées fourni par PCA, mais contre un ensemble légèrement différent de vecteurs (tournés). set.seed(1234) xx <- rnorm(1000) yy <- xx * 0.5 + rnorm(1000, sd = 0.6) vecs <- cbind(xx, …
Dans les tests d'hypothèses, une question courante est quelle est la variance de la population? Ma question est de savoir comment connaître la variance de la population? Si nous connaissions l'ensemble de la répartition, nous pourrions aussi bien connaître la moyenne de l'ensemble de la population. Quel est alors l'intérêt …
Dès le titre je voudrais savoir s'il existe un test statistique qui peut m'aider à identifier une divergence significative entre deux séries chronologiques similaires. Plus précisément, en regardant la figure ci-dessous, je voudrais détecter que les séries commencent à diverger à l'instant t1, c'est-à-dire lorsque la différence entre elles commence …
Je veux estimer la moyenne d'une fonction f, c'est-à-dire où et sont des variables aléatoires indépendantes. J'ai des échantillons de f mais pas iid: il y a des échantillons iid pour et pour chaque Y i il y a n i échantillons de X : X i , 1 , …
La pondération basée sur la précision est-elle au cœur de la méta-analyse? Borenstein et al. (2009) écrivent que pour qu'une méta-analyse soit possible, il suffit que: Les études rapportent une estimation ponctuelle qui peut être exprimée sous la forme d'un nombre unique. La variance peut être calculée pour cette estimation …
Je compare deux dispositifs de contrôle de la température conçus pour maintenir la température corporelle à exactement 37 degrés chez les patients anesthésiés. Les appareils ont été adaptés à 500 patients formant deux groupes. Groupe A (400 patients) - Dispositif 1, Groupe B (100 patients) - Dispositif 2. Chaque patient …
Dans le calcul VIF habituel pour une régression linéaire, chaque variable indépendante / explicative est traitée comme la variable dépendante dans une régression des moindres carrés ordinaires. c'est à direXjXjX_j Xj=β0+∑i=1,i≠jnβiXiXj=β0+∑i=1,i≠jnβiXi X_j = \beta_0 + \sum_{i=1, i \neq j}^n \beta_i X_i Les valeurs sont stockées pour chacune des régressions et …
Supposons un test t à un échantillon, où l'hypothèse nulle est . La statistique est alors utilisant l'écart type d'échantillon . Pour estimer , on compare les observations à la moyenne de l'échantillon : t = ¯ x - μ 0μ = μ0μ=μ0\mu=\mu_0 ss¯xt = x¯¯¯- μ0s / n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssX¯¯¯x¯\overline{x} s …
Si l'on teste l'hypothèse d'homoscédasticité, des tests paramétriques (test de Bartlett d'homogénéité des variances bartlett.test) et non paramétriques (test de Figner-Killeen d'homogénéité des variances fligner.test) sont disponibles. Comment savoir quel type utiliser? Cela devrait-il dépendre, par exemple, de la normalité des données?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.