Prouve-le


8

Les problèmes statistiques impliquant des intervalles de confiance pour une moyenne de population peuvent être formulés en fonction de la fonction de pondération suivante :

w(α,n)tn1,α/2nfor 0<α<1 and n>1.

Par exemple, l' intervalle de confiance classique de niveau standard pour la moyenne d'une super-population infinie peut s'écrire:1α

CI(1α)=[x¯n±w(α,n)sn].

Il est trivial de fixer les limites limα0w(α,n)=et limα1w(α,n)=0 utilisant la fonction quantile de la distribution T. Dans le contexte des intervalles de confiance, cela nous indique que l'intervalle se réduit à un seul point lorsque nous diminuons le niveau de confiance, et augmente sur toute la ligne réelle lorsque nous augmentons le niveau de confiance. Une autre propriété intuitive qui devrait tenir est que l'intervalle se réduit à un seul point à mesure que nous obtenons de plus en plus de données, ce qui signifie que:

limnw(α,n)=0.

Question: Veuillez fournir une preuve pour cette dernière propriété de la fonction de pondération.


Plus d'informations: Pour tout lecteur mathématique qui ne connaît pas les points critiques de la distribution T , la valeur est une fonction de définie par l'équation implicite:tn1,α/2n

α2=1(n1)πΓ(n2)Γ(n12)tn1,α/2(1+r2n1)n/2dr.

2
N'est-ce pas anodin du fait que les élèves t convergent vers une normale en variation totale? Le numérateur passe à la constante . zα/2
mec

1
@guy: Ce qui constitue "trivial" dépend du niveau de la personne que vous demandez. La raison pour laquelle je pose cette question est que c'est un problème que j'ai posé à quelques étudiants diplômés dans mon enseignement, et je veux voir quels types de preuves les gens sur ce site proposent (donc je peux comparer cela avec le types de réponses données par les étudiants). Les étudiants diplômés ont généralement une idée approximative de la façon d'aborder la preuve, mais ont du mal avec les détails. La plupart essaient de montrer et partent de là, mais d'autres essaient de le résoudre en établissant une borne sur l'intégrale. tn1,α/2zα/2<
Ben - Réintègre Monica le

(J'espère aussi voir la preuve la plus élégante, comme un bon moyen de présenter le résultat.)
Ben - Réinstallez Monica

2
Je serais intéressé de voir à quel point quelqu'un peut être élégant. Opinion personnelle, mais je dirais que l'utilisation des densités n'est pas élégante car elle apporte une structure supplémentaire qui n'est pas nécessaire. La preuve dans ma réponse a deux leçons importantes. Premièrement, la proposition est un peu utile de la théorie des probabilités et peut donner une idée du comportement des DF. Deuxièmement, la technique de preuve (qui peut être reformulée en termes de nombres de couverture) est très utile pour prouver beaucoup de choses.
mec

Réponses:


4

Preuve de l'inégalité de Chebyshev

Voici une preuve utilisant l'inégalité de Chebyshev .Pr(|T|kσ)1k2

Si nous remplissons et définissons alors nous avons une limiteσtν=νν21/k2=α=Pr(|T|tν,α/2)

Pr(|T|νν21α)Pr(|T|tν,α/2)

ainsi sera délimité ci-dessus partν,α/2

tν,α/2νν21α

en ajoutant la borne inférieure évidente et en divisant parν+1

0tn1,α/2ν+1νν+1(ν2)1α

ce qui serre à zéro pourtn1,α/2/nn


J'évite généralement les commentaires "belle réponse" mais celui-ci est vraiment élégant! (+1 évidemment!)
usεr11852

1
@ usεr11852 vous aimerez peut-être ma preuve géométrique où la distribution de la statistique t est liée à la distribution d'un angle dans l'espace n.
Sextus Empiricus

4

Je suis sûr qu'il existe un moyen plus facile de le faire, mais le résultat est immédiat de ce qui suit:

Proposition: SoitF être une fonction de distribution continue et Fn une séquence de fonctions de distribution telles que FnFfaiblement (c.-à-d. dans la distribution). alorsFn(x)F(x) uniformément dans x.

Preuve: utiliser la continuité et la monotonie, pour tout nombre naturelm nous pouvons sélectionner x0,x1,,xm tel que F(xj)=j/m (prise x0= et xm=). Par une faible convergence et le fait queF est continu, Fn(xj)F(xj). Pour toutey, trouver un intervalle [xj1,xj] contenant y et notez que |Fn(y)F(y)|supj|Fn(xj)F(xj)|+|F(xj)F(xj1)|1m. Par conséquentlim¯nsupy|Fn(y)F(y)|1m et parce que m était arbitraire, nous obtenons supy|Fn(y)F(y)|0.

Ensuite, c'est une application bien connue du théorème de Slutsky que le tn1converge dans la distribution vers une distribution normale standard. Le résultat précédent implique queFn(tn1,α)F(tn1,α)0, c'est à dire, F(tn1,α)α. En appliquant la fonction quantile normale des deux côtés, nous obtenonstn1,αzα.

Par conséquent tn1,αzα impliquant tn1,αg(n)0 pour toute g(n) (en particulier, g(n)=n).


3

Preuve géométrique

Vue géométrique

Considérons l'échantillon observé comme un point dans l'espace euclidien à n dimensions et l'estimation de la moyenne comme la projection d'une observation x1,x2,...,xn sur la ligne de modèle x1=x2=...=xn=x¯.

Le t-score peut être exprimé comme le rapport de deux distances dans cet espace

  • la distance entre le point projeté et la moyenne de la population
    n(x¯μ)
  • la distance entre ce point et l'observation
    i=1n(x^xi)2

Ceci est lié à la tangente de l'angle entre l'observation et la ligne sur laquelle elle est projetée.

tn1=n(x¯μ)i=1n(x^xi)2=1tanθ

Geometrical sketch

Distribution d'équivalence t et distribution d'angle

Dans cette vue géométrique, la probabilité que le score t soit supérieur à une certaine valeur équivaut à la probabilité que l' angle soit inférieur à une certaine valeur:

Pr(|T|>tn1,α/2)=2Pr(θθν,α)=α

Ou

tn1,α/2n1=1tanθν,α

On pourrait dire que le t-score est lié à l'angle d'observation avec la droite du modèle théorique. Pour les points en dehors de l'intervalle de confiance (alorsμ est plus éloigné x¯ et l'angle sera plus petit) l'angle sera en dessous d'une certaine limite θν,α. Cette limite changera avec plus d'observations. Si la limite de cet angleθν,α va à 90 degrés pour les grands n (la forme du cône devenant plus plate, c'est-à-dire moins pointue et longue), cela signifie que la taille de l'intervalle de confiance devient plus petite et s'approche de zéro.

angle vs t

Distribution angulaire comme aire relative du chapeau d'une sphère n

En raison de la symétrie de la distribution de probabilité conjointe des variables distribuées normales indépendantes, chaque direction est également probable et la probabilité que l'angle soit dans une certaine région est égale à l'aire relative du cap d'une sphère n.

L'aire relative de ce n-cap est trouvée en intégrant l'aire d'un n-tronc :

2Pr(θθc)=211+tan(θc)21(1x2)n32B(12,n12)dx=11+tan(θc)21t0.5(1t)n32B(12,n12)dt=I11+tan(θc)2(12,n12)

Ix(,) est la fonction bêta incomplète régularisée supérieure.

Limite d'angle

Si θn,α passe à 90 degrés pour n puis tn1,α/2/n va à zéro.

Ou une déclaration inverse: pour tout angle inférieur à 90 degrés, la zone relative de cet angle sur une n-sphère, diminue à zéro lorsque n va à l'infini.

Intuitivement, cela signifie que toute l'aire d'une sphère n se concentre sur l'équateur en tant que dimension n augmente à l'infini.

Quantitativement, nous pouvons le montrer en utilisant l'expression

a1t0.5(1t)n32B(12,n12)dt<a1(1a)n32B(12,n12)dt=(1a)n12B(12,n12)=L(n)

and consider the difference between L(n+2) and L(n).

At some point the decrease in the denominator

B(12,x+1)B(12,x)=xx+12
will be taken over by the decrease in the numerator
(1a)n+12(1a)n12=1a
and the function L(n) decreases to zero for n to infinity.

1

We have

α2=tn1,α/2limn1(n1)πΓ(n2)Γ(n12)(1+r2n1)n/2dr=tn1,α/212πe12r2dr=1Φ(tn1,α/2)1[12+φ(tn1,α/2)(tn1,α/2+(tn1,α/2)33+(tn1,α/2)515+)]

which implies that the second term in the boxed brackets can be at most 12 since the maximum α can be is 1. Note that φ(x) is the pdf of normal distribution. This approximation is also based on this.

So

0<α1+2φ(tn1,α/2)(tn1,α/2+(tn1,α/2)33+(tn1,α/2)515+)<1

Welcome to the site, @guerhuerh. Please consider registering your account & becoming a regular member here (there is information in the My Account section of our help center). We'd love to have you. If you'd like, you can take our tour, which has information for new users.
gung - Reinstate Monica

2
This is an interesting approach, but it is unclear to me how you justify the first step (where you have added the limit operation inside the integral). This gives an implicit equation for tn1,α/2 that is false.
Ben - Reinstate Monica

@Ben: Wouldn't limnα2=α2?
PEV

@PEV: Yes, but then the right-hand-side should have the limit outside the integral, not inside it. Since the limits in the integral depend on n the right-hand-side is presently a function of n, so it is not equal to α/2.
Ben - Reinstate Monica

@PEV: I think the method could be modified by separating the integral into two parts, one which replaces the lower limit with zα/2 and one that gives the remainder. The former would then converge to what is already shown, and we would then have to show that the latter converges to zero. Like I said, I think this is an interesting approach. It might have merit as a method, and might be able to be altered to be correct, but it is presently incorrect.
Ben - Reinstate Monica
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.