Contrairement à d'autres réponses, je dirais que vous pouvez dire quelque chose sur les capacités de Bolts compte tenu des données disponibles. Tout d'abord, affinons votre question. Vous posez des questions sur les humains les plus rapides, mais comme il existe une différence dans les répartitions des vitesses de course pour les hommes et les femmes, où les meilleures femmes coureuses, les femmes semblent être légèrement plus lentes que les meilleurs hommes, nous devons nous concentrer sur les hommes coureurs. Pour obtenir des données, nous pouvons regarder les meilleures performances de l'année sur 100 courses des 45 dernières années . Il y a plusieurs choses à noter à propos de ces données:
- Ce sont les meilleurs temps de course, donc ils ne nous parlent pas des capacités de tous les humains, mais des vitesses minimales atteintes.
- Nous supposons que ces données reflètent un échantillon des meilleurs coureurs du monde. Même s'il se peut qu'il y ait eu de meilleurs coureurs qui n'ont pas participé aux championnats, cette hypothèse semble assez raisonnable.
Voyons d'abord comment ne pas analyser ces données. Vous pourriez remarquer que si nous traçons les temps de fonctionnement en fonction du temps, nous observerions une forte relation linéaire.
Cela pourrait vous amener à utiliser la régression linéaire pour prévoir combien de meilleurs coureurs nous pourrions observer au cours des prochaines années. Ce serait cependant une très mauvaise idée, qui vous conduirait inévitablement à la conclusion que dans environ deux mille ans, les humains seraient capables de courir 100 mètres en zéro seconde, et ensuite ils commenceraient à atteindre les temps de course négatifs! C'est évidemment absurde, car nous pouvons imaginer qu'il existe une sorte de limite biologique et physique de nos capacités, qui nous est inconnue.
X 1 , X 2 , … , X n Y i Z 1 , Z 2 , … , Z k - Z iOui= max ( X1, X2, … , Xn)X1, X2, … ,XnOuijeZ1, Z2, … , Zk- Zjesuivent une distribution GEV pour les minimas. Nous pouvons donc adapter la distribution GEV aux données de vitesse de fonctionnement, ce qui conduit à un ajustement assez agréable (voir ci-dessous).
Si vous regardez la distribution cumulative suggérée par le modèle, vous remarquerez que le meilleur temps de fonctionnement d'Usain Bolt est dans le le plus bas1 %queue de la distribution. Donc, si nous nous en tenons à ces données et à cette analyse d'exemples de jouets, nous conclurions que les durées de fonctionnement beaucoup plus petites sont peu probables (mais évidemment, possibles). Le problème évident de cette analyse est qu'elle ne tient pas compte du fait que nous avons constaté d'année en année des améliorations des meilleurs temps de fonctionnement. Cela nous ramène au problème décrit dans la première partie de la réponse, à savoir que l'hypothèse d'un modèle de régression ici est risquée. Une autre chose qui pourrait être améliorée est que nous pourrions utiliser l'approche bayésienne et supposer une information préalable qui expliquerait certaines connaissances hors données sur les temps de fonctionnement physiologiquement possibles, qui pourraient ne pas encore être observées (mais, pour autant que je sache, ceci est inconnu pour le moment). Enfin, une théorie similaire des valeurs extrêmes a déjà été utilisée dans la recherche sportive, par exemple par Einmahl et Magnus (2008) dans leRecords in Athletics Through Extreme-Value Theory paper.
Vous pourriez protester que vous n'avez pas posé de questions sur la probabilité d'un temps de course plus rapide, mais sur la probabilité d'observer un coureur plus rapide. Malheureusement, ici, nous ne pouvons pas faire grand-chose car nous ne savons pas quelle est la probabilité qu'un coureur devienne un athlète professionnel et les temps de course enregistrés seront disponibles pour lui. Cela ne se produit pas au hasard et de nombreux facteurs contribuent au fait que certains coureurs deviennent des athlètes professionnels et d'autres pas (ou même que quelqu'un aime courir et courir du tout). Pour cela, il faudrait disposer de données détaillées sur les coureurs à l'échelle de la population, de plus, puisque vous posez des questions sur les extrêmes de la distribution, les données devraient être très importantes. Donc là-dessus, je suis d'accord avec les autres réponses.