Mon expérience est principalement dans l'apprentissage automatique et j'essayais de comprendre ce que signifiait le test d'hypothèse bayésienne. Je suis d'accord avec l'interprétation bayésienne de la probabilité et je la connais dans le contexte des modèles graphiques probabilistes. Cependant, ce qui m'embrouille, c'est ce que le mot «hypothèse» signifie dans le contexte de l'inférence statistique.
Je pense que je suis surtout confus au sujet du vocabulaire auquel je suis habitué dans l'apprentissage automatique par rapport à ce qui est normalement utilisé dans les statistiques et l'inférence.
Dans le contexte de l' apprentissage supervisé , je pense que normalement de l'hypothèse que la fonction prédictive qui associe des exemples à ses étiquettes -à- dire . Cependant, il me semble que le terme hypothèse, dans les lectures que je fais, n'a pas le même sens. Permettez-moi de coller un extrait des lectures que je lis:

Si vous lisez attentivement, cela dit aussi:
il existe un modèle différent pour les données observées ...
étaient-ils utiliser le mot modèle. Pour moi, le mot modèle me fait penser à un ensemble de fonctions où nous sélectionnons une fonction prédictive spécifique. c'est-à-dire une classe d'hypothèses de fonction. Par exemple, pourrait être la classe d'hypothèses des fonctions quadratiques (polynôme de degré 2). Cependant, il me semble qu'ils utilisent le mot modèle et l'hypothèse comme synonymes dans cet extrait (où pour moi ce sont des mots complètement différents).
Ensuite, il mentionne que nous pouvons mettre des prieurs à l'hypothèse (une chose tout à fait raisonnable à faire dans un cadre bayésien):
on peut aussi caractériser les données avec une hypothèse courante:
et mettre à jour nos opinions actuelles compte tenu de certaines données (et de la règle de Baye):
Cependant, je suppose que je suis plus habitué à mettre une estimation bayésienne à un paramètre particulier (disons ) à partir d'une classe d'hypothèses plutôt qu'à l'ensemble de la classe d'hypothèses. Fondamentalement, car il semble que ces "hypothèses" ne soient pas les mêmes hypothèses du contexte d'apprentissage automatique auxquelles je suis habitué, il me semble que ces hypothèses sont plus similaires à un paramètre θ spécifique qu'à une classe d'hypothèses.
À ce stade, j'étais convaincu que «hypothèse» signifiait la même chose que dans la fonction prédictive (paramétrisée par un paramètre , par exemple), mais je pense que j'avais tort ...
Pour aggraver ma confusion, plus tard, cette même lecture est allée de l'avant pour spécifier une "hypothèse" particulière à chaque exemple de formation qu'ils ont observé. Permettez-moi de coller un extrait de ce que je veux dire:

la raison pour laquelle cela m'embrouille est que, si j'interprète l'hypothèse comme un paramètre, alors pour moi, cela n'a aucun sens de spécifier un paramètre spécifique pour chaque valeur d'échantillon que nous voyons. À ce stade, j'ai conclu que je ne savais vraiment pas ce qu'ils voulaient dire par hypothèse, alors j'ai posé cette question.
Cependant, je n'ai pas complètement abandonné, j'ai recherché ce que signifie l'hypothèse dans les statistiques fréquentistes et j'ai trouvé la vidéo suivante de l' académie khan . Cette vidéo a beaucoup de sens pour moi (peut-être êtes-vous un fréquentateur! :) . Cependant, il semble qu'ils obtiennent un tas de données (comme un "ensemble d'échantillons") et en fonction des propriétés de l'ensemble d'échantillons, ils décident d'accepter ou de rejeter l'hypothèse nulle sur les données. Cependant, dans le contexte bayésien que je lis, il me semble que pour chaque vecteur de données [point] observé, ils le "marquent" avec une hypothèse avec le "test du rapport de vraisemblance":

La façon dont ils attribuent des hypothèses à chaque échantillon de données, semble même être un cadre d'apprentissage supervisé où nous attachons une étiquette à chaque ensemble de formation. Cependant, je ne pense pas que ce soit ce qu'ils font dans ce contexte. Que font-ils? Que signifie attribuer une hypothèse à chaque échantillon de données? Quelle est la signification d'une hypothèse? Que signifie le mot modèle?
Fondamentalement, après cette longue explication de ma confusion, quelqu'un sait-il ce que signifie le test d'hypothèse bayésienne dans ce contexte?
Si vous avez besoin d'éclaircissements ou de quoi que ce soit pour améliorer ma question ou pour que la question ait un sens, je suis plus qu'heureux de vous aider :)
Dans ma recherche d'une réponse, j'ai trouvé des choses utiles liées aux tests d'hypothèses statistiques:
Celui-ci adresse une bonne introduction au sujet si vous venez d'un arrière-plan CS (comme moi):
Qu'est-ce qu'une bonne introduction aux tests d'hypothèses statistiques pour les informaticiens?
À un moment donné, j'ai posé des questions sur les "paramètres par défaut" (que j'aurais dû définir ce que je voulais dire. Je pensais que c'était un terme standard mais ce n'est pas le cas, alors je vais y répondre) et je pense que ce que je voulais vraiment dire, c'est comment faire vous spécifiez des paramètres pour chaque hypothèse que vous avez. Par exemple, comment décidez-vous de votre hypothèse nulle et de ses paramètres. Il y a une question à ce sujet:
Comment spécifier l'hypothèse nulle dans le test d'hypothèse
