Bayésien: "Bonjour, Apprenant Machine!"
Frequentist: "Bonjour, Apprenant Machine!"
Apprentissage automatique: "Je vous entends dire que vous êtes doués pour les choses. Voici quelques données."
F: "Oui, écrivons un modèle et calculons ensuite le MLE."
n−1n
F: "Ah oui, merci de me le rappeler. Je pense souvent que je suis censé utiliser le MLE pour tout, mais je m'intéresse aux estimateurs non biaisés , etc."
ML: "Euh, qu'est-ce que c'est que philosopher? Est-ce que ça m'aidera?"
÷(n−1)
ML: "Alors, qu'est-ce qui t'importe?"
F: "Evaluation".
ML: "J'aime le son de ça."
θθθ
ML: "Ça a l'air génial! On dirait que les fréquentants sont des gens pragmatiques. Vous jugez chaque boîte noire à ses résultats. L'évaluation est la clé."
F: "En effet! Je comprends que vous adoptiez une approche similaire. Validation croisée, ou quelque chose du genre? Mais cela me semble compliqué."
ML: "Messy?"
F: "L'idée de tester votre estimateur sur des données réelles me semble dangereuse. Les données empiriques que vous utilisez pourraient avoir toutes sortes de problèmes, et pourraient ne pas se comporter conformément au modèle sur lequel nous nous sommes mis d'accord pour l'évaluation."
θ
F: "Oui. Bien que votre méthode ait pu fonctionner sur un jeu de données (le jeu de données avec train et données de test) que vous avez utilisé dans votre évaluation, je peux prouver que la mienne fonctionnera toujours."
ML: "Pour tous les jeux de données?"
F: "Non"
ML: "Donc ma méthode a été validée par recoupement sur un jeu de données. Vous n'avez pas testé la vôtre sur un jeu de données réel?"
F: "C'est vrai."
ML: "Cela me donne l'avantage! Ma méthode est meilleure que la vôtre. Elle prédit le cancer 90% du temps. Votre" preuve "n'est valide que si l'ensemble du jeu de données se comporte conformément au modèle que vous avez supposé."
F: "Euh, oui, je suppose."
θ
F: "C'est vrai. À moins que les données soient vraiment normales (ou autre), ma preuve est inutile."
ML: "Alors, mon évaluation est plus fiable et plus complète? Elle ne fonctionne que sur les jeux de données que j'ai essayés jusqu'à présent, mais au moins, ce sont de vrais jeux de données, des verrues, etc. 'et' approfondie 'et que vous étiez intéressé par la vérification des modèles et autres. "
B: (interjectant) "Hé les gars, désolé de vous interrompre. J'aimerais beaucoup faire le bilan, en montrant peut-être d'autres problèmes, mais j'aime vraiment regarder mon collègue fréquentiste se tortiller."
F: "Woah!"
ML: "OK, les enfants. Tout était une question d'évaluation. Un estimateur est une boîte noire. Des données sont introduites, des données sont générées. Nous approuvons ou désapprouvons un estimateur basé sur ses performances en cours d'évaluation. sur la «recette» ou «principes de conception» qui sont utilisés. "
F: "Oui. Mais nous avons des idées très différentes sur les évaluations qui sont importantes. ML formera et testera des données réelles. Tandis que je ferai une évaluation plus générale (car elle implique une preuve applicable à grande échelle) et également plus limité (parce que je ne sais pas si votre jeu de données est réellement tiré des hypothèses de modélisation que j'utilise lors de la conception de mon évaluation.) "
ML: "Quelle évaluation utilisez-vous, B?"
F: (intercepte) "Hé. Ne me fais pas rire. Il n'évalue rien. Il utilise simplement ses croyances subjectives et les utilise. Ou quelque chose."
B: "C'est l'interprétation courante. Mais il est également possible de définir le bayésianisme en fonction des évaluations préférées. Ensuite, nous pouvons utiliser l'idée qu'aucun d'entre nous ne se soucie de ce qu'il y a dans la boîte noire, nous nous soucions uniquement des différentes manières d'évaluer."
B poursuit: "Exemple classique: test médical. Le résultat du test sanguin est positif ou négatif. Un fréquentiste s'intéressera aux personnes en bonne santé, quelle proportion aura un résultat négatif. De même, quelle sera la proportion de malades obtenez un résultat positif. Le fréquentiste calculera ces résultats pour chaque méthode d'analyse de sang à l'étude, puis recommandera d'utiliser le test présentant la meilleure paire de scores. "
F: "Exactement. Que voulez-vous de plus?"
B: "Qu'en est-il des personnes qui ont obtenu un résultat de test positif? Elles voudront savoir 'de celles qui obtiennent un résultat positif, combien vont tomber malades?' et 'parmi ceux qui obtiennent un résultat négatif, combien sont en bonne santé?' "
ML: "Ah oui, cela semble être une meilleure paire de questions à poser."
F: "Hérésie!"
B: "Nous y revoilà. Il n'aime pas où cela va."
ML: "Il s'agit de 'priors', n'est-ce pas?"
F: "EVIL".
B: «En tout cas, oui, vous avez raison ML. Pour calculer la proportion de malades ayant un résultat positif, vous devez effectuer l'une des deux choses suivantes. Une option consiste à exécuter les tests sur un grand nombre de personnes et à simplement observer les paramètres suivants: Par exemple, combien de personnes meurent-elles de la maladie? "
ML: "Cela ressemble à ce que je fais. Utilise train-and-test."
B: "Mais vous pouvez calculer ces chiffres à l'avance, si vous êtes prêt à faire une hypothèse sur le taux de maladie dans la population. Le fréquentiste fait aussi ses calculs à l'avance, mais sans utiliser ce taux de maladie au niveau de la population."
F: "HYPOTHÈSES PLUS NON FONDÉES."
B: "Oh, tais-toi. Plus tôt, on t'a découvert. ML a découvert que tu aimais les hypothèses non fondées autant que quiconque. Tes probabilités de couverture« prouvées »ne se concrétiseront dans le monde réel que si toutes tes hypothèses sont respectées. Pourquoi mes hypothèses précédentes sont-elles si différentes? Vous me traitez de fou, mais vous prétendez que vos hypothèses sont le travail d’une analyse conservatrice, solide et sans hypothèse. "
B (continue): "Quoi qu'il en soit, ML, comme je le disais. Les Bayésiens aiment un type d'évaluation différent. Nous sommes plus intéressés par le conditionnement des données observées et le calcul de la précision de notre estimateur en conséquence. Nous ne pouvons pas effectuer cette évaluation sans utiliser Mais ce qui est intéressant, c’est que, une fois que nous avons choisi cette forme d’évaluation et une fois notre choix effectué, nous avons une "recette" automatique pour créer un estimateur approprié. Le fréquentiste ne dispose pas de cette recette. estimateur non biaisé pour un modèle complexe, il n’a aucun moyen automatisé de construire un estimateur approprié. "
ML: "Et vous faites? Vous pouvez automatiquement construire un estimateur?"
B: "Oui. Je n'ai pas de moyen automatique de créer un estimateur non biaisé, car je pense que le biais est un mauvais moyen d'évaluer un estimateur. Mais étant donné l'estimation basée sur les données conditionnelles que j'aime bien, et le peut connecter le prior et la probabilité de me donner l'estimateur ".
ML: "Alors bref, récapitulons. Nous avons tous différentes manières d'évaluer nos méthodes et nous ne serons probablement jamais d'accord sur les meilleures méthodes."
B: "Bien, ce n'est pas juste. Nous pourrions les mélanger et les assortir. Si l'un d'entre nous a de bonnes données d'entraînement étiquetées, nous devrions probablement tester ces données. Et en général, nous devrions tous tester autant d'hypothèses que possible. Et certains "les preuves peuvent aussi être amusantes, prédire les performances sous un modèle présumé de génération de données".
F: "Ouais les gars. Soyons pragmatiques à propos de l'évaluation. Et en fait, je cesserai de m'obséder à propos des propriétés des échantillons infinis. J'ai demandé aux scientifiques de me donner un échantillon infini, mais ils ne l'ont toujours pas fait. temps pour moi de me concentrer à nouveau sur des échantillons finis ".
ML: "Donc, nous n'avons qu'une dernière question. Nous avons beaucoup discuté de la façon d' évaluer nos méthodes, mais comment créons- nous nos méthodes."
B: "Ah. Comme je le savais plus tôt, nous Bayésiens avons la méthode générale la plus puissante. C'est peut-être compliqué, mais nous pouvons toujours écrire une sorte d'algorithme (peut-être une forme naïve de MCMC) qui sera échantillonné à partir de notre postérieur. "
F (intervient): "Mais ça pourrait avoir un parti pris."
B: "Alors, vos méthodes pourraient bien. Dois-je vous rappeler que le MLE est souvent biaisé? Parfois, vous avez de grandes difficultés à trouver des estimateurs non biaisés, et même lorsque vous avez un estimateur stupide (pour un modèle très complexe) qui dit: la variance est négative. Et vous appelez cela impartial. Sans parti pris, oui. Mais utile, non! "
ML: "OK les gars. Vous vous déchainez encore une fois. Laissez-moi vous poser une question, F. Avez-vous déjà comparé le biais de votre méthode avec celui de la méthode de B, alors que vous avez tous les deux travaillé sur le même problème?"
F: "Oui. En fait, je déteste l'admettre, mais l'approche de B a parfois un biais et un MSE plus bas que mon estimateur!"
ML: "La leçon à tirer est que, même si nous sommes un peu en désaccord sur l’évaluation, aucun d’entre nous n’a le monopole de la création d’estimateur ayant les propriétés que nous voulons."
B: "Oui, nous devrions lire un peu plus le travail de chacun. Nous pouvons nous inspirer les uns les autres pour les estimateurs. Nous pourrions constater que les estimateurs des autres fonctionnent très bien, immédiatement, sur nos propres problèmes."
F: "Et je devrais cesser d’être obsédé par les biais. Un estimateur non biaisé pourrait avoir une variance ridicule. Je suppose que nous devons tous" assumer la responsabilité "des choix que nous faisons dans notre évaluation et des propriétés que nous souhaitons voir dans nos estimateurs. Nous ne pouvons pas nous arrêter derrière une philosophie. Essayez toutes les évaluations possibles. Et je continuerai à jeter un coup d’œil à la littérature bayésienne pour trouver de nouvelles idées pour les estimateurs! "
B: "En fait, beaucoup de gens ne savent pas vraiment quelle est leur propre philosophie. Je ne suis même pas sûr de moi-même. Si j'utilise une recette bayésienne, puis que je prouve un bon résultat théorique, ne Un fréquentiste se soucie des preuves ci-dessus concernant la performance, il se fiche des recettes. Et si je fais des tests et des formations à la place (ou aussi), cela signifie-t-il que je suis un apprenant en machine? "
ML: "On dirait que nous sommes tous assez semblables alors."