J'ai une question concernant la classification en général. Soit f un classificateur, qui donne un ensemble de probabilités à partir de données D. Normalement, on dirait: si P (c | D)> 0.5, nous assignerons une classe 1, sinon 0 (que ce soit un binaire classification).
Ma question est la suivante: si je découvre que si je classe également 1, les probabilités sont supérieures à: c’est-à-dire 0,2, le classifieur donne de meilleurs résultats. Est-il légitime d'utiliser ensuite ce nouveau seuil lors de la classification?
J'interpréterais la nécessité d'une limite inférieure de classification dans le contexte des données émettant un signal plus petit; encore significatif pour le problème de la classification.
Je me rends compte que c’est une façon de le faire, mais si ce n’est pas une pensée juste, quelles seraient les transformations de données qui mettent l’accent sur les caractéristiques individuelles de la même manière, de sorte que le seuil puisse rester à 0,5?