Lorsque j'ai lu comment configurer vos données, une chose que j'ai souvent rencontrée est que la transformation de certaines données continues en données catégoriques n'est pas une bonne idée, car vous pourriez très bien tirer une mauvaise conclusion si les seuils sont mal déterminés.
Cependant, j'ai actuellement des données (valeurs PSA pour les patients atteints de cancer de la prostate), où je pense que le consensus commun est que si vous avez moins de 4 ans, vous ne les avez probablement pas, si vous êtes au-dessus, vous êtes à risque, puis quelque chose comme au-dessus de 10 et 20, vous l'avez probablement. Quelque chose comme ca. Dans ce cas, serait-il toujours incorrect de classer mes valeurs PSA continues en groupes de disons 0-4, 4-10 et> 10? Ou est-ce en fait correct puisque les seuils sont "bien déterminés" pour ainsi dire.