Fondamentalement, je veux convertir les mesures de similitude en poids qui sont utilisés comme prédicteurs. Les similitudes seront sur [0,1], et je limiterai les poids à également sur [0,1]. J'aimerais une fonction paramétrique qui effectue cette cartographie que j'optimiserai probablement en utilisant la descente de gradient. Les exigences sont que 0 correspond à 0, 1 correspond à 1 et il doit être strictement croissant. Un dérivé simple est également apprécié. Merci d'avance
Edit: Merci pour les réponses jusqu'à présent, celles-ci sont très utiles. Pour clarifier mon objectif, la tâche est la prédiction. Mes observations sont des vecteurs extrêmement clairsemés avec une seule dimension à prévoir. Mes dimensions d'entrée sont utilisées pour calculer la similitude. Ma prédiction est alors une somme pondérée de la valeur d'autres observations pour le prédicteur où le poids est fonction de la similitude. Je limite mes poids sur [0,1] pour plus de simplicité. Nous espérons maintenant clairement pourquoi j'ai besoin de 0 pour mapper sur 0, 1 pour mapper sur 1, et pour que cela augmente strictement. Comme l'a souligné whuber, l'utilisation de f (x) = x répond à ces exigences et fonctionne plutôt bien. Cependant, il n'a aucun paramètre à optimiser. J'ai beaucoup d'observations donc je peux tolérer beaucoup de paramètres. Je vais coder manuellement la descente du gradient, d'où ma préférence pour une dérivée simple.
Par exemple, la plupart des réponses données sont symétriques par rapport à 0,5. Il serait utile d'avoir un paramètre pour décaler vers la gauche / droite (comme avec la distribution bêta)