Je fais une estimation de la densité du noyau, avec un ensemble de points pondérés (c'est-à-dire que chaque échantillon a un poids qui n'est pas nécessaire), en N dimensions. De plus, ces échantillons sont juste dans un espace métrique (c'est-à-dire que nous pouvons définir une distance entre eux) mais rien d'autre. Par exemple, nous ne pouvons pas déterminer la moyenne des points d'échantillonnage, ni l'écart type, ni mettre à l'échelle une variable par rapport à une autre. Le noyau est juste affecté par cette distance et le poids de chaque échantillon:
Dans ce contexte, j'essaie de trouver une estimation robuste de la bande passante du noyau , pouvant varier spatialement, et de préférence qui donne une reconstruction exacte sur l'ensemble de données d'apprentissage . Si nécessaire, nous pourrions supposer que la fonction est relativement lisse.
J'ai essayé d'utiliser la distance jusqu'au premier ou au deuxième voisin le plus proche, mais cela donne de très mauvais résultats. J'ai essayé avec l'optimisation sans interruption, mais j'ai du mal à trouver une bonne mesure à optimiser dans ce contexte dans Nd, donc il trouve de très mauvaises estimations, en particulier pour les échantillons d'apprentissage eux-mêmes. Je ne peux pas utiliser l'estimation gourmande basée sur l'hypothèse normale car je ne peux pas calculer l'écart type. J'ai trouvé des références en utilisant des matrices de covariance pour obtenir des noyaux anisotropes, mais encore une fois, cela ne tiendrait pas dans cet espace ...
Quelqu'un a une idée ou une référence?