Le théorème de Mercer fonctionne-t-il à l'envers?
Pas dans tous les cas.
Wikipedia: "En mathématiques, en particulier l'analyse fonctionnelle, le théorème de Mercer est une représentation d'une fonction symétrique définie positive sur un carré comme la somme d'une séquence convergente de fonctions de produit. Ce théorème, présenté dans (Mercer 1909), est l'un des résultats les plus notables des travaux de James Mercer. C'est un outil théorique important dans la théorie des équations intégrales; il est utilisé dans la théorie de l'espace de Hilbert des processus stochastiques, par exemple le théorème de Karhunen – Loève; et il est également utilisé pour caractériser un noyau semi-défini positif symétrique.
C'est une « cartographie plusieurs à un » sur un espace de Hilbert . - une simplification grossière excessive serait de le décrire comme un hachage ou une somme de contrôle que vous pouvez tester par rapport à un fichier pour déterminer l'identité ou non.
Explication plus technique: Théorème de désintégration
"En mathématiques, le théorème de désintégration est un résultat de la théorie des mesures et de la théorie des probabilités. Il définit rigoureusement l'idée d'une " restriction "non triviale d'une mesure à un sous-ensemble de mesure zéro de l'espace de mesure en question. Il est lié à la l'existence de mesures de probabilité conditionnelles. En un sens, la "désintégration" est le processus opposé à la construction d'une mesure de produit ".
Voir aussi: " Le théorème de Fubini – Tonelli ", " Hinge Loss ", " Loss Function " et " How Good Is a Kernel When Used as a Similarity Measure? " (Juin 2007) par Nathan Srebro, le résumé:
" Résumé. Récemment, Balcan et Blum ont suggéré une théorie de l'apprentissage basée sur des fonctions de similitude générales, au lieu de noyaux semi-définis positifs. Nous étudions l'écart entre les garanties d'apprentissage basées sur l'apprentissage basé sur le noyau, et celles qui peuvent être obtenues en utilisant le noyau en tant que fonction de similitude, qui a été laissée ouverte par Balcan et Blum. Nous fournissons une limite considérablement améliorée sur la qualité d'une fonction de noyau lorsqu'elle est utilisée comme fonction de similitude, et étendons également le résultat à la perte de charnière la plus pertinente. puis un taux d'erreur de zéro. De plus, nous montrons que cette limite est étroite, et établissons donc qu'il existe en fait un véritable écart entre la notion traditionnelle de marge basée sur le noyau et la nouvelle notion basée sur la similarité. ".
Un collègue a une fonction et pour nous c'est une boîte noire.s
Voir: noyaux et similitude (en R)
C'est une boîte noire, donc vous ne savez pas avec certitude quel noyau est utilisé, s'il est basé sur le noyau, et vous ne connaissez pas les détails de la mise en œuvre du noyau une fois que vous pensez que vous savez lequel il est. Voir: L' équation de rbfKernel dans kernlab est différente de la norme? .
D'un autre côté, cela semble un peu fou.
Il est rapide et efficace, dans un ensemble restreint de circonstances. Comme un marteau, si vous portez un marteau avec vous, les gens vous traiteront-ils de fou?
" Les méthodes du noyau doivent leur nom à l'utilisation des fonctions du noyau, qui leur permettent de fonctionner dans un espace caractéristique implicite de grande dimension sans jamais calculer les coordonnées des données dans cet espace, mais plutôt en calculant simplement les produits internes entre les images de toutes les paires de données dans l'espace d'entités. Cette opération est souvent moins coûteuse en termes de calcul que le calcul explicite des coordonnées. Cette approche est appelée "astuce du noyau". Les fonctions du noyau ont été introduites pour les données de séquence, les graphiques, le texte, les images, comme ainsi que des vecteurs. ".
Leçon: vous obtenez (parfois) ce que vous payez.
Donc, ma question est "Existe-t-il un tel que pour une métrique de distance étant donné ces propriétés sur , et quel est ce ?"f ( s ( a , b ) ) = d ( a , b ) d s fff(s(a,b))=d(a,b)dsf
Beaucoup, voir les liens ci-dessus, " Fonctions du noyau populaires ", RBF , et voici un exemple (coûteux): " Une mesure de distance du rapport de vraisemblance pour la similitude entre la transformation de Fourier des séries chronologiques " (2005), par Janacek, Bagnall et Powell.
Si n'existe pas dans ces circonstances générales sur , existe-t-il un ensemble supplémentaire d'exigences pour lesquelles existe?s ffsf
Différents espaces et méthodes peuvent mieux cibler la comparaison (et la désintégration) de problèmes spécifiques, il existe de nombreuses méthodes pour l'espace Hilbert seul.
Oui, la liste est grande, voir les liens ci-dessus et (pour un exemple): Reproduire l'espace Hilbert du noyau .