Introduction et notations:
Voici une version nouvelle et simple de mon algorithme qui semble se terminer (selon mes expériences), et maintenant je voudrais le prouver.
Soit la notation faire référence à un point de données dimensionnelles (un vecteur). J'ai trois ensembles A, B et C, tels que , , :
Étant donné , soit la distance euclidienne moyenne de à ses points les plus proches dans ; et représentent la distance euclidienne moyenne de à son points les plus proches en .
Algorithme:
J'ai l'algorithme suivant qui modifie de manière itérative les ensembles A et B en déplaçant certains éléments sélectionnés de A vers B et vice versa, et C reste toujours le même (ne change pas). Pour faire simple: le but de l'algorithme est de mieux séparer les ensembles et telle sorte que "les points de sont plus similaires à ceux d'un ensemble fixe connu " et "les points de sont finalement auto-similaires et plus éloigné de ceux de et du set final ":
- ... (1)
- ; ... (2)
- } ... (3)
- ; ... (4)
- Répétez (1), (2), (3) et (4) jusqu'à ce que: (aucun élément ne passe de à ou de à , c'est-à-dire A 'et B' deviennent vides) ou ( ou )
L'algorithme se termine dans deux cas:
- quandoudevient inférieur ou égal à| B | k
- ou le cas le plus standard, quand , ce qui signifie qu'aucun élément ne se déplace entre A et B.
Question:
Comment prouver que cet algorithme se termine finalement? Je n'ai pas trouvé de fonction potentielle pratique qui puisse être strictement minimisée ou maximisée par l'algorithme. J'ai essayé en vain certaines fonctions: la fonction mais elle n'augmente pas à chaque itération. La fonction mais elle ne diminue pas à chaque itération. La fonction ne semble pas diminuer à chaque itération. La fonction ∑ x ∈ A d A x + ∑ x ∈ B d C x ∑ x ∈ A d A x + ∑ x ∈ B d B x ∑ x ∈ A d B x + ∑ x ∈ B d A xne semble pas augmenter à chaque itération. Alors, quelle est la fonction potentielle pratique qui peut augmenter ou diminuer à chaque itération? Ou faut-il montrer que la fonction diminue mais pas à chaque itération (après quelques itérations plutôt)? Comment ?
Remarques:
- Les points les plus proches de dans un ensemble , signifie: les points (autres que ) dans , ayant la plus petite distance euclidienne à . Vous pouvez simplement prendre pour simplifier l'analyse.
- Je ne sais pas si cela peut aider ou non, mais j'ai la propriété suivante pour mes ensembles initiaux : initialement , si est le point le plus proche à et est le point le plus proche de puis toujours . Ce moyen intuitivement que les points en sont plus proches de que dans les points .
- Si cela facilite l'analyse: il est tout à fait possible d'envisager une version légèrement différente de l'algorithme où dès qu'un point de doit être déplacé vers , il est déplacé de vers (sans passer par ), et vis versa pour .