J'ai besoin de mettre en œuvre un programme qui classera les enregistrements en 2 catégories (vrai / faux) en fonction de certaines données de formation, et je me demandais quel algorithme / méthodologie je devrais examiner. Il semble y en avoir beaucoup parmi lesquels choisir - Réseau de neurones artificiels, algorithme génétique, apprentissage automatique, optimisation bayésienne, etc., etc., et je ne savais pas par où commencer. Donc, mes questions sont les suivantes: comment choisir un algorithme d'apprentissage à utiliser pour mon problème?
Si cela aide, voici le problème que je dois résoudre.
Les données de formation:
les données de formation se composent de plusieurs lignes comme celle-ci:
Precursor1, Precursor2, Boolean (true/false)
La course,
je vais recevoir un tas de précurseurs.
Alors,
- Je choisis un algorithme A parmi différents algorithmes (ou je génère dynamiquement un algorithme), je l'applique sur toutes les combinaisons possibles de ces précurseurs et je collecte les "enregistrements" qui sont émis. L'enregistrement se compose de plusieurs paires clé-valeur *.
J'applique un algorithme génial et classe ces enregistrements en 2 catégories (vrai / faux).
Je vais générer un tableau qui a le même format que les données du train:
Precursor1, Precursor2, Boolean
Et tout le programme est noté en fonction du nombre de vrais / faux que j'ai bien compris.
*: Les "enregistrements" ressembleront à ceci (j'espère que cela a du sens)
Record [1...*] Score
-Precursor1 -Key
-Precursor2 -Value
Il n'y a qu'un nombre fini de clés possibles. Les enregistrements contiennent différents sous-ensembles de ces clés (certains enregistrements ont key1, key2, key3 ... d'autres enregistrements ont key3, key4 ... etc.).
J'ai en fait besoin de 2 apprentissages. L'un est pour l'étape 1. J'ai besoin d'un module qui examine les paires de précurseurs, etc. et décide quel algorithme appliquer afin d'émettre un enregistrement pour la comparaison. Un autre est pour l'étape 2. J'ai besoin d'un module qui analyse la collection d'enregistrements et les classe dans les 2 catégories (vrai / faux).
Merci d'avance!