Je construis un réseau neuronal pour prédire la valeur d'une œuvre d'art avec un large éventail d'entrées (taille, support artistique, etc.) et je voudrais également inclure l'auteur en tant qu'entrée (c'est souvent un énorme facteur de la valeur d’une seule œuvre d’art).
Ma préoccupation actuelle est que le nom de l'auteur n'est pas une entrée numérique idéale pour un NN (c'est-à-dire si je code simplement chaque auteur avec une valeur entière croissante, j'attribuerai indirectement plus de valeur aux auteurs plus bas dans la liste -_-) . Mes pensées étaient de créer des entrées distinctes pour tous les auteurs de mon ensemble de données, puis d'utiliser simplement un encodage à chaud pour mieux représenter l'entrée dans le NN.
Cette approche se heurte cependant à un problème lorsqu'un auteur qui n'est pas inclus dans mes données de formation est utilisé comme entrée dans le NN (c'est-à-dire un nouvel auteur). Je peux contourner cela avec un champ de saisie "autre auteur" mais je crains que ce ne soit pas exact car je n'aurais pas formé le NN pour cette entrée (toutes les œuvres d'art avec une évaluation ont un auteur).
Je n'ai pas complètement réfléchi à cela, mais j'ai pensé à peut-être former 2 NN, un pour une évaluation sans auteur et un pour une évaluation avec un auteur pour m'assurer d'avoir suffisamment de données de formation pour qu'une "évaluation sans auteur" soit toujours raisonnablement précise.
J'essaie toujours de conceptualiser la meilleure architecture NN avant de rester coincé dans la mise en œuvre, donc si quelqu'un a des suggestions / commentaires, je serais très reconnaissant!
Merci d'avance, Vince
PS Je fais cela comme une petite compétition avec un ami pour tester un NN par rapport aux techniques traditionnelles d'évaluation commerciale. S'il vous plaît, aidez-moi à gagner une victoire en informatique par rapport à l'actuariat.