Définition d'un modèle en machine learning


11

Cette définition ne s'applique pas tout à fait car nous ne supposons pas toujours une distribution sous-jacente. Alors qu'est-ce qu'un modèle vraiment? Un GBM avec des hyperparamètres spécifiés peut-il être considéré comme un modèle? Un modèle est-il un ensemble de règles?


1
Vous pouvez simplement faire un pas de plus vers le générique et regarder en.wikipedia.org/wiki/Mathematical_model - la plupart des modèles ML correspondront à cette définition, même s'ils ne correspondent pas au "modèle statistique" (bien que je pense que presque tous les entraînés sans supervision ou les modèles ML supervisés seraient considérés comme des modèles statistiques).
Neil Slater

Réponses:


7

Je me suis intéressé récemment à la même question et j'ai réalisé qu'il n'y avait pas de définition unique d'un "modèle" dans l'apprentissage automatique. Cela dépend fortement des sources que vous consultez, qui peuvent être la documentation d'un logiciel particulier, l'argot adopté par sa communauté d'utilisateurs ou les définitions utilisées dans les articles universitaires publiés, qui peuvent varier considérablement d'une revue à l'autre. De plus, j'ai dû apprendre à garder à l'esprit que ces articles sont rédigés non seulement par des spécialistes de l'apprentissage automatique, mais par des experts d'autres disciplines qui ont besoin d'appliquer des techniques d'apprentissage automatique (comme l'imagerie, divers domaines médicaux, etc.) . Beaucoup d'entre eux ne définissent pas explicitement le terme «modèle», qui est souvent utilisé de façon lâche. Voici quelques définitions différentes du "modèle" I '

• Modèles statistiques, en particulier les statistiques liées aux distributions de probabilité.

• Données de régression et statistiques connexes.

• Modèles mathématiques comme mentionné ci-dessus par Neil Slater.

• Les modèles de données utilisés dans l'apprentissage automatique, tels que les colonnes concernées, leurs types de données, les sources de données et autres métadonnées. C'est particulièrement délicat car il n'y a rien de mathématique dans cette définition, contrairement aux trois premiers que j'ai énumérés. Pour un exemple, consultez toute la documentation des «modèles d'exploration de données» SQL Server, qui remplissent une double fonction à des fins d'apprentissage automatique.

• Parfois, toutes les définitions ci-dessus sont étendues pour inclure des structures d'apprentissage automatique construites au-dessus des équations et des métadonnées, telles que les spécifications des réseaux neuronaux. Dans d'autres cas, ceux-ci sont considérés comme des entités distinctes.

Tous ces éléments sont parfois mélangés et appariés, selon la source. Je suis sûr qu'il existe d'autres définitions de «modèle» que j'ai laissées de côté, ce qui compliquera encore la question. Pour faire face à cette ambiguïté, j'essaie de m'entraîner à deviner les intentions de l'auteur chaque fois qu'il utilise le terme «modèle». Parfois, il est facile de déterminer en fonction du contexte ou du domaine dans lequel l'auteur travaille, mais d'autres fois, je dois lire en profondeur un article ou une documentation avant de le comprendre. J'aimerais pouvoir être plus précis à ce sujet, mais c'est vraiment un terme naturellement flou; il n'y aura jamais de réponse simple à tous. J'espère que ça aide.


1
Bien que le terme "modèle" puisse en effet s'appliquer à de nombreuses choses, dans le contexte de l'apprentissage automatique, le modèle est l'artefact créé par l'apprentissage / la formation - par exemple, dans le cas des réseaux de neurones, les poids et les biais de ce réseau.
Syzygy

5

J'aime la définition du Machine Learning donnée par Tom Mitchell .

On dit qu'un programme informatique tire des leçons de l' expérience E en ce qui concerne une certaine classe de tâches T et une mesure de performance P si sa performance aux tâches en T, telle que mesurée par P, s'améliore avec l'expérience E.

Donc, étant donné cette définition, je dois dire qu'un modèle est l'expérience acquise après avoir fait de la classe T.


L'expérience n'est-elle pas l'ensemble de formation?
Itamar Mushkin

4

Extrait d'un article sur Amazon Machine Learning

Le processus de formation d'un modèle ML implique de fournir un algorithme ML (c'est-à-dire l'algorithme d'apprentissage) avec des données de formation pour apprendre. The term ML model refers to the model artifact that is created by the training process.


2

Un modèle, en gros, est une simplification d'une chose ou d'un processus. Par exemple, la forme de la Terre n'est pas réellement une sphère, mais nous pourrions la traiter comme une seule si nous concevons un globe. De même, en supposant que l'univers est déterministe, il existe un processus naturel qui détermine si un client achètera un produit sur un site Web. Nous pourrions construire quelque chose qui se rapproche de ce processus, que nous pourrions donner des informations sur un client et qui nous dit s'il pense que le client achètera un produit.

Un "modèle d'apprentissage automatique" est donc un modèle construit par un système d'apprentissage automatique.

(Je m'excuse de ne pas être une réponse rigoureuse, mais j'espère que cela sera toujours utile.)


1

Dans le paradigme d'apprentissage automatique, le modèle se réfère à une expression mathématique des paramètres du modèle ainsi que des espaces réservés d'entrée pour chaque prédiction, classe et action pour les catégories de régression, de classification et de renforcement respectivement.

Cette expression est intégrée dans le neurone unique en tant que modèle.

Pour le perceptron monocouche et le modèle d'apprentissage en profondeur, il faut extraire ce modèle en parcourant soigneusement les neurones et les couches pour collecter et assembler la fonction d'activation de manière ordonnée.


0

Dans l'apprentissage automatique, le modèle est le centre de gravité et tout tourne autour du modèle. Bien que différentes personnes aient des définitions différentes du modèle. Mais à mon avis, voici que nous pouvons mieux définir le modèle "le modèle dans l'apprentissage automatique est l'hypothèse qui tente d'ajuster les données et d'apprendre à prédire les données invisibles".

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.