Quelle est la différence entre une fonction et une étiquette?


101

Je suis un tutoriel sur les bases de l'apprentissage automatique et il est mentionné que quelque chose peut être une fonctionnalité ou une étiquette .

D'après ce que je sais, une fonctionnalité est une propriété de données qui est utilisée. Je ne peux pas comprendre ce qu'est l'étiquette, je connais le sens du mot, mais je veux savoir ce que cela signifie dans le contexte de l'apprentissage automatique.


Les fonctionnalités sont les champs utilisés comme entrée et les étiquettes sont utilisées comme sortie. À titre d'exemple simple, considérez comment prédire si l'on doit vendre une voiture en fonction du kilométrage, de l'année, etc. Oui / non est l'étiquette alors que le kilométrage et l'année seraient les caractéristiques.
amcneil206 le

Réponses:


201

En bref, la fonction est entrée; l'étiquette est sortie. Cela s'applique à la fois aux problèmes de classification et de régression.

Une fonction est une colonne des données de votre jeu d'entrée. Par exemple, si vous essayez de prédire le type d'animal que quelqu'un choisira, vos caractéristiques d'entrée peuvent inclure l'âge, la région d'origine, le revenu familial, etc. L'étiquette est le choix final, tel que chien, poisson, iguane, rocher, etc.

Une fois que vous avez formé votre modèle, vous lui donnerez des ensembles de nouvelles entrées contenant ces fonctionnalités; il renverra le "label" (type d'animal de compagnie) prévu pour cette personne.


1
Ainsi, [l'âge, la région d'origine, le revenu familial] serait «3 vecteurs de caractéristiques». Et dans Keras, votre tableau NumPy pour votre réseau LSTM serait [échantillons, pas de temps, 3]?
naisanza

1
@naisanza: c'est certainement une possibilité. Je ne connais pas Keras, mais cette organisation de haut niveau pourrait certainement être le début d'une implémentation valide.
Prune

la caractéristique et la variable sont-elles la même chose?
Debadatta

Je voudrais dire que «l'étiquette» dépend également du contexte; par exemple, pour entraîner un modèle, vous utiliserez des données «étiquetées». Dans ce cas, l'étiquette est la vérité terrain à laquelle vos données de sortie sont comparées.
N.Atanasov

sensationnel. excellente réponse, merci cela clarifie beaucoup de questions persistantes sur cet espace de sujet.
Andrew Ray

31

Fonctionnalité:

Dans Machine Learning, la fonction signifie la propriété de vos données d'entraînement. Ou vous pouvez dire un nom de colonne dans votre ensemble de données d'entraînement.

Supposons qu'il s'agisse de votre ensemble de données d'entraînement

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

Alors voici Height, Sexet Agesont les fonctionnalités.

étiquette:

La sortie que vous obtenez de votre modèle après l'entraînement s'appelle une étiquette.

Supposons que vous ayez alimenté l'ensemble de données ci-dessus dans un algorithme et générez un modèle pour prédire le sexe en tant qu'homme ou femme, dans le modèle ci-dessus, vous transmettez des fonctionnalités telles que age, heightetc.

Ainsi, après le calcul, il renverra le sexe en tant qu'homme ou femme. Ça s'appelle une étiquette


5

Voici une approche plus visuelle pour expliquer le concept. Imaginez que vous vouliez classer l'animal montré sur une photo.

Les classes d'animaux possibles sont par exemple les chats ou les oiseaux. Dans ce cas, l' étiquette serait les associations de classe possibles, par exemple chat ou oiseau, que votre algorithme d'apprentissage automatique prédira.

Les caractéristiques sont des motifs, des couleurs, des formes qui font partie de vos images, par exemple des fourrures, des plumes ou une interprétation plus bas niveau, des valeurs de pixels.

Oiseau Étiquette: Oiseau
Caractéristiques: Plumes

Chat

Étiquette: Cat
Caractéristiques: Furr


5

Prenons un exemple où nous voulons détecter l'alphabet à l'aide de photos manuscrites. Nous alimentons ces exemples d'images dans le programme et le programme classe ces images en fonction des fonctionnalités qu'elles ont.

Un exemple de caractéristique dans ce contexte est: la lettre 'C'peut être considérée comme une concave tournée vers la droite.

Une question se pose maintenant de savoir comment stocker ces fonctionnalités. Nous devons les nommer. Voici le rôle du label qui voit le jour. Une étiquette est donnée à ces caractéristiques pour les distinguer des autres caractéristiques.

Ainsi, nous obtenons des étiquettes en sortie lorsque des fonctionnalités sont fournies en entrée .

Les libellés ne sont pas associés à un apprentissage non supervisé.


4

Prérequis: statistiques de base et exposition au ML (régression linéaire)

Il peut être répondu en une phrase -

Ils se ressemblent mais leur définition change selon les nécessités.

Explication

Laissez-moi vous expliquer ma déclaration. Supposons que vous ayez un ensemble de données, à cette fin, considérez exercise.csv. Chaque colonne de l'ensemble de données est appelée en tant qu'entité. Le sexe, l'âge, la taille, la fréquence cardiaque, la température corporelle et les calories peuvent figurer dans différentes colonnes. Chaque colonne représente des caractéristiques ou des propriétés distinctes.

exercice.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Pour solidifier la compréhension et résoudre le casse-tête, prenons deux problèmes différents (cas de prédiction).

CAS 1: Dans ce cas, nous pourrions envisager d'utiliser - Sexe, taille et poids pour prédire les calories brûlées pendant l'exercice. Cette prédiction (Y) Calories ici est une étiquette . Calories est la colonne que vous souhaitez prédire à l'aide de diverses fonctionnalités telles que - x1: sexe, x2: taille et x3: poids .

CAS2: Dans le second cas, nous pourrions vouloir prédire le Heart_rate en utilisant le sexe et le poids comme une caractéristique. Ici, Heart_Rate est une étiquette prédite à l'aide de caractéristiques - x1: Sexe et x2: Poids .

Une fois que vous avez compris l'explication ci-dessus, vous ne serez plus vraiment confondu avec les étiquettes et les fonctionnalités.


3

Une caractéristique brièvement expliquée serait l'entrée que vous avez fournie au système et l'étiquette serait la sortie que vous attendez. Par exemple, vous avez nourri de nombreuses caractéristiques d'un chien comme sa taille, la couleur de sa fourrure, etc., donc après calcul, il retournera la race du chien que vous souhaitez connaître.


0

Supposons que vous souhaitiez prédire le climat, les caractéristiques qui vous sont fournies seraient des données climatiques historiques, la météo actuelle, la température, la vitesse du vent, etc. et les étiquettes seraient des mois. La combinaison ci-dessus peut vous aider à dériver des prédictions.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.