Quel est le nom de l'opérateur qui prend un vecteur catégorique et le transforme en représentation binaire en utilisant un codage à chaud? Je me demande depuis que j'écris un article scientifique et j'ai besoin d'un nom propre pour cela.
Quel est le nom de l'opérateur qui prend un vecteur catégorique et le transforme en représentation binaire en utilisant un codage à chaud? Je me demande depuis que j'écris un article scientifique et j'ai besoin d'un nom propre pour cela.
Réponses:
Les statisticiens appellent le codage à chaud comme codage factice . Comme d'autres l'ont suggéré (y compris Scortchi dans les commentaires), ce n'est pas un synonyme exact, mais c'est le terme qui serait généralement utilisé pour les variables catégorielles codées 0-1.
Voir aussi: "Variable fictive" versus "variable indicatrice" pour les données nominales / catégorielles
Cela dépend de votre public cible.
Comme l'a dit Tim , les statisticiens appellent cela un codage factice, et c'est ce que je m'attendrais à voir en décrivant quelque chose comme un modèle de régression. "Des variables codées factices ont été incluses pour s'adapter à l'emplacement du magasin." Je pense que l'appeler un encodage à chaud semble un peu étrange ici.
Cependant, comme un autre Tim l'a également dit, l'encodage à chaud est assez courant dans la littérature sur l'apprentissage automatique. Cela implique à peine l'existence de nœuds (comme dans un réseau neuronal), de fils physiques (dans un appareil), ou quelque chose comme ça, du moins pour moi.
Le terme vient de l'ingénierie électronique. Pensez simplement à qui appellerait 1 "chaud"? Seuls ceux qui travaillent avec l'électricité, où "chaud" ou "vivant" signifie qu'il y a un potentiel électrique sur le fil . "Un chaud" se réfère à la conception du circuit où le niveau de signal électrique discret sur un fil serait décodé en chaud / froid sur un ensemble de fils. Je suppose que certaines personnes en apprentissage automatique avec une expérience en EE ont trouvé l'analogie convaincante.
En économétrie et des statistiques que vous pouvez rencontrer dummy
ou indicator
variables, qui sont assez similaires car ceux - ci sont utilisés pour représenter des catégories distinctes avec leurs indicateurs distincts. Il y a cependant une différence subtile. Par exemple, vous créez des variables factices K-1 pour les catégories K, car la catégorie de base correspond à toutes les variables muettes définies sur 0. En revanche, je pense que dans un encodage à chaud, vous avez K fils, où la catégorie de base aura son propre fil ( variable).
Je suis statistiquement formé et j'ai récemment entendu parler de "l'encodage à chaud" en apprentissage automatique / sci lit. Je viens généralement de désigner la matrice à un point comme une matrice de conception / matrice de données / cadre de conception.
En sciences physiques et en génie, on l'appelle le delta (généralisé) de Kronecker .
Le delta de Kronecker est vraiment utile dans Sigma / Pi / Einstein / etc. notations car il permet de spécifier les termes de manière conditionnelle.
Juste pour relier cela aux structures de programmation communes, le delta de Kronecker condition?1:0
, où se ?:
trouve l' opérateur conditionnel .