J'espère que cette question est la plus appropriée sur ce site ...
En Python, le nom de classe est généralement défini en utilisant la majuscule comme premier caractère, par exemple
class Vehicle:
...
Cependant, dans le domaine de l'apprentissage automatique, les données d'entraînement et de test sont souvent définies comme X
et Y
- pas x
et y
. Par exemple, je lis maintenant ce tutoriel sur Keras , mais il utilise le X
et Y
ses variables:
from sklearn import datasets
mnist = datasets.load_digits()
X = mnist.data
Y = mnist.target
Pourquoi sont-ils définis comme des majuscules? Existe-t-il une convention (au moins en Python) dans le domaine de l'apprentissage automatique selon laquelle il est préférable d'utiliser la lettre majuscule pour définir ces variables?
Ou peut-être que les gens distinguent les variables majuscules des minuscules dans l'apprentissage automatique?
En fait, le même didacticiel distingue plus tard ces variables comme suit:
from sklearn.cross_validation import train_test_split
train_X, test_X, train_y, test_y = train_test_split(X, Y, train_size=0.7, random_state=0)