Assez nouveau pour Python mais construisant mon premier modèle RF basé sur certaines données de classification. J'ai converti toutes les étiquettes en données numériques int64 et chargé dans X et Y en tant que tableau numpy, mais je rencontre une erreur lorsque j'essaie de former les modèles. Voici à quoi …
Dans ce lien sur la stationnarité et la différenciation , il a été mentionné que les modèles comme ARIMA nécessitent une série chronologique stationnaire pour la prévision car ses propriétés statistiques comme la moyenne, la variance, l'autocorrélation, etc. sont constantes dans le temps. Étant donné que les RNN ont une …
Je suis nouveau sur pytorch et j'ai commencé avec ce code github. Je ne comprends pas le commentaire de la ligne 60-61 du code "because weights have requires_grad=True, but we don't need to track this in autograd". J'ai compris que nous mentionnons requires_grad=Trueles variables dont nous avons besoin pour calculer …
Je veux calculer la précision, le rappel et le score F1 pour mon modèle binaire KerasClassifier, mais je ne trouve aucune solution. Voici mon code actuel: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() …
J'avais l'habitude d'appliquer la validation croisée K-fold pour une évaluation robuste de mes modèles d'apprentissage automatique. Mais je suis également conscient de l'existence de la méthode d'amorçage à cet effet. Cependant, je ne vois pas la principale différence entre eux en termes d'estimation des performances. Pour autant que je vois, …
Je parcourais la documentation officielle de scikit-learn learn après avoir parcouru un livre sur ML et suis tombé sur la chose suivante: Dans la documentation, il est donné à propos sklearn.preprocessing.OrdinalEncoder()alors que dans le livre, il a été donné sklearn.preprocessing.LabelEncoder(), lorsque j'ai vérifié leur fonctionnalité, il me semblait la même …
Lors de la lecture de cet article , une ligne indique que "les classificateurs linéaires ne partagent pas les paramètres entre les fonctionnalités et les classes". Quelle est la signification de cette déclaration? Cela signifie-t-il que les classificateurs linéaires tels que la régression logistique ont besoin de caractéristiques qui sont …
Vu infliger une peine: « Quand j'ouvre la ?? porte , il commence à chauffer automatiquement » Je voudrais obtenir la liste des mots possibles en ?? avec une probabilité. Le concept de base utilisé dans le modèle word2vec est de «prédire» un mot en fonction du contexte environnant. Une …
Keras prend en charge TensorFlow et Theano en tant que backend: quels sont les avantages / inconvénients de choisir l'un par rapport à l'autre, outre le fait que toutes les opérations ne sont actuellement pas implémentées avec le backend TensorFlow?
Dans le traitement d'images médicales, la plupart des travaux publiés tentent de réduire le taux de faux positifs (FPR) alors qu'en réalité, les faux négatifs sont plus dangereux que les faux positifs. Quelle est la justification derrière cela?
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour Data Science Stack Exchange. Fermé il y a 5 ans . Je suis un étudiant à la maîtrise à l'Université d'Édimbourg, …
Ceci est une question similaire à la question des conférences de statistiques à CrossValidated Quelles sont les conférences annuelles les plus importantes sur la science des données? Règles: Inclure un lien vers la conférence Veuillez inclure des liens pour les discussions (que ce soit YouTube, le site de la conférence …
C'est peut-être trop large, mais je cherche des références sur la façon d'utiliser l'apprentissage en profondeur dans une tâche de résumé de texte. J'ai déjà mis en œuvre une synthèse de texte à l'aide d'approches de fréquence de mots et de classement de phrases standard, mais j'aimerais explorer la possibilité …
Quelle est la meilleure façon de comprendre la similitude sémantique des mots? Word2Vec est correct, mais pas idéal: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 # …
Je connais la différence entre le clustering et la classification dans l'apprentissage automatique, mais je ne comprends pas la différence entre la classification de texte et la modélisation de sujet pour les documents. Puis-je utiliser la modélisation de sujet sur des documents pour identifier un sujet? Puis-je utiliser des méthodes …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.