Science des données

2

Relu a 0 gradient par définition, alors pourquoi la disparition du gradient n'est pas un problème pour x <0?

Par définition, Relu est max(0,f(x)). Ensuite , son gradient est défini comme suit: 1 if x > 0 and 0 if x < 0. Cela ne signifierait-il pas que le gradient est toujours 0 (disparaît) lorsque x <0? Alors pourquoi dit-on que Relu ne souffre pas du problème de disparition …

10 deep-learning

1

COMMENT FAIRE: Initialisation du poids du réseau neuronal profond

Étant donné la tâche d'apprentissage difficile (par exemple, grande dimensionnalité, complexité inhérente des données), les réseaux neuronaux profonds deviennent difficiles à former. Pour atténuer de nombreux problèmes, on pourrait: Normaliser les données de qualité && choisir un algorithme d'entraînement différent (par exemple RMSprop au lieu de Gradient Descent) choisissez une …

10 machine-learning neural-network deep-learning randomized-algorithms

3

Comment regrouper des valeurs identiques et compter leur fréquence en Python?

Débutant en analytique avec Python, alors soyez gentil :-) Je n'ai pas trouvé la réponse à cette question - excuses si elle a déjà été répondue ailleurs dans un format différent. J'ai un ensemble de données de données de transaction pour un point de vente. Les variables ainsi que l'explication …

10 python statistics pandas ipython

3

Construire un modèle d'apprentissage automatique pour prédire les rendements des cultures en fonction des données environnementales

J'ai un ensemble de données contenant des données sur la température, les précipitations et les rendements de soja pour une ferme pendant 10 ans (2005 - 2014). Je voudrais prédire les rendements pour 2015 sur la base de ces données. Veuillez noter que l'ensemble de données a des valeurs QUOTIDIENNES …

10 python scikit-learn pandas

1

Sortie de régression linéaire XGBoost incorrecte

Je suis un débutant pour XGBoost alors pardonnez mon ignorance. Voici le code python: import pandas as pd import xgboost as xgb df = pd.DataFrame({'x':[1,2,3], 'y':[10,20,30]}) X_train = df.drop('y',axis=1) Y_train = df['y'] T_train_xgb = xgb.DMatrix(X_train, Y_train) params = {"objective": "reg:linear"} gbm = xgb.train(dtrain=T_train_xgb,params=params) Y_pred = gbm.predict(xgb.DMatrix(pd.DataFrame({'x':[4,5]}))) print Y_pred La sortie …

10 python linear-regression xgboost

1

Produit utilisateur positif (cliquez sur les données) disponible. Comment générer des données négatives (sans clic)?

Il est très courant dans les recommandations que nous ayons des données de produit utilisateur qui ont une étiquette comme par exemple un "clic". Pour apprendre le modèle, j'ai besoin de données de clic et de non-clic. L'approche la plus simple à générer consiste à prendre des paires utilisateurs-produits qui …

10 machine-learning data-mining

2

Que faire lorsque les données de test ont moins de fonctionnalités que les données de formation?

Disons que nous prédisons les ventes d'une boutique et que mes données de formation ont deux ensembles de fonctionnalités: Un sur les ventes du magasin avec les dates (le champ "Store" n'est pas unique) Un sur les types de magasins (le champ "Store" est unique ici) La matrice ressemblerait donc …

10 machine-learning regression feature-selection feature-construction missing-data

2

Comment les scientifiques trouvent-ils les paramètres et la topologie corrects du modèle de Markov à utiliser?

Je comprends comment un modèle de Markov caché est utilisé dans les séquences génomiques, comme la recherche d'un gène. Mais je ne comprends pas comment trouver un modèle Markov particulier. Je veux dire, combien d'États le modèle devrait-il avoir? Combien de transitions possibles? Le modèle devrait-il avoir une boucle? Comment …

10 machine-learning model-selection hyperparameter markov

1

De combien de données d'entraînement Word2vec a-t-il besoin?

Je voudrais comparer la différence entre le même mot mentionné dans différentes sources. C'est-à-dire, comment les auteurs diffèrent dans leur utilisation de mots mal définis, tels que «démocratie». Un bref plan a été Prenez les livres mentionnant le terme "démocratie" en texte brut Dans chaque livre, remplacez democracypardemocracy_%AuthorName% Former un …

10 text-mining word-embeddings

1

Dans quelle mesure le lien entre la fonction objectif et la fonction d'activation de la couche de sortie est-il flexible?

Il semble standard dans de nombreux packages de réseaux neuronaux de coupler la fonction objectif à minimiser avec la fonction d'activation dans la couche de sortie. Par exemple, pour une couche de sortie linéaire utilisée pour la régression, il est standard (et souvent seul choix) d'avoir une fonction objectif d'erreur …

10 neural-network gradient-descent

1

Devez-vous normaliser les données lors de la création d'arbres de décision à l'aide de R?

Ainsi, notre ensemble de données cette semaine a 14 attributs et chaque colonne a des valeurs très différentes. Une colonne a des valeurs inférieures à 1 tandis qu'une autre colonne a des valeurs qui vont de trois à quatre chiffres entiers. Nous avons appris la normalisation la semaine dernière et …

10 r beginner

2

Amplifier un hachage sensible à la localité

J'essaie de créer un hachage sensible aux localités cosinus afin de pouvoir trouver des paires d'articles similaires candidates sans avoir à comparer toutes les paires possibles. Je l'ai essentiellement, mais la plupart des paires de mes données semblent avoir une similitude cosinus dans la plage -0,2 à +0,2, donc j'essaie …

10 machine-learning

1

Comment puis-je calculer le terme delta d'une couche convolutionnelle, étant donné les termes delta et les poids de la couche convolutionnelle précédente?

J'essaie de former un réseau neuronal artificiel avec deux couches convolutionnelles (c1, c2) et deux couches cachées (c1, c2). J'utilise l'approche de rétropropagation standard. Dans la passe arrière, je calcule le terme d'erreur d'une couche (delta) en fonction de l'erreur de la couche précédente, des poids de la couche précédente …

10 machine-learning data-mining neural-network deep-learning

3

Les ontologies et le Web sémantique sont-ils morts? [fermé]

Fermé . Cette question doit être plus ciblée . Il n'accepte pas actuellement les réponses. Vous souhaitez améliorer cette question? Mettez à jour la question pour qu'elle se concentre sur un seul problème en modifiant ce post . Fermé il y a 3 ans . Le Web sémantique est-il mort? …

10 knowledge-base

2

Combien de temps les classificateurs scikit prennent-ils pour classer?

Je prévois d'utiliser le classificateur scikit linear support vector machine (SVM) pour la classification de texte sur un corpus comprenant 1 million de documents étiquetés. Ce que je prévois de faire, c'est lorsqu'un utilisateur saisit un mot clé, le classificateur le classera d'abord dans une catégorie, puis une requête de …

10 machine-learning classification python scikit-learn