Science des données

5

Comment dessiner des diagrammes d'architecture de réseau Deep Learning?

J'ai construit mon modèle. Maintenant, je veux dessiner le diagramme d’architecture réseau pour mon travail de recherche. Exemple est montré ci-dessous:

78 machine-learning neural-network deep-learning svm software-recommendation

11

SVM utilisant scikit learn s'exécute sans fin et ne termine jamais l'exécution

J'essaie d'exécuter SVR à l'aide de scikit learn (python) sur un jeu de données d'apprentissage comportant 595605 lignes et 5 colonnes (entités) et sur un jeu de données test comportant 397070 lignes. Les données ont été pré-traitées et régularisées. Je peux exécuter avec succès les exemples de test, mais lors …

76 python svm scikit-learn

5

Pourquoi les fonctions de coût utilisent-elles l'erreur de carré?

Je commence tout juste avec un apprentissage en machine et, jusqu'à présent, je m'occupais de la régression linéaire sur une variable. J'ai appris qu'il y a une hypothèse qui est: hθ( x ) = θ0+ θ1Xhθ(X)=θ0+θ1Xh_\theta(x)=\theta_0+\theta_1x Pour trouver de bonnes valeurs pour les paramètres et nous souhaitons minimiser la différence …

73 machine-learning linear-regression loss-function

1

Différence entre isna () et isnull () dans les pandas

J'utilise des pandas depuis un certain temps. Mais, je n'ai pas compris quelle est la différence entre isna()et isnull()dans les pandas. Et, plus important encore, lequel utiliser pour identifier les valeurs manquantes dans le cadre de données. Quelle est la différence fondamentale sous-jacente de la manière dont une valeur est …

73 python pandas dataframe

11

Pourquoi les gens préfèrent-ils les pandas à SQL?

J'utilise SQL depuis 1996, donc je peux être partial. J'ai beaucoup utilisé MySQL et SQLite 3, mais j'ai également utilisé Microsoft SQL Server et Oracle. La grande majorité des opérations que j'ai vues effectuer avec des pandas peuvent être effectuées plus facilement avec SQL. Cela inclut le filtrage d'un jeu …

69 pandas sql

8

Quand devrais-je utiliser Gini Impurity par opposition à Information Gain?

Est-ce que quelqu'un peut pratiquement expliquer la raison derrière l' impureté de Gini par rapport au gain d'information (basé sur Entropie)? Quelle métrique est préférable d'utiliser dans différents scénarios lors de l'utilisation d'arbres de décision?

66 machine-learning decision-trees

8

Data Scientist vs Ingénieur en apprentissage machine

Quelles sont les différences, le cas échéant, entre un "informaticien" et un "ingénieur en apprentissage automatique"? Au cours des dernières années, les "ingénieurs en apprentissage machine" ont commencé à apparaître fréquemment dans les offres d'emploi. Cela est particulièrement visible à San Francisco, d'où le terme "informaticien". À un moment donné, …

66 machine-learning

5

Prédiction de séries chronologiques en utilisant ARIMA vs LSTM

Le problème que je traite est de prédire les valeurs de séries chronologiques. Je regarde une série chronologique à la fois et, sur la base par exemple de 15% des données d'entrée, je voudrais prédire ses valeurs futures. Jusqu'à présent, j'ai rencontré deux modèles: LSTM (mémoire à long terme et …

64 time-series deep-learning rnn prediction

3

Avantages de l'ASC par rapport à la précision standard

Je commençais à regarder dans l'aire sous la courbe (AUC) et je suis un peu confus quant à son utilité. Lorsqu’on m’expliqua pour la première fois, les AUC semblaient être un excellent moyen de mesurer les performances, mais dans le cadre de mes recherches, certains ont affirmé que son avantage …

64 machine-learning accuracy

6

les chaînes en tant qu'entités dans l'arbre de décision / la forêt aléatoire

Je fais quelques problèmes sur une application d'arbre de décision / forêt aléatoire. J'essaie d'adapter un problème comportant à la fois des chiffres et des chaînes (telles que le nom du pays). Maintenant, dans la bibliothèque, scikit-learn prend uniquement des nombres en tant que paramètres, mais je souhaite injecter les …

64 machine-learning python scikit-learn random-forest decision-trees

2

Former un RNN avec des exemples de différentes longueurs à Keras

J'essaie de commencer à apprendre sur les RNN et j'utilise Keras. Je comprends le principe de base des couches RNN et LSTM à la vanille, mais j’ai du mal à comprendre un certain point technique pour la formation. Dans la documentation de keras , il est indiqué que l’entrée dans …

64 python keras rnn training

1

Comment obtenir une corrélation entre deux variables catégorielles et une variable catégorielle et une variable continue?

Je construis un modèle de régression et j'ai besoin de calculer ce qui suit pour vérifier les corrélations Corrélation entre 2 variables qualitatives multiniveaux Corrélation entre une variable catégorielle à plusieurs niveaux et une variable continue VIF (facteur d'inflation de la variance) pour une variable catégorielle à plusieurs niveaux Je …

63 r statistics correlation

3

Backprop à travers les couches Max-Pooling?

C'est une petite question conceptuelle qui me hante depuis un moment: comment pouvons-nous propager en arrière à travers une couche de regroupement maximal dans un réseau de neurones? Je suis tombé sur des couches de max-pooling en parcourant ce tutoriel pour la bibliothèque nn de Torch 7. La bibliothèque résume …

62 neural-network backpropagation

8

Détection d'anomalies open source en Python

Problème: Je travaille sur un projet qui implique des fichiers journaux similaires à ceux trouvés dans l'espace de surveillance informatique (à ma meilleure compréhension de l'espace informatique). Ces fichiers journaux sont des données chronologiques organisées en centaines / milliers de lignes de paramètres variés. Chaque paramètre est numérique (float) et …

61 machine-learning python data-mining anomaly-detection library

11

Qu'est-ce que la réduction de dimensionnalité? Quelle est la différence entre la sélection de fonctionnalités et l'extraction?

De wikipedia, La réduction de dimensionnalité ou réduction de dimension est le processus de réduction du nombre de variables aléatoires prises en compte. Elle peut être divisée en sélection et extraction de caractéristiques. Quelle est la différence entre la sélection de fonctionnalités et l'extraction de fonctionnalités? Quel est un exemple …

59 feature-selection feature-extraction dimensionality-reduction