Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées




1
Différence entre isna () et isnull () dans les pandas
J'utilise des pandas depuis un certain temps. Mais, je n'ai pas compris quelle est la différence entre isna()et isnull()dans les pandas. Et, plus important encore, lequel utiliser pour identifier les valeurs manquantes dans le cadre de données. Quelle est la différence fondamentale sous-jacente de la manière dont une valeur est …

11
Pourquoi les gens préfèrent-ils les pandas à SQL?
J'utilise SQL depuis 1996, donc je peux être partial. J'ai beaucoup utilisé MySQL et SQLite 3, mais j'ai également utilisé Microsoft SQL Server et Oracle. La grande majorité des opérations que j'ai vues effectuer avec des pandas peuvent être effectuées plus facilement avec SQL. Cela inclut le filtrage d'un jeu …
69 pandas  sql 


8
Data Scientist vs Ingénieur en apprentissage machine
Quelles sont les différences, le cas échéant, entre un "informaticien" et un "ingénieur en apprentissage automatique"? Au cours des dernières années, les "ingénieurs en apprentissage machine" ont commencé à apparaître fréquemment dans les offres d'emploi. Cela est particulièrement visible à San Francisco, d'où le terme "informaticien". À un moment donné, …


3
Avantages de l'ASC par rapport à la précision standard
Je commençais à regarder dans l'aire sous la courbe (AUC) et je suis un peu confus quant à son utilité. Lorsqu’on m’expliqua pour la première fois, les AUC semblaient être un excellent moyen de mesurer les performances, mais dans le cadre de mes recherches, certains ont affirmé que son avantage …

6
les chaînes en tant qu'entités dans l'arbre de décision / la forêt aléatoire
Je fais quelques problèmes sur une application d'arbre de décision / forêt aléatoire. J'essaie d'adapter un problème comportant à la fois des chiffres et des chaînes (telles que le nom du pays). Maintenant, dans la bibliothèque, scikit-learn prend uniquement des nombres en tant que paramètres, mais je souhaite injecter les …


1
Comment obtenir une corrélation entre deux variables catégorielles et une variable catégorielle et une variable continue?
Je construis un modèle de régression et j'ai besoin de calculer ce qui suit pour vérifier les corrélations Corrélation entre 2 variables qualitatives multiniveaux Corrélation entre une variable catégorielle à plusieurs niveaux et une variable continue VIF (facteur d'inflation de la variance) pour une variable catégorielle à plusieurs niveaux Je …

3
Backprop à travers les couches Max-Pooling?
C'est une petite question conceptuelle qui me hante depuis un moment: comment pouvons-nous propager en arrière à travers une couche de regroupement maximal dans un réseau de neurones? Je suis tombé sur des couches de max-pooling en parcourant ce tutoriel pour la bibliothèque nn de Torch 7. La bibliothèque résume …


11
Qu'est-ce que la réduction de dimensionnalité? Quelle est la différence entre la sélection de fonctionnalités et l'extraction?
De wikipedia, La réduction de dimensionnalité ou réduction de dimension est le processus de réduction du nombre de variables aléatoires prises en compte. Elle peut être divisée en sélection et extraction de caractéristiques. Quelle est la différence entre la sélection de fonctionnalités et l'extraction de fonctionnalités? Quel est un exemple …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.