Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées


4
Comment gratter la page Web imdb?
J'essaie d'apprendre le grattage Web en utilisant Python par moi-même dans le cadre d'un effort pour apprendre l'analyse des données. J'essaie de gratter la page Web imdb dont l'URL est la suivante: http://www.imdb.com/search/title?sort=num_votes,desc&start=1&title_type=feature&year=1950,2012 J'utilise le module BeautifulSoup. Voici le code que j'utilise: r = requests.get(url) # where url is the …







4
Quelles étapes initiales dois-je utiliser pour comprendre les grands ensembles de données et quels outils dois-je utiliser?
Avertissement: je suis un débutant complet en matière d'apprentissage automatique, mais désireux d'apprendre. J'ai un grand ensemble de données et j'essaie de trouver un modèle. Il peut / peut ne pas y avoir de corrélation entre les données, soit avec des variables connues, soit avec des variables contenues dans les …


3
Comment les différentes techniques statistiques (régression, ACP, etc.) évoluent-elles avec la taille et la dimension de l'échantillon?
Existe-t-il un tableau général connu des techniques statistiques expliquant comment elles évoluent avec la taille et la dimension de l'échantillon? Par exemple, un de mes amis m'a dit l'autre jour que le temps de calcul d'un simple tri rapide des données unidimensionnelles de taille n correspond à n * log …


1
Prédiction avec des caractéristiques non atomiques
Je voudrais utiliser des données non atomiques, comme fonctionnalité pour une prédiction. Supposons que j'ai une table avec ces fonctionnalités: - Column 1: Categorical - House - Column 2: Numerical - 23.22 - Column 3: A Vector - [ 12, 22, 32 ] - Column 4: A Tree - [ …

2
Prévision du marché des changes avec les réseaux de neurones
Je voudrais utiliser ANN pour automatiser le trading de devises, de préférence USD / EUR ou USD / GBP. Je sais que c'est difficile et peut-être pas simple. J'ai déjà lu quelques articles et fait quelques expériences mais sans trop de chance. J'aimerais obtenir des conseils d'EXPERTS pour que cela …

3
Gérer un ensemble de fonctionnalités en constante augmentation
Je travaille sur un système de détection de fraude. Dans ce domaine, de nouvelles fraudes apparaissent régulièrement, de sorte que de nouvelles fonctionnalités doivent être ajoutées au modèle de manière continue. Je me demande quelle est la meilleure façon de gérer cela (du point de vue du processus de développement)? …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.