Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées


2
Groupement d'unions dans les graphes bipartis?
J'essaie de trouver une bonne (et rapide) solution au problème suivant: J'ai deux modèles avec lesquels je travaille, appelons-les joueurs et équipes. Un joueur peut appartenir à plusieurs équipes et une équipe peut avoir plusieurs joueurs). Je travaille sur la création d'un élément d'interface utilisateur sur un formulaire qui permet …
8 graphs 




1
Erreur R lors de l'utilisation du package tm (text-mining)
J'essaie d'utiliser le paquet tm pour convertir un vecteur de chaînes de texte en élément corpus. Mon code ressemble à ceci Corpus(d1$Yes) où d1$Yesest un facteur avec 124 niveaux, chacun contenant une chaîne de texte. Par exemple, d1$Yes[246] = "So we can get the boat out!" Je reçois l'erreur suivante: …
8 r  text-mining 


3
À quoi sert la collecte de données utilisateur en plus de diffuser des annonces?
Eh bien, cela ressemble à l'endroit le plus approprié pour cette question. Chaque site Web collecte des données sur l'utilisateur, certaines uniquement pour la convivialité et la personnalisation, mais la majorité comme les réseaux sociaux suivent chaque mouvement sur le Web, certaines applications gratuites sur votre téléphone analysent les messages …



4
Tutoriel d'apprentissage automatique en ligne
Quelqu'un connaît-il de bons tutoriels sur les techniques d'apprentissage automatique en ligne? C'est-à-dire comment il peut être utilisé dans des environnements en temps réel, quelles sont les principales différences par rapport aux méthodes normales d'apprentissage automatique, etc. UPD: Merci à tous pour les réponses, par "en ligne" je veux dire …


3
Score de similitude des chaînes de matrice
J'ai une charge de documents, qui ont une charge de paires de valeurs clés en eux. La clé peut ne pas être unique, il peut donc y avoir plusieurs clés du même type avec des valeurs différentes. Je veux comparer la similitude des clés entre 2 documents. Plus précisément la …

1
Erreur en cascade dans Apache Storm
En parcourant la présentation et le matériel de Summingbird par Twitter, l'une des raisons mentionnées pour utiliser les clusters Storm et Hadoop ensemble dans Summingbird est que le traitement via Storm entraîne une cascade d'erreurs. Afin d'éviter cette cascade d'erreurs et leur accumulation, le cluster Hadoop est utilisé pour traiter …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.