Questions marquées «data-mining»

5
Pourquoi la recherche sur les algorithmes génétiques a-t-elle ralenti?
Tout en discutant de certains sujets de niveau d’introduction aujourd’hui, y compris l’utilisation d’algorithmes génétiques; On m'a dit que la recherche avait vraiment ralenti dans ce domaine. La raison donnée est que la plupart des gens se concentrent sur l'apprentissage automatique et l'exploration de données. Mise à jour: Est-ce exact? …

4
Quelle est exactement la différence entre un apprentissage supervisé et non supervisé?
J'essaie de comprendre les méthodes de clustering. Ce que je pense avoir compris: Dans l'apprentissage supervisé, les catégories / étiquettes de données auxquelles sont affectées sont connues avant le calcul. Ainsi, les étiquettes, classes ou catégories sont utilisées afin «d'apprendre» les paramètres qui sont vraiment importants pour ces clusters. Dans …


5
Science des données vs recherche opérationnelle
La question générale, comme son titre l'indique, est la suivante: Quelle est la différence entre DS et OR / optimisation. Sur le plan conceptuel, je comprends que DS essaie d' extraire des connaissances des données disponibles et utilise principalement des techniques de statistiques et d'apprentissage automatique. D'un autre côté, OR …

4
Relation et différence entre la recherche et l'extraction d'informations?
De Wikipédia La récupération d'informations est l'activité consistant à obtenir des ressources d'informations pertinentes pour un besoin d'informations à partir d'une collection de ressources d'informations. Les recherches peuvent être basées sur des métadonnées ou sur une indexation en texte intégral. De Wikipédia L'extraction d'informations (IE) consiste à extraire automatiquement des …

1
Déduire les types de raffinement
Au travail, j'ai été chargé de déduire des informations de type sur un langage dynamique. Je réécris des séquences d'instructions en imbriquéeslet expressions , comme ceci: return x; Z => x var x; Z => let x = undefined in Z x = y; Z => let x = y …
11 programming-languages  logic  type-theory  type-inference  machine-learning  data-mining  clustering  order-theory  reference-request  information-theory  entropy  algorithms  algorithm-analysis  space-complexity  lower-bounds  formal-languages  computability  formal-grammars  context-free  parsing  complexity-theory  time-complexity  terminology  turing-machines  nondeterminism  programming-languages  semantics  operational-semantics  complexity-theory  time-complexity  complexity-theory  reference-request  turing-machines  machine-models  simulation  graphs  probability-theory  data-structures  terminology  distributed-systems  hash-tables  history  terminology  programming-languages  meta-programming  terminology  formal-grammars  compilers  algorithms  search-algorithms  formal-languages  regular-languages  complexity-theory  satisfiability  sat-solvers  factoring  algorithms  randomized-algorithms  streaming-algorithm  in-place  algorithms  numerical-analysis  regular-languages  automata  finite-automata  regular-expressions  algorithms  data-structures  efficiency  coding-theory  algorithms  graph-theory  reference-request  education  books  formal-languages  context-free  proof-techniques  algorithms  graph-theory  greedy-algorithms  matroids  complexity-theory  graph-theory  np-complete  intuition  complexity-theory  np-complete  traveling-salesman  algorithms  graphs  probabilistic-algorithms  weighted-graphs  data-structures  time-complexity  priority-queues  computability  turing-machines  automata  pushdown-automata  algorithms  graphs  binary-trees  algorithms  algorithm-analysis  spanning-trees  terminology  asymptotics  landau-notation  algorithms  graph-theory  network-flow  terminology  computability  undecidability  rice-theorem  algorithms  data-structures  computational-geometry 



2
Quels sont les moyens efficaces de trouver les différences entre deux grands corpus de texte qui ont un contenu similaire mais ordonné différemment?
J'ai deux gros fichiers contenant des paragraphes de texte anglais: Le premier texte fait environ 200 pages et compte environ 10 paragraphes par page (chaque paragraphe fait 5 phrases). Le deuxième texte contient presque exactement les mêmes paragraphes et texte que le premier. Il comprend également 200 pages et 10 …

1
Entrées de chaîne dans l'apprentissage automatique
Plusieurs algorithmes d'apprentissage automatique populaires tels que la régression logistique ou les réseaux de neurones nécessitent que ses entrées soient numériques. Ce qui m'intéresse, c'est comment vous faites fonctionner ces algorithmes sur des entrées non numériques (telles que des chaînes courtes). Par exemple, disons que nous construisons un système de …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.