Questions marquées «nlp»

Le traitement du langage naturel (PNL) est un domaine de l'informatique, de l'intelligence artificielle et de la linguistique qui s'intéresse aux interactions entre les ordinateurs et les langues (naturelles) humaines. À ce titre, la PNL est liée au domaine de l'interaction homme-ordinateur. De nombreux défis en PNL impliquent la compréhension du langage naturel, c'est-à-dire permettre aux ordinateurs de tirer un sens de la saisie du langage humain ou naturel, et d'autres impliquent la génération du langage naturel.



1
PNL - pourquoi «n'est pas» un mot d'arrêt?
J'essaie de supprimer les mots vides avant d'effectuer la modélisation du sujet. J'ai remarqué que certains mots de négation (pas, ni, jamais, aucun, etc.) sont généralement considérés comme des mots vides. Par exemple, NLTK, spacy et sklearn incluent "not" dans leurs listes de mots vides. Cependant, si nous supprimons «non» …

4
Améliorez la vitesse de mise en œuvre de t-sne en python pour les énormes données
Je voudrais faire une réduction de dimensionnalité sur près d'un million de vecteurs chacun avec 200 dimensions ( doc2vec). j'utiliseTSNE implémentation du sklearn.manifoldmodule pour cela et le problème majeur est la complexité du temps. Même avec method = barnes_hut, la vitesse de calcul est encore faible. Un certain temps, même …

2
PNL - Gazetteer est-il une triche?
En PNL, le concept Gazetteerpeut être très utile pour créer des annotations. Pour autant que je comprends: Un répertoire géographique se compose d'un ensemble de listes contenant des noms d'entités telles que des villes, des organisations, des jours de la semaine, etc. Ces listes sont utilisées pour trouver des occurrences …

2
Extraire les parties les plus informatives du texte des documents
Y a-t-il des articles ou des discussions sur l'extraction d'une partie du texte qui contient le plus d'informations sur le document actuel. Par exemple, j'ai un grand corpus de documents du même domaine. Certaines parties du texte contiennent les informations clés dont parle un seul document. Je veux extraire certaines …
16 nlp  text-mining 

5
agrandir la carte thermique de Seaborn
Je crée un corr()df à partir d'un df d'origine. Le corr()df est sorti 70 X 70 et il est impossible de visualiser le heatmap ... sns.heatmap(df). Si j'essaie d'afficher le corr = df.corr(), le tableau ne correspond pas à l'écran et je peux voir toutes les corrélations. Est-ce un moyen …
16 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 


4
Similitude entre deux mots
Je recherche une bibliothèque Python qui m'aide à identifier la similitude entre deux mots ou phrases. Je ferai une conversion audio en texte qui se traduira par un dictionnaire anglais ou des mots non-dictionnaire (cela pourrait être un nom de personne ou d'entreprise) Après cela, je dois le comparer à …
15 nlp  nltk 

5
Prédiction de similarité de phrase
Je cherche à résoudre le problème suivant: j'ai un ensemble de phrases comme ensemble de données et je veux pouvoir taper une nouvelle phrase et trouver la phrase à laquelle la nouvelle est la plus similaire dans l'ensemble de données. Un exemple ressemblerait à: Nouvelle phrase: " I opened a …


2
Quelles fonctionnalités sont généralement utilisées à partir des arbres d'analyse dans le processus de classification en PNL?
J'explore différents types de structures d'arbres d'analyse. Les deux structures d'arbre d'analyse largement connues sont: a) l'arbre d'analyse basé sur les circonscriptions et b) les structures d'arbre d'analyse basées sur les dépendances. Je suis capable d'utiliser les deux types de structures d'arbre d'analyse en utilisant le package Stanford NLP. Cependant, …


3
Langage naturel vers requête SQL
J'ai travaillé sur le développement d'un système "Conversion du langage naturel en requête SQL". J'ai lu les réponses aux questions similaires, mais je n'ai pas pu obtenir les informations que je cherchais. Voici l'organigramme d'un tel système que j'ai obtenu d' un algorithme pour transformer le langage naturel en requêtes …

1
Alors, quel est le problème avec LSTM?
J'élargis mes connaissances sur le package Keras et j'ai travaillé avec certains des modèles disponibles. J'ai un problème de classification binaire PNL que j'essaie de résoudre et j'ai appliqué différents modèles. Après avoir travaillé avec quelques résultats et lu de plus en plus sur LSTM, il semble que cette approche …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.