Questions marquées «nlp»

Le traitement du langage naturel (NLP) est un sous-domaine de l'intelligence artificielle qui implique la transformation ou l'extraction d'informations utiles à partir de données en langage naturel. Les méthodes incluent l'apprentissage automatique et les approches basées sur des règles.



10
Java Stanford PNL: une partie des étiquettes de discours?
La PNL de Stanford, présentée ici , donne une sortie comme celle-ci: Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. Que signifient les balises "Part of Speech"? Je ne parviens pas à trouver une liste officielle. S'agit-il du propre système de Stanford ou utilisent-ils des balises universelles? (Qu'est-ce que JJ, par exemple?) …

15
Détecter les syllabes dans un mot
J'ai besoin de trouver un moyen assez efficace de détecter les syllabes dans un mot. Par exemple, Invisible -> in-vi-sib-le Certaines règles de syllabification pourraient être utilisées: V CV VC CVC CCV CCCV CVCC * où V est une voyelle et C est une consonne. Par exemple, Prononciation (5 Pro-nun-ci-a-tion; …





2
Java ou Python pour le traitement du langage naturel [fermé]
Fermé . Cette question est basée sur l'opinion . Il n'accepte pas les réponses actuellement. Vous souhaitez améliorer cette question? Mettez à jour la question afin de pouvoir y répondre avec des faits et des citations en éditant ce message . Fermé il y a 6 ans . Améliorez cette …
112 java  python  nlp 

21
Comment faire une racine ou une lemmatisation de mots?
J'ai essayé PorterStemmer et Snowball, mais les deux ne fonctionnent pas sur tous les mots, il en manque certains très courants. Mes mots de test sont: "les chats qui courent ont couru les communautés communautaires de cactus cactus cactus ", et les deux ont moins de la moitié raison. Voir …

4
Comment calculer la précision, le rappel, l'exactitude et le score f1 pour le cas multiclasse avec scikit learn?
Je travaille sur un problème d'analyse des sentiments, les données ressemblent à ceci: label instances 5 1190 4 838 3 239 1 204 2 127 Donc mes données sont déséquilibrées puisque 1190 instancessont étiquetées avec 5. Pour la classification Im utilisant le SVC de scikit . Le problème est que …

3
Comment entraîner le Stanford Parser avec Genia Corpus?
J'ai quelques problèmes pour créer un nouveau modèle pour Stanford Parser. J'ai également téléchargé la dernière version de Stanford: http://nlp.stanford.edu/software/lex-parser.shtml Et ici, Genia Corpus en 2 formats, xml et ptb (Penn Treebank). Standford Parser peut s'entraîner avec des fichiers ptd; puis j'ai téléchargé Genia Corpus, car je veux travailler avec …
93 java  nlp  stanford-nlp 



3
Existe-t-il une bonne bibliothèque de traitement du langage naturel [fermé]
Dans l'état actuel des choses, cette question ne convient pas à notre format de questions-réponses. Nous nous attendons à ce que les réponses soient étayées par des faits, des références ou une expertise, mais cette question suscitera probablement un débat, des arguments, un sondage ou une discussion approfondie. Si vous …
90 java  nlp 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.