word2vec est un réseau neuronal à deux couches pour traiter du texte. Il prend des mots comme entrée et produit un vecteur en conséquence. Il utilise une combinaison d'implémentation de modèle Continuous Bag of Word et skipgram.
Quelle est la meilleure façon de comprendre la similitude sémantique des mots? Word2Vec est correct, mais pas idéal: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 # …
J'ai deux phrases, S1 et S2, qui ont toutes deux un nombre de mots (généralement) inférieur à 15. Quels sont les algorithmes les plus utiles et les plus efficaces (apprentissage automatique), qui sont peut-être faciles à mettre en œuvre (le réseau de neurones est correct, sauf si l'architecture est aussi …
Je me demande comment étiqueter (étiqueter) des phrases / paragraphes / documents avec doc2vec dans gensim - d'un point de vue pratique. Avez-vous besoin d'avoir chaque phrase / paragraphe / document avec sa propre étiquette unique (par exemple "Sent_123")? Cela semble utile si vous voulez dire "quels mots ou phrases …
Je crée un corr()df à partir d'un df d'origine. Le corr()df est sorti 70 X 70 et il est impossible de visualiser le heatmap ... sns.heatmap(df). Si j'essaie d'afficher le corr = df.corr(), le tableau ne correspond pas à l'écran et je peux voir toutes les corrélations. Est-ce un moyen …
J'utilise Gensim Library en python pour utiliser et former le modèle word2vector. Récemment, je cherchais à initialiser mes poids de modèle avec un modèle word2vec pré-formé tel que (modèle pré-formé GoogleNewDataset). J'ai du mal avec ça quelques semaines. Maintenant, je viens de découvrir que dans gesim il y a une …
Je cherche à trouver un poids pré-formé de modèles déjà formés comme les données de Google Actualités, etc. J'ai eu du mal à former un nouveau modèle avec suffisamment de données (10 Go, etc.) pour moi. Donc, je veux profiter de l'apprentissage par transfert dans lequel je serais en mesure …
J'essaie d'utiliser CNN (réseau neuronal convolutionnel) pour classer les documents. CNN pour les textes / phrases courts a été étudié dans de nombreux articles. Cependant, il semble qu'aucun article n'ait utilisé CNN pour un texte ou un document long. Mon problème est qu'il y a trop de fonctionnalités d'un document. …
J'ai lu que la représentation distributionnelle est basée sur l'hypothèse distributionnelle que les mots apparaissant dans un contexte similaire ont généralement des significations similaires. Word2Vec et Doc2Vec sont tous deux modélisés selon cette hypothèse. Mais, dans le document d'origine, même ils sont intitulés comme Distributed representation of words and phraseset …
Je suis un débutant dans les réseaux de neurones et j'explore actuellement le modèle word2vec. Cependant, j'ai du mal à comprendre ce qu'est exactement la matrice des fonctionnalités. Je peux comprendre que la première matrice est un vecteur d'encodage à chaud pour un mot donné, mais que signifie la deuxième …
J'ai lu l' explication de la convolution et je la comprends dans une certaine mesure. Quelqu'un peut-il m'aider à comprendre comment cette opération est liée à la convolution dans les réseaux neuronaux convolutionnels? Le filtre est-il une fonction gqui applique du poids?
J'essaie de faire une analyse des sentiments. Afin de convertir les mots en vecteurs de mots, j'utilise le modèle word2vec. Supposons que j'ai toutes les phrases dans une liste nommée «phrases» et que je passe ces phrases à word2vec comme suit: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) …
Je travaille sur un algorithme de formation des données pour Word2vec. Puisque nous avons besoin que les mots restent aussi originaux, nous ne les rendons pas en minuscules lors de la phase de prétraitement. Il y a donc des mots avec des variations différentes (par exemple "Terre" et "terre"). La …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.