Pour expérimenter, nous aimerions utiliser les Emoji intégrés dans de nombreux Tweets comme données de vérité / formation au sol pour une analyse quantitative de sénitment simple. Les tweets sont généralement trop peu structurés pour que la PNL fonctionne correctement.
Quoi qu'il en soit, il y a 722 Emoji dans Unicode 6.0, et probablement 250 autres seront ajoutés dans Unicode 7.0.
Existe-t-il une base de données (comme par exemple SentiWordNet) qui contient des annotations de sentiment pour eux?
(Notez que SentiWordNet permet aussi des significations ambiguës . Considérez par exemple drôle , ce qui n'est pas seulement positif: "ça a un drôle de goût" n'est probablement pas positif ... il en va de même ;-)
par exemple. Mais je ne pense pas que ce soit plus difficile pour Emoji que pour les mots normaux ...)
De plus, si vous avez de l'expérience avec leur utilisation pour l'analyse des sentiments, je serais intéressé de les entendre.