Réponses:
Il semble certainement qu'il y ait eu des projets de recherche impliquant une certaine forme d'exploration de texte / recherche d'informations / etc. et les sites StackExchange.
Quelques exemples que j'ai pu trouver par le biais de google / google scholar (peu susceptibles d'être n'importe où près d'une liste exhaustive):
Plus généralement, les systèmes de réponse automatique aux questions semblent être un domaine de recherche plutôt actif, pas un problème trivial / "résolu". StackExchange peut être une source de données pour de tels systèmes, mais il existe également de nombreuses autres sources de données (Wikipedia, Quora, etc.).
DuckDuckGo apprend les réponses aux questions techniques de StackExchange. Tapez une question technique comme «les projets en cours utilisent stackexchange» dans DuckDuckGo et il fournira un résumé surligné de la réponse sur le côté droit. Et le canard a une API ouverte pour de nombreuses (100s) autres sources de données répondant aux questions. Ou vous pouvez aller directement à l' API stackexchange .
Les projets peuvent utiliser les données de l'API ouverte SE tant qu'elles respectent leurs conditions d' utilisation . Assurez-vous simplement que vos utilisateurs peuvent dire que les données proviennent de Stack Exchange. La licence de copyright peut également limiter votre capacité à modifier le contenu du texte, par exemple un résumé résumé abstractif. C'est peut-être pour cela que Duck.com ne fait que mettre en évidence des mots clés.
La loi sur les droits relatifs aux données est en pleine mutation, en particulier en ce qui concerne les données que vous avez soumises à un site et les modèles d'apprentissage automatique dérivés de ces données. Les nouvelles règles européennes en matière de données et de confidentialité vous permettent de télécharger ou de supprimer toutes les données que vous soumettez à un site comme l'échange de pile.