Étant donné l'entrée d'une chaîne composée de tout message provenant de la salle de discussion de notre site, tirée de la liste décrite ci-dessous, renvoie une valeur de vérité ou une valeur de fausseté tentant de prédire si ce message a été marqué ou non sur 50 octets ou moins.
Vous pouvez utiliser n'importe quelle valeur de vérité ou de fausseté , mais elles doivent être identiques (autrement dit, il ne devrait y avoir que deux sorties possibles, une vérité et une fausseté). L'entrée sera donnée sous forme de code HTML brut avec les nouvelles lignes supprimées et peut contenir des caractères Unicode non-ASCII. Si vous avez besoin d'informations autres que UTF-8, veuillez l'indiquer dans votre réponse.
La soumission gagnante à ce défi sera celle qui prédit correctement le pourcentage le plus élevé de messages de discussion en dehors de la liste liée ci-dessous. Si deux soumissions données ont le même taux de réussite, la soumission la plus courte l'emportera.
Veuillez fournir des instructions pour exécuter votre code sur l’ensemble des messages et calculer le pourcentage correct. Idéalement, il devrait s'agir d'un peu de code passe-partout (non compté dans vos 50 octets) qui parcourt les cas de test positifs et en indique le nombre de fois que votre code est correct, puis fait de même pour les cas de test négatifs. (Le score global peut ensuite être calculé manuellement via (correctPositive + correctNegative) / totalMessages
.)
Pour que votre code soit raisonnablement vérifiable, il doit être terminé en 5 minutes ou moins pour la liste complète des messages de discussion sur du matériel moderne raisonnable.
La liste complète des messages de discussion peut être trouvée ici , et elle comprend les 1000 derniers messages marqués comme cas de test de véracité et les 1000 derniers messages non marqués comme cas de test faussement. Notez qu'il y a deux fichiers dans l'essentiel; faites défiler à mi-chemin pour les messages sans étoile.
Don'?t star
\^
O2