Beaucoup de spams traversent le filtre sur le serveur de messagerie que je lance avec l'astuce relativement simple de commencer avec quelques lignes de perte de poids (incroyablement évidentes) ou un autre texte d'escroquerie en haut, suivi d'un corps de texte plus important provenant de la documentation de programmation - ou, le plus mauvais de tous, texte gratté de Stack Exchange . Au mieux, Spamassassin considère cela comme BAYES_50, et il arrive que les autres messages soient construits avec suffisamment de soin pour ne pas toucher à d'autres déclencheurs. (Par exemple, les en-têtes sont minimes et corrects.) Souvent, les extraits inclus s'alignent assez étroitement avec mes intérêts légitimes pour que le message dans son ensemble soit marqué comme BAYES_00, car les jetons très spammeurs sont juste submergés par des pépites juteuses de résolution de problèmes d'administrateur système.
La partie supérieure est si manifestement spammée (et en fait a tendance à être très similaire aux messages reçus précédemment et formés comme spam) que je suis un peu étonné que cela passe - mais c'est clairement le cas. Cela semble être une passe distincte qui a marqué les 25 premières lignes (ou plus) du message et pesé qui résoudrait le problème. Y a-t-il un moyen de faire cela?
Plusieurs personnes ont suggéré d'écrire des expressions régulières personnalisées. Je ne veux pas entrer dans ce sujet, car il s'agit d'une bataille perdue constante. C'est ce que les gens faisaient avant que le tri bayésien du spam ne soit généralisé, et c'était généralement terrible. Aucun humain ne peut suivre . Ce n'est pas beaucoup plus efficace que d'appuyer simplement sur la touche de suppression pour chaque message de spam, et beaucoup plus de travail de ma part.
Le filtrage bayésien du spam fonctionne. Cela fonctionne même sur ce spam, si je divise la partie " au-dessus du pli " et que j'analyse simplement cette partie, sans le leurre / la balle. La question est: comment puis-je demander à Spamassassin de le faire?