Od pewneo czasu można zauważyc dziwne sekwencje pojawiające sie w spamie. W temacie maila sa znaczki np sztu-czka, .-cos itd. Nikt tak nei pisze maili. Prosta regula wychwytująca sporą częśc tego badziewia
header ZABOJCASPAMU_SUBJECT_WEIRED_STRING Subject =~ /(?: -[a-z]|[a-z]+.[a-z]+| -.| .|- )/
describe ZABOJCASPAMU_SUBJECT_WEIRED_STRING Weired string in Subject: [a-z]-[a-z]
score ZABOJCASPAMU_SUBJECT_WEIRED_STRUNG 0.5
Ta reguła wydaje się bezużyteczna.
Masa normalnych maili pod to podpada.
zgadza sie, dlatego ma niska punktacje. Jak ktos wysle adres url w temacie tez wpadnie.
Tylko według mnie ona ma jakiś błąd. Prawie każdy mail, z małymi wyjątkami, jest przez nią oznaczany.
Np. mail o temacie:
Subject: Dobre relacje w pracy
też został przez nią oznaczony.
Tymi wyjątkami są chyba tematy, które mają w treści TYLKO jedno słowo.
Cała reszta niezależnie od treści, podpada pod tą regułę.
Punktacja 0.5 to w tym przypadku i tak za dużo.
0 by pasowało, ale po co zaśmiecać fajną bazę niedziałającymi regułami :/
Takie wyrażenie jest w pliku z regułami:
(?: -[a-z]|[a-z]+.[a-z]+| -.| .|[a-z]\- )
Czy czasem:
” .” – czytaj spacja, kropka – nie oznacza wszystkiego ze spacją?
” -.” – czytaj spacja, myślnik,kropka – nie oznacza wszystkiego co ma spację przed myślnikiem?
„[a-z]+.[a-z]+” – łapie małą literę, COŚ i małą literę?
Literówka w sekwencji „score” ZABOJCASPAMU_SUBJECT_WEIRED_STRUNG (STRING)
Albo wszystkie maile:
Subject: =?UTF-8? ……..
Subject: =?iso-8859-2?…..